python3爬虫学习笔记之urllib库的使用

python3爬虫学习笔记之urllib库的使用 基本使用

  urlopen返回对象提供方法: read(), readline(), readlines(), fileno(), close():对HTTPResponse类型数据进行操作 info():返回HTTPMessage对象,表示远程服务器返回的头信息 getcode():返回Http状态码。如果是http请求,200请求成功完成、404网址未找到等等 geturl():返回请求的url 请求的数据传送 GET数据

  POST数据

  使用Request && 设置Headers属性 很多网站对非浏览器的访问都做了限制,所以如果我们要完全模拟浏览器去访问网站的话,必须要先设置Headers的属性 使用chrome浏览器按F12,点击访问的链接,Headers -> Request Headers User-Agent:Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 如果服务器对页面访问来源做了限制,则需要设置Headers的Referer属性

  Proxy(代理)的设置 如果网站限制了IP访问的次数,则需要更换代理服务器,以免被禁止访问

  异常处理

 

Python虚拟环境设置

Python虚拟环境设置 2018-4-2更新: centos7创建虚拟环境 在最新的CentOS版本7.3中,自带的Python版本依旧是2.7,而Django的建议版本已经到了3.x。所以需要安装新版本的Python,同时保留旧的Python环境。 首先安装epel源 1 yum install epel–release 查看可用的python3版本 1 yum list python3* 可以看见列表里提供Python 3.4 1 yum –y install python34 下面安装pip,python2.7和pyhon3.4的pip是可以同时存在的,默认分别为pip,pip3 1 2 yum install python–pip # 安装python2.7的pip yum install python34–pip # 安装python3.4的pip,两者可以同时存在 查看pip版本信息 1 2 3 4 ~# pip -V pip 8.1.2 from /usr/lib/python2.7/site–packages (python 2.7) ~# pip3 Read more…

nginx日志切割脚本

 

shadowSocks 从gwflist更新PAC脚本

shadowsocks从gfw更新pac时更新失败, 下面脚本可以代替更新功能, 适用于mac系统:

转自: https://gist.github.com/VincentSit/b5b112d273513f153caf23a9da112b3a

实现Openwrt路由器智能翻墙

openwrt固件实现智能翻墙 国庆放假前几天一直在家折腾路由器自动翻墙, 固件刷了好几遍, 虽然最后也没成功, 还是记录下配置过程, 以后再想做时用得着. 我的路由器是Netgear R6100, 去 https://wiki.openwrt.org/toh/hwdata/netgear/netgear_r6100 查到路由器信息, 安装 安装软件有三种方法, 一, 通过配置源在线安装;  二, 通过脚本安装. 三, 通过下载安装包安装; 一, 最简单的就是通过源安装: 由于openwrt-dist.sourceforge.net源不翻墙的话不能用, 会有bad address的错误提示, 实际配置需要配置反代源,  参考了 http://openwrt-dist.colendres.com/ , 最后配置如下: First, add openwrt-dist.pub file into opkg’s keys:

添加如下到/etc/opkg.conf, 注意将签名验证给注释掉

然后安装相应软件:

注: 每次路由器重启后, 都要先opkg update下才能安装软件 二, 通过脚本安装

三, 下载所有安装包然后opkg install 安装 Read more…

centos系统优化脚本

 

Mac系统下安装ipython分别支持python2和python3

操作系统:Mac10.11.5 python2.7.13 python3.6.1 安装python2:

安装python3:

此时,命令行输入python3则打开python3,输入python则打开python2。 利用pip安装 ipython

用pip安装ipython则是安装到python2的site-packages中,同理用pip3则是安装到python3的site-packages中。 进入/usr/local/bin目录下,可以看到ipython文件,用vi打开:  

openvpn服务器防火墙设置

 

centos用 yum 方式安装 nodejs 和 npm

centos用 yum 方式安装 nodejs 和 npm 要通过 yum 来安装 nodejs 和 npm 需要先给 yum 添加 epel 源, 添加方法在 centos 添加epel和remi源 中 安装完成后,执行

  注:centos 添加 epel 和 remi 源 添加 epel 源 64位:

32位:

导入 key:

添加 remi 源

  问题解决: yum 安装完node版本是6.17.1,通过npm install –registry=https://registry.npm.taobao.org 安装时会报以下错误: fetchMetadata: Read more…

安装ipa-client错误:kinit: Clients credentials have been revoked while getting initial credentials

安装ipa-client时, 遇到如下错误:

  执行kinit admin:

去ipa server端查询:

  原来是尝试次数过多(默认6次)被锁了 解锁一下:

再次安装ipa-client, 成功。