当前位置: 首页 > 图文教程 > 脚本技术 > Python > Python urlopen 使用小示例

Python
Python 文件操作实现代码
动态创建类实例代码
python 中文字符串的处理实现代码
Python 匹配任意字符(包括换行符)的正则表达式写法
Python 开发Activex组件方法
Python+Django在windows下的开发环境配置图解
python 文件和路径操作函数小结
python 快速排序代码
Python2.5/2.6实用教程 入门基础篇
Python3 入门教程 简单但比较不错
Python 元类使用说明

Python urlopen 使用小示例


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-11   浏览: 266 ::
收藏到网摘: n/a

打开一个网页获取所有的内容、获取Http头、使用代理等小结

一、打开一个网页获取所有的内容

from urllib import urlopen
doc = urlopen("http://www.baidu.com").read()
print doc

二、获取Http头

from urllib import urlopen
doc = urlopen("http://www.baidu.com")
print doc.info()
print doc.info().getheader('Content-Type')

三、使用代理

1. 查看环境变量

print ""n".join(["%s=%s" % (k, v) for k, v in os.environ.items()])
print os.getenv("http_proxy")

2. 设置环境变量

import os
os.putenv("http_proxy", "http://proxyaddr:<port>")

3. 使用代理

# Use http://www.someproxy.com:3128 for http proxying
proxies = {'http': 'http://www.someproxy.com:3128'}
filehandle = urllib.urlopen(some_url, proxies=proxies)
# Don't use any proxies
filehandle = urllib.urlopen(some_url, proxies={})
# Use proxies from environment - both versions are equivalent
filehandle = urllib.urlopen(some_url, proxies=None)
filehandle = urllib.urlopen(some_url)