当前位置: 首页 > 图文教程 > 脚本技术 > Python > Python urlopen 使用小示例

Python
Python 可爱的大小写
Python 条件判断的缩写方法
Python struct.unpack
Python splitlines使用技巧
比较详细Python正则表达式操作指南(re使用)
Python 过滤字符串的技巧,map与itertools.imap
Python open读写文件实现脚本
Python linecache.getline()读取文件中特定一行的脚本
Python 时间处理datetime实例
Python 命令行参数sys.argv
Python httplib,smtplib使用方法
Python 拷贝对象(深拷贝deepcopy与浅拷贝copy)
Python enumerate遍历数组示例应用
Python 初始化多维数组代码
Python 深入理解yield
Python __getattr__与__setattr__使用方法
Python 网络编程起步(Socket发送消息)
Python urlopen 使用小示例
Python 调用VC++的动态链接库(DLL)
新手该如何学python怎么学好python?

Python urlopen 使用小示例


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-09-11   浏览: 261 ::
收藏到网摘: n/a

打开一个网页获取所有的内容、获取Http头、使用代理等小结

一、打开一个网页获取所有的内容

from urllib import urlopen
doc = urlopen("http://www.baidu.com").read()
print doc

二、获取Http头

from urllib import urlopen
doc = urlopen("http://www.baidu.com")
print doc.info()
print doc.info().getheader('Content-Type')

三、使用代理

1. 查看环境变量

print ""n".join(["%s=%s" % (k, v) for k, v in os.environ.items()])
print os.getenv("http_proxy")

2. 设置环境变量

import os
os.putenv("http_proxy", "http://proxyaddr:<port>")

3. 使用代理

# Use http://www.someproxy.com:3128 for http proxying
proxies = {'http': 'http://www.someproxy.com:3128'}
filehandle = urllib.urlopen(some_url, proxies=proxies)
# Don't use any proxies
filehandle = urllib.urlopen(some_url, proxies={})
# Use proxies from environment - both versions are equivalent
filehandle = urllib.urlopen(some_url, proxies=None)
filehandle = urllib.urlopen(some_url)