python读取网站源码

这里是一个seo优化的小技巧，在seo笔记中其实很重要，我们通常在网页前台输出页面时会使用js技术动态覆盖页面原有内容，搜索引擎收录读取可能不准确，这个笔记代码可以读取网站加载时的显示内容，帮助seo的内容准确性。

这是python使用urllib2库读取网页源码保存到本地html文件的代码：

# -*- coding: utf-8 -*
import urllib2
content = urllib2.urlopen('http://www.163.com').read()#读取网站页面代码
#print(content)
f=open(r'd:\1.htm','w')#写入指定路径文件
f.write(content)
f.close()

在pyton 2.7 版本需要注意保存的编码，python3 没问题。