SEO笔记

python读取网站源码

2025年11月5日 10:37 # Python # Htm

这里是一个seo优化的小技巧,在seo笔记中其实很重要,我们通常在网页前台输出页面时会使用js技术动态覆盖页面原有内容,搜索引擎收录读取可能不准确,这个笔记代码可以读取网站加载时的显示内容,帮助seo的内容准确性。

这是python使用urllib2库读取网页源码保存到本地html文件的代码:

# -*- coding: utf-8 -*
import urllib2
content = urllib2.urlopen('http://www.163.com').read()#读取网站页面代码
#print(content)
f=open(r'd:\1.htm','w')#写入指定路径文件
f.write(content)
f.close()

在pyton 2.7 版本需要注意保存的编码,python3 没问题。