Python实现抓取网页并且解析的实例_易贤网

简要咨询新媒体/短视频平台网站导航网站搜索手机站点联系我们

公务员考试

当前位置：首页 > 范文|应用文 > IT技术专栏 > 脚本栏目

Python实现抓取网页并且解析的实例

来源：易贤网阅读：986 次日期：2014-09-25 10:22:19

温馨提示：易贤网小编为您整理了“Python实现抓取网页并且解析的实例”,方便广大网友查阅！

本文以实例形式讲述了Python实现抓取网页并解析的功能。主要解析问答与百度的首页。分享给大家供大家参考之用。

主要功能代码如下：

?123456789101112131415161718192021222324252627282930313233343536373839404142434445 #!/usr/bin/python #coding=utf-8 import sys import re import urllib2 from urllib import urlencode from urllib import quote import time maxline = 2000 wenda = re.compile("href=\""") baidu = re.compile("<a href=\"".*?>更多知道相关问题.*?</a>") f1 = open("baidupage.txt","w") f2 = open("wendapage.txt","w") for line in sys.stdin: if maxline == 0: break query = line.strip(); time.sleep(1); recall_url = "=" + query; response = urllib2.urlopen(recall_url); html = response.read(); f1.write(html) m = wenda.search(html); if m: if m.group(1) == "110": print query + "\twenda\t0"; else: print query + "\twenda\t1"; else: print query + "\twenda\t0"; recall_url = "=" + query +"&ie=utf-8"; response = urllib2.urlopen(recall_url); html = response.read(); f2.write(html) m = baidu.search(html); if m: print query + "\tbaidu\t1"; else: print query + "\tbaidu\t0"; maxline = maxline - 1; f1.close() f2.close()

更多信息请查看IT技术专栏

更多信息请查看脚本栏目

【点此处就本文及相关问题在本站进行非正式的简要咨询（便捷快速）】【点此处查询各地各类考试咨询QQ号码及交流群】

上一篇：跟老齐学Python之dict()的操作方法

下一篇：python中对list去重的多种方法

易贤网手机网站地址：Python实现抓取网页并且解析的实例

由于各方面情况的不断调整与变化，易贤网提供的所有考试信息和咨询回复仅供参考，敬请考生以权威部门公布的正式信息和咨询为准！

相关阅读脚本栏目

Bottle框架中的装饰器类和描述符应用详解10月30日

Python探索之SocketServer详解10月30日

Python探索之实现一个简单的HTTP服务器10月30日

python探索之BaseHTTPServer-实现Web服务器介绍10月30日

13个最常用的Python深度学习库介绍10月30日

深入理解Python中的*重复运算符10月30日

python logging日志模块详解10月30日

System表空间不足的报警问题浅析10月22日

Android开发自定义TextView省略号样式的方法10月22日

MySQL 清除表空间碎片的实例详解10月22日

Ubuntu下MySQL安装及配置远程登录教程10月22日

Python 2.x如何设置命令执行的超时时间实例10月22日

windows 64位下redis安装教程10月22日

Android 自定义 HorizontalScrollView 打造多图片OOM 的横向滑动效果10月22日

浅谈Node Inspector 代理实现10月22日

java web开发之购物车功能实现示例代码10月22日

Android开发中GridView用法示例10月22日

Django ORM框架的定时任务如何使用详解10月22日

SpringMail使用过程中的报错解决办法10月22日

Android 使用自定义RecyclerView控件实现Gallery效果10月22日

易贤网移动网站

2025国考·省考课程试听报名

报班类型
姓名
手机号
验证码

最新信息

2025年云南康旅酒店管理有限公司社会招聘公告

2025年云南省上半年事业单位招聘公告及岗位表汇总

2025年昆明冶金高等专科学校招聘人员公告

2025年昆明冶金高等专科学校招聘博士、双师公告

2025年云南省发展和改革委员会所属事业单位招聘人员公告

2025年上半年云南省水利厅部分直属事业单位招聘人员公告

2025年湖南省考试录用公务员公告

2025年保山机场招聘公告

2025年2月昆明市社会福利院招聘编外聘用人员公告

2025年昆明厚致百盈企业管理有限公司安宁综合营销运营中心招聘简章

公考类

云南公务员贵州公务员四川公务员广西公务员各省公务员国家公务员选调遴选

招聘类

事业单位教师招聘特岗教师三支一扶志愿者银行招聘国企招聘

各类考试

学历升学会计考试职业资格外语考试医学考试工程考试教师资格

关于我们 | 联系我们 | 人才招聘 | 网站声明 | 网站帮助 | 非正式的简要咨询 | 简要咨询须知 | 新媒体/短视频平台 | 手机站点 | 投诉建议

工业和信息化部备案号：滇ICP备2023014141号-1 云南省教育厅备案号：云教ICP备0901021 滇公网安备53010202001879号人力资源服务许可证：（云）人服证字（2023）第0102001523号

联系电话：0871-65099533/13759567129 获取招聘考试信息及咨询关注公众号：hfpxwx
咨询QQ：1093837350（9:00—18:00）版权所有:易贤网