python简单爬虫–get方式详解-偶像资源网

环境准备

安装第三方库

pip install requests
pip install bs4
pip install lxml

进行爬虫

1.获取网页数据。

import requests
from bs4 import BeautifulSoup
url = \"https://cn.bing.com/search?q=爬虫CSDN&qs=n&form=QBRE&sp=-1&pq=爬虫csdn&sc=5-6&sk=&cvid=0B13B88D8F444A0182A4A6C36E463179/\"
response = requests.get(self.url)

2.解析网页数据

soup = BeautifulSoup(response.text, \'lxml\')

3.选取目标数据。此处key 依据源代码目标标题的位置确定。首先进入开发者模式，后查看目标在html中的位置，右击选择“复制selector”，见下图。

key = \"#b_results > li > div.b_title > h2 > a\"
soup.select(key)

4.清洗数据

result = {}
for i, item in enumerate(data):
     result.update({
         f\'title_{i}\': item.get_text(),
         f\'url_{i}\': item.get(\'href\')
     })
 print(result)

参考

链接:https://www.jb51.net/article/152560.htm

总结

本篇文章就到这里了，希望能够给你带来帮助，也希望您能够多多关注免费资源网的更多内容！

版权声明 1 本网站名称：偶像资源网
2 本站永久网址：https://www.ox520.com
3 本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长 QQ593098775进行删除处理。
4 本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6 本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END

python简单爬虫–get方式详解

目录

环境准备

进行爬虫

参考

总结

请登录后发表评论