requests模块⼊⻔
既然是第三⽅模块, 那就需要我们对该模块进⾏安装, 安装⽅法:
pip install requests
如果安装速度慢的话可以改⽤国内的源进⾏下载安装.
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple requests
案例一:
接下来, 我们看⼀个稍微复杂那么⼀丢丢的, 百度翻译~
注意百度翻译这个url不好弄出来. 记住, 在输⼊的时候, 关掉各种输⼊法,
要⽤英⽂输⼊法, 然后不要回⻋. 就能看到这个sug了
案例2.抓取百度翻译数据
是不是很顺⼿呢? 还有⼀些⽹站在进⾏请求的时候会校验你的客户
端设备型号. ⽐如, 我们抓取⾖瓣电影
案例3: 抓取⾖瓣电影
简单回顾⼀下本章内容
1. 爬⾍就是写程序去模拟浏览器⽤来抓取互联⽹上的内容
2. python中⾃带了⼀个urllib提供给我们进⾏简易爬⾍的编写
3. requests模块的简单使⽤, 包括get, post两种⽅式的请求. 以及 User-Agent的介绍.