首页 / 后端开发 / requests模块⼊⻔

requests模块⼊⻔

2021-04-25 04:25 后端开发 阅读 2763 来源

既然是第三⽅模块, 那就需要我们对该模块进⾏安装, 安装⽅法:

pip install requests

如果安装速度慢的话可以改⽤国内的源进⾏下载安装.

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple requests

requests模块⼊⻔

案例一:

requests模块⼊⻔

接下来, 我们看⼀个稍微复杂那么⼀丢丢的, 百度翻译~

注意百度翻译这个url不好弄出来. 记住, 在输⼊的时候, 关掉各种输⼊法,

要⽤英⽂输⼊法, 然后不要回⻋. 就能看到这个sug了

案例2.抓取百度翻译数据

requests模块⼊⻔

requests模块⼊⻔

是不是很顺⼿呢? 还有⼀些⽹站在进⾏请求的时候会校验你的客户

端设备型号. ⽐如, 我们抓取⾖瓣电影

案例3: 抓取⾖瓣电影

requests模块⼊⻔

简单回顾⼀下本章内容

1. 爬⾍就是写程序去模拟浏览器⽤来抓取互联⽹上的内容

2. python中⾃带了⼀个urllib提供给我们进⾏简易爬⾍的编写

3. requests模块的简单使⽤, 包括get, post两种⽅式的请求. 以及 User-Agent的介绍.

猜你喜欢

  • 后端开发

    Python通过正则表达式去除(过滤)或者替换HTML标签

    本文实例介绍了Python通过正则表达式获取,去除(过滤)或者替换HTML标签的几种方法,具体内容如下

    2021-06-22 06:22 3231
  • 后端开发

    oss 上传文件返回值的url,返回自定义域名的url方法

    已经在后台设置了自定义域名,与bucket-name也已经绑定了,使用oss上传文件,返回值中的url怎么设置为自定义的域名

    2021-04-05 04:05 5557
  • 后端开发

    python开发环境的安装

    python开发环境的安装,分别介绍windows和mac下安装方式

    2021-04-11 04:11 2750
  • 后端开发

    thinkphp全站实现静态化页面

    模板完全静态化,也就是通过模板完全生成纯静态的网页,相比动态页面和伪静态页面更安全更利于SEO访问更快。

    2023-02-28 02:28 10343
  • 后端开发

    requests模块⼊⻔

    Python内置的urllib模块,用于访问网络资源。但是,它用起来比较麻烦,而且,缺少很多实用的高级功能。更好的方案是使用requests。它是一个Python第三方库,处理URL资源特别方便。

    2021-04-25 04:25 2764
  • 后端开发

    正则表达式入门

    Regular Expression, 正则表达式, ⼀种使⽤表达式的⽅式对字符串进⾏匹配的语法规则.我们抓取到的⽹⻚源代码本质上就是⼀个超⻓的字符串, 想从⾥⾯提取内容.⽤正则再合适不过了. 正则的优点: 速度快, 效率⾼, 准确性⾼ 正则的缺点: 新⼿上⼿难度有点⼉⾼.不过只要掌握了正则编写的逻辑关系, 写出⼀个提取⻚⾯内容的正则其实并不复杂正则的语法: 使⽤元字符进⾏排列组合⽤来匹配字符串

    2021-04-25 04:25 855