如何攻破防机器人网站-Cloudflare WAF反爬处理
September 24th, 2022

为什么搞这个?

事情的起因是,一个小伙伴搞了一个打图狗的程序,想要获取一个第三方的API,总是获取不到数据,但通过浏览器访问API又没问题,于是高价悬赏10u请我们帮忙,我想这个应该很简单,5分钟给你搞定吧。中间尝试用过模拟浏览器的header(头信息),cookie(浏览器本地数据),proxies(代理),webdriver(程序调用浏览器),2个小时过去了也没搞定,结果放弃了。

问题在哪?

我知道它去到了一个中间页(如图),用浏览器是看不到的,中间页又做了一次表单验证,感兴趣的可以搜一下Cloudflare,具体原理我就不说了。

解决办法

通过cloudscraper模块三行代码搞定

1、安装cloudscraper模块

python3 -m pip install cloudscraper

2、三行代码

import cloudscraper
scraper = cloudscraper.create_scraper()
resp = scraper.get('目标网站').text

欢迎关注Twitter:https://twitter.com/ishawzuo

Subscribe to 0xshaw
Receive the latest updates directly to your inbox.
Mint this entry as an NFT to add it to your collection.
Verification
This entry has been permanently stored onchain and signed by its creator.
More from 0xshaw

Skeleton

Skeleton

Skeleton