如何攻破防机器人网站-Cloudflare WAF反爬处理

September 24th, 2022

为什么搞这个？

事情的起因是，一个小伙伴搞了一个打图狗的程序，想要获取一个第三方的API，总是获取不到数据，但通过浏览器访问API又没问题，于是高价悬赏10u请我们帮忙，我想这个应该很简单，5分钟给你搞定吧。中间尝试用过模拟浏览器的header（头信息），cookie（浏览器本地数据），proxies（代理），webdriver（程序调用浏览器），2个小时过去了也没搞定，结果放弃了。

问题在哪?

我知道它去到了一个中间页（如图），用浏览器是看不到的，中间页又做了一次表单验证，感兴趣的可以搜一下Cloudflare，具体原理我就不说了。

解决办法

通过cloudscraper模块三行代码搞定

1、安装cloudscraper模块

python3 -m pip install cloudscraper

2、三行代码

import cloudscraper
scraper = cloudscraper.create_scraper()
resp = scraper.get('目标网站').text

欢迎关注Twitter：https://twitter.com/ishawzuo

Subscribe to 0xshaw

Receive the latest updates directly to your inbox.

Mint this entry as an NFT to add it to your collection.

Verification

This entry has been permanently stored onchain and signed by its creator.

Arweave Transaction

de3Kiw9W4vhUyP8…1zoUkPjt6nmR26Q

Author Address

0x031Bc31a4073059…654b50E219dC800

Content Digest

HiGiFuRRQcCJ1Km…pYpydxHAmdKvV18