思路概览

用作程序猿,要每一日保持风姿浪漫颗好奇心和想要学习的神态。

演习如何利用搜狗Wechat爬取某钦定Wechat民众号的历史篇章。爬取Wechat大伙儿号本身难度超大,谢谢搜狗提供了几个可以爬取数据的平台。

代码部分参照他事他说加以考查于:

目标:

1.

图片 1

 

  1. 抓取内定民众号的野史篇章列表

图片 2

 

待消除难点:

如何从输入验证码页面自动跳转到大家想要的页面

图片 3

 全体思路:

行使python强大的库。 

要赢得寻觅页面,需求拼接地址。需选用python requests模块。

要深入分析爬下来的html数据,供给使用xpath,lxml,
能够动用chrome的扩张插件xpath helper。

发表评论

电子邮件地址不会被公开。 必填项已用*标注