11月7日-佩恩-工作日志

  1. 早上开完会,对自己找的关键词进行筛选。整理链接和标题的表格去重,方便后期上传到网站。
  2. 下午继续采集关键词和整理链接和标题的表格,知乎尝试使用更换IP方式解决需要频繁的输入验证码的问题。大扫除,和比利负责二楼的卫生。
  3. 之后采集关键词,并汇总。采集了7万多关键词(未去重)。
  4. 明天计划:加速采集和筛选关键词。测试新的采集知乎资料的网站继续研究新的爬虫软件。测试使用更换IP方式和比利一起采集关键词,海贼王找资料,杰瑞采集知乎作者联系方式。

发表评论

电子邮件地址不会被公开。 必填项已用*标注