致力于为用户提供真实的
主机测评数据及优惠信息

最近在研究通用采集爬虫

网友 委员 说:

只要有一个入口就可以把所有内容抓来,并根据分析到的内容标签分类,感觉快做成搜索引擎了

网友 shiyu 说:

能来流量  普通技术 都好说

网友 笑花落半世琉璃 说:

努努力 吧花瓣没做完成的做完

网友 fly*ie 说:

楼主,你这个想法真可刑。。

注意抓取频率/抓取站点。。。别进去了。。

网友 nnt 说:

一个人顶一个google公司对吧

网友 委员 说:

fly*ie 发表于 2022-5-23 19:47
楼主,你这个想法真可刑。。

注意抓取频率/抓取站点。。。别进去了。。 …
网友 菜单 说:

老哥那么**了嘛

网友 委员 说:

菜单 发表于 2022-5-23 19:47
老哥那么**了嘛
网友 表妹 说:

楼主加油,争取早日蹬缝纫机

网友 mjjok 说:

**开源给mjj使用

网友 sd*u 说:

当你觉得做得完美了的时候,回头一看,咦? 我怎么在发明一个类python语言。

网友 一刀vps 说:

我曾经也有这个想法。 只是技术不够放弃了。

网友 剁手mjj 说:

采集什么内容呢。

网友 KVMCloud 说:

PY可以实现

网友 Uscnc 说:

问:爬虫怎么收费

网友 ABNER_3036 说:

前景很光明

网友 JustDoing 说:

华为有个rpa机器人爬虫,可以一键获取页面上的链接以及照片,语法不难,只是感觉不如自行diy

网友 soj**ice 说:

真刑!

网友 shiyu 说:

能来流量  普通技术 都好说

网友 ixs 说:

那就自己做个搜索引擎

网友 aRNoLD 说:

有个叫八爪鱼的软件

网友 mengdodo 说:

单纯的爬html源代码的形式不难,只是后面做语义分词和索引有点难度,再就是爬取的结果怎么安排权重,这地方够发表好几篇论文了

赞(0) 打赏
未经允许不得转载:爱主机 » 最近在研究通用采集爬虫
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址