网友 委员 说:
只要有一个入口就可以把所有内容抓来,并根据分析到的内容标签分类,感觉快做成搜索引擎了
网友 shiyu 说:
能来流量 普通技术 都好说
网友 笑花落半世琉璃 说:
努努力 吧花瓣没做完成的做完
网友 fly*ie 说:
楼主,你这个想法真可刑。。
注意抓取频率/抓取站点。。。别进去了。。
网友 nnt 说:
一个人顶一个google公司对吧
网友 委员 说:
fly*ie 发表于 2022-5-23 19:47
楼主,你这个想法真可刑。。
楼主,你这个想法真可刑。。
注意抓取频率/抓取站点。。。别进去了。。 …
网友 菜单 说:
老哥那么**了嘛
网友 委员 说:
菜单 发表于 2022-5-23 19:47
老哥那么**了嘛
网友 表妹 说:
老哥那么**了嘛
网友 表妹 说:
楼主加油,争取早日蹬缝纫机
网友 mjjok 说:
**开源给mjj使用
网友 sd*u 说:
当你觉得做得完美了的时候,回头一看,咦? 我怎么在发明一个类python语言。
网友 一刀vps 说:
我曾经也有这个想法。 只是技术不够放弃了。
网友 剁手mjj 说:
采集什么内容呢。
网友 KVMCloud 说:
PY可以实现
网友 Uscnc 说:
问:爬虫怎么收费
网友 ABNER_3036 说:
前景很光明
网友 JustDoing 说:
华为有个rpa机器人爬虫,可以一键获取页面上的链接以及照片,语法不难,只是感觉不如自行diy
网友 soj**ice 说:
真刑!
网友 shiyu 说:
能来流量 普通技术 都好说
网友 ixs 说:
那就自己做个搜索引擎
网友 aRNoLD 说:
有个叫八爪鱼的软件
网友 mengdodo 说:
单纯的爬html源代码的形式不难,只是后面做语义分词和索引有点难度,再就是爬取的结果怎么安排权重,这地方够发表好几篇论文了
未经允许不得转载:爱主机 » 最近在研究通用采集爬虫