期刊问答网 论文发表 期刊发表 期刊问答
  • 回答数

    2

  • 浏览数

    99

blucezhang
首页 > 期刊问答网 > 期刊问答 > 爬虫爬取论文网站

2个回答 默认排序1
  • 默认排序
  • 按时间排序

heyue_1984

已采纳
最简单的办法:深层网络爬取的基本构成:URL列表、LVS列表(LVS指的是标签/数值集合,即填充表单的数据源)、爬行控制器、解析器、LVS控制器、表单分析器、表单处理器、响应分析器。深层网络爬虫的表单填写有两种类型:基于领域知识的表单填写(建立一个填写表单的关键词库,在需要的时候,根据语义分析选择对应的关键词进行填写);基于网页结构分析的表单填写(一般在领域知识有限的情况下使用,这种方式会根据网页结构进行分析,并自动地进行表单填写)。

爬虫爬取论文网站

100 评论(9)

喷嚏儿

可以呀目前最好用的还是  618IP爬虫 代理。企业网页的最好选择。
214 评论(10)

相关问答