单页面一对多数据关系的采集
通常情况下,一个页面采集的数据输出的是一个表格,但对于某些情况,一个页面的数据本身就是属于一种1对多的数据关系,换句话就是两个表格的数据,且需要对应这样的关系。对于网络矿工而言,这样的数据关系可以通过数据加工一次采集完成。举例说明:http://book.hjsm.tom.com/109314/catalog.html
可以看到这个页面是一个小说的目录,小说的目录是分卷展示,采集的时候,需要采集将分卷名和章节对应起来,这也就是我们所说的一对多的关系。 采集这样的数据需要让系统自动将卷和章节的关系对应并输出。网络矿工在数据加工中提供了“拆分行”处理的方式,即采集的时候,进需要配置卷及卷下所有章节的采集即可,将一个卷的所有章节统一采集,这样第一步实现了数据一对一的关系,系统即可顺利完成采集,同时在数据加工中,将章节进行拆分,并输出多行,与卷进行对应。这样就完成了数据一对多的处理。
支持~~顶顶~~~ 路过路过路过路过路过 讨厌采集
页:
[1]