找回密码
 开放注册

QQ登录

只需一步,快速开始

微信登录

微信扫码,快速开始

搜索
查看: 759|回复: 3

单页面一对多数据关系的采集

[复制链接]

51

主题

6

回帖

321

牛毛

一级牛人

积分
321
发表于 2012-3-23 16:13:40 | 显示全部楼层 |阅读模式 来自 山西省太原市
通常情况下,一个页面采集的数据输出的是一个表格,但对于某些情况,一个页面的数据本身就是属于一种1对多的数据关系,换句话就是两个表格的数据,且需要对应这样的关系。对于网络矿工而言,这样的数据关系可以通过数据加工一次采集完成。
举例说明:http://book.hjsm.tom.com/10***14/catalog.html  
可以看到这个页面是一个小说的目录,小说的目录是分卷展示,采集的时候,需要采集将分卷名和章节对应起来,这也就是我们所说的一对多的关系。 采集这样的数据需要让系统自动将卷和章节的关系对应并输出。网络矿工在数据加工中提供了“拆分行”处理的方式,即采集的时候,进需要配置卷及卷下所有章节的采集即可,将一个卷的所有章节统一采集,这样第一步实现了数据一对一的关系,系统即可顺利完成采集,同时在数据加工中,将章节进行拆分,并输出多行,与卷进行对应。这样就完成了数据一对多的处理。

1

主题

645

回帖

74

牛毛

初生牛犊

积分
74
发表于 2012-3-23 21:05:54 | 显示全部楼层 来自 安徽省芜湖市
支持~~顶顶~~~

0

主题

134

回帖

7

牛毛

初生牛犊

积分
7
发表于 2012-3-26 18:39:22 | 显示全部楼层 来自 浙江省湖州市
路过路过路过路过路过

0

主题

21

回帖

148

牛毛

一级牛人

积分
148
发表于 2012-3-27 21:40:23 | 显示全部楼层 来自 浙江省杭州市
讨厌采集
您需要登录后才可以回帖 登录 | 开放注册

本版积分规则

帮助|Archiver|小黑屋|通信管理局专项备案号:[2008]238号|NB5社区 ( 皖ICP备08004151号;皖公网安备34010402700514号 )

GMT+8, 2025-4-25 11:58 , Processed in 0.202800 second(s), 45 queries .

Powered by Discuz! X3.5

快速回复 返回顶部 返回列表