哪位采集大佬可以分享一下火车头采集DZ的规则吗?
侧边栏壁纸
  • 累计撰写 57,311 篇文章
  • 累计收到 0 条评论

哪位采集大佬可以分享一下火车头采集DZ的规则吗?

James
2020-10-13 / 0 评论 / 64 阅读 / 正在检测是否收录...

RT,说实话,我想采集loc

希望做到这种格式:

帖子主内容;

用户1:评论1

用户2:评论2

.....

用户10:评论10


-----------------------------------------------------
网友回复:

引用:yueyyy发表于2020-10-914:43

已加入加急枪毙名单


网友回复:

引用:鲁迅发表于2020-10-914:48

采集评论到自己站的评论比较难


网友回复:

引用:xlouspeng发表于2020-10-914:49

我想直接采集成内容,大概格式问:

帖子主内容;


网友回复:

引用:鲁迅发表于2020-10-914:51

这种简单正则循环提取一下就可以了


网友回复:

有个循环匹配的功能,可以实现你的目的。不懂可以百度下。


网友回复:

引用:baiyangz1发表于2020-10-915:00

有个循环匹配的功能,可以实现你的目的。不懂可以百度下。


网友回复:

引用:xlouspeng发表于2020-10-915:10

循环采集倒是把评论内容采集到了,但是,实现“用户名:评论“发难了


网友回复:

引用:baiyangz1发表于2020-10-915:15

我的建议是不要抓取用户ID,因为意义不大,可以抓取评论之前的字符串,然后替代成用户,不是可以抓到用户...


网友回复:

可以去学习下machbbs.com看过采集得最完整的。


网友回复:

引用:citywar发表于2020-10-915:44

可以去学习下machbbs.com看过采集得最完整的。


网友回复:

引用:xlouspeng发表于2020-10-915:57

这个真的是大佬了


网友回复:

引用:citywar发表于2020-10-916:01

对啊。连回复的格式都完整过去了。

好像他站点用的腾讯云香港。速度也好快。...

0