RT,说实话,我想采集loc
希望做到这种格式:
帖子主内容;
用户1:评论1
用户2:评论2
.....
用户10:评论10
-----------------------------------------------------
网友回复:
引用:yueyyy发表于2020-10-914:43
已加入加急枪毙名单
网友回复:
引用:鲁迅发表于2020-10-914:48
采集评论到自己站的评论比较难
网友回复:
引用:xlouspeng发表于2020-10-914:49
我想直接采集成内容,大概格式问:
帖子主内容;
网友回复:
引用:鲁迅发表于2020-10-914:51
这种简单正则循环提取一下就可以了
网友回复:
有个循环匹配的功能,可以实现你的目的。不懂可以百度下。
网友回复:
引用:baiyangz1发表于2020-10-915:00
有个循环匹配的功能,可以实现你的目的。不懂可以百度下。
网友回复:
引用:xlouspeng发表于2020-10-915:10
循环采集倒是把评论内容采集到了,但是,实现“用户名:评论“发难了
网友回复:
引用:baiyangz1发表于2020-10-915:15
我的建议是不要抓取用户ID,因为意义不大,可以抓取评论之前的字符串,然后替代成用户,不是可以抓到用户...
网友回复:
可以去学习下machbbs.com看过采集得最完整的。
网友回复:
引用:citywar发表于2020-10-915:44
可以去学习下machbbs.com看过采集得最完整的。
网友回复:
引用:xlouspeng发表于2020-10-915:57
这个真的是大佬了
网友回复:
引用:citywar发表于2020-10-916:01
对啊。连回复的格式都完整过去了。
好像他站点用的腾讯云香港。速度也好快。...