找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 698|回复: 1

采集新浪滚动新闻

[复制链接]

主题

0

回帖

0

积分

管理员

积分
0
发表于 2023-7-31 10:13:24 | 显示全部楼层 |阅读模式
    新浪网新闻中心(https://news.sina.com.cn/)是新浪网最重要的频道之一。
   

    其中有一个“滚动”栏目(https://news.sina.com.cn/roll/),24小时滚动报道国内、国际及社会新闻,每日编发新闻数以万计。

    现在我们尝试使用小石头采集器采集该频道新闻内容。
    首页我们需要从应用市场获取“新滚新闻”扩展组件,并上传到服务器。
    进入到站点后台管理,打开插件“小石头采集器”,“列表采集”,点击“添加采集器”。

    “采集模式”选择“规则模板”,并输入“滚动”栏目链接。

    点击自动匹配规则。根据提示,输入要采集的栏目ID和页码范围。

    给采集器一个名称,点击保存。
    一般情况保持默认“内容规则”,根据需要可以增加“格式化内容”项目,自动去除选定标签,本例选择删除链接。

   

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

主题

0

回帖

0

积分

管理员

积分
0
 楼主| 发表于 2023-7-31 10:24:57 | 显示全部楼层
    根据个人需要,修改”采集设置“和”发布设置“,

    指定发布者和发布时间。

    现在可以点击“提交采集”。


    显示采集进度。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|小石头采集器 Stone Spider

GMT+8, 2024-5-15 18:25 , Processed in 0.111311 second(s), 27 queries .

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表