采集器列表显示规则名称、描述、提供者、类别。 可以对选中的采集器进行编辑、复制、导出、转换和删除操作。...
一般情况下只需要选择默认的自动,插件会根据采集页面自动确认编码。极少数情况下需要你指定(例如DZ为简体中文GBK)。 识别目标站点编码请参考 操作指南:识别目标站点编码 。...
如果网站需要登录才能查看内容需要你指定cookie。 获取站点cookie的方法请参考 查看当前网站的cookie的两种方法 。 特别提示 : 使用本功 能需要升级为VIP用户 1、指定一个测试地址 2、...
插件可以依此字符串识别目标站点,自动匹配采集器,字符串为网页源代码中的一部分。 建议使用body标签部分的内容 不允许有中文和换行 长度不能少于10个字符 尽量避免与其它采集器...
可以通过DOM获取、字符串获取和智能获取三种方式。 有关DOM获取请参考 操作指南:DOM获取规则 。 有关字符串获取请参考 操作指南:字符串获取规则 。 特别提示 : 智能获取选项 需要...
可以通过DOM获取、字符串获取和智能获取三种方式。 有关DOM获取请参考 操作指南:DOM获取规则 。 有关字符串获取请参考 操作指南:字符串获取规则 。 特别提示 : 智能获取选项 需要...
包括来源、原作者和发布时间获取规则。此功能采集到的数据仅适用于发布到门户的文章。 特别提示 : 使用本功 能需要升级为VIP用户 发布时间获取规则的说明: 1、如果要采集时间,...
一般内容较多的网页站点通常使用多个页面来显示,在内容下方会显示分页列表。 这类网页需要设置分页。 可以使用DOM、字符串和表达式三种方式获取分页列表。 额外的可以指定分页...
包括特殊图片获取和特殊图片本地化设置。 前者是指某些站点图片的链接在标签img中不使用属性src指定,而是使用其它属性值来指定。 例一: 当标签img中包含属性class,且属性值中包...
如果有标准的单页采集器配置文件,即可在此导入。 可以将配置文件内容粘贴到文本框内或者直接选择配置文件。...