标签:
数据采集器支持采集过程断点续采功能,不受浏览器意外关闭影响,重新启动后不会重复采集。支持自动对比过滤功能,对已采集的链接系统不会进行重复采集和入库。以上两条功能可大幅度减少采集时间,降低系统负载。采集规则嗅探器,只需要简单的鼠标复制剪贴即可生成完美的采集规则,无需烦琐的过程,即便你是新手亦能游刃有余地使用守望采集器采集任何内容!
功能介绍
1、采集目标不限,只要能连接的页面。
2、采集对象支持:文章、图片、Flash、影音等
3、完美的内容入库解决方案,守望采集器提供2种入库方式:数据库直导和模拟提交。
1)数据库直导方式支持任何基于Mysql数据库存储信息的内容管理系统。
2)模拟提交方式理论上支持任何目标,不受目标程序语言、数据库类别限制。实际使用效果受目标应用程序影响。
软件特色
1、支持文章内容分页采集。
2、支持论坛采集
3、支持UTF-8转换到GB2312,可采集内容字符格式为UTF-8的目标。
4、支持把文章内容保存到本地。
5、支持站点+栏目管理方式,使采集管理一目了然。
6、支持文章链接替换功能。
7、支持采集器设置无限过滤功能。
8、支持文章内图片采集保存到本地,自动替换文件名避免重复。
9、支持文章内FLASH文件采集保存到本地。
10、支持限制PHP FOPEN函数功能的虚拟主机。
11、支持采集结果人工筛选,并提供“空标题、空内容”的快速过滤删除。
12、支持PHPWIND、Discuz论坛导库,程序包内含2大论坛导库规则及操作指南说明。
13、支持自定义入库间隔时间,躲避虚拟主机并发数限制。