标签:
网络工具爬山虎采集器是一款新一代智能化的网页采集工具,智能分析、可视化界面,一键采集无需编程,支持自动生成采集脚本,可以采集互联网99%的网站。软件简单易学,通过智能算法+可视化界面,随心所欲,抓取自己想到的数据,只要轻松点击鼠标,就能采集网页上的数据。
功能特点
简单、高效、通用;
一键提取数据;
简单易学,通过可视化界面,鼠标点击;
即可抓取数据;
快速高效;
内置一套高速浏览器内核,加上HTTP;
引擎模式,实现快速采集数据;
适用各种网站;
能够采集互联网99%的网站,包括单页;
应用Ajax加载等等动态类型网站;
使用流程
输入采集网址;
打开软件,新建任务,输入需要采集的网站地址。
智能分析,全程自动化提取数据;
进入到第二步后,爬山虎采集器全自动智能分析网页,并且从中提取出列表数据。
导出数据到表格、数据库、网站等;
运行任务,将采集到的数据导出为Csv、Excel以及各种数据库,支持api导出。
更新日志
V2.1.1更新日志:
修复分页的采集优先级;
提前检验xpath和正则的正确性;
其他使用了Inputbox的验证修改;
增加数据处理-前后缀;
修复英文系统下乱码问题;
修复小分辨率下,窗口超过屏幕问题;
新增路由拨号和adsl拨号功能;
对等待命令增加等待某元素;
修复form的解析;
任务列表按时间顺序排列;
完善探测列表数据(列表就是a元素;
修复下载文件无后缀问题;
新增高级过滤功能;
添加鼠标和键盘的模拟操作;
增大滚动页数。