網絡神采是一款采集軟件,可以幫助用戶快速的采集網頁數據,軟件可以根據用戶的需求來進行頁面的智能采集,軟件提供可視化采集功能,讓用戶可以看到軟件的采集情況,采集的網頁內容,軟件除了采集之外還能直接下載網頁數據。
軟件功能
1、采集強度
支持JS解析、POST分頁、登錄采集、跨層采集。對于疑難采集頁面,有成熟的解決方案。
2、速度快
支持多任務同時運行,每個任務又可以設置多線程,確保運行效率。
3、規模化
支持任務多級分類、批量管理。支持云服務器分布式部署,管理員團隊協合。
4、流程化
支持定時采集,任務定時自動啟動。通過二次開發,實現流程化的信息采集、信息處理。
5、運行穩定
系統運行穩定,要求“0 bug”。目標網頁改版后,自動通知管理員。
6、準確性
定制好任務后,采集準確率可達100%,即一條不漏。
更新日志
2019-08-13 V6.3.15
可視化采集配置,放大、縮小范圍時:
1、提取下一網址:默認為連續 * 號,按Ctrl鍵為單個 * 號
2、循環采集:按Shift鍵,支持連續 * 號
3、多個 * 號時,加亮顯示
可視化采集配置,操作細節:
1、顯示完整XPath:選中后,不再取消當前元素,而是直接切換
2、廢除選項:復制XPath時覆蓋現有,改為:復制XPath時,按Shift鍵可覆蓋現有內容
3、Gecko內核:換回 xulrunner_60.0.26,低版本 xulrunner_45.0.34 仍會出現 COM 斷開,體驗太差
修復bug:
1、循環采集:整條數據或“關鍵規則”采集失敗后,URL被回收多次
2、切換動態層:從當前層切換到動態層時,如果動態層使用了“模擬點擊”,而當前層未使用,會導致“提取下一層XPath時出錯: 未將對象引用設置到對象的實例”。
相關版本
裝機必備軟件
網友評論