Piwiki修訂版是一款開源網站訪問統計系統,因此該軟件可以幫助用戶們去監測網頁瀏覽人數, 訪問最多的頁面,可以幫助用戶們查詢網站的核心搜索關鍵詞等等信息,讓用戶們可以通過該信息去優化自己的網站,從而提升網站在各大搜索引擎上的排名。
操作說明
剛裝好的Piwik是空空如也的,此時我們需要這個系統幫我們統計數據。目前Piwik支持兩種采集用戶訪問記錄的方式: JS追蹤和訪問日志追蹤。JS追蹤可定制型高,可以獲取到用戶的分辨率,瀏覽器插件等等,還可以捕獲自定義變量。訪問日志追蹤(如apache的accesslog)可以追蹤到用戶的錯誤請求(如40X錯誤,有助于捕獲到惡意用戶和爬蟲,蜘蛛等等),目前這兩種追蹤得到的數據還不支持合并。
JS追蹤
在管理設置-網站-右邊即可看到"顯示跟蹤代碼",如下圖所示:
將此代碼復制到web項目的footer中即可(即所有頁面都嵌入這段相同的js代碼,用于捕獲用戶的信息,如分辨率,瀏覽器UA,IP等),還可以按照官方文檔,捕獲自定義變量。
log追蹤
log追蹤無需修改web項目,但是必須要有登錄服務器并讀取accesslog的權限。
log追蹤的過程是解析webserver的accesslog,然后通過piwik的API上傳,最終在piwik頁面上展示。
這個過程不用自己去實現了,piwik的壓縮包中已經帶有一個python腳本可以幫助我們完成這個工作了,該腳本存儲于piwik目錄下的misc/log-analytics/import_logs.py。
將這個腳本遠程拷貝到目標服務器上,按照腳本的參數格式執行即可,我的命令行:
1./import_logs.py --url=http://192.168.1.106/piwik/ --idsite=1 --recorders=2 --token-auth=319fb461d3225905039551e861edde60 --enable-static --enable-bots --enable-http-errors --enable-http-redirects /var/log/apache2/access.log
使用--help參數即可看到這個腳本的命令行,只有一個--url參數是必須的,指明piwik的訪問路徑。
這里對我使用的參數做一下簡介:
--idsite表明抓取到的信息上傳到哪個序號對應的網站(這里的參數為1,代表解析的數據會統計到first_web這個網站中)
--token-auth這個參數是管理員的訪問token,在系統頁面最頂上的API點開即可看到,如下圖所示。這個參數可以使用--login=LOGIN --password=PASSWORD這兩個參數替代,必須是管理員的賬戶和密碼。
--recorders使用多線程解析,默認為1,官方建議這個參數和核心數一致。
--enable-static --enable-bots --enable-http-errors這三個參數基本上把apache的accesslog能抓取到的全部信息都抓全了,抓取靜態資源(jpg,png,js,css等非html的訪問),抓取bots(不知道這個是什么,猜測是否是機器人?),抓取html錯誤碼(如40X請求等等)
/var/log/apache2/access.logapache的accesslog存放路徑,常見的webserver如nginx,lighthttpd等,腳本自帶有解析引擎,無需別的參數,如果非常見webserver的話,加上--log-format-regex這個參數來自定義日志格式抓取。
當腳本執行完畢時,即可在piwik中看到網站的訪問記錄了,使用也很方便。長期使用可以寫入crontab即可。
注意:
log解析的方式追蹤比較慢,不適合實時追蹤用戶訪問記錄,建議每過幾小時執行一次crontab,來定時解析log。
如果開啟了--enable-static --enable-bots --enable-http-errors這三個參數,解析過程將會很緩慢(我這邊大概十幾條每秒),不要讓crontab太頻繁,會直接讓mysql數據庫超出連接而掛掉,我是每4小時執行一次crontab。
相關版本
裝機必備軟件
網友評論