日常在SEO優(yōu)化中,在查看百度統(tǒng)計(jì)數(shù)據(jù)時(shí),總能有一堆無(wú)效、垃圾的關(guān)鍵詞記錄在表中,讓技術(shù)分析后,可以堅(jiān)信網(wǎng)站建設(shè)中沒有被黑,沒有被掛馬,沒有被植入,那這些關(guān)鍵詞都是從哪里來(lái)的呢。
操作原理也很簡(jiǎn)單,先寫一個(gè)機(jī)器爬蟲,爬取頁(yè)面內(nèi)容,找到你的網(wǎng)站,源代碼尋找「#/hm.js」如果找到了就說(shuō)明網(wǎng)站建設(shè)初期使用了百度統(tǒng)計(jì),然后再取后面的參數(shù),就得到了站點(diǎn)的百度統(tǒng)計(jì)ID,然后保存到數(shù)據(jù)庫(kù),拿到網(wǎng)站的百度統(tǒng)計(jì)ID以后,就可以進(jìn)行下一步,使用程序批量的給百度統(tǒng)計(jì)接口發(fā)送數(shù)據(jù),也就是說(shuō)這些內(nèi)容他們根本不是真的去你的網(wǎng)站,而是直接給百度統(tǒng)計(jì)的接口提交了數(shù)據(jù),這樣,就模擬用戶關(guān)鍵詞訪問(wèn),把一條條垃圾關(guān)鍵詞,寫入你的統(tǒng)計(jì)報(bào)表里。
既然我們已經(jīng)知道原理,那就有方法去處理這個(gè)問(wèn)題。 雖然不能徹底杜絕刷百度統(tǒng)計(jì)代碼的行為,但能有效遏制這種垃圾操作數(shù)據(jù)統(tǒng)計(jì)。
首先,你的舊的統(tǒng)計(jì)代碼ID已經(jīng)被他們獲取到了,保存到了他們的數(shù)據(jù)庫(kù),所以建議舊的代碼就放棄吧,去百度統(tǒng)計(jì)刪除掉,再新增網(wǎng)站,你會(huì)獲得一個(gè)新的統(tǒng)計(jì)代碼。
然后,為了讓他們的爬蟲程序識(shí)別不到百度統(tǒng)計(jì)代碼,我們需要將百度統(tǒng)計(jì)的URL地址做一個(gè)變換,我的方式是將原有的百度統(tǒng)計(jì)URL地址打散成一個(gè)一個(gè)的字符串?dāng)?shù)組,然后再拼裝起來(lái),實(shí)例如下:
百度統(tǒng)計(jì)給我們的代碼:
var _hmt = _hmt || [];
(function() {
var hm = document.createElement("script");
hm.src = "https://#/hm.js?ee1f1987ccfc332s9bcd61a1d220f5ae41e1";
var s = document.getElementsByTagName("script")[0];
s.parentNode.insertBefore(hm, s);
})();
將百度統(tǒng)計(jì)的特征,也就是地址打散成數(shù)組,再組裝使用:
var _hmt = _hmt || [];
(function() {
var hm = document.createElement("script");
var analytics_bd = 'ee1f1987ccfc332s9bcd61a1d220f5ae41e1';
hm.src = ['ht', 't', 'ps', ':/', '/h', 'm', '.', 'ba', 'i', 'd', 'u.c', 'o', 'm/', 'h', 'm', '.j', 's?', analytics_bd].join('');
var s = document.getElementsByTagName("script")[0];
s.parentNode.insertBefore(hm, s);
}
)();
需要改動(dòng)的就只有一行,注意「hm.src = "https://#/hm.js?ee1f1987ccfc332s9bcd61a1d220f5ae41e1";」這行代碼,被拆散為數(shù)組,然后再拼裝起來(lái)使用。這樣他們的爬蟲程序就無(wú)法識(shí)別到你在使用百度統(tǒng)計(jì)了。
上一篇新聞:提高網(wǎng)站權(quán)重的幾大的技巧
專屬營(yíng)銷顧問(wèn)為您提供免費(fèi)方案及報(bào)價(jià)!
24小時(shí)免費(fèi)咨詢
請(qǐng)輸入您的聯(lián)系電話,座機(jī)請(qǐng)加區(qū)號(hào)