說明:如果您有任何疑問或想咨詢其他業(yè)務(wù)請撥打電話 400 685 0732
全網(wǎng)監(jiān)測海量數(shù)據(jù)按需發(fā)布監(jiān)測預(yù)警
實(shí)時(shí)把握輿情動態(tài)精準(zhǔn)追溯信息源頭
參加了搜索營銷大會,聽了seo幾位牛人的演講,個(gè)人而言還是很有一些感想的,尤其是對百度算法的分析尤其讓我小激動了一把。本來想把講師的PPT整過來的,可無奈于人家版權(quán)所有,拒絕分享給大家,只能偷偷的在電腦上拍下了一部分。經(jīng)過整理,挑選了一個(gè)和大家分享一下!
其實(shí),是說一下在GOMX大會上中讓我感興趣的一個(gè)百度算法,百度是如何判斷一個(gè)百度賬號是垃圾賬號的。嚴(yán)格說來這個(gè)算法應(yīng)該說是針對口碑的更多一些,可是作為以百度為研究對象還經(jīng)常會用到百度賬號的我們,怎么著我都有理由去好好研究一番這個(gè)算法。大概我們都欲將富奧這樣的情況:在某一次發(fā)百度知道的時(shí)候,問題或答案被刪掉之后,在以后無論我們發(fā)什么問題或者回答都會被刪掉,而且不管是我們投訴也好,申訴也罷總之賬號是不能用了。而且不管你的等級有多高,都是如此。那么這個(gè)原因是什么呢?(說到這里,我都覺得痛心疾首啊,這一張PPT我竟然沒有拍到~~~)
其實(shí)百度是有專門的算法來針對這些的。它的具體算法是這樣的:
一、同一賬號發(fā)布信息所對應(yīng)的地點(diǎn)數(shù)量大于預(yù)定閥值;
二、同一賬號發(fā)布信息頻率大于預(yù)定閥值;
三、同一賬號發(fā)布信息所間隔的時(shí)間相等;
四、同一賬號發(fā)布的多個(gè)信息具有相同的內(nèi)容;
五、發(fā)布信息的內(nèi)容中包含指向低質(zhì)量網(wǎng)頁的網(wǎng)址;
六、發(fā)布信息的內(nèi)容中包含廣告特征的字符串。
(哎,幸虧我有一個(gè)好記性,對感興趣的內(nèi)容幾乎過目不忘,沒有PPT,還能整理這樣全,爾等不必羨慕~哈哈)
我們可以具體的來分析一下,從這些算法中我們可以看出一些端倪,對我們做百度口碑推廣還是很有幫助的。算法中的點(diǎn),我們姑且不計(jì)較那個(gè)預(yù)定閥值是多少,我們只需要記得不要把賬號在多個(gè)地點(diǎn)登陸對了,不是么?然后第二點(diǎn),發(fā)布信息的頻率問題,我們似乎也不必在意預(yù)定閥值是多少,只要記得一個(gè)賬號發(fā)布信息的頻率不要過于頻繁對了。
接著是發(fā)布信息所間隔的時(shí)間問題,這個(gè)應(yīng)該是針對軟件批量發(fā)布信息而出的算法,因?yàn)槌藱C(jī)器能夠發(fā)布信息間隔的時(shí)間相等,我們?nèi)藶榈膽?yīng)該是不可能做到的。但是還是可以借鑒一下,比如我們要用軟件發(fā)布信息,我們可以把時(shí)間設(shè)置成隨機(jī),這樣避免了這一算法。然后看第四點(diǎn),很明顯我們要杜絕用一個(gè)賬號打天下的事情發(fā)生,因?yàn)榘俣纫呀?jīng)注意到這些單賬號英雄了!至于鏈接問題,沒什么說的,因?yàn)楝F(xiàn)在能帶鏈接的實(shí)在是少之又少!
一點(diǎn),我覺得是值得研究和關(guān)注的。發(fā)布信息的內(nèi)容中包含廣告特征的字符串,我們其實(shí)可以總結(jié)一下的,從平時(shí)那些被刪掉的內(nèi)容中找出那些具有相同特征的詞,然后在后期進(jìn)行避免。這是一個(gè)完善的過程,我們總會整理出一批有特征的字符串來的!
推薦閱讀
說明:如果您有任何疑問或想咨詢其他業(yè)務(wù)請撥打電話 400 685 0732