說明:如果您有任何疑問或想咨詢其他業(yè)務(wù)請撥打電話 400 685 0732
全網(wǎng)監(jiān)測海量數(shù)據(jù)按需發(fā)布監(jiān)測預(yù)警
實時把握輿情動態(tài)精準(zhǔn)追溯信息源頭
想必很多的seoer每天都掙扎在偽原創(chuàng)的路上,改頭改尾改標(biāo)題,然后30%-50%的原創(chuàng)。當(dāng)然我并不同意用什么nai盤工具去代替人工的這個過程,因為現(xiàn)有的工具只有簡單的替換相近詞,生成的內(nèi)容前后不通??墒亲鰝卧瓌?chuàng)本身是個很艱辛的過程,寫出來的內(nèi)容很多新手編輯心理沒底,也許能做到迎合閱讀者的口味,但過往矯正的修改又可能達(dá)不到推廣某個關(guān)鍵詞的目的。所以我們需要去了解搜索引擎如何去判斷這一相關(guān)性,不然修改或者關(guān)鍵詞的堆砌只能是畫蛇添足。
先看以下的兩組標(biāo)題,請問,他們是相關(guān)的嗎?
1、悼念喬布斯-一個時代的落幕
2、蘋果價格會不會下跌?
其實也不是我說了算,是不是相關(guān)要基于搜索引擎的大數(shù)據(jù)分析。
搜索引擎通過大量的抓取文章的內(nèi)容來判斷這些分詞之間的關(guān)系,并賦予其相關(guān)性的分值。(傳送門:什么是中文分詞?)
例如搜索引擎大量分析了其索引數(shù)據(jù)庫后發(fā)現(xiàn)某一個詞的內(nèi)容有以下的分詞會和它有相關(guān)性的特點:(下面數(shù)據(jù)屬于假設(shè))
p(某分詞|相關(guān)詞庫)=相關(guān)性數(shù)值越高越相關(guān),反之不相關(guān)
p(iPhone|蘋果公司)=0.2
p(喬布斯|蘋果公司)=0.15
p(Surface pro|蘋果公司)=0.00001
p(Windows 8|微軟)=0.2
通過數(shù)據(jù)研究,人們相信百度搜索引擎擁有這么一個詞庫,然后把相關(guān)的詞分配到各個詞庫下用來匹配文字中的內(nèi)容,從而得出這篇文章所表達(dá)的含義。如上面的假設(shè)一樣,通過大量的數(shù)據(jù)分析,機器通過分詞后能判斷iPhone、喬布斯、蘋果等在合適語境中屬于“蘋果公司”的詞庫下,windows產(chǎn)品、office辦公等屬于“微軟”的詞條下面。當(dāng)出現(xiàn)歧義的時候,會通過上下文的結(jié)果來判斷。像第二個標(biāo)題一樣,如果判斷是屬于蘋果公司的詞庫下,那這兩組標(biāo)題是相關(guān)的,喬布斯去世->蘋果價格波動,這個屬于內(nèi)在的聯(lián)系;當(dāng)僅僅是水果的價格問題,那沒有相關(guān)性。
下面舉個淺顯的例子:
百度和必應(yīng)這兩家搜索引擎市場競爭對手的握手言和,將進(jìn)一步鞏固百度在中國搜索引擎市場的地位,同時將使得谷歌在華業(yè)務(wù)的發(fā)展更為艱難。此外,這一舉動也是百度為拓展海外業(yè)務(wù)、特別是英文搜索市場業(yè)務(wù)做技術(shù)準(zhǔn)備,表明百度在框計算的進(jìn)程中又向前邁進(jìn)了一步。
你覺得這篇文章的主要講了什么?(怎么感覺和公務(wù)員申論有點像)
為了便于理解,請看圖片中,不要糾結(jié)有些類似“搜索引擎”為什么沒被分詞,為什么英文搜索一定是谷歌詞庫下,只是舉個例子,
根據(jù)終的分詞和語境可以判斷出,這段內(nèi)容是關(guān)于百度市場的。
所以有時候些軟文并不是關(guān)鍵詞越多越好,自己寫的一定有質(zhì)量。特別是沒有品牌效應(yīng)的工業(yè)產(chǎn)品的時候,很有可能一不小心寫偏了,變成了其他的主題內(nèi)容,與自己的關(guān)鍵詞無關(guān)。這告訴了 我們,我們所創(chuàng)造的內(nèi)容要以用戶需求的角度出發(fā),不然大量的偏離主旨的偽原創(chuàng)內(nèi)容,很有可能將投票頁面相關(guān)性的分?jǐn)?shù)拉低了。
推薦閱讀
百度搜索研發(fā)部:淺談互聯(lián)網(wǎng)頁面價值 | 文軍營銷首先,互聯(lián)網(wǎng)上的頁面是無窮盡的,而搜索引擎的硬件資源是有限的,想用有限的資源去覆蓋無窮盡的互聯(lián)網(wǎng),我們需要對頁面價值做出判斷,不收錄那些無檢索價值的頁面,少收錄那些檢索價值低的頁面。這是頁面價值在收錄控制方面的應(yīng)用。 第二,搜索引擎spider的抓取能力是有限的,出于訪問友好性的考慮,對于一個網(wǎng)站或一個IP抓取...淺談URL優(yōu)化該怎么寫,如何判斷重要性@steven | 文軍營銷1.URL一致性:URL 一致性是一個非常重要的指標(biāo),推薦大家一本書《走進(jìn)搜索引擎》里面有介紹spider是一種機器程序,而非人腦,雖然也有學(xué)習(xí)的過程,但是國內(nèi)網(wǎng)站千千萬,每個網(wǎng)站有不同的url規(guī)范,你如果url命名規(guī)則雜亂無章spider又怎能的辨別你的內(nèi)容規(guī)范? 這里舉個個人覺得做的比較好的case:“吧”。讀者可以去翻閱吧...
說明:如果您有任何疑問或想咨詢其他業(yè)務(wù)請撥打電話 400 685 0732