蔣鑫鵬:百度搜索引擎算法的總結(jié)

關(guān)于百度算法的猜測(cè),那是眾說(shuō)風(fēng)云,最近因?yàn)榘俣人惴ㄓ?jì)劃內(nèi)的大規(guī)模調(diào)整,眾多從事SEM和SEO的愛(ài)好者更是對(duì)于百度算法議論紛紛,筆者將近年來(lái)做SEO搜索引擎優(yōu)化的實(shí)戰(zhàn)經(jīng)驗(yàn)做總結(jié)歸納,分享與此,與熱愛(ài)網(wǎng)絡(luò)營(yíng)銷(xiāo)的朋友們探討……求拍磚,求吐槽,求碰撞出火花!

一、百度基礎(chǔ)算法分析:鏈接流行度核心算法+百度推廣+框計(jì)算+開(kāi)放平臺(tái)

1.【鏈接流行度】和大多數(shù)關(guān)鍵詞搜索引擎一樣,頁(yè)面URL地址鏈接的流行程度為核心的基礎(chǔ)核心算法;

2.【百度推廣】起先叫做百度競(jìng)價(jià),后改為百度推廣,包括關(guān)鍵詞競(jìng)價(jià)算法和網(wǎng)盟推廣算法兩部分;

3.【框計(jì)算】語(yǔ)義分析、行為分析、智能人機(jī)交互、海量基礎(chǔ)算法等。 

二、百度收錄流程

1.【頁(yè)面的收錄】搜索蜘蛛程序>收錄的頁(yè)面鏈接>現(xiàn)新的鏈接并爬行>的頁(yè)面及內(nèi)容合格>錄快照并分類(lèi)存儲(chǔ)>立頁(yè)面基本數(shù)據(jù)(頁(yè)面URL、頁(yè)面關(guān)鍵詞、頁(yè)面標(biāo)題描述、收錄來(lái)源、收錄時(shí)間、內(nèi)容簡(jiǎn)述、頁(yè)面權(quán)重、更新周期);

2.【百度免費(fèi)產(chǎn)品】百度百科、百度文庫(kù)、百度貼吧、百度知道、百度空間等百度自身免費(fèi)產(chǎn)品的頁(yè)面收錄;

3.【百度開(kāi)放平臺(tái)】主要是站長(zhǎng)提供的結(jié)構(gòu)化數(shù)據(jù)(網(wǎng)站與百度的深度合作,如汽車(chē)網(wǎng)站的參數(shù)數(shù)據(jù)、百度知道接口等)和開(kāi)發(fā)者提交的各種應(yīng)用(開(kāi)發(fā)者加入百度開(kāi)發(fā)者中心并提交相關(guān)應(yīng)用通過(guò)審核);

4.【百度競(jìng)價(jià)推廣】網(wǎng)站主開(kāi)通百度推廣賬戶(hù)>付費(fèi)并通過(guò)網(wǎng)站審核>輯關(guān)鍵詞廣告及推廣計(jì)劃>交百度推廣后臺(tái);

5.【百度網(wǎng)盟推廣】網(wǎng)站主開(kāi)通百度推廣賬戶(hù)>付費(fèi)并通過(guò)網(wǎng)站審核>輯網(wǎng)盟廣告及推廣計(jì)劃>交百度推廣后臺(tái);百度聯(lián)盟廣告合作伙伴站長(zhǎng)參與網(wǎng)盟推廣并審核通過(guò)》預(yù)留廣告位并做好網(wǎng)盟接口。

三、百度檢索流程

搜索需求>義分析>據(jù)庫(kù)檢索>名顯示反饋

1.【百度搜索頁(yè)面的檢索】用戶(hù)輸入關(guān)鍵詞并檢索>架算(語(yǔ)義分析及分詞判斷、行為分析、智能人機(jī)交互、海量基礎(chǔ)算法)>計(jì)算結(jié)果(開(kāi)放平臺(tái)的數(shù)據(jù)、傳統(tǒng)搜索結(jié)果、百度推廣結(jié)果、百度自身產(chǎn)品結(jié)果)>計(jì)算結(jié)果排名。

2.【百度網(wǎng)盟頁(yè)面的推薦】用戶(hù)訪(fǎng)問(wèn)百度網(wǎng)盟某合作網(wǎng)站頁(yè)面>盟算法根據(jù)用戶(hù)瀏覽器大量有價(jià)值的搜索Cookis計(jì)算并推薦廣告>戶(hù)被有質(zhì)量的廣告吸引并點(diǎn)擊>盟推廣后臺(tái)引導(dǎo)用戶(hù)進(jìn)入?yún)⑴c網(wǎng)盟推廣的網(wǎng)站相應(yīng)頁(yè)面。

四、百度指數(shù)權(quán)重考核因素

1.傳統(tǒng)搜索的權(quán)重考核

A.【網(wǎng)站訪(fǎng)問(wèn)量】網(wǎng)站訪(fǎng)問(wèn)流量(IP、PV、獨(dú)立訪(fǎng)客)決定網(wǎng)站權(quán)重基數(shù);

B.【關(guān)鍵詞流量】關(guān)鍵詞搜索訪(fǎng)問(wèn)流量是百度權(quán)重指數(shù)的基本考核數(shù)據(jù);

C.【關(guān)鍵詞質(zhì)量】關(guān)鍵詞搜索訪(fǎng)問(wèn)質(zhì)量(人均頁(yè)面訪(fǎng)問(wèn)數(shù)量、人均頁(yè)面停留時(shí)間)是百度權(quán)重指數(shù)的重要考核數(shù)據(jù);

D.【關(guān)鍵詞文字鏈】高質(zhì)量的關(guān)鍵詞文字外鏈?zhǔn)前俣葯?quán)重指數(shù)的重要補(bǔ)充考核數(shù)據(jù);

E.【多種外鏈來(lái)源】多元化的外鏈來(lái)源是提高權(quán)重的良好方式;

F.【關(guān)鍵詞匹配度】關(guān)鍵詞與頁(yè)面內(nèi)容的匹配度(關(guān)鍵詞所占比例、關(guān)鍵詞位置)是百度權(quán)重站內(nèi)考核的基本參數(shù);

G.【站點(diǎn)內(nèi)容質(zhì)量】網(wǎng)站內(nèi)容質(zhì)量(原創(chuàng)度、可讀性、豐富性)是百度權(quán)重指數(shù)站內(nèi)考核的重要數(shù)據(jù);

H.【站點(diǎn)鏈接結(jié)構(gòu)】站點(diǎn)鏈接結(jié)構(gòu)也是百度權(quán)重指數(shù)站內(nèi)考核的重要參數(shù);

I.【域名年齡】域名年齡長(zhǎng)的頁(yè)面權(quán)重較高;

J.【網(wǎng)站年齡】網(wǎng)站年齡也是影響權(quán)重的重要的因素,沒(méi)有明顯的大面積改版且頁(yè)面標(biāo)簽屬性變化不大的頁(yè)面容易獲得穩(wěn)定的權(quán)重;

K.【服務(wù)器穩(wěn)定性】服務(wù)器穩(wěn)定性、包括IP使用的年齡也會(huì)影響站點(diǎn)權(quán)重;

L.【百度推廣指數(shù)】購(gòu)買(mǎi)百度廣告的站點(diǎn)會(huì)直接獲得權(quán)重贈(zèng)分;這點(diǎn)已經(jīng)在很多操作實(shí)例中得以證明;

M.【百度體系指數(shù)】網(wǎng)站與百度體系的合作深度是權(quán)重參考的又一個(gè)重要依據(jù),如是否加入網(wǎng)盟、是否加入開(kāi)放平臺(tái),是否使用百度相關(guān)產(chǎn)品(如百度統(tǒng)計(jì)、百度分享、百度Hi等)

2.百度自身產(chǎn)品的頁(yè)面

根據(jù)判斷,百度自身產(chǎn)品權(quán)重順序一般為:百度百科、百度文庫(kù)、百度貼吧、百度知道、百度空間,百度自身產(chǎn)品本身因?yàn)橹髡緒ww.baidu.com權(quán)重高而獲利,其次百度算法中對(duì)以上自身產(chǎn)品本身的排名權(quán)重較高。以上所列的百度產(chǎn)品對(duì)應(yīng)的關(guān)鍵詞搜索內(nèi)容頁(yè)面是否在搜索結(jié)果展示,主要取決于用戶(hù)瀏覽質(zhì)量及參與互動(dòng)程度。

3.百度開(kāi)放平臺(tái)的頁(yè)面

百度開(kāi)放平臺(tái)與百度自身產(chǎn)品類(lèi)似,是否獲得好的排名,主要看頁(yè)面本身的流量及用戶(hù)參與程度,而開(kāi)放平臺(tái)合作站點(diǎn)本身的權(quán)重決定排名次序的基本參數(shù)。

4.百度推廣的頁(yè)面

百度付費(fèi)推廣的頁(yè)面排名主要是百度競(jìng)價(jià)機(jī)制決定,按照參與競(jìng)價(jià)的相應(yīng)關(guān)鍵詞出價(jià)高低決定排名次序;百度網(wǎng)盟推廣的排名優(yōu)先程度與競(jìng)價(jià)機(jī)制類(lèi)似,取決于網(wǎng)盟廣告出價(jià)高低。

5.百度網(wǎng)盟合作網(wǎng)站

網(wǎng)盟合作網(wǎng)站的權(quán)重會(huì)獲得一定的贈(zèng)分。因?yàn)檫@個(gè)給百度推廣獲得收益作了重要貢獻(xiàn)。

五、百度快照收錄的考核因素

(以下只針對(duì)傳統(tǒng)關(guān)鍵詞搜索的自然排名)

1.【百度快照的收錄影響因素】

(1)原創(chuàng)內(nèi)容:原創(chuàng)內(nèi)容是快照收錄考核的首要因素;

(2)鏈接引導(dǎo):鏈入新頁(yè)面的外鏈及內(nèi)鏈質(zhì)量越高越容易被收錄;

(3)頁(yè)面訪(fǎng)問(wèn)質(zhì)量:包括頁(yè)面的訪(fǎng)問(wèn)數(shù)量、訪(fǎng)問(wèn)時(shí)間等因素;

(4)站點(diǎn)質(zhì)量:如果站點(diǎn)本身的權(quán)重太低,快照收錄會(huì)受到負(fù)面影響;

(5)頁(yè)面可讀性:如果文字過(guò)少,又缺少必要的圖表配合,也會(huì)影響快照的收錄;

(6)作弊:頭部標(biāo)簽關(guān)鍵詞連續(xù)堆疊、頁(yè)面內(nèi)容中關(guān)鍵詞堆疊過(guò)多、出現(xiàn)暗鏈接、等作弊因素也可能影響快照收錄。

2.【關(guān)于與快照更新的影響因素】

(1)頁(yè)面的權(quán)重:頁(yè)面權(quán)重是蜘蛛程序造訪(fǎng)頻率的核心因素;

(2)頁(yè)面更新周期:已被收錄的快照在搜索數(shù)據(jù)庫(kù)中會(huì)有一個(gè)更新周期參數(shù),更新周期首該頁(yè)面更新歷史記錄的影響;

(3)鏈接質(zhì)量:鏈入的外鏈所在頁(yè)面權(quán)重是快照跟新周期的重要補(bǔ)充,外鏈質(zhì)量越高,快照更新越頻繁;

(4)內(nèi)容跟新的幅度:內(nèi)容更新幅度過(guò)小的頁(yè)面容易被忽略(一般指重要的導(dǎo)航頁(yè)面及站點(diǎn)主頁(yè));

(5)靜態(tài)化頁(yè)面影響快照更新:這是筆者EO實(shí)例操作中發(fā)現(xiàn)的,靜態(tài)化頁(yè)面易被搜索程序判定為“死”頁(yè)面而影響更新周期;

(6)域名及網(wǎng)站年齡:老網(wǎng)站更容易獲得較頻繁的快照更新周期;

(7)網(wǎng)站收錄頁(yè)面數(shù)量:收錄頁(yè)面越多,主頁(yè)快照更新越頻繁。(上海訊道網(wǎng)絡(luò)科技出品)

六、頁(yè)面排名分析

1.【關(guān)于頭部標(biāo)簽】

(1)頭部比重是分詞匹配的關(guān)鍵,主要的算法是:1.中文分詞、2.語(yǔ)義連貫、3.分詞所占比重

(2)頭部標(biāo)簽說(shuō)明:

title:關(guān)鍵詞在title中的算法:1.連貫、2.靠前、3.比重

keywords:keywords一定不能包含頁(yè)面沒(méi)有的關(guān)鍵詞,keywords必須在內(nèi)容中有所體現(xiàn)

描述:描述是頁(yè)面基本的參考,包含的關(guān)鍵詞權(quán)重僅次于title

(3)頭部標(biāo)簽修改后,頁(yè)面快照收錄會(huì)暫緩進(jìn)入觀(guān)察期,一般為一周左右,穩(wěn)定后恢復(fù)新快照。

頭部標(biāo)簽一定要與頁(yè)面內(nèi)容匹配,在限定字?jǐn)?shù)內(nèi),頁(yè)面頭部標(biāo)簽修改頻繁,會(huì)導(dǎo)致搜索程序直接抓取頁(yè)面內(nèi)容作為描述。

2.【關(guān)于頁(yè)面內(nèi)容】

1.關(guān)鍵詞匹配級(jí)別:位置明顯的帶鏈接的錨文本,如導(dǎo)航條、快速通道、底部導(dǎo)航、H標(biāo)簽;

2.主頁(yè)權(quán)重最高、其次為主頁(yè)直接鏈接指向的頁(yè)面;

3.頁(yè)面內(nèi)容要豐富,圖表搭配得當(dāng),訪(fǎng)問(wèn)量高有助于排名;

4.空頁(yè)面或者信息簡(jiǎn)陋的頁(yè)面直接影響收錄與排名;

5.頁(yè)面訪(fǎng)問(wèn)數(shù)量及質(zhì)量是排名的重要因素。

6.多媒體多文件性質(zhì)的頁(yè)面會(huì)被受到重視:如視頻、音樂(lè)、文檔、圖表、對(duì)話(huà)框、互動(dòng)按鈕等。

3.【關(guān)于外部鏈接】

1.鏈出鏈接指向的頁(yè)面權(quán)重要高;

2.鏈入外鏈所在頁(yè)面權(quán)重高,關(guān)鍵詞及內(nèi)容相關(guān)性匹配要高;

3.多樣化的外鏈鏈入更有效;

4.社會(huì)化分享外鏈鏈入越來(lái)越被重視;

5.購(gòu)物及電子商務(wù)類(lèi)的外鏈越來(lái)越有價(jià)值;

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2012-05-22
蔣鑫鵬:百度搜索引擎算法的總結(jié)
關(guān)于百度算法的猜測(cè),那是眾說(shuō)風(fēng)云,最近因?yàn)榘俣人惴ㄓ?jì)劃內(nèi)的大規(guī)模調(diào)整,眾多從事SEM和SEO的愛(ài)好者更是對(duì)于百度算法議論紛紛,筆者將近年

長(zhǎng)按掃碼 閱讀全文