海口網站(zhàn)建設網

百度搜索引擎兩項重要的專利


百度有兩項專利技術,一(yī)項是搜索引擎超鏈分(fēn)析技術;另一(yī)項是搜索引擎投票(piào)算(suàn)法,那麽我們就(jiù)根據百度搜索引擎排名的核心專利技術進行分(fēn)析吧(ba)!我們租一(yī)個(gè)簡單概況:超鏈分(fēn)析技術其實是将抓取的頁面包含超鏈接錨文本作(zuò)為(wèi)了(le)衡量網頁相關(guān)性及權重高低(dī)的最基礎算(suàn)法。任何一(yī)個(gè)搜索引擎都可以收錄并索引N多網頁快(kuài)照,但(dàn)是快(kuài)照之間(jiān)的相關(guān)性及頁面權重如(rú)何評級?例如(rú)sina、souhu、163等權威網站(zhàn)上(shàng)有好(hǎo)(hǎo)排名的的超鏈接,那麽至少說(shuō)明了(le)該頁面權重很高對吧(ba)?假如(rú)不但(dàn)有超鏈接還有錨文本那麽相關(guān)性就(jiù)産生(shēng)了(le)對吧(ba)?例如(rú)這(zhè)些(xiē)權威網站(zhàn)裏有我一(yī)個(gè)“搜索引擎優化(huà)”的超鏈接至少能(néng)知道我網站(zhàn)的主體(tǐ)思想吧(ba)?這(zhè)就(jiù)是超鏈分(fēn)析技術。超鏈分(fēn)析算(suàn)法兩個(gè)核心:一(yī)個(gè)是超鏈接的頁面評級判斷;另一(yī)個(gè)是錨文本相關(guān)性判斷;這(zhè)就(jiù)是李彥宏的超鏈分(fēn)析專利。

一(yī)、搜索引擎超鏈分(fēn)析算(suàn)法
超鏈分(fēn)析專利其實就(jiù)是現(xiàn)實生(shēng)活中類似于鏈接關(guān)系的應用。要判斷哪個(gè)頁面最具權威性,不能(néng)光看頁面自己怎麽說(shuō),還要看其他頁面怎麽評價。李彥宏1997年就(jiù)提交了(le)一(yī)份名為(wèi)“超鏈文件檢索系統和方法”的專利申請,這(zhè)比GOOGLE創始人(rén)發明PR要早得多,不得不說(shuō)這(zhè)是非常具有前瞻性的研究工作(zuò)。在這(zhè)份專利中,李彥宏提出了(le)與傳統信息檢索系統不同的基于鏈接的排名方法。這(zhè)個(gè)系統除了(le)索引頁面之外,還建立一(yī)個(gè)鏈接詞庫,記錄鏈接錨文字的一(yī)些(xiē)相關(guān)信息,如(rú)錨文字中包含哪些(xiē)關(guān)鍵詞,發出鏈接的頁面索引,包含特定錨文字的鏈接總數,包含特定關(guān)鍵詞的鏈接都指向哪些(xiē)頁面。詞庫不僅包含關(guān)鍵詞原型,也(yě)包含同一(yī)個(gè)詞幹的其他衍生(shēng)關(guān)鍵詞。
根據這(zhè)些(xiē)鏈接數據,尤其是錨文字,計算(suàn)出基于鏈接的文件相關(guān)性。在用戶搜索時(shí),将得到的基于鏈接的相關(guān)性與基于關(guān)鍵詞匹配的傳統相關(guān)性綜合使用,得到更準确的排名。
在今天看來(lái),這(zhè)種基于鏈接的相關(guān)性計算(suàn)是搜索引擎的常态,每個(gè)SEO人(rén)員(yuán)都知道。但(dàn)是在十三四年前,這(zhè)無疑是非常創新(xīn)的概念。當然現(xiàn)在的搜索引擎算(suàn)法對鏈接的考慮,已經不僅僅是錨文字,實際上(shàng)要複雜的多。一(yī)個(gè)與根據超鏈指向的查詢索引文檔相關(guān),用于檢索文檔的搜索引擎。它的索引器(qì)遍曆超文本數據庫并尋找包括超鏈指向的文檔地址與每個(gè)超鏈的錨文本在内的超文本信息。超文本信息是貯存在一(yī)個(gè)倒排索引文件裏,這(zhè)個(gè)倒排索引文件亦可用于計算(suàn)對于各超鏈指向的特定文檔鏈接向量。輸入查詢時(shí)候,搜索引擎找到錨文本裏含有查詢詞的全部文檔的向量。此外計算(suàn)了(le)查詢向量,然後算(suàn)出查詢向量跟每個(gè)文檔鏈接向量的點積。特定文檔相關(guān)點積的加總确定每一(yī)個(gè)文檔的相關(guān)性排名這(zhè)份專利所有人(rén)是李彥宏當時(shí)所在的公司,發明人(rén)是李彥宏本人(rén)。

 

二、搜索引擎投票(piào)排名算(suàn)法

這(zhè)個(gè)算(suàn)法是在超鏈分(fēn)析技術之後延伸的一(yī)個(gè)投票(piào)記錄算(suàn)法,搜索引擎排序規則需要在搜索展現(xiàn)與訪問之間(jiān)做出有效分(fēn)析、對比并記錄的.無論是百度排名還是google等搜索引擎結果展示并不是很容易判斷關(guān)鍵詞與快(kuài)照的權威性,如(rú)何判斷關(guān)鍵詞與實際快(kuài)照的權威性呢(ne)?一(yī)定是從用戶出發,根據有效搜索做出判斷,人(rén)自然檢索一(yī)個(gè)關(guān)鍵詞并訪問結果時(shí),用戶經常會找不到自己想要的結果,所以當人(rén)自然檢索後雖然訪問到了(le)您的網站(zhàn),但(dàn)不一(yī)定是有效搜索,因為(wèi)最後搜索不一(yī)定會停留到您的網站(zhàn)上(shàng),假如(rú):您搜索一(yī)個(gè)詞,打開第一(yī)位結果,發現(xiàn)不是你想要的,您肯定會繼續訪問下(xià)面的結果,直到找到你您需要的結果後才停止訪問剩餘結果(也(yě)有可能(néng)您根本找不到自己想要的結果)當您找到需要的結果後自然不會繼續訪問剩餘的結果,最後停留的目标頁面被稱之為(wèi)有效搜索;雖然這(zhè)個(gè)思路(lù)和算(suàn)法還存在很多缺陷,但(dàn)是大部分(fēn)搜索引擎還是以這(zhè)個(gè)算(suàn)法為(wèi)最佳算(suàn)法,因為(wèi)搜索引擎無法判斷出來(lái)關(guān)鍵詞與快(kuài)照的權威性。隻有通過用戶訪問需求進行對比分(fēn)析、加以頁面評級增加或減少!

快(kuài)速提交您的需求


咨詢類型:


您的姓名: *


您的手機: *


咨詢問題:


    

留下(xià)您的聯系信息,我們會有專業營銷顧問與您聯系,或直接拔打電話(huà) 0898-66960731 一(yī)對一(yī)為(wèi)您詳細介紹相關(guān)産品和服務(wù),幫您更高效的開展網絡營銷。