佛山網站優化公司搜索引擎超鏈分析算法
超鏈分析專利其實就是現實生活中類似于鏈接關系的應用。要判斷哪個頁面最具權威性,不能光看頁面自己怎么說,還要看其他頁面怎么評價。李彥宏1997年就提交了一份名為“超鏈文件檢索系統和方法”的專利申請,這比GOOGLE創始人發明PR要早得多,不得不說這是非常具有前瞻性的研究工作。在這份專利中,李彥宏提出了與傳統信息檢索系統不同的基于鏈接的排名方法。這個系統除了索引頁面之外,還建立一個鏈接詞庫,記錄鏈接錨文字的一些相關信息,如錨文字中包含哪些關鍵詞,發出鏈接的頁面索引,包含特定錨文字的鏈接總數,包含特定關鍵詞的鏈接都指向哪些頁面。詞庫不僅包含關鍵詞原型,也包含同一個詞干的其他衍生關鍵詞。
根據這些鏈接數據,尤其是錨文字,計算出基于鏈接的文件相關性。在用戶搜索時,將得到的基于鏈接的相關性與基于關鍵詞匹配的傳統相關性綜合使用,得到更準確的排名。
在今天看來,這種基于鏈接的相關性計算是搜索引擎的常態,每個SEO人員都知道。但是在十三四年前,這無疑是非常創新的概念。當然現在的搜索引擎算法對鏈接的考慮,已經不僅僅是錨文字,實際上要復雜的多。一個與根據超鏈指向的查詢索引文檔相關,用于檢索文檔的搜索引擎。它的索引器遍歷超文本數據庫并尋找包括超鏈指向的文檔地址與每個超鏈的錨文本在內的超文本信息。超文本信息是貯存在一個倒排索引文件里,這個倒排索引文件亦可用于計算對于各超鏈指向的特定文檔鏈接向量。輸入查詢時候,搜索引擎找到錨文本里含有查詢詞的全部文檔的向量。此外計算了查詢向量,然后算出查詢向量跟每個文檔鏈接向量的點積。
深圳網絡推廣信息http://www.easthinks.com/industry/