而我們搜索“片子下載”,百度就會將這些詞拆分為“片子”、“下載”和“片子下載”,如下圖:

百度搜索引擎在中文規模市場據有率第一的地位,嚴酷來說是他有了一套很是好的分詞手藝。當然高深的分詞手藝我們是無法探知的。但我們可以年夜一些概況的一些“管”來窺其瑯縵沔的“豹”。今天杭州seo就為巨匠談一談關于百度分辭書一點點根基的猜測。
首先我們要體味百度分辭書前提,并不是所有的詞城市有分詞發生,例如我們搜索“年夜學生”,返回的結不美觀,我們會看到精準匹配,那么百度就對這個詞沒有進行了分詞措置,看下圖:

于是有伴侶猜測會不會百度以三個中文字為限,起頭實施分詞呢?巨匠可以多次測試一下,這種說法是相當有市場的,可是后面我又搜索關頭辭書時辰發現一個問題,如不美觀一個詞已經被百度詞庫收為一個零丁的詞,那么不管他何等長,百度也灰餿舉薦精準匹配網頁,然后舉薦分詞匹配網頁。
例如巨匠搜索“不管你們信不信”,一般來嗣魅這樣的句子必定是要被分詞措置的,可是因為去年動車事務,這個句子已經成為巨匠常用的詞語,百度也已經對這個詞斗勁認可了,將他收入詞庫中,那么它就可以實現精準匹配。如下圖,網頁問題中都是精準匹配,未見分詞匹配:

結論猜測:用戶搜索某個關頭詞,百度會按照自己詞庫前進前輩行精準匹配,如不美觀這個詞是很常用的詞,在自己詞庫中已經成立詞條的詞,那么百度就會挪用相關的網頁結不美觀,如不美觀詞庫中不存在就進行分詞措置,得出的搜索結不美觀也會發生一些分詞措置情形,至于結不美觀排名影響身分斗勁多,好比網站的權重會影響到搜索的結不美觀排名,具體的需要深切剖析,這里就不布鼓雷門了。
本文由杭州seo(http://www.soxunseo.com)網編揭曉,接待巨匠轉載,轉載時請保留此鏈接,感謝合作!