好好的日comwww_久久一区免费_男男做性免费视频网_天天干天天草

合作單位:電爐,脫硫泵,氧化鋁陶瓷,水性金屬漆,陶瓷管

鼎尚網(wǎng)絡 | SEO如何研究排名規(guī)律?
發(fā)布于時間: 2021-08-28 09:44:03 瀏覽:1511

鼎尚網(wǎng)絡 | SEO如何研究排名規(guī)律?

01,搜索引擎基本概念:爬取、索引、召回、粗排、精排、重排

爬取&索引

搜索引擎爬取全網(wǎng)海量頁面→進行基本的質(zhì)量評分→過濾出小部分質(zhì)量較佳的網(wǎng)頁→創(chuàng)建倒排索引(能夠通過關(guān)鍵詞查詢文檔)

召回

用戶發(fā)起搜索請求→搜索引擎先對關(guān)鍵詞進行糾錯處理→拆成多個詞項→去索引中查找能夠命中這些詞項的文檔,可能就是這個數(shù)

圖片

粗排

但是文檔的實在數(shù)量太多了,一股腦的都推給用戶顯然很二逼,用戶不可能都看完,只會看其中極小的一部分,另外也沒法保證質(zhì)量。

所以要從海量召回的文檔中,刪除其中內(nèi)容高度重復的文檔,并篩選與搜索詞相關(guān)的760個文檔,展現(xiàn)給用戶。

這個環(huán)節(jié)屬于海選,需要大量計算,為了不讓用戶等待過長,一般用快捷優(yōu)先且相對簡單的處理方式,比如BM25、TF-IDF、LDA,具體還有啥咱也不知道。

精排

之后就是對760篇文檔排序的過程,的目的是讓排序結(jié)果大概率符合用戶預期的結(jié)果,這樣用戶才更有可能點進去了解詳情,從而提升搜索的業(yè)務價值。

這部分比海選要復雜的多,涉及一大堆數(shù)據(jù)挖掘、機器學習、用戶行為分析、用戶意圖識別等算法,大概包括:

通過用戶搜索詞和前N次搜索詞,結(jié)合歷史日志中其他搜索該詞的用戶瀏覽行為,來揣測用戶可能的搜索意圖

文檔的更新時間

文檔的歷史點擊率

文檔瀏覽后終結(jié)搜索的比例

用戶的網(wǎng)絡維度特征(IP、網(wǎng)絡類型、地域....)

與搜索詞文本匹配度高的TopN條文檔

與搜索詞潛在意圖覆蓋率高的TopN條文檔

....太多了咱也不知道

上述過程,對應著搜索引擎中,爬取、索引、召回、粗排、精排的幾個階段,屬于搜索引擎系統(tǒng)入門級的常識。

keyword:鼎尚網(wǎng)絡SEO
文章來源:http://www.68iq.com/