頭條算法是基于興趣標(biāo)簽,進(jìn)行推舉 。
因此,在考量站內(nèi)搜索排序的時候,我們更多的認(rèn)為:頁面的相關(guān)性與原創(chuàng)度,在搜索排序中,會給予較高的權(quán)重,顧才提出這個話題,供大家一起討論與研究。
比如:
它可能基于頁面分析,在分詞后,借助TF-IDF等算法,推斷 頁面的核心關(guān)鍵詞,并且計(jì)算其相關(guān)關(guān)鍵詞的匹配程度,與原創(chuàng)性,在站內(nèi)搜索結(jié)果中,給予理想的排名。
它可能結(jié)合前者基于用戶行為指標(biāo),在站內(nèi)搜索結(jié)果中輸出合理的排序。
但在實(shí)際少量樣本的測試中,我們得出初期如下小結(jié):
相關(guān)性
在搜索結(jié)果展現(xiàn)中,我們利用中文分詞,拆分大量文檔,并給予每一個關(guān)鍵詞一定的權(quán)重,但是實(shí)際操作中,我并沒有發(fā)現(xiàn),它對站內(nèi)搜索結(jié)果具有明顯且直觀的影響。
原創(chuàng)度
所謂的原創(chuàng)度,我們這里認(rèn)為,它是一個相對概念,并且在特定情況下,會計(jì)算去重,當(dāng)然,有一種特別 情況,除外:
站外合作媒體,所展現(xiàn)的內(nèi)容,并沒有在搜索結(jié)果中進(jìn)行去重,比如:某百科與某問答的內(nèi)容。
同時:
① 站內(nèi)文章原創(chuàng)度,有一個相對的時間節(jié)點(diǎn),它同樣會得到合理的推舉 與站內(nèi)搜索結(jié)果的展現(xiàn)。
② 站外文章的原創(chuàng)度,對搜索結(jié)果并沒有明顯的作用。
時效性
時效性相當(dāng)于頭條搜索結(jié)果而言,是一個十分重要的指標(biāo),對于站內(nèi)文章,無論你的內(nèi)容質(zhì)量如何,當(dāng)天公布與搜索詞“相關(guān)”內(nèi)容,都會得到合理的展現(xiàn)。
相對于站外內(nèi)容,時效性,并沒有一個明確的衡量指標(biāo),其主要的原因我們猜想是頭條蜘蛛抓取與收錄的時間節(jié)點(diǎn)問題。
權(quán)威度
① 站內(nèi)文章
一般來講,在搜索結(jié)果排序中,時效性>權(quán)威度>用戶行為指標(biāo),對目標(biāo)搜索結(jié)果的影響相對較大,值得一提的是,其中,權(quán)威度相對較高的賬號,搜索結(jié)果中排序周期穩(wěn)定性相對較高。
而權(quán)威度相對一般的賬號,時效性排序,持續(xù)的周期較弱。
② 站外文章
從目前來看,站外賬號的權(quán)威度對站內(nèi)搜索結(jié)果的影響,主要包括如下兩個方面:
1)首頁、欄目頁、TAG頁
從目前來看,對于站外搜索結(jié)果,頭條目前更多在參考PR值的排序規(guī)則,也就是基于鏈接計(jì)算的權(quán)威,你的頁面權(quán)重越高,在頭條搜索結(jié)果中的排序越高。
當(dāng)然,你會看到在百度搜索結(jié)果排名相對較高的頁面,在頭條搜索結(jié)果中,同樣重要,顧我們推測,它更多的是基于鏈接計(jì)算。
當(dāng)然,深度分析,你可以針對每一個頁面計(jì)算頁面“權(quán)威度”,這里由于外鏈工具API更新的問題,你可能需要參考多個工具的數(shù)據(jù)指標(biāo),然后取相對平均值。
2)內(nèi)容資訊頁
而相當(dāng)于站外的內(nèi)容資訊頁面,在頭條的搜索結(jié)果中的排序,我們認(rèn)為頁面標(biāo)題中關(guān)鍵詞具有重要的作用。
頁面標(biāo)題
頁面標(biāo)題中包含關(guān)鍵詞無論對于站內(nèi)與站外,都是一個非常重要的參考指標(biāo),我們認(rèn)為,它主要包括如下幾個影響因子:
1)關(guān)鍵詞拆分后,頁面標(biāo)題關(guān)鍵詞包含的先后順序。
2)頁面標(biāo)題中,關(guān)鍵詞的相間距離。
3)描述內(nèi)容中,覆蓋關(guān)鍵詞的個數(shù)。
其中,值得提醒的是:
1)站外的搜索結(jié)果中,標(biāo)題是核心,并沒有過多計(jì)算內(nèi)容質(zhì)量。
2)短標(biāo)題貌似搜索排序,相對靠前。
站內(nèi)與站外
當(dāng)站內(nèi)與站外內(nèi)容,同時出現(xiàn)在搜索結(jié)果中,相對于站外內(nèi)容之間的排名比對,更多的是參考頁面權(quán)重。
而相對于站內(nèi)之間內(nèi)容的比對,則更傾向于時效性>權(quán)威度。
而基于《站內(nèi)與站外》文章比對的時候,排除標(biāo)題的影響,它則重點(diǎn)考量如下幾個指標(biāo):
① 內(nèi)容質(zhì)量度(粗略統(tǒng)計(jì)為頁面字?jǐn)?shù))
② 權(quán)威度(站內(nèi)優(yōu)先站外)
③ 時效性(站內(nèi)時效性,長周期內(nèi)會計(jì)算用戶行為指標(biāo),包括:評論、點(diǎn)擊率、個性偏好)
④ 社會熱點(diǎn)(高考成績查詢)
付費(fèi)推廣與戰(zhàn)略合作
目前來講,頭條開放DSP形式的站內(nèi)付費(fèi)推廣,同時,頭條也與一些資源機(jī)構(gòu),建立戰(zhàn)略合作伙伴,比如:某百科,進(jìn)行商業(yè)性的合作,相關(guān),搜索排序,都是具有特定的隨機(jī)性。
總結(jié):上述內(nèi)容,只是利用非工作時間與小伙伴@柯靚,粗略的統(tǒng)計(jì)結(jié)果,僅供大家參考與討論。
豫公網(wǎng)安備41018402000614號