Google發(fā)布新算法研究
Google Research近發(fā)表了一篇研究性論文,這篇論文詳細(xì)介紹了一種新的搜索結(jié)果排序算法。
如果將來這一算法開始實(shí)施,將會(huì)對(duì)傳統(tǒng)排名決定因素的影響造成很大改變。短期內(nèi),這項(xiàng)研究讓我們進(jìn)一步了解了谷歌所提的提高內(nèi)容相關(guān)性的算法更新。
新算法簡(jiǎn)介
Google Research在第六屆國(guó)際學(xué)術(shù)會(huì)議上以通過Twitter發(fā)布了這一新算法研究論文。
論文題目是:正確提出問題:強(qiáng)化學(xué)習(xí) 重塑問題【Ask The Right Questions: Active Question Reformulation with Reinforcement Learning】
這篇論文討論了一種將查詢問題重塑后再提交給搜索引擎的方法。Google其實(shí)已經(jīng)在實(shí)施了查詢問題的重塑和提煉,這是方法中的一種。
這一算法的創(chuàng)新在于這是一強(qiáng)化學(xué)習(xí)的機(jī)器學(xué)習(xí)算法,而且這一算法并不了解排名系統(tǒng)如何工作。他是通過一個(gè)黑盒子提出問題并學(xué)習(xí)。這一算法通過一個(gè)學(xué)習(xí)系統(tǒng)重塑用戶查詢,向搜索引擎提出諸多相關(guān)問題,然后在諸多答案中選擇合適的答案。
該算法如何工作
如下是該研究論文的一個(gè)截圖,它總結(jié)了這個(gè)機(jī)器學(xué)習(xí)算法的工作原理:
用戶提出問題,然后該機(jī)器學(xué)習(xí)算法(也就是圖中所示:Agent)將這一問題重新表述為多個(gè)問題并提交給排序算法。排序算法給出結(jié)果集,機(jī)器學(xué)習(xí)算法在眾多結(jié)果中選擇佳答案呈現(xiàn)給用戶。
該研究論文指出:面對(duì)復(fù)雜的信息需求,人類通過重塑問題,多重研究,整合答案來規(guī)避不確定性。受到這一啟發(fā),我們通過Agent(代理)來執(zhí)行這一過程,Agent介于用戶和后端QA系統(tǒng)之間,也就是圖中所示:Environment(知識(shí)庫(kù))。
我們把這一代理稱之為AQA,它是一個(gè)積極回答問題的策略。AQA旨在通過向知識(shí)庫(kù)發(fā)送重塑過的問題以大化獲取正確答案的幾率。
Agent通過提出諸多相關(guān)問題和整合諸多答案來尋找佳答案。Environment(知識(shí)庫(kù))的內(nèi)部對(duì)Agent來說是不可用的,所以它必須使用黑盒來探測(cè)優(yōu)問題字符串。
為何該算法如此重要
該算法讓我們了解了機(jī)器學(xué)習(xí)方法的一種,稱之為強(qiáng)化學(xué)習(xí)。強(qiáng)化學(xué)習(xí)算法已經(jīng)被用于機(jī)器學(xué)習(xí)如何玩圍棋,玩電玩,比如Doom(毀滅戰(zhàn)士)。
SEO對(duì)這一特別算法很感興趣,因?yàn)樗梢栽谟脩艉鸵?guī)則排序算法之間插入一個(gè)新的算法,并終做出決策。因此,不同的是排序算法是決定搜索引擎結(jié)果頁(yè)顯示哪些內(nèi)容,這一機(jī)器學(xué)習(xí)算法是決策佳答案的。
這種排名是和SEO論壇傳統(tǒng)上認(rèn)為的網(wǎng)頁(yè)排名是不同的。傳統(tǒng)的理解是,決定搜索結(jié)果中排名1到10的因素有鏈接,網(wǎng)頁(yè)標(biāo)題,錨文本等等。
鏈接對(duì)于排名是一個(gè)很重要的因素。但是,通過這種算法,鏈接是有助于網(wǎng)頁(yè)的排名,但不再是決定性因素。
這一新算法的工作是決定哪些頁(yè)面適合回答某個(gè)問題。
你是否見過一個(gè)鏈接少的網(wǎng)頁(yè)排名高于那些鏈接多的網(wǎng)頁(yè)?這很可能是在用戶和排序算法之間有一個(gè)決定哪個(gè)網(wǎng)頁(yè)提供佳答案的算法。
排名因素該如何處理?
排名算法不再是網(wǎng)站排名前十的決定性因素,這也是排名因素研究有數(shù)百萬(wàn)結(jié)果卻并不準(zhǔn)確的原因。排名因素研究認(rèn)為排名因素對(duì)搜索結(jié)果前十的網(wǎng)站負(fù)有責(zé)任。
但排名因素并不是總能決定排名前十的因素。因此排名因素研究也并不完全可靠。
雖然這一特定算法目前還沒有被使用,但是已經(jīng)有其他的算法通過設(shè)置排名算法的結(jié)果來執(zhí)行類似的功能,并使用不是排名因素的因素來重新排序SERPs(搜索結(jié)果頁(yè))。
重新排列搜索結(jié)果并不是一個(gè)新想法。微軟在2005年發(fā)布過一篇學(xué)術(shù)論文,名為:【Improving Web Search Results Using Affinity Graph】(利用關(guān)系圖表來改善搜索結(jié)果)。這一算法的目的在于為用戶模糊搜索查詢提供更準(zhǔn)確的答案。
這一算法對(duì)SEO有何影響?
這一算法可能會(huì)影響SEO的未來,搜索結(jié)果會(huì)更加強(qiáng)調(diào)滿足用戶的搜索意圖。這一改進(jìn)又稱之為提高內(nèi)容相關(guān)性。因此,當(dāng)Google宣布內(nèi)容相關(guān)性的算法更新時(shí),通過研究競(jìng)爭(zhēng)排名勝出的網(wǎng)站就會(huì)知道一個(gè)網(wǎng)站丟失排名的佳答案。對(duì)于這類更新,如果只是按照傳統(tǒng)簡(jiǎn)單的研究丟失網(wǎng)頁(yè)排名的網(wǎng)站的內(nèi)容,是很難找到排名改變的原因的。