每日最新頭條.有趣資訊

頭條踢館百度搜索

頭條在2019年初開始主推搜索的時候,百度正在發力短視頻。上周,百度和頭條又打起來了,就是因為頭條的搜索業務。

4月26日,百度起訴頭條在搜索結果中大量抓取百度搜索top1的結果,要求立即停止侵權,賠償9000萬元並連續30天在其APP及網站首頁道歉。

在同一天,抖音以不正當競爭為由將百度訴至法院,因發現百度在搜索中竊取了海量抖音短視頻。抖音要求百度立即停止侵權,賠償9000萬元並在百度首頁連續道歉30天。

百度和頭條之間的競爭一直互相交錯、糾纏不清。信息流、短視頻,這些業務的爭奪,動輒就是百億的廣告市場份額的得失。如果說百度原來是大街上的一家中餐廳,頭條的信息流相當於在隔壁開了一家西餐廳,百度和頭條的關係屬於競爭,但不至於水火不容。現在頭條開始做搜索,就好比在路對面又開了一家中餐廳,這是直接進攻百度大本營,如果說之前的爭鬥關乎錢,那這次是關乎基業,關乎命,可謂是生死之戰。

百度和頭條不斷地侵入到對方的領域,業務也走得越來越像。就在上周,有媒體報導稱百度在開發一款產品,形態是線上的抖音+線下的歌手。為何百度和頭條會打得如此的膠著、激烈?其根本在於兩家公司的基業存在著很多的相似之處,無論是主動搜索還是被動推薦,百度和頭條做的,都是信息篩選的生意。而信息篩選的基礎,就是數據(內容+服務)和算法。

通過數據和算法,搜索和推薦這兩種形態的業務,有了銜接點和過渡點,雙方的重合度就會越來越高。當頭條的推薦做的足夠好的時候,做搜索就是必然。

一、百度和頭條的算法

搜索的兩個基礎條件:數據和算法。百度的搜索引擎結果排序和頭條的信息流推薦,都是算法。

這兩種算法,從表現形式上是不同的。搜索引擎的算法追求的是精準,用戶輸入關鍵詞,如果返回結果(不考慮廣告)是10條,那越優質的內容應該排得越靠前。比如說,Top1就應該是當前最好的答案。對於好的標準,是基於結果頁被引用的次數等維度,這個結果對於大多數人來說是最優結果,在當前關鍵字下,是一個標準的求解。

頭條的算法,基於內容生態屬於消費型,容錯率比百度高。比如,對於某個用戶,當前一屏10條內容,可以推薦5條體育新聞,5條娛樂新聞,都可能是用戶感興趣的。而這10條新聞中,有2條可能用戶興趣度並不高。但是對於內容消費型的推薦結果,是允許這種情況存在,2條匹配度不高的內容並不會對用戶使用體驗造成特別大的影響。

頭條的算法,推薦維度上比較複雜。我們可以這樣具象化的簡單理解:百度的搜索結果,是一條內容流,基於搜索關鍵詞展現相關度最高的內容。而頭條用戶每屏內容,是基於用戶興趣,如體育、娛樂等多條內容流,初始狀態下,是根據用戶特徵進行的推薦。比如,用戶在沒有發起搜索的時候,其實可以認為信息流在默認地為某個特徵,比如“體育”展示搜索結果。

當用戶在頭條主動發起搜索後,信息流在原先的結果中,根據關鍵字匹配出相關度更高的內容展示。比如搜索“足球”,就會在“體育”的搜索結果中選擇與足球相關的內容,減少甚至去除原先娛樂特徵下的內容。

也就是說,頭條的推薦結果,本身就是多個小的搜索引擎在同時工作,推薦和搜索,本質上是沒有太大的差別。

那麽,頭條的搜索引擎做的夠好嗎?這在信息流大戰中頭條已經證明了自己,頭條的算法無論是在靈敏度還是複雜度上,都是建立起了一定的壁壘。

算法推薦,可以細分為三個階段:數據準備、數據檢索和數據推薦。頭條經過多年的頭條號、頭條問答、微頭條等內容建立,算法的不斷優化,起碼已經準備得有能力一戰了。

頭條和百度的搜索,又有可能不一樣。百度雖然多次提到要做搜索結果千人千面,但目前還是給每位用戶推薦標準版的結果。舉個例子,如果搜索結果的來源有機構、個人站點等多個維度,那機構站點的權重可能高於個人站點,導致相同的內容下,機構站點會在顯示結果中排在個人站點前面。由於當前關鍵字下搜索結果的排序是基於網站本身的權重和屬性,對於所有的用戶最終顯示的結果都一樣的。

而頭條目前的內容體系除了閱、轉、評、讚等賦予內容本身的屬性和權重外,用戶自身還存在大量的特徵,搜索結果對應的匹配,又多了一層用戶特徵的過濾,因此每一個用戶在同樣關鍵字的搜索結果下,會得到不同的內容展示,也就是千人千面。目前不同用戶在頭條的搜索結果差異並不明顯,但是確實存在不同。

百度不是說沒有用戶特徵,而是百度多年來未完善的用戶體系,導致至今沒有很準確的用戶特徵。這也是百度在今年春節期間,除了大力推廣手機百度和視頻等單獨的應用外,也希望通過打通用戶账號來建立一個比較完善的用戶體系。

二、百度和頭條的數據

搜索的另一個基礎條件是數據。頭條和百度在數據儲備上差距大嗎?誰的數據更優?

百度自然不必說,通過多年的積累,被認為擁有全網的數據,但現在對百度來說情況早已開始起變化。比如說擁有海量用戶微信的數據,百度拿不到;頭條號的數據,百度拿不到。

反觀頭條,其數據儲備正在快速的增長。頭條起家時用爬蟲網羅了大量的數據,媒體的資訊、微博的內容,到現在頭條建立起來的內容生態,頭條號、微頭條、問答,以及第三方內容,比如互動百科、360百科等,頭條的數據儲備也具備開展搜索業務的基礎。甚至,對於大多數普通的內容使用者來說,頭條的數據優於百度。

百度近些年來在內容生態的短缺,造成了與互聯網信息的割裂,百度對內容的把控開始顯得不足。很多企業在近些年逐漸地把網站作為一個基本信息展現的地方,甚至放棄PC端網站。反而是企業的頭條號、公眾號,有大量的信息不斷地產出,而這是百度無法收錄到的。

直到百家號的出現。今年初,一篇《搜索引擎已死》,重新挑起了人們對於百度生態的懷疑,百度大力發展的百家號,被指是將流量圈在自家體系中。事實上,對於百度來講,這是對自身體系的一種補救。百家號的這種策略,從商業的角度來看是正確的,如果沒做百家號,那現在頭條做搜索,百度會更加的被動。反觀頭條,依仗得不就是數據逐漸豐富的優勢嗎?

三、頭條做搜索的必然

頭條擁有足夠的數據儲備和算法能力,進軍搜索是必然。而且,張一鳴也有足夠的商業動力去這麽做。頭條發展凶猛,但是頭條有壓力嗎?有的。互聯網紅利消失,每一家互聯網公司都有發展壓力,當然頭條也有。前些年頭條的發展速度太快了,以致於現在對於頭條來說,想要達到之前的增速幾乎是不可能了。而就在今年初,傳出了今日頭條母公司字節跳動要上市的消息。如果要在上市後給資本市場交代,那搜索這塊既成熟,又順手,又肥的業務,是頭條最好的選擇。

如果說百度某天突然消失了,李彥宏手裡只剩全網的數據和一套成型的算法,那李彥宏會做什麽?李彥宏應該依然會做搜索引擎,或者去做一個頭條。

現在的情況是,張一鳴恰巧有家店面,還有幾個不錯的廚子。那對他來說,開個餐館,是順氣自然,也是必然。這也就是,頭條現在具備了數據儲備,具備了算法能力,去做搜索也是必然。

搜索引擎需要的數據,無非就是內容+服務。內容方面,百度和頭條各有優劣,但是服務,兩家的能力都不能算及格。

近些年來,百度的搜索引擎對用戶在交易(服務)方面的能力不斷地弱化,消費者的習慣改變,早已不會在PC甚至是移動端的網頁上進行交易。而且,百度在账號體系和支付方面的不足,甚至自身都不能完成很好的閉環。同樣,頭條在這方面和百度半斤八兩,這也就不難理解,頭條和百度,都在跟進小程序了,這是完成衣務閉環的一個解決方案。百度和頭條今年春節大戰的紅包提現,都有意識在支付的環節上進行完善。

百度和頭條,在搜索引擎的基礎建設上,一個是守城,一個是進攻。城牆並非牢不可破,進攻方並非無堅不摧,這也是,雙方才有打這場仗的必要。搜索的戰場,未完,待續...

獲得更多的PTT最新消息
按讚加入粉絲團