91伊人久久大香线蕉_青久久久久国产线免观_亚洲无码久久精品视频_熟妇在线观看免费视频

首頁 > 話題 > 正文

徐一龍:把今日頭條等同于算法推薦,是四五年前的認(rèn)知了

一、頭條=算法+熱點+關(guān)注+搜索

很少人知道,現(xiàn)在互聯(lián)網(wǎng)尋人非常高效的系統(tǒng)——頭條尋人,最初就是今日頭條一個日常彈窗運營動作。

今日頭條的彈窗,有部分內(nèi)容是針對本地用戶,給本地用戶彈窗本地資訊。2015年中旬,今日頭條嘗試將尋人啟事也做本地推送——只是這個本地更精準(zhǔn),取走失者周邊幾公里。

最初,我們預(yù)期用這個方法幫助尋找走失的兒童,沒想到兒童走失的案例非常少,而且即便推送出去的,也沒有一例成功。到2016年春節(jié),就在我們猶豫要不要放棄的時候,我們意外發(fā)現(xiàn),偶爾我們推送的一條尋找走失老人的信息,居然成功了。

我記得,這是2016年大年初二的事情。后一鳴知道了這事兒,他說,這事有價值,當(dāng)成一個長期項目做吧。

后來的事情很多人都知道了。一個公益項目,從2016年大年初二整裝出發(fā)了。頭條尋人,基于LBS技術(shù),從尋找走失老人開始,逐步擴(kuò)充到精神病患者走失、尋找緊急住院無名患者家屬、尋找臺海老兵遺屬、尋找烈士遺屬,三年過去,已經(jīng)找到幫助超過1萬個離散家庭破鏡重圓。

我講這件往事是想說,把頭條等同于算法,至少是四五年前的偏見了。寫這篇文章,就是想從傳統(tǒng)媒體人的角度,談?wù)劷袢疹^條在7年時間里,是如何搭建一個包括“算法+熱點+關(guān)注+搜索”在內(nèi)的通用信息平臺的。

2015年1月,我履職今日頭條副總編輯,參與內(nèi)容運營的工作。在此之前,我在傳統(tǒng)媒體工作了15年。來今日頭條前,我不但不了解“算法”,對“推薦”這個詞也很陌生——傳統(tǒng)媒體,是很少使用“推薦”這個話術(shù)來描述業(yè)務(wù)的。

為什么?我的理解是,“算法”、“推薦”的業(yè)務(wù)場景都是處理海量資訊。我曾經(jīng)在電視臺、報社、雜志社工作,生產(chǎn)的內(nèi)容其實都很有限,一份報紙最多也就千余條新聞,媒體界用“頭條”、“頭版”、“封面”,就可以解決現(xiàn)在資訊APP瞄準(zhǔn)的“推薦”問題。而類似今日頭條僅每日新增的內(nèi)容,就有幾十萬篇文章,如果沒有“推薦”,那可是徹底亂套了。

所以,什么是“推薦”呢?我的理解是:面對海量內(nèi)容時,如何幫助用戶高效地選擇、消費內(nèi)容。

來今日頭條后,我這個文科生也對“算法”有了粗淺的了解,對更多內(nèi)容行業(yè)觀察者來說,今日頭條甚至普及了“算法”這個概念:通過個性化推薦技術(shù),用戶可以看到自己感興趣的內(nèi)容,這后來也成為了全球范圍內(nèi)幾乎所有內(nèi)容平臺的標(biāo)準(zhǔn)配置。但是,今日頭條的推薦策略其實并不只是“算法”。

2012年8月上線至今,今日頭條歷經(jīng)了7次大的版本更新,并在這個過程中,演化成一款日活過億的國民級產(chǎn)品。今日頭條的推薦策略,早已不依賴于“算法”,而是一個囊括了“算法+熱點+關(guān)注+搜索”等多種功能的通用信息平臺。

熱點、關(guān)注、搜索……這些功能陸續(xù)推出的背后,其實是今日頭條在不斷完善自身的推薦策略。在我印象里,有三個比較重要的節(jié)點。

第一次,是2015年要聞區(qū)的設(shè)立。2015年1月,頭條的推薦頻道,已經(jīng)有了要聞區(qū),但是這個要聞走的是“加權(quán)推薦”的策略,不保證每個用戶都能看到。當(dāng)時我剛加入公司,基于傳統(tǒng)媒體人對重大新聞的判斷,我提出了入職后的第一個產(chǎn)品需求:“重大新聞應(yīng)該讓每個用戶都看到”。靠算法起家的產(chǎn)品經(jīng)理和工程師們,也認(rèn)為這個需求很合理。因為他們也發(fā)現(xiàn),每當(dāng)發(fā)生重大新聞,頭條的DAU就會提升,算法可以讓用戶看到自己喜愛的內(nèi)容,而重大新聞則有“穿透性”,如熱刀插黃油般,可以輕易穿透個性化——即便不關(guān)注科技的用戶,也會關(guān)注孟晚舟女士在加拿大的遭遇。現(xiàn)在,“要聞”的演進(jìn)更成熟了,仔細(xì)觀察下現(xiàn)在的頭條首頁,會發(fā)現(xiàn)整個頁面可以分為四個區(qū)域,第一塊是搜索區(qū),第二塊是頻道區(qū),可以看到各種垂類信息,第三塊是要聞區(qū),權(quán)威媒體的重要新聞,第四塊是個性化區(qū),用戶可能感興趣的內(nèi)容。我們希望能夠通過這樣的改進(jìn),同時滿足用戶對于個性化資訊和了解新聞熱點的需求。

image001

今日頭條產(chǎn)品內(nèi)容示意圖

第二次是2017年微頭條和問答產(chǎn)品的推出。我們通過這兩種全新的內(nèi)容體裁,探索智能社交,包括:上線問答頻道并推出獨立產(chǎn)品“悟空問答”,一個為所有人服務(wù)的問答社區(qū);上線“微頭條”,讓所有頭條用戶,特別是普通人通過發(fā)布短內(nèi)容,與人互動、建立關(guān)系。這是頭條從算法分發(fā)走向社交分發(fā)的初步嘗試,我們希望用戶在頭條內(nèi)能建立起有效的社交關(guān)系。與此同時,內(nèi)容可以通過“關(guān)注”的形式來分發(fā),而不是僅僅依賴于算法。所以我們在產(chǎn)品上也做了改變,今日頭條客戶端第一欄(最左邊)就是關(guān)注頻道,用戶可以在這里實時查看自己關(guān)注用戶的動態(tài)。此外,用戶在刷推薦頻道時,也能夠隨機(jī)刷到自己關(guān)注的親戚朋友或名人明星的動態(tài)。因為工作的關(guān)系,我在頭條上關(guān)注了很多名人、作者和朋友。我會發(fā)現(xiàn),“關(guān)注頻道”對我吸引力越來越大了,甚至能媲美“推薦頻道”,這就是關(guān)注分發(fā)的魅力。

第三次是2019年頭條搜索的推出。最近,我們推出了全網(wǎng)搜索的功能。這是今日頭條“信息創(chuàng)造價值”理念的延伸。用戶可以通過今日頭條最上面的搜索框進(jìn)行搜索,查詢站內(nèi)外的信息。我本人也一直頻繁使用頭條內(nèi)的搜索,坦誠說,最初效果并不太好,但最近,它越來越能滿足我搜索的需求了。而熱點運營工作,也延伸到搜索去。每當(dāng)發(fā)生重大新聞,運營人員也會去優(yōu)化搜索結(jié)果頁,讓人們能看到重大新聞最重要、最新的進(jìn)展。

二、算法不制造信息繭房,而是探索興趣

在互聯(lián)網(wǎng)時代,人通過上網(wǎng)獲取信息,主要有四種途徑:一是門戶網(wǎng)站,二是搜索引擎,三是社交,四是算法。

門戶網(wǎng)站的特點是人工編輯篩選,把所有新聞列在首頁,缺點是容量有限,一天頂多更新幾百篇稿件,用戶也不會每條都看。而像今日頭條,內(nèi)容池是上千萬篇文章,能夠提供的信息量要豐富得多。

搜索是人主動獲取信息,但要在海量的搜索結(jié)果中,逐個仔細(xì)篩選出自己想要的,占用時間比較多。即便搜索結(jié)果也不斷被優(yōu)化,搜索時,“找內(nèi)容”的過程仍然要占據(jù)大量時間。

社交等于關(guān)注和訂閱,由本人選擇,按自己需求出發(fā)。但一個人往往是相信什么或者喜歡什么之后,才會選擇關(guān)注什么。比如我家人相信健康養(yǎng)生,就關(guān)注健康養(yǎng)生的作者,帶來的問題是難以突破認(rèn)知。

image003

從互聯(lián)網(wǎng)獲取信息的方式很多,融合起來是最好的方法

有人說算法會造成“信息繭房”。這是對算法最大的誤解。

“信息繭房”概念,來自于哈佛大學(xué)法學(xué)院教授凱斯·桑斯坦。他在《信息烏托邦——眾人如何生產(chǎn)知識》一書中指出,在信息傳播中,因公眾自身的信息需求并非全方位的,公眾只注意自己選擇的東西和使自己愉悅的通訊領(lǐng)域,久而久之,會將自身桎梏于像蠶繭一般的“繭房”中。

為什么我說算法不會制造“信息繭房”?

首先,算法在推薦時,除了用戶現(xiàn)有的個人興趣,還會基于使用環(huán)境、內(nèi)容熱度、其他用戶的興趣,來給用戶推薦信息。這些因素能夠讓推薦內(nèi)容更加豐富,避免了內(nèi)容越來越窄。

其次,算法本身還包括興趣探索。

一般人對算法的認(rèn)識:喜歡什么,就推什么??扇松锹L的,人的興趣不但是各種各樣的,也不斷變化的。比如,我是英超球隊阿森納的鐵桿球迷,可最近幾年阿森納每況愈下,實在心生疲憊;在體育內(nèi)容上,最近一年我就更關(guān)心乒乓球,尤其是“日本選手張本智和和伊藤美誠多大程度上可以挑戰(zhàn)中國乒乓球運動員”,就比“阿森納能不能排名英超前四”更讓我關(guān)注了。

算法如何做這樣的興趣探索呢?尋找這個問題的答案,也是我來今日頭條后,想要探索的一個“新興趣”。

在向公司的技術(shù)大拿同事求教后,我了解到,算法最有效的能力,是識別出你最感興趣的內(nèi)容和最不感興趣的內(nèi)容。在二者之間,還存在一大塊“你可能感興趣的內(nèi)容”,這些內(nèi)容絕對不會被工程師和產(chǎn)品經(jīng)理們放棄。事實上,每個人的成長也是不斷地將“可能感興趣的事情”,固化為“確定感興趣的事情”和“確定不感興趣的事情”的過程。

對于算法如何識別人們“最不感興趣的內(nèi)容”,算法推薦里專門有個名詞叫“協(xié)同過濾”,英文術(shù)語叫collaborative filtering。“過濾”是“推薦”的反義詞,也是“同一個事情的兩個方面”。算法有很強(qiáng)的能力,過濾掉那些你明顯不感興趣,跟你一點關(guān)系都沒有的東西。比如我根本不關(guān)注美妝、口紅方面的內(nèi)容,算法沒必要推薦這些內(nèi)容給我。

那么算法如何去探索那些人們“可能感興趣的內(nèi)容”呢?

用戶興趣泛化和窄化,其實是推薦系統(tǒng)中的經(jīng)典問題,學(xué)界和業(yè)界一直很重視。這個問題叫EE(Exploitation Exploration):Exploitation是利用,通過已知的比較確定的用戶興趣,推薦相關(guān)的內(nèi)容。Exploratio是探索,除了推薦給用戶已知的感興趣的內(nèi)容,還需要不斷探索用戶的其他興趣,避免推薦結(jié)果一成不變。

算法追求的是,盡可能地滿足用戶獲取有價值信息的需求,并且讓用戶獲取信息的價值最大化。

image005

就像開寶箱一樣,算法需要通過探索來發(fā)現(xiàn)用戶的興趣

我們的工程師大拿說,興趣探索在短期內(nèi)會減損用戶使用時長,因為用戶會在信息流里刷到不那么感興趣的內(nèi)容,覺得信息流很亂。但是如果不做興趣探索,短期內(nèi)可以提升點擊率,但這個提升效果會迅速衰減,因此從長期看收益是負(fù)向的。

所以,興趣探索并非算法的“錦上添花”,而是“必不可少”。

這下你可以理解,“算法就是喜歡什么就推什么”是一個多么“天真”的誤解了吧。

三、人是萬物的尺度,也是算法的尺度

當(dāng)然,任何事物都不是完美的,算法也有一定的局限性。所以,需要一些其他手段,來幫助信息更好地流動。

在今日頭條,我們在內(nèi)容運營方面,主要做兩個事情:一是幫助頭條獲取更多優(yōu)質(zhì)來源;二是確保優(yōu)質(zhì)內(nèi)容在頭條上獲得合理的閱讀比例。

算法再精準(zhǔn),興趣探索再成功,如果內(nèi)容池的內(nèi)容不夠優(yōu)質(zhì)、豐富,那推薦做得再好,也不會讓用戶感受好。所以,從一開始,我們就非常重視優(yōu)質(zhì)內(nèi)容。2015年,頭條率先推出“千人萬元計劃”,對1000個優(yōu)質(zhì)作者,給予每個月1萬元的保底補貼。今年又推出了“創(chuàng)作者收益計劃”,希望幫助1萬位創(chuàng)作者月薪過萬,讓優(yōu)質(zhì)創(chuàng)作者獲得更多收益。

公平并非一視同仁,一篇公司調(diào)查和一篇娛樂八卦,前者付出的心血多,而流量往往低于娛樂內(nèi)容,而平臺這時候,就該勇于去“拉偏架”。“拉偏架”不但體現(xiàn)在資金扶持,也體現(xiàn)在流量扶持上。

有些優(yōu)質(zhì)內(nèi)容,它們不一定能引起所有用戶的興趣,也不能單純從用戶行為習(xí)慣來判斷,無法被推薦系統(tǒng)直接有效地衡量。這個時候就需要人介入。

一方面,我們調(diào)整機(jī)器推薦權(quán)重,比如給優(yōu)質(zhì)來源的優(yōu)質(zhì)內(nèi)容更多推薦權(quán)重;另一方面,我們優(yōu)化產(chǎn)品機(jī)制,提供雙標(biāo)題、雙封面,幫助創(chuàng)作者提升推薦效果。此外,我們還投入專門的人力,想辦法幫助優(yōu)質(zhì)內(nèi)容獲得更好的分發(fā)和閱讀體驗。我們專門有一個團(tuán)隊就叫“作者體驗”。

舉個例子。2017年10月,今日頭條和《三聯(lián)生活周刊》達(dá)成戰(zhàn)略合作后,我們?yōu)椤度?lián)》量身打造了封面專題的分發(fā)方式。封面專題是《三聯(lián)》的特色,一個專題往往由四到六篇文章組成。在手機(jī)信息流中,專題的閱讀效果其實不如單篇文章,但是,如果這些文章被拆開、打散,作為一個專題的閱讀價值就會降低。后來,我們想辦法讓《三聯(lián)》專題在頭條信息流里,同時擁有兩種分發(fā)方式,既可以被單條推薦,也可以以專題的方式被推薦。用戶把每個專題收藏起來,就可以看三聯(lián)周刊的所有封面報道。最新一期的封面報道《老友記》最近上線了,在今日頭條內(nèi)搜索“三聯(lián)生活周刊”就能找到。

image007

三聯(lián)生活周刊的封面報道,在今日頭條內(nèi)會打包成專題推薦,也在搜索中做了優(yōu)化,幫助用戶快速獲取。

我入職今日頭條后,經(jīng)常有媒體圈的老朋友問我:一龍,你在頭條干什么啊?頭條不是都靠算法嗎?

看,這兩個問題,本身就是矛盾的。如果頭條都靠算法,那我在頭條真的沒事可做了。而事實是,我在頭條挺忙;頭條除了算法,還有很多人。

我們始終相信人對于優(yōu)質(zhì)來源和優(yōu)質(zhì)內(nèi)容的鑒別力。人的判斷不同于機(jī)器,但同樣值得被重視。技術(shù)更快,面對海量的信息,分發(fā)效率尤其重要;但人更準(zhǔn),特別是進(jìn)入模棱兩可的地帶,人的同理心和想象力能夠發(fā)揮重要作用。

無論是人還是技術(shù),其實都只是一種手段,都是希望最優(yōu)質(zhì)的信息,能又好又快地觸達(dá)到需要的用戶手里,讓人找到信息,讓信息找到人,消除用戶“早知道就好了”的遺憾。

不久前,有同事發(fā)給我一個腦科學(xué)專家的言論。大意是說,要打敗推薦算法,需要兩個因素:1. 你需要有追求高品質(zhì)內(nèi)容的需求。2. 你需要隨機(jī)取樣人類各個領(lǐng)域的知識。

其實,算法追求的,和這位專家追求的,一點也不沖突。因為,說到底,算法的目標(biāo)是由人設(shè)定的,算法的內(nèi)核,和優(yōu)質(zhì)內(nèi)容、多樣性并不對立。這也是今日頭條一直以來努力的方向。

而這位專家所需要的“因素”,在作為通用信息平臺上的今日頭條上都有。

如果只有算法,絕不會有頭條尋人;如果只有算法,今日頭條也不會長期保持成長。

“讓上帝的歸上帝,凱撒的歸凱撒。”人類其實沒必要打敗算法。一定要和算法分個勝負(fù),大概是人的虛榮心和傲慢在作祟。比如在圍棋領(lǐng)域,我們沒有必要一定要追求打敗阿法爾狗。

算法在效率方面確實勝過人,而人的同理心和想象力高于算法。我們應(yīng)該做的是,和算法相互學(xué)習(xí),做好分工。畢竟,參差多態(tài),乃幸福之源。文/今日頭條副總編輯 徐一龍

  • 微笑
  • 流汗
  • 難過
  • 羨慕
  • 憤怒
  • 流淚
責(zé)任編輯:趙文源