聽張一鳴談互聯網技術怎么改變媒體行業
以下據張一鳴演講整理
記得從中學到剛工作的那段日子,每周四下午都會有點高興,因為下班或者放學后能買到南方周末。一直以來,我始終保持著信息獲取重度用戶的習慣,并長期關注如何解決信息不對稱的問題。11年底,移動互聯網的快速發展,導致信息的創作、分發、討論,發生很大的變化。12年初,我從上一個創業公司離開,重新啟動,做了今日頭條。
我簡單介紹一下今日頭條。首先,它是一個超大用戶量的平臺,今年年初日活用戶超過2000萬。第二,它是一個信息分發的平臺,并不是生產內容的媒體,當然我們跟很多網站媒體有合作。目前,有超過20000個內容的創作者入駐今日頭條頭條號。其中,政府加各類機構超過5000家,簽約的傳統媒體有超過1000家,自媒體超過15000個,而且是以每月20%~30%的環比速度上升。 第三,從技術角度說,今日頭條是一款基于機器學習的個性化推薦引擎。它根據用戶的興趣、喜好、手機,位置,包括其他的環境信息為用戶推薦可閱讀的內容。
在我創業的時候,就有人問我張一鳴你做過媒體嗎?因為一看到今日頭條的名字,大家可能想會覺得:這是不是一個媒體機構。我說不是,我既沒有在傳統媒體工作過,也沒有在門戶網站工作過。還有人會問,你為什么招這么多工程師呢?我們確實需要這么多工程師,我們主要靠技術驅動來達到信息分發的目標。
一、互聯網技術怎么改變媒體行業的?
1.機器學習
從2011年開始移動互聯網快速發展,讓信息傳播,包括知識積累發生了很大變化。人類最早結繩記事,后來有了文字,人們將知識總結成符號記錄下來。但現在積累知識已經不是靠人了,是靠系統的觀察。系統通過觀察每個用戶的行為,不僅得到對這個用戶的了解,還得到不同用戶之間的差距。它可以知道同樣使用iPhone6手機的北京的男性用戶,有什么共同的特點。在使用3G和wifi網絡的時候,小米手機的用戶喜歡看的內容有什么區別。這些行為被系統記錄,被系統理解,沉淀下智慧。
在垂直領域,搜索、閱讀、導航、交易、保險、金融、天氣等都會出現這樣垂直的“上帝”,它們在這個領域不斷積累。系統就像一個不斷翻譯的大腦,剛剛做出來的時候可能是沒有多少智慧的,也就相當于幾歲的小孩,但它有一個優勢,不會死亡,能夠日夜不停的工作。而且用的人越多越久,它知道的東西就越多。我認為機器學習對信息的整理歸納理解的能力,將會大規模改變信息的傳播,也會抹平信息的鴻溝,減輕人腦的負擔。
2.介質的變化
我基本按時間排列了各種媒體形態——傳播信息的介質。紙是很重要的傳播介質,相比墻貼公告,(有了郵遞之后)它的傳播范圍很廣。特別是有了無線電技術之后,它可以分散多地印刷,讓大規模的傳播信息成為可能。廣播更是如此,第一次實現了非常快速的長距離的信息傳播。《偉大的博弈》那本書說,在電磁波出現之前,美國的東海岸和西海岸的市場交易價格是不一樣的,通過驛站和馬車,早上東海岸的價格下午才能傳到西海岸。電視,使多媒體信息傳播成為可能。無線電臺只能傳遞聲音信息,電視可以傳播視頻的信息。
互聯網,第一次實現了雙向實時的互動,內容創造者可以發布內容,讀者可以反饋,可以寫評論,可以互動。移動互聯網跟互聯網,就傳播信息的能力而言,沒有太大變化的。但移動互聯網可以隨身攜帶,所以它能記錄個人很多很多的特征,這一點意義重點重大。在PC上的時候,一個人用幾臺電腦,幾個人共用一臺電腦等等情況非常多,并且它不能捕捉個人的完整場景。
07年08年的時候,我在電腦上看各種內容,但也買報紙,為什么?在上下班的路上不會拿著電腦看。所以平媒受到移動互聯網的影響更大。10年之前,北京地鐵站入口有賣報紙的,出口有收報紙的,但11年之后就沒有了。因為移動互聯網便攜性非常好,傳遞信息也非常實時,并且能夠標識個人。這種介質的變化,不僅帶來信息分發效率的變化,還帶來創作的變化。第一手信息常常不再是記者的報道,而是用戶拍攝的照片發到了微博再被傳播,記者可能在微博上看到了,再去二次加工,聯絡當事人。視頻也是,以前視頻網站都是長視頻播放,但現在開始有更多的短視頻了,為什么?因為手機不僅有閱讀功能,還能創作。手機一般都有兩個以上攝像頭,能非常方便地捕捉場景,所以大量的內容被創作出來。
互動也發生了很大的改變。在功能手機時代,手機報可能一天發兩條,每一條大概摘要五條新聞,但是沒法評論,是單向接收。現在用戶不僅能評論,還可以看評論人過去的所有評論,看評論人收藏分享的文章,比如頭條上的社交功能一樣。所以媒體在閱讀之外還帶了社交屬性。這就是我理解介質帶來的變化。
3.個性化推薦需求
08年底,我有個強烈的感覺,信息越來越多,我關心的事情總是不能第一時間到達我。這個場景其實很多。比方大家都經歷高考,你們會到網上去查成績,每天可能都去看一下發布了沒有。但比較方便的,應該是一有信息就推送給你。09年的時候,有很多公司在做這方面的嘗試。其實,社交網站不論是微博還是朋友圈也能起到一定的功能,但它存在一個問題:朋友關心的不一定是我關心的。有什么產品能夠更滿足我信息獲取的需求呢,當時我看了在世界排名1000名的網站,尋找有沒有這樣的產品。發現 95年之后有很多人做了嘗試,都不太成功。09年有個比較大的網站——這個網站的創始人就是后來uber的創始人——也不是特別好。我就在想,應該存在一個更理想的形式,但一直沒出現。
我帶著這個問題工作,一直到11年智能手機出現,我覺得可以實現這個理想了。手機是你隨身攜帶的,攜帶時間比鑰匙更長,比手表更長,所以它能夠了解你的很多信息。并且手機是唯一對應到個人的設備。此外,手機屏幕很小,信息卻那么多,這兩者之間的矛盾就越加大了,信噪比(有效面積內的信息和噪音的比例)就顯得越加重要,個性化推薦的需求上更強烈了。當然,到了那個時候,相關的技術也越來越成熟了。
我還有一個觀點是這個世界越來越透明了,人在互聯網留下的痕跡越來越多了。在2009年之前,有一個說法,誰也不知道你在互聯網上是一個人還是一條狗,現在的說法是,互聯網上別人很容易知道你是誰。大家越來越多地使用真實職業,表達真實興趣,表達真實的態度觀點。因此,我覺得在移動互聯網上有可能做出基于推薦的產品,于是有了今日頭條。
二、大數據+好算法=今日頭條
有人跟我說,今日頭條長得跟新聞客戶端差不多,看不出是技術驅動。包括我跟獵頭說,我要招高水平的工程師,他們也不理解。其實如果看了這個圖,他們就能理解了。從左上角的部分,相當于一個搜索引擎的前半部分,它也要對信息進行收集、整理、分析,它要自動計算出這篇文章是哪一個主題的,是哪一個大類和小類,提到了什么人物、公司、地點。
之后,它要給用戶排序。就此時此刻,大家可以拿出手機刷一下今日頭條,跟周圍的人對比一下,你刷出來的前5條和他刷出來的5條是否一樣,肯定是不一樣的。為什么呢?因為它根據每個文章的特點,根據每個用戶的特點做了一個排序。用戶的特點是怎么知道的,我們可以看到右邊,用戶使用今日頭條,根據推薦結果產生行為,比如是否點擊、評論等,這些行為又迅速回到最下方——用戶信息的收集器——被分析,分析之后設定用戶的興趣,用戶的興趣又返回影響到排序。如果你剛剛點了一篇文章,是你從來沒有關注過的某個主題,過幾分鐘之后你再刷新,這個主題的文章就會增多。所以我們會對每條信息,每個商品(因為我們也推薦商品信息)進行各種分析。
我剛才是非常簡單的列舉,實際上分析緯度會非常多,讓這個循環不斷地迭代。人工智能系統,它不僅像一個助理,還像一個上帝,這個迭代的過程中,越來越多的知識沉淀下來。最左邊的一側顯示要做這樣一個系統的基礎工具。我們現在大概有3000臺高性能的服務器,到今年12月份會到6000臺,據我們所知,是未上市公司中最多的,當然也比很多上市公司多很多。這些服務器每天處理的日志大概有100多億條,100T,每天要消耗200塊500G的硬盤。講到這兒,大家也能理解了為什么今日頭條要招很多很多優秀的工程師。
這個圖表是我們過去一年中我們平均每個用戶每天點擊數的變化,大概是漲了90%。這個提高一方面有數據積累的因素,我們積累的數據越來越多了,另一方面就是算法的提高,計算公式越來越準了,在過去一年中,已經有幾次,一改進算法,第二天點擊率就明顯提高。
三、為內容生產者提供整套服務體系
1.智能推薦,內容生產者可以專心創作
我相信傳統媒體都挺關心我們內容合作情況的。我們的內容創作平臺——頭條號為什么能吸引很多的創作者呢?因為它具備個性化分發的能力。在平媒時代有兩個東西限制內容的分發,一個是刊號,第二個是發行。小眾內容在平媒時代是不被創造,因為它沒法被發行。比如說古箏,全國可能有20萬個讀者,但是太分散了,每個省就10000個,通過零售渠道很難發行。有了推薦引擎之后,發布第一天我們就向對古箏最感興趣的6萬人推薦了這個內容,這樣,長尾創作就發展起來了。
我們跟微信公眾號相比有一個特點,因為微信公眾號要人工訂閱的,如果你不搞一些病毒營銷、抽獎之類的東西,你是很難獲取有用戶的。很多微信公眾號運營了半年,也就幾千個粉絲,那每篇的閱讀量在一兩百。但是頭條不一樣,很可能你創作的第一篇或者第二篇內容就有幾千、幾萬個閱讀了,因為它會自動把你的內容推薦給可能感興趣的用戶。每篇文章下面還可以看到真實大量讀者的互動,很多人在評論頂踩。
2.內容變現
分發內容之后,如何變現呢?頭條現在已經做的一些事情。第一,頭條有廣告系統,用戶可以自己選擇匹配頭條的廣告系統,我們給用戶返還廣告收入。第二,用戶可以自己經營廣告位,可以放App下載,商品鏈接,或承接的廣告。一些頭條號,像電動汽車時代網、山茶花、石榴婆報告,都經營得很好,公司規模不大,也獲得了挺好的收入。
3.保護原創
在座的很多都是內容創作者,也很關心版權問題,我們今日頭條去年也有一些風波,是關于版權方面的。我想說的是,我們是業界最重視版權的。我們用業界領先的消重算法來保證作品在我們站內是唯一的。
我跟很多自媒體的作者聊過,如果你發現一篇文章被別的自媒體抄襲了,你在頭條上和微信上投訴得到處理的情況分別是怎么樣的?我經常聽到作者抱怨在微信很長時間沒有被受理,但在頭條上絕對是24小時內一定被處理完成的,因為我們要求所有的投訴反饋都要日清,這是我們的態度。 僅今年4月,今日頭條就處理了超過450例作者舉報,其中涉及侵害版權的有132例。
四、和最優秀的人做有趣和有挑戰的工作
最后,我想跟大家介紹下我們的公司文化,我相信大家對技術驅動的公司有什么特點感興趣。找工作有很多標準,最庸俗的叫做“錢多事少離家近,睡覺睡到自然醒”,但我們的標準不是這個,而是“和最優秀的人做有趣和有挑戰的工作”,招到最好的人,給盡量好的待遇,給盡量有挑戰的工作,讓他做感興趣且能做好的事情,給他最充分的發揮。
我們600個員工差不多有近300個是產品技術,我自己有40%的精力在跟招聘相關的事情上,其實我覺得應該還要再多一點,所以我們對人才是非常重視的。當然我們尤其重視技術人才,所以我們的HR負責人也是會寫代碼的。
頂級的技術人才值多少錢?我最近在朋友圈轉了這篇招聘啟示,很多人問我你們是不是營銷的噱頭,不是的,我們希望可以付100萬美金年薪招聘一個優秀的機器學習專家,但并不是說資深業界教授,我們優先喜歡35歲以下的,85后就更好了。我們經常說人力成本,其實我認為人力不是成本,我覺得人力是資源,人力是投資,所以我們愿意為優秀的機器學習人才付這么多的價錢。公司內部有很多相關規則,像推薦優秀的機器學習人才,我們獎2萬美金,推薦公司內部任何一個崗位,都獎5000人民幣,高級工程師獎1萬人民幣。我們是想員工能夠自循環起來,招到好的人,好的人再推薦好的人 。
責任編輯:大云網
-
碳中和戰略|趙英民副部長致辭全文
2020-10-19碳中和,碳排放,趙英民 -
兩部門:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
國家發改委、國家能源局:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業
-
碳中和戰略|趙英民副部長致辭全文
2020-10-19碳中和,碳排放,趙英民 -
深度報告 | 基于分類監管與當量協同的碳市場框架設計方案
2020-07-21碳市場,碳排放,碳交易 -
碳市場讓重慶能源轉型與經濟發展并進
2020-07-21碳市場,碳排放,重慶
-
兩部門:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
國家發改委、國家能源局:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
2020年二季度福建省統調燃煤電廠節能減排信息披露
2020-07-21火電環保,燃煤電廠,超低排放
-
四川“專線供電”身陷違法困境
2019-12-16專線供電 -
我國能源替代規范法律問題研究(上)
2019-10-31能源替代規范法律 -
區域鏈結構對于數據中心有什么影響?這個影響是好是壞呢!