圈哥注意到,在經(jīng)歷多次因熱點(diǎn)事件處置引發(fā)輿論爭(zhēng)議后,抖音近日首度公開了算法推薦原理和平臺(tái)治理機(jī)制,并面向公眾上線了專門網(wǎng)站,對(duì)公眾關(guān)注問題進(jìn)行答疑。此次開放的算法原理說明顯示,抖音的推薦系統(tǒng)已進(jìn)化至以神經(jīng)網(wǎng)絡(luò)計(jì)算為手段,通過預(yù)測(cè)用戶行為概率和用戶不同行為的價(jià)值權(quán)重來(lái)確定視頻推薦優(yōu)先級(jí),而非依賴傳統(tǒng)認(rèn)知中的狹義上給用戶或內(nèi)容打標(biāo)簽來(lái)推薦。
在推薦機(jī)制層面,抖音基于用戶行為的推薦方法包括協(xié)同過濾、雙塔召回、Wide&Deep等多種技術(shù)模型。算法可以在完全“不理解內(nèi)容”的情況下,找到興趣相似的用戶,將其他人感興趣的內(nèi)容推薦給該用戶。系統(tǒng)在用戶每次瀏覽時(shí)會(huì)對(duì)候選視頻進(jìn)行實(shí)時(shí)打分,綜合考量完播率、點(diǎn)贊、評(píng)論、分享等數(shù)十項(xiàng)互動(dòng)指標(biāo),最終選出互動(dòng)價(jià)值最高的內(nèi)容進(jìn)行推送。也就是說,系統(tǒng)不知道你為什么喜歡,只需推測(cè)你最喜歡什么,歸根到底,還是一種數(shù)學(xué)概率游戲。
另外,對(duì)于公眾關(guān)心的幾個(gè)熱點(diǎn)問題,抖音也都在官網(wǎng)上進(jìn)行了回應(yīng)。
問題1、“信息繭房”是算法推薦形成的嗎?
同質(zhì)化選題的密集推送容易造成“信息繭房”現(xiàn)象,對(duì)此,抖音相關(guān)責(zé)任人回應(yīng)稱:“信息繭房”概念在推薦算法成熟之前就出現(xiàn)了,算法不是“信息繭房”形成的先決因素。現(xiàn)在行業(yè)對(duì)“信息繭房”的擔(dān)心本質(zhì)是“信息偏食”,即信息來(lái)源單一。
為引導(dǎo)算法打破信息繭房,抖音算法在多目標(biāo)建模體系下,設(shè)置了專門的探索維度。一是對(duì)用戶在平臺(tái)上已經(jīng)表現(xiàn)出的興趣,盡可能推薦更多樣的內(nèi)容,通過多樣性打散、多興趣召回、扶持小眾(長(zhǎng)尾)興趣等方法控制相似內(nèi)容出現(xiàn)的頻次。二是幫助用戶探索更多新興趣,采用隨機(jī)探索、基于用戶社交關(guān)系拓展興趣、搜索推薦聯(lián)動(dòng)、“不感興趣”不再展現(xiàn)等多種方式,讓用戶的主動(dòng)行為影響推薦系統(tǒng),使推薦更加個(gè)性化和多樣化。
問題2、算法是否故意推薦擦邊內(nèi)容來(lái)提升用戶使用時(shí)長(zhǎng)?
抖音算法工程師劉暢表示,抖音更關(guān)注用戶長(zhǎng)期價(jià)值,而非追求平臺(tái)的短期數(shù)據(jù)。為此,抖音算法考慮了眾多目標(biāo),如完播、評(píng)論、點(diǎn)贊、對(duì)作者長(zhǎng)期消費(fèi)、分享、跟拍等,力圖計(jì)算出更符合用戶長(zhǎng)期價(jià)值的目標(biāo)。
問題3、現(xiàn)象級(jí)網(wǎng)紅是平臺(tái)“強(qiáng)推”出來(lái)的嗎?
在郭有才等網(wǎng)紅走紅過程中,一些網(wǎng)友懷疑,網(wǎng)紅的走紅是否由平臺(tái)算法強(qiáng)推出來(lái)的。抖音對(duì)此表示,這鍋我們不背,是你們自己“選”出來(lái)的。創(chuàng)作者走紅是多個(gè)因素共同作用的結(jié)果,其中最主要的原因是用戶最大公約數(shù)的選擇——即用戶通過點(diǎn)贊、留言、關(guān)注、分享等行為,對(duì)自己認(rèn)同的內(nèi)容“投票”。一旦算法啟動(dòng),它就會(huì)尊重廣大用戶的選擇。如果給用戶硬推不感興趣的內(nèi)容,會(huì)有大量負(fù)反饋,用戶會(huì)點(diǎn)不感興趣乃至舉報(bào),會(huì)不利于用戶體驗(yàn)。
問題4、App會(huì)“竊聽”用戶談話嗎?
抖音官網(wǎng)表示,平臺(tái)沒有動(dòng)力這樣做,合規(guī)要求也不允許這樣做。之所以用戶有這樣的誤解,可能是兩方面的原因:一個(gè)可能是跨平臺(tái)營(yíng)銷推薦。這類廣告是基于用戶在前述應(yīng)用上的網(wǎng)絡(luò)行為數(shù)據(jù),比如瀏覽、點(diǎn)擊、收藏等舉動(dòng)而對(duì)用戶進(jìn)行行為偏好預(yù)測(cè),然后形成用戶群體畫像,進(jìn)行定向營(yíng)銷廣告。例如,用戶在A電商平臺(tái)搜索了一款貓糧。關(guān)閉A平臺(tái)后,打開了B社交平臺(tái),發(fā)現(xiàn)B平臺(tái)也在推薦貓糧。這并不是B平臺(tái)對(duì)用戶做了監(jiān)控,是A平臺(tái)作為B平臺(tái)的廣告主,通過程序化廣告利用A平臺(tái)的數(shù)據(jù)定向給用戶展示了廣告,實(shí)現(xiàn)跨平臺(tái)的廣告營(yíng)銷。
另一個(gè)原因可能是“幸存者偏差”。例如有一千名用戶都提到了貓,其中999名用戶打開App后推送的內(nèi)容都與貓無(wú)關(guān),但有一名用戶發(fā)現(xiàn)App推送了貓的內(nèi)容,這種反常的巧合格外引人注意,這名用戶就會(huì)將其放大,甚至猜測(cè) App 在 “竊聽”。
除以上問題,相關(guān)負(fù)責(zé)人還解釋了抖音內(nèi)容治理體系的運(yùn)營(yíng)機(jī)制:實(shí)行“人工參與+機(jī)器學(xué)習(xí)”模式,包含異常感知、標(biāo)準(zhǔn)定義、機(jī)器識(shí)別、人工研判、風(fēng)險(xiǎn)處置等過程。創(chuàng)作者將內(nèi)容上傳至抖音后,先進(jìn)入機(jī)器識(shí)別環(huán)節(jié)。如果內(nèi)容被識(shí)別出含有高危特征,將被直接攔截;若未命中高危特征但模型判斷有問題,會(huì)被送至人工審核;若問題概率較低,獲得基礎(chǔ)流量進(jìn)入下一環(huán)節(jié)。當(dāng)視頻被舉報(bào)、評(píng)論區(qū)出現(xiàn)集中質(zhì)疑、流量激增等情況發(fā)生,則可能觸發(fā)“人工+機(jī)器”審核。相關(guān)內(nèi)容在上述任一環(huán)節(jié)被處置,系統(tǒng)都會(huì)立即停止進(jìn)一步推薦和分發(fā)。
※ 抖音相關(guān)負(fù)責(zé)人在開放日詳解平臺(tái)治理機(jī)制。
看到上述機(jī)制,和圈哥過往工作中的治理策略經(jīng)驗(yàn)基本是相符的,無(wú)非是數(shù)據(jù)生產(chǎn)-攔截-審核-入庫(kù)-分發(fā)-高曝光/負(fù)反饋-召回復(fù)審 這么一整套流程,不一樣的是,在治理閉環(huán)鏈路中,機(jī)器學(xué)習(xí)參與的比重會(huì)越來(lái)越大,畢竟降本增效永遠(yuǎn)是各個(gè)內(nèi)容大廠永恒的追求。
另外據(jù)圈哥向內(nèi)部人士了解,抖音后續(xù)還將在專門網(wǎng)站解釋更多爭(zhēng)議性問題,各位圈友有興趣可以登錄網(wǎng)址 95152.douyin.com 進(jìn)行查看,甚至可通過官網(wǎng)提交意見建議,參與平臺(tái)治理。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.