8月14日至18日,被譽為全球數(shù)據(jù)挖掘最高級別學術(shù)會議、反映最前沿數(shù)據(jù)領(lǐng)域研究風向的ACM SIGKDD 2022 (下稱KDD 2022)正式舉行。騰訊廣告共有2篇論文被KDD 2022收錄,彰顯了騰訊在數(shù)字廣告領(lǐng)域的前沿視野與以技術(shù)探索效果邊界的行動力。
如何進一步革新廣告技術(shù),才能得到投放效果的最優(yōu)解?這始終是平臺方持續(xù)探索的命題。
隨著各大平臺流量增長放緩,亟需以技術(shù)為驅(qū)動,提升對商品、人、場景的理解維度與深度,促成高效精準的匹配。以提升用戶體驗,騰訊廣告致力于提升品牌與用戶每一次相遇的效率與體驗,實現(xiàn)品牌和平臺、用戶多方共贏。
從去年開始,騰訊廣告展開了從基建到算法的技術(shù)探索,對廣告系統(tǒng)進行持續(xù)升級。一方面,依托底層太極機器學習平臺,系統(tǒng)打造廣告大模型,提升在召回、粗排、精排等競價環(huán)節(jié)的匹配效率,持續(xù)優(yōu)化廣告投放全鏈路;另一方面,系統(tǒng)基于行業(yè)知識和數(shù)據(jù)提煉特征進行建模,持續(xù)優(yōu)化算法,提升每一次投放的轉(zhuǎn)化效率和效果。
本次被KDD2022收錄的兩篇論文,就分別從用戶畫像和合約廣告發(fā)力,探索更高效的廣告效果轉(zhuǎn)化:
錄用論文1:
《 Mixture of Virtual-Kernel Experts for Multi-Objective User Profile Modeling 》
在廣告和推薦系統(tǒng)等工業(yè)應(yīng)用中,多樣化和準確的用戶畫像可以極大地幫助改進個性化體驗。當前,深度學習廣泛應(yīng)用于從用戶標簽建設(shè),即通過歷史交互行為挖掘含有實際意義的標簽,例如對廣告的點擊、轉(zhuǎn)化等行為動作可以挖掘出表達用戶興趣/意向的標簽。通常采用的方法是,面向多個動作(action)時,每次以單個動作為建模目標,引入多套獨立的雙塔模型(由于標簽眾多,單塔復(fù)雜性高)來預(yù)測用戶對標簽發(fā)生該動作的可能性(看作對標簽的CTR或CVR預(yù)估),預(yù)估出高得分的標簽可以用來表示用戶的喜好(興趣/意向)。然而,多個獨立的模型之間不能互補地學習,當某些動作的樣本比較稀疏時也不能很好地支持模型學習。此外,由于雙塔之間往往缺乏信息融合,這類設(shè)計無法很好地預(yù)估用戶對各種不同主題下標簽的喜好程度。
該研究摒棄了業(yè)界常用的雙塔結(jié)構(gòu)模型算法,獨辟蹊徑采用了創(chuàng)新型的多虛擬核專家混合模型(MVKE),用于統(tǒng)一聯(lián)合學習用戶對各種不同動作和主題的喜好。在MVKE中,我們提出了虛擬內(nèi)核專家的概念,該概念側(cè)重于對用戶喜好的一個特定方面進行建模,并且所有這些方面都在統(tǒng)一協(xié)調(diào)地學習。此外,MVKE中使用的Gate結(jié)構(gòu)在兩個塔之間構(gòu)建了一座信息融合橋梁,提高了模型的性能并保持了仍然保持了雙塔具備的較高的效率。我們將該模型應(yīng)用于騰訊廣告系統(tǒng),在線和離線評估表明,與基線方法相比,我們的方法具有更好的表現(xiàn),并對實際廣告收入產(chǎn)生了明顯的提升。
錄用論文2:
《CONFLUX: A Request-level Fusion Framework for Impression Allocation via Cascade Distillation》
合約廣告與效果廣告構(gòu)成了廣告平臺的兩條平行利潤流。由于廣告主不同的訴求(品牌效應(yīng)或短時影響力),導(dǎo)致了不同的廣告售賣模式(批量售賣或競拍售賣)和定價方式(固定單價或波動競拍)。隨之而來的問題,是如何通過合理的分配用戶曝光打破兩類廣告市場的中間壁壘。通過在全局最高點售賣曝光,提升平臺的總體收益。這種融合兩類市場的分配過程使得合約廣告和效果廣告之間,以及定向重合的合約廣告之間的競爭關(guān)系更加復(fù)雜。此外,非平穩(wěn)的用戶流量模式和效果廣告出價分布使得上述曝光分配構(gòu)成無監(jiān)督問題,且難以衡量每次分配的效果優(yōu)劣。顯然,已有的靜態(tài)或者粗粒度的建模方案都不足以很好的解決該問題。
該研究提出了一種創(chuàng)新的請求級融合排序框架CONFLUX,通過在兩種不同業(yè)務(wù)邏輯的廣告市場,即合約和效果廣告之間合理的分配曝光以提升平臺總體收益并保證廣告投放效果。該框架基于級聯(lián)式的結(jié)構(gòu)設(shè)計:首先通過線性規(guī)劃生成分配范式,將原問題有監(jiān)督化。然后利用復(fù)雜深度學習模型在請求級粒度上建模廣告之間的競爭關(guān)系,并將范式提煉為可供輕量級模型學習的經(jīng)驗信息。在線上服務(wù)階段,為了緩解模型衰退并適應(yīng)線上分布遷移,本文引入時序蒸餾損失。通過在新舊模型之間保留有用信息,周期性的微調(diào)線上服務(wù)模型同時防止過擬合現(xiàn)象的發(fā)生。這一工作流程類似于化學中的級聯(lián)蒸餾并因此得名。CONFLUX算法被實際部署于騰訊廣告系統(tǒng)并運行超過六個月。線上A/B測試以及與基線方法的對比都表明本文提出的方案能在保證廣告投放效果的同時,顯著提升平臺總體收益,實現(xiàn)廣告主和平臺的共贏。
KDD作為數(shù)據(jù)挖掘領(lǐng)域歷史最悠久、規(guī)模最大的國際頂級學術(shù)會議,由美國計算機學會(ACM)數(shù)據(jù)挖掘及知識發(fā)現(xiàn)專委會(SIGKDD)主辦,迄今為止已舉辦了28屆,被中國計算機學會(CCF)推薦為A類國際學術(shù)會議,云集了數(shù)據(jù)領(lǐng)域最前沿、最頂尖的技術(shù)趨勢與成果。吸引了數(shù)據(jù)挖掘、機器學習、大數(shù)據(jù)、AI等領(lǐng)域的多位頂級學者與從業(yè)人員、學生慕名投遞論文。
KDD論文非?粗卣撐牡 “落地應(yīng)用性”,選拔標準極高。據(jù)悉,今年共計接收到2448篇投稿,僅有449篇被錄用,接收率僅為 18.3%。本次入圍,不僅是對上述兩篇論文的前沿性及突破性予以認可,更是對騰訊廣告技術(shù)實力的再次肯定。
圍繞技術(shù)增效的恒久命題,騰訊廣告亦將圍繞在機器學習平臺、大模型算法等領(lǐng)域進行搜廣推的持續(xù)探索和深耕。