9月2日,火山引擎V-Tech數(shù)據(jù)智能科技峰會(huì)召開,峰會(huì)上新一代企業(yè)級(jí)數(shù)據(jù)產(chǎn)品火山引擎數(shù)智平臺(tái)VeDI正式發(fā)布。
字節(jié)跳動(dòng)數(shù)據(jù)平臺(tái)負(fù)責(zé)人羅旋表示:“增長,源于每個(gè)人做的每一次正確的決策,從戰(zhàn)略、管理到執(zhí)行。而決策是否正確,在沒有數(shù)據(jù)驅(qū)動(dòng)的情況下,更像是一種玄學(xué)。數(shù)據(jù)驅(qū)動(dòng)能夠讓決策方法變得更科學(xué),而更科學(xué)的決策也就會(huì)無限趨近于正確?!?/p>
本文根據(jù)羅旋演講內(nèi)容整理。
字節(jié)跳動(dòng)的數(shù)據(jù)文化、工具與組織
大家好,我是羅旋,負(fù)責(zé)字節(jié)跳動(dòng)數(shù)據(jù)平臺(tái)。
首先我們來看一個(gè),經(jīng)常被問到的問題:字節(jié)跳動(dòng)的增長,是如何實(shí)現(xiàn)的?相信大家也都看過網(wǎng)上很多分析文章,也有些自己的判斷,有說運(yùn)氣好的,有說戰(zhàn)略決勝的,有說賽道選的好,也有說網(wǎng)狀組織結(jié)構(gòu)先進(jìn)的……這些可能都對(duì),但也比較局部。今天我想從數(shù)據(jù)驅(qū)動(dòng)角度來解釋一下這件事情。
一,數(shù)據(jù)文化提升意識(shí)。
字節(jié)跳動(dòng)是一家非常注重?cái)?shù)據(jù)的公司,甚至連一開始給“今日頭條”這個(gè)APP取名也是靠A/B測試??梢哉f,字節(jié)跳動(dòng)是一家數(shù)據(jù)驅(qū)動(dòng)的“數(shù)字原生”公司。作為一家把數(shù)據(jù)驅(qū)動(dòng)作為文化基因的公司,字節(jié)跳動(dòng)在各個(gè)角色、層級(jí),從CEO、高管、中層管理者,到一線員工,都非常廣泛、細(xì)致地使用、依賴數(shù)據(jù)。對(duì)數(shù)據(jù)的依賴和應(yīng)用程度,都是業(yè)界比較領(lǐng)先的。
從高管的視角來看,很多宏觀層面問題需要被解決,如公司的經(jīng)營狀況如何,收支狀況怎么樣,團(tuán)隊(duì)是否健壯,組織是太肥了還是太瘦了,宏觀經(jīng)濟(jì)形勢如何,公司策略是否要隨之調(diào)整……而在字節(jié)跳動(dòng),這樣的信息,都必須用數(shù)據(jù)指標(biāo),來描述和支撐,我們會(huì)把它們分類整理,承載到管理駕駛艙上。從覆蓋面和精細(xì)度來說,我們有上千個(gè)數(shù)據(jù)指標(biāo),使用頻度也很高,每天都有大量訪問。甚至有管理層手繪設(shè)計(jì)圖,來討論這些數(shù)據(jù)應(yīng)該如何組織,數(shù)據(jù)產(chǎn)品應(yīng)該如何交互。
最高決策層往下,就是各業(yè)務(wù)的中層管理者們。他們除了關(guān)心某個(gè)業(yè)務(wù)板塊的進(jìn)展是否良好,有哪些待突破點(diǎn)等業(yè)務(wù)問題之外,也有很重的團(tuán)隊(duì)日常管理工作。很多企業(yè),都會(huì)用數(shù)據(jù)來監(jiān)測各項(xiàng)業(yè)務(wù)指標(biāo)。但在是字節(jié)跳動(dòng),我們不僅監(jiān)測業(yè)務(wù)指標(biāo)數(shù)據(jù),還把數(shù)據(jù)驅(qū)動(dòng)用在日常管理工作中。比如,目標(biāo)制定、OKR追蹤管理、周報(bào)周會(huì)的進(jìn)展同步、組織效率等等,這些都有大量的指標(biāo)來刻畫,并使用各種數(shù)據(jù)產(chǎn)品來跟進(jìn)、追蹤、對(duì)齊。
對(duì)一線同學(xué)來說,場景就更廣泛多元了。每個(gè)月直接使用數(shù)據(jù)產(chǎn)品的一線同學(xué)就超過10萬,字節(jié)一共只有十幾萬員工,這還不包括間接使用數(shù)據(jù)服務(wù)的情況。在日常的開會(huì)討論中,幾乎不可能出現(xiàn)一個(gè)會(huì),存在沒有數(shù)據(jù)的情況,否則會(huì)被挑戰(zhàn)得很厲害。而在不同場景下,使用的精細(xì)度也非常高,甚至?xí)幸恍┮庀氩坏降牡胤?。舉個(gè)例子,比如,在劣質(zhì)內(nèi)容的治理上,我們不只是用數(shù)據(jù)快速分析識(shí)別哪些是劣質(zhì)內(nèi)容,在對(duì)這些內(nèi)容的處罰中,也會(huì)用A/B測試來進(jìn)行判斷,以選擇更有效的處罰策略。
二,數(shù)據(jù)工具推動(dòng)執(zhí)行。
通過剛剛的幾個(gè)case,大家可能對(duì)字節(jié)的數(shù)據(jù)驅(qū)動(dòng)文化有了一定的感知。但光靠意念是不夠的,文化的落地需要有稱手的工具。
那字節(jié)跳動(dòng)的同學(xué)們,用什么工具呢?這個(gè)是字節(jié)跳動(dòng)數(shù)據(jù)平臺(tái)的產(chǎn)品架構(gòu)圖。我們整體分成數(shù)據(jù)引擎層、數(shù)據(jù)建設(shè)管理層、數(shù)據(jù)分析應(yīng)用層以及解決方案層。數(shù)據(jù)產(chǎn)品架構(gòu)覆蓋了數(shù)據(jù)全生命周期的整條鏈路。如果快速總結(jié)一下,我們整體數(shù)據(jù)產(chǎn)品的特點(diǎn),可以用兩個(gè)詞來概括,那就是敏捷和易用。
敏捷方面,簡單來說就是更快、更靈活。
快的方面,我們讓數(shù)據(jù)的各個(gè)環(huán)節(jié)都變快,不論是采集加工還是消費(fèi)分析。比如,我們能實(shí)現(xiàn)海量數(shù)據(jù)的實(shí)時(shí)寫入、實(shí)時(shí)分析;十億級(jí)的數(shù)據(jù)的查詢可以做到亞秒級(jí)響應(yīng);搭建的實(shí)時(shí)數(shù)倉,能給正在直播的賣家們以數(shù)據(jù)反饋,讓他們及時(shí)調(diào)整自己的策略,抓住轉(zhuǎn)瞬即逝的機(jī)會(huì)。
靈活方面,主要體現(xiàn)在數(shù)據(jù)處理模式、使用姿勢的靈活性上。我們能讓一線同學(xué)基于明細(xì)數(shù)據(jù)自助分析,而不用預(yù)定義指標(biāo);支持定制化,而不僅是固化的數(shù)據(jù)標(biāo)簽。因此當(dāng)我們做數(shù)據(jù)治理時(shí),就可以自定義目標(biāo),分階段定優(yōu)先級(jí),采用對(duì)應(yīng)治理規(guī)則等等。
易用方面主要體現(xiàn)在下面的三個(gè)方向:
門檻低。沒有任何技術(shù)背景的同學(xué)可以無代碼搭建數(shù)據(jù)門戶,沒有統(tǒng)計(jì)學(xué)背景的運(yùn)營也能開啟AB實(shí)驗(yàn)。
上手快。不會(huì)SQL也沒關(guān)系,只要你知道自己想要哪些指標(biāo),對(duì)數(shù)據(jù)元信息有了解,5分鐘就能搭建分析圖表。
協(xié)同廣。數(shù)據(jù)產(chǎn)品之間,數(shù)據(jù)產(chǎn)品和飛書、日歷、業(yè)務(wù)系統(tǒng)等多產(chǎn)品之間的無縫聯(lián)通,也讓大家更方便看數(shù)據(jù),用數(shù)據(jù)。
如果再回過頭來想想,為什么會(huì)是這兩個(gè)特點(diǎn)?其實(shí)也很好理解。因?yàn)楦子玫漠a(chǎn)品,才能被用得更廣泛,才能讓公司的每個(gè)員工都用起來;更敏捷的產(chǎn)品,才能被用得更深入,才能夠,在直播這樣要求非常實(shí)時(shí)的場景,在數(shù)據(jù)需求非常多變的情況下,也都能支持。
只有數(shù)據(jù)被用得又廣又深,數(shù)據(jù)驅(qū)動(dòng)的文化,才能有效落地。
三,高效組織撬動(dòng)飛輪。
文化提升意識(shí),工具落地執(zhí)行,是不是就夠了?對(duì)于業(yè)務(wù)復(fù)雜程度高,或者業(yè)務(wù)規(guī)模大的企業(yè)來說,好的組織模式是一個(gè)杠桿,能夠更大程度撬動(dòng)數(shù)據(jù)與業(yè)務(wù)這兩個(gè)飛輪互相驅(qū)動(dòng)。那什么算好的組織模式呢?我們的選擇是中臺(tái)+BP的模式。當(dāng)業(yè)務(wù)非常復(fù)雜,又存在多個(gè)形態(tài)差異大的業(yè)務(wù)時(shí),完全通用共性的產(chǎn)品有時(shí)不夠貼近業(yè)務(wù)場景。這個(gè)時(shí)候我們用數(shù)據(jù)BP模式來解決,數(shù)據(jù)BP是一個(gè)更深入業(yè)務(wù)線的角色,類似于HRBP跟業(yè)務(wù)的深度協(xié)同關(guān)系。數(shù)據(jù)BP會(huì)根據(jù)不同業(yè)務(wù)特點(diǎn),靈活組合數(shù)據(jù)中臺(tái)的產(chǎn)品技術(shù)能力,來解決更具體的業(yè)務(wù)問題。這非常類似于ToB場景中的解決方案角色,能站在客戶和實(shí)際業(yè)務(wù)痛點(diǎn)的視角看問題,從而規(guī)避了過于側(cè)重中臺(tái)和技術(shù)視角的風(fēng)險(xiǎn)。如果要做類比理解的話,中臺(tái)+BP的模式,非常類似于“中央廚房 + 終端餐廳”的關(guān)系。
上面講了我們?cè)谖幕?、在工具和在組織上的實(shí)踐案例和經(jīng)驗(yàn)。再回到最初的問題,談?wù)勎覀儗?duì)增長的理解。我們認(rèn)為:增長,源于每個(gè)人做的每一次正確的決策,從戰(zhàn)略、管理到執(zhí)行。而決策是否正確,在沒有數(shù)據(jù)驅(qū)動(dòng)的情況下,更像是一種玄學(xué)。數(shù)據(jù)驅(qū)動(dòng)能夠讓決策方法變得更科學(xué),而更科學(xué)的決策也就會(huì)無限趨近于正確。字節(jié)跳動(dòng)從第一天就相信數(shù)據(jù)驅(qū)動(dòng)科學(xué)決策的重要性,多年來也一直堅(jiān)定不移地在實(shí)踐。當(dāng)然,我們承認(rèn),一定有其它重要的因素也在影響著業(yè)務(wù)發(fā)展,比如宏觀經(jīng)濟(jì)形勢,賽道趨勢等等。但數(shù)據(jù)驅(qū)動(dòng)的文化,趁手的工具,高效的組織,這些一定會(huì)是增長的關(guān)鍵決定因素。
火山引擎數(shù)據(jù)智能平臺(tái)VeDI
講完了對(duì)數(shù)據(jù)驅(qū)動(dòng)的理解和字節(jié)跳動(dòng)的實(shí)踐經(jīng)驗(yàn),我們來看看火山引擎數(shù)智平臺(tái)?;鹕揭鏀?shù)據(jù)智能平臺(tái)VeDI,是我們對(duì)字節(jié)跳動(dòng)數(shù)據(jù)經(jīng)驗(yàn)的復(fù)刻。這個(gè)“智”,除了通常大家所理解的自動(dòng)化、智能化之外,我們更想強(qiáng)調(diào)的是,融入產(chǎn)品的經(jīng)驗(yàn)“智慧”。這也是字節(jié)十年來在數(shù)據(jù)領(lǐng)域的積累沉淀。我們希望把成功服務(wù)過抖音等諸多成功業(yè)務(wù)的經(jīng)驗(yàn)?zāi)贸鰜?,通過火山引擎服務(wù)更多外部企業(yè)。
上圖是我們整體火山引擎數(shù)智平臺(tái)的產(chǎn)品家族圖譜??梢钥吹秸w分成PaaS和SaaS兩部分,我們提供了覆蓋數(shù)據(jù)全生命周期的產(chǎn)品服務(wù),與內(nèi)部產(chǎn)品完全對(duì)應(yīng)。
PaaS層主要分為數(shù)據(jù)引擎和數(shù)據(jù)研發(fā)治理。分析引擎主要解決的是如何實(shí)現(xiàn)海量數(shù)據(jù)下既快又穩(wěn)還省的問題,這里面有湖倉一體分析服務(wù)的LAS,有開源大數(shù)據(jù)平臺(tái)的EMR,有提供極致分析性能的云原生數(shù)據(jù)倉庫ByteHouse。數(shù)據(jù)研發(fā)治理DataLeap,提供的是數(shù)據(jù)集成、開發(fā)、運(yùn)維、資產(chǎn)管理等能力。而在字節(jié)的數(shù)據(jù)經(jīng)驗(yàn)中,數(shù)據(jù)治理是其中比較有特色的一環(huán)。我們倡導(dǎo)分布式數(shù)據(jù)治理,提供工具,將治理過程做系統(tǒng)化抽象,讓它更流程化、自動(dòng)化。同時(shí),我們沉淀下來50多條治理規(guī)則,能讓各業(yè)務(wù)方依據(jù)不同業(yè)務(wù)的不同階段的優(yōu)先級(jí),進(jìn)行目標(biāo)的自定義和自治,更大程度提升數(shù)據(jù)治理的適配性和效率。SaaS產(chǎn)品是我們這次重點(diǎn)升級(jí)的系列,目的是更大程度地將數(shù)據(jù)驅(qū)動(dòng)融入到業(yè)務(wù)環(huán)節(jié)中去。我們提供了更具有場景化的模板,產(chǎn)品間協(xié)同性也顯著增強(qiáng)。
接下來,我會(huì)重點(diǎn)圍繞場景化和協(xié)同性這兩個(gè)特性,來發(fā)布我們升級(jí)后的產(chǎn)品。
一,場景更豐富。
我們?cè)诿鎸?duì)客戶的時(shí)候,經(jīng)常會(huì)被問到一些問題:“我這個(gè)行業(yè)指標(biāo)體系要怎么構(gòu)建?數(shù)據(jù)可以有很多,但哪些是我這個(gè)場景下最關(guān)鍵最需要采集的?” 在DataFinder4.0中,我們特別發(fā)布“場景模板”來解決這類問題。我們?cè)诋a(chǎn)品中預(yù)置了針對(duì)不同行業(yè)的核心場景模板,用戶可以自由選擇,一鍵生成看板。生成的看板則可直接用于對(duì)應(yīng)的場景,滿足日常業(yè)務(wù)指標(biāo)跟蹤或特定業(yè)務(wù)目標(biāo)的分析等需求。
上圖展示的就是目前預(yù)置在DataFinder里各行業(yè)一些典型場景模板。我們?cè)诜?wù)內(nèi)外部業(yè)務(wù)過程中,積累的分析經(jīng)驗(yàn)和方法論,都抽象在這些場景模板中。
二,協(xié)同更融合。
協(xié)同性方面,首先讓我們來看一個(gè)ABI產(chǎn)品DataWind跟飛書協(xié)同的案例。本次升級(jí)后的DataWind,會(huì)在多個(gè)方面與飛書高度協(xié)同。我們目前可實(shí)現(xiàn):
通過飛書機(jī)器人,一鍵訂閱數(shù)據(jù)報(bào)告,數(shù)據(jù)實(shí)時(shí)觸達(dá),定期掌握數(shù)據(jù)動(dòng)態(tài);
當(dāng)出現(xiàn)關(guān)鍵數(shù)據(jù)波動(dòng)時(shí),及時(shí)向負(fù)責(zé)對(duì)象推送異動(dòng)報(bào)警信息;
針對(duì)有疑問的數(shù)據(jù),不但可以實(shí)時(shí)評(píng)論,還可以一鍵拉群,對(duì)數(shù)據(jù)問題進(jìn)行討論和歸因分析;
分析后的BI圖表,可以嵌入回飛書云文檔中,做分析報(bào)告,總結(jié)沉淀。
對(duì)于數(shù)據(jù)量不大的場景來說,也可直接使用飛書表格作為數(shù)據(jù)集,接入DataWind分析。例如:某企業(yè)區(qū)域經(jīng)理要做經(jīng)銷商管理,經(jīng)銷商們可以通過飛書表格同步數(shù)據(jù);而區(qū)域經(jīng)理則跳轉(zhuǎn)到Datawind進(jìn)行多維度交叉分析,并且將分析結(jié)果制作成圖表;同時(shí),在有數(shù)據(jù)權(quán)限精細(xì)控制的前提下,將分析圖表,分發(fā)到飛書群或是云文檔中。DataWind跟飛書的聯(lián)動(dòng),僅僅是其中一個(gè)例子。它代表了數(shù)據(jù)產(chǎn)品與協(xié)作辦公產(chǎn)品的打通,這也是將數(shù)據(jù)驅(qū)動(dòng)的邊界,不斷向業(yè)務(wù)深處推進(jìn)。
而我們?cè)趯?duì)外的產(chǎn)品協(xié)同性上會(huì)更激進(jìn)一些,不僅是飛書,主流辦公協(xié)同工具都能集成使用。除了與協(xié)作平臺(tái)之間的聯(lián)通拓展之外,火山引擎數(shù)智平臺(tái)內(nèi)產(chǎn)品與產(chǎn)品間的協(xié)同也更絲滑。以營銷套件內(nèi)的產(chǎn)品為例,協(xié)同具備以下特點(diǎn):
數(shù)據(jù)共通:底層數(shù)據(jù)源統(tǒng)一采集、統(tǒng)一存儲(chǔ)、統(tǒng)一格式,多方產(chǎn)品共用;
標(biāo)簽聯(lián)動(dòng):VeCDP內(nèi)創(chuàng)建標(biāo)簽之后,Datawind中將自動(dòng)生成標(biāo)簽結(jié)果數(shù)據(jù)集,用戶可以直接進(jìn)行分析,GMP、Finder也都能直接用;
體驗(yàn)同步:不同產(chǎn)品中的數(shù)據(jù)看板可互相嵌入嵌出,比如DataFinder和DataWind;不同數(shù)據(jù)產(chǎn)品中,創(chuàng)建的群體也可以互相同步,比如DataWind和VeCDP;
設(shè)計(jì)統(tǒng)一:套件產(chǎn)品整體設(shè)計(jì)風(fēng)格統(tǒng)一,以保障不出現(xiàn)產(chǎn)品設(shè)計(jì)體驗(yàn)上的割裂感。
如果把這些能力用一個(gè)實(shí)際的場景串起來,大家可能更容易體會(huì)。某業(yè)務(wù)負(fù)責(zé)人早上醒來,在體內(nèi)數(shù)據(jù)驅(qū)動(dòng)基因的驅(qū)使下,打開手機(jī)飛書??戳艘谎圩约河嗛咲ataWind看板卡片,發(fā)現(xiàn)昨天某活動(dòng)的營收數(shù)據(jù),顯著低于了預(yù)期目標(biāo)。于是他立即一鍵拉群,并@了相應(yīng)負(fù)責(zé)人。拉群之后,活動(dòng)對(duì)應(yīng)的負(fù)責(zé)人、分析師、數(shù)據(jù)研發(fā)同學(xué)等不同的角色都在群里了。大家點(diǎn)擊指標(biāo)跳轉(zhuǎn)到DataWind里,通過使用DataWind內(nèi)置的智能歸因算法發(fā)現(xiàn)渠道因素的影響最大。做出這一步,也是最初步的診斷結(jié)論的時(shí)候,時(shí)間只過去了不到10分鐘。
接下來,還要做更詳細(xì)的診斷分析,看看不同渠道的轉(zhuǎn)化情況。而DataFinder其實(shí)更擅長解決渠道分析的問題,通過預(yù)嵌入DataWind的DataFinder看板,大家查看了不同渠道下的轉(zhuǎn)化漏斗對(duì)比,發(fā)現(xiàn)A渠道的人群跳失率太高了,基本上頁面點(diǎn)一下就馬上走了,說明這個(gè)渠道的投放都打了水漂。那該怎么補(bǔ)救呢?大家挑選了轉(zhuǎn)化率較好的B渠道,將他們的數(shù)據(jù)回流到VeCDP中,并建立了畫像標(biāo)簽,并基于此對(duì)原來投放的目標(biāo)群體畫像做了修正,使得其更精細(xì)化。
下一步就是投放,用VeCDP剛生成的畫像標(biāo)簽和人群包,在抖音廣告體系內(nèi)做比之前更精準(zhǔn)的定向投放。此時(shí)問題又來了,用什么樣的文案素材更好呢?通過DataTester,大家針對(duì)不同的人群,灰度測試選出了更適合,轉(zhuǎn)化率更高的素材。當(dāng)正式投放開始后,DataFinder又可以繼續(xù)用來分析投放效果了。此外,還能針對(duì)引流過來的新用戶,通過GMP進(jìn)行私域的push或者短信,提升私域用戶的活躍度。這就是一個(gè)企業(yè)如何利用火山引擎數(shù)智平臺(tái),實(shí)現(xiàn)的數(shù)據(jù)驅(qū)動(dòng)科學(xué)決策,進(jìn)而解決業(yè)務(wù)問題的例子。有時(shí)候,它可能只是從小小的數(shù)據(jù)異常開始,但卻能貫穿了企業(yè)從上到下的各個(gè)角色和環(huán)節(jié)。
在整個(gè)火山引擎數(shù)智平臺(tái)能力升級(jí)的背后,有我們一整套的數(shù)據(jù)技術(shù)能力在支撐。今天,我們也將首次對(duì)外發(fā)布火山引擎數(shù)智平臺(tái)的技術(shù)棧,讓大家全方面了解火山引擎數(shù)智平臺(tái)從數(shù)據(jù)引擎到數(shù)據(jù)管理以及數(shù)據(jù)應(yīng)用上端到端的全鏈路數(shù)據(jù)能力。
這些技術(shù)能力,除了通過剛剛介紹的商業(yè)產(chǎn)品對(duì)外服務(wù),也會(huì)通過部分開源的形式來對(duì)企業(yè)提供技術(shù)上的幫助。在字節(jié)數(shù)據(jù)平臺(tái)發(fā)展的過程中,我們也享受過開源社區(qū)帶來的便利,所以我們也將自己在實(shí)踐中自研比較成熟的系統(tǒng)開源出來,回饋給廣泛開發(fā)者。目前,我們即將開源的幾個(gè)項(xiàng)目包括數(shù)據(jù)集成項(xiàng)目BitSail和數(shù)據(jù)分析引擎ByConity開源項(xiàng)目等,預(yù)計(jì)年內(nèi)就會(huì)發(fā)布,大家敬請(qǐng)期待。
最后,讓我們簡單回顧一下。今天主要分享了字節(jié)跳動(dòng)的數(shù)據(jù)經(jīng)驗(yàn)以及我們?nèi)绾伟阉鼜?fù)刻在火山引擎并升級(jí)迭代的。我們認(rèn)為,所謂的數(shù)據(jù)驅(qū)動(dòng)不是有數(shù)據(jù)就可以驅(qū)動(dòng),還需要文化理念,精良工具產(chǎn)品,合理的組織;數(shù)據(jù)產(chǎn)品除了產(chǎn)品技術(shù)能力之外,還需要有被驗(yàn)證過的經(jīng)驗(yàn)智慧的沉淀?;鹕揭鏀?shù)智平臺(tái)VeDI,就沉淀了字節(jié)跳動(dòng)在數(shù)據(jù)驅(qū)動(dòng)方面的經(jīng)驗(yàn)智慧。期望它能夠幫助大家深入業(yè)務(wù),讓每一次業(yè)務(wù)決策更科學(xué),從而驅(qū)動(dòng)業(yè)務(wù)的發(fā)展。
謝謝大家!
編輯:楊艷 |