RTB是什麼原因造成讓廣告主競價金額提高?

Xelsion_WordleRTB_Transparent

先從解釋DSP說起好了。DSP也就是所謂「需求端平台,Demand-Side Platform」,舉凡我們現在使用Google或Facebook的廣告系統都是,簡化說法就是DSP。DSP發展歷史先簡單認識一下。DSP最早期的原身是ADP(Ads Delivery Platform),正是所謂廣告遞送平台。過去,經營網站營收來源有一部分是靠廣告,因此經營者得面對「自建平台」或是「介接平台」兩件事情。大部分網站經營者認為自己都能開發出一套網站,整站滿滿都是上架機制,再做個廣告機制應該沒什麼太大問題。所以,多數早期在1999年到2008年左右的網站,一大部分都是建網站後,再建廣告機制。廣告機制大部分設計的核心或是原型不外乎就是「廣告上架」、「廣告管理」、「廣告排程」、「廣告報表」等,而當時最多人設計廣告遞送的方法是採取「隨機,Random」。

 

舉例來講,一個網站其首頁一天有1,000,000次瀏覽數。此時,如果該頁面有五個廣告版位,每個廣告板位「理當」能獲得各別為1,000,000次的播放。但實務上廣告還是會發生「有沒有被看到的問題」。意指五個版位每個位置都不一樣,假設從1280X1024的螢幕解析度來看,瀏覽器打開之後,出現在眼球裡的廣告板位只有三個,另外兩個則沒被看到。但因為頁面載入是一次性「全部載入」,這就會導致位置在不被眼球看到的廣告位置其「廣告點擊成效」變差。

 

一個頁面五個版位,「通常」沒有特別設計的話,網站賣廣告的播放量會是這樣計算。1,000,000X5=5,000,000。但,因為現在技術發展的關係,好比說像是Facebook,其頁面會自動「刷新或重載」,在頁面瀏覽計算基礎上就會與前者所提有所不同。至此,定義瀏覽數的方式則改為「每次頁面自動重新載入」之次數。

 

為什麼要特別提上述這段?原因是計算基礎不同,結果就會有很大的不同。還有一種計算基礎是「頁面不刷新,但廣告會刷新。」這很重要,因為會影響到廣告主看報表與對GA或是其他第三方服務時數據的認知。再舉個例子,頁面的瀏覽數是1,但因為該頁面的內容可以吸引使用者停留時間較長,好比說像是Youtube或是KKBOX這類線上串流服務。畫面不動,頁面也不刷新,可是使用者眼球就是一直停在畫面上。 此時計算基礎就變成「N秒變換一次廣告」與「每個廣告呈現的頻率限制」。實際簡單算一下,頁面瀏覽數是1,但使用者至少在該頁面上停留10分鐘,而廣告則是在眼球可視範圍內15秒替換一次,因此,該頁面廣告可得的播放數會是10X60/15=40。意思是,眼球可接觸範圍的廣告能在10分鐘內,被播放到40次左右,可這數字並不代表就被看到。至於15秒切換廣告也是可設定變數,看網站擁有者希望秒數是多少,相對就會影響廣告播送次數。

 

歸納一般網站擁有自己的廣告系統,其大致形式可以分成:

1. 瀏覽數常態變動,廣告板位與廣告呈現採均量呈現

2. 瀏覽數非常態變動,廣告板位與廣告呈現採自動刷新呈現

3. 瀏覽數不經常變動,廣告板位與廣告呈現採輪播刷新呈現

了解網站所用的廣告系統與計算基礎之後,這跟DSP的關係又在哪邊?關係可大了!因為從末端銷售來講,有越多的廣告曝光量(Inventory)才有辦法賣越多拉高收入。意思就是商品有多少存量就能賣多少,存量越少能賣的量就越少,這還不提賣出去之後的品質好不好,或是量有沒有被賣掉。就銷售單位所計較的一定是有無足夠的量可以賣,但就廣告主來講在乎的則是買到量的質好或壞,而這好或壞就不一定是每個廣告系統能做得到的事情。

 

這也是為什麼會有業者催生出像是DSP服務。也就是站在廣告主需求端服務,而真要定義的話,過去各大網站自建的廣告系統比較像是SSP(供給端平台,Supply-Side Platform),主做流量供給,不做廣告主需求對應關係。但,買單的人是廣告主,廣告主要的是「買到對的廣告,廣告要能帶入效益,效益最好能轉換成具體的收入或是回報。」

 

回到DSP的定義上,DSP其實也分很多種,舉例來說Google的AdWords是DSP。但是也有很多不同的廠商,覺得Google的介面不好用,或是因為Google提供了API可以讓廠商延伸做出更多的應用服務,所以廠商則開發自己的DSP去接Google的DSP。概念就像是A的DSP去串B的DSP,讓B的媒體去播A的廣告。

 

DSP還有一件事情很重要,那就是「定義廣告量」。

 

這就回到前面提到廣告系統的三種形式。一如先前提到,有量才有得賣,質好才賣得高,那量的定義就顯得非常重要。不能夠隨意亂定義,不然就會造成量多,質差,導致轉換效果差,廣告主用了幾次就不會想用,進而導致廣告業務推展上有困難。只是,到底要怎麼去定義廣告量呢?通常,基本標準是依循網站形態而定義,除此之外,則是更重要的將廣告量給區分開來。

 

廣告量得區分開來的意思也就是「每一次點擊進來網站的都是使用者,但有些使用者是真人、有些是機器人。」白話文來講就是「流量有分成真的與假的」,目前就一些組織單位統計出來的資料,大概有25%~30%的流量是假的。這些假的流量大致上不外乎都是機器人爬資料、當跳板、作假量等。廣告主絕對不會希望買到假流量,可問題是大部分的廣告系統不具備分辨假流量的能力,因為其經營專長並不在做假流量分析,要分析假流量通常還得跟第三方單位合作。光是這點就會造成許多網站擁有者認為成本過高而不願意投入去做。

 

將真的流量與假的流量分開來後,再來還要分流量點擊狀態。舉例來講,每個使用者只要上網都會被分到一個IP,先不論是固定還是浮動,這時該使用者如對某網站單一頁面進行以下行為:

1. 單一頁面反覆不停重新載入

2. 單一頁面用多標籤重複開啟

3. 單一頁面用程式進入去閱讀 則會造成「廣告量計算的最大值」被影響。

也就是說,先前提到廣告量越大越好,但是如果廣告主買到的廣告量是某些使用者,針對特定頁面反覆一直重新載入,造成廣告曝光數不斷提昇,但點擊一次都沒有發生,廣告主很容易就會將該網站上的廣告列為無效,以後要再吸引廣告主上門就很難,所以廣告量定義除了分出真與假之外,會在依照使用者行為去區分量的正常與不正常。

 

正常與不正常的最大差異是「當IP進入網站時,其IP產生點擊行為是不是固定有頻率。」舉例來講,使用者A進到網站,此時從主機端的LOGO上面我們看到像是這樣的資料:

 

IP A Time 12:00:00  IP A Time 12:00:00   IP A Time 12:00:00   IP A Time 12:00:00    IP A Time 12:00:00 從上面時間序列可以看到A在同時間要求(Request)五次,以一個正常人類來說,同一IP要再同一秒鐘做到五次要求幾乎不可能。所謂的要求是指當使用者打開瀏覽器,瀏覽某個網頁時,到看到頁面之前,其實伺服器端已經知道該使用者進來,這時才將資料丟到使用者的瀏覽器畫面上,而這每一次的要求都會除存在伺服器的LOG之中。除了上述情境,當然還包含了以下的情境:

IP A Time 12:00:00 IP A Time 12:00:01 IP A Time 12:00:02 IP A Time 12:00:03 IP A Time 12:00:04

 

這就是頻率。每一次的要求都有固定頻率,這些頻率通常會有其不固定性,也就是說正常人的使用行為不會那麼固定。但有人會說,有些公司的IP是固定的,公司員工都用同一個IP去瀏覽同一個網站,這就不有可能出現前面兩者狀況嗎?是的,有可能會出現,所以計算IP也是一種演算法,演算大量存在LOG裡的IP狀態,去分析解析出哪些IP產出的行為是有效,哪些是無效。這,也有專門的組織提供資料去串接,接起來後就可以做雙向認證,驗證進來的IP到底是不是曾經被判定為「非自然人使用IP」。

 

流量的定義至此分完第二層,再來是第三層。前面兩層已經是大多網站的廣告系統不一定能做到的,第三層則又更麻煩。第三層則是去讀取使用者存在瀏覽器裡的「Cookie or Section」。俗稱的Cookie Base,提供廣告平台去讀取Cookie的授權,藉由Cookie確認該使用者是不是真實的使用者,並且同時驗證該使用者的使用行為有沒有「非自然狀態」。但,Cookie又是怎麼來的?其實這就是每個網站設計系統時,多多少少會存一些Cookie在使用者瀏覽器之中。而有些業者就是專門去跟各大網站要Cookie讀取與串接的權利。

 

為什麼有業者要這麼無聊跑去跟各大網站要Cookie資料,甚至用買的?因為這些Cookie裡面的資料很多、很雜,但是基本上都會有「使用者瀏覽該網站時的瀏覽歷程」。這邊是第四層的定義,也就是大部分廣告平台進入門檻最高的「取得使用者興趣資料」。實際上,廣告平台並不是取得使用者興趣相關資料,而是從大量的Cookie中去解讀出龐大的使用歷程,經由自身設計出來的分析模型,套用到哪些大量的資料中,進而定義出使用者輪廓,了解使用者的興趣、嗜好與閱讀模式。

 

第五層,最難進入的一層,也就是不僅分辨出使用者的Cookie,還可將使用者的「會員帳號」與其相關資料綁定在一起。因為大部分的Cookie不會儲存攸關個人隱私資料的內容,所以Cookie裡的資料是屬於「被動性主觀解讀」型的內容。但綁上會員帳號後,會員的性別、年齡、地址、收入、家庭、嗜好、介紹等,都有可能依照不同網站授權程度取得。 舉個例子來講,為什麼Google、Facebook、Yahoo要搞什麼Ads Exchange?講白點好像都是為了廣告主好,但其實大家要解決的問題全部都是「清除掉無效廣告量,留下有意義又具有含金量的客戶資料」。各大平台之間經由廣告資料交換,再加上現在用Google、Facebook、Yahoo帳號等登入的服務越多,他們就越容易在每次廣告交換過程中,交換更精確的使用行為與使用脈絡。

 

最後一層,也就是各家廣告平台競賽的最後一哩。「將使用者過去因廣告而產生的各種行為記錄下來,並作為日後投放廣告資料時,作為首要判斷其投放的標準與依據。」這些資料藏在各大DSP最深層的核心裡,很難取得,大多也部會釋出,這也是為什麼一堆DSP業者會因為Google、Facebook都提供DSP了還要再做DSP的原因。最後一哩的操作行為,只有掌握在自己手上,才能摸索出消費者常態的消費意圖。 流量定義好之後,這才真正進入一開始想要討論的主題。「RTB為什麼讓廣告主競價的金額提高?」因為,所有的廣告平台,不可能告訴廣告主說:「嘿!這邊有一群流量轉換效果很好的使用者在這邊等你丟廣告喔!」因為,DSP提供者不可能知道每個進來廣告主的廣告訴求與廣告操作意圖,但是DSP卻可以藉由我上述前面提到幾層區隔流量的方式,將流量變成「各式、各樣、各類的受眾」。

 

重點就在這,當流量被區隔為受眾,而不再是曝光時,廣告就變得有價值了。但問題只是,怎麼從既有的價值中去架出更高的價值?答案就是讓那些高含金量的使用者被「適當的廣告接觸到」。但,誠如前面所說,DSP業者怎麼可能知道哪些廣告主的意圖是什麼,因此,當廣告主開始操作廣告時,設定完分眾,並且開始投放之後,DSP業者立刻就知道廣告主的意圖與「哪一群分眾有直接關係」。 正是這層關係「被建立起來」,DSP業者知道了、廣告主也知道了。廣告主知道什麼?廣告主知道哪些受眾對他有效,哪些則是沒有效。舉例來講,廣告主針對15歲這族群的使用者投放廣告,播放1000次廣告帶來10次點擊,點擊率是0.01%。廣告主又另外針對20歲這族群,播放1000次廣告,可卻帶來50次點擊之,點擊率則提高為0.05%。

 

關鍵點來了,廣告主發現原來20歲的族群對他比較有效,所以想要強化20歲族群的播放量,因此加大預算提高出價。但,這種狀況難道只會有一個廣告主知道嗎?當然不是,其他廣告主在使用的過程中也發現了,甚至找出更多有效的族群,這時DSP業者在幹嘛?DSP業者在算廣告點擊之後的轉換行為。找出哪些廣告主的廣告設定後之分眾,可以獲得較好的轉換率。

 

DSP業者知道轉換率能做什麼?許多廣告主發現對自己有效族群的重疊性又有何關?當然有關!關係非常大!因為廣告主知道有效,會放大預算提高出價,此時其他廣告主原本有效的變沒效,也會採取相應措施,舉例來說: A 預算從$1000提高到$2000,出價從CPM $10 提高到$15 B 預算從$1000提高到$1500,出價從CPM $8 提高到$20 競賽開始了,廣告量取得的競賽開始。但DSP如果只是按照數字計算提供相應廣告量的話,則有可能產生B預算少但出價高,可A預算高出價少,系統安排給B較高的播放量,但是A 的廣告轉換成效好,可量被變低,導致A沒獲得適當的廣告量成效無明顯成長,B獲得相應的廣告量可是原本轉換普通,現在還是普通,至此,A有可能一陣子過後就降低預算跟出價。

 

系統該做什麼?系統就要開始回到原本廣告播送序列上,即時動態的平成A與B的關係。這關係到受眾設定的重複性比例。舉例來講,受眾可以設定三個條件,恰巧AB設的條件完全一樣,兩方都有過去成效的紀錄,而雙方又同時採取積極的廣告投放行為,那系統就得去平衡廣告在每個節點排下去的廣告播送後,其產出的成效是否相對,如果沒有相對,則在下個節點發生前排進下一組播放序列,讓廣告可以持續呈現動態的平成與成效增長。

 

只是,系統又是依據什麼條件去動態平衡這一切?答案就出在受眾,也就是先前提到的廣告量定義。用白話文來說,廣告投放有效的族群,我會投別人也會投,大家都來投放同一群人的時候,那就來比誰出價高,出價高的就擁有較高優先權,這就是RTB管理核心的一大原則。不去做這區分,齊投式的平等反而會造成系統自體的瓦解。因此,AB分別設定好受眾、走期與預算跟出價後,這時候比較的基準分成:

第一層:廣告瀏覽停留時間

第二層:廣告點擊反應狀況

第三層:廣告成效轉換狀況

第四層:廣告主的後續調整

 

每一層,都會改變廣告演算法,也會改變RTB的演算結果。但是計算基礎不會變,只是這過程中,演算法會自動生產出很多不同的演算模型,然後這些模型又會交互使用在產生新的模型,這就是我們一般講的「學習引擎」。要讓廣告系統做到可以提供給廣告主「適當」的成效,這背後是反覆交錯的不斷運算,在運算的過程中去建議廣告主的「出價策略」。 出價策略來自於廣告主的主觀認定,但出價建議則是來自系統端的客觀資訊。

 

簡單的來說,即便AB都是同樣的預算、出價、走期與受眾,但AB的廣告素材一定不同,其到達的頁面帶來的相對轉換肯定也不一樣。假設A的轉換很好,B的轉換不好,此時系統如果給AB同樣的出價建議,此時,AB在競賽,A因為成效好,系統會偏好讓A獲得較多的播放量進而贏得A的重視,可是B也是有一定的基礎,難道就應該被犧牲掉嗎?當然不是。所以,A跟B獲得的出價建議就不同。這邊就是系統善意的提醒,提醒廣告主說「嘿,你可以不用花到這麼多,適當就好」。AB看到不同的數字,B採納了系統的建議調整出價,或是不調整出價,系統還是會依照AB的實際廣告執行狀況,去自動配置較適合A的廣告序列以及較符合B的廣告序列。最後,B會得到一組播放量還能接受,點擊量也還可以接受,但轉換不一定提高太多,可是廣告花費卻實際上並沒有增加太多的結果。

 

不過這麼做會有盲點,系統建議時,建議的是過去演算基礎,無法預知未來。所謂無法預知未來也就是不知道下一個同樣的廣告主C何時會進來,因此,廣告量的使用就變得更複雜。複雜的地方在於不清楚廣告主何時會進來競賽,假設我們為了留下AB廣告主都可以持續投放廣告,而A設定的廣告播放量是1,000,000,B設定的廣告播放量是500,000,可是廣告量一天的總量是8,000,000,那這時候沒有更多競爭者出現的狀況下,系統會採取「自動補足接近平衡」的方案。

 

意思就是AB廣告主加起來雖然只有1,500,000,但廣告系統為了要讓廣告主覺得物超所值,剩餘的廣告量沒人買也是浪費,因此自動將其廣告量補給AB兩位廣告主。這時,補廣告量就有補廣告量的邏輯,補的方式又是一套很複雜的演算法,因為這又得涉及排定之後的競賽狀況是不是能符合原先預期。AB看到的報表會是一如他們先前所設定的播放量,但實際真正的播放量也許遠遠大於他們本身看到的數字,好比A會是5,000,000,B則為3,000,000。補流量有一個很重要的重點,也就是補流量後的演算必須是一套獨立的運算模型,不能作為主要影響原始演算法的絕對因素,不然就會造成原始演算法的配置失準。

 

失準的理由很多,但是跟時間還有其他混亂因素有關,不在原先既有的廣告配置計畫裡。另外就是,剩餘的流量有的DSP會拿來接其他DSP的廣告。例如AB只買到1,500,000的量,那剩餘6,500,000量沒人買就放著浪費嗎?肯定不會,所以就是將這些流量分給其他DSP,播放他們的廣告進來,而至時,我們要討論的就是進入所謂的Ads Exchange之中。

 

討論Ads Exchange又是另外一個故事,因為這是被動影響主動,主動回饋被動,雙方之間隔一層不完全透明的關係,但又得讓廣告效益獲得較佳表現,其演算法設計的複雜度則再提高不少。簡單的說,每個DSP都有自己的RTB跟演算法,我們自己的也有,兩套不同的DSP會不會有平衡,就現況來講幾乎不可能,但要做是不是可以做到,這就得看兩套DSP之間的關係建立在什麼模式之中。