“我在广告商的投入有一半是无用的,但我不知道是哪一半。”
20 年前 John Wanamaker 的这个观点在今天看来依旧深刻。据世界广告联盟 WFA 预测,若不采取措施,2025 年虚假广告花费将高达 500 亿美元,仅次于毒品交易,成为全球第二大非法营收。
整个广告交易的过程,其本质就是流量的买卖。为牟取更大的利益,流量造假成了广告行业屡禁不止的现象。据 RTBAsia 的数据显示,在 2017 年 550 个由 RTBAsia 监测的线上广告推广活动中,至少有 14% 的流量是无效流量。而 2018 年,全球浪费的广告支出约有 258 亿美元,其中 42.3% 与应用安装或 SDK 诈骗有关,邮件和广告位堆叠的比例 27.3%,点击注入欺诈占到整体的 30.3%。
流量造假的危害
投递效果无法科学评估,虚假流量的存在让广告主在广告效果、难以获得真实的反馈,导致获客成本增加,拖累运营效率,直接影响运作。
大量无效流量和无处安放的品牌流量。从结果上看,虚假流量本质是为“预期结果”负责的,“提升了”流量、下载、激活等数据,这些虚假的曝光次数对于广告主所期望的用户真实留存和活跃来说是没有价值的。
另外一些品牌被投放的负面新闻上,会严重影响企业的品牌信誉。
最终劣币驱逐良币,使得广告主对广告营销效果产生困惑,对整个行业造成信誉危机。
首先我们先分析一下作弊者是如何进行作弊的。
作弊的目的当然在于获得经济利益,因此,对不同的广告结算方式,作弊者会在不同的环节进行作弊。对于用 CPM 结算的媒体,广告曝光次数决定了最后收益,所以增加广告曝光次数就是最简单粗暴的作弊方式。
对于以 CPC 结算的媒体,制造虚假点击,提升 CTR 则是最常见的作弊方式。CPA 或者 CPS 结算方式则要求作弊者根据广告主的不同要求来调整作弊方式。
确认了作弊环节,下一步就是制造作弊流量,这类流量常见的可分为三类。
常见的三类作弊流量
第一类是,假用户带来的流量。一般来说是利用机器人来伪装成不同的用户,通过不断地变换 IP、cookie 甚至设备 ID 多次刷广告网页或点击广告。
第二类是,真用户带来的假流量。指作弊者利用真实的用户设备制作虚假流量。常见操作方法有,让用户看不见广告,例如,在同一个广告位堆叠多层广告、将广告容器设置成 1*1 像素、利用插件将广告植入页面顶部等用户无法见的位置等;归因作弊,也就是将本属于 A 平台的转换用户归于 B 平台所有;雇佣“肉鸡”、“抢手”刷广告等。
第三类是,真用户带来的真流量。虽然流量是真的,但多是滥竽充数的劣质流量,或是通过 http、DNS 劫持而来的非法流量。
了解了作弊者的作弊方式之后,就可以针对性地识别出哪些是作弊的流量。
如何识别作弊的流量
首先,应该注意的是用户标识。根据 IP、cookie 或设备 ID,来判断是否有用户存在不自然的高频次、高频率的曝光或点击,这样的用户极大可能是由机器人伪装的。
作弊者可能会变换 IP 和 cookie,这种情况下,就需要注意浏览器型号、分辨率、用户窗口大小、操作系统版本号、设备品牌号等等,如果不同 IP、cookie 对应的上述数据都相同,也可归为机器人用户。
除了通过数据对应之外,热力图也是一个简单易用且有效的反作弊工具。正常的用户点击在创意上的位置分布,往往是呈现与创意关键区域比较自然的分布。而机器产生的用户点击要么分布过于均匀,要么分布过于集中,很容易区分出来。
其次需要注意的是用户行为。
一是,用户对广告的浏览、点击行为是否自然。常见的异常表现有这几种:同一用户在同一时间或短时间内对同一广告位产生多次浏览、点击行为,同一用户浏览、点击事件间隔过于规律,用户行为环节(浏览-点击-到站-转换)有缺失,用户在页面上点击广告的位置过于集中或规律。
二是,用户到站之后的行为是否自然。这需要综合分析用户留存、停留时间,访问深度等指标。举例说,如果有用户在页面点击的位置、频率过于规律,则很有可能是作弊方制造的虚假活跃用户。
再次应注意的是到站流量的来源,即 refer 侦查。如果出现大量无 refer 的流量,则一般是来自非法手段点击代码制造的假流量。再将 refer 数据与投放媒体进行匹配,如果出现无法对应的情况,就可能是作弊流量。
在广告投放中,除广告投放平台之外,还存在第三方服务平台(AdServing),就可提供包括反作弊在内的广告验证服务。国外比较知名的 AD—Fraud 平台: forensiq、MOAT、IAS、ProtectedMedia。当然,第三方服务平台,也不可能百分之百地解决欺诈问题。
在短期内,流量欺诈的行为将一直存在,如何识别作弊流量,如何找到好的广告平台,将成为广告主们需要思考的问题。