该如何辨别数字广告虚假流量?
作者:shopaimi 阅读量:1186数字广告已成为提高销售业绩与市场份额必不可少的投资,全球的广告主每年在数字广告上花费高达数千亿美元,这些高额费用对不法分子的吸引极大,他们开始利用尚未成熟的技术漏洞来谋取利益。这种现象不仅扰乱了行业秩序,对数字广告生态链中不同的利益相关者也造成了直接的经济损失。
什么是一般无效流量(GIVT)?
一般无效流量即General Invalid Traffic,简称GIVT,是一种相对容易识别的作弊方式,通常由爬虫和机器人自动生成。
这些流量的表现非常奇怪,正常的人为流量是不会有此类行为的,比如一个同样的链接被重复点击1000次,或者每隔5秒钟就切换到一个新页面等。一般无效流量可以通过常规的过滤方式被识别出,包括过滤列表的添加应用以及其他标准参数的检查等。
典型的GIVT:
1. 已知数据中心流量 (Known data-center traffic)
来自于数据中心服务器的流量,这些服务器的 IP 地址和无效行为是相关联的,通常为非人为流量。
2. 机器人与爬虫(Bot and spiders or other crawlers)
机器人与爬虫产生的网络活动都是非人为的,有些机器人与爬虫产生的网络活动是合法的,比如搜索引擎机器人,它们可以帮助提高终端用户的体验,但有些则是违法的,甚至会带着恶意。但就算是合法的也同样会被过滤掉,因为它们属于非人为流量,且有可能在某些情况下触发广告的曝光。
3. 基于活动的过滤(Activity-based filtration)
有些用户行为需要额外关注,比如多次重复同样的有特定规律的行为,进行网络交易的速度过快、次数过频繁等等。这些看起来比较可疑的用户行为也需要被甄别出来,因为它们有很大的可能是无效流量。
4. 不正常规律(Irregular pattern)
包含一种或多种不正常规律的广告流量,比如自动刷新,这样会造成额外页面浏览的产生,或者多次重复点击。
5. 提前抓取或加载的流量 (Pre-fetch or browser pre-rendered traffic)
浏览器有时会在用户到达网页或是与网页进行互动之前提前加载一些网页上的内容,这是为了给用户带来更加无缝隙的用户体验,但提前加载网页内容可能会导致一些广告被自动触发。这种被自动触发的广告所产生的无效流量也需要被过滤掉的。