Google Analytics
GA中的某些维度可以返回上千的结果,常见的如“来源/媒介”、 “网页”及“网页标题”这些默认报表均有可能呈现较多的维度值。除了从事专业工作的分析师,大都人会选择查看前几十行,希望找到一些规律,但是很遗憾,前几十行可能并不会有明显的差异。试想这样一个应用场景,你需要找出哪些着陆页的跳出率最高,影响了你网站的访问质量。你可以打开着陆页这张默认报表,并依据跳出率排序,然而结果往往如下:
即当我们依据跳出率排序,GA默认显示的是跳出率高且会话数低的着陆页。那么我们的结论是什么呢?我们由于以上7个页面,流失了8次会话,我们的当务之急是优化这7个页面么?当然不是。我们需要找出跳出率和访问量都相对较高的页面,并优化对其进行。那么,如何找到这些页面呢?GA为我们提供了“加权”这种排序方式,是一种将跳出率(或者其他我们需要分析的比率)与访问量共同纳入考量范围的排序方式。操作如下:
继而,同样的着陆页报表,依然依据跳出率降序排列,则将得到如下结果:
总结而言,我们希望找到的不是绝对而言(就数值而言)跳出率最高的着陆页,而是跳出率高,且相对重要的着陆页。工作原理那么“加权”排序的原理是什么呢?Avinash Kaushik发布过一篇文章《End of Dumb Tables in Web Analytics Tools! Hello: Weighted Sort》比较详细的解释了“加权”排序的原理,但是数学功底有限的读者可能比较难以理解。下面触脉将呈现一个简化的“加权”排序的公式,帮助大家理解“加权”排序的原理。我们将需要4类变量:· V=任意着陆页的访问量;· B=任意着陆页访问量对应的跳出率;· MV=整个数据列表中单一着陆页访问量的最大值;· AB=所有着陆页跳出率的均值。我们需要计算的目标是:ETB=任意着陆页访问量对应的“真实”跳出率。则ETB = V / MV * B + (1 - V / MV) * AB。举个例子进一步说明一下,假设某一页面A的访问量是100,跳出率是85%,而所有着陆页中访问量最大的页面的访问量是1000,所有着陆页的平均跳出率是70%。那么页面A的“加权”跳出率是100/1000*85%+(1-100/1000)*70%=71.5%。另一个页面B的访问量为1,跳出率为100%,则页面B的“加权”跳出率是1/1000*100%+(1-1/1000)*70%=70.03%。尽管实际跳出率页面B大于页面A,但是“加权”后的跳出率页面B则低于页面A,是因为我们将页面访问量纳入考量的缘故。GA实际的加权公式要略微复杂,我们提供的这种算法是原始模型的简化估计,但是已经可以在最大程度上接近GA实际加权的结果。建议在结合跳出率、电子商务转化率、目标达成率等比率型分析时,优先使用GA中加权排序的方式,这样得出的分析结果的实际应用价值会更高。