Category Archives: 开源BI

用自定义变量跟踪Android应用的用户行为

Google Analytics Mobile SDK 为Android移动应用提供了跟网站分析几乎一样的行为跟踪能力,譬如高级细分,目标(goal)和自定义报表。现在,Google在Google Analytics Mobile SDK 里了又对页面访问和事件标签里加入了自定义变量(custom variables)功能! 自定义变量能更好的去跟踪移动用户的使用数据,并作为数据的细分参数。譬如: 免费 vs 付费用户:有多少比例的用户从demo版转化成全功能版?这中间花了多长时间? 应用版本:哪个应用版本的用户最多?哪个版本流失了一些用户?找出问题所在,快速修正! 平台版本:如果你的应用对Android系统最低版本有所要求,是否会造成用户进入使用的障碍?你应该向下兼容,还是充分利用新版本的特性? 你也可以用自定义变量来了解用户在交互操作时的习惯: 交互模式:用户更多的使用菜单项还是长按呼出命令? 帮助/教程:用户在观看内置教程后,会去探索应用中的多少种特性?用户是否会因为新加入帮助/教程而去使用之前并不使用的特性?付费用户的转化比例? 水平 vs 垂直操作:用户更喜欢使用哪种模式来操作应用,水平方向或垂直方向?

Posted in 开源BI | Tagged , , , | Leave a comment

Pentaho Business Intelligence Suite配置:在Windows环境下使用MySQL 5.x

Pentaho开发者社区资源: PAT (Pentaho Analysis Tool)  CDF (Community Dashboard Framework) 利用Pentaho’s Business Intelligence Server 的用户控制台创建数据面板的框架 CBF (Community Build Framework) CDA (Community Data Access) A data access layer for CDF (Community Dashboard Framework). 第一部分:准备工作 1. 安装和配置Java 从Sun Developer Network下载最新的Java JDK,安装。 在Windows中配置Java运行环境: 点击 “我的电脑” … Continue reading

Posted in 开源BI | Tagged , , | Leave a comment

Google 网站优化工具中的安全问题

尊敬的 Google 网站优化工具用户,您好! 谨在此通知您,Google 网站优化工具存在一项潜在安全问题。通过利用 Google 网站优化工具控制脚本的一个漏洞,攻击者可能会使用跨站脚本(Cross-Site Scripting,XSS)攻击的方式在您的网站上执行恶意代码。不过,只有在网站或浏览器已经受到其他独立攻击的威胁时,跨站脚本攻击才会发生。尽管直接遭受此类攻击的可能性不大,不过我们强烈建议您采取行动保护您的网站。 我们已经修复了这一错误,所有新实验都不会受到此类不良影响。不过,您需要更新您当前运行的所有实验,以修复您网站上的这一错误。另外,如果您已暂停或停止的实验是创建于 2010 年 12 月 3 日之前,您也需要删除或更新与其相关的所有 Google 网站优化工具脚本代码。 更新代码的方法有两种。您可以停止当前的实验,删除旧脚本,然后创建新实验;也可以直接在您的网站上更新代码。您最好创建新实验,因为这种方法比较简单。 创建新实验 停止当前运行的所有 Google 网站优化工具实验 从您的网站中删除所有 Google 网站优化工具脚本 按照常规操作创建新实验,新实验不易受到攻击 直接更新 Google 网站优化工具控制脚本 在网站上找到控制脚本。此脚本如下所示: A/B 测试控制脚本 function utmx_section(){}function utmx(){} (function(){var k=’XXXXXXXXXX’,d=document,l=d.location,c=d.cookie;function f(n){ if(c){var i=c.indexOf(n+’=’);if(i>-1){var … Continue reading

Posted in 网站设计, 网站剖析, 开源BI, 技术和方法论 | Tagged , | Leave a comment

Google Analytics新特性: In-Page Analytics – 网站分析数据的情景视觉化

查看Google Analytics报表时,要理解访问者在特定页面是如何点击和导航,这多少有点儿困难。GA最初提供的Site Overlay报表,希望能达到这个目的。但不少人(包括Google自家人)也承认,这并不是很理想的方式。有些人不得不打开两个浏览器窗口来把网站跟报表进行相互对照。 为解决这一问题,Google推出了一项新特性(当然,这是beta版):In-Page Analytics。如下图所示,你可以在网站内浏览时,就能查看到链接上叠加的GA数据。 很酷吧!要知道,在以往只有一些商业Web Analytics服务提供商,如Coremetircs,Omniture 才提供类似服务的。   目前,In-Page Analytics特性只向使用英文版本GA的用户提供。如果你是中文版用户,那则需要转化界面语言。 一个介绍视频(为方便墙内读者,已转移到国内视频网站上): http://www.tudou.com/v/H4rvK5eKAf4

Posted in 开源BI | Tagged | Leave a comment

用GA跟踪使用Frames和iFrames的网页

昨天我用Google Analytics查看博客来源关键词的报告,发现有一位读者在检索如何用GA跟踪使用Frames/iFrames网页时,降落到本博客。不过遗憾的是,我之前的博文都没有对这一问题进行阐述。下面,我就补上。希望这位朋友还能回来看到这个解决方案。 首先,毫无疑问的是,GA肯定可以跟踪使用框架frames的网站。然而,在安装和部署跟踪代码时,需要小心谨慎。使用框架网页带来的最常见的问题是,最初的访问来源信息可能会不正确。 Frames 在把GA跟踪代码部署到使用框架的网站时,要确保frameset和frame里的网页都安置了GA跟踪代码。如果两个页面都没有打上标签,GA肯定不能正确的跟踪访问来源信息。 这是由于浏览器使用DOM主框架的信息来设置访问来源信息。所有在主框架内的网页,都把主框架视作访问来源。如果主框架内只有一个页面包含GA跟踪代码,那访问的来源信息将被设置为主站,而不是真正的来源信息。 把框架集Frameset和里面的网页都打上标签后,会带来一个副作用,也就是会人为的让某些网页的浏览量出现“虚高”,尤其是框架集Frameset页面。如果这个Frameset页面并不重要的话(譬如,只是一个导航菜单,或者页头),那可以考虑用GA过滤器把它排除掉。 iFrames 对于使用iFrames的网站而言,用GA跟踪也会出现跟标准框架frames所带来的同样问题。如果外部网页没有用GA跟踪代码进行标记,那最初的访问来源信息将会丢失。 使用iFrames另一个常见问题是,跟踪第三方的购物车。如果你的网站使用第三方提供的购物车,并用iFrame来把购物车嵌进网站,那要跟踪从最初网站到购物车网站的访问进程将会变得很难实现,因为跟踪cookies必须要传给购物车网站。 这种跟踪过程,跟使用GA跟踪第三方网站的标准设置(也许以后会谈这个问题)有所不同。对于标准的第三方网站设置,我们可以利用 _link() 和 _linkByPost() 的方法(method)来通过URL把cookie值进行传递。然而,在iFrame里就不能使用这些方法了,因为 _link() 和 _linkByPost() 都会对浏览器进行转向(redirect),这就是iFrame带来的问题。 不要担心,还是有解决方案的。在这种配置下,可以利用 _getLinkerUrl() 来动态的把跟踪cookie值加入到iFrame的来源里: var iFrame = document.getElementById(“iFrame”); iFrame.src = “_gaq.push([‘_getLinkerUrl’, ‘http://www.iFrame-domains.com/’%5D); 补充: 使用Internet Exlorer(6及更高版本)和Safari时,这种实施方式可能会带来一些跟踪问题。造成这种问题的根源是,某些浏览器在从第三方网站请求内容时要求传递要求P3P隐私标头。尽管传送P3P标头也是可能的,但要写跨浏览器的代码还是有难度的。如果你有兴趣的话,可以看这里来获取更多关于生成P3P标头的信息。

Posted in 开源BI | Tagged , , , , | Leave a comment

书评:Advanced Web Metrics with Google Analytics 2nd

在Advanced Web Metrics with Google Analytics 2nd Edition一书中,Web Analytics业界领袖人物Brian Clifton博士对最新版本的Google Analytics工具进行全面覆盖,向读者讲解和展示了经证明的网站分析最佳实践方式和理念。 对于电子商务营销者、网站站长来说,这本书可以说是市面上唯一对Google Analytics(GA)进行最全面涵盖和深入讲解的书籍(也许没有之一),包括从跟踪代码的安装、配置、跟踪技巧和网站分析的最佳实践等,让GA网站分析得到完全最大的发挥,从而进行以数字和事实为依据的决策。 无论是对于网站分析新手或老手而言,这本书能让你快速用上最新的GA技巧,辅之以经实践验证的最佳实践,还包含了令人叫绝的GA“破解(hack)”技巧,如对GA新提供的自定义变量(Custom Variable)来标示访问者、访问进程和访问页面,以实现对用户行为更精准的捕捉和分析;将特定交易与特定的访问来源进行匹配,等等。从对热门社会媒体的跟踪,配置访问数据过滤器,到分析结果的解释,这本书将帮助你提升网站分析技能、网站性能、甚至整个品牌和商业利润。 本书包含的内容有: GA部署和配置的最佳实践,打造坚实网站指标平台 详尽理解GA的特性和数据报告 从真实案例中进行学习,优化网站性能 整合AdWords,AdSense,以及站内搜索跟踪工具 结合A/B和多变量测试来使用GA 将GA数据与第三方系统和应用进行整合,包括客户关系管理(CRM)系统 利用新的GA API接口 本书附录还提供了GA分析中常用正则表达式和例子,以及提高GA使用效率的相关工具推荐。 也许上面的介绍或多或少会更像是在做广告,那可以看看作者Brian Clifton的个人履历来侧面了解本书的写作背景和实力。 Brian从1997年起就跟互联网结缘,从事网站设计和SEO工作。在2005-08年间,他成为了Head of Web Analytics for Google EMEA(Xoogler,前Google员工),制定了GA的市场进入策略,并从零开始组建了一支泛欧洲的产品专家团队。他还给Google Analytics Individual Qualification (GA个人咨询师资格认证)留下了一个在线学习中心。现在,Brian是GA-Experts.com的创始人,CEO和资深策略师,这家公司专门为全球客户提供Google Analytics和Urchin软件的性能和优化咨询服务。 Brian毫无保留的把多年咨询经验和GA产品经历融入到这本书中,对任何希望从GA和网站分析中获取最大价值的人来说,这是一本必读之书。 … Continue reading

Posted in 开源BI | Tagged | Leave a comment

度量不可度量之指标:访问者吸引力(Visitor Engagement)(连载1)

在网站和受众分析社区中,一个很热门的话题就是度量针对访问者的吸引力(visitor engagement)。在2006年,微软的Robert Scoble发表了一篇题为"New Audience Metrice Needed: Engagement"的文章,不久后Forrester Research的Jeremiah Owyang在一次社会媒体Social Media圆桌会上,就社会媒体和Web 2.0环境下讨论了“我们应该度量什么?”。虽然两位牛人对Engagement的度量都给予高度重视,但尚欠缺清晰和有形的度量指标,尤其针对于网站分析工具(Web Analytics Tools)而言。 Web Analytics Demystified的Eric T. Peterson则在这个方向做出了一些尝试,他在一篇题为“How do you calculate engagement? Part I”的博客文章中,提出针对网站的商业目标,使用通用的网站分析工具可以衍生出一套访问者吸引力的度量指标。 当然,在这里首先得对Visitor Engagement先下一个定义: Engagement这个术语来源于心理学,多涉及情绪等心理因素;营销学中引入这一概念,多涉及品牌方面。 Eric T. Peterson的定义是: Engagement is an estimate of the degree and depth of … Continue reading

Posted in 开源BI, 技术和方法论 | Tagged , | Leave a comment

针对Google Analytics的正则表达式ebook

什么是“正则表达式(Regular Expression)”?它就是一个提供“强健匹配”功能的逻辑规则,通过某种模式去匹配一类字符串。 在Google Analytics里,可以用正则表达式来: 创建过滤器   创建目标(Goal) 通过正则,来匹配多目标页面(multiple goal pages)。譬如,用户下单成功后的“感谢”页面可能会有多个名称,但对分析来说,这些都只是同一个目标。所以,你可以用正则表达式来把它们进行合并。 微调 针对漏斗(funnel)流程,你可以用正则表达式来精准的获取所需数据。 下载RegEx for Google Analytics ebook (英文版) 在线阅读 目录

Posted in 开源BI | Tagged , | Leave a comment

多自定义变量的威力

Google Analytics在去年(2009)十月份提供的一个新特性是多自定义变量 Multiple Custom Variables (MCV)。在此之前,GA只允许一个使用单变量(SetVar)来对访问者基于网站互动行为进行标签。这个新的MCV特性,可以让我们根据访问者的任意数量互动和行为来进行跟踪。 在这篇文章中将展示一些可运用到商业中的实用案例。 假设,你有一家销售男装、女装和童装的网店。你(以及你的老板)当然并不满足于只有汇总的数据,所以你希望把访问者进行细分和再细分!你可能想要获取对购物体验的以下真知灼见: 对产品和部门的兴趣 部门:男装、女装等 类别:运动、套装、衬衣等 特别部分:婚礼登记、收藏夹等 购物者和非购物者 网站语言:英语、西班牙语等 有了MCV,这些问题都可以得到回答了!下面将对运用原理进行简短描述。 多自定义变量(Multiple Custom Variables)是做什么的? MCV的特性,让我们能从三个层次对访问者进行标示,”访问者“,”访问进程“和”页面“。注意:MCV本身并不对访问者进行识别和捕获数据,这些都是匿名标签。 访问者层级标签 这些标签是永久性的,只要访问者的Cookies不删除,这些标签会贴在访问者当前和未来的访问数据上,并且这个特定标签不会被其他标签所覆盖。 进程层次标签 只要访问者在网站上保持活动,这些标签就会贴上。一旦访问者离开网站或者进程过期,标签就会消失。 网页层级标签 访问者可以在网页层级分配标签,如果访问者激发了特定时间(flash, video, Ajax…)或查看特定网页。 下面,让我们回到网店的案例上,了解实施策略和技术细节。 策略 当访问者进入网店,根据他们访问过的网页(产品和网店部门)来打上不同的标签。 例1 Tom是一位说英语的访问者,浏览了一件产品(女睡衣),把它加进购物车,然后完成购买交易。 在进程最后,Tom的访问被标示如下: 例2 Sara是一位说西班牙语的访问者,浏览了几件产品(男装和女装),然后没有购买就离开了网站。 在进程最后,Sara将被标示如下: 如何用? 1. 定制跟踪代码 访问者层级标签 … Continue reading

Posted in 开源BI | Tagged , , | 1 Comment

如何度量在线表表单的质量

来源:http://analytics.blogspot.com/2010/04/how-to-measure-quality-of-online-form.html (GFWed) 在线表单。你无时无刻不在填写一些信息。你填写这些表单来完成一次购买,注册,完成问卷,等等。它们是在线冲浪的一个整合部分。就像任何事物一样,它也可能变得很糟糕。 表单通常包含一些分组字段并采取多步骤填写。大部分表单字段都需要进行验证。验证字段是测试表单的先决工作。在表单填写完毕发送前,最好是让系统对字段填写内容进行预先验证。 表单填写错误率 当我们想要度量着陆页(landing page)的表现,我们会查看弹出率(Bounce Rate)。那么,就表单质量的度量,我们可以引入一个新的指标“表单错误率”(Form Error Rate, FER)。 提交错误次数(SubmitErro):尝试提交表单不成功的次数 全部提交次数:(SubmitAll):不成功次数 + 成功提交表单的次数 例1 某位访问者正考虑在线购买一份保险。为此,它需要填入一份由25个字段组成的表单。在第三次尝试后,他看到了成功提交的确认信息。在这个例子中,表单填写错误率的计算如下: 提交错误次数 = 2 全部提交次数 = 2+1 = 3 例2 1号访问者一次成功填写和提交,2号访问者在第三次尝试后成功。最后,3号访问者在尝试3次后放弃。在这个例子中: 提交错误次数 = 5 全部提交次数 = 5 + 2 = 7 在Google Analytics里记录错误 要跟踪在线表单的错误情况,我们可以使用 … Continue reading

Posted in 开源BI | Tagged , | Leave a comment