网站数据体系Data Center

上次提到网站到底使用Google免费提供的GA就足够,还是有必要使用Adobe Omniture SiteCatalyst这类非常专业并需要付费的网站分析系统。不管你的网站用的是什么网站流量分析/统计系统,数据体系的建立对任何网站都有一定的重要性,越大的网站越是需要网站数据体系(Data Center)的建立。网站数据体系建立后可以帮助不同流量获取方式做分析和做决定:

至少以Google为例子,Google自身就是建立了一套收录网站数据和分享网站数据的数据Lifecycle。

数据体系建立前的巨大原始数据处理和保存

网站数据的分析和数据体系的建立各有难度。跟网站数据分析不同,建立数据体系时不只是需要先摸清楚以后使用数据体系中的报表的用户(比如:用户会看什么数据,把什么数据跟什么关联后得到insights、结论或知道take什么actions),处理量级极大的原始数据本身就是高难度。

  • 做处理和保存数据时会遇到多大的电脑硬盘都不够用
  • 用户会在使用数据时会遇到连Excel2010的1048576行和16384列极限

网站数据获取和网站分析系统

一般任何一个网站达到一定的流量级别后,它每天产生的原始数据都是非常巨大的。先不说平日去分析这个巨大的数据,一般人怎样去从巨大原始数据中去提炼出有用并有意义的数据都会有一定的难度,所以每个大网站都需要有专人或者甚至建立一个团队去处理这个原始数据。以下是几个情况:

  • 假如你是使用定制过的世界一流的付费网站分析系统,如Adobe Omniture SiteCatalys,your life will be a little easier。前提重点是在初期定制各种报表是你必须需要预先知道你以后的数据报告需求。
  • 假如你是通过GA获取网站数据,单每天监控网站流量趋势肯定是没问题。GA的缺点在于当你需要详细的数据时,获取数据报告会非常人工手动并非常耗时间。GA也有一个流量上限(Sampled Data),当网站流量达到GA这个上限时,而且同时你必须drill down去获取并分析非常详细的数据是,难度就来了。
  • Log日志中的原始数据有每条访问纪录,相当于网站上每一个文件被访问过的总和次数(不管文件是html、gif或者是其他),所以Log日志是最全面和最为巨大的一个网站原始数据,所以也比任何一个的通过JS代码获取流量数据的分析系统都巨大。而且Log日志原始数据在被处理过之前对使用者是无法读懂的,必须建立一套系统去把原始数据转换成有意义的报告。

SEO数据分析

在日常的SEO工作中,重要的一项工作是数据分析。通过数据分析,可以了解各种影响你网站SEO流量的因素,并去挖掘更多数据能够支持的因素。一切科学系统的SEO分析是基于网站数据的支撑和网站数据的分析。SEO数据分析中主要是对搜索引擎爬虫行为的分析。对于大网站SEO,SEO数据分析只会更为重要,所以数据体系的建立是SEO数据分析中不可缺少的前提需求。

SEM数据分析

SEM也是一样,需要对搜索广告投放进行数据分析。相比于SEO,SEM的先天优势是比如Google Adwords本身是个广告投放的操作平台,同时也是个报告下载/反馈的平台。通过Adwords后台提供的很多报告本身就可以对广告投放进行一定的效果分析,去评估日后投放策略需要改进的地方。在条件足够下,SEM会走向建立SEM团队和通过一些国际级的第三方SEM系统去管理搜索广告投放、优化、出价。

发布时间:February 2, 2012
分类:网站流量分析 | 留言

语言习惯分析,英文or中文

上次简单研究过英语对IT人的重要性,这次想到:到了中国国内生活和工作后经常用的2中语言是英语English和普通话Chinese Mandarin,所以粗鲁统计了平日语言使用习惯:

在双面、多对多沟通、交换信息(Two-or Multi-way Communication)中,使用英文和中文的百分比例:

  • 阅读、书写email:英文30%,中文70%
  • 阅读、书写IM(包括Gtalk、MSN Messenger):英文30%,中文70%
  • 写博客、在其他网站上发贴(包括TwitterSina Weibo):英文80%,中文20%
  • 口头交谈,通过面对面:英文20%,中文80%
  • 口头交谈,通过电话(包括Skype):英文20%,中文80%

单面接收信息(One-way information reception)中,使用英文和中文的百分比例:

  • 阅读新闻信息、博客、书籍:英文90%,中文10%
  • 看/听新闻、电影、视频:英文70%,中文30%
  • 通过搜索引擎搜索用的关键词:英文99%,中文1%

假设以上8项的比重都相同,得出:英文54.875%,中文45.125%

以上结果的2个主要外部原因:

  • 一种由于对方只能讲中文或太习惯讲中文
  • 另一种是由于对方不能讲中文

以上结果的1个主要内部原因:

  • 我个人自己的习惯

总结后是这样:在中国生活、在中国人的公司上班,由于环境限制,用得到中文的机会肯定非常的多,英语使用的百分比中大部分主要是因为自己到国内前留下来的个人习惯。假如你在中国的外国人朋友(不讲中文的朋友)比较多,假如你工作的环境中外国人也比较多,你使用英语和磨练英语的机会也相对会多很多。除了自己把握锻炼机会外,其他就是被环境逼到学好英语的。

全球化的社会、各个国家成为细分市场是趋势,有些已经来临,有些正在来临,不管你来自哪里、去了哪里、什么经历,这一切都是逃不掉的。

发布时间:January 12, 2012
分类:杂谈 | 留言

英语对IT人的重要性

英语对于中国人甚至是IT/互联网行业的人,到底有什么重要性?

  • 大多先进的IT科技、互联网最新的发展 – 最先基本上都是通过一些英语的网站、英语的博客、英语的新闻去得到这些一手消息。
  • 就算是在软件工程师编程方面,某些国外IT/互联网巨头公司提供的API数据接口的很多技术文档,最先推出的也是英语版本(当然有些后来也推出了其他语言,比如中文文档)
  • 很多能在网上很容易立刻找到的编程语言的帮助或教程,一般都是英语为主。
  • 有了英语,你不会被局限在不能跟外国人沟通的尴尬(前提是这些外国人是完全不懂中文或不太懂中文)。不跟外国人沟通所失去的是不会能够理解别国人的文化、思想。
  • 假如你能说能写流利的英语,也同时喜欢中国人的文化和西方国外的文化,一天你有机会到了国外生活,你的生活范围绝对不会被局限在唐人街(一般国外很多大城市都有聚居了华人或者开满了中国餐馆的一条街或者一个小区域叫做唐人街)。

最近几年看到很多中国的IT/互联网公司的Job Description(JD)中,都会加上一个条件(requirement):

  • 读写英语流利

这个可能只是一个招聘的门槛去淘汰掉一些应聘者。中国国内的很多工作根本并不是真的用得上太多的英语,除了一些真的每天需要大量使用英语,而且需要英语读写精确度都很好要求的工作例外。

当然,你一辈子不去写一句英语、不去说一句英语,你在国内生活也应该不会出什么问题。只是,你真的会You don’t even know what you have missed!做人呢,其实就是尽量让自己不要那天被一些事情一些能力局限死。

发布时间:January 8, 2012
分类:杂谈 | 留言

Lunar Eclipse,月食

食(eclipse)分为2种:月食(lunar eclipse)和日食(solar eclipse)。月食有3种可能性:

  • 月全食(total eclipse) – 整个月球进入地球的本影Umbra内
  • 月偏食(partial eclipse) – 月球只有部份进入地球的本影Umbra时
  • 半影月食(penumbral eclipse) – 月球只掠过地球的半影区Penumbra,造成月面的光度极轻微减弱

Wikipedia对lunar eclipse额解析

A lunar eclipse occurs when the Moon passes behind the Earth so that the Earth blocks the Sun’s rays from striking the Moon. This can occur only when the Sun, Earth, and Moon are aligned exactly, or very closely so, with the Earth in the middle.

下图中最黑色的三角部分是本影区umbra,本影区umbra外面的区域是半影区Penumbra(来自Wikipedia):

    How Lunar Eclipse Occurs

月食照片

从印度New Delhi拍到的月食过程

    Eclipse Photos, New Delhi India

从中国安徽省合肥拍到的月食照片

    Eclipse Photos, Hefei Anhui China

Eclipse软件

对开发工程师来说Eclipse有别的意思,英文Eclipse本省可以指一个开放源代码的框架和一组服务,基于 Java 的可扩展开发平台(Java Development Tools,JDT),并用于通过插件组件构建开发环境。Eclipse除了可以给软件开发程序员当作Java IDE平台去使用,更可以支持其他编程语言,包括C、C++、Perl、PHP、Python、Ruby、Scala、Groovy等。Google推荐对Android手机APP的开发通过使用官方的Android SDK框架加上Eclipse软件。

发布时间:December 13, 2011
分类:杂谈 | 1 Comment

Hao123,百度营销,百度广告的一部分

要获得巨大的流量,国内的B2C大型网站一向除了从百度搜索引擎营销SEM通过购买关键词广告,购买百度品牌专区广告和做好网站本身搜索引擎优化排名SEO外,另一个大流量渠道就是Hao123这类中文导航网站。百度上的营销包括:

对中国互联网不成熟的用户来说,hao123之类的导航网址网站的概念就是一个实用中文网站网址列表。

百度的大产品,百度的大收入:hao123

Hao123.com是中国最大访问量的导航网站。作为百度的产品,据说hao123还承担着百度6%-7%的收入。

中国互联网习惯使用导航网站:根据艾瑞调查报告,超过60%的中国互联网用户在2010年使用导航网站。

Hao123成立于1999年,2004年百度以人民币5000万收购。根据 Alexa,hao123是中国访问量最高的网站之一,来自其他第三方的报告显示百度的hao123和奇虎的hao.360.cn是中国的两大导航网站。我们估算百度的hao123.com和奇虎的hao.360.cn分别占到中国互联网导航市场30%的份额。

按照奇虎最新公布的数据,2011年Q3奇虎的导航收入将近2500万美元,按照hao123和hao.360.cn的市场份额,我们预计2011年百度6%—7%的收入来自于导航。

未来随着中国电子商务市场的快速发展以及广告价格的上涨,百度hao123.com将继续保持强劲增长。根据 Techweb报道,天天网曾对媒体表示表示公司在去年初,付给百度hao123.com每月5万至6万人民币,但目前相似位置的价格已经超过100万。

Hao123广告营销

SEM费用上涨是很多B2C网站近年的担心,B2C网站甲方可以做到的是建立有经验的SEM团队。在预算允许的情况下,第二部是Hao123和各个高访问量的导航网站。

  • 在hao123占领一条文字链接就相等于长期购买了个高流量、一口价fixed cost的广告位置
  • 购买hao123文字链接没有技术含量,需要的是跟百度的谈判技巧、金钱预算和手头上的一些有用资源
  • 一般情况客户与百度每年谈判一次(或者定期续约一次),购买hao123文字链接后维护成本也非常低

对不成熟的用户,像hao123的简单是很重要。

Hao123历史演进

互联网最初期时(早在1994-1995年之间),搜索引擎对网站/网页的排名技术还是非常落后。当时美国Yahoo就开始把网站分类,建立Yahoo Directory。中国类似的模式网站目录/网址比较晚出现,Hao123也要到1999上线。Hao123.com上线后也经历过好几次的样式改版,不过每次的变动不大。hao123从2002年到2008年的演进截图:

在互联网用户比较成熟的市场(e.g.美国),已经不再需要目录/导航网站的使用。现在还剩下的又有名气的目录网站web directory基本上只有Dmoz

发布时间:December 10, 2011
分类:百度SEM | 留言

Adobe Omniture网站分析系统,Efficient Frontier搜索广告竞价系统

Adobe最近收购搜索引擎营销广告投放管理系统Efficient Frontier和在09年时收购网站分析系统公司Omniture后,Adobe在全球市场上已经拥有:

  • 网站分析系统:原来Omniture的Site Catalyst和其他一些系统包括网页/网站系统等
  • SEM广告投放、管理、竞价系统Efficient Frontier

Site Catalyst + Efficient Frontier

Adobe很有可能形成的优势是把新收购的Efficient Frontier搜索引擎营销系统成功整合到现有的Adobe Digital Marketing Suite中。Adobe Digital Marketing Suite中包括原来Omniture的Site Catalyst。

Efficient Frontier的竞争系统

跟Efficient Frontier类似并在性能上可有得一比高低的全球SEM搜索广告投放系统包括:

  • Marin Software
  • Kenshoo
  • SearchForce
  • SearchIgnite

Google的GA企业版

大网站的另一个选择:谷歌GA分析是全球被最多网站使用的网站分析系统,统计流量和用户行为的功能上已经是非常不错。不过由于GA是免费版本,在性能上、自定义设置上比不上Omniture的Site Catalyst。不过今年Google终于推出了:

  • 新版GA – 改进包括界面、多个自定义仪表板、实时流量访问报告、页面速度报告、社交媒体报告、更多自定义报告等
  • GA企业版(Google Analytics Premium) – 包括技术支持、不限流量上限统计等

GA企业版 + 一套全球SEM搜索广告优化系统

大网站一般有不少广告预算投放到Google Adwords上,在对Adwords优化上,系统方面会考虑到底是用Efficient Frontier、Kenshoo、Marin Software、SearchForce、SearchIgnite当中的哪一套搜索广告优化系统。现在能选择加上GA企业版统计和有效的分析流量、用户行为和转化数据,并从数据中去优化网站的各个功能、各个流程环节,去对网站整体转化率做提升。

发布时间:December 8, 2011
分类:网站流量分析 | 留言

产品经理PM是什么,PM角色跟UED,技术,业务的关系

关于产品经理(Product Manager / PM)角色,在IT公司和互联网公司中,到底什么是PM:

很明显PM包含UED/UX、技术和业务。图片也是来自Mind the Product博客博文:

    PM is the Interception of UX, Tech, and Business

UED/UX又是什么?

PM还需要对自己的产品和用户行为做分析,网站产品更必须通过网站分析去了解网站用户,Web Analytics大师Avinash Kaushik解析:

在成为PM前,需要了解:

PM需要懂技术,所以看看最好的软件工程书籍去了解负责编程的工程师。

发布时间:December 1, 2011
分类:产品管理 | 1 Comment

中文,英文GA指标定义,维度定义

Google推出新版GA谷歌分析后,网站站长们就可以使用更易用的GA界面,并能够看到更实时的网站流量数据:

Rabbit雪博客整理出并分享中文、英文、日文对照的谷歌分析GA指标、维度。

  • GA中主要的Metrics指标(
  • GA中主要的Dimensions维度(

Gordon Choi’s Blog中也有列出过一些GA的metrics定义、SEM/PPC的指标定义和SEO的词汇解析:

发布时间:November 23, 2011
分类:网站流量分析 | 1 Comment

新浪微博,腾讯微博,Facebook,Google+ SNS社交网络网站

关于4个SNS社交网络网站:新浪微博、腾讯微博、FacebookGoogle+

新浪微博

先不说一些比较敏感的话题会不会被删贴,新浪微博Sina Weibo在中国国内的用户数量最近一年内增长超级快速。新浪微博的2个最主要功能是:

  • 只要粉丝follow对了对象,就能够当是一个每天关心时事新闻频道的平台,再把新闻通过新浪微博提供的功能按类别分类,譬如:互联网新闻、中国新闻、海外新闻、有趣笑话等
  • 跟好友、旧同事互连,作为一个长期人际联系的平台,分类为:国内好友、海外朋友、同事、旧同事等

腾讯微博

腾讯QQ本来在中国国内就拥有最多的用户数量,只要部分QQ用户转过去使用腾讯微博,腾讯微博就能立刻火热起来。个人来说经常使用虽然有些小问题,譬如像我:由于QQ开始热的时候,我在海外(南非),所以基本上是错过了加入QQ最热的时期,后来没觉得需要经常使用。

Facebook

对Facebook我实在无话好说。由于背景和以前的经历原因,所以我2/3个世界都基本上在Facebook上了,起码我认识的南非/海外朋友和香港朋友全部都在Facebook上,跟他们联系也是通过Facebook。

Google+

Google+的推出分成3个阶段:

  • 首次推出时就有很多人注册,当时Google只选择性把注册码发给少部分的Google帐号/Gmail用户
  • 第二阶段是Invitation only的注册方式,Google+用户可以把邀请发送给他们的朋友
  • 然后Google才把Google+的注册开放给全部用户

刚开始时Google+用户高达80%以上都是男性,到现在也有2/3是男性用户。Google+是个关注Geek事件的平台,有空可以尝试follow几个很Geek的Google+用户。不过当你能过follow对用于,你可以通过Google+上得到很多:

  • 新知识,包括技术领域的
  • 互联网的第一手新闻和互联网的第一手产品发展趋势。当然你可以每天阅读36氪博客之类的翻译国外原文的文章,不过个人觉得看原版才不会有失去原味的感觉。

发布时间:November 20, 2011
分类:SNS社交网站 | 1 Comment

Follow5微博同步工具关闭

微博同步工具Follow5即将关闭。Follow5发给用户的邮件:

尊敬的5友,您好:

我们已于2011年11月14日(星期一)停止了Follow5的全部服务,正式关闭网站,您可以在两周内通过Follow5首页(http://www.follow5.com)进入”5要存”下载您以往所有的分享。

感谢您一直以来对小5的支持与厚爱,不能继续为大家服务是我们最大的遗憾,为此,我们简单制作了一个视频,纪念与大家一起走过的这几年,同时也希望能够向大家解释关站的原因并得到您的理解:

http://v.youku.com/v_show/id_XMzIxODU1MTY4.html

Follow5首页上的解析:

时至年尾,已进深秋,冰冷的季节让被维护更显苍凉,虽有千百万个不愿与不舍,小5仍不得不与大家道别,感谢大家陪同小5走过这836天。你们的热情与陪伴是我们继续坚持的信念和动力!相信:经过寒冷残酷的冬天,定会是春暖花开,一片美好!

当时,Follow5微博同步工具可以跟以下微博帐号和SNS帐号同步信息:

  • 新浪微博
  • Twitter
  • 腾讯微博
  • 搜狐微博
  • 网易微博
  • Google Buzz
  • 豆瓣网
  • 饭否
  • 开心网
  • 人人网/校内网
  • Plurk
  • 天涯微博
  • 139说客
  • 做啥
  • HelloTxt
  • 9911
  • 嘀咕/火兔
  • FriendFeed
  • 叽歪
  • 同学网
  • 凤凰微博
  • 鲜果联播
  • 人民微博
  • 百度说吧

发布时间:November 17, 2011
分类:SNS工具 | 留言

下一页 »

SEM博客翻页: 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10