终于准确知道顾客是从哪里来的了

说顾客从哪里来,不是指顾客居住的地理位置, 而是指顾客找到我的产品,我的网站的方式。 最终付费的顾客是通过搜索引擎找到的,还是通过在哪个站点投放的广告, 还是通过adwords。这是我一直最关心的问题,也用了各种方法去分析,比如网页里插入Google Analytic的统计代码,用web log analyzer 分析自己网站的日志,但因为自己的共享软件是通过regsoft, regnow等注册服务提供商来完成,当用户最终确认付款时,已经离开了我的软件站点页面,Google Analytic和日志都不能确认这个用户是否付款。 很多时候把钱扔到各种推广方式上,但对每种推广方式能有什么具体效果则心里一点数也没有,只要月底一算账收入增长了,就觉得推广的方式还是有用。 如果下降了, 就不管有用没用,所有推广方式全给砍掉。

前天痛感这种状态不能再继续,于是自己修改了一下google analytic的代码来实现对顾客来源的跟踪。 Google Analytic会在客户端种植几个cookie,最有用的是__utmz, 记录了用户的来源信息,通过搜索引擎过来的用户还能找出关键词。但有个问题是,不能区分正常搜索结果过来的用户和通过adwords广告过来的用户。 这就需要自己做点工作了。

1.adwords广告的目标url设置特殊参数, 我就设定为 /index.html?ref=adwords

2.在index.html加入如下javascript代码 ,种植_isadwords cookie


var _isadwords;

_isadwords= _uGC(document.cookie, ‘_isadwords=’, ‘;’);

//判断是否cookie中已经存在isadwords字段,如果不存在就设置此字段
if( !_isadwords|| _isadwords== “-” )
{

//判断是不是adwords过来的用户
if( window.location.href.indexOf( “/index.html?ref=adwords ” ) > 0 )
_isadwords= “1” ;
else
_isadwords= “0” ;

document.cookie=”_isadwords=”+_isadwords+ “; expires=” + _uNx()+”;”;
}


这其中 _uGC()和_uNx()都是google analytic 的 script中提供的函数。_uGC()是在第一个参数中寻找以第二个参数开头,第三个参数结尾的子串。 _uNx()则是返回当前时间一年以后的时间,用做cookie的过期时间。

种下了cookie,剩下的问题就是怎么读出来了。先下载http://www.doyj.com/images/a.gif, 上载到你的站点图像目录里。 a.gif是一个只有一个透明像素的gif图像文件。然后在产品购买页面嵌入如下代码:

var _urefgifpath=”http://www.doyj.com/images/a.gif”; //这里要换成你的图像链接

var zx = _uGC(document.cookie, ‘__utmz=’, ‘;’); //取出__utmz cookie
var _isadwords=_uGC(document.cookie, ‘_isadwords=’, ‘;’);

var i3=new Image(1,1);
i3.src=_urefgifpath+”?”+”utmz=” + zx + “_isadwords=” + _isadwords + “&utmn=”+_uu;
i3.onload=function() { _uVoid(); }

代码中的_uu是google analytic中生成的一个随机数,=Math.round(Math.random()*2147483647);, 这是为了保证每次url都是不一样,客户端不会缓存对这个图像文件的访问。代码中的_uVoid()也是google analytic中的一个空函数。

这段代码其实就是new 出一个图像文件, 把cookie信息做为这个图像的参数返回给服务器,这样在日志中就会留下用户的cookie信息。因为这个图像文件是一个透明像素,并且是在javascript中new出来的,所以在页面中是不可见的。

因为在订单中有用户的ip, 每收到一个订单, 就可以去日志中去查找这个ip, 再查找这个ip访问a.gif时留下的参数,就能知道这个用户从哪里过来的了。

后记:写在这里的方法已经比我当时采用的方法又改进了一些, 当初想的方法,那是…………相当的蠢。 改进后的方法依然不好,还要去看日志文件,很麻烦,但至少实现了追踪用户来源的功能。方法还有很多改进余地,我这是抛砖引玉,先提出这么个思路,欢迎大家指正。

购买流量总结

上个星期翻到一些帖子说起购买流量的事,就去google搜了几个站看了看,看着也花不了多少钱,就先找两个便宜的试了试,一个是 needhits.net, 一个是buyhitscheap.com。

这两天分析了一下从他们来的流量,虽然还没完全结束,但已然有些心得。国内这方面有经验的人应该不少,轮不到我来分享经验,不过看大牛们似乎很忙,很少有空分享,我这菜鸟就出来抛砖引玉了。
1. 买的都是专门针对美国的流量,这两边来的流量ip分布都比较广,分析出的结果绝大部分都是美国,这点还满意。

2. 在needhits购买流量时,可以指定只要从美国过来的特定种类人群的流量。当时购买了和自己产品密切相关的分类,可是从它那里过来的流量,一般只访问完首页就走了, 首页的bounce rate达到99.73% ( 正常情况下首页的boun rate为30%左右), 更奇怪的是剩下的那0.27%, 访问路径几乎一致, 都没有查看订购或下载页面. 而且时间的访问分布曲线也非常奇怪,没有一般凌晨访问很少的情况,波动范围不大(如下图)。
image

3. Buyhitscheap过来的流量,首页的bounrate在46.28%,时间部分曲线看着貌似正常(如下图):

image

但有意思的来了,从Buyhitscheap过来的流量,来回就访问三个页面文件,访问路径都特别相似,而且这三个文件都不是下载或购买页面。其中有个是sitemap页面,这在正常的访问中只有1.12%的人会去访问,但在Buyhitscheap过来流量中,居然有25.28%的人访问。

总结:从统计来看,这两处购买的流量都完全没有用,而且很有骗子的嫌疑。

不对之处请大牛们多指正,如有其他可信的流量购买,还请不吝相告。

另:损失了40美刀,简直五内俱焚,心痛莫名,正在努力工作争取早日挣回这40美刀。有谁要请吃烧烤别忘了叫上我,现正需要烤肉来抚慰我受伤的心灵。

最牛犇的移动信号覆盖

半个月前去了趟陕西,西安周围转了转,其中有乾陵的一个陪葬墓:懿德太子墓。 进入墓道前发现墓道口有个卷帘门,仔细一看,上贴一蓝色小条:

 

DSCN2193

DSCN2194

上书:“中国移动通信 网络信号已覆盖本电梯”。(开头想坟墓不是电梯,后来一想把坟墓理解成通向天堂或地狱的“电梯”也不算错。)

就冲这种把信号覆盖到死人“电梯”里的精神劲,联通注定了将是中移动的手下败将!

中移动,I服了U!

100% VS 99.9%

以前开发一个数据挖掘软件的时候遇到一个问题,如果要保证结果的100%准确,需要的计算量和数据量很大,而且规模随采样数据量的增长而线性增长,在一些极端情况下几乎完全不可行。被这个问题困扰了很久,后来在小马提醒下才恍然大悟,其实客户并没有要求100%精确,一定的误差是可以接受的。立刻修改了算法,提供给用户误差率在正负0.1%以下的结果,这样计算量和数据量都减少很多,而且对采样数据量的增长不敏感,在极端情况下也完全能保持在可接受的规模。

记得以前看到过一句话,大意是说:“追求完美往往是通向好的最大敌人”,经过这件事后对这句话有了更深的体会。 很多时候不用去痛苦地追求过分的完美,只要稍微退一小小步,立刻就会觉得海阔天空。

技术带来的震撼感觉

大概是受工程师父亲的影响,从小就对技术的东西特别有兴趣,尤其是一些新的技术,经常能让我惊叹,其中特别杰出的就不只是惊叹了,而是完全震撼的感觉。

最早带来这种震撼感觉的是父亲实验室中的长城0520计算机,看着一条basic语句就打印出了自己的名字,很震撼的感觉:D, 等到第一次看到电脑游戏的时候那就嘴都合不拢了。

堪与第一次震撼相比的就是第一次见到Windows了。当时刚刚开始学计算机,学的还都是dos, Windows听都没听过。一次偶尔用实验室的386的时候,看到了Windows 3.1,当时彻底傻掉了。它带给我们一种完全没听说过的操作计算机的方式。当时感觉Windows 3.1画面特别美,而且这个印象保持了很久,当Win95推出后,很长时间看不惯95的画面。

也是这一次看到了第一个震撼我的游戏:Wolf 3D。 以前在红白机,街机厅看到的都是二维平面的画面,第一次看到3D画面(尽管是伪3D),游戏的感觉有了天翻地覆的变化。

能同样震撼我的游戏,甚至更震撼的,就是diablo了。还记得97年一天晚上下班后,看 到了diablo的片头动画和只有一关的演示版,当时整屋的人都被镇住了。极精美的画面,完美的配乐,完美的气氛,制作水平大大超出了那个时代所有的其他游戏。当时还很难相信bllizard 仅用了256色的画面就实现了这么精美的画面,后来差不多完全明白其中的技术诀窍后,对diablo的程序员真是佩服的五体投地。

第一个给我震撼感觉的开发工具就是Turbo Pascal , 图形化的界面,方便的调试功能,强大的编辑器,超快的编译速度,让刚从fortran过来的我有种从地狱直升天堂的感觉 ( 当时的fortran只能命令行下手工编译,要编译两次,还要链接一次才能生成执行文件,调试只能用print 。编辑时用行编辑器,苦不堪言)。 等到开始用Windows下的Visual C++ 1.0的时候,又经历了一次从地狱直升天堂。

Internet带给我的震撼不是最强的也是最强的之一。96年的时候只是看报纸上提到过Internet, 自己完全不知这是何物, 12月的时候公司里买了个14.4kbps的猫,还记得浏览的第一个网站是yahoo.com。 上了Internet才发现,之前的我象是一个坐井观天的小青蛙,而Internet让我跳了出来看到这真正的世界(当然也可能只是从一个小井跳到了一个大一点的井而已)。

如果再说一个,那就是Google。 开始用google搜索并没有带给我什么震撼,而是当google发布了一些列的服务,慢慢明白了他的蓝图,明白他瞄准的方向时,真的有点震撼了。国内还 老说百度和google竞争,要我说这就是燕雀和鸿鹄的比较,两者的志向差得太大了。google会成为我们世界的主宰么? 我们以后会生活在google建立的Matrix内么?拭目以待吧。

不知道是不是Internet带来的震撼太强,大大提高了震撼阈值,其他就绝少有技术能带来震撼的感觉了。有些小震撼,比如看到Delphi,softice, icq,看到3DS MAX,看到第一个3D加速卡Voodoo, 看到Ultra 64模拟器,看到Zelda 时之笛,看到Linux, 看到Play Station,看到英法海底隧道的挖掘机,等等等,都曾带给我一些惊叹,但和前面这些天翻地覆的震撼则完全不能相比。

震撼越来越少,是这个世界创意枯竭了,还是自己麻木了? 下一个震撼会在哪里呢?

过去的未来

小时候特别喜欢看科幻小说,当时杂七杂八看了不少,但现在有印象的好像就是《小灵通漫游未来》。现在回想起当时科幻小说里的假象,有不少现在已经实现了。

 

1. 一种手表,靠无线信号来校准时钟,永远是准的。 其实cdma手机的时钟,和gps设备上的时钟就有这个意思

2. 图书的缩微胶片查询。记得是《小灵通》里提到的,我在90年代初去专利局查资料的时候就是用的缩微胶片,现在随着电脑,光盘,互联网等技术的发展,缩微胶片早就被淘汰了。

3. 可视电话。 各种im的视频聊天要比可视电话方便多了。

4. 电子报纸。现在我每天早晨第一件事就是去看看新浪的标题新闻,再翻翻google reader

5. 壁挂式的显示屏。 现在满商场的液晶和等离子电视。

6. 比人聪明的电脑。 如果就计算能力和国际象棋而论,电脑已经比人聪明多了,其他方面还差的远,可以说是实现了一小步分。

………………

 

还有更多的没有实现

1. 能住几万人的太空城,照现在的发展速度,估计50年内比较难实现。 现在的航天推进技术是不行的,必须有些革命性的技术出来才有可能。

2. 最让我向往的是一个小说里提到的类似鸟的衣服,外形是个很大的鸟,人可以打开拉链穿上,人就变成了一个自由飞翔的鸟。一直怀疑,是不是所有人在内心深处都有想成为飞鸟,自由飞翔的愿望。

3. 和人几乎一模一样的机器人。 小时候有一个阿童木和机器猫这样的朋友一直是俺的梦想。 日本的机器人已经可以实现双腿直立行走,甚至跳舞,给人端茶递水。离梦想中的目标越来越近了,就是进步的速度比希望的慢了些。

4. 全息电影, 据说已经有一些实验性的全息电影出来了,但离当时想像的差很远。

………………

 

还有些则是当时的科幻小说都没有想到的

1. 互联网, 堪称人类史上最伟大的发明之一

2. 搜索引擎,虽然是互联网的一部分,但它的伟大还是足以单列出来

………………

 

 

说说自己最希望未来发明出来的技术: 物体的运动就是有个出发点和目的地,还有中间的过程。而这个中间过程其实就是注入能量,驱动物体前进。 将来有没有可能,把物体中间移动的时间节省掉,只用给出发地的物体输入一定能量,再指定目的地后,物体就能在目的地突然出现呢?一直感觉距离的远近,其实只是感官感受到的, 很可能现有认知体系中很远的东西,其实没有那么远,甚至就在身边。 我们看到的在走两点间直线的运动,可能在另一个坐标系里是绕了一大圈。

 

 

欢迎大家补充 

俺是如何拦截垃圾邮件的

看这篇文章之前,大家不妨猜猜俺每天收到的垃圾邮件有多少?10? 100? 1000?

统计了大约1个月,得出的结果是:平均每天1700封左右。 如何过滤这些垃圾邮件一度成了自己的头号问题。现在经常要打交道的email服务器有三个,对外公开并真正使用的有21个email地址,这也就不奇怪为什么每天的垃圾邮件那么多。现在的解决方案如下:

  1. 两个email服务器上都只保留一个email帐号, 其他的帐号信件全部转发到一个gmail帐号
  2. 在email服务器端打开SpamAssassin 。4月5号SpamAssassin为一个email地址拦截了 53个垃圾邮件
  3. gmail的拦截能力超强,每天平均拦截垃圾邮件 1500个多。
  4. 在自己的计算机上安装卡巴斯基防火墙,包含病毒email过滤
  5. 在Outlook设定过滤垃圾邮件,级别为低。 4月5号,Outlook为我拦截下80封垃圾邮件, 不过还误认了一个正常email

这么一路过滤下来,在4月5号还是有16封垃圾邮件钻进了收件箱,按比率来算是全部垃圾邮件的1%左右。 4月4号和3号这个数字分别是13和9.  这其中误杀的email肯定有, 自己只能每天能在Outlook的spam文件夹里找找, SpamAssassin和gmail每天过滤下来的垃圾邮件是没精力挨个检查的。如果没能回复大家的email, 那很可能你的email被这层层过滤给误杀了,在这里向大家抱歉。但实在没啥好办法了,如果不想误杀任何邮件,那每天要多搭进去太多时间精力。

大家有什么更好的反垃圾邮件的办法没?