以前开发一个数据挖掘软件的时候遇到一个问题,如果要保证结果的100%准确,需要的计算量和数据量很大,而且规模随采样数据量的增长而线性增长,在一些极端情况下几乎完全不可行。被这个问题困扰了很久,后来在小马提醒下才恍然大悟,其实客户并没有要求100%精确,一定的误差是可以接受的。立刻修改了算法,提供给用户误差率在正负0.1%以下的结果,这样计算量和数据量都减少很多,而且对采样数据量的增长不敏感,在极端情况下也完全能保持在可接受的规模。
记得以前看到过一句话,大意是说:“追求完美往往是通向好的最大敌人”,经过这件事后对这句话有了更深的体会。 很多时候不用去痛苦地追求过分的完美,只要稍微退一小小步,立刻就会觉得海阔天空。
看到标题肯定以为老僧在和那0.1%较上劲了.并力书0.1%的重要性和解决之所具有的重大意义.呵呵.
深刻阿
技术人员的通病就是追求完美,认死理。 俺继续反省中…. :em27: