闲论统计专业
刘以栋-2764 11/26 79144.5/2
闲论统计专业
刘以栋
统计知识在我们生活中应用很广,但在我们探讨统计知识应用以前,先看一下大家对统计应用的误解。
调侃统计结果,莫过于马克-土温的名言:谎言有三种,谎言,恶意谎言和统计结果(Lies, Damned Lies, and Statistics)。
我个人更喜欢对统计结果的另一个调侃,统计就像比基尼,露出来的部分是引人注目的,但盖住的部分确是至关重要的(Statistics are like bikinis. What they reveal is suggestive, but what they conceal is vital)。如果你对统计结果有足够的了解,你就会体验这个调侃的意味。
做数学的人一般认为统计是数学的一个分支。他们的观点是,统计就是概率论,概率论就是测度论,测度论就是实分析。实分析当然都是数学。这种观点虽然牵强,但也说明统计的理论基础是数学。
现代社会里统计学已经得到长足发展。以前大学里数学和统计经常是一个系,叫数学统计系,现在统计一般都已经独立出来,叫统计系,在文理学院里。有的大学还有生物统计系,在医科领域。
统计学在我们生活中应用很广,但我们往往没有注意。
如果有人问你从旧金山到洛杉矶有多远,那么你会说400海里还是六小时车程?大部分人会说,六小时车程,而这是统计概念,因为各人开车速度不一样,路上时间也就不一样。路上是否有交通堵塞不知道,所以车程跟你什么时候开也不一样。如果你夜里开车,说不定五个小时就到了。统计数据吗,你就不能太较真,要不怎么像比基尼呢?
我们去医院去做常规检查,而那些指标的正常值范围也是统计结果。血糖一百以下正常,一百零一就高了,很严重吗?医生会告诉你没有关系,注意观察就好了,因为那指标也就是个统计数据,并非严格的对错标准。如果是录取分数线,你就不能这样轻松对待了。
现在我们看看统计专业毕业生在未来工作中的出路。
统计知识应用很广的领域是保险精算行业。保险里面又可以分为人寿保险,医疗保险和财产保险等。我们买保险时,都需要付保费。而这保费数目的计算,就是精算师们通过统计方法计算出来的。你买保险时,你的年龄,性别,婚否,是否有小孩,过去驾驶纪录,个人信用记录,家庭住址等信息,都会被用来计算汽车保险保费。
保险以外,统计知识在医药卫生行业应用也很广泛。一个新药在政府审批过程中,要通过严格的统计验证。不能把麦糠拿来做东瀛大古丸卖。是否有药效要通过统计数据验证。
一个人生病以后,应该通过哪种途径治疗,应该根据严格的统计数据做判断,而非网上的八卦文章。一个好的医生,应该根据各人的情况,对医疗方案做出调整。根据这一点,医生不会被计算机所取代,因为医疗里面有许多模糊领域,人可以承担医疗方案后果,计算机则不能。
保险和医药卫生行业以外,统计知识现在在银行领域应用也很广。当我们去银行申请信用卡时,信用卡审批基本是通过计算机程序完成。这计算机程序是通过统计计算设计出来的。计算机程序要根据一个人的信用记录,确定他的破产概率,破产可能带来的经济损失和信用卡额度等。当你的信用卡申请被批准以后,计算机程序要跟踪你的信用情况,确定是否降低或者取消你的信用卡。
除了传统行业的统计应用以外,现在大数据和针对性销售也需要统计知识。现在很多应用软件收集到许多信息。怎样把这些信息合理利用起来,针对用户的个人习惯做相应的广告,就具有现实意义。
统计的应用非常广,但做统计的人必须喜欢跟数据打交道。现在有人把做统计的人简称为矿工(Data Mining),也说明统计人员必须做很多数据分析。
以前一位统计教授说,数据对统计人员来说,就像工资对于工人一样。越多越好,永远不嫌多(Data to statistians like salaries to workers, the more the better, never enough)。
统计学虽然是一个严肃的学科,但其操作空间很大,所以才会跟谎言并列。公说公有理,婆说婆有理,就是一个统计样本选择的概念。
假定白人警察打死一黑人小孩。如果陪审团都是白人,结论可能就是打死活该,那孩子有暴力倾向;如果陪审图都是黑人,结论可能是种族歧视。
现代统计是建立在严格的理论体系基础上的,所以不要把大学里的统计知识和古典统计问题划等号。一个统计学博士,未必就可以把奥数里的摸球问题做对。
统计概念是我们日常生活中的一部分,所以可能的话,最好掌握一些统计基本知识。如果以后有兴趣做财经方面的工作的话,那么统计知识会有利于理解统计报表和数据。
不管你是否喜欢做统计方面工作,对它的原理有所了解总是没有坏处。