《平均的终结》

读书笔记思维

创建时间:2017-06-29 21:44

阅读:

一、平均主义的由来
二、平均主义与个性原则
三、个性化的意义

花了两天的闲暇时间草草翻了这本书，没有太多的收获。按照个人的理解，本书主要讲了三个方面：

一、平均主义的由来

随机:自然界的事物多是随机的，利用统计信息可以提取一些规律信息，这也是统计学习方法的基本出发点;
简化:如何区分两个人？可以通过鼻子、嘴巴、身高、体重、肤色、眼神、头发长度、音调等等，但何必记住这些琐碎的细节？如果通过身高就可以区分，这就大大简化了分析的模型；
遍历性假设：随机信号理论中有这么一个问题：如何测试一个学生对一张数学试卷的解答能力？可以让他考试，但由于蒙对、读错题等误差因素，并不能反映出他的真实水平，理想的情况是让这个学生重复N次做该试卷，然后取平均值。但这也带来一个困难学生每次做试卷的能力是有变化的，他自身有学习能力。因此就取了一种折中的方式——取N个学生做该试卷，并取平均值，这也是估计试卷难度的一种方式。就像一个随机过程的分布，每一个时间点只有一种可能，我们不可能让同一时刻所有可能性都出现，因此假定遍历性，即利用时间换取空间的近似思想。
借助群体的平均值预测个体，有两个条件：
（1）群体中每一个个体都是相同的；
（2）群体中的所有个体都将保持不变。
如果不满足这两个条件，利用群体的平均值预测个体是不合理的。例如用成绩来衡量一个学生的学习能力，甚至综合能力。

二、平均主义与个性原则

1）个人观点

个人觉得作者关于 <平均与个性> 没有说到要点。作者提到的例子：平均数值进行飞行座椅设计、利用平均身材评价整体特性、利用平均主义设计管理行为、利用成绩评价学生、根据学历与成绩等招聘工作人员……这些与其说是平均主义与个性的差别，不如说是在这两点上有区别：1）feature的选择；2）与label的相关程度。本质就是决策树理论。 这就好像信号的时域分析与时频分析，每一个频段都可以理解成一个小时间片的特征组合，这样一来我们得到的不再是不同时刻（个体）的单一feature（幅度），而是不同时刻（个体）的多维feature（该时刻的多个频点），拿不同的label分析，这个时候的分类器就会更好。所以我认为作者说的就是决策树理论，决策树理论需要掌握：1）找出最影响分类的特征；2）利用多维特征。例如：飞行座椅设计，既考虑了每一个飞行员的特征，又考虑整体的样本，这就给特征增加了维度，而座椅是最影响人舒适感的特征，因此它被设计成自动调整，如今汽车座椅、自行车座椅、办公室座椅等，已经都体现了这一点。

2）发展与稳定

例如：如果是精英阶层推动了社会的发展，那么教育资源是该被拿来集中培养少数的精英、还是培养一大批的普通人？如果让那些被教育的精英去影响大众，效果是不是会更好，因为教育大众的结果是大众仍然是普通人。也就是说，一种观点可以这样被表达：挑选出优秀的学生并全力支持他们，比为所有学生提供同等的教育机会更重要。之前江苏高考的录取名额减少，很多家长去教育厅抗议，毕竟这是对既得利益者的一种剥削。这一部分打算多说几句，先介绍几个概念：

1.马太效应：“一个国王远行前，交给三个仆人每人一锭银子，吩咐道：“你们去做生意，等我回来时，再来见我。”国王回来时，第一个仆人说：“主人，你交给我的一锭银子，我已赚了10锭。”于是，国王奖励他10座城邑。第二个仆人报告：“主人，你给我的一锭银子，我已赚了5锭。”于是，国王奖励他5座城邑。第三仆人报告说：“主人，你给我的1锭银子，我一直包在手帕里，怕丢失，一直没有拿出来。”于是，国王命令将第三个仆人的1锭银子赏给第一个仆人，说：“凡是少的，就连他所有的，也要夺过来。凡是多的，还要给他，叫他多多益善.”

2.二八法则： 二八法则又称幂律分布 (Power Law Distribution) 或帕累托分布 (Paretian Distribution). 帕累托分布和高斯分布 (Gaussian Distribution) 并列为两大主导自然和人类现象的概率分布。高斯分布的本质是独立性 (independence). 大量同质独立事件将导致高斯分布 (由大数定律保证).帕累托分布的本质是正反馈机制 (positive feedback loop). 当事件不再独立 (a. 事件之间通信成本降低; b. 事件之间的作用力增强 )，一个事件的产生对自身和其它同质事件的产生发生影响时，会导致帕累托分布.

一本书的80%知识只需花费20%的时间，而剩下的20%可能要花费80%的时间。除非你用80/20原则仔细观察过你企业的不同层面并重新制定你的战略，否则你几乎不可避免地要为太多人浪费太多精力。“这个原则对确定您的事业发展方向具有极大价值。”

再说一个小例子：“如果一块地区有两个卖冷饮的人，公平起见，地域一分为二，甲乙两人一人一片区域，这个时候作为甲，通常希望去向中间靠拢，以便得到更多的客户，而乙也是如此，最后就是两人靠到了一起。而由于这个地方有两家商店，人们更希望去这个地方，人流量大吸引了更多的居民以及商场。”这又是一个具有最优策略的博弈问题，对于群众而言买东西需要走的更远，可以说靠在一起对民众是不理想的。 以上这些例子都想说明自己的一个观点：差距/不均衡推动发展，而平等/均衡有利于维持稳定。

总结本段就是两个观点：

分析问题借助决策树模型。找出与目标函数的最优特征（例如：成绩显然不能反应一个人的特性，学校/单位依次评估个人，但如果目标函数是成为某方面的专家或者打破牛顿第一定律的探路者，就不会过多追求这个无聊的参数，更不至于为此殚精竭虑。），并尽可能多增加特征维度（不同角度、层面认识问题），有利于对问题的具体把握；
差距/不均衡推动发展，而平等/均衡有利于维持稳定，二者互为阴阳。

三、个性化的意义

环境适应个体，而不是环境适应平均准则。例如用人单位招聘人才，如果从平均准则出发就是根据学历、成绩、专业招聘人才，但这对想获得最优秀人才的最优秀企业，是不够的；如果从个体原则出发，现在MOOC也提供了资格认证，单位可以招聘某些课程得到资格认证、某些专业技能竞赛获奖、某些大公司专业技术部门的离职人员、某些产品的开发者，这些特征与职位需求（label）相关度更高。

反过来，最佳员工、优秀毕业生、模范丈夫等等都不过是噱头。个人有一个观点：最浪费钱的地方，可能不是觉得自己花了不该花的钱，恰恰是觉得自己花了该花的钱。观念上的盲点更为致命。如果仅仅是被外界的观念牵着走，是不是也会忽略自身的一些闪光点呢？甚至它一度不受人待见。而一个人的成长，从怀疑他固有的观念开始。