《妙趣横生的博弈论》13.你奖励什么就会得到什么|读书笔记

《妙趣横生的博弈论》读书笔记和读后感。为了迎合选民的需要，有的候选人也会选择一个更为极端的路线，比如极左或者极右，从而赢得一部分特定的选民支持。这种战术通常很有效，比如我们把最极端视为0，把最保守视为100，那么也许你的观点是60，偏于中间路线，但是会把自己伪装成100的样子。也就是说，人们有动机说出自己的真实倾向，但是谈到强度的时候，会有很大的夸大倾向，比如你说我能够承担投资中的损失，确实如此，您能承担10%左右的回撤，但是当调查问卷的时候，你往往会觉得自己能承受至少30%的损失。还有很多人反对权贵主义，但其实他们并不是要绝对的公平，只是希望，自己能成为那个权贵而已。如果你要想赢得竞选，你就要找到中点选民的位置，也就是说，别看大家都咋咋呼呼的，但他们心里并非是那么想的，你要打出这个富裕来，选民们希望你极左，但是你未必一定要那么左，只要略微偏左就可以了，刚好满足选民们的利益，又不会遭遇来自对手选民的阻击。比如农民都希望打土豪分田地，但是你要是也喊出这个口号，无形中就得罪了地主阶层，此时的最佳策略，是保证人人有饭吃，人人有田种，别说什么打土豪的事。当然这种策略只能用于非黑即白的博弈，如果是多维度的偏好，那就没办法了。

在投票中，歪曲个人的真实偏好，是一个非常普遍的现象，比如有些东西是必选项，把他们安排在最后，而先把那些可选项拿出来，这时候先后顺序就有很大的学问，比如你们家的开支，吃饭和租房是必选项，这个先不讨论，还有购物，买书，上补习班，买玩具，这时候家长先列出买书，上补习班，引导你的偏好，你觉得也该在上面花钱，然后就剩下一点钱了，家长告诉你，这些钱基本只够吃饭和租房了，已经没钱买玩具了。这就歪曲了你的个人偏好。如果按顺序来，你绝对会把买玩具放在买书和上补习班前面。

老齐也多说一句，我们生活中处处都在做这种投票，而投下去的就是一分一秒的时间，你每天的时间是一定的，就24小时，睡觉8小时，上班10小时，这都是你必要的时间，无法更改，留给你的可支配的时间只有5-6个小时，此时你的投票顺序将非常关键，如果你先考虑玩游戏，出去应酬，看电视，那么把剩下的时间，在跟睡觉和上班放在一起划分，你肯定就没时间学习了。因为睡觉和上班足够刚性。相反你先学习看书，然后把剩下的应酬，玩游戏，看电视的份额跟睡觉上班放在一起，这时候你的生活将完全你不同。所以很多人说，我没时间，其实你不是没时间，你是把时间出牌的逻辑搞错了。

下面我们看看激励。作者说，他自己写书最大的痛点就是校正，有些错字，格式，还有标点都需要不断地调整，但是他看了很多遍之后，就基本上审美疲劳了，完全发现不了错误，所以他就得找学生来帮他校正，但是学生又动力不足，所以必须要给他们一定的激励才能解决这个问题。

学生的工作你是看不到的，他给你的错误清单，你也不知道是否穷尽，只有当书出版了之后，才能听到读者的反馈，但那个时候已经晚了。所以学生有偷懒的动机，他有可能只是把文稿拿走，几天后告诉你已经校对完了。所以肯定不能支付固定的报酬，那么有人说了，这很简单，按照找到的错误发钱就行了？但这个方法，可能没人愿意接受这个工作，学生们也害怕，你这是一个接近完美的文稿，他废了很多力气，结果却赚不到什么钱。所以这是一个信息不对称的问题。作者处于信息不利的一方。就跟二手车的买车人差不多。

解决方法其实也很简单，就是让双方的后顾之忧全都解决，作者害怕学生出工不出力，所以就必须要设计绩效，找出一个错误给一份钱，而学生怕文稿已经接近完美，所以你就必须得给他一个固定保证。所以最后的方法就是，固定工资加上绩效考核，这样才能给学生更多的激励。比如他当时就做了一个设计，1美元一页书，这是固定工资，然后外加一个错误1美元。最后他的学生帮他把一本600页的书，挑处来274个错误，一共获得874美元。

但是这个设计作者也并不满意，因为结果仍然不佳，这个学生还漏掉了30个错误没找出来，如果再设计一个反向惩罚机制就更好了。比如漏过一个错误扣掉2美元。这样的话，学生会更加认真一些。

激励总体的原则就是，你奖励什么就会得到什么，有的时候，并非那么表面，比如上市公司财务造假，结果他因此获利好几十个亿，但就罚了30万，这就相当于一个巨大的奖励，那以后谁不造假谁就是傻子。像上面那个例子，挑出的错误越多，奖励越高，这就是线性奖励，也有非线性奖励，比如设计一个基本工作量，超出工作量之后，就给奖金，超过越多，奖金越高。比如销售工作，每月100万销售任务，完成了才有基本工资，超过100万开始有奖金，超过200万，奖励翻倍。所以销售通常都跟打了鸡血一样，因为他一偷懒，就会错过很多钱。

如果你的激励方案，设定的太高，或者根本完不成，那就不具备激励的效果。比如一个刚过一本线的考生，让他考清华才给他奖学金，那这哥们一定觉得，这政策跟他完全不挨边。但你要说，上个211和985就给你奖学金，那么他还有的拼。

一个激励一定包括两个方面，一方面是胡萝卜，一方面是大棒，奖惩分明才能调动大家的积极性，就像上面那个学生校对书稿的例子，只给胡萝卜，没有大棒，虽然解决了信息不对称的问题，但是最后结果也不能让人感到满意。之前华尔街的激励机制就存在严重的问题，投资激进，赚了很多钱，公司CEO就能获得巨额的奖金，而业绩一般，他们也没什么损失，巨额收入照拿不误，只是稍微少了一点。如果捅了大篓子，造成了金融危机，则拍拍屁股走人，这就是一个完全胡萝卜式的激励方式，就会促使华尔街越来越激进，也会给国家带来越来越多的风险。

现在公司运用更多的是多维激励，也就是说不光是有固定工资还有奖金和处罚，有的还会给员工更多的远期期权和股票激励。也会用晋升空间吊着你。总之一个好企业的激励机制，就是让你看到前方永远有光。这道光还能照亮你脚下的路。而差企业，会让你眼前一片漆黑，对未来完全失去信心，比如老齐原来在电视台，几乎就眼前看不到路了，没有晋升空间，也没有涨薪渠道，如果我不离开，干到死可能也就是个记者。所以这就会让人感到绝望。最后就形成优胜劣汰，优秀的人全都离开了电视台。

老齐多说一句，激励的原则也要用在自己身上，同样是胡萝卜加大棒，当你完成自己设定的任务计划之后，一定要给自己一个奖励，否则你就会对努力感到不敏感。就像你玩游戏为什么那么上瘾，说白了就是看到了技能值和经验值的提升，体验到了及时反馈，而生活中你为什么不上瘾，就是因为没有及时反馈的效果，那么我们要激励自己，就要创造及时反馈系统。别人不配合你，你自己也要配合自己。比如当你存够10万元了，可以奖励自己一个2000元的礼物，任性消费一把。或者自己一年看够了50本书，奖励自己一次说走就走的旅游。总之一定要反馈。同时也要惩罚，没完成任务的时候，要缩减自己的必要开支。比如这周忙的没时间读书了，那周末就罚自己把功课补上，而不出去打球。其实自己骗自己也挺有意思的。而且你还会得到一个非常不错的结果。这都是老齐的亲身经验，如果你照着做了，并且形成习惯和信仰，那么10年后，必然有着完全不一样的人生。改不改变，就在你的一念之间。还是那句话，为什么很多人吃得了生活的苦，却吃不了学习努力的苦，因为学习努力，你得主动去尝试，主动去改变，而生活的苦，你躺在原地，他就自己来找你了。世界上有个苦难守恒定律，人的一生，吃的苦几乎是守恒的，你不在这里吃苦，就一定会在别的地方吃苦。所以老齐，愿意把苦都吃在工作和学习上。明天我们继续讲激励的话题，并结束这本书。（文章转自老齐的读书圈）

妙趣横生的博弈论读书笔记

《妙趣横生的博弈论》13.你奖励什么就会得到什么

猜你喜欢

评论抢沙发

评论前必须登录！