《妙趣横生的博弈论》13.你奖励什么就会得到什么

《妙趣横生的博弈论》读书笔记和读后感。为了迎合选民的需要,有的候选人也会选择一个更为极端的路线,比如极左或者极右,从而赢得一部分特定的选民支持。这种战术通常很有效,比如我们把最极端视为0,把最保守视为100,那么也许你的观点是60,偏于中间路线,但是会把自己伪装成100的样子。也就是说,人们有动机说出自己的真实倾向,但是谈到强度的时候,会有很大的夸大倾向,比如你说我能够承担投资中的损失,确实如此,您能承担10%左右的回撤,但是当调查问卷的时候,你往往会觉得自己能承受至少30%的损失。还有很多人反对权贵主义,但其实他们并不是要绝对的公平,只是希望,自己能成为那个权贵而已。如果你要想赢得竞选,你就要找到中点选民的位置,也就是说,别看大家都咋咋呼呼的,但他们心里并非是那么想的,你要打出这个富裕来,选民们希望你极左,但是你未必一定要那么左,只要略微偏左就可以了,刚好满足选民们的利益,又不会遭遇来自对手选民的阻击。比如农民都希望打土豪分田地,但是你要是也喊出这个口号,无形中就得罪了地主阶层,此时的最佳策略,是保证人人有饭吃,人人有田种,别说什么打土豪的事。当然这种策略只能用于非黑即白的博弈,如果是多维度的偏好,那就没办法了。

在投票中,歪曲个人的真实偏好,是一个非常普遍的现象,比如有些东西是必选项,把他们安排在最后,而先把那些可选项拿出来,这时候先后顺序就有很大的学问,比如你们家的开支,吃饭和租房是必选项,这个先不讨论,还有购物,买书,上补习班, 买玩具,这时候家长先列出买书,上补习班,引导你的偏好,你觉得也该在上面花钱,然后就剩下一点钱了,家长告诉你,这些钱基本只够吃饭和租房了,已经没钱买玩具了。这就歪曲了你的个人偏好。如果按顺序来,你绝对会把买玩具放在买书和上补习班前面。

老齐也多说一句,我们生活中处处都在做这种投票,而投下去的就是一分一秒的时间,你每天的时间是一定的,就24小时,睡觉8小时,上班10小时,这都是你必要的时间,无法更改,留给你的可支配的时间只有5-6个小时,此时你的投票顺序将非常关键,如果你先考虑玩游戏,出去应酬,看电视,那么把剩下的时间,在跟睡觉和上班放在一起划分,你肯定就没时间学习了。因为睡觉和上班足够刚性。相反你先学习看书,然后把剩下的应酬,玩游戏,看电视的份额跟睡觉上班放在一起,这时候你的生活将完全你不同。所以很多人说,我没时间,其实你不是没时间,你是把时间出牌的逻辑搞错了。

下面我们看看激励。作者说,他自己写书最大的痛点就是校正,有些错字,格式,还有标点都需要不断地调整,但是他看了很多遍之后,就基本上审美疲劳了,完全发现不了错误,所以他就得找学生来帮他校正,但是学生又动力不足,所以必须要给他们一定的激励才能解决这个问题。

学生的工作你是看不到的,他给你的错误清单,你也不知道是否穷尽,只有当书出版了之后,才能听到读者的反馈,但那个时候已经晚了。所以学生有偷懒的动机,他有可能只是把文稿拿走,几天后告诉你已经校对完了。所以肯定不能支付固定的报酬,那么有人说了,这很简单,按照找到的错误发钱就行了?但这个方法,可能没人愿意接受这个工作,学生们也害怕,你这是一个接近完美的文稿,他废了很多力气,结果却赚不到什么钱。所以这是一个信息不对称的问题。作者处于信息不利的一方。就跟二手车的买车人差不多。

解决方法其实也很简单,就是让双方的后顾之忧全都解决,作者害怕学生出工不出力,所以就必须要设计绩效,找出一个错误给一份钱,而学生怕文稿已经接近完美,所以你就必须得给他一个固定保证。所以最后的方法就是,固定工资加上绩效考核,这样才能给学生更多的激励。比如他当时就做了一个设计,1美元一页书,这是固定工资,然后外加一个错误1美元。最后他的学生帮他把一本600页的书,挑处来274个错误,一共获得874美元。

但是这个设计作者也并不满意,因为结果仍然不佳,这个学生还漏掉了30个错误没找出来,如果再设计一个反向惩罚机制就更好了。比如漏过一个错误扣掉2美元。这样的话,学生会更加认真一些。

激励总体的原则就是,你奖励什么就会得到什么,有的时候,并非那么表面,比如上市公司财务造假,结果他因此获利好几十个亿,但就罚了30万,这就相当于一个巨大的奖励,那以后谁不造假谁就是傻子。像上面那个例子,挑出的错误越多,奖励越高,这就是线性奖励,也有非线性奖励,比如设计一个基本工作量,超出工作量之后,就给奖金,超过越多,奖金越高。比如销售工作,每月100万销售任务,完成了才有基本工资,超过100万开始有奖金,超过200万,奖励翻倍。所以销售通常都跟打了鸡血一样,因为他一偷懒,就会错过很多钱。

如果你的激励方案,设定的太高,或者根本完不成,那就不具备激励的效果。比如一个刚过一本线的考生,让他考清华才给他奖学金,那这哥们一定觉得,这政策跟他完全不挨边。但你要说,上个211和985就给你奖学金,那么他还有的拼。

一个激励一定包括两个方面,一方面是胡萝卜,一方面是大棒,奖惩分明才能调动大家的积极性,就像上面那个学生校对书稿的例子,只给胡萝卜,没有大棒,虽然解决了信息不对称的问题,但是最后结果也不能让人感到满意。之前华尔街的激励机制就存在严重的问题,投资激进,赚了很多钱,公司CEO就能获得巨额的奖金,而业绩一般,他们也没什么损失,巨额收入照拿不误,只是稍微少了一点。如果捅了大篓子,造成了金融危机,则拍拍屁股走人,这就是一个完全胡萝卜式的激励方式,就会促使华尔街越来越激进,也会给国家带来越来越多的风险。

现在公司运用更多的是多维激励,也就是说不光是有固定工资还有奖金和处罚,有的还会给员工更多的远期期权和股票激励。也会用晋升空间吊着你。总之一个好企业的激励机制,就是让你看到前方永远有光。这道光还能照亮你脚下的路。而差企业,会让你眼前一片漆黑,对未来完全失去信心,比如老齐原来在电视台,几乎就眼前看不到路了,没有晋升空间,也没有涨薪渠道,如果我不离开,干到死可能也就是个记者。所以这就会让人感到绝望。最后就形成优胜劣汰,优秀的人全都离开了电视台。

老齐多说一句,激励的原则也要用在自己身上,同样是胡萝卜加大棒,当你完成自己设定的任务计划之后,一定要给自己一个奖励,否则你就会对努力感到不敏感。就像你玩游戏为什么那么上瘾,说白了就是看到了技能值和经验值的提升,体验到了及时反馈,而生活中你为什么不上瘾,就是因为没有及时反馈的效果,那么我们要激励自己,就要创造及时反馈系统。别人不配合你,你自己也要配合自己。比如当你存够10万元了,可以奖励自己一个2000元的礼物,任性消费一把。或者自己一年看够了50本书,奖励自己一次说走就走的旅游。总之一定要反馈。同时也要惩罚,没完成任务的时候,要缩减自己的必要开支。比如这周忙的没时间读书了,那周末就罚自己把功课补上,而不出去打球。其实自己骗自己也挺有意思的。而且你还会得到一个非常不错的结果。这都是老齐的亲身经验,如果你照着做了,并且形成习惯和信仰,那么10年后,必然有着完全不一样的人生。改不改变,就在你的一念之间。还是那句话,为什么很多人吃得了生活的苦,却吃不了学习努力的苦,因为学习努力,你得主动去尝试,主动去改变,而生活的苦,你躺在原地,他就自己来找你了。世界上有个苦难守恒定律,人的一生,吃的苦几乎是守恒的,你不在这里吃苦,就一定会在别的地方吃苦。所以老齐,愿意把苦都吃在工作和学习上。明天我们继续讲激励的话题,并结束这本书。(文章转自老齐的读书圈)

妙趣横生的博弈论读书笔记

赞(2)
未经允许不得转载:读书笔记 » 《妙趣横生的博弈论》13.你奖励什么就会得到什么

评论 抢沙发

评论前必须登录!