凯利指数的来龙去脉

2019-03-25

    随着凯利指数的受关注程度的提高,因为Dr. Kelly "A New Interpretation of Information Rate"(1956.3)里面,通篇举的例子是赌徒如何处理资金的分配,胜率和赔率之间 的协调,以达到最优的成功率(收益率?通过率?)的问题,在我们国家,?堵之!所以一般也很难找到这篇论文的翻译及相关资料,所以不少的人在深受其苦啊。不过,今天,如果有幸看到了蛇眼的这篇贴子,那么,保证你以后不会为此痛苦了.你的痛苦少一点,就是蛇眼的快乐多一点哈(虚伪吧?)

    其实,Dr. Kelly举赌徒的例子,只是因为这样的例子比较适于去说明他的意思,他是AT&T(贝尔实验室)的工程师,可不像Mr. Roxy一样的赌界大佬.

    凯利指数的来龙

    背景:

    在数据交换领域,Dr.Shanon发现了这样一个情况:在受噪声影响的数据传输路径,传输的速率有一个最优值。就是你追求速度有一个极限,超过了这个极限,数据接收的正确性将得不到保证(你给朋友发了一张小猫的图片,快是快,可那边收到的成了一只小狗,那这样的快就没什么意义了)

    于是,Dr. Kelly认为,这其实是一个酒瓶子,可以装二锅头,也可以装五粮液,你有兴趣装XO,当然也没有关系.因为DU(gamble)的胜率是一个随机值,你可以说你的正确率是80%,但你不能说这一次你的正确率是100%,如果你每次将所有的资金投入以追求复利,那么十次以后你还没有输光的概率就只有10.7%.所以,你会将手头的资金分散,那么,如何根据你的胜率和赔率合适的分配资金,以保证有一个最佳的收益率呢(在赔率固定为2的项目中,那么你必须要保证你的正确率在50%以上,因为50%的胜率,你可以用来玩的资金最理性的情况是占到你全部可以玩的资金的0%,也就是说,还是别玩了,澳盘抽水的学问也在这里)这个收益率后来被命名为凯利值(G).

    ,喝点二锅头:比如公司要你在三天内赶100头牛到客户那里,同时你要保证一头都不能少.那这里就存在着一个最优的凯利值问题了.你可以选择一头一头赶,牛不会丢,但时间来不及;你也可以选择一下子赶一百头牛,时间是来得及,可是你一下子照看不了那么多牛啊.所以,在时间,牛的数量和你照看牛的能力这三者之间会有一个最佳的数量关系,这个数量关系可以保证最大的凯利值G,也就是PASS的机会最大.

我们注意,Dr.KellyG来命名凯利值,我不知道为什么,但估计是gamble的第一个字母了.风险就像数据交换中的噪声一样,可以去估计它但你    没办法完全去消除它,收益也像数据交换中的传输量,一秒钟你可以选择10k,也可以选择 10M ,你选得越多,总是越容易完蛋。最糟糕的情况是你连噪声估计都不会就去选择 10M 100M 了。买料的都是这种情况,你知道每次料的大概胜率吗?按照凯利值,最好的情况也就是你的料钱=赔率*你最佳的投注额,白忙活。


 
   扭曲的凯利指数:

    足彩分析当中,凯利指数很红火,但我告诉你,这种分析方法是被扭曲了,照流行的理论分析,那是在做白日梦,你千万别生气,也千万别感到被浇了一头冷水不想看下去了。因为,在你不知道怎么回事之前,就想着去用它,是很危险的,而当你知道怎么回事了,再去发挥它,或许会有无穷的乐趣等着你哈!

    凯利指数的计算方法:

    G3=S*S',G1=B*B',G0=F*F';(S:胜赔,B:平赔,F:负赔,S'欧平均胜率,B'欧平均平率,F'欧平均负率)

什么?对于一家特定的公司,它的主胜的凯利指数G3=S*S'!你选择的公司样本不同,G值就不同,样本大小不同,G值也不同(一般的欧均值都取99家公司,从统计学的意义上来讲,还称不上样本!)这个G带有随意性,大个0.05小个0.08之类的,也只能算做误差,现在要我比较G0.89哪个大?我大你个0.05怎么了?我小你个0.08又有什么干系??

    一不留神又扯远了(脸红了一下),继续刚才的公式。

    既然涉及到平均胜率,那么看一下胜率是怎么求出来的:平均主胜率S'=(S1'+S2'+….Sn')/nS1'是第一家公司的主胜率,S2'是第二家公司的主胜率,以此类推。主胜率S'=r/S(r:赔付率)。赔付率(返还率)又是这样求的:r=1/(1/S+1/B+1/F),什么??又做梦了!!返还率是庄家也要到裁判终场哨响才知道的,这样也行??AC米兰踢亚特兰大,哨响了,投注比固定了,但踢出3,这场返还率可能是150%,踢出1可能是20%,踢出0,可能是5%,结果不同,返还率也不同啊!这里也可以看到,博彩公司不喜欢操控比赛,因为他想操控的只能是这种强弱分明的比赛,但强队踢假球的成本更高,它想操控也操控不了,最好的选择就是烧烧香:天哪,爆个冷吧!

    做下算术了:

(1)SSP 2.22 3.15 3.01

(2)立博: 2.10 3.25 3.00

(3)威廉: 2.20 3.10 2.87

(4)易胜博:2.25 3.10 2.95

    我们假设就取这四家公司为某场比赛开出的赔率来计算凯利值

S1=2.22 B1=3.15 F1=3.01

S2=2.10 B2=3.25 F2=3.00

S3=2.20 B3=3.10 F3=2.87

S4=2.25 B14=3.10 F4=2.95

1/r1=1/S1+1/B1+1/F1=1/2.22+1/3.15+1/3.01 => r1=0.91

1/r2=1/S2+1/B2+1/F2=1/2.10+1/3.25+1/3.00 => r2=0.90

1/r3=1/S3+1/B3+1/F3=1/2.20+1/3.10+1/2.87 => r3=0.89

1/r4=1/S4+1/B4+1/F4=1/2.25+1/3.10+1/2.95 => r4=0.90

S1'=1/(S1*r1)=1/(2.22*0.91)=41

    类似的计算后,于是:

S1'=41 B1'=29 F1'=30;

S2'=43 B2'=28 F2'=30

S3'=40 B3'=29 F3'=31

S4'=40 B4'=29 F4'=31

(注意:3,4两家公司,赔率不同,但它们的胜,平,负率相同了)

好:S'=(S1'+S2'+S3'+S4')/4=(41+43+40+40)/4=41

B'=(B1'+B2'+B3'+B4')/4=(29+28+29+29)/4=28.75

F'=(F1'+F2'+F3'+F4')/4=(30+30+31+31)/4=30.5

于是:

G31=S1*S'=2.22*41=91.02

G11=B1*B'=3.15*28.75=90.56

G01=F1*F'=3.01*30.5=91.8

    当然其它几家公司的凯利值也可以通过同样的方法求得,当然,事实上你不用去求(每场比赛这样求,不累死也气死了),赔率比较网站上都是这样算的。好,到这里你应该可以知道了,凯利指数是怎么样被扭曲的了,因为除了赔率是真的,其它的都是做梦的时候梦到的(并非是攻击凯利指数,这个,前文和接下来的一比较就可以发现了)。

真实的凯利指数

    假如,我坐庄了,好,要开赔率了,怎么开?

    当然,最好我知道到封盘时投注额X,投注比是:30% 30% 40%

    而且我也不贪,只要10%的抽水(返还率90%

    那简单:S*30%=90%,B*30%=90%,F*40%=90%

    于是,我的赔率就是:3.00 3.00 2.25

    比赛,踢成3:我的收益:-0.3X*3X+X=0.1X;踢成1,收益:-0.3X*3+X=0.1X;踢成0,收益:-0.4X*2.25+X=0.1X

    也就是说,如果我知道实际的投注比,不管踢成什么结果,我总可以开出一个固定收益率的赔率,除非比赛取消了,那水钱没了。

    但实际上,我只是可以估计大致的投注比,但,我不能穿过时空提前知道最终的投注额和投注比。于是,我开始害怕了。如果,我估计的投注比是:30% 30% 40%

而实际的投注比是:80% 10% 10%,并且比赛打出了3 ,那我的收益有多少呢?

-0.8X*3+X=-1.4X(这时我希望投注额越小越好,因为,稍微大一点点,我就破产了,哦,要去卖血了!)这里可以看到,选择投注额大的大公司长期跟踪,是有道理的。

    于是,大家看到了,投注是一个随机值,或者说是个估算值的话,赛果对收益的影响体现出来了!

    那么,真实的凯利指数是怎么一回事呢?G=K(i)*f(odd3,odd1,odd0)

    事情就变成确定S,B,F三个常数(开出赔率),使得K(i)这个函数的取值最大,这时,G就会得到一个最大值,也就是说通过率最高!

    直接影响K(i)的参数:赛果,投注情况。

    于是,博彩公司的主要工作也很明确了:预测赛果,预测投注情况;把握赛果,影响投注。

    赔率一半取决于赛果,一半取决于大资金的流向,就是说这个意思吧!这里凯利指数这个酒瓶装的是XO,但跟赶牛那个装二锅头的酒瓶,实际上也没有多少区别。

    凯利指数无处不在,我们买彩也悄然使用。大单提高了胜率,但降低了赔率,可以承受失败的次数减少;小单降低了胜率,但提高了赔率,可以承受失败的次数也增多。如何在特定的期次里确定单的大小?其实你就是在寻找一个最大凯利值的影响参数之间的关系。

    凯利指数的去脉

    好了,大家明白了,在足彩分析中的凯利指数,跟博彩公司在玩的凯利指数实际上没有多少关联(是指算术上,如果你根据不同的比赛去修正它,去估算它,另当别论)。

    前面的计算大家看到,除了赔率和一些算术转换,其它的什么也没看到。也就是说,不管自我感觉多么好,实际上你还是在作赔率分析的一部分劳动。这种劳动本质上就是计算一个滤除理论赔付率影响的平均赔率,并比较其中的分歧以寻找异常。这种现象在股市里非常普遍,你研究MACD也好,研究KDJ也好,自创了什么张三李四指数也好,说到底还是在研究一定时间内成交量和成交价格。你跟一个研究MACD的人去说MACD没用,小心被踢死!而你不知道怎样去分析成交量和成交价格之前,你也总是喜欢研究这样那样的技术指标。怪事就在于当你研究透了成交量和成交价格之后,你又会去选择这样那样的技术指标来帮助分析!更怪的是你什么都研究透了你会发现这些东西并不能保证你赢多输少!你可以去估计风险,但你不能去消除它!并且,你所依据的技术分析参数,都基于你或许发现,或许并未发现的概率。并且最终的结果也会受到偶然因素的影响。凯利值是一个受概率影响的不定值,你希望你所作的努力使G无限接近于1,但是梦里你也可以这样想,穿越时空,把明天的报纸拿过来今天模拟,这样你就做到G=1了。

    这个被扭曲的凯利值得到了大家的认可,并在足彩分析的运用中取得了成果。大家不要误会,以为可以借助直观的数据去还原赛果,其实还是需要背后的劳动,需要长期的跟踪,更需要结合各种情况的综合判断,但如果不明白是怎么回事,那怎么用?赔率分析可以有很多种方法,但赔率里面的两点信息(赛果,受注情况)如何去还原,这需要赔率分析之内功夫,也需要赔率分析之外的功夫,并不是绝对的,你可以怀疑,也可以排斥,当然,最好试着玩玩,“a little art and a little science”

    真实的凯利值也能带给我们一些足彩分析上的启示。比如周未晚上有两场强弱分明的赛事,胜赔都在1.30以上,所有你能看到的资讯都一片叫好,那么你就可以想象至少有一场会出问题。因为这样的比赛还将投注往强队取胜上吸引,如果不是可以两场比赛风险和收益对冲,它会亏得很多,它没有作出使G值最大的努力。

    老子说道非常道名非常名,孙子说知己知彼百战百胜,连孔子看到两小儿辩日也要发一会愣。我们有什么理由不去多想一会呢?

上一条:赌博心理学 下一条:欧亚粗算表