第441章香农的信息熵

作者:蔡泽禹 加入书签推荐本书

在展开你想象的翅膀,你应该看到当 n 变成无穷大的时候,这个平均值就不再是“几乎总是很接近1/3”,而是“就是1/3”了!

至此同学们可能已经体会出俺极其考究、极负责任的“几乎总是很接近”了吧。这里的情怀还是让俺带你们领略一下吧。老千掷出的序列当然是随机的、不确定的、没有规律的。这个序列的平均数虽然也在1/3周围随机跳动,但却随着 n 的增大越发确定起来。当n很小、她就在你跟前的时候,变化多端、捉摸不定的她让你无法看清;当 n 增大的时候,她渐行渐远,但她在风中颤动的身影却在你记忆的相机里慢慢聚焦,越来越清晰;直到她消逝在无限的远方,她竟定格成一幅永恒而又无比真切的画面......

学霸们可能会觉得俺太矫情了:不就一个简单的大数定理吗,有必要这么忽悠吗?其实俺也觉得自己有些矫情。但看完本文之后,俺请你再回头体会一下大数定理的情怀。

“二十个问题”游戏的准确规则及特例

用概率论武装一下之后,同学们应该已经认识到,在“二十个问题”游戏中俺心里想的神秘数字其实就是一个随机变量 x。我们可以假设它的取值范围s={1, 2,…, m}和概率分布函数 都已知。当然在实际情况下我们未必真知道 ,但往往可以大致估计这个函数。如果对这个分布函数我们一无所知,我们不妨认为 是个均匀分布。

对于任意一个给定的问问题策略,如果俺心里的神秘数字是 x,我们把所需的问题个数记作 。比如 m=8,而我们用前面提到的那个从1问到7的策略问问题,我们就会得到:

=1, =2, =3, =4,

=5, =6, =7, =7。

(对,=7,俺没敲错。)

因为俺心里想的是个随机变量 x,在这个策略下所需要的问题数目 就也是个随机变量。这个随机变量 也有一个分布,在知道 的前提下,如果想算也是可以算出来的。但是俺懒得算它。

既然 是个随机变量,一个最自然的方式定义这个策略所需要的问题个数就是用这个随机变量的均值,或者说用平均所需要的问题个数。如果你的数字直觉好,应该可以看到,即使不求 的分布,这个随机变量的均值其实就是

*+*+…+*.

用 的均值定义一个问问题策略所需要的问题个数除了“自然”,还有什么物理意义吗?当然!前面的大数定理告诉咱们,如果你用这个策略玩这个游戏很多次,你所用问题个数的平均值“几乎总是很接近”的均值。而当你玩了这个游戏无数次之后,你平均每次用的问题数就正好是这个 的均值。

由此可见,如果俺们准备玩这个游戏很多次,那么用 的均值定义所需要问题的个数,用金星老师的话说就是一个动作两个字:完美。

至此,俺们

上一章 返回目录 下一章