爱丽丝的21点游戏

Posted by Felix Zhang on 2020-06-03
Words 696 and Reading Time 2 Minutes
Viewed Times

胜率分析与动态规划

今天的每日一题动态规划比较难想啊,看了题解后,恍然大悟,原来可以从结果反推;

题目描述

爱丽丝参与一个大致基于纸牌游戏 “21点” 规则的游戏,描述如下:

爱丽丝以 0 分开始,并在她的得分少于 K 分时抽取数字。 抽取时,她从 [1, W] 的范围中随机获得一个整数作为分数进行累计,其中 W 是整数。 每次抽取都是独立的,其结果具有相同的概率。

当爱丽丝获得不少于 K 分时,她就停止抽取数字。 爱丽丝的分数不超过 N 的概率是多少?

示例 1

1
2
3
输入:N = 10, K = 1, W = 10
输出:1.00000
说明:爱丽丝得到一张卡,然后停止。

示例 2

1
2
3
4
输入:N = 6, K = 1, W = 10
输出:0.60000
说明:爱丽丝得到一张卡,然后停止。
在 W = 10 的 6 种可能下,她的得分不超过 N = 6 分。

示例 3

1
2
输入:N = 21, K = 17, W = 10
输出:0.73278

提示:

  1. 0 <= K <= N <= 10000
  2. 1 <= W <= 10000
  3. 如果答案与正确答案的误差不超过 10^-5,则该答案将被视为正确答案通过。
  4. 此问题的判断限制时间已经减少。

解题思路

自顶向下:从0开始对每次的摸牌情况进行分析;比较困难,目前也没想明白;

自底向上:从结果开始反推,只有在$k\le x\le \min(n, k+w-1)$区间内才获胜,如果一开始分数位于上述区间,则概率为1,而在$\min(n,k+w-1)\le x\le k + w - 1$区间内概率取0;

若以$k-1$及以前的区间开始摸牌,则最终获胜的概率均取决于下式子

考虑到相邻项中存在相同的项,对上述转移方程进行优化,可以得到

但需注意,$dp[k-1]$项需要单独处理

代码示例

1
2
3
4
5
6
7
8
9
10
11
12
double new21game(int n, int k, int w){
if(k == 0) return 1.0;
vector<double> dp(k + w, 0);
for (int i = 0; i <= n && i < k + w; ++i){
dp[i] = 1.0;
}
dp[k-1] = 1.0*min(n - k + 1, w)/w;//注意类型转换啊
for (int i = k - 2; i >= 0; i--){
dp[i] = dp[i+1] + (dp[i+1] - dp[i + w + 1])/w;
}
return dp[0];//返回以0为开始的起点
}

总结

对于上述依赖于结果的题目,可能考虑自底向上的思想比较好理解些;

又是写不来leetcode的一天orz


This is copyright.