各アームに隠された当たり確率。探索 (explore) と活用 (exploit) のバランスをどう取るか — Thompson Sampling / UCB1 / ε-greedy を比べる古典問題。