ε-greedyは機械学習においてよく使われる方法であり、そんなに理解に苦しいアルゴリズムではない。 Exploit のみを続けることに対するリスクを緩和する方法である。僕が理解できれば、みんな余裕ってわけよ!例えば、今目の前に3台のスロットマシンがあると…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。