限りなく院生に近いパリピ@エストニア

エストニアという国で一人ダラダラしてます。

2018-06-22から1日間の記事一覧

The Epsilon-Greedy Algorithm

ε-greedyは機械学習においてよく使われる方法であり、そんなに理解に苦しいアルゴリズムではない。 Exploit のみを続けることに対するリスクを緩和する方法である。僕が理解できれば、みんな余裕ってわけよ!例えば、今目の前に3台のスロットマシンがあると…