強化学習

Actor-Critic	Actor-Critic, 強化学習, TD学習, アルゴリズム
BESOM	大脳皮質, 神経回路, 一杉裕志, 自己組織化マップ, 強化学習
Deepmind	Deepmind, google, 強化学習, ディープラーニング, Q学習, ベンチャー, スタートアップ
Pybrain	機械学習, 強化学習, 教師あり学習, 教師なし学習, ニューラルネットワーク, オープンソース, Python, pybrain
Q学習	機械学習, 強化学習, Q学習
RL-Glue	機械学習, オープンソース, RL-Glue, 強化学習
TD学習(Temporal Difference Learning)	TD学習, 強化学習
マルコフ決定過程	マルコフ決定過程, 理論, 強化学習
モデルベース強化学習(model-based reinforcement learning)	機械学習, 強化学習, モデルベース強化学習
モンテカルロ法	モンテカルロ法, 強化学習
動的計画法	動的計画法, 強化学習
報酬	脳, 認知, 学習, 強化学習, 報酬系
報酬学習	報酬学習, 強化学習, 報酬系, ドーパミン
強化学習(Reinforcement Learning)	機械学習, 強化学習, 行動価値関数, 報酬系
状態価値関数	状態価値関数, マルコフ決定過程, 強化学習
目的関数	目的関数, 強化学習
行動価値関数	強化学習, 行動価値関数
行動獲得	行動獲得, 強化学習