Capa
Agradecimentos
Introdução
1. Visão Geral
Supervised Learning
Redes Neurais
Unsupervised Learning
Otimizações no Aprendizado
Tópicos Avançados
Referências
Contatos

Curso de Machine Learning

Aprendizado por reforço (Reinforcement learning)

Visão geral
Exploration e Exploitation
Markov Process
- Propriedade de Markov
- Cadeia de Markov
Markov Decision Process (MDPs)
- Busca pela política ótima com MDP
Monte-Carlo e Temporal-Difference Learning
- Valoração de Monte-Carlo
- TD Learning
Q-Learning