# Aprendizagem por Reforço

## Definição

{% hint style="success" %}
"Jogue um robô em um labirinto e deixe-o encontrar uma saída."
{% endhint %}

Nesse método de aprendizagem, o computador é estimulado a aprender com base em tentativas e erros, otimizando o processo com a prática direta. Com essa abordagem, é possível, por exemplo, ensinar um sistema a priorizar hábitos em detrimento de outros, com recompensas proporcionais ao acerto.

A aprendizagem por reforço foi inspirada por psicólogos comportamentalistas, que acreditavam na eficácia de recompensas e punições na educação dos seres humanos. Também lembra o procedimento de adestração de animais domésticos.

Exemplos de aplicação são os veículos autônomos e máquinas que jogam xadrez. O sistema aprende com múltiplas tentativas, que envolvem erros como uma jogada ruim ou um choque contra um obstáculo.

{% hint style="success" %}
Um truque eficaz para construir um modelo de carros autônomos é construir uma cidade virtual e deixar o self-driving-car aprender primeiro todos os seus truques. É exatamente assim que treinamos pilotos automáticos no momento. Crie uma cidade virtual baseada em um mapa real, preencha com pedestres e deixe o carro aprender a matar o menor número possível de pessoas. Quando o robô está razoavelmente confiante neste “GTA artificial”, é liberado para testar nas ruas reais.
{% endhint %}

**Algoritmos populares:**&#x20;

* Q-Learning;
* SARSA;
* DQN;
* A3C,&#x20;
* Genetic algorithm.


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://carlossalesti.gitbook.io/machine-learning/aprendizado-por-reforco.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.