Naive Bayes

Naive Bayes é um algoritmo de classificação que utiliza aprendizado supervisionado. O algoritmo é chamado de "naive" (do inglês, ingênuo) porque ele realiza uma suposição ingênua de que cada dado é independente dos outros, o que não é verdade na vida real. Portando, o algoritmo através do teorema de Bayes, realiza decisões que classificam os dados a partir de valores de probabilidade gerados a partir da suposição ingênua de independência dos dados.

O teorema de Bayes nos ajuda a encontrar o valor de probabilidade da hipótese dado um conhecimento prévio que pode ter interferência. Em outras palavras:


\[ \large{} P(H|e) = \frac{P(e|H)P(H)}{P(e)} \]


onde:

  • \( P(H|e) \) (posterior): o quão provável é a nossa hipótese dada a evidência observada.

  • \( P(e|H) \) (likelihood): o quão provável é a evidência dada que a hipótese é verdadeira.

  • \( P(H) \) (prior): o quão provável era a hipótese antes de observar a evidência.

  • \( P(e) \) (marginal): o quão provável é a nova evidência sob todas as possíveis hipóteses.