Naïve Bayes

A operação Naïve Bayes cria um modelo baseado na aplicação do teorema de Bayes com uma suposição ingênua de independência condicional entre cada par de atributos dado o atributo classe. Nesse caso, o modelo do Naïve Bayes define que todos os atributos sejam condicionados ao atributo classe, mas sendo independentes entre si.

Conectores

Entrada Saída
Dados utilizados para treinar o modelo Dados de saída e modelo do algoritmo de classificação

Tarefa

Nome da Tarefa

Aba Execução

Parâmetro Detalhe
Atributo(s) previsor(es) Atributo(s) que será(ão) usado(s) para treinamento
Atributo com o rótulo Atributo a ser classificado
Atributos com a predição Atributo contendo a predição do modelo
Pesos Pesos do algoritmo em um ensemble
Tipo de Modelo Modelo utilizado pelo Naïve Bayes. Pode assumir os valores de uma Binomial ou Multinomial, sendo que o tipo Multinomial é o padrão para este parâmetro
Suavização Realiza suavização (por Laplace) dos dados. O valor 0 significa que não ocorrerá suavização
Limiares Ajustar a probabilidade de previsão de cada classe
Atributo com os pesos Atributos passados ao modelo que terão um peso diferenciado
Métrica para validação cruzada Define a métrica utilizada dentro da validação cruzada (se aplicável) para avaliar o modelo de classificação dentro das k partições
Atributo com o número da partição (fold) Define o atributo a ter o número da partição para realizar uma validação cruzada (se aplicável)
Usar classificação um-contra-todos (one-vs-rest) Se selecionado, o algoritmo realizará classificação um-contra-todos ao invés de classificação tradicional (neste caso, binária ou multi-classe)

Aba Aparência

Aba Resultados

Exemplo de Utilização

Objetivo: Utilizar o modelo do Naïve Bayes para classificar a espécie da planta Íris.
Base de Dados: Íris

Fluxo de trabalho - Ler dados

  1. Leia a base de dados Irís por meio da operação Ler dados.

  2. Utilize a operação Converter categórico para numérico para converter os valores do atributo classe em valores numéricos. Para isso, utilize “class” no campo Atributos, String como Tipo de indexador e “class_index” como Nome para novo(s) atributos indexados.

  3. Utilize a operação Divisão percentual para dividir a base de dados em treino e teste. No parâmetro Percentual, calibre-o utilizando 50% dos dados para treinar (1.ª parte) e 50% para testar (2.ª parte).

  4. Na operação Naïve Bayes, selecione “petal_length”, “petal_width”, “sepal_length” e “sepal_width” no campo Atributo(s) previsor(es). Selecione “class_index” no campo Atributo com o rótulo e preencha “resultado” no campo Atributo com a predição (novo). Deixe os demais parâmetros inalterados.
    Formulário Naïve Bayes - parte 1 Formulário Naïve Bayes - parte 1

  5. Na operação Aplicar Modelo, selecione “petal_length”, “petal_width”, “sepal_length” e “sepal_width” no campo Atributo(s) previsor(es) e preencha “resultado” no campo Nome do novo atributo (herdado do modelo).

  6. Na operação Avaliar Modelo, selecione “resultado” no campo Atributo usado para predição. Selecione “class_index” no campo Atributo usado como label e a métrica “F1” como Métrica para avaliação.

  7. Execute o fluxo e visualize o resultado, i.e., a matriz de confusão gerada para as predições do modelo de árvore de decisão e, consequentemente, a tabela representando as métricas de classificação (derivadas da matriz de confusão).
    Resultado - Gráfico Resultado - Tabela


Dúvidas e/ou sugestões envie um e-mail para suporte@lemonade.org.br