Vetorizar atributo(s)
Essa operação é um transformador de features que une múltiplos atributos em um único vetor de atributos. Geralmente, esse único vetor de atributos é utilizado pelos algoritmos de mineração de dados da plataforma Spark, sendo então necessária.
Conectores
Entrada | Saída |
---|---|
Dados a serem tratados | Dados tratados |
Tarefa
Nome da Tarefa
Aba Execução
Parâmetro | Detalhe |
---|---|
Atributos a serem usados | Exibe lista de atributos a serem escolhidos para fazerem parte do novo vetor de atributos |
Nome do novo atributo | Nome do novo atributo a ser construído |
** Atributos a serem usados - Apenas atributos numéricos podem ser utilizados nessa função. Se o seu atributo não é um atributo numérico, por favor, veja a descrição da operação Converter categórico para numérico.
Exemplo de Utilização
Objetivo: criar um único vetor com alguns atributos da base de dados do Titanic.
Base de Dados: Titanic
Adicione uma base de dados por meio da operação Ler dados.
Na operação Vetorizar atributo(s), selecione “Age”, “SibSp”, “Parch”, e “Fare” como Atributos a serem usados, e preencha “atr_selecionados” como campo Nome do novo. Na aba Resultados, marque Exibir amostra(s) da(s) saída(s).
Execute o fluxo e visualize o resultado, observando as mudanças nos dados.
Note que o novo conjunto de dados possui os mesmos atributos dos dados originais, mas no final observamos a nova coluna criada com o nome “atr_selecionados” contendo uma lista com os valores dos atributos selecionados.
Dúvidas e/ou sugestões envie um e-mail para suporte@lemonade.org.br