Sumário Estatístico
Gera um resumo estatístico dos atributos selecionados em forma de tabela.
Conectores
Entrada | Saída |
---|---|
Dados | Sumário Estatístico |
Tarefa
Nome da Tarefa
Aba Execução
Parâmetro | Detalhe |
---|---|
Atributos | Atributos para gerar o sumário estatístico. Caso este campo esteja vazio, todos os atributos são selecionados |
Título | Título dessa visualização. É mostrado com a visualização |
Definições
Sumário Estatístico - Funções
As funções calculadas no sumário estatístico são:
Valor máximo/mínimo:
Dado uma coluna de valores numéricos, este campo retorna o valor máximo e o mínimo desta coluna.Média
Desvio padrão:
Indica uma medida de dispersão dos dados em torno da média.Contagem:
A quantidade de vezes que o atributo selecionado aparece na base de dados.Quantidade de valores distintos
Quantidade de valores ausentes
Assimetria O coeficiente de assimetria permite distinguir as distribuições assimétricas.
Um valor negativo indica que a cauda do lado esquerdo da função densidade de probabilidade é maior que a do lado direito. Um valor positivo para a assimetria indica que a cauda do lado direito é maior que a do lado esquerdo. Um valor nulo indica que os valores são distribuídos de maneira relativamente igual em ambos os lados da média, mas não implica necessariamente, uma distribuição simétrica.Curtose:
Curtose é uma medida de dispersão que caracteriza o "achatamento" da curva da função de distribuição. Quanto menor a curtose, mais achatada é a curva. Se a curtose for igual a 0, então a distribuição é normal e são chamadas mesocúrticas. Curvas com curtose maior do que 0 são denominadas leptocúrticas e possuem a curva da função de distribuição mais afunilada. Neste caso dizemos que essa distribuição possui caudas pesadas. Curvas com curtose menor do que 0 são denominadas platicúrticas e são mais achatadas do que uma distribuição normal.
Fonte: https://www.biologyforlife.com/standard-deviation.html
Fonte: http://www.portalaction.com.br/estatistica-basica/26-curtoseCorrelação de Pearson É um coeficiente (P) que mede o grau da correlação entre duas variáveis. Normalmente representado por valores entre -1 e 1.
P = 1: correlação perfeita entre duas variáveis. Se uma aumenta/diminui, a outra também segue este comportamento.
P = -1: correlação negativa perfeita entre as duas variáveis. Ou seja, se uma aumenta, a outra sempre diminui.
P = 0: significa que as duas variáveis não dependem linearmente uma da outra. No entanto, pode existir uma dependência não linear. Assim, o resultado deve ser investigado por outros meios.\
Exemplo de Utilização
Objetivo: aplicar sumário estatístico em uma base de dados.
Base de Dados: Iris
Adicione uma base de dados por meio da operação Ler dados.
Adicione a operação Sumário Estatístico e não preencha nenhum atributo. Preencha o título com "Sumário"
Observe o resultado final após cada execução do fluxo;
Dúvidas e/ou sugestões envie um e-mail para suporte@lemonade.org.br