Mineração de Sequências
O objetivo da operação Mineração de Sequências é encontrar padrões frequentes na forma de sequências em dados transacionais. Para isso, essa operação usa o algoritmo PrefixSpan.
Conectores
Entrada | Saída |
---|---|
Dados de transações | Padrões de sequências cujas quantidades estão acima de um determinado limiar |
Tarefa
Nome da Tarefa
Aba Execução
Parâmetro | Detalhe |
---|---|
Suporte mínimo | É a proporção de transações em que x e y ocorrem conjuntamente na base de dados. Varia entre 0 e 1 |
Tamanho máximo da sequência | Tamanho máximo da sequência a ser encontrada pelo algoritmo |
Atributo com transações | Atributo contendo as transações da base de dados |
Exemplo de Utilização
Objetivo: Retornar sequências de visitas de usuários no site http://msnbc.com em 28 de setembro de 1999
Base de Dados: msnbc.com
Adicione a base de dados por meio da operação Ler dados.
Utilize a operação Transformar valores por função para tratar a base de dados. Nesta operação, clique em Editar valor da expressão para adicionar a expressão. Clique em adicionar e, em seguida, preencha o campo da Expressão com “cast(split(trim(value), ' '), 'array<int>')” e o campo do Alias com “sequencias”. Por fim, clique em OK. Isso aplicará a expressão “sequences = cast(split(trim(value), ' '), 'array<int>') ” nos dados de entrada.
Na operação Mineração de sequências, preencha 0.01 no campo Suporte mínimo, selecione “sequencias” no campo Atributo com transações (vazio = primeiro atributo), e preencha 6 no campo Tamanho máx. da sequência.
Execute o fluxo e visualize o resultado (i.e., as sequências com suas respectivas frequências):
Dúvidas e/ou sugestões envie um e-mail para suporte@lemonade.org.br