Mineração de Sequências
O objetivo da operação Mineração de Sequências é encontrar padrões frequentes na forma de sequências em dados transacionais. Para isso, essa operação usa o algoritmo PrefixSpan.
Conectores
| Entrada | Saída |
|---|---|
| Dados de transações | Padrões de sequências cujas quantidades estão acima de um determinado limiar |
Tarefa
Nome da Tarefa
Aba Execução
| Parâmetro | Detalhe |
|---|---|
| Suporte mínimo | É a proporção de transações em que x e y ocorrem conjuntamente na base de dados. Varia entre 0 e 1 |
| Tamanho máximo da sequência | Tamanho máximo da sequência a ser encontrada pelo algoritmo |
| Atributo com transações | Atributo contendo as transações da base de dados |
Exemplo de Utilização
Objetivo: Retornar sequências de visitas de usuários no site http://msnbc.com em 28 de setembro de 1999
Base de Dados: msnbc.com

Adicione a base de dados por meio da operação Ler dados.
Utilize a operação Transformar valores por função para tratar a base de dados. Nesta operação, clique em Editar valor da expressão para adicionar a expressão. Clique em adicionar e, em seguida, preencha o campo da Expressão com “cast(split(trim(value), ' '), 'array<int>')” e o campo do Alias com “sequencias”. Por fim, clique em OK. Isso aplicará a expressão “sequences = cast(split(trim(value), ' '), 'array<int>') ” nos dados de entrada.
Na operação Mineração de sequências, preencha 0.01 no campo Suporte mínimo, selecione “sequencias” no campo Atributo com transações (vazio = primeiro atributo), e preencha 6 no campo Tamanho máx. da sequência.

Execute o fluxo e visualize o resultado (i.e., as sequências com suas respectivas frequências):

Dúvidas e/ou sugestões envie um e-mail para suporte@lemonade.org.br