A primeira etapa, de identificação e seleção dos estudos primários, foi realizada seguindo o método sugerido por Chen e Babar (2011), em três passos (i) identificação dos registros relevantes nas bases de dados com a aplicação da string de busca, tendo sido obtidos 188 resultados; (ii) aplicação dos critérios de inclusão e de exclusão propostos no protocolo da revisão, resultando na seleção de 11 estudos primários; (iii) aplicação dos critérios de avaliação da qualidade: relatório, rigor, credibilidade e relevância para a área, (cf. 5). As etapas desta aplicação são apresentadas na figura 7.
Figura 7 – Passos seguidos na identificação de estudos primários
Fonte: Traduzido de Maita et al. (2015)
A tabela 7 apresenta a lista dos 11 estudos primários, resultantes da aplicação dos critérios de inclusão e exclusão, descritos no protocolo da revisão. Os dados apresentam que sete dos 11 estudos primários foram publicados em periódicos, e quatro em conferências. Os resultados da avaliação de qualidade para esses 11 estudos primários estão apresentados na tabela 8. Os dados apresentam a avaliação dos estudos primários seleccio- nados tendo em conta os atributos definidos na tabela 5. Cada sub-atributo foi avaliado e pontuado como “Completo – 1,0 ponto”, “Parcial – 0,5 ponto” ou “Nada – 0 ponto”. Os estudos foram melhor avaliados em termos dos atributos “relatórios” e “relevância”, com taxas relativas de 91 e 82 por cento, respectivamente. Em contraste, foram pior avaliada
Tabela 7 – Lista final de estudos primários para revisão sistemática
Tipo de
Ano ID Título publicação
2004 J-1 An intelligent information infrastructure to support the stre- amlining of integrated logistics workflow
Periódico 2006 J-2 An intelligent production workflow mining system for continual
quality enhancement
Periódico C-1 Development of a distributed process mining system for reactive
ion etching enhancement
Conferência C-2 A fuzzy paradigm approach for business process intelligence Conferência 2011 J-3 KNNI-SVM: A hybrid algorithm integrating imputation and
support vector machine for real-time business process monito- ring
Periódico C-3 Process optimization of candy production based on data mining Conferência 2012 J-4 Mining event logs to support workflow resource allocation Periódico 2013 J-5 A comparative study of dimensionality reduction techniques to
enhance trace clustering performances
Periódico C-4 Data mining for “big archives” analysis: A case study Conferência 2014 J-6 Active learning for sentiment analysis on data streams: Metho-
dology and workflow implementation in the ClowdFlows plat- form
Periódico J-7 A dynamic understanding of customer behavior processes based
on clustering and sequence mining
Periódico
Fonte: Traduzido de Maita et al. (2015)
em termos dos atributos “credibilidade” e “rigor”, com taxas relativas de 61 e 56 por cento, respectivamente.
A figura 8 apresenta a distribuição temporal dos 11 estudos primários (no período de 2004 até 2014). Verifica-se uma concentração dos estudos publicados (64%) nos últimos quatro anos do período avaliado.
Figura 8 – Distribuição dos estudos primários por ano
Fonte: Traduzido de Maita et al. (2015)
A análise dos 11 estudos primários selecionados resultou nas classificações apresen- tadas a seguir, especificamente relacionadas à avaliação das questões de pesquisa.
Tabela 8 – Lista final de estudos primários para revisão sistemática
Credi- Rele- Índice de ID Relatório Rigor bilidade vância qualidade
Rel.1 Rel.2 Rel.3 Rig.1 Rig.2 Rig.3 Rig.4 Rig.5 Cre.1 Cre.2 Rele.1
J-1 C C C C P N P P P C C 8,0 J-2 C C P C C N C P P C C 8,5 C-1 C P P C N N C P N P P 5,5 C-2 C C P P N N P N N P P 4,5 J-3 C C C C N N P N N P P 5,5 C-3 C P P P N N P N N P P 4,4 J-4 C C C C C N C C P C C 9,5 J-5 C C C C C N C C C C C 10,0 C-4 C C C C C N C C C C C 10,0 J-6 C C C C P N C P P C C 8,5 J-7 C C C C C N C C P C C 9,5
Notas: C – completo (1,0 ponto); P – parcial (0,5 ponto); N – nenhum (0 pontos)
Fonte: Traduzido de Maita et al. (2015)
QP1. Que tipos de redes neurais ou de máquinas de vetores de suporte são usados para implementar as tarefas de mineração de dados quando aplicados ao contexto de mineração de processos?
As tabelas 9, 10 e 11 apresentam um resumo do resultado da extração e da classificação dos dados dos 11 estudos primários, escopo da revisão sistemática, com o objetivo de responder essa primeira questão de pesquisa. Em relação às abordagens identi- ficadas nos estudos primários que usam redes neurais, os dados da tabela 9 e da tabela 11 apresentam que a maioria delas apresentam arquitetura multicamada com aprendizado supervisionado. Já em relação às abordagens identificadas nos estudos primários que usam máquinas de vetores de suporte, os dados da tabela 10 e da tabela 11 apresentam que todos os trabalhos usam o modelo básico de máquinas de vetores de suporte para classificação com aprendizado supervisionado.
QP2. Quais tarefas de mineração de dados são direcionadas em mineração de processos quando aplicadas a redes neurais e máquinas de vetores de suporte?
Em relação às tarefas de mineração de dados, a tabela 12 mostra que para as abordagens identificadas nos estudos primários selecionados para esta revisão sistemática, três das cinco categorias são cobertas quando se considera a sua resolução com redes neurais e máquinas de vetores de suporte. Assim, foram encontrados representantes para as seguintes tarefas: previsão categórica (ou classificação), previsão numérica (do tipo “regressão”), e análise de agrupamentos. Nenhum estudo foi identificado para as outras
Tabela 9 – Classificação dos estudos primários com base no tipo de arquitetura da redes neurais
Feedforward com Recorrente com Feedforward Recorrente Camada ID camada única camada única multicamada multicamada competitiva
J-1 X J-2 X C-1 X C-2 X C-3 X J-5 X J-7 X
Fonte: Traduzido de Maita et al. (2015)
Tabela 10 – Classificação dos estudos primários considerando as variações de máquinas de vetores de suporte
Vetores suporte Regressão por Agrupamento por ID para classificação vetores suporte vetores suporte
J-3 X
J-4 X
C-4 X
J-6 X
Fonte: Traduzido de Maita et al. (2015)
Tabela 11 – Classificação dos estudos primários considerando os tipos de aprendizado de redes neurais e de máquinas de vetores de suporte
Aprendizado Aprendizado não Aprendizado Redes neurais ID supervisionado supervisionado de reforço de pesos fixos
J-1 X J-2 X C-1 X C-2 X C-3 X J-3 X J-4 X J-5 X C-4 X J-6 X J-7 X
duas categorias: previsão numérica (do tipo “identificação de tendências”), e descoberta de padrões frequentes, regras associação e correlação. De fato, dois estudos envolvem a tarefa de descoberta de padrões frequentes, mas são resolvidos com outras técnicas, assim, não foram levadas em conta na tabela 12.
Tabela 12 – Classificação dos estudos primários considerando as tarefas de mineração de dados
Descoberta de Predição Predição numérica padrões frequentes categórica Identificação Análise de regras de associação ID (classificação) Regressão de tendências agrupamentos e correlação
J-1 X J-2 X C-1 X C-2 X C-3 X J-3 X J-4 X J-5 X C-4 X J-6 X J-7 X
Fonte: Traduzido de Maita et al. (2015)
QP3. Quais tipos de mineração de processos são atendidos por redes neurais ou máquinas de vetores de suporte quando tais técnicas são usadas para tratar tarefas de mineração de dados neste contexto?
Em relação ao tipo de mineração de processos, cujo objetivo é verificar as aplicações de redes neurais e máquinas de vetores de suporte na área de interesse, os dados da tabela 13 apresentam que dois estudos se referem ao tipo descoberta, três ao tipo aprimoramento, e seis ao tipo conformidade. Embora essa classificação tenha sido realizada considerando as definições apresentadas por Aalst (2011), de fato, a maioria dos trabalhos não seguem estritamente as definições propostas por esse especialista para a área de mineração de processos. Dessa forma, a classificação apresentada na tabela 13 se refere a uma aproximação de essas propostas por Aalst (2011), levando em consideração a análise realizada pelos autores deste estudo.
Tabela 13 – Classificação dos estudos primários em relação ao tipo de mineração de processos
ID Descoberta Conformidade Aprimoramento
J-1 X J-2 X C-1 X C-2 X C-3 X J-3 X J-4 X J-5 X C-4 X J-6 X J-7 X
Fonte: Ana Rocío Cárdenas Maita, 2015