1.4. ÖRGÜTSEL ADALET TÜRLERİ
1.4.3. Etkileşim Adaleti
Durante o estudo de viabilidade realizou-se ensaios em que os conceitos retirados das reuniões eram comparados com os conceitos presentes na ontologia do domínio. Podemos destacar dentre os resultados apresentados, que os termos que possuem frequência inferior a três
deveriam ser descartados e que, na medida em que aumenta a frequência de ocorrência de um termo no texto, maior é a probabilidade deste termo ser um conceito da ontologia do domínio. Os resultados detalhados destes ensaios estão na seção 4.3 Estudo de viabilidade.
Também percebemos no estudo de viabilidade, a necessidade de ensaios que apontassem uma heurística que indicasse mais precisamente, em que frequência, os termos apontados tornar- se-iam relevantes para serem usados como indexadores das reuniões. Estes ensaios foram propostos para serem realizados no estudo de caso explanatório, apresentado no Capítulo 6.
Para propor uma forma de calcular a faixa de frequência dos termos a serem selecionados, analisamos a curva de distribuição normal [Oat06]. Na Figura 14, percebemos que 68,2% dos valores estão entre a média e o valor de uma vez o desvio padrão (área azul), já 95,4% dos valores estão entre a média e duas vezes o valor do desvio padrão (área verde) e 99,7% dos valores estão entre a média e três vezes o valor do desvio padrão (área cinza). Considerando que nos ensaios anteriores foi percebido que quanto maior a frequência de um termo na reunião, maior a probabilidade deste estar associado à ontologia do domínio, procurou-se então uma forma de sele io a osàosàte osà ueàesti e à aisàp i osà à auda àdaà u aàdeàdist i uiç oà o al.àà
Desta forma, durante o estudo de caso explanatório, os experimentos indicaram que palavras na faixa entre o valor do desvio padrão e duas vezes o valor do desvio padrão da frequência de ocorrência das palavras no texto, é que deveriam ser apontadas como termos relevantes para indexar uma reunião.
Figura 14 - Distribuição Normal [Fonte: Wikipedia]
Exemplificando, para melhor demonstrar a explanação anterior, tomemos o caso da reunião utilizada como exemplo na Tabela 12, onde foram extraídas 112 palavras classificadas como NN, NNS, NNP, NNPS, CD e FW e a frequência média em que elas ocorreram no texto foi 2,72; o desvio padrão foi 5,93 e; o valor de duas vezes o desvio padrão foi 11,86 (Figura 15). Então se definiu duas faixas de termos relevantes: (i) a primeira faixa começa no valor da soma da média da frequência aisàoà alo àdoàdes ioàpad o,à esteà aso,à , à+à , ,à ueà àigualàaà , ,à ueà
arredondando ficou 9; (ii) a segunda faixa começa no valor da soma da média da frequência mais duasà ezesà oà alo à doà des ioà pad o,à esteà aso,à , à +à , , que é igual a 14,58, que arredondando ficou 15.
Desta forma, para este caso definimos então duas faixas: uma que vai da frequência de 9 a 14, e outra que vai de valores iguais e acima de 15. Na Figura 15 temos uma ilustração que exemplifica como são definidas estas duas faixas, que concentram os termos mais relevantes de uma das reuniões do estudo de caso explanatório.
Figura 15- Exemplo de classificação das palavras em uma reunião
A escolha pelo uso do desvio padrão no cálculo para apontarmos a faixa de frequência dos termos relevantes manifestou-se adequada, pois desta forma conseguimos perceber se nas reuniões alguns poucos termos aparecem com uma frequência bem acima dos demais, que é um indicativo para ser um termo indexador da reunião. Em reuniões que isso acontece o desvio padrão tende a aumentar. Já em reuniões onde não temos poucos termos em que a frequência destoa dos demais, o desvio padrão tende a diminuir e isso aumentará o número de termos na faixa de frequência dos termos relevantes. Na Tabela 14 podemos observar este comportamento através do exemplo entre duas reuniões.
Tabela 14 - Análise do desvio padrão
Reunião 3
Reunião 4
Quantidade de Termos 112 Quantidade de Termos 129 Média de frequência 2,70 Média de frequência 2,36 Valor Desvio Padrão 5,89 Valor Desvio Padrão 2,64
Qtde termos selecionados na Faixa 2 3 Qtde termos selecionados na Faixa 2 6 Qtde termos selecionados na Faixa 1 2 Qtde termos selecionados na Faixa 1 9
Percebemos nesta análise entre estas duas reuniões, que na reunião 3, onde o desvio padrão foi maior, a quantidade de termos selecionados foi menor, já na reunião 4, onde o desvio padrão foi menor, a quantidade de termos selecionados foi maior. Na Figura 16 podemos perceber esta tendência no comparativo entre as reuniões do estudo de caso explanatório.
Essa análise utilizando a quantidade de termos em função do desvio padrão poderia auxiliar na indicação de que uma reunião é mais focada em determinados tópicos, ou se ela possui um perfil mais abrangente, considerando a discussão de tópicos associados ao projeto no qual a reunião está inserida. Quanto menor a quantidade de termos usados como indexadores de uma reunião, mais focada ela é; quanto maior a quantidade de termos; menos focada ela é.
Figura 16 - Desvio padrão comparado ao número de termos selecionados Reunião 1 Reunião 2 Reunião 3 Reunião 4 Reunião 5 Reunião 6 Reunião 7 Reunião 8 Reunião 9 Reunião 10
Desvio Padrão x Termos Selecionados
Termos selecionados Desvio PadrãoPortanto, ao final desta etapa da metodologia, que prevê classificar os termos abordados na reunião, o resultado é uma matriz com os conceitos mais relevantes àeàaàfrequência em que os mesmos ocorreram na reunião. Nesta matriz são apontados, com base no cálculo do desvio padrão, os termos ueàapa e e à aà Fai aà àeà Fai aà ,à o fo eà ost adoà aà Figura 15. A Fai aà à ep ese taàosà o eitosà ueàpossue àu aà elaç oàde média relevância com a reunião, pois estão na faixa entre uma vez o desvio padrão e duas vezes o desvio padrão, enquanto que a Fai aà à ep ese taàosà o eitosà o àu aà elaç oàde alta relevância, pois estão na faixa acima de duas vezes o desvio padrão.