• Sonuç bulunamadı

Düktil Demir Üretimde Kullanılan ġarj Malzemeleri

BÖLÜM 3. DÜKTĠL DEMĠRLER

3.2. Düktil Demir Üretimde Kullanılan ġarj Malzemeleri

A área de estudos dedicada exclusivamente a técnicas empregadas para processamento

da linguagem natural é denominada por Information Retrieval Theory que define padrões de análises semânticas e sintáticas de corpus, estabelecendo procedimentos para o que se chama de “análise de opinião” ou “análise de sentimento”. Busca apresentar aspectos positivos, negativos ou neutros das conversações sobre determinada marca, produto, atividades, personalidade pública, programas de entretenimento, etc. A relação de sentimento é importante, pois é capaz de revelar, ainda que superficialmente, a afetividade das pessoas em relação a determinado assunto. Um dos maiores desafios encontratos pela área é a ausência de contexto durante a aplicação de procedimentos para análise da linguagem, mencionadas em RUSSEL (2011, p. 240) e também por RECUERO (2014).

O processo de análise da linguagem natural envolve técnicas quantitativas para atividades de segmentação de frases, identificação e destaque de palavras-chave, símbolos, identificação de entidades, associações, hipóteses, e tendências implícitas presentes no corpus. São identificadas entidades = objetos e aspectos = propriedades, atributos ou tópicos a elas relacionadas, segundo LIU (2012, p. 17). O autor menciona a complexidade envolvida na hieraquização de entidades e suas relações através de cálculos. A principal razão é o reconhecimento de peças e atributos de uma entidade em níveis detalhados. “[...] é possível simplificar a hierarquia de dois níveis e utilizar os aspectos termo para denotar as duas partes e atributos[...] Isso simplificou quadro que é normalmente usado em sistemas práticos de análise de sentimento”. (LIU, 2012, p. 17).

Há algoritmos específicos para sumarizar componentes chaves de análise opiniões implícitas e explícitas. Progamas não entendem o que lêem quando se trata de textos humanos, portanto, identificam conjuntos de caracteres especificando suas propriedades. Exemplos de ferramentas de processamento de linguagem natural gratuitas são: WEKA,

Orange BioLab, LIWIC, Stanford NPL e RapidMiner.

Algoritmos de processamento de linguagem natural são empregados na Internet com a finalidade de:

Identificar comunidades e analisar em larga escala conteúdos publicados em sites de redes sociais.

Personalizar buscas e interações entre usuários.Recomendar produtos para compra.

Proteger dados.

Minerar dados de clicks, documentos e buscas.

Identificar padrões de apresentação para usuários finais e especialistas.

Identificar dinâmicas, evolução de padrões e tendências em sites de redes sociais.Propiciar análise contextual, temporal e topologias em sites de redes sociais.Fornecer análise baseada em multiagentes e aplicativos em sites de redes sociais.Detectar evolução de anomalias em sites de redes sociais.

Dentre algoritmos que se ocupam de PNL estão algoritmo de sumarização de Luhn e o

TFIDF que calcula scores para entidades de acordo com a frequência em corpus revelando a

importância dos mesmos em documentos.

No geral existem duas abordagens de análise de sentimento: a primeira baseada em aprendizagem de máquinas e a segunda baseado em léxico. A abordagem de aprendizagem, de acordo com (PENG e PARK, 2011) utiliza técnicas de classificação para aprender frases de texto humanas. Técnicas baseadas em léxico utilizam um dicionário com sentimentos positivos e negativos de palavras identificadas dentro de sentenças para determinar sua polaridade. Este dicionário também pode fornecer propriedades úteis para abordagens de aprendizado de máquina.

A maioria das ferramentas de análise de sentimento atuais para conteúdos publicados em sites de redes sociais definem abordagens baseadas no léxico porque é um enorme desafio obter dados humanamente classificados para a larga e diversa escala de opiniões sociais necessárias à aprendizagem de máquinas. (PENG e PARK, 2011, p. 273).

Em estudo sobre fan pages no Facebook, NGOC e YOO (2014, p. 448) consideraram não apenas o número de posts e comentários de usuários, mas o pensamento real do usuário tomando a opinião como base para cálculo de score e aprimorar técnicas úteis para o desenvolvimento de marketing social. Outra pesquisa interessante foi realizada por BERMINGHAM (2009) para identificar a presença de radicalismos no YouTube. O autor fez observações sobre a natureza das discussões, como a tendência de mulheres serem mais simpáticas aos atores da violência política e também não distinguirem entre a religião judaica e do estado de Israel, uma divisão que parece estar claramente reconhecidas por homens no grupo pesquisado. Outra descoberta foi a autoridade no grupo relacionadas a informações sobre o próprio gênero, revelando que havia mulheres ativa nos níveis mais altos dentro do grupo, BERMINGHAM (2009, p. 237).

Por outro lado, há críticas sobre o monitoramento quantitativo de processamento de linguagem natural em sites de redes sociais como as feitas por BRANTHWAITE e PATTERSON (2011) quanto ao: 1) controle e padronização das buscas para qualquer tipo de termo de pesquisa; 2) poucas similaridades entre os resultados positivos e negativos das classificações de mensagens quantitativas; 3) imprecisão da amostra e suas limitações. Desafios multilingues também foram relatados por MOENS E VULIC (2014, p. 281) e análise de ironia ou emprego de emoticons, palavras de baixo calão e uso de gramática popular, relatados em SPONDER (2012, p. 48).

Algumas plataformas de monitoramento permitem a optar pela classificação do conteúdo é realizada por humanos e não por máquinas. SPONDER (2012, p. 285) prevê o surgimento de algoritmos de aprendizado automático “projetados para tornar as buscas mais simples e precisas, melhorando a qualidade da informação extraída das redes sociais”. Esses algorítimos também seriam adequados para mapear o conteúdo de acordo com os objetivos de marketing, por exemplo, em pesquisas realizadas para mapear engajamento e quais opiniões ou sentimentos fatores lideram indicadores nessa categoria.