• Sonuç bulunamadı

Bir Endülüs Köpeği Filminde Anlatı Beklentileri

4.2. Bir Endülüs Köpeği Film Analizi

4.2.3. Bir Endülüs Köpeği Filminde Yapım Öncesi

4.2.3.2. Bir Endülüs Köpeği Filminde Anlatı Beklentileri

Empregou-se a análise de agrupamentos hierárquicos (Hierarchical Cluster Analysis - HCA) para selecionar o conjunto de amostras para calibração e validação. Os métodos de HCA empregam diferentes técnicas de segmentação para agrupar aquelas amostras que compartilham características semelhantes dentro de um conjunto de dados. Baseado em uma análise supervisionada, a HCA procura semelhanças entre os objetos por meio de cálculos de distâncias, empregando-se processos aglomerativos ou divisivos. Enquanto o método aglomerativo considera inicialmente cada objeto como um grupo unitário e segue agrupando- os sistematicamente por ordem de similaridade, o método divisivo considera inicialmente um único grupo de objetos e divide-o em dois ou mais grupos começando pelos objetos que são

mais dissimilares. A resposta gráfica é um dendrograma que mostra a similaridade entre os objetos em função das propriedades consideradas (i.e., o espectro de emissão óptica no presente caso).120

Empregou-se o método de Ward como algoritmo de agrupamento hierárquico considerando-se os intervalos de comprimento de onda 200-265 e 280-340 nm, e utilizando-se a distância Euclidiana para computar a similaridade entre as amostras a serem agrupadas.120 Considerou-se variabilidade intraobjeto (i.e., entre replicatas de uma mesma amostra) como critério para selecionar o valor de dissimilaridade mais apropriado que define os diferentes grupos de objetos. Utilizou-se o software OPUS® (Versão 4.2, Bruker, Alemanha) para realizar o tratamento quimiométrico dos espectros (i.e., HCA e calibração multivariada).

O conjunto de amostras de calibração selecionados a partir da classificação dendrográfica foi inicialmente utilizado para se estabelecer as funções univariadas de regressão entre as respostas analíticas (área de pico da linha de emissão correspondente após subtração da radiação de fundo) e as correspondentes frações de massa dos analitos empregando-se os modelos clássicos de regressão pelos mínimos quadrados.122 Particularmente, considerando-se a sensibilidade e a seletividade espectral, as seguintes linhas de emissão foram selecionadas: Ca II 315,887, Mg I 285,212, P I 213,618, Cu I 324,755, Fe II 238,204, Mn II 257,610, e Zn II 202,548 nm.

Analogamente, empregou-se o mesmo conjunto de calibração para a construção dos modelos PLS (Partial least squares regression) a partir da definição dos intervalos de comprimentos de onda, do pré-processamento dos dados (e.g., eliminação de deslocamento constante, normalização vetorial), e do número de variáveis latentes mais apropriados. Empregou-se uma estratégia similar à usada em siPLS (synergy interval PLS) 123 para definir os intervalos espectrais. Neste caso, o intervalo espectral considerado é dividido em um número definido de intervalos. Posteriormente, o procedimento de otimização é feito com um intervalo espectral e, sucessivamente, outros intervalos são considerados com o objetivo de se estabelecer uma combinação que proporcione o menor valor da raiz quadrada do erro médio quadrático de previsão (RMSEP). Selecionou-se o número de variáveis latentes (rank) com base nos menores

valores da soma dos quadrados dos erros de previsão (PRESS) do desvio médio do modelo em

relação aos valores de referência. Utilizou-se a raiz quadrada do erro médio quadrático de calibração (RMSEC) e coeficiente de regressão r cal das amostras de calibração para descrever a

Tanto os modelos de calibração univariados quanto os multivariados foram validados a partir da previsão da fração de massa dos analitos em amostras distintas àquelas empregadas no conjunto de calibração (i.e., conjunto de amostras de validação). Utilizaram-se os parâmetros estatísticos raiz quadrada do erro médio quadrático de previsão (RMSEP), coeficiente de

regressão r val das amostras de validação, coeficiente de qualidade (QC) e desvio residual de

previsão (RPD) para avaliar a capacidade de previsão dos modelos de calibração. Os valores de

RMSEP foram calculados pela Equação 2.2:124

= √∑ 𝑦𝑛 − 𝑘𝑖 − 𝑦̂𝑖 (Equação 2.2)

onde: 𝑦𝑖 é a fração de massa de referência determinada para a enésima amostra de validação,

𝑦̂𝑖 é o valor associado previsto pelo modelo, 𝑛 é o número de amostras do conjunto de validação

e 𝑘 é número de variáveis latentes empregadas no modelo PLS.

O parâmetro QC, calculado a partir da expressão proposta por Vankeerberghen and

Smeyers-Verbeke125 (Equação 2.3), determina a taxa de erro esperada para a previsão das frações de massa dos analitos em amostras futuras.120, 125 Quanto mais alto for o valor de QC,

menor será a concordância entre as previsões.

% = √∑ (𝑦̂

𝑖 − 𝑦𝑖

𝑦𝑖 )

𝑛 − ×

(Equação 2.3)

Entretanto, o parâmetro RPD avalia a habilidade do modelo de calibração em prever a

fração de massa de um dado nutriente de acordo com o intervalo de fração de massa abrangido pelo modelo.126 Assim, o índice RPD é calculado pela razão entre o desvio-padrão dos valores de fração de massa de referência do conjunto de calibração (sd) e o valor de RMSEP

correspondente (Equação 2.4). Quanto mais alto for o valor de RPD, melhor será a exatidão

das previsões.120

Por último, utilizou-se o desvio-padrão combinado das triplicatas de validação (strip) para

completar a descrição do desempenho preditivo dos modelos. Este parâmetro, calculado pela Equação 2.5, expressa a qualidade (repetitividade) das previsões de um determinado analito em uma dada amostra.127

𝑟𝑖 = √∑ × 𝑛𝑖 (Equação 2.5)

onde: r é o número de replicatas (3 neste caso por se tratar de triplicatas); 𝑖 é o desvio-padrão da fração de massa estimada pelo modelo de calibração para cada uma das n amostras que

englobam o conjunto de validação.

Amostras de calibração que apresentaram erros de previsão maiores que 100 % foram consideradas anômalas e retiradas do conjunto de calibração. Os limites de detecção (LOD)

foram estimados utilizando a Equação 2.6:128

= 𝑟 í𝑑× 𝑘 (Equação 2.6)

onde: 𝑟 í𝑑 = desvio-padrão da intensidade de emissão do ruído. Este valor foi calculado com base na intensidade de emissão de regiões espectrais independentes, localizadas nas vizinhanças das linhas de emissão de interesse; 𝑘 = 3,3; 𝛼 = coeficiente angular da função de calibração.

A exatidão dos métodos em LIBS foi avaliada estatisticamente empregando-se o método das elipses de confiança, calculadas a partir de uma função linear empregando-se regressão pelos mínimos quadrados ordinários OLS.129 Este método emprega a comparação dos valores obtidos para a inclinação e o intercepto de uma função linear de regressão entre os valores de referência e os estimados pelo modelo a ser testado. Nos casos em que o ponto ideal (0, 1) para o intercepto e a inclinação, respectivamente, estiver contido nos intervalos de confiança definidos pelas elipses, os conjuntos de dados podem ser considerados estatisticamente equivalentes no nível de confiança considerado (99 % no presente caso).130 Utilizou-se o