DEĞERLENDİRMELER
FAALİYETLERE İLİŞKİN BİLGİ
3.2.6. Yatırım Destek Faaliyetleri 1. Yatırım Promosyonu ve Tanıtım
O modelo PARAFAC ´e tamb´em conhecido sob o nome de decomposi¸c˜ao trilinear [60] ou modelo CANDECOMP e, neste trabalho, trataremos apenas como PA- RAFAC. Nesta se¸c˜ao o modelo PARAFAC ´e tratado tanto por meio de nota¸c˜oes atrav´es de somat´orios e componentes simultˆaneos, como por meio de nota¸c˜oes matriciais, em que ser´a utilizado o produto de Kronecker [59], [58] e [62].
O modelo PARAFAC com trˆes entradas consiste em determinar matrizes de cargas A, B e C com o mesmo n´umero de fatores, conforme ilustrado na Figura 2.7. Esse modelo usualmente produz eixos de coordenadas ´unicos e, de acordo com [52], n˜ao existe liberdade para rotacionar a orienta¸c˜ao dos vetores de cargas, enquanto um modelo de Tucker fornece subespa¸cos ´unicos conforme discutido em detalhes em [53], [54] e [55].
Figura 2.7: Decomposi¸c˜ao de um arranjo de trˆes dimens˜oes
Outras pesquisas, tais como [63], [64] e [65], desenvolveram o m´etodo de ani- quila¸c˜ao do rank (rank annihilation), que ´e pr´oximo `a ideia de uma decomposi¸c˜ao PARAFAC.
2.2.4.1 Defini¸c˜ao Matem´atica do Modelo PARAFAC
De acordo com [52], o modelo PARAFAC generaliza a decomposi¸c˜ao em valores singulares. Podemos considerar que um modelo de duas dimens˜oes de uma matriz X(I × J ), com elementos t´ıpicos xij, com base em uma decomposi¸c˜ao singular de valor truncado [75] e [76] para R componentes pode ser dado a partir da seguinte equa¸c˜ao: xij = R X r=1 airgrrbjr+ eij, ∀ i = 1, . . . , I; j = 1, . . . , J (2.5)
s˜ao matrizes e G = diag (g11, . . . , gRR) ´e uma matriz diagonal chamada de matriz de valores singulares (ou matriz n´ucleo) contendo os maiores valores singulares de Re X em ordem decrescente e eij s˜ao os res´ıduos. Em termos de nota¸c˜ao matricial, (2.5) pode ser escrita como
X = AGBt+ E (2.6)
sendo que E cont´em os elementos eij. Os valores de grr podem ser absorvidos por air, bjr ou em ambos os casos. Isso leva ao modelo de (2.7)
X = ABt+ E (2.7)
onde os nomes foram mantidos, embora A e B e (2.6) e (2.7) n˜ao sejam as mesmas. Este modelo tamb´em pode ser escrito conforme a equa¸c˜ao (2.8) abaixo. Assim,
xij = R X r=1
airbjr+ eij (2.8)
Para um tensor X de dimens˜oes (I × J × K ), com elementos xijk, (2.9) generaliza o modelo PARAFAC, isto ´e,
xijk= R X
r=1
airbjrckr+ eijk (2.9)
onde R: ´e o n´umero de componentes usado no modelo PARAFAC, air ´e o elemento que est´a na i-´esima linha e na r-´esima coluna da matriz de componentes A, bjr´e o elemento que est´a na j-´esima linha e na r-´esima coluna da matriz de componentes B, ckr ´e o elemento que est´a na k-´esima linha e na r-´esima coluna da matriz de componentes C, e eijk ´e o elemento que est´a na i-´esima linha, na j-´esima coluna e no k-´esimo tubo do arranjo residual, que cont´em a varia¸c˜ao n˜ao explicada pelo modelo com R componentes.
Uma representa¸c˜ao esquem´atica deste modelo ´e dada na Figura 2.8. O modelo de (2.9) ´e um modelo trilinear sendo que xijk ´e expresso como uma fun¸c˜ao linear dos demais parˆametros. O modelo de (2.9) tamb´em pode ser re-expresso de acordo com (2.5), com a introdu¸c˜ao de um parˆametro de escala grrr. Assim,
xijk = R X
r=1
grrrairbjrckr+ eijk (2.10)
Figura 2.8: O modelo PARAFAC decomposto em R tr´ıades ou tensores de Rank-1, e o tensor residual
mados com diferentes algoritmos, conforme Figura (2.9). Os fatores s˜ao estimados simultaneamente, ao contr´ario da an´alise de componentes principais, em que os componentes podem ser estimados um de cada vez. Isso ocorre porque os com- ponentes no modelo PARAFAC n˜ao s˜ao ortogonais e, portanto, dependem um do outro. Na pr´oxima se¸c˜ao iremos tratar com mais detalhes a unicidade e as estimativas dos componentes do modelo.
Figura 2.9: Modelo PARAFAC decomposto em matrizes A, B e C
2.2.4.2 Algoritmo PARAFAC-ALS
O modelo PARAFAC pode ser entendido ainda como uma extens˜ao restrita do modelo PCA, cuja base estrutural ´e dada pelas matrizes de pesos A = {air}, B = {bir} e C = {cir}, que contˆem os elementos das trˆes dimens˜oes dos dados. Esse modelo ´e ajustado para minimizar a soma dos quadrados dos res´ıduos eijk, em conformidade com (2.10). Para a resolu¸c˜ao do PARAFAC e a estima¸c˜ao das matrizes A, B e C, utiliza-se o algoritmo dos m´ınimos quadrados alternados (Al- ternating Least Squares - ALS ), que sucessivamente estima os valores de uma das
matrizes de pesos a partir dos valores conhecidos ou estimados das outras matrizes [77], [78]. Esse procedimento ´e vantajoso porque o algoritmo ´e simples para imple- mentar e incorporar restri¸c˜oes, e porque garante convergˆencia [52], apesar de nem sempre apresentar erro m´ınimo global. Entretanto, ´e tamb´em algumas vezes lento e outros tipos alternativos de algoritmos baseado em um problema de autovalor (generalizado) e outras solu¸c˜oes fornecem respostas aproximadas e pode ser visto como adequada alternativa em artigos como os de [23], [45] e [46].
O algoritmo 1 corresponde ao PARAFAC-ALS que converge iterativamente at´e atingir um crit´erio estabelecido ou um n´umero de itera¸c˜oes previamente configu- radas [46]. Os passos do algoritmo na forma gen´erica para um modelo PARAFAC podem ser verificados a seguir na forma de pseudoc´odico, embora outros detalhes estejam em [23], [52] e [46].
Algoritmo 1 PARAFAC-ALS
1: Define-se o n´umero de fatores, R;
2: Passo 1. Inicie B e C;
3: Passo 2. Calcule A por um ajuste de m´ınimos quadrados a partir de X, B e C ⇒ A = XZt(ZZt)−1
, onde Z = (C ⊗ B)t;
4: Passo 3. Calcule B de maneira an´aloga; 5: Passo 4. Calcule C de maneira an´aloga;
6: Passo 5. Retorne ao Passo 2 at´e a convergˆencia.
2.2.4.3 Unicidade do Modelo PARAFAC
O modelo PARAFAC apresenta como uma de suas caracter´ısticas de grande po- tencial de uso a propriedade da unicidade. Diversas aplica¸c˜oes desse modelo s˜ao baseadas nessa propriedade [66], [67] e [68].
Vamos considerar que X seja um tensor com R componentes do modelo PARA- FAC, com componentes matriciais A, B, C, com elementos air, bjr e ckr, respecti- vamente. Agora, assume-se que h´a componentes matriciais ˜A, ˜B, ˜C com elementos ˜
air, ˜bjr, ˜ckr, respectivamente, tais que xijk =
R X
r=1
λr˜air˜bjr˜ckr+ eijk (2.11)
no qual xijk e eijk s˜ao idˆenticos aos valores correspondentes em (2.9). Em seguida, a propriedade da singularidade/unicidade declara que A, B, C s˜ao iguais a ˜A,
˜
B, ˜C, respectivamente, sujeito a permuta¸c˜oes em suas colunas e a fatores de esca- las. A propriedade de singularidade ´e em termos do modelo param´etrico estimado, pois n˜ao h´a qualquer garantia de que o modelo PARAFAC obtenha a “verdadeira” solu¸c˜ao [71]. No entanto, se o modelo ´e especificado corretamente com o n´umero adequado de componentes e a estrutura trilinear PARAFAC ´e aproximadamente v´alida, a solu¸c˜ao proporcionar´a satisfat´orias estimativas dos parˆametros subjacen- tes.
Uma condi¸c˜ao suficiente para o modelo PARAFAC d´a estimativas dos parˆametros originais ´e dada por [69] e depois estendida por [70]. Essa condi¸c˜ao ´e dada por
kA+ kB+ kC >2R + 2 (2.12)
na qual, de acordo com [52], kA, kB e kC s˜ao de k-ranks de componentes matriciais A, B e C, respectivamente, e R ´e o n´umero de componentes do modelo PARA- FAC. As condi¸c˜oes de Kruskal n˜ao s˜ao condi¸c˜oes necess´arias exceto para um R menor do que quatro [71]. A condi¸c˜ao necess´aria para singularidade do modelo PARAFAC com mais de trˆes componentes podem ser vistas em [68] e [67]. Em muitas das situa¸c˜oes encontradas em diversas ´areas da quimiometria, psicometria e telecomunica¸c˜oes, a condi¸c˜ao de Kruskal acima ´e satisfeita e aplic´avel [61]. Desse modo, o modelo PARAFAC fornece estimativas dos parˆametros originais e tamb´em fornece estimativas dos parˆametros f´ısicos subjacentes gerando dados decompostos importantes para a interpreta¸c˜ao e a compreens˜ao de um fenˆomeno escondido na complexidade de um conjunto de dados [74], [70].