ŞEYH GÂLİB DİVANINDA NEY
C- Âşık: Ney büyük Mevlevî üstadı Şeyh Galib’e göre, her durumda âşık-ı sâdıka
Como última avaliação desenvolvida para esta proposta decidiu-se pela comparação das propostas de decisão de roteamento em tempo de execução e em tempo de projeto. Conduziu-se dois experimentos, ambos comparando resultados de latência média, que serão melhor descritos a seguir.
Neste contexto foi desenvolvida uma nova NoC, aqui chamada AVAL, onde implementou-se quase todas especificações da NoC Hermes, exceto para o esquema de roteamento, modificando para aceitar roteamento na origem, conforme a especificação assumida para a NoC Hermes-SR (Seção 3.1). A NoC AVAL atende as configurações definidas no início deste Capítulo na Seção 4.1.1 para a simulação. Assim, a única diferença entre a NoC AVAL e a NoC Hermes é o esquema de ro- teamento. Já entre a NoC AVAL e a NoC Hermes-SR a única diferença é o esquema de arbitragem.
O primeiro experimento assumiu um cenário de tráfego todos para todos onde as origens de comunicação injetam tráfego a 30% da capacidade dos canais da NoC (i.e. 240 Mbps). É compa- rado o desempenho do emprego dos algoritmos de roteamento apresentados no contexto deste
trabalho quando do seu uso em tempo de execução (TExec) e tempo de projeto (TProj), este último representado pelos cenários de rotas. TExec é representado pela NoC Hermes, enquanto TProj é representado pela NoC AVAL. Tamanhos diferentes de fila de armazenamento foram utilizados du- rante a simulação deste experimento para adicionalmente permitir a avaliação dos potencias ga- nhos na redução de latência para ambas as abordagens. Detalhado na Figura 4.15, todas decisões em TProj com os algoritmos nfnm e nfm levaram a latências maiores quando comparadas as deci- sões em TExec com os mesmos algoritmos. A exceção foi para em um caso que resultou em ganho para a decisão em TProj (1,12% - aproximadamente 350 ciclos de relógio mais rápido em média) sobre TExec quando assumido o algoritmo nfm e fila de armazenamento de tamanho igual a 4. Pa- ra o restante dos algoritmos de roteamento, as decisões em TProj garantiram redução na latência média em todos os casos quando comparada as decisões TExec. Os bons resultados obtido com os algoritmos West first e North last para decisões em TProj tem três explicações. A primeira é o grau de liberdade provido por estes quando comparado ao negative first durante o processo de mape- amento de rotas, conforme explicações da Seção 3.2. A segunda explicação é o conhecimento glo- bal da carga dos canais de rede quando planejadas as rotas a serem utilizadas pelos pares comuni- cantes. A terceira é a má decisão que pode ser tomadas em TExec, visto que o julgamento da dire- ção a ser tomada baseia-se em informação de ocupação disponível localmente, o que pode desviar pacotes para regiões de maior concentração de tráfego.
Conforme pode ainda ser visto na Figura 4.15, as decisões em TExec atingiram latências menores quando comparando-se os algoritmos wfnm ao nlnm e wfm ao nlm. Todavia, quando os cenários de rotas são definidos, ou seja, em TProj, as vantagens comparadas anteriormente se in- vertem, sendo atingidas as menores latências comparando-se nlnm ao wfnm e nlm ao nlnm.
O segundo experimento combina todas as abordagens exploradas nos este capítulo de re- sultados, avaliando as decisões arquiteturais (i.e. arbitragem centralizada/distribuída e roteamento em tempo de execução ou em tempo de projeto). Adicionalmente, ele permite medir a eficiência do planejamento de rotas. Para tanto, o cenário de tráfego hotspot é novamente utilizado, sendo que as origens dos pares comunicantes injetam pacotes a 10% da capacidade dos canais de rede. A Tabela 4.5 apresenta as latências médias computadas a partir da simulação. Às infraestruturas de comunicação foram empregadas filas de armazenamento de tamanho igual a 4.
Para os valores apresentados na primeira linha da Tabela 4.5, apenas as decisões arquitetu- rais podem ser avaliadas, visto que as mesmas rotas são usadas durante a transmissão dos pacotes pelas NoCs (i.e. xy). Comparando-se a primeira e a segunda colunas da primeira linha, pode ser vis- to que não houve ganho quando da escolha esquema de roteamento definido em tempo de execu- ção e tempo de projeto. Já a escolha da arbitragem distribuída permitiu ganhos de até 40% na re- dução de latência quando comparada a abordagem centralizada, comparando-se a terceira coluna com as duas primeiras na primeira linha da tabela. Quando comparando-se a primeira e a segunda colunas para as demais linhas da tabela, pode-se observar a eficiência do planejamento de rotas em tempo de execução e das decisões tomadas em tempo de execução. O experimento mostrou reduções de latência de 24,93% (nlnm) até 73,87% (nlm) quando definidos os cenários de rotas. Adicionalmente, pode-se notar o benefício da combinação do planejamento de rotas e da arbitra- gem distribuída, suportada pela Hermes-SR. Comparando-se os resultados obtidos para este expe- rimento para a NoC Hermes e para a NoC Hermes-SR, obteve-se reduções de até 10,99 vezes a la- tência média de transmissão de pacotes para esta última infraestrutura de comunicação. Como esperado, os resultados apresentados naquela tabela mostraram que o algoritmo xy levou ao de- sempenho menos otimizado quando usado como base de computação do cenário de rotas.
Decisões de roteamento em tempo de execução (TExec) Versus
Decisões de roteamento em tempo de projeto (TProj)
TExec TProj TExec TProj TExec TProj TExec TProj TExec TProj TExec TProj
nfnm nfm wfnm wfm nlnm nlm L a tê n c ia m é d ia ( c ic lo s d e r e ló g io )
NoC Hermes
(TExec)vs NoC AVAL
(TProj)Tabela 4.5 – Comparação da latência média das NoCs (em ciclos de relógio)
Hermes AVAL Hermes-SR
xy 15 047.06 15 047.06 8 746.96 nfnm 3 364.56 1 894.57 582.29 nfm 4 443.94 1 697.26 567.06 wfnm 5 148.44 3 676.78 1 095.43 wfm 11 081.46 5 344.77 2 382.24 nlnm 2 730.85 2 050.10 754.18 nlm 8 053.11 2 103.99 733.06 4.4 CONSIDERAÇÃO FINAL
No presente Capítulo foram apresentados resultados de estimativa e simulação de trans- missão de pacotes. No primeiro experimento, uma comparação de latências e ocupação de área foi realizada entre a NoC Hermes-SR e a NoC Hermes, sendo que a primeira proveu diminuição das latências sobre a segunda, porém consumiu mais área em FPGA. No segundo experimento, foram encontrados resultados encorajadores sobre a adoção de caminhos alternativos gerados a partir de algoritmos adaptativos, oferecendo em alguns cenários ganhos de desempenho da ordem de 45 a 75 vezes maior que nas rotas definidas pelo algoritmo xy. No terceiro experimento, conduziu-se uma comparação de desempenho entre abordagens de decisão de roteamento em tempo de exe- cução e tempo de projeto, finalizando por uma comparação da combinação de esquemas distintos de roteamento e arbitragem. Para o primeiro, observou-se vantagens na maioria dos casos en- quanto que para o segundo, a combinação da arbitragem com o planejamento de rotas mostrou-se muito eficaz no aumento de desempenho da infraestrutura de comunicação.