4. SANAL MİMARİ TASARIM STÜDYOSUNDA PEDAGOJİK YAKLAŞIMLAR
4.4. Sanal Mimari Tasarım Stüdyosunda Öğretim Üyesi ve Öğrenci
A metodologia deste trabalho é baseada no CRISP-DM, no que tange o processo de coleta, tratamento e processamento dos dados, a qual é apresentada visualmente em seis etapas, conforme a Figura 6. Estas etapas serão descritas a seguir.
Figura 6 - Processo de coleta, tratamento e processamento dos dados Fonte: O autor
3.4.1 Entendimento do negócio
Os conhecimentos necessários para a coleta de dados são adquiridos na fase do entendimento do negócio. O conhecimento sobre a necessidade dos investimentos em imóveis realizado pelos fundos de pensão e a descoberta de índices econômicos que possam ser utilizados no processamento dos dados se caracteriza como fator importante para o processo. Se mal realizado, o entendimento do negócio pode ocasionar uma repetição em fases posteriores que necessitam de avaliação do processo.
3.4.2 Coleta de dados
Com o conhecimento adquirido na fase do entendimento de negócio, é possível iniciar o processo de coleta de dados. Nesta fase é definida a utilização de duas fontes de dados. A fonte primária sendo a própria Fundação CERES, que forneceu os dados referentes aos
imóveis em questão. Para o papel de fonte secundária, foi selecionado o portal IPEAData7,
base de dados macroeconômicos, financeiros e regionais do Brasil mantida pelo IPEA.
3.4.3 Preparação dos dados
A fase de preparação de dados é referente à formatação dos dados em arquivos específicos para a utilização do software de processamento. Este processo deve levar em consideração a formatação dos dados recebidos pela Fundação CERES, as conversões necessárias para os arquivos específicos, incluindo formatações em relação aos delimitadores de numerais e de decimais.
3.4.4 Parametrização da rede neural artificial
A parametrização da RNA é realizada baseada nos Teoremas de Kolmogorov, cujo é utilizado para o desenvolvimento da RNA em relação ao número de camadas ocultas (AZEVEDO, BRASIL, OLIVEIRA, 2000) e no Teorema de Eberhart, o qual é utilizado para o desenvolvimento da RNA em relação ao número de neurônios da camada oculta (AZEVEDO, BRASIL, OLIVEIRA, 2000). Nesta etapa são definidos os parâmetros relativos ao software de processamento, tais como as taxas de aprendizagem, de momento, de erro, de aprendizagem, os tipos de paradas no processo de aprendizagem da RNA, seja por validação
ou por erro de treinamento e condições de paradas personalizadas em casos de aumento da taxa de erro. São definidas as quantidades de registros para validação e treinamento, de acordo com limitações impostas pelo software de processamento.
O processo de treinamento das RNAs é iniciado logo após todos os ajustes mencionados anteriormente. Este processo pode durar de simples segundos até horas. Por esta razão é aconselhável aplicar condições de paradas personalizadas para o caso das taxas de erros tenham algum tipo de aumento. È aconselhável também acompanhar a evolução da curva de treinamento, cuja finalidade é de verificar se os ajustes foram executados de forma otimizada. Caso a curva tenha um comportamento ascendente, sugere-se executar novas personalizações nos parâmetros com vista a um novo treinamento.
Além do processo de validação realizado pelos registros internos da RNA, faz-se necessário um processo extra de validação, visto que o tema financeiro é de suma importância para a Fundação CERES. Este processo, neste trabalho, é denominado de Processo de Validação de Treinamento de RNA. É proposto um treinamento da RNA levando em consideração d -1, onde d é a quantidade de registros destinados a um único imóvel, sendo que o registro que será descartado é o último registro do conjunto de dados.
Após o treinamento da etapa do Processo de Validação de Treinamento de RNA, deve ser realizada uma query a RNA, ou simplesmente, é inserido um novo registro, com o intuito de questionar a RNA sobre qual seria a resposta sobre um conjunto de dados. Para este processo de validação de treinamento de RNA, é comparado a query realizada pela RNA com os dados fornecidos pela Fundação CERES relativos ao ano de 2006.
Satisfeitas todas as condições anteriormente mencionadas, a RNA está preparada para o processo de predição dos índices de valorização ou desvalorização do referido empreendimento referente ao ano de 2007. Nesta etapa foram utilizadas previsões de dados econômicos, executados pela Pesquisa Focus do BACEN no período entre o final do mês de julho e início de agosto de 2007, com os seguintes índices:
• Dólar Médio Anual = 1,96
• IPCA Médio Anual = 3,75
• SELIC Média Anual = 11,84
Para reforçar a confiabilidade dos dados previstos, serão realizadas previsões aos anos de 2005 e 2004. Este processo visa apenas reafirmar a validação realizada em relação ao ano de 2006.
3.4.5 Avaliação dos resultados
Os índices previstos para o ano de 2007, juntamente com o Processo de Validação de Treinamento de RNA e o Treinamento da RNA, foram avaliados de forma que todos esses eventos sejam aprovados para a próxima fase ou para retorno à fase de entendimento do negócio ou para parametrização da RNA. Foi estabelecido que o Processo de Validação de Treinamento de RNA será aceito como válido caso sua taxa de erro, em relação aos dados fornecidos pela Fundação CERES relativos ao ano de 2006, for inferior a 5%. Caso este índice for superior a 5%, é recomendável que o processo seja reiniciado na fase do entendimento do negócio.
3.4.6 Execução e geração de relatórios
Nesta fase foram gerados os relatórios de acordo com as informações preditas nas fases anteriores. Existem vários modelos de relatórios, sendo que neste trabalho será gerado apenas um modelo comparativo de acordo com os índices utilizados. Esses relatórios foram gerados de acordo com a necessidade da diretoria da Fundação CERES, agregando informações necessárias para o processo de tomada de decisão.