4.1. Nitel Araştırma Verilerine İlişkin Bulgular
4.1.5. Öğretmen ve Yöneticilerin Hayalleri
O relacionamento de base de dados é uma ferramenta utilizada em muitos países do mundo, sobretudo nos mais desenvolvidos. Entre os tipos de relacionamento utilizados, há: o relacionamento das mesmas pessoas em uma única base de dados, para criar históricos de saúde; o relacionamento de dados de coortes; o relacionamento de dados de referências geográficas para adicionar novas informações na cartografia; o relacionamento como parte de um ambiente do sistema operacional (exemplo de registros de câncer); e o relacionamento para adicionar variáveis analíticas (FAIR, 1999). Além disso, há trabalhos com dados provenientes de diferentes fontes de dados e que podem corresponder a estatísticas vitais, censos, dados administrativos e surveys, com o objetivo de melhorar a qualidade e consistências dos dados, preparar registros específicos para estudar doenças, acompanhar coortes para determinar status vitais do indivíduo e atividades habituais, construir estruturas de amostragem, e estudar histórias genealógicas ou históricas. (SMITH, 1985; GOLDACRE, 1987; GILL e BALDWIN, 1987; JENSEN, 2004).
O relacionamento de dados tem sido extensivamente utilizado em vários países na área da saúde, especificamente nos estudos epidemiológicos (como a saúde infantil e Neoplasias) (Machado, 2002). Esta metodologia tem aplicação também em outras áreas, como no
marketing, relacionando dados para administrar a fidelidade dos clientes de um produto no
mercado, descoberta de fraude e data warehousing. As entidades do governo também utilizam o relacionamento de dados para executar leis, regulamentos e políticas. Todas estas aplicações podem ser classificadas como “administrativas”, porque o relacionamento é utilizado para fazer decisões e ações relacionadas com uma entidade individual (FAIR, 1999?).
Nas últimas décadas o Canadá e os Estados Unidos têm fomentado um sistema similar de acompanhamento das causas de mortalidade, utilizando o relacionamento de dados. Países escandinavos, como a Noruega, Suécia, Dinamarca, e Finlândia, também têm aproveitado a utilização de procedimentos de relacionamentos de bases de dados para o acompanhamento de indivíduos durante vários anos com vários objetivos específicos, tomando como base o número de identificação individual emitido aos residentes no momento do nascimento. No Reino Unido, durante vários anos, atividades semelhantes utilizaram um número de serviços para a saúde nacional como identificador, com o
objetivo de pesquisar a incidência de câncer e a mortalidade. Além disso, há mais de dez anos foram desenvolvidos sistemas de relacionamento de dados complexos, e/ou em alguns casos estão sendo desenvolvidas ferramentas computacionais de relacionamento de dados em países como a Austrália, França, Índia, Israel, Japão, e a antiga União Soviética (M. Carpenter, Estatísticas da Canadá, Ottawa, Ontario, pessoal de comunicação da Canadá, 1998)11
2.4.1 Evidências do relacionamento de bases de dados aplicadas no Brasil.
No caso brasileiro, os trabalhos de relacionamento de dados probabilísticos (e alguns determinísticos) foram realizados na área da saúde. O relacionamento probabilístico foi especialmente aproveitado nos estudos da mortalidade infantil (MACHADO, 2002).
Dentre os primeiros trabalhos que se discute o relacionamentos de dados “record linkage” com funções automáticas, aponta-se o de Noronha et al (1997), em que é feita uma comparação entre os sistemas de informações de mortalidade e de nascidos vivos para analisar o grau de concordância do preenchimento de dados comuns a eles e recuperação de informações. Para isto utilizou-se um relacionamento automático e determinísticos dos registros de nascimentos pertencentes à coorte de nascidos de 1998 e cujas mães residiam no município de Rio de Janeiro (MACHADO, 2002).
Almeida e Jorge (1996) relacionaram as informações do SIM e do SINASC, para estudo de mortalidade neonatal, com possibilidade de determinação de medidas de risco para os nascidos vivos. Este estudo foi realizado no município de Santo André, Região Metropolitana de São Paulo, Brasil.
Fernandes (1997) fez um relacionamento de informações sobre óbitos e nascimentos, partindo, inicialmente, da localização manual dos registros. Neste trabalho considerou os nascidos em 1989, 1990 e 1991 de Brasília-DF, comparandor o nome da mãe em ambas as bases de dados, de forma manual.
11 No ANEXO I são apresentados alguns trabalhos que tratam do relacionamento de bases de dados nos paises desenvolvidos.
Carvalho e Mello et al (1998), com o objetivo de analisar a sobrevida em pacientes hospitalizados por Acidentes Vasculares Encefálicos (AVE), realizaram o relacionamento entre a base contendo os 6531 casos de AVE identificados na base de dados dos formulários AIH e os bancos das DO de 1998 (110.820 óbitos, por todas as causas) e de 1999 (105.644 óbitos, por todas as causas). O método probabilístico foi escolhido por não ter um campo identificador unívoco entre os bancos de referência (como por exemplo, o campo CPF, normalmente não preenchido), o que não possibilita a busca direta pelo caso. Os campos utilizados para o relacionamento foram nomes, data de nascimento e sexo.
Bohland (2003) utilizou em seu estudo as informações do SIM, SINASC, SIH e Sistema de Informação da Atenção Básica para melhorar a qualidade da informação sobre óbitos de mulheres em idade reprodutiva.
Os trabalhos anteriormente mencionados foram feitos utilizando um relacionamento exato. Outros trabalhos relacionando informações de registros entre os registros de mortes e os de nascimento também foram realizados, mas neste caso por meio do relacionamento probabilístico.
Machado (2002) utilizou o relacionamento probabilístico de registros das bases de dados de SIM e SINASC para estudo da morbi-mortalidade infantil. No estudo identificou todos os nascimentos da cidade de São Paulo durante 1998, extraindo 209.628 registros de nascimento. Depois de ter a informação combinada, Machado fez uso da regressão logística multivariada para ajustar o efeito de cada variável independente sobre o escore de Apgar indicando: menos de sete a um minuto e menos de sete a cinco minutos.
Coeli et al. (2003) utilizaram o relacionamento probabilístico para obter a concordância entre a informação de internação hospitalar obtida por inquérito domiciliar e o registro hospitalar da internação mencionada. Este estudo contou com um total de 2.288 entrevistas domiciliares que foram realizadas em Duque de Caxias, Rio de Janeiro. As informações sobre a ocorrência de ao menos uma hospitalização durante o ano que precedeu a entrevista foi obtida de um total de 10.733 moradores. Os 130 registros de moradores que relataram ao menos uma hospitalização na rede pública foram relacionados a uma base de dados hospitalares contendo 801.587 registros.
Por último, um trabalho em que se utilizou o processo de relacionamento de base de dados é de Miranda-Ribeiro (2007), trabalho este que utiliza o processo de relacionamento para a
reconstrução de história de nascimentos, com o objetivo de tornar completa a história de nascimentos das mulheres entre 15 e 64 anos de idade, para os quinze anos anteriores ao censo ou pesquisa. Especificamente o relacionamento, consiste em buscar, no universo de histórias de nascimentos completos, aquela que mais se aproxima da história de nascimentos parcial, com base na comparação de algumas variáveis (MIRANDA- RIBEIRO, 2007).