Repositório Digital

A- A A+

Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2

.

Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2

Mostrar registro completo

Estatísticas

Título Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2
Autor Bessel, Marina
Orientador Vigo, Álvaro
Data 2010
Nível Graduação
Instituição Universidade Federal do Rio Grande do Sul. Instituto de Matemática. Departamento de Estatística. Curso de Estatística: Bacharelado.
Assunto Link King
Metodos probabilisticos
[en] Linkage
[en] Link king
[en] Probabilistic linkage
Resumo Em muitas investigações, principalmente na área da saúde, é necessário reunir informações sobre indivíduos armazenadas em bases de bancos diferentes, muitas vezes registradas por instituições diferentes. Um aspecto peculiar é que a chave de identificação dos registros nos arquivos de dados, quando existe, não permite fazer uma correspondência entre eles. Para superar estas dificuldades foram desenvolvidas técnicas especiais de relacionamento de registros utilizando campos como nome do indivíduo, nome da mãe, data de nascimento, endereço, etc., para identificar os pares correspondentes. Este método é usualmente chamado de linkagem de registros, podendo utilizar algoritmos determinísticos ou probabilísticos. O objetivo deste trabalho é apresentar os conceitos fundamentais e aplicação da linkagem de registros. Rotinas computacionais em linguagem SAS® foram desenvolvidas para a padronização dos campos e criação de um banco final, usado nas análises. A linkagem foi realizada utilizando o programa Link King. Dois conjuntos de dados hipotéticos foram usados para ilustrar passo a passo os procedimentos de padronização e linkagem. De um total de 4995 registros em cada banco de dados, foram criados corretamente 4746 (95%) pares.
Abstract In many investigations, especially in health, it is necessary to join individual’s information stored in different databases, often recorded by distinct institutions. A peculiar aspect is that the key to identifying the records in the data files, if any, do not allow a match between them. To overcome these difficulties some special techniques have been developed to identify the corresponding pairs using fields such as individual's name, mother's name, birth date or address. This method is usually called record linkage and may use deterministic or probabilistic algorithms. The aim of this work is to present the fundamental concepts of record linkage and of its application. SAS® routines were developed to standardize the fields and also to create the final database used in the analysis. The record linkage was performed using the program Link King. Two hypothetical datasets were used to illustrate step by step procedures of standardization and linkage. From a total of 4995 records in each database, 4746 (95%) of the pairs were correctly created. The main objective of this work is to present the concepts and application of record linkage method. This method can be deterministic or probabilistic, once in the first there is a univocal identifier field which is inexistent on the second. It has been developed computational routines in SAS® language for the fields’ standardization and creation of a final database that can be adapted to any other database. In the application phase, the software used was the Link King together with the developed routines. From a total of 4995 records in each database used in the linkage 4746 (95%) pairs were created correctly.
Tipo Trabalho de conclusão de graduação
URI http://hdl.handle.net/10183/29100
Arquivos Descrição Formato
000775473.pdf (3.529Mb) Texto completo Adobe PDF Visualizar/abrir

Este item está licenciado na Creative Commons License

Este item aparece na(s) seguinte(s) coleção(ões)


Mostrar registro completo

Percorrer



  • O autor é titular dos direitos autorais dos documentos disponíveis neste repositório e é vedada, nos termos da lei, a comercialização de qualquer espécie sem sua autorização prévia.
    Projeto gráfico elaborado pelo Caixola - Clube de Criação Fabico/UFRGS Powered by DSpace software, Version 1.8.1.