Mostrar registro simples

dc.contributor.advisorHeuser, Carlos Albertopt_BR
dc.contributor.authorBohm, Luiz Fernandopt_BR
dc.date.accessioned2010-10-14T04:19:21Zpt_BR
dc.date.issued2010pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/26350pt_BR
dc.description.abstractO presente trabalho consiste na elaboração de uma estratégia de deduplicação de dados utilizando técnicas de blocagem e algoritmos fonéticos em um cadastro hospitalar de pacientes. A chave de blocagem que apresenta a maior qualidade é a chave que utiliza os algoritmos fonéticos Soundex em conjunto com o BuscaBR, aplicados ao nome da mãe do paciente. Todos os passos realizados na preparação da base de dados de testes, no préprocessamento dos dados, na deduplicação dos registros da base de dados completa e todas as métricas utilizadas na análise da qualidade dos resultados estão detalhados. Como resultado deste trabalho é apresentada a estratégia de deduplicação que maximiza a quantidade de registros duplicados encontrados em uma base de dados de testes previamente avaliada, assim como o conjunto de registros possivelmente duplicados que foram encontrados na base de dados completa. Também são analisadas propostas adicionais para melhorar o desempenho e a qualidade do processo de blocagem e deduplicação.pt_BR
dc.description.abstractThis work consists in elaborating a record linkage strategy using blocking techniques and phonetic algorithms on a hospital patient’s database. The blocking key with the highest quality was the key using the phonetic algorithms Soundex combined with the BuscaBR, applied on the patient mother’s name. All the steps taken in preparing the test database, pre-processing of data, in the record linkage of the complete database and all the metrics used in analyzing the quality of the results are detailed. As a result of this work is presented the record linkage strategy that maximizes the amount of duplicate records found in the test database previously evaluated, as well as possibly duplicate set of records that were found in the complete database. Besides, additional proposals are analyzed to improve the performance and quality of the blocking and record linkage process.en
dc.format.mimetypeapplication/pdf
dc.language.isoporpt_BR
dc.rightsOpen Accessen
dc.subjectInformática médicapt_BR
dc.subjectRecord linkageen
dc.subjectBanco : Dadospt_BR
dc.subjectBlockingen
dc.subjectSoundexen
dc.subjectBuscaBRen
dc.titleElaboração de uma estratégia de deduplicação de dados utilizando técnicas de blocagem em um cadastro hospitalar de pacientespt_BR
dc.title.alternativeElaborating a record linkage strategy using blocking techniques on a hospital patients database en
dc.typeTrabalho de conclusão de graduaçãopt_BR
dc.identifier.nrb000757805pt_BR
dc.degree.grantorUniversidade Federal do Rio Grande do Sulpt_BR
dc.degree.departmentInstituto de Informáticapt_BR
dc.degree.localPorto Alegre, BR-RSpt_BR
dc.degree.date2010pt_BR
dc.degree.graduationCiência da Computação: Ênfase em Ciência da Computação: Bachareladopt_BR
dc.degree.levelgraduaçãopt_BR


Thumbnail
   

Este item está licenciado na Creative Commons License

Mostrar registro simples