Mostrar registro simples

dc.contributor.advisorGomes, Adriano de Araújopt_BR
dc.contributor.authorCanova, Luciana dos Santospt_BR
dc.date.accessioned2024-03-22T05:07:05Zpt_BR
dc.date.issued2023pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/274079pt_BR
dc.description.abstractO algoritmo de Projeções Sucessivas (APS), também conhecido em inglês como SPA, foi desenvolvido com o propósito de selecionar um subconjunto de variáveis informativas e minimamente redundantes para a construção de modelos de regressões lineares múltiplas (MLR). Esse método visa minimizar o impacto da multicolinearidade, que é comumente presente em dados instrumentais, ao mesmo tempo em que alcança uma melhor acurácia na previsão. A combinação do APS com o MLR, como uma abordagem de seleção variável/calibração multivariada, resultou no método APS-MLR, o qual tem sido relatado na literatura como capaz de produzir modelos com boa capacidade de previsão em comparação com os modelos convencionais de "espectro completo" via mínimos quadrados parciais (PLS), em alguns casos. Neste trabalho, é proposta a adição de uma etapa de filtro (f) à versão atual do algoritmo APS, a fim de reduzir o número de variáveis não informativas antes da fase de projeção. Essa adição auxilia o algoritmo na seleção das melhores variáveis nas etapas subsequentes. O algoritmo resultante, denominado de fAPS-MLR, é avaliado em dois estudos de caso que envolvem dados de espectroscopia no infravermelho próximo: (i) quantificação do ingrediente farmacêutico ativo (IFA) em comprimidos e (ii) quantificação de biodiesel em misturas diesel/biodiesel. Comparados com o método PLS, os modelos fAPS-MLR demonstram desempenho semelhante ou superior. Além disso, os modelos fAPS-MLR superam o APS-MLR original tanto na validação cruzada quanto na previsão externa. Independentemente do algoritmo de pré-processamento testado, incluindo primeira derivada Savitzky-Golay (SG) e Standard Normal Variate (SNV), ou mesmo em dados de espectros brutos, os modelos fAPS-MLR oferecem resultados superiores.pt_BR
dc.description.abstractThe Successive Projection Algorithm (APS), also known in English as SPA, was developed with the purpose of selecting a subset of informative and minimally redundant variables for the construction of multiple linear regression models (MLR). This method aims to minimize the impact of multicollinearity, which is commonly present in instrumental data, while achieving better forecast accuracy. The combination of APS with MLR, as a variable selection/multivariate calibration approach, resulted in APS-MLR method, which has been reported in literature as capable of producing models with good predictive ability compared to conventional models of "full spectrum" via Partial Least Squares (PLS) in some cases. In this work, it is proposed to add a filter step (f) to the current version of APS algorithm, to reduce the number of non-informative variables before projection phase. This addition assists the algorithm in selecting the best variables in subsequent steps. The resulting algorithm, called fAPSMLR, is evaluated in two case studies involving near-infrared spectroscopy data: (i) quantification of the active pharmaceutical ingredient (IFA), also known in English as API, in tablets and (ii) quantification of biodiesel in diesel/biodiesel blends. Compared with the PLS method, fAPS-MLR models demonstrate similar or superior performance. Furthermore, fAPS-MLR models outperform the original APS-MLR in both crossvalidation and external prediction. Regardless of the tested pre-processing algorithm, including Savitzky-Golay (SG) First Derivative and Standard Normal Variate (SNV), or even on raw spectral data, fAPS-MLR models deliver superior results.en
dc.format.mimetypeapplication/pdfpt_BR
dc.language.isoporpt_BR
dc.rightsOpen Accessen
dc.subjectVariable selectionen
dc.subjectSeleção de variáveispt_BR
dc.subjectRegressão linear múltiplapt_BR
dc.subjectSuccessive projections algorithmen
dc.subjectRegressão por mínimos quadrados parciais (PLS)pt_BR
dc.subjectMultilinear regressionen
dc.subjectEspectrometria no infravermelhopt_BR
dc.subjectPartial least squares, NIR spectrometryen
dc.titleUma versão aprimorada do algoritmo de projeções sucessivas para seleção de variáveis em regressão linear múltiplapt_BR
dc.typeDissertaçãopt_BR
dc.identifier.nrb001195497pt_BR
dc.degree.grantorUniversidade Federal do Rio Grande do Sulpt_BR
dc.degree.departmentInstituto de Químicapt_BR
dc.degree.programPrograma de Pós-Graduação em Químicapt_BR
dc.degree.localPorto Alegre, BR-RSpt_BR
dc.degree.date2023pt_BR
dc.degree.levelmestradopt_BR


Thumbnail
   

Este item está licenciado na Creative Commons License

Mostrar registro simples