TCC Estatística
http://hdl.handle.net/10183/26438
2024-03-29T01:00:58ZUma aplicação do modelo de Processamento de Linguagem Natural BERT para classificação de notícias falsas
http://hdl.handle.net/10183/267734
Uma aplicação do modelo de Processamento de Linguagem Natural BERT para classificação de notícias falsas
Saul, Gabriel Holmer
O aumento contínuo da geração e armazenamento de dados de texto, somado ao expressivo aumento do poder computacional, trouxe a necessidade de se ajustar modelos estatísticos mais complexos, provocando uma demanda substancial por métodos da área de Processamento de Linguagem Natural (NLP). As técnicas de NLP podem ser aplicadas em um vasto número de tarefas, como tradução de máquina, análise de sentimento e classificação de texto. Dentre estas tarefas, destaca-se a detecção automatizada de notícias falsas, também chamadas de fake news, que são cada vez mais presentes na sociedade com o advento de programas de computadores capazes de gerar e disseminar notícias falsas entre diversos meios de comunicação. Para combater a propagação de fake news, é possível utilizar o modelo de NLP BERT, que é capaz de representar o significado semântico e sintático de uma palavra a partir do seu contexto. Neste trabalho, é feita uma aplicação do modelo BERT para determinar se uma notícia específica de língua inglesa é falsa ou não, analisando a descrição textual de seu título. O banco de dados utilizado contém 72.134 notícias, já categorizadas entre verdadeiras e falsas, que foram extraídas de diferentes portais. Os resultados apontam para um bom desempenho do modelo ajustado, o que pode contribuir no combate à desinformação e auxiliar estudos futuros na área.; The continuous increase in the generation and storage of text data, added to the significant increase in computational power, brought the need to fit more complex statistical models, causing a substantial demand for methods in the field of Natural Language Processing (NLP). NLP techniques can be applied to a vast number of tasks, such as machine translation, sentiment analysis and text classification. Among these tasks, the automated detection of fake news stands out, which are increasingly present in society with the advent of computer programs capable of generating and disseminating fake news among various means of communication. To combat the spread of fake news, it is possible to use the BERT NLP model, which is capable of representing the semantic and syntactic meaning of a word from its context. In this work, an application of the BERT model is made to determine whether a certain news article in English is fake or not, analyzing the textual description of its title. The dataset used contains 72,134 news, already categorized between true and false, which were extracted from different portals. The results point to a good performance of the adjusted model, which can contribute to the fight against misinformation and help future studies in the area.
2023-01-01T00:00:00ZAnálise espacial de cardiopatias congênitas no Rio Grande do Sul
http://hdl.handle.net/10183/267727
Análise espacial de cardiopatias congênitas no Rio Grande do Sul
Silva, Bruno Alano da
Resumo não disponível.
2023-01-01T00:00:00ZComparação de medidas de risco na otimização de portfólios
http://hdl.handle.net/10183/267712
Comparação de medidas de risco na otimização de portfólios
Wilsmann, Thomas Wittmann
Este estudo investiga alternativas à Teoria Moderna de Portfólio de Harry Markowitz, reconhecendo suas limitações em cenários de mercado desafiadores. Focalizamos a análise nas medidas de risco Second Lower Partial Moment (SLPM) e Conditional Value-at-Risk (CVaR) e, em consonância com a preocupação pela aversão a grandes perdas, incorporamos o Maximum Drawdown (MDD). Realizamos uma análise empírica abrangente com ações do Ibovespa no período de 2009 a 2019, comparando diversas estratégias com o Global Minimum Variance Portfolio (GMVP) e o benchmark Equal-Weight Portfolio (EWP). Os resultados destacam que estratégias fundamentadas em SLPM e MDD superaram consistentemente o benchmark em termos de rentabilidade e métricas de avaliação de risco, emergindo como alternativas promissoras para investidores e gestores de portfólio em contextos desafiadores de mercado.; This study explores alternatives to Harry Markowitz's Modern Portfolio Theory, recognizing its limitations in challenging market scenarios. We focus our analysis on the risk measures Second Lower Partial Moment (SLPM) and Conditional Value-at-Risk (CVaR) while, in line with the concern for aversion to large losses, we also incorporate the Maximum Drawdown (MDD). Through a comprehensive empirical analysis spanning the period from 2009 to 2019 and involving stocks listed in the Ibovespa index, we rigorously compare various investment strategies with both the Global Minimum Variance Portfolio (GMVP) and the Equal-Weight Portfolio (EWP) benchmark. The results consistently underscore that strategies rooted in SLPM and MDD not only outperformed the benchmark but also demonstrated superior profitability and risk mitigation, thus emerging as highly promising alternatives for investors and portfolio managers seeking resilience and excellence in the face of challenging market conditions.
2023-01-01T00:00:00ZAplicação de modelos de crédito utilizando pacotes do R
http://hdl.handle.net/10183/262076
Aplicação de modelos de crédito utilizando pacotes do R
Radin, Tiago Luigi Guadagnin
O mercado de crédito no Brasil vem crescendo constantemente ao longo dos últimos anos, dessa maneira, é essencial saber quais clientes irão pagar seus créditos, para mitigar gastos com inadimplentes e assim poder oferecer melhores ofertas de crédito aos bons pagadores. Atualmente são utilizados modelos de pontuação de crédito para auxiliar nessa decisão e com o avanço da tecnologia os softwares de programação ganharam espaço importante para a construção dos modelos. O software R é hoje um dos principais programas utilizados para realizar análises de credit scoring e nele constantemente são adicionados códigos para auxiliar nessa tarefa. Assim, o presente trabalho tem como objetivo apresentar alguns dos pacotes disponíveis no R e suas funções e quais seriam indicados para percorrer todas as etapas de construção de um modelo de crédito. Inicialmente é realizada uma revisão da literatura, mostrando a importância do software R para os modelos de pontuação de risco de crédito. Na sequência é apresentado um exemplo prático de modelo, passando por todas as etapas de construção do mesmo: (i) Delimitação da População; (ii) Seleção da Amostra; (iii) Análise Preliminar; (iv) Construção do Modelo; (v) Escolha do Modelo; (vi) Passos para Implantação. Por fim, são expostas todas as funções e pacotes utilizados para a realização do exemplo prático. Conclui-se que existem diversas peculiaridades para implementar um modelo de pontuação de risco de crédito e que, além de programar, é necessário conhecer a empresa e o mercado que se está querendo modelar, a fim de encontrar os melhores resultados.; The credit market in Brazil has been growing steadily over the last few years, so it is essential to know which customers will pay their credits to mitigate expenses with defaulters and thus be able to offer better credit offers to good payers. Currently, credit assessment models are used to assist in the decision and with the advancement of technology, programming software has gained important space for the construction of models. The R software is today one of the main programs used to perform credit score analysis and codes are constantly added to auxiliary tasks in this task. Thus, the present work aims to present some of the packages available in R and their functions and which ones would be indicated to go through all the stages of building a credit model. Initially, a literature review is carried out, showing the importance of the R software for credit risk assessment models. Next, a practical example of a model is presented, going through all the stages of its construction: (i) Population delimitation; (ii) Sample Selection; (iii) Preliminary Analysis; (iv) Model Construction; (v) Choice of Model; (vi) Steps for Implementation. Finally, all the functions and packages used to carry out the practical example are exposed. It is concluded that there are several peculiarities to implement a credit risk scoring model and that, in addition to programming, it is necessary to know the company and the market that one is trying to model, in order to find the best results.
2023-01-01T00:00:00Z