Análise preditiva em partidas de League of Legends : aplicação de regressão logística para prever a vitória por jogador
Fecha
2024Autor
Nivel académico
Grado
Tipo
Materia
Resumo
League of Legends é, atualmente, um dos jogos eletrônicos mais populares em escala global. Portanto, possui grande relevância para a cultura e economia do cenário competitivo de jogos eletrônicos, os eSports. Este trabalho tem como objetivo aplicar regressão logística, bem como técnicas de seleção de variáveis e aprendizado de máquina, a fim de identificar variáveis relevantes que impactam diretamente na probabilidade de vitória. A fim de comparar modelos, para a seleção de variáveis foram util ...
League of Legends é, atualmente, um dos jogos eletrônicos mais populares em escala global. Portanto, possui grande relevância para a cultura e economia do cenário competitivo de jogos eletrônicos, os eSports. Este trabalho tem como objetivo aplicar regressão logística, bem como técnicas de seleção de variáveis e aprendizado de máquina, a fim de identificar variáveis relevantes que impactam diretamente na probabilidade de vitória. A fim de comparar modelos, para a seleção de variáveis foram utilizadas dois métodos distintos: regressão por stepwise e um método desenvolvido neste trabalho, nomeado de Método de R2 de Regressão Simples. Os modelos logísticos foram ajustados a dois bancos de dados com observações distintas, referentes a jogadores de níveis de ranque Desafiante e Ouro IV. A seleção destes ranques em específico se deve ao interesse de comparar, entre dois ranques com níveis de habilidade completamente distintos, as variáveis selecionadas pelos modelos ajustados. Estes conjuntos de dados possuem, respectivamente 5.600 e 6.000 observações. Adicionalmente, os bancos foram segmentados, cada um, em banco de treinamento e teste, com proporções de 70% e 30% do banco original, respectivamente. Visto que o primeiro consiste da elite dos jogadores, enquanto o segundo é o ponto de corte de 50% dos jogadores ativos em partidas ranqueadas. Adicionalmente, os modelos treinados em seus respectivos ranques, também foram testados para o outro ranque, a fim de testar sua generalização. Concluiu-se que, para regressão logística, nos dados estudados nesse trabalho, o método de seleção de variáveis via regressão por stepwise, possui um melhor desempenho se comparada à outra técnica que foi desenvolvida. Contudo, o processamento computacional do método de seleção de variáveis via R2 de Regressão Simples é muito mais rápido e atinge bons resultados. Por fim, obteve-se resultados preditivos melhores que os esperados, com modelos que atingem até 85% de acurácia no banco de teste do ranque Desafiante e 82,89% de acurácia no ranque Ouro IV. ...
Abstract
League of Legends is, currently, one of the most popular electronic games on a global scale. Therefore, it holds significant relevance to the culture and economy of the competitive electronic gaming scene, the eSports. This paper aims to apply logistic regression, as well as variable selection techniques and machine learning techniques, in order to identify relevant variables that directly impact the probability of victory. In order to compare models, two different methods were used for variabl ...
League of Legends is, currently, one of the most popular electronic games on a global scale. Therefore, it holds significant relevance to the culture and economy of the competitive electronic gaming scene, the eSports. This paper aims to apply logistic regression, as well as variable selection techniques and machine learning techniques, in order to identify relevant variables that directly impact the probability of victory. In order to compare models, two different methods were used for variable selection: stepwise regression and a method developed in this work, named Simple Regression R2 Method. The logistic models were fitted to two databases with distinct observations, pertaining to players of Challenger and Gold IV rank levels. The selection of these specific ranks is due to the interest in comparing, between two ranks with completely different skill levels, the variables selected by the adjusted models. These datasets contain, respectively, 5,600 and 6,000 observations. Additionally, the databases were segmented, each into training and testing datasets, with proportions of 70% and 30% of the original dataset, respectively. Considering that the first consists of the top players, while the second is the cut-off point for 50% of the active players in ranked matches. Additionally, the models trained in their respective ranks were also tested for the other rank, in order to test their generalization. It was concluded that, for logistic regression, in the data studied in this work, the variable selection method by stepwise regression has a better performance compared to the other technique that was developed. However, the computational processing of the variable selection method by simple regression R2 is much faster and achieves good results. Finally, better than expected predictive results were obtained, with models that achieve up to 85% accuracy in the test dataset of the Challenger rank and 82.89% accuracy in the Gold IV rank. ...
Institución
Universidade Federal do Rio Grande do Sul. Instituto de Matemática e Estatística. Curso de Estatística: Bacharelado.
Colecciones
-
Tesinas de Curso de Grado (36942)Tesinas Estadística (290)
Este ítem está licenciado en la Creative Commons License