REVISTACIENTIFICAMULTIDISCIPLINARNUCLEODOCONHECIMENTO

Revista Científica Multidisciplinar

Pesquisar nos:
Filter by Categorias
Administração
Administração Naval
Agronomia
Arquitetura
Arte
Biologia
Ciência da Computação
Ciência da Religião
Ciências Aeronáuticas
Ciências Sociais
Comunicação
Contabilidade
Educação
Educação Física
Engenharia Agrícola
Engenharia Ambiental
Engenharia Civil
Engenharia da Computação
Engenharia de Produção
Engenharia Elétrica
Engenharia Mecânica
Engenharia Química
Ética
Filosofia
Física
Gastronomia
Geografia
História
Lei
Letras
Literatura
Marketing
Matemática
Meio Ambiente
Meteorologia
Nutrição
Odontologia
Pedagogia
Psicologia
Química
Saúde
Sem categoria
Sociologia
Tecnologia
Teologia
Turismo
Veterinária
Zootecnia
Pesquisar por:
Selecionar todos
Autores
Palavras-Chave
Comentários
Anexos / Arquivos

Modelo para a predição de resultados de partidas de futebol

RC: 128731
1.201
5/5 - (31 votes)
DOI: ESTE ARTIGO AINDA NÃO POSSUI DOI
SOLICITAR AGORA!

CONTEÚDO

ARTIGO ORIGINAL

PADILHA, Juliano Bitencourt [1], RIES, Lisandra Kittel [2]

PADILHA, Juliano Bitencourt. RIES, Lisandra Kittel. Modelo para a predição de resultados de partidas de futebol. Revista Científica Multidisciplinar Núcleo do Conhecimento. Ano. 07, Ed. 10, Vol. 01, pp. 94-102. Outubro de 2022. ISSN: 2448-0959, Link de acesso: https://www.nucleodoconhecimento.com.br/matematica/predicao-de-resultados

RESUMO

Buscando prever o futuro, modelos matemáticos são desenvolvidos nas mais diversas áreas, o que inclui competições esportivas. Esses, parametrizados a partir de dados históricos e com a inserção de dados de entrada, apresentam probabilidades de eventos futuros acontecerem. Neste contexto, a seguinte questão norteadora surge: como poderia ser um modelo para a predição de partidas de futebol? Visando a responder a essa pergunta, este artigo tem como objetivo apresentar um modelo inédito para a predição de resultados de partidas de futebol. O modelo desenvolvido apresenta quatro parâmetros que são determinados a partir da análise do histórico de resultados entre duas equipes. Um exemplo específico é apresentado detalhadamente, abordando o confronto entre duas equipes brasileiras ao longo dos Campeonatos Brasileiros na era dos pontos corridos (com início no ano de 2003). Ainda, resultados para outros confrontos e que consideram a maximização do número de resultados certos, e posteriormente a minimização da distância De Finetti (1972), são apresentados.

Palavras-chave: Modelo, Otimização, Predição, Futebol.

1. INTRODUÇÃO

Prever os resultados de competições esportivas ou de outros eventos a partir de modelos matemáticos tem sido uma ambição humana crescente a partir do aumento da capacidade de processamento dos computadores, que podem lidar com praticamente uma ilimitada quantidade de dados. Um exemplo presente no cotidiano de todos é a previsão do tempo, um campo de estudo bem estabelecido e que tem evoluído ao longo das últimas décadas (SAMPAIO; DIAS, 2014). Também podemos citar como exemplos, o uso de modelos para precificação de ativos financeiros (BLACK; JENSEN; SCHOLES, 1972), para o cálculo de valores a serem cobrados por seguradoras (BORCH, 1974), para a avaliação de um possível aquecimento global por efeitos antropogênicos (HAUSTEIN et al., 2017) e para a análise de proliferação e letalidade de novos vírus (KISSLER et al., 2020). Especificamente na área de competições esportivas, a possibilidade de apostas online fez crescer a busca por modelos preditivos (KUCHARSKI, 2017). Basicamente, um modelo apresenta parâmetros definidos e gera resultados de saída a partir de dados de entrada. Neste contexto, a seguinte questão norteadora surge: como poderia ser um modelo para a predição de partidas de futebol? Visando a responder a essa pergunta, este artigo tem como objetivo apresentar um modelo inédito para a predição de resultados de partidas de futebol. O modelo desenvolvido apresenta quatro parâmetros que são determinados a partir da análise do histórico de resultados entre duas equipes. Um exemplo específico é apresentado detalhadamente, abordando o confronto entre duas equipes brasileiras ao longo dos Campeonatos Brasileiros na era dos pontos corridos (com início no ano de 2003). Ainda, resultados para outros confrontos e que consideram a maximização do número de resultados certos, e posteriormente a minimização da distância De Finetti (1972), são apresentados.

Em suma, a metodologia consiste no desenvolvimento do modelo, levantamento dos dados históricos, parametrização das constantes do modelo a partir desses dados e apresentação e análise dos resultados obtidos.

2. MODELO DESENVOLVIDO

O modelo desenvolvido apresenta quatro parâmetros que serão determinados com o objetivo de maximizar o número de resultados certos por parte do modelo a partir do histórico do confronto entre duas equipes. Tais parâmetros estão relacionados a dois aspectos: local do jogo (em casa ou fora) e classificação dos times ao final dos campeonatos. A entrada do modelo é o número de participantes do campeonato, as classificações das duas equipes no momento do confronto e o local do jogo (em casa ou fora). Como resultado de saída, o modelo fornece a probabilidade de cada resultado acontecer (vitória do time 1, vitória do time 2 e empate).

É importante salientar que para a determinação dos parâmetros, assumiu-se a classificação final das equipes ao final de cada campeonato, e não a classificação das equipes no momento dos jogos. Já nos dados de entrada, evidentemente, buscando uma previsão, devemos entrar com a classificação das equipes antes do confronto. Isso é um ponto relevante a ser observado. Dessa forma, utilizar tal modelo para prever resultados no returno dos campeonatos (quando a metade do total de partidas do campeonato já foi realizada) é o mais recomendável, uma vez que a tabela de classificação já apresenta certa estabilidade.

As equações do modelo são as que seguem:

Equação 1

E as restrições a serem respeitadas são:

Equação 2

Onde:

Equação 3

3. RESULTADOS OBTIDOS

Como exemplo, analisaremos o confronto entre Santos e Flamengo. A Tabela 1 apresenta os resultados obtidos, assumindo o time do Santos como referência. Neste caso, na coluna resultado, V, E e D significam, respectivamente, vitória, empate e derrota do Santos. Os parâmetros otimizados, que visam a maximizar o número de resultados certos fornecidos pelo modelo, foram a1 = 0,06; b1 = 0,33; a2 = 0,02; b2 = 0,39. Com tais parâmetros, o modelo conseguiu contemplar 28 resultados certos (28/36 = 77,78%), 4 resultados em que a segunda maior probabilidade calculada ocorreu (4/36 = 11,11%) e 4 resultados completamente errados (4/36 = 11,11%). Ainda, a distância De Finetti (1972) média foi da ordem de 0,5771. Caso fosse assumido para todos os confrontos uma estimativa trivial com P1 = 1/3, P2 = 1/3 e P3 = 1/3, a distância média seria da ordem de 0,6667. Portanto, é esperado que um bom modelo retornasse um valor inferior a esse.

Novamente, é importante destacar que na Tabela 1, k31 e k32 não fazem referência à classificação dos times no momento do confronto, e sim, à classificação dos times ao final de cada campeonato.

Tabela 1 – Histórico dos confrontos entre Santos e Flamengo e resultados obtidos com o modelo a partir da otimização dos parâmetros a1, b1, a2 e b2

Histórico dos confrontos entre Santos e Flamengo e resultados obtidos com o modelo a partir da otimização dos parâmetros a1, b1, a2 e b2.
Fonte: elaboração própria.

A Tabela 2 ilustra os resultados obtidos para outros confrontos envolvendo a equipe do Santos. Para cada confronto, os parâmetros do modelo foram otimizados.

Tabela 2 – Resultados obtidos para outros confrontos

Resultados obtidos para outros confrontos.
Fonte: elaboração própria.

Analisando a Tabela 2, observa-se que, embora limitado a apenas quatro parâmetros, o modelo foi capaz de prover uma alta taxa de acertos (269/406 = 66,26%) e com todas as distâncias De Finetti (1972) médias abaixo de 0,6667.

Também foi realizada uma simulação considerando os adversários como sendo uma única equipe, totalizando 406 partidas. Neste cenário, os parâmetros otimizados foram a1 = 0,12; b1 = 0,16; a2 = 0,22; b2 = 0,13. Com tais parâmetros, o modelo conseguiu contemplar 216 resultados certos (216/406 = 53,20%), 109 resultados em que a segunda maior probabilidade calculada ocorreu (109/406 = 26,85%) e 81 resultados completamente errados (81/406 = 19,95%). A distância De Finetti (1972) média foi da ordem de 0,6281.

Por fim, ao invés de considerar a maximização do número de acertos, outro objetivo foi estipulado: minimizar a distância De Finetti (1972) média. Com essa abordagem, considerando os adversários como sendo uma única equipe, a distância média foi da ordem de 0,6147 com o modelo contemplando 200 resultados certos (200/406 = 49,26%), 120 resultados em que a segunda maior probabilidade calculada ocorreu (120/406 = 29,56%) e 86 resultados completamente errados (86/406 = 21,18%). Os parâmetros otimizados foram a1 = 0,15; b1 = 0,20; a2 = 0,18; b2 = 0,13. Já os resultados dessa abordagem, que consideram individualmente cada adversário, estão presentes na Tabela 3.

Tabela 3 – Resultados obtidos assumindo como objetivo a minimização da distância De Finetti média

Resultados obtidos assumindo como objetivo a minimização da distância De Finetti média
Fonte: elaboração própria.

Pela Tabela 3, com a minimização da distância De Finetti (1972) média, observam-se taxas de acertos menores do que aquelas presentes na Tabela 2. No entanto, tal abordagem não necessariamente é pior, pois busca avaliar a qualidade das previsões considerando não apenas a relação binária entre acerto e erro. Elucidando essa questão, por exemplo, quanto maior o valor de P1, “mais correto” estaria o modelo em caso de vitória do time 1, e “mais incorreto” em caso de empate ou derrota.

4. CONCLUSÃO

Neste trabalho, um modelo inédito para predição de resultados de partidas de futebol foi apresentado, visando a responder a questão norteadora: como poderia ser um modelo para a predição de partidas de futebol? Apesar de ser um modelo simples, com apenas quatro parâmetros, esses estão diretamente relacionados a dois aspectos importantes que impactam na probabilidade do resultado de uma partida: fator local (jogo em casa ou fora) e qualidade das equipes (que de certa forma é avaliada pela classificação das mesmas).

Como vantagens do modelo desenvolvido podemos elencar sua simplicidade, sendo de fácil implementação e entendimento, e a boa aderência ao histórico de resultados. E como desvantagens, a aplicabilidade a um tipo específico de campeonato (que adote pontos corridos) e a não recomendação para o uso no primeiro turno do campeonato.

Outros objetivos para o cálculo dos parâmetros do modelo podem ser aplicados, como por exemplo, uma ponderação entre a maximização de resultados corretos e a minimização da distância média De Fenetti. Além disso, modificações no modelo a partir da inserção de mais parâmetros podem ser realizadas, a fim de elevar a taxa de acertos em relação aos dados históricos.

Concluindo, ao responder a questão norteadora a partir do desenvolvimento de um modelo inédito, buscou-se elucidar as etapas e procedimentos adotados para tal. Uma vez compreendida a lógica subjacente ao que foi apresentado, esperamos que o leitor esteja apto a desenvolver seu próprio modelo a partir da criatividade, imaginação e heurística.

REFERÊNCIAS

BLACK, Fischer; JENSEN, Michael C.; SCHOLES, Myron. The Capital Asset Pricing Model: Some Empirical Tests. Studies in the Theory of Capital Market, [S. l.], 1972. Disponível em: https://papers.ssrn.com/sol3/papers.cfm?abstract_id=908569. Acesso em: 6 ago. 2022.

BROCH, Karl. Mathematical Models in Insurance. ASTIN Bulletin – The Journal of the International Actuarial Association, [S. l.], v. 7, n. 3, p. 192-202, 1 mar. 1974. DOI https://doi.org/10.1017/S0515036100006036. Disponível em: https://www.cambridge.org/core/journals/astin-bulletin-journal-of-the-iaa/article/mathematical-models-in-insurance/DFCBFCD3635843B53766ED506AF7066B. Acesso em: 6 ago. 2022.

DE FINETTI, Bruno. Probability, Induction and Statistics: The art of guessing. London, New York, Sydney, Toronto: John Wiley & Sons, 1972.

HAUSTEIN, K. et al. A real-time Global Warming Index. Scientific Reports , [S. l.], v. 7, p. 1-6, 13 nov. 2017. DOI https://doi.org/10.1038/s41598-017-14828-5. Disponível em: https://www.nature.com/articles/s41598-017-14828-5. Acesso em: 6 ago. 2022.

KISSLER, Stephen M. et al. Projecting the transmission dynamics of SARS-CoV-2 through the postpandemic period. Science, [S. l.], v. 368, n. 6493, p. 860-868, 14 abr. 2020. DOI DOI: 10.1126/science.abb5793. Disponível em: https://www.science.org/doi/10.1126/science.abb5793. Acesso em: 6 ago. 2022.

KUCHARSKI, Adam. A ciência da sorte: A matemática e o mundo das apostas: de loterias e cassinos ao mercado financeiro. 1. ed. [S. l.]: Zahar, 2017. 264 p. ISBN 978-8537816929.

SAMPAIO, Gilvan; DIAS, Pedro Leite da Silva. Evolução dos Modelos Climáticos e de Previsão de Tempo e Clima. Revista USP, [S. l.], n. 103, p. 41-54, 22 nov. 2014. DOI https://doi.org/10.11606/issn.2316-9036.v0i103p41-54. Disponível em: https://www.revistas.usp.br/revusp/article/view/99179. Acesso em: 6 ago. 2022.

[1] Doutor em Engenharia Elétrica pela Universidade Federal de Santa Catarina, Mestre em Engenharia Elétrica pela Universidade Federal de Santa Catarina, Bacharel em Engenharia Elétrica pela Universidade Federal de Santa Maria. ORCID: 0000-0003-2219-6836.

[2] Doutora em Engenharia Elétrica pela Universidade Federal de Santa Catarina, Mestre em Engenharia Elétrica pela Universidade Federal de Santa Catarina, Bacharel em Engenharia Elétrica pela Universidade Federal de Santa Catarina. ORCID: 0000-0003-3708-9582.

Enviado: Julho, 2022.

Aprovado: Outubro, 2022.

5/5 - (31 votes)
Juliano Bitencourt Padilha

Uma resposta

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

POXA QUE TRISTE!😥

Este Artigo ainda não possui registro DOI, sem ele não podemos calcular as Citações!

SOLICITAR REGISTRO
Pesquisar por categoria…
Este anúncio ajuda a manter a Educação gratuita