Introdução
A rodada nº 33 do campeonato brasileiro de 2023 terminou na quinta-feira desta semana (10/11/23) e, com ela, o Botafogo se encontra em apuros, com o pesadelo de perder seu título, após uma campanha histórica do primeiro turno, cada vez mais real. A equipe já se encontra empatada em pontos com o Palmeiras e Grêmio e ainda tem pela frente o Bragantino, em confronto direto pelo título, fora de casa. Você pode dar uma conferida na tabela logo abaixo:
Este talvez seja um dos campeonatos mais disputados da história, com destaque especial para o sucesso de equipes “improváveis” como o Botafogo, Bragantino e Grêmio (que, ano passado, estava na série B). O que não sabemos, contudo, ao olhar a tabela, é o quanto, de fato, estas posições são merecidas: quantos times criaram mais chances, mas perderam gols com bolas bobas? Quais são suas capacidades de conversão de chances? Quem possui os goleiros mais decisivos do campeonato?
Estes parâmetros podem nos ajudar a entender melhor a tendência de queda e melhora de da posição das equipes, uma vez que estaríamos a analisar aquilo que se convencionou chamar o “desempenho” no futebol — o qual, em geral, determina o resultado, mas não sempre. Propomos atacar esta dimensão a partir de uma simulação destes resultados a partir do xG e PSxG destas partidas, permitindo-nos entender quais times teriam ganho mais jogos pelo seu desempenho do que pela sorte. Apresentemos nosso método, então.
Para entender melhor o que é o xG e ter acesso a uma exposição de uma versão mais simples de nosso modelo, confira o seguinte post:
Nosso método se resume a simular os gols de cada equipe a partir do xG de suas finalizações: cada chute é simulado e o resultado dos jogos nada mais é do que a soma de chutes que se tornaram gol por parte de cada time. Ao final das simulações dos jogos, selecionamos o resultado mais comum destes jogos: se, por exemplo, tivermos 10 simulações, dentre as quais tivemos 5 empates, 2 vitórias do time A e 3 vitórias do time B, adicionamos o resultado de empate na simulação do campeonato.
Seguindo este processo, simulamos cada jogo cerca de 2000 vezes e cada campeonato 15 vezes. Se tínhamos cerca de 300 jogos por campeonato, no total, tivemos cerca de 600.000 simulações por temporada, num total de mais de 9 milhões de simulações de jogos. Este é, portanto, um método intensivo, mas ainda assim com variações significativas, uma vez que tratamos por vezes de equipes que tiveram jogos muito disputados, o que dificultava afirmar com precisão qual equipe deveria ser vencedora de determinado jogo.
Por se tratar de um modelo probabilístico, ele obviamente não é absoluto e possui desvios comuns em cada simulação. De toda forma, para evitar qualquer problema a mais de ajuste dos dados, selecionamos a temporada simulada com os resultados mais comuns (moda), a partir da pontuação das equipes. No caso, conseguimos simulações nas quais houve a pontuação mais comum para 15 e 17 equipes do campeonato, um número suficiente para garantir, pelo menos, uma simulação minimamente fidedigna ao desempenho das equipes.
Os campeonatos simulados mais comuns
xG
Esta simulação calcula, basicamente, as chances de vitória das equipes a partir de suas chances criadas levando-se em conta a qualidade média de finalização e defesa dos jogadores em geral na jogada. Ou seja, a expectativa de gol não muda a partir de quem defende ou chuta a gol, tomando-se, pelo contrário, a chance média daquela finalização se tornar um gol como medida do xG. Diferenças de qualidade na defesa e ataque, pois, não são consideradas neste modelo.
Como podemos ver, esta tabela já se diferencia bastante do que observamos na realidade. Temos equipes em posições bem diferentes do esperado, destacando-se, negativamente, o América Mineiro (com -22 pontos de diferença!), Coritiba (-16), Corinthians (-12), Cruzeiro (-11) e Fortaleza (-11), que deveriam estar bem acima na tabela pelas suas chances criadas e concedidas. Por outro lado, Grêmio (+14), Botafogo (+12), Internacional (+11) e Fluminense (+10) são as equipes com mais pontos em comparação ao nosso modelo, demonstrando que aproveitam bem suas chances.
Sabemos bem que o xG não diz tudo, mas a diferença de valores entre este e os gols reais pode indicar pelo menos três coisas: nível de finalização das equipe, qualidade dos goleiros e, por fim, incompetência do adversário (a qual, por sua vez, pode vir de desconcentração mental por diferentes fatores, como intimidação diante da equipe, relaxamento, etc.). Estas relações ficarão mais claras quando compararmos a tabela do xG com a do PSxG, a qual nos permitirá separar com mais facilidade sorte e azar x qualidade do goleiro e dos atacantes.
Outro elemento interessante a ser notado é que há uma diferença muito grande de gols: o Bragantino, nesta simulação, teria o melhor ataque, com 39 gols. Na realidade, o time com o melhor ataque é o Grêmio, ambos com 57 gols, em uma diferença de 18 gols! Isto significa, obviamente, que as equipes tendem a finalizar melhor em suas chances e, talvez, os goleiros não tenham um desempenho tão bom — esta última constatação, contudo, será melhor analisada com o PSxG.
Além disso, podemos ver que boa parte do problema destas equipes se dá na dimensão defensiva: o América, por exemplo, tomou 21 gols a mais do que o esperado! Esta é uma diferença absurda e uma boa explicação para ela é o fato da equipe sempre tomar a virada: conforme o jogo chega mais ao final, pelo menos no modelo da Opta, o xG diminui, uma vez que os jogadores já estão mais cansados e têm maior pressão para finalizar e resolver o jogo.
Do outro lado, o Botafogo tomou -6 gols do que o esperado, um número extremamente baixo: a média do campeonato é receber +7.45 gols em comparação com a simulação a partir do xG. Há, então, uma diferença de “meros” 13.45 gols entre uma equipe média em nosso modelo e o desempenho do Glorioso. Logo, chegar ao nível do Botafogo é absolutamente improvável pela pura sorte, o que, como veremos melhor à frente com o PSxG, faz com que este dado seja melhor explicado pela capacidade defensiva de Lucas Perri.
Na dimensão ofensiva, a equipe com melhores números é o Grêmio, com 23 gols a mais. Este número certamente reflete uma capacidade de finalização acima da média, provavelmente tendo-se uma boa qualidade em chutes de fora da área, voleios e cabeçadas, jogadas que, em geral, possuem um xG menor. De destaque negativo, temos o Cruzeiro e Vasco, a única dupla de equipes que marcou menos gols do que o esperado: seu saldo, respectivamente, foi de -3 e -1.
Os dados da simulação do PSxG, contudo, podem nos fornecer algumas informações um pouco diferentes, estando mais atento à qualidade da finalização, os quais iremos explorar agora.
PSxG
Aqui, já tratamos de algo um pouco diferente: consideramos os chutes dos jogadores e sua capacidade de finalização. Logo, se algum jogador sai na cara do gol, com um xG de 0.5, e isola esta bola, neste modelo seu PSxG seria 0. Então, as diferenças entre as duas simulações são significativas e a comparação entre elas podem nos ajudar a interpretar melhor a qualidade das equipes aqui acompanhadas, mapeando quem aproveita e defende chances de gol.

Já podemos perceber algumas variações na tabela: o Bragantino sai da liderança e dá lugar ao Flamengo, ao mesmo tempo em que Flamengo (8º → 1º), Fluminense (18º → 6º) e Internacional (20º → 16º) sobem na tabela e América (15º → 19º), Vasco (14º → 18º), Goiás (13º → 17º), Corinthians (7º → 10º) e Grêmio (12º → 15º) descem. Em termos gerais, os times que sobem na classificação tendem a finalizar melhor, enquanto os times que descem tendem a finalizar pior. Este dado pode ser parcialmente confirmado quando analisamos a situação do Vasco, por exemplo, que tende, nesta temporada, a perder jogos nos quais ganhou a disputa do xG: em um caso ou outro isto pode ser, sim, fruto do azar, mas quando isto acontece repetidamente, certamente não falamos mais do acaso. Há, pois, uma ineficiência inegável à frente do gol.
Voltando à classificação, as variações com a tabela real são menos drásticas, mas ainda presentes: o América reduziu sua diferença de -22 para -11 pontos, sendo seguido de perto pelo Athletico (-10), Fluminense (-9) e Flamengo (-8). Botafogo e Grêmio seguem sendo as equipes com mais “sorte”, acumulando +15 e +18 pontos do que em nossa simulação. Estas equipes, talvez possa-se dizer, devem se marcar pela sua qualidade e sorte em momentos decisivos: marcam gols inesperados e não tomam gols certos, muito por conta da qualidade de seus goleiros e da pressão exercida sobre seus adversários.
O caso do Grêmio é interessante de ser analisado: ele piora seu desempenho quando olhamos para o PSxG, indo ao contrário do que especulamos anteriormente. Isto pode ser explicado, em nível teórico, pelo fato de marcar gols e vencer jogos com finalizações não tão boas, ao mesmo tempo em que segura o placar quando está à frente, sabendo sofrer. Na seção de análise de jogos, apresentaremos um jogo do Grêmio que descreve bem esta condição: há a criação de um bom número de chances, mas estas não são finalizadas com muita qualidade.
Voltando às diferenças entre a simulação e a tabela real, analisando o saldo de gols geral, tivemos uma média de -1.5 gols por time, de acordo com o PSxG. Isto significa que nossos goleiros poderiam ser considerados acima da média, devendo-se destacar, em especial, Lucas Perri e Cleiton (Bragantino), que evitaram, respectivamente, 11 e 8 gols, de acordo com a tabela simulada. De destaque negativo, temos os goleiros do Coritiba e do América, que sofreram, respectivamente, +8 e +10 gols do que o esperado. Interpretação de nosso modelo
Conforme vimos, a tendência natural de explicação do sucesso de Grêmio e Botafogo na tabela se deve muito à qualidade de seus goleiros e relativa sorte em certos jogos. Sendo assim, a tendência é que estes valores regressem à média e seus gols não saíam da mesma forma como antes, como está acontecendo com o Botafogo no presente momento.
Lembra do Botafogo no primeiro turno? A equipe tinha o melhor ataque do campeonato, com 35 gols. Isto se dava muito graças à imensa eficiência ofensiva da equipe, a qual marcava um gol a cada 7.68 chutes. Para ter uma ideia melhor destas métricas, cheque nosso texto sobre a eficiência das equipes à frente do gol no primeiro turno:
Por isso, se você for apostar em algum campeão para esta reta final, nossa sugestão estaria entre os líderes de nossa tabela do PSxG: o Flamengo e o Palmeiras. Estas equipes parecem ser as mais decisivas, no presente momento, com resultados mais próximos ao seu desempenho.
Para ilustrar estes pontos, veja as seguintes estatísticas: o Palmeiras marcou -1 gol de acordo com nossas simulações, assim como tomou -3. O Flamengo, por sua vez, marcou +1 gol e tomou -1, o que significa que esta sua diferença defensiva não vem de azar ou incompetência do goleiro, mas da performance do jogo mesmo. Isto certamente é um elemento explicativo para a equipe rubro-negra não ter disparado no campeonato, mas esta situação deve ser remediada com o trabalho de Tite, mestre em montar defesas sólidas.
A descrença em Botafogo e Grêmio surge, pois, quando analisamos as equipes mais “sortudas” para conseguirem gols — as quais são, justamente, estes dois times, com, ambos, tendo +9 de saldo em comparação com o PSxG. Além disso, estas equipes sofreram menos gols do que o esperado (-11 e -3), o que pode ser explicado pela qualidade de seus goleiros, mas, por outro lado, por melhor que eles sejam, não é muito recomendável apostar que eles mantenham este nível de performance.
Com relação à diferença de gols entre os valores de xG e PSxG, estas duas equipes estão em polos opostos: enquanto o Botafogo aumentou apenas 3 gols esperados, o Grêmio ampliou este número em 8 gols. Isto mostra que a equipe gaúcha finaliza melhor que a carioca (mas não passa, por exemplo, da média da diferença de gols entre PSxG e xG por equipes), enquanto, como mostramos no parágrafo anterior, o Glorioso possui o melhor arqueiro do campeonato.
Nosso modelo parece afirmar que o Botafogo não “mereceu” estar à frente no campeonato, mas esta não seria a interpretação correta. Utilizando um discurso mais rebuscado, podemos dizer que, na verdade, o Botafogo tinha uma probabilidade menor de estar onde está. Mas, diante dos fatos ocorridos, conseguiu segurar as equipes adversárias e manteve as vitórias e empates onde deu.
Além disso, pense da seguinte forma: todo modelo é burro e o nosso não foge à regra. Sua maior burrice, de longe, é que ele considera que o jogo seria o mesmo sempre, independentemente se o Botafogo tomou um gol de empate. Por isso, ele é apenas um meio de entretenimento e deve servir mais como modelo de interpretação da qualidade de finalização e defesas dos jogadores destas equipes, controlando parcialmente a dimensão “sorte” a partir da simulação destas probabilidades de vitória.
Por isso, não considere estes dados uma negação dos méritos do Fogão, mas sim um asterisco sobre a qualidade desta equipe: trata-se de um time que depende da qualidade imensa de seus jogadores extremos, mais especificamente do goleiro e do ataque. Não é surpreendente, pois, que seu desempenho fique abaixo quando estes jogadores oscilam.
Outra equipe interessante a ser destacada, para pensar possíveis falhas de nosso modelo, é o Corinthians: é uma equipe que, na simulação de xG, estava muito acima de sua classificação real, uma vez que as chances por eles sofridas são, em geral, de baixo xG, longe de seu gol e/ou com vários jogadores à frente. Contudo, esta equipe cede tantas chances assim que, ainda mais num campeonato como o nosso, não é surpreendente que jogadores com mais qualidade na finalização se aproveitem de tantas oportunidades. Há, pois, um descompasso do modelo (do xG) com a realidade que acaba favorecendo o estilo desta equipe, mas que, no mundo real, não se observa empiricamente.
Ou seja, nosso modelo pode contribuir como elemento interpretativo do que é observado qualitativamente, sendo recomendável sempre aliá-lo com o que é visto em campo. Para ilustrar melhor como fazer isto, vejamos alguns jogos do Botafogo e do Grêmio pela lente de nossas simulações.
Simulação de jogos emblemáticos
Vamos analisar alguns jogos nos quais a vitória veio de forma inesperada. Considere, novamente, que o modelo desconsidera a mudança de postura após levar um gol, então, ele não serve de base para saber exatamente quem ganharia o jogo, mas sim quão provável ou improvável foi o resultado analisado a partir do que aconteceu em campo.
Palmeiras 0 x 1 Botafogo (12ª Rodada — 25/06/23)
Este jogo foi decidido por uma jogadaça de Tiquinho Soares, na qual ele converteu um xG de 0.04 em um PSxG de 0.45. Ou seja, o centroavante finalizou muito bem nesta bola, dificultando a vida de Weverton. Além disso, os jogadores do Palmeiras foram simplesmente desastrosos em suas finalizações: Veiga perdeu um pênalti (chutando para fora), tendo uma eficiência de finalizações (PSxG — xG) de -1.2, e Rony perdeu boas chances (-0.55). Por outro lado, lance definidor de Tiquinho aparte, os jogadores do Botafogo também não foram tão eficientes: estas finalizações foram tão ruins que o resultado mais comum em nossas simulações, pelo PSxG, foi de 0 x 0! Pelo xG, pelo contrário, o Palmeiras ganhou a imensa maioria das simulações, tendo mais de 80% de vitórias, com o placar mais comum sendo 2 x 1 para o time paulista.
Botafogo 2 x 0 Bragantino (15ª Rodada — 15/07/23)
Aqui, novamente, o Botafogo saiu derrotado no xG: o Braga ganhou 47% destas simulações, contra 25% do time carioca, sendo os resultados mais comuns, respectivamente, 1 x 1, 0 x 1 e 1 x 2. Mas o surpreendente é que o Botafogo não conseguiu demonstrar uma eficiência ofensiva no mesmo nível que em outras partidas, apesar de ter marcado dois gols: no PSxG, manteve-se os mesmos resultados da simulação do xG. Isto pode ser parcialmente explicado pelo fato do Bota ter tido menos chances, mas, principalmente, por ter perdido algumas destas chutando para fora ou na trave (como foi o caso da belíssima finalização de Eduardo), enquanto o Bragantino finalizou mais no gol. Note, contudo, que o Botafogo possui uma média maior de xG e PSxG por chute, o que pode ser determinante para explicar sua vitória sobre o time do interior paulista. De toda forma, ao analisar os lances, podemos ver a qualidade ofensiva do Botafogo, que conseguiu aproveitar os espaços de forma mais incisiva que o Braga — não é à toa que a equipe de Caixinha possui uma queda de posições em nossas tabelas quando trocamos o xG pelo PSxG.
Cruzeiro 0 x 0 Botafogo (18ª Rodada — 06/08/23)
Este jogo se trata de um empate no qual, na realidade, o líder deveria ter perdido o jogo. E só não perdeu pura e unicamente devido a Lucas Perri (e um pouquinho de sorte também): se o Cruzeiro acumulou 0.9 de xG e conseguia, de acordo com esta métrica, a vitória em 68% de nossas simulações, esta distância ficava ainda maior no PSxG, tendo, aqui, 2.09 deste e mais de 90% de vitória em nossas simulações. E, se antes o time carioca conseguia compensar as poucas chances com boa eficiência, neste jogo criou-se absurdamente pouco, de tal forma que não houve praticamente nenhuma chance de vitória por parte do time carioca.
América MG 1 x 2 Botafogo (27ª Rodada — 18/10/23)
Este jogo talvez seja o mais absurdo de todos analisados aqui: as chances de vitória do Botafogo eram, de acordo com xG e PSxG, respectivamente, de apenas 1.83% e 2.4%! O resultado mais comum de todas as simulações, em ambos os casos, era 3 x 0 para o América! Como explicar este resultado tão diferente? Há aspectos positivos na atuação do Botafogo: Junior Santos foi líder em eficiência ofensiva, adicionando mais 0.64 gols esperados com suas finalizações. A única surpresa, na verdade, é que suas duas boas finalizações tenham sido gol: o esperado, em nosso modelo, é que no máximo uma delas entraria no gol, e isto não seria suficiente para conter o resto do ataque do América. Por isso, unido a esta qualidade de chute e atuação não tão boa do goleiro americano, também temos as defesas, novamente, de Perri, o qual concedeu apenas um gol, num chute de 0.88 PSxG de Benítez. Por outro lado, defendeu um chute no mesmo nível (0.84 PSxG) aos 37’ do primeiro tempo e outro petardo de Cazares no final do jogo.
Atletico PR 1 x 2 Grêmio (8ª Rodada — 27/05/23)
O elemento marcante deste jogo, para nosso modelo, é que os dois gols do Grêmio foram marcados com chutes com saldo negativo na diferença entre PSxG e xG, enquanto, de outro lado, o Athletico marcou com uma finalização de altíssima qualidade de Vitor Roque (0.97 PSxG). Para se ter uma ideia, neste jogo, nosso prognóstico de vitória do Grêmio girou em torno de 2%, considerando o PSxG. Quando analisamos o xG, as chances de vitória do Grêmio foram próximas a 17%, o que reforça, justamente, a falta de qualidade na finalização dos jogadores gremistas. Considere, contudo, que este jogo não contou com a presença de Luis Suárez, o craque da equipe gaúcha e um dos jogadores com maior eficiência ofensiva do campeonato. Ou seja, a vitória do Grêmio aqui pode ser, sim, atribuída em boa parte ao fator sorte e à ineficiência do goleiro athleticano.

