A B C
0 0.25 0.32768 0.348678440
1 0.50 0.40960 0.387420489
2 0.25 0.20480 0.193710244
3 0.00 0.05120 0.057395628
4 0.00 0.00640 0.011160261
5 0.00 0.00032 0.001488035

Você certamente já sentiu aquela sensação de assistir um jogo de seu time no qual a derrota veio apesar da exibição da equipe: chutes, desarmes e passes bons foram dados, mas nada adiantou.
Esses dias certamente são frustrantes e revelam algo a mais sobre o futebol. Talvez neste dia você até tenha concordado com a máxima de que não importa jogar bonito, afinal o feio é perder.
Por isso, no futebol, muito se discute sobre a eficiência de jogadas e ataques, e uma ferramenta fundamental para trabalhar com esta ideia é a noção de probabilidade. Uma chance é boa tanto quanto maior for sua probabilidade de se converter em gol; uma equipe é mais eficiente conforme suas chances tem maior probabilidade de serem gol.
Quando falamos que algum time perdeu, mas merecia ganhar, dizemos, no fundo, que ele tava mais probabilidade de alcançar a vitória que o time adversário: criou mais chances, teve mais posse e concedeu o gol numa “bola boba”.
Analistas de desempenho afeitos aos dados estatísticos até inventaram uma métrica para quantificar, em termos gerais, esta possibilidade de vitória: o xG, sigla de Expected Goals.
O que é o xG?
O xG, em termos bastante simplistas, estima o quão comum é que a bola chutada pelo jogador, na posição e condição dele e de seus adversários, seja gol.
Este número é calculado de diferentes formas entre vários institutos de estatística no futebol, mas, em geral, ele é calculado realizando-se média de gol de todos os chutes dados naquela posição e condição, levando-se em consideração alguns elementos como:
A posição do chute: por exemplo, se esta é dentro da pequena área ou do meio de campo e com ou sem ângulo;
A condição do chute: se este chute é com a bola rolando, parada ou de cabeça;
A posição dos adversários: se este chute é livre com o goleiro, com dois defensores na frente, etc.;
Para se ter exemplos mais claros de como o xG funciona, recomendo este artigo do FBREF, que apresenta alguns casos de chutes e detalha alguns cálculos realizados.
Por isto mesmo, o xG é uma métrica muito melhor para calcularmos as chances de uma equipe: aqui, se um time tem 5 chutes com boas condições de gol teria um valor maior que outra equipe com 10 chutes de fora da área.
Ou seja, esta é uma métrica com um valor descritivo do jogo e da qualidade de uma equipe muito maior que outras como o número de chutes e a posse de bola.
Se um treinador falar em uma entrevista que os dados de xG do jogo davam a vitória para sua equipe, sua afirmação tem muito mais valor que as outras reclamações comuns: é uma métrica mais aprofundada e clara do que outras.
Contudo, será que todos os valores de xG, ao final de uma partida, são os mesmos? Por exemplo, se formos olhar para uma partida na qual dois times jogaram e tiveram eles o mesmo número de xG, mas um número de chutes diferentes, como podemos definir qual deles tinha mais chances de ganhar?
Comparação entre xGs
Vamos colocar em termos comparativos mais claros: é diferente a chance de um clube marcar “x” gols a partir de 2 chutes com o valor de 0.5 xG ou com 10 chutes com 0.1 xG?
Por um lado, sabemos que o time com 10 chutes pode fazer mais gols, tendo um limite de 10 gols, enquanto, por outro, o time de dois chutes muito dificilmente não fará um gol. Mas como definir qual delas é melhor?
A matemática possui uma resposta para esta nossa pergunta, se definirmos nossa questão mais claramente: qual destes times tem a maior probabilidade marcar pelo menos um gol?
Para responder mais claramente, vamos imaginar três equipes: primeiro, a equipe A, que chutou duas vezes a gol, com 0.5xG cada; segundo, a equipe B, que chutou 5 vezes com 0.2 xG; e, por fim, a C, com 10 chutes de 0.1 xG.
Quais são as chances destas equipes, com o mesmo número de xG acumulado, marcarem um, dois ou três gols? Podemos responder esta questão a partir da distribuição binomial:
\[ P_x = \frac{n!}{x!(n-x)!} p^x q^{n-x}\]
Onde: x é o número de eventos que se confirmaram (no caso, o número de gols); n é o número de tentativas (2, 5 ou 10); p é a probabilidade de sucesso em uma tentativa (0.5, 0.2 e 0.1); e q é a probabilidade de falha em uma tentativa (0.9, 0.8 e 0.9).
Se rodarmos esta fórmula em qualquer software estatístico com os parâmetros já delineados de nossas equipes, teremos a seguinte resposta:
Segundo nossa tabela, a equipe A possui 25% de chances de não marcar nenhum gol, enquanto as equipes B e C possuem, respectivamente, 32.7% e 34.8%. Com relação a mais de 2 gols, obviamente a equipe A não possui nenhuma chance de marcar mais de dois gols, enquanto as equipes B e C possuem mais ou menos 5% e 6% de possibilidade de marcar este tanto.
Entretanto, talvez a estatística definitiva seja a que a equipe A terá pelo menos um gol 75% das vezes, enquanto a B e a C, respectivamente, terão “apenas” 67% e 65% de jogos com pelo menos um gol. Ou seja, mesmo que todas nossas equipes tenham um xG igual, a primeira equipe teria maior probabilidade de marcar pelo menos um gol, em comparação com as outras.
Isto se dá porque suas chances de não marcar são significativamente menores quando comparadas com a segunda e terceira equipe, o que garante que ela possa marcar com mais consistência que a outra.
Basicamente, a equipe A terá pelo menos um gol 75% das vezes, enquanto a B e a C, respectivamente, terão “apenas” 67% e 65% de jogos com pelo menos um gol.
Vamos ilustrar isto de forma mais clara a partir de um gráfico de densidade destas probabilidades:

Sendo assim, obviamente, se quisermos fazer mais gols, temos que chutar mais, mas os ganhos com chutes de pouca qualidade são muito poucos: três gols, por exemplo, são uma raridade, sendo muito mais comum não se ter nenhum gol do que este tanto!
Por outro lado, com apenas 2 chutes de qualidade, a chance de se ter pelo menos um gol é muito maior – e isto pode ser decididamente muito vantajoso para qualquer equipe. Estes dados, puros, parecem confirmar a hipótese de que vale mais a pena poucas oportunidades boas do que várias oportunidades ruins.
Contudo, dentro do mundo do futebol, a simples probabilidade não adianta muito para um estatístico, uma vez que as chances precisam ser simuladas na mesma aleatoriedade do campo. Nesta realidade, um modelo estocástico, a partir da técnica Monte Carlo, faz muito mais sentido para nos ajudar a entender a realidade.
Para termos uma ideia melhor se, de fato, vale a pena esta estratégia, simulamos os gols a partir destes chutes, ordenamos os números de gols de cada caso e comparamos os seus valores. Vejamos o caso de 2 chutes contra 10 chutes:
W D L
0.0935 0.8296 0.0769
Como podemos ver na tabela, a tendência natural é ao empate: este valor, quando ordenamos nossos gols, tem uma frequência muito maior que a vitória de um time ou de outro.
Nesta análise, contudo, ainda estamos fazendo algo errado, uma vez que colocamos ordem em uma realidade total desordenada e aleatória que é o futebol.
Precisamos, então, de um modelo que interfira menos nos dados simulados e os compare diretamente, em um grande volume, para aumentar sua confiabilidade.
Para realizar esta tarefa, criamos uma função que simula os gols de cada caso (número de chutes + xG médio por chute) e nos retorna a mesma tabela anterior.
W D L
Min. 0.347400 0.318600 0.301700
1st Qu. 0.354600 0.325775 0.310575
Median 0.358350 0.329650 0.313150
Mean 0.358044 0.329195 0.312761
3rd Qu. 0.361100 0.331825 0.315125
Max. 0.370800 0.342100 0.322100
Neste modelo absolutamente aleatório, basicamente tudo pode acontecer! As chances de vitória, derrota e empate são bastante próximas.
Contudo, as equipes com dois chutes tendem a ter uma vantagem pequena, de mais ou menos 3 a 5 pontos percentuais, quando comparamos seus números de gols.
Quando olhamos os dados da comparação entre 2 e 5 chutes, a diferença diminui um pouco, mas persiste:
W D L
Min. 0.335000 0.328300 0.302000
1st Qu. 0.344075 0.335250 0.310075
Median 0.348200 0.338050 0.314200
Mean 0.347728 0.338324 0.313948
3rd Qu. 0.351300 0.340925 0.316800
Max. 0.360500 0.348200 0.329900
Por outro lado, esta diferença é muito pequena para, efetivamente, ser suficiente para justificar estilos de jogo. Pelo contrário, quando colocamos na ponta do lápis, a qualidade dos jogadores importam muito mais que criar mais ou menos chances de qualidade.
Não à toa, temos outra métrica bastante popular para termos ideia desta condição: o PSxG (Post Shot Expected Goals). Através dela, podemos perceber quais tipos de jogadas nossos jogadores conseguem converter em boas chances de gol.
Todos sabemos, por exemplo, que uma cabeçada de baixo xG para o Cristiano Ronaldo é, na verdade, muito mais perigosa que a mesma para um jogador comum: ele irá conseguir colocar a bola em um lugar muito mais perigoso que seu companheiro.
Por isto, a vitória não é simplesmente fruto da criação de oportunidades, mas sim de quais oportunidades são criadas, pensando na qualidade de seus jogadores e nos defeitos do adversário. No futebol contemporâneo, estes detalhes importam cada vez mais.
Botafogo e a sorte
O Botafogo certamente será campeão brasileiro e merecerá muito esta conquista, fruto de um trabalho invejável de seu departamento de futebol. Por isso, para finalizar este artigo, pretendemos ilustrar sua competência com o caso de um jogo desta equipe.
Certamente temos casos bastante interessantes para analisar, uma vez que este time passou por algumas partidas difíceis e contou até mesmo um pouco com a sorte em seus jogos, como foi no caso de jogos contra Palmeiras e Flamengo no primeiro turno.
Pretendemos, então, a partir de nosso modelo, simular a probabilidade de vitória da equipe botafoguense em um desses jogos difíceis. Vejamos o caso do jogo contra o Flamengo, de roteiro dramático, com jogador expulso e tudo:
W D L
0.203377 0.168354 0.628269
Lembrando que, neste jogo, o Botafogo marcou três gols com 1.9 de xG, em 11 chutes, enquanto o Flamengo conseguiu 3.1 de xG com 24 chutes e marcou dois gols. Esses números, sozinhos, já mostram como o jogo foi movimentado e comprovam a superioridade de criação do Flamengo.
Porém, indo para a dimensão de probabilidade, de acordo com nosso modelo – o qual simulou um milhão de jogos –, a média das chances de vitória do Fogão eram de apenas 20.34%!
Se você recebesse os dados do jogo anteriormente à partida e fosse fazer uma aposta em qualquer casa, a odd justa para o Fogão, de acordo com nosso modelo, seria de 4.92! Isto demonstra como o contexto da partida, a qualidade e momento dos jogadores – e até mesmo a sorte – importam no futebol.
Mesmo assim, nas palavras de Casimiro Miguel, a sorte premia os competentes. As defesas de Perri e os gols de Tiquinho, justamente por serem improváveis, são o que fazem destes jogadores excepcionais e nos fazem amar este esporte.