Fazer muito com pouco. Uma frase comum ao cotidiano do brasileiro, também se faz presente em muitos outros contextos. No futebol por exemplo, a tarefa dos clubes de menor porte é cada vez mais difícil com a concentração de riquezas nas mãos de poucos clubes do futebol europeu.
Gastos com grandes jogadores geralmente tendem a resultar em sucesso esportivo, mas o quão forte seria essa relação? Como base, analisamos a primeira metade da Serie A para observar qual clube super-performou e qual clube ficou devendo, sob um par de perspectivas.
Correlação
Como o nome já diz, a correlação é uma relação estatística entre duas variáveis, havendo uma relação que envolva dependência entre elas. Um exemplo simples, seria a (forte) ligação entre o tamanho de um apartamento e seu preço. Geralmente, quanto maior o apartamento, maior é o preço (ou seja, possuem uma correlação positiva — imagem genérica abaixo). Neste caso, o preço seria a variável dependente da metragem quadrada, que por sua vez é a variável independente.
O inverso também pode acontecer. Quando uma variável aumenta e a outra diminui, continuamos a ter uma forte correlação, mas neste caso, negativa (imagem ilustrativa abaixo). Pense na relação entre a velocidade de um trem e o tempo de viagem: quanto mais o trem acelera (variável independente), menor vai durar o trajeto (dependente).
Esta correlação é medida numericamente pelo coeficiente de correlação, número entre -1 e 1, que pode ser interpretado genericamente da seguinte forma:
Gastos x desempenho
Ao final da primeira metade da temporada, a tabela da Serie A (veja abaixo)* contava com a Internazionale na ponta, enquanto a Salernitana segurava a lanterna.
*Udinese e Salernitana possuem um jogo a menos na imagem porque a partida entre eles havia sido postergada devido a grande quantidade de casos de COVID-19 na equipe visitante. Posteriormente, foi cancelada e a vitória foi dada para a equipe de Udine, por W.O.
Utilizando os dados da Capology, portal internacional de finanças e salários no futebol, calculamos a correlação entre as variáveis (gastos com salários semestrais e pontuação no campeonato) que está representada no gráfico abaixo.

O coeficiente de correlação foi r= 0,712, ou seja, uma forte correlação. Em estudo de Stefan Szymanski, pHd em economia e autor do livro Soccernomics, a correlação de desempenho esportivo e folha salarial nas duas primeiras divisões na Inglaterra entre 2003 e 2012, foi de 0,952.
Essa forte correlação do estudo inglês pode ser explicada basicamente por dois motivos: a liga inglesa realmente pode ser diferente da italiana e os clubes dependem mais de grandes gastos com atletas para pontuar. A outra, certa de se afirmar sem necessidade de outros estudos, é que, estatisticamente, quanto maior uma amostra, maior a tendência dos resultados refletirem melhor a realidade (no caso um estudo levou em conta uma década, e o outro, apenas um semestre). Se o exercício feito aqui fosse ampliado para mais temporadas, talvez (e até arrisco a dizer, provavelmente) teríamos um “r” maior.
Com as variáveis acima, também podemos calcular quantos pontos uma equipe conseguiu gastando o mesmo valor. No caso, um milhão de euros em salários de atletas durante o primeiro semestre de competição.
Os destaques nesta panorama, foram Hellas Verona (gastou o equivalente a €430 mil por ponto conquistado), Spezia e Udinese (já contabilizados os três pontos contra a Salernitana) que conseguiram fazer mais do que dois pontos por milhão de euros.
Os três piores clubes neste quesito, foram Juventus(gastou o equivalente a €2,48 milhões por ponto conquistado), Cagliari e Genoa (seguidos por Roma e Inter) que gastaram muito para pontuar pouco (imagem abaixo).

Correlação não quer dizer causalidade
Apesar de ser sedutor interpretar que quando duas variáveis têm uma forte correlação, uma é causadora da outra, este raciocínio nem sempre está correto. Para explicar de outra forma, vejamos um par de gráficos abaixo, tirados do site Tyler Vigen. O primeiro apresenta a relação entre a idade da miss Estados Unidos com o número de mortes causados por vapor quente e objetos quentes: coeficiente de correlação de 87,01%. O segundo mostra como a taxa de divórcios no estado de Maine(EUA) acompanha o consumo per capita de margarina. A correlação? 99,26%.


Obviamente que a quantidade de margarina que as pessoas comem não influenciam no número de casamentos infelizes que foram desfeitos. Essa é a diferença: apesar de correlacionados, os dados nem sempre apresentam uma relação de causa/efeito.
Desempenho em campo
Em campo, uma métrica já difundida é a de Expected Points (xP), que mede quantos pontos uma equipe deveria ter feito em comparação ao que realmente fez, baseado em uma série de simulações em grande escala de todos os chutes dados na partida para ver qual foi o resultado de cada uma das partidas.
Utilizando a base de dados do Understat, subtraímos o xP da pontuação real de cada time para ver quem se deu melhor nessa primeira metade de Campeonato Italiano. Neste exercício, Milan e Empoli tiveram quase 11 e 8 pontos a mais, respectivamente, do que o projetado. Do outro lado, o destaque negativo fica para Cagliari, Genoa e Torino, que perderam oportunidades de pontuar melhor na tabela (tabela abaixo).

A análise final
O exercício final, então, foi juntar tudo! No gráfico abaixo, vemos a influência do dinheiro gasto em salários e a sobre/sub-produção esportiva. Aqui, quanto mais na parte superior à direita uma equipe está, melhor foi sua situação: gastou menos e ainda conseguiu mais pontos do que o esperado, como é o caso do Empoli, destaque do 1º turno por estes critérios. O inverso porém, demonstra o pior cenário para os clubes, como Juventus, Roma, Cagliari e Genoa que, gastaram muito para conseguirem pontuar e ainda por cima, dentro de campo não concretizaram as oportunidades criadas.
Muitas vezes o que vemos em campo não reflete a realidade. Muitas vezes também, o que vemos nos números tampouco esclarecem as coisas. Mais importante do que ver os dados, é saber fazer as perguntas certas e interpretar bem as respostas encontradas. Ponto positivo para o Empoli, e um alerta para a Velha Senhora… veremos como esta história se encerra ao final da temporada.