Introduction au Player Impact Estimate (PIE)

Au Basketball, une des statistiques les plus récentes est le Player Impact Estimate. Elle a été créée en 2013 par John Hollinger aujourd’hui VP of basketball operations chez les Memphis Grizzlies. La carrière d’Hollinger est intéressante. Il a d’abord été blogueur en 1996 avec un site web qui avait pour accroche « The Basketball Page for Thinking Fans ». L’écriture de son blog était pour lui un hobby. Elle était le point de départ d’une grande aventure.

Il a ainsi pu expérimenter plusieurs nouvelles méthodes d’analyses notamment dans l’évaluation de la contribution d’un joueur à la performance globale de l’équipe.

Il a attiré l’œil de plusieurs magasines web et papiers qui ont mis en avant son travail. Il a ensuite été embauché chez OregonLive.com où il a développé le fameux PER : Player Efficiency Rating. Il a ensuite poursuivi sa carrière chez Sports Illustrated et ESPN avant d’entrer chez les Grizzlies. Entre temps, il a complété le PER par le Game Score qui est la statistique que l’on retrouve le plus souvent dans les tableaux de statistiques NBA dans la colonne Évaluation.

La production statistique de John Hollinger s’est rapidement démocratisée en partie par la simplicité de ses calculs et leur lisibilité. C’est le cas avec le Player Impact Estimate (PIE).

Récemment le site francophone viziball a été lancé. Ce dernier rend accessible les différents classements et performances collectives et individuelles de la NBA sous un design bien pensé. Le PIE est par exemple mis en avant. C’est en consultant ce site que m’est venu l’envie d’expérimenter le PIE et de l’appliquer au football.

Définition

Selon le glossaire de viziball, « le PIE désigne le pourcentage des faits de matchs auxquels le joueur a participé. C’est une statistique intéressante car elle propose de montrer sous forme de ratio, la contribution d’un joueur sur un match.

Il s’agit bien de tous les faits de matchs, donc pas uniquement les actions d’une équipe. C’est à dire qu’en additionnant les PIE de tous les joueurs on obtient très précisément 100%. Cela veut aussi dire qu’à chaque fois qu’un joueur réalise un fait de match positif (panier, rebond, passe décisive, contre, interception), cela va faire diminuer un peu la note de tous les autres. Ainsi, une ligne de stat identique sur deux matchs différents, ne donnera pas nécessairement la même mesure d’impact, et réciproquement, deux mesures d’impact identiques, ne proviendraient pas forcément de lignes de stats identiques. De même le score peut être négatif, dans le cas où le joueur n’a pas produit suffisamment de faits de match positifs pour passer au-dessus de zéro. »

La bonne nouvelle, c’est que cette définition est tout à fait adaptable au football. Le PIE est utilisable en l’état. On va pouvoir mesurer l’impact d’un joueur sur l’ensemble des actions d’une rencontre. La différence par rapport au basket sera simplement que les actions ne seront pas des paniers, rebonds mais des passes, duels, ou encore des dégagements…

Attention, il ne faut pas se tromper d’objectif. Il ne s’agit pas d’évaluer la performance du joueur. Ici il s’agit de mesurer sa contribution aux actions d’un match : c’est bien son impact quantitatif qui est mesuré.

Formule

Comme décrit ci-avant, on va soustraire les actions individuelles ratées aux actions individuelles réussies et les comparer à la somme des actions réalisées sur le match :

PIE d’un joueur = (Nombre d’actions réussies – Nombre d’actions ratées) / (Somme du nombre d’actions réussies des deux équipes – Somme du nombre d’actions ratées des deux équipes)

A la différence du basketball, on peut s’attendre à de grandes différences dans les résultats du PIE à cause de deux composants majeurs :

  • Il y a 22 joueurs sur un terrain de football contre 10 au basket : l’impact d’un joueur sur une rencontre de foot sera plus faible avec moins Evènements comptabilisés
  • Il y a de plus nombreux postes au football qu’au basketball. Le gardien par exemple ne peut être inclus dans l’étude d’impact. Son rôle et ses actions ne sont pas comparables aux joueurs de champs. Aussi, la réussite des actions sera plus forte pour un défenseur qu’un attaquant. Nous y reviendrons un peu plus tard.

Exemple

J’ai pris comme exemple le dernier match du Stade Malherbe face à Châteauroux le 6 mars dernier. 25 joueurs de champ ont pris part au match pour un total de 1 437 actions tentées, 886 actions réussies et 551 actions ratées.

Exemple de calcul pour Romain Grange :

  • Nombre d’actions totales : 62
  • Nombre d’actions réussies : 43
  • Nombre d’actions ratées : 62 – 43 = 19

Calcul du PIE :

(43 – 19) / (886 – 551) = 7,2%. Romain Grange a contribué à 7,2% des actions du match. Il a un ratio positif ce qui signifie que le joueur a produit plus d’actions réussies que d’actions ratées.

Tableau récapitulatif du PIE de ce match :

CHASMC

Aidé par le code couleur, et un tri décroissant par équipe, on peut visualiser les joueurs ayant contribué le plus sur le match (en rouge) et le moins (en vert), la moyenne étant de 4% (100% / 25 joueurs de champs). Attention, la moyenne par équipe est indiquée à titre indicative. Elle est tronquée du fait du nombre de participants à la rencontre de chacune des équipes (13 joueurs de champs côté Berrichonne contre 12 côté caennais).

Comme évoqué ci-avant, la répartition par profil est primordiale afin d’interpréter les résultats correctement sans biais car un attaquant aura un taux de déchet plus important qu’un défenseur :

CHASMC par poste

Clef de lecture :

  • les joueurs caennais qui ont eu la plus grosse contribution sont des défenseurs
  • les joueurs castelroussins qui ont eu le plus d’impact sont des milieux avec un gros match de Valentin Vanbaleghem et Remi Mulumba
  • l’offensif qui a eu le plus d’impact est Romain Grange
  • Alexis Goncalves a eu beaucoup de déchet ainsi que Leo Leroy
  • Les milieux caennais ont beaucoup moins contribué que les milieux castelroussins avec Jessy Deminguet en retrait

Ces contributions sont à contextualiser avec les données macros du match. Châteauroux avait gagné ce match 2-1.

macro

  • Résultat conforté par les expected goals : 2,02 xG versus 1,01 pour Caen.
  • Possession de balle équivalente
  • Moins de déchet par la passe pour Châteauroux
  • Châteauroux a joué plus long que Caen
  • Caen a gagné plus de ses duels que les castelroussins
  • Châteauroux a moins attaqué que les caennais
  • Caen a joué plus haut que les castelroussins

Ces données macro se révèlent insuffisantes notamment pour jauger les zones d’influences, de dominations et de faiblesses des équipes. Complété par le PIE, le rapport de force devient visible. Avant une rencontre, la confrontation des PIE de chacune des équipes peut permettre justement d’approcher les matchup.

Exemple des PIE compilés depuis le début de saison pour les joueurs avant la rencontre Châteauroux-Caen :

CHASMC pré

Les prévisions sont sensiblement proches de la réalité de la rencontre :

  • Oui : les défenseurs caennais ont contribué le plus dans leur équipe : défenseurs centraux A. Weber et J. Rivierez
  • Les milieux castelroussins V. Vanbaleghem et R. Mulumba ont été impactant
  • R. Grange est l’offensif qui a contribué le plus.
  • H. Vandermerch, latéral droit, a plus contribué que A. Mbengue, latéral gauche
  • Etc…

A la lumière de ces résultats, le PIE semble avoir un avenir dans le football. Son utilisation est à calibrer et surtout à contextualiser comme tout indicateur statistique individuel.

Illustration sur une saison

A partir des 280 matchs disputés cette saison en ligue 2, des 530 joueurs de champ et des 590 279 actions tentées, ci-dessous le top 10 par poste pour les joueurs ayant disputé plus de 1 000 minutes :

clas

Limites et avenir

L’utilisation du PIE telle que décrite dans cet article vise à chiffrer quantitativement la contribution d’un joueur de champ dans un match. Elle ne vise pas à évaluer qualitativement la performance.

Prenons l’exemple des attaquants centraux dans le classement ci-dessus. Les joueurs qui sont mis en avant sont des profils d’attaquants qui ne sont pas des attaquants pivots avancés sur le terrain. Amine Bassi ou Jérémy Ménez sont plutôt des faux neuf dézonant. Ils sont donc récompensés à travers le PIE contrairement à des profils « à risque » comme Abdoulaye Sané de Sochaux par exemple. On privilégiera donc une analyse équipe par équipe, poste par poste plutôt qu’un classement collectif comme présenté précédemment. L’utilisation isolée du PIE dans le cas du scouting est à déconseiller. Elle doit être complétée par d’autres indicateurs.

Dans le football, pour évaluer objectivement la performance des joueurs, il faudra valoriser tout type d’action des joueurs en fonction de son impact sur le résultat du jeu tout en tenant compte du contexte dans lequel l’action est arrivée.

Scisports a déjà bien avancé sur le sujet avec sa mesure du VAEP (Value Valuing Actions by Estimating Probabilities) à base d’intelligence artificielle et de machine learning.

Leur indicateur s’éloigne de la philosophie des indicateurs de John Hollinger. Ces derniers sont SMART c’est-à-dire : spécifique, mesurable, acceptable, réaliste et temporellement défini. Dans le cadre du VAEP mais c’est la cas pour tous les scores -index algorithmiques diffusés par les médias (indice canal, note whoscorred, note sofascore…), il sont difficilement acceptables car leurs calculs et leurs formules d’élaboration ne sont pas partagés avec les lecteurs. Leur crédibilité n’est pas assurée.

Dans les sports majeurs nord- américains, ce n’est pas le cas. Pour le basket, ou encore pour les sabbermetrics du baseball, les statistiques avancées sont partagées et acceptées. Leurs calculs sont souvent rapidement compréhensibles car le plus souvent sont le résultat de pondération de certains composants des actions. Exemple du gamescore dans le basketball :

PTS + (0.4 * FG) – (0.7 * FGA) – (0.4 * (FTA – FT)) + (0.7 * ORB) + (0.3 * DRB) + STL + (0.7 * AST) + (0.7 * BLK) – (0.4 * PF) – TOV

Pour ma part, la définition du PIE telle que décrite dans cet article m’a convaincu surtout pour son utilisation dans l’évaluation du rapport de force pré et post match. Elle a ses limites comme tout indicateur. J’espère vous avoir convaincu.

Concevoir un site comme celui-ci avec WordPress.com
Commencer