Battre le marché des transferts

Réflexions sur l’investissement de joueurs

Je n’ai jamais rejoint ma sphère professionnelle avec l’ecriture de ce blog. C’est désormais chose faite avec ces quelques lignes empruntées aux grands penseurs des marchés financiers (Buffett, Lynch Marks, …) qui ont construit ma pensée et dont la parole me semble résonner dans le cadre des marchés des transferts de joueurs.

Si j’étais un investisseur sur le marché des transferts de joueurs, je serai un investisseur de valeur, c’est-à-dire que je chercherai la valeur au prix le plus bas car acheter à bas prix, c’est le rendement le plus fiable.

Tous les clubs professionnels recrutent mais peu obtiennent des résultats significatifs. Le marché des transferts de joueurs est caractérisé par de nombreuses erreurs et de mauvaises évaluations. Un très grand nombre de transactions ne donne pas satisfaction avec une absence de retour sur investissement.

Les erreurs commises prennent souvent sources dans le manque d’objectivité des décideurs-investisseurs car les êtres humains ne sont pas des machines informatiques cliniques. Nous sommes remplis d’émotions qui contaminent notre objectivité et ouvrent la porte à des erreurs importantes. Certains actifs sont ainsi achetés et vendus à des prix trop bas et d’autres trop élevés.

Ces erreurs d’évaluation et les différences de compétences, de connaissances et d’accès à l’information permettent à certains investisseurs de constamment surpasser les autres.

Le directeur sportif du stade brestois, Grégory Lorenzi confiait récemment à Ouest France ceci : « Sur le marché français, tout le monde se connaît. Je ne dis pas que tout le monde travaille de la même façon, mais tout le monde connaît les bons jeunes, les bons éléments qui sont dans les réserves ou centres de formation des gros clubs pros, les meilleurs éléments de Ligue 2, les meilleurs éléments de National. Quand un joueur est performant à ces niveaux, tous les clubs français sont au courant. Et même à l’étranger, tu croises des représentants d’autres clubs français intéressés par les mêmes joueurs que toi. »

Si j’étais investisseur en ligue 1 ou ligue 2, je fuirai les marchés surpeuplés occidentaux remplis de scouts car il est difficile de battre régulièrement ces marchés ou le consensus sur les fondamentaux des joueurs est important. Il est rare d’entendre des voix discordantes sur la valeur d’un joueur. Ces derniers relèveront tous les mêmes points forts et les mêmes points faibles. Ces marchés sont efficaces. Il faut donc regarder les marches inefficaces où l’on peut extraire plus de valeur.


Il faudrait pouvoir se limiter aux marchés relativement inefficaces où le travail et les compétences seraient les plus rentables. Le marché des transferts peut être battu car il existe des inefficacités donnant lieu à la possibilité de surperformance et de ROI élevé. Allouer des ressources d’une cellule de recrutement vers les marchés inefficaces n’est pas utopique. Les Astros de Houston (récent vainqueur des world series de baseball) ont par exemple tué leur cellule de recrutement. Les scouts sont beaucoup moins nombreux et n’interviennent plus en amont du recrutement. Ce ne sont plus des dénicheurs de pépites. Ils interviennent en aval. Ce sont les stats et les vidéos qui les envoient le plus souvent sur le terrain des championnats mineurs. Une illustration de ce travail : à fin juillet, 7 lanceurs débutants issus des ligues mineures ont entamé leur carrière en MLB avec les Astros, et aucun bullpen n’affichait de stats aussi bonnes depuis le début de la saison 2020.

Si j’étais un investisseur, je chercherai à estimer précisément la valeur intrinsèque des joueurs par la data et la vidéo dans les championnats exotiques que peu regardent car la chose la plus sûre et la plus rentable est d’acheter quelque chose qui ne plaît à personne.

Pour obtenir des résultats supérieurs, il faut avoir des opinions non consensuelles sur la valeur, et elles doivent être exactes ce qui n’est pas facile. Il faut faire différemment et avoir raison.

Si j’étais investisseur en ce début de mois d’août 2020, j’enverrai un scout observer Lallianzula Chhangte du FC Chennaiyin en Inde. C’est un petit ailier gaucher évoluant à gauche (rare) né en 97, international espoir indien. Il est le fruit d’une recherche longue et méthodique sur les marchés inefficaces fait de croisements et de correspondances entre différentes bases de données et d’indicateurs personnels construits. Il est le joueur « werdy » que les clubs européens ne veulent pas alors qu’il représente de la valeur à un bas coût. Ses fondamentaux sont bons. Doté d’un bon physique, il est endurant et capable de répéter les courses à très haute intensité. Son jeu sans ballon est très utile, il harcèle souvent efficacement ses adversaires directes. Ses stats sont bonnes cette saison après avoir échoué lors d’un essai au Viking FC, en Norvège, en août 2019. Il souhaite retenter sa chance en Europe. C’est un investissement dont le risque est contrôlé. Lorsque l’on regarde le contexte de ses performances et l’historique de Lallianzula, on peut espérer qu’avec un travail de développement adéquat, il peut devenir un joueur professionnel en Europe occidentale. Lalliaanzula peut être ce joueur vous permettant de battre le marché des transferts. C’est sur lui que j’investirai mais je ne suis pas un investisseur sur le marché des transferts de joueurs. Hélas…

Liverpool a innové pour gagner

30 ans plus tard, Liverpool est de nouveau champion d’Angleterre. Il n’est jamais simple de tenter d’expliquer les raisons d’une victoire. Johan Cruyff aurait tenu ces propos : « Pourquoi les responsables sauraient pourquoi l’équipe perd, alors qu’ils n’ont jamais su pourquoi elles gagnaient auparavant ? ».

Définir les facteurs clés de succès est pourtant une étape indispensable si l’ on souhaite faire perdurer les victoires. Un des facteurs clés pour le Liverpool de Jurgen Klopp est surement l’utilisation d’innovations en tout genre pour acquérir un avantage compétitif.

J’ai listé ci-dessous différentes ressources disponibles sur le web pour les curieux, fans et piqueurs d’idées :

Big data :

How Data (and Some Breathtaking Soccer) Brought Liverpool to the Cusp of Glory, New York Times,

How Math and Data Science Made Liverpool the Best Team on the Planet, medium.com, Viroshan Naicker, 16 janvier 2020 : évoque les incentives Skin in the game ; explicite la méthode de recrutement autour de 4 axes :

  1. An explicit, quantifiable, sense of how the manager wants the team to play; and a method for realizing this within a specific budget.
  2. Models and methods for making player assessments; per position.
  3. An understanding of team dynamics.
  4. Models for the team’s evolution with each additional player recruited.

Le Liverpool FC utilise une IA française pour analyser ses matches en temps réel, 01net.com, Adrien Branco, 10 octobre 2019 : présentation de l’apport de la startup SkillCorner.

The Triumph of Merseyball: How Liverpool Won the Premier League, The New York Times, Rory Smith, 26 janvier 2020 : Mersyball et les data driven decisions ; l’influence du directeur sportif Michael Edwards ; les gains marginaux provenant du travail de Thomas Gronnemark, spécialiste des touches et Mona Nemmer, nutritionniste.

The lessons Manchester United can learn from football analytics leaders Liverpool and Barcelona, Independant, Melissa Reddy, 18 avril 2020 : l’apport des départements analytics dans le foot ; des exemples de datarecrutement.

Liverpool are using incredible data science during matches, and effects are extraordinary, liverpool.com, 27 janvier 2020 : quelques illustrations analytics

Les Hommes et Femmes :

Michael Edwards: The Making of the Man Who Helped to Make Klopp’s Liverpool, Bleacher Report, Tom Williams, 25 mars 2020 : personnalité du directeur sportif

Ian Graham: How Liverpool integrate data, analysis and coaching, William Spearman: How Liverpool create pitch control models, Ian Graham: The ‘one currency’ Liverpool use to judge players, Tim Waskett: The maths behind Liverpool’s title charge, plusieurs articles de traininggroundguru.com sur les outils innovants utilisés

How Liverpool and Tottenham became two of Europe’s best-run clubs from the man whose values shaped both, Independant, Jack Pitt-Brooke, 1er juin 2019 : interview de Damien Comolli, ancien directeur sportif du LFC, initiateur de l’arrivée des expected goals lorsqu’il était à Tottenham ; a recruté Michael Edwards et Ian Graham à Liverpool; bientôt président du TFC ?

Behind the Badge: Mona Nemmer | Tailoring nutrition, life at LFC & more, vidéo de présentation de Mona Nemmer, nutritionniste.

Les meilleures équipes combinent les touches longues, rapides et intelligentes, Nosotros : entretien avec l’entraîneur spécialiste des touches Thomas Gronnemark.

Tactique :

The 10 tactical innovations that transformed Klopp’s Liverpool into champions, Athlétique, Michael Cox, 26 juin 2020 : 10 innovations tactiques décrites : Pressing-Firmino as a false nine- 4-3-3- Mane & Salah on the break- Virgil van Dijk- A top-class goalkeeper- Assisting from full-back- Long balls- Henderson shifts right- Fabinho dominates

Les clés de la transformation de Liverpool, podcast vu du banc

Comment jürgen klopp a construit son Liverpool, So foot, Maxime Brigand, 2 juillet 2020

Tactique : le rouleau-compresseur atypique du Liverpool de Jürgen Klopp, L’Equipe, Pierre-Étienne Minonzio, 2 juillet 2020

Entraînement :

Position specific and positional play training in elite football: context matters, Barca Innovation hub : exemples d’exercices d’endurances et de vitesse spécifique avec la vidéo : youtube.com/watch?v=vfpPN1Cm1Vo#action=share

Le classement ment : Points, xPoints, TSR ou Pythagore ?

Le « Pythagorean expectation » est une formule conçue par Bill James (père des sabermetrics) pour estimer le pourcentage de matchs qu’une équipe de baseball « aurait » dû gagner en fonction du nombre de « runs » qu’elle a inscrit et subi.

La comparaison du pourcentage de victoires réel et le % de victoire pythagoricien d’une équipe peut être utilisée pour faire des prédictions et évaluer quelles équipes sont sur-performantes et sous-performantes. L’objectif de cette métrique  se rapproche beaucoup des expected goals pour le football. Le nom vient de la ressemblance de la formule avec le théorème de Pythagore.

Pour évaluer le niveau de performance d’une équipe de football, nous disposons de plusieurs indicateurs : le nombre de points (méthode classique), les expected points (simulation des résultats en fonction en fonction du nombre et de la qualité des occasions créées et concédées = expected goals), le total shot rate (rapport entre le nombre de tirs réalisés et le nombre de tirs subis) et donc le « pythagorean expectation ».

La formule de base de ce dernier pour le baseball est :

Win Ratio ou ratio de victoires  = runs scored^2 / (runs scored^2 + runs allowed^2)

Le nombre de victoires attendu est ensuite obtenu par la multiplication du Win Ratio par le nombre de parties jouées.

Le nom Pythagore est utilisé car cette première version de calcul supposait que les runs ^ 2 / (runs ^ 2 + runs autorisés ^ 2) devraient égaler le pourcentage de victoires, empruntant l’exposant de 2 au théorème de Pythagore : a ^ 2 + b ^ 2 = c ^ 2 c’est à dire dans un triangle rectangle, le côté opposé à l’angle droit, est égal à la somme des carrés des longueurs des deux autres côtés.

L’exposant 2 utilisé originellement par James a été corrigé à plusieurs reprises afin de rapprocher les prédictions de la réalité. L’exposant optimal s’est avéré ne pas être 2 mais environ 1,82 (baseball reference).

Cette statistique a été adaptée pour le basketball, le football us ou encore le hockey.

Si on devait utiliser l’approche Pythagoricienne pour le ballon rond, la formule utilisée serait la suivante : Buts inscrits ^x / (Buts inscrits ^x + Buts encaissés ^x). Pour identifier la valeur de l’exposant x, il faut pouvoir minimiser cette fonction en pénalisant les écarts importants entre la prédiction et la réalité. En utilisant les données de la saison 2019/20 de ligue 2, on additionne pour chaque équipe l’écart entre le nombre de points attendus et le nombre de points réellement obtenus. Le x qui minimise la somme des erreurs quadratiques est de 1,2.

Expo pythagore

Ce qui nous donne comme classement :

class pythagore

L’avant dernière colonne indique l’écart existant entre le nombre de points réels et le nombre de points simulés par la méthode pythagorienne. Le nuancier de couleurs permet de mettre en relief les surperformances et sous-performances collectives. On constatera qu’avec cette méthode, peut d’équipe apparaissent comme surperformantes : le nombre de point attendu est très souvent supérieur au nombre de points réel ce qui est troublant.

L’utilisation de Pythagore pour le football ne s’est pas démocratisée. Beaucoup privilégient des modèles de type Monte-Carlo avec tirages aléatoires car plus fiables pour les prédictions de résultats à venir. Je vous invite à consulter l’article suivant de soccermetrics datant de 2012 qui critique cette méthode pour le football :  https://www.soccermetrics.net/soccer-pythagorean-theory/why-the-baseball-pythagorean-doesnt-work-for-soccer

En ce qui me concerne, je serai beaucoup moins critique en vers cette méthode et je résumerai ma pensée ainsi :

  • les expected points sont utiles pour évaluer la conversion des occasions en buts,
  • le Total Shot Rate s’intéresse à la corrélation entre le nombre de tirs et la probabilité de marquer,
  • la méthode pythagorienne est utile pour convertir le nombre de buts réellement inscrits en victoires car ce sont les seules choses qui comptent finalement au classement général.

Pour toutes ces raisons, la méthode pythagoricienne n’est pas à mettre à la poubelle surtout qu’elle peut être utilisé pour le calcul de l’objectif de buts par victoires dans certains modèles WAR.

Je prédis que ces modèles vont bientôt déferler dans le monde du football. Ils correspondent à la quête ultime d’obtenir une métrique unique évaluant la valeur d’un joueur individuel par rapport à un joueur de « niveau de remplacement » comme au baseball. Ils existent surement déjà mais restent confidentiels au sein des clubs qui ont misé sur les analytics.

Dans le cas de la ligue 2 pour la saison 2019/20, on utiliserait la méthode pythagorienne de cette manière :

Buts par victoire = (4 X nombre de buts par match par équipe dans le championnat) / exposant

soit pour la ligue 2 cette saison : (4 x 1,11 ) / 1,2 = 3,7.

Autrement dit, si j’avais calculé le GAR d’un joueur (Goals Above Replacement), je l’aurai divisé par ce chiffre pour obtenir le WAR (Wins Above Replacement).

Si vous souhaitez en apprendre plus sur le WAR, je vous conseille la lecture du site americans soccer analytics qui a publié très récemment une suite d’articles sur leur métrique « goals added » qui s’approche du travail de SciSports à la différence que la méthodologie est désormais open source et non mercantilisée :

https://www.americansocceranalysis.com/home/2020/4/22/37ucr0d5urxxtryn2cfhzormdziphq

Bonne lecture

Avec ou sans Toi ?

La volonté de cet article est de décrire une méthode permettant de calculer une métrique d’un joueur en comparaison à ses coéquipiers et son équipe. Pour cet article je me suis inspiré de contenus utilisés pour l’évalution d’un joueur de hockey sur glace notamment un article publié sur hockey-graphs.com.

Cet article se base sur l’étude du CORSI qui pour le football est utilisé sous le nom de TSR (Total Shot Rate). Son calcul est le suivant : Tirs réalisés / (Tirs réalisés + Tirs subis). Pour en apprendre plus sur son utilisation footballistique, je vous incite à lire l’article de James Grayson qui est un must read.

Exemple d’utilisation du total shot rate avec le championnat de ligue 2 2019/20 et comparaison avec le nombre de points réels et le nombre d’expected points :

classement tsr

Les équipes de ligue 2 présentant un fort TSR sont Lorient, Auxerre et Guingamp. La corrélation est forte entre le TSR et le nombre de points attendus (xPoints). Avant l’apparition des expected goals, cette stat était souvent utilisée. A tort, son utilisation s’est raréfiée alors qu’elle permet d’observer par un simple calcul le classement général avec un autre point de vu plus en rapport avec le contenu et le rapport de force des matchs. Dans le cas de la Ligue 2, les sous performances (Auxerre, Guingamp par exemple) et les surperformances (Clermont, Valenciennes) sont mises en relief par le TSR et par les xPoints.

Je vais utiliser le TSR pour l’appliquer individuellement et relativiser la contribution d’un joueur par rapport à ses coéquipiers. On pourra ainsi juger : dans quelle mesure un joueur a réussi par rapport à ses coéquipiers ?

La formule adaptée pour le football est la suivante (Rel pour relative – TM pour teammate) :

Rel TM TSR90 = TSR90 du joueur sur le terrain – moyenne pondérée de tous les coéquipiers TSR90 sur le terrain sans le joueur (pondérée par le % de temps sur le terrain du joueur avec son coéquipier)

En d’autres termes, le nombre final tente de supprimer ce que les coéquipiers d’un joueur ont fait pendant qu’ils ont joué sans lui. La méthode se fonde sur l’approche WOWY (With Or Without You) :

1.) si les coéquipiers d’un joueur réussissent généralement mieux avec lui que sans lui, c’est bien,

2.) si les coéquipiers d’un joueur réussissent généralement moins bien avec lui que sans lui, c’est mauvais.

Des grilles de paires de joueurs sont construites. Prenons l’exemple de Jessy Deminguet pour les tirs réalisés (attention il manque une journée dans mon jeu de données) :

paires

Ensuite, nous déterminons chacun des temps de jeu et tirs réalisés sans Deminguet avec la conversion par 90 minutes :

paires2

Nous calculons ensuite le pourcentage de temps de jeu avec chaque coéquipier par Jessy Deminguet. Par exemple, Jessy a joué au total 1 868 minutes. Il a joué 112 minutes avec Alexis Beka Beka. Son % de temps de jeu avec Alexis est de 112 / 1 868 = 8% :

paires3

Avec les chiffres ci-dessus, nous pouvons calculer la moyenne pondérée : les tirs réalisés par les coéquipiers de Jessy Deminguet lorsque ce dernier n’est pas sur le terrain sont multipliés par le % de temps de jeu avec chacun des coéquipiers :

paires4

Nous additionnons ensuite les nombres « tirs réalisés pondérés » et divisons par la somme du % de temps de jeu avec coéquipier (la somme est évidemment proche de 10 coéquipiers). Dans le cas de Jessy Deminguet, la somme de la colonne « Tirs réalisés pondérés » est de 94,0 et la somme de la colonne «%temps de jeu avec coéquipier » est de 9,85. On divise le premier par le second (94 / 9,85) pour obtenir 9,5. Il s’agit de la moyenne pondérée du nombre de tirs des coéquipiers de Deminguet sans Deminguet.

Le nombre de tirs réalisés lorsque Jessy Deminguet est sur le terrain est de 6,7.

Le Rel TM Tirs réalisés par 90 de Deminguet est = 6,7 – 9,5 = -2,8.

Pour calculer son différentiel Rel TM TSR90, on soustrait le Rel TM Tirs réalisés – Rel TM tirs subis = -2,8 – 0,3 = -3,1. Pour l’exprimer en % au-dessus et en-dessous de 0, on calcule la moyenne pondérée des coéquipiers pour les tirs réalisés et subis/ La formule finale est la suivante :

Rel TM TSR% = (Tirs réalisés par 90 lorsque le joueur est sur le terrain / (Tirs réalisés par 90 lorsque le joueur est sur le terrain + Tirs subis par 90 lorsque le joueur est sur le terrain)) – (Tirs réalisés par les coéquipiers lorsque le joueur n’est pas sur le terrain pondéré par 90 / (Tirs réalisés par les coéquipiers lorsque le joueur n’est pas sur le terrain pondéré par 90 Tirs subis par les coéquipiers lorsque le joueur n’est pas sur le terrain pondéré par 90))

Pour Jessy Deminguet :

Rel TM TSR% = (6,7 / (6,7 + 10,1) – (9,5 / (9,5 + 9,8) = -0,09

La représentation graphique pour le Stade Malherbe de Caen pour la saison 2019/20 du Rel TM TSR% est la suivante :

graph

La clef de lecture du graphique est la suivante, si les coéquipiers d’un joueur réussissent généralement mieux avec lui que sans lui, son Rel TM TSR% sera négatif ; si les coéquipiers d’un joueur réussissent généralement moins bien avec lui que sans lui, son Rel TM TSR% sera positif.

L’utilisation d’une telle méthode peut être intéressante si on souhaite évaluer l’impact d’un joueur à l’intérieur d’une équipe. L’analyse doit se concentrer sur les joueurs ayant cumulé plus de mille minutes au cours de la saison pour avoir un échantillon de données solide ne venant pas biaiser l’interprétation.

Dans le cas des caennais, parmi les joueurs ayant disputé plus de 1 000 minutes au cours de la saison 2019/20, seuls Adama Mbengue et Jessy Deminguet ont un Rel TM TSR% négatif. De manière assez surprenante, le joueur le plus décisif du Stade Malherbe cette saison avec 5 buts et 2 passes décisives, Jessy Deminguet est mal classé avec un Rel Tm TSR% de -0,09. C’est le nombre élevé de tirs réalisés par ses coéquipiers lorsqu’il n’est pas sur le terrain qui le pénalise : 9,5 tirs contre seulement 6,7 lorsqu’il est sur le terrain.

Plusieurs facteurs peuvent en être la cause :

  • Jessy Deminguet a été titularisé 24 fois sur 25 apparitions, mais il sort souvent avant la fin du match. Son temps de jeu moyen est de 78 minutes. Les fins de matchs sont souvent plus animés et décousus lorsqu’il n’est pas sur le terrain comme lors du match aller face au HAC, du déplacement à Rodez, de la réception de Troyes… Ces coéquipiers frappent souvent au but en fin de match au moment où les espaces sont plus nombreux.
  • Jessy Deminguet est un joueur de contrôle : un joueur d’équilibre. Comme explicité dans ce précédent article, « Aujourd’hui, le projet de jeu des hommes de Pascal Dupraz fait la part belle aux transitions avec des attaques rapides et peu de jeu de conservation, or le Normand est un joueur qui aime toucher le ballon. Il apprécie les redoublements de passes à la différence de ses partenaires du milieu tels Jessy Pi ou Anthony Gonçalves. Contrairement à eux, il ne se tourne pas automatiquement vers l’avant pour chercher la passe létale coûte que coûte. A l’inverse, le Lexovien va souvent faire preuve de patience. Il est l’un des rares caennais à vouloir allonger le temps de possession. Il privilégie souvent le choix le moins risqué par la passe avec peu de touches de balles. ». Cette appréciation du style de jeu de Jessy se vérifie donc dans le nombre de tirs réalisés par lui ou ses partenaires lorsqu’il est sur le terrain.

Voir Jessy Deminguet mal classé n’est finalement pas une aberration au regard de cette description et sa faible contribution offensive dans le jeu. Quant à Adama Mbengue, l’explication est beaucoup plus rapide car lorsqu’il est sur le terrain, le SMC subit 12,2 tirs par match !

Cette méthode est un indicateur supplémentaire qui me semble pertinent pour évaluer l’impact d’un joueur dans les performances de l’équipe à partir du moment où l’échantillon de données est suffisant. Dans l’exemple ci-dessus j’ai utilisé le total shot rate mais on pourra utiliser d’autres métriques comme les expected goals, les passes… L’influence du joueur est objectivée.

Dans l’article initial publié sur hockey graphs, il sert également au calcul du WAR d’un joueur. Un autre sujet à explorer prochainement…

Introduction au Player Impact Estimate (PIE)

Au Basketball, une des statistiques les plus récentes est le Player Impact Estimate. Elle a été créée en 2013 par John Hollinger aujourd’hui VP of basketball operations chez les Memphis Grizzlies. La carrière d’Hollinger est intéressante. Il a d’abord été blogueur en 1996 avec un site web qui avait pour accroche « The Basketball Page for Thinking Fans ». L’écriture de son blog était pour lui un hobby. Elle était le point de départ d’une grande aventure.

Il a ainsi pu expérimenter plusieurs nouvelles méthodes d’analyses notamment dans l’évaluation de la contribution d’un joueur à la performance globale de l’équipe.

Il a attiré l’œil de plusieurs magasines web et papiers qui ont mis en avant son travail. Il a ensuite été embauché chez OregonLive.com où il a développé le fameux PER : Player Efficiency Rating. Il a ensuite poursuivi sa carrière chez Sports Illustrated et ESPN avant d’entrer chez les Grizzlies. Entre temps, il a complété le PER par le Game Score qui est la statistique que l’on retrouve le plus souvent dans les tableaux de statistiques NBA dans la colonne Évaluation.

La production statistique de John Hollinger s’est rapidement démocratisée en partie par la simplicité de ses calculs et leur lisibilité. C’est le cas avec le Player Impact Estimate (PIE).

Récemment le site francophone viziball a été lancé. Ce dernier rend accessible les différents classements et performances collectives et individuelles de la NBA sous un design bien pensé. Le PIE est par exemple mis en avant. C’est en consultant ce site que m’est venu l’envie d’expérimenter le PIE et de l’appliquer au football.

Définition

Selon le glossaire de viziball, « le PIE désigne le pourcentage des faits de matchs auxquels le joueur a participé. C’est une statistique intéressante car elle propose de montrer sous forme de ratio, la contribution d’un joueur sur un match.

Il s’agit bien de tous les faits de matchs, donc pas uniquement les actions d’une équipe. C’est à dire qu’en additionnant les PIE de tous les joueurs on obtient très précisément 100%. Cela veut aussi dire qu’à chaque fois qu’un joueur réalise un fait de match positif (panier, rebond, passe décisive, contre, interception), cela va faire diminuer un peu la note de tous les autres. Ainsi, une ligne de stat identique sur deux matchs différents, ne donnera pas nécessairement la même mesure d’impact, et réciproquement, deux mesures d’impact identiques, ne proviendraient pas forcément de lignes de stats identiques. De même le score peut être négatif, dans le cas où le joueur n’a pas produit suffisamment de faits de match positifs pour passer au-dessus de zéro. »

La bonne nouvelle, c’est que cette définition est tout à fait adaptable au football. Le PIE est utilisable en l’état. On va pouvoir mesurer l’impact d’un joueur sur l’ensemble des actions d’une rencontre. La différence par rapport au basket sera simplement que les actions ne seront pas des paniers, rebonds mais des passes, duels, ou encore des dégagements…

Attention, il ne faut pas se tromper d’objectif. Il ne s’agit pas d’évaluer la performance du joueur. Ici il s’agit de mesurer sa contribution aux actions d’un match : c’est bien son impact quantitatif qui est mesuré.

Formule

Comme décrit ci-avant, on va soustraire les actions individuelles ratées aux actions individuelles réussies et les comparer à la somme des actions réalisées sur le match :

PIE d’un joueur = (Nombre d’actions réussies – Nombre d’actions ratées) / (Somme du nombre d’actions réussies des deux équipes – Somme du nombre d’actions ratées des deux équipes)

A la différence du basketball, on peut s’attendre à de grandes différences dans les résultats du PIE à cause de deux composants majeurs :

  • Il y a 22 joueurs sur un terrain de football contre 10 au basket : l’impact d’un joueur sur une rencontre de foot sera plus faible avec moins Evènements comptabilisés
  • Il y a de plus nombreux postes au football qu’au basketball. Le gardien par exemple ne peut être inclus dans l’étude d’impact. Son rôle et ses actions ne sont pas comparables aux joueurs de champs. Aussi, la réussite des actions sera plus forte pour un défenseur qu’un attaquant. Nous y reviendrons un peu plus tard.

Exemple

J’ai pris comme exemple le dernier match du Stade Malherbe face à Châteauroux le 6 mars dernier. 25 joueurs de champ ont pris part au match pour un total de 1 437 actions tentées, 886 actions réussies et 551 actions ratées.

Exemple de calcul pour Romain Grange :

  • Nombre d’actions totales : 62
  • Nombre d’actions réussies : 43
  • Nombre d’actions ratées : 62 – 43 = 19

Calcul du PIE :

(43 – 19) / (886 – 551) = 7,2%. Romain Grange a contribué à 7,2% des actions du match. Il a un ratio positif ce qui signifie que le joueur a produit plus d’actions réussies que d’actions ratées.

Tableau récapitulatif du PIE de ce match :

CHASMC

Aidé par le code couleur, et un tri décroissant par équipe, on peut visualiser les joueurs ayant contribué le plus sur le match (en rouge) et le moins (en vert), la moyenne étant de 4% (100% / 25 joueurs de champs). Attention, la moyenne par équipe est indiquée à titre indicative. Elle est tronquée du fait du nombre de participants à la rencontre de chacune des équipes (13 joueurs de champs côté Berrichonne contre 12 côté caennais).

Comme évoqué ci-avant, la répartition par profil est primordiale afin d’interpréter les résultats correctement sans biais car un attaquant aura un taux de déchet plus important qu’un défenseur :

CHASMC par poste

Clef de lecture :

  • les joueurs caennais qui ont eu la plus grosse contribution sont des défenseurs
  • les joueurs castelroussins qui ont eu le plus d’impact sont des milieux avec un gros match de Valentin Vanbaleghem et Remi Mulumba
  • l’offensif qui a eu le plus d’impact est Romain Grange
  • Alexis Goncalves a eu beaucoup de déchet ainsi que Leo Leroy
  • Les milieux caennais ont beaucoup moins contribué que les milieux castelroussins avec Jessy Deminguet en retrait

Ces contributions sont à contextualiser avec les données macros du match. Châteauroux avait gagné ce match 2-1.

macro

  • Résultat conforté par les expected goals : 2,02 xG versus 1,01 pour Caen.
  • Possession de balle équivalente
  • Moins de déchet par la passe pour Châteauroux
  • Châteauroux a joué plus long que Caen
  • Caen a gagné plus de ses duels que les castelroussins
  • Châteauroux a moins attaqué que les caennais
  • Caen a joué plus haut que les castelroussins

Ces données macro se révèlent insuffisantes notamment pour jauger les zones d’influences, de dominations et de faiblesses des équipes. Complété par le PIE, le rapport de force devient visible. Avant une rencontre, la confrontation des PIE de chacune des équipes peut permettre justement d’approcher les matchup.

Exemple des PIE compilés depuis le début de saison pour les joueurs avant la rencontre Châteauroux-Caen :

CHASMC pré

Les prévisions sont sensiblement proches de la réalité de la rencontre :

  • Oui : les défenseurs caennais ont contribué le plus dans leur équipe : défenseurs centraux A. Weber et J. Rivierez
  • Les milieux castelroussins V. Vanbaleghem et R. Mulumba ont été impactant
  • R. Grange est l’offensif qui a contribué le plus.
  • H. Vandermerch, latéral droit, a plus contribué que A. Mbengue, latéral gauche
  • Etc…

A la lumière de ces résultats, le PIE semble avoir un avenir dans le football. Son utilisation est à calibrer et surtout à contextualiser comme tout indicateur statistique individuel.

Illustration sur une saison

A partir des 280 matchs disputés cette saison en ligue 2, des 530 joueurs de champ et des 590 279 actions tentées, ci-dessous le top 10 par poste pour les joueurs ayant disputé plus de 1 000 minutes :

clas

Limites et avenir

L’utilisation du PIE telle que décrite dans cet article vise à chiffrer quantitativement la contribution d’un joueur de champ dans un match. Elle ne vise pas à évaluer qualitativement la performance.

Prenons l’exemple des attaquants centraux dans le classement ci-dessus. Les joueurs qui sont mis en avant sont des profils d’attaquants qui ne sont pas des attaquants pivots avancés sur le terrain. Amine Bassi ou Jérémy Ménez sont plutôt des faux neuf dézonant. Ils sont donc récompensés à travers le PIE contrairement à des profils « à risque » comme Abdoulaye Sané de Sochaux par exemple. On privilégiera donc une analyse équipe par équipe, poste par poste plutôt qu’un classement collectif comme présenté précédemment. L’utilisation isolée du PIE dans le cas du scouting est à déconseiller. Elle doit être complétée par d’autres indicateurs.

Dans le football, pour évaluer objectivement la performance des joueurs, il faudra valoriser tout type d’action des joueurs en fonction de son impact sur le résultat du jeu tout en tenant compte du contexte dans lequel l’action est arrivée.

Scisports a déjà bien avancé sur le sujet avec sa mesure du VAEP (Value Valuing Actions by Estimating Probabilities) à base d’intelligence artificielle et de machine learning.

Leur indicateur s’éloigne de la philosophie des indicateurs de John Hollinger. Ces derniers sont SMART c’est-à-dire : spécifique, mesurable, acceptable, réaliste et temporellement défini. Dans le cadre du VAEP mais c’est la cas pour tous les scores -index algorithmiques diffusés par les médias (indice canal, note whoscorred, note sofascore…), il sont difficilement acceptables car leurs calculs et leurs formules d’élaboration ne sont pas partagés avec les lecteurs. Leur crédibilité n’est pas assurée.

Dans les sports majeurs nord- américains, ce n’est pas le cas. Pour le basket, ou encore pour les sabbermetrics du baseball, les statistiques avancées sont partagées et acceptées. Leurs calculs sont souvent rapidement compréhensibles car le plus souvent sont le résultat de pondération de certains composants des actions. Exemple du gamescore dans le basketball :

PTS + (0.4 * FG) – (0.7 * FGA) – (0.4 * (FTA – FT)) + (0.7 * ORB) + (0.3 * DRB) + STL + (0.7 * AST) + (0.7 * BLK) – (0.4 * PF) – TOV

Pour ma part, la définition du PIE telle que décrite dans cet article m’a convaincu surtout pour son utilisation dans l’évaluation du rapport de force pré et post match. Elle a ses limites comme tout indicateur. J’espère vous avoir convaincu.

Etude des systèmes de jeu en Ligue 1

Dans le dernier livre édité par Vestiaires intitulé « Les Systèmes de jeu », 9 dispositifs sont décrits et analysés abordant l’organisation générale, les animations spécifiques, les profils, les problématiques ou encore des pistes de réflexion afin de guider l’entraîneur de football.

Il est difficile de juger du système déployé sous nos yeux au cours d’un match. La part de subjectivité est grande au moment de qualifier et dénombrer le dispositif tactique surtout que selon la phase de jeu, des modulations peuvent apparaître : de 4 défenseurs, passage à trois axiaux avec ballon par exemple, ce qui complique la tâche.

C’est un vrai sujet pour les producteurs de données dont les analystes sont formés pour adopter un référentiel d’observation commun. Ainsi, au moment d’analyser un match, les fournisseurs de data vont saisir les événements des matchs à quatre yeux afin de limiter d’éventuels biais subjectifs y compris au moment de dénombrer l’occupation de l’espace par les joueurs.

Après avoir dévoré le dernier livre de Vestiaires, j’ai voulu confronter ma lecture avec la vérité des chiffres. La suite de cet article vise à répondre aux questions suivantes :

  • Quels systèmes sont les plus répandus ?
  • Quelles sont les tendances des cinq dernières années ?
  • Quelles performances sont obtenues selon les systèmes
  • Pour quoi faire ?
  • Qui les utilise ?
  • Quelles performances selon les systèmes affrontés ?

Pour y parvenir, j’ai pu accéder, compiler et synthétiser la quasi-totalité des systèmes de jeu mis en place au coup de sifflet d’envoi en ligue 1 depuis la saison 2015/16 soit 3 584 systèmes pour 1 792 matchs (7 matchs me sont manquants).

Un échantillon suffisamment large pour révéler quelques observations qui ne me semblent pas anodines. A vous de juger.

A noter qu’il s’agit des systèmes observés au coup de sifflet d’envoi ce qui est un biais pour la suite de cet article. Même si les dispositifs analysés ont été maintenus en moyenne 74 minutes au cours des matchs, cela introduit un biais notamment au moment d’évaluer la performance du dispositif car le système de départ n’est pas forcément celui du coup de sifflet final.

Les systèmes utilisés :

Selon le jeu de données compilé, 16 systèmes au total ont été utilisé par les coachs de ligue 1 ces 5 dernières saisons :

  • 4-3-3 pointe basse
  • 4-2-3-1
  • 4-4-2 à plat
  • 4-4-2 losange
  • 4-1-4-1
  • 3-4-3
  • 3-5-2
  • 4-3-3 pointe haute
  • 4-3-2-1
  • 3-3-3-1
  • 3-5-1-1
  • 5-4-1
  • 4-2-2-2
  • 4-3-1-2
  • 4-5-1
  • 3-4-2-1

Les 9 premiers systèmes de cette liste sont compris dans le recueil de Vestiaire sorti en janvier dernier. Les 7 derniers ne le sont pas.

Quels systèmes sont les plus répandus ? Quelles sont les tendances des cinq dernières années ?

déf à 4 vs déf à 5

Les systèmes à quatre défenseurs sont les plus répandus.

Néanmoins le choix d’une défense à trois axiaux est de plus en plus répandu avec 80% des systèmes en L1 en 2019/20. L’utilisation d’une défense à trois axiaux a triplé en 5 ans en ligue 1 avec un boom en 2018/19 : 25% des systèmes.

Déclinaison par systèmes

classement

Le système le plus utilisé est le 4-2-3-1 avec 24,5% des dispositifs.

Ce dispositif vient largement en tête de ce classement avec 7 point d’avance sur un trio composé du 4-4-2 à plat, du 4-1-4-1 et du 4-3-3 pointe basse.

Si le 4-2-3-1 a été le plus utilisé sur ces 5 dernières années, il est intéressant de noter que ce dernier n’est plus le système préféré en 2019/20. En effet le 4-4-2 à plat est désormais privilégié.

Le 4-1-4-1 est également au fur et à mesure des années de plus en plus choisi.

En revanche le 4-3-3 pointe basse est de moins en moins choisi alors qu’il était le système le plus choisi en 2016/17.

Le 3-5-2, très peu utilisé jusqu’en 2018, est désormais le troisième le plus utilisé par les coachs de ligue 1.

Quelles performances sont obtenues selon les systèmes ?

Pour juger de la performance obtenue, je me suis intéressé aux expected goals car ils illustrent la réelle performance de l’équipe contrairement au résultat. Pour rappel, les expected goals mesurent la probabilité de marquer suite à tir, selon la situation de ce dernier.

J’ai donc compilé pour chaque dispositif les expected goals inscrits, les expected goals subis et les expected points autrement dit les buts inscrits attendus, les buts encaissés attendus et le nombre de points attendus par match.

classement performance

Les dispositifs ayant permis d’engranger un maximum de points par match sont au cours des 5 dernières années en ligue 1 sont par ordre décroissant :

  • Le 4-2-2-2 (attention il n’a été utilisé que 4 fois)
  • Le 4-3-3 pointe basse
  • Le 4-4-2 losange
  • Le 3-4-3
  • Le 4-3-1-2
  • Le 4-4-2 à plat
  • Le 4-2-3-1
  • Le 3-4-2-1

Les dispositifs les moins productifs en points par match sont au cours des 5 dernières années en ligue 1 par ordre croissant :

  • Le 4-3-3 pointe haute
  • Le 3-3-3-1
  • Le 5-4-1
  • Le 4-5—1
  • Le 3-5-1-1
  • Le 4-3-2-1
  • Le 4-1-4-1
  • Le 3-5-2

Attention, le tableau ci-dessus ne signifie pas que tous les entraîneurs de ligue 1 doivent se ruer sur le 4-2-2-2 ou le 4-3-3 pointe basse. En fonction des effectifs à disposition et des profils, il est toujours entendu que le dispositif doit être adapté aux joueurs à disposition et au projet de jeu choisi.

Néanmoins le tableau ci-dessus pose des faits : par exemple le 4-1-4-1 est beaucoup moins performant que le 4-4-2 à plat ou le 4-2-3-1 en ligue 1 sur les 5 dernières années.

La problématique sous-jacente à la publication de ces résultats : Est-ce que certains dispositifs sont surutilisés au regard des performances obtenues et inversement, Est-ce que certains dispositifs sont sous-utilisés à tort ?

Le rapport entre points attendus et nombre d’apparitions des systèmes ci-dessous nous aidera à y voir plus clair :

comp

Les systèmes sous-utilisés à tort :

  • Le 4-2-2-2 (attention échantillon faible)
  • Le 4-4-2 losange (attention échantillon faible)
  • Le 3-4-3
  • Le 4-3-1-2
  • Le 3-4-2-1

Les systèmes surutilisés à tort :

  • Le 4-3-3 pointe haute (attention échantillon faible)
  • Le 3-3-3-1 (attention échantillon faible)
  • Le 5-4-1
  • Le 3-5-1-1 (attention échantillon faible)
  • Le 4-5-1
  • Le 4-3-2-1 (attention échantillon faible)
  • Le 3-5-2
  • Le 4-1-4-1

Pourquoi faire ?

Le tableau ci-dessus vise à décrire les statistiques saillantes par dispositif. Cette fois-ci, la présentation des dispositifs n’est pas par ordre décroissant d’utilisation mais par ordre décroissant des performances :

classement posse

Il est intéressant de constater que les dispositifs expansifs (dont la possession de balle est importante) ont un rendement de points attendus supérieurs aux dispositifs réactifs (dont la possession de balle est inférieur à 50%). C’est à dire, si je cherche à être performant, je cherche à tenir le ballon.

Seul le 4-4-2 à plat tire son épingle du jeu parmi les dispositifs réactifs avec une possession moyenne de 48,6% et un nombre de points attendus de 1,29 pt.

Autrement dit, je cherche à tenir le ballon, je choisis soit : le 4-2-2-2, le 4-3-3 pointe basse, le 4-4-2 losange, le 3-4-3, le 4-3-1-2 le 4-2-3-1 ou le 3-4-2-1. La faible utilisation du 4-3-3 pointe basse ces deux dernières saisons est une incohérence au regard de ces données. Au plus fort de son utilisation, en 2016/17, il permettait de se créer 1,7 xG par matchs contre 1,07 xG concédés. Un futur retour en grâce ?

A l’opposé, si je ne cherche pas à tenir le ballon, j’opte pour le 4-4-2 à plat. Pour rappel, le 4-4-2 à plat est le système le plus utilisé en ligue 1 cette saison. En revanche le 4-1-4-1, 3-5-2 et le 4-5-1 sont de mauvais choix.

Qui l’utilise ? Contre quel système ?

Le 4-2-2-2

Un seul club l’a utilisé. Il s’agit du fameux 4-4-2 du PSG considéré comme un 4-2-2-2 avec la présence des 4 fantastiques (Di Maria-Neymar-Mbappé-Icardi ou Sarabia). Le PSG l’a utilisé 4 fois cette saison : 2019-08-25, PSG – Toulouse 4:0, 2020-01-15 Monaco – PSG 1:4, 2020-02-01 PSG – Montpellier 5:0, 2020-02-04 Nantes – PSG 1:2. Des résultats probants avec des scores larges donc mais valable pour un effectif world class.

Le 4-3-3 pointe basse

On retrouve les habitués du haut du classement dans cette catégorie avec PSG, Bordeaux, Nice, Olympique Lyonnais, Olympique Marseille. L’animation de ce dispositif suppose des profils particuliers et dominants dans leurs domaines. Est-ce que cela signifie que seuls les grands clubs peuvent y prétendre ?

Angers en 2015/16 et 2016/17 l’a utilisé par exemple fort a propos ou Nantes en 2018/19…

En revanche, Dijon a eu d’énormes difficultés a l’animé lors de la saison 2018/19 sous Olivier Dall’Oglio ou même en 2016/17.

Le 4-3-3 s’est révélé moins performant en effet miroir face à un autre 4-3-3.

Le 4-4-2 losange

Trop peu d’échantillons sur ce dispositif. La dernière fois, qu’un coach de ligue 1 l’a utilisé plus d’une mi-temps, c’était Thierry Laurey en octobre dernier avec Strasbourg face à Nice avec un losange composé de Bellegarde en pointe basse, Liénard et Fofana excentré et Thomasson en n°10.

Le 3-4-3

Peu utilisé ces cinq dernières années, il donne régulièrement satisfaction.

En revanche cette saison, St Etienne l’a utilisé déjà 7 fois cette saison pour des résultats décevants : 3 V, 1 N, 4 D avec une utilisation peut-être à contre-emploi (jeu réactif avec 46% de possession).

Il prend régulièrement le dessus sur des défenses à trois axiaux ou le 4-4-2.

Il est en revanche en difficulté face au 4-2-3-1, 4-3-3 et 4-1-4-1.

Le 4-3-1-2

Alors qu’il était en vogue en 2015/16 avec notamment Nice et Lyon comme disciples, peu l’utilise aujourd’hui hormis Strasbourg cette saison.

A éviter face au 4-1-4-1, 4-3-3 et 4-4-2.

Le 4-4-2 à plat

Grand succès de la ligue 1 cette saison, l’adopter n’est pourtant pas gage de réussite. Si le 4-4-2 lillois, monégasque ou rennais fonctionne bien, celui de Brest, Nîmes, Amiens, Toulouse ou Nice n’a pas été aussi performant.

Très fort face au défense à trois axiaux ce qui explique qu’il a le vent au poupe puisque de nombreuses équipes choisissent une défense à trois axiaux cette saison.

Le 4-2-3-1

Reims est un grand fan de ce système pour des résultats très corrects depuis sa montée. Beaucoup d’autres clubs l’ont utilisés pour des résultats médiocres comme Amiens, Nantes ou Caen l’an passé.

Fort face au 4-1-4-1 et aux défenses à trois axiaux. En difficulté face au 4-2-3-1, 4-4-2, 4-3-3 et 4-3-1-2.

Le 3-4-2-1

Bordeaux est la seule équipe a l’utilisé fréquemment avec des résultats passables sous Paulo Sousa. En difficulté face au 4-4-2.

Le 4-1-4-1

Très gros succès chez les clubs de L1 mais pour des performances décevantes. Angers (depuis très longtemps) et Marseille cette saison sont les seules équipes a véritablement tirer toute la quintessence de ce système.

Caen, Toulouse, Dijon, Metz, Troyes, Lorient ont tous pendant de nombreux matchs adoptés ce système pour des échecs et des descentes en L2 (pas tout à fait pour Toulouse).

Lorsque le SCO, l’utilise, il obtient ses meilleurs performances face à des dispositifs en 4-2-3-1 ou en 4-4-2.

Le 3-5-2

Les performances du 3-5-2 ne sont pas bonnes. Cette saison, l’utilisation faite par Monaco est une éclaircie. Mais son utilisation faite par Rennes en août et septembre dernier sont un contre-exemple.

Le 3-5-2 fonctionne correctement face au 4-2-3-1. Il est en difficulté face au 4-3-3.

Le 4-3-2-1

Très peu utilisé. Bastia l’a longtemps utilisé en 2016/17 pour un très faible rendement.

Le 4-5-1

Ni trop fort, ni trop faible. Le 4-5-1 permet d’obtenir des performances corrects sans excès.

Rennes l’a souvent utilisé avant l’arrivée de Julien Stéphan pour des résultats moyens. Nantes l’a utilisé a meilleur escient la saison passée.

Amiens, Dijon, Caen n’ont pas su le dompter en revanche ces dernières années.

Le 3-5-1-1

Trop peu utilisé pour en tirer des conclusions.

Le 5-4-1

A éviter : Caen en 2016/17 ou Toulouse en 2018/19.

Peu efficace face au 4-4-2 ou le 4-3-3. Plus intéressant face au 4-2-3-1.

Le 3-3-3-1

Le Lille de Bielsa.

Le 4-3-3 pointe haute

Pas vu depuis Dijon Nantes en octobre 2018 avec Olivier Dall’Oglio à la baguette.

Tableau récapitulatif

dispositifs resume

Ce qu’il faut retenir :

Les systèmes à quatre défenseurs sont les plus répandus.

Le choix d’une défense à trois axiaux est de plus en plus répandu

Ces cinq dernières années, le système le plus utilisé est le 4-2-3-1

Le système préféré cette saison en L1 est le 4-4-2 à plat

Le 4-1-4-1 est également au fur et à mesure des années de plus en plus choisi.

Le 4-3-3 pointe basse est de moins en moins choisi alors qu’il était le système le plus privilégié en 2016/17.

Le 3-5-2, très peu utilisé jusqu’en 2018, est désormais le troisième le plus utilisé par les coachs de ligue 1.

Les dispositifs ayant permis d’engranger un maximum de points par match sont au cours des 5 dernières années en ligue 1 sont par ordre décroissant :

  • Le 4-2-2-2 (attention il n’a été utilisé que 4 fois)
  • Le 4-3-3 pointe basse
  • Le 4-4-2 losange

Les dispositifs les moins productifs en points par match sont au cours des 5 dernières années en ligue 1 par ordre croissant :

  • Le 4-3-3 pointe haute
  • Le 3-3-3-1
  • Le 5-4-1

Les dispositifs sous utilisés à tort :

  • Le 4-2-2-2 (attention échantillon faible)
  • Le 4-4-2 losange (attention échantillon faible)
  • Le 3-4-3
  • Le 4-3-1-2
  • Le 3-4-2-1

Les dispositifs sur utilisés à tort :

  • Le 4-3-3 pointe haute (attention échantillon faible)
  • Le 3-3-3-1 (attention échantillon faible)
  • Le 5-4-1
  • Le 3-5-1-1 (attention échantillon faible)
  • Le 4-5-1
  • Le 4-3-2-1 (attention échantillon faible)
  • Le 3-5-2
  • Le 4-1-4-1

Il est intéressant de constater que les dispositifs expansifs (dont la possession de balle est importante) ont un rendement de points attendus supérieurs aux dispositifs réactifs (dont la possession de balle est inférieur à 50%). C’est à dire : si je cherche à être performant, je cherche à tenir le ballon.

A l’opposé, si je ne cherche pas à tenir le ballon, j’opte pour le 4-4-2 à plat.

Le 4-1-4-1 n’est pas à privilégier sauf si je suis le SCO d’Angers.

Le 4-4-2 à plat est très performant face aux défenses à trois axiaux ce qui explique sa forte utilisation cette saison étant donné le grand nombre d’équipes évoluant en 3-5-2.

Toutes les solutions ne valent pas. En fonction du projet de jeu ou de l’effectif à disposition, des inadéquations peuvent exister si le mauvais dispositif est choisi. Il est important de cerner le champ des possibles pour optimiser la performance de l’équipe.

En ce sens, j’espère que cet article vous aura été utile.

Le style de jeu des promus et barragistes

Les discussions vont bon train à la machine à café le lundi matin et c’est la même conversation entre collègues qui revient en boucle : Est-ce que le stade malherbe sera capable de réaliser une remonta jamais vue et s’immiscer dans le top 5 synonyme de place de barragiste au soir de la 38ème journée de ligue 2 ?

Tout le monde y va de son pronostic avec comme clef de lecture le nombre de points distançant les malherbistes de la cinquième place. A la trêve, ce total est de 9 points. Or dans un championnat de séries, chacun sait que l’exploit d’une remontée au classement n’est pas irréalisable. L’exemple troyen de la saison passée peut donner du baume au cœur aux joueurs caennais. Ils avaient conclu leur saison régulière par une série de 14 matchs sans défaites dont 11 victoires. Les aubois pointaient en février à la 8ème place pour finir à une belle troisième place.

Ok pour le retard au classement mais qu’en est-il du contenu ? Le résultat étant la conséquence d’un processus de match complexe, il est sans doute pertinent d’extrapoler la position finale du SMC en jugeant la qualité des prestations réalisées durant 90’ plutôt que par le simple prisme des points manquants.

Après avoir vu un jeu de possession sans progression sous Rui Almeida, le jeu observé par les fans malherbistes s’est transformé en un jeu plus énergivore et vertical. La question est donc : est-ce que ce style de jeu fait des rouge et bleu des candidats à la montée ?

L’objet de cet article est donc d’analyser le style de jeu des anciens promus et barragistes de Ligue 2 pour savoir si le jeu caennais s’approche de celui d’un vrai candidat à la remontée en Ligue 1.

Pour réaliser cette étude, j’ai collecté leurs stats et construit des indicateurs clefs révélant le style de jeu des 15 équipes promues ou ayant été barragistes en ligue 2 depuis la saison 2015/16. J’ai inséré les mêmes KPI de l’équipe caennaise depuis la prise de pouvoir de Pascal Dupraz en octobre dernier.

J’ai classifié et hiérarchisé les résultats pour allotir les styles de jeux. Ainsi les styles de jeux proches le sont également géographiquement grâce à un arbre de classification.

J’ai énuméré les points forts, points faibles directement sur cet arbre avec comme clef de lecture :

  • Les points forts sont écrits en couleur verte
  • Les points faibles sont écrits en couleur rouge

Le résultat est le suivant :

Style de jeu des promus de L2

Premier constat : il y a une hétérogénéité des profils. Il n’y a pas de chemin unique pour parvenir à la L1. On retrouve par exemple autant d’équipe joueuse que d’équipe préférant courir après le ballon.

Aussi certaines équipes présentant des carences fortes révélées par les chiffres ont réussi par le passé à se positionner en haut du classement. Ces dernières sont positionnées sur la droite de l’arbre.

C’est un motif d’espoir pour les malherbistes qui dans ce classement se situent sur la droite. Les caractéristiques de leur style de jeu sont proches de l’équipe de Troyes millésime 2016/17 qui avait accédé à la L1 après un barrage disputé face à Lorient.

Ouf, la remontée n’est pas impossible.

Il y a tout de même des réserves à porter au regard des faiblesses caennaises.

Parmi les équipes promues ou barragistes depuis 2015/16 :

  • Aucune équipe n’a sous-performé offensivement (écart favorable entre le nombre de buts attendus et le nombre de buts réellement inscrits). Aujourd’hui l’écart est nul pour les caennais
  • Seules 2 équipes avaient une possession aussi basse
  • Seule Metz, promue en 2015/16, a concédé plus d’occasions qualitatives que Caen
  • Aucune équipe n’été promue avec aussi peu de passes cassants les lignes défensives adverses (seulement 4,9 par match)
  • Caen est la seule équipe présentant un taux de tirs par attaques positionnelles aussi faible, c’est-à-dire une capacité à conclure ses attaques placées par un tir : seulement 14,3% !

En résumé, Caen peut croire en une remontada puisque par le passé des équipes présentant des carences similaires ont pu accéder au top 5 de L2. Néanmoins l’absence de créativité et de finition sont des obstacles difficilement franchis par le passé. A suivre…

Comment lire un corner offensif ?

Depuis le début de la saison, en Ligue 2, 29% des buts sont inscrits sur phases arrêtées, un taux identique à celui observé lors de la coupe du monde 2018 en Russie, record de la compétition.

On se rappelle notamment la réussite insolente des anglais de Gareth Southgate dans ce domaine avec 9 buts inscrits sur CPA contre 3 seulement dans le jeu. A quelques mois de l’échéance mondiale, l’entraîneur des three lions avait réalisé un stage de plusieurs semaines dans des équipes nord-américaines de basketball et de football américain là où la data est omniprésente.

Ces dernières années, les belles histoires dans ce domaine ne manquent pas : Nicolas Jover avec le Montpellier champion en titre en 2012/13 désormais dans le staff de Man city, Hansi Flick dans le staff de la Mannschaft lors du mondial 2014 et actuel coach du Bayern Munich, Heimir Hallgrimsonn avec l’Islande en 2016, … Dans notre sport, la percée de la data est encore timide sauf pour l’étude des corners, coups francs, penaltys et touches où une approche méthodique est désormais répandue avec des analystes dédiés dans les staffs.

Mais revenons aux caennais. Les malherbistes peinent à se procurer des occasions dans le jeu mais les situations arrêtées sont à coup sûr un moment d’excitation dans les travées pour le meilleur et pour le pire car depuis que Pascal Dupraz est l’entraîneur du SMC :

  • 64% des buts encaissés par les rouge et bleu de Pascal Dupraz l’ont été suite à une phase arrêtée !  3 corners, 1 coup franc, 2 penalty et 1 touche.
  • 43% des buts inscrits par les rouge et bleu de Pascal Dupraz l’ont été suite à une phase arrêtée  2 pénalty, 2 corners, 1 coup franc direct, et 1 touche.

Ci-dessous, un essai de carte mentale pour interpréter les corners offensifs :

Carte mentale

 

L’utilisation du 3-5-2 en Europe en 2019

Cette saison, Rui Almeida, le nouveau coach caennais, a importé le système en 1-3-5-2 de son expérience troyenne où après l’avoir installé en mars 2019, il fut invaincu en saison régulière.

Dans cet article j’ai voulu quantifier et de qualifier l’utilisation de ce dispositif à l’heure actuelle car le système n’est qu’un outil du projet de d’un entraîneur.

L’utilisation du 3-5-2 trouve ses origines au début des années 80 avec la disparition du gioco all’Italiana. On notera comme précurseurs Carlos Billardo avec l’Argentine, Ciro Blazevic avec le Dynamo Zagreb ou Sepp Piontek avec le Danemark. Le 3-5-2 s’est démocratisé assez fortement durant près d’une décennie avant que la défense à quatre ne devienne une

Aujourd’hui peu d’équipes l’utilisent. J’ai dénombré 14 équipes ayant utilisé le 1-3-5-2 dans le big five lors de la saison 2018/19 (plus de 10 matchs).

Trois équipes françaises, Trois espagnoles, cinq italiennes, deux allemandes et une anglaise.

Un système commun à beaucoup d’équipes mais avec des conceptions différentes pour jouer au football et pour gagner des matchs.

La hiérachisation ci-dessous permet de classifier selon 12 critères de jeu ces 14 équipes avec l’ajout des performances du stade malherbe depuis le début de la saison.

3-5-2.png

On relvèe que seul le Bétis de Séville de Quique Setien a utilisé ce système pour imposer son jeu de possession.

Les autres équipes l’ont surtout utilisé pour déployer un jeu de transition. Il s’agit majoritairement d’équipes italiennes et allemandes.

S’il fallait retenir un modèle du jeu de transition hyper rapide et efficace avec le 3-5-2, ce serait celui de l’Eintracht Frankfurt.

Entre les deux se situe les équipes françaises qui n’ont ni utilisé ce système pour un jeu expansif ni pour un jeu réactif.

Caen, Troyes, Strasbourg et Montpellier ont déployé un modèle de jeu avec peu d’attaques positionnelles et peu de contre-attaques.

Un tempo plus lent a donc été observé chez ces équipes.

Cette saison, Rui Almeida a importé ce système dans l’équipe caennaise depuis Troyes.

Il est intéressant de noter qu’après 3 journées de championnat, l’équipe qui se rapproche le plus du SM Caen est tout simplement Troyes, l’ancienne équipe coachée par Rui Almeida.

Les points communs sont : le peu de tirs au but, une possession équilibrée, peu d’attaques positionnelles, un usage du jeu long et vers l’avant modéré, peu de centres tentés.

Ce dernier point est d’ailleurs surprenant puisque le 3-5-2 est utilisé théoriquement pour jouer dans la largeur.

C’est la grande différence avec le jeu montpelliérain et strasbourgeois.

Si l’objectif de l’entraîneur portugais est de tendre vers le jeu déployé dans l’Aube, il faudra corriger le nombre de but attendu , ainsi que le nombre de contre attaques trop peu nombreux.

 

Classement interactif des buts et passes D attendus en France en 2018/19

https://platform.twitter.com/widgets.js

from Twitter https://twitter.com/StatMalherbe