#1 The Interview : Opta, au coeur des statistiques


My Premier League lance une nouvelle rubrique nommé « The Interview ». Nous nous efforcerons, comme nous l’avons déjà fait, de proposer des discussions sur des sujets de fond avec des interlocuteurs pertinents. Voici le premier volet de cette nouvelle série…


optas-range-of-services

2015. L’âge d’or des statistiques. On en voit partout, à toutes les sauces, pour toutes les utilisations imaginables. Le paysage footballistique a connu l’ascension fulgurante des chiffres. Dans le même temps, des sites comme Whoscored, StatsZone, Squawka se sont multipliés et ont pris un poids considérable dans la lecture et l’analyse des rencontres.

Toutefois, ne faudrait-il pas nuancer l’utilisation parfois abusive de ces statistiques ? Se dirige-t-on vers un monde de foot basé essentiellement sur la « data » ?

Pour mieux comprendre cette généralisation des statistiques, nous recevons Rob Bateman, Directeur du Contenu et des Services de Clientèle d’Opta, un des leadeurs mondiaux des fournisseurs de data sportive.

Opta a été crée en 1996. Tu as rejoint l’équipe en 1998. Quel était l’objectif d’Opta à l’époque ? Celui-ci a-t-il évolué aujourd’hui ?

Opta a été fondé en 1996 autour d’un unique produit – le « Carling Opta Index ». L’idée était de collecter de la data et d’attribuer une valeur à chaque évènement – passes, tacles, tirs, arrêts – pour évaluer la performance d’un joueur et créer un classement. Ce classement était distribué aux médias gratuitement. Évidemment, cela allait créer des discordes parmi les fans de football. Toutefois, assez rapidement, il est devenu évident que les gens étaient également intéressés par la « data pure » ainsi nous l’avons distribuée aux médias et aux clubs de Premier League.

(le côté "old" de l'image est assumé par l'auteur)
(le côté « old » de l’image est assumé par l’auteur)

Comment Opta a-t-il développé son immense réseau mondial ?

Le réseau s’est très rapidement agrandi avec le temps. L’histoire a débuté au Royaume-Uni, nous travaillions étroitement avec les médias clients pour leur montrer comment intégrer la data à leur contenu. Ensuite, c’est simple : une fois que vous avez réussi à accrocher un client, d’autres sont intéressés et veulent toujours pousser la barre plus haut. A la base, nous ne collections que la data de la Premier League, puis nous nous sommes étendus aux championnats majeurs d’Europe, soit en ouvrant de nouveaux bureaux soit en rachetant d’autres fournisseurs de data déjà établis. Nous avons également commencé à collecter de la data pour le rugby, le rugby league et le cricket parmi d’autres sports, puis nous avons progressivement atteint les Amériques, l’Extrême Orient et l’Australie. Maintenant nous appartenons à une maison mère si large (Perform Group) que notre réseau s’est étendu aux profils très en vue dans 40 pays différents.

La difficulté a été de convaincre les médias de l’utiliser. Par exemple, le graphique des 5 derniers pénalties tirés par un joueur, affiché juste avant que le joueur tire son pénalty, a été proposé aux diffuseurs il y a plus de 10 ans. A l’époque, ils étaient dubitatifs, ils disaient « nous devons montrer les ralentis ou les joueurs qui entourent l’arbitre ». Cela a pris 5 ans pour que quelqu’un l’essaie, mais une fois que cela avait été fait, nous l’avons montré à tous les autres diffuseurs et il le voulait tous.

Étant donné que nous avons continué d’innover autour de ce type de contenus, cela nous a aidé à devenir un des leadeurs des compagnies de data sportive en faisant plus qu’une simple collecte de données. L’autre point contributif majeur a été la quantité de data que nous collections dans un contexte réel et notre cote favorable par rapport aux autres, ainsi que le marché en lui-même qui devient plus sophistiqué et l’augmentation de la demande pour de nouveaux contenus par les groupes médias.

La data peut être utilisée comme un outil complémentaire, pas pour remplacer les méthodes traditionnelles d’observation.

Même question pour toi : ton rôle a-t-il évolué ? D’ailleurs, pourquoi as-tu choisi de rejoindre Opta ?

Auparavant, je travaillais dans la publicité et le marketing, mais ma passion a toujours été le football. A la fin de ma vingtaine et au début de ma trentaine, j’ai quitté mon travail pour devenir freelance et ainsi pouvoir passer 3 mois par an à engranger de l’expérience dans des groupes tels que Sky. Je voulais essayer de devenir journaliste sportif. J’étais probablement celui avec le plus d’expérience professionnelle ! J’avais déjà écrit pour des fanzines qui essayaient d’utiliser les faits plutôt que les opinions et quand l’offre d’emploi chez Opta a été proposé, j’ai candidaté et j’ai eu la chance d’être engagé. Mon patron à l’époque voulait que l’entreprise se développe rapidement et pensait que mes qualités de management et ma connaissance des différents médias pourraient aller de pair avec mes connaissances et ma passion du football pour favoriser la croissance de l’entreprise.

J’ai accepté une immense baisse de salaire pour rejoindre Opta, mais si on me demandait de mettre sur papier ce que serait mon job idéal, ce serait probablement cela. J’ai la grande chance de pouvoir faire quelque chose que j’adore et j’ai travaillé avec des personnes fantastiques. Même mes « pires » journées sont meilleures que les « meilleures » journées dans mes anciennes expériences professionnelles. En définitive, le pari a été gagnant.

Tu couvres Arsenal sur Twitter sous le pseudo @Orbinho mais tu t’occupes également du contenu international. Pourquoi les statistiques sont-elles si importantes d’une manière générale ?

J’aime beaucoup m’occuper des « faits » d’Arsenal sur Twitter, mais je donne toujours les meilleurs à @OptaJoe que j’ai crée et géré à l’origine. C’est quasiment impossible pour quelqu’un de regarder tous les matchs de tous les championnats, la data peut aider à donner un aperçu global de ce qui se passe, comme les styles de jeu, les forces et faiblesses de l’équipe, les attributs des joueurs. La data sert souvent à appuyer les théories personnelles (comme par exemple qu’Arsenal est faible sur les coups de pieds arrêtés) ou pour détruire les mythes. Si elle est utilisée correctement, elle peut aider les observateurs à mieux comprendre le jeu, ou aider les clubs dans leurs observations. Par exemple, tout le monde sait que Fabregas est un joueur créatif et qu’il a un nombre élevé de passes décisives, mais les données sur les «occasions créées qui ne mènent pas à un but » peuvent mettre en lumière un joueur sous-estimé qui n’a pas beaucoup de passes décisives parce que l’attaquant avec lequel il joue n’a pas converti les occasions. Tout le monde ne peut pas se permettre d’avoir Fabregas, mais on peut utiliser la data pour créer une « shortlist » de joueurs à observer, pour aider les recruteurs à être plus efficaces et peut-être signer un joueur à un bon prix, qui peut aider l’équipe. Les clubs ne peuvent pas regarder tous les matchs. En revanche, s’ils ont la data de tous les joueurs de tous les championnats, cela les aide à repérer de potentielles recrues et envoyer leurs recruteurs. La clé pour comprendre tout cela est la suivante : la data peut être utilisée comme un outil complémentaire, pas pour remplacer les méthodes traditionnelles d’observation.

En réalité, elle [la data] n’a presque jamais une signification unique. On peut utiliser la data pour illustrer les choses, mais il est important de prendre en compte le contexte et de faire preuve de bon sens.

Toutefois, comment peut-on être pertinent avec les stats ? Évidemment, le football n’est pas fait que de chiffres. Comment les assimiler ?

Tout est une question de contexte. Tout le monde à Opta dira que la data ne permet pas d’avoir réponse à tout. Ce qu’elle permet c’est de poser des questions et ensuite, on utilise d’autres ressources – vidéos, nos propres yeux, nos recruteurs – pour appuyer ce que la data nous dit. Encore une fois, si l’on utilise le « nombre d’occasions créées », un joueur aura peut-être un nombre élevé, mais quand un club signe un joueur, il a besoin de savoir quels types d’occasions il crée – combien sur des situations de jeu et combien sur coups de pieds arrêtés. Si Liverpool signait quelqu’un qui était très efficace sur corners et coups-francs, avec Gerrard, ses stats seraient évidemment amoindries. Ou si vous avez un ailier qui centre beaucoup mais vise un grand attaquant comme Andy Carroll, vous n’allez probablement pas l’acheter si vous avez Jermain Defoe devant.

Les gens ont tendance à sur-utiliser les stats, la plupart du temps pour en faire leur argument principal. Cela est-il possible ? Je pense que, globalement, les stats sont parfaites pour illustrer un argument ou donner des exemples. Qu’en penses-tu ?

Bien évidemment, la data peut être mal utilisée. Les gens se focalisent sur un point de data précis et disent « ceci veut dire ceci ». En réalité, elle n’a presque jamais une signification unique. On peut utiliser la data pour illustrer les choses, mais il est important de prendre en compte le contexte et de faire preuve de bon sens. Ceci est un bon résumé d’un incident en particulier :http://www.theguardian.com/football/blog/2015/feb/11/louis-van-gaal-sam-allardyce-long-ball

Penses-tu que la tactique et les statistiques sont compatibles ?

Il y a certainement des connaissances tactiques qui peuvent être apprises par la data. Je me souviens d’un match entre Reading et Arsenal, c’était un lundi soir, Gary Neville disait qu’Arsenal ne centrait pas beaucoup mais que Reading était l’équipe dans tout le championnat la plus susceptible de concéder des buts sur des centres, et utilisait les chiffres (ceux des buts concédés sur des centres par Reading) pour appuyer son raisonnement. En tant qu’arrière latéral, il expliquait l’évolution du jeu et que de son temps, les ailiers étaient attirer vers l’intérieur, alors que maintenant, les latéraux essayent de pousser les joueurs vers la ligne de touche. Il disait cela parce que des équipes comme Arsenal aimaient repiquer dans l’axe pour passer dans l’espace plutôt que de centrer. Il pensait qu’Arsenal aurait fort à gagner à jouer « contre nature » et à essayer de plus centrer. Les Gunners ont marqué 3 buts en première mi-temps, 3 buts sur des centres ! Il avait un sourire très suffisant lors de son analyse à la pause.

Quelle est la partie la plus difficile de ton métier ? La collecte des statistiques ou être pertinent en les utilisant ?

La partie la plus difficile de mon travail est probablement de ne pas avoir un grand contrôle de la manière dont elles sont utilisées. Occasionnellement, elles peuvent être mal utilisées, mais dans ces cas précis, c’est rarement l’auteur de l’article qui est critiqué, mais bel et bien la data qui est remise en cause. Les stats dans le football sont encore dans leur « jeunesse » et pour les fans, elles ont souvent mauvaise réputation.

Il y avait trois fois plus de tirs lors de la Coupe du Monde 1966 que lors de l’édition 2006.

Quels changements majeurs prévois-tu d’ici 10 ou 20 ans ? Penses-tu que les avancées technologiques sont une aubaine ou un « fardeau » ?

Je pense que scruter la data, couvrir les actions sans le ballon deviendra plus commun et cela devrait nous permettre d’expliquer ce qui passe autour du porteur de balle. A l’heure actuelle, elle est seulement utilisée pour mesurer à quelle distance ou à quelle vitesse un joueur court. Mais dans le futur, elle pourrait être utilisée pour montrer la force d’un joueur pour faire une passe ou un tir sous pression parce que nous aurons les informations sur les 22 joueurs au lieu de ne les avoir que quand ils sont en possession de la balle. On trouvera peut-être des éléments que les joueurs porteront pour changer la manière pour collecter et étudier la data. Et bien évidemment, l’accès aux données et la manière dont elles seront utilisées changera. Il y a 10 ans, le « match centre » avec les chiffres totaux basiques ou les alertes buts par SMS étaient des innovations. Il suffit de penser aux différentes applications de représentations graphiques ou les TV tactiles disponibles aujourd’hui, le panorama continuera probablement de s’étendre avec les nouvelles données et les nouvelles façons de les utiliser.

Il y a 50 ans, les statistiques n’avaient pas l’importance qu’elles ont aujourd’hui à cause des limites technologiques évidentes. Pourtant, penses-tu qu’elles auraient été aussi utiles qu’elles le sont aujourd’hui ?

Oui. Le jeu n’a pas autant changé que cela. Ce qui a changé, bien sûr, c’est que les matchs sont disponibles en images vidéos et la technologie pour être capable de collecter la data, nous l’avons. Il n’était possible que d’avoir des choses très basiques il y a 50 ans. Mais nous avons analysé des matchs datant de cette époque, comme l’intégralité de la Coupe du Monde 1966 donc nous pouvons voir l’évolution du jeu. Il y avait trois fois plus de tirs lors de la Coupe du Monde 1966 que lors de l’édition 2006.

Ce qui m’intéresse c’est de voir comment la data peut aider à mieux comprendre le sport […].

Penses-tu qu’Opta soit à son paroxysme ou est-ce que le meilleur est encore à venir ?

Opta a évolué en même temps que le marché s’est développé. Opta a innové et probablement fait plus que quiconque pour aider les médias à intégrer la data dans leurs programmes. Nous espérons continuer notre contribution dans cette avancée avec les nouvelles capacités de collecte de données et de modélisation mathématique qui deviennent plus « mainstream », les clubs et les médias sont toujours à la recherche de contenu pour satisfaire les demandes de leurs lecteurs ou (téle)spectateurs. Ainsi, Opta, en adéquation avec notre maison-mère Perform Group, cherchera toujours à améliorer son offre.

As-tu tendance à voir des chiffres partout dans ta vie quotidienne? Sont-ils devenus une sorte d’obsession ?

J’ai toujours apprécié et utilisé les chiffres, mais je ne dirais pas que je recherche à tout prix à voir des choses numériques partout sans aucun véritable intérêt. Mon obsession est le football et je ne pense pas que cela changera un jour. Ce qui m’intéresse c’est de voir comment la data peut aider à mieux comprendre le sport et j’apprécie énormément échanger cela avec d’autres personnes.

Notre site se focalise sur le football anglais et la Premier League en particulier. Apprécies-tu toujours regarder la Premier League si tu laisses les statistiques de côté ? D’ailleurs, est-ce encore possible pour toi ?

Je dois avouer que je regarde beaucoup moins de football que j’ai pu le faire. Notre travail est tel que nous ne pouvons nous concentrer sur les matchs en tant que divertissement pendant que nous travaillons parce que nous nous focalisons sur des évènements comme les buts, les cartons ou d’autres données et après nous recherchons des éléments pour satisfaire les diffuseurs afin qu’ils puissent les utiliser en direct. On a en quelque sorte le match en fond sonore. En tant que fan d’Arsenal, j’essaie de ne rater aucun match quand je le peux. J’ai tendance à ne pas apprécier un match pour son « spectacle » si je le regarde chez moi. Je suis constamment en train de « penser » data car j’ai accès à différents outils de recherche sur mon ordinateur portable et je partage mon travail avec mes collègues ou d’autres fans. C’est une histoire totalement différente quand je vais aux matchs avec mon fils, je peux me détendre et regarder le spectacle, ses réactions, la foule. Ce n’est pas pour autant que je ne suis pas contrarié quand Arsenal concède encore une fois un but de la tête car je sais qu’ils sont une des pires équipes dans ce domaine !

Pour aller plus loin, je vous invite à lire l’excellent papier des Cahiers du football : http://www.cahiersdufootball.com/article-us-et-abus-de-la-data-5705

Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s