Comment récupérer les données du PMU ?

Retour au blog

Par L'équipe Boturfers, le 19/04/2018
Mots-clés de l'article : PMU API widgets

Beaucoup de personnes recherchent souvent à récupérer les données hippiques du PMU, si possible automatiquement, sans rien à faire et évidemment, gratuitement puisque c'est bien connu, le web est gratuit... ;) Peu importe le format : API, fichier plat, Excel, JSON, webservice, dll...
Disons-le clairement, l'équation s'annonce difficile à résoudre.
Il existe au demeurant des solutions qui permettent de répondre en partie aux besoins de chacun.

Qui recherche les données turf du PMU ?

Quand on regarde qui cherche à aspirer les informations hippiques diffusées sur le site du PMU, on y trouve deux catégories de chercheurs :

  • Les joueurs, qui sont rarement des développeurs, mais qui sont persuadés d'avoir mis au point une super moulinette Excel, "qu'il ne reste plus qu'à automatiser". Puisse ces quelques lignes faire gagner du temps à cette catégorie de parieurs : il y a plus simple, plus rapide, et surtout, plus efficace ! Car très sincèrement, calculer des coefficients ou des indices de forme basés sur une musique pondérée et/ou filtrée, multipliés / divisés par des âges, des gains, ou tout autre variable ne donnera pas grand chose... Au mieux ce genre de feuille de calcul entretiendra la douce illusion que la mécanique complexe des courses pourrait se résumer à quelques simples formules Excel. Cette illusion tiendra un temps, et s'effondrera rapidement, rattrapée par la réalité des chiffres et des probabilités. Il existe aujourd'hui sur le marché d'excellents logiciels de turf qui permettent de tester des stratégies de jeux sur des historiques de plusieurs dizaines de milliers de courses. On est loin des tableurs et des tuyaux du bar PMU ;)

  • Les développeurs, qui peuvent occasionnellement jouer aux courses, mais dont la principale pré occupation est de récupérer ces informations pour les diffuser sur le site web. Rédacteur d'un blog de turf amateur, responsable technique d'un site de pronostics hippiques en cours de professionnalisation, ou entrepreneur porteur d'un nouveau projet de création d'entreprise, les profils sont multiples mais animés de la même volonté : gagner du temps. Du coup ils ont besoin de récupérer automatiquement les données des courses PMU pour alimenter leurs propres processus de calcul de pronostics et de publication. Ils parlent couramment PHP, MySQL, et CRON :)

Les données du PMU disponibles

Sur le site du PMU, de nombreuses informations sont disponibles sur les courses du jour et du lendemain. Mais on y trouve aussi les courses de la veille et des jours antérieurs, généralement sur un historique d'un an ou deux. D'ailleurs le site ne permet pas de remonter au-delà, justement pour éviter de se faire aspirer toute sa base de données ! Il convient donc bien de distinguer la possibilité de récupérer un flux "en temps réel" des données hippiques, de celle de récupérer 10 ans d'historique de courses ! La problématique n'est pas du tout la même, les enjeux non plus... et le coût financier non plus.
Voici le genre de données que le PMU met à disposition de ses visiteurs :

Programme des courses

Il s'agit de savoir quelles courses ont été courues ou vont être disputées, sur quel hippodrome, et à quelle heure. Ce calendrier des courses est généralement quasiment fixé un an à l'avance, donc pas de grosses surprises sur le programme des festivités, mais le PMU ne communique que sur les courses du jour et du lendemain pour ouvrir les paris à celles et ceux qui voudraient placer leurs mises en avance.
Petite précision : 50 % des enjeux sont placés 10 mn avant le départ de la course !

Conditions des courses

Les "conditions" d'une course constituent en réalité le règlement de la course : qui peut participer, sous quelles conditions, sur quel parcours, quels seront le prix etc.
En terme turfique on y trouve donc la discipline, l'allocation, le nombre de partants, l'hippodrome, la piste, la distance, le revêtement etc.

Données sur les participants

Pour les chevaux engagés, les supplémentés et même les non partants (ceux qui se sont inscrits mais qui ont déclaré forfait avant la course), le PMU fournit toutes les statistiques sur les chevaux, les jockeys et les entraîneurs en affichant leur musique qui résume leurs performances passées. On y trouve également des infos comme les gains sur leur carrière, si le cheval est déferré, s'il porte des oeillères ou des oeillères australiennes, les casaques etc.

Données de jeux

Comme tout bookmaker, le PMU affiche les rapports probables qui sont donnés par les cotes, elles-mêmes calculées à partir des enjeux. Le PMU donne ainsi un aperçu des premières cotes, généralement affichées vers 11h pour les courses de l'après midi. Mais depuis quelques temps, le PMU affiche aussi ses cotes en temps réel. Bien sûr les cotes ne bougent plus et sont figées dès le départ de la course.

Résultats des courses

A la fin de la course le PMU affiche l'arrivée officielle de la course, avec les rapports des jeux simples et des jeux composés. Depuis l'ouverture à la concurrence, le PMU dissocie les enjeux en ligne, appelés e-PMU ou ePMU, des enjeux collectés dans les points PMU et les hippodromes.

Différentes façons de récupérer les donnés PMU

La récupération en direct des données PMU via webservice ou API est possible, mais elle n'est pas gratuite. Il suffit de s'adresser à l'infocentre du PMU pour qu'il vous adresse une cotation.
Attention, cette solution s'adresse néanmoins à des professionnels et coute plusieurs dizaines de milliers d'Euros par an.

Aux amateurs de scrapping web à coups de scripts PHP, Java, VBA, Python, Curl ou autre joyeuseté, attention : vous risquez d'aller aux devants de grosses déconvenues. Non seulement vous passerez une bonne partie de votre temps à corriger vos scripts - hé oui, le PMU change souvent son site et le format de ses données ;)  - mais surtout, c'est interdit ! Et quel que soit le dispositif que vous mettrez en place, il ne sera pas stable et restera illégal.

C'est la raison pour laquelle nous vous proposons des widgets faciles à intégrer qui permettent à n'importe quel webmaster d'afficher sur son site, les partants du quinté, les cotes du quinté, l'arrivée et les rapports du quinté. Nous pouvons les adapter à n'importe quelle course et mieux, nous pouvons les customiser pour vous !

Alors n'hésitez pas à nous solliciter pour que nous étudions ensemble votre projet !