PREDICT THE PARLIAMENT – analyse des résultats

par Mohamed AL ANI, Davy BENSOUSSAN, Alexandre BREHELIN, Bertrand de VERICOURT, Raphaël VIGNES

L’équipe d’étudiants du Mastère Spécialisé Big Data de Télécom ParisTech évalue sa prédiction sur les législatives, dont le résultat au deuxième tour s’est avéré proche de leurs projections.

Rappel du modèle

Notre modèle consiste en une simulation complète du scrutin sur les deux tours, à l’aide de données historiques de vote et de données socio-économiques (revenus, chômage, etc.).

Ces données nous permettent de modéliser le premier tour, circonscription par circonscription, afin d’obtenir une estimation des voix obtenues pour tous les candidats en lice. Nous appliquons ensuite les diverses règles électorales pour déterminer les qualifiés pour le second tour, les triangulaires et les élus du premier tour.

La projection du nombre de sièges à l’Assemblée est effectuée par un autre algorithme qui analyse quant à lui l’historique des seconds tours d’élections législatives depuis 2002 et propose une estimation à partir de la simulation du premier tour.

Lien vers l’article original

L’apport de notre démarche

Le mode de scrutin particulier des élections législatives représente un défi pour les instituts de sondage traditionnels car il est compliqué de constituer des échantillons de population représentatifs de toutes les circonscriptions du territoire, mais aussi parce qu’il est difficile, à partir d’une estimation du nombre de voix obtenues par les candidats au 1er tour, d’en déduire une projection du nombre de sièges pour chaque parti. Enfin, la multiplicité des partis et l’émergence de nouvelles forces politiques complique un peu plus la tâche.

L’intérêt de notre modélisation réside dans le fait qu’elle est intégrale : nous pouvons proposer une estimation dans chacune des 577 circonscriptions. Bien sûr, les prédictions de l’algorithme ne sont pas justes partout, mais ce maillage fin améliore la précision lorsque l’on agrège les données au niveau national.

Comparaison du modèle et des sondages avec les résultats finaux

Comparons nos résultats avec les prévisions des différents instituts :

1ère ligne : les résultats finaux

2ème ligne : nos prédictions

Lignes suivantes : estimations des sondages

En orange, les cas où le résultat de l’élection est en dehors de la fourchette proposée par les instituts. On remarque la grande volatilité des estimations entre les instituts (particulièrement sur REM).

En terme d’écart total en nombre de sièges, notre algorithme est meilleur que chacune des trois études Ipsos, mais est battu par les études réalisées par les autres instituts au mois de mai.

Notons enfin que les estimations faites par les instituts pendant l’entre-deux tours ont toutes été largement erronées (voir ci-dessus) prédisant notamment une majorité écrasante pour l’alliance REM-MODEM autour de 450 sièges.

Comparaison du modèle avec les résultats finaux, parti par parti

En rentrant dans le détail de notre prédiction, nous remarquons que les erreurs de notre modèle sont regroupées sur quelques partis (le PS en tête), tandis que pour le reste nous sommes assez proches de la réalité.

L’Assemblée prédite vs l’Assemblée réelle

Pour rappel, voici notre projection sur l’Assemblée, mise en regard de l’Assemblée siégeant maintenant au Palais Bourbon :

 

Une conclusion

Comme nous le rappelons régulièrement, l’idée n’est pas vraiment d’opposer les méthodologies, mais de mettre en perspective les apports de chacune.

L’historique des données socio-économiques et électorales, et donc le modèle que nous avons utilisé, peuvent aider à donner une projection des résultats législatifs à la maille de la circonscription. Le modèle apprend les ressorts historiques du scrutin, et tâche de le simuler à l’aide de données plus fraîches. Son talon d’achille tient donc à ce qu’il n’apprend que sur le passé proche, et ne saurait être pertinent dans le cas d’une situation de rupture très nette de la mécanique ou des habitudes électorales.

Les sondages, quant à eux, ont l’avantage de sentir les tendances. De plus, leur méthodologie s’applique très bien sur une élection nationale telle que la Présidentielle – et notamment sur la dernière. Mais cette réactivité peut être aussi un facteur négatif inattendu, comme nous l’avons vu sur les enquêtes réalisées entre les deux tours.

Il serait maintenant intéressant de travailler sur d’autres élections, en l’adaptant aux particularismes du scrutin concerné voire aux dynamiques électorales d’autres pays.

Leave a Reply

Your email address will not be published. Required fields are marked *