Return to site

Big Data et présidentielles font-ils bon ménage ?

· big data,prédiction,Présidentielles 2017

En complément des sondages traditionnels utilisés pour l’élection présidentielle, des universités et start-ups se sont elles-aussi essayées au jeu des prédictions et sondages version 2.0 pour cette élection 2017…

Avec quelles données ces statisticiens 2.0 prédisent-ils ces estimations?

Tout d’abord, ces données se basent sur l’évolution des votes en France avec la géographie électorale qui donne une idée d’intention de vote pour les différents blocs des partis politiques mais pas pour les différents candidats. Pour avoir une estimation plus précise par candidat, il faut utiliser le poids numérique de chacun de ces candidats. C’est à dire exploiter les données des recherches Google, les opinions de masse du réseau social Twitter ainsi que les sondages d’opinions. Avec ces données, il est plus simple qu’avant d’avoir une tendance générale sur les intentions de votes, du moins c’est ce que qu’affirment ces statisticiens. Mais est-ce vraiment le cas?

Certains paramètres et algorithmes ne sont encore pas totalement fiables…

Plusieurs raisons peuvent expliquer cet échec. La première est la fiabilité des résultats de Twitter. En effet, selon les statistiques de ces étudiants Parisiens, se basant uniquement sur les avis et opinion de Twitter, Marine Le Pen sortait gagnante à 24,13% suivi de François Fillon à 24,08%. Mais ces données ne représentent que l’avis des Français sur les réseaux sociaux et non leurs intentions de votes. De plus, le nombre de bots (programmes informatiques intelligents) et de comptes “fakes” a explosé sur Twitter, ce qui rend les résultats encore moins fiables.

Pour le cas de Google, les données prises en compte ne sont en fait que les recherches buzzdu moment. Par exemple Jean-Luc Mélenchon, qui a fait le buzz ces dernières semaines a eu plus de 23% de poids numérique sur Google mais cela ne représentait pas les intentions de votes (avec un score de 19,58% au premier tour). Prenons un autre exemple, celui de Benoit Hamon qui à l’inverse voit son poids numérique Google atteindre le faible score de 1.77% alors qu’il a obtenu 6,36% des voix au premier tour de l’élection présidentielle. Cet écart assez important signifie juste qu’il n’est pas très populaire auprès des internautes

En combinant les trois données Google, Twitter et les sondages, on obtient ces résultats:

https://goo.gl/Dacn8p

Ces prédictions s’avèrent ici fausses avec Madame Le Pen et Monsieur Fillon sortant vainqueurs de ce premier tour. Cependant, il faut souligner que, mis à part pour Marine Le Pen et Emmanuel Macron, ces chiffres ne sont pas si loin de la réalité des résultats des autres candidats.

 

Nous allons maintenant prendre un autre exemple qui a beaucoup été contesté, celui de Fliteris, start-up canadienne qui assurait que les “analyses Big Data” étaient plus fiables que les sondages traditionnels. Pourtant leurs prédictions se sont avérées fausses quasiment à chaque fois. Cette start-up avait déjà prévu une victoire de François Fillon au premier tour des primaires avec 22%, il en a finalement obtenu presque le double. Leurs prédictions n’avaient pas prévu Nicolas Sarkozy sortant au premier tour non plus. D’autres résultats assez éloignés de la réalité ont fait également polémique lors des primaires de la gauche avec notamment la victoire de Manuel Valls qui ne fut pas le cas.

https://goo.gl/Dacn8p

Ces prédictions s’avèrent ici fausses avec Madame Le Pen et Monsieur Fillon sortant vainqueurs de ce premier tour. Cependant, il faut souligner que, mis à part pour Marine Le Pen et Emmanuel Macron, ces chiffres ne sont pas si loin de la réalité des résultats des autres candidats.

Nous allons maintenant prendre un autre exemple qui a beaucoup été contesté, celui de Fliteris, start-up canadienne qui assurait que les “analyses Big Data” étaient plus fiables que les sondages traditionnels. Pourtant leurs prédictions se sont avérées fausses quasiment à chaque fois. Cette start-up avait déjà prévu une victoire de François Fillon au premier tour des primaires avec 22%, il en a finalement obtenu presque le double. Leurs prédictions n’avaient pas prévu Nicolas Sarkozy sortant au premier tour non plus. D’autres résultats assez éloignés de la réalité ont fait également polémique lors des primaires de la gauche avec notamment la victoire de Manuel Valls qui ne fut pas le cas.

Cette méthode est contestable à l’heure actuelle car d’une part, rien n’a prouvé que le Big Data était plus fiable que les sondages (qui eux-même n’ont pas vraiment la côte et pour cause les médias qui sont accusés de jouer un rôle important dans l’orientation des intentions de votes) et d’autre part, les réseaux sociaux ne sont pour le moment pas un échantillon assez représentatif de la population Française (seulement 10% des Français sont inscrit sur Twitter). Il est donc encore aujourd’hui difficile d’affirmer avec certitude que cette méthode puisse perdurer dans le temps.

Mais ces nouvelles méthodes sont-elles vraiment à abandonner pour la suite?

Pas si sûr, car si nous reprenons les résultats des statistiques fournies par les étudiants Parisiens, mis à part quelques exceptions, les résultats se trouvent être assez réalistes pour certains candidats.

Les écarts de résultats pour les candidats favoris peuvent être expliqué par l’incertitude de cette élection qui a rendu les prédictions quasi impossibles.

Un autre phénomène en cause est la limite de la technologie. En effet, à l’heure actuelle,l’intelligence artificielle est encore trop limitée et peu développée pour pouvoir prédire avec certitude l’avenir. Par exemple pour les réseaux sociaux, les prédictions de l’IA ont été faussés et pour cause : “L’intelligence artificielle interprète encore mal l’ironie ou l’humour par exemple”, explique la start-up Fliteris. De ce fait, les données des réseaux sociaux ne sont pas encore exploitables pour prédire exactement ce qui va se passer, ce ne sont que des tendances du moment.

Mais nous anticipons que d’ici à quelques années, l’IA sera devenue ultra-performante et pourra donner des résultats ultra-précis. Cette méthode, si elle se perfectionne, reste prometteuse pour l’avenir et, un jour, pourrait devenir plus fiable que les sondages d’opinion…

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OKSubscriptions powered by Strikingly