Votre version d'internet explorer est obsolette, veuillez mettre votre navigateur à jour pour accéder à ce site.

Mettre à jour

Big data : comment les données sont-elles utilisées ?

Les algorithmes traitent des données dans le secteur de la finance, des sciences, du marketing, voire du système judiciaire. Dans le cadre de la semaine digitale de Bordeaux, plusieurs experts de ces secteurs ont débattu autour d'une table ronde pour démystifier et donner un sens à l'utilisation de masse des données.

Big data : comment les données sont-elles utilisées ?

 

« Au départ, il y a la science empirique, pensez à Galilée qui observe le ciel, prend des notes et arrive à prouver que la Terre n’est pas au centre de l’Univers. » Guy Mélançon, enseignant-chercheur au Labri et intervenant à la table ronde Big data : peut-on s'enthousiasmer d'une économie régie par les données ?, qui marquait l’ouverture de la semaine digitale made in Cap Sciences mardi 5 avril 2016, tente de resituer l’utilisation des données et le big data dans l’histoire des sciences. « Newton vient ensuite, il établit un modèle qui lui permet de prédire où va tomber son projectile. Il y a une équation derrière, on peut reproduire le phénomène et démonter l’existence d’une loi universelle. »

Après Newton, « on est allé vers des modèles plus compliqués de prédiction, comme la météo. Des équations il y en a, et on ne pouvait plus les résoudre sur papier comme on faisait à l’école. La science est alors devenue computationnelle : il fallait y aller avec une armée de machines qui prennent en charge la résolution des équations. La démarche aujourd’hui, elle est nouvelle, on collectionne des données, avec l’espoir qu’elles nous révèlent des choses qu’on n’a pas encore vu. Ce n’est pas une démarche empirique, c’est une démarche exploratoire des données. On regarde ce qui se passe à travers des traces laissées par des êtres vivants. C’est la complexité de la vie qu’on observe. »

"Un algorithme, ce n’est qu’une méthode de calcul"

Ce sont les algorithmes qui interprètent ces données. S’ils sont essentiels, ces derniers n’ont-ils pas en quelque sorte pris le pouvoir ? « L’algorithmique, c’est vieux comme les mathématiques, rétorque l’un des artistes du collectif Rybn, autour de la table ronde. C’est un domaine très riche avec énormément de types de philosophies. »
Guy Mélançon complète : « ce ne sont pas les algorithmes qui prennent le pouvoir, il y a des humains derrière. Un algorithme, ce n’est qu’une méthode de calcul. Quand vous faites votre café le matin, vous appliquez un algorithme, une méthode bien précise. Si vous mettez trop d’eau, ça ne marche pas, si vous oubliez le café, ça ne marche pas non plus. Pareil pour construire son cabanon de jardin ou pour monter son meuble Ikea. »

Pour les intervenants, la régulation légale de l’aspiration par les grandes industries du numérique (type Google, Amazon, Apple et Facebook) de nos données personnelles ne résoudra pas les problèmes, car « il y a une partie de la population qui accepte de recevoir du service, qui trouve très bénéfique qu’on lui propose le bon produit au bon moment, et qui sera capable d’accepter de donner une partie de ses données ».

Emmanuel Granger, Chief Data Officer au sein du groupe Cartegie à Bruges - spécialisé dans le marketing numérique - met en garde le public. "Les outils internet sont aujourd'hui très bavards : la moindre action sur le numérique laisse des traces et des traces importantes, qui sont signifiantes ou pas, immédiates ou pas. Aujourd'hui on a des outils qui permettent de faire des analyses de réputation, des analyses de sentiments, et de vérifier que les actions commerciales qu'on met par exemple sur le marché ont des répercussions positives, négatives".

Malgré les potentialités qu'internet offrent à des entreprises de marketing, du côté des usagers, le tableau est plus mitigé. « Aujourd'hui on vous dit : "vous utilisez la plateforme (ou le service) et c’est vous le produit. Si vous ne voulez pas être le produit, ne l’utilisez pas." Il manque une troisième alternative qui consiste à accepter de donner un certain nombre d’infos, de conserver les autres, et en contrepartie, ne pas avoir un service optimisé. Aujourd’hui, c’est du tout ou rien. »

Estimer les risques de récidive des prévenus...

Autres pays, autres problématiques. En direct depuis New York, où elle travaille comme sociologue dans le think-tank Data&Society, Angèle Christin observe pour sa part avec scepticisme les algorithmes nouvellement utilisés en justice pénale aux Etats-Unis. Ceux-ci doivent permettre d'estimer les risques de récidive des prévenus. « Cet algorithme est présenté comme LA solution qui va sauver un système en crise. Il y a actuellement plus de deux millions de personnes incarcérées, les prisons sont surpeuplées. Le système judiciaire est très discriminant, tout particulièrement envers les minorités et les jeunes hommes d’origine africano-américaine. »

Mais l’algorithme a lui aussi ses limites. En s’appuyant sur les bases de données de nombreux casiers judiciaires du système pénal américain, qui sont eux-mêmes façonnés par une histoire de discrimination, ils ne font que reproduire cette discrimination. « D’autre part, les algorithmes fonctionnent comme des boites noires : personne ne comprend ce qu’il y a dedans. En effet, ils sont fabriqués par des compagnies privées qui n’ont aucun intérêt à les dévoiler. Ni les juges, ni les procureurs ne savent ce qu’il y a dedans, et surtout, les prévenus et leurs avocats ne savent pas non plus comment le risque de délinquance est calculé. »

Gagner de l'argent ou trouver un vélo

L'artiste de Rybn enchaine en expliquant ce qu'il explore depuis une dizaine d'années : les algorithmes de calcul en économie. « L’algorithmique, il y en a de toute sorte, et l’algorithmique financière c’est une partie très étriquée en termes d’objectif, qui se résume à permettre de faire du profit plus vite que les autres, par contre c’est surement la spécialité qui a les moyens les plus larges. »

Suzanne Galy, la modératrice du débat, finit par s’interroger. « Mais avez-vous quand même des exemples d’algorithmes programmés au service de l’intérêt général ? » Quelques rires dans la salle, puis l’enseignant-chercheur répond. « Sur les forums d’experts, où sur Twitter, c’est souvent difficile de trouver la réponse à sa question car il y a énormément d’articles, de tweets. Les machines regardent les échanges, les questions et les réponses, calculent les indices de réputation des personnes. Elles nous aident à trouver les personnes et nous en suggèrent d’autres. »

D'autres exemples sont évoqués du bout des lèvres, comme celui d’une collectivité de Bordeaux-Métropole qui a équipé les déchetteries de capteurs. Les données récoltées sur les flux permettent en temps réel que l’usager sache à quel endroit et à quel moment se déplacer pour se débarrasser de son encombrant. Un autre algorithme prédictif présenté permet à TBC de calculer, lorsque l’application Back predict est interrogée, si l’utilisateur aura de la place à la prochaine station pour garer son vélo, ou s’il va y avoir un vélo à telle borne. En espérant qu'il y en aura d'autres !

 

Crédits photos : DR