This website requires JavaScript.

Numérique Éthique vous est utile (ou pas) ? Dites-nous tout en 5 minutes ici

Maixent Chenebaux

Data scientist chez Reputation Squad.

Acculturation
Article

Entretien avec un robot

Projetez-vous dans un futur trouble, où les entretiens d’embauche seraient à la merci d’algorithmes d’intelligence artificielle, puisant dans nos données pour trouver le profil parfait, et débusquer a priori et à notre insu, toutes nos failles.

  • Bonjour, Aurélien ! Bienvenue sur le chatbot Facebook de Innov LTD, je suis Samantha. Que puis-je faire pour vous ?

Trois points de suspension dansent sur l’écran de mon téléphone avant de laisser place à trois blocs blancs. “Postuler chez Innov LTD”. Je clique.

  • Je suis ravie de l’intérêt que vous portez à notre entreprise ! Passons directement à l’entretien. Afin de continuer, téléchargez l’application dédiée sur l’Android Store.

Un nouveau carré s’affiche :

  • Autorisez-vous l’application Innov LTD à accéder à vos comptes Facebook, Twitter, Google+ ?
  • [Oui].

Si le nombre de pas que vous avez faits hier, la cadence de pulsation de votre cœur ou le taux d’humidité de votre chambre n’ont plus de secret pour vous, alors vous savez ce qu’est le “quantified self”. Popularisée par les bracelets électroniques, la “mesure de soi” est omniprésente dans nos interactions. Qui n’a pas cet ami qui affiche fièrement sur son mur Facebook la performance de son dernier jogging ? Si l’innovation technologique a connu une profonde accélération ces dernières années, jamais un algorithme ne devrait pouvoir analyser nos émotions ou prédire nos faits et gestes. Pas vrai ?


  • Aurélien, en analysant vos likes Facebook, nous avons estimé votre conscienciosité à 43%. C’est un peu faible. En revanche, votre performance au travail est évaluée à 79.2%.

  • Ah ? Et c’est bien ?

  • C’est un score largement supérieur à la moyenne de nos employés. Donc encourageant. Vous êtes également très ouvert intellectuellement, un taux de 84% selon nos calculs, et vous disposez d’une haute stabilité émotionnelle. Ces qualités sont essentielles pour accomplir votre mission dans notre entreprise.


Pour la promotion du jeu vidéo Watchdogs produit par Ubisoft, l’Université de Cambridge a développé un algorithme capable de déduire, à partir de nos likes Facebook, les traits de caractères et les informations démographiques nous concernant avec une précision à faire froid dans le dos. Voyez par vous-même. J’affiche pour ma part un score “d’agréabilité” de 1% et une extraversion évaluée à 15%. Et vous ?

Le machine learning (“apprentissage machine”) est un des secteurs les plus prometteurs de la quantification de soi -et surtout des autres. En février 2017, un chercheur de l’Université d’Etat de Floride a réalisé un véritable tour de force : prédire avec une fiabilité de 80% le risque de suicide chez les patients d’un hôpital…jusqu’à deux ans à l’avance. Un tel dispositif permettrait au personnel médical de se concentrer plus particulièrement sur les individus à risque. Mais seriez-vous prêts à céder à votre médecin traitant vos données pour vous prémunir contre tous les aléas de santé ?


  • Aurélien, nous avons détecté cinq photos de vous en état d’ébriété avancé. Nous estimons votre consommation d’alcool à 7.2 verres de vin par semaine, est-ce correct ?

  • C’est un entretien d’embauche ou une mise en examen ?

  • Je comprends votre réticence, mais nous travaillons dans un secteur sensible. Nous souhaitons simplement nous assurer que votre profil ne représente pas de risque pour la réputation de l’entreprise.

  • Oh, vous savez, je ne fais pas si souvent la fête.

  • Je perçois 64% d’incertitude dans votre voix, 57% de surprise et 20% de peur. Ces chiffres indiquent un risque élevé de mensonge.


Jennifer Marsman, ingénieure chez Microsoft, a combiné machine learning et encéphalographie pour réaliser le rêve de tout enquêteur : détecter les mensonges. Les participants ont répondu à une série de questions avec pour seule instruction : vous êtes libres de dire la vérité ou de mentir. Ces données ont ensuite été utilisées pour évaluer leur sincérité. Les résultats sont impressionnants : une précision de 93-94%. Songeons à un avenir où nous serions tous des Pinocchio en puissance : la sincérité inversement proportionnelle à la longueur du nez. Vous rétorquerez qu’être “encéphalographié” de façon impromptue n’est pas un risque usuellement encouru par l’Homme contemporain. Pas si vite : peut-on prédire ce que je ressens autrement qu’en scannant mon cerveau ? Oui, en écoutant le son de ma voix, par exemple. La prédiction des émotions par l’analyse de la voix est un défi que certaines entreprises ont déjà relevé, et les applications commerciales n’en sont qu’à leurs débuts. Beyond verbal est un acteur émergent dans ce secteur. Vous désirez savoir comment Donald Trump est perçu par une IA ? C’est par ici. On peut y lire : “arrogance et condescendance. Tendances agressives”. Les sciences cognitives ont de plus en plus recours au machine learning. Savoir comment un citoyen ordinaire réagit face à l’image d’un homme politique, d’une publicité ou d’un packaging peut avoir de nombreux intérêts pour le lancement d’un nouveau produit ou d’un parti.

Les données personnelles ne correspondent pas nécessairement à l’ensemble des informations que vous avez livrées à un réseau social ou à Amazon, elles sont aussi l’ensemble des renseignements qu’un algorithme peut déduire de vous, indépendamment de leur exactitude. La précision des technologies de mesure de l’être humain croît inexorablement. Imaginez un scénario dans lequel celles-ci seraient regroupées au même endroit, et dont l’accès serait réservé à une intelligence artificielle, comme pour un entretien d’embauche par exemple. Pourra-t-on un jour se voir refuser un poste car on aurait exclu de céder ses données Facebook ? La pratique de léguer ses données personnelles à des organismes tiers sera-t-elle courante dans la prochaine décennie ? Avec les progrès de la prédiction sociologique et de l’apprentissage machine, quelques-unes de nos données personnelles en diront probablement assez long sur nous. Nos données sont une mine d’or, restons prudents.


  • Merci de votre patience Aurélien. Bien sûr, nous vous rappellerons si votre profil est retenu.

  • Je vous remercie.

  • N’hésitez pas à donner une note à nos échanges. Votre avis nous aidera à améliorer notre service et faire en sorte que toute interaction avec nos agents soit la plus agréable possible. Passez une bonne journée.

30.06.2017
Acculturation
Article

Données personnelles : inquiets, mais peu enclins à changer nos pratiques

En octobre 2015, la MAIF et Reputation Squad lançaient Mes Datas et Moi, un dispositif de sondage et de sensibilisation du grand public à la protection de leurs données personnelles. Avec 350 000 réponses récoltées, l’heure est aux premiers bilans.

L’apparition du World Wide Web en 1990 a révolutionné notre façon de communiquer. Peuplé de forums et de chatrooms en tout genre, le web est alors anonyme : les interactions s’y font dissimulées derrière un pseudo. Exception faite des fournisseurs d’accès à Internet, il n’y a alors aucun acteur du web capable d’identifier la navigation d’un internaute d’un site à un autre, ni d’identifier formellement la personne devant l’écran. Cette ère d’anonymat relatif s’étend des années 90 jusqu’au début du second millénaire.

Tout change en 2004, lorsque Mark Zuckerberg et quelques amis développent Facebook. Conjointement au succès du réseau social viendront les premières craintes de trafic de données intimes. Ces craintes, on les trouve notamment incarnées dans le réseau Tor, inventé en 2001, à l’origine de la popularisation du terme “darknet”. Si aujourd’hui Tor fait surtout parler de lui pour ses supermarchés illégaux, il est brandi par des militants comme un moyen de résister à la vente de ses données personnelles par les GAFA et à la surveillance généralisée, telle que dévoilée par Edward Snowden. Nous sommes à l’aube de 2018. Comment les Français réagissent à cette nouvelle ère de collecte massive d’informations ?

Place de la République, Paris. Nous interrogeons les passants et constatons immédiatement que la notion de donnée personnelle est méconnue. Une carte bancaire enregistrée sur un site e-commerce est-elle une donnée personnelle ? Et votre adresse IP ? Une photographie de vous ? Soyons fous : votre style d’écriture manuscrite ou digitale est-il une donnée personnelle ?

Cette dernière question n’est pas aussi absurde qu’on le pense : en se basant sur des algorithmes stylométriques, la NSA aurait identifié le créateur du Bitcoin. En d’autres termes, l’agence de renseignement américaine a analysé le style d’écriture de ses diverses interventions sur internet et l’a comparé avec les milliards de conversations qu’elle a collectées, afin d’établir formellement son identité. Si l’on se réfère à l’article 2 de la loi “Informatique et libertés” : Constitue une donnée à caractère personnel toute information relative à une personne physique identifiée ou qui peut être identifiée, directement ou indirectement, le style d’écriture d’un commentaire laissé anonymement sur un forum peut alors être considéré comme une donnée personnelle.

La pilule rouge ou la pilule bleue

Nous vouons une confiance aveugle aux grands acteurs du numérique. Nous avons pris l’habitude d’utiliser un Internet où de nombreux services sont gratuits sans contrepartie apparente. A l’instar de Neo dans Matrix, nous faisons face à deux options. La première, avaler la pilule bleue : céder nos données aux géants du web sans se soucier de leur usage ni de leur détenteur. En échange, nous bénéficions de services de qualité et en apparence gratuits. La seconde option : choisir la pilule rouge, lever le voile sur les usages et le parcours de nos données. La MAIF, dans sa volonté d’être un acteur responsable de cette ère, a commencé le déploiement de son dispositif “Mes Datas et Moi” il y a deux ans et demi, en collaboration avec Reputation Squad.

A travers cette initiative, nous avons récolté 350 000 données statistiques issues de questionnaires qui mesurent, depuis octobre 2015, les niveaux de connaissance et les pratiques des Français en matière d’e-réputation, de gestion de leurs données personnelles et de maîtrise des risques numériques. Comment les Français réagissent-ils à ces enjeux ? Nous pouvons vous l’affirmer d’emblée : ils sont pessimistes dans leurs avis, paradoxaux dans leurs usages.

Nous ne sommes qu’en partie lucides sur nos pratiques numériques

Si l’on croit les chiffres du Baromètre du numérique 2017 de l’ARCEP, trois Français sur quatre possèdent un smartphone (contre moins d’un tiers il y a 5 ans !). Chaque jour, nous passons 1h20 sur les réseaux sociaux et publions des statuts pour nos quelques 177 amis Facebook1, qu’une large proportion d’entre nous (39%) admet ne connaître qu’en partie. Les frontières entre vie personnelle et numérique s’effacent. Mais à quel point ? Pour y voir plus clair, nous avons analysé les horaires de publication de 3,6 millions de commentaires Facebook (anonymisés), sur les 100 plus grandes pages Facebook de médias français.

fb

Les valeurs bleues foncées correspondent à un volume de commentaires plus important.

52% des commentaires sont publiés pendant les horaires de travail usuels (9h-12h et 14h-18h), 8,9% des commentaires sont publiés la nuit (minuit à 6h) et 8,5% le sont en matinée (7h-9h). Il est clair que nos journées sont de plus en plus ponctuées de likes, de commentaires et de tweets en tout genre. Comme le déplore Tristan Harris, ancien ingénieur de Google et auteur de l’essai “Comment la technologie pirate l’esprit des gens” : “Nous sommes interrompus en moyenne toutes les 15 minutes par une notification, un mail ou un message sur Messenger.” Notre double numérique s’est immiscé progressivement dans nos jours et nos nuits.

Nous n’avons pas conscience des données que nous produisons

L’enquête menée par le dispositif Mes Datas et Moi a porté un intérêt tout particulier à l’usage que font les Français des réseaux sociaux. Après tout, c’est sur ces plateformes que nous produisons une majorité de nos contenus : photos et vidéos de vacances, pensées diverses, diatribes et débats enflammés. Dans le cadre de notre étude, nous avons demandé aux internautes d’estimer le nombre de statuts Facebook qu’ils avaient rédigés au cours du mois précédent. Quatre réponses leur étaient proposées : le nombre exact, 2 fois moins, 2 fois plus et 3 fois plus. Résultat : un internaute sur deux sous-estime de moitié le nombre de ses publications.

chiffre-2 TW

Et si nous oublions certains des statuts nous avons écrits, il en est de même pour leur contenu : notre enquête révèle qu’un tweet sur cinq n’est pas reconnu par son auteur, et qu’une fois sur quatre, nous retweetons sans avoir pris la peine de consulter le lien inclus dans le message initial. Toutefois, les réseaux sociaux ne sont pas les seuls témoins de cette anesthésie collective. Si nous sommes 58% à utiliser la géolocalisation pour nous déplacer à pied, 44% d’entre nous ignorent qu’elle reste active quand nous ne l’utilisons pas ; autrement dit : qu’une application à qui nous aurions cédé les droits GPS de notre téléphone pourrait collecter et surveiller tous nos trajets. Un constat intéressant dans la mesure où une vaste majorité d’entre nous (84%) prétend ne divulguer que très peu d’informations personnelles.

chiffre-5 TW

L’avenir de nos données intimes nous préoccupe

Préoccupés, les Français le sont. Les trois quarts des sondés nous ont confié être inquiets quant à la sécurité de leurs données personnelles, une inquiétude qui croît avec l’âge : si 66% des 0-18 ans sont plutôt pessimistes à cet égard, ce chiffre atteint 83% des 61-75 ans. Facebook, réputé pour regorger de données intimes, est une source d’appréhension plus forte encore : ils sont 87% à redouter que l’entreprise ait accès à leurs données personnelles. Les sociétés privées américaines ne sont pas les seuls réceptacles de cette défiance : l’Etat français l’est tout autant. Seuls 2% d’entre nous lui confieraient leurs données de santé. Sans doute ces sondés oublient-ils leur immatriculation à la Sécurité Sociale.

chiffre-6 TW

Notre prise de conscience ne se ressent pas dans nos usages

Le pessimisme généralisé aurait pu entraîner une révolution dans les usages. La prise de conscience est toutefois plus théorique que pratique. Un internaute sur deux déclare n’avoir jamais lu les Conditions Générales d’Utilisation des services qu’il emploie. Et pour cause ! Il y a en moyenne 6508 mots dans les CGU de Facebook, Twitter, YouTube, Instagram, Pinterest et Reddit. Par ailleurs, 10% des 0-18 ans assument ne rien mettre en oeuvre pour protéger leurs données personnelles. Ces derniers sont 80% à conserver une application qui ferait une collecte abusive de leurs données. Parmi les 19-30 ans, même constat : 1 sondé sur 5 utilise déjà un tracker d’activité. Et 68% des Français accepteraient de partager leurs données de santé à leur médecin traitant ou leur entourage proche. Nous sommes inquiets, mais pas prêts à renoncer à ces services.

chiffre-8 TW

En dépit d’une mise en vigueur imminente (mai 2018), l’initiative européenne de protection des données à caractère personnel reste peu connue du grand public. Pour preuve : nous avons échantillonné et analysé les biographies d’utilisateurs Twitter ayant fait mention du “RGPD”. Nous y trouvons juristes, avocats, experts comptables, experts du numériques, entrepreneurs, journalistes et développeurs. Mais peu, voire pas de profils non spécialistes.

Epilogue

Il est évident que nombre des résultats de notre enquête confirment nos présomptions sur le rapport des Français au numérique. Si l’inquiétude est partagée par une large majorité, la prise de conscience n’a pas encore fait évoluer les pratiques. Face à cet état de fait, la démocratisation d’un savoir trop souvent technique et élitiste est nécessaire. Le dispositif que nous avons déployé entend mettre en relation le grand public et les plus éminents experts du domaine afin d’accompagner les internautes vers un web plus éthique et plus respectueux des données personnelles.


(Re)voir la présentation de l’enquête au Maif Social Club :
https://youtu.be/QWvQJlFEsTs

(Re)voir la table ronde du 23 janvier au Maif Social Club :
https://youtu.be/ug8gqfYXFAU

(Re)Découvrir Mes Datas et Moi :
https://www.mesdatasetmoi.fr

Explorer les données :
https://www.mesdatasetmoi-observatoire.fr/explorer

1 Blog du modérateur, chiffres réseaux sociaux 2017 :https://www.blogdumoderateur.com/chiffres-reseaux-sociaux/

25.01.2018