đŽ 7 about... l'effet Google et le RAG
L'effet Google
1. L'effet Google (ou amnĂ©sie numĂ©rique) est notre tendance Ă ne pas faire lâeffort de mĂ©moriser des informations si elles sont facilement accessibles en ligne (ou sur nos tĂ©lĂ©phones et ordinateurs). Quelques exemples : le numĂ©ro de tĂ©lĂ©phone de nos proches, la dĂ©finition dâun mot, les informations essentielles dâun pays sur lequel nous travaillonsâŠÂ
2. Lorsque nous ne faisons que consulter ces informations, nous ne les intĂ©grons pas durablement et ne pourrons donc pas les rĂ©utiliser spontanĂ©ment quand nous aurons Ă Ă©valuer une situation ou rĂ©soudre un problĂšme.Â
3. Une premiÚre étude a révélé ce phénomÚne en 2011, étude réalisée par les psychologues américains Betsy Sparrow (Columbia University), Daniel M Wegner (Harvard University) et Jenny Liu : Google Effects on Memory: Cognitive Consequences of Having Information at Our Fingertips. Pour faire bref, les expériences menées montraient notamment que :
nous oublions plus facilement une information si nous savons quâelle est stockĂ©e Ă un âendroitâ facilement accessible ;
nous nous souvenons davantage du nom du âlieuâ de stockage, mĂȘme complexe, que de lâinformation elle-mĂȘme.
4. En considĂ©rant Internet, nos ordinateurs et nos tĂ©lĂ©phones comme des mĂ©moires externes auxquelles nous pouvons accĂ©der le besoin venant, nous accentuons une dĂ©pendance Ă l'Ă©gard de la technologie, qui pourrait non seulement nuire Ă notre intelligence mais aussi Ă notre bien-ĂȘtre, Ă notre capacitĂ© dâattention, voire Ă nos aptitudes sociales (se souvenir du nom exact et de la fonction dâune personne sans aller faire un tour sur Linked-In par exemple).Â
5. Le mĂȘme phĂ©nomĂšne peut se produire avec la photographie. Sans surprise, nous nous souvenons mieux de quelque chose lorsque nous lâobservons que lorsque nous le photographons : nom, forme, dĂ©tails⊠ce qui laisse perplexe si lâon pense Ă certains touristes qui photographient Ă tout va, sans mĂȘme se donner la peine de regarder.
6. Toutefois, on peut aussi considĂ©rer que ces âstockages externesâ fonctionnent comme des livres et des bibliothĂšques. En effet, lorsque nous refermons un livre, nous nâavons pas mĂ©morisĂ© lâensemble des informations que nous venons de lire. En revanche, nous savons oĂč se trouve ce livre, et donc ces informations, dans notre bibliothĂšque.Â
7. Le mĂȘme phĂ©nomĂšne se produit dans une Ă©quipe oĂč les informations rĂ©parties entre ses membres, peuvent ĂȘtre rĂ©unies et combinĂ©es en fonction de la question Ă rĂ©soudre. Lâeffet Google serait donc une forme de mĂ©moire transactive (collective).
La leçon à retenir
Avec ChatGPT et autres AI disponibles, le risque est que nous ne nous souvenions mĂȘme pas de ce que nous sommes censĂ©s avoir Ă©crit ou crĂ©Ă©. Hum, ça va devenir compliquĂ©âŠ
Pour aller plus loinÂ
Lâarticle originel : Betsy Sparrow - Information at Our Fingertips Google Effects on Memory: Cognitive Consequences of Having
Le RAG
1. Le RAG (Retrevial Augmented Generation ou GĂ©nĂ©ration augmentĂ©e par rĂ©cupĂ©ration) est une technique rĂ©cente dâamĂ©lioration des grands modĂšles de langage (LLM) tels que ChatGPT dâOpen AI, Gemini de Google ou encore le français Mistral. Lâenjeu ici nâest autre que de permettre Ă lâhumain de reprendre le contrĂŽle sur les outils dâIA tout en amĂ©liorant leurs performances.
2. Selon une Ă©tude de la Harvard Business School (septembre 2023), les tĂąches rĂ©alisĂ©es par les outils dâIA gĂ©nĂ©rative comportent 19 % dâerreurs en plus que les mĂȘmes tĂąches effectuĂ©es par un humain. Trois raisons principales expliquent ce taux dâerreur plus Ă©levĂ© :Â
Les sources utilisĂ©es pour gĂ©nĂ©rer les rĂ©ponses ne sont pas identifiĂ©es et vĂ©rifiĂ©es.Â
Ces sources ne sont pas Ă jour.Â
Le âdĂ©fautâ finalement trĂšs humain, de ne pas âavouerâ quâon ne sait pas, conduit lâoutil Ă donner coĂ»te que coĂ»te une rĂ©ponse, mĂȘme fausse (les fameuses hallucinations).
Le RAG propose de combler ces failles.Â
3. PremiĂšre Ă©tape : constituer et utiliser des bases de donnĂ©es ne contenant que des informations fiables, Ă jour et exactes, provenant de sources de confiance identifiĂ©es (articles, publications, sites web de rĂ©fĂ©rence, donnĂ©es internes Ă une organisationâŠ). Prenons un exemple : pour disposer dâinformations fiables et actualisĂ©es dans le domaine du sport, il faudra sĂ©lectionner comme sources de confiance, les mĂ©dia spĂ©cialisĂ©s, les clubs, les associations, les fĂ©dĂ©rations⊠ou les bases de donnĂ©es que vous aurez vous-mĂȘme constituĂ©es.
4. Seconde Ă©tape : modifier les instructions donnĂ©es Ă lâoutil dâIA, de sorte quâil suive la procĂ©dure suivante (on se permet de tutoyer la machine) :
Va extraire des données à partir de mes sources de confiance.
Vérifie la pertinence de ces données par rapport au prompt (question posée).
GĂ©nĂšre des rĂ©ponses en citant tes sources, ce qui permettra dâen vĂ©rifier la fiabilitĂ©.
Et enfin (et surtout !), si tu ne sais pas, pas de problĂšme ! Tu le dis et tu ne rĂ©ponds pas nâimporte quoi.
5. Plusieurs domaines se prĂȘtent particuliĂšrement bien Ă lâusage des RAG :
Les services dâassistance clients : amĂ©liorer lâefficacitĂ© des assistants virtuels.
La publication de contenus : augmenter la capacitĂ© de production dâarticles, de cataloguesâŠ
La rĂ©daction dâĂ©tudes : amĂ©liorer la qualitĂ© des rapports en disposant de donnĂ©es fiables et Ă jour.
6. Autres avantages du RAG :
Il permet aux outils dâIA gĂ©nĂ©rative dâapprendre mieux et plus vite quâavec les modĂšles traditionnels sâappuyant sur la correction des donnĂ©es auto-gĂ©nĂ©rĂ©es. Â
La mise Ă jour des donnĂ©es se fait plus rapidement puisque les sources de confiance utilisĂ©es sont elles-mĂȘmes mises Ă jour.
Les risques de fuite de données confidentielles sont moindres puisque les sources sélectionnées restent privées.
7. Le concept de RAG est de plus en plus largement adoptĂ© par les entreprises et les particuliers, car, les outils dâIA gĂ©nĂ©rative Ă©tant accessibles Ă tous, la diffĂ©rence se fera sur la façon de sâen servir et sur la qualitĂ© des informations que nous fournissons Ă la âmachineâ.
La leçon à tirer
Nous revenons finalement Ă des problĂ©matiques humaines bien connues : lâidentification et la fiabilitĂ© des sources. On se croirait en premiĂšre annĂ©e dâuniversitĂ©âŠÂ
Pour aller plus loin
Le texte original, publié sur Arvix : Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, Facebook AI Research, University College London, New York University
Navigating the Jagged Technological Frontier: Field Experimental Evidence of the Effects of AI on Knowledge Worker Productivity and Quality - Harvard Business School