ChatGPT est un prototype d'agent conversationnel utilisant l'intelligence artificielle, développé par OpenAI et spécialisé dans le dialogue.
L'agent conversationnel de ChatGPT est basé sur le modèle de langage GPT d'OpenAI, et est affiné en continu grâce à l'utilisation de techniques d'apprentissage supervisé et d'apprentissage par renforcement, afin d'améliorer les performances du logiciel.
ChatGPT est capable de générer des réponses à des questions, de compléter des phrases, de traduire des textes, d'écrire des articles et même de tenir des conversations avec des humains. Il peut également synthétiser des textes en fonction d'un ensemble de contraintes données, telles que le ton, le style et le sujet. Il a été utilisé dans diverses applications, telles que la génération de sous-titres pour des vidéos et la création de chatbots.
En raison de ses capacités multiples, le prototype suscite également des inquiétudes en raison des détournements possibles à des fins malveillantes, des risques de plagiat dans le monde académique et de possibles suppressions d'emplois dans certains secteurs. ChatGPT soulève également des préoccupations en matière de sécurité et de confidentialité, car le modèle peut être utilisé pour générer des faux textes et des informations trompeuses.
Lancé en novembre 2022 dans une version gratuite et non connectée à Internet, ChatGPT bénéficie d’une large exposition médiatique et reçoit un accueil globalement positif, bien que son exactitude factuelle soit critiquée.
En janvier 2023, ChatGPT compte plus de 100 millions de comptes enregistrés.
Signification
Le sigle ChatGPT est un mot-valise composé des mots anglais « chat » et « GPT »3.
Le mot « chat » désigne un fil de discussions dans lequel les internautes échangent des messages de manière instantanée. La particularité de ChatGPT est de permettre à un internaute de discuter non pas avec d'autres internautes mais avec un système basé sur une intelligence artificielle4.
Le mot « GPT » est un acronyme signifiant « Generative Pre-trained Transformer » (« Transformeur génératif pré-entraîné »)
Caractéristiques
ChatGPT est un prototype d'agent conversationnel lancé en novembre 2022 par OpenAI, une société co-créée par Elon Musk et Sam Altman en 2015 et valorisée à 29 milliards de dollars américains en 20235.
Il s'agit d'un agent conversationnel à intelligence artificielle ou « chatbot », autrement dit un assistant virtuel qui utilise les nouvelles technologies pour dialoguer avec ses utilisateurs6.
Disponible dans de multiples langues comme le français, son robot conversationnel est capable de répondre à des questions-tests dans un langage très proche de celui d'un humain (parfois, selon la question, avec un niveau de performance supérieur à un répondant humain moyen)7,8.
L'accès à ChatGPT est libre, mais nécessite d'ouvrir un compte sur le site Web d'OpenAI pour accéder au robot9. Les utilisateurs contribuent aussi à former ChatGPT
Modèle de langage et d'apprentissage
ChatGPT est une amélioration du modèle de langage GPT-3 d'OpenAI, entraîné par apprentissage supervisé et apprentissage par renforcement, les deux approches faisant appel à des données créées par des humains pour l'entrainement du modèle11.
Dans le cas de l'apprentissage supervisé, le modèle reçoit des conversations dans lesquelles les formateurs jouent les deux rôles : l'utilisateur et l'assistant d'intelligence artificielle. Dans l'étape de renforcement, les formateurs humains ont d'abord classé les réponses que le modèle avait créées dans les conversations précédentes. Ces classements ont été utilisés pour créer des modèles de récompense sur lesquels le modèle est affiné en utilisant plusieurs itérations de Proximal Policy Optimization (en) (PPO)12,13.
Les algorithmes de Proximal Policy Optimization présentent un avantage économique par rapport aux algorithmes de Trust Region Policy Optimization ; ils annulent un grand nombre d'opérations coûteuses en calcul avec des performances plus rapides14,15. Les modèles sont formés en collaboration avec Microsoft sur son infrastructure de supercalculateur Microsoft Azure
Limites
ChatGPT possède cependant de multiples limites.
Le modèle de récompense de ChatGPT, conçu autour de la surveillance humaine, peut par exemple être suroptimisé et ainsi entraver les performances, un phénomène connu sous le nom de loi de Goodhart17.
En outre, ChatGPT n'a pas accès à Internet et a une connaissance limitée des événements survenus après 2021. La base de données utilisée par ChatGPT ne contient en effet que des informations antérieures, ce qui peut poser problème lorsque la recherche concerne des événements récents. Si l'utilisateur interroge par exemple ChatGPT sur l'effondrement, en 2022, de la plateforme de cryptomonnaies FTX, l'IA se révèle incapable de répondre18. Elle se contente alors d'indiquer :
« Je suis désolé, mais je ne suis pas en mesure de fournir des informations sur des événements qui ont pu se produire dans la réalité. [Mes données d'entraînement] ne couvre[nt] pas de tels événements et je n'ai pas accès à l'Internet pour effectuer des recherches18. »
Lors de la phase d'entraînement de l'IA, les évaluateurs humains ont par ailleurs privilégié la rédaction de réponses plus longues, indépendamment de la « compréhension » réelle du sujet traité ou du fait qu'il s'agisse d'un contenu factuel12.
Les données d'entraînement peuvent également souffrir d'un biais algorithmique. Des messages comprenant des descriptions vagues de personnes, comme un président-directeur général, pourraient ainsi générer une réponse qui suppose que cette personne est, par exemple, un homme blanc