Un nouveau modèle de langage nommé gpt2-chatbot sème la confusion et l’excitation dans le monde de l’IA. Serait-ce un modèle OpenAI en construction, ou un canular bien orchestré ?
Nouveau modèle mystérieux sur le radar
Depuis le 29 avril, un mystérieux modèle de langage suscite l’effervescence dans la communauté de l’intelligence artificielle (IA). Apparu sur le comparateur de chatbots LMSYS, gpt2-chatbot est présenté par certains observateurs comme le potentiel successeur de GPT-4, ou du moins d’une version dérivée. Sam Altman, le patron d’OpenAI, s’est même délecté de la situation en jouant avec le suspense dans un tweet mystérieusement ambigu.
Un jeu de mot avec gpt2-chatbot
Quelle importance accorde Sam Altman à ce nom, gpt2-chatbot, pour tweeter qu’il avait « un faible pour gpt2 », tout en mettant l’accent sur l’absence de tiret, puis en modifiant son tweet pour exclure toute ressemblance avec GPT-2 ? Certains supposent l’arrivée d’une nouvelle version du mécanisme de transformation d’OpenAI, quand d’autres évoquent plutôt un éventuel GPT2-1, qui signifierait que le GPT-5 n’existerait pas.
Des questions sur la fabrication de gpt2-chatbot
Qui est derrière gpt2-chatbot ? L’agent conversationnel est entraîné pour se présenter comme ChatGPT et se baser sur GPT-4, ce qui ne nous aide pas. Son créateur aurait pu l’orienter à répondre qu’OpenAI est à l’origine de sa création. Cela dit, la seule certitude est que gpt2-chatbot partage les mêmes faiblesses que les autres modèles d’OpenAI, ce qui semble indiquer une corrélation.
Des opinions différentes sur Twitter
Sur Twitter, on trouve une myriade d’opinions, certaines présentent gpt2-chatbot comme une version allégée de GPT-4, d’autres parlent d’une version open source de GPT-4. Il est aussi décrit comme incroyablement doué en programmation et en mathématiques. Les théories abondent et varient entre une révolution pour un futur modèle GPT-5 et une imitation open source de GPT-4.
L’ambiguïté de gpt2-chatbot
Il est complexe d’établir l’aspect exact de gpt2-chatbot. Actuellement limité à 8 interactions par utilisateur, avec un quota de 1 000 par heure à l’échelle de son serveur, son invisibilité laisse place à l’ambiguïté et au flou. Le tweet de Sam Altman a changé la donne en faisant penser que gpt2-chatbot est plus qu’un simple canular.
Une annonce imminente ?
La publication de Sam Altman laisse présager une annonce imminente. Elle suscite la curiosité de savoir si une nouvelle version de la machine GPT est en cours, ou si un nouveau modèle comme GPT-4.5/GPT-5 est en préparation. Peut-être est-ce une initiative totalement innovante, ou n’est ce qu’une simple illusion ?
On pourrait également penser à une stratégie d’OpenAI pour faire dévier l’attention de ses concurrents avant la Google I/O le 14 mai et l’Apple WWDC le 10 juin. Pourrait-on assister à une annonce majeure de la part d’OpenAI à ces dates ?
Le mystérieux gpt2-chatbot évoque des questions incessantes ne trouvant pas de réponses. Ses capacités sont-elles réelles ou usurpées ? Suffirait-il de fixer à un modèle un cadre conversationnel pour que la magie opère ? Ces questions remettent en discussion les méthodes existantes et poussent à réfléchir sur la future évolution de l’IA.