L’ère statique de l’intelligence artificielle est révolue. Ou du moins, Trajectory veut que ce soit le cas.
D’anciens chercheurs des grandes ligues – Google, Apple, OpenAI – parient gros sur une seule idée. Commentaires du monde réel. Ils ont lancé Trajectory cette semaine, dans le but de boucler la boucle entre l’erreur de l’utilisateur et l’amélioration du modèle. Fini de s’entraîner une seule fois et d’espérer le meilleur.
Trajectory vient de récolter 15 millions de dollars. Ronde de graines. Valorisation de 115 millions de dollars. La conviction a mené la charge. Bessemer et Radical VC se sont joints. Des grands noms de l’investissement individuel ? Jeff Dean, scientifique en chef de Google DeepMind. Fei-Fei Li, la « marraine de l’IA ». La pile de crédibilité est épaisse.
Ronak Malde est PDG. Il est venu du Windsurf, puis a rejoint DeepMind lors de cette campagne d’embauche désordonnée de 2,4 milliards de dollars l’année dernière. Ses cofondateurs incluent Arjun Karanam de l’équipe Vision Pro d’Apple et Michael Elabd, anciennement dans la branche robotique de DeepMind. Petite équipe, seulement onze personnes pour le moment. Ambition? Énorme.
Ils affirment que l’industrie est en panne. Pourquoi?
Parce que votre IA cesse d’apprendre à la fin de la phase d’entraînement. OpenAI, Anthropic, Google – ils construisent des bêtes. Des modèles de codage qui écrivent mieux que vous. Modèles mathématiques qui résolvent des preuves. Mais après le lancement ? Congelé. Une statue. Le modèle qui vous a fait échouer mardi vous échouera exactement de la même manière vendredi.
« Même l’IA la plus puissante aujourd’hui est statique. »
Malde cite les assistants de codage comme Cursor comme preuve de concept. Ils utilisent déjà les données des utilisateurs pour peaufiner constamment leurs modèles. C’est pourquoi le codage de l’IA a explosé si rapidement. Il ne s’agit pas seulement de la force du modèle de base. C’est la couche d’apprentissage continu au sommet. Trajectory veut apporter cette même mécanique à tous les autres secteurs verticaux. Pas seulement du code. Assistance client. Ventes. Loi.
Mais c’est plus difficile.
Le code s’exécute ou plante. Binaire. Faire le ménage. Une demande de retour traitée par un bot de support ? C’est compliqué. Ambiguë. Le succès est flou. Karanam admet le défi. Trajectory aide les entreprises à définir leurs propres indicateurs de réussite. Vous ne commencez pas avec GPT-4. Vous commencez avec un modèle open source, post-formé pour votre travail spécifique.
Prenez Decagon. Ils créent des agents IA pour le support client. Lorsqu’un robot échoue et passe la main à un humain, Trajectory enregistre cet échec. La semaine prochaine? Ils s’entraînent là-dessus. Le nouveau modèle ne fait pas cette erreur. Ils affirment que ces modèles étroits et post-entraînés battent les géants des frontières dans des tâches spécifiques.
Les dirigeants adorent l’idée. À l’heure actuelle, le déploiement de l’IA nécessite l’embauche d’« ingénieurs déployés vers l’avant ». Des consultants sophistiqués intégrés dans votre entreprise pour surveiller la pile technologique. OpenAI et Anthropic sont en train de constituer des équipes pour effectuer ce travail manuel à votre place. Elabd déteste ça. Il veut que le logiciel se répare tout seul. Aucun ingénieur n’est nécessaire pour l’entretien. Branchez-le simplement. Il apprend. Ça va mieux.
Est-ce un véritable apprentissage continu ? Les critiques pourraient lever les yeux au ciel. Les mises à jour ont lieu chaque semaine. Entre ces mises à jour, le modèle est toujours statique. C’est intermittent. Un patch. Pas un flux.
Elabd écarte cela. Il dit que chaque semaine n’est que la porte de départ. L’objectif est des mises à jour quotidiennes. Mises à jour horaires. Peut-être même un apprentissage par interaction. Il envisage un monde dans lequel les entreprises ne formeraient pas une IA géante pour tout le monde. Ils forment des IA spécifiques pour chaque employé. Personnalisé. Adaptatif. En direct.
Cela semble risqué. Cela semble incroyable. Ce sera lequel ?
Il faudra attendre le prochain patch hebdomadaire pour le savoir.
