Un trillion de tokens et la décision que la majorité ne comprend pas
Le 24 mars 2026, Portkey a annoncé que son AI Gateway devenait entièrement open source. La couverture médiatique immédiate s'est centrée sur les chiffres d'échelle : plus d'un trillion de tokens traités quotidiennement, 120 millions de requêtes par jour, 180 millions de dollars de dépenses en IA gérées annuellement pour 24 000 organisations. Des chiffres impressionnants qui ont inévitablement généré des gros titres faciles.
Cependant, le véritable mouvement stratégique ne réside pas dans les chiffres. Il se trouve dans la décision de libérer ce qui est historiquement protégé : la couche d'infrastructure qui connecte les entreprises avec plus de 250 modèles de langage sous une interface unifiée, ainsi que les capacités de gouvernance, d'observabilité, d'authentification et de contrôle des coûts qui nécessitaient auparavant un abonnement payant séparé.
Pour toute entreprise opérant dans ce segment, cela équivaut à tirer le verrou au sol et à dire : "La valeur n'était pas ici." La question qui mérite une analyse n'est pas de savoir si cela est généreux, mais quelle architecture de portefeuille se cache derrière cette décision et à quel point elle est solide.
La logique de portefeuille derrière l'ouverture du code
Portkey n'est pas dans le secteur des logiciels empaquetés. Elle se positionne comme la couche de contrôle entre les entreprises et la prolifération des modèles d'IA. Cette distinction change complètement la façon d'évaluer le mouvement.
Lorsqu'une entreprise libère son infrastructure centrale en open source, elle applique généralement l'une de deux stratégies : soit le produit central a cessé d'être différenciateur et nécessite une communauté pour survivre, soit l'entreprise a identifié que le véritable moteur de revenus se trouve dans une couche supérieure et a besoin d'une distribution maximale dans la couche inférieure pour l'alimenter. Portkey est clairement dans le second scénario.
Le gateway open source agit comme un moteur d'acquisition massive. Chaque équipe d'ingénierie qui l'adopte parce qu'il est gratuit, auto-hébergé et flexible devient un candidat qualifié pour les niveaux de paiement : l'infrastructure gérée avec un SLA de 99,99 %, le stockage et l'indexation des logs à grande échelle, le cache sémantique, la gestion avancée des prompts et, surtout, les certifications de conformité réglementaire telles que SOC2, HIPAA et ISO 27001, que toute entreprise régulée ne peut construire en interne en quelques semaines.
Il s'agit d'une exploitation intelligente du business présent pour financer l'exploration du business futur. Le moteur de revenus actuel, la plateforme gérée avec ses niveaux de paiement, reste intact. Ce qui est ouvert, c'est l'entonnoir d'entrée. Le coût marginal d'acquisition d'un nouvel utilisateur technique tombe à zéro tandis que la valeur que capture Portkey dans le segment des entreprises ne diminue pas du tout.
Un fait mérite une attention particulière : l'annonce n'est pas, strictement parlant, la première fois que Portkey publie du code open source. Le gateway fonctionnait déjà sous cette modalité dans des versions antérieures. Ce qui est annoncé en mars 2026 est l'unification de composants séparés et l'incorporation du MCP Gateway comme disponibilité générale. La narration de "maintenant c'est complètement ouvert" est aussi une déclaration de maturité du produit : il n'y a plus de pièces dispersées qui obligent l'utilisateur à payer pour la cohésion.
Le MCP Gateway comme pari d'exploration
L'élément le plus révélateur de l'annonce n'est pas l'open source en soi, mais l'incorporation du MCP Gateway, construit sur le Protocole de Contexte de Modèle. Ce protocole permet aux agents d'IA d'utiliser des outils externes, d'accéder à des bases de données et d'exécuter des actions sur des systèmes d'entreprise de manière contrôlée.
C'est ici que la logique bimodale de Portkey se révèle le plus clairement. Le gateway unifié pour LLMs est l'activité d'aujourd'hui : mature, avec des métriques d'échelle impressionnantes, parfaitement défendable avec l'argument du coût de migration. Le MCP Gateway est le pari sur l'activité de demain : la gouvernance des agents autonomes dans des environnements professionnels, un marché qui en 2026 définit encore ses normes.
Lancer le MCP Gateway comme disponibilité générale simultanément avec l'ouverture du code est une manœuvre de positionnement délibérée. Portkey envoie deux messages simultanément : "Nous sommes les plus matures sur le problème existant" et "Nous sommes les premiers sur le problème à venir." Le risque de cette position est l'exécution simultanée. Maintenir la qualité opérationnelle d'un système qui traite un trillion de tokens par jour tout en construisant et en développant une capacité complètement différente, l'orchestration des agents, nécessite un design organisationnel qui protège les deux lignes de travail sans qu'une ne cannibalise les ressources de l'autre.
Les concurrents directs, notamment LiteLLM dans le segment d'auto-hébergement à haute disponibilité et TrueFoundry dans la gouvernance des agents, opèrent déjà dans ces espaces. L'avantage de Portkey ne réside pas dans la technologie isolée ; c'est la base installée de 24 000 organisations qui font déjà confiance à sa couche de contrôle pour les dépenses en IA. Convertir cette confiance en adoption du MCP Gateway est un problème d'expansion de compte, non de conquête de nouveaux marchés, ce qui réduit considérablement le risque du pari.
La sobriété que les chiffres de l'échelle cachent
Il existe une tension structurelle que l'annonce ne résout pas de manière explicite : la latence. Le surcoût mesuré de 20 à 40 millisecondes que Portkey introduit lorsque les fonctions avancées d'observabilité et de garde-fous sont activées n'est pas un détail technique mineur. Pour les charges de travail des agents qui enchaînent des dizaines d'appels à des modèles en séquence, ce surcoût s'accumule et peut changer la viabilité économique d'un flux complet.
Cela importe car la promesse du MCP Gateway est précisément de permettre des flux d'agents complexes. Si le coût de la gouvernance est la latence accumulée, Portkey devra démontrer avec des métriques de production que le contrôle ne détruit pas les performances. Des concurrents comme Bifrost, construit en Go et conçu explicitement pour minimiser le surcoût, sont positionnés pour contester exactement cet argument.
Le modèle d'auto-hébergement mérite également une analyse minutieuse. Bien que le code open source soit disponible, le déploiement dans un environnement isolé ou sécurisé n'est disponible qu'au niveau Entreprise. Cela signifie que les organisations avec des exigences strictes en matière de résidence des données, un segment en pleine expansion avec chaque nouvelle réglementation sur l'IA, doivent s'engager au niveau le plus élevé avant de pouvoir évaluer si le produit répond à leurs normes techniques. LiteLLM propose un auto-hébergement complet sans coût de licence, ce qui est un argument de vente simple et puissant pour les équipes avec des capacités de DevOps.
L'open source comme infrastructure du modèle de revenus
Portkey exécute un modèle de portefeuille dans lequel la couche ouverte et gratuite ne concurrence pas l'activité payante ; elle l'alimente. L'ouverture du code est l'investissement dans l'acquisition ; la plateforme gérée avec certifications de conformité et SLA est le retour. C'est une structure qui a déjà prouvé sa validité dans l'infrastructure des données, dans les outils de développement et dans les bases de données, et qui se déplace maintenant vers le middleware d'IA d'entreprise.
La viabilité à long terme de ce modèle dépend de deux variables que les chiffres actuels ne peuvent pas confirmer : le taux auquel les utilisateurs du gateway gratuit passent à des plans payants, et la vitesse à laquelle le MCP Gateway capte l'adoption avant que le marché de la gouvernance des agents ne se consolide autour d'un autre standard. Avec 24 000 organisations déjà dans le périmètre et un trillion de tokens quotidiens comme signal de rétention opérationnelle, la base de conversion existe. L'exécution sur le segment des agents est la variable qui déterminera si le portefeuille de Portkey se renforce ou se fragmente dans les dix-huit mois à venir.











