More

    Coûts de l’IA générative : obstacles pour les entreprises françaises

    France

    Les entreprises françaises font face à des défis significatifs en matière de coûts liés à l’IA générative, en particulier en ce qui concerne l’inférence. Alors qu’elles commencent à adopter ces technologies, les modèles de tarification basés sur l’utilisation suscitent des inquiétudes quant à leur impact financier futur.

    Des tarifs au token en mode SaaS

    Les tarifs au token ont été adoptés par tous les fournisseurs de LLM en mode SaaS. (Crédit S.L.)« )

    Les fournisseurs de modèles de langage (LLM) en mode logiciel en tant que service (SaaS) ont tous adopté des tarifs au token. Cela complique la gestion des budgets pour les entreprises qui explorent l’utilisation de l’IA générative.

    Un potentiel inexploité

    Selon une étude menée par Canalys, le potentiel de l’IA générative reste largement inexploré. Les entreprises hésitent à tirer parti de cette technologie en raison des coûts récurrents associés au cloud computing. Contrairement aux coûts ponctuels engendrés par la formation des modèles, l’inférence entraîne des dépenses opérationnelles continues.

    Rachel Brindley, directrice principale chez Canalys, souligne que « l’inférence représente une contrainte cruciale sur la voie de la commercialisation de l’IA. » À mesure que les entreprises passent de la recherche à un déploiement à grande échelle, la rentabilité de l’inférence devient une priorité, incitant les acteurs à évaluer les différents modèles, plateformes cloud, et architectures matérielles comme les GPU ou les accélérateurs personnalisés.

    Des coûts volatils et prévisibilité difficile

    Yi Zhang, chercheur chez Canalys, explique que de nombreux services d’IA fonctionnent sur des modèles de tarification basés sur l’utilisation, facturant par jeton ou par appel API. Cela rend difficile la prévision des coûts, surtout avec l’augmentation de l’utilisation.

    Lorsque les coûts d’inférence deviennent volatils ou excessivement élevés, les entreprises se voient contraintes de limiter leur utilisation, simplifiant les modèles ou restreignant leur mise en œuvre à des scénarios à forte valeur ajoutée. En conséquence, le potentiel de l’IA demeure sous-exploité, comme le souligne M. Zhang.

    LAISSER UN COMMENTAIRE

    S'il vous plaît entrez votre commentaire!
    S'il vous plaît entrez votre nom ici


    Actualités

    L’acteur de Friends, Matthew Perry, décède à 54 ans

    "Matthew Perry, célèbre pour son rôle de Chandler Bing dans Friends, décède à 54 ans. Acteur très apprécié, sa mort suscite l'émotion mondiale."

    Entité sioniste déploie des navires de guerre en Mer Rouge selon un expert militaire

    Entité sioniste déploie des navires de guerre en Mer Rouge pour contrer les Houthis au Yémen, une manœuvre vue comme une démonstration de force envers l'Iran.

    L’affaire des SMS entre Pfizer et la Commission européenne : ce qu’il faut savoir

    En avril 2021, le New York Times a révélé...

    Banque suisse : Credit Suisse en chute libre après la faillite de la SVB

    L'action de Credit Suisse a dévissé de plus de...

    Le Retour de Microsoft avec Bing et Edge : Une Menace pour Google ?

    Depuis moins de trois mois, ChatGPT a déjà créé...

    Face aux Big Tech, la coalition SPUR élargit son front sur l’IA

    SPUR accueille 30 nouveaux membres et veut encadrer l’usage des contenus journalistiques par les plateformes d’IA.

    OpenAI élargit Codex : Sites, annotations et extensions métiers expliqués

    OpenAI ajoute à Codex des Sites, annotations et extensions par rôle. Ce que ces nouveautés changent pour les équipes et leurs limites.

    Qwant au Parlement européen : ce que la bascule change vraiment

    Qwant devient le moteur par défaut au Parlement européen : ce que ce choix change, ce qu’il ne change pas et pourquoi il reste surtout symbolique.

    Google Gemma 4 12B : l’IA locale veut sortir du cloud

    Gemma 4 12B vise l’IA multimodale en local sur ordinateur portable, avec exécution hors cloud et une contrainte matérielle centrale : 16GB de mémoire.

    Microsoft MAI : pourquoi ses sept modèles d’IA maison comptent vraiment

    Microsoft a présenté sept modèles MAI développés en interne à Build 2026. Raisonnement, code, image, voix : voici ce qui est confirmé et ce qui reste limité.

    Microsoft Scout : ce que l’agent IA change vraiment dans Microsoft 365

    Microsoft Scout inaugure les agents Autopilot dans Microsoft 365 : tâches en arrière-plan, OpenClaw, préversion limitée et garde-fous à connaître.

    Android Drop juin 2026 : partage avec l’iPhone, sécurité et IA utile

    Android Drop de juin 2026 étend Quick Share avec AirDrop, ajoute des fonctions de sécurité et déploie plusieurs usages IA côté Android.

    Google Drive : Gemini veut ranger vos fichiers sans décider à votre place

    La nouvelle option de Google Drive propose de classer les fichiers épars avec Gemini, mais les déplacements restent soumis à validation.

    à Lire

    Categories