More

    Google lance Gemma 4, ses modèles d’IA open source les plus puissants à ce jour

    Google a dévoilé Gemma 4, sa nouvelle famille de modèles d’intelligence artificielle open source, conçue pour rivaliser avec les meilleurs systèmes propriétaires tout en restant accessible au plus grand nombre. Placée sous licence Apache 2.0, cette quatrième génération marque un tournant stratégique pour le géant américain, qui mise sur l’ouverture pour accélérer l’adoption de l’IA dans les entreprises et sur les appareils mobiles.

    Présentée début avril par Clement Farabet, vice-président de la recherche chez Google DeepMind, et Olivier Lacombe, chef de produit, cette nouvelle gamme se décline en quatre tailles : 2 milliards de paramètres effectifs (E2B), 4 milliards (E4B), 26 milliards en mélange d’experts (MoE) et 31 milliards en modèle dense. L’objectif affiché : offrir des performances de pointe sur une grande variété de matériels, du smartphone aux serveurs d’entreprise.

    Des performances qui défient des modèles vingt fois plus gros

    Sur le classement Arena AI, référence indépendante du secteur, le modèle Gemma 4 de 31 milliards de paramètres se hisse au troisième rang mondial des modèles open source, surpassant des systèmes jusqu’à vingt fois plus volumineux. La version 26 milliards MoE, elle, occupe la sixième place tout en n’activant que 3,8 milliards de paramètres lors de l’inférence, ce qui lui confère une rapidité d’exécution exceptionnelle.

    Ces prouesses techniques s’appuient sur les mêmes travaux de recherche que Gemini 3, le modèle propriétaire phare de Google. « Gemma 4 est la famille de modèles la plus performante que vous puissiez exécuter sur votre propre matériel », assure l’équipe de Google DeepMind. Une affirmation qui illustre l’ambition de démocratiser l’accès à une IA de niveau professionnel.

    Raisonnement avancé, code et agents autonomes

    Au-delà de la simple conversation, Gemma 4 excelle dans trois domaines clés pour les développeurs. Le raisonnement avancé permet une planification multi-étapes et une logique approfondie, avec des progrès significatifs dans les tests de mathématiques et de suivi d’instructions complexes. La génération de code transforme un poste de travail classique en assistant de programmation local, sans connexion cloud requise.

    Mais c’est surtout la prise en charge native des workflows agentiques qui distingue cette génération : appels de fonctions, sortie JSON structurée et instructions système permettent de construire des agents autonomes capables d’interagir avec différents outils et API. Une capacité qui intéresse particulièrement les entreprises souhaitant automatiser des processus métier sans dépendre d’infrastructures externes.

    L’IA sur mobile franchit un cap

    Les modèles E2B et E4B ont été spécifiquement conçus pour les appareils mobiles et l’Internet des objets. Développés en collaboration étroite avec les équipes Google Pixel, Qualcomm et MediaTek, ils fonctionnent entièrement hors ligne avec une latence quasi nulle sur les smartphones, Raspberry Pi et autres appareils embarqués. Ils intègrent en outre une entrée audio native pour la reconnaissance vocale.

    Tous les modèles de la gamme traitent nativement la vidéo et les images, avec des performances remarquables en reconnaissance optique de caractères (OCR) et en compréhension de graphiques. La fenêtre de contexte atteint 128 000 tokens pour les modèles mobiles et 256 000 tokens pour les grands modèles, permettant de traiter des dépôts de code entiers ou de longs documents en une seule requête.

    Un écosystème ouvert et immédiatement disponible

    Fidèle à sa volonté d’ouverture, Google a obtenu un support immédiat des principaux acteurs de l’écosystème : Hugging Face, Ollama, NVIDIA NIM, vLLM, llama.cpp et LM Studio sont disponibles dès le premier jour. Les développeurs peuvent expérimenter gratuitement via Google AI Studio, ou télécharger les poids des modèles sur Hugging Face et Kaggle.

    Pour les déploiements en production, Google Cloud propose plusieurs options : Vertex AI, Cloud Run avec GPU, GKE et même un cloud souverain pour les charges de travail réglementées. « La sortie de Gemma 4 sous licence Apache 2.0 est une étape majeure », s’est réjoui Clément Delangue, co-fondateur et PDG de Hugging Face.

    Open source et proprietary : le bon équilibre

    Si l’engouement pour les modèles open source est réel — plus de 75 % des entreprises utilisent désormais au moins deux familles de LLM, mêlant modèles fermés et ouverts selon un rapport Databricks 2026 —, les analystes appellent à la prudence. « Les DSI devraient considérer cela comme un portefeuille où ils créent un mélange de modèles ouverts et propriétaires, et trouver le bon équilibre pour leurs cas d’usage », conseille Chirag Dekate, analyste chez Gartner.

    La question de la pérennité des modèles open source reste en suspens, alors que le chinois Alibaba a récemment fait basculer sa populaire famille Qwen vers un modèle propriétaire. Une incertitude qui n’empêche pas Google d’afficher ses ambitions : avec plus de 400 millions de téléchargements depuis la première génération et une communauté de plus de 100 000 variantes, la « Gemmaverse » est déjà une réalité.

    LAISSER UN COMMENTAIRE

    S'il vous plaît entrez votre commentaire!
    S'il vous plaît entrez votre nom ici


    Actualités

    L’acteur de Friends, Matthew Perry, décède à 54 ans

    "Matthew Perry, célèbre pour son rôle de Chandler Bing dans Friends, décède à 54 ans. Acteur très apprécié, sa mort suscite l'émotion mondiale."

    Entité sioniste déploie des navires de guerre en Mer Rouge selon un expert militaire

    Entité sioniste déploie des navires de guerre en Mer Rouge pour contrer les Houthis au Yémen, une manœuvre vue comme une démonstration de force envers l'Iran.

    L’affaire des SMS entre Pfizer et la Commission européenne : ce qu’il faut savoir

    En avril 2021, le New York Times a révélé...

    Banque suisse : Credit Suisse en chute libre après la faillite de la SVB

    L'action de Credit Suisse a dévissé de plus de...

    Le Retour de Microsoft avec Bing et Edge : Une Menace pour Google ?

    Depuis moins de trois mois, ChatGPT a déjà créé...

    Iran et Chine discutent à Pékin avant la visite de Trump

    Le chef de la diplomatie iranienne rencontre Wang Yi à Pékin alors que les tensions montent autour du détroit d’Hormuz et des discussions avec Washington.

    L’Argentine franchit un cap avec la hausse de note Fitch, mais les fragilités demeurent

    Fitch a relevé la note de l’Argentine à B- grâce aux réformes de Milei, tout en soulignant des fragilités macroéconomiques persistantes.

    Contrats carbone : l’Allemagne finance la décarbonation de l’acier et du ciment

    Berlin lance un programme pouvant aller jusqu’à 5 milliards d’euros pour aider l’industrie lourde à réduire ses émissions de CO2.

    Tesla face au scepticisme européen sur sa conduite assistée

    Tesla se heurte aux réserves de plusieurs régulateurs européens au sujet de son système de conduite assistée Full Self-Driving.

    La roupie indienne tombe à un niveau record, les tensions avec l’Iran pèsent sur les marchés

    La roupie indienne a atteint un niveau record mardi, sous l’effet des tensions au Moyen-Orient et de la baisse des espoirs de détente autour de l’Iran.

    Iran attaque les Émirats : vague de condamnations internationales

    Après les attaques iraniennes contre les Émirats, l’Arabie saoudite, le Qatar et des pays occidentaux dénoncent une dangereuse escalade.

    Le pétrole s’envole après les violences dans le détroit d’Ormuz

    Le Brent grimpe de près de 6 % après les violences dans le détroit d’Ormuz, ravivant les craintes sur l’approvisionnement mondial.

    Cessez-le-feu en Ukraine : Moscou et Kiev se menacent

    Moscou et Kiev ont chacun annoncé un cessez-le-feu autour du 9-Mai, mais la trêve s’accompagne de menaces et de combats toujours en cours.

    à Lire

    Categories