More

    Google lance Gemma 3 270M : IA compacte et locale pour smartphones

    France, États-Unis

    Google présente Gemma 3 270M, une version compacte et open source de sa famille de modèles Gemma conçue pour s’exécuter en local sur smartphones et navigateurs, promettant un réglage rapide, un suivi d’instructions solide et une confidentialité renforcée grâce au traitement sur l’appareil.

    Fonctionnalités de Gemma 3 270M et performances

    Gemma 3 270M est une déclinaison légère de la série Gemma développée par Google DeepMind. Le modèle totalise 270 millions de paramètres : 170 millions dédiés aux embeddings pour gérer un vocabulaire étendu et 100 millions pour les blocs de transformation. Grâce à un vocabulaire de 256 000 tokens, il peut traiter des tokens spécifiques et rares, ce qui en fait une base adaptée à un affinement par domaine ou par langue.

    Google met en avant plusieurs caractéristiques techniques :

    • Architecture compacte : conçu pour fonctionner localement sur des appareils contraints en ressources, y compris des smartphones et potentiellement entièrement dans un navigateur web.
    • Efficacité énergétique : selon des tests internes sur un SoC Pixel 9 Pro, le modèle quantifié en INT4 aurait consommé seulement 0,75 % de batterie pour 25 conversations, faisant de Gemma 3 270M le modèle Gemma le plus économe en énergie selon Google.
    • Suivi des instructions : un point de contrôle pré‑entraîné orienté « instruction » est publié ; bien que le modèle ne soit pas destiné aux cas conversationnels complexes, il suit efficacement des instructions générales dès sa mise en service.
    • Quantification prête pour la production : des points de contrôle Quantization‑Aware Trained (QAT) sont disponibles pour l’exécution en INT4 avec une dégradation minimale des performances, essentiel sur appareils aux ressources limitées.

    « Vous n’utiliseriez pas un marteau pour accrocher un cadre. Le même principe s’applique à la construction avec l’IA. »

    Gemma s’inscrit dans une famille de modèles lancée progressivement : la première version en février 2024, Gemma 2 en juin 2024 et les premières variantes Gemma 3 publiées début 2025. La famille comprend des tailles allant d’environ 1 milliard à 27 milliards de paramètres pour des besoins cloud ou serveur, tandis que Gemma 3 270M cible les déploiements embarqués et légers.

    Déploiement, réglage fin et cas d’usage

    Google présente Gemma 3 270M comme « l’outil adapté à la tâche » : un modèle de base performant qui se spécialise réellement après un réglage fin. Selon l’entreprise, une fois affiné, le modèle peut exécuter des tâches telles que la classification de texte et l’extraction de données avec rapidité et précision, tout en restant peu coûteux à exploiter.

    Exemples et retours d’expérience

    Le principe de spécialisation a déjà produit des résultats concrets : Adaptive ML, en collaboration avec SK Telecom, a affiné un modèle Gemma 3 4B pour la modération de contenus multilingues et a constaté que le modèle spécialisé égalait ou surpassait des modèles propriétaires bien plus volumineux pour cette tâche précise.

    Pour des usages créatifs, Gemma 3 270M alimente déjà des démonstrations comme une application web Bedtime Story Generator, exploitée via Transformers.js, illustrant la capacité du modèle à soutenir des tâches hors ligne et basées sur le web.

    Quand choisir Gemma 3 270M

    • Pour des tâches bien définies et à fort volume : analyse de sentiments, extraction d’entités, routage de requêtes, transformation de texte non structuré vers structuré, écriture créative et contrôles de conformité.
    • Pour minimiser latence et coûts d’inférence : exécution sur infrastructure légère ou directement sur l’appareil.
    • Pour itérer et déployer rapidement : la petite taille permet des expériences de réglage fin en quelques heures.
    • Pour garantir la confidentialité : traitement local des données sensibles sans envoi au cloud.
    • Pour déployer une flotte de modèles spécialisés, chacun dédié à une tâche, sans coûts massifs d’infrastructure.

    Accès et outils

    Google indique que les modèles Gemma 3 270M sont distribués via des plateformes publiques et outils d’inférence : Hugging Face, Ollama, Kaggle, LM Studio et Docker. Ils peuvent être testés sur Vertex AI ou avec des moteurs d’inférence populaires tels que llama.cpp, Gemma.cpp, LiteRT, Keras et MLX. Le réglage fin est possible avec des outils comme Hugging Face, UnSloth et JAX, et les modèles spécialisés peuvent être déployés localement ou sur des infrastructures cloud, y compris Google Cloud Run.

    « Le Gemmaverse repose sur l’idée que l’innovation peut prendre toutes les formes. Avec Gemma 3 270M, nous donnons aux développeurs les moyens de créer des solutions d’IA plus intelligentes, plus rapides et plus efficaces. Nous sommes impatients de découvrir les modèles spécialisés que vous allez créer », déclare Google.

    Enjeux environnementaux et sociaux liés au déploiement

    Si Gemma 3 270M met l’accent sur l’efficacité énergétique, l’essor des usages d’intelligence générative pèse sur le bilan global de l’entreprise. Google a indiqué une hausse de 13 % de ses émissions de carbone en 2023, soit une augmentation de 48 % par rapport à 2019, et attribue en partie cette hausse à la demande en modèles d’IA. Cette tension illustre le coût environnemental associé à l’évolution technologique.

    Sur le plan sociétal, des voix comme celle de Mo Gawdat, ancien directeur commercial de Google X, mettent en garde : il a averti que « l’IA va prendre des emplois, qu’il s’agisse de développeurs ou de PDG, et qu’elle va créer 15 années « d’enfer » qui débuteront plus tôt que nous le pensons. » Ces remarques soulignent les défis à venir pour la main-d’œuvre alors que se multiplient les modèles compacts et performants destinés à automatiser des tâches variées.

    Source : Google

    source:https://intelligence-artificielle.developpez.com/actu/374662/Google-annonce-Gemma-3-270M-une-version-miniature-de-son-modele-d-IA-ouvert-concu-pour-fonctionner-en-local-reglable-en-un-clin-d-oeil-et-offrant-des-performances-robustes-malgre-son-faible-encombrement/

    LAISSER UN COMMENTAIRE

    S'il vous plaît entrez votre commentaire!
    S'il vous plaît entrez votre nom ici


    Actualités

    L’acteur de Friends, Matthew Perry, décède à 54 ans

    "Matthew Perry, célèbre pour son rôle de Chandler Bing dans Friends, décède à 54 ans. Acteur très apprécié, sa mort suscite l'émotion mondiale."

    Entité sioniste déploie des navires de guerre en Mer Rouge selon un expert militaire

    Entité sioniste déploie des navires de guerre en Mer Rouge pour contrer les Houthis au Yémen, une manœuvre vue comme une démonstration de force envers l'Iran.

    L’affaire des SMS entre Pfizer et la Commission européenne : ce qu’il faut savoir

    En avril 2021, le New York Times a révélé...

    Banque suisse : Credit Suisse en chute libre après la faillite de la SVB

    L'action de Credit Suisse a dévissé de plus de...

    Le Retour de Microsoft avec Bing et Edge : Une Menace pour Google ?

    Depuis moins de trois mois, ChatGPT a déjà créé...

    Affaire Nahel : la Cour de cassation annule la requalification des faits visant le policier

    La haute juridiction judiciaire a annulé vendredi 12 juin 2026 la requalification des faits visant le policier dans l'affaire Nahel. L'affaire est renvoyée devant la cour d'appel de Versailles.

    BCE : la hausse des taux de 25 points de base du 11 juin 2026, ce qu’elle change pour la France

    Le 11 juin 2026, la BCE a relevé ses trois taux directeurs de 25 points de base. Une première depuis un an, motivée par une inflation zone euro à 3,2% en mai et la flambée des prix de l'énergie. Voici les nouveaux taux, les projections BCE et les conséquences concrètes pour les ménages et les entreprises en France.

    Centrale de Zaporijjia : une 19e coupure d’alimentation externe signalée par l’AIEA

    La centrale nucléaire de Zaporijjia a perdu toute alimentation électrique externe dans la nuit du 10 au 11 juin 2026 après une frappe contre un poste de secours

    Centrale de Zaporijjia : une 19e coupure d’alimentation externe signalée par l’AIEA

    La centrale nucléaire de Zaporijjia a perdu toute alimentation électrique externe dans la nuit du 10 au 11 juin 2026 après une frappe contre un poste de secours

    Inflation en France : 2,4 % sur un an en mai, le rebond se confirme

    L’INSEE estime que les prix à la consommation ont augmenté de 2,4 % sur un an en mai 2026, après 2,2 % en avril. Le rebond est lié à l’énergie, et la Banque de France abaissera mi-juin ses prévisions de croissance.

    Climat : l’OMM estime à 91 % la probabilité qu’une année 2026-2030 dépasse 1,5 °C

    L'OMM publie sa mise à jour 2026-2035 : 86 % de chances de battre 2024, 91 % de dépassement temporaire de 1,5 °C, et 75 % sur la moyenne quinquennale. El Niño fin 2026 pourrait pousser 2027 vers un nouveau record.

    Prix du gaz : la CRE officialise une hausse de 7,4% au 1er juillet

    La CRE officialise une hausse de 7,4% du prix repère du gaz au 1er juillet 2026 (164,21 €/MWh TTC). Surcoût moyen de 2,7 € TTC pour ~6 millions de ménages en offre indexée.

    Industrie française : le rebond d’avril masque une demande fragile

    La production manufacturière progresse encore en avril, mais les signaux de demande et de coûts invitent à lire ce rebond avec prudence.

    à Lire

    Categories