More

    Google lance Gemma 3 270M : IA compacte et locale pour smartphones

    France, États-Unis

    Google présente Gemma 3 270M, une version compacte et open source de sa famille de modèles Gemma conçue pour s’exécuter en local sur smartphones et navigateurs, promettant un réglage rapide, un suivi d’instructions solide et une confidentialité renforcée grâce au traitement sur l’appareil.

    Fonctionnalités de Gemma 3 270M et performances

    Gemma 3 270M est une déclinaison légère de la série Gemma développée par Google DeepMind. Le modèle totalise 270 millions de paramètres : 170 millions dédiés aux embeddings pour gérer un vocabulaire étendu et 100 millions pour les blocs de transformation. Grâce à un vocabulaire de 256 000 tokens, il peut traiter des tokens spécifiques et rares, ce qui en fait une base adaptée à un affinement par domaine ou par langue.

    Google met en avant plusieurs caractéristiques techniques :

    • Architecture compacte : conçu pour fonctionner localement sur des appareils contraints en ressources, y compris des smartphones et potentiellement entièrement dans un navigateur web.
    • Efficacité énergétique : selon des tests internes sur un SoC Pixel 9 Pro, le modèle quantifié en INT4 aurait consommé seulement 0,75 % de batterie pour 25 conversations, faisant de Gemma 3 270M le modèle Gemma le plus économe en énergie selon Google.
    • Suivi des instructions : un point de contrôle pré‑entraîné orienté « instruction » est publié ; bien que le modèle ne soit pas destiné aux cas conversationnels complexes, il suit efficacement des instructions générales dès sa mise en service.
    • Quantification prête pour la production : des points de contrôle Quantization‑Aware Trained (QAT) sont disponibles pour l’exécution en INT4 avec une dégradation minimale des performances, essentiel sur appareils aux ressources limitées.

    « Vous n’utiliseriez pas un marteau pour accrocher un cadre. Le même principe s’applique à la construction avec l’IA. »

    Gemma s’inscrit dans une famille de modèles lancée progressivement : la première version en février 2024, Gemma 2 en juin 2024 et les premières variantes Gemma 3 publiées début 2025. La famille comprend des tailles allant d’environ 1 milliard à 27 milliards de paramètres pour des besoins cloud ou serveur, tandis que Gemma 3 270M cible les déploiements embarqués et légers.

    Déploiement, réglage fin et cas d’usage

    Google présente Gemma 3 270M comme « l’outil adapté à la tâche » : un modèle de base performant qui se spécialise réellement après un réglage fin. Selon l’entreprise, une fois affiné, le modèle peut exécuter des tâches telles que la classification de texte et l’extraction de données avec rapidité et précision, tout en restant peu coûteux à exploiter.

    Exemples et retours d’expérience

    Le principe de spécialisation a déjà produit des résultats concrets : Adaptive ML, en collaboration avec SK Telecom, a affiné un modèle Gemma 3 4B pour la modération de contenus multilingues et a constaté que le modèle spécialisé égalait ou surpassait des modèles propriétaires bien plus volumineux pour cette tâche précise.

    Pour des usages créatifs, Gemma 3 270M alimente déjà des démonstrations comme une application web Bedtime Story Generator, exploitée via Transformers.js, illustrant la capacité du modèle à soutenir des tâches hors ligne et basées sur le web.

    Quand choisir Gemma 3 270M

    • Pour des tâches bien définies et à fort volume : analyse de sentiments, extraction d’entités, routage de requêtes, transformation de texte non structuré vers structuré, écriture créative et contrôles de conformité.
    • Pour minimiser latence et coûts d’inférence : exécution sur infrastructure légère ou directement sur l’appareil.
    • Pour itérer et déployer rapidement : la petite taille permet des expériences de réglage fin en quelques heures.
    • Pour garantir la confidentialité : traitement local des données sensibles sans envoi au cloud.
    • Pour déployer une flotte de modèles spécialisés, chacun dédié à une tâche, sans coûts massifs d’infrastructure.

    Accès et outils

    Google indique que les modèles Gemma 3 270M sont distribués via des plateformes publiques et outils d’inférence : Hugging Face, Ollama, Kaggle, LM Studio et Docker. Ils peuvent être testés sur Vertex AI ou avec des moteurs d’inférence populaires tels que llama.cpp, Gemma.cpp, LiteRT, Keras et MLX. Le réglage fin est possible avec des outils comme Hugging Face, UnSloth et JAX, et les modèles spécialisés peuvent être déployés localement ou sur des infrastructures cloud, y compris Google Cloud Run.

    « Le Gemmaverse repose sur l’idée que l’innovation peut prendre toutes les formes. Avec Gemma 3 270M, nous donnons aux développeurs les moyens de créer des solutions d’IA plus intelligentes, plus rapides et plus efficaces. Nous sommes impatients de découvrir les modèles spécialisés que vous allez créer », déclare Google.

    Enjeux environnementaux et sociaux liés au déploiement

    Si Gemma 3 270M met l’accent sur l’efficacité énergétique, l’essor des usages d’intelligence générative pèse sur le bilan global de l’entreprise. Google a indiqué une hausse de 13 % de ses émissions de carbone en 2023, soit une augmentation de 48 % par rapport à 2019, et attribue en partie cette hausse à la demande en modèles d’IA. Cette tension illustre le coût environnemental associé à l’évolution technologique.

    Sur le plan sociétal, des voix comme celle de Mo Gawdat, ancien directeur commercial de Google X, mettent en garde : il a averti que « l’IA va prendre des emplois, qu’il s’agisse de développeurs ou de PDG, et qu’elle va créer 15 années « d’enfer » qui débuteront plus tôt que nous le pensons. » Ces remarques soulignent les défis à venir pour la main-d’œuvre alors que se multiplient les modèles compacts et performants destinés à automatiser des tâches variées.

    Source : Google

    source:https://intelligence-artificielle.developpez.com/actu/374662/Google-annonce-Gemma-3-270M-une-version-miniature-de-son-modele-d-IA-ouvert-concu-pour-fonctionner-en-local-reglable-en-un-clin-d-oeil-et-offrant-des-performances-robustes-malgre-son-faible-encombrement/

    LAISSER UN COMMENTAIRE

    S'il vous plaît entrez votre commentaire!
    S'il vous plaît entrez votre nom ici


    Actualités

    L’acteur de Friends, Matthew Perry, décède à 54 ans

    "Matthew Perry, célèbre pour son rôle de Chandler Bing dans Friends, décède à 54 ans. Acteur très apprécié, sa mort suscite l'émotion mondiale."

    Entité sioniste déploie des navires de guerre en Mer Rouge selon un expert militaire

    Entité sioniste déploie des navires de guerre en Mer Rouge pour contrer les Houthis au Yémen, une manœuvre vue comme une démonstration de force envers l'Iran.

    L’affaire des SMS entre Pfizer et la Commission européenne : ce qu’il faut savoir

    En avril 2021, le New York Times a révélé...

    Banque suisse : Credit Suisse en chute libre après la faillite de la SVB

    L'action de Credit Suisse a dévissé de plus de...

    Le Retour de Microsoft avec Bing et Edge : Une Menace pour Google ?

    Depuis moins de trois mois, ChatGPT a déjà créé...

    Le FMI et la Banque mondiale rétablissent leurs liens avec le Venezuela

    Le FMI et la Banque mondiale renouent avec le Venezuela, ouvrant la voie à un possible soutien financier au pays.

    Cessez-le-feu Israël-Liban : scènes de fête à Beyrouth

    Au Liban, des tirs de célébration éclatent à Beyrouth après l’entrée en vigueur du cessez-le-feu entre Israël et le Hezbollah.

    Attaques russes en Ukraine: 14 morts dont un enfant

    Attaques russes meurtrières en Ukraine: 14 morts à Kiev, Odessa et Dnipro, dont un enfant. La Russie signale aussi 2 enfants tués à Tuapse.

    Curry porte les Warriors en playoffs après l’élimination des Clippers

    Curry mène les Warriors en playoffs après l’élimination des Clippers, tandis que les 76ers battent le Magic et filent en phase finale.

    États-Unis : trois morts dans une nouvelle attaque navale dans le Pacifique

    Les États-Unis ont mené une nouvelle frappe dans le Pacifique Est, tuant trois personnes accusées de narcotrafic. Les ONG dénoncent des exécutions.

    Trump annonce un échange entre les dirigeants d’Israël et du Liban

    Trump annonce un échange historique entre les dirigeants d’Israël et du Liban, alors que les frappes et tensions se poursuivent au Liban.

    Conflit Iran-États-Unis : le Pakistan relance les négociations

    Le Pakistan intensifie sa médiation pour relancer les négociations Iran-États-Unis, sur fond de tensions au détroit d’Ormuz.

    Haïti : deux responsables limogés après la bousculade de la Citadelle

    En Haïti, deux responsables ont été limogés après la bousculade à la Citadelle de la Laferrière qui a fait 25 morts.

    à Lire

    Categories