More

    Apple dévoile les limites des modèles d’IA générative en recherche

    France, États-Unis

    Les modèles d’IA générative ont rapidement prouvé leur capacité à exécuter des tâches techniques avec précision. L’ajout de capacités de raisonnement a ouvert la voie à des performances inattendues, permettant à ces systèmes de traiter des questions complexes et de fournir des réponses de qualité supérieure. Cependant, un rapport récent d’Apple remet en question certaines de ces avancées.

    Les limites des modèles de raisonnement IA

    La semaine dernière, Apple a publié un rapport de recherche intitulé « The Illusion of Thinking : Comprendre les forces et les limites des modèles de raisonnement à travers la lentille de la complexité des problèmes ». Ce document de 30 pages examine si les grands modèles de raisonnement (LRM), tels que les modèles d’OpenAI et d’Anthropic, réussissent réellement à fournir des capacités de « pensée » avancées.

    Que sont les grands modèles de raisonnement (LRM) ?

    Le terme « grands modèles de raisonnement » désigne des modèles avancés qui ont été popularisés par l’émergence de modèles tels que le modèle d’OpenAI. Le principe qui sous-tend ces LRM est que passer plus de temps à analyser une question peut améliorer la qualité de la réponse. Des techniques comme la « chaîne de pensée » (CoT) permettent à ces modèles de décomposer des problèmes complexes en étapes plus simples, facilitant ainsi la compréhension pour les utilisateurs.

    Les LRM nécessitent plus de puissance de calcul

    Cependant, ce traitement supplémentaire implique une demande accrue en ressources de calcul, rendant ces modèles plus coûteux et moins adaptés aux tâches quotidiennes. Les critères de référence utilisés pour tester ces LRM sont souvent basés sur des calculs mathématiques, ce qui pose des problèmes méthodologiques, comme le souligne Apple dans son rapport.

    Les expériences d’Apple

    Pour mieux évaluer ces modèles, Apple a mis en place quatre puzzles contrôlables :

    • Tower of Hanoi : un défi de déplacement de disques.
    • Checkers Jumping : un jeu de dames repositionnant des pièces.
    • River Crossing : un exercice de traversée de rivière avec des formes.
    • Blocks World : une tâche d’échange d’objets colorés.

    Illustration des expériences

    Ces puzzles ont été choisis pour créer un environnement contrôlé, permettant une analyse rigoureuse des schémas de raisonnement. En comparant les versions « pensantes » et « non pensantes » de modèles connus, Apple a pu manipuler la complexité des tâches.

    Les résultats d’Apple

    Les résultats révèlent que les modèles non réflexifs peuvent rivaliser, voire surpasser, les modèles réflexifs dans des situations de faible complexité. Cependant, l’écart de performance s’accroît dans des contextes de complexité moyenne. À des niveaux de complexité élevés, les performances des deux types de modèles chutent, indiquant des limites fondamentales.

    Résultats des modèles

    Un effondrement similaire avec cinq modèles de réflexion

    Un effondrement de performance similaire a été observé avec cinq modèles de réflexion testés, confirmant que l’augmentation de la complexité entraîne une baisse de précision. Les modèles, même ceux conçus pour raisonner, ont montré des limites lorsqu’ils étaient confrontés à des défis plus difficiles.

    Précision et jetons de réflexion

    Implications pour l’IA

    Les résultats de ce rapport soulèvent des questions sur l’état actuel des modèles de raisonnement. Bien que certains experts considèrent que cela indique un éloignement de l’intelligence générale artificielle (AGI), d’autres critiquent la méthodologie utilisée par Apple. Les critiques portent notamment sur le plafonnement des jetons et le choix des modèles testés.

    LAISSER UN COMMENTAIRE

    S'il vous plaît entrez votre commentaire!
    S'il vous plaît entrez votre nom ici


    Actualités

    L’acteur de Friends, Matthew Perry, décède à 54 ans

    "Matthew Perry, célèbre pour son rôle de Chandler Bing dans Friends, décède à 54 ans. Acteur très apprécié, sa mort suscite l'émotion mondiale."

    Entité sioniste déploie des navires de guerre en Mer Rouge selon un expert militaire

    Entité sioniste déploie des navires de guerre en Mer Rouge pour contrer les Houthis au Yémen, une manœuvre vue comme une démonstration de force envers l'Iran.

    L’affaire des SMS entre Pfizer et la Commission européenne : ce qu’il faut savoir

    En avril 2021, le New York Times a révélé...

    Banque suisse : Credit Suisse en chute libre après la faillite de la SVB

    L'action de Credit Suisse a dévissé de plus de...

    Le Retour de Microsoft avec Bing et Edge : Une Menace pour Google ?

    Depuis moins de trois mois, ChatGPT a déjà créé...

    Le Pentagone limoge le chef d’état-major de l’armée américaine

    Le Pentagone a limogé Randy George en pleine guerre contre l’Iran, sur fond de purge interne et de remaniement voulu par Pete Hegseth.

    États-Unis : détention du président d’une association islamique à Milwaukee

    Aux États-Unis, l’ICE a arrêté Salah Sarsour, président d’une association islamique de Milwaukee, sur fond d’accusations contestées.

    Golfe, Irak et Jordanie : interceptions et chute d’un drone

    Koweït, Bahreïn et Émirats interceptent des attaques, tandis qu’un drone s’écrase à la frontière irako-jordanienne.

    Washington informe Israël de l’échec des discussions avec l’Iran

    Washington a informé Israël de l’impasse des discussions avec l’Iran, alors que de nouvelles frappes et des pressions sur l’économie iranienne sont étudiées.

    Israël frappe 44 zones du sud du Liban, Hezbollah riposte

    Israël a frappé 44 zones du sud du Liban, causant 10 morts. Le Hezbollah a riposté avec 60 attaques contre des cibles israéliennes.

    Trump menace l’Iran : frappes massives annoncées dans 2-3 semaines

    Trump menace des frappes « très puissantes » contre l'Iran dans 2-3 semaines, visant à détruire ses capacités militaires et nucléaires. Pays concernés : USA, Iran.

    Abu Obeida salue les mobilisations syriennes pour al‑Aqsa et les détenus

    Abu Obeida salue les manifestations en Syrie en soutien à al‑Aqsa et aux prisonniers palestiniens. Pays concernés : Syrie, Palestine, Israël.

    Un juge suspend la construction du ballroom de 400 M$ de Trump

    Un juge fédéral bloque temporairement le projet de ballroom à 400 M$ de Donald Trump à la Maison-Blanche en attendant l'autorisation du Congrès.

    à Lire

    Categories