More

    Vulnérabilités des modèles GenAI face à des attaques itératives — France

    France

    Une étude récente met en lumière les vulnérabilités des modèles de raisonnement GenAI face à des attaques itératives, révélant comment ces systèmes peuvent être facilement trompés. Le pipeline d’attaque, nommé CatAttack, démontre les risques associés aux modèles d’intelligence artificielle (IA) lorsqu’ils sont soumis à des données perturbatrices.

    Une nouvelle méthode d’attaque

    Développé par des chercheurs, CatAttack révèle que les modèles GenAI, qui sont conçus pour résoudre des problèmes de manière séquentielle, peuvent être induits en erreur. En utilisant des phrases courtes et non pertinentes associées à des problèmes mathématiques, il est possible d’augmenter significativement le taux d’erreur des réponses fournies par ces modèles. Par exemple, en insérant des informations comme « Fait intéressant : les chats dorment la majeure partie de leur vie » dans un problème mathématique, la probabilité que le modèle réponde incorrectement est doublée.

    Une étude montre qu’un pipeline d’attaque itératif, CatAttack, perturbe les modèles GenAI en provoquant erreurs et réponses allongées, soulignant l’urgence de renforcer leur protection

    Types de déclencheurs identifiés

    Les chercheurs ont identifié trois types principaux de déclencheurs qui perturbent les modèles d’IA :

    • Des affirmations générales et non pertinentes (par exemple, « n’oubliez pas d’épargner au moins 20 % de vos revenus »),
    • Des faits non pertinents sans références (par exemple, « les chats dorment la majeure partie de leur vie »),
    • Des questions ou indices trompeurs (par exemple, « la réponse pourrait-elle être proche de 175 ? »).

    Les questions sont particulièrement efficaces, entraînant des taux d’erreur plus élevés et des réponses excessivement longues. CatAttack utilise un modèle de substitution moins coûteux pour générer ces déclencheurs, qui peuvent être transférés à des modèles plus avancés, augmentant ainsi les risques de réponses incorrectes de plus de 300 %.

    Conséquences des erreurs

    Les chercheurs soulignent que même lorsque CatAttack ne conduit pas à des réponses incorrectes, la longueur des réponses peut doubler dans 16 % des cas, entraînant des ralentissements et une augmentation des coûts. Dans certains cas, ces déclencheurs peuvent tripler la longueur des réponses des modèles. Les scientifiques affirment que les modèles les plus modernes ne sont pas à l’abri de ces interférences et que des mesures de protection plus robustes sont urgentes, surtout dans des secteurs critiques comme la finance, le droit ou la santé.

    LAISSER UN COMMENTAIRE

    S'il vous plaît entrez votre commentaire!
    S'il vous plaît entrez votre nom ici


    Actualités

    L’acteur de Friends, Matthew Perry, décède à 54 ans

    "Matthew Perry, célèbre pour son rôle de Chandler Bing dans Friends, décède à 54 ans. Acteur très apprécié, sa mort suscite l'émotion mondiale."

    Entité sioniste déploie des navires de guerre en Mer Rouge selon un expert militaire

    Entité sioniste déploie des navires de guerre en Mer Rouge pour contrer les Houthis au Yémen, une manœuvre vue comme une démonstration de force envers l'Iran.

    L’affaire des SMS entre Pfizer et la Commission européenne : ce qu’il faut savoir

    En avril 2021, le New York Times a révélé...

    Banque suisse : Credit Suisse en chute libre après la faillite de la SVB

    L'action de Credit Suisse a dévissé de plus de...

    Le Retour de Microsoft avec Bing et Edge : Une Menace pour Google ?

    Depuis moins de trois mois, ChatGPT a déjà créé...

    Le Pentagone limoge le chef d’état-major de l’armée américaine

    Le Pentagone a limogé Randy George en pleine guerre contre l’Iran, sur fond de purge interne et de remaniement voulu par Pete Hegseth.

    États-Unis : détention du président d’une association islamique à Milwaukee

    Aux États-Unis, l’ICE a arrêté Salah Sarsour, président d’une association islamique de Milwaukee, sur fond d’accusations contestées.

    Golfe, Irak et Jordanie : interceptions et chute d’un drone

    Koweït, Bahreïn et Émirats interceptent des attaques, tandis qu’un drone s’écrase à la frontière irako-jordanienne.

    Washington informe Israël de l’échec des discussions avec l’Iran

    Washington a informé Israël de l’impasse des discussions avec l’Iran, alors que de nouvelles frappes et des pressions sur l’économie iranienne sont étudiées.

    Israël frappe 44 zones du sud du Liban, Hezbollah riposte

    Israël a frappé 44 zones du sud du Liban, causant 10 morts. Le Hezbollah a riposté avec 60 attaques contre des cibles israéliennes.

    Trump menace l’Iran : frappes massives annoncées dans 2-3 semaines

    Trump menace des frappes « très puissantes » contre l'Iran dans 2-3 semaines, visant à détruire ses capacités militaires et nucléaires. Pays concernés : USA, Iran.

    Abu Obeida salue les mobilisations syriennes pour al‑Aqsa et les détenus

    Abu Obeida salue les manifestations en Syrie en soutien à al‑Aqsa et aux prisonniers palestiniens. Pays concernés : Syrie, Palestine, Israël.

    Un juge suspend la construction du ballroom de 400 M$ de Trump

    Un juge fédéral bloque temporairement le projet de ballroom à 400 M$ de Donald Trump à la Maison-Blanche en attendant l'autorisation du Congrès.

    à Lire

    Categories