More

    R et Python : Améliorer l’ingénierie des prompts avec Perplexity

    France

    Dans cet article, nous explorons comment combiner R et Python pour optimiser l’ingénierie des prompts à l’aide de l’API Perplexity. L’objectif est de corriger les performances insatisfaisantes d’une étude de cas antérieure en améliorant la façon dont nous formulons les requêtes.

    Contexte

    L’exemple motivant ici utilise à nouveau des modèles de langage de grande taille (LLMs) pour m’aider à calculer certaines caractéristiques pour mon modèle des Oscars. Plus précisément : combien de films le réalisateur d’un film nommé dans la catégorie Meilleur Film a-t-il réalisé avant le film en question ?

    Erreurs précédentes

    Dans mon article précédent, j’ai constaté des performances assez médiocres. Une partie de cela est due au système des studios à Hollywood : les réalisateurs des films d’avant 1970 avaient des films à leur actif en raison de ce système, ainsi que des courts-métrages et des documentaires. Cela souligne l’importance de l’expertise dans le domaine des sciences des données.

    Changement 1

    Cette fois, j’ai décidé de ne considérer que les films nominés après 1969, ce qui reflète un changement qualitatif dans la manière dont les données sont générées.

    Changement 2

    J’utilisais GPT-3.5 Turbo à l’intérieur d’un agent LangChain équipé de l’API Wikipédia. J’ai réalisé que je devais changer d’approche car je ne pouvais pas accéder à toutes les informations nécessaires dans les résultats fournis.

    Changement 3

    J’ai donc remplacé LangChain par Perplexity AI, qui utilise un moteur de recherche conversationnel pour fournir des informations en temps réel.

    Changement 4

    Enfin, j’ai retravaillé mon prompt afin d’améliorer la clarté des instructions données au modèle.

    Approche actuelle

    Actuellement, j’utilise l’API Perplexity avec un prompt réécrit. J’emploie le module OpenAI en Python pour accéder à Perplexity, qui utilise le modèle llama-3.1-sonar-large-128k-online.

    from openai import OpenAI
    API_KEY=""
    model="llama-3.1-sonar-large-128k-online"
    client = OpenAI(api_key=API_KEY, base_url="https://api.perplexity.ai")
    
    def get_films(director):
        messages = [
            { "role": "system", "content": """Vous êtes un assistant de recherche détaillé, aidant l'utilisateur à trouver les noms de films."""},
            { "role": "user", "content": director }
        ]
        response = client.chat.completions.create(model=model, messages=messages, temperature=0)
        return response.choices[0].message.content
    

    Diviser le travail en R

    Récupérer les données

    J’ai configuré {reticulate} en utilisant un environnement virtuel lié à mon Google Drive. Je récupère une liste de réalisateurs qui ont dirigé un film nommé aux Oscars après 1969.

    library(googlesheets4)
    library(tidyverse)
    library(reticulate)
    use_virtualenv("../../../../")
    source_python("ppxai.py")
    gs4_auth()
    

    Performance et résultats

    Nous avons considérablement amélioré nos performances de recherche d’informations en utilisant Perplexity AI :

    • La corrélation entre l’estimation et la réalité est passée de 0,82 à 0,99.
    • L’erreur absolue moyenne (MAE) est passée de 2,01 films à 0,50 films.
    • Le taux de réponses correctes a augmenté de 42% à 70%.

    Visualisation des résultats

    Les graphiques ci-dessous montrent la relation entre les données vérifiées et les estimations fournies par Perplexity :

    Graphique de performance
    Graphique de performance

    Importance de l’ingénierie des prompts

    Cet exercice montre l’importance de l’ingénierie des prompts et comment une meilleure compréhension de l’architecture d’un LLM peut mener à de meilleures requêtes. En décomposant les tâches en parties plus petites et en ne s’appuyant sur le LLM que lorsque cela est nécessaire, on optimise la recherche d’informations.

    R Python Perplexity | R | Python | Api | Perplexity | Ingénierie Des Prompts | France

    LAISSER UN COMMENTAIRE

    S'il vous plaît entrez votre commentaire!
    S'il vous plaît entrez votre nom ici


    Actualités

    L’acteur de Friends, Matthew Perry, décède à 54 ans

    "Matthew Perry, célèbre pour son rôle de Chandler Bing dans Friends, décède à 54 ans. Acteur très apprécié, sa mort suscite l'émotion mondiale."

    Entité sioniste déploie des navires de guerre en Mer Rouge selon un expert militaire

    Entité sioniste déploie des navires de guerre en Mer Rouge pour contrer les Houthis au Yémen, une manœuvre vue comme une démonstration de force envers l'Iran.

    L’affaire des SMS entre Pfizer et la Commission européenne : ce qu’il faut savoir

    En avril 2021, le New York Times a révélé...

    Banque suisse : Credit Suisse en chute libre après la faillite de la SVB

    L'action de Credit Suisse a dévissé de plus de...

    Le Retour de Microsoft avec Bing et Edge : Une Menace pour Google ?

    Depuis moins de trois mois, ChatGPT a déjà créé...

    Bangladesh bat le Pakistan et remporte une série Test historique

    Bangladesh bat le Pakistan de 78 runs à Sylhet et remporte une série Test historique à domicile grâce à Taijul Islam.

    Xi Jinping et Vladimir Poutine discutent à Beijing

    Xi Jinping et Vladimir Poutine tiennent des discussions à Beijing sur la Chine, la Russie, l’Ukraine et le Moyen-Orient.

    L’ONU révise à la baisse la croissance mondiale face à la crise au Moyen-Orient

    L’ONU abaisse ses prévisions de croissance mondiale à 2,5 % en 2026, citant la crise au Moyen-Orient et la hausse des prix de l’énergie.

    Xi Jinping reçoit Vladimir Poutine à Pékin: ce que révèle ce sommet sur l’axe Chine-Russie

    Le sommet de Pékin entre Xi Jinping et Vladimir Poutine confirme la solidité d’un partenariat central pour l’Ukraine, l’énergie et l’équilibre géopolitique mondial.

    Kentucky : Thomas Massie battu en primaire, Donald Trump impose son candidat

    Thomas Massie, élu républicain du Kentucky, a perdu sa primaire face à Ed Gallrein, candidat soutenu par Donald Trump, dans une course très coûteuse et symbolique.

    Hantavirus : pourquoi les autorités ne parlent pas d’un « nouveau Covid » et quels symptômes doivent vraiment alerter

    Le risque pour le grand public reste faible, mais le hantavirus peut être grave après exposition réelle. Voici ce que disent l’OMS et le CDC sur les symptômes, la transmission et la prévention.

    Le Sénat américain freine Trump sur la guerre contre l’Iran

    Le Sénat américain avance une résolution pour limiter les pouvoirs de guerre de Trump contre l’Iran, dans un rare revers présidentiel.

    Édouard Philippe visé par une information judiciaire: ce que change vraiment l’enquête ouverte au Havre

    L’ouverture d’une information judiciaire visant Édouard Philippe place désormais le dossier havrais sous l’autorité d’un juge d’instruction.

    à Lire

    Categories