Publié le 20 mai 2025
Vidéo explicative | Web | Extensions | État de Chrome | Intent |
---|---|---|---|---|
GitHub | Afficher | Intent to Experiment |
Avec l'API Prompt, vous pouvez envoyer des requêtes en langage naturel à Gemini Nano dans le navigateur.
L'API Prompt est disponible pour les extensions Chrome. Les développeurs Web peuvent utiliser l'API exploratoire dans Chrome Canary en participant au programme Preview anticipé. Cette API sera bientôt disponible en phase d'évaluation (Origin Trial).
Vous pouvez utiliser l'API Prompt de nombreuses façons. Dans une application Web ou un site Web, vous pouvez créer:
- Recherche optimisée par l'IA: répondez à des questions en fonction du contenu d'une page Web.
- Flux d'actualités personnalisés: créez un flux qui classe dynamiquement les articles en catégories et permet aux utilisateurs de filtrer ces contenus.
Dans les extensions Chrome, vous pouvez créer:
- Événements d'agenda Développez une extension Chrome qui extrait automatiquement les détails des événements à partir de pages Web afin que les utilisateurs puissent créer des entrées d'agenda en quelques étapes.
- Extraction de contacts. Créez une extension qui extrait les coordonnées des sites Web, ce qui permet aux utilisateurs de contacter plus facilement une entreprise ou d'ajouter des informations à leur liste de contacts.
Ce ne sont là que quelques possibilités, mais nous avons hâte de découvrir vos créations.
Utiliser l'API Prompt
Deux fonctions principales sont disponibles dans l'espace de noms LanguageModel
:
availability()
pour vérifier les fonctionnalités du modèle et s'il est disponible.create()
pour démarrer une session de modèle de langage.
Téléchargement du modèle
L'API Prompt utilise le modèle Gemini Nano dans Chrome. Bien que l'API soit intégrée à Chrome, le modèle est téléchargé séparément la première fois qu'une extension utilise l'API.
Pour déterminer si le modèle est prêt à l'emploi, appelez la fonction LanguageModel.availability()
asynchrone. Cette opération devrait renvoyer l'une des réponses suivantes:
"unavailable"
signifie que le navigateur n'est pas compatible avec les options demandées ou qu'il n'est pas du tout compatible avec l'invite d'un modèle de langage."downloadable"
signifie que le navigateur est compatible avec les options demandées, mais qu'il doit télécharger quelque chose (par exemple, le modèle de langage lui-même ou un réglage fin) avant de pouvoir créer une session à l'aide de ces options."downloading"
signifie que le navigateur est compatible avec les options demandées, mais qu'il doit terminer une opération de téléchargement en cours avant de pouvoir créer une session à l'aide de ces options."available"
signifie que le navigateur est compatible avec les options demandées sans nécessiter de nouveaux téléchargements.
Si la réponse à availability()
est 'downloadable'
, écoutez la progression du téléchargement et informez l'utilisateur, au cas où le téléchargement prendrait du temps.
const session = await LanguageModel.create({
monitor(m) {
m.addEventListener("downloadprogress", (e) => {
console.log(`Downloaded ${e.loaded} of ${e.total} bytes.`);
});
},
});
Fonctionnalités multimodales
L'API Prompt est compatible avec les entrées audio et image de Chrome 138 Canary, pour les tests locaux. L'API renvoie une sortie textuelle.
Ces fonctionnalités vous permettent d'effectuer les opérations suivantes:
- Autorisez les utilisateurs à transcrire les messages audio envoyés dans une application de chat.
- Décrivez une image importée sur votre site Web pour l'utiliser dans une légende ou un texte alternatif.
Vos commentaires nous aident à déterminer l'avenir de cette API et les améliorations à apporter à Gemini Nano. Nous pouvons même créer des API de tâches dédiées (telles que des API de transcription audio ou de description d'images) pour répondre à vos besoins et à ceux de vos utilisateurs.
Participer et envoyer des commentaires
Vos commentaires peuvent avoir un impact direct sur la façon dont nous créons et implémentons les futures versions de cette API et de toutes les API d'IA intégrées.
- Rejoignez le programme Preview anticipé.
- Pour envoyer des commentaires sur l'implémentation de Chrome, envoyez un rapport de bug ou une demande de fonctionnalité.
- Partagez vos commentaires sur la forme de l'API en commentant un problème existant ou en en créant un dans le dépôt GitHub de l'API Prompt.
- Participez à l'élaboration des normes en rejoignant le groupe de la communauté Web Incubator.