Google réalise une avancée majeure dans la compréhension des contextes longs avec Gemini 1.5

2024/02/16

Google a annoncé la sortie de Gemini 1.5 Pro pour des tests préliminaires via AI Studio. L’un des principaux objectifs de cette nouvelle mise à jour du modèle est sa capacité à comprendre le contenu à contexte long prenant en charge une fenêtre contextuelle de 128 000 jetons dans un premier temps, mais l’ambition de l’étendre jusqu’à 1 million de jetons.

Selon un document technique publié par Google, Gemini 1.5 Pro est plus performant que 1.0 Pro et 1.0 Ultra. Par rapport à Ultra, 1.5 Pro a un taux de victoire de capacités de base de 54,8 %, un taux de victoire de texte de 77 %, un taux de victoire de vision de 46 % et un taux de victoire audio de 20 %. Il fonctionne bien mieux que la version 1.0 Pro, avec respectivement 87,1 %, 100 %, 77 % et 60 %.

Certains des points forts de ce modèle comprennent :

Raisonner sur de grandes quantités d’informations

Gemini 1.5 Pro peut analyser et résumer les transcriptions de 402 pages de la mission Apollo 11 sur la lune.

Meilleure compréhension des modalités

Gemini 1.5 Pro peut effectuer des tâches de raisonnement très sophistiquées pour différentes modalités, comme un film muet de Buster Keaton.

Résolution de problèmes avec des blocs de code plus longs

Gemini 1.5 Pro peut raisonner sur 100 000 lignes de code offrant des solutions, modifications et explications utiles.

Sundar Pichai, PDG de Google, a déclaré ceci à propos de la nouvelle version de Gemini :

« Nos équipes continuent de repousser les limites de nos derniers modèles en mettant la sécurité au cœur. Ils font des progrès rapides. En fait, nous sommes prêts à introduire la prochaine génération : Gemini 1.5. Il présente des améliorations spectaculaires dans un certain nombre de dimensions et la version 1.5 Pro atteint une qualité comparable à celle de la version 1.0 Ultra, tout en utilisant moins de calcul.

Cette nouvelle génération constitue également une avancée majeure dans la compréhension des contextes longs. Nous avons pu augmenter considérablement la quantité d’informations que nos modèles peuvent traiter, en exécutant jusqu’à 1 million de jetons de manière cohérente, obtenant ainsi la plus longue fenêtre contextuelle de tous les modèles de fondation à grande échelle à ce jour.

Si vous souhaitez bénéficier d’un accès anticipé à Gemini Pro 1.5, remplissez ce formulaire Google AI Studio . Google n’a pas donné de calendrier pour la publication de cette mise à jour à tous les utilisateurs, mais ce sera le cas dès qu’il aura terminé ses tests.

Source : Google

Laisser un commentaire Annuler la réponse