Deepmind réinvente le curseur avec l'IA Gemini
Deepmind travaille sur un curseur IA transformant les pixels en entités structurées (lieux, dates, objets). Cette innovation, intégrée à Gemini dans Chrome, permettra des interactions simplifiées via des commandes vocales et gestuelles. Le 'Magic Pointer' sera bientôt lancé sur Googlebook.
« "Because a typical AI tool lives in its own window, users need to drag their world into it. We want the opposite," write Deepmind researchers Adrien Baranes and Rob Marchant. » — The Decoder
Que faut-il retenir ?
- Deepmind développe un curseur IA Gemini pour capturer le contexte visuel et sémantique autour du pointeur.
- Les utilisateurs pourront utiliser des commandes simplifiées comme 'Corrige ça' ou 'Déplace ici' combinées à la voix et aux gestes.
- Les pixels deviennent des 'entités structurées' comme des lieux, dates ou objets, transformant une note manuscrite en liste de tâches interactive.
- La fonctionnalité 'Magic Pointer' sera bientôt lancée sur Googlebook et est déjà intégrée à Gemini dans Chrome.
Pourquoi cette nouvelle compte-t-elle ?
Cette innovation réduit la complexité des interactions avec l'IA en permettant des commandes naturelles et contextuelles. Les professionnels gagneront en efficacité pour des tâches quotidiennes, sans avoir à maîtriser l'ingénierie des prompts. L'intégration dans Chrome et Googlebook en fera une fonctionnalité largement accessible.
null
💬 Adrien Baranes et Rob Marchant, Chercheurs chez Deepmind
Public concerné : développeurs, entreprises
Comment le curseur IA de Deepmind simplifie-t-il les interactions ?
Le curseur Gemini capture le contexte visuel et sémantique, permettant des commandes vocales et gestuelles naturelles comme 'Corrige ça'. Il transforme les pixels en entités structurées pour des interactions plus intuitives.
Commentaires (0)
💡 Aucun lien externe ni code HTML accepté. Soyez respectueux. Les commentaires sont modérés avant publication.
Aucun commentaire pour le moment. Soyez le premier !