Anthropic Lance son Mode Vocal : La Nouvelle Ère des Assistants IA
Dans l’actualité d’aujourd’hui, nous explorons trois développements majeurs dans le monde de l’intelligence artificielle : Anthropic déploie son mode vocal tant attendu, Meta divise son équipe d’IA, et bien plus encore. Voici votre résumé quotidien des actualités IA, en environ 5 minutes.
Le Mode Vocal d’Anthropic Enfin Disponible
Commençons par une nouvelle fonctionnalité très attendue. Anthropic vient de lancer son mode vocal pour Claude. Cette fonctionnalité permet aux utilisateurs de parler directement à Claude et de recevoir des réponses audio. La voix de Claude est agréable à écouter – elle n’est pas trop robotique, mais n’essaie pas non plus d’imiter une voix humaine en ajoutant des tics vocaux artificiels. Si la voix britannique par défaut ne vous convient pas, cinq options vocales différentes sont disponibles.
Ce qui est particulièrement intéressant, c’est la façon dont Anthropic présente cette fonctionnalité. Leur vidéo de lancement démontre comment utiliser Claude comme un assistant vocal agentique. On y voit un utilisateur demander à Claude de vérifier son emploi du temps matinal en accédant à son calendrier, puis d’envoyer un email à un collègue pour préparer des documents pour la première réunion de la journée.
Bien sûr, il existe de nombreuses façons d’utiliser le mode vocal. Si vous êtes un utilisateur régulier de ChatGPT, vous en avez probablement déjà découvert plusieurs. Mais il est intéressant de constater qu’Anthropic présente cette fonctionnalité comme un pas de plus vers un assistant complet.
Il convient de noter que le mode vocal consomme une part importante des limites d’utilisation. Anthropic indique que les utilisateurs gratuits peuvent s’attendre à 20 à 30 conversations. De plus, les fonctionnalités d’utilisation d’outils comme l’accès au calendrier ou aux emails sont réservées aux abonnés payants. Au lancement, cette fonctionnalité n’est disponible que via l’application Claude, et non via l’interface web ou l’API.
Cela va-t-il inciter les utilisateurs à préférer Claude à d’autres options, ou s’agit-il simplement d’une fonctionnalité désormais standard ? Dans tous les cas, nous sommes heureux de voir cette fonctionnalité disponible et impatients de l’explorer davantage.
Meta Divise son Équipe d’IA en Deux
Pendant ce temps, chez Meta, l’entreprise divise sa division d’IA en deux dans l’espoir d’accélérer ses efforts dans la course à l’IA. Axios rapporte, sur la base d’une note interne envoyée hier, que la division GenAI sera désormais divisée en une équipe de produits IA et une unité de fondations d’AGI (Intelligence Artificielle Générale).
L’équipe des produits IA sera dirigée par Connor Hayes, actuellement vice-président de GenAI. Cette équipe aura la responsabilité de Meta AI, AI Studio, ainsi que de tous les outils intégrés aux applications. L’unité des fondations d’AGI sera co-dirigée par Ahmad Aldal et Amir Frankl, qui travailleront sur des efforts plus larges, notamment l’amélioration des modèles fondamentaux Llama.
Le laboratoire de recherche fondamentale en IA (FAIR) continuera d’être une division entièrement distincte, bien qu’une équipe travaillant sur le multimédia sera transférée à l’unité des fondations d’AGI.
La note de restructuration a été envoyée par Chris Cox, directeur des produits, qui joue un rôle de plus en plus important dans l’orientation de la stratégie d’IA de Meta. Axios rapporte qu’aucun dirigeant ne quitte l’entreprise dans le cadre de cette restructuration, et qu’aucun emploi n’est supprimé. Cependant, Meta déplace certains leaders clés d’autres parties de l’entreprise.
Business Insider a récemment rapporté que Meta avait connu une fuite de cerveaux vers des entreprises d’IA open source plus dynamiques comme Mistral. Axios écrit : « Meta espère que la division d’une grande organisation en équipes plus petites accélérera le développement des produits et donnera à l’entreprise plus de flexibilité alors qu’elle ajoute des leaders techniques supplémentaires. »
Une citation directe de la note de Cox indique : « Notre nouvelle structure vise à donner à chacun plus de responsabilités tout en rendant explicites les dépendances entre équipes. » Selon The Information, la restructuration signifiera que plus de deux douzaines de leaders auront la responsabilité de diverses parties de la stratégie d’IA de l’entreprise.
Depuis 6 mois, le récit dominant est celui d’une Meta en panique. Même avant cela, en 2023, nous avons vu une première réorganisation de l’IA chez Meta avec le projet Llama retiré du laboratoire FAIR et confié à l’équipe GenAI nouvellement formée.
Fait intéressant, cette nouvelle restructuration semble aller dans la direction complètement opposée de Google, qui a consolidé la plupart de ses équipes d’IA sous DeepMind à la fin de l’année dernière, garantissant que les équipes produits travaillent directement avec la division recherche. Le PDG Sundar Pichai a même souligné cette stratégie lors de la conférence Google I/O de la semaine dernière, le thème central étant de faire passer l’IA de la recherche à la réalité, selon leurs propres termes.
Néanmoins, je comprends pourquoi Meta prendrait cette décision. Lorsqu’on essaie d’avancer rapidement, la lourdeur organisationnelle peut être l’un des principaux obstacles. Ainsi, en ayant des équipes plus petites et plus agiles, ils pourront peut-être progresser plus rapidement.
En fin de compte, il est très difficile de savoir exactement ce qui se passe à l’intérieur des entreprises. Et ce qui est absolument vrai, c’est que lorsque les choses se corsent, tout ce qui importera sera l’efficacité de ces changements.
OpenAI Explore la Connexion via ChatGPT pour les Applications Tierces
Enfin, OpenAI explore des moyens permettant aux utilisateurs de se connecter à des applications tierces en utilisant leur compte ChatGPT. Hier, l’entreprise a publié une manifestation d’intérêt, recherchant des développeurs intéressés par l’intégration de ces fonctionnalités dans leurs propres applications.
Le formulaire envisage des partenariats avec des applications comptant aussi peu que mille utilisateurs, jusqu’à celles dont la base d’utilisateurs dépasse les 100 millions. OpenAI souhaitait également savoir comment les applications facturent leurs fonctionnalités d’IA et si elles utilisent les API d’OpenAI.
Plus tôt ce mois-ci, OpenAI a lancé une prévisualisation de cette fonctionnalité pour les développeurs via Codeex CLI. Ils ont offert des crédits API gratuits pour inciter les développeurs à connecter leurs comptes ChatGPT à leurs comptes API.
Cela pourrait être une simple tentative d’obtenir des données utilisateur plus précises, en éliminant les doublons, mais la plupart pensent qu’il s’agit de quelque chose de bien plus important.
Nick Dobos a posté : « C’est un plus gros événement que ce que les gens réalisent. Se connecter avec ChatGPT va bientôt être partout. » Jusqu’à présent, la connexion avec un compte existant a été principalement le domaine des géants de la technologie. Le marché consiste à offrir une gestion pratique des identifiants pour les développeurs d’applications en échange de données utilisateur de base.
Sam Altman s’intéresse certainement à cet angle. En fait, il parle de la connexion avec OpenAI comme fonctionnalité depuis au moins fin 2023. Son projet crypto Worldcoin concerne également l’identification unifiée basée sur la biométrie.
Mais cela pourrait aussi être un enjeu encore plus important. Jonas Templestein écrit : « Cela rappelle la plateforme Facebook originale ? Apportez votre token API, vos GPTs, vos souvenirs, vos outils, etc. » C’est certainement quelque chose à surveiller.
Voilà qui conclut notre résumé des actualités IA d’aujourd’hui.