
Awaneesh Verma dirige Google Meet, Google Voice et d’autres produits de communication en temps réel chez Alphabet, supervisant un vaste réseau qui atteint environ 3 milliards d’utilisateurs et 11 millions d’entreprises dans le monde.
Cependant, sa volonté d’éliminer les frictions dans la communication et de garantir que les gens « se comprennent vraiment » est enracinée dans un parcours personnel remontant à avant son passage chez Uber et Duolingo, lorsqu’il a appris comment les barrières peuvent empêcher les gens de communiquer.
Né au Royaume-Uni de parents émigrés d’Inde, Verma a passé son enfance dans la ville de Sheffield, dans les Midlands de l’Angleterre. Dans une récente interview accordée à Fortune, il a rappelé que pendant longtemps, il avait été « le seul enfant indien de ma classe ».
Bien que sa ville natale soit « un endroit formidable », il ne pouvait s’empêcher de se demander « comment on se sentait et à quoi ressemblait le reste du monde ». Il a rappelé à quel point il était fasciné par un atlas physique avant Google Maps. “J’aime simplement regarder des cartes et dessiner des lieux en fonction de celles-ci.”
Des années plus tard, alors que Verma étudiait l’ingénierie à l’université Carnegie Mellon de Pittsburgh, il entendit le chef de l’ingénierie de Google, Alan Eustace, parler des projets en cours, notamment de Google Translate. “Je me suis dit : “Wow, c’est l’avenir de la connexion des gens”.” Quelques années plus tard, Verma travaillait chez Google Translate, dans le cadre d’un parcours qui l’a conduit à Duolingo en tant que premier chef de produit, avant un arrêt chez Uber, également en tant que chef de projet, et un retour chez Google.
Verma a déclaré à Fortune qu’il aimait son travail parce qu’il avait toujours aimé l’idée de quelque chose en rapport avec le voyage, et a déclaré qu’il voulait animer une émission de voyage quand il était enfant.
“J’ai vraiment aimé l’attrait de rencontrer des gens de cultures différentes et de vraiment se comprendre”, a-t-il déclaré, ajoutant qu’il avait eu la chance de faire un travail qui lui permettait de faire de même.
Bêta-test en conduisant la machine
En tant que responsable de Google Meet, Verma a déclaré à Fortune qu’il testait toujours en version bêta son produit, dont dépendent des milliards d’utilisateurs pour leur activité. (Bien que plus spécifiquement, il a déclaré qu’il testait toujours le produit en interne, depuis les premières preuves de concept de recherche jusqu’aux prototypes et à la version bêta de l’utilisateur final.) Il a déclaré que la beauté de Google Meet est qu’il fait partie de Google Workspace, ce qui signifie que toutes les notes que vous prenez font partie de votre Google Drive.
Verma a déclaré qu’il utilisait Take Notes avec Gemini dans «presque toutes mes réunions». D’un simple clic, cet outil crée instantanément un document Google en direct avec des notes de réunion, qui deviennent la « décision enregistrée » de l’équipe, transformant les discussions en quelque chose de « durable et collant ».
Il a noté que cette fiabilité avait facilité la collaboration distribuée, rappelant une époque où un tiers de son équipe à Stockholm se sentait en sécurité pour éviter une réunion gênante, un grand changement par rapport à il y a seulement quelques années. L’équipe essayait d’obtenir les commentaires de certains dirigeants de la Bay Area, mais le moment n’était pas opportun. Cependant, ils étaient convaincus que la réunion aurait lieu sans eux. “Nous sommes convaincus que cela représentera bien notre point de vue et nous lirons les notes et la transcription plus tard.”
Le patron de Google Meet a également déclaré qu’il faisait souvent un compte rendu des projets et demandait aux membres de l’équipe ce qui s’était bien passé et ce qui aurait pu être différent. Une fois que tout cela est écrit sur un tableau blanc, vous les comparez à ce que le preneur de notes Gemini AI a pensé de la réunion. “En cas de doute, vous pouvez revenir en arrière et lire la transcription”, a-t-il déclaré, notant que Gemini inclut des guillemets, donc dès qu’il y a un doute, “il y a un simple clic sur cette partie de la transcription où vous pouvez lire ce qui s’y est passé”.
L’objectif est d’utiliser l’IA pour faciliter la haute fidélité des conversations humaines, y compris le ton et les émotions, permettant ainsi aux équipes d’atteindre des résolutions plus rapidement qu’une communication asynchrone. Verma l’a illustré en racontant une discussion de 60 minutes avec un collègue ingénieur. En utilisant Ask Gemini pour résumer, ils ont immédiatement produit une spécification de produit en 15 puces.
Traduction en temps réel
Les innovations de Verma et de son équipe prennent vie lorsque Fortune s’entretient avec Niklas Blum, un germanophone natif qui travaille dans le bureau Google de Stockholm susmentionné. Il présente le traducteur vocal en temps réel de Google, un produit très différent de Google Translate.
“Tu ne m’entends pas, Nick ? Je te parle allemand maintenant”, a déclaré Blum, alors que ce journaliste pouvait l’entendre parler en arrière-plan dans quelque chose qui sonnait germanique, tandis que, quelques secondes plus tard, sa voix sortait des haut-parleurs en anglais, un peu étrangement.
Blum a expliqué que la technologie de l’intelligence artificielle a progressé au point de cloner votre voix en temps réel pour donner l’impression que vous parlez anglais.
Il a ajouté que l’équipe de Verma travaillait en étroite collaboration avec DeepMind de Google sur les différentes technologies, avec plusieurs couches d’IA à l’œuvre : la traduction et la génération de la voix traduite. Dans une certaine mesure, a-t-il déclaré, le délai dépend beaucoup de la langue traduite, car l’IA doit prendre en compte la grammaire et la complexité de la langue utilisée. L’allemand place généralement le verbe vers la fin de la phrase, par exemple, il y a donc un délai pendant que l’IA s’assure qu’il a le sens correct.
Cet outil de traduction en temps réel a été créé sur une période d’environ deux ans, a déclaré Blum, ajoutant qu’il avait commencé comme une exploration sans date limite. Mais plus ils communiquaient avec des entreprises mondiales qui exercent leurs activités au-delà des barrières linguistiques, plus ils percevaient un besoin sur le marché.
Il a déclaré qu’il était « vraiment difficile » d’avoir des conversations d’équipe dans différentes langues tout en s’assurant que tout le monde recevait toutes les bonnes informations. “Nous voulons que Google Meet ne soit pas seulement un outil pour connecter les gens, mais (quelque chose) qui crée de la valeur dans la conversation”, a-t-il ajouté.
“La beauté de la technologie ne réside pas seulement dans le fait que vous pouvez l’automatiser et la rendre plus facile”, a déclaré Verma, mais aussi dans le fait qu’on peut être sûr “qu’elle représente de manière vraiment neutre tout ce qui a été dit”.
Bien sûr, il y a un impératif derrière cela, qui, d’une certaine manière, apporte une solution à l’assaut post-pandémique des réunions interminables qui définissent la plupart des journées de travail.
Verma note qu’ils sont souvent inefficaces et laissent les participants incertains de ce qui a été décidé et de ce qui va suivre. Il a déclaré qu’il ressentait un réel besoin de remédier à la « fatigue des réunions » qui survient parce que les réunions ne se déroulent tout simplement pas bien.
Verma dit que chaque amélioration est filtrée par la question : « comment aurions-nous pu les aider à faire mieux ?



