Pour la plupart des tâches professionnelles, l’IA est suffisamment bonne pour réussir, mais pas assez pour impressionner, selon le MIT | Fortune

Pour la plupart des tâches professionnelles, l’IA est suffisamment bonne pour réussir, mais pas assez pour impressionner, selon le MIT | Fortune

La proportion croissante d’employés de bureau américains qui ont expérimenté l’intelligence artificielle dans leur travail quotidien ont probablement eu des moments de doute quant à leur stabilité professionnelle à long terme.

Mais malgré toutes les améliorations de l’IA ces dernières années, la technologie n’est encore capable d’atteindre que de faibles niveaux dans des tâches spécifiques sur le lieu de travail, selon des données récentes publiées par le MIT. Même dans ce cas, vous pourriez encore commettre de grosses erreurs.

Les travailleurs inquiets d’être bientôt remplacés par l’IA seront probablement rassurés par les nouvelles recherches du MIT, qui présentent le récit des reprises d’emplois induites par l’IA moins comme un film d’action au rythme rapide que comme une réflexion lente.

L’IA s’améliore progressivement dans l’exécution de diverses tâches dans diverses professions, selon une étude des résultats préliminaires publiée jeudi. Mais dans la plupart des cas, les performances des modèles actuellement disponibles sont similaires à celles d’un stagiaire désenchanté : répondant à des critères minimaux mais luttant généralement pour produire un travail de qualité sans qu’une main humaine n’affine son résultat.

Nettoyer le bar

Les chercheurs du MIT ont utilisé 41 LLM différents, y compris les versions de Claude, Gemini et ChatGPT, pour analyser les performances de plus de 11 000 tâches principalement basées sur du texte pour divers postes répertoriés par le ministère du Travail. Leurs résultats ont ensuite été évalués par des humains ayant une réelle expérience professionnelle dans ces domaines. L’objectif était de voir à quelle fréquence le remplacement d’un travailleur IA pouvait produire un résultat qu’un manager considérerait comme acceptable sans aucune modification humaine, puis d’évaluer sa qualité.

Les chercheurs ont découvert que l’IA est devenue plus fiable au fil des années pour de nombreux types de travail, mais qu’elle reste insuffisante lorsque les risques ou les normes sont élevés. L’étude du MIT a utilisé une échelle de notation de 1 à 9 pour évaluer les performances de l’IA, avec un 7 défini comme « minimalement suffisant », ce qui signifie que le travail est utile tel quel et ne nécessite aucune modification. Fin 2025, les modèles d’IA obtenaient un score de 7 sur environ 65 % des tâches.

Plus important encore, pour les entreprises qui envisagent de remplacer une partie de leur personnel par l’IA, les données du MIT suggèrent que l’IA a du mal à effectuer des tâches plus complexes. Quel que soit le temps dont dispose un modèle d’IA pour accomplir une tâche, la probabilité de réussite lorsqu’il est évalué avec un score de qualité de 9 ou « supérieur » n’a jamais dépassé 50 %. En d’autres termes, lorsqu’un travail nécessite plusieurs étapes, de la créativité ou de la précision, les remplacements par l’IA sont plus susceptibles d’échouer que de réussir.

La recherche s’aligne sur certains aspects du récit actuel de l’adoption de l’IA dans les entreprises américaines. Les entreprises qui utilisent l’IA sont plus susceptibles d’automatiser les tâches et les rôles de routine une fois qu’elles quittent l’entreprise pour des postes de premier échelon, tandis que certaines compétences hautement techniques, notamment numériques, ont en fait été associées à des primes salariales.

Cela se reflète dans les données du MIT, qui révèlent des taux de réussite moyens plus faibles pour les postes qualifiés dans les emplois juridiques et informatiques, tandis que les modèles d’IA trouvent généralement plus facile d’aborder les tâches textuelles associées aux métiers de la construction et de la maintenance.

Les entreprises qui ont expérimenté l’automatisation complète de certaines parties de leur charge de travail sont confrontées à des difficultés croissantes. L’année dernière, Deloitte a produit deux rapports pour des clients gouvernementaux en Australie et au Canada et tous deux se sont révélés truffés de mensonges. Il a été constaté que des médias tels que CNET et Sports Illustrated utilisent l’IA pour générer des histoires inexactes avec des signatures inventées. Les avocats se sont également appuyés sur l’IA pour préparer leurs dossiers, et un cabinet d’avocats s’est excusé publiquement l’année dernière après avoir découvert que de fausses assignations à comparaître générées par l’IA étaient apparues dans un dépôt de bilan dans l’une de ses affaires.

Des preuves anecdotiques et des données du MIT suggèrent que l’IA a encore besoin de la main humaine pour maximiser ses bénéfices, même si la technologie s’améliore rapidement. Les chercheurs du MIT ont estimé que le taux de réussite de l’IA dans les tâches analysées augmentait jusqu’à 11 points de pourcentage chaque année grâce à des modèles plus performants.

D’ici 2029, estiment les auteurs, la plupart des modèles d’IA seront capables d’effectuer entre 80 % et 95 % des tâches basées sur du texte avec un benchmark minimum suffisant.

On ne sait toujours pas si l’IA sera un jour capable d’évoluer vers des performances excellentes, voire parfaites.

“L’automatisation généralisée, en particulier dans les domaines à faible tolérance aux erreurs, est peut-être encore loin”, écrivent les chercheurs.

Website |  + posts
spot_imgspot_img

Articles connexes

spot_imgspot_img

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici