Поддержать команду Зеркала
Беларусы на войне
  1. «Будут задержки зарплаты». «Киберпартизаны» рассказали «Зеркалу» о последствиях атаки на «Химволокно»
  2. «Все трактуют как доход». Налоговая рассылает «письма счастья» — требует отчитаться, откуда пришли деньги: к кому возникают такие вопросы
  3. Поляков спросили, какая соседняя страна вызывает у них наибольшую симпатию. Вот что они думают о Беларуси
  4. Лукашенко снова высказался о «вероломном нападении» на Иран. Но главным виновником назвал не США
  5. Беларусам стали чаще отказывать в повторном ВНЖ в Польше, если они допустили одну ошибку с первым
  6. По всей Беларуси водители не могут зарядить электромобили на станциях Malanka. Что произошло
  7. Невестка Лукашенко занялась новым бизнесом — подробности
  8. Эксперты говорят, что командование армии РФ продолжает действовать в «параллельной реальности» — о чем речь
  9. Рублю прогнозировали непростое начало 2026 года. Тем временем в обменниках сложилась весьма нетипичная ситуация
  10. Трамп рассказал, на каком месте война в Украине в его «списке приоритетов»
  11. Глава МВД назвал категорию беларусов, которыми «легко манипулировать»
  12. Функционера БРСМ судили за измену государству и дали 17 лет — «Наша Ніва»
  13. Рейс из Омана, который не долетел до аэропорта назначения, возвращается в Минск — «Белавиа»
  14. Узнали, чем в Минске владеет Григорий Азаренок. Если думаете, что у него замок, — мы вас разочаруем
  15. Беларуске дали срок за посылки политзаключенным, которые она покупала за свои деньги. Где в ее действиях нашли экстремизм
  16. Кто такие аятоллы? Объясняем, почему они главные в Иране и кто может быть следующим


/

Исследователи из Университета Карнеги-Меллон провели эксперимент, в котором создали виртуальную IT-компанию с сотрудниками-роботами. Даже лучший ИИ-работник смог выполнить только четверть поставленных задач, а остальные показали еще более плачевные результаты, пишет издание Futurism.

Изображение: Pexels
Робот. Снимок носит иллюстративный характер. Фото: Pexels.com

Исследователи создали виртуальную компанию под названием TheAgentCompany, где все позиции — от финансовых аналитиков и программистов до проектных менеджеров — занимали не люди, а ИИ-агенты от Google, OpenAI, Anthropic и Meta. Агент — это модель искусственного интеллекта, которая должна самостоятельно выполнять поставленные задачи, подобно человеку.

Виртуальным сотрудникам поручили обычные офисные задания: работать с файлами, совершать виртуальные экскурсии по новым офисным помещениям и писать отзывы на работу коллег.

Результаты оказались катастрофическими. Лучшей моделью стала Claude 3.5 Sonnet от компании Anthropic, но даже она смогла выполнить лишь 24% поставленных задач. При этом ее работа была крайне неэффективной — в среднем на каждую задачу уходило около 30 шагов и более шести долларов.

Gemini 2.0 Flash от Google тратил на каждую задачу около 40 шагов, но успешно завершал только 11,4% заданий. Худшим «сотрудником» оказался Nova Pro v1 от Amazon, который справился лишь с 1,7% поручений.

Исследователи отметили, что цифровым работникам не хватает здравого смысла, социальных навыков и понимания того, как работать в интернете. ИИ-сотрудники часто придумывали нелепые решения проблем — например, когда один робот не смог найти нужного человека в корпоративном чате, он просто переименовал другого пользователя.

Хотя современные ИИ-модели могут неплохо справляться с некоторыми простыми задачами, итоги этого и других исследований показывают, что они пока не готовы к более сложной работе, с которой легко справляются люди. Во многом это связано с тем, что нынешний «искусственный интеллект» — это, по сути, продвинутая версия предиктивного ввода текста в вашем телефоне, а не разумное существо, способное решать проблемы, учиться на опыте и применять его в новых ситуациях, отмечают авторы.