Навіть школяр знає краще: штучний інтелект провалив просте завдання з годинником

Просте завдання, але серйозна проблема

Попри вражаючі можливості сучасних моделей штучного інтелекту – від написання текстів до створення зображень і програмного коду – вони все ще не здатні впоратися з тим, що для людини вважається елементарним: правильно визначити час за аналоговим годинником або зчитати дату з календаря. Про це повідомляє "Дивогляд" із посиланням на Live Science.

Команда дослідників з Единбурзького університету протестувала кілька сучасних багатомодальних мовних моделей (MLLM), які можуть аналізувати як візуальну, так і текстову інформацію. Зокрема, у тесті взяли участь такі системи: GPT-4o (OpenAI), Gemini 2.0 (Google), Claude-3.5 Sonnet (Anthropic) та LLaMA 3.2-Vision (Meta). Їм було запропоновано серію зображень із годинниками та календарями.

Результати здивували: більшість моделей не змогли коректно визначити час або день тижня у понад половині випадків.

"Більшість людей навчаються визначати час і користуватись календарями з раннього віку. Наші результати демонструють значну прогалину в здатностях ІІ до виконання цих базових навичок.

Ці обмеження варто подолати, якщо ми хочемо використовувати ІІ у системах, де важливий точний розрахунок часу – як-от автоматизація, планування чи асистивні технології", – зазначив автор дослідження Рохіт Саксена.

Робота була представлена на конференції ICLR 2025 та опублікована 18 березня на платформі arXiv як препринт, що ще очікує рецензування.

Раніше стало відомо, що Google за допомогою штучного інтелекту покращить в Android і Chrome інструменти для людей з вадами зору та слуху.

Поки на нашій землі війна, навіть "Дивогляд" – це не про котиків і пандочок, а про перемоги нашого війська! Наш Telegram – Дивогляд 5.UA.

Теги:

штучний інтелект (ШІ) нові технології науковці, вчені, дослідники

Навіть школяр знає краще: штучний інтелект провалив просте завдання з годинником

ПРОКОМЕНТУЙТЕ

МАТЕРІАЛИ ЗА ТЕМОЮ

Читайте більше