Все більше людей використовують штучний інтелект для підвищення продуктивності на роботі та в навчанні
Такі результати представила компанія Humaine, яка проаналізувала реальні діалоги майже 25 тисяч учасників зі США та Великої Британії. Фінальний рейтинг здивував багатьох: популярний ChatGPT-4.1 опинився лише на восьмій позиції, пише "Дивогляд".
Перше місце отримав Google Gemini 2.5 Pro – модель, яку користувачі відзначили за природний стиль спілкування та вміння плавно вести розмову. На другій сходинці опинився китайський DeepSeek v3, який особливо сподобався людям старшого віку. Третє місце посіла французька модель Magistral Medium від компанії Mistral: хоч вона і не стала абсолютним лідером, але виявилася дуже сильною у "людяності" спілкування.
У першій п’ятірці також опинилися дві моделі xAI – Grok 4 та Grok 3. Після оновлення Grok 4 значно покращив баланс між сміливими відповідями та етичністю, а його попередник у деяких категоріях навіть перевершив "молодшу" версію.
Google домінує і в нижній частині рейтингу: Gemini 2.5 Flash, Gemma і Gemini 2.0 Flash зайняли шосту, дев’яту та десяту позиції відповідно. DeepSeek R1 закріпився на сьомому місці.
Цікаво, що Humaine оцінює моделі не за технічними тестами, а через реальні діалоги у форматі "лоб в лоб": користувач спілкується одразу з двома анонімними моделями і обирає, яка йому сподобалася більше. У підсумку з’ясовується, що для більшості людей важливі не лише складні обчислення, а й зручність, інтонація, адаптивність та відчуття "розмови з живою людиною".
У дослідженні окремо враховували чотири параметри: логіку міркувань, уміння переходити між темами, стиль і подачу відповідей, а також рівень довіри та етичності. Саме за останніми показниками ChatGPT і поступився конкурентам.
Раніше "Дивогляд" розповідав про 5 запитів, які ніколи не варто писати в ChatGPT.
Чудернацькі історії з України, котики, скандали світових зірок, гумор і трохи дикого трешу з московських боліт – читайте першими в Telegram Дивогляд 5.UA.