Все больше людей используют искусственный интеллект для повышения производительности на работе и в учебе
Такие результаты представила компания Humaine, проанализировавшая реальные диалоги почти 25 тысяч участников из США и Великобритании. Финальный рейтинг удивил многих: популярный ChatGPT-4.1 оказался лишь на восьмой позиции, пишет "Дивогляд".
Первое место получил Google Gemini 2.5 Pro – модель, которую пользователи отметили за естественный стиль общения и умение плавно вести разговор. На второй строчке оказался китайский DeepSeek v3, который особенно понравился людям старшего возраста. Третье место заняла французская модель Magistral Medium от компании Mistral: хотя она и не стала абсолютным лидером, но оказалась очень сильной в "человечности" общения.
В первой пятёрке также оказались две модели xAI – Grok 4 и Grok 3. После обновления Grok 4 значительно улучшил баланс между смелыми ответами и этичностью, а его предшественник в некоторых категориях даже превзошёл "младшую" версию.
Google доминирует и в нижней части рейтинга: Gemini 2.5 Flash, Gemma и Gemini 2.0 Flash заняли шестую, девятую и десятую позиции соответственно. DeepSeek R1 закрепился на седьмом месте.
Интересно, что Humaine оценивает модели не по техническим тестам, а через реальные диалоги в формате "лоб в лоб": пользователь общается сразу с двумя анонимными моделями и выбирает, какая ему понравилась больше. В итоге выясняется, что для большинства людей важны не только сложные вычисления, но и удобство, интонация, адаптивность и ощущение "разговора с живым человеком".
В исследовании отдельно учитывали четыре параметра: логику рассуждений, умение переходить между темами, стиль и подачу ответов, а также уровень доверия и этичности. Именно по последним показателям ChatGPT и уступил конкурентам.
Ранее "Дивогляд" рассказывал о 5 запросах, которые никогда не стоит писать в ChatGPT.
Причудливые истории из Украины, котики, скандалы мировых звёзд, юмор и немного дикого трэша с московских болот – читайте первыми в Telegram Дивогляд 5.UA.