ШІ як «ненадійний ньюзмейкер»: дослідження показало масові помилки у новинних відповідях AI-асистентів

27 Жовтня 14:56

Штучний інтелект, який дедалі частіше використовується як джерело новин, досі не може забезпечити точність і достовірність. До такого висновку дійшли дослідники Європейського мовного союзу (EBU) після масштабного тестування найпопуляніших AI-асистентів, передає «Комерсант Український».

Результати, які були опубліковані на сайті EBU, свідчать, що 45% новинних відповідей штучного інтелекту містили серйозні помилки, а ще 81% — дрібні неточності.

Що відомо

EBU залучив 22 суспільні мовники з 18 країн. Вони проаналізували понад 3 000 відповідей, згенерованих системами ChatGPT (OpenAI), Copilot (Microsoft), Gemini (Google) та Perplexity різними мовами.

Оцінювали чотири критерії:

  • точність фактів,
  • достовірність джерел,
  • відокремлення фактів від суджень,
  • контекст і актуальність даних.

Які найпоширеніші помилки

Найпоширеніші проблеми стосувалися джерел: у 31% випадків дані були відсутні або неправильно приписані.

На другому місці — помилки точності (30%), коли асистенти видавали застарілу або вигадану інформацію.

Наприклад, ChatGPT у тестовому сценарії заявив, що Папа Франциск досі чинний понтифік, хоча за умовою дослідження він уже помер і його замінив Папа Лев XIV.

Copilot натомість послався на новину BBC 2006 року, відповідаючи на запит про сучасні дослідження пташиного грипу.

Gemini — найбільше помилок, Perplexity — найкращий результат

Серед чотирьох систем найгірше себе показала Gemini, у якої помилки виявили у 76% відповідей — удвічі більше, ніж у конкурентів.

Для порівняння:

  • Copilot — 37%,
  • ChatGPT — 36%,
  • Perplexity — 30%.

Асистенти найчастіше помилялися у темах, що швидко змінюються або потребують складного контексту — наприклад, у питаннях про торговельну політику Дональда Трампа чи геополітичні події.

Читайте нас в Telegram: важливі теми – без цензури

Популярність ШІ у новинах зростає

Попри високий рівень помилок, штучний інтелект продовжує ставати джерелом інформації для дедалі більшої кількості людей.

Згідно з даними Reuters Institute та Університету Оксфорда, кількість користувачів, які отримують новини через ШІ, подвоїлася за рік — найбільше зростання зафіксовано в Аргентині, США та серед молоді 18–24 років.

Що це означає для медіа

Дослідники EBU застерігають: довіра до помилкових відповідей AI може підірвати роль журналістики.

«Асистенти штучного інтелекту досі не є надійним способом отримання новин», — зазначили в EBU.

Експерти додають, що хоча моделі демонструють певне покращення у порівнянні з попередніми тестами BBC, рівень точності залишається неприйнятним для журналістських стандартів.

Європейський мовний союз (EBU) — найбільша у світі асоціація суспільних мовників, до якої входять, зокрема, BBC, ARD, France Télévisions, RAI, Суспільне Україна та інші.

Організація регулярно проводить моніторинг використання нових технологій у журналістиці, включно зі штучним інтелектом, блокчейном і алгоритмами рекомендацій.

Дивіться нас у YouTube: важливі теми – без цензури

Марина Максенко
Редактор

Читають зараз