ШІ як «ненадійний ньюзмейкер»: дослідження показало масові помилки у новинних відповідях AI-асистентів
27 Жовтня 14:56
Штучний інтелект, який дедалі частіше використовується як джерело новин, досі не може забезпечити точність і достовірність. До такого висновку дійшли дослідники Європейського мовного союзу (EBU) після масштабного тестування найпопуляніших AI-асистентів, передає «Комерсант Український».
Результати, які були опубліковані на сайті EBU, свідчать, що 45% новинних відповідей штучного інтелекту містили серйозні помилки, а ще 81% — дрібні неточності.
Що відомо
EBU залучив 22 суспільні мовники з 18 країн. Вони проаналізували понад 3 000 відповідей, згенерованих системами ChatGPT (OpenAI), Copilot (Microsoft), Gemini (Google) та Perplexity різними мовами.
Оцінювали чотири критерії:
- точність фактів,
- достовірність джерел,
- відокремлення фактів від суджень,
- контекст і актуальність даних.
Які найпоширеніші помилки
Найпоширеніші проблеми стосувалися джерел: у 31% випадків дані були відсутні або неправильно приписані.
На другому місці — помилки точності (30%), коли асистенти видавали застарілу або вигадану інформацію.
Наприклад, ChatGPT у тестовому сценарії заявив, що Папа Франциск досі чинний понтифік, хоча за умовою дослідження він уже помер і його замінив Папа Лев XIV.
Copilot натомість послався на новину BBC 2006 року, відповідаючи на запит про сучасні дослідження пташиного грипу.
Gemini — найбільше помилок, Perplexity — найкращий результат
Серед чотирьох систем найгірше себе показала Gemini, у якої помилки виявили у 76% відповідей — удвічі більше, ніж у конкурентів.
Для порівняння:
- Copilot — 37%,
- ChatGPT — 36%,
- Perplexity — 30%.
Асистенти найчастіше помилялися у темах, що швидко змінюються або потребують складного контексту — наприклад, у питаннях про торговельну політику Дональда Трампа чи геополітичні події.
Читайте нас в Telegram: важливі теми – без цензури
Популярність ШІ у новинах зростає
Попри високий рівень помилок, штучний інтелект продовжує ставати джерелом інформації для дедалі більшої кількості людей.
Згідно з даними Reuters Institute та Університету Оксфорда, кількість користувачів, які отримують новини через ШІ, подвоїлася за рік — найбільше зростання зафіксовано в Аргентині, США та серед молоді 18–24 років.
Що це означає для медіа
Дослідники EBU застерігають: довіра до помилкових відповідей AI може підірвати роль журналістики.
«Асистенти штучного інтелекту досі не є надійним способом отримання новин», — зазначили в EBU.
Експерти додають, що хоча моделі демонструють певне покращення у порівнянні з попередніми тестами BBC, рівень точності залишається неприйнятним для журналістських стандартів.
Європейський мовний союз (EBU) — найбільша у світі асоціація суспільних мовників, до якої входять, зокрема, BBC, ARD, France Télévisions, RAI, Суспільне Україна та інші.
Організація регулярно проводить моніторинг використання нових технологій у журналістиці, включно зі штучним інтелектом, блокчейном і алгоритмами рекомендацій.
Дивіться нас у YouTube: важливі теми – без цензури