Llama 4: зустрічайте нову модель штучного інтелекту від Meta

7 Квітня 10:11

Компанія Meta Platforms представила найновіші версії своєї великої мовної моделі (LLM) – Llama 4 Scout та Llama 4 Maverick. Ці релізи є частиною стратегії технологічного гіганта щодо посилення своїх позицій на ринку штучного інтелекту, повідомляє «Комерсант Український» з посиланням на Reuters.

За інформацією від Meta, нові моделі належать до мультимодальних систем штучного інтелекту. Такі системи здатні обробляти та інтегрувати різноманітні типи даних, включаючи текст, відео, зображення та аудіо, а також конвертувати вміст між цими форматами.

У своїй офіційній заяві компанія охарактеризувала Llama 4 Scout та Llama 4 Maverick як “найдосконаліші моделі на сьогодні” та “найкращі у своєму класі за мультимодальністю”. Meta також підкреслила, що обидві моделі будуть випущені з відкритим вихідним кодом, що дозволить розробникам з усього світу використовувати та вдосконалювати їх.

Крім того, Meta анонсувала попередній огляд Llama 4 Behemoth, яку компанія називає “однією з найрозумніших LLM у світі та найпотужнішою на сьогодні”, що слугуватиме як “вчитель” для нових моделей компанії.

Випуск нових моделей відбувається на тлі агресивних інвестицій великих технологічних компаній у інфраструктуру штучного інтелекту після успіху ChatGPT від OpenAI, який суттєво змінив технологічний ландшафт та стимулював значні вкладення у машинне навчання.

За повідомленням видання The Information, опублікованим у п’ятницю, Meta раніше відклала запуск найновішої версії своєї LLM через те, що під час розробки Llama 4 не відповідала очікуванням компанії щодо технічних показників, особливо у завданнях з логічного мислення та математики. Також повідомлялося, що компанія була занепокоєна тим, що Llama 4 виявилася менш здатною, ніж моделі OpenAI, у проведенні голосових розмов, подібних до людських.

Meta планує витратити до 65 мільярдів доларів цього року на розширення своєї інфраструктури штучного інтелекту, що відбувається на тлі тиску з боку інвесторів на великі технологічні компанії щодо демонстрації прибутковості їхніх інвестицій.

Читайте нас у Telegram: головні новини коротко

Що таке LLM (Large Language Model)

LLM (Large Language Model) – це тип штучного інтелекту, який відноситься до великих мовних моделей, навчених на величезних обсягах текстових даних для розуміння, генерації та обробки людської мови. Ці моделі використовують архітектуру трансформерів та мільярди або навіть трильйони параметрів для аналізу контексту та генерації релевантних відповідей. Сучасні LLM, такі як GPT (від OpenAI), Llama (від Meta), Claude (від Anthropic) та інші, можуть писати тексти, відповідати на запитання, узагальнювати інформацію, перекладати між мовами та виконувати багато інших завдань, пов’язаних із обробкою природної мови.

Процес навчання LLM включає етап попереднього тренування (pre-training), під час якого модель опрацьовує величезні масиви текстів з інтернету, книг, статей та інших джерел, вивчаючи статистичні закономірності мови та накопичуючи знання про світ. Після цього багато моделей проходять етап налаштування (fine-tuning) з використанням методів навчання з підкріпленням за допомогою зворотного зв’язку від людини (RLHF), щоб зробити їх більш корисними, точними, безпечними та узгодженими з людськими цінностями та потребами.

З розвитком технологій, сучасні LLM еволюціонували від простих текстових моделей до мультимодальних систем, які можуть працювати не лише з текстом, але й із зображеннями, аудіо, відео та іншими типами даних. Це розширює їхні можливості та дозволяє використовувати їх для створення контенту, програмування, аналізу даних, автоматизації бізнес-процесів, освіти, розваг та багатьох інших галузей. Незважаючи на вражаючі можливості, LLM мають обмеження, зокрема можливість галюцинацій (видача неправдивої інформації), упередженість, залежність від якості навчальних даних та етичні виклики, пов’язані з їх використанням.

Читайте нас у Telegram: головні новини коротко

Остафійчук Ярослав

Редактор