Встречайте Qwen 3: новая модель ИИ, которая обещает думать глубже и действовать быстрее

29 апреля 2025 11:37

Китайская технологическая компания Alibaba 29 апреля представила новую линейку языковых моделей Qwen3. По словам разработчиков, новое поколение искусственного интеллекта от Qwen значительно улучшено по сравнению с предыдущими версиями, сообщает «Коммерсант Украинский».

Что особенного в Qwen3

Флагманская модель Qwen3-235B-A22B имеет впечатляющие 235 миллиардов параметров, из которых активно используется 22 миллиарда. Она, по замыслу, должна успешно конкурировать с такими гигантами индустрии, как DeepSeek-R1, o1, o3-mini, Grok-3 и Gemini-2.5-Pro. Даже маленькая модель Qwen3-4B демонстрирует результаты на уровне предыдущего поколения Qwen2.5-72B-Instruct, что демонстрирует эффективность новых подходов в разработке.

Два режима мышления

Самой интересной особенностью новой линейки является внедрение гибридных режимов мышления:

  1. Режим мышления (Thinking Mode) — модель детально обдумывает задачу шаг за шагом перед выдачей ответа, что идеально подходит для сложных проблем.
  2. Режим быстрого отве та (Non-Thinking Mode) — обеспечивает практически мгновенные ответы для более простых вопросов.

Пользователи могут переключаться между этими режимами с помощью команд /think и /no_think, контролируя баланс между скоростью и глубиной мышления модели.

Многоязычие в новом масштабе

Qwen3 поддерживает 119 языков и диалектов, включая языки индоевропейской, сино-тибетской, афро-азиатской и многих других языковых семей. Это делает модель доступной для пользователей из разных уголков мира и открывает новые возможности для международного применения.

На украинском ИИ также говорит.

Читайте нас у Telegram: головні новини коротко

Серия моделей для разных потребностей

Разработчики выпустили целую линейку моделей разного размера:

  • Две MoE-модели: Qwen3-235B-A22B (самая мощная) и Qwen3-30B-A3B.
  • Шесть плотных моделей: от Qwen3-32B до Qwen3-0.6B.

Все модели доступны с открытыми весами под лицензией Apache 2.0, что позволяет использовать их как для исследований, так и для коммерческих проектов.

Улучшенная разработка и обучение

Процесс создания Qwen3 включал обучение на 36 триллионах токенов — почти вдвое больше, чем в предыдущем поколении. Обучение проходило в три этапа с постепенным усложнением данных и увеличением контекстного окна до 128 тысяч токенов.

Мощные агентские возможности

Особое внимание разработчики уделили интеграции с инструментами и агентскими функциями. Модель отлично работает с фреймворком Qwen-Agent, что упрощает создание ИИ-ассистентов, способных взаимодействовать с различными сервисами и выполнять сложные задачи.

Будущие перспективы

Команда Qwen рассматривает выпуск Qwen3 как важный шаг на пути к созданию искусственного общего интеллекта (AGI) и сверхразумного ИИ (ASI). В будущем они планируют совершенствовать архитектуру моделей, увеличивать объемы данных и размеры моделей, расширять контекстное окно и развивать обучение с подкреплением.

Qwen3 уже доступна для использования через Qwen Chat Web(chat.qwen.ai) и мобильное приложение, а также на платформах Hugging Face, ModelScope и Kaggle.

Эта новая серия моделей пополняет экосистему инструментов для работы с естественным языком и предоставляет разработчикам дополнительные возможности для создания различных приложений.

Читайте нас у Telegram: головні новини коротко

Дзвенислава Карплюк
Редактор

Сейчас читают