Встречайте Qwen 3: новая модель ИИ, которая обещает думать глубже и действовать быстрее
29 апреля 2025 11:37
Китайская технологическая компания Alibaba 29 апреля представила новую линейку языковых моделей Qwen3. По словам разработчиков, новое поколение искусственного интеллекта от Qwen значительно улучшено по сравнению с предыдущими версиями, сообщает «Коммерсант Украинский».
Что особенного в Qwen3
Флагманская модель Qwen3-235B-A22B имеет впечатляющие 235 миллиардов параметров, из которых активно используется 22 миллиарда. Она, по замыслу, должна успешно конкурировать с такими гигантами индустрии, как DeepSeek-R1, o1, o3-mini, Grok-3 и Gemini-2.5-Pro. Даже маленькая модель Qwen3-4B демонстрирует результаты на уровне предыдущего поколения Qwen2.5-72B-Instruct, что демонстрирует эффективность новых подходов в разработке.
Два режима мышления
Самой интересной особенностью новой линейки является внедрение гибридных режимов мышления:
- Режим мышления (Thinking Mode) — модель детально обдумывает задачу шаг за шагом перед выдачей ответа, что идеально подходит для сложных проблем.
- Режим быстрого отве та (Non-Thinking Mode) — обеспечивает практически мгновенные ответы для более простых вопросов.
Пользователи могут переключаться между этими режимами с помощью команд /think и /no_think, контролируя баланс между скоростью и глубиной мышления модели.
Многоязычие в новом масштабе
Qwen3 поддерживает 119 языков и диалектов, включая языки индоевропейской, сино-тибетской, афро-азиатской и многих других языковых семей. Это делает модель доступной для пользователей из разных уголков мира и открывает новые возможности для международного применения.
На украинском ИИ также говорит.
Читайте нас у Telegram: головні новини коротко
Серия моделей для разных потребностей
Разработчики выпустили целую линейку моделей разного размера:
- Две MoE-модели: Qwen3-235B-A22B (самая мощная) и Qwen3-30B-A3B.
- Шесть плотных моделей: от Qwen3-32B до Qwen3-0.6B.
Все модели доступны с открытыми весами под лицензией Apache 2.0, что позволяет использовать их как для исследований, так и для коммерческих проектов.
Улучшенная разработка и обучение
Процесс создания Qwen3 включал обучение на 36 триллионах токенов — почти вдвое больше, чем в предыдущем поколении. Обучение проходило в три этапа с постепенным усложнением данных и увеличением контекстного окна до 128 тысяч токенов.
Мощные агентские возможности
Особое внимание разработчики уделили интеграции с инструментами и агентскими функциями. Модель отлично работает с фреймворком Qwen-Agent, что упрощает создание ИИ-ассистентов, способных взаимодействовать с различными сервисами и выполнять сложные задачи.
Будущие перспективы
Команда Qwen рассматривает выпуск Qwen3 как важный шаг на пути к созданию искусственного общего интеллекта (AGI) и сверхразумного ИИ (ASI). В будущем они планируют совершенствовать архитектуру моделей, увеличивать объемы данных и размеры моделей, расширять контекстное окно и развивать обучение с подкреплением.
Qwen3 уже доступна для использования через Qwen Chat Web(chat.qwen.ai) и мобильное приложение, а также на платформах Hugging Face, ModelScope и Kaggle.
Эта новая серия моделей пополняет экосистему инструментов для работы с естественным языком и предоставляет разработчикам дополнительные возможности для создания различных приложений.
Читайте нас у Telegram: головні новини коротко