Alibaba Cloud, известная китайская технологическая компания, в среду представила свою новейшую визуально-языковую модель Qwen2. 5-VL. Этот новый выпуск представляет собой значительный шаг вперед по сравнению с предшественником, моделью Qwen2-VL.
Open-source многомодальная модель доступна в нескольких конфигурациях с размерами параметров в 3 миллиарда, 7 миллиардов и 72 миллиарда. Кроме того, она включает в себя как базовые версии, так и версии, настроенные на выполнение инструкций.
Согласно заявлению облачного подразделения Alibaba, опубликованному на официальном аккаунте WeChat, "Qwen 2. 5-Max превосходит почти все показатели по сравнению с GPT-4o, DeepSeek-V3 и Llama-3. 1-405B," ссылаясь на наиболее сложные open-source модели ИИ от OpenAI и Meta.
Премиальная модель, Qwen2. 5-VL-72B-Instruct, теперь доступна через платформу Qwen Chat. Между тем, вся серия Qwen2. 5-VL доступна на Hugging Face и в open-source сообществе Alibaba, Model Scope.
Alibaba утверждает, что модель Qwen2. 5-VL демонстрирует исключительные многомодальные возможности, превосходя в продвинутом визуальном анализе текстов, диаграмм, схем и графиков на изображениях. Более того, она способна интерпретировать видео продолжительностью более часа, отвечать на вопросы, связанные с видео, и точно идентифицировать конкретные фрагменты до секунды.
. news.instaforex.com2025-1-30 01:49