当前位置: 首页> 科技资讯 >通义千问宣布Qwen2-VL视觉语言模型API开放:2B与7B参数版本就绪

通义千问宣布Qwen2-VL视觉语言模型API开放:2B与7B参数版本就绪

时间:2024-09-28 09:07:20

编辑:波波资源网

阅读:5

近日消息,通义千问宣布,其第二代视觉语言模型Qwen2-VL正式开源。为了方便开发者与企业用户快速应用,阿里云百炼平台同步上线了该模型的2B、7B两种规模及相应的量化版本API,用户可直接调用这些API,无缝融入自身业务,加速视觉理解与语言技术的融合创新。

通义千问宣布Qwen2-VL视觉语言模型API开放:2B与7B参数版本就绪

Qwen2-VL模型在多个方面实现了性能的全面提升。它能够理解不同分辨率和不同长宽比的图片,在DocVQA、RealWorldQA、MTVQA等基准测试中创下全球领先的表现。此外,该模型还能理解20分钟以上的长视频,支持基于视频的问答、对话和内容创作等应用。Qwen2-VL还具备强大的视觉智能体能力,能够自主操作手机和机器人,进行复杂推理和决策。

该模型能够理解图像视频中的多语言文本,包括中文、英文、大多数欧洲语言、日语、韩语、阿拉伯语、越南语等。通义千问团队从六个方面评估了模型的能力,包括综合的大学题目、数学能力、文档表格多语言文字图像的理解、通用场景问答、视频理解、Agent能力。

Qwen2-VL-72B作为旗舰模型,在大部分指标上都达到了最优。Qwen2-VL-7B以其经济型参数规模实现了极具竞争力的性能表现,而Qwen2-VL-2B则支持移动端的丰富应用,具备完整的图像视频多语言理解能力。

在模型架构方面,Qwen2-VL延续了ViT加Qwen2的串联结构,三个尺寸的模型都采用了600M规模大小的ViT,支持图像和视频统一输入。为了提升模型对视觉信息的感知和视频理解能力,团队在架构上进行了升级,包括实现对原生动态分辨率的全面支持和使用多模态旋转位置嵌入(M-ROPE)方法。

阿里云百炼平台提供了Qwen2-VL-72B的API,用户可以直接调用。同时,Qwen2-VL-2B和Qwen2-VL-7B的开源代码已集成到Hugging Face Transformers、vLLM和其他第三方框架中,开发者可以通过这些平台下载和使用模型。

阿里通义千问公布Qwen2.5模型开源版:Qwen2-VL-72B比肩GPT-4技术前沿

近日消息,通义千问团队在Qwen2成功发布仅三个月后,再度发力,正式揭开Qwen系列新秀——Qwen2.5系列语言模型的开源序幕。

阿里通义千问公布Qwen2.5模型开源版:Qwen2-VL-72B比肩GPT-4技术前沿

此次开源行动被誉为历史上规模最大之列,不仅涵盖了全能型通用语言模型Qwen2.5,还囊括了专为编程及数学领域定制的Qwen2.5-Coder与Qwen2.5-Math模型,此举无疑将进一步推动AI技术的边界与应用深度。

Qwen2.5系列模型在最新的大规模数据集上进行了预训练,数据集包含高达18T tokens,相较于Qwen2,新模型在知识获取、编程能力和数学能力方面均有显著提升。模型支持长文本处理,能够生成最多8K tokens的内容,并保持了对29种以上语言的支持。

Qwen2.5系列模型的开源,不仅采用了Apache2.0许可证,还提供了多种不同规模的版本,以适应不同的应用需求。此外,通义千问团队还开源了性能媲美GPT-4的Qwen2-VL-72B模型。

新模型在指令执行、长文本生成、结构化数据理解以及生成结构化输出方面取得了显著改进。特别是在编程和数学领域,Qwen2.5-Coder和Qwen2.5-Math模型在专业数据集上进行了训练,展现了更强的专业领域能力。

盛势翻天!阿里云强势发布大模型通义千问,瞄准AI领域的新阶段!

进日消息,阿里云官方宣布将在4月11日召开的2023阿里云峰会上,带来“通义千问”相关的重磅消息。

根据官方公布的预热海报显示," 通义千问 " 大模型与其他工具的组合将会使得这一大模型具备更进一步的应用价值。

阿里云大模型通义千问将于4月11日发布

据悉,通义千问是阿里达摩院自主研发的预训练语言大模型,它能够回答问题、创作文字,也能够表达观点、撰写代码。

在此之前,该模型主要邀请企业用户进行体验测试,用户可以通过官方网站(tongyi.aliyun.com)申请参与体验。符合条件的用户将有机会试用该模型。

据了解,阿里达摩院早在多年前就开始布局 NLP 自然语言处理等前沿科研领域,并于2019年启动了大模型研发。2021年,阿里相继发布了国内首个超过百亿参数的多模态大模型 M6和被称为「中文版 GPT-3」的语言大模型 PLUG。随后,此前还训练了全球首个拥有10万亿参数的 AI 模型。

《通义千问》内测资格怎么申请

通义千问是一种基于自然语言处理技术的大规模智能问答引,目前已经开启内测,那么内测资格在哪里申请呢?下面一起来看看吧!

《通义千问》内测资格怎么申请

申请网址

tongyi.aliyun.com

通义千问内测资格获取方法

申请需要填写手机号、企业邮箱、企业名称、用途等信息。

获得到邀请码的话就可以填写在官网地址下面的,然后就可以正常使用了。

从发布的文字来看,阿里云大模型名称为“通义千问”

2023阿里云峰会将于4月11日在北京召开,阿里巴巴董事局主席兼CEO张勇、阿里云智能首席技术官周靖人等都将出席主论坛。业内有消息称,阿里云或将在11日的年度阿里云峰会上推出大模型产品。

阿里云今日宣布,大模型通义千问开始邀请测试,这是继百度文心一言之后,国内又一家开始测试的AI大模型。

阿里云方面认为,大模型是“大算力+强算法”相结合的产物,是人工智能的发展趋势和未来。

本文导航
最新上架

联系方式:boosccom@163.com

版权所有2023 boosc.com AII版权所有备案号 渝ICP备20008086号-38 渝公网安备50010702506211号