当前位置: 首页> 软件资讯 >智谱揭晓基础模型新纪元,《清言》App领跑国内市场:C端视频通话服务全面开放

智谱揭晓基础模型新纪元,《清言》App领跑国内市场:C端视频通话服务全面开放

时间:2024-10-06 23:47:56

编辑:波波资源网

阅读:1

近日消息,智谱AI在知识发现与数据挖掘领域的顶级会议KDD 2024上,骄傲地推出了他们的新一代基础模型,宣称该模型在相关领域已跻身国际顶尖水平。

智谱揭晓基础模型新纪元,《清言》App领跑国内市场:C端视频通话服务全面开放

更令人振奋的是,他们决定在MaaS平台上无偿开放GLM-4-Flash API的使用权,此举无疑将促进AI技术的普及与创新合作,为研究人员和开发者提供强大的工具支持,加速AI技术在各行各业的应用探索和实践。

语言模型 GLM-4-Plus:在语言理解、指令遵循、长文本处理等方面性能得到全面提升。

文生图模型 CogView-3-Plus:具备与当前最上面的 MJ-V6 和 FLUX 等模型接近的性能。

图像 / 视频理解模型 GLM-4V-Plus:具备卓越的图像理解能力,并具备基于时间采集的视频理解能力。该模型将上线开放平台(bigmodel.cn),并成为国内首个通用视频理解能力模型 API。

视频生成模型 CogVideoX:在发布并开源 2B 版本后,5B 版本也正式开源,其性能进一步增强。

GLM-4-Flash API:推理服务免费,并提供完全强大的服务。

除此之外,智谱还宣布在清言 App 上线了视频通话功能,这是国内首个面向 C 端用户开放的视频通话服务。

智谱表示,GLM-4-Plus 基础模型在各项指标上,实现与 GPT-4o 等第一梯队模型持平。此外,在 GLM-4-Plus 模型的训练过程中,智谱通过采用更精准的长短文本数据混合策略,显著增强了模型在长文本推理方面的表现。

对于 CogView-3-Plus,智谱采用 Transformer 架构替代了传统的 UNet 架构来训练扩散模型,并深入研究了扩散模型的噪声规划,其效果目前接近一线水平的 MJ-V6 和 FLUX 等模型。

目前 GLM-4-Plus 模型已正式上线开放平台(bigmodel.cn),对外提供 API 服务;同时也即将在清言 App 中上线;CogView-3-Plus 模型已经正式上线清言 App 供大家使用。

智谱AI宣布《清影》AI视频生成工具上线,现已集成至智谱清言PC与APP端

近日消息,智谱AI在OpenDay活动上揭晓了其最新研发的AI大模型——清影(Ying)。该模型独树一帜,能够迅速将任何文本内容转化为视频形式,展现出非凡的创造力。

智谱AI宣布《清影》AI视频生成工具上线,现已集成至智谱清言PC与APP端

用户仅需提供文本提示,并选定心仪风格,如卡通3D、黑白默片、油画质感或电影级视觉效果,清影便能在短短30秒内生成1440x960分辨率的高清视频。目前,该技术已集成至清言App,向公众全面开放使用,标志着AI内容生成技术的又一里程碑式进步。

除了文本生成视频,清影还支持图片生成视频,带来表情包梗图、广告制作、剧情创作、短视频创作等新玩法。同时,基于清影的“照片动起来”小程序也将上线,AI能让旧照片中的人物或场景动起来。

清影API也已上线大模型开放平台bigmodel.cn,企业和开发者可以通过调用API的方式使用文生视频和图生视频的模型能力。清影采用了新型DiT模型架构,更高效地压缩视频信息,并充分融合文本和视频内容,提升了复杂指令遵从能力、内容连贯性和画面调度。

智谱AI CEO张鹏在活动中提到,清影底座的视频生成模型是CogVideoX,它融合了文本、时间和空间三个维度,参考了Sora的算法设计。CogVideoX相比前代推理速度提升了6倍,未来将推出更高分辨率、更长时长的生成视频功能。

用户可以通过智谱清言PC/APP上的“清影智能体”直接体验清影,将脑中的灵感转化为艺术视频创作。

智谱《清言》APP宣布视频通话限时免费,全民畅聊无界限

近日消息,北京智谱华章科技有限公司最新宣布,其人工智能产品“清言”现已集成视频通话功能,并面向所有用户开放,特设限时免费试用期,让用户亲身体验AI技术带来的沟通便利。

智谱《清言》APP宣布视频通话限时免费,全民畅聊无界限

这一新功能的推出标志着“清言”AI产品在交互方式上的重大进步,用户不再局限于文字和语音交流,而是可以通过视频与AI进行更直观的互动。

“清言”AI产品通过视频通话功能,能够“看到”用户所在的环境,理解用户的表情和情绪,提供更加个性化和富有同理心的交流体验。

这一功能的推出,不仅提升了用户体验,也展示了智谱华章科技在人工智能领域的创新能力。

智谱AI宣布GLM-4-Long API正式上线,每千tokens输入输出成本低至0.001元

近日消息,智谱AI最新宣布,其支持超长上下文的LLM GLM-4-Long已在bigmodel.cn开放平台正式上线。这款模型专为驾驭超大规模文本而生,能够处理相当于两部《红楼梦》或多达125篇论文的信息量,无需分割处理。

智谱AI宣布GLM-4-Long API正式上线,每千tokens输入输出成本低至0.001元

它在长文档翻译、深度财务分析、关键信息萃取,以及构建拥有超长记忆对话能力的AI机器人等领域展现出巨大潜力,为处理复杂文本任务提供了强大工具。

GLM-4-Long在价格方面具有显著优势,输入、输出价格低至0.001元/千tokens,为企业和开发者提供了一个经济高效的解决方案。该模型在技术迭代中不断追求领先的上下文能力,从最初的2K上下文发展到目前的1M上下文长度,集成了大量长文本处理的研究成果。

在“大海捞针”评测实验中,GLM-4-Long展现了其无损信息处理的能力,证明了其在1M上下文长度中的卓越性能。此外,GLM-4-Long在财报读取、论文总结和小说阅读等方面的实际应用测试中也表现出色,能够准确摘取和分析关键信息。

GLM-4-Long的应用为企业带来了显著的优势,包括深入的对话理解、复杂文档处理、连贯性更强的内容生成以及更强的数据分析能力。这些能力在客户服务、法律、金融、科研、营销、广告和大数据分析等领域尤为重要。

本文导航
最新上架

联系方式:boosccom@163.com

版权所有2023 boosc.com AII版权所有备案号 渝ICP备20008086号-38 渝公网安备50010702506211号