成功案例

     倾情推荐

     合作伙伴

     客户专区

     帮助中心

您当前的位置:首页 >> 详细内容
阿里云开源通义千问14B模型,部分指标甚至接近Llama2-70B
作者:huoshu 发布:2023年9月28日 浏览次数: 2072

 


  阿里云近日宣布,开源了通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,这些模型是免费且可商用的。

  据了解,Qwen-14B在多个权威评测中表现超越了同等规模的模型,部分指标甚至接近Llama2-70B。阿里云此前已经开源了70亿参数模型Qwen-7B等模型,这些模型受到了开源社区的热烈欢

迎,一个多月的时间内下载量就突破了100万。

  Qwen-14B是一款支持多种语言的高性能开源模型。与同类模型相比,它使用了更多的高质量数据,整体训练数据超过3万亿Token,这使得模型具备了更强大的推理、认知、规划和记忆能力。另外,Qwen-14B的最大支持上下文窗口长度为8k。

  Qwen-14B-Chat是在基座模型上经过精细的对话模型训练得到的。借助于基座模型的强大性能,Qwen-14B-Chat在生成内容方面的准确度得到了大幅提升,也更加符合人类的偏好。此外,在内容创作方面的想象力和丰富度也有显著扩展。

  Qwen拥有出色的工具调用能力,这使得开发者可以更快地构建基于Qwen的Agent(智能体)。开发者可以用简单的指令教会Qwen使用复杂的工具,例如使用CodeInterpreter工具执行Python代码以进行复杂的数学计算、数据分析、图表绘制等。此外,Qwen还能开发出具有多文档问答、长文写作等能力的“高级数字助理”。

  目前,用户可以直接从魔搭社区下载这些模型,也可以通过阿里云灵积平台访问和调用Qwen-14B和Qwen-14B-Chat。阿里云为用户提供包括模型训练、推理、部署、精调等在内的全方位服务。

  此次开源将会显著降低中小企业开发细分领域行业模型的门槛,这也标志着阿里云大模型开源生态的初具雏形。

关闭本页