成功案例
倾情推荐
- 英文国际域名 100/年
- 中国国家顶级域名 100/年
- 纯HTML 100 MB 200/年
- 标准安居 W2K 600/年
- 商务型主机 1500/年
- 豪华型主机 1800/年
- 普及型[建站套餐] 3000元
- 豪华型[建站套餐] 8000元
- 小型邮局A 200/年
- 标准邮局A 680/年
- 新浪快速登录 500/年
- 基本维护 800/年
- 专业维护 3000/年
合作伙伴
- 中国搜索
- 中国万网
- 商务中国
- 中国频道
- 商务中国
- 搜 狐 网
- 新 浪 网
- 网 易
- 中国互联网络信息中心
客户专区
帮助中心
您当前的位置:首页 >> 详细内容
阿里云开源通义千问14B模型,部分指标甚至接近Llama2-70B
作者:huoshu 发布:2023年9月28日 浏览次数: 2072
阿里云近日宣布,开源了通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,这些模型是免费且可商用的。
据了解,Qwen-14B在多个权威评测中表现超越了同等规模的模型,部分指标甚至接近Llama2-70B。阿里云此前已经开源了70亿参数模型Qwen-7B等模型,这些模型受到了开源社区的热烈欢
迎,一个多月的时间内下载量就突破了100万。
Qwen-14B是一款支持多种语言的高性能开源模型。与同类模型相比,它使用了更多的高质量数据,整体训练数据超过3万亿Token,这使得模型具备了更强大的推理、认知、规划和记忆能力。另外,Qwen-14B的最大支持上下文窗口长度为8k。
Qwen-14B-Chat是在基座模型上经过精细的对话模型训练得到的。借助于基座模型的强大性能,Qwen-14B-Chat在生成内容方面的准确度得到了大幅提升,也更加符合人类的偏好。此外,在内容创作方面的想象力和丰富度也有显著扩展。
Qwen拥有出色的工具调用能力,这使得开发者可以更快地构建基于Qwen的Agent(智能体)。开发者可以用简单的指令教会Qwen使用复杂的工具,例如使用CodeInterpreter工具执行Python代码以进行复杂的数学计算、数据分析、图表绘制等。此外,Qwen还能开发出具有多文档问答、长文写作等能力的“高级数字助理”。
目前,用户可以直接从魔搭社区下载这些模型,也可以通过阿里云灵积平台访问和调用Qwen-14B和Qwen-14B-Chat。阿里云为用户提供包括模型训练、推理、部署、精调等在内的全方位服务。
此次开源将会显著降低中小企业开发细分领域行业模型的门槛,这也标志着阿里云大模型开源生态的初具雏形。