欢迎来到浙江尊龙凯时人生就是博官方平台,z6com·尊龙凯时官方网站,Z6尊龙官网入口电力成套设备有限公司企业官网!
咨询热线:0577-62710822TEL:0577-62710822
1010717522@qq.com
编辑:小编│ 发表时间: 2024/11/21│ 浏览次数:
11月20日消息■★◆◆■★,最新的Qwen2■◆.5-Turbo已在阿里云百炼上线万个汉字◆■★■◆◆,在多个长文本评测集上的性能表现超越GPT-4。即日起,所有用户可在阿里云百炼调用Qwen2◆★.5-Turbo API★◆■★,百万tokens仅需0.3元★■■■★◆。
据介绍,阿里云百炼已上线Qwen■★◆◆、Llama★◆■■、Flux等超200款国内外主流开源和闭源大模型,用户可选择直接调用、训练微调或打造RAG应用。目前■★,一汽、金山、哈啰集团、国家天文台等超30万企业和机构在使用阿里云百炼。(完/供图)
该团队表示,长文本任务处理依然存在诸多挑战,未来将进一步探索长序列人类偏好对齐■■★■■■,优化推理效率以减少运算时间,并继续研发更大、更强的长文本模型。
Qwen2.5-Turbo可应用于长篇小说深入理解、仓库级别代码助手■★■■■、多篇论文阅读等场景◆★★◆★■,可一次性处理10本长篇小说,150小时的演讲稿,3万行代码◆■★■■◆。针对该模型,阿里云百炼免费为用户赠送1000万tokens额度。
在推理速度方面,通义千问团队利用稀疏注意力机制将注意力部分的计算量压缩了约12.5倍■◆★■◆,将处理1M tokens上下文时的首字返回时间从4★★■.9分钟降低到68秒◆◆★,实现了4.3倍的速度提升。