欢迎来到浙江尊龙凯时人生就是博官方平台,z6com·尊龙凯时官方网站,Z6尊龙官网入口电力成套设备有限公司企业官网!

咨询热线:0577-62710822
资讯动态 INFOMATION DYNAMIC
联系我们 CONTACT

TEL:0577-62710822

1010717522@qq.com

行业动态 您当前的位置:首页 > 资讯动态 > 资讯动态

阿里云百炼上线-Turbo模型可支持100万超长上下文

编辑:小编│ 发表时间: 2024/11/21│ 浏览次数:

  

阿里云百炼上线-Turbo模型可支持100万超长上下文

  11月20日消息■★◆◆■★,最新的Qwen2■◆.5-Turbo已在阿里云百炼上线万个汉字◆■★■◆◆,在多个长文本评测集上的性能表现超越GPT-4。即日起,所有用户可在阿里云百炼调用Qwen2◆★.5-Turbo API★◆■★,百万tokens仅需0.3元★■■■★◆。

  据介绍,阿里云百炼已上线Qwen■★◆◆、Llama★◆■■、Flux等超200款国内外主流开源和闭源大模型,用户可选择直接调用、训练微调或打造RAG应用。目前■★,一汽、金山、哈啰集团、国家天文台等超30万企业和机构在使用阿里云百炼。(完/供图)

  该团队表示,长文本任务处理依然存在诸多挑战,未来将进一步探索长序列人类偏好对齐■■★■■■,优化推理效率以减少运算时间,并继续研发更大、更强的长文本模型。

  Qwen2.5-Turbo可应用于长篇小说深入理解、仓库级别代码助手■★■■■、多篇论文阅读等场景◆★★◆★■,可一次性处理10本长篇小说,150小时的演讲稿,3万行代码◆■★■■◆。针对该模型,阿里云百炼免费为用户赠送1000万tokens额度。

  在推理速度方面,通义千问团队利用稀疏注意力机制将注意力部分的计算量压缩了约12.5倍■◆★■◆,将处理1M tokens上下文时的首字返回时间从4★★■.9分钟降低到68秒◆◆★,实现了4.3倍的速度提升。

热销产品
  • BWX-Z低压柱上综合配电箱

    MORE >
  • DFW高压电缆分支箱(欧式)

    MORE >
  • GGJ低压无功补偿成套装置

    MORE >