推理速度最高提升6.5倍,中国电信翼支付Talon获国际人工智能研究院顶会认可
创始人
2025-11-11 03:42:52
0

当前,大语言模型(LLMs)在智能客服、代码生成、内容创作等场景中正发挥着越来越重要的作用,但受限于推理速度瓶颈,多数模型在部署和运行过程中的计算资源消耗仍存在较大优化空间,难以控制推理成本,也因响应延迟而影响用户体验,限制了在实时场景下的应用。据统计,截止到2025年上半年全国公有云厂商大模型调用日均输出约2.96万亿tokens,成本高达405亿元。与此同时,大模型深度思考大幅提升了推理结果的可靠性,然而更长时间的响应延迟也带来了AI产品使用体验不足的问题。

11月9日,中国电信翼支付Talon架构技术论文被国际人工智能顶会AAAI(人工智能促进协会会议)2026接收,标志着其创新性再次获得了国际学术界的权威认可。

中国电信翼支付一直致力于攻关大模型推理加速关键核心技术,2024年中国电信翼支付自研Falcon架构技术论文被国际人工智能顶会AAAI 2025接收。2025年,中国电信翼支付推出第二代推理加速架构——Talon,该架构严格保持生成质量无损的基础上,实现最高6.52倍的加速,在精度无损条件下最高可将推理成本降至原来的1/6,性能相较于大模型行业领先水平提升了50%+, 也超越了当前国际同类型方法。

AAAI创办于1979年,是国际人工智能顶级学术会议,并收录于CCF-A类会议目录中,每年吸引全球大量知名企业、科研院校等顶尖AI团队参与,至今已举办40届。AAAI 2026将于2026年1月在新加坡举行,本次会议共收到近31000篇投稿,其中有效投稿共计23,680 篇,创历年新高,然而录用率仅为17.6%,为近三年最低,且热门领域第一阶段拒稿率高达67%,反映出空前的竞争压力。

破解效率难题,实现推理速度最高6.5倍

传统的投机解码虽然一定程度上提升了推理速度,但存在同步瓶颈与Draft token的低接受率挑战。Talon从推理范式上进行了重构,通过设计异步并行执行范式,将草稿生成与验证解耦为可同时进行的独立任务,从根本上消除了资源等待。同时,Talon引入了自适应混合草稿策略,融合模型驱动与检索驱动的方法,同时提高模型在通用和专业领域的draft token接受率,大幅提升了大模型推理速度。

得益于扎实的技术组合优势,Talon在涵盖多轮对话、代码生成、数学推理等领域的多个维度权威基准测试中得到严格验证,相比传统自回归解码实现了4.04倍至6.52倍的加速效果,尤其在知识密集型以及确定性解码场景下,Talon在各类模型、任务配置中均表现出色。

学术行业双认可,夯实技术领先地位

中国电信翼支付始终坚持在新一代人工智能技术的研发投入,收获深厚的技术积淀。此前,中国电信翼支付已在NeurIPS、AAAI、WWW等国际顶级人工智能会议发表多篇学术论文,参与多项国家行业标准,并累计申请百余项专利,也为此荣获“中央企业人工智能高价值场景”“华彩杯”算力大赛奖项等行业重要荣誉。此次Talon被国际人工智能顶会AAAI 2026接收,是中国电信翼支付创新研发能力的又一次有力证明。

理论实践并重,助力企业用户降本增效

性能突破的价值最终体现在业务成效上。目前,Talon技术已集成至中国电信一站式Mass平台InsightAI,服务中国电信翼支付“数字人客服”“翼小橙”“翼点通”“翼小财”等多个核心业务,不仅为用户带来了流畅、迅捷的交互体验,更在保证生成内容精准无误的前提下,将大模型推理成本降至原先的1/6,降本增效效果显著,将数智化技术高效性直接转化为了可观的运营效益,为大规模、高并发下的AI应用铺平了道路。

未来,中国电信翼支付将继续深化Talon等自主核心技术的迭代与应用,并将其通过InsightAI平台向更广泛的行业伙伴开放,以创新技术赋能至千行百业,助力企业实现大模型高效、可靠、低成本的规模化部署,推动人工智能技术的务实发展与产业升级。

相关内容

与违法发放贷款等原因,安徽...
据国家金融监督管理总局官网11月10日信息,国家金融监督管理总局巢...
2025-11-11 03:42:54
河源落地首笔“脱核链贷”供...
近期,人民银行河源市分行联合建设银行河源市分行,立足产业链核心企业...
2025-11-11 03:42:54
湖北省支农支小再贷款余额首...
11月10日,上证报记者从中国人民银行湖北省分行获悉,截至10月底...
2025-11-11 03:42:53
港人“北上”贷款渐起 深港...
大湾区居民双向奔赴。继消费之后,过去的以“南向”居多的深港跨境信贷...
2025-11-11 03:42:53
奥浦迈(688293)披露...
截至2025年11月10日收盘,奥浦迈(688293)报收于61....
2025-11-11 03:42:53
推理速度最高提升6.5倍,...
当前,大语言模型(LLMs)在智能客服、代码生成、内容创作等场景中...
2025-11-11 03:42:52
华为用户码住:华为支付1分...
双11的规则越来越复杂,算满减算到头秃。我这几天研究下来,发现最实...
2025-11-11 03:42:50
中国农业发展银行副行长徐一...
11月10日,据通威股份消息,近日,中国农业发展银行党委委员、副行...
2025-11-11 03:42:49
CPE源峰斥资3.5亿美元...
雷递网 乐天 11月10日 继星巴克中国之后,汉堡王中国的股权也发...
2025-11-11 03:42:41

热门资讯

奥浦迈(688293)披露发行... 截至2025年11月10日收盘,奥浦迈(688293)报收于61.42元,较前一交易日上涨9.68%...
推理速度最高提升6.5倍,中国... 当前,大语言模型(LLMs)在智能客服、代码生成、内容创作等场景中正发挥着越来越重要的作用,但受限于...
北京银行发生大宗交易 成交溢价... 北京银行11月10日大宗交易平台出现一笔成交,成交量77.00万股,成交金额479.71万元,大宗交...
首个股份制银行资产投资公司获批... 11月9日晚间,兴业银行发布公告称,已于11月7日收到《国家金融监督管理总局关于兴银金融资产投资有限...
全线拉升!美联储降息,新消息!... 11月10日晚间,欧洲股市全线大涨。意大利MIB指数涨超2%,法国CAC40指数、德国DAX指数、欧...
今夜,大涨!美联储,降息大消息... 【导读】科技股暴涨 中国基金报记者 泰勒 大家好,今晚继续关注海外市场的表现! 美股大涨 11月10...
“青云租”兑付异常:上市公司背... 蓝鲸新闻11月10日讯(记者 赵凯)据上海证券报报道,近日手机租赁头部平台的“青云租”出现兑付问题,...
投资回报率16930%!国会3... 美国众议院前议长南希·佩洛西上周宣布,将在2027年1月完成本届众议员任期后不再寻求连任,结束其长达...
“十四五”期间,山西省人均GD... 11月10日上午,中共山西省委宣传部、山西省人民政府新闻办公室组织召开“高质量完成‘十四五’规划”系...
MicroStrategy在1... MicroStrategy在11月3日至11月9日期间以平均价10.26万美元购入487枚比特币,累...