8月12日下午,华为正式发布AI推理“黑科技”UCM(推理记忆数据管理器) ,助力解决AI推理效率与用户体验的难题。
来源:中国基金报记者拍摄
AI推理是AI产业在下一阶段的发展重心 。AI产业已从“追求模型能力极限 ”转向“追求推理体验最优化”,推理体验直接关联用户满意度、商业可行性等核心需求,成为衡量AI模型价值的黄金标尺。
据悉 ,华为计划在9月开源UCM。届时,华为将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给所有Share Everything(共享架构)的存储厂商和生态伙伴 。
UCM将提升推理系统效率和性能
UCM是一款以KV Cache(键值缓存)为中心的推理加速套件 ,融合多类型缓存加速算法工具,可以分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口 ,以实现高吞吐 、低时延的推理体验,从而降低每个Token(词元)的推理成本。
来源:中国基金报记者拍摄
KV Cache是一种用于优化计算效率、减少重复运算的关键技术,但是需要占用GPU(图形处理器)的显存存储历史KV(键值)向量 ,生成的文本越长,缓存的数据量越大。
随着AI产业的发展迈入代理式人工智能时代,模型规模化扩张、长序列需求激增 ,以及推理任务并发量增长,导致AI推理的KV Cache容量增长,超出了显存的承载能力。
目前 ,国外领先芯片厂商通过从硬件迭代到软件优化,再到生态绑定,构建起AI推理时代的“铁三角”,短期内难以被代替 。中国企业在单点硬件技术上有所突破 ,但国产软件及生态适配仍有较大差距。
随着信息技术应用创新产业的国产化改造提速,各行业逐步意识到需要加速构建国产推理生态。UCM的核心价值在于提供更快的推理响应 、更长的推理序列等 。
以提供更长的推理序列为例,UCM通过动态KV逐层卸载、位置编码扩展等组合技术 ,将超长序列的Cache(缓存)分层卸载至外置专业存储,利用算法突破模型和资源限制,实现10倍级推理上下文窗口扩展。
UCM提供更低推理成本
华为联手中国银联落地三大场景
据悉 ,UCM可根据记忆热度在HBM、DRAM、SSD等存储介质中实现按需流动,同时融合多种稀疏注意力算法实现存算深度协同,使长序列场景下TPS(每秒处理token数)提升2至22倍 ,从而降低每个Token的推理成本。
Token是AI模型中的基本数据单位 。在训练过程中,AI大模型会学习标记Token之间的关系,从而执行推理并生成准确 、相关的输出。
数据显示 ,国外主流AI大模型的单用户输出速度已进入200 Tokens/s区间(时延5ms),而我国主流AI大模型的单用户输出速度普遍小于60 Tokens/s(时延50至100ms)。
同时,随着AI应用向各类实际场景深度渗透,用户规模和请求量急剧攀升 ,模型分析和生成的Token数呈现指数级增长态势 。
巨大的Token处理量意味着高昂的运营成本,包括服务器维护、电力消耗持续攀升等,而保障流畅推理体验需要加大算力投入。
最大化的单Token智能承载力和优化成本 ,成为众多厂商的核心目标,并且Token经济时代来临,训练、推理效率与体验量纲都以Token为表征。
目前 ,华为AI推理加速方案结合UCM与华为AI存储(OceanStor A系列)技术,与中国银联开展智慧金融AI推理加速应用试点,三大落地业务场景分别是客户之声 、营销策划、办公助手 。
来源:中国基金报记者拍摄
以办公助手场景为例 ,通过应用华为AI推理加速方案,可支持用户输入超过17万Tokens的超长序列推理,避免超长序列模型推不动的问题。
(文章来源:中国基金报)
十大优质配资平台:网上股票开户怎么办理-OpenAI发布ChatGPT智能体 能帮金融分析师做PPT和EXCEL
股票怎么在手机上交易:股票开户网上可以申请-国产创新药领域重磅合作频出 这笔60亿美元BD大单花落AI制药领域
股票配资平台是什么:配资网上开户-小米入局 AI眼镜爆发临界点已至?
国内最安全的股票配资平台:股票账户开户哪家好-“世界上最强AI模型”发布 马斯克放话!机构扎堆看好这些概念股
股票网上可以开户:配资炒股论坛平台查询-焦煤焦炭期货连续上涨 15只煤炭股处于破净状态(附名单)
债券融资与股票融资的比较:股票网上开户佣金是多少-中国城市公共交通协会网约车分会发布致歉声明
诚利和app-实盘配资一键查询_正规配资不怕查提示:文章来自网络,不代表本站观点。
诚利和app-实盘配资一键查询_正规配资不怕查㉖股票配资公司强调风险管理的前瞻性,通过模拟不同市场环境下的投资组合表现,来评估潜在风险,并提前制定应对措施。
记者闫桂花 王珍中国社会科学院学部委员、中国社会科学院原副院长高培勇周日在“中国发展高层论坛2025年...
记者辛圆3月25日,博鳌亚洲论坛旗舰报告《亚洲经济前景及一体化进程2025年度报告》(以下简称《报告》...
2025年3月25日,倍轻松(688793.SH)公告称,公司股东宁波倍松投资有限公司(简称“宁波倍松”)拟通过大宗交易...
记者王珍中国国际经济交流中心副理事长、国务院发展研究中心原副主任王一鸣周一在“中国发展高层论坛2025...
记者辛圆给补贴、建平台,为了吸引更多高层次人才,各地纷纷放出“大招”。据央广网周一发布消息,湖...
记者|赵阳戈年初,证监会就修改《证券发行与承销管理办法》部分条款向社会公开征求意见,市场也将注意力投向了...
3月24日,易方达国证自由现金流ETF公开发售。该产品跟踪国证自由现金流指数,这个指数是什么?有哪些优势?投资价值如何?...
今日A股V型反弹,TMT行业探底回升。芯片50ETF(516920)探底回升,尾盘翻红收涨0.92%,资金连续涌入,近2...
【隔夜行情】•周五(2025年3月21日),A股三大指数集体下跌,截至收盘,截止收盘,沪指跌1.29%,报收33...
文丨华西证券华西证券研报指出,手机市场疲软的环境之下,华为推出Mate60系列手机终端给手机产业链带来新...
3月24日,AI眼镜概念股开盘拉升,瀛通通讯直线涨停,明月镜片涨超10%,比依股份、博士眼镜、恒玄科技、国光电器等跟涨。...
近日,开源证券大连分公司遭大连证监局处罚,暂停其办理需要合格投资者认定相关业务六个月。该惩处力度在近年来券商分支机构中并...
3月24日,海洋王照明科技股份有限公司(以下简称“海洋王”,002724.SZ)早盘一字跌停,此后股价拉涨,尾盘封涨停板...
沪深两市成交额连续第44个交易日突破1万亿,较昨日此时缩量超900亿。...
3月24日,业内权威专家表示,MLF(中期借贷便利)不再有统一的中标利率,标志着MLF利率的政策属性完全退出。3月24日...