据澎湃新闻,5月21日,记者获悉,智谱联合驭驯网络与清华大学,在GLM-5.1线上生产集群中完成了新一代网络架构ZCube的规模化落地。在线上GLM-5.1 coding场景中,在保持GPU算力、软件栈与应用不变的前提下,ZCube节省了33%交换机与光模块成本,同时将GPU平均推理吞吐提升了15%,并将TTFT P99降低了40.6%。这意味着,同样的硬件投入,智谱的 GLM 大模型现在每秒能多响应 15% 的 API 请求。对于大模型 API 平台而言,这直接对应更高的并发上限以及在流量峰值下更稳定的用户体验。
举报 相关阅读
英伟达刷新最高季度营收纪录,年内CPU收入预计200亿美元英伟达CEO黄仁勋表示,英伟达的增长速度应该会超过超大规模科技企业的资本支出增速。
元股证券:ygzq.hk 13196 3小时前
“最大AI芯片”公司上市首日涨68%,美股AI热潮与分歧共存英伟达7连涨创新高,新贵上市首日高开,市场提醒“别贪婪”
36353 05-15 10:33
马化腾回应腾讯AI落后质疑,超300亿资本开支主投AI第一季度腾讯Non-IFRS经营利润756.3亿元,如果剔除新AI产品的影响,该数据为844亿元。
119371 05-13 22:13
英伟达市值失守5万亿美元,发生了什么?多家科技公司透露了芯片自研进展,英伟达面临竞争。
此次样本调整后,科创50和科创100两大指数的成份股总市值合计覆盖率达63%,较调样前提升1.1%,意味着科创宽基指数对科创板市场的代表性进一步提升。同时,科创50和科创100两大指数实现了体系内样本的有序互换,科创50调入样本来自科创100,而科创50调出样本则相应转入科创100,二者协同联动共同表征科创板大中市值证券表现。
30060 05-01 08:45
时隔近半年,英伟达市值再次突破5万亿美元近期市场上多有关于AI需求强劲的消息实盘炒股杠杆排行。
1527 04-25 07:28 一财最热 点击关闭
在在多空双方博弈更趋胶着的时期的盘面环境中阶段如何用好轻松配近期,在国际金融市场的高低切换频繁的阶段中,围绕“轻松配资炒
2026-02-05
亚洲多个最脆弱的经济体眼下正面临日益加剧的压力,尽管伊朗战争引发的石油冲击对经济造成的打击不断加深,但这些国家的央行依然
2026-05-20
正值4月15日国家安全教育日,为深入贯彻总体国家安全观,同时积极响应中国证券投资基金业协会“一司一省一高校”投教活动号召
2026-04-21
据新华社,匈牙利蒂萨党主席毛焦尔·彼得13日在布达佩斯阐述未来新政府改革计划时说,匈牙利正迈入一个“人道主义、高效运转、
2026-04-17
阶段性时期量化策略资金使用配资官方开户的持仓结构优化行为金融近期,在新兴科技板块市场的情绪反复的盘整期中,围绕“配资官方
2026-01-28