记者 查睿 束涵
5月11日,中国算力平台(上海)教育专区暨上海教育智算服务平台正式启动;4月,上海发文要求加快“人工智能+政务服务”改革,推动云、网、算等新型基础设施融通;3月,上海提出未来要形成支撑性智算云算力集群,提升智算服务能级……
今年以来,上海频频发布人工智能产业新政,其中“智算云平台”成为关键词,精准抓住大模型竞争的“命门”,也意味着上海算力基础设施正逐步赋能千行百业。
业内人士认为,无论是公共云的智能算力,还是专有云的知识库,上海均已提前布局,力争打造更具竞争力的产业集群。
“AI上云”正成为主流
今年初,DeepSeek“一石激起千层浪”,掀起全国算力浪潮的同时,也激活了云计算平台的海量需求。
大模型训练依赖“大力出奇迹”,只有海量参数加上巨量算力,才能训练出高性能的大模型。
面对算力需求,自建服务器成本过高,将大模型放在云端服务器上训练,仅需为算力消耗付费,成了多数中小AI企业的最佳选择。因此,云计算正成为AI产业的“新基建”,中国工程院院士王坚曾形容,“云计算和大模型的关系,就像是电和电机的关系,未来的云端算力会被模型消耗掉”。摩根士丹利最新报告也显示,预计到2026年底,46%的数据将集中到云计算平台。
近年来,“AI上云”的趋势愈发明显。大模型厂商与云计算平台的“双向奔赴”,一方面是AI企业对算力的需求持续增长,另一方面是云计算平台也在打造丰富的AI生态。
上海四大基模之一MiniMax自主研发的多模态通用大模型,从诞生到成长都在“云端”。记者了解到,MiniMax大模型从上架腾讯云到启动训练,仅需1天。此外,云端训练将大模型数据损耗压缩至6%,GPU(图形处理器)芯片的利用率提升40%,研发成本削减30%,算力能效发挥到极致。同时,MiniMax凭借云服务器覆盖全球的计算节点,还顺利出海至180多个国家和地区。
也就是说,MiniMax不再需要为算力、网络等基础支持费心,仅需专注于模型迭代的研发工作,孵化出海螺AI、星野社区等明星产品,并成长为国内AI明星企业。
同时,云计算平台也在接入更多大模型。“随着单一模型难以覆盖复杂场景需求,头部厂商开始转向多模型生态构建,这有助于绑定开发者与行业合作伙伴,稳固自身生态圈。”业内人士指出。
诸如,全球头部云计算平台微软Azure绑定OpenAI的同时,也在开发轻量级模型Orca、小参数模型Phi等,优化推理成本。阿里云自研通义千问,搭建开源社区“魔搭”,吸引众多开发者围绕开源大模型进行创新。
AI智能算力成为发力点
“前几年,国内云计算平台缺少足够应用场景,发展一度停滞。DeepSeek的算法优化,降低了云计算的成本,也盘活了云服务市场,创造了大量AI训练的需求。”业内人士认为,未来几年,AI智能算力仍将持续紧缺,这对提前布局算力的上海来说是绝对利好。
长期以来,上海积累了一批头部的算力和数据平台。比如上海数据港长期服务阿里云、腾讯云、网易等为代表的云计算巨头企业,利用自身的数据中心资源优势,为AI企业提供高效的算力支持。云赛智联在算力资源的基础上,还能提供数据处理、分析以及人工智能应用开发等解决方案。云计算龙头企业优刻得在算力租赁方面具有独特的优势,是全国首家公有云科创板上市公司……
“国内最大的GPU智算中心落地上海,我们还在松江部署了新一代高性能计算集群,可为大模型提供强大的算力支持。”腾讯云副总裁王前表示,上海的AI基础设施完备,包括算力的技术设施领先全国,是AI产业发展的“骨架”;上海的AI应用场景丰富,金融、生物制药、装备制造、科技创新等行业齐备,发展较为成熟,为AI产业落地提供了“肌肉”;上海的科研机构集聚,科研人才丰富,人才的储备就像AI产业的“血液”。
正是“骨架、肌肉、血液”完善的AI生态,让上海稳居国内AI高地,具备很强的产业辐射能力。
基于充沛的通用算力基础,更适合AI训练的智能算力,正成为上海的下一个发力点。
今年3月底印发的《上海市关于促进智算云产业创新发展的实施意见(2025—2027年)》提出,到2027年,上海智算云产业规模力争突破2000亿元,智算规模力争达到200EFLOPS(每秒百亿亿次浮点运算),其中自主可控算力占比超70%,云边端协同、产业链条完备的生态体系基本形成,并打造若干综合型智算云平台和一批垂直型智算云平台。
给大模型“上课”是关键
“模型是‘大脑’,知识库是‘课本’,大脑智商再高,如果没有学过相应的知识,也无法很好地解决问题。”腾讯集团云与智慧产业事业群CEO汤道生认为,云服务解决AI算力只是大模型落地的第一步,AI应用也离不开专有云知识库。
业内人士告诉记者,知识库通常是企业或垂直行业经过逻辑关联处理过的数据,储存在本地部署的专有云上,是大模型各类应用的核心竞争力。
众所周知,大模型依靠训练时的数据“记忆”来回答问题,知识库就像是实时更新的“图书馆”。“大模型+知识库”之后,大模型负责理解问题,然后从知识库中精准检索内容再回复,这样在保证大模型能力的同时确保答案的准确性。比如,在AI医疗领域,大模型理解患者描述的症状,知识库提供最新的诊疗指南。
在这一方面,上海也开始摸索实践。
今年2月,上药控股打通药学专业知识库和DeepSeek-R1及混元大模型,融合推理能力与药学专业领域知识,生产不同功能的AI智能体,为药师和患者提供专业的药学建议。依托腾讯云在医学知识图谱上的优势,上海瑞金医院发布的医学大模型已在十余个头部临床科室落地,以体检报告生成为例,平均每5秒即可自动生成一份总检报告,每天自动生成超过500份,报告采纳率达到96%以上。
“越来越多的AI应用不再局限于纯文本来生成回答,涉及的数据类型日益复杂,这也要求知识库能够处理和存储不同类型的数据,并支持结构化、半结构化及非结构化数据的复杂融合查询。”国产数据库OceanBase的首席执行官杨冰表示,将大模型能力与知识库专有云结合,是让模型应用更懂业务的关键所在。