首页 资讯 正文

北斗专访|无问芯穹夏立雪:如今更关注“用对芯片”而非“用贵芯片”

体育正文 94 0

北斗专访|无问芯穹夏立雪:如今更关注“用对芯片”而非“用贵芯片”

北斗专访|无问芯穹夏立雪:如今更关注“用对芯片”而非“用贵芯片”

“星汉灿烂,若出其里(qílǐ)。”人工智能迈入闪耀时刻。 4月(yuè)29日,习近平总书记来到位于徐汇区的上海“模速空间”大模型创新生态社区调研(diàoyán)。他指出(zhǐchū),人工智能技术加速迭代,正迎来爆发式(bàofāshì)发展,上海要总结好以大模型产业生态体系孵化人工智能产业等成功经验,加大探索力度,力争在人工智能发展和治理各方面走在前列(qiánliè),产生示范效应。 如今,徐汇区已形成“北斗列阵”+“群星闪耀”的AI生态布局。其中,“北斗七星”由稀宇(xīyǔ)科技、商汤科技、阶跃星辰(xīngchén)、无问芯穹、星纪魅族、特赞科技和斑马智行(zhìxíng)7家标杆企业构成。 这些(zhèxiē)企业何以(héyǐ)成为“北斗”?它们在人工智能领域有哪些探索和前瞻性的(de)思考?澎湃新闻推出“北斗专访”系列报道,通过深度对话,解码标杆企业的AI星辰版图。 作为企业掌舵人,清华大学电子工程系毕业夏立雪身上(shēnshàng)带有(dàiyǒu)理工科学生的气质。如今他的身份(shēnfèn)是无问芯穹CEO,常穿公司文化衫或西装出席公开场合,每次采访均准时现身。 面对澎湃新闻记者的提问,他总会迅速作答,有问必答、条理清晰,即使谈及激烈(jīliè)而残酷(cánkù)的竞争,也保持平和而克制的语调。 来到上海(shànghǎi)发展,这个出生于1991年的(de)青年企业家开始喜爱这座城市(chéngshì)。“上海确实让我有很大的一个感触,它和年轻人是很匹配(pǐpèi)的。我们公司平均年龄32岁,年轻人喜欢上海,可能因为它的文化基因更加开放和活泼。” 无问芯穹至今成立刚满两年,融资近10亿元。接下来要不(bù)要上市,夏立雪似乎并不心急。他说(shuō):“我相信只要坚持(jiānchí)做好两件事,既有(yǒu)技术的持续领先,又有商业化的成功,上市只是一个水到渠成的事情。” 无问芯穹,位于上海徐汇(xúhuì)滨江模速空间一楼。受访者 供图 摆在眼前的,是AI竞争来到“深水区”。2025年,大模型在算力上的比拼正发生(fāshēng)深刻转变:从原来的“比谁有(yǒu)更(gèng)多GPU”,演变成了“比谁能更聪明、更经济地用好手中算力”。 “我们现在需要考虑的是,在算力资源有限的情况下,怎么去解决模型持续增长的问题?”在夏立雪看来(kànlái),AI的任务越来越多样,芯片(xīnpiàn)技术越来越细分,算力资源越来越紧张——于是,“用最适合(shìhé)的芯片做最适合的任务”就成了大趋势。比如,适合训练(xùnliàn)的芯片专注训练,适合推理的芯片完成推理,适合端侧的芯片负责(fùzé)部署。更重要的是,要发挥异构算力资源的整体效能(xiàonéng)。 无论对中国还是全球(quánqiú),整合多元异构算力已不再是权宜之计,而是技术演进、成本压力和应用多样化之下的一个必然(bìrán)方向。 2025年(nián)5月,上海模速空间,无问芯穹公司门口。澎湃(pēngpài)新闻记者 李佳蔚 图 中国算力资源的(de)一大突出特点是多元异构。市场上主流CPU生态有5种以上,GPU生态则多达10种以上,不同(bùtóng)的算力芯片、服务器形态(xíngtài)、存储形态,以及网络形态组合(zǔhé)配置在一起,可以形成成百上千的组合。 “没有用不完(yòngbùwán)的英伟达GPU,也不是必须用英(yòngyīng)伟达的GPU。”夏立(xiàlì)雪说,AI企业如今更关注“用对芯片”,而(ér)非“用贵芯片”。掌握整合多元异构算力的核心技术,是中国确保人工智能安全、可靠、可控的一部分。 他进一步谈到,“打开水龙头,我们可能(kěnéng)不知道水是从哪个水库过来的(de),只知道它是标准化的自来水。同理,作为算力运营商,我们要(yào)调用不同的基座模型(móxíng)、使用不同的算力芯片,最终为AI企业提供标准化的算力服务。” 澎湃(pēngpài)新闻:这两年大模型技术更迭非常快,每年都有(yǒu)新焦点,你对行业变化有什么感受? 夏立雪:这两年人工智能发展飞速变化,前年我们在讨论大(dà)语言模型,去年多模态已经(yǐjīng)进入视野,今年的推理模型大家也习以为常了,技术(jìshù)飞快地迭代。随着模型能力增强,背后是模型的体量增大。 人工智能(réngōngzhìnéng)依然遵循Scaling Law(尺度定律),对算力(suànlì)的(de)需求越来越大,大到了一个什么程度?大到了你不能再假设你的资源是无限的。前两年训练模型的时候,很多大厂有(yǒu)一个基本假设,算力是无限的,至少在做(zuò)单一任务时算力是无限的。但是,现在这个假设的边界已经逼近,我们需要考虑,中国的算力资源是有限(yǒuxiàn)的,怎么去解决模型持续增长的问题? DeepSeek提供了(le)(le)一个很好的例子,它没有用(yòng)“大力出奇迹”的方式(fāngshì),而是用低成本、高效率的方式,在资源有限的情况下造出了一个好模型。所以,在打造更好的模型方面,现在我们需要更加精细化地把现有算力资源用好。 另外,我们还要考虑供需关系的问题。比如,当很多算力资源被用在(zài)模型训练上,而推理落地(luòdì)的算力需求也在上升(shàngshēng),那后者的资源就有限了。这中间,算力资源的供需匹配和性价比是一个很大的挑战。 当前,我们特别需要把没有被用(yòng)起来的(de)算力资源充分利用,同时要确保使用效率高。如果你拿来的算力不好用,大模型跑得非常卡,三秒(sānmiǎo)才出一个字,那没人愿意用。 2025年5月(yuè),上海模速空间,无问(wúwèn)芯穹办公空间一隅。澎湃新闻记者 李佳蔚 图 澎湃新闻:算力(suànlì)资源有限,是中国特有的还是全球性问题? 夏立雪:大多数国家(guójiā)都面临这个(zhègè)问题,只是有些国家会选择放弃。在AI大模型的赛道上,目前来看主要是中国(zhōngguó)和美国仍在坚持,随着模型不断增大,都会面临算力资源有限的瓶颈。 澎湃新闻:你提到算力供需错配,这是(zhèshì)怎么回事(zěnmehuíshì)?这个市场痛点如何解决? 夏立雪:现阶段,算力市场的供需错配是比较明显的。举个简单例子,由于使用习惯问题,大家都优先选择所谓的高质量算力,最尖端的GPU,它(tā)经过市场验证,一定好用。但问题是,每家企业都需要用尖端卡(kǎ)吗?对性能要求不高的企业,用一般性能的GPU行不行?不同(bùtóng)企业需求不同,可以用不同的卡。如果所有企业都抢最尖端的卡,一方面成本(chéngběn)极高,另一方面资源(zīyuán)很快短缺(duǎnquē)。 事实上,市场上还有大量性能不错,但没有被(bèi)关注或接受的算力(suànlì),我们要让这些算力都被利用起来。这当中要解决一些问题(wèntí),比如(bǐrú),这种算力和模型是不是适配,企业会不会用。异构卡出于不同的设计理念,会有很多性能差异,适配不同的任务,因此多种不同类型的卡展现出的效率差异会导致大规模分布式训练变得低效(dīxiào)。 我们有一个公式,AI模型(móxíng)的算力(suànlì)=芯片算力×优化系数×多元异构能力。其中,优化系数是通过软硬件协同发挥芯片算力最大(zuìdà)价值的能力;多元异构,则是让不同类型的算力资源都进入算力池(suànlìchí),并实现算力适配的能力。 打开水龙头,我们可能(kěnéng)不知道水是从哪个水库过来的,只知道它是标准化(biāozhǔnhuà)的自来水。同理,作为算力运营商,我们要调用不同(bùtóng)的基座模型、使用不同的算力芯片,最终为AI企业提供标准化的算力服务。 2025年(nián)5月,上海模速空间,无问芯穹(xīnqióng)成立2周年的一处照片墙。澎湃新闻记者 李佳蔚 图 澎湃新闻:既然(jìrán)AI任务变得越来越多样化,芯片技术也越来越细分,是不是意味着算力应该(yīnggāi)用在最适合它的地方? 夏立雪:是的,企业手里有算力(yǒusuànlì),一定要把它用(yòng)好。算力需求本身是分层的,供给也应该分层。一些芯片(xīnpiàn)更适合承担大模型训练的高吞吐任务,另一些则在低延迟、低功耗(dīgōnghào)的推理场景中更有优势,还有些专为端侧部署设计,追求轻量化,实时响应。不同类型的AI应用,匹配最适合的算力资源,才能在性能、效率(xiàolǜ)与成本之间找到最优解。 澎湃新闻:能否解释一下,在庞大的AI产业(chǎnyè)当中,你们具体提供(tígōng)怎样的产品和服务? 夏立雪:就像刚才说的(de),我们有点像一个“自来水厂”,从不同水库调取水源,经过统一(tǒngyī)标准化的处理,再供给到千家万户。我们也(yě)像是大模型算力的电商平台(píngtái),你要部署AI应用,可以像在(zài)电商平台上购物(gòuwù)一样,在我们这里选择不同芯片、不同模型,选购最适合自己的组合套餐。最终,我们希望让更多的企业能用得起算力,也用得好算力。 目前,无问(wúwèn)芯穹拥有全球首个(shǒugè)可进行单任务千卡规模异构芯片混合训练的平台,支持包括华为昇腾、天数智芯、沐曦、摩尔线程与AMD、NVIDIA六种(liùzhǒng)异构芯片在内(zàinèi)的大模型混合训练,集群算力利用率最高可达97.6%。 澎湃新闻:你是清华博士,也(yě)是“90后”,你怎么看如今越来越多的科学家和(hé)年轻人投身AI行业? 夏立雪:这两个问题在人工智能行业是有(yǒu)统一性的。也就是说,科学家(kēxuéjiā)创业和年轻人(niánqīngrén)创业,在人工智能行业很(hěn)普遍,也很匹配。人工智能是一个快速迭代的技术体系,现在很多技术都来不及写书、来不及成为教材,就已经被广泛应用起来了。和传统上我们先在学校学习,然后才(cái)进入行业应用的模式非常不同。 我们公司(gōngsī)平均年龄(píngjūnniánlíng)只有32岁,比我更小,如果算上(suànshàng)实习生,那平均年龄才28岁。2023年我们公司推出的第一个在业界打响名气(míngqì)的推理加速(jiāsù)方法FlashDecoding++,通过异步(yìbù)方法实现注意力计算的真正并行,它就是一个年仅24岁的实习生作为主要贡献者实现的,那年她也拿到了我们公司最高荣誉“无穹之星”。所以在这个行业,年轻人大有可为。 澎湃新闻(xīnwén):来到上海,你对(duì)这座城市以及这里的人工智能发展环境有什么感受? 夏立雪:北京、上海都是(shì)人工智能很强的城市,有各自不同的优势。上海确确实实(quèquèshíshí)让我有很大的一个感触,就是(jiùshì)它和年轻人的匹配,可能因为它的文化基因更加(gèngjiā)开放、更加活泼,年轻人生活工作在其中比较舒适。这种环境既有利于创新,也吸引了大量人工智能企业的聚集。 澎湃(pēngpài)新闻:无问芯穹是否有融资压力,考虑上市吗? 夏立雪:我们有(yǒu)自己的(de)技术理想,同时也考虑商业化落地。从公司发展角度,一方面我们会继续坚持一套自主、可控的技术方向(fāngxiàng),符合且服务国家需求;另一方面,我们不是(búshì)一家(yījiā)研究院,我们乐于追求商业价值,不仅仅是给股东交答卷,更是要让技术接受市场的验证。我相信只要坚持做好(zuòhǎo)两件事,既有技术的持续领先,又有商业化的成功,上市只是一个水到渠成的事情。 澎湃新闻:无问芯穹(xīnqióng)是首批入驻模速空间的企业,讲一个你对模速空间的深刻印象吧(ba)。 夏立雪:我们公司和模速(mósù)空间(kōngjiān)共同成长,感情很深。模速空间为我们提供了全方位的贴心服务,并(bìng)给予了大力支持。这里聚集(jùjí)了大量人工智能上下游企业,我经常上楼找其他同行(tóngháng)聊一聊天,相互交换一些行业早期的信息(xìnxī)和判断,这对各自发展都有好处。另外,我们很多合作也是这样达成的,有时模速空间两家企业相互合作,有时我们携手去服务外部的另一个客户。在这里,机遇非常多。 澎湃(pēngpài)新闻高级记者 李佳蔚 (本文来自(láizì)澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)
北斗专访|无问芯穹夏立雪:如今更关注“用对芯片”而非“用贵芯片”

欢迎 发表评论:

评论列表

暂时没有评论

暂无评论,快抢沙发吧~