商汤联合创始人、首席科学家王晓刚认为,商汤入局大模型有两个优势:第一是基础设施,第二是商汤在过去几年深入行业和场景,积累了各种各样多模态任务,这些好比是原材料。
【资料图】
腾讯新闻《潜望》刘勇
2023年4月10日,商汤科技SenseTime举办技术交流日活动,公布以“大模型+大算力”推进AGI(通用人工智能)发展的战略布局,并公布商汤在该战略下的“日日新SenseNova”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。
活动上,商汤展示了“日日新SenseNova”大模型体系下的语言大模型,以及AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用,并公布了商汤依托AI大装置SenseCore实现“大模型+大算力”融合创新的研发体系。
据悉,商汤大装置上共有27000块GPU芯片卡,可以输出5.0 exaFLOPS总算力,是亚洲目前最大的智能计算平台之一。
为什么叫“日日新”? 商汤方面表示,“苟日新,日日新,又日新”选自中国儒家经典——《礼记·大学》,意思是如果能够一天新,就应保持天天新,新了还要更新。这就像“日日新”大模型给产业带来的全新的生产力革命,在商汤科技已经将AGI的服务沁入企业生产及生活中,悄然掀起了一场生产力的革新风暴。
商汤科技董事长兼CEO徐立在10日发布会表示:“在AI大模型时代,数据、算法和算力这三要素也在经历新的演变,大模型参数量将以指数级的速率提升,而数据量随着多模态的引入也将大规模增长,因此就必然会导致对算力需求的剧增。我们以AI大装置SenseCore打造AGI时代的基础设施。”
“AGI催生了新的研究范式,即基于一个强大的多模态基模型,通过强化学习和人类反馈不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。AGI将实现从‘数据飞轮’到‘智慧飞轮’的演进,最终迈向人机共智。”商汤科技联合创始人、首席科学家王晓刚表示:“商汤已建立了全栈的大模型研发体系,并已在多个行业场景中落地,场景的多样性,任务的复杂度,数据的丰富度均充分展示了我们大模型的能力和未来潜力。我们将持续推动基础设施建设,期待和合作伙伴一起投入到AGI的时代大潮中。”
日前,王晓刚在谈及商汤进入大模型领域的优势时说,他认为商汤优势有以下两方面:
第一,在人工智能创业公司里,很少看到像商汤这样把大量资源投入到基础设施建设的企业,商汤做了大装置,除了有强大算力,还有5000 P算力,从而搭建了一个强大的训练系统、超算系统。
第二,商汤作为平台性公司,覆盖了众多行业线。在各个行业线,积累了不同类型的数据,还有对问题的描述。
“当我们要做一个通用的人工智能大模型,我们把它比喻成核聚变,要产生一个核武器,你要有核装置,这就是我们一些基础的硬件系统。你还得有核原料,核原料它就是要有一些各个行业里非常丰富的数据也好,任务也好。”他说。
他接着说道,ChatGPT为什么能成功?是因为它从互联网上得到的这些数据后,会发现自然语言可以涵盖多样复杂的任务。但如果我们扩展到多模态,扩展到视觉,这些复杂的任务你没办法直接从互联网里面去拿到数据。
所以,在他看来,商汤做通用人工智能大模型的先天优势,一个有很好的基础设施,系统性的基础设施。另一个是,商汤在过去几年深入到行业和场景里面,积累了各种各样的多模态任务,这些作为原材料,最终让这个模型能够成功。
此外,“日日新SenseNova”为政企客户提供了多种灵活的API接口和服务,包括图片生成,自然语言生成,视觉感知通用任务与标注服务。客户可根据实际应用需求,调用“日日新SenseNova”大模型的各项AI技术能力,低门槛、低成本、高效率地实现各类AI应用。
在“一平台四支柱”的战略体系下,商汤“日日新SenseNova”大模型体系已支持了智能汽车、智慧生活、智慧商业、智慧城市等业务板块,打通了多个领域、行业的应用闭环。
在智能驾驶领域,大量的长尾类别需求,需要高精度车端模型。通过大模型生产高精度车端模型,大幅提升了few/one/zero shot在长尾类别中的精度,在重点关注的类别上,平均精度提升3%。此外,大模型提供了高精度的智能标注能力,为数据闭环提供了核心功能,大大减少了需要人工标注的数据量,加速了模型精度的提升。得益于大模型能力,商汤实现了BEV环视感知,做到了3000类物体的高精度识别,还构建了感知决策一体化的自动驾驶多模态大模型,带来更强的环境、行为、动机解码能力。
在生物医药领域,商汤AI大装置为蛋白质结构大模型提供AI推理算力,并为蛋白质相互作用模型,提供研发平台及训练算力。商汤与百英科技合作,训练抗体亲和力预测模型。通过高性能计算优化,蛋白质结构预测大模型推理时间由数小时减少到数分钟,使得蛋白质结构预测性能达到工业应用的标准,抗体筛选效率提升60%。
数字时代的人-物-场已经逐渐被颠覆和重构,从商汤此次公布的中文自然语言、数字人生成、大场景漫游、小物体重建、文生图等多种API接口来看,企业可以根据自身的需求,更灵活的都调用大模型的各项AI能力,低门槛、低成本、高效率地实现AI技术在实际业务环节中的部署,切实的实现技术力向生产力的转化。
同时,“日日新SenseNova”也为商汤的自身业务带来了突破。例如在智能驾驶领域,基于视觉大模型,商汤实现了可识别3000类物体的BEV环视通用感知算法的实车量产,也构建了感知决策一体化的自动驾驶多模态模型,带来更强的环境、行为、动机解码能力。
自然语言是人机沟通的关键手段,“日日新SenseNova”也推出了商汤最新研发的语言大模型“商量SenseChat”。作为千亿级参数的自然语言处理模型,“商量SenseChat”使用大量数据训练,并充分考虑了中文语境,能够更好地理解和处理中文文本。活动现场,“商量SenseChat”展示了出色的多轮对话和超长文本的理解能力。商汤也展示了语言大模型支持的几项创新应用,包括:编程助手,可帮助开发者更高效地编写和调试代码;健康咨询助手,为用户提供个性化的医疗建议;PDF文件阅读助手,能轻松从复杂文档中提取和概括信息。
扩散模型引爆了AIGC应用的流行,商汤展示了“日日新SenseNova”的各种AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用:
“秒画SenseMirage”文生图创作平台,展现了光影真实、细节丰富、风格多变的强大的文生图能力,可支持6K高清图的生成;客户还可根据自身需求训练生成模型。
“如影SenseAvatar”AI数字人视频生成平台,仅需一段5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。
“琼宇SenseSpace”和“格物SenseThings”3D内容生成平台,可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。
“日日新SenseNova”带来的这些强大而易用的内容生成能力,将会改变内容生产行业的生产范式,突破内容创意的天花板,将会重塑内容生产行业生态并打开新的增长空间。
无论是语言大模型,还是文生图或数字人生成,都离不开大规模AI基础设施的算力支持。商汤AI大装置SenseCore,拥有行业领先的算力输出能力、超大模型训练及大规模推理能力,将会成为AGI和大模型时代的基础设施服务领导者。
基于AI大装置SenseCore和“日日新SenseNova”大模型体系,商汤面向行业伙伴提供涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多种大模型即服务(Model-as-a-Service):
基于预训练大模型的自动化数据标注可实现相较于人工数据标注近百倍的效率提升。
大模型并行训练和模型增量训练服务能够帮助客户快速利用自有数据训练模型,包括在预训练大模型之上进行垂域行业模型的开发,生产千行千面的自定义模型。
模型推理部署服务可将大模型推理效率提高100%以上,降低用模型提供服务的成本。
商汤也向行业开发人员开放大量预训练模型及AI开发工具链,全面赋能客户提升开发效率。
AGI不是一场作秀式的狂欢节,而是生产力升维的契机。在ChatGPT成为程序员、画师、创作者的过程中,商汤已经将AGI带动的生产力迭代注入到更多的领域、行业、企业和场景中。可以说在驾驭AGI的道路上,商汤已经找到了关键的破局点。