大涨31%!国内AI巨头突然暂停交易,最新回应来了 日新模型引关注

同花顺 2024-04-24 19:31:45
A+ A-

4月24日午间,商汤科技(0020.HK)在港交所暂停交易,停牌前股价上涨31.15%,报收0.8港元,当日成交额达12.61亿港元。早盘期间,商汤经历短暂低位盘旋后迅速攀升,盘中涨幅一度超过36%,引发市场广泛关注。

商汤科技回应南都湾财社记者称,股价异动主要归因于前一天“日日新大模型5.0”发布会受到市场的热烈反响。根据上市规则及港交所建议,公司将发布进一步公告,敬请投资者留意。

4月23日,在商汤科技的技术交流日上,公司董事长兼CEO徐立发布了全面升级的“日日新SenseNova5.0”大模型体系,简称“日日新5.0”。同时,商汤还展示了行业首套覆盖“云、端、边”全栈的大型模型产品矩阵,以适应不同规模场景的应用需求。

基于“日日新”基础大模型,商汤推出了包括“日日新.商量大模型5.0”、“日日新.商量多模态大模型”、“日日新.商量拟人大模型”在内的七大衍生模型。商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚在接受南都湾财社采访时表示,这些模型并非孤立存在,而是相互关联。大模型的发展不单纯追求数量,关键在于模型间的差异性和创新性。他指出,今年公司会重点发力多模态模型的研发。

“日日新5.0”大模型矩阵的更新,推动了文生视频平台的技术进步。作为“日日新SenseNova”大模型体系自去年4月首次发布以来的第五次重大版本更新,“日日新5.0”在文科能力、理科能力和多模态能力三方面均有显著提升。其中,多模态能力是其核心竞争力之一。该模型能高效解析高清长图,快速完成分类描述,包括标题、副标题、背景、主体分类等信息提取。此外,还具备文生图交互式生成、跨文档知识抽取与总结问答、多模态交互等多种复杂功能。

在文科能力方面,“日日新5.0”在创意写作、推理和总结能力上均有显著提升,能够更准确理解和总结中文知识输入,为教育、内容产业等垂直应用场景提供有效支持。在理科能力方面,其数理、代码和推理能力达到业界领先水平,为金融、数据分析等领域的应用落地提供了坚实基础。

徐立以一个趣味推理问题为例,现场对比了“日日新5.0”与GPT-4的表现。问题为:“妈妈给圆圆冲了一杯咖啡,圆圆喝了半杯后加满水,再次饮下半杯后再加满水,最后全部喝完。问圆圆喝的咖啡多还是水多?”结果显示,“日日新5.0”准确回答了问题,优于GPT-4。

除了云侧大模型,徐立强调端侧大模型应用的落地对于大模型普及至关重要。他通过现场演示,展示了商汤端侧模型在与友商“打拳”互动中的快速反应与判断能力。此外,商汤端侧模型在图像编辑任务中表现出色,能在1秒内生成预览,数秒内生成高达1200万像素的大图,速度比友商云端模型快10倍。端侧模型能够快速进行等比扩图、自由扩图、旋转扩图等操作,其效能也在大会现场得到实时验证。

商汤科技在2023年财报中预测,2024年将是端侧大模型应用爆发之年。为此,公司已将端侧大模型应用的推广列为今年战略重点。在此基础上,商汤推出了端云协同解决方案,徐立介绍称,端云MOE架构中,部分场景端侧处理占比可达70%以上,有助于降低推理成本。公司可根据不同行业需求调整云端联动比例,以实现最佳推理效果。

王晓刚在采访中同样提到了端云结合的重要性,他认为未来的手机模型必然走向端云结合,需要端侧大模型在体验和性能上与云侧模型保持一致,并实现端云协同。商汤在过去一年对云侧模型进行了大量开发与改进,以此为基础开发出的端侧模型已能与云侧模型对齐,这是商汤端云结合的独特优势。

此外,商汤在技术交流日发布的“云、端、边”全栈大模型产品矩阵中,还包含了“商汤企业级大模型一体机”,旨在为金融、代码、医疗、政务等多个领域提供定制化产品。王晓刚认为,与垂直行业的深度融合是展现模型“差异化”的重要指标,行业需求将引领模型的优化发展方向。

值得一提的是,商汤在文生视频平台技术上取得突破,徐立现场播放了由商汤大模型生成的三段视频,强调了“文生视频”平台对人物、动作和场景的精准控制,但未正式发布相关产品。在数字人方面,商汤已推出“商汤.拟人语言大模型”,使虚拟人物更具真实感。

徐立指出,当前大模型发展已步入落地阶段,与产业、应用场景的有效结合成为关键。同时,“尺度定律”路径日益明晰,“涌现”现象可能随时出现,因此前瞻性探索最前沿的大模型技术同样至关重要。

商汤科技目前专注于生成式AI、传统AI和智能汽车三大业务。尽管传统业务受到一定影响,但生成式AI业务开局良好。王晓刚谈到与手机厂商的合作时认为,这具有显著价值,既积累了客户资源,又因手机厂商对交付品质和响应速度的高要求,促使商汤打磨出高质量的端侧模型和数据生成能力,有助于加强小型模型的训练。

在智能汽车板块,商汤旗下的“绝影”业务备受瞩目。王晓刚表示,智能汽车是通用人工智能大模型的理想落地场景,商汤计划加大对“绝影”的投入,赋予其更多自主发展权,并依托公司基础能力,使其在智能汽车终端充分展现通用人工智能和大模型的价值。他强调,商汤未来的发展重点并非制造实体机器人,而是打造机器人的“大脑”。

展望未来,王晓刚透露了商汤在生成式AI业务上的布局与规划。考虑到商量、如影、格物等生成式AI产品主要面向C端市场,公司将持续关注用户体验,根据用户需求进行产品优化,确保及时响应。

王晓刚重申,AI大模型的研发是一项长期投入、长期竞争的事业。无论B端还是C端业务,两者并行发展至关重要。商汤将坚定地沿着这条道路前行,与众多合作伙伴和生态系统共同推动相关成果和基础能力的提升。

责任编辑:张蕾
点击查看全文(剩余0%)

热点新闻

精彩推荐

加载更多……