热点资讯

中国首个GPT-4 Turbo级别的大模型登场，6000亿参数，商汤「日日新5.0」发布

2025China.cn 2024年04月25日

国产AI大模型迎来对标全球顶尖版本时刻!

4月23日，商汤科技带来全新升级的「日日新SenseNova 5.0」大模型，具备更强的知识、数学、推理及代码能力，综合性能全面对标 GPT-4 Turbo，并在主流客观评测上达到或超越 GPT-4 Turbo。

「日日新 5.0」能力提升主要得益三个方面：

● 采用混合专家架构(MoE)，激活少量参数就能完成推理。且推理时上下文窗口达到 200K 左右。

● 基于超过10TB tokens训练、覆盖数千亿量级的逻辑型合成思维链数据。

● 商汤AI大装置SenseCore算力设施与算法设计的联合调优。

先看看BenchMark成绩：

「日日新 5.0」在大部分核心测试集指标上都对标甚至超过GPT-4 Turbo

在实际使用中，「日日新 5.0」具体表现怎么样?下面，分别从自然语言能力、文生图能力、多模态和数据分析能力几个方面对比一下。

自然语言能力

「日日新 5.0」的自然语言能力得益于对大量中文语料的构建。

创意写作、推理以及总结能力均大幅提升，相同的中文知识注入后，可以获得更好的理解总结及问答，为教育、内容产业等垂直应用场景提供有力辅助。

例如，在创意写作方面，「日日新 5.0」可以打破传统作文的“八股式”写法，将通用知识、新知识融会贯通，实现更开放式的创作。

以《红楼梦》里亭子的题名来写一篇关于文化、关于创新的作文：GPT-4写作分别从学习、工作、生活维度讨论传统与创新，套路痕迹较为明显，浅尝辄止，难免不让人觉得枯燥乏味;「日日新 5.0」写作颇为生动形象，节奏不一，引经据典。从《诗经》《楚词》到《汉赋》，从“兼爱非攻”到“民贵君轻”，革古鼎新，“一花独放不是春，百花齐放春满园”，文化交流是创新生生不息的源泉。从历史宏观到细节的生动刻画，「日日新 5.0」想象力丰富，似一位才华横溢的“大才子”

数学，不仅涉及到计算能力，其实也会涉及到很多对题目和问题描述的理解能力，反映的是一个更加综合思考、构建逻辑的过程。

当前的AI大模型很容易失败的一点是应对之前没有提问过的数学场景，当背后缺少构造完整思维链时就容易出错。问一些小众不常见的问题实际上是验证其背后真正构建思维链的能力。

「日日新 5.0」和GPT-4回答趣味推理问题：“妈妈给圆圆冲了一杯咖啡，圆圆喝半杯后，将它加满水，然后她又喝了半杯后，再加满水，最后全部喝完。问圆圆喝了多少咖啡，多少水?”，「日日新 5.0」回答正确

下面也是一个很简单的逻辑题目。

「日日新 5.0」和GPT-4回答逻辑问题对比：“13个小朋友玩老鹰抓小鸡，1人扮演老鹰，12个扮演小鸡，已经抓了5只小鸡，还剩几只?”。GPT-4给出答案是抓了5只还剩8只，而日日新的答案是减掉1只老鹰所以还有7只没有被抓住。这个题目并不是一个简单算术的问题，而是需要对中文环境有充分理解，显然「日日新 5.0」表现更好

文生图能力

「日日新 5.0」的文生图能力也有较大提升，下面对比了商汤「日日新•秒画」和目前行业中几个最好的模型，包括：Midjourney、Stable Diffution 3、GPT-4V。

人像是评估文生图能力的关键场景之一，「日日新 5.0」在人物生成上有非常大的提升。秒画生成的人像可以看出非常好皮肤的纹理，而其他几个大模型在皮肤上都做了磨皮

这个对比体现另外一个难点，即怎样把不同字段的理解合成在一起。秒画给出了一个非常未来感的建筑，且对建筑下的倒影、波浪都表现得非常具有美感，实现了比较完整的指令跟随且生成效果好。而其他几个大模型会发现对于文字嵌入到图像中，无论对文字的理解还是放置位置，都有一定缺失

多模态和数据分析能力

本次「日日新5.0」另一大核心指标就是多模态能力，商汤多模态大模型的图文感知能力达到全球领先水平，在权威综合基准测试MMBench中综合得分排名首位，在多个知名多模态榜单MathVista, AI2D, ChartQA, TextVQA, DocVQA, MMMU 取得领先成绩。

「日日新5.0」在应用产品层面也实现了更卓越的多模态能力，支持高清长图的解析和理解以及文生图交互式生成，还可以实现复杂的跨文档知识抽取及总结问答展示，还具备丰富的多模态交互能力，下面看几个具体例子。

首先是一个很常见的例子，针对信息长图做核心内容的提炼和分析。有时长图尺寸很大，很多多模态大模型支持不了很大的图像分辨率，而「日日新5.0」提供了非常大的分辨率接口。

大家有时会把打车软件截图发给等待的朋友，这里面有司机信息、车的信息、车牌信息、时间信息等等一系列文字和图片信息，信息密度非常高。对于大模型的信息提取分析很有挑战。

「日日新 5.0」展现出了对于中文理解的优势，特别是对文本的分析和对场景的理解上非常出色，识别出来有手机信号中国移动和中国联通双卡双待，GPT-4没有识别出来的。包括对车牌、司机姓名等细节内容的提取，GPT-4的识别也有错误。日日新 5.0」对这类多模态信息的获取更加准确

最后，再看看「日日新 5.0」对应的数理能力。

上周，中国首位F1车手周冠宇完成了他在F1中国大奖赛的比赛。用大模型统计下周冠宇和F1赛事的情况。

One More thing

基于商汤「日日新 5.0」的智能编程助手代码小浣熊Raccoon发福利了，详情请戳下面海报：

（来源：商汤科技）

标签：商汤科技

我要反馈

相关链接

一场全球科技盛事，见证上海如何培育大模型产业发展新生态

2024年3月23日，“2024全球开发者先锋大会”(GDC)在上海徐汇顺利召开，本次大会以“模速空间——开发者的模力之源”为主题，以促进开源开放为引领，以... [详情]

2024年04月25日 2024全球开发者先锋大会

商汤科技董事长兼CEO徐立：AI 2.0时代的 “新质生产力工具”

“AI2.0时代，生成式AI被视为推动生产力进步的重要技术，如果能在知识、推理、执行三层能力上实现突破，将真正带来整个社会生产力的跨越式发展。”商汤科技董事长兼CEO徐立... [详情]

2024年04月25日商汤科技

两大认证“加持”!商汤与华为昇腾共筑人工智能产业新生态

近日，经华为综合评测，SenseCore商汤大装置AI云、商汤日日新·商量SenseChat大语言模型成功通过与华为Atlas系列服务器的相互兼容性测试，获得HUAWEICOMPATIBLE证书及认证徽标的... [详情]

2024年04月25日商汤科技

资讯热点

算力点亮AI | 东软携手生态伙伴共创算力网络产业链算力+能源协同优化助力数据中心绿色低碳转型格创东智支持广西职业院校工业互联网技能大赛成功举办仙工智能入选「2024 年上海市重点服务独角兽(潜力)企业榜单」 “基智创优血润新生检造未来”实验室管理学术交流研讨会成功举行欣旺达动力 “点晶”智能电芯传感器行业率先发布，为电池全生命周期安全保驾护航盛弘储能：以技术之光点亮微电网的星辰 “百城千站超充计划”落地成都，领充新能源助力让每位运营商收益更高一筹马瑞利与禾赛前照灯和激光雷达一体化解决方案亮相北京车展

专题报道

2024汉诺威工业博览会专题

2024 汉诺威工业博览会将于4月22 - 26日在德国汉诺威展览中心举行。作为全球首屈一指的工业贸易展览会，本届展览会

安全走向数字化

如果说安全是过程工业的基本盘，数字化是过程工业的新锚点，那么作为2023 NAMUR中国年会唯一的赞助商，HIMA与这次

第三届EESA储能展

EESA储能展是由储能领跑者联盟主办的品牌展会，创办至今已经连续举办了两届。为加快适应储能规模化发展的步伐，促进储能行业

视频

/resupload/guangzhi/AS00012420/1708312885679_1.jpg

西门子德国汉诺威探索交流之旅费斯托携创新产品亮相2024 CIBF 助力锂电池制造行业降本增效科思创打造材料回收闭环，助推循环经济建设 2024汉诺威工业展：施耐德电气以软件、自动化和电气化铸就工业影响力越疆 X-Trainer AI 机器人操作平台盛弘股份提升能源利用率，助推绿色低碳发展纳晖新能源战略投资微慕科技签约仪式