史上首款2nm芯片有多强？三星Exynos 2600性能分析！

By 极客湾Geekerwan

Summary

Topics Covered

HPB封装：内存不叠SoC散热翻倍
三星2nm GAA工艺终于不拉了
1+9核CPU：刷分王者，体验噩梦
GPU理论算力7TF但内存带宽是木桶短板
工艺制程才是芯片成败的决定性因素

Full Transcript

今天我们要聊的这颗芯片有点特殊他是三星在欧洲/东南亚版本的S26和S26+上搭载的自研芯片 Exynos 2600 在十年前 Exynos曾经被我们奉为安卓之光因为当时高通那边的火龙810 把各大安卓厂商弄得鸡飞狗跳

但三星自家的Exynos 7420 凭借非常优秀的三星14nm FinFET工艺成了安卓大区唯一能与苹果分庭抗礼的希望但在台积电支棱起来后三星工艺就走了下坡路连带着Exynos芯片也寄了能效落后高通竞品好几代这么多年来三星也只敢在部分市场使用Exynos

不过如今的Exynos 2600 似乎看到了一些希望首先三星比台积电更早用上了GAA工艺率先进入了2nm节点他会不会不像以前的三星工艺那么拉了呢？

其次 Exynos 2600也是世界上第一颗采用了HPB封装的手机芯片有望解决手机PoP封装内存叠在SoC上导致的积热问题再者它在芯片设计上也有不少看头比如说它的CPU是一个 1超大+9中核的离谱配置

而它的GPU更是用上了AMD最先进的RDNA4架构授权连AMD自己的核显都没这个待遇呢是不是听完我的描述你也很想知道这个芯片到底是咋回事吧？

哎正好我还有一位研究芯片的朋友@谈三圈也对它感兴趣所以我们今天就买了一台新加坡版的S26 把Exynos 2600磨开来好好分析一下再把性能能效这些全部测一遍那么就开始吧那我们先把手机拆开来看看好了光拆出主板你就已经能发现一些端倪了

哎，这怎么有一个5G基带在这儿？

原来Exynos 2600并没有内置基带而是采用了自家Shannon 5400的外挂基带和谷歌Pixel 9同款采用三星4nm工艺制造可是这就奇怪了三星啥都是自家做啊他又不像之前的苹果那样需要依赖高通基带没道理不能集成啊？

其实以前Exynos一直都是集成基带这代被迫外挂实际上和芯片本身的设计有关系我们待会就会揭晓原因了上面这个大芯片就是Exynos 2600 SoC本体了不觉得他的封装看起来很神奇吗？

跟一般的手机芯片都不一样啊正常来说手机芯片底下是SoC 上面是内存两层叠叠乐就是我们叫PoP封装为啥要叠叠乐呢？

因为手机主板非常小空间寸土寸金如果不把内存叠在CPU上就会挤占其他部件的空间比如影响到电池容量叠叠乐在过去十年里一直是手机芯片最合理的封装方案但随着手机的功耗越来越高叠叠乐的问题也暴露出来了就是积热你在内存芯片上贴散热

是很难把底下SoC的热量导出来的所以为了解决这个隔靴搔痒的问题这次三星就提出了HPB封装也就是你看到的这种设计为了让大家看得更清楚我们这次拍了CT 大概就是这么一个结构他是把内存颗粒缩小一半面积并且把内存的BGA触点

全部转成一条竖长的界面移到基板的一侧旁边的SoC上面一层树脂填平高度 SoC正上方这么大片空间就可以涂上硅脂贴上一个铜制导热顶盖这个导热顶盖就叫HPB 根据我们的测绘来看他压的这个位置正好就是芯片的CPU和GPU这两个大热源的正上方

想得还挺周到啊这么设计就能把SoC的主要热量尽可能高效地导出到均热板上了从原理上看这似乎是一个挺容易理解的创新那为什么是三星跑出来率先做这件事儿呢？

因为三星又做内存又做SoC呗他肯定比大多数厂商更有这个条件去试水这些有的没的 HPB到底带来多少散热提升其实很难量化但我们在测试过程中已经能明显感受到差别了还记得我们8 Elite Gen5那期节目里讲的液氮跑单核都能过热降频根本稳不住吗？

我们这次测Exynos 2600 确实就没有再遇到这么严重的积热了虽然因为绝对功耗高再加上S26不算什么顶级散热也并非完全没有降频但基本上用个强点的散热背夹也是可以压个七七八八的不需要液氮就能跑满还挺管用的那在聊芯片架构之前

我觉得有必要先来聊一聊它所使用的这个三星2nm GAA工艺到底有没有比英特尔的18A和台积电的3nm更强呢？

有请我们的好朋友——谈三圈来分析一下吧谢谢云飞送的稀有芯片我们第一时间就把它切了在X和Y方向上切了两刀然后放到20万倍的电子显微镜下来一窥三星2nm工艺的秘密我们切芯片的刀法还是比较精准这次应该是正好切到了芯片里晶体管密度最高的部分待会细讲先来看一下2nm晶体管的剖面这里每根头顶悬浮3枚纳米片

就是典型的GAA晶体管形貌了三星这边叫MBC-FET 英特尔那边叫Ribbon-FET 其实都是指的栅极全环绕简称GAA了旁边放一粒老演员噬菌体大家感受一下大小在这个尺度下去雕刻晶体管还是有一点难度的尽管三星是最早开始量产GAA的 22年底出货的3nm就已经是GAA了但客观讲仅从这次实验数据看

三星2nm GAA的形貌控制与工艺一致性比英特尔还差点意思其实是少了一片纳米片这些躺平的板板简单说就是晶体管的并联通道所以同等条件下多一枚纳米片能提供更大的驱动电流有利于提升逻辑单元的性能但代价肯定叠4片比叠3片的工艺挑战更大当然除了堆数量还可以改变纳米片的宽度来调节驱动电流和功耗

比如这次三星的剖面里我们发现排列有宽片和窄片两种尺寸的晶体管混合使用来平衡芯片不同区域路径的能效 18A里面也是宽窄片混用只是比例不同但三星的另一个问题是纵向排列的这3枚纳米片尺寸不是很一致我们大致手工测量了一下都有点上小下大上窄下厚头顶怎么尖尖的

这应该是整体工艺的问题了因为从器件设计的角度同一种晶体管我们通常希望从上到下的纳米片尺寸尽量保持一致否则并联宽度不同每片的电流会分配不均相比之下英特尔的形貌一致性就控制的更好一些纳米片更接近等宽排列 18A因为我们最近也切了里面还能看到背部的晶圆供电和电容阵列具体以后单独讲

当然18A也有缺点就是它的单元库占地面积大晶体管密度比较拉而三星2nm里面要不是我们这次刀法好切到了以前从没报告发现的也许是三星最高密度的单元库就是这两道沟槽之间的窄片单元包含PMOS和NMOS两类晶体管总的体长只有约143nm 纵向的栅极间距约50nm

这个测出来我们还是比较意外的因为比三星前代工艺的尺寸要小不少缩放的步子迈的有点大这里放一个英特尔我们实测的单元库大家感受一下占地面积如果以此来计算极限晶体管密度两者能相差约20% 看得出三星在工艺上也是太想进步了而与这两家对比发哥天玑9500用的台积电3nm

仍然属于鱼鳍晶体管FinFET的古法工艺因为台积电要到今年的2nm才会启用GAA 理论上由于GAA把三面环绕的鱼鳍片升级成了四面全包的纳米片栅极对沟道漏电的控制力更强所以GAA器件尺寸能缩得更小晶体管密度能做更大但GAA毕竟刚开始量产工艺和良率还有待优化不可能一下缩得那么小

而台积电的第三代3nm工艺N3P是它迭代打磨十年后最后也是最强一代的FinFET工艺了所以N3B里最紧凑的单元库能做到体长140nm 栅极间距47nm 这个尺寸其实比三星2nm还要略小一点点所以如果不看晶体管种类只算极限密度的话三星2nm与台积电N3P差不多英特尔18A暂时落后

但它自己有减少压降的专属buff 而且不做手机芯片这里就不讨论了等苹果真的用上英特尔14A工艺了到时再拉出来做三家对比综上从我们切开芯片的解剖结果来看三星2nm与台积电3nm的最高晶体管密度接近再结合我们能谱分析的结果从金属材料COAG到高K栅极先进制程里这些常见技术两家也都用上了所以单看工艺

Exynos 2600跟三星前代相比进步很不错尤其是工艺库的缩放大家可以期待一下能效上的进步但跟同期发哥的天玑9500相比毕竟还是早期GAA 不会比最强3nm有什么工艺上的神秘加成当然制造工艺只是芯片性能的一部分具体让我们看极客湾的真机实测交给云飞感觉这三星2nm

光看密度虽然还是有点注水啊但好在赶上台积电N3的屁股也算是不错了好歹比以前强那了解完工艺我们也该好好分析一下Dieshot了还是请我们的老朋友们把他磨开来看看吧应该说这个Exynos 2600真的是很巨大在没有内置基带的情况下

它的核心面积都达到了141.5平方毫米这是本世代乃至几乎所有手机芯片里的面积之最考虑到封装限制 140平方毫米其实已经达到手机芯片的极限了这也是为什么三星会把基带外置这个SoC实在塞不下了如果加上基带160多平方毫米那得和M5差不多大了

不含基带都这么大面积这Exynos 2600里到底塞了些啥玩意啊？

其实这个面积主要是被他的GPU和NPU给占掉的这片就是它的Xclipse 960 GPU了它占据了整个SoC 23%的面积远远大于其他家单看GPU部分的话它的面积比高通的GPU整整大出了46% 太吓人了

然后三星这个NPU也非常巨大比其他几位对手要大得多至于它的CPU部分呢大小就比较正常了和隔壁高通发哥的占地面积差不太多那我们就先从这个CPU说起好了三星这次的CPU也终于是抛弃了A5xx小核转向了全大核架构但是他的全大核

跟另外三家的全大核有那么亿点点不一样这次的Exynos 2600 用了一个C1 Ultra超大核搭配9个C1 Pro中核！

中间完全没有拿C1 Premium大核来衔接哇一个爸爸带9个小朋友这是不是有点太离谱了？

不过在三星这里核心并不是被简单粗暴的分成1超大+9中这9个中核还是被分成两组了的其中一组3颗中核峰值频率会拉高到3.25GHz来充当大核剩下一组6颗中核最高2.75GHz 所有的C1 Pro中核都配备1M L2缓存最后就是这个光杆司令C1 Ultra超大核了该说不说

三星在缓存配置上还是挺大方的给了超大核3M L2缓存比发哥的9500更大再外加总共16M L3缓存和24M SLC系统缓存这简直就跟缓存不要钱一样那么问题来了能不能从他这个CPU的单核能效看出这次三星2nm工艺的电气性能呢？

我们首先就掏出SPEC 2017 来测一下它CPU超大核的能效既然它的超大核用的是ARM的C1-Ultra 和台积电3nm的天玑9500同款那么对比9500的单核能效就很有看头了实测在整数测项里 Exynos 2600这颗超大核能效好像完全不输给天玑9500啊

两位缠在一块非常焦灼并没有出现以往三星芯片那种明显差很多的情况三星中高频部分甚至还有些微的领先相比8 Elite Gen5的超大核 Exynos 2600也是差距不大莫非真给他三星整明白了？

这工艺的表现真的还可以啊我们也看了下浮点测项 Exynos 2600这颗C1 Ultra 会比9500的C1 Ultra略微逊色一丢丢但整体基本上还是半斤八两的水平说他是当代旗舰水准的能效是绝对没毛病的当然光看单核能效我也没办法直接下定论毕竟哪怕用着一样的IP核

处理器后端设计也会影响表现我们在玄戒那期视频里就证明了这一点但至少能看出来三星这次的SF2工艺应该是没有比台积电N3差多少的这比以前还是强多了三星工艺终于不算拖后腿了不容易啊！

解开了三星2nm工艺的谜团我还有个特别好奇的就是这个1+9核的离谱CPU配置到底疗效怎么样？

搞这么多小核至少多核刷分应该非常在行吧你还别说他真就太适合刷分了来请看GB6的CPU多核能效曲线你敢信？

Exynos 2600居然直接拉爆了8 Elite Gen5啊！

而且是全频段领先多核相比发哥的9500那是强得不知到哪里去了我去三星登顶多核能效榜搁以前你能想象的了吗？

太扯淡了！

十核打八核优势在我啊！

其实玩PC比较多的同学早就已经看习惯了前几年英特尔也好这两年AMD的笔电U也好都是在猛堆小核数量拉高多核性能三星这次只是做到了一个极端就是完全没有中间性能段的核心只堆一颗单核剩下全拿小核刷高多核分这下分确实刷上去了

能效曲线确实好看得很但实际体验是不是也有那么强我觉得并没有因为如今的手机应用工况就没有那么两极化要不只吃单核要不吃满多核根本不是这样的很多应用都要求有多种性能级别的多个核心可以灵活调用不管是苹果高通那种两个超大核

还是发哥的1+3+4 都是有一定梯度的可以尽量合理地去调用三星这个1+9 软件调度起来应该是很头大的一方面它得把好几颗小核提频去充当大核这几颗小核会离开甜点的能效区间另一方面很多软件也调用不了这么多核心可能最终还是有几个核一直都用不上

那它这个优秀的能效曲线就和实际体验脱节了顺带一提我们最近采购了全新的电源设备压降比之前低很多所以从这次开始我们就把所有能效曲线都用新电源复测了一遍应该越往高频段走功耗会比之前要越准所以大家如果看到能效曲线前后有点不一样也不要觉得奇怪

我们之后也会把新测的能效曲线上传到socpk的再来看看GPU 刚刚我们讲了这次Exynos的GPU占地面积巨大无比这颗Xclipse 960到底堆了多少料呢？

我们知道这玩意是基于AMD的RDNA4架构授权魔改来的但和PC上的RDNA4显卡非常不一样 Exynos的GPU砍掉了大量特性比如你在他的驱动里是完全找不到WMMA的 BF16/FP8/INT8这些加速他全都跑不了因为他把AI加速单元全部砍掉了

这也意味着他不可能支持FSR4的超分既然砍掉了大量三星认为不需要的单元为啥这个GPU还这么庞大呢？

因为三星似乎是着了魔一样地在给他疯狂加料作为一颗16CU的GPU 他的FP32 ALU规模要比PC上同为16CU的890M核显大得多！

正常RDNA2时期的GPU 每个CU里包含64组FP32 ALU 从RDNA3开始AMD带来了VOPD技术每个ALU在合适指令组合下可以双发FP32 所以峰值情况下可以等效128组ALU 不管是780M、890M核显还是RDNA4桌面显卡都是这个规格

那三星这个魔改RDNA呢？

哎！

他每个CU总共有224组FP32 ALU！

而且不是VOPD扩出来的是实实在在堆了224组ALU！

我跟你说就不管是N卡A卡还是I卡目前市面上没有任何一家的GPU 单个计算单元规模有他大的这个真的很离谱造成的结果就是三星这颗Xclipse 960 GPU的FP32浮点算力我们测出来最高能干到7TFLOPS

比同样16CU的890M算力高得多听起来很牛逼是吧？

但是，我要开始反转了浮点算力高就代表图形性能一定高吗？

其实未必还有一个决定性因素是内存缓存的带宽这个东西是遵循木桶原理的你哪怕无脑堆算力内存带宽不够很多算法卡在内存瓶颈上发挥不出来那你多堆的算力就浪费掉了很不幸的是手机的内存位宽只有主流PC轻薄本的一半

带宽比PC小得多顶天80+G/s 而且和大方到缓存不要钱的CPU不同 Exynos 2600这么大一颗GPU也没有给特别多的L2缓存给了2M吧这也就和桌面端890M核显差不多这点点内存缓存带宽其实只够这颗特大GPU跑在较低的频率上

当然这也无可厚非毕竟手机GPU就是低频用的最多那为什么不一开始就做小一点规模抬点频率呢？

能效可能半斤八两但面积却能小得多节约了成本还能把基带集成进来怎么想都感觉更合理啊老实说我是有点没搞明白为什么要在没有大缓存的情况下堆这么多ALU的这里我做了一个非常粗略的屋檐模型来说明问题咱们姑且不说缓存吧就单说内存

底下这个数字代表了一个算法读写一次内存能续航多少次浮点运算或者说得更直白一点游戏里的各种算法对内存带宽有多敏感三星这个GPU如果拉满跑只有这个值达到82的算法才能完全吃满它的浮点算力那我们来看看常见的一些图形算法是什么样的内存开销比如最原始的模糊算法

这个是极端吃内存的大概就只有零点几意思是读写1byte内存只够做零点几次浮点运算那像延迟渲染写入G-Buffer 差不多是1-10 SSR屏幕空间反射大概在5-20 哪怕是不那么吃内存的体积雾或者粒子特效这个值也就20以上只有PC上拉满设定可能才超过100

这种效果在手游里真的很罕见所以大多数手游图形算法在这颗GPU满频率上都是撞内存墙的当然前面也说了正常工况GPU也不会跑高频基本都是降到低频用的那他这个线就降到和其他家差不多位置了那就是花了更多芯片面积实现了跟别人一样的效果

怎么算都挺浪费的但反正造芯片的钱是三星掏的他也不外卖面积大了造价贵了对于用户来说也未必感知很强大家最关心的估计还是能效对吧？

这个RDNA4核显到底实际性能有多强呢？

我们测下来放在移动端确实还是挺强的这是它的3DMark SNL能效曲线他这颗GPU 毫不意外地能效全程压制高通的8 Elite Gen 5 相比目前手机GPU王者天玑9500 能效也已经很接近了实际上他这个SNL 3200多分的峰值成绩

确实超过了PC上的核显常青树780M 比起频率更高内存带宽更大的890M也差得不远这波在核显上猛猛堆料至少能效上还是挺好看的只要没多收钱对于用户来说就没问题但三星也确实是在工艺制程不差的情况下用比别家大得多的GPU面积

实现了差不多的能效所以你要问我这个芯片设计上好不好呢？

我也很难完全赞同它的设计思路吧总的来看这个Exynos 2600最大的好消息确实还是这个三星2nm工艺制程不拉了密度能效都过关三星工艺总算支棱起来了并且通过疯狂加中核实现了纸面上很好看的CPU多核能效 GPU大幅魔改AMD的RDNA架构

能效同样也很不错但狂堆ALU也有点用力过猛了占的面积过大就没法内置基带了我觉得这Exynos 2600虽然不是什么烂货吧但我高低也得给他颁一个年度最抽象芯片奖但是再怎么抽象他相比前几代三星芯片还是好了太多太多

那么问题来了理论能效这么强的一颗芯片实际上在手机的各种应用里能打得过高通竞品吗？

我们干脆又买了台国行的S26 搭载骁龙8 Elite Gen 5 for Galaxy 直接拿它俩对比一下三星打三星够公平吧？

那首先就来玩点游戏看看好了先来看一个它一定能跑动的游戏原神我的初衷是先找一个一定能跑60帧的游戏这样能更准确地通过功耗看出来能效差别但这一上来就给了我们一个下马威啊没想到理论能效这么强的Exynos 2600 玩个原神也并不能全程贴满60帧

到了后半截17分钟开始也是会有一丁点降频掉帧的那我们就对比前半截打满的功耗这台Exynos 2600的S26是整机5.3W 作为对比隔壁高通8E5的S26只有4.4W 搭载8E的S25也不过4.7W多当然如果是拿出8Gen3机型

那个功耗就高太多了三星这个Exynos2600再怎么说能效也是远远强于8Gen3的但确实理论多核干8E5 游戏能效却打不过8E 还是稍微有点让人失望的这其实我早先就预料到了前面也讲了嘛这9个中核就是刷分猛猛刷实际用起来有得苦了

从原神的调度来看它就是乱七八糟他的CPU7和CPU8会交替冲到很高的占用上但一个核占用高另一个核是完全不干活的 CPU6和CPU9也都基本没动与此同时看频率玩个原神都要把这9个中核爆拉到将近2GHz 这个调度策略真的何意味作为对比

8E5虽然三星也关掉了一个超大核用但整体占用一直是比较低的中核在数量少得多的情况下频率也仅仅控在1.2GHz左右节省功耗这才是一个正常的调度策略 Exynos这个跑法实在是很离谱啊能效不好看也是情理之中了只能说优秀的三星工艺和最新的ARM架构还能carry它接近个8E水平很不容易了

原神都跑这个性能那其他游戏就更不必说了一旦CPU不够用要看调度的时候你可想而知会有多拉比如明日方舟终末地我们武陵城跑图实测30分钟下来 Exynos 2600只能跑到30多帧远远不如8E和8E5的三星机型这个性能仅仅和8Gen3机型半斤八两

当然5.4W的功耗还是比8Gen3低多了但你也看到了三星根本没法调度好这个10核CPU 其实一开始这段它甚至是能跑满60帧的因为超大核居然动起来跑高频了那代价就是功耗跑到10W多撑不了多久就降频了不过一个三星手机居然十几瓦功耗还能撑两分钟

而不是秒降频感觉HPB确实起到了一些作用啊最后我们也测了一下鸣潮拉海洛摩托跑图864P跑个40多帧能效依然介于8Gen3和8E之间忽略功耗单纯比游戏性能依然没干过8Gen3的S24 我说什么来着？

这玩意确实是调度噩梦吧？

除了游戏之外大家应该也比较好奇这个国际版S26续航表现怎么样？

Exynos 2600机型的续航会和它的理论能效更接近还是像游戏一样比较拉呢？

看起来这个续航是比较拉的国际版S26在我们的极客湾5G续航模型3.5里仅仅坚持了6小时45分钟相比S26国行少了整整一个小时续航对于本就续航不长的机器来说少一个小时是极为致命的在电池加大的情况下

它续航也就和上一代8E的S25差不多所以日用能效依然是干不过8E机型的这个续航可能就比Google Pixel 10好那么一丝吧都是吊车尾水平不过续航差的锅并不能全部扣在Exynos 2600上我觉得罪魁祸首可能是外挂基带没办法

这基带不仅用着远不如SoC的三星4nm工艺制程还需要额外的电路有额外的启动功耗还占了主板空间外挂基带就是坏文明这一点苹果已经深受其害了去年小米玄戒我们也看到影响不小三星这个我是真觉得很抽象那两家实在是没办法

而你三星明明设计制造全靠自家完全可以做到协调各部门设计为什么还是把基带外置了呢？

堆这么大面积的GPU而不放基带真的合理吗？

反正我是有点看不明白但不管这次的Exynos 2600在设计上有多少抽象问题总体上还是被三星SF2工艺优秀的能效表现给盖过去了从这个角度来看工艺制程确实是当代芯片表现的决定性因素以前三星工艺拉芯片怎么做都拉现在工艺赶上来了

芯片再怎么设计都差不到哪儿去还是挺让人感慨的讲到这里我们对于三星Exynos 2600这颗神奇芯片的分析就已经做得差不多了这个视频信息量够大吧？

我们也是花了好长好长时间来分析如果大家看得过瘾有所收获的话一定记得点赞收藏转发支持我们一下记得关注我们极客湾频道也别忘了去关注一下@谈三圈的频道这种干货满满的长视频我们可以多来一点同时也感谢“安全研究团队DARKNAVY·深蓝” 通过内核漏洞root了这台S26手机

我们才得以挖掘出这么多的信息好了以上就是本期节目的全部内容我是云飞我们下次再见了 bye bye

Loading...

Loading video analysis...