窝牛号

让AI从名词走向现实!第三代骁龙8移动平台技术解读

昨日凌晨,高通正式开启了2023年骁龙技术峰会。作为驱动未来一年安卓旗舰手机的新一代移动平台,第三代骁龙8自然是此次活动上大家的重点关注对象。

高通宣称第三代骁龙8是其首款“专为生成式AI”而精心打造的移动平台,峰会上反复强调AI对未来人们生活、生产方式的影响和改变等,这无疑透露出这一代骁龙8不同以往、与众不同的特质。

那么全新一代骁龙8移动平台的这些变化将给智能手机带来哪些新的体验?从目前公布的技术细节和周边信息来看,我们认为主要集中在三点:1.当然是更强大的算力;2.自研Adreno GPU的一系列新特性;3.AI真正走向实用。

纯64位架构的进化

自2019年高通发布骁龙855以来,基于“大中小”三丛集的CPU架构设计,就几乎成为了旗舰手机芯片的标配,“1超大3大4小”早已成为整个行业广为接受的标准。

不过在第二代骁龙8移动平台上,高通打破了这种传统,具体来说,它采用了“1+2+2+3”的CPU方案,其中包括一个Cortex-X3超大核、两个Cortex-A715大核、两个Cortex-A710大核,以及三个Cortex-A510 Refresh小核。

而到了今年的第三代骁龙8,CPU架构再一次发生改变,采用了新的“1+5+2”架构,包括1个基于Arm Cortex-X4技术的主处理器核心,主频最高可达3.3GHz;5个最高3.2GHz的Cortex-A720性能核心(2.96GHz Cortex-A720 *2,3.15GHz Cortex-A720 *3),以及2个基于Cortex-A520的能效核心,最高频率为2.27GHz。

为什么高通会如此设计第三代骁龙8的CPU?实际上,在去年第二代骁龙8面市时,其仍然保留将32位应用跑在效率内核和部分性能内核上的做法,就引发了一些争议。

为此高通的工程师们还专门解释过,因彼时包括中国大陆在内的一些市场,依然有不少32位应用存在,比如部分游戏、工具和银行类的App,保证这部分应用的体验也是非常重要的。同时,高通也会逐步推动32位向64位应用的转变升级。

到了今年下半年,OPPO、vivo、小米等主流应用商店已逐步完成清理仅支持32位的应用,并不再允许仅32位的应用上架以及更新。因此,到了第三代骁龙8,理所当然完成了纯64位架构的进化。

那么,使用这种CPU架构设计会对第三代骁龙8的性能、能效带来何种影响呢?

从结果来看,得益于更多的“大核心”和更高的平均核心主频,第三代骁龙8的CPU性能提升了30%。在台积电N4P工艺、更大的缓存设计(所有核心共享12MB三级缓存,前代是8MB L3+6MB 系统缓存),以及更先进的LPDDR5T内存加持下,其能效也有着20%的改进。

我们也已经对全球首款搭载第三代骁龙8的小米14进行了性能实测,从跑分来看,安兔兔1966467分,Geekbench单核得分2236,多核6816,相比上一代都有较大的提升。

相比性能表现,能效提升其实更让人感兴趣。按照卢伟冰的说法,搭载了第三代骁龙8的小米14,运行原神能够做到 59.3 FPS 的帧率情况下,将机身温度控制在 43.2℃,功耗降低 10%。

我们用小米14实测的原神表现,30分钟跑出了 59.1FPS平均帧率,且1.7左右稳帧指数也是目前安卓阵营最强,平均功耗4.6W,耗电14%,手机背面温度42.1℃。我们不妨大胆预测,在更高的能效表现下,第三代骁龙8很可能是一颗“冰龙”。

真正主机级游戏体验

再来看GPU方面,第三代骁龙 8搭载的是Adreno 750 @903MHz,官方表示其性能和能效均实现了25%的提升。提升幅度虽然看起来并不夸张,但它是在上代性能提升25%的基础上得来的。

实际上高通在GPU上一直是领先状态,它也是目前安卓阵营中唯一一家可以不依赖外部授权,独立开发自研GPU架构,自主编写和优化GPU驱动的厂商。这也使得它不仅具备针对老机型的长期系统和驱动更新,在新技术、游戏的适配方面,也有着天然优势。

为实现“硬件光线追踪”的实装,在第二代骁龙8移动平台上,高通就重新设计了自研的Adreno GPU,为其加入硬件光追单元。这次则又为第三代骁龙8加入了图像运动引擎2.0,支持游戏主动提帧,无需游戏适配即可运行最高240Hz的超高帧率,也能原生支持最低1Hz的待机帧率,平衡性能和功耗。

第三代骁龙8还支持类似DLSS、FSR、XeSS的游戏超分技术,手游分辨率可以做到最高8K。没错,8K 240Hz,手机上也能达到这样的游戏画面体验水平了。再配合新加入的实时全局光照和反射技术,可以说已经堪比PC级高端显卡。

当然,手机游戏对性能要求也达不到这么高。不过,从今年苹果将主机游戏移植到iPhone 15系列上,也可以看到,手机实现主机级游戏体验,是大势所趋,就看安卓生态下的后续优化了。目前,虚幻引擎UE5 Lumen已经率先支持该技术,并特别针对骁龙平台做了深度优化,使其依然具备着对标实力。

另外还有影像方面的提升,还记得第二代骁龙8上首次带来“认知ISP”这一全新设计,能通过实时语义分割实现照片和视频的自动增强。第三代骁龙8集成了三个认知ISP,均为18-bit。拍照支持单个1.08亿像素,或者两个6400万像素+3600万像素,亦或者三个3600万像素。视频支持8K/30 HDR格式录制的同时捕捉6400万像素照片,也支持4K/120高清慢动作视频。

不仅摄像头规格更高,第三代骁龙8图片语义分割可以支持到多达12层,对物体、场景的识别与分割更加精准。其他细节部分,超级夜景支持拍照和录像,并且大量运用有AI,可以提高效率和能效;还有Vlogger View模式,能利用前后双摄像头结合ISP,同时捕捉两个画面等。

整体来看,第三代骁龙8在GPU带来的诸多新特性,综合性能上有质的飞跃,也保持了安卓阵营的领先地位。

AI算力与实用性暴涨

在今年的骁龙技术峰会上,最大的主角其实是AI,早前的预热海报就已透露出,AI是第三代骁龙8的主要升级方向。

具体来看,第三代骁龙8 AI硬件单元这次升级为Hexagon NPU,高通专门为其配备了独立的供电电路,解决了此前一些复杂的功能模块之间因为共用供电电路,导致在不需要的时候也会被频繁唤醒、白白耗电的问题。这意味着,当手机不需要用到AI相关的算力时,Hexagon NPU可以真正地实现“完全断电”,从而帮助能效提升了40%。

高通AI引擎的异构计算架构,以及Hexagon NPU矢量单元与内存之间增加的直连通道,也意味着这次第三代骁龙8上的AI是全芯片架构的加速,CPU、GPU、ISP、DSP各种传感器都能调用AI模块进行加速,整体性能相较上一代提升了多达98%,带来强大的终端侧 AI 能力。

今年7月,高通便已宣布与 Meta携手优化Llama 2 大型语言模型,让其直接在装置上执行,不再依赖云端服务运作,之前高通已经能够在手机上脱离云端实现超过 15 亿参数的大模型运行。现在第三代骁龙8可处理的大模型参数超过100亿,每秒可执行最多20 Token,实现了 AI 算力的大幅提升。

在AI计算兼容性上,第三代骁龙8支持INT4、INT8、INT16、FP16等各种整数和浮点格式,以及INT8+INT16混合精度。开发方面,高通提供了全新的一体化AI Stack开发平台,首发支持20多个不同模型,支持Pytorch等各种AI框架,让开发人员能够使用高通平台的 AI 功能,推出全新生成式 AI 应用。

近年来,智能手机行业开始了对大模型的应用提速,包括华为、小米、OPPO、vivo、荣耀在内的中国品牌参与者,都相继高调入局大模型。一些厂商已经将大模型正式带到手机上,一些厂商处于准备阶段,只差临门一脚。

高通的混合 AI 架构几乎适用于所有生成式 AI 应用和终端领域,无疑将驱动移动终端领域生成式 AI 阵地的扩大。这次第三代骁龙8在AI引擎的提升可以用“蜕变”来形容,对高通来说,这也是基于其技术产品的一大差异化优势。毫无疑问,它势必会成为各大安卓厂商争相追捧的一颗芯片。

不过还是那句话,骁龙原材料是端上来了,至于能做成什么水平,还要看各厂商的调教功底了。

本站所发布的文字与图片素材为非商业目的改编或整理,版权归原作者所有,如侵权或涉及违法,请联系我们删除

窝牛号 wwww.93ysy.com   沪ICP备2021036305号-1