如图所示,NPU 4的性能/耗能比,相较于NPU 3高出2倍,且最高性能可达NPU 3的4倍。-英特尔

图为Meteor Lake与Lunar Lake跑Stable Diffusion 图片生成任务时的表现比较。Lunar Lake搭载了更强大的NPU 4,能负责原本由CPU和GPU处理的部分任务,因而提升性能/耗能比。-英特尔
GPU性能提升1.5倍,算力达67 TOPS
与前一代一样,Lunar Lake的图形运算区块由GPU及其他专责图形运算区块组成。相较于前一代分为4个区块,这一代则是拆成GPU、显示区块及多媒体处理区块共3区。英特尔在显示及多媒体运算区块中,从软硬件上分别针对各自专责工作进行效率及耗能优化,例如选择性画面更新及内存配置优化等。

Lunar Lake的GPU采取了新一代Xe2 GPU架构,由8个Xe2内核组成。每个内核采用原生SIMD16(单指令多重数据)引擎,内含8个512-bit Xe Vector Engines (XVE)矢量引擎,以及8个2048-bit Xe Matrix eXtensions(XMX)矩阵引擎。XVE引擎支持SIMD和SIMD 32矢量运算,以及INT8、FP16、BF16的矩阵运算,和各式三角、指数等超越函数运算。XMX引擎规格则是每周期能运行2048次FP16运算,或4096次INT8运算。
整体来说,Xe2性能相较前一代提升了1.5倍,特定任务甚至提升了12.5倍。总共67 TOPS的算力及对矢量、矩阵运算的支持度,也使Xe2 GPU能负责运行负荷较重的AI运算任务。


Xe2新硬件架构搭配专属的指令集,使其相较前一代GPU在许多表现上都相较第一代有大幅提升。-英特尔
4颗E-Core及4颗P-Core的CPU架构,大幅升级的E-Core是高能源效率关键
相较于Meteor Lake有低耗能E-Core、一般E-Core及P-Core三种性能的CPU,Lunar Lake取消了低耗能E-Core的设计,只搭载了4颗高能源效率E-Core及4颗高运算性能P-Core。其中,E-Core规格提升幅度尤其引人注目。
新一代E-Core采Skymont架构,IPC(每时脉周期指令数量) 相较前一代有大幅提升,整数运算任务增加38%、浮点运算任务更大增68%。同样性能下,这一代E-Core耗能只有前一代低耗能E-core的1/3。英特尔更宣称新一代E-Core在矢量运算及AI相关运算的性能较前一代提升1倍。
E-Core性能及能源使用效率大幅提升,意味着可以将更多日常运算任务留给低耗能的E-core,只有真正要求高性能的任务才会动用到P-Core。

以运行Microsoft Teams为例,Meteor Lake不时会需要将运算任务交由较耗能的P-Core来运行,甚至来回在不同CPU间调度。受益于E-Core规格大升级,Lunar Lake则能一直使用E-Core来运行此任务。-英特尔
高性能CPU P-core也升级为新一代Lion Cove架构,IPC相较前一代提升了14%。新架构下,内存、运算单位等多项硬件规格提升,且调控运转时钟频率的颗粒度更精细,能在同样耗能下挤出更多性能,减少硬件闲置情况。
不只如此,新P-Core还能根据当下运行的运算任务及温度来即时调控运转性能,而非根据预先设死的标准来调控。相较于后者做法,前者可以使CPU在不过热的情况下,用更高时钟频率运转。
除了运算单位升级,Lunar Lake其他升级包括:支持Wi-Fi 7与蓝牙5.4、搭载2颗LPDDR5x DRAM内存,运作速率8.5 GT/s,最多可至32GB,以及更新了能源管理及线程分配机制来更进一步提升能源使用效率。英特尔还推出了Lunar Lake开发者套件,辅助开发者针对新处理器开发AI应用。
Lunar Lake预计第三季上市,至于搭载Lunar Lake的Copilot+ PC何时会推出,英特尔没有进一步揭露更多细节。



2024-06-04
