
如圖所示,NPU 4的效能/耗能比,相較於NPU 3高出2倍,且最高效能可達NPU 3的4倍。-英特爾
圖為Meteor Lake與Lunar Lake跑Stable Diffusion 圖片生成任務時的表現比較。Lunar Lake搭載了更強大的NPU 4,能負責原本由CPU和GPU處理的部分任務,因而提升效能/耗能比。-英特爾
GPU效能提升1.5倍,算力達67 TOPS
與前一代一樣,Lunar Lake的圖形運算區塊由GPU及其他專責圖形運算區塊組成。相較於前一代分為4個區塊,這一代則是拆成GPU、顯示區塊及多媒體處理區塊共3區。英特爾在顯示及多媒體運算區塊中,從軟硬體上分別針對各自專責工作進行效率及耗能優化,例如選擇性畫面更新及記憶體配置優化等。
Lunar Lake的GPU採取了新一代Xe2 GPU架構,由8個Xe2核心組成。每個核心採用原生SIMD16(單指令多重資料)引擎,內含8個512-bit Xe Vector Engines (XVE)向量引擎,以及8個2048-bit Xe Matrix eXtensions(XMX)矩陣引擎。XVE引擎支援SIMD和SIMD 32向量運算,以及INT8、FP16、BF16的矩陣運算,和各式三角、指數等超越函數運算。XMX引擎規格則是每周期能執行2048次FP16運算,或4096次INT8運算。
整體來說,Xe2效能相較前一代提升了1.5倍,特定任務甚至提升了12.5倍。總共67 TOPS的算力及對向量、矩陣運算的支援度,也使Xe2 GPU能負責執行負荷較重的AI運算任務。
Xe2新硬體架構搭配專屬的指令集,使其相較前一代GPU在許多表現上都相較第一代有大幅提升。-英特爾
4顆E-Core及4顆P-Core的CPU架構,大幅升級的E-Core是高能源效率關鍵
相較於Meteor Lake有低耗能E-Core、一般E-Core及P-Core三種效能的CPU,Lunar Lake取消了低耗能E-Core的設計,只搭載了4顆高能源效率E-Core及4顆高運算效能P-Core。其中,E-Core規格提升幅度尤其引人注目。
新一代E-Core採Skymont架構,IPC(每時脈週期指令數量) 相較前一代有大幅提升,整數運算任務增加38%、浮點運算任務更大增68%。同樣效能下,這一代E-Core耗能只有前一代低耗能E-core的1/3。英特爾更宣稱新一代E-Core在向量運算及AI相關運算的效能較前一代提升1倍。
E-Core效能及能源使用效率大幅提升,意味著可以將更多日常運算任務留給低耗能的E-core,只有真正要求高效能的任務才會動用到P-Core。
以執行Microsoft Teams為例,Meteor Lake不時會需要將運算任務交由較耗能的P-Core來執行,甚至來回在不同CPU間調度。受益於E-Core規格大升級,Lunar Lake則能一直使用E-Core來執行此任務。-英特爾
高效能CPU P-core也升級為新一代Lion Cove架構,IPC相較前一代提升了14%。新架構下,記憶體、運算單位等多項硬體規格提升,且調控運轉時脈頻率的顆粒度更精細,能在同樣耗能下擠出更多效能,減少硬體閒置情況。
不只如此,新P-Core還能根據當下執行的運算任務及溫度來即時調控運轉效能,而非根據預先設死的標準來調控。相較於後者做法,前者可以使CPU在不過熱的情況下,用更高時脈頻率運轉。
除了運算單位升級,Lunar Lake其他升級包括:支援Wi-Fi 7與藍牙5.4、搭載2顆LPDDR5x DRAM記憶體,運作速率8.5 GT/s,最多可至32GB,以及更新了能源管理及執行緒分配機制來更進一步提升能源使用效率。英特爾還推出了Lunar Lake開發者套件,輔助開發者針對新處理器開發AI應用。
Lunar Lake預計第三季上市,至於搭載Lunar Lake的Copilot+ PC何時會推出,英特爾沒有進一步揭露更多細節。