20140925_Intel_NT03P1  

英特爾Gen 8執行單元包含內有多個通用暫存器的執行單元,其中部分支援特定架構的暫存器

英特爾(Intel)向來吝於透露該公司的嵌入式繪圖處理器(GPU)核心內部細節,不過在不久前舉行的年度開發者論壇上卻主動深入介紹了自家的GPU。HD Graphics 5300是一款衍生自英特爾第八代(Gen 8)處理器繪圖處理架構的首款產品,看來是存在於英特爾鎖定平板電腦與其他可攜式裝置的新型 Core M 系列處理器中。
Core M 在 CPU核心、快取記憶體以及GPU之間採用環狀匯流排(ring bus),每個連結的處理器或快取記憶體有專用的本地介面。該環狀互連是寬度32-byte的雙向資料匯流排,並有負責request、snoop與acknowledge等不同功能的個別線路,讓該款GPU可扮演「一等公民(first-class citizen)」角色。

GTI (graphics technology interface)是該款GPU與處理器SoC其他功能區塊之間的閘道器,有助於CPU核心之間、以及可能與其他固定功能元件(如攝影機成像流水線)的溝通;在該款GPU的某些版本,英特爾將經由GTI的寫入頻寬加倍,並實現了CPU核心與GPU之間的一致性共享虛擬記憶體。

這種架構基於所謂的執行單元(execution units,EUs),擁有7個執行緒、每個執行緒包含128個通用暫存器;EU內的主運算單元是一對SIMD浮點單元(FPU),同時支援浮點與整數(integer)運算,每個SIMD FPU可在每個週期內同步完成加/乘浮點指令。那些EU呈現被稱為子切片(subslice)的叢集化分布,子切片又被進一步叢集化成切片,這些元素就是英特爾用以打造各種衍生產品的模組化功能區塊。

搭配Iris Pro 5200 GPU 的Core M系列將包含128MB的嵌入式DRAM,但不是在處理器晶片內、而是在晶片的上方;Gen 8繪圖處理器的每一個切片採用576KB L3快取記憶體,容量高於前一代的384KB。

Gen 8 GPU的一個新功能,是GPU與CPU核心之間的全球記憶體一致性;配備該新款GPU的處理器產品,整合了支援英特爾Intel VT-d虛擬化技術(Virtualization Technology for Directed I/O)之硬體零組件。這種規格代表了英特爾映射虛擬機器至實體資源之現有方法的擴展。

英特爾對於GPU產品的180度策略大轉彎抱持著非常謹慎的態度;該公司不乏設計優異 GPU的工程人才,但因為可能在市場行銷、製造與財務等方面永遠也看不到投資報酬,他們認為沒有人會為該產品額外花錢。

自第六代(Gen 6) GPU佔據更多晶片空間以來,英特爾的策略開始改變;現在Gen 8 GPU在處理器晶片上佔據的面積超過六成,還不包括可選配的繪圖處理專用外部DRAM。現在你幾乎可以說,英特爾打造了一款GPU,並強制某幾款CPU與其搭配。至於英特爾GPU的核心數,因為每個EU具備在每個周期執行16次32位元浮點運算,有人會認為它是16核心,但用這種算法,該GPU也可能有384個核心。

AMD就曾吹噓過擁有512核心的GPU,Nvidia則表示他們的GPU有192核心,高通(Qualcomm)雖然不會說,但我們認為他們的GPU有24個多FPU核心;不過,當你看到GPU的性能基準測試結果,不要以核心數來衡量,這種比較真的很無聊。

遺憾的是,大多數的處理器SoC都不會發展成像是PC那樣的開放性系統,那樣的設備能在一個更公平的環境被評測;不過在可攜式裝置的應用案例中,繪圖處理器的性能測試結果可能就無關緊要了,更重要的是每瓦性能。

編譯:Judith Cheng

(參考原文: Inside Intel's Gen 8 GPU,by Jon Peddie)

資料來源:電子工程專輯

arrow
arrow
    全站熱搜

    Shacho San 發表在 痞客邦 留言(0) 人氣()