簡介
關注Yeti的讀者應該都知道Yeti就是個果粉,但我相信大部分人都沒在關注(誤),但今天不吃蘋果,試試來自Intel新口味Level-Zero,一個從底層殺出的GPU Driver
基本的架構如下圖所示,從下圖你應該還是看不出甚麼端倪,如果你看的出來你直接去Level-Zero的官網看就好了,也不用看我的文章
今天就讓我為各位看官用最淺顯易懂的方式,說明何謂Level-Zero
Level-Zero的前世今生
2024年3月4號,Nvidia的股價已達到852.29美元,GPU也從當年的顯卡小弟成長為AI大神了,Nvidia已經用CUDA橫掃整個AI運算市場,此時Intel派出Level-Zero迎戰Nvidia CUDA的AI運算平台
那傳統的GPU Driver跟特化過AI運算的Level-Zero Driver又有何差別呢?
直接、精準、特定分析是Level-Zero的代名詞,這邊舉一個簡單的例子來解釋GPU Driver與Level Zero的差別,相信大家都知道一蘭拉麵,沒吃過趕快去吃,吃完再來看這篇文章,沒必要當工程師當到這麼苦悶,連一蘭拉麵都沒吃過
GPU Driver就如同一般的拉麵店,你可以選擇想吃味噌拉麵或是豚骨拉麵,店家提供你簡單的選項,但沒辦法讓你選擇你想要加甚麼配料
Level-Zero就像一蘭拉麵,你自己選擇要加那些配料,如果你可以直接在單子勾選多加一片海苔,精準地選擇要哪一種麵體,以滿足你特定的喜好
計算任務 | 一般 GPU 加速 | Level Zero 特有能力 |
---|---|---|
圖形渲染 | GPU 本質上設計用於高效處理圖形渲染任務。 | Level Zero 提供低級訪問,允許更精細的性能調優和資源管理。 |
通用計算 (GPGPU) | 使用如 OpenCL 的高級 API 進行數據並行計算。 | 直接控制執行單元,優化計算核心的調度和管理。 |
機器學習模型訓練 | 通過並行處理加速大規模矩陣運算和深度學習算法。 | 精確控制內存分配和數據傳輸,最小化延遲。 |
高性能計算 (HPC) | 加速科學模擬、工程分析等需要大量計算的應用。 | 為複雜的工作負載提供精細的資源控制,包括內存、隊列和同步機制。 |
實時數據分析 | GPU 加速數據庫查詢和大數據分析工作負載。 | 允許開發者針對特定分析任務優化內存訪問模式和計算流程。 |
視頻編解碼 | 利用 GPU 加速視頻壓縮和解壓縮任務。 | 提供對硬件編解碼器的低級訪問,實現高效的媒體處理流程。 |
Level-Zero跟OneAPI關係
Intel不只提供對GPU加速的Level Zero,還有對CPU、FPGA、AI的優化庫,為了使用者方便,Intel將其集合成一個大禮包,一次滿足用戶的需求
- CPU:支持多核心和向量化的 CPU 程式設計,充分利用並行處理能力。
- GPU:包括 Intel 集成 GPU 和 Intel Xe 系列離散 GPU,通過 DPC++ 和 Level Zero 實現高效並行代碼。
- FPGA:支持現場可程式化門陣列編程,適用於高性能或特定計算任務。
- AI 和機器學習加速器:提供優化庫,如 oneDNN 和 oneDAL,加速 AI 和機器學習任務。
結論
看完了這些,在看一次這張圖,是否有更理解Level-Zero跟OneAPI一些了呢? 如果沒有也不要灰心,可以在網路上多找一些學習資源,或是花20美元跟媲美常春藤名校高材生的ChatGPT4.0一起解決這個問題!