GPU
對圖像進(jìn)行處理的相關(guān)計算。
1999年,美國英偉達公司推出世界上第一款圖像處理器芯片。2001年,科學(xué)計算開(kāi)發(fā)人員從矩陣乘法運算著(zhù)手GPU通用計算。2008年,英偉達推出支持CUDA的Tesla架構顯卡之后,GPU迅速轉向實(shí)用,在計算力學(xué)、地質(zhì)科學(xué)、生命科學(xué)、雷達遙感、計算金融等領(lǐng)域得到應用。
?21世紀以來(lái),GPU已經(jīng)成為高性能計算的重要角色。2017年11月最新的TOP500數據顯示,世界排名前500的超級計算機中,有87臺采用了GPU協(xié)處理器。Volta架構動(dòng)搖了2018年的TOP500版圖,它的性能飛越能夠重新定義超級計算機:過(guò)去,千萬(wàn)億次計算意味著(zhù)一個(gè)機房、一個(gè)集群,現在僅需要一個(gè)8卡GPU節點(diǎn)就能實(shí)現。
?GPU微架構以高度并發(fā)為基礎特征,其并行編程模型主要是CUDA和OpenCL。前者是一個(gè)配備完整工具包、針對單一供應商(英偉達)的成熟開(kāi)發(fā)平臺,具有統一的開(kāi)發(fā)套件(CUDA Toolkit、NVIDIA GPU Computing SDK、NSight等)、非常豐富的庫(cuBLAS、cuFFT、cuSPARSE、cuRAND、NPP、Thrust、NCCL等)以及PTX匯編代碼生成、離線(xiàn)編譯等成熟的編譯器特性;后者是一個(gè)有著(zhù)開(kāi)放的標準,具有跨平臺性和通用性,支持包括Nvidia、AMD、Intel、Qualcomm、ARM在內的多類(lèi)處理器,能夠更好地支持異構計算。
?GPU的出現和發(fā)展,與傳統CPU形成了強烈的對比和有效互補。CPU擅長(cháng)處理具有復雜控制邏輯的任務(wù),如操作系統、通用應用程序;而GPU擅長(cháng)處理大量同類(lèi)型數據上的密集數值計算。GPU的定位仍舊是CPU的加速器/協(xié)處理器,但是考慮到阿姆達爾定律,整體加速受限于不可并行的部分,應當盡量減少程序中的串行處理。

