時(shí)間: 2010年5月27日
地點(diǎn): NVIDIA(英偉達(dá))公司北京分公司會(huì)議室
人物: NVIDIA(英偉達(dá))公司聯(lián)合創(chuàng)始人、總裁兼首席執(zhí)行官 黃仁勛
中國計(jì)算機(jī)報(bào)社常務(wù)副社長(zhǎng)兼總編輯 劉保華
在企業(yè)界,黃仁勛作為英偉達(dá)聯(lián)合創(chuàng)始人、總裁兼CEO,十多年來勵(lì)精圖治,將英偉達(dá)打造成了最大的獨(dú)立圖形計(jì)算廠商,因而成為華人在國際企業(yè)界的驕傲。如今,他再創(chuàng)輝煌,成功地抓住了高性能計(jì)算(HPC)與視頻計(jì)算的歷史性機(jī)遇。
在IT界,他曾經(jīng)以“黃氏定律”而聞名,“顯卡性能每半年翻一倍”似乎要叫板摩爾定律,其實(shí)摩爾定律使的是猛勁——全力提高工藝水平,而“黃氏定律”用的是巧勁——主要是通過改進(jìn)架構(gòu)來實(shí)現(xiàn)。
我們面前的黃仁勛,則是一個(gè)總把“為產(chǎn)業(yè)和社會(huì)做出獨(dú)特貢獻(xiàn)”掛在嘴邊的人。

圖為NVIDIA(英偉達(dá))公司聯(lián)合創(chuàng)始人、總裁兼首席執(zhí)行官 黃仁勛
領(lǐng)銜高性能計(jì)算
劉保華:2008年,IBM混合架構(gòu)的“走鵑”在成為首臺(tái)突破千萬億次大關(guān)的超級(jí)計(jì)算機(jī)的同時(shí),證明了流處理器在HPC(高性能計(jì)算)中的加速作用,進(jìn)而間接地證明了GPU在HPC中的地位。如今,GPU已經(jīng)在HPC上唱起了主角。你認(rèn)為GPU在HPC領(lǐng)域還有哪些挑戰(zhàn)?
黃仁勛:“走鵑”是世界上第一臺(tái)采用異構(gòu)計(jì)算的方式進(jìn)行數(shù)據(jù)處理的超級(jí)計(jì)算機(jī),它同時(shí)采用了順序處理器和并行處理器兩種處理方式。而英偉達(dá)的 GPGPU(通用圖形處理器)屬于第二代的異構(gòu)計(jì)算解決方案。最近,在全球排名第二的曙光“星云”超級(jí)計(jì)算機(jī)中,英偉達(dá)的GPGPU已經(jīng)成為最重要的處理器。
GPU 計(jì)算面臨的挑戰(zhàn)就是編程效率。我們要讓習(xí)慣于串行編程的程序員學(xué)會(huì)并行思考;其次,我們還要為他們提供高效易用的軟件工具,這也就是我們基于CUDA通用并行計(jì)算架構(gòu)設(shè)計(jì)的GPGPU芯片F(xiàn)ermi,要支持CUDA Fortran、CUDA C 和 CUDA C++等多種高級(jí)語言的原因。事實(shí)上,“走鵑”面臨的最大障礙在于編程非常復(fù)雜。
劉保華:為什么HPC500強(qiáng)中有的混合架構(gòu)超級(jí)計(jì)算機(jī)的效率并不高?
黃仁勛:原因很簡(jiǎn)單,那些超級(jí)計(jì)算機(jī)采用的是其他廠商的GPU。你可以讓 GPU 執(zhí)行部分并行程序,但前期要做的工作非常多,而且效益不高。與GPU使用OpenGL、DirectX等圖形編程接口不同,英偉達(dá)的GPGPU采用的 CUDA架構(gòu)是一種真正的并行計(jì)算架構(gòu),其不僅僅限于圖形計(jì)算。這也解釋了為何現(xiàn)在有如此多的 CUDA 應(yīng)用程序,為何 CUDA 能夠在科學(xué)領(lǐng)域得到廣泛應(yīng)用,為何有如此多的 CUDA 書籍,以及為何各所大學(xué)紛紛開設(shè) CUDA 課程。
劉保華:GPU在圖形應(yīng)用時(shí),沒有ECC(錯(cuò)誤檢查和修復(fù))功能問題還不大。而在科學(xué)計(jì)算和模擬時(shí),如果GPU不支持ECC的話,一個(gè)很小的錯(cuò)誤經(jīng)過多次的迭代計(jì)算,最終會(huì)出現(xiàn) “失之毫厘謬以千里”的情況。
黃仁勛:是的,HCP進(jìn)行一次大的模擬需要耗費(fèi)幾天才能完成。如果結(jié)果不正確,則需要重頭再來,成本相當(dāng)高。超級(jí)計(jì)算機(jī)通常有數(shù)千個(gè)GPU,如果某一個(gè)GPU在第三天出現(xiàn)了一個(gè)錯(cuò)誤,這三天的電費(fèi)和時(shí)間就全都浪費(fèi)了。在超級(jí)計(jì)算領(lǐng)域,ECC校驗(yàn)是必備的。所以我們才在設(shè)計(jì)階段加大投入,并加大設(shè)計(jì)難度,將ECC單元植入Fermi。事實(shí)上,在GPU市場(chǎng)只有英偉達(dá)能夠提供對(duì)ECC的支持。
劉保華:如果沒有ECC,想要確認(rèn)計(jì)算結(jié)果是否正確的方法,是不是只有再算一次?
黃仁勛:可能還不止。假如第二次跟第一次的結(jié)果還不一樣,那只有再算一次。假設(shè)一共算三次,那我們就希望有兩次結(jié)果是一樣的。
劉保華:GPU要想在云計(jì)算中大顯身手,是否必須直面虛擬化方面的挑戰(zhàn)?
黃仁勛:CPU因?yàn)镸MU(內(nèi)存管理單元)、多任務(wù)處理的關(guān)系,虛擬化很容易。GPU不具備MMU,它非常擅長(zhǎng)完成單個(gè)非常大的任務(wù),并不十分擅長(zhǎng)多任務(wù)處理。你說的不錯(cuò),我們必須發(fā)明新的技術(shù),以使GPU不僅能夠非常適合并行處理,而且還適合多任務(wù)處理以及虛擬化的要求。等我們完成這一重大的創(chuàng)新后,就能夠?qū)PU置于云端。
劉保華:分布式是否是未來HPC發(fā)展的趨勢(shì)?
黃仁勛:未來將會(huì)出現(xiàn)非常龐大的超級(jí)計(jì)算中心,大量的超級(jí)計(jì)算中心構(gòu)成一個(gè)巨大的網(wǎng)絡(luò),同時(shí)超級(jí)計(jì)算機(jī)也會(huì)存在于你的桌面上。大型模擬計(jì)算可以在超級(jí)計(jì)算中心完成,更為龐大的模擬計(jì)算則可以依靠云計(jì)算中的超級(jí)計(jì)算機(jī)來完成。在未來,超級(jí)計(jì)算能力將通過連續(xù)的設(shè)施來提供,從云到超級(jí)計(jì)算中心,再到個(gè)人超級(jí)計(jì)算機(jī),它們將運(yùn)行相同的程序。
