英偉達(dá)GTC大會(huì) 架構(gòu)創(chuàng)新助力計(jì)算效率提升

2020-12-18 15:24:57

如果問(wèn)你英偉達(dá)是做什么的,你的第一反應(yīng)是否是顯卡?從“顯卡大廠”到“AI霸主”,英偉達(dá)已走過(guò)了27個(gè)年頭。該公司官網(wǎng)的“名片”為:GPU(圖形處理器)的發(fā)明者,也是人工智能計(jì)算的引領(lǐng)者。

12月15日—12月19日,英偉達(dá)為期5天的GTC中國(guó)線上大會(huì)正式召開(kāi),探索英偉達(dá)技術(shù)如何在AI、圖形計(jì)算、智慧醫(yī)療、機(jī)器人等領(lǐng)域帶來(lái)突破性進(jìn)展,并為各行各業(yè)帶來(lái)變革。期間,英偉達(dá)各類產(chǎn)品線的技術(shù)專家在“閉門會(huì)議”上的發(fā)言都帶來(lái)了哪些干貨?

架構(gòu)創(chuàng)新助力計(jì)算效率提升

黃氏定律預(yù)測(cè)GPU將推動(dòng)AI性能實(shí)現(xiàn)逐年翻倍,而黃氏定律的核心是架構(gòu)創(chuàng)新。“英偉達(dá)更多的是依靠架構(gòu)上的創(chuàng)新,從而使GPU發(fā)展速度和性能提升呈現(xiàn)幾倍、甚至幾十倍的結(jié)果。”英偉達(dá)區(qū)中國(guó)工程和解決方案高級(jí)總監(jiān)賴俊杰如是說(shuō)道。

全新的英偉達(dá) Ampere GPU架構(gòu)可以為AI、數(shù)據(jù)科學(xué)以及高性能計(jì)算等提供6倍的性能提升。而基于英偉達(dá)Ampere架構(gòu)的首款產(chǎn)品A100 Tensor Core GPU則是全球最大的7nm處理器,擁有超過(guò)540億個(gè)晶體管。

據(jù)賴俊杰介紹,英偉達(dá)A100結(jié)合了第三代Tensor Core、結(jié)構(gòu)化疏松技術(shù)、新的多實(shí)例GPU功能和第三代 NVLink 高速互聯(lián)技術(shù)等關(guān)鍵性技術(shù),使得A100能夠在各種規(guī)模的計(jì)算上提供前所未有的加速。

其中,英偉達(dá)第三代Tensor Core引入了TF32精度,一方面,它有足夠的動(dòng)態(tài)范圍和精度,能夠保證網(wǎng)絡(luò)在訓(xùn)練的時(shí)候沒(méi)有任何精度損失; 另一方面,它能夠利用Tensor Core架構(gòu)大大加速神經(jīng)網(wǎng)絡(luò)相關(guān)的一些計(jì)算性能。

在剛剛過(guò)去的10月,英偉達(dá)發(fā)布了A100 80GB版本,與A100 GPU區(qū)別主要體現(xiàn)在內(nèi)存方面。據(jù)了解,A100 80GB的版本采用了HBM2e版本的內(nèi)存,并且它的容量能夠達(dá)到20GB,其顯存帶寬超過(guò)2TB。采用A100 80GB版本的DGX服務(wù)器,其顯存總?cè)萘靠梢赃_(dá)到640GB。

何為未來(lái)的網(wǎng)絡(luò)架構(gòu)

英偉達(dá)亞太區(qū)網(wǎng)絡(luò)市場(chǎng)開(kāi)發(fā)高級(jí)總監(jiān)宋慶春指出,“英偉達(dá)剛剛發(fā)布的NDR InfiniBand產(chǎn)品充分體現(xiàn)了未來(lái)的網(wǎng)絡(luò)架構(gòu),即軟件定義、硬件加速、云原生、網(wǎng)絡(luò)計(jì)算的網(wǎng)絡(luò)。”

在NDR產(chǎn)品發(fā)布以后,世界上有了第一款400Gb/s的端到端網(wǎng)絡(luò)解決方案。而且在英偉達(dá)的NDR產(chǎn)品上面,實(shí)現(xiàn)了網(wǎng)絡(luò)通信中最難的 AllReduce和 All2All集合通信硬件卸載,解決了行業(yè)的痛點(diǎn)。

憑借NDR產(chǎn)品,可在3個(gè)Hop內(nèi)達(dá)到超過(guò)百萬(wàn)臺(tái)的服務(wù)器互連,E級(jí)和Z級(jí)系統(tǒng)Ready,SHARP的網(wǎng)絡(luò)計(jì)算能力提升32倍。

“NDR是一個(gè)完全的SDN的網(wǎng)絡(luò),在網(wǎng)絡(luò)內(nèi)其所有的操作都可由軟件進(jìn)行控制。同時(shí),在管理上面實(shí)現(xiàn)了Cyber AI管理。將AI和網(wǎng)絡(luò)管理整合在一起,可以讓網(wǎng)絡(luò)管理員主動(dòng)預(yù)防網(wǎng)絡(luò)故障、規(guī)避故障的發(fā)生,而不是等到網(wǎng)絡(luò)故障發(fā)生以后被動(dòng)的找問(wèn)題。”宋慶春說(shuō)道。

據(jù)悉,英偉達(dá)上個(gè)月宣布推出英偉達(dá) Mellanox 400G InfiniBand產(chǎn)品,其是第7代的InfiniBand產(chǎn)品,利用100Gb/s的PAM4 Serdes技術(shù), 實(shí)現(xiàn)了400Gb/s的單端口傳輸帶寬, 是上一代產(chǎn)品的兩倍, 同時(shí)通過(guò)添加更多、更強(qiáng)大的加速引擎,實(shí)現(xiàn)了更強(qiáng)大的計(jì)算和通信能力。

Jetson平臺(tái)助AI落地

Jetson是英偉達(dá)的自主機(jī)器平臺(tái),截至目前,該平臺(tái)已在全球擁有70萬(wàn)開(kāi)發(fā)者,而且這個(gè)數(shù)字每一天還在增長(zhǎng)當(dāng)中。

對(duì)于Jetson受歡迎的原因,英偉達(dá)亞太區(qū)開(kāi)發(fā)者發(fā)展總監(jiān)李銘指出,我們?cè)贘etson平臺(tái)上一直致力于打造一套相對(duì)來(lái)說(shuō)上手容易、而且功能豐富的SDK,也就是JetPack。

JetPack版本已經(jīng)從當(dāng)初的JetPack 1.0到了現(xiàn)在的4.4版本,現(xiàn)在最新推出的4.4.1版本可以支持TS1、TS2、Nano等。

“Jetson的理念就是給大家一個(gè)非常合適、各種工具齊備的平臺(tái)。Jetson的算力選擇也非常豐富,這樣在產(chǎn)品化落地階段中,各個(gè)階段都可以幫到大家。”李銘表示。

英偉達(dá)在今年下半年推出的新品是Jetson Nano 2GB,把之前Nano產(chǎn)品向更加入門的方向又推進(jìn)一步,適用于學(xué)生、教育工作者和機(jī)器人愛(ài)好者。其接口非常豐富,常規(guī)的USB、HDMI接口都有,且算力充沛,共有0.5T算力。

據(jù)悉,Jetson Nano 2GB 開(kāi)發(fā)者套件由英偉達(dá) JetPack SDK提供支持,英偉達(dá)JetPack SDK隨附英偉達(dá)容器運(yùn)行時(shí)及完整的Linux軟件開(kāi)發(fā)環(huán)境。因此,開(kāi)發(fā)者可以將他們的 Jetson應(yīng)用程序及其所有依賴項(xiàng)打包到一個(gè)可以在任何部署環(huán)境下運(yùn)作的容器中。它還由 英偉達(dá)CUDA-X加速計(jì)算堆棧提供支持。

標(biāo)簽: 英偉達(dá)

關(guān)閉
新聞速遞