今年10月,英偉達(dá)發(fā)布了一款針對(duì)數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的GPU加速平臺(tái)——RAPIDS,它能夠幫助超大規(guī)模的公司提高分析海量數(shù)據(jù)的速度,從而更加精準(zhǔn)的預(yù)測(cè)業(yè)務(wù)。
在本屆GTC China 2018大會(huì)上,英偉達(dá)特別舉辦了媒體講解會(huì),詳細(xì)介紹了RAPIDS的工作原理以及市場(chǎng)受眾。尤其值得一提的是DLI——深度學(xué)習(xí)學(xué)院,目前有12萬的開發(fā)者正在接受了英偉達(dá)人工智能的培訓(xùn)。
揭秘英偉達(dá)RAPIDS平臺(tái) 數(shù)據(jù)科學(xué)在2010年變得非常興盛,正好是在那個(gè)節(jié)點(diǎn)摩爾定律不再像以前那么管用了。2010年CPU的速度足夠快的已經(jīng)可以支持人工智能和機(jī)器學(xué)習(xí)了,但是在那之后大數(shù)據(jù)發(fā)展的非??欤珻PU卻沒有更快的速度發(fā)展,以至于到現(xiàn)在CPU能夠去處理的機(jī)器學(xué)習(xí)內(nèi)容和實(shí)際上所需要的數(shù)據(jù)科學(xué)家需要的算力,兩者有很大的鴻溝。
英偉達(dá)創(chuàng)始人兼CEO黃仁勛曾表示,“數(shù)據(jù)分析和機(jī)器學(xué)習(xí)是高性能計(jì)算市場(chǎng)中最大的細(xì)分市場(chǎng),不過目前尚未實(shí)現(xiàn)加速。全球最大的行業(yè)均在海量服務(wù)器上運(yùn)行機(jī)器學(xué)習(xí)算法,目的在于了解所在市場(chǎng)和環(huán)境中的復(fù)雜模式,同時(shí)迅速、精準(zhǔn)地做出將直接影響其決策的預(yù)測(cè)。”
有了RAPIDS之后,就可以把深度學(xué)習(xí)的能力擴(kuò)展到其它領(lǐng)域、大數(shù)據(jù)的領(lǐng)域。深度學(xué)習(xí)對(duì)于非結(jié)構(gòu)化數(shù)據(jù)比較好,比如:語音、視頻、圖片,但是機(jī)器學(xué)習(xí)是要用于結(jié)構(gòu)性的數(shù)據(jù)。
RAPIDS是什么?一個(gè)完全開源的軟件平臺(tái)。要用三個(gè)關(guān)鍵詞來概括,那就是面向數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)、開源和軟件平臺(tái)。人們使用RAPIDS一般出于兩個(gè)原因:一是數(shù)據(jù)科學(xué)家,希望自己的工作做得更快;二是不用學(xué)其他的軟件,利用已有軟件足矣。
RAPIDS希望幫助企業(yè)以“前所未有”的速度分析海量數(shù)據(jù)并進(jìn)行精準(zhǔn)的業(yè)務(wù)預(yù)測(cè),用戶只需要進(jìn)行非常小代碼的變化量,將典型訓(xùn)練時(shí)間從數(shù)天減少到數(shù)小時(shí),或者從數(shù)小時(shí)減少到數(shù)分鐘。這給數(shù)據(jù)科學(xué)家?guī)砹藰O大的信心。
據(jù)悉,RAPIDS首次為數(shù)據(jù)科學(xué)家提供了他們需要用來在GPU上運(yùn)行整個(gè)數(shù)據(jù)科學(xué)管線的工具。最初的RAPIDS基準(zhǔn)分析利用了XGBoost機(jī)器學(xué)習(xí)算法在NVIDIA DGX-2? 系統(tǒng)上進(jìn)行訓(xùn)練,結(jié)果表明,與僅有CPU的系統(tǒng)相比,其速度能加快50倍,大大提高效率,節(jié)省時(shí)間。
解決方案架構(gòu)與工程團(tuán)隊(duì)副總裁Marc Hamilton在解答記者提問時(shí)特別舉了一個(gè)真實(shí)案例。在中國(guó)或者別的大的國(guó)家,政府的衛(wèi)生部門會(huì)從醫(yī)院、醫(yī)生和患者那里收取數(shù)據(jù),來探討“人是怎么樣可以生病的”。在冬天的時(shí)候,不管是人的流感,亦或是禽流感,它們的傳播速度都是非常快的。在中國(guó)的挑戰(zhàn)就在于人口超過10億的國(guó)家,大家去醫(yī)院,醫(yī)院是不夠的。政府就可以用XGBoost,在去醫(yī)院的造訪人來尋找規(guī)律。如果去處理這些數(shù)據(jù)需要花4個(gè)月的時(shí)間就沒有用了,因?yàn)榈较奶斓脑挻蠹叶己芙】担?ldquo;流感季”也結(jié)束了。所以如果用已有的機(jī)器學(xué)習(xí)改三行代碼,然后用數(shù)據(jù)跑一遍,只需要花4個(gè)小時(shí)而不是4個(gè)月的話,今天就可以給人發(fā)出警告,現(xiàn)在是很糟糕的流感季節(jié),大家盡量不要出去。
華大基因世界上最大的基因組也使用英偉達(dá)RAPIDS XGBoost對(duì)癌癥特異性肽和正常肽進(jìn)行分類,比在CPU上快10倍。
目前,英偉達(dá)云上有600個(gè)應(yīng)用程序,它們都是基于GPU加速,并且加速有不同的方式。
深度學(xué)習(xí)學(xué)院助力AI開發(fā)者 在越來越多的領(lǐng)域中,深度學(xué)習(xí)方面的專長(zhǎng)將成為核心技能。為了能夠?qū)⑹澜缟献顬轭I(lǐng)先的深度學(xué)習(xí)和AI技術(shù)帶給整個(gè)開發(fā)者群體,英偉達(dá)在2016年成立了深度學(xué)習(xí)學(xué)院。
英偉達(dá)深度學(xué)習(xí)學(xué)院通過培訓(xùn)研究人員開發(fā)者以及數(shù)據(jù)科學(xué)家,用深度學(xué)習(xí)的方式來解決面臨最具挑戰(zhàn)性的問題。通過建立實(shí)驗(yàn)室,開發(fā)課程,讓數(shù)據(jù)科學(xué)家、研究人員和開發(fā)者能夠用親身實(shí)踐的方式去學(xué)習(xí)深度學(xué)習(xí)。
英偉達(dá)開發(fā)者計(jì)劃全球副總裁Greg Estes 強(qiáng)調(diào),“GPU之上,如果沒有軟件、沒有應(yīng)用程序,那么沒人會(huì)買你的GPU。因此,在我的眼里,開發(fā)者是最重要的,所以我們花很大的力氣關(guān)注開發(fā)者的社區(qū)”。
英偉達(dá)的開發(fā)者計(jì)劃有四個(gè)方面,分別是“開發(fā)者計(jì)劃”、“深度學(xué)習(xí)學(xué)院”、“英偉達(dá)GPU云”和初創(chuàng)加速計(jì)劃。截至目前,開發(fā)者社區(qū)人數(shù)已經(jīng)超過100萬,有60萬個(gè)GPU相關(guān)的應(yīng)用程序。
除了人工智能,DLI還提供一些其他課程,包括無人駕駛汽車、健康、衛(wèi)生、金融服務(wù)、娛樂及安全城市。為了方便,他們把所有課程放在云端,開發(fā)者使用普通的筆記本電腦就能學(xué)習(xí),并且DLI還提供親手操作的環(huán)境,讓所有開發(fā)者能夠從深度學(xué)習(xí)學(xué)院中學(xué)到的不同的技術(shù)、不同的工作、不同的數(shù)據(jù)。
Greg Estes介紹,“我們會(huì)教你怎樣利用數(shù)據(jù)、利用人工智能框架,讓它對(duì)圖像進(jìn)行識(shí)別、分類,以及如何把這些學(xué)習(xí)知識(shí),開發(fā)到一個(gè)應(yīng)用程序中。”他還提到,不同的人工智能應(yīng)用程序,它們會(huì)使用不同的神經(jīng)網(wǎng)絡(luò),例如圖像識(shí)別用CNN,機(jī)器人學(xué)動(dòng)作會(huì)用到強(qiáng)化學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)等。
英偉達(dá)越來越注重國(guó)內(nèi)的AI開發(fā)者,眾所周知中國(guó)是人工智能非常重要的一個(gè)市場(chǎng)。“初創(chuàng)加速計(jì)劃”就是針對(duì)開發(fā)者的“,目前已有將近四千人加入。
英偉達(dá)在國(guó)內(nèi)還有多家認(rèn)證合作伙伴,訓(xùn)練超過9000人,其中已有100個(gè)開發(fā)者獲得了認(rèn)證。2019年在中國(guó)獲得培訓(xùn)的開發(fā)者會(huì)超過10000人。
另外,英偉達(dá)還通過“DLI校園大使計(jì)劃”,通過認(rèn)證的教職人員和研究者向?qū)W生人員和教學(xué)人員免費(fèi)教授DLI課程。目前,中國(guó)已有11位“校園大使”,共培訓(xùn)出500多名學(xué)生、教職人員和研究人員。
IDC的數(shù)據(jù)預(yù)測(cè),兩年以后,也就是到2020年,80%的應(yīng)用里面都會(huì)含有AI的成分。不得不說,英偉達(dá)這盤棋下的真大!
關(guān)鍵詞: 人工智能 深度學(xué)習(xí)
質(zhì)檢
推薦