欧洲国产视频_自拍视频在线_www.精品_国产小视频免费_日韩在线_av黄色天堂

英偉達(dá) TensorRT 8 上線,BERT 推理延遲僅有 1.2 毫秒

作者: 來(lái)源: 2021-07-21 12:56:13 閱讀 我要評(píng)論 直達(dá)商品

  英偉達(dá)昨日發(fā)布了其 TensorRT 的 8.0 版本。TensorRT 可以看作是在英偉達(dá)各種 GPU 硬件平臺(tái)下運(yùn)行的一個(gè)深度學(xué)習(xí)推理框架,其核心是一個(gè) C++ 庫(kù)。

  

英偉達(dá)TensorRT 8上線,BERT推理延遲僅有1.2ms

 

  開發(fā)者可以將其他框架訓(xùn)練好的模型轉(zhuǎn)化為 TensorRT 格式,并通過(guò) TensorRT 推理引擎提升該模型的運(yùn)行速度。芯東西等媒體和英偉達(dá) AI 軟件部的產(chǎn)品管理總監(jiān) Kari Briski、產(chǎn)品營(yíng)銷主管 Siddharth Sharma 就 TensorRT 8 的技術(shù)細(xì)節(jié)、應(yīng)用落地等進(jìn)行了深入地探討。

  此外,Kari Briski 和 Siddharth Sharma 也分享了英偉達(dá)團(tuán)隊(duì)在推薦系統(tǒng)競(jìng)賽中所取得的成績(jī)。

  一、運(yùn)行速度和精準(zhǔn)度提升 1 倍,推理延遲僅有 1 毫秒

  Kari Briski 首先回顧了英偉達(dá) TensorRT 的推出背景和成績(jī)。她說(shuō),AI 模型正在以指數(shù)級(jí)的速度增長(zhǎng),很多公司不得不縮減模型大小以追求響應(yīng)速度。而英偉達(dá) 2016 年推出的 TensorRT 可以幫助這些企業(yè)擴(kuò)大其模型規(guī)模,提升精度。5 年來(lái),已經(jīng)有超過(guò) 35 萬(wàn)名開發(fā)者下載了 250 萬(wàn)次 TensorRT。TensorRT 7 也幫助英偉達(dá)創(chuàng)造了多項(xiàng)基準(zhǔn)測(cè)試記錄。

  而相比 7.0 版本,TensorRT 8 的運(yùn)行速度和精準(zhǔn)度都提升了 1 倍。此外,TensorRT 8 還有 2 項(xiàng)較為關(guān)鍵的特性,提升了其 AI 推理性能。

  第一個(gè)是稀疏性(Sparsity)技術(shù),該技術(shù)能夠提升英偉達(dá) Ampere 架構(gòu) GPU 性能,可以在保持推理精度的同時(shí),降低模型中的部分權(quán)重。這意味著模型所需的帶寬和內(nèi)存也會(huì)更小。

  第二個(gè)是量化感知訓(xùn)練(Quantization Aware Training)。這使開發(fā)者能夠利用訓(xùn)練好的模型,以 INT8 精度進(jìn)行推理,既保證精度,也減少了計(jì)算和存儲(chǔ)成本。

  

 

  ▲ 英偉達(dá) TensorRT 8 提升的性能

  當(dāng)前,開源 AI 公司 Hugging Face 和醫(yī)療方案解決商 GE 醫(yī)療正在應(yīng)用 TensorRT。

  Hugging Face 產(chǎn)品總監(jiān) Jeff Boudier 稱,通過(guò)采用 TensorRT 8,Hugging Face 在 BERT(預(yù)訓(xùn)練的語(yǔ)言表征模型)上的推理延遲僅有 1.2 毫秒。

  GE 醫(yī)療心血管超聲首席工程師 Erik Steen 也談道,當(dāng)前臨床醫(yī)生需要花費(fèi)寶貴的時(shí)間來(lái)選擇和評(píng)估超聲圖像。TensorRT 則憑借其實(shí)時(shí)推理能力,提高了 GE 醫(yī)療的視圖檢測(cè)算法性能,能夠加快臨床醫(yī)生的工作效率。

  

 

  ▲ 英偉達(dá) TensorRT 的應(yīng)用

  二、連獲 3 項(xiàng)冠軍,7 分鐘即可完成 CPU 近 24 小時(shí)工作

  除了 TensorRT 8 的具體細(xì)節(jié),Kari Briski 和 Siddharth Sharma 也分享了英偉達(dá)推薦系統(tǒng)團(tuán)隊(duì)在 RecSys 推薦系統(tǒng)數(shù)據(jù)科學(xué)競(jìng)賽中所獲得的成績(jī)。推薦系統(tǒng)作為計(jì)算機(jī)科學(xué)較新的分支,能夠幫助互聯(lián)網(wǎng)用戶找到自己想看、想玩、想買的內(nèi)容。

  在本次 ACM RecSys 挑戰(zhàn)賽中,Twitter 會(huì)在 28 天內(nèi)向參與者提供數(shù)百萬(wàn)個(gè)數(shù)據(jù)點(diǎn),要求他們預(yù)測(cè)用戶會(huì)點(diǎn)贊或轉(zhuǎn)發(fā)哪些推文。規(guī)則要求選手的模型上限為 20 千兆字節(jié),必須基于云端 CPU 的單一內(nèi)核運(yùn)行,且時(shí)間不能超過(guò) 24 小時(shí)。

  英偉達(dá)的 7 人團(tuán)隊(duì)則第二次獲得了這一比賽的冠軍。

  英偉達(dá)參賽成員之一的 Gilberto Titericz 認(rèn)為,其推理模型需要去適應(yīng) CPU 核心是本次比賽的難點(diǎn)之一,對(duì)英偉達(dá)的團(tuán)隊(duì)來(lái)說(shuō)“就好像回到了遠(yuǎn)古時(shí)代”。事實(shí)上,在比賽后,該團(tuán)隊(duì)在單個(gè) NVIDIA A100 Tensor Core GPU 上運(yùn)行了比賽模型,CPU 花費(fèi)將近 24 小時(shí)的工作,英偉達(dá) A100 GPU 僅用了 7 分鐘就完成運(yùn)行。

  此前 5 個(gè)月中,英偉達(dá)還參與了 Booking.com 挑戰(zhàn)賽和 SIGIR 電子商務(wù)數(shù)據(jù)挑戰(zhàn)賽。前者要求選手使用匿名數(shù)據(jù)點(diǎn)預(yù)測(cè)歐洲度假者最終選擇前往的城市,后者則提供了 3700 萬(wàn)個(gè)數(shù)據(jù)點(diǎn)要求選手預(yù)測(cè)消費(fèi)者會(huì)購(gòu)買哪些產(chǎn)品。

  這 2 項(xiàng)比賽吸引了阿里巴巴、沃爾瑪?shù)绕髽I(yè)參與,而英偉達(dá)最終獲得了 2 項(xiàng)比賽的冠軍。

  

 

  ▲ 英偉達(dá)推薦系統(tǒng)團(tuán)隊(duì)

  結(jié)語(yǔ):TensorRT 可有效提升英偉達(dá) GPU 推理表現(xiàn)

  TensorRT 作為英偉達(dá) GPU 的推理庫(kù),5 年中更新了 7 個(gè)版本。本次,英偉達(dá)推出的 TensorRT 8 相比上一版本再次有較大幅度的性能提升,側(cè)面體現(xiàn)出了英偉達(dá)對(duì)推理領(lǐng)域的重視。

  另外,TensorRT 也支持 Python 調(diào)用,可在數(shù)據(jù)中心、嵌入式和汽車等平臺(tái)中應(yīng)用。TensorRT 可以提升視頻流傳輸、語(yǔ)音識(shí)別、推薦和自然語(yǔ)言處理等工作的推理延遲,滿足了許多實(shí)時(shí)服務(wù)、自動(dòng)和嵌入式應(yīng)用的要求。


  推薦閱讀

  英偉達(dá)顯卡驅(qū)動(dòng) 471.41 發(fā)布,正式支持微軟 Win11

  7 月 20 日消息 上周,英特爾推出了新的圖形驅(qū)動(dòng)程序,正式支持 Win11 操作系統(tǒng)。  今天,英偉達(dá)發(fā)布了支持 Win11 的 GeForce 驅(qū)動(dòng)程序版本 471.41,帶來(lái)了全新的顯卡>>>詳細(xì)閱讀


本文標(biāo)題:英偉達(dá) TensorRT 8 上線,BERT 推理延遲僅有 1.2 毫秒

地址:http://www.xglongwei.com/a/zhibo/311222.html

樂(lè)購(gòu)科技部分新聞及文章轉(zhuǎn)載自互聯(lián)網(wǎng),供讀者交流和學(xué)習(xí),若有涉及作者版權(quán)等問(wèn)題請(qǐng)及時(shí)與我們聯(lián)系,以便更正、刪除或按規(guī)定辦理。感謝所有提供資訊的網(wǎng)站,歡迎各類媒體與樂(lè)購(gòu)科技進(jìn)行文章共享合作。

網(wǎng)友點(diǎn)評(píng)
我的評(píng)論: 人參與評(píng)論
驗(yàn)證碼: 匿名回答
網(wǎng)友評(píng)論(點(diǎn)擊查看更多條評(píng)論)
友情提示: 登錄后發(fā)表評(píng)論,可以直接從評(píng)論中的用戶名進(jìn)入您的個(gè)人空間,讓更多網(wǎng)友認(rèn)識(shí)您。
自媒體專欄

評(píng)論

熱度

主站蜘蛛池模板: 欧美高清一区二区三区欧美 | 无码av波多野结衣久久 | 日本成人免费在线视频 | 久久精品99久久香蕉国产色戒 | 欧美又大粗又爽又黄大片视频 | 韩国三级视频全部在线观 | 日本www高清视频 | 欧美影视一区二区三区 | 久久亚洲免费视频 | 色呦呦免费 | 天天摸天天舔 | 欧美在线视频一区二区三区 | 人碰人人| 久久精品国产亚洲网站 | 美女日批视频在线观看 | 国产欧美一区二区久久 | 日韩在线视频www色 日韩在线视频播放 | 99久久国产亚洲综合精品 | 久久精品美女久久 | 在线毛片一区二区不卡视频 | 亚洲国产精品久久婷婷 | 玖草在线资源 | 日本成人一区二区三区 | 99re视频在线播放 | 国内精品视频免费观看 | 人人人插| 青青99| 欧美gav| 久久久夜 | 欧美国产另类 | 国产丝袜护土调教在线视频 | 韩国免费人成在线观看网站 | 福利一区二区三区视频午夜观看 | 天天爱天天爽 | jizz日本女人 | 欧美日韩亚洲一区二区三区在线观看 | 欧美影视在线 | 久久伊人免费视频 | 久久精品8 | 午夜免费观看福利片一区二区三区 | 久久性网 |