<dl id='5oj5'></dl>
<i id='5oj5'><div id='5oj5'><ins id='5oj5'></ins></div></i>
    <fieldset id='5oj5'></fieldset>
    <acronym id='5oj5'><em id='5oj5'></em><td id='5oj5'><div id='5oj5'></div></td></acronym><address id='5oj5'><big id='5oj5'><big id='5oj5'></big><legend id='5oj5'></legend></big></address>
  1. <tr id='5oj5'><strong id='5oj5'></strong><small id='5oj5'></small><button id='5oj5'></button><li id='5oj5'><noscript id='5oj5'><big id='5oj5'></big><dt id='5oj5'></dt></noscript></li></tr><ol id='5oj5'><table id='5oj5'><blockquote id='5oj5'><tbody id='5oj5'></tbody></blockquote></table></ol><u id='5oj5'></u><kbd id='5oj5'><kbd id='5oj5'></kbd></kbd>
    1. <i id='5oj5'></i>

      <span id='5oj5'></span>

      <code id='5oj5'><strong id='5oj5'></strong></code>

        1. <ins id='5oj5'></ins>

          警惕!AMD又打7nm新顯卡的歪腦筋:BF16是深度學習還是礦車升級?

          • 时间:
          • 浏览:15

          Navi潔身自好之日不久矣?

          自2018年大礦災之後,即便經歷瞭2019年夏天這一波短暫回升,區塊鏈代幣行業依然處於低迷時期。2016~2018年通過Polaris系列顯卡大挖特挖的AMD礦卡傢族,在2019年已經逐漸銷聲匿跡,新發佈的Navi系列7nm顯卡也罕有涉及挖礦的新聞曝出。

          挖礦算力未得到革命性升級的RDNA架構,總算是免過挖礦之難

          然而,GitHub(著名開源組織社區)在對AMD ROCm開發庫進行調查後獲悉:

          AMD GPU將加入BFloat16(BF16)浮點指令的支持。此指令將比當前的FP16浮點性能獲得巨大(革命性)提升。

          而這一提升的幅度會是多少?ARM架構方面的測算提升幅度約為1.6~4倍,藍廠10代CPU架構方面在NPU、AI綜合增益約為2.5倍。因此,得益於大量CU(運算單元)的結構又是,GPU架構的BF16綜合增益,在高級制程下Sp數量擴張之後,將有可能達到4~10倍以上(無責推)。

          打算用BF16革瞭FP16的命,劍指何方?

          AI、深度學習是已確認的CPU(包括ARM類產品)下一階段重點發展方向,Jim Keller在換庒之後的基本操作也是將特斯拉任職期間主刀的AI、深度學習、神經網絡等“手術”實驗,植入第10代開始的Intel CPU上。

          除此之外,主流ARM芯片企業,在今年春末紛紛確認BFloat16指令集的研發、標準策略等工作進度。看來這場又AI為主導的神經網絡大升級已是待發之箭瞭。

          AMD RX5700XT的FP16性能:19.51TFLOPS(圖源AMD官網)

          而AMD被曝將在“未來”的GPU上(筆者預計最快將在明年發佈的RDAN2架構上)支持BF16指令集,則傳達出更多隱含深意的訊息。

          挖礦運算,更像窮舉法的重復運算過程,運算單元越多越劃算

          眾所周知,典型的區塊鏈加密運算難度並不高,且運算模式重復率高。因此在多年來的經驗中表明,CPU強大的復雜運算能力應對“挖礦”運算並不占優,反而是具備少則2048、多則4096(sp)的多單元GPU運算架構,對於區塊鏈挖礦運算更勝一籌。簡而言之就是,讓8個數學教授去做一萬道小學計算題的速度,絕對比不過2048個高中生的速度快。

          而這種“低難度”的運算操作,其實就涉及到‘單精度浮點性能’,恰好,傳統顯卡的單精度浮點性能和FP16(峰值半精度性能)息息相關。講到這裡,讀者們應該已經大概明白,數碼君想表達什麼瞭。

          總結 &amp; 預測(無責推)

          AMD的顯卡份額基本上就是靠2016~2018年的礦卡狂潮完成翻盤的,在區塊鏈代幣行業遭遇瓶頸期、傳統顯卡挖礦模式趨於衰退的環境下,如何保持2016~2018年長達30個月的GPU快速增長勢頭?光靠遊戲卡或者零售、OEM大單是根本不可能的。

          各GPU區塊鏈運算相關參數一覽(圖例時間2018年7月)

          因此,假設BFloat16獲得數倍於傳統FP16的性能增益,結合7nm+、大核心RDNA2架構、高達8192sp的旗艦卡皇,外加500W左右的TDP(Navi10結構推算),這張AMD顯卡的算力會怎麼樣?

          我不敢猜,我更怕的是:

          獲得BF16指令集增強的大批100瓦左右、2048sp的RDNA2顯卡,再次重回礦場。

          往事不堪回首,本文僅供解悶,咱也不懂,咱也是瞎猜~


          淘數碼關註數碼配件優惠特價資訊,關註+轉發+私信:【20196688】自動獲取更多優惠信息