每日最新頭條.有趣資訊

外媒評價華為GPU Turbo:有效的技術與過度的行銷

華為今年最重要的技術之一是其GPU Turbo技術,是一種軟硬協同的圖形加速技術,它可以在不改變硬體的情況下,以更低的功耗提供更高的性能,這一說法給了我們很大震動。在(我們)內部,很多人情不自禁的睜大了雙眼。

在那之後,正好我們在柏林IFA展會期間與華為有所接觸,對這技術也做了不少討論,有了一個基本的理解,以及看到的一些行銷策略——結論是,華為並不是所有新特性都用了最誠實的方式來表達。

GPU Turbo的發展時間線

GPU Turbo據說是一種新的機制,官方說它對新設備和現有設備進行了性能和功率的巨大改善。這一新“技術”是在6月初隨著榮耀Play手機一起在中國首次推出的,今年晚些時候隨著EMUI 9.0系統的發布,它將被更新為2.0版。

在接下來的幾個月裡,華為計劃在其所有主流產品上都加上這項技術的支持。華為承諾所有設備(不論硬體)都將受益。

自GPU Turbo在最初幾款設備發布後的幾周時間,我們看到了榮耀和華為在這方面的很多宣傳和行銷,目標是推廣GPU Turbo。在所有的演示文稿、新聞發布和媒體模糊的分析中,有一件重要的事情總是被忽略:我們沒有看到關於GPU Turbo到底是什麽、以及它的技術原理解釋。一切都與結果有關,但沒有什麽與細節有關。在AnandTech,真正能讓我們產生共鳴的是細節,比如一個新功能是否是真實的。

GPU Turbo的支持產品及時間線

值得稱讚的是,華為確實與我們取得了聯繫,只是當我們要求華為就這一新技術提供更詳細的技術介紹時,該公司和公關部門都沒有真正做出回應。我們不確定原因是什麽,因為該公司一直以來都對技術討論持開放態度。在今年的IFA展會上,我們終於有機會見到了華為的硬體和軟體工程師/經理團隊。

通過這些討論,我們得出了一些詳細的解釋。我們現在對GPU Turbo的實際功能有了更好的理解(它是講得通的),儘管他們也將大量模糊解釋放在發布會的幻燈片裡。

所以,在這篇關於GPU Turbo的文章中,我們將分階段講述這個新技術的故事。

首先,我們來看看華為關於這項技術的最初對外聲明,特別是具體數據;其次,我們將深入了解GPU Turbo的實際功能;再其次驗證產品與技術,看看我們可以觀察到什麽不同;最後我們談談行銷,其實這部分才真的需要仔細看看。

需要指出的是,如果時間和資源允許的話,我們希望深入了解GPU Turbo。隨著(未來)Mate 20的發布和Kirin 980芯片的發布,我們將會對更多數據進行更詳細的分析。這只是GPU Turbo的故事的開始。

GPU Turbo的優勢:華為官方的數據

在GPU Turbo公布時,最受關注以及被廣泛引用的幻燈片上的數據是,新特性將以某種方式讓芯片獲得高達60%的顯示性能提升,同時也能減少多達30%的功耗。華為(和榮耀)非常熱衷於這些數字,並盡可能以最好的方式顯示結果。

這些數據在上周四的IFA榮耀新品發布會上再次得到重申。過去的幾天裡,我看到許多家媒體報導了這些數據,並將其歸因於GPU Turbo帶來的提升。然而到目前為止,還沒有進行任何分析。

我們見過的大多數幻燈片看起來都是這樣的,把數字寫進這篇文章非常容易:

由於AnandTech是一份以技術為導向的媒體,所以從一開始,這些數據在我們看來就很可疑。我們為自己的獨立分析感到自豪並珍視它,想確保所提升的數據是準確的。畢竟,這樣的數據與常規的工程技術進步背道而馳。而這恰恰是行銷數據的bug。稍後會詳細介紹。

那麽什麽是GPU Turbo?我們終於搞清楚了!

當我們開始尋找GPU Turbo的詳細解釋時,我(編輯Andrei)首先嘗試自己去弄清楚GPU Turbo是做什麽的?但(驗證過程)缺乏細節導致基礎薄弱。由於特定的原因,這任務最終成為了一個噩夢;儘管多年來允許設備Root獲取權限,但大約在GPU Turbo發布的同時,華為和榮耀停止了bootloader (引導加載程式)解鎖。

這阻止了用戶修改系統韌體,當然我們也不能,因為我們無法Root手機來進行基準測試分析。此外,所有與GPU Turbo一起發布的新韌體據說都被鎖定了。目前尚不清楚這兩件事是否直接相關,不過喜歡陰謀論的人可能會這麽想吧。

因此,在GPU Turbo的相關工作中,我真正想要的是通過Arm的streamlined工具來分析GPU,因為這樣可以提供GPU正在處理的工作負載的確切資訊。有了這些工具,我們就可以深入分析這顆發動機罩下發生了什麽。無論是有意還是無意,bootloader鎖阻止了我們這樣做。正因為這些限制,在我的測試中,這些都成死胡同。

我開始寫這篇文章的時候並沒有對這技術有更進一步的詳解,但是我們在柏林IFA期間遇到了EMUI軟體團隊,最終我們對GPU Turbo有了更全面的解釋。我們與軟硬體團隊討論了這項技術,並與他們進行了不同尋常的討論。

通過與硬體團隊交流——特別是海思(Hisilicon,華為的半導體部門)——他們明確表示,GPU Turbo純粹是一種軟體技術。雖然此技術是由他們輔助實現的,但實際工作的都是由軟體決定的。這一點很好理解,也解釋了華為為何能夠在所有智能手機中都加入這項技術的支持。它也與NPU(神經網絡處理器)無關,儘管在其中加入NPU顯然會有所幫助。

德國時間上周五麒麟980的發布會首次暗示了它的實際用途,被稱為“人工智能預加載技術”。

這張幻燈片試圖傳達的是,GPU Turbo允許芯片更好地跟蹤計算工作負載,調整硬體性能狀態,以便更好地適應負載。例如,當CPU(運算核心)比GPU(圖形核心)需要更多的功率時,可以調整功率比以滿足需求,從而提高性能和效率。

在下一頁我們會深入一些,最終對這機制有了很好的解釋。我們要感謝華為智能手機軟體總裁王成錄博士提供的資訊。

關於GPU Turbo的詳細解釋

揭開面紗,華為使用TensorFlow神經網絡模型來進行學習和預測。通過數千個小時(真實時間+模擬時間)詳細檢查與記錄學習,華為建立了神經網絡的內部模型,提前了解遊戲運行的方式和功率性能的需求,最終把它放到一段密集代碼裡。

使用神經網絡優化每個遊戲與設備的DVFS控制

在訓練階段,網絡開始分析並調整芯片的動態電壓和主頻,用來以最小的功耗達到最佳性能。這需要CPU、GPU和記憶體控制都更為精準,已達到保證60fps幀率,且不會達到更高的狀態(換句話說,最小化性能冗余)。最終結果是對於CPU 、GPU 、 DRAM能完成執行每個指令,但相應的硬體塊具有更好的功率控制。這是對性能和能耗的雙重優化,但重點在於後者。

這樣,生成的模型將包含在支持GPU Turbo的設備韌體中。每個Title(編程中的標題)都有針對每個智能手機的特定神經網絡模型,可用資源因手機型號而異。就我們所理解的技術而言,在設備本身上,應用程式和GPU驅動程式之間似乎存在一個監視渲染調用的攔截層,用作神經網絡模型的輸入。由於網絡模型經過訓練,能輸出對於給定場景最佳的DVFS(即最優控制電流電壓)設定,因此GPU Turbo機制可以立即將其應用於硬體並相應地調整DVFS。

對於擁有它的芯片,芯片自己的NPU會加速網絡模型的推理(執行)。在不使用NPU的SoC中引入GPU Turbo的情況下,CPU會使用回落。這樣操作需要極快的預測,我不得不懷疑它引起的渲染延遲有多少;不過似乎它不會延遲太多,華為表示他們非常關注這個領域,確認這些模型都是16位浮點(FP16),這意味著對於像麒麟980器這樣的未來處理器,可以通過使用基於新NPU支持的INT8模型進一步優化。

實質上,因為GPU Turbo是一種DVFS機制,它與渲染管道協同工作並具有更精細的粒度,它能夠預測即將到來的硬體要求,並進行相應調整。這就是GPU Turbo特別聲稱相比“傳統的反應式DVFS驅動器”能大大降低性能抖動;而後者只是通過硬體計數器監控GPU利用率,並在事後進行調整。

更多思考以後的解釋

華為在這裡所做的當然是一種有趣的方法,具有明顯的實際潛力。我們可以看到在有限的功率內如何在硬體之間以最佳方式分配資源,這將有助於提高性能,效率和功耗。因此,更詳細的解釋具有很多技術意義,我們對此毫無疑問。這是一個令人印象深刻的壯舉,可能會在更廣泛的技術領域產生影響,比如PC。

該技術的缺點是每個設備和每個遊戲的性質不同。華為沒有詳細介紹培訓單一遊戲需要多長時間:第一版GPU Turbo支持絕地求生、Mobile Legends: Bang Bang(一款類似王者榮耀的遊戲)。伴隨著Mate 20,第二個版本將支持NBA 2K18,生存規則,Valor競技場和Vainglory等遊戲。

從技術上講,粒度特性取決於每個芯片而不是具體到每個設備,儘管不同的設備在熱性能或記憶體性能方面會有不同的限制。只是很明顯,雖然華為對這項技術感到非常自豪,但每個優化推出速度都很慢。這裡沒有靈丹妙藥——雖然理想的目標是一個單一的優化網絡來處理市場上的每一款遊戲,但必須依靠默認機制來完成工作。

華為將首先使用GPU Turbo打造其核心遊戲賣點,如絕地求生和Arena of Valor,以及與EA/騰訊NBA 2K18等公司的作品。我懷疑在這背後,一些公司希望與華為聯繫,將他們添加到要優化的遊戲列表中。

接下來,我們將對手持設備的GPU Turbo進行分析、另外還遇到了一個問題,即ARM的Mali GPU(用於華為麒麟芯片)如何使遊戲與華為的競爭對手設備不同。

分析GPU Turbo技術的難點

我們沒能找到“兩款硬體一樣,其中一個加載GPU Trubo而另外一個沒有”的類比。能夠做最接近的實際比較是華為P20(沒有採用GPU Trubo)和Honor Play(搭載GPU Trubo),這兩個設備使用相同的芯片和記憶體。

兩款手機之間的差異不僅僅是GPU Turbo的推出,榮耀Play還包括更新的ARM Bifrost驅動程式的R12P0版本,而P20則是R9P0版本。遺憾的是,沒有驅動程式更新行說明,因此我們無法區分GPU驅動程式方面的改進,以及GPU Turbo所做的實際改進。

P20 沒有採用GPU Trubo

榮耀Play(採用GPU Turbo技術)

從原始幀速率數字很難分辨兩部手機,兩款手機《絕地求生》的起始幀率都是40FPS。當然我們可以投入更多的時間來檢查抖動的持續體驗影響,以及觀察長期的功耗數據。

榮耀Play看起來確實有優勢,在渲染場景時能耗為3.9瓦,P20則消耗了4.7瓦;雖然螢幕尺寸等也可能會對這一數值有影響,但它確實代表了15%的功率差異。

華為引用了麒麟980的數據:

儘管如此,乍看之下GPU Turbo確實具有效率優勢,然而在麒麟980演講期間呈現的10%數據似乎比宣傳的30%更接近現實。

GPU Turbo是真實的,只是擔心被過度行銷

在本文中不應該被誤解的一件事是GPU Turbo本身不僅僅是一種行銷策略,而是一種非常真實和創新的解決方案,試圖解決當前一代麒麟芯片組的弱點。麒麟仍然遠遠落後於基於Adreno顯示芯片的高通驍龍的性能和效率,而且由於華為無法授權拿到Adreno,除了為GPU提供更多的芯片太空外,它還必須盡力發揮其優勢。

然而,GPU Turbo的大部分技術優勢在很大程度上被過多的行銷所掩蓋,這些行銷宣傳簡直就是誤導。實際的例子我們不妨往下看。

它本質上是一種軟體解決方案,它可以增強硬體,但硬體本身提升是有局限的。而混亂的遊戲體驗行銷,則混淆了事情本身。實際情況是:GPU Turbo有效,但仍然無法與高通驍龍845處理器設備競爭。即使它努力嘗試表達自己的優點;但這裡硬體的差異太大了,無法通過軟體優化來克服,無論新機制的創新程度如何。

《絕地求生》的問題:並非所有GPU均等渲染

我們在測試《絕地求生》手遊的時候遇到了新情況,是在之前的標準化測試中從未見到過的。在比較高通驍龍和華為麒麟芯片時,試圖觀察華為引用的性能差異,結果發現Adreno(驍龍使用的GPU)和Mali(麒麟使用的GPU)渲染效果之間存在很大差異。

具體來說,我們發現和其他手機相比,一加手機6(搭載驍龍845處理器)的影像品質明顯比其他手機要好。

榮耀Play(GPU Turbo)

華為Mate 10 Pro(GPU Turbo)

一加手機6

三星Galaxy S9(三星Exyons 9810芯片)

這裡有兩個地方需要注意。第一,Adreno GPU渲染的效果非常清晰,看上去遊戲採用了十分特別的影像壓縮算法。為了保證測試的公平性,我們將渲染分辨率設定為720p,並將所有手機的渲染分辨率調高至1080p。結果發現Adreno的顯示效果更佳銳利,Mali的畫面則相對模糊,並且這種情況在手機遊戲運行時是可以看出來的。

第二點更重要,使用Adreno圖形處理的手機啟用了Anisotropic filtering非等向濾鏡 ,而使用Mali圖形處理的手機似乎忽略了它,退回到Bilinear filtering(雙線性過濾)。在像《絕地求生》這類遊戲中,運行時的效果非常明顯,並且會產生很大的畫質差異。這也給圖形帶來了相當大的差異。

因此,華為的GPU Turbo在行銷上和競爭對手相比較的做法也讓人生疑:各向異性紋理過濾本身會對幀率產生高達16%-18%的影響。由於Mali GPU沒有啟用這項技術,在進行性能比較時本身就有可能出現不公平的情況。換句話說,Mali圖形處理的手機性能提升了16%-18%,但它卻犧牲了品質。(外媒編輯注:在過去的10年中,我們在PC行業經常看到這種情況,不同的GPU通過不同的路徑或是“技巧”減少處理器的工作負載,不過現在他們不這麽幹了)

需要注意的是,雖然Mali設備沒有像Adreno設備那樣進行紋理過濾從而獲得了工作負載上的優勢,但性能和效率依舊更好。隻不過遊戲在高品質最高幀率40fps的情況下這種差異很小。唯一能衡量這種差異的就只有芯片功耗了。

對於功耗來說,儘管在渲染路徑和品質上存在差異,但是驍龍845仍然保留了巨大優勢。在打開AF的情況下,驍龍845手機的功耗為2.5-3W,而搭載麒麟970處理器的手機平均功耗是4-4.5W。更高的功耗和效率意味著設備的電池續航會縮短。

真實情況 VS 綜合測試

我完全能夠理解華為專注於《絕地求生》遊戲的實際運行效果,而不是所謂的綜合基準測試,但是我們使用綜合基準測試來判斷新功能是否可靠是有一定道理的——它們是行業標準,並且很直觀很好理解。在涉及到實際的技術比較時,華為和榮耀對於《絕地求生》的行銷做得並不周到,我們將在下面討論這個問題。

不同的GPU還沒有使用相同的圖形路徑:Adreno GPU添加各向異性過濾並且具有更高縮放品質,這味著它最終運行時影像品質會更好。在華為提供的宣傳材料中,性能和效率比較中沒有考慮到這一點,這使得宣傳材料的可信度降低。

這件事的本質

儘管如此,GUP Turbo是一項很有前途的技術,它能夠在其他條件相同的情況下為華為帶來競爭優勢。不過遺憾的是,對於麒麟960和麒麟970來說,情況並不一樣。隨著麒麟980問世,競爭格局將發生巨大變化,但在此之前,前一代處理器的用戶需要清楚地知道GPU Turbo技術能帶來什麽樣的效果。

過度行銷帶來的小問題

正如前面提到的那樣,華為和榮耀對於新技術的宣傳都使用了同樣的文案:GPU Turbo技術能夠提高60%的性能和降低30%的功耗。在我們看到的所有宣傳頁面中,只有一個頁面解讀了這些數據。下面是榮耀Play在全球產品頁面的注釋,解釋了60%和30%這兩個數字背後的意義:

榮耀Play官網對GUP Turbo的介紹

這裡有個小重點:

上圖中備注第二條: GPU Turbo技術是一種基於麒麟芯片的圖形處理技術,融合了軟體和硬體協調。它支持一些特定的遊戲;結果則是和上一代芯片麒麟960芯片進行的比較。

這裡需要特別注意:通常在比較一項新技術時,性能差異應該用off/on的狀態做對比(外媒認為華為應該比較GPU Turbo開啟和關閉時性能差異),而不是拿麒麟960作為基準。因此,應該不難看出華為在這方面存在很大問題,他們混淆了這一概念——將性能提升全部歸結於GPU Turbo技術,而沒有提及兩代芯片組之間的改進。

正確的方式應該是以麒麟970作為基準,比較GPU Turbo技術打開和關閉時的情況。然而現在的結果卻是使用沒有GPU Turbo技術的麒麟960和帶有GPU Turbo技術的麒麟970進行比較。

事實上,麒麟970採用了全新的10納米工藝製造,並且搭載了頻率為747MHz的新型Mali G72MP12 GPU。這對採用16nm製造工藝的麒麟960來說有很大改進,而且麒麟960採用的是頻率高達1037MHz的Mali G71MP8 GPU。

此外,麒麟960處理器的GPU性能和效率存在很大問題,甚至表現出我們所見過的智能手機中最糟糕的一些情況。我們不打算回過頭去糾結為什麽會這樣,但是對於麒麟960來說這無疑是極大的打擊。

如今麒麟970在這樣的的基礎上進行了改進。隻不過華為提到的“GPU Turbo技術提升了60%性能和降低了30%功耗”,雖然字面上看著令人印象深刻,但是一旦我們知道這些數據是怎麽得來的也就不那麽興奮了。通過和表現不佳的麒麟960處理器進行對比所得出的結論,完全改變了這些數據的意義。也就是說,在你手中的設備上啟用GPU Turbo技術並不能獲得60%的性能提升和30%的功耗下降。

這也是華為在呈現GRU Turbo整個生命周期數據中面對的問題。60%和30%兩個數字確實吸人眼球,但即便是華為自己的分析師,也認為60%和30%過於樂觀了。

最終,華為還是用了“60%和30%”這樣的數據作為GPU Turbo開啟/關閉時的差異。如果有人有這樣的預期,那他們恐怕要失望了。

同樣在上面這張圖中,我們不得不批評這些條形圖所掩蓋的事實:圖中開啟GPU Turbo《絕地求生》手遊由此前的36.4上升到39.5,幀率增長3,卻顯示為25%的增長。該公司認為有必要修改實際的增長價值而不是遵循從零開始的標準,因為這樣做能讓這張圖看上去印象深刻。

為什麽使用麒麟960:從一個較低的標準起步

回到我們在GFXBench Manhattan 3.1和T-Rex中測量的GPU功率效率表,我們將兩個芯片組重新梳理:

因此,儘管麒麟970在960年的基礎上有進步和改善——但考慮到可競爭對手,它仍然難以同時代的三星Exynos和高通次驍龍芯片抗衡。

在GPU Turbo的聲明中,我想強調的重點是,60%和30%的提升數據是非常不現實的,並且對用戶具有極大的誤導性。如果華為和榮耀不清楚基準對比,那麽在未來的公告中,這些公司自己的數據永遠都不可信。

GPU Turbo到底能提升多少?

上周五IFA期間,華為消費者業務CEO余承東推出麒麟980芯片,其中一些幻燈片展示了GPU Turbo給新款芯片帶來的具體數據:

在這裡,實際的性能改進是相當小的,因為工作量是V-sync(垂直同步)限制的,GPU在這方面沒有問題,但是功耗的改進仍然具有代表性。在這裡,實際的功率改進是10%——這是一個更合理和可信的改進數據,可以歸功於軟體

早在2015年,AnandTech就在北京媒體發布會上報導了麒麟950的發布,華為的謙虛和敏銳我們留下了深刻的印象。如今三年多的時間過去了,華為已經有了長足的發展。

華為和榮耀現在每年銷售1.53億部智能手機,華為目前是全球第二大智能手機制造商,最近超過了蘋果。榮耀稱其在全球排名第五。華為還表示,它將把5G等未來的研發預算從總收入的15%(132.3億美元)提高到20-30%。華為和榮耀都是這一領域的主要參與者,華為的內部芯片設計團隊海思創建了自己的芯片,以幫助其產品與基於高通和聯發科的產品區分開。

華為的爆炸性增長不僅涉及研發,還涉及行銷。隨著公司的擴大,華為經常選擇在歐洲各國召開發布會推出全新的智能手機,每場發布會的規模通常在500-2000人左右,相比之下,三星和蘋果則要低調了許多。

為了獲得更高品牌知名度和認知度,華為的行銷方法可謂是一把雙刃劍——在技術層面提供創新和解決方案的同時,在某些方面,華為的品牌資訊偏離了其更為謙和的基調。

GPU Turbo開發技術將成華為的關鍵。華為與高通驍龍在遊戲性能、影像品質和能效方面存在明顯差距。雖然在價格、性能、面積上使用矽芯片是一種平衡行為,並且會帶來一些收益,但通常會犧牲其他規格。

這就是為什麽GPU Turbo很重要,從硬體角度來說,GPU Turbo是一種“免費”的收益。它並沒用新芯片,而是通過專門的軟體開發出來的。這一功能幫助華為和榮耀的智能機中得到了不錯的推廣。當然,GPU Turbo還有很長的路要走,比如擴大支持的遊戲數量以及改進行銷方式。

對於GPU Turbo的行銷,華為更是下了大功夫。華為將有GPU Turbo加持的麒麟970和沒有GPU Turbo加持的麒麟960作比較,得出970比960性能超60%、功耗少30%的結論,但並沒有在每次展示中說清楚對比的方式,這可能是華為有意混淆,確實給用戶造成了一定的誤導。

通過基準檢測發現,這是通過加速以獲得更高的分數,表明華為試圖以此來蒙蔽用戶。雖然華為產品呈現爆炸式的增長,但如果只是為了性能獲得高分而隱藏真實的得分,將會極大降低消費者對於華為的信任度。

這一點,通過我們的基準檢測發現,是通過加速以獲得更高的分數,表明華為試圖以此來蒙蔽用戶。雖然華為呈現爆炸式的增長,但如果只是為了在性能獲得高分而試圖隱藏真實的數字,消費者對華為的信任就會很快消失。

不過正如在評論中多次提到的,我們已經更詳細地解釋了GPU Turbo,這個技術是真實的,並且很可能成為這家廠商在手機上實現差異化的催化劑。

至於華為的主題演講,我們為有創意和開創性技術的團隊點讚。在一個不斷競爭的環境中,芯片供應商需要與眾不同,並嘗試相互融合,GPU Turbo等技術正在成為創新優勢,從而改善整體用戶體驗。像GPU Turbo這樣的技術正作為創新優勢出現,提高整體用戶體驗。

如果時間,硬體和軟體允許,我們的目標是獲取麒麟980使用和不使用GPU Turbo的數據比較。這只是GPU Turbo故事的開始。

獲得更多的PTT最新消息
按讚加入粉絲團