每日最新頭條.有趣資訊

特斯拉FSD芯片詳解:是“猛獸”還是“小貓”?

關注並標星電動星球News

每天打卡閱讀

更深刻理解汽車產業變革

————————

距離馬斯克發布「毀天滅地」的 Autopilot 硬體 3.0 已經過去兩個多月了——但有一個問題:這塊以「全自動駕駛(FSD)」命名的電路板,真的價值 56000 元嗎?或者說的更嚴重點,它真的代表著人類出行的未來嗎?

而現在,美國知名智能汽車媒體 Clean Technica 似乎拿到了更多幕後消息。

在前兩天的文章裡面,Clean Technica 針對硬體 3.0 的技術規格作出了更具體的判斷——這是一隻猛獸!

我們將這篇文章絕大部分進行了翻譯,並作未改變意思的編輯和注解,順便在文末加了幾個彩蛋。

總覽:來自車企的芯片弄潮兒

首先讓大家看一張硬體 3.0 主機板的圖片。

根據馬斯克的說法,這塊主機板做了完整的冗余,也就是說硬體 3.0 的每一個功能區都可以損壞,而整套硬體依然可以保持正常工作。主機板的右側是一些視頻輸出接口,左側是電源接口和一些另外的輸入/輸出接口。

整塊主機板最明顯的部分,就是碩大的兩個銀色處理器封裝(稱它們為處理器不太合適,稍後會解釋)。兩個處理器不是為了增強性能,而是為了圖像處理的安全和準確性——特斯拉實際上只允許一塊處理器工作,另一塊是為了冗余和相互對照處理結果。

在處理器封裝的左下角是用於儲存作業系統的閃存顆粒,考慮到這是一個承載著深度學習模型的,「可升級到自動駕駛能力」的硬體,閃存顆粒的容量應該不會小。

處理器封裝的兩旁是各自 4 片,一共 8 片 LPDDR4 運行記憶體顆粒。雖然 FSD 硬體使用的是三星的 14 納米工藝,但是運行記憶體顆粒上面很明顯打著鎂光的 LOGO。採用鎂光記憶體顆粒的原因可能是鎂光顆粒的頻率相對更高,而三星顆粒的頻率更低一點。

LPDDR4 是一種運行記憶體規範,是從DDR4 規範的分支,主要應用於功耗更低的移動設備,比如說手機等。LPDDR4 的速度比 DDR4 略慢,但是還是比硬體 2.X 的 DDR3 運行記憶體速度快很多。

最後再回到水冷模塊下面的兩塊銀色處理器封裝。

單塊封裝的面積大概是 260 毫米,Clean Technica 做了一張主流芯片的封裝面積對比圖。可以看到 2016 年英特爾的 14 納米處理器 i7 6700K 面積大概是 176 平方毫米,16 納米工藝,單芯片算力為 FSD 芯片 21%的NVIDIA Xavier,封裝面積是 350 平方毫米。12 納米工藝的 2019 年頂級 GPU,RTX2080Ti,封裝面積是 754 毫米。

硬體 3.0 主芯片:心有猛虎

上文說過的「處理器封裝」其實並不準確,因為在封裝裡麵包含著三種不同的處理單元:負責圖形處理的 GPU、負責深度學習和預測的神經處理單元 NPU,還有負責通用數據處理的中央處理器 CPU。

特斯拉官方表示,圖像數據處理的流程首先從攝影頭的高速數據傳輸開始——高速指的是25 億像素/秒,大概是往 21 塊 1080P 的全高清螢幕塞 60 幀畫面的程度。這個數據傳輸速度比特斯拉車型現有的8顆攝影頭可以產生的數據量多了不止一個維度。

如此高的傳輸速度現在還用不上——因為 FSD 芯片內置的圖像處理器ISP最高「只能」處理 10 億像素的數據量,也就是 8 塊 1080P 螢幕每秒 60 幀的程度——這已經追上現在世界上最快的消費級圖像傳輸標準 DisplayPort 1.4 了,而車載芯片「傳統上」是要落後消費級起碼一個時代的。

圖像處理器 ISP 的作用主要是將攝影頭產生的原始 RGB 三原色數據轉化成複雜的圖像信息,這些信息的下一站是神經處理單元 NPU,NPU 會根據深度學習模型對圖像數據作出處理——但在此之前,這些數據將會存儲在 SRAM 內。

那什麽是 SRAM?

SRAM 一般被應用在處理芯片的 1-3 級緩存上,你可以簡單地將它理解為比運行記憶體速度快很多,同時成本也高很多的存儲芯片。有多快?特斯拉芯片總工程師 Pete Bannon 表示,處理全自動駕駛的緩存帶寬至少要達到 1TB/秒,而 FSD 芯片的 SRAM 實際上能提供 2TB/秒的帶寬。

那32MB 的緩存又是什麽概念?做一個不是十分準確但足夠形象的比較,零售價 16999 元的英特爾酷睿 i9-9980XE,SRAM 緩存總量也僅為33.75MB。另一個細節是,2010 年英特爾CPU的最大 SRAM 僅為16MB,2014 年也只是增長到了 24MB。

SRAM 的價格之高,特斯拉 SRAM 規格之激進,相信大家也能管中窺豹——而 Pete Bannon 在發布會上也將巨大的 SRAM 容量總結為 FSD 芯片對比市場上同類芯片的最大的優勢。

芯片內部的所有數據都在淺藍色標注的主通道上傳輸,或者叫NOC(Network on Chip),然後才會經過總帶寬為 68GB/s的LPDDR4 運行記憶體——所以特斯拉目前的傳感器數據產生量大概率不會超過 68GB/s,甚至不會超過 34GB/s,當然這也已經是一個很嚇人的數字了——但記憶體帶寬可能還是自動駕駛的瓶頸。

NPU 是 FSD 芯片裡面的真正大殺器。但總有一些其他方面的數據處理是NPU 無法完成的,這時候就需要 CPU 和 GPU 共同參與。

FSD 芯片內置了主頻為 1GHZ 的 GPU,擁有 600TOPS 的運算能力。特斯拉的表述是 GPU 主要負責一些後處理的任務,比如說描繪人類能看得懂的界面和圖形——也就是說 2.X 時代特斯拉自動駕駛硬體的 AB 面設計將會大概率被取消。總的來說,按照特斯拉在發布會上對 GPU 的描述,以後的 FSD 芯片裡面,GPU 的地位將會被繼續削弱。

除此之外,一些通用數據只能交給 CPU 處理,特斯拉採用的是 12 個 64 位 ARM Cortex A72 內核,運行頻率為 2.2GHZ——準確點說應該是三個四核 CPU 的並聯架構。

特斯拉對於 CPU 架構的選擇有點讓人摸不著頭腦,因為 A72 是 ARM 在 2015 年推出的架構(雖然 2016 年才正式商用),往後可用的架構包括 A73 和 A75(A76 和 A77 是 2018/2019 年發布的)。

不過考慮到 FSD 芯片的研發是從 2016 年開始的,採用再前一年的架構也很正常。因為老架構更便宜,而多個核心疊加的方式也保證了多線程總性能不比如今頂級的 4 核心移動端 CPU 弱,甚至尤有勝之——硬體 3.0 的 CPU 性能是硬體 2.5 的 2.5 倍。

NVIDIA該開始緊張了?

在 FSD 芯片吊打全宇宙之後,NVIDIA在官方網站上發文稱特斯拉此舉「提升了自動駕駛計算的門檻」,滿滿的商業互吹味道。

事實上,NVIDIA本身就是被吊打的主角。目前多家 Tier1 供應鏈廠商和主流車企都在採用的NVIDIA AGX Xavier,是 FSD 之前算力最強的車載計算芯片——能提供 30TOPS 的算力(特斯拉在發布會稱 Xavier 算力為21TOPS,那是僅計算 GPU 單元的算力,後來NVIDIA發文指正)。

但特斯拉提出 21TOPS 的標準非常誅心:「多少 TOPS 能夠真正應用於自動駕駛相關的圖像處理和行為預測?」

這個標準和「芯片能提供多少算力」是截然不同的,它涉及到芯片本身的效率。當然NVIDIA標注 30TOPS 並沒有做錯,因為 Xavier 並不僅能用於自動駕駛,還能處理其他與汽車相關的數據。

所以我們必須清楚,當我們評判一套複雜的軟體體系的時候,最根本的目的就是要看它能達到多高的工作效率。最好的硬體,並不總是那些擁有最高理論性能的硬體。

特斯拉的 FSD 芯片非常複雜,連本應該是主處理器的 CPU,在 FSD 體系下都淪為了「協處理器」。特斯拉成功打造了一套在處理「自動駕駛」場景下非常高效的硬體,但在運行其他駕駛相關任務的時候卻未必。

然而NVIDIA也充分暴露了缺點——NVIDIA AGX Pegasus 最高可以通過雙芯片的布局實現 320TOPS 的總算力,但NVIDIA自家的 NV Link 2.0 多芯片數據傳輸標準卻只能提供 100GB/s 的帶寬。要知道坐擁 2TB 帶寬SRAM 的特斯拉也已經開始抱怨帶寬不夠用了。

更何況 AGX Pegasus 雙芯片的功耗高達 500W,在大多數電動汽車還沒達到隨便開 500 公里的今天,每小時多用小半度電依然是個不小的挑戰——而 FSD 芯片的功耗可以保持在 200W 左右。

硬體 4.0 什麽時候到來?

馬斯克在自動駕駛投資者日的發布會上,說過新一代的 FSD 芯片會在兩三年內到來,而性能將會起碼再翻一番。Clean Technica 也對硬體 4.0 的技術規格做了一點預測:

首先,CPU 部分將會跟進最新的架構。考慮到 FSD 2 代已經在研發當中,Cortex A75 會是一個可能性相當高的選擇。新的架構在提升性能的同時還會更省電,同時能節約更多芯片內的空間。

其次,特斯拉可能會將運行記憶體升級到 LPDDR5(這一點我們表示不讚同,因為 LPDDR5 甚至還沒有進入消費領域)。也有可能特斯拉為了成本和功耗的考慮小幅升級到 LPDDR4X,更低電壓同時還有更高速度(這點我們同意)。

另外還有基本是板上釘釘的 SRAM 容量提升,以及新一代攝影頭——現在的攝影頭甚至無法滿足硬體 3.0 的處理能力。最後一點可能就是徹底消失,或者起碼篇幅極小的 GPU,畢竟硬體 3.0 中 GPU 的唯一作用只有處理那些 CPU 和 NPU 無法處理的車機畫面顯示。

Clean Technica 的總結

特斯拉硬體 3.0 是一頭徹頭徹尾的猛獸——然後還要提幾點可能大家沒注意到的,但能夠解釋為什麽硬體 3.0 使特斯拉領跑自動駕駛賽道的細節,領跑指的是敗者食塵那種領跑。

幾乎所有現在在做電動汽車的企業都有那麽一兩手必殺技,但如果是和特斯拉比。即使是 2012 年的 Model S,都算得上是秒殺全場,而這還只是在電動汽車的基礎素質上秒殺,比如說續航、充電。

至於在智能、自動駕駛、自研能力上面,特斯拉的垂直整合能力可以說是天下無雙。

其他汽車廠商造電動汽車的方式,就是在供應鏈上買積木,如果買來的積木拚不上,那就用小刀略作修改,或者只能再買別的積木——而特斯拉造車,是自己造積木,所有部件渾然天成,並且都有著自己的升級迭代計劃。

馬斯克曾經說過,自動駕駛能且只能在純電動汽車上面實現,他是對的。汽油機相對更滯後的動力響應,以及更複雜的控制,都讓自動駕駛在汽油車上變得更危險。

最後,FSD 芯片再次證明了,特斯拉依然在領先全世界——領先好幾年那種。

電動星球的彩蛋

我們其實找到了一些更深入的消息。

前不久我們在 Reddit 上面找到了一張 6886x3511 像素的 FSD 主機板黑白照片。我們無法 100%確定這張照片是真的,但是可能性起碼達到了99.9%,因為上面每一個零件都有編號,而且連 PCB印 刷的瑕疵都異常清晰。

在芯片封裝的左邊是運行記憶體顆粒,鎂光的 LOGO 和顆粒序列號清晰可見——而序列號就是顆粒的身份證號,可以通過序列號查詢出顆粒的具體規格。

首先,根據第一行序列號,這是一顆 2018 年第二周生產的顆粒(8表示2018,B 表示第 4 周,鎂光只在雙數周進行顆粒封裝),然後這是一顆 D-Die 顆粒(D 代表 D-Die,屬於鎂光產品線中性能相對一般的型號), 77 分別代表芯片生產地和封裝地,7 代表中國台灣(5 代表中國大陸)。

第二行序列號相對更複雜,我們登陸了鎂光的官網,輸入第二行序列號進行解密,然後得到了顆粒的詳細編碼,根據這一行編碼,我們可以得知顆粒的詳細規格。

其中MT 代表 Micron Technology,鎂光科技的名稱;53 代表這是一顆 LPDDR4 顆粒;D 代表 1.1V 的工作電壓;512M 表示單顆顆粒的容量為 512MB;32 表示單顆粒位寬為 32bit,D2 表示這款顆粒是雙層封裝,也就是單顆體積裡面有兩顆 512MB 的顆粒,總容量 1GB;DS 是包裝編號;046表示這款顆粒的工作頻率是 2133MHZ;第一個 A 表示Automotive,車用顆粒;後面的 AT 表示 Automotive Temperature,符合車載工作溫度要求;最後一個 D 依然表示這是一顆 D-Die 顆粒。

也就是說,特斯拉硬體 3.0 實際上是擁有 4GB(考慮雙系統冗余)128bit 2133MHZ運行記憶體的,這個技術規格並不算頂尖——但那是與消費級電腦相比,與車載運算系統比,其實可以算是頂尖級別的了。

在 FSD 芯片的左下角是一顆閃存芯片,上面沒有 LOGO,但是有一串序列號——這是東芝閃存顆粒特有的序列號。

東芝官網沒有查詢入口,我們在美國商業資訊網 businesswire.com 上面找到了 2017 年 12 月的一則供應鏈新聞,裡面提到了這款閃存的型號 THGAF9G8L2LBAB7,是一款滿足車載娛樂系統和 ADAS 系統工作需求的 UFS 2.1 高速閃存,容量為 32GB。

32GB 應該算是一個不大不小的數目,但用於承載作業系統和深度學習模型已經足夠了,因為自動駕駛硬體上面的存儲芯片並沒有多媒體存儲的需求。

在兩塊 FSD 芯片的下面,是一塊印著 M 字 LOGO 的芯片——這是頂級網絡芯片公司 Marvell 的 LOGO,根據上面的產品編號,我們也在谷歌上找到了相對應的芯片,隸屬於千兆級別的有線網卡系列,最大傳輸速率為 128MB/s,具體的用途我們並不清楚。

以上,可能就是在狠心車主拆解之前,全網對於特斯拉 FSD 芯片最詳細的解析了,希望大家沒有睡著,我們下次再見。

獲得更多的PTT最新消息
按讚加入粉絲團