特斯拉FSD芯片詳解：是“猛獸”還是“小貓”？

關注並標星電動星球News

每天打卡閱讀

更深刻理解汽車產業變革

————————

距離馬斯克發布「毀天滅地」的 Autopilot 硬體 3.0 已經過去兩個多月了——但有一個問題：這塊以「全自動駕駛（FSD）」命名的電路板，真的價值 56000 元嗎？或者說的更嚴重點，它真的代表著人類出行的未來嗎？

而現在，美國知名智能汽車媒體 Clean Technica 似乎拿到了更多幕後消息。

在前兩天的文章裡面，Clean Technica 針對硬體 3.0 的技術規格作出了更具體的判斷——這是一隻猛獸！

我們將這篇文章絕大部分進行了翻譯，並作未改變意思的編輯和注解，順便在文末加了幾個彩蛋。

總覽：來自車企的芯片弄潮兒

首先讓大家看一張硬體 3.0 主機板的圖片。

根據馬斯克的說法，這塊主機板做了完整的冗余，也就是說硬體 3.0 的每一個功能區都可以損壞，而整套硬體依然可以保持正常工作。主機板的右側是一些視頻輸出接口，左側是電源接口和一些另外的輸入/輸出接口。

整塊主機板最明顯的部分，就是碩大的兩個銀色處理器封裝（稱它們為處理器不太合適，稍後會解釋）。兩個處理器不是為了增強性能，而是為了圖像處理的安全和準確性——特斯拉實際上只允許一塊處理器工作，另一塊是為了冗余和相互對照處理結果。

在處理器封裝的左下角是用於儲存作業系統的閃存顆粒，考慮到這是一個承載著深度學習模型的，「可升級到自動駕駛能力」的硬體，閃存顆粒的容量應該不會小。

處理器封裝的兩旁是各自 4 片，一共 8 片 LPDDR4 運行記憶體顆粒。雖然 FSD 硬體使用的是三星的 14 納米工藝，但是運行記憶體顆粒上面很明顯打著鎂光的 LOGO。採用鎂光記憶體顆粒的原因可能是鎂光顆粒的頻率相對更高，而三星顆粒的頻率更低一點。

LPDDR4 是一種運行記憶體規範，是從DDR4 規範的分支，主要應用於功耗更低的移動設備，比如說手機等。LPDDR4 的速度比 DDR4 略慢，但是還是比硬體 2.X 的 DDR3 運行記憶體速度快很多。

最後再回到水冷模塊下面的兩塊銀色處理器封裝。

單塊封裝的面積大概是 260 毫米，Clean Technica 做了一張主流芯片的封裝面積對比圖。可以看到 2016 年英特爾的 14 納米處理器 i7 6700K 面積大概是 176 平方毫米，16 納米工藝，單芯片算力為 FSD 芯片 21%的NVIDIA Xavier，封裝面積是 350 平方毫米。12 納米工藝的 2019 年頂級 GPU，RTX2080Ti，封裝面積是 754 毫米。

硬體 3.0 主芯片：心有猛虎

上文說過的「處理器封裝」其實並不準確，因為在封裝裡麵包含著三種不同的處理單元：負責圖形處理的 GPU、負責深度學習和預測的神經處理單元 NPU，還有負責通用數據處理的中央處理器 CPU。

特斯拉官方表示，圖像數據處理的流程首先從攝影頭的高速數據傳輸開始——高速指的是25 億像素/秒，大概是往 21 塊 1080P 的全高清螢幕塞 60 幀畫面的程度。這個數據傳輸速度比特斯拉車型現有的8顆攝影頭可以產生的數據量多了不止一個維度。

如此高的傳輸速度現在還用不上——因為 FSD 芯片內置的圖像處理器ISP最高「只能」處理 10 億像素的數據量，也就是 8 塊 1080P 螢幕每秒 60 幀的程度——這已經追上現在世界上最快的消費級圖像傳輸標準 DisplayPort 1.4 了，而車載芯片「傳統上」是要落後消費級起碼一個時代的。

圖像處理器 ISP 的作用主要是將攝影頭產生的原始 RGB 三原色數據轉化成複雜的圖像信息，這些信息的下一站是神經處理單元 NPU，NPU 會根據深度學習模型對圖像數據作出處理——但在此之前，這些數據將會存儲在 SRAM 內。

那什麽是 SRAM？

SRAM 一般被應用在處理芯片的 1-3 級緩存上，你可以簡單地將它理解為比運行記憶體速度快很多，同時成本也高很多的存儲芯片。有多快？特斯拉芯片總工程師 Pete Bannon 表示，處理全自動駕駛的緩存帶寬至少要達到 1TB/秒，而 FSD 芯片的 SRAM 實際上能提供 2TB/秒的帶寬。

那32MB 的緩存又是什麽概念？做一個不是十分準確但足夠形象的比較，零售價 16999 元的英特爾酷睿 i9-9980XE，SRAM 緩存總量也僅為33.75MB。另一個細節是，2010 年英特爾CPU的最大 SRAM 僅為16MB，2014 年也只是增長到了 24MB。

SRAM 的價格之高，特斯拉 SRAM 規格之激進，相信大家也能管中窺豹——而 Pete Bannon 在發布會上也將巨大的 SRAM 容量總結為 FSD 芯片對比市場上同類芯片的最大的優勢。

芯片內部的所有數據都在淺藍色標注的主通道上傳輸，或者叫NOC（Network on Chip），然後才會經過總帶寬為 68GB/s的LPDDR4 運行記憶體——所以特斯拉目前的傳感器數據產生量大概率不會超過 68GB/s，甚至不會超過 34GB/s，當然這也已經是一個很嚇人的數字了——但記憶體帶寬可能還是自動駕駛的瓶頸。

NPU 是 FSD 芯片裡面的真正大殺器。但總有一些其他方面的數據處理是NPU 無法完成的，這時候就需要 CPU 和 GPU 共同參與。

FSD 芯片內置了主頻為 1GHZ 的 GPU，擁有 600TOPS 的運算能力。特斯拉的表述是 GPU 主要負責一些後處理的任務，比如說描繪人類能看得懂的界面和圖形——也就是說 2.X 時代特斯拉自動駕駛硬體的 AB 面設計將會大概率被取消。總的來說，按照特斯拉在發布會上對 GPU 的描述，以後的 FSD 芯片裡面，GPU 的地位將會被繼續削弱。

除此之外，一些通用數據只能交給 CPU 處理，特斯拉採用的是 12 個 64 位 ARM Cortex A72 內核，運行頻率為 2.2GHZ——準確點說應該是三個四核 CPU 的並聯架構。

特斯拉對於 CPU 架構的選擇有點讓人摸不著頭腦，因為 A72 是 ARM 在 2015 年推出的架構（雖然 2016 年才正式商用），往後可用的架構包括 A73 和 A75（A76 和 A77 是 2018/2019 年發布的）。

不過考慮到 FSD 芯片的研發是從 2016 年開始的，採用再前一年的架構也很正常。因為老架構更便宜，而多個核心疊加的方式也保證了多線程總性能不比如今頂級的 4 核心移動端 CPU 弱，甚至尤有勝之——硬體 3.0 的 CPU 性能是硬體 2.5 的 2.5 倍。

NVIDIA該開始緊張了？

在 FSD 芯片吊打全宇宙之後，NVIDIA在官方網站上發文稱特斯拉此舉「提升了自動駕駛計算的門檻」，滿滿的商業互吹味道。

事實上，NVIDIA本身就是被吊打的主角。目前多家 Tier1 供應鏈廠商和主流車企都在採用的NVIDIA AGX Xavier，是 FSD 之前算力最強的車載計算芯片——能提供 30TOPS 的算力（特斯拉在發布會稱 Xavier 算力為21TOPS，那是僅計算 GPU 單元的算力，後來NVIDIA發文指正）。

但特斯拉提出 21TOPS 的標準非常誅心：「多少 TOPS 能夠真正應用於自動駕駛相關的圖像處理和行為預測？」

這個標準和「芯片能提供多少算力」是截然不同的，它涉及到芯片本身的效率。當然NVIDIA標注 30TOPS 並沒有做錯，因為 Xavier 並不僅能用於自動駕駛，還能處理其他與汽車相關的數據。

所以我們必須清楚，當我們評判一套複雜的軟體體系的時候，最根本的目的就是要看它能達到多高的工作效率。最好的硬體，並不總是那些擁有最高理論性能的硬體。

特斯拉的 FSD 芯片非常複雜，連本應該是主處理器的 CPU，在 FSD 體系下都淪為了「協處理器」。特斯拉成功打造了一套在處理「自動駕駛」場景下非常高效的硬體，但在運行其他駕駛相關任務的時候卻未必。

然而NVIDIA也充分暴露了缺點——NVIDIA AGX Pegasus 最高可以通過雙芯片的布局實現 320TOPS 的總算力，但NVIDIA自家的 NV Link 2.0 多芯片數據傳輸標準卻只能提供 100GB/s 的帶寬。要知道坐擁 2TB 帶寬SRAM 的特斯拉也已經開始抱怨帶寬不夠用了。

更何況 AGX Pegasus 雙芯片的功耗高達 500W，在大多數電動汽車還沒達到隨便開 500 公里的今天，每小時多用小半度電依然是個不小的挑戰——而 FSD 芯片的功耗可以保持在 200W 左右。

硬體 4.0 什麽時候到來？

馬斯克在自動駕駛投資者日的發布會上，說過新一代的 FSD 芯片會在兩三年內到來，而性能將會起碼再翻一番。Clean Technica 也對硬體 4.0 的技術規格做了一點預測：

首先，CPU 部分將會跟進最新的架構。考慮到 FSD 2 代已經在研發當中，Cortex A75 會是一個可能性相當高的選擇。新的架構在提升性能的同時還會更省電，同時能節約更多芯片內的空間。

其次，特斯拉可能會將運行記憶體升級到 LPDDR5（這一點我們表示不讚同，因為 LPDDR5 甚至還沒有進入消費領域）。也有可能特斯拉為了成本和功耗的考慮小幅升級到 LPDDR4X，更低電壓同時還有更高速度（這點我們同意）。

另外還有基本是板上釘釘的 SRAM 容量提升，以及新一代攝影頭——現在的攝影頭甚至無法滿足硬體 3.0 的處理能力。最後一點可能就是徹底消失，或者起碼篇幅極小的 GPU，畢竟硬體 3.0 中 GPU 的唯一作用只有處理那些 CPU 和 NPU 無法處理的車機畫面顯示。

Clean Technica 的總結

特斯拉硬體 3.0 是一頭徹頭徹尾的猛獸——然後還要提幾點可能大家沒注意到的，但能夠解釋為什麽硬體 3.0 使特斯拉領跑自動駕駛賽道的細節，領跑指的是敗者食塵那種領跑。

幾乎所有現在在做電動汽車的企業都有那麽一兩手必殺技，但如果是和特斯拉比。即使是 2012 年的 Model S，都算得上是秒殺全場，而這還只是在電動汽車的基礎素質上秒殺，比如說續航、充電。

至於在智能、自動駕駛、自研能力上面，特斯拉的垂直整合能力可以說是天下無雙。

其他汽車廠商造電動汽車的方式，就是在供應鏈上買積木，如果買來的積木拚不上，那就用小刀略作修改，或者只能再買別的積木——而特斯拉造車，是自己造積木，所有部件渾然天成，並且都有著自己的升級迭代計劃。

馬斯克曾經說過，自動駕駛能且只能在純電動汽車上面實現，他是對的。汽油機相對更滯後的動力響應，以及更複雜的控制，都讓自動駕駛在汽油車上變得更危險。

最後，FSD 芯片再次證明了，特斯拉依然在領先全世界——領先好幾年那種。

電動星球的彩蛋

我們其實找到了一些更深入的消息。

前不久我們在 Reddit 上面找到了一張 6886x3511 像素的 FSD 主機板黑白照片。我們無法 100%確定這張照片是真的，但是可能性起碼達到了99.9%，因為上面每一個零件都有編號，而且連 PCB印刷的瑕疵都異常清晰。

在芯片封裝的左邊是運行記憶體顆粒，鎂光的 LOGO 和顆粒序列號清晰可見——而序列號就是顆粒的身份證號，可以通過序列號查詢出顆粒的具體規格。

首先，根據第一行序列號，這是一顆 2018 年第二周生產的顆粒（8表示2018，B 表示第 4 周，鎂光只在雙數周進行顆粒封裝），然後這是一顆 D-Die 顆粒（D 代表 D-Die，屬於鎂光產品線中性能相對一般的型號）， 77 分別代表芯片生產地和封裝地，7 代表中國台灣（5 代表中國大陸）。

第二行序列號相對更複雜，我們登陸了鎂光的官網，輸入第二行序列號進行解密，然後得到了顆粒的詳細編碼，根據這一行編碼，我們可以得知顆粒的詳細規格。

其中MT 代表 Micron Technology，鎂光科技的名稱；53 代表這是一顆 LPDDR4 顆粒；D 代表 1.1V 的工作電壓；512M 表示單顆顆粒的容量為 512MB；32 表示單顆粒位寬為 32bit，D2 表示這款顆粒是雙層封裝，也就是單顆體積裡面有兩顆 512MB 的顆粒，總容量 1GB；DS 是包裝編號；046表示這款顆粒的工作頻率是 2133MHZ；第一個 A 表示Automotive，車用顆粒；後面的 AT 表示 Automotive Temperature，符合車載工作溫度要求；最後一個 D 依然表示這是一顆 D-Die 顆粒。

也就是說，特斯拉硬體 3.0 實際上是擁有 4GB（考慮雙系統冗余）128bit 2133MHZ運行記憶體的，這個技術規格並不算頂尖——但那是與消費級電腦相比，與車載運算系統比，其實可以算是頂尖級別的了。

在 FSD 芯片的左下角是一顆閃存芯片，上面沒有 LOGO，但是有一串序列號——這是東芝閃存顆粒特有的序列號。

東芝官網沒有查詢入口，我們在美國商業資訊網 businesswire.com 上面找到了 2017 年 12 月的一則供應鏈新聞，裡面提到了這款閃存的型號 THGAF9G8L2LBAB7，是一款滿足車載娛樂系統和 ADAS 系統工作需求的 UFS 2.1 高速閃存，容量為 32GB。

32GB 應該算是一個不大不小的數目，但用於承載作業系統和深度學習模型已經足夠了，因為自動駕駛硬體上面的存儲芯片並沒有多媒體存儲的需求。

在兩塊 FSD 芯片的下面，是一塊印著 M 字 LOGO 的芯片——這是頂級網絡芯片公司 Marvell 的 LOGO，根據上面的產品編號，我們也在谷歌上找到了相對應的芯片，隸屬於千兆級別的有線網卡系列，最大傳輸速率為 128MB/s，具體的用途我們並不清楚。

以上，可能就是在狠心車主拆解之前，全網對於特斯拉 FSD 芯片最詳細的解析了，希望大家沒有睡著，我們下次再見。