标签: NVIDIA

  • NVIDIA NCA-AIIO 認證解析:AI 基礎設施與運維領域的入門敲門磚

    隨著 AI 技術全面進入企業環境,越來越多公司開始建置 GPU 叢集、AI 訓練平台、推理環境以及高效能資料中心。然而,AI 不只是模型開發,更需要強大的基礎設施(Infrastructure)與日常運維(Operations)來支撐。

    因此 NVIDIA 推出了 NCA-AIIO(NVIDIA Certified Associate – AI Infrastructure and Operations) 認證,專門針對 AI 基礎設施與運維人才設計,讓 IT、網路、資料中心及雲端工程師能夠快速進入 AI 基礎架構領域。


    什麼是 NCA-AIIO?

    NCA-AIIO 是 NVIDIA AI Infrastructure 認證路徑中的 Associate(入門級)認證。

    主要驗證考生是否具備:

    • AI 基礎知識
    • GPU 架構概念
    • AI 基礎設施規劃能力
    • AI 資料中心運維知識
    • NVIDIA AI 生態系理解

    它並非 AI 模型開發認證,而是偏向:

    • 資料中心工程師
    • 網路工程師
    • 系統管理員
    • DevOps 工程師
    • 雲端工程師
    • 解決方案架構師

    等基礎設施相關職位。


    考試基本資訊

    項目內容
    認證名稱NCA-AIIO
    全名NVIDIA Certified Associate – AI Infrastructure and Operations
    等級Associate
    題數50 題
    考試時間60 分鐘
    考試方式線上監考
    語言英文
    有效期限2 年
    官方價格USD 125

    官方建議考生具備基本資料中心基礎知識。


    NCA-AIIO 在 NVIDIA 認證體系中的位置

    NVIDIA AI Infrastructure 路線大致如下:

    NCA-AIIO

    ┌────┼────┐
    ↓ ↓ ↓
    NCP-AII NCP-AIO NCP-AIN

    AI AI AI
    Infrastructure Operations Networking

    其中:

    • NCA-AIIO:入門級
    • NCP-AII:AI Infrastructure 專家級
    • NCP-AIO:AI Operations 專家級
    • NCP-AIN:AI Networking 專家級

    因此 NCA-AIIO 可以視為整個 NVIDIA AI Infrastructure 路徑的起點。


    考試內容分析

    官方 Blueprint 將考試分為三大領域。


    第一部分:Essential AI Knowledge(38%)

    這部分是 AI 基礎理論。


    AI、Machine Learning、Deep Learning

    必須理解:

    AI

    人工智慧總稱

    例如:

    • ChatGPT
    • 自動駕駛
    • 推薦系統

    Machine Learning

    透過資料訓練模型。

    例如:

    • 分類
    • 預測
    • 聚類

    Deep Learning

    利用神經網路學習。

    例如:

    • LLM
    • Computer Vision
    • Speech Recognition

    訓練與推理

    考試經常出現。

    Training

    模型學習階段

    需求:

    • 大量 GPU
    • 高速網路
    • 大量儲存

    Inference

    模型使用階段

    需求:

    • 低延遲
    • 高併發
    • 穩定性

    需要理解兩者基礎架構差異。


    GPU 與 CPU 架構比較

    重點:

    CPUGPU
    少量核心大量核心
    適合序列運算適合平行運算
    通用運算AI 加速

    考試常問:

    為什麼 AI 訓練主要使用 GPU?


    NVIDIA AI 軟體生態系

    需要認識:

    • CUDA
    • TensorRT
    • NVIDIA AI Enterprise
    • NGC
    • cuDNN
    • RAPIDS

    了解每項工具在 AI 生命週期中的角色即可。


    第二部分:AI Infrastructure(40%)

    這是整份考試比重最高的領域。


    AI 伺服器硬體

    理解:

    • GPU Server
    • DGX 系統
    • PCIe
    • NVLink
    • NVSwitch

    重點:

    不同 AI 工作負載需要不同硬體配置。


    GPU 擴展規劃

    例如:

    小型部署

    • 1~8 張 GPU

    中型部署

    • 多節點 GPU

    大型部署

    • GPU Cluster

    需理解擴展思路。


    AI 網路架構

    高頻考點。

    需要了解:

    • Ethernet
    • InfiniBand
    • RDMA

    以及:

    • East-West Traffic
    • Latency
    • Throughput

    資料中心供電與散熱

    很多 IT 人員容易忽略。

    需理解:

    Power

    • Rack Power
    • PDU

    Cooling

    • Air Cooling
    • Liquid Cooling

    因 AI 伺服器功耗遠高於傳統伺服器。


    On-Prem 與 Cloud

    比較:

    項目On-PremCloud
    成本前期高按需付費
    彈性較低
    控制性較低

    考試常出情境題。


    DPU 概念

    NVIDIA 非常重視此領域。

    需了解:

    DPU(Data Processing Unit)

    用途:

    • 網路加速
    • 儲存加速
    • 安全卸載

    常見產品:

    NVIDIA BlueField DPU。


    第三部分:AI Operations(22%)

    偏向日常維運。


    GPU 監控

    需要理解:

    • GPU Utilization
    • Temperature
    • Memory Usage
    • Power Consumption

    AI Cluster 管理

    理解:

    • Resource Allocation
    • Job Scheduling
    • Multi-Tenant Environment

    容器化技術

    常見考點:

    • Docker
    • Kubernetes

    因為大多數 AI 工作負載都以容器方式部署。


    虛擬化

    了解:

    • GPU Passthrough
    • vGPU

    以及適用場景。


    資料中心監控

    需要認識:

    • DCGM
    • Cluster Monitoring
    • Alerting

    主要目標:

    • 提高可用性
    • 降低停機時間

    推薦學習路線

    第一階段:AI 基礎

    學習:

    • AI
    • ML
    • DL
    • Training vs Inference

    第二階段:GPU 基礎

    重點:

    • GPU Architecture
    • CUDA
    • Tensor Core

    第三階段:AI Infrastructure

    學習:

    • DGX
    • NVLink
    • InfiniBand
    • Storage

    第四階段:AI Operations

    學習:

    • Docker
    • Kubernetes
    • GPU Monitoring

    第五階段:NVIDIA 生態系

    熟悉:

    • CUDA
    • TensorRT
    • NGC
    • NVIDIA AI Enterprise

    適合哪些人報考?

    NCA-AIIO 特別適合:

    網路工程師

    例如:

    • Cisco
    • Juniper
    • Arista

    工程師希望轉向 AI 資料中心。


    系統管理員

    例如:

    • Windows Server
    • Linux Server

    管理人員。


    資料中心工程師

    希望進入 AI Infrastructure 領域。


    DevOps 工程師

    未來 AI Platform Engineer 的重要基礎。


    雲端工程師

    AWS、Azure、GCP 從業者。


    NCA-AIIO 的職涯價值

    取得 NCA-AIIO 後,可作為進入以下方向的第一步:

    • AI Infrastructure Engineer
    • GPU Platform Engineer
    • AI Operations Engineer
    • Data Center Engineer
    • AI Cloud Engineer
    • MLOps Engineer(基礎階段)

    同時也是進階挑戰 NCP-AII、NCP-AIO、NCP-AIN 的最佳準備。


    結語

    如果說 NCA-GENL 是「學會如何使用 AI」,那麼 NCA-AIIO 更像是「學會如何讓 AI 跑起來」。

    它不聚焦於 Prompt Engineering 或模型開發,而是專注於 AI 背後最重要的基礎設施:GPU、網路、儲存、資料中心與運維管理。

    對於具有網路、系統、虛擬化、雲端或資料中心背景的 IT 人員而言,NCA-AIIO 是目前轉型 AI Infrastructure 領域最適合作為起點的 NVIDIA 官方認證之一。

  • 黃仁勳GTC 2026演講:核心技術與變革解析

    原創 架構師技術聯盟
    一、開場定調:從晶片公司到 AI 基礎設施締造者2026 年 3 月 17 日,英偉達 GTC 年度大會在加利福尼亞州如期舉行,黃仁勳以標誌性皮夾克登場,用一場鎧達演講核心圍繞三大關鍵字:算力效率革命、Token 工廠經濟學、智能體生態重構,並拋出「2027 年前 Blackwell 與 Rubin 架構綜合採購訂單達 1 萬億美元」 的震撼預期,較去年預測,直接推動英偉達股價盤中漲漲約4.3%。


    二、科技硬派:Vera Rubin 平台重建 AI 算力標準作為本次演講的核心硬體發布,Vera Rubin AI 加速平台以已故天文學家命名,象徵其探索 AI 「暗物質」(極致算力)的野心,其技術突破體現於全端重建:
    •六顆核心協同架構:整合6 交換機、ConnectX-9 網卡、BlueField-4 DPU 與 Spectrum-6 交換機,形成完整 AI 工廠基礎設施,而非單一晶片產品。
    •製程與電晶體飛躍:採用台積電 3 奈米製程,整合 3360 億電晶體(較上一代 Blackwell 提升 61.5%),搭載 288GB HBM4 內存,內存頻寬達 22TB / 秒,單機組寬頻上網
    •算力與效率雙突破:FP4 精準度推論算力 50 PFLOPS(Blackwell 的 5 倍),訓練計算能力 35 PFLOPS(3.5 倍);每瓦效能提升 10 倍,且推論計算值
    •基礎設施革新:NVL72 機架採用 100% 液冷與無線纜模組化設計,安裝時間從 2 小時壓縮至 5 分鐘,以解決高密度算力的散熱與部署痛點。
    三、前瞻佈局:Rubin Ultra 與 Feynman 架構鎖定未來黃仁勳同時揭露兩代後續產品路線圖,彰顯技術迭代決心:
    •Rubin Ultra(2027 年量產):採用 Kyber 垂直機架架構,單機架整合 576NVL144 的 4 倍),升級 HBM4e 記憶體(總容量 365TB),功耗達 600 千瓦量級,專為超大規模世界模式訓練設計。 •Feynman 架構(2028 年):提前亮相的下一代架構採用台積電 1.6nm A16 製程,首次大規模集成矽光子光互連,帶寬密度提升 10 倍、傳輸能耗下降 90%,打破多路卡集群「互連牆」,為互連

    四、商業革命:Token 工廠經濟學定義 AI 新價值黃仁勳提出的全新商業邏輯,重建了 AI 產業的盈利模式:
    •核心定義:數據中心不再是存儲倉庫,而是生產 Token(AI 生成基本單位)的 「工廠」,電力中心不再是儲存倉庫,而是生產 Token(AI 生成基本單位)的核心指標「工廠」,電力是整合式企業生產的核心約束(1105),工廠競爭力
    •五級服務定價:將 AI 服務分為免費層(高吞吐低速度)、中階層(3 美元 / 百萬 Token)、高階層(6 美元)、高速層(45 美元)、超高速層(150 美元),吞吐量與產生速度直接轉換為企業收入。
    •數兆需求支援:60% 業務來自全球前五超大型雲端服務商,40% 涵蓋主權雲端、企業、產業等多元場景,通用型架構讓客戶投入具備長久生命週期,成為 「成本最低的 AI 基礎設施」。
    五、推理時代:Groq LPU 填補極速場景空白針對 AI 產業從訓練競賽轉向推理普惠的拐點,英偉達推出專用解決方案:
    •Groq 3 LPU 晶片:整合 2025 年收購的 Groq 技術,採用片上 SRAM 權重常駐設計,片內頻寬 80TB/s,微秒級響應,推理速度較傳統 GPU 提升低 5-101/倍、成本降至


    •非對稱分離推理:透過 Dynamo 軟體架構實現 Rubin 與 Groq 協同 -Rubin 負責大量計算的 Pre-fill 階段,Groq 承接延遲敏感的解碼階段,高階推理效能再提升 35 倍,並延遲減半。


    六、生態重構:NemoClaw 開啟智能體時代黃仁勳將智能體(Agent)視為 AI 下一站,透過生態開放建構產業標準:•OpenClaw 定位:類比 Windo ws 對 PC 的意義,這款開源 AI 代理框架被定義為 “智能體電腦的作業系統”,其開源專案短期內超越 Linux 三十年發展成就,OpenAI 已同步開源。


    •NemoClaw 開源方案:英偉達推出企業級智能體平台,內建安全沙箱、隱私路由器與策略引擎,提供從模型到部署的全流程工具鏈,支援企業快速建立自主執行任務的 AI。
    •模式矩陣佈局:涵蓋 Nemotron 大語言模式、Cosmos 世界基礎模式、GROOT 機器人模式、Alpamayo 自動駕駛模式等全場景,成立 Nemotron 聯盟推動基礎模式研發。
    七、實體 AI 落地:從數位世界走向實體經濟演講重點強調 AI 從 「數位產生」 到 「實體互動」 的跨越,展現規模化落地成果:
    •產業領域:與西門子深化合作,透過 Omniverse  /AIAI •汽車與交通:Alpamayo 自動駕駛系統規模上車,賓士、比亞迪等車企落地城市高階智駕;與 Uber 合作部署 RoboTaxi 車隊。
    •機器人與邊緣:實體 AI 控制堆疊讓機器人具備即時感知 – 決策 – 執行能力,且突破結構化環境限制;無線基地台升級為 NVIDIA Aerial AIRAN,以實現邊緣智慧節能。
    •太空探索:啟動 Vera Rubin Space-1 計劃,部署軌道資料中心,算力相當於 25 台 H100,拓展 AI 算力應用邊界。
    八、總結:
    AI 產業的三大拐點黃仁勳的演講清晰界定了 AI 產業的關鍵轉折:
    1.技術轉折點:

    從通用 GPU 到 「訓練 GPU + 推理 LPU + 光互聯 + 液冷」 的異構融合架構,能源效率比成為核心競爭力;
    2.商業拐點:從“算力資源” 到 “Token 產能”,數據中心成為盈利中心,每瓦 Token吞吐量決定商業成敗;
    3.應用轉折點:從“工具型 AI” 到 “智能體 AaaS”,物理 AI 落地打開數十億級實體經濟市場,AI 成為第四次工業革命核心引擎。

  • 程式設計師這個職業會在10年內被AI淘汰嗎?

    AI以肉眼可見的速度重塑編程,它能理解需求、產生程式碼、調試糾錯。它像一個不知疲倦、博聞強識的實習生,正在快速掌握從基礎到複雜的開發任務。
    這讓我們不得不直面一個核心問題,當AI越來越“能幹”,程式設計師的角色將走向何方?
    主題:程式設計師這個職業會在10年內被AI淘汰嗎? https://www.zhihu.com/question/591764104
    【回答1】
    壞消息:AI會寫程式碼;
    好消息:客戶說不清楚自己的需求。
    【回答2】
    程式設計師會不會被淘汰我不好說。
    但非程式設計師的能力邊界會被極大拓展,這是我親身經歷過,而且仍在經歷中的。
    回到五年前,我甚至都想像不到我今天除了本職運營工作外,具備了一些外掛出來的設計能力,又具備了一些外掛出來的編程能力,成為了一瓶真正的萬金油。
    【回答3】
    今天和同事剛好討論到這個問題,同事覺得AI寫程式碼非常適合,所以覺得程式猿會失業。
    我表示,你看我們兩個日常工作最大精力真的是花在寫程式碼和審核程式碼上面嗎?如果讓AI取代了低階寫碼功能,不是省力多了,有時間做更重要的事情嘛?
    至少身為一個士大夫以上等級的程式猿,我們更有價值的時間不都是在找出到底現在出了什麼問題,或者我們要去解決什麼問題,如何解決這個問題,分析哪個問題更優先解決,怎麼設計這個系統,怎麼驗證這個系統,審核別人設計的系統好不好之類的嗎。
    【回答4】
    現在我們看到AI很火,大有取代眾多職業之勢,但是,我的看法不變,程式設計師這個工種不會消失,最多只是工作方式變了。
    而且,現在AI的發展並未發生質變,沒有強智能產生,也就是這些AI只能透過機器訓練+來模擬人類智能,但仍是沒有感知的機器。
    對於人類已經重複無數次而且有模式可循的工作,AI的確有很大優勢,但是圈外人或者圈內邊緣人看到AI解一個算法題就得好驚嘆,但是真正圈內人都知道,真實的軟體開發工作可不是解決一個一個獨立的算法題,軟體開發幾乎總是要面對新的問題,每一個軟體專案都是會有獨一無二的挑戰。
    總是要有活人去解決這些獨一無二的挑戰,這需要人,人工智慧無法做判斷。從這個意義上說,總是需要有程式設計師,只是程式設計師的工作方式會改變。
    【回答5】
    起初我的看法是:有可能淘汰一部分程式設計師。
    幾年後,我的看法是:不可能淘汰程式設計師,甚至很難淘汰其它產業。
    為什麼會有這個轉變呢?因為我突然意識到了另一個層次。
    首先說,為什麼我最初認為,它有可能淘汰一部分程式設計師,因為在我看來,它確實能提升一部分任務的效率。
    雖然這部分任務在實際程式活動中佔比並沒有那麼高,但客觀來說,就確實能提升一部分效率。這部分提升量,有的人認為是5%~10%,也有人認為在10~15%。總的來說,你就認為它確實對程式設計的產出效率有提升就是了。
    但是,程式效率有提升這件事,是第一次發生嗎?或者說,2020年的程式效率,跟2010年,2000年,是一樣的嗎?事實上,答案是否定的,在程式設計這個產業誕生以來,它的效率一直都在提升,2020年的程式設計師,能夠以2000年根本想像不到的效率來完成比當初複雜度高出許多的程式。我甚至可以肯定的說,2020年相比2000年之間,在程式設計工具程式語言等方面對程式設計師程式設計效率的提升,幅度其實並不小於AI。
    然而,程式設計師的工作強度,在2000~2020年的這個時間段,究竟是下降了還是提升了?程式設計師是被淘汰了還是程式設計師工作越來越多了?雖然2020年程式效率更高,但程式設計師並沒有比2000年更輕鬆,甚至反而更累了。
    程式設計師也沒有淘汰,反而,需要程式設計師的工作變多了。為什麼會出現這樣的情況?
    為什麼提升程式設計師的程式效率,提升程式設計師的產出效率,不但沒有減少程式設計師,反而造成了程式設計師的增加,不但沒有讓程式設計師更輕鬆,反而使得程式設計師更苦逼,更累了?
    答案是對程式設計師產出的期待值變高了,當你的工具提升10%效率的時候,對你的產出期待可能提高了20%,你不但沒有更輕鬆,反而更累了。
    而程式設計師產業的捲,並不是只做出指定需求的產品,而是做出達到友商水準或超過友商水準的產品。這就意味著,其實對程式設計師而言,大家都提升等於沒提升,因為公司要想捲過友商,那麼對程式設計師的產出要求就必然跟友商看齊,而既然友商都能獲得AI帶來的產出效率提升,那麼,業界所有產商對程式設計師的產出要求就會提升。
    做同樣的產品,需求的精細度,功能的複雜度都提升了,行業會提升對你產物的要求,這些需求吃掉了程式設計師本身工具效率提升的紅利,因此程式設計師不但沒有更輕鬆,反而更累了。
    甲方會提出越來越複雜的需求,你的產能不提升就會被友商卷死,訂單被友商搶走,所以程式設計師做的產品也只能在提升產能的情況下,價格不變。
    這就意味著,因為需求並非恆定不變,AI對程式設計師提升的那點效率,會被提升的更多的需求吃掉,AI沒法淘汰程式設計師,反而需要更多程式設計師。一方面是維護AI本身還需要程式設計師,二方面是管理階層會高估AI對產能的提升,提前把產能需求增加到完全吃掉你AI產能紅利的地步。
    雖然我發現我所在的程式設計師產業,確定如此,資本會吃掉程式設計師自身效率帶來的所有提升,但其它產業是否也是如此?
    AI帶來的產能提升會被成長的需求覆蓋掉,使得最終員工無法享受到這個紅利,如果它成為更普遍的現象,那麼恐怕AI無法淘汰掉任何職業,只會讓更多職業對產出效率的要求變得更高。
    以上。

  • Nvidia成全球首家市值達五兆美元公司

    Nvidia(英偉達)週三創造了歷史,成為首家市值達到五萬億美元的公司,這場驚人的股價飆升鞏固了其在全球人工智慧浪潮中的核心地位。
    這一里程碑凸顯了該公司從一個小眾圖形晶片設計公司迅速轉變為全球人工智慧產業的中堅力量,使執行長黃仁勳(黃仁勳)成為矽谷代表性人物,並使其先進的晶片成為中美科技競爭的熱點。
    自2022年ChatGPT問世以來,英偉達股價已飆漲12倍,推動標普500指數屢創新高,也引發市場對科技估值泡沫的討論。
    在英偉達市值突破4兆美元大關僅三個月後,此次突破5兆美元標誌著已超越全球加密貨幣總市值,約等於歐洲指標股指史托克600指數的一半。
    黃仁勳週二公佈了 5,000 億美元的人工智慧晶片訂單,並表示計劃為美國政府建造七台超級電腦。
    同時,該公司Blackwell晶片的銷售因美國出口管製成為中美科技競爭的關鍵議題之一。

    股價大漲,黃仁勳財富暴增
    根據監管文件與路透社的估算,以目前股價計算,Nvidia執行長黃仁勳持股價值約1,792億美元,使他成為《富比士》全球富豪榜上的第八名。
    雖然 Nvidia 仍是人工智慧競賽中當之無愧的領跑者,但蘋果和微軟等大科技公司近幾個月的市值也已突破 4 兆美元。
    分析師稱,這一漲勢反映了投資者對人工智慧支出持續成長的信心,但也有分析師警告稱,估值可能已經過熱。

  • 英偉達:下一代GPU細節曝光

    架构师技术联盟

    本文轉自「英偉達:下一代GPU細節曝光」。 Nvidia 正在準備該公司的 GeForce RTX 50 系列 (Blackwell) 產品,以與最好的顯示卡競爭。 著名硬體洩密者 @kopite7kimi 聲稱,根據他的訊息,Blackwell系列的記憶體介面配置不會與Ada Lovelace系列有太大差異。 既然這是洩漏,請持保留態度。 我們從先前發布的一些洩密資訊中了解到 ,該公司計劃在其基於Blackwell 架構 的下一代頂級 GB202 GPU 中保留 384 位元記憶體總線 。

    相關連結:

    1.英偉達NVLink技術詳細概述

    2.英偉達Blackwell平台網路配置詳解

    3.英偉達GB200 NVL72全連網技術,銅纜方案或成為未來趨勢?

    4.英偉達Blackwell性能增加5倍,AMD/Intel產品升級,國產廠商如果應對?

    更多GPU技術細節,請參考文章“最新版:GPU顯示卡天梯圖(2023年11月)”,“全球GPU呈現“一超一強”競爭格局”,“2023年GPU顯卡詞條報告”,“ HBM崛起:從GPU到CPU”,“英偉達GPU龍頭穩固,國內逐步追趕(2023)”,“英偉達L40S GPU架構及A100、H100對比”,“AI晶片第一極:GPU性能、技術全面分析”, “主流國產GPU產品及規格概述(2023)”,“新型GPU雲桌面發展白皮書”,“國內外GPU現狀:海外龍頭領跑,國產差距明顯”,“GPGPU流式多處理器架構及原理”等等 。

    Nvidia 的 Blackwell 可能是該公司第一個支援GDDR7記憶體的系列,與現有的GDDR6和GDDR6X記憶體解決方案相比,其更高的資料傳輸速率和架構特性有望顯著提高效能。 鑑於第一代 GDDR7 SGRAM IC 將具有 32 GT/s 的資料傳輸速率,採用這些晶片的 384 位元記憶體子系統將提供約 1,536 GB/s 的頻寬,因此 512 位元記憶體介面是不容錯過的。

    雖然我對512位元還抱有幻想,但GB20x的記憶體介面配置和AD10x沒有太大差別。

    2024 年 3 月 9 日,美光錶示 16 Gb 和 24 Gb GDDR7晶片將於 2025 年上市,但其路線圖並未顯示這些設備是否會同時推出,還是 16 Gb 會更早推出。 也就是說,仍有待觀察的是 Nvidia 是否會在其原始的 GeForce RTX 50 系列顯示卡中使用 16 Gb 還是 24 Gb GDDR7 記憶體 IC。

    由於英偉達的Blackwell家族至少還有兩到四分之三的時間,現在很難做出預測。 然而,我們在表中概述了GB200系列供電產品的可能記憶體配置。

    在迄今為止的幾代產品中,Nvidia 的頂級消費性顯示卡均使用 384 位元記憶體介面(AD102、GA102),事實證明,從效能和成本的角度來看,該介面是最佳的。 Nvidia 頂級消費性圖形產品的精簡版採用 320 位元記憶體接口,而高階 GPU 則採用 256 位元匯流排(例如 AD103、GA103 和 GA104)。 同時,效能主流段也有採用192位元記憶體匯流排的GPU(如AD104、GA106)及主流段採用128位元記憶體介面的GPU(如AD106、AD107、GA107)。

    雖然洩密者的評論表明Blackwell系列將在很大程度上保留當前Ada Lovelace系列的記憶體介面配置,但應該記住,根據同一洩密者,Blackwell 系列將缺少 GB204 GPU。 相比之下,傳聞中的GB205很可能不會直接繼承 AD104。

    功率突破1000W?

    如果你認為 Nvidia 的 700W H100 是又熱又耗電的機器,那就等到今年稍後 的 B100 GPU上市吧。

    戴爾科技集團營運長 Jeff Clarke 表示,Nvidia 最新的 AI 加速器的功耗將達到 1,000 瓦,比其前身高出 42%。 但別擔心,他非常確定馴服這頭野獸不需要液體冷卻。

    克拉克上週在戴爾財報電話會議上對投資者表示:「我們對H200 所發生的事情及其性能改進感到興奮。」他補充說,他對Nvidia 即將推出的B100 加速器和另一個他稱為B200 的加速器 也有同樣的感受。 。

    他認為,處理每個功耗 1,000 瓦的 GPU 不需要直接液體冷卻——他說「明年 B200 就會達到這一水平」。

    目前還不完全清楚 Clarke 所指的「B200」卡是什麼,因為去年秋天英偉達與投資者分享的路線圖上沒有出現該名稱的晶片。 然而,我們懷疑 Clarke 實際上指的是 GB200 Superchip,它與GH200一樣,預計將 Nvidia 的 Grace CPU 與其 B100 GPU 結合起來。