Appearance
當 AI 飛向太空:nanoGPT 上軌道背後的科技巨頭競賽
從 Andrej Karpathy 的一則推文,看見 AI 算力競賽的下一個戰場
2025 年 12 月
一則推文,一個時代的起點
12 月 10 日,前 Tesla AI 總監、OpenAI 共同創辦人 Andrej Karpathy 在 X 上發了一則簡短的推文:
"nanoGPT - the first LLM to train and inference in space 🥹. It begins."
Andrej Karpathy 的歷史性推文
他轉發的是 Starcloud 首席工程師 Adi Oltean 的消息:他們剛剛用搭載在 Starcloud-1 衛星上的 NVIDIA H100 GPU,在太空中訓練了第一個大型語言模型。訓練資料?莎士比亞全集。訓練完成後,這個模型開始用莎士比亞的風格說話。
"It begins"——這兩個字背後,是一場即將改變人類運算基礎設施的競賽。
為什麼是 nanoGPT?為什麼是莎士比亞?
要理解這則新聞的份量,得先認識 nanoGPT 的來歷。
2022 年 12 月,ChatGPT 剛發布幾週後,Karpathy 寫了一個只有約 600 行 Python 的小專案,目的是讓任何人都能理解 GPT 是怎麼運作的。他選擇莎士比亞全集作為預設訓練資料,因為資料量小、訓練快,而且結果很容易驗證——你馬上就能看到模型有沒有學會「用莎士比亞的方式說話」。
這個教學用的小玩具,後來演化出了驚人的生命力:它成為 llm.c(純 C/CUDA 實現)的基準、被改造成研究框架、訓練時間從最初的 45 分鐘被社群優化到只要 3 分鐘。2025 年 11 月,Karpathy 宣布 nanoGPT 正式「退休」,由更完整的 nanochat 接棒。
然後,就在它退休後不到一個月,nanoGPT 在太空中完成了訓練。
Starcloud 團隊選擇這個組合,大概有幾個原因:向 Karpathy 致敬、證明概念的簡潔性、以及——最重要的——展示即使是最基本的 LLM 訓練流程,現在也能在軌道上完成。
當 Karpathy 說 "It begins",他看到的不只是自己的程式碼上了太空。他看到的是:AI 算力正式脫離地球的束縛。
地球的瓶頸:為什麼要把資料中心搬到太空?
要理解這場競賽的驅動力,得先看看地面資料中心面臨的困境。
電力危機:訓練一個大型 AI 模型消耗的電力驚人。根據預測,到 2030 年全球 AI 資料中心的電力需求將達到 347 GW。這是什麼概念?美國全國的平均用電量大約是 500 GW。科技公司正在瘋狂搶購電力,Microsoft 甚至因為電力不足而囤積了大量 GPU 卻無法使用。
冷卻難題:GPU 運算產生大量熱能,傳統資料中心依賴淡水蒸發來冷卻。在水資源日益緊張的今天,這成了另一個瓶頸。
土地與審批:建造一座超大型資料中心需要大量土地、漫長的環評、複雜的審批流程。在西方國家,這個過程可能需要數年。
太空提供了一個激進的解決方案:
在正確的軌道上,太陽能板的效率是地面的 8 倍,而且幾乎可以 24 小時持續發電。太空的真空環境是天然的散熱器——你只需要把熱量輻射出去,不需要任何冷卻水。沒有土地問題、沒有鄰避效應、沒有環評。
當然,代價是你得把東西送上太空。但隨著 SpaceX 等公司持續降低發射成本,這個方程式正在改變。Google 的分析顯示,如果發射成本降到每公斤 200 美元以下(預計 2030 年代中期可達成),太空資料中心的經濟效益將與地面設施相當。
競賽者們:誰在佈局太空算力?
Starcloud:第一個吃螃蟹的人
Starcloud 是一家 2024 年成立的 YC 新創公司(原名 Lumen Orbit),總部在華盛頓州。創辦團隊背景驚人:CEO Philip Johnston 有哈佛國安碩士和沃頓 MBA;CTO Ezra Feilden 在 Airbus 和 NASA 月球探路者任務工作過;首席工程師 Adi Oltean 來自 SpaceX Starlink 團隊。
2025 年 11 月,他們發射了 Starcloud-1——一顆只有小冰箱大小的衛星,卻搭載了人類送上太空的最強 GPU:NVIDIA H100,算力是過去任何太空 GPU 的 100 倍。
他們的野心不止於此。Starcloud 的白皮書描繪了一個 5 GW 的軌道資料中心,配備約 4 公里見方的超大型太陽能板和散熱面板。下一顆衛星 Starcloud-2 將在 2026 年發射,搭載更多 GPU 和 NVIDIA Blackwell 架構。
SpaceX:Musk 的終極願景
Elon Musk 的計劃是另一個量級。
2025 年 10 月底,Musk 在 X 上確認 SpaceX 將進軍太空資料中心,方法是「直接把 Starlink V3 衛星放大」。Starlink 已經是全球最大的衛星網路,擁有超過其他所有國家加總還多的在軌衛星。V3 衛星預計 2026 年開始大規模部署,具備 1 Tbps 的資料傳輸能力和衛星間雷射通訊。
但 Musk 的視野遠不止於此。他聲稱 Starship 每年可以將 300-500 GW 的太陽能 AI 衛星送入軌道——這相當於每年新增半個美國的用電量。他甚至提到在月球建立工廠,就地生產 AI 衛星,每年產出 100 TW 的算力。
這不是商業計劃,這是文明等級的躍進。Musk 明確表示,太陽能 AI 衛星是通往「卡爾達舍夫二型文明」(能夠利用整顆恆星能量輸出的文明)的路徑。
為了實現這個願景,SpaceX 計劃在 2026 年 IPO,目標估值超過 1.5 兆美元,募資明確用於建造太空資料中心。
Google:Project Suncatcher
Google 在 2025 年 11 月公布了「Project Suncatcher」計劃,目標是在太空中部署 81 顆衛星組成的叢集,每顆都搭載 Google 自家的 TPU 晶片,透過光學通訊連結成一個分散式運算網路。
這個叢集會在「晨昏同步軌道」運行——這個軌道讓衛星幾乎永遠處於陽光下,最大化太陽能收集效率。Google 已經測試了 TPU 在輻射環境下的耐受性,結果顯示晶片可以在軌道上存活約五年。
Google 將與衛星影像公司 Planet Labs 合作,預計 2027 年初發射兩顆原型衛星進行測試。CEO Sundar Pichai 表示,十年內太空資料中心將成為「更正常的建造方式」。
其他玩家
Jeff Bezos / Blue Origin:亞馬遜創辦人預測 10-20 年內將出現 GW 級的太空資料中心。Blue Origin 據報已經有專門團隊研發相關技術超過一年。
Eric Schmidt:前 Google CEO 在 2025 年收購了火箭公司 Relativity Space,明確表示目標是把資料中心送上軌道。
Aetherflux:這家新創提出「Galactic Brain」計劃,結合太空太陽能傳輸和邊緣 AI 運算,計劃 2026 年發射示範衛星。
Microsoft + SpaceX:Azure Space 計劃透過 Starlink 提供全球雲服務,並測試在軌部署軟硬體。
Meta + NVIDIA + HP:「Space Llama」計劃為國際太空站提供 AI 科研支援。
技術挑戰:太空不是天堂
把資料中心搬到太空聽起來很美好,但現實充滿挑戰。
輻射:太空中的高能粒子會損害電子元件。Google 的測試顯示,高頻寬記憶體(HBM)對輻射最敏感,可能產生無法修正的錯誤。這對推論任務影響較小,但對訓練任務的影響還需要更多研究。
太空碎片:Google 的 81 衛星叢集要在 1 公里半徑內維持約 200 公尺的間距,以 17,500 英里/小時的速度飛行。這就像在 Daytona 賽道上讓 81 輛車以超音速競賽,而且賽道上還有無數看不見的碎片。據估計,這個叢集每 5 秒就會遇到一次沙粒大小以上的碎片。2025 年上半年,SpaceX 的 Starlink 衛星群進行了超過 14 萬次避撞機動。
維護困難:地面資料中心壞了可以派人修理,太空中不行。目前的策略是「冗餘配置」——多放一些衛星,壞了就整顆換掉。長期可能發展出模組化設計和機器人維修能力,但那還需要數年。
延遲與頻寬:雖然低軌衛星的延遲已經降到約 20-25 毫秒,但對於需要即時互動的應用仍然是個問題。衛星間的光學通訊頻寬也需要持續突破。
經濟可行性:即使發射成本持續下降,建造一個 GW 級太空資料中心仍然需要巨額投資。Starcloud 的 5 GW 計劃需要多少錢?沒有人公開說過,但肯定是數百億美元等級。
NVIDIA 執行長黃仁勳對太空資料中心的評價很直接:「這只是一個夢。」但歷史上,很多「只是夢」的東西後來都成真了。
商業機會:這場競賽的投資邏輯
對於關注科技趨勢的人來說,這場競賽開啟了幾個值得觀察的投資方向。
發射與衛星基礎設施:Rocket Lab (RKLB)、Redwire (RDW)、AST SpaceMobile (ASTS) 等公司直接受益於衛星部署需求的增加。
GPU/晶片供應鏈:NVIDIA 不用說了,H100 和 Blackwell 是這場競賽的核心。Broadcom 的 AI 網路和客製化晶片也在供應鏈中扮演重要角色。
地面資料中心(過渡期受益者):Equinix (EQIX)、Digital Realty (DLR) 等資料中心 REIT 在太空方案成熟前仍然是 AI 算力的主要載體。Vertiv (VRT) 的冷卻和電力管理技術在地面和太空都有應用場景。
ETF 配置:想要分散風險的投資者可以考慮 UFO (Procure Space ETF)、ARKX (ARK Space Exploration)、DTCR (Global X Data Center) 等 ETF。ERShares 的 XOVR 甚至持有約 8% 的 SpaceX 私募股份。
長期機會:太空級電子元件(抗輻射設計)、衛星地面站設備、光通訊元件、熱管理解決方案,這些都是潛在的供應鏈切入點。
更大的圖景:這不只是商業競爭
當我們退後一步,這場太空算力競賽揭示的是人類文明的一個根本性轉變。
過去幾十年,我們把運算能力集中在地球上的少數幾個地點——矽谷、北維吉尼亞、新加坡。這些資料中心消耗著越來越多的電力和水資源,對環境的壓力與日俱增。
太空資料中心提供了一個不同的路徑:把運算從地球「外包」出去,利用太陽這個幾乎無限的能源,把廢熱排放到宇宙的真空中。這不是逃避環境責任,而是從根本上改變運算與地球資源的關係。
當然,這也帶來新的問題。太空碎片會不會讓軌道變得無法使用?資料主權在太空中如何界定?如果運算基礎設施掌握在少數幾家公司手中,對社會有什麼影響?
這些問題還沒有答案。但競賽已經開始了。
結語:It begins
回到 Karpathy 的那則推文。
一個三年前寫來教學用的小程式,在太空中完成了人類第一次軌道 LLM 訓練。這個事實本身就是對技術進步速度的最好註解。
"It begins" 不只是對這一刻的描述,更是對未來的預言。
十年後回看,2025 年 12 月可能會被記住為一個轉折點:AI 算力開始離開地球的那一天。而莎士比亞——那個在 400 多年前寫下「全世界是一個舞台」的詩人——大概沒想到,他的文字有一天會在星空中被機器學習、被複誦。
All the world's a stage, indeed. 只是現在,這個舞台變得更大了。
本文基於 2025 年 12 月的公開資訊撰寫。太空產業變化快速,建議讀者自行查證最新發展。