《天才的野心》:OpenAI 崛起背後,技術、權力與人性的角力

by MaxJames

從封面的山姆.奧特曼與《天才的野心》這個書名,應該不難猜出這本書在談什麼吧。沒錯,它講的正是當今人工智慧巨頭 OpenAI 的崛起之路。

作者小林雅一身兼作家與記者,同時也是 KDDI 綜合研究所研究員及資訊安全大學院大學客座教授。身分多到不行,相當多才多藝(笑)。

在這本小書裡,他先是簡要回顧 OpenAI 以前的人工智慧開發史,接著依序講述 OpenAI 的誕生、成長與爆發。讀來就像是看故事一樣,讓我直往下翻。除了講古外,書中也帶入許多 AI 的技術基礎與應用層面的反思,激發了我不少思考。

關於故事的部分,就留給大家自行到書中享受。這篇文想和大家分享四個讀後思考。

【非線性成長】

讀這本書時,我一直有個很深的感受:技術的發展往往不是線性地緩慢爬升,而是像爬樓梯一樣,在某個關鍵節點後突然迎來突破。

比方說,早期 AI 的發展主要有兩條路線:

  • 符號型處理 AI
    讓 AI 依照人類預先給定的知識與規則來處理資訊。
  • 神經網路
    讓 AI 從大量資料中自行學習。

放到今天來看,神經網路無疑是主流。然而過去它其實曾經歷很長的一段黑暗期,甚至被許多人視為沒前途的研究領域。直到克里澤夫斯基(Alex Krizhevsky)與蘇茨克維(Ilya Sutskever)利用 GPU 訓練出卷積神經網路 AlexNet 後,AI 的學習能力才迎來巨大的躍進。擁有「AI 教父」之稱的辛頓(Geoffrey Hinton) 甚至坦言,「深度學習」(Deep Learning)就是為了擺脫神經網路過去的壞名聲而想出來的名字。

後來大放異彩的大型語言模型(LLM)也是如此。早在 2012 年,蘇茨克維便在辛頓的研究室開發出早期的語言模型。當時雖然能產生語句通順、符合文法的內容,但往往只是缺乏實際意義的文字堆疊。(下圖為當時辛頓發表的投影片,完全不知道在說啥……)

辛頓的 LLM 簡報(改自《天才的野心》)
辛頓的 LLM 簡報(改自《天才的野心》)

沒想到之後的突破,居然是來自 OpenAI 的競爭對手 Google。2017 年,Google 團隊發表論文〈Attention Is All You Need〉(你需要的只是注意力),提出名為「轉換器(Transformer)」的新型神經網路架構,為大型語言模型開啟了進化大門。

傳統語言模型最大的問題之一,在於難以根據語境判斷同一個詞彙在不同情境下的意思。舉例來說:

  • 請買蘋果和橘子。
  • 蘋果發表了全新的 iPhone。

人類很容易理解兩個「蘋果」代表完全不同的概念,但早期語言模型卻無法辨別。(如下圖)

傳統語言模型無法分辨多重語義字詞(截自《天才的野心》)
傳統語言模型無法分辨多重語義字詞(截自《天才的野心》)

而轉換器的核心概念之一,就是讓模型在處理文字時,能主動將「注意力」放在其他相關詞彙上。當它看到「橘子」時,便能推測這裡的「蘋果」是水果;看到「iPhone」時,則能推測這裡的「蘋果」指的是公司。(如下圖)

轉換器能根據前後字詞去分辨多重語義字詞(截自《天才的野心》)
轉換器能根據前後字詞去分辨多重語義字詞(截自《天才的野心》)

換言之,轉換器可說是傳統語言模型缺的最後一塊拼圖。當時已經是 OpenAI 首席科學家的蘇茨克維,在讀完這篇論文後便表示:「這就是我們渴望已久的技術。」之後的故事大家都知道了:ChatGPT 橫空出世,徹底改變了 AI 發展的局勢。

這種階梯式成長的概念,也帶給我一個很大的啟發:現在落後,並不代表永遠落後

事實上,在 OpenAI 殺出來前,AI 領域的領先者其實一直是 Google。2016 年擊敗世界棋王李世乭的 AlphaGo,便是由 Google 旗下的 DeepMind 團隊所開發。然而後來 Google 卻被 OpenAI 超車。甚至在本書出版的 2024 年,Google 還在苦苦追趕。

不過到了 2026 年的今天,Google 已憑藉 Gemini 等產品重新站穩腳步。M 觀點創辦人 Miula 便曾說:

「AI 競賽現在也只是三局上半,任何領先都可能被逆轉。」

可以預見的是,在未來的幾年,AI 巨頭間的「量子糾纏」還會持續下去。

【AI 發展的那條線】

AI 發展的那條「線」,也是我在閱讀本書時不斷思考的主題。事實上,OpenAI 發展過程中的許多重大事件,都與這條線的位置有關。

例如 OpenAI 創立之初,便獲得了伊隆.馬斯克的大力支持。而馬斯克之所以想參與,很大程度上源自他與 Google 共同創辦人賴瑞.佩吉的一場爭論。事情是這樣:2015 年,兩人在一場生日派對上聊到 AI 的未來。佩吉認為,AI 終有一天會與人類融合,成為不同形式的智慧生命,並透過物競天擇的方式,留下最能適應的物種。

馬斯克無法接受這樣的觀點。他認為,這幾乎等同於默許 AI 會讓人類滅亡;而在他的價值觀裡,「人類不能滅亡」是不可跨越的底線。但佩吉聽完卻反嗆馬斯克是「種族歧視者」(speciesist),認為他過度偏袒人類這物種。

自那之後,馬斯克開始相信,由 Google 主導 AI 發展是一件危險的事。因此,當奧特曼找上他共同創立 OpenAI 時,他幾乎立刻答應。

為了不重蹈 Google 的覆轍,OpenAI 一開始便以「開放」作為核心理念,希望透過分享研究成果造福全人類。同時,馬斯克與奧特曼也將 OpenAI 定位為非營利組織,以人類利益為優先來發展 AI。

然而,如此「理想」後來卻逐漸出現分歧。簡單來說,OpenAI 內部存在兩種不同立場:

  • 警戒主義者
    認為 AI 可能危及人類生存,開發過程必須慎重再慎重。
  • 加速主義者
    認為 AI 雖然存在風險,但其帶來的好處遠大於壞處,因此應該加速發展。

奧特曼本身較接近加速主義的一側;但公司內部許多重要研究者,則更傾向警戒主義。

例如,主導 GPT-3 開發的達里奧.阿莫迪在 2021 時便帶著十五名研究人員離開 OpenAI,並與團隊創立 Anthropic。這家公司後來提出「憲法式 AI」的概念,希望建立更安全、更可控的 AI 系統。

共同創辦人蘇茨克維同樣對 AI 安全議題抱持高度警覺,也曾多次與奧特曼產生理念上的衝突。最終甚至在 2023 年聯合其他四位董事,將奧特曼趕下執行長大位。

從這些事件不難發現,每個人心中對 AI 發展的那條「線」其實都畫在不同的位置。我覺得或許可用一條光譜來表示:

AI 發展路線光譜圖(ChatGpt 繪製)
AI 發展路線光譜圖(ChatGpt 繪製)

其中,奧特曼的位置或許是最耐人尋味的。雖然在意人類利益,但對 AI 發展較「開放」,有時甚至會遊走於侵害人的邊緣。有人形容他的許多行為像是「紙張邊緣劃出的傷口」──雖不致命,卻讓人隱隱作痛。

這點從 GPT-4o 的 Sky 語音事件便可見一斑。當時 OpenAI 提供了五種語音,其中 Sky 的聲線居然酷似史嘉蕾‧喬韓森。喬韓森隨即公開提出抗議。雖然奧特曼強調 Sky 並沒有模仿喬韓森,但 OpenAI 最終仍將該語音下架。

而這爭議,正好能帶入下一個我想討論的主題:AI 與著作權。

【AI與著作權】

AI 的著作權問題,是整個生成式 AI 發展過程中不可能繞開的一個點。小林雅一甚至將其稱為生成式 AI 的「原罪」。

事實上,GPT 等大型語言模型在訓練時使用了海量的人類創作內容。然而,許多人並不知道自己的作品被拿去「訓練」。因此,許多 AI 公司都陸續被控訴違反著作權。例如,2022 年,程式設計師兼律師馬修.巴達立克與其他利害關係人,對微軟、OpenAI 與 GitHub 提起集體訴訟,認為這些公司侵犯了數百萬名程式設計師的權益。

在這些著作權的攻防中,有三個主要被討論的點:

  • 合理使用
    在某些條件下(如教育與研究),使用者可在未經著作權人許可的情況下使用其作品。
  • 作品被修改到何種程度
    只要充分改變原作並具備原創性,即使未獲授權,也可能不被視為違反著作權法。
  • 競合性
    若作品與原作不存在競爭關係,沒有侵蝕原有市場,一般較不容易被認定為侵權。

這邊舉「谷阿莫」的快速講電影影片為例。首先,它很難被歸類為教育或研究用途;再者,把作品片段直接剪進影片,也不太能算是充分修改;更重要的是,許多人看完影片後便不再觀看電影,因此有侵蝕原作市場的疑慮。綜合以上,這類影片在法庭上通常較難站得住腳。

那生成式 AI 呢?狀況又有些不同。許多 AI 生成的作品確實不是單純用於教育或研究;從競合的角度來看,也確實存在一些問題。例如,許多努力經營 SEO 的網站,在 Google 推出 AI 摘要功能後,流量便出現雪崩式下跌。許多藝術家與設計師也都面臨類似的狀況。

但在「修改作品」這點上,就很有討論空間了。比方說,奧特曼便主張,ChatGPT 這類大型語言模型透過文字進行訓練,其實就跟人類閱讀書報、從中吸收知識一樣。其產出的內容是模型「內化」後的結果,與原作並不完全相同,因此理應不算侵權。

這點我覺得非常值得思考。確實,人類基本上也是在前人的肩膀上創作,但 AI 的規模化速度與對原作市場的衝擊,顯然已非傳統人類創作可比擬。這條合法與侵權間的界線究竟該劃在哪?老實說,我也還沒有想得太清楚。因此,容我先停在這裡,留給大家一起思考吧!

【AI 發展離不開「人」】

最後,想來聊聊「人」。

雖然 AI 發展有許多技術上的問題需要突破,但在閱讀這本書時,我深深感受到,「人的問題」同樣是影響 AI 發展的關鍵要素。只能說,除了科技上的比拼,人與人之間也是鬥得很兇啊!

前面提過,馬斯克之所以力挺 OpenAI,某部分原因是不爽 Google 的佩吉。然而後來,他也與奧特曼產生了激烈矛盾。主因在於 OpenAI 成立後的前幾年始終沒有太大突破;反觀 Google 旗下的 DeepMind,卻靠 AlphaGo 大放異彩,讓馬斯克對遲遲拿不出具體成果的 OpenAI 感到相當不滿。

為了取得更多資源,馬斯克與奧特曼等高層開始思考將公司轉型為營利組織。這時,馬斯克順勢提出希望在公司轉型後持有過半股權,並擔任執行長的想法,但遭到反對而作罷。之後,他又提出讓 OpenAI 與特斯拉合併的方案,依然未能成功。最終,馬斯克便與 OpenAI 分道揚鑣。

時至今日,馬斯克與奧特曼的恩怨情仇仍未落幕。2024 年,馬斯克再度以違反契約為由控告 OpenAI,理由是如今的 OpenAI 已完全成為有違公司名稱的「封閉源」團體,實質上更像是微軟的子公司。

不過,這個理由其實不太站得住腳。畢竟,他自己過去也曾試圖讓 OpenAI 成為由自己主導的公司。小林雅一就指出,馬斯克其實也知道自己的勝算不大,但只要能透過訴訟拖慢 OpenAI 的發展,對他而言就算成功了。(題外話,覺得這兩人的糾葛還真的很適合拍成影集(?))

而前面提到的 OpenAI「宮鬥劇」,其實也不單純只是 AI 發展路線的分歧而已。事實上,許多人對奧特曼都頗有意見。例如,有些董事認為他刻意操弄董事會成員彼此對立;此外,蘇茨克維對奧特曼將 GPT-4 開發者雅克布.帕喬基晉升至與自己同等的研究總監職位一事,也相當不滿。種種因素累積起來,最終才導致了這場「政變」。

小林雅一對此有段很精闢的小結:

「雖然 OpenAI 一直高舉『不是單一企業,以及為了全人類謀福利』這個崇高、遠大的目標,但這次的事件說明 OpenAI 與一般公司一樣,都離不開人際關係的糾葛以及權力鬥爭。」

這點不只適用於 OpenAI,我覺得放到整個 AI 發展史來看都成立。

不過,這些「鬥爭」似乎也不全然是壞事。OpenAI 在被馬斯克抽銀根後找上微軟,最終生出 ChatGPT;馬斯克拂袖離去後,也打造出了 Grok;阿莫迪出走後,則推出了 Claude。

或許某種程度上,要是少了這些衝突與火花,恐怕也不會有如今這樣百花齊放的 AI 世界吧。

【後記】

老實說,《天才的野心》這書名我覺得有點誤導。乍看之下,會以為這是一本奧特曼的傳記。而日文原書名《イーロン・マスクを超える男 サム・アルトマン》則更浮誇,直接把奧特曼形容成「超越馬斯克的男人」。

但就如小林雅一自己在前言中所言:

「本書是以 OpenAI 為主軸,介紹微軟、Google 這類主力玩家開發生成式 AI 的開發故事。」

因此,實際上本書的內容算很中性,引用的也大多是公開資料。必須說,小林雅一整理得很不錯,不但流暢地帶出了許多 AI 發展的重要細節,也把人與人之間的糾葛講得十分清楚,讀來很暢快。

較可惜的是,小林雅一個人的觀點相對少了一些。印象中,只有在「生成式 AI 訓練資料即將耗盡」這個問題上,有提出一點自己的看法。(這部分也很精彩,就留給大家自己去看了。)

老實說,AI 這幾年的發展真的快到令人眼花撩亂,怎麼追都追不上……而許多人也對這項技術產生了不少擔憂。例如最近美國年輕世代便出現了一股反 AI 浪潮,甚至有科技巨頭到大學畢典演講時被噓。

在這個時間點讀到這本書,我覺得挺好的。正好可以停下腳步,回頭看看我們已經走過的路,也重新思考這一切發展究竟是為了什麼。

希望未來 AI 的發展,真的能對人類帶來更多好處囉。


你可能也會有興趣的文章:


vocus|新世代的創作平台

↓↓也歡迎大家來追蹤〈姆斯的閱讀空間〉的臉書、哀居和Podcast↓↓

姆斯的閱讀空間 FB
姆斯的閱讀空間 IG
姆斯的閱讀空間 Podcast


如果喜歡我的內容,歡迎訂閱電子報,接收最新文章通知喔!


0 留言
0

You may also like

請留言