Skip to main content

保持生成式AI平衡發展:開源模型 VS 專有模型

作者:騰訊企業發展事業群總經理兼歐洲首席代表葛凌博士

今年三月,OpenAI正式推出突破性的GPT-4基礎模型,為生成式人工智能(AI)發展寫下重要的里程碑。而僅僅兩周後,三藩市又舉辦了另一場被譽為Woodstock AI的活動,引起科技界關注。

這場舉辦得有聲有色的活動旨在慶祝開源生成式AI的快速成長,以及相關社群的湧現。在此後的幾個月裏,開源生態系統中出現了大量新興參與者、模型和使用案例。未來當我們回顧過去時,很可能會將這段時期定位為兩種AI類型——專有模型和開源模型——競爭公開化的決定性節點。

在GPT-4發布和Woodstock AI聚會後的六個月中,這兩種模型的競爭漸趨白熱化。這裏先明確一下定義:生成式AI被歸類為「閉源」,其中專有的基礎模型通常由大型科技公司擁有,用戶調用API需要付費。相比之下,開源生態系統支持免費分享和調整AI模型參數(參與的公司通過分享雲服務供應商提供的模型等方式間接獲得收入)。

我們正在見證兩種模型的對弈。開源的支持者聲稱開源模型的發展勢頭是強大而不可阻擋的。與此同時,OpenAI這個月剛剛推出另一個強大的專有模型——GPT-Vision,旨在將視覺與文本結合起來。在新書《The Coming Wave》中,DeepMind的聯合創始人Mustafa Suleyman認為,出於安全考慮,應禁止AI模型中使用開源。

全球企業和消費者主要採用閉源的生成式AI還是開源的生成式AI,或者均衡使用兩種模型,將是問題的關鍵。結果至關重要,因為討論的出發點是確保AI以有利於人類的方式發展。不僅如此,這場競爭還將塑造商業和社會中最具變革性的AI使用案例,並決定生成式AI的受益者。

不過首先,所謂的Woodstock AI是什麼,又有哪些人參與了呢?這場「開源AI聚會」於三月底在三藩市的探索館舉行,參與者超過5,000人。正如它的名字來源「Woodstock Rock Festival」,活動洋溢着派對氛圍,而開源運動的合作精神和創新動力更為其錦上添花。

人潮湧動中,活動的組織者——AI公司Hugging Face的首席執行官Clement Delangue,打扮成公司的吉祥物,一個看起來像「擁抱臉」的開心的黃色表情符號,非常應景。羊駝漫步會場,致敬Meta大語言模型「LLaMA」。「解放羊駝」的標語在空中飄揚,各種AI名人,如吳恩達以及大語言模型(LLM)初創公司Anthropic的高管悉數到場。許多來賓被《時代》雜誌列為當前AI領域「最具影響力的100人」。

儘管這個場景與任何科技會議都不同,但參與者分享的想法足以改變整個行業,對生成式AI巨大潛力的期待清晰又殷切——麥肯錫近期估計,在63個用例中,生成式AI的潛力每年或將額外產生2.6至4.4萬億美元的價值。

全球的科技領軍人物都對此興奮不已。例如,今年五月,騰訊創始人兼首席執行官馬化騰在公司的股東大會上表示:「我們最開始以為AI是互聯網十年不遇的機會,但是越想越覺得,這是幾百年不遇的、類似發明電的工業革命一樣的機遇。」

那麼,哪種類型的生成式AI模型正在引領新的工業革命?現在,專有模型處於領先地位。這有兩個明顯的原因:專有模型在能力方面領先,並且目前人們認為專有模型更安全。

首先是性能。根據領先基準,如大規模多任務語言理解評測,OpenAI的GPT-4目前脫穎而出,成為最強大和最有能力的LLM。儘管開源模型的質量正在迅速提升,但它們仍然落後於先進的閉源同類產品。

這背後的原因是訓練先進基礎模型的嚴酷商業現實。前期成本巨大,從購買專業硬件,如高達3萬美元的Nvidia最新H100 GPU芯片,到巨額雲計算費用都包含在內。此外,部署先進的訓練技術,如人類反饋的強化學習,需要專業知識。像Cohere、Anthropic、Adept、Mistral、Aleph Alpha、AI21 Labs和Imbue這樣的初創公司,大部分預算都投入到了芯片上,這一支出模式便能說明這一點。

總的來說,專有模型投入資源最多。以OpenAI為例,所涉及的成本之高似乎促使它從開源轉向封閉。OpenAI由首席執行官Sam Altman以及Elon Musk等知名人士在2015年創立,最初致力於研發開源模型。然而,在發布迄今為止最強大的大語言模型時,它卻放棄了最初的開源承諾。這種轉變部分可以歸因於OpenAI需要保護其巨額投入。

安全性目前被視為閉源的另一優勢。OpenAI聲稱,選擇封閉的另一個原因是LLM相關的道德風險。這些模型有可能被不良行為者濫用,隨着模型能力越來越強,公開可訪問的風險也在增加。OpenAI的首席科學家Ilya Sutskever表示:「如果你像我們一樣相信,某個時候,AI或者AGI將變得極其強大,那麼開源它根本沒有意義。這是一個糟糕的主意。」

那麼,鑒於Sutskever的上述論點,以及專有模型的強大性能優勢,為什麼開源生成式AI發展會引起如此廣泛的關注呢?全球最大的科技公司以及初創公司和大量開發者都加入了這股潮流。

其中一個原因是,隨着時間的推移,開源在科技界中慢慢取得了切實成功。現代雲基礎設施主要在Linux上運行,機器學習由Python等開源編程語言所驅動,開源滲透到了科技領域的許多方面。

Woodstock AI的激動人心之處在於開源創新。開源LLM將其權重和參數公開,使全球的開發者社群能夠對其進行微調並改進,激發出比最新的專有模型更大的創新。

對於尋求採用生成式AI的企業來說,輕鬆微調開源模型的能力也非常具吸引力。他們可以根據自己公司特定的數據來定制這些模型,以實現需要這種知識的特定用例。

Woodstock AI的組織者Hugging Face是開源AI運動的早期先驅之一。該公司成立於2016年,其開源產品之一是Transformers庫。它是LLM的開放存儲庫,客戶可以取用以進一步自行調整模型,或者通過API調用典型的LLM功能,如補全句子、分類或文本生成。這個「模型即服務」平台使各種規模的企業都可以從實驗過渡到部署,而無需佔用過多內部資源。用戶可以使用托管的基礎設施將任何模型轉換為自己的API,彰顯出開源的民主化AI精神。

Microsoft、Google、Meta、Intel和eBay等巨頭都是Hugging Face一萬多名客戶中的一員。其「模型即服務」概念已經演變為托管超過一百萬個模型、數據集和應用程式。這個多樣化的生態系統強調了其開源工具的廣泛適用性,範圍包含從輝瑞和羅氏等制藥巨頭的數據安全升級,到專門的AI應用,如彭博的財務語言模型BloombergGPT。

隨着AI領域的不斷發展,領導者和關鍵參與者越來越主張將生成式AI開源。圖靈獎得主、Meta的首席AI科學家Yann LeCun認為世界需要開源LLM:「AI基礎模型將成為基礎設施,人們和行業會要求它開源。就像互聯網的軟件基礎設施一樣。」

Meta首席執行官Mark Zuckerberg對開源的熱衷則是出於不同的目的。「它每天都在變得更加高效,」他評論道,「我只是覺得,整個社群,包括學生、黑客、初創公司以及其他人使用開源模型,我們也能從中學到很多。」

基於這種理念,Meta於7月發布的LLaMa-2可以說是目前公眾可以獲取的最強大、性能最高的開源LLM。它提供了預訓練和微調的版本,參數分別為70億、130億和700億。

除了LLaMa-2這樣的主流項目外,其他一些值得關注的項目也正在為開源AI生態作出貢獻。例如,Runway公司於2018年開始專注於為電影製作人提供AI工具,但現在已經轉向生成式AI。其旗艦產品Gen-2開拓了根據文本提示創建影片這一細分領域,該公司還推出了Runway Studios和AI電影節以擴大其影響力。

另一方面,LangChain作為一個Python庫,旨在增強LLM的可用性、可取用性和多功能性,使開發人員更容易將這些強大的工具集成到各種應用程式中。這些項目都展示了開源AI模型在不同行業日漸增長的適用性和多樣性。

開源模型也挑戰了關於模型參數的一個觀念,即「更大總是更好」。較小的模型可以提供成本效益、更高的靈活性,而且在針對特定應用程式進行微調時,甚至可能超越大模型的表現。

涉及到確保AI安全性和責任性的關鍵問題時,開源一方也有好的論據。專有模型的支持者認為,讓所有人都可以訪問模型很危險。然而,開源AI的支持者反駁說,開源LLM提供了透明度,並吸引多元社群的審查。這有助於識別和減少偏見,使它們更加公正。此外,開源模型與一些閉源模型不同,它們在如何使用用戶數據方面提供了透明度。

未來將會如何,哪種模型將會勝出呢?總的來說,兩種模型各有千秋。以GPT-4為代表的專有模型具有獨特的優勢,包括自定義、專用支持和強大的安全功能。另一方面,效率、透明度和公平性等特徵為開源AI提供了有力的論據。

當然,理性的策略是讓公司提供並利用兩者的優點。因此,騰訊採取雙重策略。我們已經推出了專有基礎AI模型「混元」,可用於多種應用程式,同時也在騰訊雲上提供了一個「模型即服務」解決方案。這項服務旨在協助多個行業高效部署開源模型。我們預計,在未來格局中,少數幾種專有基礎模型將佔據主導地位,但針對特定行業和企業應用的專門開源模型也將蓬勃發展。基於非常小的模型(能夠在智能手機和筆記本電腦的即時通訊軟件內運行)的個人AI助手將成為我們的夥伴。

Meta的LLaMa-2由美國雲服務提供商,如Microsoft Azure和Amazon的AWS托管,這進一步證明這些科技巨頭同樣看到支持開源模型和專有模型的價值所在。

我們應該歡迎開源和專有模型之間的良性競爭。幸運的是,目前似乎還沒有一種模型能佔據主導地位。過去六個月間,兩種模型之間的質量差距已經縮小。開源模型在激發創新、AI民主化以及促進責任和安全方面的潛力愈加明顯。

牛津大學電腦科學教授、圖靈研究所基礎AI研究主任、AI先驅Michael Wooldridge教授將在2023年皇家研究院聖誕講座上發表演講「AI的真相」。他希望看到兩種模型都能蓬勃發展。他表示:「這一年,像ChatGPT這樣的大眾市場、通用AI工具已經出現,我們處於一個關鍵節點。開源和專有模型各有優劣。在向前發展的過程中,保持平衡至關重要,我們需要確保AI繼續成為造福廣大社會的工具。」正如1969年的伍德斯托克音樂節一樣,2023年春天的三藩市已經在AI史冊上佔有一席之地。