深度解析 Multi-Agent:Web3 與 AI 終將相互成就?
如果說AIGC開啟了內容生成的智能時代,那么AIAgent則有機會把AIGC的能力真正產品化。
AIAgent像一位更具象的全能員工,被稱為是人工智能機器人的初級形態,能夠如同人類一般觀察周遭環境、做出決策,并自動采取行動。
比爾·蓋茨曾直言,“掌控AIAgent,才是真正的成就。屆時,你將不再需要親自上網搜索信息。”AI領域的權威專家們同樣對AIAgent的前景寄予厚望。微軟CEO薩提亞·納德拉曾預言,AIAgent將成為人機交互的主要方式,能夠理解用戶需求并主動提供服務。吳恩達教授亦預測,在未來的工作環境中,人類和AIAgent將以更加緊密的方式協作,形成高效的工作模式,提高效率。
AIAgent不單是技術的產物,更是未來生活與工作方式的核心。
這不禁讓人回想,當Web3和Blockchain剛引起廣泛討論時,人們也常常用"顛覆"一詞來形容這項技術的潛力。回顧過去幾年,Web3從最初的ERC-20、零知識證明,逐漸發展到了與其他領域相融合的DeFi、DePIN、GameFi等。
若將Web3與AI這兩大熱門數字科技相結合,會不會產生1+1>2的效果呢?融資規模越來越龐大的Web3AI項目,能否為行業帶來新的用例范式,創造新的真實需求?AIAgent:人類最理想的智能助手
AIAgent的想象力到底在哪里?網上盛傳一個高分答案,“大語言模型只能編個貪吃蛇,而AIAgent可以編出一整個王者榮耀。”聽起來很夸張,但并未言過其實。
Agent,國內通常翻譯為“智體”。這一概念由“人工智能之父”Minsky在1986年出版的《思維的社會》一書中提出,Minsky認為社會中的某些個體經過協商之后可得出某一問題的解,這些個體就是Agent。多年來,Agent一直是人機交互的基石,從微軟的剪輯助手Clippy到GoogleDocs的自動建議,這些早期形態的Agent表現出了個性化交互的潛力,但在處理更復雜任務方面能力仍然有限。直到大語言模型(LLM)的出現,Agent的真正潛力才得以被挖掘。
今年5月,AI領域權威學者吳恩達教授在美國紅杉AI活動上分享了關于AIAgent的演講,在其中,他展示了其團隊做的一系列實驗:
讓AI去寫一些代碼并運行,對比不同LLM和工作流程得出的結果。結果如下:
GPT-3.5模型:準確率48%
GPT-4模型:準確率67%
GPT-3.5+Agent:高于GPT-4模型的表現
GPT-4+Agent:遠高于GPT-4模型,非常出色
單人獨角獸公司正在成為現實
AIAgent還能夠幫助企業打造以“人機協同”為核心的智能化運營新模式。越來越多的業務活動將交由AI來完成,而人類則只需要聚焦于企業愿景、戰略和關鍵路徑的決策上。
就像OpenAI首席執行官SamAltman曾在采訪中提到過這樣一個引人注目的觀點,隨著AI的發展,我們即將進入“單人獨角獸”時代,即由單人創辦并達到10億美元估值的公司。
聽起來天方夜譚,但在AIAgent的助力下,這個觀點正在成為現實。
不妨做個假設,現在我們要創辦一家科技初創公司。按照傳統方法,顯然我需要雇傭軟件工程師、產品經理、設計師、營銷人員、銷售和財務人員,各司其職但都由我來協調。
那么如果使用AIAgent呢,我可能甚至都不需要雇傭員工。
Devin—自動化編程
替代軟件工程師,我可能會使用今年爆火的AI軟件工程師Devin,它能幫我完成所有前端和后端的工作。
Devin由CognitionLabs開發,被稱為是“世界上第一個AI軟件工程師”。它能夠獨立完成整個軟件開發工作,獨立分析問題、做出決策、編寫代碼并修復錯誤,均可自主執行。大大減輕了開發人員的工作負擔。Devin在短短半年內就獲得了1.96億美元的融資,估值迅速飆升至數十億美元,投資方包括FoundersFund、KhoslaVentures等知名風險投資公司。
雖然Devin仍未推出公開版本,但我們可以從另一個最近爆火Web2的產品Cursor一窺潛力。它幾乎可以為你完成所有工作,將一個簡單的想法在幾分鐘內轉化為功能性代碼,你只需要發號施令,就能「坐享其成」。有報道稱,一個八歲的孩子,在沒有任何編程經驗的情況下,居然使用Cursor完成代碼工作并建起了一個網站。
Hebbia—文件處理
替代產品經理或財務人員,我可能會選擇Hebbia,它能幫我完成所有文檔的整理和分析。
與Glean側重企業內文檔搜索不同,HebbiaMatrix是一個企業級的AIAgent平臺,借助多個AI模型,幫助用戶高效地提取、結構化、分析數據和文檔,從而推動企業生產力的提高。令人印象深刻的是,Matrix能一次性處理多大數百萬份文檔。
Hebbia在今年7月完成了1.3億美元B輪,a16z領投,GoogleVentures、PeterThiel等知名投資者參投。
JasperAI—內容生成
替代社媒運營和設計師,我可能會選擇JasperAI,它能幫我完成內容的生成。
JasperAI是一個AIAgent寫作助手,旨在幫助創作者、營銷人員和企業簡化內容生成流程,提高生產力和創作效率。JasperAI能夠根據用戶要求的風格生成多種類型的內容,包括博客文章、社交媒體帖子、廣告文案和產品描述等。并根據用戶的描述生成圖片,為文本內容提供視覺輔助。
JasperAI已獲得1.25億美元的融資,并在2022年達到了15億美元的估值。根據統計數據,JasperAI已幫助用戶生成超過5億個單詞,成為使用最廣泛的AI寫作工具之一。
MultiOn—網頁自動化操作
替代助理,我可能會選擇MultiOn,幫我管理日常任務、安排日程、設置提醒,甚至是規劃出差行程,自動預訂酒店,自動安排網約車。
MultiOn是一個自動化的網絡任務AI代理,能夠幫助在任何數字環境中自主執行任務,例如幫助用戶完成在線購物、預約等個人任務,提升個人效率,或幫助用戶簡化日常事務,提高工作效率。
Perplexity—搜索、研究
替代研究員,我可能會選擇英偉達CEO都在每天使用的Perplexity。
Perplexity是一個AI搜索引擎,能夠理解用戶的提問,拆分問題,然后搜索和整合內容,生成報告,以向用戶提供清晰的答案。
Perplexity適用于各類用戶群體,例如學生和研究人員可以簡化寫作時的信息檢索流程,提高效率;營銷人員可以獲取可靠數據支持營銷策略。
以上內容僅為想象,當下這些AIAgent的真正能力和水平尚不足以替代各行各業中的精英人才。正如LogenicAI聯合創始人李博杰所言,目前LLM的能力還只是入門級水平,遠遠達不到專家級,現階段的AIAgent更像是一個干活比較快但不太可靠的員工。
然而,這些AIAgent憑借各自的特長,正在助力現有用戶在多樣化場景中提高效率和便利性。
不僅僅限于科技公司,各行各業都可以在AIAgent的浪潮中獲得益處。在教育領域,AIAgent可以根據學生的學習進度、興趣和能力提供個性化的學習資源和輔導;在金融領域,AIAgent可以幫助用戶管理個人財務,提供投資建議,甚至預測股票走勢;在醫療領域,AIAgent可以幫助醫生進行疾病診斷和治療方案的制定;在電商領域,AIAgent還可以作為智能客服,通過自然語言處理和機器學習技術自動回答用戶咨詢,處理訂單問題和退貨請求,以此提高客戶服務效率。Multi-Agent:AIAgent的下一步
在上一節關于單人獨角獸公司的設想中,單一的AIAgent在處理復雜任務時面臨著局限性,難以滿足實際需求。而運用多個AIAgent時,由于這些AIAgent基于異構LLM,集體決策困難,能力有限,以至于還需要人類充當這些獨立AIAgent之間的調度員,協調這些服務于不同應用場景的AIAgent去工作。這便催生了“MultiAgent(多智體框架)”的興起。
復雜問題往往需要融合多方面的知識和技能,而單個AIAgent的能力有限,難以勝任。通過將不同能力的AIAgent進行有機組合,Multi-Agent系統可以讓AIAgent發揮各自的長處,取長補短,從而更有效地解決復雜問題。
這非常類似于我們實際中的工作流程或組織結構:由一個領導者分配任務,擁有不同能力的人,負責不同的任務,每個工序執行的結果給到下一個工序,最終得到最后的任務成果。
在實現過程上,由較低級別AIAgent執行各自的任務,而由級別較高的AIAgent分配任務,并對它們的完成情況進行監督。
Multi-Agent還能模擬我們人類的決策過程,就像我們遇到問題時會找人商量一樣,多個AIAgent也可以模擬集體決策的行為,為我們提供更好的信息支持。例如由微軟開發的AutoGen就滿足了這一點:
能夠創建不同角色的AIAgent。這些AIAgent具有基本的對話能力,能夠根據接收到的消息,生成回復。
通過GroupChat來創建由多個AIAgent參與的群聊環境,在這個GroupChat有一個管理員角色的AIAgent管理其他AIAgent的聊天記錄、發言者順序、終止發言等。
傳統的AI系統往往是集中式管理,導致AIAgent面臨單點故障和數據隱私問題,Web3的Decentralization特性可以使得Multi-Agent系統更加分散和自治,每個AIAgent可以獨立地運行在不同的Node上,自主執行用戶提出的需求,增強了魯棒性和安全性。通過PoS、DPoS等機制建立針對質押者、委托者的激勵懲罰機制,可以促進單一AIAgent或Multi-Agent系統的民主化。
在這方面,GaiaNet、Theoriq、PINAI、HajimeAI都有非常前沿的嘗試。
Theoriq是一個服務于“AIforWeb3”的項目,希望通過AgenticProtocol建立 AIAgents的調用和經濟系統,普及Web3的開發和許多功能性場景,為Web3dApp提供可驗證的模型推理能力。
GaiaNet以Node為基礎的AIAgent創建和部署環境,以保護專家、用戶的知識產權與數據隱私為出發點,抗衡中心化的OpenAIGPTStore。
HajimeAI則在兩者基礎上發力AIAgent工作流在實際需求中的建立和針對意圖本身的智能化、自動化,呼應PINAI提到的“AI智能的個性化”。
同時,ModulusLabs與ORAProtocol分別在AIAgent的zkML和opML的算法方向取得了進展。
最后,AIAgent和Multi-Agent系統的開發和迭代往往需要大量的資金支持,而Web3可以通過前置流動性的特點幫助有潛力的AIAgent項目獲取寶貴的早期支持。
Spectral和HajimeAI均提出了支持發行鏈上AIAgent資產的產品構想:通過IAO(InitialAgentOffering)發行Tokens,AIAgent可以直接從投資者獲得資金,同時成為DAO治理的一員,為投資者提供參與項目發展和分享未來收益的機會。其中HajimeAI的BenchmarkDAO希望通過眾籌加Tokens激勵的方式,將Decentralization的AIAgent評分和AIAgent資產發行有機結合起來,打造AIAgent依托Web3融資和冷啟動的閉環,也是比較新穎的嘗試。
AI潘多拉魔盒已然開啟,置身其中的每個人既興奮又迷茫,熱潮下是機遇還是暗礁,無人知曉。如今,各行各業都已不再是PPT融資時代,無論多么前沿的技術,也只有落地才能實現價值。AIAgent的未來注定是一場漫長的馬拉松,而Web3正確保它不會在這場競賽中黯然退場。