近期,在AI領域爆火的Agent,似乎遇到了口碑兩極分化的局面。
一方面,Agent仍然被看作是“大模型的下一場戰事”,2024年也被看作是Agent爆發元年。
今年3月20日,紅杉資本合伙人在AI Ascent主題活動的開幕致辭中對2024年的人工智能趨勢做出了預測,*條就是:Copilot將逐漸向Agent轉變。
AI將從輔助人類的Copilot轉變為真正能替代一些人類工作的Agent。AI更像一個同事,而不僅僅是一個工具。這一點已經在軟件工程、客服等行業初步顯現。
在同一場活動上,斯坦福大學客座教授吳恩達也發表了關于Agent的主題報告。他認為AI代理工作流程將在今年推動AI的巨大進步,甚至可能超過下一代基礎模型,“這是一個重要的趨勢,我呼吁所有從事人工智能工作的人都關注它?!?/p>
另一方面,與之形成鮮明對比的是,*批做Agent的OpenAI,似乎遇到了出道即*,隨后一路下滑的狀態。
去年11月,OpenAI在首屆DevDay上發布了Agent開發框架Assistant API,并配套推出了GPT Store。GPT Store里的每一個GPTs,就是一個Agent。
但是,GPT Store的流量表現不佳。SametimeWeb數據顯示,2月份GPTs僅占ChatGPT網站桌面訪問量的1.5%。
據The Information報道,一位開發人員分析了3.6萬多個GPTs,其中約有5%每天有150至500名活躍用戶,但絕大多數每天只有1到2個用戶?!案杏XOpenAI已經放棄了GPT Store。”這位開發人員吐槽道。
近期,金沙江創投主管合伙人朱嘯虎在一次采訪中更是直接坦言,“個人助理”都是技術人員的想象,都是典型的偽需求。
究竟是GPT Store不行,還是Agent不行?在AI日新月異的發展節奏中,Agent要從玩具和“概念”真正變為生產力,究竟路在何方?
一個自AI熱潮興起以來一直備受挑戰的事物或許能為Agent落地提供答案,那就是低代碼。
1.技術與成本的雙重挑戰
今天,幾乎所有的科技巨頭與AI創業公司都在布局Agent。IDC調研表明,50%的企業已經在某項工作中進行了Agent的試點,另有34%的企業正在制定Agent的應用計劃。
“華為天才少年”、Logenic AI聯合創始人李博杰是Agent創業潮中的一員,他將這些類目繁多的Agent分成了兩大類:一個是有趣的AI,也就是更像人的AI;另一個是更有用的AI,也就是更像工具的AI。
去年爆火的“斯坦福AI小鎮”是*個出圈的有趣的Agent系統,這是一個由25個Agent組成的虛擬世界,完完全全地模擬了真實的人類生活。
另一個“有趣的AI”是角色扮演類的Agent,這一賽道也誕生了數家AI獨角獸公司,代表產品是Character.ai、Inflection的Pi、Minimax的Talkie等。
有趣的AI主要面向to C領域,而有用的AI主要面向to B領域,比如各種Copilot工具、面向個人或者企業的Agent。
如今,越來越多工具屬性的Agent已經涌現。據云基礎設施服務商E2B的不完全統計和分類,在編程、個人助手、生產力、HR、科學、商業智能、設計、市場營銷、金融等多個細分場景都有大量的開源和閉源的Agent項目。
除了針對垂直業務場景打穿打透的Agent,還有企業從平臺模式出發,打造包羅萬象的智能體商店,比如OpenAI推出的GPT Store,國內企業如釘釘、智譜AI、昆侖萬維也分別推出了各自的Agent平臺。
長期來看,AI*的價值在于生產力的提升,也就是AI工具的屬性。但目前,受限Agent系統大腦——大模型本身的性能,Agent到底能否從有趣的“AI玩具”進一步升級為有用的“AI工具”,還存在一定的挑戰。
以AutoGPT查天氣為例,雖然它能夠自主規劃、決策與執行任務,但很多時候都以失敗告終,因為很多天氣App的API是付費的,AutoGPT無法獲?。蝗绻菑木W頁讀取天氣數據看到的是HTML代碼,AutoGPT也看不懂;如果要把網頁數據轉換成看得懂的文本,又會丟掉太多的網頁結構信息;如果是把渲染出來的網頁截圖放到多模態模型里去直接識別,需要GPT-4V這種級別的模型才會比較靠譜。
在嚴肅的企業任務場景中,對于數據、問答的準確性有比較高的要求,哪怕有1%的錯誤率也是不能忍受的,這種錯誤率很難商用。而大模型的幻覺問題目前難以避免,如何降低幻覺帶來的錯誤率是一個挑戰。
Logenic AI聯合創始人李博杰認為,目前大模型的能力只是一個入門級的水平,還遠遠達不到專家級,現階段的Agent系統更像是一個干活比較快但不太靠譜的員工。
他分享過在華為聽到的一個說法:“如果你是領域專家,你會覺得大模型很笨;但是如果你是領域的小白,你就會發現大模型非常聰明?!?/p>
這些挑戰的根源都歸結于Agent系統的大腦——也就是底層大模型的基礎能力,Agent系統針對復雜任務的規劃和分解任務、遵循復雜指令、自主使用工具以及減少幻覺等等,還有很大的提升空間。
Agent面臨的另一個挑戰,在于成本。我們都知道訓練大模型需要很高的算力成本,而運行一個Agent系統所消耗的推理成本同樣不低。
李博杰分享了一組數據:如果基于GPT-4做一個游戲NPC,跟玩家不停地交互,成本高達每個玩家每小時26美元,沒有哪一個游戲能燒這么多錢。
更實際的問題是,對于中國的廣大企業而言,除了算力成本外,更值得關心的成本在于如何在AI的道路上走出“*步”:搭建一個Agent,讓它成為業務流和數據資產的入口,這需要招一個多貴的團隊?
2023年,一個私有化大模型的的價格曾達到千萬元級別。顯然如此高昂的成本不可能在企業級場景大范圍的落地。
總結來說,Agent能否變得有效、可靠與低成本,是目前遇到的核心挑戰。
2.Agent低成本落地的突破口
談到拉低成本和門檻,低代碼可以說是一個被驗證過的答案。靠低代碼、用傳統軟件十分之一甚至五十分之一的成本實現數字化的故事,過去幾年中并不鮮見。
那么,低代碼能把AI Agent應用的成本打下來嗎?
釘釘的低代碼團隊宜搭正在做出一些實踐,并推出了“宜搭AI”——一個在低代碼平臺上構建AI助理的方式。
去年,在大模型與AIGC爆火之后,低代碼行業“人人自?!?。低代碼原本是為了降低應用開發的門檻,而大模型直接連代碼都可以生成,似乎有直接顛覆低代碼賽道的趨勢。
去年7月,釘釘還專門拉上了氚云等幾家低代碼廠商展開了一次討論,專門討論AI能否替代低代碼。最后大家的一致結論是:不但不會替代,AI還給低代碼插上了騰飛的翅膀。
釘釘給出的答案則是,低代碼+AI,就是Agent落地的突破口。
低代碼+AI構建Agent,能否真正成為企業業務有效的工具?目前,已經在一些企業和組織中落地了。
在營銷領域,深圳航空營銷委使用釘釘AI助理、釘釘宜搭互動卡片以及業務接口搭建了“深航AI銷售幫手”,專門針對深航營銷場景的痛點進行了定制化開發,解決了銷售系統保障、信息觸達、經營監控、銷售預警、知識管理等難點。
此前,深圳航空的機票分銷系統“深航銷售平臺”,在用戶使用過程中雖然提供了培訓以及使用了傳統的手冊和知識庫,但是由于功能迭代頻繁,營業部、坐席人員調整,每天仍須要通過大量人工問答獲取信息,效率不高,溝通成本巨大。同時,一線銷售人員需要查詢訂單票據信息時,需要通過登錄深航銷售平臺系統中查詢,信息同步不夠及時便捷,系統中沉淀的大量數據沒有*程度地發揮價值。
而“深航銷幫”集成宜搭搭建的銷售管理系統“云銷平臺”,打通多個內部銷售相關系統,為員工觸達和使用這些數據提供了非常人性化的入口:用自然語言詢問“系統最近的出票時間是什么?”“近12小時出票情況如何?”等問題,這個Agent就會調用接口,實時查詢,并以圖表形式顯示相關數據,通過Agent對接知識庫解答用戶的常見問題。
這個Agent還能為非系統用戶提供訂單票據查詢等服務。銷售人員無需經過系統用戶中轉,就可直接向AI助理提問“XXX機票/訂單的出票代理人是誰?具體信息如何?”,AI助理會直接查詢B2B系統的出票數據,返回所需票據信息。
另一個案例是在教育領域,浙江工商大學教務中心使用釘釘宜搭應用讓全校的教務業務在線化,搭配上AI助理,教授、同學、行政老師都有了自己的專屬AI秘書,以聊天的形式就能吩咐AI助理完成招生咨詢、課程答疑、課程數據分析等大量工作。
例如該校推出的“智能招生AI助理”,就集成了包含學校的招生政策、專業設置、錄取分數線等信息的招生知識庫,學生和家長以自然語言向這個AI助理提問,如"我的分數能報考哪些專業?"助理便會結合知識庫智能給出合理解答,并且能夠7*24小時在線。
這些都是很細微的業務場景,不但切實提升了業務效率,更重要的是盤活了企業最重要的資產,也就是數據。
更重要的是,用宜搭AI開發Agent的門檻并不高,成本也不貴。
業內確實有高成本進行Agent開發的案例。由于涉及到數據治理、訓練私有化模型、交付實施等流程,成本并不低。
但如果企業已經在釘釘宜搭上開發過業務應用,其積累的業務數據已經是大模型所需的結構化數據,僅需要“一鍵開啟”Agent能力。這個實施成本幾乎可以忽略不計。
正如深圳航空營銷委史炎平所言:“在AI助理搭建過程中,我們曾深入探討并評估了多種技術手段,但是使用AI助理的一些高級功能需要一定的開發能力,這對于我們這樣的非專業人員無疑構成了較高的門檻。而宜搭讓我們可以通過低代碼進行開發,使用AI助理的高級功能,更豐富,更智能地實現我們的業務需求?!?/p>
對于大企業的業務部門以及沒有錢也沒有產研人才的中小企業來說,這種“低代碼+AI”一鍵開啟Agent能力將會有很大的吸引力。
正因如此,今年1月,釘釘總裁葉軍在釘釘7.5版本發布會上宣布釘釘的目標是成為低門檻、高頻和開放的AI助理平臺。與OpenAI推出的GPT Store類似,釘釘也宣布將在4月份推出自己的Agent Store————“釘釘AI助理市場”,并要在三年內創建1000萬個AI助理。
3.打開Agent的想象空間
可能連釘釘自己都不會想到,3年前釘釘開啟的低代碼戰略,會在AI時代迎來Agent的東風。
低代碼在軟件行業也曾備受爭議,但經歷了幾年的低代碼熱潮之后,如今低代碼本身已經有了廣泛的基礎,尤其是在中小企業里有非常高的普及度。
與OpenAI聚焦C端不同的是,釘釘核心定位在B端。釘釘首先是一個協同平臺,Agent的突破首先在協同辦公場景;其次是一個應用開平臺,釘釘過去三年力推的低代碼戰略已經開發了1000萬個業務應用,不僅能助力協同辦公,還能深入到企業業務中去。
低代碼的普及為AIAgent打下了良好的“系統”和“數據”基礎設施。AI時代本質是在變革數據產生與數據消費的方式,Agent正在讓這一切逐漸落地。
宜搭搭建的AI助理,除了具備大模型本身就有的常識理解、生成能力外,最重要的是能夠默認打通企業的業務應用、業務數據和領域知識,讓原有的傳統應用一鍵享受AI助理的新入口形式和使用交互形式。
像釘釘這樣在to B領域做商業智能類的Agent,毫無疑問會涉及更加復雜的數據、流程、行業Know-how,這是企業的護城河。
釘釘宜搭產品負責人邵磊告訴「甲子光年」:“企業最關心的不再是單純的組織協同或業務協同,企業的業務數據和積累的行業知識才是他們真正的核心資產,這是完全不具備任何可替代性的。只有挖掘數據與行業知識的價值,企業才會真正發展。”
在企業服務這個to B的場景下做AI,絕大多數需求都是源自于客戶本身。釘釘有著很濃厚的產品共創機制和文化。比如釘釘和一家生產制造企業共創過程中,其實是客戶自身提出了圍繞數據的輸入和分析結合AI的眾多想法。
釘釘過去三年已經基于低代碼平臺搭建了1000萬個應用,積累了大量的結構化數據。在to B行業做AI需要高可信任性,而AI可信任性的前提就是數據的可靠性與結構化。
更進一步來看,低代碼+AI推動了Agent的普及,這種人機交互式的軟件開發方式有望推動軟件架構的范式遷移。
比爾·蓋茨就認為,Agent將徹底顛覆軟件行業,將影響我們如何使用軟件以及如何編寫軟件。
Agent范式將原本由人類主導的功能開發,逐漸遷移為以AI為主要驅動力。以大模型為技術基礎設施,Agent為核心產品形態,把傳統軟件預定義的指令、邏輯、規則和啟發式算法的任務層級演變成目標導向的智能體自主生成。這樣一來,原本的架構只能解決有限范圍的任務,未來的架構則可以解決無限域的任務。
未來的軟件生態,不僅是最上層與所有人交互的媒介是Agent,整個產業的發展,無論是底層技術,商業模式,中間組件,甚至是人們的生活習慣和行為都會圍繞Agent來改變,這就是Agent-Centric時代的開啟。
低代碼+AI,無疑正是推動軟件平民化的一次重要嘗試。
聲明:以上內容為本網站轉自其它媒體,相關信息僅為傳遞更多企業信息之目的,不代表本網觀點,亦不代表本網站贊同其觀點或證實其內容的真實性。投資有風險,需謹慎。