【jinnianhui.com】如果你想點(diǎn)一杯咖啡外賣(mài)到家,使用傳統的手機App,你的操作流程大概率是這樣的:點(diǎn)開(kāi)外賣(mài)App,輸入咖啡(或咖啡品牌),找到一家滿(mǎn)意的店鋪,選擇想喝的品類(lèi),選擇是否去冰、是否減糖,輸入或選擇送到的地址,點(diǎn)擊下單,輸入密碼或人臉識別付費……
但如果手機搭載了AI Agent(AI智能體或AI代理),你只需對著(zhù)手機說(shuō)一句“幫我點(diǎn)一杯咖啡盡快送到家”,不用再進(jìn)行任何操作,它便能主動(dòng)識別你所處的位置,打開(kāi)外賣(mài)App,準確猜測你的喜好選擇咖啡品牌、品類(lèi),并自動(dòng)完成付款……
2025世界人工智能大會(huì )(WAIC 2025)7月26日在上海開(kāi)幕,AI智能體成為與會(huì )者熱議的話(huà)題。事實(shí)上,自大模型開(kāi)始比拼落地應用后,AI智能體便反復被提及。那聽(tīng)了這么多,AI智能體到底是什么?目前發(fā)展到哪個(gè)階段了?
和傳統智能助手有何區別?
“你可以將其理解為一個(gè)‘全方位的秘書(shū)’?!备咄ü続I產(chǎn)品技術(shù)中國區負責人萬(wàn)衛星用一句通俗易懂的話(huà)向中新經(jīng)緯解釋何為AI智能體。他提到,AI智能體的“全方位”,是指它不僅能幫你完成簡(jiǎn)單的垂類(lèi)任務(wù),而且能處理覆蓋生活、工作等方方面面的復雜任務(wù)。
“AI智能體會(huì )讓生活和工作更簡(jiǎn)單、更美好?!比f(wàn)衛星表示,用戶(hù)只需說(shuō)一句話(huà),Agent就能自動(dòng)完成任務(wù),讓工作生活都變得更輕松,而它的感知性和專(zhuān)屬化,能真正做到“想你所想”。
據中國銀河證券6月發(fā)布的研報,摩根士丹利發(fā)布的深度研究報告《AI Agents Knocking at the Door》提到,AI Agents不再僅僅是輔助人類(lèi)的工具,它們將越來(lái)越多地成為執行任務(wù)和做出決策的主體,從簡(jiǎn)單的自動(dòng)化工具進(jìn)化為具備自主理解、行動(dòng)和學(xué)習能力的“數字勞動(dòng)力”。該篇報告將AI Agents視為能夠感知環(huán)境、規劃任務(wù)、調用工具,并靈活迭代的自主軟件。
AI智能體不僅是一個(gè)簡(jiǎn)單的應用程序,也是一個(gè)完整的系統?!巴瓿梢粋€(gè)看似簡(jiǎn)單的任務(wù),AI智能體往往需要至少4個(gè)步驟?!比f(wàn)衛星以AI智能體“點(diǎn)咖啡”舉例,當用戶(hù)發(fā)布語(yǔ)音指令時(shí),智能體首先要通過(guò)語(yǔ)音轉文字模塊,將指令轉成文字信息;然后調用相當于“大腦”的大模型,理解指令意圖;接著(zhù)搜尋個(gè)性化記憶,自主了解用戶(hù)習慣在哪個(gè)App點(diǎn)咖啡、喜歡什么口味的咖啡、家庭地址等信息;最后查詢(xún)數據庫把信息補齊后生成提示詞,調用點(diǎn)咖啡的軟件接口或者在A(yíng)pp里點(diǎn)擊完成相關(guān)操作。
萬(wàn)衛星介紹,模擬點(diǎn)擊是目前AI智能體的運行方式之一。簡(jiǎn)單言之,就是AI智能體模仿人的點(diǎn)擊操作,但人不用親自動(dòng)手,只需下達指令就行。這種模式下,智能體完成整個(gè)任務(wù)耗時(shí)多少主要取決于操作步驟的多少,比如需要翻幾個(gè)頁(yè)面?!澳壳澳芸吹揭恍┲笜孙@示,單步操作已經(jīng)大概能控制在2秒以?xún)攘??!?/p>
在萬(wàn)衛星看來(lái),和“我說(shuō)一句,它回一句”的傳統智能助手相比,AI智能體扮演的更像是一個(gè)統籌決策者的角色。他介紹,聊天機器人和語(yǔ)音助手比較依賴(lài)于專(zhuān)業(yè)且明確的指令,完成的任務(wù)是單一清晰的,并且在解決任務(wù)時(shí)仍舊以人的決策為主。
在“人為主、AI 為輔”的任務(wù)解決模式下,AI 只負責執行。但像個(gè)“小秘書(shū)”的AI智能體改變了這一模式,它要幫用戶(hù)解決復雜問(wèn)題,而不是一步一步和用戶(hù)交互著(zhù)完成。萬(wàn)衛星稱(chēng),真正的AI智能體應該以“AI為主、人為輔”的方式解決問(wèn)題,即人只需要發(fā)布任務(wù),或者最后驗收結果就行,盡量讓機器和AI承擔更多主體工作。
在現實(shí)世界如何應用?
榮耀手機AI產(chǎn)品專(zhuān)家白晨對中新經(jīng)緯表示,過(guò)去的應用程序(App)將被具備執行力的AI智能體所替代,手機將成為用戶(hù)的助理和伙伴,把“能聽(tīng)你說(shuō)”變成“替你去做”。比如,你下班回家時(shí)已經(jīng)不需要再打開(kāi)打車(chē)軟件,查看路況、選擇車(chē)型、根據預估車(chē)費和時(shí)間下單叫車(chē),而只需對手機說(shuō)“我要回家”,它會(huì )自動(dòng)完成這一切,然后告訴你:10分鐘后在公司門(mén)前,乘坐車(chē)牌尾號888的網(wǎng)約車(chē),預計7點(diǎn)到家。
在WAIC 2025騰訊展臺,智能座艙服務(wù)Agent正化身出行服務(wù)助手,演示了在餐飲點(diǎn)單、取號訂座、機酒預訂等場(chǎng)景下,如何“懂你所說(shuō)、知你所想、代你操作”。比如,用戶(hù)在駕車(chē)路上僅需說(shuō)一句“幫我下單一杯少冰的冰椰拿鐵”,Agent即可協(xié)助在微信小程序上選擇順路的咖啡店,用戶(hù)確認即可基于微信車(chē)端小額免密支付完成下單,取餐信息會(huì )自動(dòng)推送到手機微信上,用戶(hù)到店取餐時(shí)可以直接用手機亮出二維碼核銷(xiāo)。
從實(shí)際應用場(chǎng)景來(lái)看,目前AI智能體主要用于客戶(hù)服務(wù)、個(gè)人助理、管理電子郵件并充當生產(chǎn)力工具。萬(wàn)衛星提到,一些廠(chǎng)商正合作推出“做行程規劃”的Agent,在該領(lǐng)域Agent能不錯地完成任務(wù),而點(diǎn)咖啡、點(diǎn)餐類(lèi)Agent小應用,目前發(fā)展也不錯?!跋鄬Σ惶珡碗s、對整合協(xié)調能力要求不過(guò)高,也不特別涉及多領(lǐng)域執行的通用任務(wù),加上用戶(hù)指令很明確的話(huà),Agent是能勝任的?!?/p>
DCCI互聯(lián)網(wǎng)研究院院長(cháng)劉興亮告訴中新經(jīng)緯,Agent能跨平臺、跨領(lǐng)域、多步驟整合行程安排與提醒。用戶(hù)手機內置的Agent可以讀取日程中的會(huì )議變動(dòng)、自動(dòng)發(fā)郵件申請時(shí)間調整、通過(guò)外賣(mài)平臺訂早飯、根據出行路線(xiàn)推薦順路菜市場(chǎng)并生成購物清單……未來(lái)“智能日程+生活助理”Agent,極具爆發(fā)潛力。
目前發(fā)展到什么階段?
AI技術(shù)演進(jìn)的速度可以說(shuō)是“人間一天,AI一年”。萬(wàn)衛星認為,Agent的底層技術(shù)及上層應用,從2024年開(kāi)始發(fā)展就非???。他認為,在A(yíng)gent領(lǐng)域,“過(guò)一天就可能有全新的變化”。
業(yè)內人士普遍認為,2025年將成為“智能體元年”。AI智能體憑借著(zhù)深度思考、自主規劃、做出決策并深度執行的能力,AI在發(fā)展路徑上正實(shí)現一次范式突變?!拔艺f(shuō)AI答”正轉向“我說(shuō)AI做”,并被逐漸應用到各類(lèi)商業(yè)場(chǎng)景中。
智能終端Agent是階躍星辰重點(diǎn)布局的領(lǐng)域。據該公司相關(guān)人士向中新經(jīng)緯介紹,過(guò)去兩年,階躍星辰自研的Step系列大模型,已搭載至汽車(chē)、具身智能、物聯(lián)網(wǎng)等頭部企業(yè)的旗艦產(chǎn)品中,50%以上頭部國產(chǎn)手機品牌與階躍合作AI智能體。7月25日,2025世界人工智能大會(huì )前夕,階躍星辰在上海發(fā)布了新一代基礎大模型——Step 3。
階躍星辰相關(guān)人士介紹,Agent爆發(fā)需要兩個(gè)必要條件,一個(gè)是多模態(tài)的能力,另外一個(gè)是慢思考的能力,這兩個(gè)能力恰好在2024年取得了突破性的進(jìn)展。所以,2025年Agent將會(huì )大規模爆發(fā),將成為“智能體元年”。
萬(wàn)衛星也表示,OpenAI發(fā)布的O1、O3模型、Deepseek R1模型相繼出現,說(shuō)明大模型在多模態(tài)支持、思維鏈(COT)能力上越來(lái)越成熟,這為Agent的落地提供了可行性。最近OpenAI、Manus等都推出了自己的Agent相關(guān)應用,落地場(chǎng)景越來(lái)越多。此外,Token(在信息技術(shù)領(lǐng)域是一種用于身份驗證、安全訪(fǎng)問(wèn)控制或數據完整性保護的數字標識符)成本變低,各個(gè)App也在推出自己功能的核心API(應用程序編程接口),開(kāi)放給第三方調用。這些都會(huì )給Agent帶來(lái)體驗上的進(jìn)步。
“今年我們看到很多Agent相關(guān)產(chǎn)品落地,大家能明顯感受到Agentic AI(智能體AI,比AI Agent更自主)產(chǎn)品帶來(lái)的交互變革,以及對工作效率和便利性的提升?!痹谌f(wàn)衛星看來(lái),今年端側在A(yíng)gent領(lǐng)域的機會(huì )很大,因為感知性和個(gè)性化的優(yōu)勢,行業(yè)或多或少會(huì )把一些模塊、方案部署到端側。
“雖然現在模型能力越來(lái)越強,支持多模態(tài)、有思維鏈能力,但在解決復雜問(wèn)題上,確實(shí)還有差距?!比f(wàn)衛星提到,在A(yíng)I智能體“點(diǎn)咖啡”的實(shí)際場(chǎng)景中也可能出錯,比如點(diǎn)錯口味,或者卡在某個(gè)步驟。
萬(wàn)衛星表示,現階段AI Agent在應用時(shí)還未徹底實(shí)現全自動(dòng)化?!爸饕窃谀承┐怪鳖I(lǐng)域的特定應用中,智能體可以實(shí)現大多數任務(wù)的自動(dòng)化,但最后還需要加入人工干預?!彼忉?zhuān)@種人工干預可能是進(jìn)行一些糾錯工作,也可能是在點(diǎn)餐的過(guò)程中完成最后的付款操作。具體來(lái)說(shuō),智能體在“完成任務(wù)的可靠性和準確性”“提高通用性”以及“打通生態(tài)”方面還有進(jìn)步空間。
AI智能體未來(lái)還會(huì )在哪出現?
對于A(yíng)I智能體的理想樣態(tài),萬(wàn)衛星稱(chēng),讓“人工干預徹底消失”確實(shí)比較復雜。但單從應用場(chǎng)景和消費者便利性來(lái)看,讓AI智能體或者機器人獨立完成復雜任務(wù)是大家追求的目標。這實(shí)際上是朝著(zhù)Agentic AI的方向發(fā)展——即完全高度自主,能夠獨立行動(dòng),強調自主性的AI類(lèi)型。
未來(lái),AI智能體是否只會(huì )出現在手機上?還有哪些類(lèi)型的終端設備可能會(huì )成為它的搭載平臺?
萬(wàn)衛星認為,手機無(wú)疑還是AI智能體最大的入口,因其算力中心、交互中心和感知中心的地位,手機仍會(huì )在A(yíng)gentic AI中處于中心位置,但它可能不再是唯一入口。PC、AI眼鏡、耳機、智能座艙,甚至智能家居、IoT設備等,都有可能成為搭載AI Agent的重要平臺。
萬(wàn)衛星還提到,如今用戶(hù)已經(jīng)習慣直接和“小愛(ài)”“YoYo”這類(lèi)助手對話(huà)了,交互路徑已經(jīng)逐漸從“人找App”變成“人找Agent來(lái)統一調度App”,流量流向也隨之改變,未來(lái)AI智能體成為新的流量入口是毋庸置疑的,而這還可能催生出應用商店3.0、4.0類(lèi)的全新商業(yè)模式。
-金年會(huì )體育