AI 功能早已進入手機,比如拍攝優(yōu)化、面部識別、語音助手等。2024年被手機廠商宣稱為“AI手機元年”,主要是指AI大模型進入手機,可能引起交互與體驗的變革,如語音交互能否取代觸屏,個人智能助理成為重要的用戶價值等。相應地,手機操作系統(tǒng)、芯片、內(nèi)存等需升級換代,手機廠商認為這將驅(qū)動手機進入繼功能機、智能手機之后的第三階段,AI手機階段。
對于消費者來說,AI手機價值不在于硬件堆疊,而是基于AI大模型的應用。IDC和OPPO聯(lián)合發(fā)布的《AI手機白皮書》提出“AI手機的用戶價值,是自在交互、智能隨心、專屬陪伴、安全可信的個人化助理!睂嶋H上,大模型的出現(xiàn)(LLM為主),智能個人助理(Assistant)可以擴展為更為自主的個人智能代理(Agent),深度參與到個人數(shù)據(jù)中,提供個性化服務(wù)。手機廠商2023年下半年起,逐步推出搭載大模型的手機,標配生成式AI應用與個人Agent,但都還處于早期階段。本文基于個人AI Agent將成為個人智能應用核心模式的判斷,從個人AI Agent核心組件及實現(xiàn)出發(fā),討論AI手機的現(xiàn)狀與未來,以及運營商可為的布局。
個人AI Agent將成為智能應用的核心模式,重塑終端與應用生態(tài)
一是大模型具備增強智能助理擴展性和可用性的潛力。Siri、谷歌助手、華為、百度的智能助手等早已進入智能手機與智能家居,它們基于預定義的規(guī)則和較小的專用語言模型,執(zhí)行具體定向的任務(wù),如設(shè)定提醒、播放音樂、獲取天氣預報等,但擴展性不足,對用戶意圖理解力也不夠。大模型(LLM為主)展現(xiàn)出很強的自然語言理解、內(nèi)容生成、邏輯推理等能力,以大模型驅(qū)動的個人AI Agent,具備把目標分解成子任務(wù),并調(diào)用工具來完成的潛力,預期可以做更泛化場景的任務(wù)。
二是APP與智能終端積累個人軌跡數(shù)據(jù),使行為智能成為可能。互聯(lián)網(wǎng)時代網(wǎng)站崛起,人類實現(xiàn)廣泛的信息共享交流,積累豐富的知識內(nèi)容,為大模型訓練提供了內(nèi)容基礎(chǔ)。移動互聯(lián)網(wǎng)時代,人類生活逐步線上化,即時通訊、購物、健身、出行等APP匯聚用戶行為軌跡數(shù)據(jù),為個人行為預測訓練提供了基礎(chǔ)。智能化時代,真正智能的個人Agent成為可能,從“幫你做事”到主動預測“代你做事”(代理性程度不一),Agent有望成為智能時代的核心應用載體,行為智能是本質(zhì)特點。
圖1 Agents可能成為個人智能應用的核心載體
三是從個人AI Agent應用模式出發(fā),會重構(gòu)智能終端與應用生態(tài)。個人AI Agent的終極目標是理解用戶并完成任務(wù),具備響應性技能和主動性技能(圖2)。即響應用戶需求的能力,如問題答復、天氣查詢等,與在用戶沒有明確命令的情況下,提供主動服務(wù)的能力,如活動推薦及執(zhí)行等。從應用目標出發(fā),個人AI Agent需要:(1)更廣泛的個人數(shù)據(jù)采集,包括來自APP等“軟終端”與各類傳感器、智能硬終端的信息監(jiān)測;(2)用戶歷史記憶檔案與當前狀態(tài)信息(環(huán)境、位置等)的組合,體現(xiàn)個性化、即時服務(wù)特點;(3)多樣的工具調(diào)用能力,包括不同專業(yè)Agent的協(xié)同;(4)基礎(chǔ)AI模型是核心,連接調(diào)度Agent的功能組件。結(jié)合現(xiàn)有進展,我們預計將會出現(xiàn):(1)新一波監(jiān)測類智能終端創(chuàng)新,類似Limitless錄音吊墜、Galaxy Ring運動睡眠等監(jiān)測;(2)新一波智能Agent應用創(chuàng)新,個人綜合Agent與專屬Agent(如健康助理)等;(3)新一波承載Agent應用的終端創(chuàng)新,類似Rabbit R1、AI Pin、Ray-Ban Meta,當然包括AI手機;(4)新的操作系統(tǒng)內(nèi)核,大模型為核心,支持多工具、多Agent調(diào)用等;(5)個人隱私保護技術(shù)創(chuàng)新及應用,加密與可信環(huán)境等。
圖2 個人AI Agent的主要組件
來源:《PERSONAL LLM AGENTS: INSIGHTS AND SURVEY ABOUT THE APABILITY, EFFICIENCY AND SECURITY》
現(xiàn)階段AI手機以生成式應用為主,“行為智能”尚處探索階段
綜合當前各方對AI手機的界定,AI手機可以概括為包含端側(cè)大模型、具備NPU的SoC芯片(IDC要求NPU性能在30到45 TOPS之間)、端側(cè)實現(xiàn)GenAI并向個人Agent發(fā)展等。下表是手機廠商目前推出的AI手機及特征總結(jié):
表3 主流廠商當前AI手機推出情況
可以看出,現(xiàn)階段AI手機端側(cè)模型以7B為主流,并與云端協(xié)同,大模型開始與操作系統(tǒng)融合。但受硬件與技術(shù)限制,AI手機應用以內(nèi)容生成處理類場景為主,多是云端大模型應用的移植,個人AI Agent尚未真正發(fā)揮“行為智能”的特點,所以用戶感覺沒有明顯的差異化,不夠顛覆性。具體而言:
(1) 主打內(nèi)容生成處理,體現(xiàn)一定特色。以端側(cè)AI在圖像和文本處理的深化為主,如文本和圖片生成、AIGC 消除與背景補充、文件和本地通話摘要等。差異化來自某類場景的專注提升,如小米專注“影像”,VIVO文檔提煉更加高效等。
(2) 個人AI Agent處于探索階段。智能助手在識別用戶意圖,對手機的資源、性能、業(yè)務(wù)應用進行調(diào)度方面開始探索,如:榮耀YOYO提供“任意門”功能,宣稱實現(xiàn)意圖識別、信息跨應用跨設(shè)備流轉(zhuǎn),VIVO小V自然語言操控手機APP等。
(3) 注重跨終端融合與智能應用生態(tài)打造。如小米“人車家全生態(tài)”布局,小愛能學習用戶的使用習慣,實現(xiàn)跨終端自動控制。應用生態(tài)方面,一是利用成熟生態(tài),如三星與Google的大模型及生態(tài)合作;二是建新生態(tài),如OPPO“1+N智能體生態(tài)”,即小布助手+開發(fā)者和用戶Agents,榮耀發(fā)起“百模生態(tài)計劃”,手機端自有AI大模型為中控,調(diào)度云端模型生態(tài)等。
AI手機適應新應用模式的未來關(guān)鍵方向分析
新范式催生新終端形式,重構(gòu)應用生態(tài),AI Pin是無屏幕交互Agent,Rabbit R1是直接操作APP的 Agent,Limitless的愿景也是個人 Agent,AI及Agent模式還會持續(xù)帶來智能眼鏡、耳機、家居等終端創(chuàng)新。面對原生AI終端與AI應用,AI化的手機的定位及形態(tài)面臨升級,或需重新定義的局面。具體來說,有以下幾個值得關(guān)注的問題和方向:
(1) AI手機還能否整合AI終端保持中心設(shè)備的位置:本質(zhì)上就是AI手機能否成為個人AI Agent的集成調(diào)度中心,AI終端成為手機的補充,或者作為新的功能組件的問題。目前專項AI硬件,如Limitless吊墜、Ploud錄音機,包括主打音頻和拍攝的Ray-Ban Meta初步獲得市場認可,也與手機配合,而偏綜合的,甚至宣稱取代手機的AI Pin、Rabbit R1低于預期,高開低走。AI手機成為個人AI Agent的集成調(diào)度中心,核心優(yōu)勢是本地算力和存儲,能夠承載端側(cè)模型和個人隱私數(shù)據(jù),是當下的最佳載體。未來不排除某類更隨身輕靈的AI原生穿戴設(shè)備,借助云端+網(wǎng)絡(luò)+可信數(shù)據(jù)空間等成為新中心,產(chǎn)生更移動化場景的Agent應用生態(tài)。
(2) 行為數(shù)據(jù)孤島下如何協(xié)調(diào)建立用戶的個人記憶:用戶行為軌跡數(shù)據(jù)分散終端及在各大APP中,后者未必愿意開放API。探索的方向是:①Agent學習APP操作方法,通過UI界面模擬完成任務(wù),如Rabbit R1,以及APPAgent框架等,但不是最有效率的方案;②系統(tǒng)級個人Agent、專項Agent(如購物、旅游)之間協(xié)同調(diào)用,彌補數(shù)據(jù)孤島劣勢;③大廠廣泛布局智能終端,構(gòu)建用戶記憶檔案,比如小米、蘋果、華為、三星等向智能可穿戴、智能家居擴展等。
(3) 手機廠商APP Store能否升級為“Agent” Store:APP Store是手機廠商的重要營收渠道,引入Agent面臨:①大模型不是手機廠商包括蘋果的強項,主導權(quán)在Open AI 、Google等手中;② Agent模式向下擠壓原APP,甚至跳過APP,利益鏈條被打破;③Agent Store需要新的平臺插件、功能組件與商業(yè)模式等?赡艿姆较颍阂皇墙⒋竽P蜕鷳B(tài),如榮耀“百模生態(tài)計劃”以及蘋果尋求多方合作;二是探索新商業(yè)模式,如系統(tǒng)級Agent、專項Agent及APP數(shù)據(jù)交換與協(xié)同合作,平臺架構(gòu)設(shè)立面向B端的Agent組合調(diào)用層,按量/訂閱收費分成等;三是建立或參與建立數(shù)據(jù)集成平臺(如可信數(shù)據(jù)空間),匯集用戶行為數(shù)據(jù),統(tǒng)一格式與隱私管理,為Agent提供開發(fā)運營基礎(chǔ)等。
(4) 個人數(shù)據(jù)安全如何有效保障:在AI手機等本地端保存處理,被認為是最安全的方式,但對內(nèi)存挑戰(zhàn)大,推理成本也比較高。云邊協(xié)作是另一種處理方式,隱私保護技術(shù)主要是數(shù)據(jù)屏蔽、數(shù)據(jù)加密、可信執(zhí)行環(huán)境等?偟膩碚f,現(xiàn)有隱私保護技術(shù)還不足以支持高水平個人AI Agent運作,需要手機廠商等提出創(chuàng)新性解決方案,贏得用戶信任。
(5) AI手機軟硬件持續(xù)升級:一是端側(cè)模型及OS效率改進,蘋果OpenELM 、微軟Phi-3、Octopus V2等端側(cè)模型在語⾔、推理、編碼等方面有良好表現(xiàn),蘋果即將發(fā)布的iOS 18是其展開AI競爭的主要平臺;二是端側(cè)硬件持續(xù)升級,將采用3nm等更先進制程,推理能力及手機內(nèi)存加速提升等。
運營商可以做什么布局
面對AI終端與應用模式變革趨勢,電信運營商一是可把握新一波AI終端云端聯(lián)網(wǎng)的流量需求,帶動流量卡號銷售;二是優(yōu)化網(wǎng)絡(luò)質(zhì)量與套餐服務(wù),Agent端云實時的數(shù)據(jù)處理交互,對網(wǎng)絡(luò)速度和穩(wěn)定性的需求增加,因個人數(shù)據(jù)更加完整,運營商可以與應用方合作,提供個性化的套餐服務(wù);三是布局個人、家庭Agent特色智能服務(wù),如健康管理服務(wù)、智能家庭服務(wù)、緊急響應服務(wù)等;四是參與用戶數(shù)據(jù)隱私保護技術(shù)開發(fā)與可信數(shù)據(jù)空間建設(shè),提供加密技術(shù)保護用戶Agent數(shù)據(jù),積極布局個人、家庭可信數(shù)據(jù)空間基礎(chǔ)設(shè)施建設(shè)等。