服務于會員的需要服務于行業的發展服務于政府的橋梁
公告:
發布于:2025-10-11
2025年被視為AI智能體(Agent)的元年,也是智能體走向終端設備、提升應用普及的時間窗口。在近期舉辦的“2025驍龍峰會·中國”上,“智能體”被芯片供應商、手機OEM、PC OEM及廣大AI技術解決方案提供商頻頻提及。榮耀終端股份有限公司產品線總裁方飛在峰會現場表示,2025年將開啟“手機智能體與性能的雙擎時代”;小米AI產品經理李豪杰向《中國電子報》記者表示,小米的個性化端側AI除了讓智能體更懂用戶,生成內容的時候可以不需要輸入之外,還具備感知能力;金山辦公生態合作總經理張寧介紹了基于WPS靈犀的“原生Office辦公智能體”。
芯片是終端設備的算力引擎。智能體要走入硬件配置(相對云端)受限的終端側,不僅對芯片的性能參數和架構設計提出了新的要求,也推動芯片供應商與終端OEM進行更加精細的聯合研發、底層調優及功能開發,加速解鎖更多的功能特性與用戶體驗。
從算力、內存到感知,智能體全方位考驗終端芯片能力
根據谷歌云的定義,AI智能體可以同時處理文本、語音、視頻、音頻、代碼等多模態信息,執行復雜的多步驟操作,實現自主學習、適應并獨立做出決策。相比AI助理,智能體不再被動響應用戶的要求,而是以目標為導向,自主、主動地執行任務。
智能體的功能很大程度上得益于生成式AI和AI基礎模型的多模態功能。而多模態的多元數據類型和多樣算力需求,需要以NPU為核心且NPU、CPU、GPU協同工作的異構計算矩陣。高通本次發布的第五代驍龍8至尊版搭載了異構AI引擎,包含作為通用加速單元的自研Oryon CPU和Adreno GPU,以及作為引擎核心的全新Hexagon NPU,三個加速單元各有側重又協同工作。比如Oryon CPU負責即時響應任務,包含獨立顯存的Adreno GPU能夠加速AI負載并實現更快的推理響應,Hexagon NPU專注于持續運行的大語言模型和復雜推理任務。此外,該AI引擎還集成了高通傳感器中樞,在保護數據隱私的基礎上,圍繞用戶構建更加深入、個性化的個人知識圖譜。
Al工作負載主要包括由標量、向量和張量數學組成的神經網絡層計算以及非線性激活函數。Hexagon NPU提供了三種硬件加速單元,分別對應標量、向量、張量三種常見數據類型及相應的工作負載。其中,12個標量加速器用于處理圖像識別、音頻分析等經典AI任務,同時支持大語言模型推理;8個向量加速器用于加速復雜的像素級圖像模型,并在大語言模型場景上支持更長的上下文窗口;張量加速器用于加速更大、更復雜的多媒體用例以及LVM(視覺大模型)。
同樣值得注意的是,內存帶寬對大模型的端側部署至關重要,直接影響大模型的訓練效率和推理速度。面向大模型的內存帶寬瓶頸,第五代驍龍8至尊版首次支持64位內存架構,使NPU可訪問超過4GB RAM,從而更高效地支持更大參數的端側模型部署。此外,第五代驍龍8至尊版支持的LP DDR5x內存頻率達到5.2GHz,進一步提升了大模型的推理速度。
降低內存占用同樣是部署AI大模型——尤其是本地化、輕量化部署的重中之重。量化成為解決這一問題的關鍵技術,通過降低模型參數精度,減少內存需求,并保持模型的大部分準確性。最新一代的Hexagon NPU支持INT2和FP8精度,為開發者提供更加靈活的模型部署方式。其中FP8在加快計算速度的同時降低內存占用,使大模型走向邊緣設備成為可能,越來越成為大模型技術團隊的主流選擇。
“在30億參數的大語言模型上,我們(第五代驍龍8至尊版的NPU)的出字速度最快能夠達到220token/s以上。”高通技術公司產品市場總監萬衛星在峰會現場表示。
在AI智能體所需的異構計算架構中,CPU和GPU的作用同樣關鍵。第五代驍龍8至尊版搭載了當前業界最快的移動端CPU和具備獨立顯存的GPU,為AI負載提供更加全面的算力支撐。
其中,第三代Qualcomm Oryon CPU是迄今全球最快的移動端CPU,采用4.60GHz的超級內核和3.62GHz的性能內核,以及每簇12MB的緩存,支持矩陣加速,使第五代驍龍8至尊版的單核性能提升20%,多核性能提升17%,CPU能效提升35%。
而新一代高通Adreno GPU在性能提升23%、光追性能提升25%、能效優化20%的基礎上,首次引入獨立高速顯存。這一18MB的專用圖形緩存,不僅帶來10%的整機功耗降低和最多38%的游戲性能提升,也為GPU上運行的其他用例帶來性能和功耗上的收益,比如實時分析視頻、識別關鍵瞬間、相冊增強等一系列AI影像功能,并實現更快的推理響應。
除了智能手機,AI PC也是AI智能體的重要落點。本次驍龍峰會上,高通發布了面向PC平臺的驍龍X2 Elite Extreme和驍龍X2 Elite。其中,驍龍X2 Elite Extreme集成了3nm制程的第三代Qualcomm Oryon CPU,擁有12個超級核心、6個性能核心,是首款主頻達到5GHz的ARM兼容CPU。該處理器還搭載了面向筆記本電腦的全球最快NPU,支持80TOPS AI處理能力,可在Windows 11 AI+PC上支持并發AI體驗。
“為了支持生成式AI和智能體AI,我們(驍龍X2 Elite Extreme)配備了全新的強大NPU,能夠提供80TOPS的推理性能。”高通技術公司產品管理副總裁Nitin Kumar表示。
芯片廠商與OEM深度協同,共同推動底層技術創新
面向終端平臺的用戶需求與限制因素,手機、PC等終端OEM與高通團隊聯合研發,使旗艦產品更充分地發揮芯片能力,解鎖更多功能特性與用戶體驗。而AI智能體的部署要求,使OEM與高通的合作更加緊密,在硬件設計、交互框架、技術部署、功能開發、底層調優等方面取得諸多進展,并在驍龍峰會上帶來了多項首發技術與體驗。
“智能體的核心是模型。”榮耀終端股份有限公司產品線總裁方飛表示。在峰會現場,榮耀展示的圖像AI追色功能引發現場觀眾的陣陣驚呼。其背后是榮耀與高通聯合研發的高效能端側AI模型方案。
首先,榮耀與高通團隊通過端側低bit量化技術,使端側模型存儲空間節省30%、推理速度提升15%、推理功耗下降20%。通常來說,低bit量化技術在端側落地,將顯著優化功耗、內存、性能等模型體驗,但也會導致對應的精度損失增大。榮耀與高通攜手,在最新旗艦芯片上實現了垂域場景的2-bit量化商用準出,在精度達標的前提下,進一步降低內存占用、提升推理性能并減少推理功耗,推動量化技術從單純的軟件壓縮,演變為與硬件設計深度耦合的計算范式。
其次,雙方推出了新一代向量化檢索技術,通過將文本、圖像、視頻等數據編碼為稠密向量,構建語義層的高效索引,推動檢索性能提升400%。
再次,雙方一起構建端側多模態感知能力,使個人知識庫的構建更加便捷高效。采用低比特量化技術的多模態模型,能夠高效、精準地理解手機端的文本、圖片、視頻等各類數據,將其轉化為結構化的信息與知識,在提升效率的同時進一步降低計算和存儲開銷。
基于雙方多個技術層面的聯合研發,榮耀首發了“智能體驅動的圖像AI追色”功能。在現場展示中,方飛通過語音指令,讓榮耀智能體YOYO將一張電影海報保存為追色模板“愛樂之城”,并找到“周末在故宮拍攝的照片”。YOYO基于低bit量化存儲和向量檢索技術,即刻完成對指定圖片的搜索。隨著方飛說“把這張圖片追色成‘愛樂之城’模板”,YOYO將故宮照片的風格色調變成了“愛樂之城”的海報風格。
而PC作為更具生產力屬性的終端,正在通過AI能力衍生出跨文件、跨應用的全局檢索和信息整理能力,并基于多模態大模型重構人機交互體驗。
金山辦公生態合作總經理張寧表示,過去半年,金山辦公與高通工程師團隊緊密合作,基于驍龍AI PC進行架構適配,以充分發揮驍龍X系列平臺性能。在個人辦公方面,根據金山辦公9月的預發布版本,WPS Office已經在驍龍平臺上實現顯著的性能提升,啟動速度相比競品提升20%,打開15MB Excel速度領先10%,打開10MB PPT速度領先10%。金山辦公將于今年12月底正式交付面向驍龍AI PC的WPS Office,屆時,中國用戶將能作為首批用戶感受更流暢、跨平臺的統一辦公體驗。企業協作方面,金山辦公于今年7月發布了WPS AI 3.0版本——WPS靈犀。
“有了WPS靈犀,用戶只需通過自然語言、多輪對話即可完成文檔創作、演示文稿生成及語音助手等功能,是真正意義上的原生Office辦公智能體。我們相信,未來WPS靈犀與驍龍AI PC的硬件能力有更深的合作機會,形成協同增效的辦公生態。”張寧說道。
2025年是高通成立四十周年,也是其在華發展的第三十年,而AI將是高通與中國合作伙伴下一個三十年的重中之重。高通中國區董事長孟樸在展望高通與中國生態伙伴合作前景時表示:“站在AI與連接重構終端、重塑體驗并開啟全新智能時代的新起點,讓我們以創新引領方向,以合作匯聚力量,共同開創下一個更加輝煌的三十年。”高通公司首席運營官兼首席財務官Akash Palkhiwala表示,高通將攜手中國合作伙伴,在智能手機上實現更多AI賦能的功能和優化,將智能體AI的體驗引入更多終端;同時與中國的AI模型提供商和開發者合作,共同推動更多AI應用案例的探索與落地。
【來源:中國電子報】