在智能化時代,人工智能(AI)與無線通信技術的融合,正在為人類社會帶來一場深刻的變革。尤其是在物聯網(IoT)和無線傳感系統(WSS)領域,利用無線電信號對環境與行為進行智能識別成為前沿研究的熱點。無線傳感(Wireless Sensing)作為一種無源、隱私友好且不依賴攝像頭的感知技術,被廣泛應用于智慧城市、安防監控、健康護理等多個領域。尤其是在室內人群計數、行為識別等任務中,AI 模型通過解析信道狀態信息(CSI)等物理層信號,能夠精準判斷人體活動模式,大幅度提升了環境智能感知的能力。


然而,隨著AI模型的規模和復雜度不斷上升,部署在傳感器設備(Sensor Devices,簡稱 SD)上的深度學習模型往往面臨巨大的計算壓力。同時,由于SD在通信和計算資源方面的先天限制,傳統的端側推理或完全卸載至邊緣服務器(Edge Server,簡稱 ES)的方式,已無法滿足對推理延遲和能耗的雙重嚴格要求。因此,如何在資源受限的條件下,智能地調度AI模型在設備和邊緣間的推理協作,成為亟需解決的關鍵難題。


在設備邊緣協同推理(Device-Edge Collaborative Inference)框架中,AI模型被劃分為多個部分,部分在設備端執行,剩余部分在邊緣服務器上完成。這種協同機制可以顯著減輕設備的計算負擔,并利用邊緣計算資源提升整體推理性能。然而,模型切分點(即模型在設備和邊緣之間的劃分位置)和資源分配(如無線帶寬、功率、時間等)的設計,構成了一個復雜的混合優化問題。


首先,不同用戶的AI模型分裂位置決定了設備上傳數據的體積和結構,這將直接影響通信時延和計算延遲。其次,邊緣服務器資源有限,不同用戶間的資源分配方案必須考慮協同競爭與共享的平衡。此外,由于用戶所處的信道條件不同(如信道增益變化),模型切分的最優位置在空間上呈現異質性,即沒有統一的最佳切分點可以適用于所有設備。因此,該問題不僅涉及深度學習模型結構的分析,還需引入智能調度與優化算法進行聯合求解。


為了系統性地解決上述挑戰,微算法科技(NASDAQ:MLGO)提出了一種集成學習與優化算法——LOP(Learning-Optimization Policy)框架,該方法創新性地將深度強化學習(Deep Reinforcement Learning, DRL)與凸優化技術相結合,分別處理模型分裂與資源分配兩個子問題,從而高效求解整個設備邊緣協同推理任務。


微算法科技 LOP算法的核心思想是將問題分為兩個階段:


第一階段:使用深度強化學習進行模型分裂點選擇


模型分裂問題本質上是一個組合優化問題。在每個設備SD上,深度神經網絡可以被切分成若干連續層,而模型分裂點的選擇決定了設備需要處理的層數與數據上傳量。微算法科技使用強化學習中的策略梯度方法,訓練一個智能體(agent)來根據當前的網絡狀態(如設備能耗預算、信道狀態、邊緣負載等)預測最優的模型切分點。該方法具有良好的泛化能力,并可以根據環境動態調整策略。


第二階段:通過凸優化進行系統資源的聯合分配


在第一階段確定模型切分點之后,系統進入第二階段,即根據分裂結構和用戶需求,進行無線資源(如帶寬、時間片、計算能力等)的聯合優化。此時,由于切分結構已定,系統資源的優化問題可被轉化為一個約束條件明確的凸優化問題,從而使用經典的凸優化算法(如內點法、梯度下降等)求解。在這一階段,重點考慮能量最小化目標,同時約束推理延遲不超過某一閾值。


微算法科技 LOP算法實現了“感知-決策-優化”三位一體的智能協同流程。它不僅提升了模型分裂與資源調度的效率,而且顯著降低了系統的整體能耗與通信延遲。



在工程實現中,一個多用戶無線傳感系統,系統由多個傳感設備SD、邊緣服務器ES、和后端控制器組成。每個SD部署有輕量級神經網絡模型,在前端負責初步特征提取。處理后的中間特征被壓縮后上傳至ES,ES上的后續模型部分完成最終的推理判斷,如人群計數、人體動作識別等任務。


整個系統通過控制器實現以下關鍵功能:


感知狀態更新:定期從SD收集信道狀態、剩余電量、數據隊列等信息;


分裂策略學習:在控制器中部署DRL智能體,預測每個設備的模型切分策略;


資源分配優化:在DRL輸出后,調用凸優化求解器進行邊緣資源精確分配;


推理協同執行:SD與ES按照下發指令同步執行AI模型推理任務。


該系統基于軟件定義網絡(SDN)架構,具備高度可編程性與靈活性,適應大規模設備部署環境下的高并發協同推理需求。


在實驗中,該系統模型切分點隨著用戶信道增益的變化而呈現出明顯的閾值行為。具體而言,當設備信道條件良好時,模型切分點趨于靠后,意味著設備可以執行更多計算任務;而在信道惡劣時,模型盡可能前移,將大部分任務交由邊緣服務器完成,從而減少上傳數據體積與能耗。


微算法科技(NASDAQ:MLGO) LOP算法創新性地將深度強化學習與凸優化方法結合,成功解決了模型分裂與資源分配耦合帶來的復雜性,顯著提升了系統在延遲與能耗之間的優化能力。通過實驗驗證,該技術在性能與可行性方面均表現出色,展示了其作為下一代邊緣智能支撐方案的巨大潛力。


更重要的是,這項技術不僅具備理論價值,更具備強大的工程適用性與可擴展性。它突破了傳統邊緣推理“單點切分、平均分配”的思維定式,實現了感知系統由“固定模式”向“動態協同”的智能躍遷,為未來智慧城市、智能醫療、工業感知等多場景應用提供了統一的邊緣AI推理解決方案。其通用框架與模塊化設計,也為未來的跨設備、跨場景部署打下了良好基礎。


展望未來,隨著6G、物聯網、邊緣計算等基礎設施的進一步成熟,微算法科技 LOP算法將在更大規模、多模態、多用戶的智能環境中展現更強適應能力。期待這項技術繼續拓展其邊界,推動AI模型在真實世界中的智能部署方式不斷演進,助力構建一個真正智能、高效、綠色的無線感知新時代。


來源:媒介聯盟
原標題:MLGO微算法科技 LOP算法:實現多用戶無線傳感系統中邊緣協同AI推理的智能優化路徑