1. 项目概述从通信信号中“看见”世界作为一名在无线通信和感知领域摸爬滚打了十多年的工程师我见证了这个领域从“通信就是通信雷达就是雷达”的泾渭分明到如今两者水乳交融的奇妙转变。我们手里的手机、家里的路由器、遍布城市的基站这些原本只为传递比特流而生的设备正在被赋予一双“慧眼”。这背后的核心技术就是集成感知与通信ISAC。简单来说ISAC的核心思想是“一石二鸟”让无线通信系统在完成数据传输本职工作的同时利用其发射和接收的无线电波来感知物理世界。这听起来有点像科幻但其物理基础却非常坚实。无线信号在空间中传播时遇到的任何物体——无论是走动的人、呼吸的胸腔还是落下的雨滴、上涨的河水——都会对信号产生微妙的调制。这些调制体现在信道状态信息CSI的幅度、相位变化或是多普勒频移的谱线移动上。过去这些变化被视为需要被“均衡”掉的信道损伤而现在我们意识到它们其实是描绘物理世界的“墨水”。这篇文章我想和你深入聊聊ISAC如何从一个前沿概念落地为从“感知人体”到“感知环境”的统一框架。我们不再满足于实验室里用特制设备做演示而是探讨如何利用现成的、无处不在的4G/5G和Wi-Fi信号在非视距、非协作的“恶劣”条件下稳定地提取出有价值的环境与生命信息。这不仅仅是技术的炫技更是为了解决真实世界的问题如何用最低的成本、最广泛的覆盖实现大范围的健康监测、灾害预警和环境管理。2. ISAC的统一感知框架信号如何“诉说”世界在深入具体应用之前我们必须先理解ISAC感知的“通用语言”。无论目标是人体还是环境感知的物理本质都是相通的目标物改变了电磁波的传播路径、速度或能量我们在接收端通过解读这些改变来反推目标的状态。2.1 核心物理模型信道频率响应CFR的奥秘一切感知的起点是通信系统在进行信道估计后得到的信道频率响应CFR。对于一个多天线OFDM系统第it个发射天线到第ir个接收天线、第j个子载波、第k个OFDM符号上的CFR可以建模为H_it,ir,j,k [相位偏移项] * Σ [路径损耗 * 时延项 * 多普勒项 * 到达角项 * 出发角项]这个公式看起来复杂但拆解开来每一项都对应着一种物理效应相位偏移项包含了时钟不同步TO/CFO和硬件差异引入的“噪声”这是双基站Bistatic感知中首先要克服的难题。路径损耗信号在传播中的衰减对于环境感知如降雨至关重要。时延项e^{-j2πΔf_j τ[l]}反映了信号经过第l条路径的传播时间。人体移动或水位变化会改变反射路径长度从而改变时延τ。多普勒项e^{-j2πf_D[l]kT_s}由目标与收发信机之间的相对径向运动引起。心跳、呼吸、行走、流水都会产生特征性的多普勒频移f_D。到达角/出发角项由天线阵列的几何结构决定用于对目标进行空间定位。关键洞察人体感知和环境感知虽然应用场景迥异但都依赖于从上述CFR模型中提取相同的核心特征——时延、多普勒、角度。区别在于人体感知关注的是快速、周期性、近场的微变如毫米级胸腔起伏而环境感知则处理缓慢、大范围、远场的渐变如厘米级水位变化。前者需要高时间分辨率来捕捉动态后者则需要高稳定性来滤除噪声。2.2 从粗糙到精细感知代理指标的演进早期基于信号强度如RSSI的感知方案因其易于获取而备受青睐。手机能直接读出信号格数路由器也能上报RSSI。然而RSSI是一个将所有多径信号能量粗暴叠加后的标量信息损失极大。它就像只用耳朵听一个交响乐团的总体音量你无法分辨出其中小提琴、大提琴各自的声音。信道状态信息CSI的引入是感知技术的一次革命。它相当于为每个子载波可以理解为不同音高的声部单独记录了其幅度和相位。这使得我们能够“听见”并分离出不同传播路径的“声音”。目前从商用Wi-Fi网卡如Intel 5300、Atheros系列和开源软件无线电如srsLTE中提取CSI已成为可能为精细感知提供了数据基础。注意尽管CSI提供了丰富的信息但在实际部署中尤其是利用运营商的公共蜂窝信号进行感知时直接获取原始CSI仍然面临挑战。这涉及到基带芯片的开放程度和网络侧的合作。因此许多环境感知研究退而求其次使用网络侧更容易提供的参考信号接收功率RSRP等指标并通过长期观测和机器学习来挖掘其与环境参数的相关性。3. 人体感知实战从定位到生命体征让我们把镜头拉近看看ISAC如何在不佩戴任何设备的情况下“隔空”感知人体的活动与状态。这个过程就像用无线信号给空间做一次“CT扫描”。3.1 第一步攻克时钟不同步的“拦路虎”在理想的雷达系统中收发机共享同一时钟相位是纯净的。但在ISAC的典型双基站场景下例如用一个手机基站发射信号另一个手机或专用设备接收发射机和接收机的时钟是独立的。这会导致CSI相位中出现快速变化的随机偏移完全淹没掉由人体微动引起的微小相位变化。解决这个问题有几种主流思路我结合自己的调试经验来谈谈跨天线互相关CACC这是最直观的方法。既然随机相位对同一时刻、同一位置的不同天线影响是相似的那么将两根接收天线的CSI共轭相乘公共的随机相位项理论上就被抵消了。但这里有个大坑多普勒镜像。因为两根天线的信号功率相近计算互相关后会产生对称的正负多普勒分量你无法判断目标是靠近还是远离。我在早期实验中就曾被这个问题困扰许久。跨天线信号比CASR计算两根天线CSI的比值。这个方法能同时消除随机相位和自动增益控制AGC的影响且没有多普勒镜像问题。但它有个致命缺点比值运算破坏了CSI中时延和角度信息的线性关系给后续的联合参数估计带来了巨大困难。如果你的应用只关心多普勒比如判断有没有人在动CASR是个好选择但如果需要精确定位就得慎用。改进的CACC变体与单天线方法学术界也在不断改进。例如WiDFS 2.0提出的方法利用静态路径分量在多根天线间构造差分项既能消除随机相位又能抑制镜像。而对于只有单根接收天线的极端情况比如很多物联网设备可以通过在时延域或频域构造参考信号来校准相位。我实测过在带宽足够40MHz时单天线方法也能取得不错的效果但分辨率确实不如多天线方案。实操心得选择哪种相位校准方法取决于你的硬件配置天线数量和感知任务是否需要测距/测角。对于多数人体跟踪和活动识别拥有至少3根接收天线的改进CACC变体是平衡性能与复杂度的优选。3.2 第二步提取多维特征点云校准后的CSI是一个包含时间、子载波频率、天线维度信息的数据立方体。我们的任务是从这个立方体中提取出对应人体目标的“特征点云”。这个过程通常分三步走可以类比为图像处理中的“边缘检测”多普勒维FFT沿时间轴做FFT将信号变换到多普勒频率域。人体运动即使是静止时的呼吸会产生特定的多普勒频移这通常是分辨率最高的维度能有效区分静止 clutter 和运动目标。时延维MVDR波束成形对每个多普勒单元在天线对维度上应用最小方差无失真响应MVDR波束成形。这相当于一个空间滤波器能增强来自某个特定时延方向的信号抑制其他方向的干扰从而提升时延分辨率。角度维FFT最后在空间维度做FFT估计信号的到达角AoA。结合时延和几何关系就能将目标定位在二维或三维空间中。经过这三步我们得到了一个多普勒-时延-角度DDA三维特征张量。其中的每一个能量峰值都对应一个潜在的散射点可能是人体的某个部位也可能是环境中的静态物体。3.3 第三步基于位置的精炼感知得到目标的位置信息后感知的精度和鲁棒性可以大幅提升。位置成了一个强大的空间滤波器。定位与跟踪我们使用二维恒虚警率2D-CFAR检测算法在“多普勒-角度”二维平面上找出能量显著高于背景噪声的点形成初始点云。然后将这些点云送入扩展卡尔曼滤波EKF或联合概率数据关联JPDA等跟踪算法。EKF会根据运动模型如匀速或匀加速预测目标下一时刻的位置再用新的观测点去修正从而形成平滑、连续的轨迹。我的经验是在室内复杂多径环境下单纯依赖时延或角度都容易出错但将两者与多普勒信息在EKF框架下融合能极大提升跟踪的稳定性。生命体征监测这是最让我感到神奇的应用。对于一个静坐的人其胸腔因呼吸和心跳产生的微动毫米级会调制反射信号的相位。传统方法直接分析所有信号的相位噪声极大。我们的做法是首先利用长时间窗口如10秒的高分辨率多普勒谱找到对应“静止人体”的零频附近能量峰呼吸频率通常0.1-0.5 Hz。然后锁定这个目标所在的“多普勒-时延-角度”三维单元只提取该单元内残留CSI信号的相位序列。这个操作相当于把“探照灯”精准打在了人的胸腔上极大抑制了环境噪声和其他身体部位的无关运动。最后对相位序列做差分消除身体缓慢晃动的影响再经过0.1-0.5 Hz呼吸和0.8-2 Hz心跳的带通滤波就能清晰地提取出呼吸和心跳波形。我们在5 GHz Wi-Fi环境下实测心率误差可以控制在±3 BPM以内。活动识别一旦锁定目标我们可以持续提取其“微多普勒”特征。不同活动走、跑、挥手、跌倒会导致四肢产生不同的运动速度组合在多普勒-时间谱图上形成独特的“纹理”图案。例如走路会产生周期性的、对称的多普勒谱而跌倒则会产生一个短暂的、高能量的正向或负向频移。利用卷积神经网络CNN或时序模型如LSTM对这些谱图进行分类就能实现高精度的活动识别。这里的一个关键技巧是自动活动分割我们借鉴了语音活动检测VAD的思路用预训练的语音分割网络来无监督地检测连续行为中的边界效果比固定时间窗好很多。4. 环境感知实战让基站成为气象站和水文站如果说人体感知是“显微镜”那么环境感知就是“广角镜”。它的目标不再是几米范围内的精细动作而是数百米甚至公里尺度上的宏观状态变化如降雨、土壤湿度、河流水位。4.1 环境感知的独特挑战与思路环境感知面临几个与人体感知截然不同的挑战信号弱且变化慢环境参数变化缓慢如水位每小时变化几厘米引起的信号变化非常微弱且容易被温度漂移、设备增益波动等长期趋势淹没。非视距NLOS主导在广域监测中收发节点之间很少有直射路径LOS信号主要通过反射、衍射、散射传播路径复杂。特征相关性复杂降雨导致信号衰减土壤湿度影响介电常数从而改变传播时延和反射系数水位变化则通过改变水面反射路径的长度和相干性来影响信号。这些关系往往是非线性且需要现场标定的。4.2 案例深潜基于LTE信号的水位感知这里我想分享一个我们团队在悉尼帕拉马塔河边的真实项目经历它完美诠释了如何在NLOS、非协作条件下用最“土”的办法实现环境感知。4.2.1 实验部署与数据“嗅探”我们的目标是用公共的LTE基站信号来监测潮汐引起的水位变化。我们在河岸边的室内UTS Haberfield赛艇俱乐部放置了一台软件定义无线电SDR接收机和两根简单的单极子天线正对河流方向。在码头下我们安装了一个高精度声纳水位计作为地面真值。关键点在于接收机与周围所有基站均处于NLOS状态——没有直射信号接收到的全是经过建筑、树木、水面多次反射、散射后的信号。我们使用开源工具如srsLTE持续“嗅探”下行链路信号成功捕获了来自7个不同小区、跨越4个频段Band 1, 3, 5, 28的参考信号接收功率RSRP。我们并没有与任何运营商合作也没有基站的控制权完全是被动接收。4.2.2 特征分析与“涌现”的相关性最初几天我们只是枯燥地记录RSRP数据和声纳水位数据。当我们把时间序列画在一起时有趣的现象出现了某些频段特别是低频段如Band 28的RSRP波动与潮汐水位曲线呈现出肉眼可见的负相关。水位上涨RSRP下降水位下降RSRP回升。而高频段如Band 1的相关性则较弱且滞后。为什么我们分析低频信号波长长绕射能力强其传播路径可能更多依赖于经水面的反射路径。水位变化直接改变了这条反射路径的长度和反射点的性质水面粗糙度等从而显著影响接收信号强度。高频信号则可能更多依赖其他固定的散射体对水面变化不敏感。4.2.3 从观察到预测简单的线性模型也能工作基于这个发现我们构建了一个极其简单的特征集过去12小时内7个LTE载波的RSRP均值、方差、以及一些基础气象数据如温度、气压。然后我们用一个线性回归模型去预测未来10分钟的水位。结果令人惊讶在12小时的测试集上预测水位与声纳实测值的均方根误差RMSE仅为7.36厘米。这个精度对于许多区域性洪水预警应用已经具有参考价值。它证明了即使使用最粗糙的信号强度指标RSRP在复杂的NLOS环境下环境变化的信息依然被“编码”在了 ambient RF信号中并且可以通过机器学习模型被有效地“解码”出来。4.2.4 进阶走向更精细的感知当然我们并不满足于此。在后续的研究中我们向更深处探索使用更精细的特征我们尝试从LTE信号中提取始的CSI幅度和相位信息。通过高级的空时信号处理算法如空间谱估计我们成功从接收信号中分离出来自水面的反射分量并构建了联合多普勒-角度谱。这使得我们不仅能估计水位还能分析水流的表面流速。多源信号融合单一基站信号不稳定可能因网络优化而突变。我们正在尝试融合来自多个运营商、多个频段LTE/5G甚至Wi-Fi的信号利用其空间和频率分集效应来提升感知的鲁棒性和分辨率。物理信息驱动的机器学习纯数据驱动的黑箱模型泛化能力差。我们正在将电磁波传播的物理方程如水面反射模型作为约束嵌入到循环神经网络RNN中构建“物理信息神经网络”。这样模型在学习时不仅看数据还要遵守物理定律有望在未观测过的河流或天气条件下也能做出合理预测。5. 核心挑战与未来之路尽管前景广阔但将ISAC从实验室推向规模化应用还有几座大山需要翻越。以下是我在研究和项目落地中感触最深的几点5.1 弱视距与非视距场景下的人体感知现有大多数人体感知算法都强烈依赖一个稳定、强大的直射路径LOS作为参考。但在真实的室内复杂环境或利用室外蜂窝信号进行室内感知时LOS路径经常被遮挡甚至完全不存在。在只有非视距NLOS多径的情况下如何从一堆杂乱无章的反射信号中准确分离出微弱的、动态的人体反射信号是极大的挑战。这需要发展更强大的多径分辨和干扰抑制算法或许需要结合深度学习对复杂信道环境进行建模。5.2 模型泛化与部署适配问题这是一个非常现实的工程问题。你在实验室用特定品牌的Wi-Fi网卡、特定的天线布局、在某个房间训练出的活动识别模型换到另一个房间、另一款路由器性能就可能大幅下降。对于环境感知不同地区的土壤成分、植被覆盖、建筑布局千差万别一个地方的降雨-衰减模型很难直接用到另一个地方。我的思路是追求“特征泛化”而非“数据泛化”。与其收集海量数据去覆盖所有场景不如设计对硬件和环境不敏感的特征表示。例如无论系统带宽和载频如何人体运动的多普勒-时延-角度DDA点云的几何分布和运动模式是相对稳定的。我们可以尝试构建一个基于DDA点云抽象表示的预训练模型再针对新场景进行少量数据的微调Domain Adaptation。联邦学习Federated Learning也是一个有前景的方向可以在保护数据隐私的前提下利用分布在不同地点的设备协同训练一个全局模型。5.3 面向环境的任务对齐特征工程人体感知的特征微多普勒、相位周期相对直观。但环境感知需要我们从信号中提取出与特定物理过程如降雨衰减、土壤介电常数变化直接相关的特征。这要求研究者兼具无线通信和地球科学的知识。例如降雨感知需要关注信号衰减的动态斜率、链路不对称性并结合经验性的A-R关系模型。土壤湿度感知需要关注信号相位的时延变化、地表反射系数的变化。水位感知需要关注水面反射路径的相干性、多普勒展宽等。未来的方向是发展“物理信息特征提取”将领域知识如水文模型、电磁传播模型与深度学习特征提取网络相结合让模型学到的特征具有明确的物理意义从而提升可解释性和跨场景泛化能力。5.4 天线与硬件平台的适应性环境感知的部署平台可能是固定的基站也可能是无人机、车辆甚至可穿戴设备。这对天线提出了新要求需要可重构、宽频带、低功耗并且性能不能受平台姿态如无人机倾斜或环境如天线被雨淋湿的严重影响。新型天线技术如基于超表面的可编程天线、流体天线系统、漏波天线等提供了动态权衡感知与通信性能的可能。例如广义联合耦合器GJC矩阵天线就能以低功耗实现多波束生成非常适合需要同时进行多方向感知的ISAC节点。6. 写在最后从碎片化应用到统一感知层回顾ISAC的发展早期工作多是“打补丁”式的看到一个应用比如用手势控制电视就设计一套专门的信号处理流程。这导致了技术的碎片化。通过这篇梳理我希望传达一个核心观点尽管人体感知和环境感知在具体任务上差异巨大但其底层信号处理内核是统一的——都是通过解读无线信道受物理世界调制后产生的变化来反演状态。因此ISAC的终极形态不应是散落各处的“感知孤岛”而应成为嵌入未来6G网络基础设施中的一个统一感知层。这个感知层提供标准化的信号采集接口、统一的多维特征提取能力DDA点云、衰减统计量等、以及可插拔的推理算法模块。不同的感知应用人员计数、跌倒检测、降雨监测、洪水预警可以像手机APP一样运行在这个统一的基础之上按需调用底层的感知能力。这条路还很长需要通信工程师、信号处理专家、数据科学家乃至领域专家如气象学家、水文专家的紧密协作。但可以预见当我们的通信网络真正具备了“视觉”和“触觉”它将成为构建智慧城市、数字孪生和无处不在智能的基石。而我们今天在相位校准、特征提取、模型泛化上踩过的每一个坑都是在为那个万物皆可被“无线”感知的未来铺路。