【信息科学与工程学】【物理/化学和工程科学】【数学分析】第一百九十九篇 矢量分析和场论及高温合金——低空经济02
编号类型领域理论方法的逐步推理思考的数学表达式涵盖数学物理/数学化学的数学表达式及数字/数值和完整的求解过程和求解方程参数列表和参数说明和参数表达关联知识331数学模型低空飞行/协同控制多智能体强化学习集中式训练分布式执行每个智能体飞行器的观测矢量 oi输入到其策略网络 $\pi_i(\mathbf{a}_i\mathbf{o}i; \boldsymbol{\theta}i)输出动作\mathbf{a}i。全局奖励R_t由所有智能体共同获得。价值网络V(\mathbf{o}1, ..., \mathbf{o}N; \phi)评估全局状态价值。通过策略梯度\nabla{\boldsymbol{\theta}i} J \approx E[ \nabla{\boldsymbol{\theta}i} \log \pi_i(\mathbf{a}i\mathbf{o}i) A_t ]更新优势函数A_t R_t \gamma V(\mathbf{o}{t1}) - V(\mathbf{o}_t)$。用于训练多无人机协同任务如包围、搜索。332数学模型低空飞行/控制气动参数在线辨识递推最小二乘法飞行器动力学模型线性化为 yΦθe 其中 y为测量输出如加速度、角加速度Φ为回归矩阵由状态、控制输入构成θ为待辨识参数矢量如气动导数。递推公式θ^kθ^k−1Kk(yk−Φkθ^k−1) KkPk−1ΦkT(RΦkPk−1ΦkT)−1 Pk(I−KkΦk)Pk−1Q。用于自适应控制。y测量输出矢量。Φ回归矩阵由飞行状态和控制输入构成。θ待辨识的气动参数矢量。θ^kk时刻的参数估计值。Kk增益矩阵。Pk参数估计误差协方差矩阵。Q,R过程噪声和测量噪声协方差矩阵。参数辨识、递推最小二乘、系统辨识、自适应控制、飞行力学333数学模型低空飞行/任务规划分布式凸优化分布式梯度下降N个智能体协同求解 minx∑i1Nfi(x) 其中 fi为局部目标函数。每个智能体维护局部变量 xi 通过通信与邻居交换信息迭代更新xi(k1)∑j∈Niwijxj(k)−α∇fi(xi(k)) 其中 wij为权重满足 ∑jwij1 α为步长。在连通图下所有 xi收敛到共同的最优解。用于分布式任务分配、资源调度。fi(x)智能体 i的局部目标函数。xi智能体 i的局部决策变量矢量。Ni智能体 i的邻居集合。wij混合权重通常基于图拉普拉斯矩阵。α步长。∇fi局部目标函数的梯度。连通图保证信息在整个网络中传播。分布式优化、梯度下降、一致性、多智能体决策、资源分配334数学模型低空飞行/控制模仿学习行为克隆从专家演示数据集 D{(si,ai)}中学习策略 $\pi_\theta(\mathbf{a}\mathbf{s})。最小化损失L(\theta) \sum_i |\pi\theta(\mathbf{s}i) - \mathbf{a}_i|^2。∗∗逆强化学习∗∗从专家轨迹\tau_E中推断奖励函数R(\mathbf{s}, \mathbf{a}; \mathbf{w})的参数\mathbf{w}使得专家策略优于其他策略。通过最大熵逆强化学习P(\tau\mathbf{w}) \frac{1}{Z} \exp(R(\tau; \mathbf{w}))$ 最大化专家轨迹的似然。然后利用学到的奖励函数进行强化学习。335数学模型低空飞行/监控意图识别隐马尔可夫模型隐藏状态 qt∈{1,...,K}表示目标意图观测 ot为测量矢量如位置、速度。模型参数 λ(A,B,π) 其中 A为状态转移矩阵B为观测概率矩阵π为初始状态分布。给定观测序列 O1:T 用 Viterbi 算法解码最可能的意图序列 $\mathbf{q}{1:T}^* \arg\max{\mathbf{q}} P(\mathbf{q}_{1:T}\mathbf{O}_{1:T}, \lambda)$。可结合交互式多模型IMM跟踪多个可能的意图。qt时刻 t的隐藏意图状态。ot时刻 t的观测矢量。A状态转移概率矩阵$A{ij} P(q{t1}j336数学模型低空飞行/通信智能反射表面可重构智能表面信道IRS 由 N个可调反射单元组成反射系数 v[ejϕ1,...,ejϕN]T。基站到用户信道 hHRIHdiag(v)hBRhBU。优化 v以最大化信噪比 $\text{SNR} \mathbf{h}^H \mathbf{w}^2 / \sigma^2其中\mathbf{w}为基站波束赋形矢量。联合优化\mathbf{w}和\mathbf{v}受限于337数学模型低空飞行/导航语义 SLAM联合优化状态变量包含相机位姿 xc和语义地标 ls如物体中心、方向。观测包含特征点 zp和物体检测框 zb。后端优化最小化误差∑∥zp−πp(xc,lp)∥2∑∥zb−πb(xc,ls)∥2 其中 πb为物体投影模型。语义信息提供数据关联的鲁棒性如通过物体类别和高级理解。xc相机位姿矢量位置、姿态。ls,lp语义地标物体和特征点的三维位置矢量。zp,zb特征点和物体检测框的观测矢量。πp,πb特征点和物体的投影函数将三维点映射到图像。联合优化同时优化位姿、特征点、语义地标。物体检测提供语义观测如边界框、类别、位姿。语义SLAM、物体级地图、联合优化、目标检测、场景理解338数学模型低空飞行/通信博弈论功率控制非合作博弈N个用户飞行器竞争信道用户 i选择发射功率 pi最大化自身效用 ui(pi,p−i)log(1∑jipjhijσ2pihii)−cpi 其中 c为功率代价。纳什均衡满足对每个 i pi∗argmaxpiui(pi,p−i∗)。分布式迭代算法pi(k1)[c1−hii∑jipj(k)hijσ2]。pi用户 i的发射功率。p−i除用户 i外其他用户的功率矢量。hij从用户 j到用户 i的接收端的信道增益。ui用户 i的效用函数权衡速率和功耗。c功率代价系数。纳什均衡任何用户单方面改变策略都不能提高自身效用。[x]max(x,0)。博弈论、功率控制、非合作博弈、纳什均衡、分布式算法339数学模型低空飞行/控制自适应容错控制滑模观测器x^˙Ax^BuL(y−y^)ν y^Cx^ ν为不连续项用于估计故障。故障估计 f^ρsgn(ey) 其中 eyy−y^。控制器 uunom−Bf^补偿故障。需满足匹配条件故障在 B的列空间内。x^状态估计矢量。y,y^测量输出和估计输出矢量。ν滑模观测器的不连续注入项。f^故障估计矢量如执行器失效、卡死。ρ滑模增益大于故障上界。unom标称控制律。B控制矩阵的伪逆用于故障补偿。容错控制、滑模观测器、故障估计、故障补偿、鲁棒控制340数学模型低空飞行/路径规划快速轨迹生成最小加加速度轨迹在三维空间生成时间最优的平滑轨迹约束速度 vmax、加速度 amax、加加速度 jmax。将路径离散为 M个航点 pk 用 B 样条表示轨迹 r(t)∑piBi(t)。优化问题mint1,...,tMTλ∫∥r′′′(t)∥2dt 约束 ∥r′(t)∥≤vmax ∥r′′(t)∥≤amax ∥r′′′(t)∥≤jmax。转化为凸优化如二次规划求解。pk控制点位置矢量。Bi(t)B 样条基函数。T总时间。λ光滑性权重。vmax,amax,jmax最大速度、加速度、加加速度矢量约束。加加速度加速度的导数影响乘坐舒适性和执行器带宽。凸优化可高效求解全局最优解。轨迹优化、B样条、凸优化、微分平坦、时间最优341数学模型低空飞行/机器学习元学习模型无关元学习学习一个可快速适应新任务的初始化参数 θ。在元训练阶段从任务分布 p(T)中采样任务 Ti 每个任务有支持集 Disup和查询集 Diquery。内层适应用支持集计算适应后参数 θi′θ−α∇θLTi(fθ,Disup)。外层更新用查询集损失 ∑iLTi(fθi′,Diquery)更新 θ。θ元学习器如神经网络的初始参数。Ti第 i个任务如一种新的障碍物环境。Disup,Diquery任务 i的支持集和查询集。θi′任务 i的适应后参数。α内层学习率。LTi任务 i的损失函数。任务分布元训练任务应覆盖元测试时可能遇到的任务。元学习、小样本学习、MAML、任务适应、快速学习342数学模型低空飞行/仿真多保真度优化协同克里金模型融合高保真精确但耗时模型 fh(x)和低保真快速但粗糙模型 fl(x)。假设 fh(x)ρfl(x)δ(x) 其中 ρ为缩放因子δ为差异过程建模为高斯过程。用少量高保真样本和较多低保真样本训练协同克里金模型 f^h(x)。用于飞行器设计优化在优化循环中用 f^h代理高保真仿真。x设计变量矢量。fh,fl高保真和低保真模型输出。ρ标量关联两种模型。δ(x)高斯过程建模两种模型间的差异。f^h(x)融合后的协同克里金预测模型。高斯过程用均值和协方差函数描述空间相关随机场。代理模型近似计算昂贵的真实模型用于优化。多保真度建模、协同克里金、代理模型、设计优化、计算效率343数学模型低空飞行/监控数字孪生预测物理信息神经网络在数字孪生中用神经网络 u(x,t;θ)近似物理场如流场、温度场。损失函数包含数据项 Ldata∑∥u(xi,ti)−ui∥2和物理项 Lphy∑∥N[u](xj,tj)∥2 其中 N为控制偏微分方程算子如纳维-斯托克斯。通过训练网络预测未来状态用于飞行器在复杂环境中的性能预测。u(x,t;θ)物理场近似神经网络输入为空间坐标 x和时间 t 参数 θ。Ldata与测量数据匹配的损失项。Lphy与物理定律匹配的损失项残差为零。N偏微分方程算子如 N[u]∂t∂u(u⋅∇)u−ν∇2u∇p。PINN物理信息神经网络将物理规律编码为损失函数约束。数字孪生、物理信息神经网络、偏微分方程、流场预测、实时仿真344数学模型低空飞行/协同集群涌现控制Vicsek模型N个自驱动粒子飞行器位置 ri 速度方向 θi。更新规则θi(tΔt)⟨θj(t)⟩j∈Niηξi(t) 其中 ⟨⋅⟩表示邻居平均方向η为噪声幅度ξi为随机扰动。位置更新 ri(tΔt)ri(t)v0n^(θi(t))Δt。在低噪声下系统涌现出同步运动。用于模拟和设计无人机集群的群体行为。ri粒子 i的位置矢量。θi粒子 i的速度方向角。Ni粒子 i的邻居集合距离小于 R。⟨θj⟩邻居方向角的平均。η噪声强度。ξi(t)[−π,π]上的均匀随机噪声。v0粒子恒定速度大小。n^(θ)方向角 θ对应的单位矢量。群体智能、自组织、Vicsek模型、同步、集群控制345数学模型低空飞行/通信无人机基站部署覆盖最大化无人机作为空中基站位置 r 高度 h。地面用户 k的接收功率 PkPtGtGr/Lk 路径损耗 LkLfsηNLOS 视距概率 PLOS(θk)1/(1ae−b(θk−a)) θk为仰角。优化问题maxr,h∑kI(SINRk≥γ) 其中 SINRkPk/(Ikσ2)。可用遗传算法或梯度法求解。r,h无人机基站的水平位置矢量和高度。Pt发射功率。Gt,Gr发射和接收天线增益。Lk到用户 k的路径损耗。θk仰角θkarctan(h/∥r−uk∥)。PLOS视距概率取决于环境。I(⋅)指示函数条件满足为1否则0。γ信干噪比阈值。无人机基站、覆盖优化、路径损耗模型、视距概率、资源分配346数学模型低空飞行/感知偏振成像斯托克斯矢量描述光的偏振状态S[I,Q,U,V]T 其中 I为总强度Q为水平与垂直偏振强度差U为 45∘与 −45∘偏振差V为右旋与左旋圆偏振差。由多个偏振方向图像计算。用于材料分类、去雾、目标增强。例如金属和电介质表面的偏振特性不同可用于检测伪装目标。S斯托克斯矢量描述光束的偏振状态。I,Q,U,V斯托克斯参数I2≥Q2U2V2。偏振度DoPQ2U2V2/I。偏振角α21arctan(U/Q)。偏振成像获取每个像素的斯托克斯矢量。材料分类利用不同材料的偏振特性差异。偏振光学、斯托克斯矢量、偏振度、目标检测、材料识别347数学模型低空飞行/控制迭代学习控制更新律针对重复性任务如周期性巡检利用前一次执行的经验修正当前周期的控制输入。设 k为迭代次数t为时间。控制律 uk1(t)uk(t)Lek(t1) 其中 ek(t)yd(t)−yk(t)为跟踪误差L为学习增益矩阵。收敛条件∥I−PL∥1 其中 P为系统脉冲响应矩阵。用于提高轨迹跟踪精度。uk(t)第 k次迭代在时刻 t的控制输入。yk(t),yd(t)第 k次迭代的输出和期望输出。ek(t)跟踪误差。L学习增益矩阵可时变。迭代收敛随着迭代次数增加误差趋近于零。重复性任务每个迭代周期执行相同的期望轨迹。迭代学习控制、重复控制、学习增益、收敛条件、轨迹跟踪348数学模型低空飞行/路径规划基于采样的动力学规划RRT*在 RRT 基础上通过重布线优化路径代价。扩展新节点 xnew后在其附近邻域 Xnear内寻找使从 xinit到 xnew代价更小的父节点并重布线邻域内其他节点检查以 xnew为父节点是否能降低其代价。代价函数 c(x,x′)考虑控制努力、时间等。在概率完备性基础上渐进最优。xnew新生成的节点。Xnearxnew的邻域节点集合通常以半径为 r的球定义。c(x,x′)从节点 x到 x′的代价通常为控制输入积分或时间。重布线为邻域内节点重新选择父节点如果新路径代价更低。渐进最优随着采样点增加解的成本以概率1收敛到最优。运动规划、RRT*、渐进最优、重布线、基于采样349数学模型低空飞行/监控分布式假设检验共识创新每个节点有局部观测 zi 假设 H0和 H1。节点计算局部对数似然比 $L_i \log \frac{p(\mathbf{z}_iH_1)}{p(\mathbf{z}_iH_0)}。分布式更新\lambda_i(t1) \sum{j \in N_i} w{ij} \lambda_j(t) \gamma (L_i - \lambda_i(t))其中\lambda_i为局部决策统计量\gamma为步长。当\lambda_i$ 超过阈值则做出决策。用于分布式检测事件如非法入侵。350数学模型低空飞行/通信可重构智能表面辅助定位定位CRB目标位置 η[x,y,z]T 测量矢量 z如TOA、AOA、RSS 其费雪信息矩阵 $J(\boldsymbol{\eta}) E[ (\frac{\partial \ln p(\mathbf{z}\boldsymbol{\eta})}{\partial \boldsymbol{\eta}}) (\frac{\partial \ln p(\mathbf{z}\boldsymbol{\eta})}{\partial \boldsymbol{\eta}})^T ]。位置估计误差协方差满足C \ge J^{-1}。通过优化RIS相位\mathbf{v}最大化J$ 的某个标量函数如迹、行列式以提高定位精度。351数学模型低空飞行/控制事件触发控制触发条件不连续地更新控制输入仅在满足触发条件时进行。定义误差 e(t)x^(t)−x(t) 其中 x^为上次触发时的状态。触发条件 ∥e(t)∥≥σ∥x(t)∥或基于 Lyapunov 函数变化。控制律 u(t)Kx^(tk) t∈[tk,tk1)。可减少通信或计算负担。x(t)当前状态矢量。x^(t)在最近触发时刻 tk采样的状态矢量。e(t)状态误差矢量e(t)x^(t)−x(t)。σ触发阈值参数σ0。tk第 k次触发时刻。事件触发仅在需要时更新控制减少不必要的更新。K状态反馈增益矩阵。事件触发控制、采样控制、资源节约、网络化控制系统352数学模型低空飞行/监控生成对抗网络异常检测GAN训练生成器 G(z;θg)从噪声 z生成数据判别器 D(x;θd)判断输入 x来自真实数据还是生成器。对抗训练minGmaxDV(D,G)Ex∼pdata[logD(x)]Ez∼pz[log(1−D(G(z)))]。异常检测训练 GAN 仅用正常数据。测试时计算重构误差 ∥x−G(z∗)∥ 其中 z∗argminz∥x−G(z)∥2。误差大则判定为异常。G,D生成器和判别器神经网络参数为 θg,θd。z噪声输入矢量通常来自简单分布如高斯分布。pdata,pz真实数据分布和噪声分布。V(D,G)价值函数判别器试图最大化生成器试图最小化。重构误差测试数据与生成器重构数据之间的差异。异常分数基于重构误差定义用于检测异常。生成对抗网络、异常检测、无监督学习、重构误差、数据生成353数学模型低空飞行/通信非正交多址接入功率域 NOMA基站向多个用户发送叠加信号 x∑k1Kpksk 其中 pk为功率分配sk为用户 k的数据流。接收信号 ykhkTxnk。用户采用连续干扰消除先解码强用户信号减去后再解码自身信号。优化功率分配 p[p1,...,pK]T以最大化和速率或保证公平性。x基站发射信号矢量。pk分配给用户 k的功率。sk用户 k的数据符号矢量。hk基站到用户 k的信道矢量。yk用户 k的接收信号。SIC连续干扰消除按信道增益强弱顺序解码和消除干扰。和速率所有用户速率之和∑klog(1SINRk)。非正交多址接入、功率分配、连续干扰消除、多用户通信、和速率优化354数学模型低空飞行/协同任务分配匈牙利算法分配 N个任务给 N个智能体代价矩阵 C 元素 cij为智能体 i执行任务 j的代价。寻找置换 π最小化总代价 ∑ici,π(i)。步骤1) 行归约、列归约2) 用最少数目的线覆盖所有零元素3) 若线数小于 N 调整矩阵返回步骤24) 从零元素中确定最优分配。复杂度 O(N3)。C代价矩阵C∈RN×N。cij智能体 i执行任务 j的代价。π分配方案一个置换π(i)表示分配给智能体 i的任务。行归约每行减去该行最小值。列归约每列减去该列最小值。覆盖线用水平或垂直线覆盖矩阵中的所有零。最优分配总代价最小的完美匹配。任务分配、匈牙利算法、组合优化、指派问题、多智能体355数学模型低空飞行/控制预设性能控制性能函数定义误差 e(t)的包络 e(t)需满足 −ρi(t)ei(t)ρi(t) 其中 ρi(t)(ρi0−ρi∞)e−litρi∞为预设性能函数ρi0ρi∞0 li0。引入变换 zT(e,ρ) 例如 zi21log(1−ei/ρiei/ρi1)。设计控制器使 z稳定则 e自动满足预设性能。e(t)跟踪误差矢量。ρi(t)第 i个误差分量的预设性能函数控制瞬态和稳态边界。ρi0,ρi∞,li性能函数参数初始值、稳态值、收敛速率。z变换后的误差矢量无约束。T(⋅)变换函数将受限误差映射到无约束空间。预设性能预先指定误差的收敛速度、超调量和稳态精度。预设性能控制、误差变换、瞬态性能、约束控制、鲁棒控制356数学模型低空飞行/导航多普勒速度日志声学多普勒计程仪向海底发射多个波束测量回波的多普勒频移。波束方向单位矢量 k^i 测量频移 fd,iλ2(v−vc)⋅k^i 其中 v为飞行器速度vc为海流速度。至少三个非共面波束可解算 v−vc。结合姿态信息转换到导航坐标系积分得到相对位移用于水下或近水面导航。k^i第 i个声波束在载体坐标系中的单位方向矢量。fd,i第 i个波束测量的多普勒频移。v飞行器相对于海底的速度矢量。vc海流速度矢量假设在测量周期内恒定。λ声波波长。DVL多普勒速度日志提供对地速度矢量。波束几何通常配置 Janus 配置四个波束两两对称。多普勒计程仪、水下导航、速度测量、波束形成、相对位移357数学模型低空飞行/监控时空背景建模高斯混合模型每个像素的颜色值 xt用 K个高斯分布建模p(xt)∑k1Kwk,tN(xt;μk,t,Σk,t)。在线更新对每个新像素计算与现有高斯的匹配若匹配如马氏距离小于阈值则更新该高斯的参数wk,t(1−α)wk,t−1α μk,t(1−ρ)μk,t−1ρxt Σk,t(1−ρ)Σk,t−1ρ(xt−μk,t)(xt−μk,t)T。否则创建新高斯。前景检测若像素不与任何背景高斯匹配则为前景。xt时刻 t的像素颜色矢量如 RGB。wk,t第 k个高斯分量的权重。μk,t,Σk,t第 k个高斯分量的均值和协方差矩阵。K高斯分量个数通常 3-5。α学习率控制背景模型更新速度。ρ参数更新率ραη(xt;μk,Σk)。前景/背景根据像素与背景模型的匹配程度判断。背景减除、高斯混合模型、运动检测、视频监控、在线学习358数学模型低空飞行/通信全双工通信自干扰消除全双工节点同时同频收发接收信号 y(t)hsxs(t)hSIxSI(t)n(t) 其中 hSIxSI为自干扰。通过模拟域、数字域抵消。模拟域估计信道 hSI 生成抵消信号 −h^SIxSI。数字域进一步消除残留干扰。自干扰信道估计可用已知的发射信号 xSI训练。剩余自干扰功率决定全双工增益。y(t)接收信号。hs,xs(t)期望信号的复信道增益和发射信号。hSI,xSI(t)自干扰信道的复增益和自身发射信号。n(t)噪声。h^SI自干扰信道的估计值。自干扰消除在模拟和数字域减去估计的自干扰信号。全双工增益理论上比半双工频谱效率提高一倍实际受限于消除能力。全双工通信、自干扰消除、信道估计、同时同频收发、频谱效率359数学模型低空飞行/制导强化学习制导深度 Q 网络状态 s包含相对位置、速度等动作 a为离散的加速度方向。Q 网络 Q(s,a;θ)近似动作价值函数。训练目标yrγmaxa′Q(s′,a′;θ−) 损失 L(θ)E[(y−Q(s,a;θ))2]。用经验回放和固定目标网络稳定训练。训练后制导策略 π(s)argmaxaQ(s,a)。s,a状态矢量和动作矢量。Q(s,a;θ)动作价值函数参数为 θ的神经网络近似。r立即奖励如基于脱靶量或控制努力。γ折扣因子。y目标 Q 值结合奖励和下一状态的最大 Q 值。θ−目标网络参数定期从主网络复制。经验回放存储转移 (s,a,r,s′)在缓冲池中随机采样训练。深度强化学习、DQN、价值函数、经验回放、制导策略360数学模型低空飞行/协同同步定位与建图分布式 SLAM多个智能体各自建图通过相遇或通信交换信息融合成一致地图。关键挑战是数据关联和相对位姿估计。可用分布式优化方法如分布式 Gauss-Seidel每个智能体优化自身变量位姿、地标固定邻居变量交替进行。全局代价函数分解为局部代价之和通过一致性约束关联。xi智能体 i的变量位姿、观测到的地标。fi(xi)智能体 i的局部代价函数基于其自身的观测。fij(xi,xj)智能体 i和 j之间的约束代价来自共同观测或相对测量。分布式优化每个智能体只优化自身变量通过通信协商达成全局一致。地图融合将局部地图对齐到全局坐标系。数据关联识别不同智能体观测到的同一地标。分布式 SLAM、多机器人 SLAM、地图融合、分布式优化、协同感知