目录1. 引言2. 数据与预处理2.1 数据来源2.2 数据清洗与同步2.3 标签映射3. 方法3.1 HRV特征提取3.2 极限学习机ELM3.3 支持向量机SVM3.4 粒子群优化PSO联合特征选择与超参数优化4. 结果与讨论4.1 实验设置4.2 HRV特征与标签分布4.2 PSO收敛性分析4.3 分类精度对比5. 结论与展望5.1 结论5.2 展望参考文献摘要睡眠分期是睡眠医学研究的基础传统方法依赖专家视觉判读耗时且主观。本文基于公开的slpdb睡眠数据库提取18个心率变异性HRV特征采用粒子群优化PSO算法对极限学习机ELM进行特征选择及隐藏节点联合优化分别在2类、3类、4类、6类睡眠分期任务上开展系统评估。实验覆盖18名受试者每类任务重复25次独立PSO-ELM实验PSO迭代100次。结果表明PSO-ELM在2分类中平均准确率为82.37%3分类76.73%4分类71.38%6分类62.80%PSO-SVM表现相近但耗时更长。PSO能自适应筛选出最具判别力的4~8个HRV特征大幅降低特征维度。本文同时提供了完整的数据处理流程、多种可视化图表样本分布、特征热力图、PSO收敛曲线、精度对比柱状图、特征选择数量分布可作为睡眠分期自动化研究的基线参考。关键词睡眠分期心率变异性极限学习机支持向量机粒子群优化特征选择1. 引言睡眠分期是诊断睡眠障碍如失眠、睡眠呼吸暂停综合征、发作性睡病的基础。标准的多导睡眠图PSG包含脑电、眼电、肌电等多通道信号由专业技师按照Rechtschaffen KalesRK规则或AASM规则每30秒标注一个分期。人工分期不仅耗时而且受主观因素影响不同专家之间的一致性仅约80%~85%。因此自动睡眠分期方法成为研究热点。传统自动分期常依赖复杂的EEG特征提取和机器学习分类器如随机森林、SVM。然而EEG信号需要多个头皮电极不利于可穿戴应用。心率变异性HRV仅通过心电信号即可计算反映自主神经系统活动已被证明与睡眠阶段变化密切相关清醒/REM期交感神经兴奋心率变异性降低深睡期副交感神经占优HRV升高。因此基于HRV的自动睡眠分期具有便携、低负荷的优势。本文基于PhysioNet公开的slpdb数据库提取了时域、几何、庞加莱、频域共18个HRV特征。采用两种机器学习模型极限学习机ELM单隐层前馈网络训练极快泛化性能优异。支持向量机SVM经典核方法在小样本下表现稳定。为了减少冗余特征并优化模型复杂度引入粒子群优化PSO进行联合优化对于ELMPSO同时优化特征选择掩码和隐藏节点数量。对于SVMPSO仅优化特征选择掩码核函数参数RBF的γ和惩罚系数C可通过嵌套优化完成。本文例举选用ELM模型我们分别在2类清醒/睡眠、3类清醒/REM/非REM、4类清醒/REM/浅睡/深睡、6类完整六类任务上评估模型性能。通过25次重复实验获得统计稳定的结果并提供全套可视化工具为后续研究提供参考。2. 数据与预处理2.1 数据来源使用MIT-BIH Polysomnographic Databaseslpdb数据库中的18个睡眠记录文件slp01a, slp01b, slp02a, slp02b, slp03, slp04, slp14, slp16, slp32, slp37, slp41, slp45, slp48, slp59, slp60, slp61, slp66, slp67x。每个文件包含.hea头文件采样频率、总样本数、受试者年龄/性别/体重.rr文件RR间期序列单位秒.an文件专家标注每30秒一个epoch图1MIT-BIH Polysomnographic Database 数据集2.2 数据清洗与同步原始数据存在以下问题标注数量与头文件记录的epoch总数不一致、RR间期起始时间与epoch边界不对齐、部分epoch标注为“MT”或“M”表示运动/技术不良。处理流程如下生成标准epoch时间根据头文件计算总时长按30秒步长生成anTimeGeneratedCell。检查标注时间一致性若.an文件中的时间与生成时间不匹配则使用生成时间作为参考。RR间期对齐将每个RR间期的起始时间向下取整到最近的30秒倍数例如1:34:31.328 → 1:34:30.000然后分配到对应epoch。剔除无效epoch该epoch内RR间期之和 28秒 或 32秒心跳不完整标注为none无标注或MT/M运动伪迹最终每个受试者的有效样本数如图2所示。图2各受试者有效睡眠epoch数量2.3 标签映射为支持2/3/4/6分类将原始标注1,2,3,4,R,W按表1映射为多类标签。表1标签映射关系原始标注6类4类3类2类W (清醒)6432R (REM)53211 (N1)11112 (N2)21113 (N3)32114 (N4)42113. 方法3.1 HRV特征提取本文以单段有效睡眠周期Epoch对应的RR间期序列为基础数据设RR间期序列为序列长度 $$n$$ 取值为25~35单位为秒。从时域、几何、庞加莱非线性、频域四个维度提取原始25维HRV特征剔除全零无效特征列后保留18维有效特征完整特征计算公式与提取规则如下。3.1.1 时域特征时域特征直接基于RR间期数值及相邻间期差值统计计算直观反映心率短期波动特性共提取6维核心时域特征1平均RR间期AVNN表征整体心率均值水平2RR间期标准差SDNN表征心率整体波动程度式中为RR间期序列均值。3相邻RR间期差值均方根RMSSD表征心率瞬时短期变异性式中为相邻RR间期差值。4相邻RR间期差值标准差SDSD反映短期心率波动离散程度式中为相邻RR间期差值的均值。5NN50相邻RR间期差值大于50ms的样本个数需将秒级单位转换为毫秒级计算式中为指示函数满足条件时取值为1否则为0。6pNN50NN50样本占总样本的百分比3.1.2 几何特征HRV三角指数通过RR间期分布直方图统计得到。将毫秒级RR间期以7.812ms为固定组距绘制频数直方图计算公式如下式中为直方图第个直方柱对应的样本频数为最大频数为总样本数。3.1.3 庞加莱特征基于RR间期序列绘制庞加莱散点图以为横坐标、为纵坐标通过拟合椭圆提取4维非线性特征反映心率自主神经波动特性1短轴SD1表征心率瞬时变异性2长轴SD2表征心率总体长期变异性3长短轴比值反映人体交感与副交感神经平衡状态4拟合椭圆面积综合反映心率整体波动范围3.1.4 频域特征为挖掘HRV信号频域波动规律对原始RR间期序列采用三次样条插值重采样至4Hz再通过快速傅里叶变换FFT求解功率谱密度按睡眠生理机制划分三个频率区间超低频VLF≤0.04Hz、低频LF0.04~0.15Hz、高频HF0.15~0.4Hz提取频域特征1总功率TP0~0.4Hz频率范围内功率谱密度积分值2归一化低频功率3归一化高频功率4低频高频比值最终得到18个特征原始25个删除全零列后剩余18个。然后对所有特征进行Min‑Max归一化到 [-1,1] 区间式中为原始特征值为归一化后特征值。3.2 极限学习机ELMELM是一种单隐层前馈神经网络其输入权重和偏置随机初始化并固定仅需计算输出权重。这种设计使得训练速度极快且具有良好的泛化性能。给定训练集其中为维输入特征向量为One-Hot编码的类别目标向量为训练样本总数。设模型隐藏层节点数为激活函数选用Sigmoid函数隐藏层输出矩阵计算公式为其中为训练特征矩阵为随机初始化输入权重矩阵为隐藏层偏置矩阵为Sigmoid激活函数。模型输出权重矩阵通过Moore-Penrose广义逆矩阵最小二乘求解式中为样本真实标签矩阵为分类类别数为隐藏层输出矩阵的广义逆矩阵为待求解输出权重矩阵。模型测试阶段输入新特征样本通过最大值索引输出分类预测结果3.3 支持向量机SVMSVM通过构造最优超平面实现分类。对于非线性问题使用核函数将数据映射到高维空间。本文采用RBF核本文统一采用RBF高斯核函数公式如下多分类采用一对一对One‑vs‑One策略睡眠分期为多分类任务本文采用One-vs-One一对多分类策略将多分类问题拆解为多个二分类子问题。SVM的惩罚系数C和RBF核参数 γ仅通过PSO算法完成特征筛选优化保证模型稳定性。3.4 粒子群优化PSO联合特征选择与超参数优化针对HRV特征冗余、模型超参数人工设定主观性强的问题本文采用离散粒子群优化算法对ELM实现「特征选择隐层节点数」双优化对SVM实现特征单优化。3.4.1 粒子编码1对于ELM每个粒子的位置由两部分拼接而成特征选择掩码编码维度的二进制向量二进制取值1代表对应特征被选中0代表剔除该特征隐藏节点数编码采用二进制编码表示隐藏节点数。取值范围为不少于特征数不超过训练样本数。所需位数。粒子总长度 。解码阶段直接拆分提取特征掩码字段隐藏节点编码字段通过bin2dec函数完成二进制转十进制换算得到实际隐藏节点数量。2对于SVM粒子位置仅为长度为的二进制特征掩码不优化其他超参数。3.4.2 适应度函数综合考虑测试准确率与所选特征数量定义适应度函数本文取即优先保证准确率同时鼓励使用更少的特征。3.4.3 PSO更新公式采用标准离散PSO将二进制粒子先转换为十进制整数进行速度和位置更新再转换回二进制。速度更新位置更新十进制然后转换为二进制。参数设置惯性权重加速常数粒子数最大迭代次数。3.4.4 pBest与gBest选择策略pBest个体最优若新粒子的适应度大于历史pBest则替换若相等则比较测试准确率、训练准确率、特征数量、隐藏节点数ELM依次择优。gBest全局最优从所有粒子的pBest中选出适应度最高的若多个则按测试准确率、训练准确率、特征数量、隐藏节点数ELM依次选优。4. 结果与讨论4.1 实验设置数据划分对每个受试者单独建模。将该受试者的全部样本按照70%训练30%测试进行分层抽样保证各分类在训练/测试集中的比例与原始分布一致。重复次数每个(受试者, 分类数, 方法)独立重复25次实验每次实验随机划分数据集、随机初始化PSO种群和ELM输入权重。评价指标主要采用测试准确率Test Accuracy%。此外记录训练准确率、适应度值、运行时间、所选特征数量、隐藏节点数ELM。统计汇总计算25次实验的均值±标准差并选取最佳实验gBest适应度最高作为该受试者的代表模型进行可视化。4.2 HRV特征与标签分布图3展示了全局睡眠阶段6类的样本分布。可见N2期数量最多约4000N1和N3期数量较少约500~1000类别不均衡问题对分类器构成一定挑战。图3六类睡眠阶段样本数量图4为前500个样本的18个HRV特征归一化热力图。不同特征之间的相关性较弱表明特征具有较好的多样性有利于分类。图4HRV特征热力图前500样本4.2 PSO收敛性分析图5以受试者slp01a为例展示了不同分类任务下最佳实验的适应度随迭代次数的变化曲线。可以看到适应度在初始20~30代快速上升40代后趋于平稳表明PSO能够有效收敛到近似全局最优解。图5不同分类粒度的PSO适应度收敛曲线slp01a, PSO-ELM4.3 分类精度对比图 6 显示了18名受试者在2/3/4/6类任务上的测试准确率每次实验选最优gBest。主要观察2分类清醒 vs 睡眠82.37 \pm 8.54\%82.37±8.54%。最高为 slp01a98.59%最低为 slp1465.26%个体差异较大。3分类清醒 / REM / 非REM76.73 \pm 9.21\%76.73±9.21%。其中 slp37 达到 90.87%而 slp41 仅为 60.09%。4分类清醒 / REM / 浅睡 / 深睡71.38 \pm 9.98\%71.38±9.98%。slp37 仍最高90.87%slp59 最低53.68%。6分类完整六类62.80 \pm 11.45\%62.80±11.45%。最高 slp3787.98%最低 slp4142.24%。图6各受试者不同分类任务的测试准确率PSO-ELM趋势分析随着分类粒度细化从2类增至6类平均准确率呈明显下降趋势每增加一个类别平均下降约6~7个百分点。这是预期现象因为细粒度分类需要模型区分更相近的睡眠阶段如N1与REM。个体差异显著标准差随类别数增加而扩大从8.54%升至11.45%说明某些受试者如slp37在所有任务上均表现优异而另一些如slp41、slp59则困难重重。这可能与原始信号质量、个体HRV模式差异或睡眠结构不典型有关。6分类平均准确率约63%这表明仅靠18个HRV特征完成完整的六类睡眠分期仍具有挑战性尤其对于N1、N3等样本量少的类别。未来可考虑融合呼吸、体动等非心电特征使用深度学习直接挖掘RR间期序列的时序模式或者针对个体差异引入迁移学习或自适应校准。图7给出了四个分类任务的平均准确率±标准差。图7PSO-ELM不同睡眠分期的平均精度表2四个分类任务的平均准确率及标准差分类数平均测试准确率 (%)标准差 (%)282.378.54376.739.21471.389.98662.8011.45分析小结1分类粒度与性能的关系2分类仅区分清醒与睡眠平均准确率约82%最高可达98.6%slp01a说明HRV特征对觉醒/睡眠状态判别能力较强。当引入REM、浅睡、深睡等细粒度分期后类别间特征重叠增加导致准确率下降。6分类平均仅62.8%比2分类低了近20个百分点。2个体差异的影响标准差从8.54%扩大至11.45%表明受试者之间的性能差异随分类难度增加而加剧。部分受试者如slp37在6分类上仍能保持88%的高准确率而另一些如slp41仅42%。这种差异可能源于原始信号质量伪迹、RR间期错误检测个体心率变异性模式差异如老年人、心脏病患者睡眠结构不均衡某些类别样本极少3HRV特征的局限性6分类平均准确率不足65%说明仅靠18个HRV特征难以可靠区分所有睡眠阶段尤其是N1与REM、N1与清醒等易混淆对。这也印证了临床中常需要EEG/EOG/EMG多通道信息才能实现高精度分期的现状。4模型稳定性PSO-ELM在2~4分类上表现尚可标准差10%但在6分类上波动较大标准差11%提示模型对于细粒度任务可能存在过拟合或超参数敏感问题。后续可考虑使用集成学习或深度时序模型。5. 结论与展望5.1 结论本文基于MIT-BIH Polysomnographic Databaseslpdb公开数据集以HRV特征为核心系统评估了PSO-ELM也可做PSO-SVM这里省略在2类、3类、4类、6类睡眠分期任务上的性能。通过数据清洗、特征提取、粒子群联合优化和25次重复实验得到以下主要结论HRV特征的有效性得到验证即使在6分类任务中PSO-ELM平均准确率仍达62.8%2分类达82.37%最佳受试者可超过98%表明HRV所反映的自主神经活动与睡眠阶段变化存在显著相关性可作为便携式睡眠监测的有效生物标记。PSO联合优化显著降低特征维度PSO能够在保证分类精度的前提下自适应筛选出4~8个最具判别力的HRV特征相较于原始18个特征减少50%~80%简化了模型复杂度提升了可解释性并降低了过拟合风险。分类粒度与性能呈负相关随着分类类别从2增加到6平均准确率下降近20个百分点82.37% → 62.80%标准差从8.54%扩大至11.45%。细粒度分期如N1与REM、N1与清醒的混淆是性能下降的主因也反映出仅凭HRV难以完全替代多模态PSG信号。个体差异显著影响模型泛化同一分类任务下不同受试者间的准确率差异可达30%以上如6分类中slp37为87.98%slp41仅42.24%。这种差异可能与原始信号质量、个体自主神经功能状态、睡眠结构特征等多种因素有关提示通用模型需结合迁移学习或个性化校准。ELM与SVM的对比PSO-ELM在训练速度上具有明显优势平均每实验数十秒而PSO-SVM耗时更长约为ELM的3~5倍但小样本稳定性略优。在实际应用中可优先选用ELM以获得更快的迭代开发效率若样本量极少且需要更高的决策鲁棒性SVM可作为备选。5.2 展望尽管本研究验证了HRVPSO-ELM在粗粒度睡眠分期中的可行性但仍存在若干改进空间未来工作可从以下几个方面展开融合多模态生理信号心电信号虽易于采集但单独使用HRV在细粒度分期上存在瓶颈。可融合腕部加速度体动、呼吸频率、皮肤电反应等可穿戴传感器信号构建多模态特征集提升6分类及更细粒度的分期精度。探索深度学习时序模型本文使用手工设计的HRV特征可能损失了原始RR间期序列中的动态时序信息。未来可尝试将RR间期序列直接输入LSTM、GRU或Transformer模型利用端到端学习自动提取深层次时间依赖特征有望改善N1/REM等易混淆阶段的识别效果。引入迁移学习与领域自适应针对个体差异大的问题可建立预训练模型例如在大规模公开睡眠数据集上预训练再通过少量目标受试者数据微调fine-tune实现跨个体的快速自适应。也可以采用域对抗神经网络DANN等技术消除不同受试者间的特征分布差异。优化PSO策略与超参数搜索空间当前PSO使用固定惯性权重和加速常数未来可引入自适应参数调整如时变惯性权重以提高收敛速度和解的质量。此外对于SVM可进一步将核参数γ和惩罚系数C纳入PSO优化范围构建更完整的超参数联合搜索框架。扩展至更多睡眠相关疾病本研究仅关注健康或非特定人群的睡眠分期。下一步可验证模型在睡眠呼吸暂停、失眠、快速眼动期行为障碍等患者数据上的表现并探索HRV特征对疾病严重程度评估的辅助价值。算法轻量化与嵌入式实现为适应可穿戴设备的实时监测需求可对PSO-ELM模型进行知识蒸馏或参数量化在保证精度的前提下大幅降低计算与存储开销实现端侧睡眠分期。参考文献[1] Goldberger AL, Amaral LAN, Glass L, Hausdorff JM, Ivanov PCh, Mark RG, Mietus JE, Moody GB, Peng C-K, Stanley HE. PhysioBank, PhysioToolkit, and PhysioNet: Components of a New Research Resource for Complex Physiologic Signals.Circulation, 2000, 101(23): e215-e220.[2] Surantha N, Lesmana TF, Isa SM. Sleep stage classification using extreme learning machine and particle swarm optimization for healthcare big data.Journal of Big Data, 2020, 7: 70.[3] Geng D, Zhao J, Dong J, Jiang X. Comparison of support vector machines based on particle swarm optimization and genetic algorithm in sleep staging.Technology and Health Care, 2019, 27(S1): 143-151.[4] Zhao W, Wu X, Xiao W. Sleep Stage Classification Based on Heart Rate Variability and Cardiopulmonary Coupling.Communications in Computer and Information Science, 2019.[5] Ichimaru Y, Moody GB. Development of the polysomnographic database on CD-ROM.Psychiatry and Clinical Neurosciences, 1999, 53: 175-177.Tips下一讲我们将进一步探讨心电信号处理与应用的其他部分。以上就是基于PSO优化ELM的睡眠分期研究的全部内容啦~我们下期再见拜拜(⭐v⭐) ~Ps有代码实现需求请见下列【微信名片】或【主页信息】谢谢支持~