文章

《武汉工程大学学报》 2021年06期 670-674 出版日期：2021-12-31 ISSN:1674-2869 CN:42-1779/TQ

P300信号分类的多样本融合支持向量机算法

脑电信号是大脑细胞器进行生命活动所产生的一种电活动，其产生的方式主要分为诱发脑电信号以及自发脑电信号两种方式。诱发脑电信号是指因外界某种刺激使大脑电位产生变化从而形成的一种脑电活动。脑电信号由人体皮层内的大量神经元突触后电位同步总和而形成［1］，是许多神经元共同活动的结果，包含了大量与人体生理和疾病有关的信息，为康复治疗提供了有效的帮助。在临床医学领域中，脑电信号不仅作为某些脑疾病的临床诊断依据，同时还作为一种辅助治疗手段帮助一些脑疾病进行康复治疗。在工程应用中，利用脑电信号实现的脑机接口，为瘫痪病人的某些功能重建提供了一种有效的方法。因此在康复医疗领域的实际运用中，对脑电信号的深入研究具有重要意义。基于事件相关电位的脑机接口通常使用的是P300信号， P300信号是由人脑在受到小概率刺激后300 ms左右出现的一个正向波峰［2］。P300电位作为一种内源性成分，通常与刺激物理特性无关，而与知觉或认知心理活动有关，并与记忆、智能、注意等加工过程密切相关。基于P300的脑机接口优点在于它具有稳定的锁时性和高时间精度特性，研究人员无需复杂训练就能够获得较高的识别准确率。对脑机接口所获得的电信号进行P300电位的自动化识别也成为了脑电信号研究领域的关键研究之一［3］。本文针对脑机接口所获得的电位波形进行了P300电位的分类识别研究，采用了多样本融合的支持向量机（support vector machine， SVM）算法对脑电信号进行分类识别并与单样本的SVM算法进行了比较。1　实验部分1.1　实验方法P300信号无需对受试者进行预先训练，只需要通过视觉刺激的方式使其自发产生。实验设计如表1所示，该实验可设计为一个6行6列的字符矩阵。首先，提示受试者注视屏幕上的“目标字符”，假设出现的“目标字符”为“A” ，在受试者注视“目标字符”的过程中，当给定的“目标字符”所在行或列闪烁时，P300电位就会在受试者的脑电信号中出现；相反当其他行或列闪烁时，P300电位则不会出现在受试者的脑电信号中。其次，字符矩阵每次将以随机的顺序闪烁字符矩阵的一行或一列，每次闪烁80 ms，两次闪烁之间间隔80 ms。如若所有行和列均闪烁过1次，则本轮实验结束，并开始下一轮试验，该实验共重复5轮。脑电信号在采集过程中使用了20个通道，采集频率为250 Hz。表1　行/列的标识符Tab. 1　Row/column identifier[标识符行列号第7列第8列第9列第10列第11列第12列第1行 A B C D E F 第2行 G H I J K L 第3行 M N O P Q R 第4行 S T U V W X 第5行 Y Z 1 2 3 4 第6行 5 6 7 8 9 0 ]P300电位分类识别的目的即为判断某行或列闪烁后，脑电信号中是否出现了P300电位。该实验本质上是一个二分类问题，因此非常适合使用SVM算法解决。1.2　实验数据采集研究数据来自于5名健康成年被试者，平均年龄为20岁，均采用前述的实验方法，每个字符都进行5轮矩阵闪烁实验，因此每个字符闪烁实验都含有60次闪烁数据。本研究共收集了12个已给出目标字符的训练用数据，以及10个未给出目标字符的待识别目标字符数据用于测试，每个字符闪烁实验的数据为：[D=d1, d2, …, dNT] 其中[di=t1, t2, …t20]即第i次采样得到的20个通道的脑电数据，[i=1,2,…,N]，每个字符闪烁实验中[N≈3 000]，即每个字符闪烁实验大约进行了3 000次采样。进行信号采集时，设备需要设置2个电极：参考电极和接地电极。运用该采集方法可以准确的获得作用电极与参考电极两者之间的差值。该实验所用到的20个通道与数据特征对应关系如表2所示，各通道在信号采集设备上的位置如图1所示。表2　通道与数据特征对应关系Tab. 2　Correspondence between channels and features[特征序号通道名称特征序号通道名称 1 Fz 11 CP5 2 F3 12 CP6 3 F4 13 Pz 4 Cz 14 P3 5 C3 15 P4 6 C4 16 P7 7 T7 17 P8 8 T8 18 Oz 9 CP3 19 O1 10 CP4 20 O2 ]图1　脑机接口采集设备中各通道位置示意图Fig. 1　Position of each channel in brain-computer interface acquisition device1.3　数据预处理数据中的噪声和其他质量因素都会直接影响算法的识别效率，有必要对原始数据进项预处理操作，主要过程如图2所示。首先采用8阶的切比雪夫低通滤波器对每个脑电信号采集通道的信号都进行阈值为10 Hz的低通滤波处理，仅保留频率低于10 Hz的部分。图2　数据预处理流程Fig. 2　Flowchart of data preprocessing接着考虑到P300电位一般在刺激之后的300 ms左右产生［4］，为了尽可能地包含P300电位的产生时间段，本研究从数据中提取出持续时间800 ms的单次试验数据段，对应 200个采样点，根据每次试验对应的字符，将该字符对应的行列的试验数据段标记为含有P300信号的正类数据（类别标记为+1），其他实验数据段标记为不含P300信号的负类数据（类别标记为-1）。数据通过切比雪夫滤波后需要进行降采样，对每条实验数据段进行间隔为5个的降采样，这样单次实验的采样点数降为了40个。同时由于每轮实验含有对应字符和行列数仅占总行列数的1/5，即正类数据与负类数据样本数量比值为1∶5，类别数量的不平衡会极大地影响到分类模型的训练和误差计算［5］，因此要对含有P300信号的数据样本进行数量上扩充，具体扩充方法利用了降采样过程针对含有P300信号的正类进行起始索引的不同的5次间隔降采样，这样就得到5条含有P300数据的原样本的过采样数据。上述过程能够获得类别比例为1∶1的两类数据，避免了类别不平衡的问题。然后针对每个试验数据段所包含的采样数据，按最大最小归一化处理，使用线性化的方法将原始数据转换到［0， 1］的范围内。最后为了有效地突出P300信号和提高分类性能，针对每个待确定字符的5轮测试数据，按照行列序号对每个行列对应的5轮采样数据分别进行了叠加求平均的操作，获得每个待确定字符测试数据中12个不同行列对应脑电波平均波形，并且也进行了可视化展示，如图3所示。从图3中可以发现有P300信号的平均波形在300~500 ms之间，有明显的正向波峰，符合P300信号的特征。经过上述操作后，单个字符测试试验中的60条有效数据合并为12条，12个目标字符的实验数据最终对应144条训练数据，10个目标字符的检测数据对应120条检测数据。[0 100 200 300 400 500 600 700 800t / ms][0.80.70.60.50.40.30.2][Amplitude / μm][P300No P300]图3　有P300信号和无P300信号的平均波形对比Fig. 3　Comparison of average waveforms with P300 signal and without P300 signal1.4　多样本融合的SVM算法SVM作为监督学习方法的一种，通常用于对数据进行二元分类［6］。其基本思想是利用训练集，在样本空间中找到能够分开不同样本集的划分超平面［7］。但在实际问题中所遇到的样本通常是线性不可分的，对于该问题通常的解决方法为将样本的原始空间映射到更高维的空间中，使样本集在高维空间内实现线性可分［8］。在线性不可分的问题中，找到合适的核函数对样本分类准确性起到决定性的作用［9］。对于本研究所使用的数据集[T=x1, y1,][x2, y2,?,xN, yN]，其中 [xi=d1,d2,…,d40T]为训练数据，每条数据共含有40个采样点，每个采样点 [di=t1,t2,…,t20]包含20个通道，[yi={+1,-1}]，针对每个被试者[N=144]，并将数据[xi]输入到SVM时展平为含有800个特征的一维向量。在求解过程中，需要选取合适的核函数[Kxi?xj]以及合适的惩罚系数[C]，构造并求解最优化问题［10］ [minα12i=1Nj=1NαiαjyiyjKxi?xj-i=1Nαi] [ s.t. i=1Naiyi=0] [0≤ai≤C, i=1, 2, ?, N]求得一个最优解 [α=α1, α2, ?, αNT]。选择[α]的一个正分量[0<αj>

[S1 S2 S3 S4 S5 S*][1.00.80.60.40.20][Accuracy][1.00.80.60.40.20][Accuracy][S1 S2 S3 S4 S5 S*][1.00.80.60.40.20][Accuracy][S1 S2 S3 S4 S5 S*][1.00.80.60.40.20][Accuracy][S1 S2 S3 S4 S5 S*][5 rounds][4 rounds][3 rounds][2 rounds]从图4中可以发现，本研究所提出的多样本融合的支持向量机分类模型相比单一的支持向量机算法在准确率上有了显著的提高。另外在逐步减少检测数据轮次的过程中，模型预测结果逐渐变差。针对本研究所涉及到的数据，在保证模型预测效果的前提下，为了尽可能减少数据量，可以仅使用4轮实验数据来进行分析。3　结　论针对P300电位对应字符的预测，本质是二分类问题，在考虑多种分类方法之后，选择了基于线性核函数的支持向量机模型进行P300电位的分类识别。本文提出的模型优点在于对数据做了充分的预处理，使用过采样解决了P300电位分类识别中的类别不平衡导致模型过拟合的问题，并结合了多名受试者的预测结果进行多样本融合来获得最终一致性结果，其预测字符的准确率很高，并且有较高的扩展性和通用性，应用前景广泛。

undefined