
主编:孙圣和
创刊:1980年
ISSN:1002-7300
CN:11-2175/TN
国内邮发代号:2-369
- 浏览排行
- 引用排行
- 下载排行
2025, 48(6):1-9.
摘要:针对服务机器人在动态行人环境下难以准确理解行人意图、避障路径选择不合理的问题,提出一种行人开放度舒适模型。首先,通过扩展传统的二维对称高斯函数为非对称高斯函数,更精确地建模行人的动态舒适空间;其次,结合行人头部姿态和行人开放度特征,增强机器人对行人运动意图和社交互动关系的理解能力,从而提升导航的友好性和合理性。最后,通过仿真和真实环境下的实验对比验证,使用行人开放度舒适模型的服务机器人在路径选择上更加优化,能够主动避开行人群组的互动空间,不仅减少了与行人产生冲突的可能性,还增强了导航的平滑性和自然性,在不同场景的仿真环境中,运动时间分别缩短了1.15和2.58 s;在不同场景的真实环境中,运动时间分别缩短了1.14、2.30和0.12 s。实验结果表明,该模型能够有效使机器人适应复杂行人动态场景,提高避障效率,显著提升机器人在人机共融场景中的社交友好性和导航质量。
2025, 48(6):10-19.
摘要:为解决传统虚拟同步发电机控制下光伏并网时出现的功率和频率的波动和输出电压中谐波含量的问题,在并网中引入了VSG转动惯量自适应控制方法和一种随机激励的调制方案。在VSG控制中引入了带虚拟阻抗的电压控制环路,并结合基于准比例谐振控制器的电流控制环路,构建了一种适用于光伏发电系统并网逆变器的VSG控制策略。该策略下,仿真结果A、B、C三相电压的THD分别下降了15.17%、15.37%、13.10%,有功功率超调量下降了7.42%,实验结果A、B、C三相电压的THD分别降低了1.92%、4.61%、2.44%,频率稳定在50.07 Hz。仿真和实验结果表明了所提方法能有效抑制功率和频率的震荡和降低输出电压的THD,验证了所提方法的可行性。
2025, 48(6):20-27.
摘要:在物流机器人运输流程中,路径规划是核心环节,面临路径不够平滑及算法搜索效率低下的挑战。A*算法作为广泛应用的全局路径规划方法,在应用于物流机器人时存在无法有效实现路径平滑等问题。为此,对传统A*算法进行了改进,通过动态加权处理启发函数,并利用Floyd算法去除路径中的冗余点,同时引入安全距离机制以防碰撞。此外,还对路径进行了平滑优化,以更好地适应物流机器人的实际移动需求。MATLAB仿真结果显示,改进后的A*算法相比传统算法在转折点数量上平均减少了58.5%,路径长度缩短了3.19%,遍历点数降低了59.9%。进一步结合DWA算法进行局部路径规划,实现了避障功能。通过仿真和实车实验验证了该融合算法的有效性。
2025, 48(6):28-37.
摘要:为了解决交通标志小目标检测所存在的漏检、误检和准确率低等问题,本文提出了一种小目标交通标志检测模型YOLOv8-Faster-Ghost-GAM。该算法首先在主干网络的最后一个C2f模块中引入了全局注意力机制(GAM),增强关键特征并抑制无关信息,显著提升了目标检测中的小目标和复杂场景下的识别能力;其次,将主干网络中的每个C2f模块替换为Fasternet,以减少模型参数量,并将普通卷积替换为幻影卷积Ghost,使用低廉的线性变换较少计算量;最后,采用WiOU损失函数,有效提升对低质量样本的识别,精度提升了1.6%,召回率提升了3.2%,证明了所作的改进的有效性。
2025, 48(6):38-44.
摘要:大多数现有的动态同时定位和地图构建(SLAM)算法简单地移除动态对象,导致帮助系统自身定位和导航的动态对象运动信息的丢失,对于复杂和不断变化的工业环境具有局限性。本研究提出了一种改进的目标跟踪的视觉SLAM算法,在进行定位的同时,获得更准确的目标位姿估计。该算法使用背景点进行自身定位,利用细化的光流信息,减少噪点的影响,进行准确的定位,然后结合多项式残差的场景流信息,获得准确的动态目标感知结果,降低算法对目标位姿估计的误差。最后,在公开的KITTI Tracking数据集和真实场景上对所提算法进行了评估。实验结果显示,在公共数据集上,所提算法定位效果平均旋转误差(RPER)为0.027°,平均位移误差(RPET)为0.069 m。目标位姿估计平均旋转误差为0.686 97°,平均位移误差0.103 50 m,具有更好的自定位和动态目标跟踪性能。在真实场景中,所提算法也表现出良好的定位与跟踪性能。
2025, 48(6):45-52.
摘要:针对辐射场视觉SLAM算法的位姿估计误差大以及与IMU融合过程中的鲁棒性问题,本文提出了一种基于紧耦合IMU的辐射场视觉惯性SLAM算法。该算法使用改进的预积分模块实现紧耦合框架,改进的初始化策略来处理鲁棒性问题,结合辐射场损失联合优化位姿和零偏。将本文的改进算法分别应用于NICE-SLAM和MonoGS的定位模块,并在IMU-RGBD数据集OpenLORIS上进行了实验测试,紧耦合模块对定位精度的提升最大分别为34.3%和14.8%。与MM3DGS相比,本算法具备更高的鲁棒性,可有效提高定位精度,对于提升辐射场SLAM性能具有较好的泛化能力。
2025, 48(6):53-64.
摘要:针对轴承外圈表面缺陷检测中存在的缺陷尺度变化大、纹理相似与分布密集等问题,以及现有检测模型结构复杂、计算量与检测精度差的挑战,提出一种轻量高效的轴承缺陷检测算法DWA-YOLO。首先,设计了一种即插即用的轻量化双瓶颈结构模块DBM,以有效降低模型复杂度并强化模型对于不同尺度特征的提取能力。其次,在网络主干中引入多尺度特性的小波卷积WTConv作为下采样算子,通过扩大模型的感受野与利用多尺度分析特性来捕捉图像的细节和纹理信息,增强了模型对纹理与噪声的抗干扰能力和上下文信息理解能力,从而提升了整体检测精度。此外,本文设计了联合损失函数Alpha-MPDIoU,利用幂变换机制提高边界框的定位精度与解决检测多框问题。最后,采用辅助检测头训练策略,加快模型的收敛速度并增强了检测能力。实验结果表明,DWA-YOLO相比基线模型在mAP精度上提升3.5%,模型参数量为2.6 M,计算量为7.4 GFLOPs。改进后的模型不仅提高轴承缺陷识别能力,还降低网络复杂度,更加适用于工业现场对轴承外圈表面缺陷的检测需求。
2025, 48(6):65-72.
摘要:针对传统三矢量模型预测控制策略存在的矢量选择计算量大、各矢量作用时间计算复杂与存在较大共模电压的问题,提出了多矢量模型预测电流控制策略。首先针对较大共模电压问题,提出利用有效电压矢量合成代替传统零矢量,同时利用电压矢量选择表与电压矢量位置角快速选择矢量,减少矢量选择计算量,其次采用电压误差占空比的方式简化计算各矢量作用时间,最后通过仿真与实物平台验证其有效性,证明了该控制算法在提高系统稳态性能的同时抑制了较大共模电压对于电机的影响。
2025, 48(6):73-82.
摘要:针对Informed-RRT*算法在路径规划中存在随机性大、无效节点多和收敛效率低等问题,提出了一种改进的Informed-RRT*算法。该算法通过全局采样优化和自适应步长提升节点利用率;采用概率偏置的双向搜索及重选父节点的方法找到初始路径,为后续的迭代优化提供较好的初始值;在进行椭圆迭代时加入贪心策略以减少无用节点,最后对路径回溯优化减少无用节点提升路径的平直度。本文设计障碍物复杂程度和地图尺寸两种变量,对比了改进算法和Informed-RRT*算法在四种场景下的表现,统计20次实验结果,改进算法的路径节点数量减少28.6%~64.3%,路径长度降低0.3%~2.7%。结果表明,与Informed-RRT*算法相比改进算法可以提升节点的利用率,在相同迭代次数下能得到更短的路径并显著降低路径节点数量。
2025, 48(6):83-89.
摘要:声呐检测技术目前已被广泛应用于水下结构检测,受水下复杂环境影响,声呐图像通常存在分辨率低、噪声干扰严重、边缘细节模糊、纹理信息差等实质问题。针对这些问题,本文提出一种基于改进各向异性引导滤波和维纳滤波的融合去噪算法。算法首先在传统AnisGF上引入局部结构相似性指数作为权重因子,实现在去噪的同时保留更多的边缘结构信息;其次,利用贝叶斯优化方法确定维纳滤波的SSIM权重,最后融合AnisGF与维纳滤波方法对声呐图像进行联合去噪。实验结果表明,本文所提出的算法相比传统算法在均方误差、峰值信噪比和结构相似性指数上有9.5%、4%和10%的提升。
2025, 48(6):90-98.
摘要:频谱感知是缓解频谱资源短缺的关键技术之一,其中智能频谱感知已成为当前研究的热点方向。针对现有频谱感知方法对信号特征提取不充分以及在低信噪比下频谱感知效果不佳的问题,提出一种由Inception模块、双向门控循环单元、时间注意力机制和全连接层网络组成的频谱感知混合模型。首先,Inception模块对接收到的I/Q信号进行多尺度空间特征的提取;然后,采用双向门控循环单元获取信号的时间序列特征,并通过时间注意力机制强化重要时序特征;最后,全连接层网络将提取到的特征映射到频谱状态的分类空间完成分类识别。实验结果表明,本文方法与多种现有频谱感知方法相比显著提升了感知性能,模型的整体检测准确率达到84.55%,当信噪比为-20 dB时,该方法的感知误差为24%;且对多种调制类型的无线电信号具有较好的适应性。所提方法无需依赖任何先验信息,在低信噪比和复杂无线电环境下展现出较强的鲁棒性,实现了感知性能与模型复杂度的有效平衡,为智能频谱感知提供了一种新的解决方案。
2025, 48(6):99-105.
摘要:智能反射面(IRS)是未来6G的关键技术之一,然而在多用户系统中,系统的计算复杂度随反射单元数量和用户数量增加而大幅度增加,系统的优化设计面临着极大挑战。为此,本文提出了一种基于多用户反射单元选择的低计算复杂传输速率最大化算法。该算法根据用户的速率需求和信道状况,选择匹配的反射单元,综合考虑相移设置和基站波束赋形,进行联合优化,建立了一个用户速率最大化问题。由于该优化问题变量之间存在高度耦合。因此,将原始问题划分为两个子问题进行求解,使用半正定松弛得到近似解。仿真结果表明,本文算法可以大幅降低系统的计算复杂度同时提高下行传输速率,相比与无IRS辅助系统,传输速率提升约50%;与随机相位IRS相比,传输速率提升约30%。
2025, 48(6):106-113.
摘要:为研究不同引导方式对精细运动想象皮层活跃度的影响,提出了一种结合视觉和听觉引导的精细运动想象方法,旨在探索不同引导方式在精细运动想象中对大脑皮层活跃度的增强效果及其规律。设计了一种针对腕、肘、肩3个关节的精细运动想象实验范式,包括简单视觉引导、听觉引导、动态视觉引导以及动态视觉结合听觉引导方式。通过时域、频域上ERD和ERS的指标作为分析测度,评估大脑皮层活跃度效果。利用能量分布和脑网络功能连接观察大脑空间特征分布,分析不同引导方式下大脑皮层活跃程度。实验结果表明,不同引导方式中动态视觉结合听觉引导下,ERD和ERS的变化幅度显著高于其他引导方式。此外,大脑皮层的活跃区域在视觉和听觉结合引导下更加广泛,且在多个区域表现出较强的同步性和去同步性。相比于简单视觉引导、听觉引导、以及单一的动态视觉引导方式,动态视觉结合听觉引导方式显著增强了精细运动想象中大脑皮层的活跃度。该方法为精细运动想象训练提供了一种新的引导手段,有助于提高训练效果和康复效率,具有潜在的实际应用价值。
2025, 48(6):114-120.
摘要:北斗卫星同步系统中,一般使用基于FPGA的方案,使用ARM单核系统在调度过程中容易导致资源竞争和实时响应偏差的问题,但是ARM在处理业务逻辑、浮点运算等方面优于FPGA。本文提出了一种基于ARM处理器的北斗1PPS同步和守时的实现方案,采用最小二乘法结合滑动窗口实现同步计算、通过阶段性增长机制实现守时计算,并提出一种延迟修正算法,解决了信号处理中因中断冲突造成的周期边界采集偏差。当系统检测到数据即将溢出时,该算法通过推迟记录上升沿信号的周期值并进行修正。实验结果表明,该算法能够实现10-8 s级别的同步精度,证明了其在高精度时间同步中的可用性。
2025, 48(6):121-129.
摘要:针对当前图像修复领域所面临的高计算复杂度以及在生成结构合理且细节丰富的图像方面的局限,提出了一种融合多尺度分层特征与全局局部协同Transformer的图像修复模型。首先提出多尺度分层特征融合模块,以实现深层特征与浅层特征细节上的有效融合,在扩大感受野的同时减少关键信息丢失情况。其次提出用于全局推理的全局-局部协同Transformer模块,它通过集成矩形窗口注意力机制和局部前馈神经网络,在降低计算复杂度的同时,提高模型对全局上下文信息的宏观理解和对局部细节特征的微观捕捉能力,增强图像的整体一致性。实验在CelebA-HQ和Places2数据集上进行了验证,在处理40%~50%掩码时,所提方法与常用的修复方法对比,PSNR平均提高了0.26~6.25 dB,SSIM平均提升了1.4%~19%,L1平均下降了0.2%~5.66%。实验证明,所提方法修复后的图像在视觉上具有更加真实和自然的效果,进一步验证了该方法的有效性。
2025, 48(6):130-142.
摘要:针对遥感图像目标排列密集、尺度差异大以及背景复杂造成的检测虚警率高、检测精度低、漏检和误检的问题,提出了一种基于YOLOv8n的遥感图像检测算法YOLOv8-EP。首先,构建特征聚焦扩散金字塔网络(FFDPN),通过并行深度卷积捕获多尺度信息,同时加入扩散机制将特征信息扩散到各个检测尺度增强特征交互。设计轻量化的任务动态调整检测头(TADD),通过特征共享和并行任务处理,提高检测的定位和分类性能。其次,引入SimAM注意力机制捕捉图像中关键信息,增加模型感受野。最后,引入Inner-CIoU损失函数改善低质量图像对网络梯度的不利影响,加速模型收敛。在NWPU VHR-10数据集和RSOD数据集上的实验结果表明,YOLOv8-EP的mAP 分别达到97.6%和 97.9%,参数量下降13%,相比于YOLOv8n基线网络提升了2.2%和1.5%,能够满足工业部署的要求,整体达到良好的检测性能。
2025, 48(6):143-151.
摘要:冠状动脉的分割有利于医生快速诊断心血管疾病,针对冠状动脉复杂结构和其它血管组织干扰带来的难分割,造成大量碎片分割的问题,保证模型对不同形态结构冠脉分割的自适应能力,提出了一种新的三维冠状动脉分割网络模型CA-SegNet。融合CNN和Transformer为骨干网络,利用其优势和互补性,充分提取冠状动脉的局部和全局特征。通过提出多尺度特征交互模块,提取冠脉多尺度特征的同时进行特征通道之间的交互。在解码阶段,提出注意力加权特征融合模块,分别从空间和通道的角度对特征进行加权融合,使模型更加关注冠状动脉区域。实验结果表明,提出的模型在Dice相似系数、Recall、Precision和HD95值分别达到了81.96%、84.24%、80.11%和14.94,优于当前流行的分割网络模型,验证了CA.SegNet的有效性。
2025, 48(6):152-160.
摘要:工业场景下,缺陷工件的获取和标注非常困难,对工件缺陷检测带来极大的阻碍。通过少量真实缺陷样本生成大量缺陷样本,极大地缓解了缺陷样本稀缺的问题,但是现有的缺陷生成方法普遍存在生成缺陷样本的表观真实性差和与掩模对齐性差的问题。针对现有问题,文中提出了一种新颖的可控扩散模型AnomalyAlign来生成与掩膜高度对齐的逼真工业缺陷图像。AnomalyAlign在继承文生图大模型Stable Diffusion的先验知识基础上,提出了强语义对齐文本提示生成器,通过该生成器获取语义层面上与真实图像更加对齐的文本提示,促进了模型的收敛;同时,AnomalyAlign还提出了一种缺陷对齐损失来提高生成的缺陷图像和掩模之间的对齐性。通过MVTec-AD上的大量实验验证,AnomalyAlign可以生成与掩模高度对齐的逼真且多样化的缺陷图像,并有效地提升了下游缺陷检测任务的性能。
2025, 48(6):161-170.
摘要:在为保护配电网安全而进行的树障清理工程中,人工核算砍伐量的方式面临核算结果主观性强、管理困难等问题,而现有算法精度较低,错检、漏检多,鲁棒性较差,因此,提出了用于输电走廊树障砍伐量核算的树桩检测算法。针对配电网清障场景复杂、树干与树桩难以区分导致砍伐量核算不准确的问题,设计了基于Context Guide Block的特征提取模块;引入RepGFPN与Dysample结构对颈部网络进行优化,有效融合环境上下文语义信息与树桩局部细节特征;随后,算法设计了基于LW-SEAM的树桩检测头,优化了遮挡情况下的检测效果。模型在测试集上的P、R和mAP50指标分别提升到了85.5%、76.4%、80.4%,在复杂背景和遮挡情况下对树桩检测有较好的检测效果,能够为实现智能化工程核算提供技术参考。
2025, 48(6):171-178.
摘要:既有办公建筑(EOB)安装光伏发电(PVG)系统是环保绿电措施之一,但PVG波动性不利于EOB平稳用电,EOB-PVG功率预测非常重要。本文提出一种EOB-PVG功率预测的麻雀搜索算法长短期记忆(SSA-LSTM)方法,对采集得到环境、发电数据集进行多重插补+主成分分析(MI+PCA)预处理并划分数据集,设计LSTM神经网络预测模型,采用SSA对神经网络超参数自动寻优,实现准确预测。实验选取某EOB实际环境、发电数据,预处理后数据集主成分累计贡献率>95%,设计3项评价指标评估预测性能,对比实验结果表明,SSA-LSTM比LSTM、SSA-TCN具有更高预测精度、更强拟合能力,能够较好地准确预测EOB-PVG功率,有助于后续实现EOB智慧用能管控任务。
2025, 48(6):179-187.
摘要:耐张线夹在输电线路中起到连接导线、运载电流作用,其压接质量直接关系电网安全有效运行。针对耐张线夹压接DR图像缺陷检测存在操作复杂、人员要求高等问题,提出应用VAUNet分割技术的DR图像缺陷评定方法。首先研究面向耐张线夹DR图像缺陷的语义分割模型VA-UNet,选用图像特征提取分析能力显著的VGG16作为主干网络,通过融入空间金字塔池化结构ASPP增强多尺度特征融合,引入混合损失函数进而加快模型收敛、提高分割精确度;然后,研究结合模型预测分割结果与相关定量分析的等级评定方法,实现耐张线夹压接DR缺陷危害严重性评估,为后续线夹处理工作提供参考依据。基于数据集准备与试验评价指标分析,开展相关消融实验表明VA-UNet指标mIoU、mPA分别达到84.14%、91.58%,较原始模型显著提高;耐张线夹压接DR缺陷危害严重性评估实验表明方法具有科学性、实用性。
2025, 48(6):188-195.
摘要:在语义通信中,图像语义信息处理高度依赖于计算复杂度高的卷积神经网络,尤其在处理高分辨率图像时,对计算性能要求更高,这对语义通信在边缘场景中的应用提出了巨大挑战。为此,本文提出了一种基于FPGA的语义信息处理加速器,创新性地将卷积神经网络编码器和rANS编码融合在同一硬件加速器中。具体而言,加速器采用融合乘累加器的脉动阵列架构、循环分块策略和双缓存结构,以充分利用FPGA的并行计算能力与片上存储资源,提升数据传输效率与计算性能。每个处理单元集成多个乘累加单元,可在每个时钟周期完成两个INT8乘法并局部累加。最终,对输出特征采用rANS进行8路并行编码,进一步压缩特征数据。实验结果表明,在ZCU104平台上,本设计在处理1080P图像时达到300.5 GOPS的吞吐量,能效比为66.77 GOPS/W,处理速度比Intel CPU提升约6倍,比ARM CPU提升约58倍。与其他FPGA加速器相比,BRAM效率分别提升约730%、40%和63%,能效比分别提升约802%、60%和3%,DSP效率分别提升约476%、70%和133%。所提出的加速器在性能上具有显著优势,可高效处理图像语义信息,具有广泛的实际应用意义。
2025, 48(6):196-196.
摘要:
主编:孙圣和
创刊:1980年
ISSN:1002-7300
CN:11-2175/TN
国内邮发代号:2-369