1

标题:基于视觉跟踪的激光指示转台闭环控制方法

引文格式:陈诗雨,王霖,刘峰,等.基于视觉跟踪的激光指示转台闭环控制方法[J].机电工程技术,2025,54(06):1-6+57.

作者:陈诗雨;王霖;刘峰;王向军

作者单位:天津大学精密测试技术及仪器全国重点实验室;天津大学微光机电系统技术教育部重点实验室

基金项目:国家自然科学基金(51575388)

关键词:模型预测控制;激光指示转台;目标跟踪;视觉伺服控制

摘要:针对基于视觉跟踪的便携式激光指示转台的动态目标指示问题,提出了一种基于模型预测控制(Model Predictive Control,MPC)的视觉伺服闭环控制方法。首先,利用图像雅可比矩阵构建激光指示转台预测模型,并将其离散化处理。为了解决MPC在实际转台控制中准确度较低、波动较大的问题,构建MPC的增量式预测方程,并对输入量和输入变化量施加了约束,通过设计一个包含输出误差、输入变化量以及最终输出误差加权平方和的代价函数,并在给定约束条件下求解,实现了对激光指示转台的视觉伺服控制。为验证所提出方法的有效性,搭建了一个基于视觉的便携式二轴转台,并进行实验验证。实验结果表明,对静态目标,重复指向精度达0.017°;在缩比实验中,对1km处速度不超过75km/h的目标,指向误差控制在0.08°以内。实验结果证明了该方法的有效性,为便携式激光指示转台的实现提供了理论依据。

 

2

标题:基于激光振镜的视觉检测缺陷确定方法

引文格式:麦伟浩,吕文阁,唐文艳.基于激光振镜的视觉检测缺陷确定方法[J].机电工程技术,2025,54(06):7-10+107.

作者:麦伟浩;吕文阁;唐文艳

作者单位:广东工业大学机电工程学院

基金项目:教育部产学协同育人项目(220600405274221)

关键词:激光振镜;机器视觉;疑似缺陷;缺陷确定

摘要:针对疑似缺陷的判断问题,提出了一种结合机器视觉与激光振镜的缺陷确定方法。对检测系统进行系统标定,获取振镜偏转角与像素坐标之间的映射关系,利用图像处理算法对物体疑似缺陷进行预定位,结合检测系统标定信息使激光振镜自动扫描疑似缺陷位置,通过工业相机采集扫描区域图像,利用Steger算法完成光条纹中心提取,对光条纹中心进行RANSAC直线拟合并计算光条纹中心相邻像素点之间的梯度和曲率,根据光条纹中心与拟合直线的距离并分析其平顺程度完成缺陷确定。实验结果表明,在铝板、刨花板、纸板等不同表面材质的缺陷检测中,多个样本组的Kappa系数超过0.98,缺陷判断准确率达到97.03%。

 

3

标题:基于改进中值滤波算法的拉索表面缺陷图像降噪方法研究

引文格式:张跃,殷红.基于改进中值滤波算法的拉索表面缺陷图像降噪方法研究[J].机电工程技术,2025,54(06):11-15.

作者:张跃;殷红

作者单位:兰州交通大学机电工程学院

基金项目:甘肃省自然科学基金(23JRRA907)

关键词:改进中值滤波;图像降噪;拉索表面缺陷

摘要:针对传统中值滤波算法在去除拉索表面缺陷图像噪声时,存在降噪效果不佳、耗时较长,导致无法准确检测拉索表面缺陷的问题,提出一种改进中值滤波算法。首先,检测图像中的极值噪声点,取其周围像素均值进行替换。其次,设置滤波窗口,计算滤波窗口的均值和每个像素的绝对值差值,通过绝对值差值寻找窗口中值。最后,移动滤波窗口,比较进入窗口的像素值和移除窗口的像素值,像素灰度值相同,则中值不变;若不同,确定新的窗口中值。通过改进中值滤波、中值滤波和均值滤波对兰州银滩黄河大桥拉索表面漆层脱落缺陷图像进行降噪处理。结果表明,在不同噪声浓度下,改进中值滤波相较于其他两种降噪算法,处理后图像PSNR值提高了3.47~5.9,降噪时间缩短了0.41~0.48 s,所提方法能够有效地去除图像中的噪声,保留更多的拉索图像细节信息,且处理时间较短。

 

4

标题:融合多重注意力及高阶特征的绝缘子缺陷检测方法

引文格式:严锴,曾子豪,邓文娟,等.融合多重注意力及高阶特征的绝缘子缺陷检测方法[J].机电工程技术,2025,54(06):16-22.

作者:严锴;曾子豪;邓文娟;汪志成;黄奖华;周书民

作者单位:东华理工大学江西省新能源工艺及装备工程技术中心;深圳市锦嘉电子有限公司基金项目:江西省自然科学基金重点项目(20232ACB202004);江西省技术创新引导类项目(20212BDH80008)

关键词:绝缘子;多重注意力机制;高阶特征融合;目标检测;YOLOv8

摘要:针对绝缘子缺陷图像目标分布较分散且特征不明显、检测精度较低等问题,提出一种基于改进YOLOv8的绝缘子缺陷图像检测算法模型(Highly Efficient Insulator and Defect Detector,HIEDet)。首先设计了一个主干特征提取网络,在特征图大的部分使用双层路由注意力机制,保持全局建模能力,在特征图小的部分使用高效梯度流多尺度注意力,通过分组和多尺度并行子网络来捕捉全局和局部的空间依赖关系,加强网络模型检测性能。然后设计了一个高阶联合特征分发机制网络,缓解了PANet结构导致的特征信息丢失问题,同时增强了模型的多尺度特征融合能力。最后,使用SIoU作为HIEDet网络的回归损失函数,帮助训练收敛过程和效果,提高模型在绝缘子缺陷图像检测任务上的检测性能。实验结果验证,改进后的HIEDet算法模型相较于YOLOv8在绝缘子缺陷数据集上mAP@50提高了2.2%,mAP提高了1.6%,表明提出的HIEDet算法模型在绝缘子及缺陷检测任务上的有效性。

 

5

标题:基于深度展开ISTA网络的动态路径选择的压缩感知图像恢复

引文格式:任重伟,张雨晨.基于深度展开ISTA网络的动态路径选择的压缩感知图像恢复[J].机电工程技术,2025,54(06):23-27+50.

作者:任重伟;张雨晨

作者单位:西藏大学信息与科技学院;西藏大学

关键词:深度展开网络;动态路径选择;压缩感知;图像恢复

摘要:由于传统压缩感知图像恢复技术在处理大规模数据时面临计算效率低下及资源消耗过大的困难,基于深度学习框架,研究了深度展开网络(Deep Unfolding Networks,DUNs)作为解决这些问题的新途径,它通过将传统优化算法的迭代过程转化为神经网络的层级结构,从而实现了高效、准确的图像重建。但考虑到图像恢复过程中网络不同阶段对计算资源的需求差异,提出了一个动态路径选择网络DPCS (Dynamic Path Control Select)DUNs的方法,包括了动态梯度下降控制单元模块和动态近端映射路径选择模块以适应不同的图像特征。在set11数据集上验证网络的有效性和优越性,实验结果表明该网络在不同压缩比的条件下PSNR和SSMI值都优于现阶段其他网络的恢复性能指标。提出的动态路径选择网络是通过调节不同的复杂度权衡来实现瘦身,实现计算轻量化,验证了网络的可行性和高效性。

 

6

标题:基于高效局部注意力和全局上下文增强的遥感影像建筑物提取方法

引文格式:张永城,刘春阳,刘裕芸,等.基于高效局部注意力和全局上下文增强的遥感影像建筑物提取方法[J].机电工程技术,2025,54(06):28-33+39.

作者:张永城;刘春阳;刘裕芸;王德金

作者单位:安徽理工大学空间信息与测绘工程学院;矿山采动灾害空天地协同临测与预警安徽普通高校重点实验室;安徽理工大学矿区环境与灾害协同监测煤炭行业工程研究中心

基金项目:矿山采动灾害空天地协同监测与预警安徽普通高校重点实验室(安徽理工大学)开放基金资助(KLAHEI202203)

关键词:遥感影像;建筑物提取;深度学习;Unet;注意力机制

摘要:建筑物是城市的主要组成部分,能够准确高效地从高分辨遥感影像中提取建筑物信息,对城市规划、土地利用及灾害评估等方面具有十分重要意义。然而,在使用语义分割手段进行建筑物信息提取任务时,往往存在分割精度低、漏提、错提等问题。针对上述问题,在U-Net网络的基础上,提出了一种全局上下文增强的特征提取网络,以增强特征提取阶段对建筑物上下文细节特征的提取,并减少误检的可能性;同时引入高效局部注意力,以实现建筑物区域的准确区分,解决复杂背景下的建筑物精细化提取问题。为了验证该方法的有效性,在两个建筑物数据集中进行了实验,并于主流的语义分割方法进行了比较。其中,WHU数据集的实验结果中,该方法在IoU、Precision、Recall和F_1score中分别达到了90.21%、94.96%、94.74%、94.85%,明显高于其他比较网络,并且结果图中建筑物分割效果也更加精细,同时在贵阳数据集中验证了网络的普适性。

 

7

标题:基于改进MobileNetV3的钢轨表面伤损识别模型

引文格式:郭睿,姜云龙,宁善平.基于改进MobileNetV3的钢轨表面伤损识别模型[J].机电工程技术,2025,54(06):34-39.

作者:郭睿;姜云龙;宁善平

作者单位:长春理工大学材料科学与工程学院;广东交通职业技术学院轨道交通学院

基金项目:2024年广东省科技创新战略专项资金(pdjh2024b573)

关键词:改进MobileNetV3;CA模块;钢轨表面伤损;轻量化

摘要:针对钢轨表面伤损识别中存在的精度不足与模型收敛缓慢问题,提出了一种高性能的轻量化级钢轨表面伤损识别模型。通过引入包含空间坐标信息的通道注意力(CA)模块,提高了特征提取的精准度与模型的泛化能力。将改进后的MobileNet V3网络作为主干网络,实现模型轻量化和高效性。为验证效果,创建了钢轨表面伤损数据集。实验结果表明,在构建的钢轨表面伤损数据集上,初始的MobileNet V3识别准确率仅为91.8%,F_1值为91.5%;改进模型的识别准确率和F_1值分别提高至93.8%和93.6%;参数量仅为7.01×10~6,明显优于其他模型。提出的改进MobileNet V3模型能够有效识别钢轨表面伤损,大大降低了模型参数量,提升了检测速度,可为钢轨表面伤损高效检测提供有效手段。

 

8

标题:基于图像处理的电喷雾萃取电离源直线特征提取方法

引文格式:李水斌,王双龙,董晓峰.基于图像处理的电喷雾萃取电离源直线特征提取方法[J].机电工程技术,2025,54(06):40-44.

作者:李水斌;王双龙;董晓峰

作者单位:东华理工大学机械与电子工程学院;江西省质谱科学与仪器重点实验室

基金项目:江西省自然科学基金(20242BAB25139,20242BAB25131);江西省自然科学基金青年基金(20224BAB216007);江西省重点研发计划(20232BBG70013)

关键词:电喷雾萃取电离源;特征提取;直线检测;区间Hough变换

摘要:电喷雾萃取电离源目前在诸多领域已获得了广泛的应用,但其空间位姿参数的高效测量问题仍未得到解决,基于图像处理的影像测量方法是解决此问题的首选方法,其中直线特征的提取算法非常关键。因此,提出一种基于图像处理的直线特征提取方法,将电喷雾萃取电离源图像转换到灰度空间进行Otsu阈值分割和二值化处理;采用分水岭算法对图像进行形态学运算以去除像素点过曝区,再经过高斯滤波后进行Canny边缘检测;在直线检测阶段,提出一种区间Hough直线检测算法,重新定义了标准Hough直线检测的角度累加器,成功提取得到电喷雾萃取电离源的两边缘直线特征。实验结果显示,相较于标准Hough直线检测算法,区间Hough直线检测算法的平均检测速率提升至4.95倍,检测准确率提升至1.99倍。结果表明该方法具有较高的检测效率和准确率,能够满足电喷雾萃取电离源直线特征提取的需求。

 

9

标题:基于全局特征下框可见劳动密集场景下工业人员检测的标签分配算法

引文格式:何一凡,何昊阳,卢山,等.基于全局特征下框可见劳动密集场景下工业人员检测的标签分配算法[J].机电工程技术,2025,54(06):45-50.

作者:何一凡;何昊阳;卢山;邵坚铭;张志铭;谢磊

作者单位:深圳职业技术大学;浙江大学控制科学与工程学院;浙江中烟工业有限责任公司宁波卷烟厂

基金项目:国家自然科学基金(62073286)

关键词:密集人员检测;标签分配;复杂场景

摘要:为了解决工业生产场景下背景信息复杂、工人与工人之间存在严重的相互遮挡给人员检测带来的干扰问题,基于OTA中全局匹配策略对目标检测算法中标签分配这一关键性问题进行改进。所提出方法首先改进了正样本的选择方式,对于被遮挡的及小目标的工人加入权重函数来提高被分配的概率。此外,针对于全局匹配后剩下的样本直接被分配为负样本的这一问题,提出一种忽略样本算法,将含有一部分正样本属性的锚框分配为忽略样本,避免直接被分配为背景类而影响模型的训练。最后,在CrowdHuman密集人员数据集和自行建立的工业场景密集人员数据验证集上进行了实验结果分析和一系列的消融实验。实验结果表明,模型对于密集场景下的工人检测精度在AP、MR以及Recall等指标上分别达到88.02%,47.91%和95.44%,相比于传统方法均有提升。

 

10

标题:基于视觉的焊缝坐标识别系统设计

引文格式:黄冠杰,师文庆.基于视觉的焊缝坐标识别系统设计[J].机电工程技术,2025,54(06):51-57.

作者:黄冠杰;师文庆

作者单位:广东海洋大学电子与信息工程学院;广东海洋大学材料科学与工程学院

关键词:焊缝跟踪;视觉识别;图像处理;坐标

摘要:目前,绝大多数焊接机器人都是通过操作员输入给定指令来进行重复焊接作业,但当外部环境变化时,需要重新调整参数,效率低下,自动化和智能化程度不够。针对这一问题,设计了一种搭载在焊接机器人上的焊缝坐标识别系统,基于Visual Studio2022软件,通过调用OpenCV3.4.0视觉库完成焊缝坐标识别。系统的硬件部分由海康威视MV-CA004-10UM工业相机、酷聚液态透镜模组、650 nm一字激光器、650 nm窄带滤光片和VPLC532E视觉运动控制一体机等组成;软件方面设计了一个三选一操作界面,能够满足摄像头、图片、视频等多种输入信号,通过图像预处理和焊缝坐标识别两个模块,实现了对于焊缝的坐标识别功能。测试结果表明,该焊缝坐标识别系统能够稳定运行,响应迅速,精度能保证在3 mm以内,具有一定的实际应用价值。

 

11

标题:用于病理学全视野图像分类的双流多实例学习模型

引文格式:曾军英,尹永宏,麦智鹏,等.用于病理学全视野图像分类的双流多实例学习模型[J].机电工程技术,2025,54(06):58-63.

作者:曾军英;尹永宏;麦智鹏;严维刚;肖雨;秦传波;贾旭东;邓森耀

作者单位:五邑大学电子与信息工程学院;中国医学科学院北京协和医学院北京协和医院泌尿外科;中国医学科学院北京协和医学院北京协和医院病理科

基金项目:中央高水平临床科研专项(2022-PUMCH-B-009);2022年研究生教育创新计划项目(YJS-SFJD-22-01);2024年广东省普通高校重点领域专项(2024ZDZX1008)

关键词:病理学;全视野图像;多实例学习;Mamba;线性可变形卷积

摘要:病理学全视野图像检查被视为癌症诊断的金标准。但其图像的高分辨率和缺乏像素级标签特性使检查变得复杂。目前弱监督多实例学习已成为全视野图像检查的主流方法,其关键挑战在于如何对大量实例进行同时建模全局和局部特征,辅助模型准确聚合包级特征,实现分类任务。为此,提出了一种双流多实例学习模型RLMIL。该模型先利用Reordered Mamba模块捕捉实例之间的全局特征,快速分析图像的整体结构;其次,引入线性可变形卷积模块动态采集实例之间的特征分布以捕捉局部特征。该模型在CAMELYON16、TCGA-LUNG两个公共数据集和PUMCH私有数据集上进行了实验,与当前主流多实例学习模型相比,RLMI模型在准确度分别提高了2.3%、0.5%和0.9%,其还展现了准确的癌症区域定位能力,表明其在病理诊断中的重要应用潜力。

 

12

标题:基于改进YOLOv8的PCB缺陷检测算法

引文格式:孔祥强,刘广敏,高彦臣.基于改进YOLOv8的PCB缺陷检测算法[J].机电工程技术,2025,54(06):64-69.

作者:孔祥强;刘广敏;高彦臣

作者单位:山东交通学院轨道交通学院;青岛智能产业技术研究院

关键词:PCB;缺陷检测;YOLOv8;注意力机制;损失函数

摘要:印刷电路板(PCB)是电子产品的重要组成部分,其质量是电子产品正常使用的关键。为了提高模型对PCB小目标缺陷的检测精度,提出了一种基于改进的YOLOv8的PCB缺陷检测算法YOLOv8-G。首先,在颈部网络中引入SE通道注意力机制,优化对小目标缺陷的特征提取能力,提升模型对小目标缺陷的检测精度。其次,在颈部网络中使用加权双向特征金字塔网络BiFPN结构替换原有的PANet结构,以增强模型的多尺度特征融合能力,使其更加适应小目标缺陷的检测需求。最后,利用WIOU损失函数替换传统的CIOU损失函数,以提高模型的检测精度和鲁棒性。实验结果表明,所提出的模型在精确度、召回率和平均检测精度上分别达到93.1%、87.4%和93.1%,对比原模型分别提升2.9%、3.4%和2.1%。有效地提升了对PCB缺陷的检测精度,增强了其在实际工业生产应用中的稳定性和可靠性。

 

13

标题:基于优化Faster-RCNN遥感影像飞机目标检测算法

引文格式:刘裕芸,刘春阳,周绍鸿,等.基于优化Faster-RCNN遥感影像飞机目标检测算法[J].机电工程技术,2025,54(06):70-77.

作者:刘裕芸;刘春阳;周绍鸿;张永城;王德金

作者单位:安徽理工大学空间信息与测绘工程学院;矿山采动灾害空天地协同临测与预警安徽普通高校重点实验室;安徽理工大学矿区环境与灾害协同监测煤炭行业工程研究中心

基金项目:安徽省自然科学基金面上项目(2108085MD130);矿山采动灾害空天地协同监测与预警安徽普通高校重点实验室(安徽理工大学)开放基金资助(KLAHEI202203)

关键词:遥感影像;数据增强;飞机目标检测;Faster-RCNN;深度学习

摘要:针对现阶段遥感影像飞机目标检测的数据集规模较小的问题,使用水平翻转和灰度变换的数据增强方式扩充数据集,在一定程度上可以提高飞机目标检测的准确性,并缓解过拟合的现象。为解决Faster-RCNN中VGG16网络层数较浅,特征提取不充分的问题,使用ResNet50作为特征提取网络,可以提炼出更深层次和抽象的目标特征,在网络深度加深、梯度爆发和网络性能提升不明显的情况,ResNet50中的残差结构有利于解决这些问题。为解决ROI Pooling两次量化造成的区域不匹配问题,使用ROI Align双线性内插的方法取消两次量化操作,获得更精确的像素坐标,并将整个特征聚集过程转化为一个连续的操作。最终优化FasterRCNN在RSOD数据集上飞机目标检测精度达到了98.72%,同时在UCAS-AOD数据集上也具有良好的泛化性能,验证了优化模型的有效性。

 

14

标题:基于改进YOLOv8的丁烷气体红外图像检测算法

引文格式:于航,郭家乐,张佳文,等.基于改进YOLOv8的丁烷气体红外图像检测算法[J].机电工程技术,2025,54(06):78-83.

作者:于航;郭家乐;张佳文;夏光庆;张龙刚

作者单位:季华实验室;云南师范大学物理与电子信息学院;云南昆船机械制造有限公司

基金项目:国家自然科学基金(61774130);云南师范大学研究生科研创新基金项目(YJSJJ23-B112)

关键词:丁烷;红外图像;YOLOv8;可变形卷积;自适应多头注意力机制;WIoU

摘要:针对现有基于红外成像的丁烷气体泄漏检测方法中存在的精度低、速度慢、易受环境影响等问题,提出了一种改进的YOLOv8算法。该算法在保留YOLOv8高精度检测优势的基础上,通过3个方面的优化,显著提升了检测性能。首先,采用可变形卷积技术替代YOLOv8中的传统卷积,增强了模型对泄漏气体形状多变性的适应能力;其次,在Neck网络中嵌入自适应多头注意力机制模块,有效提升了模型对轮廓不清晰、对比度低特征的提取和识别能力;最后,引入WIoU损失函数,提高了模型的泛化能力和检测精度。实验结果表明,在自建数据集上,该算法实现了87.2%的检测精度和89.7%的mAP@0.5,平均检测图像速度达到7.6帧/s,性能优于当前常用算法。这一改进的算法不仅提高了检测速度,还确保了高精度,为丁烷气体泄漏检测提供了一种高效、可靠的解决方案,有望在实际应用中发挥重要作用,为工业安全提供有力保障。

 

15

标题:轻量化目标检测模型算法综述

引文格式:杨晨红,高振刚,杨瑞鹏,等.轻量化目标检测模型算法综述[J].机电工程技术,2025,54(06):84-95.

作者:杨晨红;高振刚;杨瑞鹏;郝一军;王万勇

作者单位:鄂尔多斯应用技术学院信息工程系;鄂尔多斯应用技术学院大飞机学院;内蒙古电力(集团)有限责任公司鄂尔多斯供电公司;鄂尔多斯凯图科技有限公司

基金项目:鄂尔多斯市科技计划资助项目(2022YY004);鄂尔多斯应用技术学院资助项目(KYYB2021011)

关键词:深度学习;轻量化设计;目标检测;综述

摘要:随着深度卷积神经网络的兴起,很多目标检测模型取得了显著的成绩。然而,大模型以计算成本昂贵且内存密集型为特点,难以部署在嵌入式、实时检测等环境中,因此,研究设计轻量化模型是当前的研究热点之一。构建轻量化的目标检测算法是具有挑战性的任务,因为模型必须要被精妙设计才能在花费尽可能少的参数量和计算资源消耗的同时获得优越的检测性能。在过去10年中,轻量化算法设计取得了显著进展。总结了轻量化目标检测算法,旨在进一步探索轻量网络设计的新思路和新方向。将轻量化算法设计分为3类:骨干网络、特征融合网络和注意力机制。详细分析了每一类在目标检测任务中的性能、优势和局限性。接着,简要介绍了一些最近取得成功的方法,如YOLO系列和DETR。最后总结了研究内容,并讨论了未来工作的挑战和潜在方向,同时探讨了轻量化设计在目标检测领域的发展趋势。

 

16

标题:东巴古籍译注版面分析与识别端到端系统的设计与实现

引文格式:杨玉婷,康厚良.东巴古籍译注版面分析与识别端到端系统的设计与实现[J].机电工程技术,2025,54(06):96-102.

作者:杨玉婷;康厚良

作者单位:苏州市职业大学计算机工程学院;苏州市职业大学体育部

基金项目:教育部人文社会科学研究项目(23YJCZH273);苏州市职业大学引进人才科研启动金项目(201905000034);苏州市职业大学预研项目(SVU2021YY02)

关键词:东巴古籍版面分析;端到端系统;东巴古籍数据化;版面分析与识别

摘要:东巴古籍是记录古代纳西族社会的大百科全书,被列入世界记忆遗产名录。东巴古籍对于研究少数民族文化、少数民族的演变和发展历程有着极为重要的作用。但是,随着时间的流逝,在世能够释读所有东巴经文,具有高水平、大师级的东巴祭司已经越来越少,利用人工智能技术辅助实现东巴经的自动翻译工作已迫在眉睫。因此,以《纳西东巴古籍译注全集》为对象,设计并实现了东巴古籍译注版面分析与识别端到端系统。该系统实现了东巴古籍文档的边缘检测、页面分割、东巴经原文、读音和意译的分类提取及东巴经汉字意译的OCR识别。经过测试,整个系统在文档页面检测与分割、文字块分类及文本行识别等方面都显示出了较好的效果,准确率分别达到了99.24%、96.34%和97.2%,综合准确率达到了97.59%,从而为构建东巴古籍数据库,实现东巴经的自动翻译奠定基础。

 

17

标题:基于驾驶员面部特征的疲劳驾驶监测报警系统

引文格式:孙鹏,孙传聪,徐要要,等.基于驾驶员面部特征的疲劳驾驶监测报警系统[J].机电工程技术,2025,54(06):103-107.

作者:孙鹏;孙传聪;徐要要;高城;侯仰志;唐永菁

作者单位:山东药品食品职业学院医疗器械系

基金项目:山东省卫生健康委员会研究项目(2024183);威海市科技智库调研课题(人工智能提高威海旅游业个性化体验与服务质量的研究)

关键词:疲劳驾驶;机器视觉;开合度计算;面部检测;Dlib库;头部姿态

摘要:近年来,因疲劳驾驶导致的交通事故逐年增多,为人民安全带来威胁,为降低交通事故发率,结合当下的车辆驾驶实际情况,提出了基于驾驶员面部特征的安全驾驶监测系统的研究。采用RPI 4B嵌入式硬件平台作为主控板,搭配高清摄像头,设计了一款基于openCV框架的基于机器视觉的嵌入式疲劳监测系统,使用Dlib的面部检测器识别面部,通过多级级联的残差回归树模型进行面部嘴部和眼睛的特征点标定,采用三坐标轴来表示头部的偏转情况,通过计算嘴部、眼睛的开合度和头部姿态特征的偏移角度,再与阈值进行比较,完成驾驶员的疲劳状态监测,并配合声光报警器对疲劳状态报警。该系统体积小,能耗低,经过实验,采用该设计的每帧检测平均速度约为107 ms;疲劳判断的准确率约为96%,监测结果的准确度高,实时性好。

 

18

标题:利用可变形模板匹配的图像相减法模拟航空发动机外观缺陷检测技术研究

引文格式:宋静怡,王慧博,卫晶.利用可变形模板匹配的图像相减法模拟航空发动机外观缺陷检测技术研究[J].机电工程技术,2025,54(06):108-111+168.

作者:宋静怡;王慧博;卫晶

作者单位:辽源职业技术学院信息工程学院;哈尔滨工业大学(鞍山)工业技术研究院

基金项目:教育部科技发展中心高校产学研创新基金(2022IT160)

关键词:缺陷检测;可变形模板匹配;仿射变换;图像相减

摘要:利用机器视觉对航空发动机进行外观缺陷检测是质量控制的关键环节。但其结构复杂紧凑,受光照及镜头畸变等影响,检测敏感度极高,即检测过程中被测物与相机相对位置不固定所导致的缺陷定位不准确或误标记等情况。针对此问题提出了一种全新的基于可变形模板匹配的缺陷检测算法。首先,制作标准模板库,利用可变形模板匹配算法消除畸变影响提高缺陷检测的准确率;其次,根据评分选择最优模板,并在空间坐标系下进行最优模板轮廓的仿射变换,实现图像归一化;最后,应用图像相减法定位缺陷细节。使用与航空发动机具有相似复杂外观特性的物体进行模拟实验分析,与传统深度学习算法相比较,所提出的算法能够有效缩短模板学习时间,平均单幅图像检测速度提高0.4 s,误检率与缺陷定位精度均有所改善。

 

19

标题:图像边缘降噪保边的数理统计方法

引文格式:孙晓辉,聂小春,桂存兵.图像边缘降噪保边的数理统计方法[J].机电工程技术,2025,54(06):112-118.

作者:孙晓辉;聂小春;桂存兵

作者单位:广州工程技术职业学院

基金项目:2023年度广东省普通高校重点领域专项(2023ZDZX3073);2023年校级质量工程项目(37)

关键词:图像处理;边缘检测;滤波降噪;数理统计

摘要:针对图像边缘去伪降噪保边问题,提出了一种基于边缘物理连续性和噪声分布随机性假设,运用数理统计分析的边缘滤波降噪与边缘保持的处理方法。首先,建立了离散型边缘的孤立噪声、连续噪声、伪边缘的物理模型,并使用一阶梯度表征边缘起伏大小,使用二阶梯度表征邻域边缘起伏趋势,通过梯度组合构建起噪声模板和伪边缘模板。根据目标边缘的实际形态,为了满足平滑连续的假设条件,可对原始数据做预处理,即通过分段坐标变换,使目标边缘趋势线归一到坐标轴上。然后,运用数理统计分析得到梯度阈值,并对边缘梯度数据进行噪声与伪边缘模板匹配,检索得到疑似虚假边缘。最后,通过选取疑似虚假边缘前后邻域的置信数据进行多项式拟合,利用离差值评价噪声分布,利用相关系数评价边缘特征,以完成噪声与伪边缘的验证。通过3种实例测试,分析了该方法对不同信噪比边缘的滤波降噪保边效果。测试发现,对于有明显噪声干扰的边缘信息(信噪比小于15 dB),该方法处理的降噪准确率和保边准确率均为80%以上。当信噪比为1.85dB时,降噪准确率达到82%,说明该方法对低信噪比滤波有良好效果。

 

20

标题:基于改进YOLO模型的红外图像微小目标检测方法

引文格式:周虹,陈嘉,周国栋.基于改进YOLO模型的红外图像微小目标检测方法[J].机电工程技术,2025,54(06):119-123.

作者:周虹;陈嘉;周国栋

作者单位:湖南开放大学智能制造学院

基金项目:湖南省教育厅科学研究项目(24C0971);长沙市社科联哲学社会科学规划课题(2024CSSKKT132);湖南开放大学科研课题(XDK-2024-JG-3,XDK-2024-C-2);湖南省社科评审委员会课题(XSP2023JYC164);湖南省职业教育教学改革研究项目(ZJGB2022805)

关键词:红外遥感;小目标检测;深度学习;YOLO

摘要:红外遥感成像在军事观测、夜间安全监控、森林火灾监测等领域中起着至关重要的作用。但是在复杂背景和低对比度条件下,检测微弱的小目标一直面临准确度不高的问题。现有的基于模型驱动的方法通常在处理噪声和小尺寸目标时缺乏鲁棒性,而基于深度学习的方法高度依赖数据,在特征处理和融合上存在局限性,导致漏检和误检。提出了一种改进深度学习的红外图像小目标检测方法。设计了一种基于YOLO的深度学习网络YOLO-SR,在骨干层的空间金字塔池化模块之后引入瓶颈转换器模块,以捕捉红外图像中的长距离依赖性。在颈部层设计了C3-Neck模块,以更好地提取和融合空间与通道信息。实验结果表明,与当前最先进的基于数据驱动的检测方法相比,所提出的方法在公开数据集上mAP (IoU为0.5)达到了95.2%。

 

21

标题:基于3D视觉的焊缝打磨关键技术研究

引文格式:苏德全.基于3D视觉的焊缝打磨关键技术研究[J].机电工程技术,2025,54(06):124-128+178.

作者:苏德全

作者单位:泉州华中科技大学智能制造研究院

关键词:3D视觉;激光自适应;光条提取;打磨姿态;焊缝提取

摘要:焊缝打磨作为焊接工艺的重要环节,对于提高焊接质量、降低生产成本具有重要意义。由于传统焊缝打磨方法主要依赖于人工操作,效率低,精度差,工作环境恶劣,存在自动化程序低、焊缝形貌复杂以及打磨轨迹姿态难以精确控制等技术难点。为此,基于三角测距原理和沙姆定律原理设计了一款3D线扫相机,研究了基于聚类的光条提取算法,提升了3D相机的测量精度,解决了焊缝的三维重建问题。研究了激光功率自适应技术,解决了激光器在金属表面的反光问题。提出了一种焊缝点云提取算法,解决了平面和曲面的焊缝提取问题。且能够自适应不同的使用场景,进一步提高打磨质量和效率。采用六关节机器人、3D线扫相机和打磨工具组合搭建了打磨测试平台,打磨效率显著提升,焊缝表面打磨光滑平整,验证了基于3D视觉的焊缝打磨技术的可行性和有效性,降低人工干预的需求,为焊接行业的自动化和智能化发展提供了有力的技术支持。

 

22

标题:基于注视行为的高速分心驾驶识别方法

引文格式:夏小均,黄毅,陈德兵,等.基于注视行为的高速分心驾驶识别方法[J].机电工程技术,2025,54(06):129-134+149.

作者:夏小均;黄毅;陈德兵;叶磊;陈宝;韦学军

作者单位:招商局检测车辆技术研究院有限公司;重庆理工大学车辆工程学院;上汽通用五菱汽车股份有限公司

基金项目:重庆市市场监督管理局基金(CQSJKJ2021009);科技发展基金(23AKC14)

关键词:交通安全;分心驾驶;注视行为;概率分布;分心识别

摘要:为预防高速道路环境下分心驾驶导致的交通安全事故,基于高速道路驾驶员的注视行为建立分心驾驶的识别模型。对不同光照高速道路安全驾驶试验的注视数据分布特征进行概率统计拟合分析,确定了视线位于主视区时注视摆头角(GazeHeading)为正态分布和俯仰角(GazePitch)为对数正态分布,基于主视区注视角的概率区间拟合计算出视线离开主视区时长概率分布和计算驾驶员的眨眼时间均值,构建及验证以离开主视区的时长和眨眼时间均值为输入的高速道路驾驶分心识别仿真模型。试验结果表明:光照越弱,驾驶员对道路中央的关注提高,且视线有向上偏的趋势,视线上下观察范围明显增加。而构建的高速驾驶分心模型可以有效识别驾驶过程中的视觉分心和认知分心,为高速道路分心驾驶导致的交通安全事故预防技术的开发提供思路。

 

23

标题:基于旋转圆形特征提取的硬币识别方法

引文格式:孙燕,余元超.基于旋转圆形特征提取的硬币识别方法[J].机电工程技术,2025,54(06):135-139.

作者:孙燕;余元超

作者单位:广电运通集团股份有限公司

基金项目:广东省重点领域研发计划项目(2018B010109004)

关键词:硬币识别鉴伪;旋转圆形特征提取;任意角度图像;平均灰度特征;识别结果融合摘要:利用CMOS图像传感器获取硬币的正面和背面图像,对硬币ROI区域中选定的环状区域采用环状展开平移方法进行特征提取,通过与模板特征进行Pearson相关性匹配计算,可以准确地识别出硬币信息并判断真伪。对展开后的矩形区域进行划块取平均灰度特征,并利用多角度的图像特征作为模板,可以有效解决硬币以任意角度进入成像设备时局部纹理差异较大导致识别错误问题。通过融合正面、反面硬币图像识别结果,可以增加识别结果的可信度。针对任意角度的硬币图像,将圆形区域旋转转化成矩形区域平移,来表征硬币图像的旋转角度,大大降低了计算量,满足低内存嵌入式系统下快速识别出硬币信息需求,在实际应用中真币识别准确率可达98.875%,游戏币检出率100%。

 

24

标题:基于SAR图像区域约束的输电杆塔智能识别方法

引文格式:岑宗浩,范鹏,刘波.基于SAR图像区域约束的输电杆塔智能识别方法[J].机电工程技术,2025,54(06):140-143.

 

作者:岑宗浩;范鹏;刘波

作者单位:国家电网有限公司华东分部;国网电力科学研究院武汉南瑞有限责任公司

基金项目:国家电网有限公司华东分部项目(52992424001X)

关键词:SAR;输电杆塔;深度学习;YOLOv8

摘要:星载合成孔径雷达(SAR)作为一种主动微波成像技术,能够提供全天时、全天候的对地成像观测,在基础设施远程识别和监测任务中越来越受到关注。针对复杂场景下高分辨率SAR图中输电杆塔检测存在的虚警和漏警的问题,提出了一种结合区域约束的双层输电杆塔目标检测方法。首先构建了不同地区的输电杆塔SAR样本数据集,包括目标级和区域级标注;在此基础上,利用YOLOv8等多种深度学习模型实现了输电杆塔的识别,并对比了不同模型的检测精度、推理速度以及在大场景SAR图像中的适用性。结果表明,该方法可以显著减少城区和水区的误报现象,在测试案例中输电杆塔的输电杆塔识别率达到了90%,验证了所提方法的有效性。

 

25

标题:基于改进YOLOv5的机车圆弹簧缺陷检测

引文格式:戴永刚,朱亚斌,高国章,等.基于改进YOLOv5的机车圆弹簧缺陷检测[J].机电工程技术,2025,54(06):144-149.

作者:戴永刚;朱亚斌;高国章;马文娟;裴志彪;王栋;高鹏

作者单位:中国铁路兰州局集团有限公司兰州西机务段;兰州交通大学机电工程学院

基金项目:中国铁路兰州局科技发展计划项目(FWTPZDJXJ-170)

关键词:圆弹簧缺陷检测;YOLOv5;数据增强;轻量化

摘要:目前机车圆弹簧磁粉探伤采用人工观察分析模式,普遍存在漏检、误检及自动化程度低等一系列问题,基于此,提出一种改进的YOLOv5机车圆弹簧缺陷检测算法以更好地辅助车间人员进行机车圆弹簧裂损缺陷检测。首先,为了保证模型训练有足够的样本支撑,采用数据增强方法对现有机车圆弹簧裂损缺陷样本进行扩充。其次,为了使得训练得到的机车圆弹簧缺陷检测模型更易于边缘部署,利用MobileNetv3替换YOLOv5原始的Backbone,实现模型轻量化改进,降低算法推理过程中的计算开销。最后在机车圆弹簧裂损缺陷数据集上试验分析,改进后的算法YOLOv5-M在不过多降低检测精度的前提下显著降低了模型参数量和计算开销,模型参数量减少至3.39 M,相比原始模型减少了53.1%;GFLOPs从原来的16.6减少至6.1。改进后的算法相比基础算法,可部署性更好,证明了算法改进后的可行性和适用性。

 

26

标题:基于改进YOLOv5的有机板表面缺陷视觉检测

引文格式:饶湘,邹金平,肖鹏,等.基于改进YOLOv5的有机板表面缺陷视觉检测[J].机电工程技术,2025,54(06):150-155.

作者:饶湘;邹金平;肖鹏;周钰瑶;李东

作者单位:金发科技股份有限公司

关键词:缺陷检测;复合材料;YOLO;机器视觉;有机板

摘要:有机板是一种基于拉挤成型工艺的高强度、高刚度、轻量化复合材料,因其优异的力学性能被广泛应用于汽车制造用材。在生产过程中容易出现颜色异常、划痕、污渍、凹坑、分缝、溢料等外观缺陷,造成品控不合格导致客户投诉返工,增加生产成本。现有生产过程中主要依靠人工目视检测,存在主观性强和效率低下,因此需要一种替代人工实时检测的新方法。设计一种基于注意力机制的YOLOv5缺陷目标检测模型YOLOv5_CBAM,实现有机板外观缺陷准确检测。基于有机板连续生产的特点使用Dalsa线阵相机实时采集生产中的有机板图像数据,输入至YOLOv5模型提取图像中缺陷特征,主干网络引入注意力机制CBAM增强模型对缺陷关键特征注意力,对通道和空间加权提升模型准确性和鲁棒性。实验表明:在有机板数据集的验证集上改进模型YOLOv5_CBAM的mAP为98.6%,在原始YOLOv5s基础上提升了4.9个百分点,与Faster RCNN、YOLOv3和YOLOv4模型比较mAP分别高出23.4、12.4和11.5个百分点,模型单张图像推理时间为41 ms,实验结果表明改进模型YOLOv5_CBAM能够实时准确地检测有机板外观缺陷。

 

27

标题:CNC加工工件尺寸在线视觉检测工艺研究

引文格式:蔡杨.CNC加工工件尺寸在线视觉检测工艺研究[J].机电工程技术,2025,54(06):156-159.

作者:蔡杨

作者单位:浙江永成机械有限公司

基金项目:2023—2024年度机械行业技工教育科研课题(JXJGKT202314)

关键词:CNC加工工件;在线视觉检测工艺;系统设计

摘要:为满足CNC加工工件尺寸在线视觉检测的需求,设计并开发了一种集成自主研发CCD视觉测头的CNC加工工艺系统。该系统基于精确的视觉检测技术,能够在CNC加工过程中实时自动采集工件的图像,并通过高级图像处理算法对工件的尺寸与误差数据进行精确的分析和处理。与传统的人工检测或接触式测量方法相比,该系统的在线检测能够显著提高生产的自动化程度,降低人为因素导致的误差。通过对多种复杂形状和高精度要求的工件进行实验测试,结果显示本系统在尺寸检测过程中展现出极高的精度和效率,能够快速完成对加工工件的实时测量和反馈,极大提升了生产线的生产效率和成品合格率。此外,该系统通过模块化设计,可轻松集成到现有的CNC加工设备中,适应不同种类工件的检测需求,具有广泛的适应性。与传统的离线检测方法相比,该系统不仅缩短了检测时间,还在精准度和检测效率上展现出显著的优势,验证了其在智能制造和自动化生产领域的应用潜力。

 

28

标题:小样本学习研究综述

引文格式:李坤,陈剑钧,李国胜,等.小样本学习研究综述[J].机电工程技术,2025,54(06):160-168.

作者:李坤;陈剑钧;李国胜;姜晓道

作者单位:华东光电集成器件研究所

关键词:小样本学习;元学习;度量学习

摘要:深度神经网络参数众多,需要大量的标记数据进行模型训练,而许多罕见的类别无法收集大量标记样本,严重限制了深度学习方法的可扩展性。受到人类小样本学习能力的启发,近年来关于小样本学习领域的研究取得了不错的进展。对小样本学习方法进行了系统的梳理和总结。首先,给出了小样本学习的问题定义,阐述用于解决小样本问题的元学习框架,说明元训练和元测试的具体过程。然后,对小样本学习算法进行综述,现阶段小样本学习算法分为三类:基于参数优化、基于外部记忆和基于度量学习,其中度量学习方法应用最广、效果最好。对前两类方法进行了简要的说明,然后重点介绍基于度量学习的方法。最后,给出了未来小样本学习领域一些可能的研究方向。

 

29

标题:舰载直升机尾轮偏角视觉测量方法研究

引文格式:陈冲,蔡斌,漆光林,等.舰载直升机尾轮偏角视觉测量方法研究[J].机电工程技术,2025,54(06):169-173.

作者:陈冲;蔡斌;漆光林;许涛

作者单位:中国船舶集团有限公司系统工程研究院航空系统研究所;中国科学院光电技术研究所光电探测与信号处理研究室

关键词:直升机;尾轮;偏角;机器视觉;管道滤波;圆特征

摘要:高海况条件下,舰载直升机面临进出舰船机库困难的问题。针对该问题所研发的舰载直升机快速回收放飞系统,在牵引直升机进出机库时,操作员需要实时监测尾轮相对于机身的偏角,防止尾轮发生大角度偏转,以确保牵引过程中的直升机尾轮安全。提出了一种基于管道滤波和轮毂圆特征的尾轮偏角视觉测量方法,通过安装在移动平台上的两台相机,配合近红外光源,对尾轮相对于直升机机身的偏角进行检测,并进行了相关试验。试验结果表明,所提出的尾轮偏角视觉测量方法能够有效测量尾轮偏转角度,通过陀螺仪测量尾轮偏角作为参考真值,得到测量误差在5°以内。该方法能够以足够的测量精度,为直升机牵引作业提供可靠的尾轮偏角值,具有重大的工程应用价值。

 

30

标题:基于3D视觉的EVA材质鞋面打孔关键技术研究

引文格式:陈达伟.基于3D视觉的EVA材质鞋面打孔关键技术研究[J].机电工程技术,2025,54(06):174-178.

作者:陈达伟

作者单位:泉州冰点科技有限公司

基金项目:泉州市科技计划项目(2022C010R)

关键词:三维成像;匹配算法;AI图像识别

摘要:近些年EVA材质的花园鞋生成订单部分流入国内,由于特殊的工艺要求,需要在曲面原有孔洞上再进行打孔操作,目前皆是人工完成打孔工序,无法实现自动化。为此,引入3D视觉技术、深度学习技术,对花园鞋打孔关键技术进行研究。结合3D视觉采集技术,搭建3D视觉扫描系统,获取鞋面的三维点云数据及灰度信息;结合深度学习模型来识别鞋面上的孔洞,为后续的打孔操作提供了关键信息;结合三维点云配准技术获取基准孔洞点云到目标孔洞点云的位置关系,从而获取各个孔洞可加工的位姿;结合机器人技术,实现了自动生成花园鞋鞋面打孔程序。解决因花园鞋材料容易变形,无法自动化加工,用工成本高、用工难的问题。同时也加快了相关行业实现自动化、柔性化的步伐。

 

31

标题:基于深度学习的自动化视觉库存盘点方法

引文格式:唐俊宇,齐良春,郭铁.基于深度学习的自动化视觉库存盘点方法[J].机电工程技术,2025,54(06):179-182.

作者:唐俊宇;齐良春;郭铁

作者单位:红云红河烟草(集团)有限责任公司

基金项目:红云红河烟草(集团)有限责任公司科技项目(HYHH2021GY04)

关键词:计算机视觉;深度学习;库存盘点

摘要:自动化库存盘点在现代供应链管理中扮演着越来越重要的角色。它不仅可以优化库存管理流程,提高整体运营效率,还能显著降低运营成本,同时增强客户服务体验。提出了一个基于深度学习的视觉库存盘点方法,利用在ImageNet数据集上预训练的ResNet18网络,通过迁移学习技术适应新的库存分类问题,从而实现对仓库中物品的自动化识别和分类,不仅提高了盘点的效率,还显著提升了盘点的准确性。实验结果表明,提出的方法在“MVTec D2S”数据集上能够达到98.84%的F1-score,并对比了不同预训练卷积神经网络(CNN)对识别性能的影响,证明了该方法的可行性和有效性,为后续研究提供了有价值的参考,对推动供应链管理的自动化和智能化具有重要的意义。

 

32

标题:基于视觉检测的冶金试样机器人抓取系统

引文格式:丁烨,吴瑞珉,宋希韬.基于视觉检测的冶金试样机器人抓取系统[J].机电工程技术,2025,54(06):183-187+193.

作者:丁烨;吴瑞珉;宋希韬

作者单位:宝山钢铁股份有限公司

关键词:机器人;视觉检测;试样抓取;自动后处理

摘要:在铁水预处理工序中,从探头中分离的扁圆柱试样的状态及位姿存在不确定性,给自动后处理带来了较大挑战。建立了一种基于视觉检测的冶金试样机器人抓取系统,搭建了机器人数字化模拟仿真和实物测试平台。制定了试样抓取的基本作业流程,通过视觉检测系统实现了试样状态及位姿检测,提出了有柄试样抓取干涉避让策略及试样柄区间调整策略,开展了冶金试样机器人抓取系统功能验证。结果表明3D相机试样位置检测结果偏差值小于±1 mm,视觉检测系统检测时间小于5 s,试样姿态、试样柄有无状态及试样柄方位识别准确,满足抓取精度及响应速度要求。系统实现了无柄和有柄冶金试样的视觉有效识别和机器人稳定抓取,解决了铁水预处理工序探头试样自动后处理的关键问题。

 

33

标题:基于YOLOv5s道路缺陷检测研究

引文格式:邹国厚,刘达.基于YOLOv5s道路缺陷检测研究[J].机电工程技术,2025,54(06):188-193.

作者:邹国厚;刘达

作者单位:抚州市公路事业发展中心

关键词:YOLOv5s;道路缺陷;深度学习;CBAM;空洞卷积

摘要:道路缺陷检测对于保障道路交通安全和维护基础设施至关重要。传统的YOLOv5s模型在道路缺陷检测中虽有应用,但在复杂的道路场景下,其检测精度有待进一步提高。为克服这一局限性,对YOLOv5s进行改进。将原模型的SPP替换为ASPP,增强对不同尺度道路缺陷特征的提取能力,并且在ASPP模块前引入CBAM注意力机制,使模型能够更精准地关注到缺陷关键部位。实验结果表明,YOLOv5s原模型的mAP@0.5仅为89.8%,而改进后的YOLOv5s-ASPP-CBAM模型达到92.9%,提升了3.2%,显著提升了道路缺陷检测的准确性与可靠性。