1. 研究目的与意义
随着当今世界科学的进步,人工智能也在迅速发展。其中无论是一直在追求更好的安全性能的传统汽车产业还是传统汽车产业以人工智能的发展为依托,正在大力研发的无人驾驶技术都离不开基于机器视觉的三维位姿检测系统的研发与设计。许多的辅助驾驶功能都是在识别到有效车辆目标的基础上实现。车辆检测技术随着计算机视觉领域理论的发展,分成了很明显的几个阶段:从最早的简单图像处理到基本的模式识别方法,再从传统的手动设计特征的机器学习方法到基于深度卷积神经网络的方法。车辆跟踪技术也从最开始的模板匹配、卡尔曼滤波延伸出许多改进的方法。
2. 研究内容和预期目标
本课题主要研究内容:
利用kitti采集车辆的特征点云数据,让3D激光雷达结合深度学习CNN卷积神经网络车型判别模块对目标车辆的车型进行判别;根据CNN卷积神经网络的判别结果,从云端数据库调取对应车型的点云数据,然后利用迭代最近点算法对所采集的目标车辆特征点云数据与云端点云数据进行匹配获取目标车辆的刚体旋转矩阵与位移向量;最后依据刚体旋转矩阵与位移向量获取目标车辆的位姿信息。
包括:
基于激光雷达的物体检测:
LiDAR的输出数据是3D点云,每一个点除了包含X,Y,Z坐标,还包含一个反射强度R,类似与毫米波雷达里的RCS。
检测算法输出3D矩形框,3D BBox可以有多种表示方法,一般最常用的就是用中心点3D坐标,长宽高,以及3D旋转角度来表示。
检测算法输出的3D BBox与人工标注的数据进行对比,一般采用3D IoU (Intersection over Unoin)来衡量两个BBox重合的程度,高于设定的阈值就被认为是一个成功的检测,反之则认为物体没有被检测到(False Negative)
点云数据库:常见的点云数据库由KITTI等数据库。
激光雷达物体检测算法:Multi-view方法,Voxel方法, Point方法,以及Point和Voxel结合的方法。
技术要求如下:
1.检测速度:>1Hz
2位姿估计准确度:<10度
3. 研究的方法与步骤
基于深度学习的计算机视觉三维检测的姿态和位置估计涉及到目标检测、图像分割、姿态估计等多个任务。下面介绍几种常用的算法:Faster R-CNN: Faster R-CNN是一种目标检测算法,通过引入Region Proposal Network(RPN),在不同的特征层级上进行检测,并使用RoI Pooling操作获取候选区域特征,从而实现目标检测。
YOLOv3: YOLOv3是一种实时目标检测算法,通过引入Darknet-53网络,在不同的特征层级上进行检测,并利用YOLOv3算法结构实现目标检测。
Mask R-CNN: Mask R-CNN是一种实例分割算法,通过在Faster R-CNN基础上添加Mask分支,在检测的同时,对每个目标进行像素级别的分割。
DensePose: DensePose是一种人体姿态估计算法,通过对人体区域进行密集的网格划分,同时利用CNN模型实现人体姿态估计。
PVNet: PVNet是一种基于点云的三维姿态估计算法,通过使用渲染技术将3D物体映射到2D图像中,再利用CNN模型实现姿态估计。
PoseNet: PoseNet是一种人体姿态估计算法,通过利用CNN模型实现人体的姿态估计,包括关键点的坐标位置和对应的深度信息。
基于深度学习的前方车辆位姿估计方法通常包括以下几个步骤:
数据准备:收集前方车辆的图像数据,并标注车辆的位置和姿态信息。
特征提取:利用CNN等模型从图像中提取特征表示,同时考虑车辆的三维信息。
目标检测和跟踪:利用目标检测模型对车辆进行检测,并利用RNN等模型对车辆进行跟踪,得到车辆的运动轨迹。
位姿估计:根据车辆的运动轨迹和三维信息,利用计算机视觉技术估计车辆的位姿信息,包括位置和姿态等。
4. 参考文献
[1]胡杰,刘汉,徐文才,赵亮.基于三维激光雷达的道路障碍物目标位姿检测算法[J].中国激光,2021,48(24):164-174.
[2]李晏,阚斐然,陈辛波.基于单线激光雷达的目标车辆位姿检测方法[J].激光杂志,2021,42(02):66-71.DOI:10.14016/j.cnki.jgzz.2021.02.066.
[3]李琳辉,张溪桐,连静,周雅夫.结合车道线检测的智能车辆位姿估计方法[J].科学技术与工程,2020,20(21):8804-8809.
5. 计划与进度安排
2024-2-20~2024-3-11 查阅资料,分析实施方案;
2024-3-12~2024-3-31 完成各项模块算法设计;
2024-4-1~2024-5-15 编制各模块程序;
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。