2、设计Grasp Quality Convolutional Neural Network (GQ-CNN),去得到一系列鲁棒性良好的抓取规划
因此,dex-net 2.0数据集对dex-net 1.0版本进行了扩展,极大提高了RGP的采样复杂度(结合了点云和候选鲁棒性抓取),之后通过训练一个卷积神经网络模型来达到最优大区的目的。


这里写图片描述 :为状态函数,其中O为待抓物体的形状,To为物体坐标系,Tc为相机坐标系,γ为摩擦系数
image y:为深度图或者2.5D点云
Grasp g:定义为 这里写图片描述 可以看作是一次抓取规划,其中p为手爪的三维坐标(物体坐标系下), ψ为手抓相对于抓取点对的旋转
Succsee Metric S:为一次抓取规划成功的度量,定义为
,其中Eq定义为epsilon质量,包括摩擦系数和夹持器姿态的不确定性带来的姿态误差的鲁棒性度量,collfree(u,x)为执行抓取u,状态为x时无碰撞 ,对此进行鲁棒性分析。

我们的最终目的是学习一个鲁棒性函数 这里写图片描述 ,使得
这里写图片描述 ,C为对跖点对集
即训练一个网络,使得网络参数θ: 这里写图片描述
这里写图片描述 为网络参数集合,L为交叉熵损失函数


1)1500个原始3D网格模型,通过Dex-Net 1.0的方式在模型表面生成数百个垂直于表面的模拟抓取点,通过对跖的方式找到对应点对。
服从: 这里写图片描述 联合分布
在该联合分布下,通过epsilon质量(包括摩擦系数和夹持器姿态的不确定性带来的姿态误差的鲁棒性度量) 这里写图片描述 来将670万数据分成正负样本


输入为:1、记录Grasp Candidate抓取点(i,j),对跖点对连线旋转置
与对应坐标系横轴平行,记录旋转角度θ,缩放置固定大小后截取32*32图片,成为Aligned Image(对准图片)
输出:鲁棒性函数: 这里写图片描述 再通过rank得分得到鲁棒性排序函数 这里写图片描述 从而得到初期最优抓取规划
这里写图片描述 对于第一层卷积核,可以表达出图像的梯度信息,根据此梯度信息可以推测手爪与物体的碰撞信息,然后根据collfree与 这里写图片描述 可以判断出最优抓取规划


其中,真正类率(true positive rate ,TPR), 计算公式为TPR=TP/ (TP+ FN),刻画的是分类器所识别出的正实例占所有正实例的比例。另外一个是假正类率(false positive rate, FPR),计算公式为FPR= FP / (FP + TN),计算的是分类器错认为正类的负实例占所有负实例的比例。


Success Rate:在认为随意放置的待抓物体,手爪通过移动旋转操作之后能抓起物体的成功比率
Robust Grasp Rate:在Precision高于50%的抓取规划中,真正去实施抓取的比例
Planning Time:得到深度图到去执行抓取动作所需要的时间





一、绪论1)本文的主要贡献 1、制作dex-net2.0数据集,该数据集包括670万点云数据,又从1500个 3D模型通过GWS(抓手运行空间分析)得到手爪的运行规划 2、设计Grasp Quality Convolutional Neural Network (GQ-CNN),去得到一系列鲁棒性良好的抓取规划 3、设置一种抓取机制,可以对得到的鲁棒性良好的一组抓取规划进行 rank排序, 如今,在各种期刊顶会都能看到平面抓取检测的论文,他们声称能应对多物体堆叠场景,然而实际效果都不尽人意,我认为主要原因有如下几点: (1)缺乏多物体堆叠场景的抓取 数据 集。现在最常用的Cornell Grasp Dataset, Jacquard 数据 集都是单目标场景。(像 Dex -Net 数据 集和Google机器人工厂这种东西普通研究者就只能看着了) (2)现在的研究者过于强调端到端检测。 (3)没有一个合适的抓取表示法。 如何利用少量 数据 集学习一个端到端 网络 或者整个方法中的一个子 网络 ,实现堆叠场景 二、本文贡献 对比以往利用计算机视觉技术实现机器人抓取物体的研究,本文提出的方法可以实时生成让机器人对静态的、动态的、集中堆放的未知物体的抓取轨迹,采用的GG-CNN相比以往包含了更少的参数,性能更佳。 三、具体方法 首先对抓取点在笛卡尔坐标中进行定义,然后对深度相机拍摄的物体图片进行处理,利用图像中心点相对于相机参考帧的旋转角度、抓取宽度,再根据相机内参与实际物理位置,进一步转化
《Multimodal Deep Learning for Robust RGB-D Object Recognition》 2015,Andreas Eitel et al. 特征层融合 1.提出了一种新的RGB-D结构为目标识别(最后一层融合concat): 2. 数据 准备 由 网络 结构图可知,Depth image的输入为3通道。 几种不同的深度图编码方式,如下图所示 几种最常见的方式:...
Multimodal Deep Learning for Robust RGB-D Object Recognition 原文中使用到的深度图像着色方法,根据距离把深度图渲染上红绿蓝的颜色,被称为colorjet 如题目所述的效果图: (2). 构建 Dex -Net 3.0 数据 集 (3). 训练GQ-CNN 网络 二、柔性吸附接触模型(一)问题描述 1、目标:对于由深度相机给出的点云,我们的目标是找到一个鲁棒性最高的吸附抓取方式。 2、假设:为了便
Antipodal Robotic Grasping using Generative Residual Convolutional Neural Network 本文提出了一个模块化的机器人系统,用于预测、规划和执行场景中物体的反足抓取。 提出了一种生成剩余卷积神经 网络 (GR ConvNet),该 网络 为n通道输入图像中的每个像素生成反模式抓取,该结构用于预测摄像机视场中物体的合适反足抓取配置。 “Deep learning for detecting robotic grasps,” http://bair.berkeley.edu/blog/2017/06/27/ dex net- 2.0 / https://berkeleyautomation.github.io/ dex -net/# dex net_2 https://berkeleyautomation.github.io/gqcnn/ 代码复制到自己电脑后修改文件路径 folder="C:/Users/win101818/Desktop/OpenCV01/flower_photos/daisy01" #自己图片的路径 train_batch_5 test folder_ad="C:/Users/win101818/Desktop/OpenCV01/flower_photos/new" #将图片转化为32*32的三通道图片的路径 train_batch_5_ad test_ad imglist=listdir(folder) #这里原作者好像写错了,我自行修改了,目测现在是对的 num=len(imglist) img_tra() label=[] for i in range (0,num): label.append(seplabel(imglist[i])) binpath="C:/Users/win101818/Desktop/OpenCV01/flower_photos/data_batch_5" #保存的路径 data_batch_5 test_batch print(binpath) mkcf() 运行后报错 PermissionError: [Errno 13] Permission denied: 'C:/Users/win101818/Desktop/OpenCV01/flower_photos/data_batch_5' 这是什么原因?