机器人感知是UPNN机器人专项中的最后一门课程,其利用视觉方法来对环境进行感知。与之前提到的机器人视觉不同,机器人感知更侧重于对环境物体的识别与检测。与计算机视觉不同,机器人视觉所识别的物体往往不需要高精度测量,物体也有明显特征。机器人感知最为典型的应用是对环境的感知 —— SLAM,同步定位与地图构建。如果说机器人视觉解决了where am I的问题,那么Robotic Perception 面对的是Who is it.
1、1D Gaussian
感知要解决的是对环境识别的问题,沿着PGM的思路往下,识别就是算概率。对于一般的识别任务,比如识别一个自然环境中的网球,可以对网球的颜色进行建模。为了符合人们的感知,可以先将RGB图像转为HSI图像,其中色度Hue,就与亮度解耦,成为一个不变量了。其只和材质与光照条件有关。一个物体如果颜色是统一的,那么其 H 会满足Gaussian分布。只需要从训练集中提取这个分布,就可以用于判别场景中是否存在这个物体。
2、mutiple Gaussian
mutiple Gaussian 对应的是多变量高斯模型。多变量高斯模型分为相关和不相关两种,具体表现在协方差矩阵上。其分布均值是样本均值,其方差是样本的协方差矩阵!
3、Expecatation Maxiumazition
EM算法是无监督学习中非常重要的一种算法。其可以分解成两个步骤——E step, M step
其中,E step 表示的是由 label ---> parameters. label 不一定是01样本,也可以是各个样本的概率。如果是概率样本,则可以使用 weighted Gaussian estimation 来估计parameters:具体算法见PGM week9 Homework in OSChina.
M step 表示的是由parametes ---> label. 也就是对当前的参数来计算样本各个label的概率。
如此往复最终可获得稳定的分类结果。需要指出的是EM算法对初始label 非常敏感。如果是当量样本中有少量缺失标记,EM算法可以很好的满足需求。如果纯聚类,则可考虑使用其他聚类算法先给出聚类结果,再利用EM来进行优化。