Handcraft features

人工智能炼丹师
2016-09-01 / 0 评论 / 141 阅读 / 正在检测是否收录...

Take-Home Message

  • LBP 不受光照影响,运算快,适用在人脸
  • SIFT是基于关键点的特征描述,具有旋转、尺度、光照不变性(常用欧式距离比较距离做匹配)
  • HOG 是基于块的梯度直方图特征描述,适用在人体检测(常作为分类器输入特征)

算法细节

LBP (Local Binary Pattern)

  • 算法流程:
    比较3x3邻域(Local)内,中心点像素值与周围8个点的大小关系,大于中心点,取值为1;小于中心点,取值为0(Binary), 将8位0/1表示的二进制转换为十进制表示,得到该点处的LBP特征的数值
  • 特点:
    • Pros: LBP反应了像素值间的大小关系,与具体数值无关,故对光照影响鲁棒
    • Cons: 只统计周围3x3邻域关系,不具有旋转尺度不变性(有对这些缺点进行改进的算法)

SIFT (Scale Invariant Feature Transform)

  • 算法流程

    • 1.关键点检测
      • 构建高斯尺度金字塔(gaussian blur)和图像金字塔(downsample)
      • 用DOG近似LOG, 在DOG图像中找到极大/极小值点作为候选关键点(3张DOG图像上,3x3领域的极值), 在超像素层面找到极值点(泰勒展开,梯度法迭代求解极值点), (尺度不变性)
      • 去除多余关键点(低对比度点和边缘)
    • 2.对关键点的直方图特征描述
      • 主方向对齐(旋转不变性)
      • 关键点邻域(16x16)梯度直方图统计, 每个关键点得到128维特征向量(4x4x8)
  • 特点

    • 尺度, 旋转不变性,光照变化不敏感
    • 计算量大,耗时

HOG (Histogram of Oriented Gradients)

  • 算法流程:
    HOG将图片均匀分成多个cell,对每个cell进行梯度直方图统计,多个cell组成一个block,在单个block做归一化(block之间存在重叠),这样对光照变化鲁棒。每个block得到一个向量,将所有block特征合并得到最后的HOG特征表示

  • 算法特点:

    • 适用于人体检测
    • 不具有尺度/旋转不变性

! HOG与SIFT的区别
The R-HOG blocks appear quite similar to the scale-invariant feature transform (SIFT) descriptors; however, despite their similar formation, R-HOG blocks are computed in dense grids at some single scale without orientation alignment, whereas SIFT descriptors are usually computed at sparse, scale-invariant key image points and are rotated to align orientation. In addition, the R-HOG blocks are used in conjunction to encode spatial form information, while SIFT descriptors are used singly. (From wikipedia HOG)

reference

0

评论 (0)

取消
粤ICP备2021042327号