CVIM-Tutorial - SIFT -


CVIMチュートリアルシリーズ

Date Title PDF PPT
2007.09.04 藤吉弘亘. "Gradientベースの特徴抽出 - SIFTとHOG - ", 情報処理学会 研究報告 CVIM 160, pp. 211-224, 2007. PDF PPT
アブストラクト
Scale-Invariant Feature Transform(SIFT) は,特徴点の検出と特徴量の記述を行うアルゴリズムである. 検出した特徴点に対して,画像の回転・スケール変化・照明変化等に頑健な特徴量を記述するため,イメージモザイク等の画像のマチングや物体認識・検出に用いられている. 本稿では,SIFT のアルゴリズムについて概説し,具体例としてSIFT を用いたアプリケーションや応用手法への展開について紹介する.また,SIFT と同様にgradient ベースの特徴抽出法であるHistograms of Oriented Gradients(HOG)のアルゴリズムとその応用例として人検出についても紹介する.
Abstract
Scale-Invariant Feature Transform(SIFT) is an approach for detecting and extracting local feature descriptors that are reasonably invariant to changes in illumination, image noise, rotation, scaling, and small changes in viewpoint. Because the SIFT algorithm can describe characteristics of feature points that are invariant to scale and rotation changes, it has been used for image matching such as image mosaicing and generic object recognition. In this paper, we describe the SIFT algorithm and introduce applications that use it. We also describe another algorithm called “Histograms of Oriented Gradients(HOG)” which is based on gradient feature extraction similar to the SIFT algorithm. We also introduce an example of how HOG can be used for people detection.

Date Title PDF PPT
2008.10.30 藤吉弘亘. "一般物体認識のための局所特徴量(SIFTとHOG)", 2008. PDF PPT
アブストラクト
一般物体認識問題として画像分類や物体検出の研究が盛んに取り組まれている。画像分類で用いられているBag-of-Keypointsというアプローチでは、局所特徴量として勾配情報から算出されるSIFT(Scale Invariant Feature Transform)が用いられている。SIFTは、スケール変化、回転変化に不変な特徴量を記述することができるため、特定物体認識だけでなく画像分類の特徴量として有効である。一方、歩行者認識等の物体検出においても、局所特徴量として勾配情報から算出する勾配方向ヒストグラムHOG(Histogram of Oriented Gradients)が用いられている。本チュートリアルでは、勾配情報から得られる局所特徴量としてSIFTとHOGのアルゴリズムについて紹介し、一般物体認識への利用方法について講演する。
Abstract
Generic Object Recognition is one of the biggest problem in the research area of computer vision. Gradient-based local features such as SIFT and HOG are commonly used for object dection and object categorization. Scale-Invariant Feature Transform(SIFT) is an approach for detecting and extracting local feature descriptors that are reasonably invariant to changes in illumination, image noise, rotation, scaling, and small changes in viewpoint. Because the SIFT algorithm can describe characteristics of feature points that are invariant to scale and rotation changes, it has been used for image matching such as image mosaicing and generic object recognition. In this paper, we describe the SIFT algorithm and introduce applications that use it. We also describe another algorithm called ``Histograms of Oriented Gradients(HOG)'' which is based on gradient feature extraction similar to the SIFT algorithm. We also introduce an example of how the HOG algorithm can be used for people detection.

Date Title PDF Keynote
2010.5.21 "物体認識のための画像局所特徴量 -SIFTと最近のアプローチ-" PDF PPT
アブストラクト
近年のアプローチである画像局所特徴量による物体認識についてわかりやすく解説する.勾配をベースとした画像局所特徴量であるSIFTは,特徴点であるキーポイントの検出と特徴量の記述を行うアルゴリズムである.検出したキーポイントに対して,画像の回転・スケール変化・照明変化等に頑健な特徴量を記述するため,イメージモザイク等の画像間の対応点マッチングや特定の物体認識に用いられている. 本講演では,SIFTのアルゴリズムについて概説し,具体例としてSIFTを用いたアプリケーションや応用手法として一般物体認識への展開について紹介する.さらに,SIFTアプローチの高精度化手法であるPCA-SIFTやGLOH,高速化手法であるSURF,そして最近のアプローチであるRandomized Treesを用いた事前学習による対応点探索の高精度化・高速化について,デモを交えて解説する.

一般物体認識

Date Title PDF Keynote
2010.6.3 "一般物体認識(BoFとSRF)" PDF PPT
アブストラクト
一般物体認識問題における画像中の物体がどのカテゴリに属するかを求める画像分類問題に対して,Bag-of-featuresモデルが提案され,多くの研究が取り組まれている. Bag-of-featuresは,画像を局所特徴量の集合とみなし,局所特徴量のヒストグラムをその画像の特徴量としてカテゴリを認識する手法である. 本稿では,Bag-of-featuresの解説とその拡張手法の紹介をする. さらに画像分類問題とセグメンテーションを同時に計算可能なSemantic Texton Forestsについて解説する.


Fujiyoshi laboratory, Dept. of Computer Science, Chubu University.