CVIM-Tutorial - SIFT -


CVIMチュートリアルシリーズ

SIFT Documents

Date Title PDF PPT
2007.09.04 藤吉弘亘. "Gradientベースの特徴抽出 - SIFTとHOG - ", 情報処理学会 研究報告 CVIM 160, pp. 211-224, 2007. PDF PPT

Gradientベースの特徴抽出 - SIFTとHOG - by Hironobu Fujiyoshi

Japanese
Scale-Invariant Feature Transform(SIFT) は,特徴点の検出と特徴量の記述を行うアルゴリズムである. 検出した特徴点に対して,画像の回転・スケール変化・照明変化等に頑健な特徴量を記述するため,イメージモザイク等の画像のマチングや物体認識・検出に用いられている. 本稿では,SIFT のアルゴリズムについて概説し,具体例としてSIFT を用いたアプリケーションや応用手法への展開について紹介する.また,SIFT と同様にgradient ベースの特徴抽出法であるHistograms of Oriented Gradients(HOG)のアルゴリズムとその応用例として人検出についても紹介する.
English
Scale-Invariant Feature Transform(SIFT) is an approach for detecting and extracting local feature descriptors that are reasonably invariant to changes in illumination, image noise, rotation, scaling, and small changes in viewpoint. Because the SIFT algorithm can describe characteristics of feature points that are invariant to scale and rotation changes, it has been used for image matching such as image mosaicing and generic object recognition. In this paper, we describe the SIFT algorithm and introduce applications that use it. We also describe another algorithm called “Histograms of Oriented Gradients(HOG)” which is based on gradient feature extraction similar to the SIFT algorithm. We also introduce an example of how HOG can be used for people detection.


PCSJ/IMPS2008 ナイトセッション

SIFT Documents

Date Title PDF PPT
2008.10.30 藤吉弘亘. "一般物体認識のための局所特徴量(SIFTとHOG)", 2008. PDF PPT

一般物体認識のための局所特徴量(SIFTとHOG) - by Hironobu Fujiyoshi

Japanese
一般物体認識問題として画像分類や物体検出の研究が盛んに取り組まれている。画像分類で用いられているBag-of-Keypointsというアプローチでは、局所特徴量として勾配情報から算出されるSIFT(Scale Invariant Feature Transform)が用いられている。SIFTは、スケール変化、回転変化に不変な特徴量を記述することができるため、特定物体認識だけでなく画像分類の特徴量として有効である。一方、歩行者認識等の物体検出においても、局所特徴量として勾配情報から算出する勾配方向ヒストグラムHOG(Histogram of Oriented Gradients)が用いられている。本チュートリアルでは、勾配情報から得られる局所特徴量としてSIFTとHOGのアルゴリズムについて紹介し、一般物体認識への利用方法について講演する。
English
Generic Object Recognition is one of the biggest problem in the research area of computer vision. Gradient-based local features such as SIFT and HOG are commonly used for object dection and object categorization. Scale-Invariant Feature Transform(SIFT) is an approach for detecting and extracting local feature descriptors that are reasonably invariant to changes in illumination, image noise, rotation, scaling, and small changes in viewpoint. Because the SIFT algorithm can describe characteristics of feature points that are invariant to scale and rotation changes, it has been used for image matching such as image mosaicing and generic object recognition. In this paper, we describe the SIFT algorithm and introduce applications that use it. We also describe another algorithm called ``Histograms of Oriented Gradients(HOG)'' which is based on gradient feature extraction similar to the SIFT algorithm. We also introduce an example of how the HOG algorithm can be used for people detection.



Fujiyoshi laboratory, Dept. of Computer Science, Chubu University.