SIFT:なぜアラインメントを変えないのですか?

私はSIFTを勉強しています。私はLoweのアルゴリズムの中には少し混乱しています。

スケーリングのような変換に不変な記述子を持たせるには、LoG(ラプラシアン・オブ・ガウス)のスケーリング係数を取り除かなければなりません。私はLoGが次のように表されていることを知っています:

enter image description here

次に、スケール不変のLoGは次のようになります。

enter image description here

しかし、DoGはどのようにこのようになりますか?

enter image description here

言い換えれば、DoGを使って近似すると、SIFTでそのスケールファクタを取り除くことができます。私はDoGがどのように計算されているのか知っていますが、問題は、その要素を取り除いて、不変からスケールまでのLoG近似を持つ方法を理解できません。 正確な説明は本当に感謝しています。

編集:いくつかのより多くの質問は、正確に答えてください。ありがとう:-) 1- SIFTの最後のステップで、勾配方向を用いて特徴ベクトルを計算する。これを行うには、各方向からキーポイントの回転を差し引きます。なぜ私たちがそれらを引くのか理解できないのですか?

2 - 照明の依存関係はどうですか?

イルミネーションとオリエンテーションの依存関係をどのように取り除くのか誰でも説明できますか?

2

1 答え

DoGをLoGからどのように入手するのか、あなたはすでに知っていると思うので、私はそれ以上検討しません。

あなたの質問によると "DoGを使って近似する方法、私たちはSIFTでその倍率を取り除く"。 DoGは、与えられた画像(ブロブのような形)のブロブを検出するための特徴検出器として機能します。ここでは少しエッジ検出器です.DoGを使って検出されたブロブの写真です:

enter image description here

These blobs detected at different scales using the scale space pyramid. Using larger values of sigma you get bigger blobs. Experimentally DoG give you the best notion of scale as you can see here : enter image description here

したがって、実験的にDoGは、スケール空間を構築し、DoGを計算し、最後に極大点を抽出することによって、スケール不変の最も堅牢な特徴を提供します。

役に立つリンク:

1- Lecture PPT

2- Best known video lecture for SIFT

注:これはプロの答えではなく、私は他のフェローからもっと聞くことを望みます

1
追加された