Author: smly
smly

2025-07-24

7/14 に開催された Image Matching Challenge 2025 振り返り会で発表してきました。 Image Matching Challenge 2025 (IMC’25) は CVPR 2025 workshop 併設コンペティションとして、Kaggle 上で開催されました。

振り返り会では IMC’25 上位チームの発表があり、私も7位チームとして発表してきました。発表資料は以下 Speakerdeck にアップロードしています。(社内勉強会用に資料をアップデートしているため、当日の発表資料とは異なる部分があります。)

一番言ったかったこと

発表でしゃべりたかったことは RANSAC の 1981年の論文にある近似確率で実装されていた OSS 実装が多々あるなか、これを厳密確率に変えたという Fixing the RANSAC Stopping Criterion の話でした。非復元抽出を考慮しない近似確率から、数行の実装変更によって厳密確率に変更したという修正についてレポートが上がっています。よく気づいたな!

どんな感じだったか

振り返り会では多くの学びを得ることができました。特に、

  • シーンの種類(outdoor, indoor, natural)ごとに有効なアプローチに違いがあった
  • MASt3R のマッチング結果に加えて、RDD や GIM のマッチング結果を組み合わせることで大きな改善余地があった

という点が印象的でした。まだまだ深堀りの余地がたくさんありそうです。オープニングではワークショップの運営のメンバーである Dmytro Mishkin 氏からサプライズの温かいメッセージをいただきました。もし来年も開催されるならば、その時はもっと面白い結果を報告できるようにしたいとモチベーションが爆上がりしました。

3D基盤モデル、作りたいですよね?

懇親会ではシーンの種類ごとに傾向が異なるならばデータセットを作ってモデルを学習させればいいんじゃね?といった雑談などしていました。 例えば以下のような自然シーンではMASt3R はうまく3D復元できたりします(※ 失敗することもある)。

しかし全てのシーンでうまくいくわけではなく、当然ながら学習に使われたデータの傾向や、評価対象の難易度によって結果は大きく変わります。 過去のIMCでは出題されて今年のIMCでは扱われなかった(と思われる)シーンとして、航空写真の鳥瞰図的な視点の画像とのマッチングがあります。 AerialMageDepth のように応用にあわせてモデルをファインチューニングする事例もあり、データセット構築から独自の3D基盤モデルを作りたみがあります。衛星画像や航空写真が好きな身としてはワクワクが止まりません。余裕ができたら GPU 借りてでも最強のモデルを作っていきたい。

smly avatar Kohei Ozaki

Kohei Ozaki (smly)

KaggleとAI開発が好きなソフトウェアエンジニアです。詳しく読む