論文の概要: FastJAM: a Fast Joint Alignment Model for Images
- arxiv url: http://arxiv.org/abs/2510.22842v1
- Date: Sun, 26 Oct 2025 21:21:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.391497
- Title: FastJAM: a Fast Joint Alignment Model for Images
- Title(参考訳): FastJAM:画像の高速関節アライメントモデル
- Authors: Omri Hirsch, Ron Shapira Weber, Shira Ifergane, Oren Freifeld,
- Abstract要約: 画像の結合アライメントは、画像の集合を、対応する空間的位置において意味的に類似した特徴が現れるように、統一された座標フレームに整列することを目的としている。
我々は,関節アライメントタスクの計算量を大幅に削減する高速グラフベース手法であるFastJAMを紹介する。
- 参考スコア(独自算出の注目度): 10.522943649619426
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Joint Alignment (JA) of images aims to align a collection of images into a unified coordinate frame, such that semantically-similar features appear at corresponding spatial locations. Most existing approaches often require long training times, large-capacity models, and extensive hyperparameter tuning. We introduce FastJAM, a rapid, graph-based method that drastically reduces the computational complexity of joint alignment tasks. FastJAM leverages pairwise matches computed by an off-the-shelf image matcher, together with a rapid nonparametric clustering, to construct a graph representing intra- and inter-image keypoint relations. A graph neural network propagates and aggregates these correspondences, efficiently predicting per-image homography parameters via image-level pooling. Utilizing an inverse-compositional loss, that eliminates the need for a regularization term over the predicted transformations (and thus also obviates the hyperparameter tuning associated with such terms), FastJAM performs image JA quickly and effectively. Experimental results on several benchmarks demonstrate that FastJAM achieves results better than existing modern JA methods in terms of alignment quality, while reducing computation time from hours or minutes to mere seconds. Our code is available at our project webpage, https://bgu-cs-vil.github.io/FastJAM/
- Abstract(参考訳): 画像の結合アライメント(JA)は、画像の集合を、対応する空間的位置において意味的に類似した特徴が現れるように、統一された座標フレームに整列することを目的としている。
既存のアプローチの多くは、長いトレーニング時間、大容量モデル、広範囲なハイパーパラメータチューニングを必要とすることが多い。
我々は,関節アライメントタスクの計算量を大幅に削減する高速グラフベース手法であるFastJAMを紹介する。
FastJAMは、オフザシェルフ画像マーカによって計算されたペアワイズマッチングと、高速な非パラメトリッククラスタリングを利用して、画像内および画像間キーポイント関係を表すグラフを構築する。
グラフニューラルネットワークは、これらの対応を伝播して集約し、画像レベルのプーリングを通じて画像ごとのホモグラフィパラメータを効率的に予測する。
逆合成損失を用いることで、予測された変換に対する正規化項が不要になる(したがって、そのような項に付随するハイパーパラメータチューニングが不要になる)ため、FastJAMは画像JAを迅速かつ効果的に実行する。
いくつかのベンチマーク実験の結果、FastJAMは、計算時間を数時間から数分からほんの秒に短縮しつつ、アライメント品質の観点から、既存のJA手法よりも優れた結果が得られることが示された。
私たちのコードはプロジェクトのWebページ、https://bgu-cs-vil.github.io/FastJAM/で利用可能です。
関連論文リスト
- Hierarchical Scheduling for Multi-Vector Image Retrieval [17.023146933530484]
HiMIRは画像検索のための効率的なスケジューリングフレームワークである。
本稿では,画像オブジェクトのアライメントを高めるために,複数の中間粒度を用いた新しい階層的パラダイムを提案する。
実験により,HMIRは精度を向上するだけでなく,既存のMVRシステムに比べて最大3.5倍の計算量を削減できることがわかった。
論文 参考訳(メタデータ) (2025-10-10T03:36:18Z) - Speedy MASt3R [68.47052557089631]
MASt3Rは、DUSt3Rを活用して高速な相互マッチング方式を導入することで、画像マッチングを3Dタスクとして再定義する。
高速MASt3Rは、精度を犠牲にすることなく、推論時間(画像ペアあたり198msから91ms)を54%削減する。
この進歩により、リアルタイムな3D理解が可能になり、複合現実ナビゲーションや大規模3Dシーン再構築といったアプリケーションに恩恵をもたらす。
論文 参考訳(メタデータ) (2025-03-13T03:56:22Z) - Cross-Modal Mapping: Mitigating the Modality Gap for Few-Shot Image Classification [13.238769012534922]
画像分類のための新しいクロスモーダルマッピング(CMM)手法を提案する。
CMMは、画像特徴とテキスト特徴空間を線形変換により整列する。
11のベンチマークデータセットでは、Top-1の平均精度が1.06%向上している。
論文 参考訳(メタデータ) (2024-12-28T10:40:21Z) - Fast constrained sampling in pre-trained diffusion models [80.99262780028015]
任意の制約下で高速で高品質な生成を可能にするアルゴリズムを提案する。
我々の手法は、最先端のトレーニングフリー推論手法に匹敵するか、超越した結果をもたらす。
論文 参考訳(メタデータ) (2024-10-24T14:52:38Z) - SpaceJAM: a Lightweight and Regularization-free Method for Fast Joint Alignment of Images [9.099291890744201]
教師なしの関節アライメントは、高複雑性、幾何学的歪み、局所的あるいは大域的最適性への収束といった課題によって特徴づけられる。
本稿では,JA タスクに効率と簡易さで対処する新しいアプローチである SpaceJAM について紹介する。
論文 参考訳(メタデータ) (2024-07-16T15:32:39Z) - Image-GS: Content-Adaptive Image Representation via 2D Gaussians [52.598772767324036]
本稿では,2次元ガウス放射率に基づくコンテンツ適応型画像表現であるImage-GSを紹介する。
リアルタイム使用のためにハードウェアフレンドリーな高速アクセスをサポートし、ピクセルをデコードするためには0.3KのMACしか必要としない。
テクスチャ圧縮、セマンティクス対応圧縮、共同画像圧縮と復元など、いくつかのアプリケーションでその汎用性を実証する。
論文 参考訳(メタデータ) (2024-07-02T00:45:21Z) - RTMO: Towards High-Performance One-Stage Real-Time Multi-Person Pose Estimation [46.659592045271125]
RTMOは座標分類をシームレスに統合する一段階のポーズ推定フレームワークである。
高速を維持しながらトップダウン手法に匹敵する精度を達成する。
私たちの最大のモデルであるRTMO-lは、COCO val 2017で74.8%AP、1つのV100 GPUで141FPSを実現しています。
論文 参考訳(メタデータ) (2023-12-12T18:55:29Z) - Searching a Compact Architecture for Robust Multi-Exposure Image Fusion [55.37210629454589]
2つの大きなスタブリングブロックは、画素の不一致や非効率な推論など、開発を妨げる。
本研究では,高機能なマルチ露光画像融合のための自己アライメントとディテールリプレクションモジュールを取り入れたアーキテクチャ検索に基づくパラダイムを提案する。
提案手法は様々な競争方式より優れており、一般的なシナリオではPSNRが3.19%向上し、不整合シナリオでは23.5%向上した。
論文 参考訳(メタデータ) (2023-05-20T17:01:52Z) - {\mu}Split: efficient image decomposition for microscopy data [50.794670705085835]
muSplitは、蛍光顕微鏡画像の文脈で訓練された画像分解のための専用アプローチである。
本稿では,大規模な画像コンテキストのメモリ効率向上を実現するメタアーキテクチャである横型文脈化(LC)を提案する。
muSplitを5つの分解タスクに適用し、1つは合成データセットに、もう4つは実際の顕微鏡データから導出する。
論文 参考訳(メタデータ) (2022-11-23T11:26:24Z) - Inverted Semantic-Index for Image Retrieval [3.751222656656264]
逆インデックスは、簡潔で正確な候補リストを生成する、より微細なパーティションを構築することを目的としている。
本稿では,コードブック構築時にクラスタリング手法を画像分類に置き換える。
我々は、PQ圧縮による精度損失を軽減するために、セマンティックインデックスと製品量子化(PQ)を組み合わせる。
論文 参考訳(メタデータ) (2022-06-25T11:21:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。