論文の概要: Fast computation of mutual information in the frequency domain with
applications to global multimodal image alignment
- arxiv url: http://arxiv.org/abs/2106.14699v1
- Date: Mon, 28 Jun 2021 13:27:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 18:02:46.653917
- Title: Fast computation of mutual information in the frequency domain with
applications to global multimodal image alignment
- Title(参考訳): 周波数領域における相互情報の高速計算と大域的マルチモーダル画像アライメントへの応用
- Authors: Johan \"Ofverstedt, Joakim Lindblad, Nata\v{s}a Sladoje
- Abstract要約: 情報理論における相互情報(MI)の概念は,多モードアライメントプロセスの導出のための類似度尺度として広く用いられている。
すべての離散空間変位に対する計算MIの効率的なアルゴリズムを提案する。
提案手法の有効性を3つのベンチマークデータセットで評価した。
- 参考スコア(独自算出の注目度): 3.584984184069584
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimodal image alignment is the process of finding spatial correspondences
between images formed by different imaging techniques or under different
conditions, to facilitate heterogeneous data fusion and correlative analysis.
The information-theoretic concept of mutual information (MI) is widely used as
a similarity measure to guide multimodal alignment processes, where most works
have focused on local maximization of MI that typically works well only for
small displacements; this points to a need for global maximization of MI, which
has previously been computationally infeasible due to the high run-time
complexity of existing algorithms. We propose an efficient algorithm for
computing MI for all discrete displacements (formalized as the cross-mutual
information function (CMIF)), which is based on cross-correlation computed in
the frequency domain. We show that the algorithm is equivalent to a direct
method while asymptotically superior in terms of run-time. Furthermore, we
propose a method for multimodal image alignment for transformation models with
few degrees of freedom (e.g. rigid) based on the proposed CMIF-algorithm. We
evaluate the efficacy of the proposed method on three distinct benchmark
datasets, of aerial images, cytological images, and histological images, and we
observe excellent success-rates (in recovering known rigid transformations),
overall outperforming alternative methods, including local optimization of MI
as well as several recent deep learning-based approaches. We also evaluate the
run-times of a GPU implementation of the proposed algorithm and observe
speed-ups from 100 to more than 10,000 times for realistic image sizes compared
to a GPU implementation of a direct method. Code is shared as open-source at
\url{github.com/MIDA-group/globalign}.
- Abstract(参考訳): マルチモーダル画像アライメント(multimodal image alignment)は、異種データ融合と相関解析を容易にするために、異なる撮像技術または異なる条件下で形成される画像間の空間対応を見つけるプロセスである。
相互情報(mi: information-theoretic concept of mutual information)は、多くの著作がmiの局所的最大化に焦点を合わせており、通常は小さな変位のみにのみ有効なmiの局所的最大化に焦点を当てているマルチモーダルアライメントプロセスを導くための類似性尺度として広く用いられている。
本稿では、周波数領域で計算された相互相関に基づく全ての離散変位(相互情報関数(CMIF)として形式化された)に対するMIの効率的な計算アルゴリズムを提案する。
このアルゴリズムは,実行時において漸近的に優れている一方,直接手法と等価であることを示す。
さらに,自由度の低い変換モデルのマルチモーダル画像アライメント法(例)を提案する。
剛性) 提案されたCMIFアルゴリズムに基づく。
提案手法の有効性を,航空画像,細胞画像,組織画像の3つの異なるベンチマークデータセットを用いて評価し,良好な成功率(既知の剛性変換の回復),MIの局所最適化,最近の深層学習に基づくアプローチなど,総合的に優れた代替手法を提案する。
また、提案アルゴリズムのGPU実装の実行時間を評価し、直接手法のGPU実装と比較して、現実的な画像サイズに対して100~10,000倍のスピードアップを観測する。
コードはオープンソースとして、 \url{github.com/MIDA-group/globalign}で共有されている。
関連論文リスト
- Fast and Scalable Semi-Supervised Learning for Multi-View Subspace Clustering [13.638434337947302]
FSSMSCは、既存のアプローチで一般的に見られる高い計算複雑性に対する新しいソリューションである。
この手法は、各データポイントを選択されたランドマークの疎線型結合として表現し、すべてのビューにまたがるコンセンサスアンカーグラフを生成する。
FSSMSCの有効性と効率は、様々なスケールの複数のベンチマークデータセットに対する広範な実験を通して検証される。
論文 参考訳(メタデータ) (2024-08-11T06:54:00Z) - Multiway Point Cloud Mosaicking with Diffusion and Global Optimization [74.3802812773891]
マルチウェイポイントクラウドモザイクのための新しいフレームワーク(水曜日)を紹介する。
我々のアプローチの核心は、重複を識別し、注意点を洗練する学習されたペアワイズ登録アルゴリズムODINである。
4つの多種多様な大規模データセットを用いて、我々の手法は、全てのベンチマークにおいて大きなマージンで、最先端のペアとローテーションの登録結果を比較した。
論文 参考訳(メタデータ) (2024-03-30T17:29:13Z) - QN-Mixer: A Quasi-Newton MLP-Mixer Model for Sparse-View CT Reconstruction [0.0]
準ニュートン法に基づくアルゴリズムQN-Mixerを導入する。
Incept-Mixerは非局所正規化用語として機能する効率的なニューラルネットワークである。
我々のアプローチは知的に情報をサンプリングし、計算要求を大幅に削減する。
論文 参考訳(メタデータ) (2024-02-28T00:20:25Z) - MB-RACS: Measurement-Bounds-based Rate-Adaptive Image Compressed Sensing Network [65.1004435124796]
本稿では,MB-RACS(Message-Bounds-based Rate-Adaptive Image Compressed Sensing Network)フレームワークを提案する。
実験により,提案手法が現在の先行手法を超越していることが実証された。
論文 参考訳(メタデータ) (2024-01-19T04:40:20Z) - Late Fusion Multi-view Clustering via Global and Local Alignment
Maximization [61.89218392703043]
マルチビュークラスタリング(MVC)は、異なるビューからの補完情報を最適に統合し、クラスタリング性能を改善する。
既存のアプローチの多くは、クラスタリングに最適な類似性行列を学ぶために、複数の事前定義された類似性を直接融合する。
これらの問題に対処するために、アライメントを通してレイトフュージョンMVCを提案する。
論文 参考訳(メタデータ) (2022-08-02T01:49:31Z) - Dual-Flow Transformation Network for Deformable Image Registration with
Region Consistency Constraint [95.30864269428808]
現在のディープラーニング(DL)ベースの画像登録アプローチは、畳み込みニューラルネットワークを利用して、ある画像から別の画像への空間変換を学習する。
一対のイメージ内のROIの類似性を最大化する領域整合性制約を持つ新しいデュアルフロー変換ネットワークを提案する。
4つの公開3次元MRIデータセットを用いた実験により,提案手法は精度と一般化において最高の登録性能が得られることを示した。
論文 参考訳(メタデータ) (2021-12-04T05:30:44Z) - Image-specific Convolutional Kernel Modulation for Single Image
Super-resolution [85.09413241502209]
本稿では,新しい画像特異的畳み込み変調カーネル(IKM)を提案する。
我々は、画像や特徴のグローバルな文脈情報を利用して、畳み込みカーネルを適応的に調整するための注意重みを生成する。
単一画像超解像実験により,提案手法は最先端手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-11-16T11:05:10Z) - Cross-Sim-NGF: FFT-Based Global Rigid Multimodal Alignment of Image
Volumes using Normalized Gradient Fields [3.584984184069584]
マルチモーダル画像アライメントは、外観と構造によって異なるボリューム間の空間的対応を見つけることを含む。
本稿では、周波数領域における正規化フィールド(NGF)の類似性を計算するための新しいアルゴリズムに基づいて、剛性多モード3次元画像アライメントのグローバル最適化手法を提案する。
論文 参考訳(メタデータ) (2021-10-19T15:28:37Z) - An Optimal Control Framework for Joint-channel Parallel MRI
Reconstruction without Coil Sensitivities [5.536263246814308]
離散時間最適制御フレームワークを組み込んだ新しいキャリブレーションフリー高速並列MRI (pMRI) 再構成法を開発した。
本稿では,画像空間とフーリエ空間における構造化マルチプレイヤー畳み込みネットワークを利用して,大きさ情報と位相情報を両立させることを提案する。
論文 参考訳(メタデータ) (2021-09-20T06:42:42Z) - LocalTrans: A Multiscale Local Transformer Network for Cross-Resolution
Homography Estimation [52.63874513999119]
クロスレゾリューション画像アライメントは、マルチスケールギガ撮影において重要な問題である。
既存のディープ・ホモグラフィー手法は、それらの間の対応の明示的な定式化を無視し、クロスレゾリューションの課題において精度が低下する。
本稿では,マルチモーダル入力間の対応性を明確に学習するために,マルチスケール構造内に埋め込まれたローカルトランスフォーマーネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-08T02:51:45Z) - Distributed Optimization, Averaging via ADMM, and Network Topology [0.0]
センサローカライゼーションの現実問題において,ネットワークトポロジと異なるアルゴリズムの収束率の関係について検討する。
また、ADMMと持ち上げマルコフ連鎖の間の興味深い関係を示すとともに、その収束を明示的に特徴づける。
論文 参考訳(メタデータ) (2020-09-05T21:44:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。