論文の概要: Novel OCT mosaicking pipeline with Feature- and Pixel-based registration
- arxiv url: http://arxiv.org/abs/2311.13052v1
- Date: Tue, 21 Nov 2023 23:25:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 16:43:45.783953
- Title: Novel OCT mosaicking pipeline with Feature- and Pixel-based registration
- Title(参考訳): 特徴量と画素数に基づく新しいoctモザイクイングパイプライン
- Authors: Jiacheng Wang, Hao Li, Dewei Hu, Yuankai K. Tao, Ipek Oguz
- Abstract要約: マルチビューOCT/OCTAテクスタイタン顔投影画像の縫合のための多目的パイプラインを提案する。
本手法は,複数の画像の整合性を向上するために,学習に基づく特徴マッチングと堅牢な画素ベース登録の長所を組み合わせる。
パイプラインの有効性は、社内データセットと大規模なパブリックデータセットを使用して検証される。
- 参考スコア(独自算出の注目度): 8.825027931444795
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-resolution Optical Coherence Tomography (OCT) images are crucial for
ophthalmology studies but are limited by their relatively narrow field of view
(FoV). Image mosaicking is a technique for aligning multiple overlapping images
to obtain a larger FoV. Current mosaicking pipelines often struggle with
substantial noise and considerable displacement between the input sub-fields.
In this paper, we propose a versatile pipeline for stitching multi-view
OCT/OCTA \textit{en face} projection images. Our method combines the strengths
of learning-based feature matching and robust pixel-based registration to align
multiple images effectively. Furthermore, we advance the application of a
trained foundational model, Segment Anything Model (SAM), to validate
mosaicking results in an unsupervised manner. The efficacy of our pipeline is
validated using an in-house dataset and a large public dataset, where our
method shows superior performance in terms of both accuracy and computational
efficiency. We also made our evaluation tool for image mosaicking and the
corresponding pipeline publicly available at
\url{https://github.com/MedICL-VU/OCT-mosaicking}.
- Abstract(参考訳): 高分解能光コヒーレンス断層撮影(oct)は眼科研究に不可欠であるが、比較的狭い視野(fov)で制限されている。
画像モザイク化(image mosaicking)は、複数の重なり合った画像を調整してより大きなfovを得る技術である。
現在のモザイクパイプラインは、入力サブフィールド間のかなりのノイズとかなりの変位に苦しむことが多い。
本稿では,マルチビュー OCT/OCTA \textit{en face} プロジェクションイメージを縫合するための汎用パイプラインを提案する。
本手法は,学習に基づく特徴マッチングと頑健な画素登録の長所を組み合わせることで,複数の画像を効果的に調整する。
さらに,モザイクの結果を教師なしで検証するために,訓練された基礎モデルSegment Anything Model(SAM)の適用を進めた。
このパイプラインの有効性は,社内データセットと大規模公開データセットを用いて検証され,精度と計算効率の両面で優れた性能を示す。
また,画像モザイク評価ツールや,それに対応するパイプラインを \url{https://github.com/MedICL-VU/OCT-mosaicking} で公開しました。
関連論文リスト
- MFCLIP: Multi-modal Fine-grained CLIP for Generalizable Diffusion Face Forgery Detection [64.29452783056253]
フォトリアリスティック・フェイスジェネレーション手法の急速な発展は、社会やアカデミックにおいて大きな関心を集めている。
既存のアプローチは主に画像モダリティを用いて顔の偽造パターンをキャプチャするが、きめ細かいノイズやテキストのような他のモダリティは完全には探索されていない。
そこで本研究では,画像ノイズの多点にわたる包括的かつきめ細かなフォージェリートレースをマイニングする,MFCLIP(MF-modal Fine-fine-fine-fine-fine-fine CLIP)モデルを提案する。
論文 参考訳(メタデータ) (2024-09-15T13:08:59Z) - Exploring Multi-view Pixel Contrast for General and Robust Image Forgery Localization [4.8454936010479335]
本稿では,画像フォージェリーローカライゼーションのための多視点Pixel-wise Contrastive Algorithm (MPC)を提案する。
具体的には、まず、教師付きコントラスト損失を伴うバックボーンネットワークを事前訓練する。
次に、クロスエントロピー損失を用いてローカライゼーションヘッドを微調整し、ピクセルローカライザを改良する。
論文 参考訳(メタデータ) (2024-06-19T13:51:52Z) - PTA: Enhancing Multimodal Sentiment Analysis through Pipelined Prediction and Translation-based Alignment [17.70859235594373]
マルチモーダル・アスペクトベース感情分析(MABSA)は、意見のきめ細かい理解を目的としている。
伝統的に、MABSA法は側面と感情を同時に識別するために共同予測手法を用いている。
本稿では、まずその側面を予測し、次に翻訳に基づくアライメント(TBA)を用いて、画像利用を改善するためにマルチモーダルなセマンティック一貫性を向上させるパイプラインフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-23T01:16:45Z) - PROMPT-IML: Image Manipulation Localization with Pre-trained Foundation
Models Through Prompt Tuning [35.39822183728463]
本稿では,改ざん画像を検出するための新しいPrompt-IMLフレームワークを提案する。
人間は、意味情報と高周波情報に基づいて、画像の真偽を識別する傾向がある。
我々のモデルは8つの典型的なフェイク画像データセットでより良い性能を得ることができる。
論文 参考訳(メタデータ) (2024-01-01T03:45:07Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [63.54342601757723]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - Affinity Feature Strengthening for Accurate, Complete and Robust Vessel
Segmentation [48.638327652506284]
血管セグメンテーションは、冠動脈狭窄、網膜血管疾患、脳動脈瘤などの多くの医学的応用において重要である。
コントラストに敏感なマルチスケールアフィニティアプローチを用いて,幾何学的手法と画素単位のセグメンテーション特徴を連成的にモデル化する新しいアプローチであるAFNを提案する。
論文 参考訳(メタデータ) (2022-11-12T05:39:17Z) - MC-Blur: A Comprehensive Benchmark for Image Deblurring [127.6301230023318]
ほとんどの実世界の画像では、ブラーは動きやデフォーカスなど様々な要因によって引き起こされる。
我々は,MC-Blurと呼ばれる大規模マルチライク画像デブロアリングデータセットを新たに構築する。
MC-Blurデータセットに基づいて,異なるシナリオにおけるSOTA法の比較を行う。
論文 参考訳(メタデータ) (2021-12-01T02:10:42Z) - Learning Contrastive Representation for Semantic Correspondence [150.29135856909477]
セマンティックマッチングのためのマルチレベルコントラスト学習手法を提案する。
画像レベルのコントラスト学習は、畳み込み特徴が類似したオブジェクト間の対応を見出すための鍵となる要素であることを示す。
論文 参考訳(メタデータ) (2021-09-22T18:34:14Z) - LocalTrans: A Multiscale Local Transformer Network for Cross-Resolution
Homography Estimation [52.63874513999119]
クロスレゾリューション画像アライメントは、マルチスケールギガ撮影において重要な問題である。
既存のディープ・ホモグラフィー手法は、それらの間の対応の明示的な定式化を無視し、クロスレゾリューションの課題において精度が低下する。
本稿では,マルチモーダル入力間の対応性を明確に学習するために,マルチスケール構造内に埋め込まれたローカルトランスフォーマーネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-08T02:51:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。