論文の概要: Active Annotation of Informative Overlapping Frames in Video Mosaicking
Applications
- arxiv url: http://arxiv.org/abs/2012.15343v1
- Date: Wed, 30 Dec 2020 22:19:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-18 08:34:37.219526
- Title: Active Annotation of Informative Overlapping Frames in Video Mosaicking
Applications
- Title(参考訳): ビデオモザイクアプリケーションにおける情報重なりフレームのアクティブアノテーション
- Authors: Loic Peter, Marcel Tella-Amo, Dzhoshkun Ismail Shakir, Jan Deprest,
Sebastien Ourselin, Juan Eugenio Iglesias, Tom Vercauteren
- Abstract要約: シーケンス内での長距離ペアワイズ対応のアクティブアノテーションのための効率的なフレームワークを紹介します。
当社のフレームワークでは,oracleエージェントに情報提供を求めるイメージのペアを提案しています。
モザイクの効率的な構築に加えて、我々の枠組みは副産物として、地上の真実のランドマーク対応を提供する。
- 参考スコア(独自算出の注目度): 3.5544725140884936
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Video mosaicking requires the registration of overlapping frames located at
distant timepoints in the sequence to ensure global consistency of the
reconstructed scene. However, fully automated registration of such long-range
pairs is (i) challenging when the registration of images itself is difficult;
and (ii) computationally expensive for long sequences due to the large number
of candidate pairs for registration. In this paper, we introduce an efficient
framework for the active annotation of long-range pairwise correspondences in a
sequence. Our framework suggests pairs of images that are sought to be
informative to an oracle agent (e.g., a human user, or a reliable matching
algorithm) who provides visual correspondences on each suggested pair.
Informative pairs are retrieved according to an iterative strategy based on a
principled annotation reward coupled with two complementary and online
adaptable models of frame overlap. In addition to the efficient construction of
a mosaic, our framework provides, as a by-product, ground truth landmark
correspondences which can be used for evaluation or learning purposes. We
evaluate our approach in both automated and interactive scenarios via
experiments on synthetic sequences, on a publicly available dataset for aerial
imaging and on a clinical dataset for placenta mosaicking during fetal surgery.
- Abstract(参考訳): ビデオモザイクは、再建されたシーンのグローバルな一貫性を確保するために、シーケンス内の遠くのタイムポイントに位置する重なり合うフレームを登録する必要がある。
しかし,このような長距離ペアの完全自動登録は,画像自体の登録が困難である場合には困難である。
本稿では,配列内の長距離対対応のアクティブアノテーションのための効率的なフレームワークを提案する。
当社のフレームワークでは,提案する各ペアに視覚的対応を提供するoracleエージェント(例えば,人間ユーザや信頼できるマッチングアルゴリズム)に情報提供を求めるイメージのペアを提案している。
フレームオーバーラップの2つの相補的およびオンライン適応可能なモデルと組み合わせた、原則付きアノテーション報酬に基づく反復戦略に基づいて、インフォーマティブペアを検索する。
モザイクの効率的な構築に加えて、我々のフレームワークは、評価や学習目的で使用できる副産物として、地上の真実のランドマーク対応を提供する。
本手法は, 人工的およびインタラクティブなシナリオにおいて, 合成配列の実験, 航空画像用データセット, 胎児手術時の胎盤モザイク用臨床データセットを用いて評価した。
関連論文リスト
- One registration is worth two segmentations [12.163299991979574]
画像登録の目的は、2つ以上の画像間の空間的対応を確立することである。
そこで我々は,より直感的な対応表現として,対応する関心領域(ROI)ペアの集合を提案する。
提案したSAMRegは複数のROIペアのセグメンテーションとマッチングが可能であることを示す。
論文 参考訳(メタデータ) (2024-05-17T16:14:32Z) - Matching in the Wild: Learning Anatomical Embeddings for Multi-Modality
Images [28.221419419614183]
放射線療法士は、両方のモダリティからの情報を効果的に活用するために、MR/CT画像の正確な登録を必要とする。
近年の学習に基づく手法は, 剛体/ファインステップにおいて有望な結果を示した。
そこで我々は,クロスモダリティマッチングを可能にするCross-SAMと呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2023-07-07T11:49:06Z) - Self-Supervised Correspondence Estimation via Multiview Registration [88.99287381176094]
ビデオは、視覚学習に必要な同期時間一貫性を提供します。
近年のアプローチでは、この信号を用いて、近接フレーム対からの対応推定を学習している。
短いRGB-Dビデオシーケンスにおけるマルチビュー一貫性から学習する対応推定のための自己教師付きアプローチを提案する。
論文 参考訳(メタデータ) (2022-12-06T18:59:02Z) - Correspondence Matters for Video Referring Expression Comprehension [64.60046797561455]
ビデオ参照表現(REC)は、文章に記述された参照オブジェクトをビデオフレーム内の視覚領域にローカライズすることを目的としている。
既存の手法では,1)ビデオフレーム間の非一貫性な局所化結果,2)参照オブジェクトとコンテキストオブジェクトの混同という2つの問題に悩まされている。
本稿では、フレーム間およびクロスモーダルの両方で密接な関連性を明確に強化する新しいデュアル対応ネットワーク(DCNet)を提案する。
論文 参考訳(メタデータ) (2022-07-21T10:31:39Z) - HighlightMe: Detecting Highlights from Human-Centric Videos [52.84233165201391]
我々は,人間中心のビデオからハイライト可能な抜粋を検出するために,ドメインとユーザに依存しないアプローチを提案する。
本研究では,時空間グラフ畳み込みを用いたオートエンコーダネットワークを用いて,人間の活動やインタラクションを検出する。
我々は,最先端の手法に比べて,人手によるハイライトのマッチングの平均精度が4~12%向上したことを観察した。
論文 参考訳(メタデータ) (2021-10-05T01:18:15Z) - Modelling Neighbor Relation in Joint Space-Time Graph for Video
Correspondence Learning [53.74240452117145]
本稿では、ラベルなしビデオから信頼できる視覚対応を学習するための自己教師付き手法を提案する。
接続時空間グラフでは,ノードがフレームからサンプリングされたグリッドパッチであり,2種類のエッジによってリンクされる。
学習した表現は、様々な視覚的タスクにおいて最先端の自己監督手法よりも優れています。
論文 参考訳(メタデータ) (2021-09-28T05:40:01Z) - Deep Group-wise Variational Diffeomorphic Image Registration [3.0022455491411653]
本稿では,複数の画像の同時登録を可能にするために,現在の学習ベース画像登録を拡張することを提案する。
本稿では,複数の画像の粘性測地線平均への登録と,利用可能な画像のいずれかを固定画像として使用可能な登録を両立できる汎用的な数学的枠組みを提案する。
論文 参考訳(メタデータ) (2020-10-01T07:37:28Z) - MvMM-RegNet: A new image registration framework based on multivariate
mixture model and neural network estimation [14.36896617430302]
生成モデル(MvMM)とニューラルネットワーク推定に基づく新しい画像登録フレームワークを提案する。
外観と解剖情報を一体化した生成モデルを構築し、グループ登録が可能な新規な損失関数を導出する。
マルチモーダル心画像への様々な応用のためのフレームワークの汎用性を強調した。
論文 参考訳(メタデータ) (2020-06-28T11:19:15Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。