論文の概要: Uncertainty in Minimum Cost Multicuts for Image and Motion Segmentation
- arxiv url: http://arxiv.org/abs/2105.07469v1
- Date: Sun, 16 May 2021 16:22:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-18 15:07:27.870463
- Title: Uncertainty in Minimum Cost Multicuts for Image and Motion Segmentation
- Title(参考訳): 画像・動き分割のための最小コストマルチカットの不確かさ
- Authors: Amirhossein Kardoost and Margret Keuper
- Abstract要約: 最小コストリフトマルチカットアプローチは、幅広い用途で実質的に優れた性能を証明しています。
最適化中に行われた決定の不確実性の尺度を提供する。
- 参考スコア(独自算出の注目度): 11.295032417617456
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The minimum cost lifted multicut approach has proven practically good
performance in a wide range of applications such as image decomposition, mesh
segmentation, multiple object tracking, and motion segmentation. It addresses
such problems in a graph-based model, where real-valued costs are assigned to
the edges between entities such that the minimum cut decomposes the graph into
an optimal number of segments. Driven by a probabilistic formulation of minimum
cost multicuts, we provide a measure for the uncertainties of the decisions
made during the optimization. We argue that access to such uncertainties is
crucial for many practical applications and conduct an evaluation by means of
sparsifications on three different, widely used datasets in the context of
image decomposition (BSDS-500) and motion segmentation (DAVIS2016 and FBMS59)
in terms of variation of information (VI) and Rand index (RI).
- Abstract(参考訳): 最小コスト引き上げマルチカットアプローチは、画像分解、メッシュセグメンテーション、複数オブジェクト追跡、モーションセグメンテーションといった幅広いアプリケーションにおいて、実質的に優れた性能を示している。
グラフベースのモデルでは、最小カットがグラフを最適なセグメント数に分解するように、エンティティ間のエッジに実際の値のコストを割り当てる。
最小コストのマルチカットを確率論的に定式化することで,最適化時の決定の不確実性を評価する。
画像分解(bsds-500)とモーションセグメンテーション(davis2016,fbms59)の文脈において,情報変動(vi)とランド指数(ri)の3つの異なる広範に使用されるデータセットのスパーシフィケーションによって,このような不確実性へのアクセスは,多くの実用的応用において不可欠である。
関連論文リスト
- MIA-DPO: Multi-Image Augmented Direct Preference Optimization For Large Vision-Language Models [85.30735602813093]
Multi-Image Augmented Direct Preference Optimization (MIA-DPO)は、マルチイメージ入力を効果的に処理する視覚的嗜好アライメントアプローチである。
MIA-DPOは、グリッドコラージュやピクチャ・イン・ピクチャ形式で配置された無関係な画像で単一の画像データを拡張することにより、多様なマルチイメージトレーニングデータの不足を軽減する。
論文 参考訳(メタデータ) (2024-10-23T07:56:48Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Interpretable Small Training Set Image Segmentation Network Originated
from Multi-Grid Variational Model [5.283735137946097]
深層学習法 (DL) が提案され, 画像分割に広く利用されている。
DLメソッドは通常、トレーニングデータとして大量の手動セグメントデータを必要とし、解釈性に乏しい。
本稿では,MSモデルにおける手作り正則項をデータ適応型一般化可学習正則項に置き換える。
論文 参考訳(メタデータ) (2023-06-25T02:34:34Z) - Modeling Multimodal Aleatoric Uncertainty in Segmentation with Mixture
of Stochastic Expert [24.216869988183092]
入力画像にあいまいさが存在する場合、セグメンテーションにおけるデータ独立不確実性(いわゆるアレタリック不確実性)を捉えることに重点を置いている。
本稿では,各専門家ネットワークがアレータティック不確実性の異なるモードを推定する,新しい専門家モデル(MoSE)を提案する。
We developed a Wasserstein-like loss that makes direct minimizes the distribution distance between the MoSE and ground truth annotations。
論文 参考訳(メタデータ) (2022-12-14T16:48:21Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - A Baseline Statistical Method For Robust User-Assisted Multiple
Segmentation [0.0]
そこで本稿では,異なる入力タイプや量を扱える,シンプルで効果的な統計的セグメンテーション手法を提案する。
提案手法はロバストな仮説テスト、特にDGLテストに基づいており、画像領域の画素数と2乗数で線形な時間的複雑さで実装することができる。
論文 参考訳(メタデータ) (2022-01-08T06:55:45Z) - High Quality Segmentation for Ultra High-resolution Images [72.97958314291648]
超高分解能セグメンテーション精錬作業のための連続精細モデルを提案する。
提案手法は画像分割精細化において高速かつ効果的である。
論文 参考訳(メタデータ) (2021-11-29T11:53:06Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z) - Robust Submodular Minimization with Applications to Cooperative Modeling [0.0]
本稿では,制約を考慮したロバストな部分モジュラー最小化問題について検討する。
制約付き部分モジュラー最小化は、画像セグメンテーションにおける協調的カット、画像対応における協調的マッチングなど、いくつかの応用で発生する。
論文 参考訳(メタデータ) (2020-01-25T20:40:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。