論文の概要: Ideal Observer for Segmentation of Dead Leaves Images
- arxiv url: http://arxiv.org/abs/2512.05539v1
- Date: Fri, 05 Dec 2025 08:53:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-13 22:40:56.97109
- Title: Ideal Observer for Segmentation of Dead Leaves Images
- Title(参考訳): 枯葉画像の分割のための理想的なオブザーバ
- Authors: Swantje Mahncke, Malte Ott,
- Abstract要約: 死葉」モデルでは、オブジェクトを重ね合わせて画像を生成する。
枯葉モデルは、オブジェクトの位置、形状、色、テクスチャの分布からなる生成モデルである。
我々は、独立した枯葉モデル分布に基づいて、与えられたピクセルの集合を分割する理想的なオブザーバを導出する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The human visual environment is comprised of different surfaces that are distributed in space. The parts of a scene that are visible at any one time are governed by the occlusion of overlapping objects. In this work we consider "dead leaves" models, which replicate these occlusions when generating images by layering objects on top of each other. A dead leaves model is a generative model comprised of distributions for object position, shape, color and texture. An image is generated from a dead leaves model by sampling objects ("leaves") from these distributions until a stopping criterion is reached, usually when the image is fully covered or until a given number of leaves was sampled. Here, we describe a theoretical approach, based on previous work, to derive a Bayesian ideal observer for the partition of a given set of pixels based on independent dead leaves model distributions. Extending previous work, we provide step-by-step explanations for the computation of the posterior probability as well as describe factors that determine the feasibility of practically applying this computation. The dead leaves image model and the associated ideal observer can be applied to study segmentation decisions in a limited number of pixels, providing a principled upper-bound on performance, to which humans and vision algorithms could be compared.
- Abstract(参考訳): 人間の視覚環境は異なる表面で構成されており、空間に分散している。
一度に見えるシーンの部分は、重なり合うオブジェクトの隠蔽によって管理される。
この研究では、オブジェクトを重ね合わせて画像を生成する際に、これらのオクルージョンを再現する「死の葉」モデルについて検討する。
枯葉モデルは、オブジェクトの位置、形状、色、テクスチャの分布からなる生成モデルである。
画像は、これらの分布からオブジェクト(リーブ)をサンプリングして枯れ葉モデルから生成され、停止基準に達するまで(通常、画像が完全にカバーされている場合や、所定の数の葉がサンプリングされるまで)。
ここでは、過去の研究に基づいて、独立な枯葉モデル分布に基づいて、与えられたピクセルの集合を分割するベイズ理想オブザーバを導出する理論的アプローチについて述べる。
先行研究を拡張して,後続確率の計算におけるステップバイステップの説明と,この計算を現実的に適用する可能性を決定する因子について述べる。
デッドリーフ画像モデルとそれに関連する理想オブザーバは、限られたピクセル数でセグメンテーション決定を研究するために適用することができ、人間と視覚アルゴリズムを比較可能な性能上の原則を提供する。
関連論文リスト
- Bayesian Inverse Graphics for Few-Shot Concept Learning [3.475273727432576]
最小限のデータのみを用いて学習するベイズ的知覚モデルを提案する。
本稿では、この表現が、数ショットの分類や推定などの下流タスクにどのように使用できるかを示す。
論文 参考訳(メタデータ) (2024-09-12T18:30:41Z) - DVMNet++: Rethinking Relative Pose Estimation for Unseen Objects [59.51874686414509]
既存のアプローチでは、通常、接地構造オブジェクト境界ボックスと、多数の離散仮説を持つ近似3次元回転を用いて3次元翻訳を予測している。
本稿では,1回のパスで相対オブジェクトのポーズを計算するDeep Voxel Matching Network (DVMNet++)を提案する。
提案手法は,最先端手法と比較して計算コストの低い新しいオブジェクトに対して,より正確な相対的ポーズ推定を行う。
論文 参考訳(メタデータ) (2024-03-20T15:41:32Z) - ZoDi: Zero-Shot Domain Adaptation with Diffusion-Based Image Transfer [13.956618446530559]
本稿では,ZoDiと呼ばれる拡散モデルに基づくゼロショット領域適応手法を提案する。
まず,原画像の領域を対象領域に転送することで,対象画像の合成にオフ・ザ・シェルフ拡散モデルを用いる。
次に、元の表現でソース画像と合成画像の両方を用いてモデルを訓練し、ドメイン・ロバスト表現を学習する。
論文 参考訳(メタデータ) (2024-03-20T14:58:09Z) - Ref-Diff: Zero-shot Referring Image Segmentation with Generative Models [68.73086826874733]
本稿では,画像分割を参照するための新しい参照拡散分割器(Referring Diffusional segmentor, Ref-Diff)を提案する。
提案生成器がなければ、生成モデルだけで既存のSOTAの弱教師付きモデルに匹敵する性能を達成できることを実証する。
このことは、生成モデルがこのタスクに有益であり、より優れたセグメンテーションを参照するために識別モデルを補完できることを示している。
論文 参考訳(メタデータ) (2023-08-31T14:55:30Z) - Probabilistic and Semantic Descriptions of Image Manifolds and Their
Applications [28.554065677506966]
画像は高次元空間の低次元多様体上にあると言うのが一般的である。
画像は多様体上に不均一に分布し、この分布を確率分布としてモデル化する方法を考案する。
多様体上の点を記述するために意味論的解釈がどのように用いられるかを示す。
論文 参考訳(メタデータ) (2023-07-06T09:36:45Z) - Foreground-Background Separation through Concept Distillation from
Generative Image Foundation Models [6.408114351192012]
本稿では, 簡単なテキスト記述から, 一般的な前景-背景セグメンテーションモデルの生成を可能にする新しい手法を提案する。
本研究では,4つの異なる物体(人間,犬,車,鳥)を分割する作業と,医療画像解析におけるユースケースシナリオについて述べる。
論文 参考訳(メタデータ) (2022-12-29T13:51:54Z) - DisPositioNet: Disentangled Pose and Identity in Semantic Image
Manipulation [83.51882381294357]
DisPositioNetは、シーングラフを用いた画像操作のタスクに対して、各オブジェクトのアンタングル表現を学習するモデルである。
我々のフレームワークは、グラフ内の特徴表現と同様に、変分潜在埋め込みの切り離しを可能にする。
論文 参考訳(メタデータ) (2022-11-10T11:47:37Z) - RelPose: Predicting Probabilistic Relative Rotation for Single Objects
in the Wild [73.1276968007689]
本稿では、任意のオブジェクトの複数の画像からカメラ視点を推定するデータ駆動手法について述べる。
本手法は, 画像の鮮明さから, 最先端のSfM法とSLAM法より優れていることを示す。
論文 参考訳(メタデータ) (2022-08-11T17:59:59Z) - Unsupervised Deep Learning Meets Chan-Vese Model [77.24463525356566]
本稿では,Chan-Vese(CV)モデルとディープニューラルネットワークを統合した教師なしのイメージセグメンテーション手法を提案する。
私たちの基本的な考え方は、イメージを潜伏空間にマッピングするディープニューラルネットワークを適用して、画像空間における断片的な定数仮定の違反を軽減することです。
論文 参考訳(メタデータ) (2022-04-14T13:23:57Z) - Self-Supervised Leaf Segmentation under Complex Lighting Conditions [14.290827361756108]
葉のセグメンテーションはイメージベース植物表現において必須の前提条件である。
本稿では,自己教師付きセマンティックセマンティックセマンティクスモデル,色に基づくリーフセマンティクスアルゴリズム,および自己教師型色補正モデルからなる自己教師型リーフセマンティクスフレームワークを提案する。
異なる植物種のデータセットに対する実験結果は、提案された自己管理フレームワークの可能性を示している。
論文 参考訳(メタデータ) (2022-03-29T22:59:02Z) - Shelf-Supervised Mesh Prediction in the Wild [54.01373263260449]
本研究では,物体の3次元形状とポーズを1つの画像から推定する学習手法を提案する。
まず、カメラのポーズとともに、標準フレーム内の体積表現を推定する。
粗い体積予測はメッシュベースの表現に変換され、予測されたカメラフレームでさらに洗練される。
論文 参考訳(メタデータ) (2021-02-11T18:57:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。