論文の概要: Explainable Human-in-the-Loop Segmentation via Critic Feedback Signals
- arxiv url: http://arxiv.org/abs/2510.09945v1
- Date: Sat, 11 Oct 2025 01:16:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:29.706997
- Title: Explainable Human-in-the-Loop Segmentation via Critic Feedback Signals
- Title(参考訳): 批判的フィードバック信号による説明可能なHuman-in-the-Loopセグメンテーション
- Authors: Pouya Shaeri, Ryan T. Woo, Yasaman Mohammadpour, Ariane Middel,
- Abstract要約: セグメント化出力の人為的補正による介入学習を可能にする,ループ内対話型フレームワークを提案する。
筆者らのフレームワークは,挑戦的な立方体データに対して最大9mIoUポイントのセグメンテーション精度を向上させることを実証している。
この研究は、精度が高く、データセットバイアスに頑健で、データ効率が良く、都市気候モニタリングや自動運転といった現実世界の領域に適応可能なセグメンテーションシステムを構築するための、研究者や実践者のための実践的なフレームワークを提供する。
- 参考スコア(独自算出の注目度): 0.20999222360659608
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Segmentation models achieve high accuracy on benchmarks but often fail in real-world domains by relying on spurious correlations instead of true object boundaries. We propose a human-in-the-loop interactive framework that enables interventional learning through targeted human corrections of segmentation outputs. Our approach treats human corrections as interventional signals that show when reliance on superficial features (e.g., color or texture) is inappropriate. The system learns from these interventions by propagating correction-informed edits across visually similar images, effectively steering the model toward robust, semantically meaningful features rather than dataset-specific artifacts. Unlike traditional annotation approaches that simply provide more training data, our method explicitly identifies when and why the model fails and then systematically corrects these failure modes across the entire dataset. Through iterative human feedback, the system develops increasingly robust representations that generalize better to novel domains and resist artifactual correlations. We demonstrate that our framework improves segmentation accuracy by up to 9 mIoU points (12-15\% relative improvement) on challenging cubemap data and yields 3-4$\times$ reductions in annotation effort compared to standard retraining, while maintaining competitive performance on benchmark datasets. This work provides a practical framework for researchers and practitioners seeking to build segmentation systems that are accurate, robust to dataset biases, data-efficient, and adaptable to real-world domains such as urban climate monitoring and autonomous driving.
- Abstract(参考訳): セグメンテーションモデルは、ベンチマークで高い精度を達成するが、真のオブジェクト境界ではなく急激な相関に頼って、現実世界の領域で失敗することが多い。
セグメント化出力の人為的補正による介入学習を可能にする,ループ内対話型フレームワークを提案する。
提案手法は, 表面的特徴(例えば, 色, テクスチャ)が不適切であることを示す介入信号として, 人間の修正を扱います。
このシステムは、修正インフォームド編集を視覚的に類似した画像に伝達することで、これらの介入から学習し、データセット固有のアーティファクトではなく、堅牢で意味のある機能に向けてモデルを効果的に操縦する。
より多くのトレーニングデータを提供する従来のアノテーションアプローチとは異なり、我々の手法は、モデルがいつ、なぜ失敗したかを明確に識別し、データセット全体にわたってこれらの障害モードを体系的に修正する。
反復的な人間のフィードバックを通じて、新しいドメインをより一般化し、人工的相関に抵抗する、ますます堅牢な表現を開発する。
筆者らのフレームワークは,挑戦的な立方体マップデータに対して最大9mIoUポイント(12~15%の相対的改善)でセグメンテーション精度を向上し,ベンチマークデータセット上での競合性能を維持しつつ,標準的な再トレーニングと比較してアノテーションの労力を3~4ドル以上削減できることを実証した。
この研究は、精度が高く、データセットバイアスに頑健で、データ効率が良く、都市気候モニタリングや自動運転といった現実世界の領域に適応可能なセグメンテーションシステムを構築するための、研究者や実践者のための実践的なフレームワークを提供する。
関連論文リスト
- Exploring Generalized Gait Recognition: Reducing Redundancy and Noise within Indoor and Outdoor Datasets [24.242460774158463]
一般化歩行認識は、多様な領域にわたる堅牢なパフォーマンスを実現することを目的としている。
混合データセットトレーニングは一般化を高めるために広く利用されている。
クロスドメイン歩行認識を体系的に改善する統合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-21T06:46:09Z) - A Large-scale Benchmark on Geological Fault Delineation Models: Domain Shift, Training Dynamics, Generalizability, Evaluation and Inferential Behavior [11.859145373647474]
本研究は,地震解析における領域シフト戦略のガイドラインを提供するために設計された,最初の大規模ベンチマーク研究である。
私たちのベンチマークでは、モデルアーキテクチャ、データセット、トレーニング戦略を3つのデータセットで200以上組み合わせています。
我々の分析は、ソースとターゲットのデータセットが結合していない場合、一般的な微調整のプラクティスが破滅的な忘れを招きかねないことを示している。
論文 参考訳(メタデータ) (2025-05-13T13:56:43Z) - SMaRt: Improving GANs with Score Matching Regularity [114.43433222721025]
生成的敵ネットワーク(GAN)は通常、基礎となる多様体が複雑である非常に多様なデータから学ぶのに苦労する。
スコアマッチングは、生成したデータポイントを実データ多様体へ持続的にプッシュする能力のおかげで、この問題に対する有望な解決策であることがわかった。
提案手法は, 実世界のデータセットにおいて, 近似スコア関数として機能する事前学習拡散モデルを用いて, 最先端のGANの性能を継続的に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-11-30T03:05:14Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - One-Shot Domain Adaptive and Generalizable Semantic Segmentation with
Class-Aware Cross-Domain Transformers [96.51828911883456]
セマンティックセグメンテーションのための教師なしのsim-to-realドメイン適応(UDA)は、シミュレーションデータに基づいて訓練されたモデルの実世界のテスト性能を改善することを目的としている。
従来のUDAは、適応のためのトレーニング中に利用可能なラベルのない実世界のサンプルが豊富にあると仮定することが多い。
実世界のデータサンプルが1つしか利用できない,一発の教師なしシム・トゥ・リアル・ドメイン適応(OSUDA)と一般化問題について検討する。
論文 参考訳(メタデータ) (2022-12-14T15:54:15Z) - RAIS: Robust and Accurate Interactive Segmentation via Continual
Learning [16.382862088005087]
本稿では,対話型セグメンテーションと継続的学習のための堅牢で正確なアーキテクチャであるRAISを提案する。
テストセットを効率的に学習するために,グローバルパラメータとローカルパラメータを更新するための新しい最適化手法を提案する。
また,リモートセンシングと医用画像のデータセットにおけるロバスト性も示す。
論文 参考訳(メタデータ) (2022-10-20T03:05:44Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。