論文の概要: Whose Is This?: Context-Aware Object Ownership Inference with Uncertainty-Guided Questioning
- arxiv url: http://arxiv.org/abs/2605.28087v1
- Date: Wed, 27 May 2026 07:43:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.853585
- Title: Whose Is This?: Context-Aware Object Ownership Inference with Uncertainty-Guided Questioning
- Title(参考訳): これは誰なのか?:不確実なガイド付き質問によるコンテキスト認識オブジェクトのオーナシップ推論
- Authors: Saki Hashimoto, Akira Taniguchi, Shoichi Hasegawa, Yoshinobu Hagiwara, Tadahiro Taniguchi,
- Abstract要約: サービスロボットは、"bring me my cup"のような指示を正しく解釈するために、オブジェクトの所有権を推論しなければならない。
不確実性誘導相互作用(COIN)を用いたコンテキスト認識型オーナシップ推論のためのフレームワークを提案する。
- 参考スコア(独自算出の注目度): 6.763690463901024
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Service robots must infer object ownership to correctly interpret instructions such as "bring me my cup." However, ownership is a latent attribute that cannot be directly observed, and existing methods often rely on limited cues such as recent usage, making them unreliable in scenarios such as temporary sharing. We propose a framework for context-aware ownership inference with uncertainty-guided interaction (COIN). The method integrates user background information and object usage history using a large language model (LLM) to estimate ownership scores. To handle uncertainty, we apply conformal prediction to construct a set of plausible owners and selectively generate user queries when the prediction is uncertain. Experiments in a simulated home environment show that the proposed method consistently outperforms baseline approaches, achieving a Subset Accuracy of 0.988 and a Mean Jaccard index of 0.991. The method also maintains high performance in scenarios involving temporary use and shared ownership. The results demonstrate that combining contextual reasoning with uncertainty-aware interaction improves both estimation accuracy and robustness. The project page is available at https://emergentsystemlabstudent.github.io/COIN/.
- Abstract(参考訳): サービスロボットは、オブジェクトの所有権を推論し、「私のカップをください」といった指示を正しく解釈する必要があります。
しかし、オーナシップは直接観察できない潜在属性であり、既存のメソッドは最近の使用法のような限られた手段に依存することが多く、一時的な共有のようなシナリオでは信頼できない。
本研究では,不確実性誘導相互作用(COIN)を用いたコンテキスト認識型オーナシップ推論のためのフレームワークを提案する。
本手法は,大規模言語モデル(LLM)を用いてユーザ背景情報とオブジェクト使用履歴を統合し,オーナシップスコアを推定する。
不確実性に対処するため、我々はコンフォーマル予測を適用し、予測が不確実である場合にユーザクエリを選択的に生成する。
シミュレーションした家庭環境における実験により,提案手法はベースラインアプローチを一貫して上回り,サブセット精度0.988,平均ジャカード指数0.991を達成した。
また、一時的な使用や共有オーナシップを含むシナリオで高いパフォーマンスを維持する。
その結果、文脈推論と不確実性を考慮した相互作用を組み合わせることにより、推定精度とロバスト性の両方が向上することが示された。
プロジェクトページはhttps://emergentsystemlabstudent.github.io/COIN/で公開されている。
関連論文リスト
- Representation-Level Counterfactual Calibration for Debiased Zero-Shot Recognition [36.36218470387896]
私たちはこの問題を因果推論問題として再考し、次のような質問をした。
推測時にこれを答えるために、CLIPの表現空間内のオブジェクトと背景の期待値を推定し、反ファクトの埋め込みを合成する。
提案手法は,再訓練や即時設計を伴わず,文脈に敏感なベンチマークにおいて,最悪のグループと平均精度の両方を著しく改善する。
論文 参考訳(メタデータ) (2025-10-30T13:11:23Z) - LLM Microscope: What Model Internals Reveal About Answer Correctness and Context Utilization [9.410181019585822]
我々は、モデル出力の正しさを予測できるかどうかを確認するために、解釈可能性法を運用する。
私たちは正しい、間違った、無関係なコンテキストを考え、それらを区別するためのメトリクスを導入します。
モデル内部のメトリクスは、正しいコンテキストと不正確なコンテキストを区別する基準線を著しく上回る。
論文 参考訳(メタデータ) (2025-10-05T03:14:05Z) - Cycles of Thought: Measuring LLM Confidence through Stable Explanations [53.15438489398938]
大規模言語モデル(LLM)は、様々なベンチマークで人間レベルの精度に到達し、さらに超えることができるが、不正確な応答における過度な自信は、依然として十分に文書化された障害モードである。
本稿では,LLMの不確実性を測定するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-05T16:35:30Z) - Uncertainty-boosted Robust Video Activity Anticipation [72.14155465769201]
ビデオアクティビティの予測は、ロボットビジョンから自動運転まで幅広い応用可能性を受け入れることで、将来何が起こるかを予測することを目的としている。
近年の進展にもかかわらず、コンテンツ進化過程やイベントラベルの動的相関として反映されたデータ不確実性問題は、何らかの形で無視されている。
本研究では,予測結果の信頼性を示す不確実な値を生成する,不確実性を考慮した頑健なビデオアクティビティ予測フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-29T12:31:38Z) - Mitigating LLM Hallucinations via Conformal Abstention [70.83870602967625]
我々は,大言語モデルが一般ドメインでの応答をいつ無視すべきかを決定するための,原則化された手順を開発する。
我々は、幻覚率(エラー率)の厳密な理論的保証の恩恵を受けるため、共形予測手法を活用して、禁忌手順を開発する。
実験によって得られた共形禁忌法は, 種々の閉書, オープンドメイン生成質問応答データセットに, 幻覚率を確実に拘束する。
論文 参考訳(メタデータ) (2024-04-04T11:32:03Z) - Improving Adaptive Conformal Prediction Using Self-Supervised Learning [72.2614468437919]
我々は、既存の予測モデルの上に自己教師付きプレテキストタスクを持つ補助モデルを訓練し、自己教師付きエラーを付加的な特徴として用いて、非整合性スコアを推定する。
合成データと実データの両方を用いて、効率(幅)、欠陥、共形予測間隔の超過といった付加情報の利点を実証的に実証する。
論文 参考訳(メタデータ) (2023-02-23T18:57:14Z) - Birds of a Feather Trust Together: Knowing When to Trust a Classifier
via Adaptive Neighborhood Aggregation [30.34223543030105]
我々は、NeighborAggがアダプティブ近隣アグリゲーションを介して2つの重要な情報を利用する方法を示す。
また, 誤り検出の密接な関連課題へのアプローチを拡張し, 偽陰性境界に対する理論的カバレッジを保証する。
論文 参考訳(メタデータ) (2022-11-29T18:43:15Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Bayesian deep learning of affordances from RGB images [5.939410304994348]
本稿では,RGB画像から直接,環境の可利用性を予測するための深層学習手法を提案する。
社会的に受け入れられた価格に関するこれまでの研究に基づいて,本モデルでは,対象物と全画像の局所的・グローバル的情報を組み合わせたマルチスケールCNNをベースとした。
以上の結果から,Brierスコアと予測誤差のMC-dropoutと比較すると,深層アンサンブルの限界性能が向上した。
論文 参考訳(メタデータ) (2021-09-27T07:39:47Z) - Learning Uncertainty For Safety-Oriented Semantic Segmentation In
Autonomous Driving [77.39239190539871]
自律運転における安全クリティカル画像セグメンテーションを実現するために、不確実性推定をどのように活用できるかを示す。
相似性関数によって測定された不一致予測に基づく新しい不確実性尺度を導入する。
本研究では,提案手法が競合手法よりも推論時間において計算集約性が低いことを示す。
論文 参考訳(メタデータ) (2021-05-28T09:23:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。