論文の概要: PEC-Home: Interpretation of Progressively Elliptical Commands in Smart Homes
- arxiv url: http://arxiv.org/abs/2606.18636v1
- Date: Wed, 17 Jun 2026 03:17:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:50.982484
- Title: PEC-Home: Interpretation of Progressively Elliptical Commands in Smart Homes
- Title(参考訳): PEC-Home:スマートホームにおける段階的楕円型コマンドの解釈
- Authors: Yingyu Shan, Zeming Liu, Silin Li, Boao Qian, Jiashu Yao, Yuhang Guo, Haifeng Wang,
- Abstract要約: PEC-Homeは、スマートホームにおける徐々に楕円的なコマンドを解釈するために特別に設計された、最初のシミュレーションされたホームデータセットである。
実験により、既存のホームアシスタントは、楕円型コマンドのみに基づくユーザ意図の操作を実行するのに苦労していることが示された。
- 参考スコア(独自算出の注目度): 21.255725216450916
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advancements in Large Language Models (LLMs) have empowered home assistants with natural language interaction capabilities. However, current assistants overlook the progressive omission that occurs in human dialogue as shared context accumulates, leading to more elliptical expressions for efficient communication. Thus, current assistants still struggle to interpret such elliptical expressions accurately, which limits their effectiveness in real-world applications. In practical smart home scenarios, assistants face two major challenges caused by elliptical commands: (1) referential ambiguity caused by different environmental expectations among multiple users; and (2) intention ambiguity resulting from user preferences that evolve over time or change with the environment. To address these challenges, we introduce PEC-Home, the first simulated home dataset specifically designed for interpreting progressively elliptical commands in smart homes. Extensive experiments on various LLMs, including GPT-4o, show that existing home assistants struggle to execute user-intended operations based solely on elliptical commands. Even when equipped with tools for storing and retrieving user dialogue history, execution accuracy remains below that achieved with complete commands.}.
- Abstract(参考訳): 近年,Large Language Models (LLMs) の進歩により,自然言語対話機能を備えたホームアシスタントが強化されている。
しかしながら、現在のアシスタントは、共有コンテキストが蓄積するにつれて人間の対話で発生する進行的な欠落を見落とし、効率的なコミュニケーションのためのより楕円的な表現をもたらす。
このように、現在のアシスタントは、そのような楕円式の正確な解釈に苦慮し、現実の応用においてその有効性を制限している。
実践的なスマートホームのシナリオでは,(1)複数のユーザの環境期待の相違による参照的あいまいさ,(2)時間の経過や環境の変化によるユーザの好みによる意図的あいまいさという,楕円的命令による2つの大きな課題に直面している。
これらの課題に対処するために、私たちはスマートホームにおける徐々に楕円的なコマンドを解釈するために特別に設計された、最初のシミュレーションされたホームデータセットであるPEC-Homeを紹介します。
GPT-4oを含む様々なLCMの大規模な実験により、既存のホームアシスタントは楕円型コマンドのみに基づいてユーザ意図の操作を実行するのに苦労していることが示された。
ユーザ対話履歴の保存と検索のためのツールが備わっている場合でも、完全なコマンドで達成した実行精度は低いままである。
と。
関連論文リスト
- Reframing Conversational Design in HRI: Deliberate Design with AI Scaffolds [17.978554550286955]
本稿では,人間とロボットの会話を意図的に設計するシステムであるAI-Aided Conversation Engine(ACE)を紹介する。
1)「ブランクページ問題」を克服するために初期即時生成を足場とするLLM音声エージェント,2)会話文の粒度と接地フィードバックの収集を可能にするアノテーションインターフェース,3)LLMを使用してユーザのフィードバックを即時改善する。
その結果、ACEはロボット行動の創出を促進するため、より明確かつ特異性が高くなり、ACEによって生成されたプロンプトは、高品質な人間とロボットの対話に繋がることがわかった。
論文 参考訳(メタデータ) (2026-01-17T15:21:21Z) - Trapped by Expectations: Functional Fixedness in LLM-Enabled Chat Search [9.166043188084414]
大規模言語モデル(LLM)対応チャット検索における機能的固定性の影響について検討した。
事前の期待が言語の使用を形作り、行動を促すことを発見した。
適切なシステムサポートにより、LLM能力の広範な探索が促進される可能性がある。
論文 参考訳(メタデータ) (2025-04-02T19:14:01Z) - REALTALK: A 21-Day Real-World Dataset for Long-Term Conversation [51.97224538045096]
本稿では、21日間のメッセージアプリ対話のコーパスであるREALTALKを紹介する。
EI属性とペルソナの整合性を比較し,現実世界の対話による課題を理解する。
その結果,モデルでは対話履歴のみからユーザをシミュレートすることが困難であり,特定のユーザチャットの微調整はペルソナのエミュレーションを改善することがわかった。
論文 参考訳(メタデータ) (2025-02-18T20:29:01Z) - LangSuitE: Planning, Controlling and Interacting with Large Language Models in Embodied Text Environments [70.91258869156353]
テキストエンボディの世界における6つの代表的具体的タスクを特徴とする多目的・シミュレーション不要なテストベッドであるLangSuitEを紹介する。
以前のLLMベースのテストベッドと比較すると、LangSuitEは複数のシミュレーションエンジンを使わずに、多様な環境への適応性を提供する。
具体化された状態の履歴情報を要約した新しいチェーン・オブ・ソート(CoT)スキーマであるEmMemを考案する。
論文 参考訳(メタデータ) (2024-06-24T03:36:29Z) - SituationalLLM: Proactive language models with scene awareness for dynamic, contextual task guidance [13.155859243167619]
本研究では,構造化シーン情報を大規模言語モデルに統合する新しいアプローチである PresentalLLM を提案する。
カスタムのScene Graph Languageでオブジェクト、属性、関係をエンコードすることで、AciencealLLMは環境コンテキストのギャップを積極的に識別し、ユーザインタラクション中に明確化を求める。
実験結果から、ALLLMはタスク特異性、信頼性、適応性において、ジェネリックLLMベースラインよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-06-19T07:42:48Z) - Exploring Interaction Patterns for Debugging: Enhancing Conversational
Capabilities of AI-assistants [18.53732314023887]
大規模言語モデル(LLM)は、プログラマが様々なソフトウェア開発タスクの自然言語説明を得ることを可能にする。
LLMはしばしば十分な文脈なしに行動し、暗黙の仮定や不正確な反応を引き起こす。
本稿では,対話パターンと会話分析からインスピレーションを得て,デバッグのための対話型AIアシスタントRobinを設計する。
論文 参考訳(メタデータ) (2024-02-09T07:44:27Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - Voice2Action: Language Models as Agent for Efficient Real-Time
Interaction in Virtual Reality [1.160324357508053]
大規模言語モデル(LLM)は、ごく少数の例で自然言語命令に従うように訓練されている。
本稿では,アクションとエンティティ抽出による音声信号とテキストコマンドを階層的に解析するフレームワークであるVoice2Actionを提案する。
人工的な指示データを用いた都市工学VR環境における実験結果から,Voice2Actionは最適化のないアプローチよりも効率的かつ高精度に動作可能であることが示された。
論文 参考訳(メタデータ) (2023-09-29T19:06:52Z) - DiPlomat: A Dialogue Dataset for Situated Pragmatic Reasoning [89.92601337474954]
プラグマティック推論は、実生活における会話でしばしば起こる暗黙の意味を解読する上で重要な役割を担っている。
そこで我々は,現実的な推論と会話理解の場所に関するマシンの能力のベンチマークを目的とした,新しい挑戦であるDiPlomatを紹介した。
論文 参考訳(メタデータ) (2023-06-15T10:41:23Z) - Improving Policy Learning via Language Dynamics Distillation [87.27583619910338]
本稿では,言語記述による実演を前提とした環境動態予測モデルであるLanguage Dynamics Distillation(LDD)を提案する。
実演における言語記述は,環境全体にわたるサンプル効率と一般化を改善することを示す。
論文 参考訳(メタデータ) (2022-09-30T19:56:04Z) - Structural Pre-training for Dialogue Comprehension [51.215629336320305]
本稿では,SPIDER, Structure Pre-trained DialoguE Readerについて述べる。
対話のような特徴をシミュレートするために,元のLM目的に加えて,2つの訓練目標を提案する。
広く使われている対話ベンチマークの実験結果から,新たに導入した自己教師型タスクの有効性が検証された。
論文 参考訳(メタデータ) (2021-05-23T15:16:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。