論文の概要: "Are you telling me to put glasses on the dog?'' Content-Grounded
Annotation of Instruction Clarification Requests in the CoDraw Dataset
- arxiv url: http://arxiv.org/abs/2306.02377v1
- Date: Sun, 4 Jun 2023 15:23:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-06 18:16:37.457804
- Title: "Are you telling me to put glasses on the dog?'' Content-Grounded
Annotation of Instruction Clarification Requests in the CoDraw Dataset
- Title(参考訳): 「犬に眼鏡をかけろとおっしゃいますか?」CoDrawデータセットにおける教示明細書の内容
- Authors: Brielen Madureira and David Schlangen
- Abstract要約: 本稿では,既存のiCR識別子を拡張したCoDraw-iCR(v2)を提案する。
我々のアノテーションは対話エージェントの修復能力のモデル化と評価に役立てることができる。
- 参考スコア(独自算出の注目度): 17.285206913252786
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Instruction Clarification Requests are a mechanism to solve communication
problems, which is very functional in instruction-following interactions.
Recent work has argued that the CoDraw dataset is a valuable source of
naturally occurring iCRs. Beyond identifying when iCRs should be made, dialogue
models should also be able to generate them with suitable form and content. In
this work, we introduce CoDraw-iCR (v2), which extends the existing iCR
identifiers fine-grained information grounded in the underlying dialogue game
items and possible actions. Our annotation can serve to model and evaluate
repair capabilities of dialogue agents.
- Abstract(参考訳): 命令の明確化要求は通信問題を解決するメカニズムであり、命令追従相互作用において非常に機能する。
最近の研究は、CoDrawデータセットは自然発生のiCRの貴重な情報源であると主張している。
iCRがいつ作成されるべきかを識別する以外に、対話モデルは適切なフォームとコンテンツで生成できる必要がある。
本稿では,既存のicr識別子を基礎となる対話ゲームアイテムと可能なアクションに接する詳細情報を拡張したcodraw-icr(v2)を紹介する。
我々のアノテーションは対話エージェントの修復能力のモデル化と評価に役立てることができる。
関連論文リスト
- CREPE: Coordinate-Aware End-to-End Document Parser [13.530212337717515]
視覚文書理解のためのOCRフリーシーケンス生成モデル(VDU)を定式化する。
本モデルは,文書画像からテキストを解析するだけでなく,マルチヘッドアーキテクチャに基づくテキストの空間座標も抽出する。
コーディネート・アウェア・エンド・ツー・エンドドキュメンテーション(Coordinate-aware End-to-end Document)と呼ばれる。
CREPEでは,OCRテキスト用の特別なトークンを導入することで,これらの機能を独自に統合する。
論文 参考訳(メタデータ) (2024-05-01T00:30:13Z) - Parameter-Efficient Conversational Recommender System as a Language
Processing Task [52.47087212618396]
会話レコメンデータシステム(CRS)は,自然言語会話を通じてユーザの嗜好を喚起することで,ユーザに対して関連項目を推薦することを目的としている。
先行作業では、アイテムのセマンティック情報、対話生成のための言語モデル、関連する項目のランク付けのためのレコメンデーションモジュールとして、外部知識グラフを利用することが多い。
本稿では、自然言語の項目を表現し、CRSを自然言語処理タスクとして定式化する。
論文 参考訳(メタデータ) (2024-01-25T14:07:34Z) - DiactTOD: Learning Generalizable Latent Dialogue Acts for Controllable
Task-Oriented Dialogue Systems [15.087619144902776]
本稿では,潜在空間における対話行動を表現する対話行動モデル(DiactTOD)を提案する。
大規模なコーパスで事前トレーニングを行うと、DiactTODは対話を予測し制御し、制御可能な応答を生成する。
論文 参考訳(メタデータ) (2023-08-01T23:29:16Z) - 'What are you referring to?' Evaluating the Ability of Multi-Modal
Dialogue Models to Process Clarificational Exchanges [65.03196674816772]
参照表現が宛先に対して意図された参照を一意に識別しない場合、参照の曖昧さが対話で生じる。
出席者は、通常、そのような曖昧さをすぐに検知し、メタコミュニケーション、明確化取引所(CE: Meta-communicative, Clarification Exchanges)を使用して、話者と作業する。
ここでは、CRを生成・応答する能力は、マルチモーダルな視覚的基盤を持つ対話モデルのアーキテクチャと目的関数に特定の制約を課していると論じる。
論文 参考訳(メタデータ) (2023-07-28T13:44:33Z) - Instruction Clarification Requests in Multimodal Collaborative Dialogue
Games: Tasks, and an Analysis of the CoDraw Dataset [17.285206913252786]
本稿では,CoDrawにおける命令明確化要求(iCR)について解説する。
プレイヤーが自己動機的に生成する語彙的および意味論的に多様なiCRを含むことを示す。
次に、iCRの作成時期と認識方法の2つのタスクのベースラインモデルを定式化し、提供します。
論文 参考訳(メタデータ) (2023-02-28T08:41:53Z) - Reasoning in Dialog: Improving Response Generation by Context Reading
Comprehension [49.92173751203827]
マルチターンダイアログでは、発話が文の完全な形を取るとは限らない。
読み解きの質問に答えるモデルの能力を検討し、応答生成性能の向上を提案する。
論文 参考訳(メタデータ) (2020-12-14T10:58:01Z) - CR-Walker: Tree-Structured Graph Reasoning and Dialog Acts for
Conversational Recommendation [62.13413129518165]
CR-Walkerは知識グラフ上で木構造推論を行うモデルである。
インフォメーションダイアログが生成され、言語生成をガイドする。
自動的および人的評価は、CR-Walkerがより正確なレコメンデーションに到達できることを示している。
論文 参考訳(メタデータ) (2020-10-20T14:53:22Z) - SSCR: Iterative Language-Based Image Editing via Self-Supervised
Counterfactual Reasoning [79.30956389694184]
反復言語ベースの画像編集(IL-BIE)タスクは、段階的に画像を編集するための反復的な命令に従う。
データ不足は、命令ベースの変更前後の大規模な画像のサンプル収集が困難であるため、ILBIEにとって重要な問題である。
本稿では,データ不足を克服する対実的思考を取り入れたセルフスーパービジョンの対実的推論フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-21T01:45:58Z) - History for Visual Dialog: Do we really need it? [55.642625058602924]
ダイアログ履歴を明示的にエンコードするコアテンションモデルは、そうでないモデルよりも優れていることを示す。
また、クラウドソーシングデータセット収集手順の欠点も明らかにした。
論文 参考訳(メタデータ) (2020-05-08T14:58:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。