論文の概要: Interactive Natural Language Processing
- arxiv url: http://arxiv.org/abs/2305.13246v1
- Date: Mon, 22 May 2023 17:18:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-23 14:10:18.679410
- Title: Interactive Natural Language Processing
- Title(参考訳): 対話型自然言語処理
- Authors: Zekun Wang, Ge Zhang, Kexin Yang, Ning Shi, Wangchunshu Zhou, Shaochun
Hao, Guangzheng Xiong, Yizhi Li, Mong Yuan Sim, Xiuying Chen, Qingqing Zhu,
Zhenzhu Yang, Adam Nik, Qi Liu, Chenghua Lin, Shi Wang, Ruibo Liu, Wenhu
Chen, Ke Xu, Dayiheng Liu, Yike Guo, Jie Fu
- Abstract要約: 対話型自然言語処理(iNLP)は,NLP分野における新しいパラダイムとして登場した。
本稿では,iNLPの概念の統一的定義と枠組みを提案することから,iNLPに関する包括的調査を行う。
- 参考スコア(独自算出の注目度): 67.87925315773924
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Interactive Natural Language Processing (iNLP) has emerged as a novel
paradigm within the field of NLP, aimed at addressing limitations in existing
frameworks while aligning with the ultimate goals of artificial intelligence.
This paradigm considers language models as agents capable of observing, acting,
and receiving feedback iteratively from external entities. Specifically,
language models in this context can: (1) interact with humans for better
understanding and addressing user needs, personalizing responses, aligning with
human values, and improving the overall user experience; (2) interact with
knowledge bases for enriching language representations with factual knowledge,
enhancing the contextual relevance of responses, and dynamically leveraging
external information to generate more accurate and informed responses; (3)
interact with models and tools for effectively decomposing and addressing
complex tasks, leveraging specialized expertise for specific subtasks, and
fostering the simulation of social behaviors; and (4) interact with
environments for learning grounded representations of language, and effectively
tackling embodied tasks such as reasoning, planning, and decision-making in
response to environmental observations. This paper offers a comprehensive
survey of iNLP, starting by proposing a unified definition and framework of the
concept. We then provide a systematic classification of iNLP, dissecting its
various components, including interactive objects, interaction interfaces, and
interaction methods. We proceed to delve into the evaluation methodologies used
in the field, explore its diverse applications, scrutinize its ethical and
safety issues, and discuss prospective research directions. This survey serves
as an entry point for researchers who are interested in this rapidly evolving
area and offers a broad view of the current landscape and future trajectory of
iNLP.
- Abstract(参考訳): 対話型自然言語処理(Interactive Natural Language Processing, INLP)は、AIの最終的な目標と整合しながら、既存のフレームワークの制限に対処することを目的とした、NLPの分野における新しいパラダイムとして登場した。
このパラダイムは、言語モデルを外部エンティティから反復的にフィードバックを観察し、行動し、受信できるエージェントとみなす。
Specifically, language models in this context can: (1) interact with humans for better understanding and addressing user needs, personalizing responses, aligning with human values, and improving the overall user experience; (2) interact with knowledge bases for enriching language representations with factual knowledge, enhancing the contextual relevance of responses, and dynamically leveraging external information to generate more accurate and informed responses; (3) interact with models and tools for effectively decomposing and addressing complex tasks, leveraging specialized expertise for specific subtasks, and fostering the simulation of social behaviors; and (4) interact with environments for learning grounded representations of language, and effectively tackling embodied tasks such as reasoning, planning, and decision-making in response to environmental observations.
本稿では,概念の統一的な定義と枠組みを提案することから,inlpの包括的調査を行う。
次に、対話オブジェクト、インタラクションインターフェース、インタラクションメソッドを含む様々なコンポーネントを分離し、iNLPの体系的な分類を提供する。
我々は、この分野で使われている評価手法を精査し、その多様な応用を探求し、倫理的および安全上の課題を精査し、今後の研究の方向性について論じる。
この調査は、この急速に発展している領域に興味を持つ研究者のエントリポイントとなり、現在の景観とiNLPの今後の軌跡を広く見ることができる。
関連論文リスト
- Visual-Geometric Collaborative Guidance for Affordance Learning [63.038406948791454]
本稿では,視覚的・幾何学的手がかりを取り入れた視覚・幾何学的協調学習ネットワークを提案する。
本手法は,客観的指標と視覚的品質の代表的なモデルより優れている。
論文 参考訳(メタデータ) (2024-10-15T07:35:51Z) - Multimodal Fusion with LLMs for Engagement Prediction in Natural Conversation [70.52558242336988]
我々は,不関心や混乱の兆候を検出することを目的として,言語的および非言語的手がかりを精査することにより,ダイアディック的相互作用における係り合いを予測することに焦点を当てた。
本研究では,カジュアルなダイアディック会話に携わる34人の参加者を対象に,各会話の最後に自己報告されたエンゲージメント評価を行うデータセットを収集する。
大規模言語モデル(LLMs)を用いた新たな融合戦略を導入し,複数行動モダリティをマルチモーダル・トランスクリプトに統合する。
論文 参考訳(メタデータ) (2024-09-13T18:28:12Z) - Improving Agent Interactions in Virtual Environments with Language
Models [0.9790236766474201]
本研究は、Minecraftデータセットにおける集合的なビルディング割り当てに焦点を当てる。
我々は,最先端手法によるタスク理解を強化するために,言語モデリングを採用している。
論文 参考訳(メタデータ) (2024-02-08T06:34:11Z) - AntEval: Evaluation of Social Interaction Competencies in LLM-Driven
Agents [65.16893197330589]
大規模言語モデル(LLM)は、幅広いシナリオで人間の振る舞いを再現する能力を示した。
しかし、複雑なマルチ文字のソーシャルインタラクションを扱う能力については、まだ完全には研究されていない。
本稿では,新しいインタラクションフレームワークと評価手法を含むマルチエージェントインタラクション評価フレームワーク(AntEval)を紹介する。
論文 参考訳(メタデータ) (2024-01-12T11:18:00Z) - Detecting Any Human-Object Interaction Relationship: Universal HOI
Detector with Spatial Prompt Learning on Foundation Models [55.20626448358655]
本研究では,ビジョン・ランゲージ(VL)基礎モデルと大規模言語モデル(LLM)を用いて,オープンワールド環境におけるユニバーサルインタラクション認識について検討する。
我々の設計にはHO Prompt-guided Decoder (HOPD) が含まれており、基礎モデルにおける高次関係表現と画像内の様々なHOペアとの結合を容易にする。
オープンカテゴリの対話認識では,対話文と解釈文の2つのタイプがサポートされている。
論文 参考訳(メタデータ) (2023-11-07T08:27:32Z) - Automatic Context-Driven Inference of Engagement in HMI: A Survey [6.479224589451863]
本稿では,人間と機械の相互作用に関するエンゲージメント推論について述べる。
これには、学際的定義、エンゲージメントコンポーネントと要因、公開データセット、地上真実の評価、そして最も一般的に使用される機能と方法が含まれる。
これは、信頼性の高いコンテキスト認識エンゲージメント推論機能を備えた、将来の人間と機械のインタラクションインターフェースの開発のためのガイドとして機能する。
論文 参考訳(メタデータ) (2022-09-30T10:46:13Z) - Enabling Harmonious Human-Machine Interaction with Visual-Context
Augmented Dialogue System: A Review [40.49926141538684]
Visual Context Augmented Dialogue System (VAD) は、マルチモーダル情報を知覚し理解することで人間とコミュニケーションする能力を持つ。
VADは、エンゲージメントとコンテキスト対応の応答を生成する可能性を秘めている。
論文 参考訳(メタデータ) (2022-07-02T09:31:37Z) - Situated Language Learning via Interactive Narratives [16.67845396797253]
本稿では,文脈的関連のある自然言語を理解し,生成する能力を持つ学習エージェントの活用方法について考察する。
このようなエージェントを作成するための2つの重要なコンポーネントは、相互作用と環境接地です。
テキストゲームのパズルのような構造と自然言語状態とアクション空間が組み合わさったユニークな課題について論じる。
論文 参考訳(メタデータ) (2021-03-18T01:55:16Z) - SPA: Verbal Interactions between Agents and Avatars in Shared Virtual
Environments using Propositional Planning [61.335252950832256]
SPA(Sense-Plan-Ask)は、仮想的な仮想環境において、仮想的な人間のようなエージェントとユーザアバターの間の言語的対話を生成する。
提案アルゴリズムは実行時コストを小さくし,自然言語通信を利用せずにエージェントよりも効率的に目標を達成できることが判明した。
論文 参考訳(メタデータ) (2020-02-08T23:15:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。