論文の概要: Modular Conversational Agents for Surveys and Interviews
- arxiv url: http://arxiv.org/abs/2412.17049v1
- Date: Sun, 22 Dec 2024 15:00:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 16:01:16.406407
- Title: Modular Conversational Agents for Surveys and Interviews
- Title(参考訳): 調査・インタビューのためのモジュール会話エージェント
- Authors: Jiangbo Yu, Jinhua Zhao, Luis Miranda-Moreno, Matthew Korp,
- Abstract要約: 本稿では,対話エージェントを設計するためのモジュラーアプローチとそのパラメータ化プロセスを紹介する。
3つの実証的な研究を通して、モジュラーアプローチの適応性、一般化性、有効性を示す。
その結果、このモジュラーアプローチの有効性と、重要な倫理的、プライバシ、セキュリティ、トークン消費の懸念にどのように対処するかが示されている。
- 参考スコア(独自算出の注目度): 6.019313905775819
- License:
- Abstract: Surveys and interviews (structured, semi-structured, or unstructured) are widely used for collecting insights on emerging or hypothetical scenarios. Traditional human-led methods often face challenges related to cost, scalability, and consistency. Recently, various domains have begun to explore the use of conversational agents (chatbots) powered by large language models (LLMs). However, as public investments and policies on infrastructure and services often involve substantial public stakes and environmental risks, there is a need for a rigorous, transparent, privacy-preserving, and cost-efficient development framework tailored for such major decision-making processes. This paper addresses this gap by introducing a modular approach and its resultant parameterized process for designing conversational agents. We detail the system architecture, integrating engineered prompts, specialized knowledge bases, and customizable, goal-oriented conversational logic in the proposed approach. We demonstrate the adaptability, generalizability, and efficacy of our modular approach through three empirical studies: (1) travel preference surveys, highlighting multimodal (voice, text, and image generation) capabilities; (2) public opinion elicitation on a newly constructed, novel infrastructure project, showcasing question customization and multilingual (English and French) capabilities; and (3) transportation expert consultation about future transportation systems, highlighting real-time, clarification request capabilities for open-ended questions, resilience in handling erratic inputs, and efficient transcript post-processing. The results show the effectiveness of this modular approach and how it addresses key ethical, privacy, security, and token consumption concerns, setting the stage for the next-generation surveys and interviews.
- Abstract(参考訳): 調査とインタビュー(構造化、半構造化、または非構造化)は、創発的または仮説的なシナリオについての洞察を集めるために広く利用されている。
従来のヒューマン主導の手法は、コスト、スケーラビリティ、一貫性に関する課題に直面することが多い。
近年,多言語モデル(LLM)を利用した対話型エージェント(チャットボット)の利用が検討されている。
しかし、インフラやサービスに対する公共投資や政策は、しばしばかなりの公益と環境リスクを伴うため、このような主要な意思決定プロセスに適した厳格で透明性があり、プライバシーを保護し、コスト効率の高い開発フレームワークが必要である。
本稿では,対話エージェントを設計するためのモジュラーアプローチとそのパラメータ化プロセスを導入することで,このギャップに対処する。
提案手法では,システムアーキテクチャの詳細,エンジニアリングプロンプトの統合,専門知識ベース,カスタマイズ可能な目標指向の対話ロジックについて述べる。
本研究では,(1)旅行嗜好調査,マルチモーダル(音声,テキスト,画像生成)能力の強調,(2)新しいインフラプロジェクトへの世論導入,質問のカスタマイズと多言語(英語とフランス語)能力の紹介,(3)交通専門家による未来の交通システムに関する相談,リアルタイムの強調,開放された質問に対する明確化要求能力の強調,エラスティック入力の処理におけるレジリエンス,および効率的なトランスクリプト後処理の3つの実証的研究を通して,モジュラーアプローチの適応性,一般化性,有効性を実証する。
その結果、このモジュラーアプローチの有効性と、それが重要な倫理的、プライバシー、セキュリティ、トークン消費の懸念にどのように対処するかを示し、次世代の調査およびインタビューのステージを設定した。
関連論文リスト
- Position: Foundation Agents as the Paradigm Shift for Decision Making [24.555816843983003]
我々は,エージェントの学習パラダイムの変革的変化として,基礎エージェントの構築を提唱する。
我々は,大規模な対話型データ収集や生成から自己指導型事前学習,適応に至るまで,基礎エージェントのロードマップを定めている。
論文 参考訳(メタデータ) (2024-05-27T09:54:50Z) - A Survey on Recent Advances in Conversational Data Generation [14.237954885530396]
マルチターン対話型データ生成の体系的・包括的レビューを行う。
オープンドメイン,タスク指向,情報検索の3種類の対話システムに注目した。
合成会話データを評価するための評価指標と手法について検討する。
論文 参考訳(メタデータ) (2024-05-12T10:11:12Z) - 'What are you referring to?' Evaluating the Ability of Multi-Modal
Dialogue Models to Process Clarificational Exchanges [65.03196674816772]
参照表現が宛先に対して意図された参照を一意に識別しない場合、参照の曖昧さが対話で生じる。
出席者は、通常、そのような曖昧さをすぐに検知し、メタコミュニケーション、明確化取引所(CE: Meta-communicative, Clarification Exchanges)を使用して、話者と作業する。
ここでは、CRを生成・応答する能力は、マルチモーダルな視覚的基盤を持つ対話モデルのアーキテクチャと目的関数に特定の制約を課していると論じる。
論文 参考訳(メタデータ) (2023-07-28T13:44:33Z) - Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。
モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。
このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文 参考訳(メタデータ) (2023-07-25T17:59:18Z) - Improving Factuality and Reasoning in Language Models through Multiagent
Debate [95.10641301155232]
複数の言語モデルインスタンスが共通の最終回答に到達するために、複数のラウンドで個別の応答と推論プロセスを提案し、議論する言語応答を改善するための補完的なアプローチを提案する。
以上の結果から,本手法は様々なタスクにおける数学的・戦略的推論を著しく向上させることが示唆された。
我々のアプローチは、既存のブラックボックスモデルに直接適用され、調査するすべてのタスクに対して、同じ手順とプロンプトを使用することができる。
論文 参考訳(メタデータ) (2023-05-23T17:55:11Z) - Using Textual Interface to Align External Knowledge for End-to-End
Task-Oriented Dialogue Systems [53.38517204698343]
本稿では,外部知識の整合化と冗長なプロセスの排除にテキストインタフェースを用いた新しいパラダイムを提案する。
我々は、MultiWOZ-Remakeを用いて、MultiWOZデータベース用に構築されたインタラクティブテキストインタフェースを含む、我々のパラダイムを実演する。
論文 参考訳(メタデータ) (2023-05-23T05:48:21Z) - Interactive Natural Language Processing [67.87925315773924]
対話型自然言語処理(iNLP)は,NLP分野における新しいパラダイムとして登場した。
本稿では,iNLPの概念の統一的定義と枠組みを提案することから,iNLPに関する包括的調査を行う。
論文 参考訳(メタデータ) (2023-05-22T17:18:29Z) - Foundation Models for Decision Making: Problems, Methods, and
Opportunities [124.79381732197649]
大規模に多様なデータに基づいて事前訓練された基礎モデルは、幅広いビジョンと言語タスクにおいて異常な能力を示してきた。
ファンデーションモデルをトレーニングし、他のエージェントと対話し、長期的な推論を行うための新しいパラダイムが生まれている。
基礎モデルと意思決定の交わりにおける研究は、強力な新しいシステムを作るための大きな約束である。
論文 参考訳(メタデータ) (2023-03-07T18:44:07Z) - Taxonomy of Abstractive Dialogue Summarization: Scenarios, Approaches
and Future Directions [14.85592662663867]
この調査は、シナリオから抽象的な対話を要約するための既存の研究を包括的に調査する。
タスクは入力ダイアログの種類、すなわちオープンドメインとタスク指向の2つの幅広いカテゴリに分類される。
既存のテクニックを3方向に分類し、対話機能を注入し、補助訓練タスクを設計し、追加データを使用する。
論文 参考訳(メタデータ) (2022-10-18T14:33:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。