論文の概要: Modular Conversational Agents for Surveys and Interviews
- arxiv url: http://arxiv.org/abs/2412.17049v2
- Date: Tue, 04 Mar 2025 02:14:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:12:01.733180
- Title: Modular Conversational Agents for Surveys and Interviews
- Title(参考訳): 調査・インタビューのためのモジュール会話エージェント
- Authors: Jiangbo Yu, Jinhua Zhao, Luis Miranda-Moreno, Matthew Korp,
- Abstract要約: 本稿では,AIエージェントを設計するためのモジュラーアプローチとそのパラメータ化プロセスを紹介する。
3つの実証的な研究を通して、モジュラーアプローチの適応性、一般化性、有効性を示す。
その結果,AIエージェントは完成率と応答品質を高めることが示唆された。
- 参考スコア(独自算出の注目度): 6.019313905775819
- License:
- Abstract: Surveys and interviews are widely used for collecting insights on emerging or hypothetical scenarios. Traditional human-led methods often face challenges related to cost, scalability, and consistency. Recently, various domains have begun to explore the use of conversational agents (chatbots) powered by generative artificial intelligence (AI) technologies. However, considering decisions in transportation investments and policies often carry significant public and environmental stakes, surveys and interviews face unique challenges in integrating AI agents, underscoring the need for a rigorous, resource-efficient approach that enhances participant engagement and ensures privacy. This paper addresses this gap by introducing a modular approach and its resulting parameterized process for designing AI agents. We detail the system architecture, integrating engineered prompts, specialized knowledge bases, and customizable, goal-oriented conversational logic. We demonstrate the adaptability, generalizability, and efficacy of our modular approach through three empirical studies: (1) travel preference surveys, highlighting conditional logic and multimodal (voice, text, and image generation) capabilities; (2) public opinion elicitation on a newly constructed, novel infrastructure project, showcasing question customization and multilingual (English and French) capabilities; and (3) expert consultation about the impact of technologies on future transportation systems, highlighting real-time, clarification request capabilities for open-ended questions, resilience in handling erratic inputs, and efficient transcript postprocessing. The results suggest that the AI agent increases completion rates and response quality. Furthermore, the modular approach demonstrates controllability, flexibility, and robustness while addressing key ethical, privacy, security, and token consumption concerns.
- Abstract(参考訳): 調査やインタビューは、新興または仮説上のシナリオについての洞察を集めるために広く利用されている。
従来のヒューマン主導の手法は、コスト、スケーラビリティ、一貫性に関する課題に直面することが多い。
近年,汎用人工知能(AI)技術を活用した会話エージェント(チャットボット)の活用が注目されている。
しかし、交通投資や政策における決定は、しばしば公共や環境の負担を伴っているため、調査やインタビューはAIエージェントの統合におけるユニークな課題に直面し、参加者のエンゲージメントを高め、プライバシーを確保するための厳格でリソース効率のよいアプローチの必要性を強調している。
本稿では,AIエージェントを設計するためのモジュラーアプローチとそのパラメータ化プロセスを導入することで,このギャップに対処する。
システムアーキテクチャ、エンジニアリングプロンプトの統合、専門知識ベース、カスタマイズ可能な目標指向の対話ロジックについて詳述する。
本稿は,(1)旅行嗜好調査,条件論理とマルチモーダル(音声,テキスト,画像生成)能力の強調,(2)新たに構築された新しいインフラプロジェクトに対する世論の引用,課題のカスタマイズとマルチリンガル(英語とフランス語)能力の実証,(3)将来的な輸送システムへの影響に関する専門家の相談,オープンな質問に対するリアルタイム・明確化要求能力の強調,エラー入力処理のレジリエンス,といった経験的考察を通じて,モジュラーアプローチの適応性,一般化性,有効性を実証する。
その結果,AIエージェントは完成率と応答品質を高めることが示唆された。
さらに、モジュラーアプローチは、重要な倫理的、プライバシ、セキュリティ、トークン消費の懸念に対処しながら、コントロール可能性、柔軟性、堅牢性を示す。
関連論文リスト
- Position: Foundation Agents as the Paradigm Shift for Decision Making [24.555816843983003]
我々は,エージェントの学習パラダイムの変革的変化として,基礎エージェントの構築を提唱する。
我々は,大規模な対話型データ収集や生成から自己指導型事前学習,適応に至るまで,基礎エージェントのロードマップを定めている。
論文 参考訳(メタデータ) (2024-05-27T09:54:50Z) - A Survey on Recent Advances in Conversational Data Generation [14.237954885530396]
マルチターン対話型データ生成の体系的・包括的レビューを行う。
オープンドメイン,タスク指向,情報検索の3種類の対話システムに注目した。
合成会話データを評価するための評価指標と手法について検討する。
論文 参考訳(メタデータ) (2024-05-12T10:11:12Z) - 'What are you referring to?' Evaluating the Ability of Multi-Modal
Dialogue Models to Process Clarificational Exchanges [65.03196674816772]
参照表現が宛先に対して意図された参照を一意に識別しない場合、参照の曖昧さが対話で生じる。
出席者は、通常、そのような曖昧さをすぐに検知し、メタコミュニケーション、明確化取引所(CE: Meta-communicative, Clarification Exchanges)を使用して、話者と作業する。
ここでは、CRを生成・応答する能力は、マルチモーダルな視覚的基盤を持つ対話モデルのアーキテクチャと目的関数に特定の制約を課していると論じる。
論文 参考訳(メタデータ) (2023-07-28T13:44:33Z) - Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。
モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。
このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文 参考訳(メタデータ) (2023-07-25T17:59:18Z) - Improving Factuality and Reasoning in Language Models through Multiagent
Debate [95.10641301155232]
複数の言語モデルインスタンスが共通の最終回答に到達するために、複数のラウンドで個別の応答と推論プロセスを提案し、議論する言語応答を改善するための補完的なアプローチを提案する。
以上の結果から,本手法は様々なタスクにおける数学的・戦略的推論を著しく向上させることが示唆された。
我々のアプローチは、既存のブラックボックスモデルに直接適用され、調査するすべてのタスクに対して、同じ手順とプロンプトを使用することができる。
論文 参考訳(メタデータ) (2023-05-23T17:55:11Z) - Using Textual Interface to Align External Knowledge for End-to-End
Task-Oriented Dialogue Systems [53.38517204698343]
本稿では,外部知識の整合化と冗長なプロセスの排除にテキストインタフェースを用いた新しいパラダイムを提案する。
我々は、MultiWOZ-Remakeを用いて、MultiWOZデータベース用に構築されたインタラクティブテキストインタフェースを含む、我々のパラダイムを実演する。
論文 参考訳(メタデータ) (2023-05-23T05:48:21Z) - Interactive Natural Language Processing [67.87925315773924]
対話型自然言語処理(iNLP)は,NLP分野における新しいパラダイムとして登場した。
本稿では,iNLPの概念の統一的定義と枠組みを提案することから,iNLPに関する包括的調査を行う。
論文 参考訳(メタデータ) (2023-05-22T17:18:29Z) - Foundation Models for Decision Making: Problems, Methods, and
Opportunities [124.79381732197649]
大規模に多様なデータに基づいて事前訓練された基礎モデルは、幅広いビジョンと言語タスクにおいて異常な能力を示してきた。
ファンデーションモデルをトレーニングし、他のエージェントと対話し、長期的な推論を行うための新しいパラダイムが生まれている。
基礎モデルと意思決定の交わりにおける研究は、強力な新しいシステムを作るための大きな約束である。
論文 参考訳(メタデータ) (2023-03-07T18:44:07Z) - Taxonomy of Abstractive Dialogue Summarization: Scenarios, Approaches
and Future Directions [14.85592662663867]
この調査は、シナリオから抽象的な対話を要約するための既存の研究を包括的に調査する。
タスクは入力ダイアログの種類、すなわちオープンドメインとタスク指向の2つの幅広いカテゴリに分類される。
既存のテクニックを3方向に分類し、対話機能を注入し、補助訓練タスクを設計し、追加データを使用する。
論文 参考訳(メタデータ) (2022-10-18T14:33:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。