Fugu-MT 論文翻訳(概要): Modular Conversational Agents for Surveys and Interviews

論文の概要: Modular Conversational Agents for Surveys and Interviews

arxiv url: http://arxiv.org/abs/2412.17049v2
Date: Tue, 04 Mar 2025 02:14:35 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-05 18:50:37.03199
Title: Modular Conversational Agents for Surveys and Interviews
Title（参考訳）: 調査・インタビューのためのモジュール会話エージェント
Authors: Jiangbo Yu, Jinhua Zhao, Luis Miranda-Moreno, Matthew Korp,
Abstract要約: 本稿では,AIエージェントを設計するためのモジュラーアプローチとそのパラメータ化プロセスを紹介する。 3つの実証的な研究を通して、モジュラーアプローチの適応性、一般化性、有効性を示す。その結果,AIエージェントは完成率と応答品質を高めることが示唆された。
参考スコア（独自算出の注目度）: 6.019313905775819
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Surveys and interviews are widely used for collecting insights on emerging or hypothetical scenarios. Traditional human-led methods often face challenges related to cost, scalability, and consistency. Recently, various domains have begun to explore the use of conversational agents (chatbots) powered by generative artificial intelligence (AI) technologies. However, considering decisions in transportation investments and policies often carry significant public and environmental stakes, surveys and interviews face unique challenges in integrating AI agents, underscoring the need for a rigorous, resource-efficient approach that enhances participant engagement and ensures privacy. This paper addresses this gap by introducing a modular approach and its resulting parameterized process for designing AI agents. We detail the system architecture, integrating engineered prompts, specialized knowledge bases, and customizable, goal-oriented conversational logic. We demonstrate the adaptability, generalizability, and efficacy of our modular approach through three empirical studies: (1) travel preference surveys, highlighting conditional logic and multimodal (voice, text, and image generation) capabilities; (2) public opinion elicitation on a newly constructed, novel infrastructure project, showcasing question customization and multilingual (English and French) capabilities; and (3) expert consultation about the impact of technologies on future transportation systems, highlighting real-time, clarification request capabilities for open-ended questions, resilience in handling erratic inputs, and efficient transcript postprocessing. The results suggest that the AI agent increases completion rates and response quality. Furthermore, the modular approach demonstrates controllability, flexibility, and robustness while addressing key ethical, privacy, security, and token consumption concerns.
Abstract（参考訳）: 調査やインタビューは、新興または仮説上のシナリオについての洞察を集めるために広く利用されている。従来のヒューマン主導の手法は、コスト、スケーラビリティ、一貫性に関する課題に直面することが多い。近年,汎用人工知能(AI)技術を活用した会話エージェント(チャットボット)の活用が注目されている。しかし、交通投資や政策における決定は、しばしば公共や環境の負担を伴っているため、調査やインタビューはAIエージェントの統合におけるユニークな課題に直面し、参加者のエンゲージメントを高め、プライバシーを確保するための厳格でリソース効率のよいアプローチの必要性を強調している。本稿では,AIエージェントを設計するためのモジュラーアプローチとそのパラメータ化プロセスを導入することで,このギャップに対処する。システムアーキテクチャ、エンジニアリングプロンプトの統合、専門知識ベース、カスタマイズ可能な目標指向の対話ロジックについて詳述する。本稿は,(1)旅行嗜好調査,条件論理とマルチモーダル(音声,テキスト,画像生成)能力の強調,(2)新たに構築された新しいインフラプロジェクトに対する世論の引用,課題のカスタマイズとマルチリンガル(英語とフランス語)能力の実証,(3)将来的な輸送システムへの影響に関する専門家の相談,オープンな質問に対するリアルタイム・明確化要求能力の強調,エラー入力処理のレジリエンス,といった経験的考察を通じて,モジュラーアプローチの適応性,一般化性,有効性を実証する。その結果,AIエージェントは完成率と応答品質を高めることが示唆された。さらに、モジュラーアプローチは、重要な倫理的、プライバシ、セキュリティ、トークン消費の懸念に対処しながら、コントロール可能性、柔軟性、堅牢性を示す。

関連論文リスト

A Desideratum for Conversational Agents: Capabilities, Challenges, and Future Directions [51.96890647837277]
大規模言語モデル(LLM)は、従来の対話システムから、自律的な行動、文脈認識、ユーザとのマルチターンインタラクションが可能な高度なエージェントへと、会話AIを推進してきた。本調査では,人間レベルの知性にアプローチするよりスケーラブルなシステムにおいて,何が達成されたのか,どのような課題が持続するのか,何を行う必要があるのか,といった,次世代の会話エージェントのデシラトゥムを提示する。
論文参考訳（メタデータ） (2025-04-07T21:01:25Z)
Toward Agentic AI: Generative Information Retrieval Inspired Intelligent Communications and Networking [87.82985288731489]
Agentic AIは、インテリジェントなコミュニケーションとネットワークのための重要なパラダイムとして登場した。本稿では,通信システムにおけるエージェントAIにおける知識獲得,処理,検索の役割を強調する。
論文参考訳（メタデータ） (2025-02-24T06:02:25Z)
Challenges in Human-Agent Communication [55.53932430345333]
これらのシステムがもたらす12の重要なコミュニケーション課題を特定し分析する。これには、エージェントからユーザへの情報伝達の課題、ユーザからエージェントへの情報伝達の課題、すべての人間とエージェントのコミュニケーションで考慮すべき課題の概略が含まれる。私たちの発見は、これらのシステムの透明性と制御を支援するために、新しいデザインパターン、原則、ガイドラインを緊急に呼び出すのに役立ちます。
論文参考訳（メタデータ） (2024-11-28T01:21:26Z)
Towards Human-Level Understanding of Complex Process Engineering Schematics: A Pedagogical, Introspective Multi-Agent Framework for Open-Domain Question Answering [0.0]
化学・プロセス産業では、プロセス・フロー・ダイアグラム(PFD)とパイプ・アンド・インスツルメンテーション・ダイアグラム(P&ID)が設計、建設、保守に不可欠である。生成型AIの最近の進歩は、ビジュアル質問回答(VQA)のプロセス図の理解と解釈の約束を示している。本稿では,階層的かつマルチエージェントなRetrieval Augmented Generation(RAG)フレームワークを用いた,セキュアでオンプレミスなエンタープライズソリューションを提案する。
論文参考訳（メタデータ） (2024-08-24T19:34:04Z)
Position: Foundation Agents as the Paradigm Shift for Decision Making [24.555816843983003]
我々は,エージェントの学習パラダイムの変革的変化として,基礎エージェントの構築を提唱する。我々は,大規模な対話型データ収集や生成から自己指導型事前学習,適応に至るまで,基礎エージェントのロードマップを定めている。
論文参考訳（メタデータ） (2024-05-27T09:54:50Z)
A Survey on Recent Advances in Conversational Data Generation [14.237954885530396]
マルチターン対話型データ生成の体系的・包括的レビューを行う。オープンドメイン,タスク指向,情報検索の3種類の対話システムに注目した。合成会話データを評価するための評価指標と手法について検討する。
論文参考訳（メタデータ） (2024-05-12T10:11:12Z)
Enabling High-Level Machine Reasoning with Cognitive Neuro-Symbolic Systems [67.01132165581667]
本稿では,認知アーキテクチャを外部のニューロシンボリックコンポーネントと統合することにより,AIシステムにおける高レベル推論を実現することを提案する。本稿では,ACT-Rを中心としたハイブリッドフレームワークについて紹介し,最近の応用における生成モデルの役割について論じる。
論文参考訳（メタデータ） (2023-11-13T21:20:17Z)
Re-Reading Improves Reasoning in Large Language Models [87.46256176508376]
既成のLarge Language Models (LLM) の推論能力を高めるため, 単純で汎用的で効果的なプロンプト手法であるRe2を導入する。 CoT (Chain-of-Thought) など、ほとんどの思考を刺激する手法とは異なり、Re2 は質問を2回処理することで入力に焦点を移し、理解プロセスを強化する。提案手法の有効性と汎用性を検証するため,14のデータセットにまたがる広範囲な推論ベンチマークでRe2を評価した。
論文参考訳（メタデータ） (2023-09-12T14:36:23Z)
'What are you referring to?' Evaluating the Ability of Multi-Modal Dialogue Models to Process Clarificational Exchanges [65.03196674816772]
参照表現が宛先に対して意図された参照を一意に識別しない場合、参照の曖昧さが対話で生じる。出席者は、通常、そのような曖昧さをすぐに検知し、メタコミュニケーション、明確化取引所(CE: Meta-communicative, Clarification Exchanges)を使用して、話者と作業する。ここでは、CRを生成・応答する能力は、マルチモーダルな視覚的基盤を持つ対話モデルのアーキテクチャと目的関数に特定の制約を課していると論じる。
論文参考訳（メタデータ） (2023-07-28T13:44:33Z)
Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文参考訳（メタデータ） (2023-07-25T17:59:18Z)
Requirements for Explainability and Acceptance of Artificial Intelligence in Collaborative Work [0.0]
本稿では,AIの説明可能性と受容の要件について考察する。その結果,2つの主要なグループが,モデルの内部操作に関する情報を必要とする開発者であることが示唆された。 AIシステムの受容は、システムの機能や性能、プライバシ、倫理的考慮事項に関する情報に依存する。
論文参考訳（メタデータ） (2023-06-27T11:36:07Z)
A Study of Situational Reasoning for Traffic Understanding [63.45021731775964]
トラフィック領域における状況推論のための3つの新しいテキストベースのタスクを考案する。先行作業における言語推論タスクにまたがる一般化能力を示す知識強化手法を4つ採用する。本稿では,データ分割におけるモデル性能の詳細な解析を行い,モデル予測を分類的に検討する。
論文参考訳（メタデータ） (2023-06-05T01:01:12Z)
Using Textual Interface to Align External Knowledge for End-to-End Task-Oriented Dialogue Systems [53.38517204698343]
本稿では,外部知識の整合化と冗長なプロセスの排除にテキストインタフェースを用いた新しいパラダイムを提案する。我々は、MultiWOZ-Remakeを用いて、MultiWOZデータベース用に構築されたインタラクティブテキストインタフェースを含む、我々のパラダイムを実演する。
論文参考訳（メタデータ） (2023-05-23T05:48:21Z)
Interactive Natural Language Processing [67.87925315773924]
対話型自然言語処理(iNLP)は,NLP分野における新しいパラダイムとして登場した。本稿では,iNLPの概念の統一的定義と枠組みを提案することから,iNLPに関する包括的調査を行う。
論文参考訳（メタデータ） (2023-05-22T17:18:29Z)
Foundation Models for Decision Making: Problems, Methods, and Opportunities [124.79381732197649]
大規模に多様なデータに基づいて事前訓練された基礎モデルは、幅広いビジョンと言語タスクにおいて異常な能力を示してきた。ファンデーションモデルをトレーニングし、他のエージェントと対話し、長期的な推論を行うための新しいパラダイムが生まれている。基礎モデルと意思決定の交わりにおける研究は、強力な新しいシステムを作るための大きな約束である。
論文参考訳（メタデータ） (2023-03-07T18:44:07Z)
Taxonomy of Abstractive Dialogue Summarization: Scenarios, Approaches and Future Directions [14.85592662663867]
この調査は、シナリオから抽象的な対話を要約するための既存の研究を包括的に調査する。タスクは入力ダイアログの種類、すなわちオープンドメインとタスク指向の2つの幅広いカテゴリに分類される。既存のテクニックを3方向に分類し、対話機能を注入し、補助訓練タスクを設計し、追加データを使用する。
論文参考訳（メタデータ） (2022-10-18T14:33:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。