Fugu-MT 論文翻訳(概要): DevNous: An LLM-Based Multi-Agent System for Grounding IT Project Management in Unstructured Conversation

論文の概要: DevNous: An LLM-Based Multi-Agent System for Grounding IT Project Management in Unstructured Conversation

arxiv url: http://arxiv.org/abs/2508.08761v1
Date: Tue, 12 Aug 2025 09:08:29 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-13 21:07:34.35938
Title: DevNous: An LLM-Based Multi-Agent System for Grounding IT Project Management in Unstructured Conversation
Title（参考訳）: DevNous: 構造化されていない会話におけるITプロジェクト管理を基盤とするLLMベースのマルチエージェントシステム
Authors: Stavros Doropoulos, Stavros Vologiannidis, Ioannis Magnisalis,
Abstract要約: 本稿では,Large Language Model-based (LLM) multi-agent expert systemを導入し,この非構造化翻訳プロセスを自動化する。 DevNousはチームチャット環境に直接統合し、非公式な対話から行動可能な意図を特定する。システムを定量的に評価するために,160個の現実的対話型ターンのベンチマークを導入する。
参考スコア（独自算出の注目度）: 2.1301560294088318
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The manual translation of unstructured team dialogue into the structured artifacts required for Information Technology (IT) project governance is a critical bottleneck in modern information systems management. We introduce DevNous, a Large Language Model-based (LLM) multi-agent expert system, to automate this unstructured-to-structured translation process. DevNous integrates directly into team chat environments, identifying actionable intents from informal dialogue and managing stateful, multi-turn workflows for core administrative tasks like automated task formalization and progress summary synthesis. To quantitatively evaluate the system, we introduce a new benchmark of 160 realistic, interactive conversational turns. The dataset was manually annotated with a multi-label ground truth and is publicly available. On this benchmark, DevNous achieves an exact match turn accuracy of 81.3\% and a multiset F1-Score of 0.845, providing strong evidence for its viability. The primary contributions of this work are twofold: (1) a validated architectural pattern for developing ambient administrative agents, and (2) the introduction of the first robust empirical baseline and public benchmark dataset for this challenging problem domain.
Abstract（参考訳）: 非構造化チーム対話をIT(Information Technology)プロジェクトガバナンスに必要な構造化アーティファクトに手動で翻訳することは、現代の情報システム管理において重要なボトルネックとなっている。本稿では,Large Language Model-based multi-agent expert systemであるDevNousを紹介し,この非構造化翻訳プロセスを自動化する。 DevNousはチームチャット環境に直接統合し、非公式な対話から行動可能な意図を特定し、自動化タスクのフォーマライゼーションや進捗要約合成といった中核的な管理タスクのためのステートフルなマルチターンワークフローを管理する。システムを定量的に評価するために,160個の現実的対話型ターンのベンチマークを導入する。データセットは、手動でマルチラベルの真実を注釈付けされ、公開されている。このベンチマークでは、DevNousは81.3\%の正確な一致精度と0.845のマルチセットF1スコアを達成した。この研究の主な貢献は、(1)環境管理エージェントを開発するための検証済みアーキテクチャパターン、(2)この課題領域のための最初の堅牢な経験的ベースラインと公開ベンチマークデータセットの導入である。

関連論文リスト

Agyn: A Multi-Agent System for Team-Based Autonomous Software Engineering [0.09046463333989574]
現実世界のソフトウェア開発は、共有方法論に従ってチームが共同で行う活動として組織されます。ソフトウェア工学を組織プロセスとして明示的にモデル化する,完全に自動化されたマルチエージェントシステムを提案する。我々の結果は、チーム構造、方法論、コミュニケーションの複製が、自律的なソフトウェアエンジニアリングの強力なパラダイムであることを示唆している。
論文参考訳（メタデータ） (2026-02-01T22:17:19Z)
LoCoBench-Agent: An Interactive Benchmark for LLM Agents in Long-Context Software Engineering [90.84806758077536]
textbfLoCoBench-Agentは,大規模言語モデル(LLM)エージェントを現実的,長期的ソフトウェア工学で評価するための総合的な評価フレームワークである。我々のフレームワークは、LoCoBenchの8000のシナリオを対話型エージェント環境に拡張し、マルチターン会話の体系的評価を可能にする。我々のフレームワークは,8つの特殊なツール(ファイル操作,検索,コード解析)をエージェントに提供し,それを10Kから1Mトークンの範囲で評価する。
論文参考訳（メタデータ） (2025-11-17T23:57:24Z)
MMWOZ: Building Multimodal Agent for Task-oriented Dialogue [61.816787158531874]
我々は、MultiWOZ 2.3データセットから拡張された新しいマルチモーダル対話データセットを開発する。 MMWOZデータセットのベースラインモデルとして,MATEと呼ばれる新しいマルチモーダルモデルを提案する。
論文参考訳（メタデータ） (2025-11-16T13:08:03Z)
A Comprehensive Survey on Benchmarks and Solutions in Software Engineering of LLM-Empowered Agentic System [56.40989626804489]
この調査は、Large Language Modelsを使ったソフトウェアエンジニアリングに関する、最初の総合的な分析を提供する。本稿では,150以上の最近の論文をレビューし,(1)素早い,微調整,エージェントベースのパラダイムに分類した解法,(2)コード生成,翻訳,修復などのタスクを含むベンチマークという2つの重要な側面に沿った分類法を提案する。
論文参考訳（メタデータ） (2025-10-10T06:56:50Z)
AgentMaster: A Multi-Agent Conversational Framework Using A2A and MCP Protocols for Multimodal Information Retrieval and Analysis [0.0]
本稿では,A2AとMPPを自己実装した新しいモジュール型マルチプロトコールMASフレームワークであるAgentMasterの試験的検討を行う。このシステムは、技術的専門知識のない自然言語インタラクションをサポートし、マルチモーダルクエリに応答する。全体として、提案するフレームワークは、MASを利用したドメイン固有、協調的、スケーラブルな対話型AIの可能性に寄与する。
論文参考訳（メタデータ） (2025-07-08T03:34:26Z)
A Survey on (M)LLM-Based GUI Agents [62.57899977018417]
グラフィカルユーザインタフェース (GUI) エージェントは、人間とコンピュータのインタラクションにおいて、トランスフォーメーションパラダイムとして登場した。大規模言語モデルとマルチモーダル学習の最近の進歩は、デスクトップ、モバイル、Webプラットフォーム全体でGUI自動化に革命をもたらした。本調査では, 正確な要素位置決定, 効果的な知識検索, 長期計画, 安全に配慮した実行制御など, 重要な技術的課題を明らかにする。
論文参考訳（メタデータ） (2025-03-27T17:58:31Z)
OmniParser V2: Structured-Points-of-Thought for Unified Visual Text Parsing and Its Generality to Multimodal Large Language Models [58.45517851437422]
VsTP(Visually-situated text parsing)は、自動化された文書理解の需要が高まり、最近顕著な進歩を遂げている。既存のソリューションは、タスク固有のアーキテクチャと個々のタスクの目的に依存していることが多い。本稿では,テキストスポッティング,キー情報抽出,テーブル認識,レイアウト解析など,VsTPの典型的なタスクを統一する汎用モデルであるOmni V2を紹介する。
論文参考訳（メタデータ） (2025-02-22T09:32:01Z)
Autonomous Deep Agent [0.7489814067742621]
Deep Agentは、複雑なマルチフェーズタスクを管理するために設計された高度な自律AIシステムである。システムの基盤は階層型タスクDAGフレームワーク上に構築されています。 Deep Agentは、自己管理型AIシステムにおいて、新しいパラダイムを確立する。
論文参考訳（メタデータ） (2025-02-10T21:46:54Z)
InstructERC: Reforming Emotion Recognition in Conversation with Multi-task Retrieval-Augmented Large Language Models [9.611864685207056]
本稿では,識別的枠組みから大規模言語モデル(LLM)に基づく生成的枠組みへ,感情認識タスクを再構築するための新しいアプローチであるインストラクタCを提案する。 InstructERCは、3つの重要な貢献をしている:(1)モデルがマルチグラニュラリティ対話監視情報を明示的に統合するのに役立つ単純で効果的なテンプレートモジュール、(2)話者識別と感情予測タスクという2つの追加の感情アライメントタスクを導入し、会話における対話の役割の関係と将来の感情傾向を暗黙的にモデル化する。
論文参考訳（メタデータ） (2023-09-21T09:22:07Z)
LAMM: Language-Assisted Multi-Modal Instruction-Tuning Dataset, Framework, and Benchmark [81.42376626294812]
本稿では,Language-Assisted Multi-Modalインストラクションチューニングデータセット,フレームワーク,ベンチマークを提案する。我々の目標は、MLLMのトレーニングと評価のための成長するエコシステムとしてLAMMを確立することです。本稿では,2次元および3次元視覚のための広範囲な視覚タスクをカバーする包括的データセットとベンチマークを提案する。
論文参考訳（メタデータ） (2023-06-11T14:01:17Z)
Zero-Shot Generalizable End-to-End Task-Oriented Dialog System using Context Summarization and Domain Schema [2.7178968279054936]
タスク指向対話システムにおける最先端のアプローチは、条件付きシーケンス生成タスクとして問題を定式化する。これは、新しいドメインまたはタスクごとにラベル付きトレーニングデータを必要とする。本稿では,ZS-ToDという,Zero-Shotの汎用的なエンドツーエンドタスク指向ダイアログシステムについて紹介する。
論文参考訳（メタデータ） (2023-03-28T18:56:31Z)
A Machine Learning Approach to Classifying Construction Cost Documents into the International Construction Measurement Standard [0.0]
原価文書で提供される自然言語記述を分類する最初の自動モデル「Bills of Quantities」を紹介した。英国中の24の大規模なインフラ建設プロジェクトから収集された5万件以上の項目のデータセットから学習する。
論文参考訳（メタデータ） (2022-10-24T11:35:53Z)
A Data-Centric Framework for Composable NLP Workflows [109.51144493023533]
アプリケーションドメインにおける経験的自然言語処理システム(例えば、ヘルスケア、ファイナンス、教育)は、複数のコンポーネント間の相互運用を伴う。我々は,このような高度なNLPの高速な開発を支援するために,統一的なオープンソースフレームワークを構築した。
論文参考訳（メタデータ） (2021-03-02T16:19:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。