Fugu-MT 論文翻訳(概要): Smarter Together: Creating Agentic Communities of Practice through Shared Experiential Learning

論文の概要: Smarter Together: Creating Agentic Communities of Practice through Shared Experiential Learning

arxiv url: http://arxiv.org/abs/2511.08301v1
Date: Wed, 12 Nov 2025 01:51:56 GMT
ステータス: 翻訳完了
システム内更新日: 2025-11-12 20:17:03.749029
Title: Smarter Together: Creating Agentic Communities of Practice through Shared Experiential Learning
Title（参考訳）: より賢く:共有経験的学習を通して実践のエージェント・コミュニティを作る
Authors: Valentin Tablan, Scott Taylor, Gabriel Hurtado, Kristoffer Bernhem, Anders Uhrenholt, Gabriele Farei, Karo Moilanen,
Abstract要約: 人間中心のソフトウェア開発プラクティスからエージェント中心のソフトウェア開発プラクティスへの移行は、ソフトウェア開発者のための既存の知識共有環境を破壊している。従来のピアツーピアレポジトリと、技術知識を共有し、ベストプラクティスを共有する開発者コミュニティは、短期間で参加の劇的な減少を目の当たりにした。私たちは、人間の開発コミュニティの集合的知性とノウハウをエミュレートするために設計された、新しい共有エージェントメモリアーキテクチャであるSparkを紹介します。
参考スコア（独自算出の注目度）: 0.8169615474579602
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: The transition from human-centric to agent-centric software development practices is disrupting existing knowledge sharing environments for software developers. Traditional peer-to-peer repositories and developer communities for shared technical knowledge and best practice have witnessed dramatic drops in participation in a short period of time. At the same time, agentic functional equivalents are yet to emerge leaving AI agents, which already generate a significant proportion of all new software code produced, without access to repositories of valuable shared learning. In this paper, we introduce Spark, a novel shared agentic memory architecture which is designed to emulate the collective intelligence and know-how of human developer communities. Spark enables AI coding agents to both contribute to and draw from a persistent and continuously evolving experiential memory. Agents operating in the same general problem space use the Spark shared memory as a repository of new knowledge to achieve collective continual learning. We evaluate Spark as a coach for AI coding agents performing software development tasks. We demonstrate that recommendations made by Spark improve the quality of code generated by generic code generation models at varying sizes and capability tiers. Boosted by Spark, a small open-weights model with 30 billion parameters was able to match the code quality afforded by a much larger state-of-the-art model. Separately, we measure the intrinsic quality of recommendations generated by Spark against a wide range of criteria inspired by software development best practice, and achieve helpfulness levels of up to 98.2% in the top two (out of five) qualitative helpfulness bands.
Abstract（参考訳）: 人間中心のソフトウェア開発プラクティスからエージェント中心のソフトウェア開発プラクティスへの移行は、ソフトウェア開発者のための既存の知識共有環境を破壊している。従来のピアツーピアレポジトリと、技術知識を共有し、ベストプラクティスを共有する開発者コミュニティは、短期間で参加の劇的な減少を目の当たりにした。同時に、エージェント機能相当物は、価値ある共有学習のレポジトリにアクセスすることなく、すでに生成されたすべての新しいソフトウェアコードのかなりの割合を生成しているAIエージェントを残して、まだ現れていない。本稿では,人間の開発コミュニティの集合的知性とノウハウをエミュレートするために設計された,新しい共有エージェントメモリアーキテクチャであるSparkを紹介する。 Sparkは、永続的で継続的な進化した体験記憶にAIコーディングエージェントが貢献し、そこから引き出すことを可能にする。同じ一般的な問題領域で動作するエージェントは、Spark共有メモリを新しい知識のリポジトリとして使用して、集合的な継続的な学習を実現する。私たちは、ソフトウェア開発タスクを実行するAIコーディングエージェントのコーチとしてSparkを評価します。 Sparkのレコメンデーションは、汎用コード生成モデルによって生成されたコードの品質を、さまざまなサイズと能力レベルで改善することを示した。 Sparkによって強化された、300億のパラメータを持つ小さなオープンウェイトモデルでは、はるかに大きな最先端モデルによって提供されるコード品質にマッチすることができた。別として、ソフトウェア開発のベストプラクティスにインスパイアされた幅広い基準に対してSparkが生み出すレコメンデーションの本質的な品質を測定します。

関連論文リスト

ClarEval: A Benchmark for Evaluating Clarification Skills of Code Agents under Ambiguous Instructions [19.875754116636436]
ClarEvalは、人間のコミュニケーションのあいまいさをシミュレートすることで、エージェントの「協調的クオリティ」を評価するために設計されたフレームワークである。この能力の定量化のために,Average Turnsが主導するメトリクススイートを提案し,コーダ(ATC)とキー質問カバレッジ(KQC)を明らかにする。 GPT-5-Coderのようなモデルはコーディングに優れていますが、効率的なパートナーシップに必要な戦略的コミュニケーションスキルは欠如しています。
論文参考訳（メタデータ） (2026-02-27T01:10:27Z)
Agent0: Unleashing Self-Evolving Agents from Zero Data via Tool-Integrated Reasoning [84.70211451226835]
大規模言語モデル(LLM)エージェントは、人間の計算データへの依存によって制約される。我々は,外部データを持たない高性能エージェントを進化させる完全自律型フレームワークであるAgent0を紹介する。 Agent0は推論能力を大幅に向上させ、Qwen3-8B-Baseモデルを数学的推論で18%改善し、一般的な推論ベンチマークで24%改善した。
論文参考訳（メタデータ） (2025-11-20T05:01:57Z)
CoCoA: Collaborative Chain-of-Agents for Parametric-Retrieved Knowledge Synergy [47.1570374686203]
Retrieval-Augmented Generation (RAG)はLarge Language Models (LLM)を強化する現在のRAG法は、世代間の知識を完全に活用するのに苦労することが多い。本稿では,パラメトリックな知識と検索された知識の相乗効果を明確に向上するフレームワークであるCollaborative Chain-of-Agentsを提案する。
論文参考訳（メタデータ） (2025-08-03T10:00:38Z)
Code with Me or for Me? How Increasing AI Automation Transforms Developer Workflows [60.04362496037186]
本研究は,コーディングエージェントと開発者インタラクションを制御した最初の研究である。我々は,2つの主要な協調型およびエージェント型符号化アシスタントの評価を行った。結果から,エージェントはコピロトを超える方法で開発者を支援することができることがわかった。
論文参考訳（メタデータ） (2025-07-10T20:12:54Z)
SWE-Bench-CL: Continual Learning for Coding Agents [0.0]
SWE-Bench-CLは、人間検証されたSWE-Bench検証データセット上に構築された、新しい連続学習ベンチマークである。 GitHubのイシューを、自然リポジトリの進化を反映した時系列順序に整理することで、SWE-Bench-CLは、エージェントのエクスペリエンスを蓄積する能力を直接評価できる。
論文参考訳（メタデータ） (2025-06-13T07:11:14Z)
Enhancing LLM Code Generation: A Systematic Evaluation of Multi-Agent Collaboration and Runtime Debugging for Improved Accuracy, Reliability, and Latency [0.0]
プログラミング活動の異なる構成や訓練パラダイムがコード生成の効率に与える影響について検討する。私たちの発見は、堅牢なAI駆動型コーディングソリューションを求める組織に貴重な洞察を与えます。
論文参考訳（メタデータ） (2025-05-04T14:44:27Z)
Kolb-Based Experiential Learning for Generalist Agents with Human-Level Kaggle Data Science Performance [81.05882480184587]
本稿では,自律エージェントに対するVygotskyのZPDを用いて,Kolbの学習サイクルの計算フレームワークを提案する。 Agent Kは、KolbとVygotskyにインスパイアされた人間の認知学習をうまく統合する第1のAIシステムである。金9個、銀8個、銅12個で、メダル獲得競争で金4個、銀4個を含む。エージェントKは、コルブとヴィーゴツキーにインスパイアされた人間の認知学習をうまく統合する第1のAIシステムである。
論文参考訳（メタデータ） (2024-11-05T23:55:23Z)
Codev-Bench: How Do LLMs Understand Developer-Centric Code Completion? [60.84912551069379]
Code-Development Benchmark (Codev-Bench)は、細粒度で現実世界、リポジトリレベル、開発者中心の評価フレームワークです。 Codev-Agentは、リポジトリのクローリングを自動化し、実行環境を構築し、既存のユニットテストから動的呼び出しチェーンを抽出し、データ漏洩を避けるために新しいテストサンプルを生成するエージェントベースのシステムである。
論文参考訳（メタデータ） (2024-10-02T09:11:10Z)
OpenHands: An Open Platform for AI Software Developers as Generalist Agents [109.8507367518992]
私たちは、人間の開発者と同じような方法で世界と対話するAIエージェントを開発するためのプラットフォームであるOpenHandsを紹介します。プラットフォームが新しいエージェントの実装を可能にし、コード実行のためのサンドボックス環境との安全なインタラクション、評価ベンチマークの導入について説明する。
論文参考訳（メタデータ） (2024-07-23T17:50:43Z)
The AI Community Building the Future? A Quantitative Analysis of Development Activity on Hugging Face Hub [2.595302141947391]
私たちはHugging Face (HF) Hub上での開発活動を分析します。例えば、70%以上のモデルが0回ダウンロードされ、1%が99%ダウンロードされている。コミュニティにはコア周辺構造があり、多彩な開発者のコアと、分離された開発者の大多数があります。
論文参考訳（メタデータ） (2024-05-20T11:10:49Z)
SOEN-101: Code Generation by Emulating Software Process Models Using Large Language Model Agents [50.82665351100067]
FlowGenは、複数のLarge Language Model (LLM)エージェントに基づいたソフトウェアプロセスモデルをエミュレートするコード生成フレームワークである。 FlowGenScrumをHumanEval、HumanEval-ET、MBPP、MBPP-ETの4つのベンチマークで評価した。
論文参考訳（メタデータ） (2024-03-23T14:04:48Z)
Experiential Co-Learning of Software-Developing Agents [83.34027623428096]
大規模言語モデル(LLM)は、特にソフトウェア開発において、様々な領域に大きな変化をもたらした。本稿では,新しいLLM学習フレームワークであるExperiential Co-Learningを紹介する。実験では、このフレームワークにより、エージェントは、目に見えないソフトウェア開発タスクをより効果的に対処できることを示した。
論文参考訳（メタデータ） (2023-12-28T13:50:42Z)
Comparing Software Developers with ChatGPT: An Empirical Investigation [0.0]
本稿では,ChatGPTのようなソフトウェア技術者やAIシステムのパフォーマンスを,さまざまな評価指標で比較した実証的研究を行う。この論文は、さまざまな評価基準を考慮して、ソフトウェアエンジニアとAIベースのソリューションの包括的な比較が、人間と機械のコラボレーションを促進する上で重要であることを示唆している。
論文参考訳（メタデータ） (2023-05-19T17:25:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。