論文の概要: Smarter Together: Creating Agentic Communities of Practice through Shared Experiential Learning
- arxiv url: http://arxiv.org/abs/2511.08301v1
- Date: Wed, 12 Nov 2025 01:51:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.749029
- Title: Smarter Together: Creating Agentic Communities of Practice through Shared Experiential Learning
- Title(参考訳): より賢く:共有経験的学習を通して実践のエージェント・コミュニティを作る
- Authors: Valentin Tablan, Scott Taylor, Gabriel Hurtado, Kristoffer Bernhem, Anders Uhrenholt, Gabriele Farei, Karo Moilanen,
- Abstract要約: 人間中心のソフトウェア開発プラクティスからエージェント中心のソフトウェア開発プラクティスへの移行は、ソフトウェア開発者のための既存の知識共有環境を破壊している。
従来のピアツーピアレポジトリと、技術知識を共有し、ベストプラクティスを共有する開発者コミュニティは、短期間で参加の劇的な減少を目の当たりにした。
私たちは、人間の開発コミュニティの集合的知性とノウハウをエミュレートするために設計された、新しい共有エージェントメモリアーキテクチャであるSparkを紹介します。
- 参考スコア(独自算出の注目度): 0.8169615474579602
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The transition from human-centric to agent-centric software development practices is disrupting existing knowledge sharing environments for software developers. Traditional peer-to-peer repositories and developer communities for shared technical knowledge and best practice have witnessed dramatic drops in participation in a short period of time. At the same time, agentic functional equivalents are yet to emerge leaving AI agents, which already generate a significant proportion of all new software code produced, without access to repositories of valuable shared learning. In this paper, we introduce Spark, a novel shared agentic memory architecture which is designed to emulate the collective intelligence and know-how of human developer communities. Spark enables AI coding agents to both contribute to and draw from a persistent and continuously evolving experiential memory. Agents operating in the same general problem space use the Spark shared memory as a repository of new knowledge to achieve collective continual learning. We evaluate Spark as a coach for AI coding agents performing software development tasks. We demonstrate that recommendations made by Spark improve the quality of code generated by generic code generation models at varying sizes and capability tiers. Boosted by Spark, a small open-weights model with 30 billion parameters was able to match the code quality afforded by a much larger state-of-the-art model. Separately, we measure the intrinsic quality of recommendations generated by Spark against a wide range of criteria inspired by software development best practice, and achieve helpfulness levels of up to 98.2% in the top two (out of five) qualitative helpfulness bands.
- Abstract(参考訳): 人間中心のソフトウェア開発プラクティスからエージェント中心のソフトウェア開発プラクティスへの移行は、ソフトウェア開発者のための既存の知識共有環境を破壊している。
従来のピアツーピアレポジトリと、技術知識を共有し、ベストプラクティスを共有する開発者コミュニティは、短期間で参加の劇的な減少を目の当たりにした。
同時に、エージェント機能相当物は、価値ある共有学習のレポジトリにアクセスすることなく、すでに生成されたすべての新しいソフトウェアコードのかなりの割合を生成しているAIエージェントを残して、まだ現れていない。
本稿では,人間の開発コミュニティの集合的知性とノウハウをエミュレートするために設計された,新しい共有エージェントメモリアーキテクチャであるSparkを紹介する。
Sparkは、永続的で継続的な進化した体験記憶にAIコーディングエージェントが貢献し、そこから引き出すことを可能にする。
同じ一般的な問題領域で動作するエージェントは、Spark共有メモリを新しい知識のリポジトリとして使用して、集合的な継続的な学習を実現する。
私たちは、ソフトウェア開発タスクを実行するAIコーディングエージェントのコーチとしてSparkを評価します。
Sparkのレコメンデーションは、汎用コード生成モデルによって生成されたコードの品質を、さまざまなサイズと能力レベルで改善することを示した。
Sparkによって強化された、300億のパラメータを持つ小さなオープンウェイトモデルでは、はるかに大きな最先端モデルによって提供されるコード品質にマッチすることができた。
別として、ソフトウェア開発のベストプラクティスにインスパイアされた幅広い基準に対してSparkが生み出すレコメンデーションの本質的な品質を測定します。
関連論文リスト
- CoCoA: Collaborative Chain-of-Agents for Parametric-Retrieved Knowledge Synergy [47.1570374686203]
Retrieval-Augmented Generation (RAG)はLarge Language Models (LLM)を強化する
現在のRAG法は、世代間の知識を完全に活用するのに苦労することが多い。
本稿では,パラメトリックな知識と検索された知識の相乗効果を明確に向上するフレームワークであるCollaborative Chain-of-Agentsを提案する。
論文 参考訳(メタデータ) (2025-08-03T10:00:38Z) - Code with Me or for Me? How Increasing AI Automation Transforms Developer Workflows [60.04362496037186]
本研究は,コーディングエージェントと開発者インタラクションを制御した最初の研究である。
我々は,2つの主要な協調型およびエージェント型符号化アシスタントの評価を行った。
結果から,エージェントはコピロトを超える方法で開発者を支援することができることがわかった。
論文 参考訳(メタデータ) (2025-07-10T20:12:54Z) - SWE-Bench-CL: Continual Learning for Coding Agents [0.0]
SWE-Bench-CLは、人間検証されたSWE-Bench検証データセット上に構築された、新しい連続学習ベンチマークである。
GitHubのイシューを、自然リポジトリの進化を反映した時系列順序に整理することで、SWE-Bench-CLは、エージェントのエクスペリエンスを蓄積する能力を直接評価できる。
論文 参考訳(メタデータ) (2025-06-13T07:11:14Z) - Enhancing LLM Code Generation: A Systematic Evaluation of Multi-Agent Collaboration and Runtime Debugging for Improved Accuracy, Reliability, and Latency [0.0]
プログラミング活動の異なる構成や訓練パラダイムがコード生成の効率に与える影響について検討する。
私たちの発見は、堅牢なAI駆動型コーディングソリューションを求める組織に貴重な洞察を与えます。
論文 参考訳(メタデータ) (2025-05-04T14:44:27Z) - OpenHands: An Open Platform for AI Software Developers as Generalist Agents [109.8507367518992]
私たちは、人間の開発者と同じような方法で世界と対話するAIエージェントを開発するためのプラットフォームであるOpenHandsを紹介します。
プラットフォームが新しいエージェントの実装を可能にし、コード実行のためのサンドボックス環境との安全なインタラクション、評価ベンチマークの導入について説明する。
論文 参考訳(メタデータ) (2024-07-23T17:50:43Z) - The AI Community Building the Future? A Quantitative Analysis of Development Activity on Hugging Face Hub [2.595302141947391]
私たちはHugging Face (HF) Hub上での開発活動を分析します。
例えば、70%以上のモデルが0回ダウンロードされ、1%が99%ダウンロードされている。
コミュニティにはコア周辺構造があり、多彩な開発者のコアと、分離された開発者の大多数があります。
論文 参考訳(メタデータ) (2024-05-20T11:10:49Z) - SOEN-101: Code Generation by Emulating Software Process Models Using Large Language Model Agents [50.82665351100067]
FlowGenは、複数のLarge Language Model (LLM)エージェントに基づいたソフトウェアプロセスモデルをエミュレートするコード生成フレームワークである。
FlowGenScrumをHumanEval、HumanEval-ET、MBPP、MBPP-ETの4つのベンチマークで評価した。
論文 参考訳(メタデータ) (2024-03-23T14:04:48Z) - Experiential Co-Learning of Software-Developing Agents [83.34027623428096]
大規模言語モデル(LLM)は、特にソフトウェア開発において、様々な領域に大きな変化をもたらした。
本稿では,新しいLLM学習フレームワークであるExperiential Co-Learningを紹介する。
実験では、このフレームワークにより、エージェントは、目に見えないソフトウェア開発タスクをより効果的に対処できることを示した。
論文 参考訳(メタデータ) (2023-12-28T13:50:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。