論文の概要: Before the Pull Request: Mining Multi-Agent Coordination
- arxiv url: http://arxiv.org/abs/2606.19616v1
- Date: Wed, 17 Jun 2026 21:47:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.550967
- Title: Before the Pull Request: Mining Multi-Agent Coordination
- Title(参考訳): プルリクエスト前:マルチエージェントコーディネーションのマイニング
- Authors: Dipankar Sarkar,
- Abstract要約: 我々は、並行エージェントが共有作業に対して主張し、分割し、衝突する方法において、欠けている信号がPRの前に存在すると主張している。
我々はこのプロセスを,中央サーバを必要としないオープンソースのコーディネート基板であるgriteを通じて研究し,そのレコードをgit自体に格納する。
i) この共有基板は, 重複と矛盾する作業のオーバーヘッドを低減し, (ii) 各エージェントのログのコピーは, 書き込みを無音に落とさずに同じ状態に収束し, (iii) ログは, コンクリート破壊モードが自動的に回復可能な, 採掘可能な人工物であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous coding agents now open millions of pull requests, yet large-scale studies find their PRs are produced faster but accepted less often - a coordination and trust gap that pull-request-level telemetry cannot explain. We argue the missing signal lives before the PR, in how concurrent agents claim, divide, and collide over shared work. We study this process through grite, our open-source coordination substrate that needs no central server and stores its records inside git itself, so its append-only, signed event log captures the coordination process directly. We show that (i) this shared substrate reduces duplicate and conflicting work at bounded overhead - the share of work that merely re-does a teammate's task falls from 78% to 0% while useful throughput more than triples; (ii) every agent's copy of the log converges to the same state with no write silently dropped, where a file-based tracker loses concurrent writes; and (iii) the log is a mineable artefact from which concrete failure modes - conflicting edits, lock starvation, redundant rediscovery, race-to-close - are automatically recoverable with provenance, several invisible in pull-request history. We release the dataset, harness, and mining toolkit.
- Abstract(参考訳): 自律的なコーディングエージェントは今や数百万のプルリクエストを開くが、大規模な研究によると、PRはより高速に生成されるが、受け入れられる頻度は低い。
我々は、並行エージェントが共有作業に対して主張し、分割し、衝突する方法において、欠けている信号がPRの前に存在すると主張している。
我々はこのプロセスを,中央サーバを必要としないオープンソースのコーディネート基板であるgriteを通じて研究し,そのレコードをgit自体に格納する。
私たちはそれを示します
(i)この共有基板は、重複と矛盾するオーバーヘッドでの作業を減らす。チームメイトのタスクを単にやり直す作業のシェアは、78%から0%に低下し、3倍以上の有用なスループットが得られます。
(ii) 各エージェントのログコピーは同じ状態に収束し、書き込みを無音にドロップすることなく、ファイルベースのトラッカーが同時書き込みを失う。
(iii)ログは、具体的障害モード(編集の矛盾、ロックの飢餓、冗長な再発見、レース・トゥ・クロース)が、いくつかのプルリクエスト履歴で目に見えない、自動的に回復可能な、マイニング可能なアーティファクトである。
データセット、ハーネス、マイニングツールキットをリリースします。
関連論文リスト
- GitOfThoughts: Version-Controlled Reasoning and Agent Memory You Can Replay, Diff, and Merge [0.02066679446411895]
エージェントの推論ツリーをgitリポジトリとして格納するGitOfThoughtsを紹介します。
評価されたすべての思考はコミットであり、スコアはノートであり、結果はタグであり、検索はエージェント自身の履歴に対して"git log"である。
これにより、ほぼゼロのエンジニアリングコストで、推論が再生可能で、監査可能で、エージェント間でマージ可能になります。
論文 参考訳(メタデータ) (2026-06-12T14:02:37Z) - tap: A File-Based Protocol for Heterogeneous LLM Agent Collaboration [2.7254915857994324]
本稿では,共有メモリや同一ランタイムを使わずに,ClaudeとCodexのコラボレーションを可能にする,ファイルベースのコラボレーションプロトコルであるTapを提案する。
tapはオープンソースのnpmパッケージ@hua-labs/tap (v0.5.2)として配布される。
論文 参考訳(メタデータ) (2026-06-12T13:28:34Z) - Where Do Deep-Research Agents Go Wrong? Span-Level Error Localization in Agent Trajectories [51.22051230894794]
最終回答に基づく評価は、エージェントが成功するかどうかを示すが、どの部分の軌道が答えを信頼できないかを示すものではない。
2つのエージェントフレームワーク、3つのバックボーンモデル、3つのベンチマークから2,790の実際のトラジェクトリを収集し、生ログをセマンティックスパンに変換し、エキスパートレビューを通じて有害なエラースパンを注釈付けします。
我々は,エージェントの主張を追跡するクレーム中心の監査フレームワークであるDRIFTを提案する。
論文 参考訳(メタデータ) (2026-06-01T10:50:26Z) - Mesh Memory Protocol: Semantic Infrastructure for Multi-Agent LLM Systems [0.9494375075678443]
LLMエージェントは、数日または数週間にわたるタスクでますます協力する。
これにより、エージェントはセッション間でリアルタイムでお互いの認知状態を共有し、評価し、組み合わせる必要がある。
我々はこのクロスセッションエージェント対エージェント認知コラボレーションを、並列エージェント実行とは別物と呼ぶ。
論文 参考訳(メタデータ) (2026-04-21T15:00:25Z) - When AI Teammates Meet Code Review: Collaboration Signals Shaping the Integration of Agent-Authored Pull Requests [0.0]
公開AIDevデータセットを用いて,統合結果,分解速度,レビュータイムの協調信号について検討した。
レビューア・エンゲージメントは、成功裏に最も強い相関関係があるのに対して、大きな変更サイズと調整中断アクションは、マージの可能性の低下に関連している。
論文 参考訳(メタデータ) (2026-02-23T02:20:56Z) - BlackCATT: Black-box Collusion Aware Traitor Tracing in Federated Learning [51.251962154210474]
フェデレートラーニング: BlackCATT におけるブラックボックストレーサトレースのための一般的なコラシオン耐性埋め込み法を提案する。
実験により,異なるアーキテクチャやデータセットにまたがる提案手法の有効性が確認された。
メインタスクの更新不整合に苦しむモデルに対して,提案したBlackCATT+FRには機能正規化が組み込まれている。
論文 参考訳(メタデータ) (2026-02-12T16:26:57Z) - Pull Requests as a Training Signal for Repo-Level Code Editing [49.82435173554125]
Clean Pull Request(Clean-PR)は、現実のGitHubプルリクエストをリポジトリレベルの編集のトレーニングシグナルとして活用する、トレーニング中のパラダイムである。
ノイズの多いプルリクエストの差分を,再構築と検証を通じて検索/リプレース編集ブロックに変換する,スケーラブルなパイプラインを導入する。
SWE-benchでは,SWE-bench Liteが13.6%,SWE-bench Verifiedが12.3%,命令調整ベースラインが大幅に向上した。
論文 参考訳(メタデータ) (2026-02-07T09:22:25Z) - Where Do AI Coding Agents Fail? An Empirical Study of Failed Agentic Pull Requests in GitHub [5.808464460707249]
われわれはGitHub全体で5人のコーディングエージェントが作成した33kエージェントのPRを大規模に調査している。
まず,4次元のPRを定量的に特徴付ける。
マージされていないPRは、より大きなコード変更を伴い、より多くのファイルに触れる傾向があり、プロジェクトのCI/CDパイプライン検証に合格しないことが多い。
論文 参考訳(メタデータ) (2026-01-21T17:12:46Z) - Fact Checking Beyond Training Set [64.88575826304024]
本稿では,レトリバーリーダが,あるドメインのラベル付きデータに基づいてトレーニングし,別のドメインで使用する場合,性能劣化に悩まされることを示す。
本稿では,レトリバー成分を分散シフトに対して頑健にするための逆アルゴリズムを提案する。
次に、これらのデータセットから8つの事実チェックシナリオを構築し、モデルと強力なベースラインモデルのセットを比較します。
論文 参考訳(メタデータ) (2024-03-27T15:15:14Z) - A Cordial Sync: Going Beyond Marginal Policies for Multi-Agent Embodied
Tasks [111.34055449929487]
エージェントが協力して家具をリビングルームに移動させるという,新しいタスクFurnMoveを紹介した。
既存のタスクとは異なり、FurnMoveはエージェントが各タイミングで調整する必要がある。
既存の分散化されたアクションサンプリング手順は、表現力のある共同アクションポリシーを許さない。
SynC-policiesとCORDIALを用いて、我々のエージェントはFurnMoveで58%の完成率を達成する。
論文 参考訳(メタデータ) (2020-07-09T17:59:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。