論文の概要: What Software Engineering Looks Like to AI Agents? -- An Empirical Study of AI-Only Technical Discourse on MoltBook
- arxiv url: http://arxiv.org/abs/2605.08380v1
- Date: Fri, 08 May 2026 18:38:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:49.600267
- Title: What Software Engineering Looks Like to AI Agents? -- An Empirical Study of AI-Only Technical Discourse on MoltBook
- Title(参考訳): AIエージェントにソフトウェアエンジニアリングはどのようなものか? -- MoltBookにおけるAI専門の技術談話の実証的研究
- Authors: Junyu Huo, Ziqi Mao, Zihao Wan, Gouri Ginde,
- Abstract要約: 自律型AIエージェントが、主に相互に相互作用するときに生み出す、ソフトウェアエンジニアリングの談話についてはほとんど知られていない。
本稿では,AIエージェントのみのソーシャルネットワークであるMoltBookにおける自律型AIエージェントの議論について検討する。
全体として、AIのみの技術談話は一貫性はあるが選択的である。
- 参考スコア(独自算出の注目度): 0.2937391223068457
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI agents are increasingly framed as software-engineering teammates, yet most research studies them inside human-centered workflows. Little is known about the software-engineering discourse autonomous AI agents produce when they interact primarily with one another. This paper examines what autonomous AI agents discuss in MoltBook, an AI-agents-only social network, how that discourse is organized, and how it differs from human developer discourse. We combine human open coding of a 500-post sample, a concentration-plus-check topic-analysis pipeline over 4,707 English-filtered MoltBook technology posts, and a matched-instrument comparison against 5,211 GitHub Discussions posts. MoltBook technology discourse spans 12 recurring themes and is led by Security and Trust (27.4%). At the community level, activity is highly concentrated: the largest submolt contains 63.5% of posts and the Gini coefficient is 0.88, yet a stability-aware BERTopic pipeline still yields 32 non-outlier sub-topics. Compared with the GitHub Discussions baseline, MoltBook discourse contains fewer concrete, context-rich cues such as code-formatted artifacts, environment details, runtime failures, and reproduction steps; social mimicry appears only in a limited way, while idealization is mainly reflected through lower hedging. Overall, AI-only technical discourse is coherent but selective. It repeatedly returns to concerns such as security and trust, memory and context management, tooling and APIs, debugging and error handling, workflow automation, and infrastructure/ops, while omitting much of the concrete runtime and project-local detail common in human developer discourse. This may be because MoltBook contains fewer environment-specific failures, reproduction steps, and other concrete grounding cues.
- Abstract(参考訳): AIエージェントはますます、ソフトウェアを駆使するチームメイトとして位置づけられているが、ほとんどの研究は、人間中心のワークフローの中でそれらを研究している。
自律型AIエージェントが、主に相互に相互作用するときに生み出す、ソフトウェアエンジニアリングの談話についてはほとんど知られていない。
本稿では、AIエージェントのみのソーシャルネットワークであるMoltBookで自律型AIエージェントが何を議論しているか、その会話がどのように組織化されているか、そしてそれが人間の開発者談話とどのように異なるかを検討する。
500ポストのサンプルの人間のオープンコーディング,4,707件の英語フィルタリングされたMoltBookテクノロジポストに対する集中+チェックトピック分析パイプライン,および5,211件のGitHub議論ポストに対する一致したインストラクションの比較を組み合わせる。
MoltBookの技術談話は12の繰り返しテーマに及び、Security and Trust(27.4%)がリードしている。
最大のサブモルトは63.5%のポストを含み、ジニ係数は0.88であるが、安定性に敏感なBERTopicパイプラインは32の非異常なサブトピックを生成する。
コード形式のアーティファクトや環境詳細,ランタイム障害,再現ステップといった,具体的かつコンテキストに富んだキューは,GitHubの議論ベースラインと比較して少ない – ソーシャル模倣は限定的な方法でのみ現れ,理想化は主として低いヘッジを通じて反映される。
全体として、AIのみの技術談話は一貫性はあるが選択的である。
セキュリティと信頼、メモリとコンテキストの管理、ツールとAPI、デバッグとエラー処理、ワークフローの自動化、インフラストラクチャ/運用といった問題に繰り返し戻ります。
MoltBookには、環境固有の障害や再生手順、その他の具体的な接地手段が少ないためかもしれない。
関連論文リスト
- Agentic AI in the Software Development Lifecycle: Architecture, Empirical Evidence, and the Reshaping of Software Engineering [0.0]
現代のエージェントシステムは、リポジトリ、機能、アルゴリズムの粒度で機能する。
本稿ではエージェントソフトウェア工学システムのための6層参照アーキテクチャを提案する。
調査の中心的な対象は、コード生成から人事監督下での委任執行へと移行したと論じる。
論文 参考訳(メタデータ) (2026-04-29T04:06:47Z) - SWE-chat: Coding Agent Interactions From Real Users in the Wild [70.18158706281724]
SWE-chatは、オープンソースの開発者から収集された実際のコーディングエージェントセッションの大規模なデータセットである。
現在、データセットには6000のセッションが含まれており、63,000以上のユーザプロンプトと355,000のエージェントツールコールが含まれている。
論文 参考訳(メタデータ) (2026-04-22T17:08:19Z) - The Semi-Executable Stack: Agentic Software Engineering and the Expanding Scope of SE [3.6320170149653985]
AIベースのシステムは、ソフトウェアエンジニアリングに対する脅威として、ますます議論されている。
この論文は別の読み方を主張する。
設計されているものは、実行可能なコードから半実行可能なアーティファクトへと拡張するということです。
論文 参考訳(メタデータ) (2026-04-16T18:36:02Z) - ClawArena: Benchmarking AI Agents in Evolving Information Environments [61.664633997138004]
ClawArenaは、進化する情報環境におけるAIエージェントの評価のためのベンチマークである。
それぞれのシナリオは、エージェントをノイズ、部分的、時には矛盾するトレースだけに露呈しながら、完全に隠された地上の真実を維持します。
評価は、マルチソースコンフリクト推論、動的信念修正、暗黙のパーソナライゼーションという3つの複合的な課題に基づいて構成される。
論文 参考訳(メタデータ) (2026-04-05T17:55:23Z) - Engineering Pitfalls in AI Coding Tools: An Empirical Study of Bugs in Claude Code, Codex, and Gemini CLI [14.169228579189989]
本稿では,AI支援コーディングツール構築における工学的落とし穴の実証的研究について述べる。
私たちは、GitHub上の3つのAI支援コーディングツールのオープンソースリポジトリにある3,8K以上の公開報告されたバグを分析するために、オープンソースコーディング手法を採用しています。
結果から,これらのツールのバグの67%以上が機能に関連していることが判明した。
論文 参考訳(メタデータ) (2026-03-21T15:05:23Z) - On Autopilot? An Empirical Study of Human-AI Teaming and Review Practices in Open Source [11.412808537439973]
プロジェクトレベルのガイドラインとAI支援プルリクエスト(PR)との開発者のインタラクションについて検討した。
AIが共著するPRの67.5%以上が、コードオーナシップのないコントリビュータから生まれています。
非オーナーの開発者が最もフィードバックを受けられるような、人間が作ったPRとは対照的に、非オーナーのAI共著のPRは最小限のフィードバックを受け取っている。
論文 参考訳(メタデータ) (2026-01-20T09:09:53Z) - The Rise of AI Teammates in Software Engineering (SE) 3.0: How Autonomous Coding Agents Are Reshaping Software Engineering [10.252332355171237]
本稿では,このようなエージェントが野生でどのように動作するかを示す最初の大規模データセットであるAIDevを紹介する。
AIDevは5つの主要なエージェントによる45万6000件以上のプルリクエストに対処し、ソフトウェア開発において自律的なチームメイトを研究するための前例のない経験的な基盤を提供する。
データセットには、PR、著者、レビュータイムライン、コード変更、統合結果に関する豊富な情報が含まれている。
論文 参考訳(メタデータ) (2025-07-20T15:15:58Z) - TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks [55.03911355902567]
我々は、デジタルワーカーと同じような方法で世界と対話するAIエージェントを評価するためのベンチマークであるTheAgentCompanyを紹介する。
最も競争力のあるエージェントは、タスクの30%を自律的に完了させることができる。
これは、実際の職場の設定でLMエージェントをシミュレートすることで、タスク自動化に関する微妙な絵を描く。
論文 参考訳(メタデータ) (2024-12-18T18:55:40Z) - OpenHands: An Open Platform for AI Software Developers as Generalist Agents [109.8507367518992]
私たちは、人間の開発者と同じような方法で世界と対話するAIエージェントを開発するためのプラットフォームであるOpenHandsを紹介します。
プラットフォームが新しいエージェントの実装を可能にし、コード実行のためのサンドボックス環境との安全なインタラクション、評価ベンチマークの導入について説明する。
論文 参考訳(メタデータ) (2024-07-23T17:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。