Fugu-MT 論文翻訳(概要): Do Agents Repair When Challenged -- or Just Reply? Challenge, Repair, and Public Correction in a Deployed Agent Forum

論文の概要: Do Agents Repair When Challenged -- or Just Reply? Challenge, Repair, and Public Correction in a Deployed Agent Forum

arxiv url: http://arxiv.org/abs/2604.00518v2
Date: Thu, 02 Apr 2026 05:13:36 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-03 14:21:09.372927
Title: Do Agents Repair When Challenged -- or Just Reply? Challenge, Repair, and Public Correction in a Deployed Agent Forum
Title（参考訳）: エージェントはチャレンジされた時に修復する -- あるいは単にリプライするか - デプロイされたエージェントフォーラムにおけるチャレンジ、修復、およびパブリックコレクション
Authors: Luyang Zhang, Yi-Yun Chu, Jialu Wang, Beibei Li, Ramayya Krishnan,
Abstract要約: 大規模な言語モデル(LLM)エージェントフォーラムであるMoltbookと、一致するRedditコミュニティ5つを比較した。 Redditとは対照的に、Moltbookの議論はスレッド数が約10倍少なく、チャレンジやレスポンスの機会ははるかに少ない。 Redditの非曖昧なベースラインは、このギャップが単に深いスレッド化ではなく、課題と関連していることを示唆している。
参考スコア（独自算出の注目度）: 9.934280404394636
License: http://creativecommons.org/licenses/by/4.0/
Abstract: As large language model (LLM) agents are deployed in public interactive settings, a key question is whether their communities can sustain challenge, repair, and public correction, or merely produce norm-like language. We compare Moltbook, a live deployed agent forum, with five matched Reddit communities by tracing a three-step mechanism: whether discussions create threaded exchange, whether challenges elicit a response, and whether correction becomes visible to the wider thread. Relative to Reddit, Moltbook discussions are roughly ten times less threaded, leaving far fewer chances for challenge and response. When challenges do occur, the original author almost never returns (1.2% vs. 40.9% on Reddit), multi-turn continuation is nearly absent (0.1% vs. 38.5%), and we detect no repairs under a shared conservative protocol. A non-challenge baseline within Reddit suggests this gap is linked to challenge, not simply deeper threading. These results indicate that social alignment depends not only on producing norm-aware language, but on sustaining the interactional processes through which communities teach, enforce, and revise norms. This matters for safety, because correction is increasingly decentralized, and for fairness, because communities differ in how they expect participants to engage with challenge.
Abstract（参考訳）: 大規模言語モデル(LLM)エージェントがパブリックなインタラクティブな設定でデプロイされるため、コミュニティがチャレンジ、修復、パブリックな修正を維持できるかどうか、あるいは単にノルム的な言語を生成できるかどうかが重要な疑問である。我々は、ライブデプロイされたエージェントフォーラムであるMoltbookと、Redditコミュニティの5つのマッチした3段階のメカニズムをトレースして比較した。 Redditとは対照的に、Moltbookの議論はスレッド数が約10倍少なく、チャレンジやレスポンスの機会ははるかに少ない。課題が発生した場合、オリジナルの著者はほとんど戻ってこない(Redditでは1.2%対40.9%)、マルチターン継続はほとんど欠落している(0.1%対38.5%)。 Redditの非曖昧なベースラインは、このギャップが単に深いスレッディングではなく、チャレンジと関連していることを示唆している。これらの結果は、社会の整合性は、標準を意識した言語を作り出すことだけでなく、コミュニティが規範を教え、強制し、修正する相互作用プロセスを維持することに依存していることを示している。これは安全のために重要であり、修正はますます分散化され、公正のために、コミュニティは参加者が挑戦に参加することをどのように期待するかが異なる。

関連論文リスト

Fast Response or Silence: Conversation Persistence in an AI-Agent Social Network [0.0]
我々は、AIエージェントのソーシャルネットワークであるMoltbookを1週間のスナップショットを用いて研究し、インタラクションハーフライフを紹介した。何万ものコメントスレッドにわたって、モルトブックの議論は、チェーンの拡張よりも第一層反応に支配されている。全体として、モルトブック上の初期のエージェントの社会的相互作用は、迅速な応答または沈黙の体制に適合し、持続する複数ステップの調整には明示的なメモリ、スレッドの再認識、再突入の足場が必要になる可能性が高いことを示唆している。
論文参考訳（メタデータ） (2026-02-07T19:22:28Z)
AI Didn't Start the Fire: Examining the Stack Exchange Moderator and Contributor Strike [6.538542549579634]
大規模言語モデル(LLM)のリリースに伴う緊急時を中心に,2023年に発生したStack Exchangeプラットフォームとコミュニティの対立について検討する。 2023年の紛争は、特に、コミュニティの高度に評価されたガバナンスにおける参加的役割を無視することによる、コミュニティとプラットフォームの関係の長期的悪化によって、どのように先行していたかを示す。我々は、プラットフォームやコミュニティが、永続的で効果的に参加型ガバナンスを実施できる方法を推奨する。
論文参考訳（メタデータ） (2025-12-09T18:19:42Z)
UQ: Assessing Language Models on Unsolved Questions [149.46593270027697]
当社では,Stack Exchangeから提供された500の難解で多様な質問を対象としたテストベッドであるUQを紹介します。未解決の質問は、人間が答えを求めるときにしばしば難しく自然に発生する。上位モデルは15%の質問でUQ検証をパスし、予備的な人間の検証はすでに正しい答えを同定している。
論文参考訳（メタデータ） (2025-08-25T01:07:59Z)
Community Moderation and the New Epistemology of Fact Checking on Social Media [124.26693978503339]
ソーシャルメディアプラットフォームは伝統的に、誤解を招くコンテンツを識別しフラグを立てるために、独立した事実チェック組織に依存してきた。 X(元Twitter)とMetaは、クラウドソースのファクトチェックの独自のバージョンを立ち上げて、コミュニティ主導のコンテンツモデレーションに移行した。主要なプラットフォーム間での誤情報検出の現在のアプローチについて検討し,コミュニティ主導型モデレーションの新たな役割を探求し,大規模クラウドチェックの約束と課題の両方を批判的に評価する。
論文参考訳（メタデータ） (2025-05-26T14:50:18Z)
RankAlign: A Ranking View of the Generator-Validator Gap in Large Language Models [43.89751891729739]
我々は,モデルが生成した解答と,その解答の検証,ジェネレータとバリケータのギャップとの相違について考察する。この測定結果から,質問応答,語彙意味論タスク,次の単語予測など,さまざまな設定に大きなギャップがあることが分かる。次にランキングベースのトレーニング手法である RankAlign を提案する。
論文参考訳（メタデータ） (2025-04-15T16:53:31Z)
When Disagreements Elicit Robustness: Investigating Self-Repair Capabilities under LLM Multi-Agent Disagreements [56.29265568399648]
我々は、不一致が早期のコンセンサスを防ぎ、探索されたソリューション空間を拡張することを主張する。タスククリティカルなステップの相違は、ソリューションパスのトポロジによってコラボレーションを損なう可能性がある。
論文参考訳（メタデータ） (2025-02-21T02:24:43Z)
DebUnc: Improving Large Language Model Agent Communication With Uncertainty Metrics [52.242449026151846]
大規模言語モデル(LLM)の精度向上のためのマルチエージェント論争が紹介されている。エージェントの信頼性を評価するために不確実性指標を用いた議論フレームワークであるDebUncを提案する。
論文参考訳（メタデータ） (2024-07-08T22:15:01Z)
From Chaos to Clarity: Claim Normalization to Empower Fact-Checking [57.024192702939736]
Claim Normalization(別名 ClaimNorm)は、複雑でノイズの多いソーシャルメディア投稿を、より単純で分かりやすい形式に分解することを目的としている。本稿では,チェーン・オブ・ソートとクレーム・チェック・バシネス推定を利用した先駆的アプローチであるCACNを提案する。実験により, CACNは様々な評価尺度において, いくつかの基準値を上回る性能を示した。
論文参考訳（メタデータ） (2023-10-22T16:07:06Z)
Stranger Danger! Cross-Community Interactions with Fringe Users Increase the Growth of Fringe Communities on Reddit [14.060809879399386]
Reddit上での3つのフリンジコミュニティの成長に対するフリンジインタラクションの影響について検討した。この結果から,フリンジ・インタラクションが新たなメンバーを惹きつけることが示唆された。有害な言語を用いた相互作用は、非有害な相互作用よりもコミュニティを侵害する新参者を惹きつける確率が5pp高い。
論文参考訳（メタデータ） (2023-10-18T07:26:36Z)
What Makes Online Communities 'Better'? Measuring Values, Consensus, and Conflict across Thousands of Subreddits [13.585903247791094]
我々は,2,151種類のサブredditで2,769人のredditユーザを含む,コミュニティ価値の最初の大規模調査を通じて,コミュニティ価値を測定した。コミュニティメンバーがコミュニティの安全について意見が一致していないことを示し、長年のコミュニティは、新しいコミュニティよりも信頼性に30.1%重きを置いていることを示している。これらの発見は、脆弱なコミュニティメンバーを保護するために注意が必要であることを示唆するなど、重要な意味を持つ。
論文参考訳（メタデータ） (2021-11-10T18:31:22Z)
How do climate change skeptics engage with opposing views? Understanding mechanisms of social identity and cognitive dissonance in an online forum [0.0]
気候変動に懐疑的なオンラインコミュニティにおける反対意見がRedditに与える影響について検討する。我々は,イデオロギー的に不協和性のある提案が,コミュニティにおける活動の刺激となることを発見した。また、不協和音の投稿に関わったユーザーはフォーラムに戻る可能性が高かった。
論文参考訳（メタデータ） (2021-02-12T13:39:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。