論文の概要: Hide-and-Shill: A Reinforcement Learning Framework for Market Manipulation Detection in Symphony-a Decentralized Multi-Agent System
- arxiv url: http://arxiv.org/abs/2507.09179v1
- Date: Sat, 12 Jul 2025 07:55:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 18:48:22.660057
- Title: Hide-and-Shill: A Reinforcement Learning Framework for Market Manipulation Detection in Symphony-a Decentralized Multi-Agent System
- Title(参考訳): Hide-and-Shill:Symphony-a Decentralized Multi-Agent Systemにおける市場操作検出のための強化学習フレームワーク
- Authors: Ronghua Shi, Yiou Liu, Xinyu Ying, Yang Tan, Yuchun Feng, Lynn Ai, Bill Shi, Xuhui Wang, Zhuang Liu,
- Abstract要約: 分散金融(DeFi)は、新たな無許可金融革新の時代をもたらしたが、前例のない市場操作につながった。
本稿では,マニピュレータと検出器間の相互作用を動的対向ゲームとしてモデル化し,分散操作検出のためのマルチエージェント強化学習フレームワークを提案する。
このフレームワークは、遅延トークン価格反応を金融指標として不審なパターンを特定する。
- 参考スコア(独自算出の注目度): 4.808769904090313
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Decentralized finance (DeFi) has introduced a new era of permissionless financial innovation but also led to unprecedented market manipulation. Without centralized oversight, malicious actors coordinate shilling campaigns and pump-and-dump schemes across various platforms. We propose a Multi-Agent Reinforcement Learning (MARL) framework for decentralized manipulation detection, modeling the interaction between manipulators and detectors as a dynamic adversarial game. This framework identifies suspicious patterns using delayed token price reactions as financial indicators.Our method introduces three innovations: (1) Group Relative Policy Optimization (GRPO) to enhance learning stability in sparse-reward and partially observable settings; (2) a theory-based reward function inspired by rational expectations and information asymmetry, differentiating price discovery from manipulation noise; and (3) a multi-modal agent pipeline that integrates LLM-based semantic features, social graph signals, and on-chain market data for informed decision-making.The framework is integrated within the Symphony system, a decentralized multi-agent architecture enabling peer-to-peer agent execution and trust-aware learning through distributed logs, supporting chain-verifiable evaluation. Symphony promotes adversarial co-evolution among strategic actors and maintains robust manipulation detection without centralized oracles, enabling real-time surveillance across global DeFi ecosystems.Trained on 100,000 real-world discourse episodes and validated in adversarial simulations, Hide-and-Shill achieves top performance in detection accuracy and causal attribution. This work bridges multi-agent systems with financial surveillance, advancing a new paradigm for decentralized market intelligence. All resources are available at the Hide-and-Shill GitHub repository to promote open research and reproducibility.
- Abstract(参考訳): 分散金融(DeFi)は、無許可の金融革新の新たな時代をもたらしたが、前例のない市場操作につながった。
中央集権的な監視がなければ、悪意あるアクターは様々なプラットフォームでシリングキャンペーンやポンプ・アンド・ダンプ・スキームを調整する。
本稿では,マルチエージェント強化学習(MARL)フレームワークを提案する。
本フレームワークは, 遅延トークン価格反応を用いた疑わしいパターンを金融指標として, グループ相対的政策最適化 (GRPO) による学習安定性の向上, 2) 合理的な期待と情報非対称性にインスパイアされた理論に基づく報酬関数, 改良ノイズからの価格発見, (3) LLMに基づく意味的特徴, ソーシャルグラフ信号, および情報決定のためのオンチェーン市場データを統合したマルチモーダルエージェントパイプライン, の3つの革新を紹介し, フレームワークは, ピアツーピアエージェントの実行を可能にする分散ログによる信頼度学習を実現する分散マルチエージェントアーキテクチャであるSymphonyシステムに統合されている。
シンフォニーは、戦略的アクター間の敵対的共進化を促進し、中央集権的なオークレスを使わずに堅牢な操作検出を維持し、世界規模のDeFiエコシステムのリアルタイム監視を可能にし、10万件の現実世界の談話エピソードに基づいて、敵シミュレーションで評価され、Hide-and-Shillは検出精度と因果属性において最高のパフォーマンスを達成している。
この作業は、金融監視によるマルチエージェントシステムを橋渡しし、分散市場インテリジェンスのための新しいパラダイムを推し進める。
すべてのリソースは、オープンなリサーチと再現性を促進するために、Hie-and-Shill GitHubリポジトリで利用できる。
関連論文リスト
- When Autonomy Goes Rogue: Preparing for Risks of Multi-Agent Collusion in Social Systems [78.04679174291329]
悪意のあるマルチエージェントシステム(MAS)のリスクをシミュレートするための概念実証手法を提案する。
この枠組みを、誤情報拡散とeコマース詐欺という2つのリスクの高い分野に適用する。
その結果,分散システムの方が,集中型システムよりも悪意ある行動を実行するのに効果的であることが示唆された。
論文 参考訳(メタデータ) (2025-07-19T15:17:30Z) - AI Agent Architecture for Decentralized Trading of Alternative Assets [2.8195433571821162]
GoldMine OSは、ブロックチェーンベースのStablecoin("OZ")への物理的な金のトークン化と交換を自動化するために、複数の専門的AIエージェントを使用する研究指向アーキテクチャである。
本稿では,4つの協調エージェント(コンプライアンス,トークン発行,マーケットメイキング,リスクコントロール)とコーディネートコアについて述べる。
実験では、プロトタイプは需要トークンを1.2秒未満で提供し、手動よりも100倍以上高速である。
論文 参考訳(メタデータ) (2025-07-15T09:11:19Z) - ReAgent-V: A Reward-Driven Multi-Agent Framework for Video Understanding [71.654781631463]
ReAgent-Vは、新しいエージェントビデオ理解フレームワークである。
推論中に効率の良いフレーム選択とリアルタイムの報酬生成を統合する。
12のデータセットに対する大規模な実験は、一般化と推論において大きな成果を上げている。
論文 参考訳(メタデータ) (2025-06-02T04:23:21Z) - Benchmarking LLMs' Swarm intelligence [50.544186914115045]
大規模言語モデル(LLM)は複雑な推論の可能性を秘めているが、マルチエージェントシステム(MAS)における創発的協調の能力はほとんど探索されていない。
分散エージェントとして機能するLDMのタスクを体系的に評価する新しいベンチマークであるSwarmBenchを紹介する。
本稿では,協調効率の指標を提案し,創発的グループダイナミクスを解析する。
論文 参考訳(メタデータ) (2025-05-07T12:32:01Z) - Challenges and Innovations in LLM-Powered Fake News Detection: A Synthesis of Approaches and Future Directions [0.0]
偽ニュースの拡散は ソーシャルメディアのプラットフォームを通じて 一般大衆の信頼に 重大なリスクをもたらします
最近の研究には、マルチモーダルフレームワークにおける大規模言語モデルによる検出の強化が含まれている。
このレビューでは、ダイナミックなソーシャルメディアトレンド、リアルタイム、クロスプラットフォーム検出機能への適応性の重大なギャップがさらに明らかになった。
論文 参考訳(メタデータ) (2025-02-01T06:56:17Z) - BotDetect: A Decentralized Federated Learning Framework for Detecting Financial Bots on the EVM Blockchains [3.4636217357968904]
本稿では、仮想マシン(EVM)ベースのブロックチェーン内の金融ボットを検出するために、分散フェデレーション学習(DFL)アプローチを提案する。
提案するフレームワークでは,スマートコントラクトによって編成されたフェデレーション学習を活用して,悪意のあるボット動作を検出する。
実験の結果,我々のDFLフレームワークは,スケーラビリティと堅牢性を維持しつつ高い検出精度を実現していることがわかった。
論文 参考訳(メタデータ) (2025-01-21T13:15:43Z) - Dynamic Analysis and Adaptive Discriminator for Fake News Detection [59.41431561403343]
偽ニュース検出のための動的解析・適応識別器(DAAD)手法を提案する。
知識に基づく手法では,モンテカルロ木探索アルゴリズムを導入し,大規模言語モデルの自己表現能力を活用する。
意味に基づく手法では、偽ニュース生成のメカニズムを明らかにするために、典型的偽造パターンを4つ定義する。
論文 参考訳(メタデータ) (2024-08-20T14:13:54Z) - DAM: A Universal Dual Attention Mechanism for Multimodal Timeseries Cryptocurrency Trend Forecasting [3.8965079384103865]
本稿では,マルチモーダル時系列データを用いた暗号通貨のトレンド予測のための新しいデュアルアテンションメカニズム(DAM)を提案する。
われわれのアプローチは、重要な暗号通貨メトリクスと、CryptoBERTを通じて分析されたニュースやソーシャルメディアからの感情データを統合する。
本手法は,分散システム,自然言語処理,財務予測といった要素を組み合わせることで,LSTMやTransformerといった従来のモデルよりも最大20%高い精度で性能を向上する。
論文 参考訳(メタデータ) (2024-05-01T13:58:01Z) - SACHA: Soft Actor-Critic with Heuristic-Based Attention for Partially
Observable Multi-Agent Path Finding [3.4260993997836753]
我々は,ヒューリスティック・ベース・アテンション(SACHA)を用いたソフト・アクター・クリティカル(Soft Actor-Critic)と呼ばれる新しいマルチエージェント・アクター・クリティカルな手法を提案する。
SACHAは、各エージェントが最短経路ガイダンスに選択的に注目するニューラルネットワークを、その視野内の複数のエージェントから学習する。
我々は、いくつかの最先端の学習ベースMAPF法に対して、成功率とソリューション品質に関して、良好な改善を示す。
論文 参考訳(メタデータ) (2023-07-05T23:36:33Z) - Networked Communication for Decentralised Agents in Mean-Field Games [59.01527054553122]
平均フィールドゲームフレームワークにネットワーク通信を導入する。
当社のアーキテクチャは、中央集権型と独立した学習ケースの双方で保証されていることを証明しています。
ネットワーク化されたアプローチは、障害の更新や人口規模の変化に対する堅牢性という点において、両方の選択肢に対して大きなメリットがあることが示されています。
論文 参考訳(メタデータ) (2023-06-05T10:45:39Z) - F2A2: Flexible Fully-decentralized Approximate Actor-critic for
Cooperative Multi-agent Reinforcement Learning [110.35516334788687]
分散マルチエージェント強化学習アルゴリズムは複雑なアプリケーションでは実践的でないことがある。
本稿では,大規模で汎用的なマルチエージェント設定を扱える,柔軟な完全分散型アクター批判型MARLフレームワークを提案する。
当社のフレームワークは,大規模環境におけるスケーラビリティと安定性を実現し,情報伝達を低減できる。
論文 参考訳(メタデータ) (2020-04-17T14:56:29Z) - Monotonic Value Function Factorisation for Deep Multi-Agent
Reinforcement Learning [55.20040781688844]
QMIXは、中央集権的なエンドツーエンドで分散ポリシーをトレーニングできる新しい価値ベースの手法である。
深層多エージェント強化学習のための新しいベンチマークとして,StarCraft Multi-Agent Challenge (SMAC)を提案する。
論文 参考訳(メタデータ) (2020-03-19T16:51:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。