論文の概要: CyberJurors: A Multi-Agent Simulation Task for E-Commerce Disputes Verdict
- arxiv url: http://arxiv.org/abs/2605.28369v1
- Date: Wed, 27 May 2026 12:07:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:56.032193
- Title: CyberJurors: A Multi-Agent Simulation Task for E-Commerce Disputes Verdict
- Title(参考訳): CyberJurors: 電子商取引の判決をマルチエージェントでシミュレーションするタスク
- Authors: Yanhui Sun, Wu Liu, Haifeng Ming, Xinru Wang, Hantao Yao, Yongdong Zhang,
- Abstract要約: 電子商取引プラットフォームは、大量の取引紛争を判断するためにクラウドソースの陪審員を募集し始めた。
本稿では,先駆的タスクであるEDV(E-Commerce Dispute Verdicts)と,6,000件の現実世界のケースからなるマルチモーダルベンチマークであるVerdictBenchを紹介する。
本稿では,論争ロジックを明確にし,判定プロセスを制御するマルチエージェントフレームワークであるCyberJurorsを提案する。
- 参考スコア(独自算出の注目度): 59.06704011432714
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: E-commerce platforms have begun recruiting crowdsourced jurors to adjudicate massive volumes of transaction disputes. Unlike formal legal judgment, E-commerce dispute verdicts require grounding pivotal clues from redundant, multi-round, multimodal evidence and making decisions under flexible platform-specific conventions. These characteristics render existing methods insufficient for this scenario. To bridge this gap, we introduce a pioneering task, E-commerce Dispute Verdicts (EDV), and present VerdictBench, a multimodal benchmark comprising 6,000 real-world cases designed to reflect crowdsourced jury decisions. Building upon this, we propose CyberJurors, a multi-agent framework to clarify the dispute logic and regulate the verdict process. At the individual level, Individual Verdict Chain-of-Thought decomposes the EDV task into four structured reasoning stages, enabling fine-grained clue perception and clarifying causal logic between pivotal clues and the dispute focus. At the collective level, Jury Consensus Verdict simulates multi-round discussion and voting among jurors, while incorporating verdict precedents to mitigate cognitive biases toward either disputant. Experiments on VerdictBench show that CyberJurors outperforms state-of-the-art LLMs, MLLMs, and court simulators, while achieving stronger alignment with real-world jury voting patterns. Code and dataset are available at https://github.com/YanhuiS/CyberJurors and https://huggingface.co/datasets/piggi/VerdictBench.
- Abstract(参考訳): 電子商取引プラットフォームは、大量の取引紛争を判断するためにクラウドソースの陪審員を募集し始めた。
正式な法的判断とは違って、Eコマースの論争の判決は、冗長で多ラウンドなマルチモーダルな証拠や、柔軟なプラットフォーム固有の慣例に基づく決定から重要な手がかりを得る必要がある。
これらの特徴により、このシナリオでは既存の手法が不十分である。
このギャップを埋めるために、先駆的タスクであるE-Commerce Dispute Verdicts (EDV)を導入し、クラウドソースによる陪審決定を反映した6000の現実世界のケースからなるマルチモーダルベンチマークVerdictBenchを紹介した。
そこで我々はCyberJurorsを提案する。CyberJurorsは、論争ロジックを明確にし、検証プロセスを制御するためのマルチエージェントフレームワークである。
個人レベルでは、EDVタスクを4つの構造化された推論段階に分解し、きめ細かい手がかり認識を可能にし、重要な手がかりと紛争焦点の間の因果論理を明確にする。
集合レベルでは、Jarry Consensus Verdictは、審査員の間での複数回にわたる議論と投票をシミュレートし、一方、評決の前例を取り入れて、双方の論争に対する認知バイアスを緩和する。
VerdictBenchの実験では、CyberJurorsは最先端のLLM、MLLM、および裁判所シミュレータよりも優れており、実際の陪審員投票パターンとのより強力な整合性を実現している。
コードとデータセットはhttps://github.com/YanhuiS/CyberJurorsとhttps://huggingface.co/datasets/piggi/VerdictBenchで入手できる。
関連論文リスト
- More Than Sum of Its Parts: Deciphering Intent Shifts in Multimodal Hate Speech Detection [49.07221734365168]
ソーシャルメディア上でのヘイトスピーチは、サイバースペースの確保には不可欠だが、自動検出システムに大きく依存している。
我々は、モダリティが相互作用する意味的意図変化を特徴付け、良心的憎悪から暗黙的憎悪を構築するか、意味的逆転を通じて毒性を中和する。
本稿では,これらの複雑な手がかりを効果的に解読するために,裁判所エージェントによる非対称推論(Asymmetric Reasoning)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-22T15:46:23Z) - AppellateGen: A Benchmark for Appellate Legal Judgment Generation [30.9030336647868]
7,351対のケースペアからなる第2のインスタンス法定判断生成のためのベンチマークであるAppellateGenを紹介する。
このタスクは、最初の評決と明らかな更新について推論することで、法的に拘束力のある判断を起草するモデルを必要とする。
本稿では,SOPに基づく法的マルチエージェントシステム(SLMAS)を提案し,その生成過程を個別の課題識別,検索,起草の段階に分解する。
論文 参考訳(メタデータ) (2026-01-04T02:15:17Z) - Beyond Retrieval-Ranking: A Multi-Agent Cognitive Decision Framework for E-Commerce Search [10.160028965489577]
検索レベルのパラダイムは、プラットフォームユーザの多段階認知決定プロセスと誤解する。
受動的検索から積極的な意思決定支援へパラダイムをシフトさせる多エージェント認知決定フレームワーク(MACDF)を提案する。
JD検索プラットフォーム上でのオンラインA/Bテストは、その実用性を確認する。
論文 参考訳(メタデータ) (2025-10-23T13:55:53Z) - Reasoning Court: Combining Reasoning, Action, and Judgment for Multi-Hop Reasoning [17.829990749622496]
Reasoning Court(RC)は、ReActのような反復的推論と検索の手法を拡張した新しいフレームワークである。
RCはタスク固有の微調整なしで、最先端のショットプロンプト手法を一貫して上回っている。
論文 参考訳(メタデータ) (2025-04-14T00:56:08Z) - A Law Reasoning Benchmark for LLM with Tree-Organized Structures including Factum Probandum, Evidence and Experiences [76.73731245899454]
本稿では,階層的なファクトラム,証拠,暗黙的な経験に富む透明な法理推論スキーマを提案する。
このスキーマにインスパイアされた課題は、テキストのケース記述を取り込み、最終決定を正当化する階層構造を出力する。
このベンチマークは、Intelligent Courtにおける透明で説明可能なAI支援法推論の道を開く」。
論文 参考訳(メタデータ) (2025-03-02T10:26:54Z) - Multi-Defendant Legal Judgment Prediction via Hierarchical Reasoning [49.23103067844278]
マルチディペンダント・ケースの各被告に対する判断結果を自動予測することを目的としたマルチディペンダント・LJPの課題を提案する。
マルチディペンダント LJP の課題は,(1) 各被告の識別不能な判断結果, (2) 訓練と評価のための実世界のデータセットの欠如である。
論文 参考訳(メタデータ) (2023-12-10T04:46:30Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - Jury Learning: Integrating Dissenting Voices into Machine Learning
Models [38.66234866615259]
ジャリー・ラーニング(英: Jury learning)とは、陪審員の比喩を通じて、不一致を明確に解決する教師付き機械学習アプローチである。
データセット内のすべてのアノテータをモデル化し、アノテータのモデルからサンプルを採取して陪審を集成し、推論して分類するディープラーニングアーキテクチャにコントリビュートします。
我々のアーキテクチャは、陪審員が彼らの構成を動的に適応し、反事実を探求し、不満を可視化することを可能にする。
論文 参考訳(メタデータ) (2022-02-07T05:23:14Z) - E-Commerce Dispute Resolution Prediction [69.84319333335935]
我々は、紛争解決における人間のエージェントを大規模に支援する第一歩を踏み出す。
eBayのオンラインマーケットプレースから大規模な論争のデータセットを構築し、いくつかの興味深い行動パターンと言語パターンを特定します。
次に、高い精度で論争の結果を予測するために分類器を訓練する。
論文 参考訳(メタデータ) (2021-10-13T09:45:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。