Fugu-MT 論文翻訳(概要): Multi-Agent Simulator Drives Language Models for Legal Intensive Interaction

論文の概要: Multi-Agent Simulator Drives Language Models for Legal Intensive Interaction

arxiv url: http://arxiv.org/abs/2502.06882v1
Date: Sat, 08 Feb 2025 15:05:24 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-12 18:22:47.779752
Title: Multi-Agent Simulator Drives Language Models for Legal Intensive Interaction
Title（参考訳）: 言語モデルを駆動する多エージェントシミュレータ
Authors: Shengbin Yue, Ting Huang, Zheng Jia, Siyuan Wang, Shujun Liu, Yun Song, Xuanjing Huang, Zhongyu Wei,
Abstract要約: 本稿では,対話型法シナリオをシミュレートして合成データを生成するマルチエージェント法定シミュレーションドライバ(MASER)を提案する。 MASERは参加者間の法的属性の整合性を確保し、参加者の性格や行動を調整するための監督機構を導入する。
参考スコア（独自算出の注目度）: 37.856194200684364
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large Language Models (LLMs) have significantly advanced legal intelligence, but the scarcity of scenario data impedes the progress toward interactive legal scenarios. This paper introduces a Multi-agent Legal Simulation Driver (MASER) to scalably generate synthetic data by simulating interactive legal scenarios. Leveraging real-legal case sources, MASER ensures the consistency of legal attributes between participants and introduces a supervisory mechanism to align participants' characters and behaviors as well as addressing distractions. A Multi-stage Interactive Legal Evaluation (MILE) benchmark is further constructed to evaluate LLMs' performance in dynamic legal scenarios. Extensive experiments confirm the effectiveness of our framework.
Abstract（参考訳）: 大規模言語モデル(LLM)は、かなり高度な法的な知性を持っているが、シナリオデータの不足は、対話的な法的なシナリオへの進歩を妨げる。本稿では,対話型法シナリオをシミュレートして合成データを生成するマルチエージェント法定シミュレーションドライバ(MASER)を提案する。実法的なケースソースを活用することで、MASERは参加者間の法的属性の整合性を確保し、参加者の性格や行動の整合性や気晴らしに対処するための監督機構を導入する。 MILE(Multi-stage Interactive Legal Evaluation)ベンチマークは、動的法シナリオにおけるLLMのパフォーマンスを評価するために、さらに構築されている。大規模な実験により、我々のフレームワークの有効性が確認された。

関連論文リスト

AgenticSimLaw: A Juvenile Courtroom Multi-Agent Debate Simulation for Explainable High-Stakes Tabular Decision Making [0.6218206949753592]
我々はAgenticSimLawを紹介した。これは、透明で制御可能なテストタイム推論を提供するロール構造化マルチエージェントの議論フレームワークである。ブラックボックスアプローチとは異なり、裁判所スタイルのオーケストレーションでは、エージェントの役割を明確に定義しています。 NLSY97データセットを用いて、この枠組みを若者の復習予測にベンチマークする。
論文参考訳（メタデータ） (2026-01-29T16:26:10Z)
DEBATE: A Large-Scale Benchmark for Role-Playing LLM Agents in Multi-Agent, Long-Form Debates [10.609797175227644]
マルチエージェントロールプレイングLLM間の相互作用の信頼性を評価するための,最初の大規模実証的ベンチマークであるDEBATEを紹介する。我々は,シミュレーション群と真正群との重要な相違点を系統的に評価し,同定した。
論文参考訳（メタデータ） (2025-10-29T02:21:10Z)
Sample-Efficient Online Learning in LM Agents via Hindsight Trajectory Rewriting [92.57796055887995]
本稿では,言語モデルエージェントの強化学習から後視体験のリプレイに適応するプロンプトフレームワークECHOを紹介する。 ECHOは失敗した試みで達成できた代替目標のために最適化された軌道を生成する。我々は、テキストベースのナビゲーションと計画ベンチマークであるXMiniGridのステートフルバージョンと、協調的な情報収集企業シミュレーションであるPeopleJoinQAについて、ECHOを評価した。
論文参考訳（メタデータ） (2025-10-11T18:11:09Z)
MADIAVE: Multi-Agent Debate for Implicit Attribute Value Extraction [52.89860691282002]
インプシット属性値抽出(AVE)は、電子商取引における商品の正確な表現に不可欠である。マルチモーダル大言語モデル(MLLM)の進歩にもかかわらず、多次元データの複雑さのため暗黙のAVEは依然として困難である。我々は,複数のMLLMエージェントを用いて推論を反復的に洗練するマルチエージェント討論フレームワークであるtextscmodelnameを紹介する。
論文参考訳（メタデータ） (2025-10-07T06:27:42Z)
ToolACE-MT: Non-Autoregressive Generation for Agentic Multi-Turn Interaction [84.90394416593624]
大規模言語モデル(LLM)によるエージェント的タスク解決には,多ターン・マルチステップインタラクションが必要である。既存のシミュレーションベースのデータ生成手法は、複数のエージェント間のコストのかかる自己回帰的相互作用に大きく依存している。本稿では,高品質なマルチターンエージェント対話を構築するための非自己回帰反復生成フレームワークであるToolACE-MTを提案する。
論文参考訳（メタデータ） (2025-08-18T07:38:23Z)
LANGTRAJ: Diffusion Model and Dataset for Language-Conditioned Trajectory Simulation [94.84458417662404]
LangTrajは、トラフィックシナリオにおけるすべてのエージェントの共同動作をシミュレートする、言語条件のシーン拡散モデルである。自然言語入力を条件付けすることで、LangTrajはインタラクティブな振る舞いを柔軟かつ直感的に制御できる。 LangTraj氏は、リアリズム、言語制御性、言語条件の安全クリティカルなシミュレーションにおいて、強力なパフォーマンスを示している。
論文参考訳（メタデータ） (2025-04-15T17:14:06Z)
Refining Financial Consumer Complaints through Multi-Scale Model Interaction [8.504311452987036]
本稿では,非公式な会話文入力を説得力のある法的議論に変換する法文改良の課題について考察する。我々は、請求合理性に関する公式判断を付した中国の金融紛争記録のデータセットであるFinDRを紹介した。実験の結果,MSMI(Multi-Scale Model Interaction)はシングルパスプロンプト戦略を著しく上回ることがわかった。
論文参考訳（メタデータ） (2025-04-14T05:51:31Z)
Debate-Feedback: A Multi-Agent Framework for Efficient Legal Judgment Prediction [7.196065223124077]
本稿では,Debate-Feedbackアーキテクチャに基づく新たな法的判断予測モデルを提案する。従来の手法とは異なり、我々のモデルは大規模な歴史的データセットの必要性を最小限に抑え、効率を大幅に改善する。
論文参考訳（メタデータ） (2025-04-07T09:34:14Z)
Dynamic benchmarking framework for LLM-based conversational data capture [0.0]
本稿では,大規模言語モデル(LLM)を評価するためのベンチマークフレームワークを提案する。生成エージェントシミュレーションを統合して、情報抽出、コンテキスト認識、適応エンゲージメントといった重要次元のパフォーマンスを評価する。その結果,不明瞭な応答を扱う場合,適応戦略によりデータの抽出精度が向上することが示唆された。
論文参考訳（メタデータ） (2025-02-04T15:47:47Z)
LegalAgentBench: Evaluating LLM Agents in Legal Domain [53.70993264644004]
LegalAgentBenchは、中国の法律領域でLLMエージェントを評価するために特別に設計されたベンチマークである。 LegalAgentBenchには、現実世界の法的シナリオから17のコーパスが含まれており、外部知識と対話するための37のツールを提供している。
論文参考訳（メタデータ） (2024-12-23T04:02:46Z)
RA-BLIP: Multimodal Adaptive Retrieval-Augmented Bootstrapping Language-Image Pre-training [55.54020926284334]
近年,MLLM (Multimodal Large Language Models) が注目されている。検索拡張技術はLLMとMLLMの両方に有効なプラグインであることが証明されている。本研究では,MLLMの新しい検索支援フレームワークであるRA-BLIP(Retrieval-Augmented Bootstrapping Language-Image Pre-training)を提案する。
論文参考訳（メタデータ） (2024-10-18T03:45:19Z)
AgentCourt: Simulating Court with Adversarial Evolvable Lawyer Agents [25.509677234774056]
AgentCourtは、LLMベースのエージェントの対角的進化を通じて課題に対処する包括的な法的シミュレーションフレームワークである。 1000件の民事事件をシミュレートすることにより、エージェントの法的推論能力を高める進化した知識基盤を構築する。我々の研究は、法的なAIにおける敵対的学習の重要性を強調し、より広範な司法・規制の文脈にシミュレーションに基づく法的推論を拡張するための有望な方向性を提案する。
論文参考訳（メタデータ） (2024-08-15T11:33:20Z)
Simulating The U.S. Senate: An LLM-Driven Agent Approach to Modeling Legislative Behavior and Bipartisanship [0.0]
本研究では,LSM駆動型仮想エージェントを用いた立法プロセスのシミュレーション手法を提案する。我々は、個々の上院議員を代表するエージェントを開発し、それらを模擬委員会議論に配置した。エージェントは現実的な議論を行い、思慮深いリフレクションを提供し、双党派の解決策を見つける能力を示した。
論文参考訳（メタデータ） (2024-06-26T19:10:51Z)
LangSuitE: Planning, Controlling and Interacting with Large Language Models in Embodied Text Environments [70.91258869156353]
テキストエンボディの世界における6つの代表的具体的タスクを特徴とする多目的・シミュレーション不要なテストベッドであるLangSuitEを紹介する。以前のLLMベースのテストベッドと比較すると、LangSuitEは複数のシミュレーションエンジンを使わずに、多様な環境への適応性を提供する。具体化された状態の履歴情報を要約した新しいチェーン・オブ・ソート(CoT)スキーマであるEmMemを考案する。
論文参考訳（メタデータ） (2024-06-24T03:36:29Z)
INTAGS: Interactive Agent-Guided Simulation [4.04638613278729]
マルチエージェントシステム(MAS)を含む多くのアプリケーションでは、実稼働に先立って、実験的な(Exp)自律エージェントを高忠実度シミュレータでテストすることが必須である。本稿では,ExpエージェントとBGエージェントのライブインタラクションによって評価される実システムと合成マルチエージェントシステムとを区別する指標を提案する。 InTAGSを用いてシミュレータのキャリブレーションを行い、現状のWasserstein Generative Adversarial Networkアプローチと比較して、より現実的な市場データを生成することができることを示す。
論文参考訳（メタデータ） (2023-09-04T19:56:18Z)
Rethinking the Evaluation for Conversational Recommendation in the Era of Large Language Models [115.7508325840751]
近年の大規模言語モデル(LLM)の成功は、より強力な対話レコメンデーションシステム(CRS)を開発する大きな可能性を示している。本稿では,ChatGPTの会話レコメンデーションへの活用について検討し,既存の評価プロトコルが不十分であることを明らかにする。 LLMをベースとしたユーザシミュレータを用いた対話型評価手法iEvaLMを提案する。
論文参考訳（メタデータ） (2023-05-22T15:12:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。