論文の概要: LegalWebAgent: Empowering Access to Justice via LLM-Based Web Agents
- arxiv url: http://arxiv.org/abs/2512.04105v1
- Date: Fri, 28 Nov 2025 07:26:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:45.769253
- Title: LegalWebAgent: Empowering Access to Justice via LLM-Based Web Agents
- Title(参考訳): LegalWebAgent: LLMベースのWebエージェントによる司法アクセスの強化
- Authors: Jinzhe Tan, Karim Benyekhlef,
- Abstract要約: LegalWebAgentは、一般市民の正義へのアクセスギャップを埋めるために、マルチモーダルな大規模言語モデルを利用したWebエージェントを使用している。
このフレームワークは、大規模言語モデルの自然言語理解能力とマルチモーダル認識を組み合わせることで、ユーザクエリから具体的なアクションまでの完全なプロセスを可能にする。
評価結果によると、LegalWebAgentは最高成功率86.7%に達し、すべてのテストモデルで平均84.4%に達した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Access to justice remains a global challenge, with many citizens still finding it difficult to seek help from the justice system when facing legal issues. Although the internet provides abundant legal information and services, navigating complex websites, understanding legal terminology, and filling out procedural forms continue to pose barriers to accessing justice. This paper introduces the LegalWebAgent framework that employs a web agent powered by multimodal large language models to bridge the gap in access to justice for ordinary citizens. The framework combines the natural language understanding capabilities of large language models with multimodal perception, enabling a complete process from user query to concrete action. It operates in three stages: the Ask Module understands user needs through natural language processing; the Browse Module autonomously navigates webpages, interacts with page elements (including forms and calendars), and extracts information from HTML structures and webpage screenshots; the Act Module synthesizes information for users or performs direct actions like form completion and schedule booking. To evaluate its effectiveness, we designed a benchmark test covering 15 real-world tasks, simulating typical legal service processes relevant to Québec civil law users, from problem identification to procedural operations. Evaluation results show LegalWebAgent achieved a peak success rate of 86.7%, with an average of 84.4% across all tested models, demonstrating high autonomy in complex real-world scenarios.
- Abstract(参考訳): 司法へのアクセスは依然としてグローバルな課題であり、法的な問題に直面している場合、多くの市民は司法制度から助けを求めるのが難しいと感じている。
インターネットは豊富な法的情報やサービスを提供しているが、複雑なWebサイトをナビゲートし、法的用語を理解し、手続き的なフォームを埋めることは、司法にアクセスするための障壁となり続けている。
本稿では,多モーダルな大規模言語モデルを用いたWebエージェントを用いた,一般市民の司法アクセスのギャップを埋めるLegalWebAgentフレームワークを提案する。
このフレームワークは、大規模言語モデルの自然言語理解能力とマルチモーダル認識を組み合わせることで、ユーザクエリから具体的なアクションまでの完全なプロセスを可能にする。
Askモジュールは自然言語処理を通じてユーザニーズを理解し、BrowseモジュールはWebページを自律的にナビゲートし、ページ要素(フォームやカレンダーを含む)と対話し、HTML構造やWebページのスクリーンショットから情報を抽出する。
提案手法の有効性を評価するため,Québec の民事法ユーザに関連する典型的法的サービスプロセスを,問題識別から手続き的操作までシミュレーションした15の実世界のタスクを対象としたベンチマーク試験を設計した。
評価結果によると、LegalWebAgentは86.7%の最高成功率に達し、全てのテストモデルで平均84.4%に達し、複雑な実世界のシナリオにおいて高い自律性を示している。
関連論文リスト
- WebExplorer: Explore and Evolve for Training Long-Horizon Web Agents [57.203515352080295]
本稿では,モデルに基づく探索と反復的,長短のクエリ進化を用いた体系的データ生成手法であるWebExplorerを紹介する。
我々のモデルは、128Kのコンテキスト長と最大100のツール呼び出しスイッチをサポートし、長期の問題解決を可能にします。
8Bサイズのモデルとして、WebExplorer-8Bは、RLトレーニング後の平均16ターンを効果的に探索することができる。
論文 参考訳(メタデータ) (2025-09-08T10:07:03Z) - AI-Powered Legal Intelligence System Architecture: A Comprehensive Framework for Automated Legal Consultation and Analysis [0.0]
LICESアーキテクチャは、従来のパラグラフベンチマークと比較して、予備的な法的調査とケースアセスメント時間を90%以上削減することができる。
性能評価の結果、LICESアーキテクチャは予備的な法的研究とケースアセスメント時間を98%以上削減できることが示された。
論文 参考訳(メタデータ) (2025-08-24T19:41:26Z) - REAL: Benchmarking Autonomous Agents on Deterministic Simulations of Real Websites [9.58858258192147]
実世界のWebサイトの決定論的シミュレーションにおけるマルチターンエージェント評価のためのベンチマークおよびフレームワークであるREALを紹介する。
また、日々の複雑なユーザインタラクションを反映した112の実践的なタスクからなるベンチマークもリリースしています。
我々のフレームワークは、新しいタスクの容易な統合、再現可能な評価、スケーラブルな後学習データ生成をサポートします。
論文 参考訳(メタデータ) (2025-04-15T18:22:55Z) - Learning to Contextualize Web Pages for Enhanced Decision Making by LLM Agents [89.98593996816186]
複雑なWebページをより理解しやすい形式にするための言語モデルを学習するためのフレームワークであるLCoWを紹介する。
LCoWは、別々のコンテキスト化モジュールをトレーニングすることで、意思決定からWebページ理解を分離する。
我々の文脈化モジュールは、様々なスケールのLLMエージェントと効果的に統合され、意思決定能力を大幅に向上することを示した。
論文 参考訳(メタデータ) (2025-03-12T01:33:40Z) - MEL: Legal Spanish Language Model [0.3651422140724638]
本稿では,XLM-RoBERTa-largeに基づく法的言語モデルであるMELの開発と評価について述べる。
評価ベンチマークは、法的スペイン語を理解する上で、ベースラインモデルよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2025-01-27T12:50:10Z) - LegalAgentBench: Evaluating LLM Agents in Legal Domain [53.70993264644004]
LegalAgentBenchは、中国の法律領域でLLMエージェントを評価するために特別に設計されたベンチマークである。
LegalAgentBenchには、現実世界の法的シナリオから17のコーパスが含まれており、外部知識と対話するための37のツールを提供している。
論文 参考訳(メタデータ) (2024-12-23T04:02:46Z) - AgentOccam: A Simple Yet Strong Baseline for LLM-Based Web Agents [52.13695464678006]
本研究は, 観察空間と行動空間を簡略化することで, LLMベースのWebエージェントを強化する。
AgentOccam は以前の最先端および同時処理を 9.8 (+29.4%) と 5.9 (+15.8%) で上回っている。
論文 参考訳(メタデータ) (2024-10-17T17:50:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。