論文の概要: Compliance-to-Code: Enhancing Financial Compliance Checking via Code Generation
- arxiv url: http://arxiv.org/abs/2505.19804v2
- Date: Mon, 09 Jun 2025 07:23:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 21:10:47.003531
- Title: Compliance-to-Code: Enhancing Financial Compliance Checking via Code Generation
- Title(参考訳): コンプライアンス・トゥ・コード:コード生成による財務コンプライアンスチェックの強化
- Authors: Siyuan Li, Jian Chen, Rui Yao, Xuming Hu, Peilin Zhou, Weihua Qiu, Simin Zhang, Chucheng Dong, Zhiyao Li, Qipeng Xie, Zixuan Yuan,
- Abstract要約: 金融規制コンプライアンスに特化した中国初の大規模データセットであるCompliance-to-Codeを提示する。
10のカテゴリにわたる361の規則から1,159の注釈付き節をカバーし、各節は規則関係とともに4つの論理的要素、条件、制約、文脈情報からなるモジュール構造になっている。
自動監査を容易にするために,決定論的Pythonコードマッピング,詳細なコード推論,コード説明を提供する。
- 参考スコア(独自算出の注目度): 36.166087396386445
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Nowadays, regulatory compliance has become a cornerstone of corporate governance, ensuring adherence to systematic legal frameworks. At its core, financial regulations often comprise highly intricate provisions, layered logical structures, and numerous exceptions, which inevitably result in labor-intensive or comprehension challenges. To mitigate this, recent Regulatory Technology (RegTech) and Large Language Models (LLMs) have gained significant attention in automating the conversion of regulatory text into executable compliance logic. However, their performance remains suboptimal particularly when applied to Chinese-language financial regulations, due to three key limitations: (1) incomplete domain-specific knowledge representation, (2) insufficient hierarchical reasoning capabilities, and (3) failure to maintain temporal and logical coherence. One promising solution is to develop a domain specific and code-oriented datasets for model training. Existing datasets such as LexGLUE, LegalBench, and CODE-ACCORD are often English-focused, domain-mismatched, or lack fine-grained granularity for compliance code generation. To fill these gaps, we present Compliance-to-Code, the first large-scale Chinese dataset dedicated to financial regulatory compliance. Covering 1,159 annotated clauses from 361 regulations across ten categories, each clause is modularly structured with four logical elements-subject, condition, constraint, and contextual information-along with regulation relations. We provide deterministic Python code mappings, detailed code reasoning, and code explanations to facilitate automated auditing. To demonstrate utility, we present FinCheck: a pipeline for regulation structuring, code generation, and report generation.
- Abstract(参考訳): 今日では、規制の遵守が企業統治の基盤となり、体系的な法的枠組みの遵守が保証されている。
金融規制の中核は、しばしば高度に複雑な規定、階層化された論理構造、そして多くの例外で構成されており、必然的に労働集約的または理解的課題をもたらす。
これを軽減するために、最近のRegTechとLarge Language Models(LLMs)は、規制テキストを実行可能なコンプライアンスロジックに変換する自動化において、大きな注目を集めている。
しかし,1) ドメイン固有知識表現の不完全化,(2) 階層的推論能力の不足,(3) 時間的・論理的一貫性の維持に失敗したこと,の3つの主要な制約により,中国語の金融規制に適用された場合,その性能は依然として最適以下である。
有望な解決策の1つは、モデルトレーニングのためのドメイン固有かつコード指向のデータセットを開発することである。
LexGLUE、LegalBench、CODE-ACCORDといった既存のデータセットは、しばしば英語にフォーカスし、ドメインミスマッチし、コンプライアンスコード生成のきめ細かい粒度を欠いている。
これらのギャップを埋めるために、金融規制コンプライアンスに特化した中国初の大規模データセットであるCompliance-to-Codeを紹介します。
10のカテゴリにわたる361の規則から1,159の注釈付き節をカバーし、各節は規則関係とともに4つの論理的要素、条件、制約、文脈情報からなるモジュール構造になっている。
自動監査を容易にするために,決定論的Pythonコードマッピング,詳細なコード推論,コード説明を提供する。
実用性を示すために、FinCheck: 構造化、コード生成、レポート生成のためのパイプラインを提供する。
関連論文リスト
- Unlocking Reasoning Potential in Large Langauge Models by Scaling Code-form Planning [94.76546523689113]
CodePlanは、テキストコード形式の計画を生成し、追跡するフレームワークで、高いレベルの構造化された推論プロセスの概要を擬似コードで示します。
CodePlanは、洗練された推論タスク固有のリッチなセマンティクスと制御フローを効果的にキャプチャする。
反応を直接生成するのに比べて25.1%の相対的な改善が達成されている。
論文 参考訳(メタデータ) (2024-09-19T04:13:58Z) - RIRAG: Regulatory Information Retrieval and Answer Generation [51.998738311700095]
本稿では,質問を自動生成し,関連する規制通路と組み合わせる,問合せペアを生成するタスクを紹介する。
我々は、Abu Dhabi Global Markets (ADGM) の財務規制文書から得られた27,869の質問を含むObliQAデータセットを作成する。
本稿では,RIRAG(Regulation Information Retrieval and Answer Generation)システムをベースラインとして設計し,新しい評価基準であるRePASを用いて評価する。
論文 参考訳(メタデータ) (2024-09-09T14:44:19Z) - Using Large Language Models for the Interpretation of Building Regulations [7.013802453969655]
大規模言語モデル(LLM)は、ユーザのプロンプトに応答する論理的に一貫性のあるテキストとソースコードを生成することができる。
本稿では, 建物規制をLegalRuleMLに変換する際のLLMの性能を, 数ショットの学習設定で評価する。
論文 参考訳(メタデータ) (2024-07-26T08:30:47Z) - CODE-ACCORD: A Corpus of building regulatory data for rule generation towards automatic compliance checking [1.9950441865030422]
CODE-ACCORD (CODE-ACCORD) は、イングランドとフィンランドの建築規則に基づく852の文のデータセットである。
テキスト分類、エンティティ認識、関係抽出など、MLおよび自然言語処理(NLP)タスクをサポートする。
論文 参考訳(メタデータ) (2024-03-04T17:21:19Z) - Bridging between LegalRuleML and TPTP for Automated Normative Reasoning
(extended version) [77.34726150561087]
LegalRuleMLは、標準ルールのモデリングと交換のためのXMLベースの表現フレームワークである。
TPTP入力および出力フォーマットは、自動推論システムとのインタラクションのための汎用標準である。
本稿では,TPTP形式に基づく論理的論理的規範的推論言語を定義することにより,この2つのコミュニティ間の橋渡しを行う。
論文 参考訳(メタデータ) (2022-09-12T08:42:34Z) - Tag-based regulation of modules in genetic programming improves
context-dependent problem solving [62.997667081978825]
タグに基づく遺伝子制御を実験的に導入し、実証する。
タグベースの遺伝子制御は、既存のタグベースの命名スキームを拡張している。
タグに基づく規制は、文脈依存問題における問題解決性能を向上させる。
論文 参考訳(メタデータ) (2020-12-16T19:49:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。