論文の概要: Standard Applicability Judgment and Cross-jurisdictional Reasoning: A RAG-based Framework for Medical Device Compliance
- arxiv url: http://arxiv.org/abs/2506.18511v1
- Date: Mon, 23 Jun 2025 11:04:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.948511
- Title: Standard Applicability Judgment and Cross-jurisdictional Reasoning: A RAG-based Framework for Medical Device Compliance
- Title(参考訳): 標準適用可能性判断と相互判断推論:医療機器コンプライアンスのためのRAGベースのフレームワーク
- Authors: Yu Han, Aaron Ceross, Jeroen H. M. Bergmann,
- Abstract要約: 自由テキストデバイス記述を前提として、キュレートされたコーパスから候補標準を抽出し、大規模言語モデルを用いて、管轄範囲固有の適用性を推定する。
我々は,専門家による標準マッピングを用いた医療機器記述の国際ベンチマークデータセットを構築し,検索専用,ゼロショット,ルールベースラインに対するシステム評価を行った。
提案手法は, 分類精度73%, トップ5検索リコール87%を達成し, 関連する規制基準の特定に有効であることを示す。
- 参考スコア(独自算出の注目度): 3.439579933384111
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Identifying the appropriate regulatory standard applicability remains a critical yet understudied challenge in medical device compliance, frequently necessitating expert interpretation of fragmented and heterogeneous documentation across different jurisdictions. To address this challenge, we introduce a modular AI system that leverages a retrieval-augmented generation (RAG) pipeline to automate standard applicability determination. Given a free-text device description, our system retrieves candidate standards from a curated corpus and uses large language models to infer jurisdiction-specific applicability, classified as Mandatory, Recommended, or Not Applicable, with traceable justifications. We construct an international benchmark dataset of medical device descriptions with expert-annotated standard mappings, and evaluate our system against retrieval-only, zero-shot, and rule-based baselines. The proposed approach attains a classification accuracy of 73% and a Top-5 retrieval recall of 87%, demonstrating its effectiveness in identifying relevant regulatory standards. We introduce the first end-to-end system for standard applicability reasoning, enabling scalable and interpretable AI-supported regulatory science. Notably, our region-aware RAG agent performs cross-jurisdictional reasoning between Chinese and U.S. standards, supporting conflict resolution and applicability justification across regulatory frameworks.
- Abstract(参考訳): 適切な規制標準の適用性を特定することは、医療機器のコンプライアンスにおいて重要な課題であり、様々な管轄区域で断片化され異質な文書を専門的に解釈する必要がある。
この課題に対処するために,検索拡張生成(RAG)パイプラインを活用して,標準的な適用性判定を自動化するモジュール型AIシステムを導入する。
自由テキストデバイス記述を前提として,提案システムはキュレートされたコーパスから候補標準を抽出し,大規模言語モデルを用いて,規定,勧告,適用不可と分類された管轄範囲固有の適用性を推定する。
我々は,専門家による標準マッピングを用いた医療機器記述の国際ベンチマークデータセットを構築し,検索専用,ゼロショット,ルールベースラインに対するシステム評価を行った。
提案手法は, 分類精度73%, トップ5検索リコール87%を達成し, 関連する規制基準の特定に有効であることを示す。
我々は、スケーラブルで解釈可能なAI支援規制科学を可能にする、標準適用可能性推論のための最初のエンドツーエンドシステムを導入する。
特筆すべきは、我々の地域対応RAGエージェントは、中国と米国の標準の間で、相互判断的推論を行い、規制フレームワーク間の紛争解決と適用可能性の正当性をサポートすることである。
関連論文リスト
- Explainable AI Systems Must Be Contestable: Here's How to Make It Happen [2.5875936082584623]
本稿では、説明可能なAIにおける競合性の最初の厳密な形式的定義について述べる。
我々は、ヒューマン中心のインターフェース、技術プロセス、組織アーキテクチャにまたがる、設計やポストホックメカニズムのモジュール化されたフレームワークを紹介します。
私たちの作業は実践者に、真のリコースと説明責任をAIシステムに組み込むためのツールを提供しています。
論文 参考訳(メタデータ) (2025-06-02T13:32:05Z) - AlignRAG: Leveraging Critique Learning for Evidence-Sensitive Retrieval-Augmented Reasoning [61.28113271728859]
RAGは知識ベースで大規模言語モデル(LLM)を実現するためのパラダイムとして広く採用されている。
標準的なRAGパイプラインは、モデル推論が取得した証拠と整合性を維持するのに失敗することが多く、事実上の矛盾や否定的な結論につながる。
本研究では,RAGをRetrieval-Augmented Reasoningと解釈し,中心的だが未探索な問題であるtextitReasoning Misalignmentを同定する。
論文 参考訳(メタデータ) (2025-04-21T04:56:47Z) - Lawful and Accountable Personal Data Processing with GDPR-based Access and Usage Control in Distributed Systems [0.0]
本稿では,データ処理活動の合法性に関する法的議論を確立するための,自動規範推論のためのケースジェネリック手法を提案する。
議論は、プライバシーの専門家によるケース固有の法的資格に基づいて確立され、人間をループに導く。
GPDRから抽出した要求に対して、結果のシステムは設計され、批判的に評価される。
論文 参考訳(メタデータ) (2025-03-10T10:49:34Z) - AILuminate: Introducing v1.0 of the AI Risk and Reliability Benchmark from MLCommons [62.374792825813394]
本稿ではAI製品リスクと信頼性を評価するための業界標準ベンチマークとして,AIluminate v1.0を紹介する。
このベンチマークは、危険、違法、または望ましくない行動を12の危険カテゴリーで引き起こすように設計されたプロンプトに対するAIシステムの抵抗を評価する。
論文 参考訳(メタデータ) (2025-02-19T05:58:52Z) - Bridging the Gap in XAI-Why Reliable Metrics Matter for Explainability and Compliance [2.3020018305241337]
この論文は、標準化された信頼性のあるメトリクスが欠如していることから、説明可能なAI(XAI)の評価における重要なギャップを強調している。
現在の評価手法は、しばしば断片化され、主観的、偏見的であり、複雑なモデルの評価を操作し複雑にする傾向がある。
我々は、堅牢で文脈に敏感な評価指標を開発するための広範な研究を提唱する。
論文 参考訳(メタデータ) (2025-02-07T06:54:48Z) - RIRAG: Regulatory Information Retrieval and Answer Generation [51.998738311700095]
本稿では,質問を自動生成し,関連する規制通路と組み合わせる,問合せペアを生成するタスクを紹介する。
我々は、Abu Dhabi Global Markets (ADGM) の財務規制文書から得られた27,869の質問を含むObliQAデータセットを作成する。
本稿では,RIRAG(Regulation Information Retrieval and Answer Generation)システムをベースラインとして設計し,新しい評価基準であるRePASを用いて評価する。
論文 参考訳(メタデータ) (2024-09-09T14:44:19Z) - Normative Requirements Operationalization with Large Language Models [3.456725053685842]
規範的な非機能要件は、社会的、法的、倫理的、共感的、文化的規範の違反を避けるために、システムが観察しなければならない制約を規定する。
近年の研究では、規範的要件を特定するためにドメイン固有言語を使用してこの問題に対処している。
本稿では,システム機能の抽象表現間の意味的関係を抽出するために,大規模言語モデルを用いた補完的アプローチを提案する。
論文 参考訳(メタデータ) (2024-04-18T17:01:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。