論文の概要: Computable Gap Assessment of Artificial Intelligence Governance in Children's Centres: Evidence-Mechanism-Governance-Indicator Modelling of UNICEF's Guidance on AI and Children 3.0 Based on the Graph-GAP Framework
- arxiv url: http://arxiv.org/abs/2601.04216v1
- Date: Sat, 20 Dec 2025 17:03:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-11 18:48:17.623253
- Title: Computable Gap Assessment of Artificial Intelligence Governance in Children's Centres: Evidence-Mechanism-Governance-Indicator Modelling of UNICEF's Guidance on AI and Children 3.0 Based on the Graph-GAP Framework
- Title(参考訳): 子どもセンターにおける人工知能ガバナンスの計算可能なギャップ評価:グラフGAPフレームワークに基づくユニセフのAIと子供3.0指導の証拠-機械-統治-指標モデリング
- Authors: Wei Meng,
- Abstract要約: 本稿では,権威政策文書からエビデンス,メカニズム,ガバナンス,インジケータの4層グラフに要件を分解する手法を提案する。
UNICEF Innocenti Guidance on AIとChildren 3.0を主要な素材として、再現可能な抽出単位、コーディングマニュアル、グラフパターン、スコアリング尺度、一貫性チェックを定義する。
その結果, プライバシやデータ保護と比較して, 子どもの健康と発達, 説明可能性, 説明可能性, 説明可能性, 資源配分といった要件が, ギャップやメカニズムギャップの指標となる傾向が示唆された。
- 参考スコア(独自算出の注目度): 5.260137087369841
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper tackles practical challenges in governing child centered artificial intelligence: policy texts state principles and requirements but often lack reproducible evidence anchors, explicit causal pathways, executable governance toolchains, and computable audit metrics. We propose Graph-GAP, a methodology that decomposes requirements from authoritative policy texts into a four layer graph of evidence, mechanism, governance, and indicator, and that computes two metrics, GAP score and mitigation readiness, to identify governance gaps and prioritise actions. Using the UNICEF Innocenti Guidance on AI and Children 3.0 as primary material, we define reproducible extraction units, coding manuals, graph patterns, scoring scales, and consistency checks, and we demonstrate exemplar gap profiles and governance priority matrices for ten requirements. Results suggest that compared with privacy and data protection, requirements related to child well being and development, explainability and accountability, and cross agency implementation and resource allocation are more prone to indicator gaps and mechanism gaps. We recommend translating requirements into auditable closed loop governance that integrates child rights impact assessments, continuous monitoring metrics, and grievance redress procedures. At the coding level, we introduce a multi algorithm review aggregation revision workflow that runs rule based encoders, statistical or machine learning evaluators, and large model evaluators with diverse prompt configurations as parallel coders. Each extraction unit outputs evidence, mechanism, governance, and indicator labels plus readiness scores with evidence anchors. Reliability, stability, and uncertainty are assessed using Krippendorff alpha, weighted kappa, intraclass correlation, and bootstrap confidence intervals.
- Abstract(参考訳): 本稿では,児童中心型人工知能の実践的課題に対処する:政策テキストは国家の原則と要件を規定するが,再現可能な証拠アンカー,明確な因果経路,実行可能なガバナンスツールチェーン,計算可能な監査指標を欠くことが多い。
我々は,権威主義的政策文書からの要求を証拠,メカニズム,ガバナンス,指標の4層グラフに分解する手法であるGraph-GAPを提案し,GAPスコアと緩和準備性という2つの指標を計算し,ガバナンスのギャップを識別し,行動の優先順位を決定する。
UNICEF Innocenti Guidance on AIとChildren 3.0を主要素材として、再現可能な抽出単位、コーディングマニュアル、グラフパターン、スコアリング尺度、一貫性チェックを定義し、典型的なギャッププロファイルと10の要件に対するガバナンス優先行列を示す。
その結果, プライバシやデータ保護と比較して, 子どもの健康と発達, 説明可能性, 説明可能性, 説明可能性, 資源配分といった要件が, ギャップやメカニズムギャップの指標となる傾向が示唆された。
我々は、児童の権利影響評価、継続的なモニタリングメトリクス、回復の手続きを統合した監査可能なクローズドループガバナンスに要求を翻訳することを推奨する。
符号化レベルでは、ルールベースのエンコーダ、統計的または機械学習評価器、および並列コーダとして多様なプロンプト構成を持つ大規模モデル評価器を実行するマルチアルゴリズムレビュー集約リビジョンワークフローを導入する。
各抽出ユニットはエビデンス、メカニズム、ガバナンス、インジケータラベルとエビデンスアンカーによる準備スコアを出力する。
信頼性,安定性,不確実性を,Krippendorffα,加重カッパ,クラス内相関,ブートストラップ信頼区間を用いて評価した。
関連論文リスト
- Compliance as a Trust Metric [1.0264137858888513]
本稿では,規制コンプライアンスを定量的かつダイナミックな信頼度として運用することで,この研究ギャップを埋める。
私たちのコントリビューションは、各違反の深刻度を、そのボリューム、時間、ブレッドス、臨界度など、複数の次元に沿って評価する定量的モデルです。
人工病院のデータセット上でACEを評価し,複雑なHIPAAおよびHIPAA違反を正確に検出できることを実証した。
論文 参考訳(メタデータ) (2026-01-03T21:14:40Z) - Measuring What Matters: The AI Pluralism Index [0.0]
AI Pluralism Index(AIPI)は、4つの柱(参加型ガバナンス、傾向と多様性、透明性、説明責任)にまたがる生産者とシステム家族を評価する透明でエビデンスに基づく指標である。
この指標は、多元主義的な実践に対するインセンティブを推し進め、政策立案者、調達者、一般大衆に同等の証拠を与えることを目的としている。
論文 参考訳(メタデータ) (2025-10-09T13:19:34Z) - Demystifying deep search: a holistic evaluation with hint-free multi-hop questions and factorised metrics [89.1999907891494]
We present WebDetective, a benchmark of hint-free multi-hop questions with a control Wikipedia sandbox。
25の最先端モデルに対する我々の評価は、すべてのアーキテクチャにまたがる体系的な弱点を明らかにしている。
私たちはエージェントワークフローであるEvidenceLoopを開発し、ベンチマークが特定する課題を明示的にターゲットしています。
論文 参考訳(メタデータ) (2025-10-01T07:59:03Z) - AgenticIQA: An Agentic Framework for Adaptive and Interpretable Image Quality Assessment [69.06977852423564]
画像品質評価(IQA)は、人間の視覚系に根ざした知覚品質の定量化と解釈の両方を反映している。
AgenticIQAは、IQAを歪み検出、歪み解析、ツール選択、ツール実行の4つのサブタスクに分解する。
本稿では,IQAエージェントに適した大規模命令データセットであるAgenticIQA-200Kと,VLMベースのIQAエージェントの計画,実行,要約機能を評価するための最初のベンチマークであるAgenticIQA-Evalを紹介する。
論文 参考訳(メタデータ) (2025-09-30T09:37:01Z) - KAQG: A Knowledge-Graph-Enhanced RAG for Difficulty-Controlled Question Generation [0.0]
本研究は知識強化質問生成(KAQG)を紹介する。
項目応答理論(IRT)、ブルームの分類学、知識グラフをマルチエージェント検索拡張生成システムに統合する。
提案手法は, 項目難易度, 心理測定校正, 認知アライメントのきめ細かい制御を可能にすることによって, 既存の手法の限界を克服する。
論文 参考訳(メタデータ) (2025-05-12T14:42:19Z) - Retrieval is Not Enough: Enhancing RAG Reasoning through Test-Time Critique and Optimization [58.390885294401066]
Retrieval-augmented Generation (RAG) は知識基底型大規模言語モデル(LLM)を実現するためのパラダイムとして広く採用されている。
RAGパイプラインは、モデル推論が得られた証拠と整合性を維持するのに失敗することが多く、事実上の矛盾や否定的な結論につながる。
批判駆動アライメント(CDA)に基づく新しい反復的枠組みであるAlignRAGを提案する。
AlignRAG-autoは、動的に洗練を終了し、批判的な反復回数を事前に指定する必要がなくなる自律的な変種である。
論文 参考訳(メタデータ) (2025-04-21T04:56:47Z) - Demographic Benchmarking: Bridging Socio-Technical Gaps in Bias Detection [0.0]
本稿では、ITTACA AI監査プラットフォームが、AIレコメンデータシステムの監査において、階層的ベンチマークにどのように取り組むかを説明する。
フレームワークは、単に測定するだけでなく、特定のパフォーマンス指標の許容範囲を確立することができるので、監査役として役立ちます。
我々のアプローチは、社会デマトグラフィーの洞察を直接AIシステムに統合し、バイアスを減らし、全体的なパフォーマンスを改善する。
論文 参考訳(メタデータ) (2025-01-27T12:14:49Z) - Multisource AI Scorecard Table for System Evaluation [3.74397577716445]
本稿では、AI/機械学習(ML)システムの開発者およびユーザに対して標準チェックリストを提供するマルチソースAIスコアカードテーブル(MAST)について述べる。
本稿では,インテリジェンス・コミュニティ・ディレクティブ(ICD)203で概説されている分析的トレードクラフト標準が,AIシステムの性能を評価するためのフレームワークを提供する方法について考察する。
論文 参考訳(メタデータ) (2021-02-08T03:37:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。