論文の概要: Human-aligned AI Model Cards with Weighted Hierarchy Architecture
- arxiv url: http://arxiv.org/abs/2510.06989v1
- Date: Wed, 08 Oct 2025 13:13:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 16:41:20.508195
- Title: Human-aligned AI Model Cards with Weighted Hierarchy Architecture
- Title(参考訳): 軽量階層型AIモデルカード
- Authors: Pengyue Yang, Haolin Jin, Qingwen Zeng, Jiawen Wen, Harry Rao, Huaming Chen,
- Abstract要約: LLM(Large Language Models)の普及は、専門的なドメイン特化モデルのエコシステムの肥大化につながった。
Model CardsやFactSheetsといった既存のドキュメントフレームワークは、レポートの標準化を試みるが、多くの場合は静的で、質的である。
我々は、静的開示からアクション可能な人間対応のドキュメントに移行する新しいアプローチである包括的責任AIモデルカードフレームワーク(CRAI-MCF)を紹介します。
- 参考スコア(独自算出の注目度): 5.774549987076668
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The proliferation of Large Language Models (LLMs) has led to a burgeoning ecosystem of specialized, domain-specific models. While this rapid growth accelerates innovation, it has simultaneously created significant challenges in model discovery and adoption. Users struggle to navigate this landscape due to inconsistent, incomplete, and imbalanced documentation across platforms. Existing documentation frameworks, such as Model Cards and FactSheets, attempt to standardize reporting but are often static, predominantly qualitative, and lack the quantitative mechanisms needed for rigorous cross-model comparison. This gap exacerbates model underutilization and hinders responsible adoption. To address these shortcomings, we introduce the Comprehensive Responsible AI Model Card Framework (CRAI-MCF), a novel approach that transitions from static disclosures to actionable, human-aligned documentation. Grounded in Value Sensitive Design (VSD), CRAI-MCF is built upon an empirical analysis of 240 open-source projects, distilling 217 parameters into an eight-module, value-aligned architecture. Our framework introduces a quantitative sufficiency criterion to operationalize evaluation and enables rigorous cross-model comparison under a unified scheme. By balancing technical, ethical, and operational dimensions, CRAI-MCF empowers practitioners to efficiently assess, select, and adopt LLMs with greater confidence and operational integrity.
- Abstract(参考訳): LLM(Large Language Models)の普及は、専門的なドメイン特化モデルのエコシステムの肥大化につながった。
この急速な成長はイノベーションを加速する一方で、モデル発見と採用において大きな課題を同時に生み出している。
プラットフォーム間の不整合、不完全、不均衡なドキュメントのため、ユーザはこの状況のナビゲートに苦労する。
Model CardsやFactSheetsといった既存のドキュメントフレームワークは、レポートの標準化を試みるが、しばしば静的で質的であり、厳密なクロスモデル比較に必要な量的メカニズムが欠如している。
このギャップは、モデルの不使用を悪化させ、責任ある採用を妨げる。
これらの欠点に対処するために、私たちは、静的開示からアクション可能な、人間に準拠したドキュメントに移行する新しいアプローチである、包括的責任AIモデルカードフレームワーク(CRAI-MCF)を紹介します。
CRAI-MCFはVSD(Value Sensitive Design)で構築されており、240のオープンソースプロジェクトの実証分析に基づいて、217のパラメータを8モジュールのバリューアライメントアーキテクチャに抽出する。
本フレームワークは,評価を運用するための量的充足基準を導入し,統一的スキームの下で厳密な相互モデル比較を可能にする。
技術的、倫理的、運用的な側面のバランスをとることで、CRAI-MCFは実践者がより信頼性と運用上の整合性のあるLSMを効率的に評価し、選択し、採用することを可能にする。
関連論文リスト
- OneCAT: Decoder-Only Auto-Regressive Model for Unified Understanding and Generation [91.45421429922506]
OneCATは、理解、生成、編集をシームレスに統合する統合マルチモーダルモデルである。
我々のフレームワークは、推論中に視覚変換器(ViT)や視覚トークン化器などの外部コンポーネントを不要にする。
論文 参考訳(メタデータ) (2025-09-03T17:29:50Z) - Conformalized Exceptional Model Mining: Telling Where Your Model Performs (Not) Well [31.013018198280506]
本稿では,新しいフレームワークであるConformalized Exceptional Model Miningを紹介する。
コンフォーマル予測の厳密さと例外モデルマイニングの説明力を組み合わせる。
我々は、共形予測の厳密なカバレッジ保証を通じて不確実性を定量化する新しいモデルクラスmSMoPEを開発する。
論文 参考訳(メタデータ) (2025-08-21T13:43:14Z) - AI in a vat: Fundamental limits of efficient world modelling for agent sandboxing and interpretability [84.52205243353761]
最近の研究は、世界モデルを使用して、AIエージェントをデプロイ前にテストできる制御された仮想環境を生成することを提案する。
評価対象のAIエージェントに非依存な世界モデルを簡単にする方法を検討する。
論文 参考訳(メタデータ) (2025-04-06T20:35:44Z) - SMRS: advocating a unified reporting standard for surrogate models in the artificial intelligence era [1.4835379864550937]
我々は、サロゲートモデルのための構造化レポート標準を確立する緊急の必要性を論じる。
標準化されながらフレキシブルなフレームワークを推進することによって、サロゲートモデリングの信頼性を向上させることを目指している。
論文 参考訳(メタデータ) (2025-02-10T18:31:15Z) - QualEval: Qualitative Evaluation for Model Improvement [82.73561470966658]
モデル改善のための手段として,自動定性評価による定量的スカラー指標を付加するQualEvalを提案する。
QualEvalは強力なLCM推論器と新しいフレキシブルリニアプログラミングソルバを使用して、人間の読みやすい洞察を生成する。
例えば、その洞察を活用することで、Llama 2モデルの絶対性能が最大15%向上することを示す。
論文 参考訳(メタデータ) (2023-11-06T00:21:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。