論文の概要: Why Model Credibility Isn't Enough: -Rethinking Trust in Simulation Architectures
- arxiv url: http://arxiv.org/abs/2606.17593v1
- Date: Tue, 16 Jun 2026 06:56:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.319236
- Title: Why Model Credibility Isn't Enough: -Rethinking Trust in Simulation Architectures
- Title(参考訳): モデルの信頼性が不十分な理由: - シミュレーションアーキテクチャにおける信頼を再考する
- Authors: Romain Barbedienne, Adeline Lanugue, Rim Kaddah, Julien Silande, Anthony Levillain, Cedric Leclerc, Maxime Hayet, Boussaad Soualmi, Cristian Maxim,
- Abstract要約: 本稿では,組立信頼性分野における技術の現状について概説する。
感度分析技術、専門家による質的分析、AIにおける説明可能性、ネットワークを比較します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Credibility of a simulation model is an important topic. Several approaches try to quantify the credibility of simulation. However, models are mostly assembled within a simulation architecture. Can the credibility of a simulation architecture be assessed based on the credibility of the models that comprise it? This paper aims to address this issue by providing an overview of the current state of the art in the field of assembly credibility. It will compare sensitivity analysis techniques, qualitative analysis by experts, explainability in AI, and networks. Finally, an assessment of the proposed approaches, based on criteria such as rigor, generalization, and resource requirements, will reveal the strengths and weaknesses of each approach.
- Abstract(参考訳): シミュレーションモデルの信頼性は重要なトピックである。
いくつかの手法はシミュレーションの信頼性を定量化しようとする。
しかし、モデルは主にシミュレーションアーキテクチャ内で組み立てられる。
シミュレーションアーキテクチャの信頼性は、それを構成するモデルの信頼性に基づいて評価できるだろうか?
本稿では, 組立信頼性の分野における現状を概観することにより, この問題に対処することを目的とする。
感度分析技術、専門家による質的分析、AIにおける説明可能性、ネットワークを比較します。
最後に、厳格化、一般化、資源要件といった基準に基づいて提案手法の評価を行い、それぞれのアプローチの長所と短所を明らかにする。
関連論文リスト
- Quantifying and Attributing Submodel Uncertainty in Stochastic Simulation Models and Digital Twins [0.1234398109349733]
本稿では,サブモデルの不確実性がシステム性能指標の推定に与える影響について検討する。
本研究では,シミュレーションモデルにおけるサブモデル不確実性を定量化するためのフレームワークを開発し,そのフレームワークをデジタルツイン設定に拡張する。
論文 参考訳(メタデータ) (2026-02-18T00:06:39Z) - Q-REAL: Towards Realism and Plausibility Evaluation for AI-Generated Content [71.46991494014382]
本稿では,AI生成画像におけるリアリズムと妥当性の詳細な評価のための新しいデータセットであるQ-Realを紹介する。
Q-Realは、人気のあるテキスト・ツー・イメージ・モデルによって生成される3,088のイメージで構成されている。
そこで本研究では,Q-Real Benchを2つの課題,すなわち判断と推論による根拠付けに基づいて評価する。
論文 参考訳(メタデータ) (2025-11-21T02:43:17Z) - Human-aligned AI Model Cards with Weighted Hierarchy Architecture [5.774549987076668]
LLM(Large Language Models)の普及は、専門的なドメイン特化モデルのエコシステムの肥大化につながった。
Model CardsやFactSheetsといった既存のドキュメントフレームワークは、レポートの標準化を試みるが、多くの場合は静的で、質的である。
我々は、静的開示からアクション可能な人間対応のドキュメントに移行する新しいアプローチである包括的責任AIモデルカードフレームワーク(CRAI-MCF)を紹介します。
論文 参考訳(メタデータ) (2025-10-08T13:13:18Z) - RealUnify: Do Unified Models Truly Benefit from Unification? A Comprehensive Benchmark [71.3555284685426]
本稿では,双方向機能相乗効果を評価するためのベンチマークであるRealUnifyを紹介する。
RealUnifyは、10のカテゴリと32のサブタスクにまたがる、細心の注意を払ってアノテートされた1000のインスタンスで構成されている。
現在の統一モデルは、効果的な相乗効果を達成するのに依然として苦労しており、アーキテクチャの統一だけでは不十分であることを示している。
論文 参考訳(メタデータ) (2025-09-29T15:07:28Z) - Is Smoothness the Key to Robustness? A Comparison of Attention and Convolution Models Using a Novel Metric [0.0]
既存の堅牢性評価アプローチは理論的な一般性を欠いているか、経験的評価に大きく依存していることが多い。
本研究では,トポロジカルデータ解析とリプシッツ連続性を橋渡ししてロバスト性評価を行う層解析に基づくトポリップを提案する。
論文 参考訳(メタデータ) (2024-10-23T07:44:14Z) - Benchmarks as Microscopes: A Call for Model Metrology [76.64402390208576]
現代の言語モデル(LM)は、能力評価において新たな課題を提起する。
メトリクスに自信を持つためには、モデルミアロジの新たな規律が必要です。
論文 参考訳(メタデータ) (2024-07-22T17:52:12Z) - A Bayesian Approach to Robust Inverse Reinforcement Learning [54.24816623644148]
我々は、オフラインモデルに基づく逆強化学習(IRL)に対するベイズ的アプローチを考える。
提案フレームワークは,専門家の報酬関数と環境力学の主観的モデルとを同時推定することにより,既存のオフラインモデルベースIRLアプローチとは異なる。
本分析は, 専門家が環境の高精度なモデルを持つと考えられる場合, 評価政策が堅牢な性能を示すという新たな知見を提示する。
論文 参考訳(メタデータ) (2023-09-15T17:37:09Z) - Learning Topic Models: Identifiability and Finite-Sample Analysis [6.181048261489101]
本稿では,特定の統合可能性に基づく潜在トピックの最大確率推定器(MLE)を提案する。
シミュレーションと実データの両方について実証的研究を行った。
論文 参考訳(メタデータ) (2021-10-08T16:35:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。