Fugu-MT 論文翻訳(概要): SMRS: advocating a unified reporting standard for surrogate models in the artificial intelligence era

論文の概要: SMRS: advocating a unified reporting standard for surrogate models in the artificial intelligence era

arxiv url: http://arxiv.org/abs/2502.06753v2
Date: Mon, 09 Jun 2025 16:01:25 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-10 16:33:09.839182
Title: SMRS: advocating a unified reporting standard for surrogate models in the artificial intelligence era
Title（参考訳）: SMRS:人工知能時代におけるサロゲートモデルの統一報告標準の提唱
Authors: Elizaveta Semenova, Alisa Sheinkman, Timothy James Hitge, Siobhan Mackenzie Hall, Jon Cockayne,
Abstract要約: 我々は、サロゲートモデルのための構造化レポート標準を確立する緊急の必要性を論じる。標準化されながらフレキシブルなフレームワークを推進することによって、サロゲートモデリングの信頼性を向上させることを目指している。
参考スコア（独自算出の注目度）: 1.4835379864550937
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Surrogate models are widely used to approximate complex systems across science and engineering to reduce computational costs. Despite their widespread adoption, the field lacks standardisation across key stages of the modelling pipeline, including data sampling, model selection, evaluation, and downstream analysis. This fragmentation limits reproducibility and cross-domain utility -- a challenge further exacerbated by the rapid proliferation of AI-driven surrogate models. We argue for the urgent need to establish a structured reporting standard, the Surrogate Model Reporting Specification (SMRS), that systematically captures essential design and evaluation choices while remaining agnostic to implementation specifics. By promoting a standardised yet flexible framework, we aim to improve the reliability of surrogate modelling, foster interdisciplinary knowledge transfer, and, as a result, accelerate scientific progress in the AI era.
Abstract（参考訳）: サーロゲートモデルは計算コストを削減するために科学と工学の複雑なシステムを近似するために広く使われている。広く採用されているにもかかわらず、フィールドはデータサンプリング、モデル選択、評価、下流分析など、モデリングパイプラインの重要なステージにわたって標準化されていない。この断片化は再現性とクロスドメインユーティリティを制限する -- AI駆動のサロゲートモデルの急速な普及によってさらに悪化する課題だ。我々は,構造化された報告標準であるSurrogate Model Reporting Specification(SMRS)の確立を急務に要求する。標準化されたフレキシブルなフレームワークを推進することによって、代理モデリングの信頼性を高め、学際的な知識伝達を促進し、その結果、AI時代の科学的進歩を加速することを目指している。

関連論文リスト

TokaMark: A Comprehensive Benchmark for MAST Tokamak Plasma Models [56.94569090844015]
TokaMarkは、Mega Ampere Spherical Tokamak (MAST)から収集された実実験データに基づいてAIモデルを評価するための構造化ベンチマークである。 TokaMarkは、データ駆動型AIベースのプラズマモデリングの進歩を加速することを目的としている。
論文参考訳（メタデータ） (2026-02-05T16:49:44Z)
Agentic Proposing: Enhancing Large Language Model Reasoning via Compositional Skill Synthesis [10.951981109673119]
Agentic Proposingは、問題合成をゴール駆動シーケンシャルな意思決定プロセスとしてモデル化するフレームワークである。数学、コーディング、科学にまたがる高精度で検証可能な訓練軌道を生成する。 11,000個の合成軌道で訓練された30Bソルバは、AIME25で91.6%の精度を達成する。
論文参考訳（メタデータ） (2026-02-03T09:02:53Z)
AI-NativeBench: An Open-Source White-Box Agentic Benchmark Suite for AI-Native Systems [52.65695508605237]
我々は、Model Context Protocol(MCP)とAgent-to-Agent(A2A)標準に基づいて、アプリケーション中心でホワイトボックスのAI-NativeベンチマークスイートであるAI-NativeBenchを紹介する。エージェントスパンを分散トレース内の第一級市民として扱うことにより,本手法は,単純な機能以上の工学的特性の粒度解析を可能にする。この研究は、モデル能力の測定から信頼性の高いAI-Nativeシステムへの移行を導く最初の体系的な証拠を提供する。
論文参考訳（メタデータ） (2026-01-14T11:32:07Z)
Human-aligned AI Model Cards with Weighted Hierarchy Architecture [5.774549987076668]
LLM(Large Language Models)の普及は、専門的なドメイン特化モデルのエコシステムの肥大化につながった。 Model CardsやFactSheetsといった既存のドキュメントフレームワークは、レポートの標準化を試みるが、多くの場合は静的で、質的である。我々は、静的開示からアクション可能な人間対応のドキュメントに移行する新しいアプローチである包括的責任AIモデルカードフレームワーク(CRAI-MCF)を紹介します。
論文参考訳（メタデータ） (2025-10-08T13:13:18Z)
Automated Optimization Modeling through Expert-Guided Large Language Model Reasoning [43.63419208391747]
本稿では,最適化プロセスを自動化するチェーン・オブ・シント推論を通じて,専門家レベルの最適化モデリングの原則を活用する新しいフレームワークを提案する。また、ロジスティクス領域からの新しい最適化モデリングベンチマークであるLogiORを導入し、標準化されたアノテーションに関するより複雑な問題を含む。
論文参考訳（メタデータ） (2025-08-20T04:14:54Z)
Learning Time-Aware Causal Representation for Model Generalization in Evolving Domains [50.66049136093248]
動的因果要因と因果機構のドリフトを組み込んだ時間認識型構造因果モデル(SCM)を開発した。本研究では,時間領域毎に最適な因果予測値が得られることを示す。合成と実世界の両方のデータセットの結果から,SynCは時間的一般化性能に優れることが示された。
論文参考訳（メタデータ） (2025-06-21T14:05:37Z)
Lightweight Task-Oriented Semantic Communication Empowered by Large-Scale AI Models [66.57755931421285]
大規模人工知能(LAI)モデルは、リアルタイム通信シナリオにおいて重大な課題を提起する。本稿では,LAIモデルから知識を抽出・凝縮するために知識蒸留(KD)技術を活用することを提案する。本稿では,反復推論の必要性を排除したプレストア圧縮機構を備えた高速蒸留法を提案する。
論文参考訳（メタデータ） (2025-06-16T08:42:16Z)
Anomaly Detection and Generation with Diffusion Models: A Survey [51.61574868316922]
異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文参考訳（メタデータ） (2025-06-11T03:29:18Z)
High-Fidelity Scientific Simulation Surrogates via Adaptive Implicit Neural Representations [51.90920900332569]
入射神経表現(INR)は空間的に構造化されたデータをモデリングするためのコンパクトで連続的なフレームワークを提供する。近年のアプローチでは、剛性幾何学的構造に沿った付加的な特徴を導入することでこの問題に対処している。機能適応型INR(FA-INR)を提案する。
論文参考訳（メタデータ） (2025-06-07T16:45:17Z)
Modèles de Substitution pour les Modèles à base d'Agents : Enjeux, Méthodes et Applications [0.0]
エージェントベースモデル(ABM)は、局所的な相互作用から生じる創発的な現象を研究するために広く用いられている。 ABMの複雑さは、リアルタイム意思決定と大規模シナリオ分析の可能性を制限する。これらの制限に対処するため、サロゲートモデルはスパースシミュレーションデータから近似を学習することで効率的な代替手段を提供する。
論文参考訳（メタデータ） (2025-05-17T08:55:33Z)
A SCADE Model Verification Method Based on B-Model Transformation [0.8437187555622164]
本研究では,B法に基づく形式的検証フレームワークを提案する。 SCADEで直接モデリングするのが難しい抽象仕様をうまく検証します。本研究は,アビオニクス,鉄道輸送,その他の領域における組込み制御システムに対するクロスモデル検証パラダイムを提供する。
論文参考訳（メタデータ） (2025-05-02T03:05:09Z)
Domain Guidance: A Simple Transfer Approach for a Pre-trained Diffusion Model [62.11981915549919]
ドメインガイダンス(Domain Guidance)は、トレーニング済みの知識を活用して、サンプリングプロセスを対象のドメインに誘導する移行アプローチである。 FIDは19.6%改善し、FD$_textDINOv2$は23.4%改善した。
論文参考訳（メタデータ） (2025-04-02T09:07:55Z)
Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute [61.00662702026523]
より大規模なモデルではなく、推論時間の増加を活用する統合されたテスト時間計算スケーリングフレームワークを提案する。当社のフレームワークには,内部TTCと外部TTCの2つの補完戦略が組み込まれている。当社の textbf32B モデルは,DeepSeek R1 671B や OpenAI o1 など,はるかに大きなモデルを上回る 46% の課題解決率を実現している。
論文参考訳（メタデータ） (2025-03-31T07:31:32Z)
A Survey of Model Architectures in Information Retrieval [59.61734783818073]
2019年から現在までの期間は、情報検索(IR)と自然言語処理(NLP)における最大のパラダイムシフトの1つとなっている。従来の用語ベースの手法から現代のニューラルアプローチまで,特にトランスフォーマーベースのモデルとそれに続く大規模言語モデル(LLM)の影響が注目されている。今後の課題と今後の方向性について、先見的な議論で締めくくります。
論文参考訳（メタデータ） (2025-02-20T18:42:58Z)
LoRE-Merging: Exploring Low-Rank Estimation For Large Language Model Merging [10.33844295243509]
基本モデルであるtextscLoRE-Merging へのアクセスを必要とせず,タスクベクトルの低ランク推定に基づくモデルマージのための統一フレームワークを提案する。我々のアプローチは、細調整されたモデルからのタスクベクトルは、しばしば支配的な特異値の限られた数しか示さず、低ランク推定が干渉しにくくなるという観察に動機づけられている。
論文参考訳（メタデータ） (2025-02-15T10:18:46Z)
Transfer Learning of Surrogate Models via Domain Affine Transformation Across Synthetic and Real-World Benchmarks [4.515998639772672]
代理モデルはしばしば、現実世界のプロセスのコストのかかる実行のための効率的な代用として使われる。本研究は、原関数から対象関数への非微分可能な代理モデルを転送することに焦点を当てる。これらのドメインは未知のアフィン変換によって関連づけられていると仮定し、ターゲット上で評価された限られた量の転送データポイントのみを使用する。
論文参考訳（メタデータ） (2025-01-23T18:44:25Z)
AAD-LLM: Adaptive Anomaly Detection Using Large Language Models [35.286105732902065]
本研究は,Large Language Models (LLMs) を利用した異常検出モデルの伝達性の向上を目的とする。この研究はまた、モデルとプラントオペレーターの間でより協調的な意思決定を可能にすることを目指している。
論文参考訳（メタデータ） (2024-11-01T13:43:28Z)
Benchmarks as Microscopes: A Call for Model Metrology [76.64402390208576]
現代の言語モデル(LM)は、能力評価において新たな課題を提起する。メトリクスに自信を持つためには、モデルミアロジの新たな規律が必要です。
論文参考訳（メタデータ） (2024-07-22T17:52:12Z)
Two-Stage Surrogate Modeling for Data-Driven Design Optimization with Application to Composite Microstructure Generation [1.912429179274357]
本稿では,科学・工学分野における逆問題に対処する2段階の機械学習に基づく代理モデリングフレームワークを提案する。最初の段階では、"Learner"と呼ばれる機械学習モデルは、予測出力が望ましい結果と密接に一致している入力デザイン空間内の候補の限られたセットを特定する。第2段では、第1段で生成された縮小候補空間を評価するために、「評価器」として機能する別の代理モデルを用いる。
論文参考訳（メタデータ） (2024-01-04T00:25:12Z)
QualEval: Qualitative Evaluation for Model Improvement [82.73561470966658]
モデル改善のための手段として,自動定性評価による定量的スカラー指標を付加するQualEvalを提案する。 QualEvalは強力なLCM推論器と新しいフレキシブルリニアプログラミングソルバを使用して、人間の読みやすい洞察を生成する。例えば、その洞察を活用することで、Llama 2モデルの絶対性能が最大15%向上することを示す。
論文参考訳（メタデータ） (2023-11-06T00:21:44Z)
Refined Mechanism Design for Approximately Structured Priors via Active Regression [50.71772232237571]
我々は、大量の商品を戦略的入札者に販売する収益を最大化する販売業者の問題を考える。この設定の最適かつほぼ最適のメカニズムは、特徴付けや計算が難しいことで有名である。
論文参考訳（メタデータ） (2023-10-11T20:34:17Z)
REX: Rapid Exploration and eXploitation for AI Agents [103.68453326880456]
本稿では、REXと呼ばれるAIエージェントのための高速探索およびeXploitationのための改良されたアプローチを提案する。 REXは追加の報酬層を導入し、アッパー信頼境界(UCB)スコアに似た概念を統合し、より堅牢で効率的なAIエージェントのパフォーマンスをもたらす。
論文参考訳（メタデータ） (2023-07-18T04:26:33Z)
Low-dimensional Data-based Surrogate Model of a Continuum-mechanical Musculoskeletal System Based on Non-intrusive Model Order Reduction [0.0]
データ駆動型モデルオーダーリダクションを用いた代理モデルのような従来の手法は、高忠実度モデルをより広く利用するために用いられる。ヒト上腕部の複素有限要素モデルに対する代理モデル手法の利点を実証する。
論文参考訳（メタデータ） (2023-02-13T17:14:34Z)
Slimmable Domain Adaptation [112.19652651687402]
重み付けモデルバンクを用いて、ドメイン間の一般化を改善するためのシンプルなフレームワーク、Slimmable Domain Adaptationを導入する。私たちのフレームワークは、他の競合するアプローチを、複数のベンチマークにおいて非常に大きなマージンで上回ります。
論文参考訳（メタデータ） (2022-06-14T06:28:04Z)
Model Reprogramming: Resource-Efficient Cross-Domain Machine Learning [65.268245109828]
視覚、言語、音声などのデータに富む領域では、ディープラーニングが高性能なタスク固有モデルを提供するのが一般的である。リソース制限されたドメインでのディープラーニングは、(i)限られたデータ、(ii)制約付きモデル開発コスト、(iii)効果的な微調整のための適切な事前学習モデルの欠如など、多くの課題に直面している。モデル再プログラミングは、ソースドメインから十分に訓練されたモデルを再利用して、モデル微調整なしでターゲットドメインのタスクを解くことで、リソース効率のよいクロスドメイン機械学習を可能にする。
論文参考訳（メタデータ） (2022-02-22T02:33:54Z)
Surrogate Modeling for Physical Systems with Preserved Properties and Adjustable Tradeoffs [0.0]
代理モデルを生成するためのモデルベースおよびデータ駆動型戦略を提案する。後者は、前提となる位相構造に人工的関係を組み込むことで解釈可能な代理モデルを生成する。我々のフレームワークは、分散パラメータモデルのための様々な空間離散化スキームと互換性がある。
論文参考訳（メタデータ） (2022-02-02T17:07:02Z)
Towards Robust and Reliable Algorithmic Recourse [11.887537452826624]
モデルシフトに堅牢なリコースを見つけるための敵対的トレーニングを活用する新しいフレームワークであるRObust Algorithmic Recourse(ROAR)を提案します。また,モデルシフトにロバストなリコースの構築の重要性を強調する詳細な理論解析を行う。
論文参考訳（メタデータ） (2021-02-26T17:38:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。