論文の概要: A non-cooperative meta-modeling game for automated third-party
calibrating, validating, and falsifying constitutive laws with parallelized
adversarial attacks
- arxiv url: http://arxiv.org/abs/2004.09392v1
- Date: Mon, 13 Apr 2020 18:43:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 23:45:45.477329
- Title: A non-cooperative meta-modeling game for automated third-party
calibrating, validating, and falsifying constitutive laws with parallelized
adversarial attacks
- Title(参考訳): 並列攻撃を伴う構成則の自動校正、検証、改ざんのための非協力的メタモデリングゲーム
- Authors: Kun Wang, WaiChing Sun, Qiang Du
- Abstract要約: 特に高リスク・高レグリート工学的応用におけるモデルの評価には、効率的で厳格な第三者の校正、検証、ファルシフィケーションが必要である。
本研究は,ゲーム理論と機械学習技術の概念を導入し,これらの課題の多くを克服しようとするものである。
2つの競合するAIエージェントが実験データを生成し、与えられたモデルを校正し、その弱点を探り、競争を通じて実験設計を改善し、堅牢性をモデル化する自動メタモデリングゲームを導入する。
- 参考スコア(独自算出の注目度): 6.113400683524824
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The evaluation of constitutive models, especially for high-risk and
high-regret engineering applications, requires efficient and rigorous
third-party calibration, validation and falsification. While there are numerous
efforts to develop paradigms and standard procedures to validate models,
difficulties may arise due to the sequential, manual and often biased nature of
the commonly adopted calibration and validation processes, thus slowing down
data collections, hampering the progress towards discovering new physics,
increasing expenses and possibly leading to misinterpretations of the
credibility and application ranges of proposed models. This work attempts to
introduce concepts from game theory and machine learning techniques to overcome
many of these existing difficulties. We introduce an automated meta-modeling
game where two competing AI agents systematically generate experimental data to
calibrate a given constitutive model and to explore its weakness, in order to
improve experiment design and model robustness through competition. The two
agents automatically search for the Nash equilibrium of the meta-modeling game
in an adversarial reinforcement learning framework without human intervention.
By capturing all possible design options of the laboratory experiments into a
single decision tree, we recast the design of experiments as a game of
combinatorial moves that can be resolved through deep reinforcement learning by
the two competing players. Our adversarial framework emulates idealized
scientific collaborations and competitions among researchers to achieve a
better understanding of the application range of the learned material laws and
prevent misinterpretations caused by conventional AI-based third-party
validation.
- Abstract(参考訳): 構成モデルの評価は、特に高リスクで高精細な工学的応用のためには、効率的で厳格なサードパーティのキャリブレーション、検証、改ざんを必要とする。
モデルを検証するためのパラダイムや標準手順を開発する努力は数多くあるが、一般的に採用されているキャリブレーションと検証プロセスの逐次的、手動的、しばしばバイアスのかかる性質のために困難が生じ、データ収集が遅くなり、新しい物理の発見への進歩が妨げられ、費用が増加し、提案されたモデルの信頼性と適用範囲の誤解釈につながる可能性がある。
本研究は,ゲーム理論と機械学習技術の概念を導入し,これらの課題の多くを克服しようとするものである。
そこで,2つのaiエージェントが実験データを体系的に生成し,与えられた構成モデルを校正し,その弱点を探求し,競争による実験設計とモデルロバスト性を改善する自動メタモデリングゲームを提案する。
この2つのエージェントは、人間の介入なしに対向的な強化学習フレームワークにおいてメタモデリングゲームのナッシュ平衡を自動的に探索する。
実験の可能な全ての設計オプションを1つの決定木にキャプチャすることで、実験の設計を2人の競技者による深層強化学習を通じて解決できる組合せ運動のゲームとして再キャストする。
我々の逆境フレームワークは、研究者間の理想的な科学的コラボレーションと競争をエミュレートし、学習資料法の適用範囲をよりよく理解し、従来のAIベースの第三者検証による誤解釈を防止する。
関連論文リスト
- Learning Low-Dimensional Strain Models of Soft Robots by Looking at the Evolution of Their Shape with Application to Model-Based Control [2.058941610795796]
本稿では,低次元物理モデル学習のための合理化手法を提案する。
各種平面ソフトマニピュレータを用いたシミュレーションにより,本手法の有効性を検証した。
物理的に互換性のあるモデルを生成する方法のおかげで、学習したモデルはモデルベースの制御ポリシーと簡単に組み合わせることができる。
論文 参考訳(メタデータ) (2024-10-31T18:37:22Z) - Explainable data-driven modeling via mixture of experts: towards
effective blending of grey and black-box models [6.331947318187792]
専門家の混成」の理論的根拠に基づく包括的枠組みを提案する。
このアプローチは、多様なローカルモデルのデータベースの融合を可能にする。
我々は,解釈可能性を高めるために,専門家の組み合わせの急激な変化を罰する。
論文 参考訳(メタデータ) (2024-01-30T15:53:07Z) - Two-Stage Surrogate Modeling for Data-Driven Design Optimization with
Application to Composite Microstructure Generation [1.912429179274357]
本稿では,科学・工学分野における逆問題に対処する2段階の機械学習に基づく代理モデリングフレームワークを提案する。
最初の段階では、"Learner"と呼ばれる機械学習モデルは、予測出力が望ましい結果と密接に一致している入力デザイン空間内の候補の限られたセットを特定する。
第2段では、第1段で生成された縮小候補空間を評価するために、「評価器」として機能する別の代理モデルを用いる。
論文 参考訳(メタデータ) (2024-01-04T00:25:12Z) - Leveraging World Model Disentanglement in Value-Based Multi-Agent
Reinforcement Learning [18.651307543537655]
本稿では,Distangled World Modelを用いた新しいモデルベースマルチエージェント強化学習手法であるValue Decomposition Frameworkを提案する。
本研究では,本手法が高サンプリング効率を実現し,敵軍を撃破する性能が他のベースラインよりも優れていることを示すために,簡単な,ハード,スーパーハードのStarCraft IIマイクロマネジメントの課題について実験的に検討した。
論文 参考訳(メタデータ) (2023-09-08T22:12:43Z) - Mimicking To Dominate: Imitation Learning Strategies for Success in
Multiagent Competitive Games [13.060023718506917]
我々は、対戦者の次の動きを予測するための新しいマルチエージェント模倣学習モデルを開発する。
また、模倣学習モデルとポリシートレーニングを組み合わせた、新しいマルチエージェント強化学習アルゴリズムを1つのトレーニングプロセスに導入する。
実験結果から,本手法は既存のマルチエージェントRLアルゴリズムと比較して性能が優れていることがわかった。
論文 参考訳(メタデータ) (2023-08-20T07:30:13Z) - Exploring the Trade-off between Plausibility, Change Intensity and
Adversarial Power in Counterfactual Explanations using Multi-objective
Optimization [73.89239820192894]
自動対物生成は、生成した対物インスタンスのいくつかの側面を考慮すべきである。
本稿では, 対実例生成のための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2022-05-20T15:02:53Z) - Exploration and Exploitation: Two Ways to Improve Chinese Spelling
Correction Models [51.744357472072416]
本稿では,モデルの弱点を継続的に識別し,より価値の高いトレーニングインスタンスを生成する手法を提案する。
実験結果から, 事前学習戦略と組み合わさって, 複数のCSCモデルの一般化とロバスト性を改善することができることがわかった。
論文 参考訳(メタデータ) (2021-05-31T09:17:33Z) - Congestion-aware Multi-agent Trajectory Prediction for Collision
Avoidance [110.63037190641414]
渋滞パターンを明示的に学習し、新しい「センス--学習--Reason--予測」フレームワークを考案する。
学習段階を2段階に分解することで、「学生」は「教師」から文脈的手がかりを学習し、衝突のない軌跡を生成する。
実験では,提案モデルが合成データセットにおいて衝突のない軌道予測を生成できることを実証する。
論文 参考訳(メタデータ) (2021-03-26T02:42:33Z) - Adversarial Training is Not Ready for Robot Learning [55.493354071227174]
対人訓練は,ノルム有界摂動に耐性のあるディープラーニングモデルを訓練する有効な方法である。
敵訓練により得られたニューラルコントローラが3種類の欠陥を受けることを理論的および実験的に示す。
この結果から, ロボット学習にはまだ対応できていないことが示唆された。
論文 参考訳(メタデータ) (2021-03-15T07:51:31Z) - Automated and Formal Synthesis of Neural Barrier Certificates for
Dynamical Models [70.70479436076238]
バリア証明書(BC)の自動的,形式的,反例に基づく合成手法を提案する。
このアプローチは、ニューラルネットワークとして構造化されたBCの候補を操作する誘導的フレームワークと、その候補の有効性を認証するか、反例を生成する音検証器によって支えられている。
その結果,音のBCsを最大2桁の速度で合成できることがわかった。
論文 参考訳(メタデータ) (2020-07-07T07:39:42Z) - Hybrid modeling: Applications in real-time diagnosis [64.5040763067757]
我々は、機械学習にインスパイアされたモデルと物理モデルを組み合わせた、新しいハイブリッドモデリングアプローチの概要を述べる。
このようなモデルをリアルタイム診断に利用しています。
論文 参考訳(メタデータ) (2020-03-04T00:44:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。