Fugu-MT 論文翻訳(概要): Statistical Inference of Minimally Complex Models

論文の概要: Statistical Inference of Minimally Complex Models

arxiv url: http://arxiv.org/abs/2008.00520v2
Date: Mon, 27 Sep 2021 22:32:38 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-03 19:55:34.100383
Title: Statistical Inference of Minimally Complex Models
Title（参考訳）: 最小複雑モデルの統計的推測
Authors: Cl\'elia de Mulatier, Paolo P. Mazza, Matteo Marsili
Abstract要約: 最小複素モデル (Minimally Complex Models, MCM) は任意の順序の相互作用を持つスピンモデルである。これらのモデルに限定されたベイズモデル選択は計算可能であることが示される。モデル複雑性に対して適合性をトレードオフするそれらの証拠は、パラメータフィッティングなしで容易に計算できる。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Finding the model that best describes a high dimensional dataset is a daunting task. For binary data, we show that this becomes feasible when restricting the search to a family of simple models, that we call Minimally Complex Models (MCMs). These are spin models, with interactions of arbitrary order, that are composed of independent components of minimal complexity (Beretta et al., 2018). They tend to be simple in information theoretic terms, which means that they are well-fitted to specific types of data, and are therefore easy to falsify. We show that Bayesian model selection restricted to these models is computationally feasible and has many other advantages. First, their evidence, which trades off goodness-of-fit against model complexity, can be computed easily without any parameter fitting. This allows selecting the best MCM among all, even though the number of models is astronomically large. Furthermore, MCMs can be inferred and sampled from without any computational effort. Finally, model selection among MCMs is invariant with respect to changes in the representation of the data. MCMs portray the structure of dependencies among variables in a simple way, as illustrated in several examples, and thus provide robust predictions on dependencies in the data. MCMs contain interactions of any order between variables, and thus may reveal the presence of interactions of order higher than pairwise.
Abstract（参考訳）: 高次元データセットを最もよく記述するモデルを見つけるのは大変な作業です。バイナリデータに対して、最小複素モデル (MCM) と呼ばれる単純なモデルの族への探索を制限することで、これが実現可能であることを示す。これらは任意の順序の相互作用を持つスピンモデルであり、最小複雑性の独立した成分からなる(Beretta et al., 2018)。情報理論の用語は単純であり、特定の種類のデータに適しており、したがって偽造が容易である。これらのモデルに制限されたベイズモデルの選択は計算可能であり、他の多くの利点があることを示す。第一に、モデルの複雑さに対して適合性をトレードオフするそれらの証拠は、パラメータの適合なしに容易に計算できる。これにより、モデル数が天文学的に大きいにもかかわらず、最も優れたmcmを選択することができる。さらに、MCMは計算の労力なしで推論およびサンプリングすることができる。最後に、MCM間のモデル選択は、データの表現の変化に関して不変である。 MCMは、いくつかの例に示すように、変数間の依存関係の構造を単純な方法で表現し、データの依存関係に関する堅牢な予測を提供する。 MCMは変数間の任意の順序の相互作用を含んでおり、従ってペアよりも高い順序の相互作用の存在を明らかにする。

関連論文リスト

AdaMMS: Model Merging for Heterogeneous Multimodal Large Language Models with Unsupervised Coefficient Optimization [86.8133939108057]
異種MLLMに適した新しいモデルマージ手法であるAdaMMSを提案する。提案手法は,マッピング,マージ,検索という3段階の課題に対処する。ラベル付きデータ無しで異種MLLMをマージできる最初のモデルマージ手法として、AdaMMSは様々なビジョンベンチマークで過去のモデルマージ手法より優れている。
論文参考訳（メタデータ） (2025-03-31T05:13:02Z)
Inferring High-Order Couplings with Neural Networks [3.55026004901472]
本稿では,制限ボルツマンマシンを一般化ポッツモデルにマッピングし,任意の順序の相互作用を抽出する手法を提案する。合成データセットに対する検証では,2体と3体の相互作用を正確に再現できることが確認された。タンパク質配列データに適用すると、このフレームワークはタンパク質接触マップを能動的に再構築し、最高の逆ポッツモデルに匹敵する性能を提供する。
論文参考訳（メタデータ） (2025-01-10T17:01:09Z)
Model aggregation: minimizing empirical variance outperforms minimizing empirical error [0.29008108937701327]
多様なモデルからの予測を単一のより正確な出力に集約する,データ駆動型フレームワークを提案する。モデルはブラックボックス関数として扱う、モデルに依存しない、最小限の仮定を必要とする、広範囲のモデルからの出力を組み合わせることができる。従来の解法と機械学習モデルをうまく統合して、堅牢性と精度の両方を改善する方法を示す。
論文参考訳（メタデータ） (2024-09-25T18:33:21Z)
EMR-Merging: Tuning-Free High-Performance Model Merging [55.03509900949149]
Elect, Mask & Rescale-Merging (EMR-Merging) は既存のマージ手法と比較して優れた性能を示した。 EMR-Mergingはチューニング不要なので、データアベイラビリティや追加のトレーニングは必要ありません。
論文参考訳（メタデータ） (2024-05-23T05:25:45Z)
Induced Model Matching: Restricted Models Help Train Full-Featured Models [1.4963011898406866]
フル機能の(大きな)モデルをトレーニングする際に、制限された機能を使用した非常に正確な(小さな)予測モデルが利用可能であるシナリオを検討する。制限されたモデルは、フルモデルにどのように役立つのか? 誘導モデルマッチング(IMM)と呼ばれる手法を導入する。 IMMは、大きなモデルのコンテキスト制限された、あるいは誘導されたバージョンと制限されたモデルとを一致させる。
論文参考訳（メタデータ） (2024-02-19T20:21:09Z)
Model-Based RL for Mean-Field Games is not Statistically Harder than Single-Agent RL [57.745700271150454]
モデルに基づく関数近似を用いた平均フィールドゲーム(MFG)における強化学習のサンプル複雑性について検討した。本稿では、モデルクラスの複雑性を特徴付けるためのより効果的な概念である部分モデルベースエルダー次元(P-MBED)を紹介する。
論文参考訳（メタデータ） (2024-02-08T14:54:47Z)
Representation Surgery for Multi-Task Model Merging [57.63643005215592]
マルチタスク学習(MTL)は、複数のタスクから情報を統一されたバックボーンに圧縮し、計算効率と一般化を改善する。最近の研究は、複数の独立して訓練されたモデルをマージして、共同トレーニングのために生データを収集する代わりにMLLを実行する。既存のモデルマージスキームの表現分布を可視化することにより、マージモデルはしばしば表現バイアスのジレンマに悩まされる。
論文参考訳（メタデータ） (2024-02-05T03:39:39Z)
Sample Complexity Characterization for Linear Contextual MDPs [67.79455646673762]
文脈決定プロセス(CMDP)は、遷移カーネルと報酬関数がコンテキスト変数によってインデックス付けされた異なるMDPで時間とともに変化できる強化学習のクラスを記述する。 CMDPは、時間とともに変化する環境で多くの現実世界のアプリケーションをモデル化するための重要なフレームワークとして機能する。 CMDPを2つの線形関数近似モデルで検討する: 文脈変化表現とすべての文脈に対する共通線形重み付きモデルIと、すべての文脈に対する共通表現と文脈変化線形重み付きモデルIIである。
論文参考訳（メタデータ） (2024-02-05T03:25:04Z)
Exact and general decoupled solutions of the LMC Multitask Gaussian Process model [28.32223907511862]
コリージョン化線形モデル(英: Linear Model of Co- Regionalization、LMC)は、回帰や分類のためのマルチタスクガウス過程の非常に一般的なモデルである。最近の研究によると、ある条件下では、モデルの潜在過程は切り離され、そのプロセスの数でのみ線形となる複雑さが生じる。ここでは、これらの結果を拡張し、LCCの効率的な正確な計算に必要な条件はノイズモデルに関する軽度の仮説である、という最も一般的な仮定から示している。
論文参考訳（メタデータ） (2023-10-18T15:16:24Z)
Bayesian Learning of Coupled Biogeochemical-Physical Models [28.269731698116257]
海洋生態系の予測モデルは、様々なニーズに使われている。希少な測定と海洋プロセスの理解が限られているため、かなりの不確実性がある。候補モデルの空間での処理と新しいモデルの発見を可能にするベイズモデル学習手法を開発した。
論文参考訳（メタデータ） (2022-11-12T17:49:18Z)
PAC Reinforcement Learning for Predictive State Representations [60.00237613646686]
部分的に観察可能な力学系におけるオンライン強化学習(RL)について検討する。我々は、他のよく知られたモデルをキャプチャする表現モデルである予測状態表現(PSR)モデルに焦点を当てる。我々は,サンプル複雑性のスケーリングにおいて,ほぼ最適なポリシを学習可能な,PSRのための新しいモデルベースアルゴリズムを開発した。
論文参考訳（メタデータ） (2022-07-12T17:57:17Z)
Low-Rank Constraints for Fast Inference in Structured Models [110.38427965904266]
この研究は、大規模構造化モデルの計算とメモリの複雑さを低減するための単純なアプローチを示す。言語モデリング,ポリフォニック・ミュージック・モデリング,教師なし文法帰納法,ビデオ・モデリングのためのニューラルパラメータ構造モデルを用いた実験により,我々の手法は大規模状態空間における標準モデルの精度と一致することを示した。
論文参考訳（メタデータ） (2022-01-08T00:47:50Z)
Revisiting minimum description length complexity in overparameterized models [38.21167656112762]
本稿では,線形モデルとカーネル手法に対するMDL-COMPの広範な理論的特性について述べる。カーネル法では,MDL-COMPがサンプル内誤差を最小化し,入力の次元が増加するにつれて減少することを示す。また、MDL-COMPがサンプル内平均二乗誤差(MSE)を束縛していることも証明する。
論文参考訳（メタデータ） (2020-06-17T22:45:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。