論文の概要: Biased Hypothesis Formation From Projection Pursuit
- arxiv url: http://arxiv.org/abs/2201.00889v1
- Date: Mon, 3 Jan 2022 22:02:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-05 22:23:27.043422
- Title: Biased Hypothesis Formation From Projection Pursuit
- Title(参考訳): 射影追跡によるバイアス付き仮説形成
- Authors: John Patterson, Chris Avery, Tyler Grear, Donald J. Jacobs
- Abstract要約: 仮説形成に対するバイアスの影響は、自動データ駆動追従ニューラルネットワークによって特徴づけられる。
このインテリジェント探索プロセスは、完全な状態空間を解離部分空間に分割し、作用仮説を作成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The effect of bias on hypothesis formation is characterized for an automated
data-driven projection pursuit neural network to extract and select features
for binary classification of data streams. This intelligent exploratory process
partitions a complete vector state space into disjoint subspaces to create
working hypotheses quantified by similarities and differences observed between
two groups of labeled data streams. Data streams are typically time sequenced,
and may exhibit complex spatio-temporal patterns. For example, given atomic
trajectories from molecular dynamics simulation, the machine's task is to
quantify dynamical mechanisms that promote function by comparing protein
mutants, some known to function while others are nonfunctional. Utilizing
synthetic two-dimensional molecules that mimic the dynamics of functional and
nonfunctional proteins, biases are identified and controlled in both the
machine learning model and selected training data under different contexts. The
refinement of a working hypothesis converges to a statistically robust
multivariate perception of the data based on a context-dependent perspective.
Including diverse perspectives during data exploration enhances
interpretability of the multivariate characterization of similarities and
differences.
- Abstract(参考訳): バイアスが仮説形成に及ぼす影響は、データストリームのバイナリ分類の特徴を抽出・選択する自動データ駆動投影追従ニューラルネットワークによって特徴づけられる。
このインテリジェント探索プロセスは、完全ベクトル状態空間を解離部分空間に分割し、ラベル付きデータストリームの2つのグループ間で観測された類似性と差によって定量化された作用仮説を生成する。
データストリームは通常、時系列化され、複雑な時空間パターンを示す。
例えば、分子動力学シミュレーションの原子軌道を考えると、この機械の任務はタンパク質変異体を比較することによって機能を促進する動的なメカニズムを定量化することである。
機能的および非機能的タンパク質のダイナミクスを模倣する合成2次元分子を用いて、機械学習モデルと異なるコンテキスト下で選択されたトレーニングデータの両方においてバイアスを特定し制御する。
作業仮説の精細化は、文脈依存的な視点に基づくデータの統計的にロバストな多変量知覚に収束する。
データ探索中の多様な視点を含めると、類似性と相違の多変量キャラクタリゼーションの解釈性が向上する。
関連論文リスト
- Range, not Independence, Drives Modularity in Biological Inspired Representation [52.48094670415497]
我々は、生物学的にインスピレーションを受けたネットワークが、ソース変数(ソース)の表現をモジュール化する理論を開発する。
我々は、最適な線形オートエンコーダのニューロンがモジュラー化するかどうかを決定するソースのサンプルに対して、必要かつ十分な条件を導出する。
我々の理論はどんなデータセットにも当てはまり、以前の研究で研究された統計的な独立性よりもはるかに長い。
論文 参考訳(メタデータ) (2024-10-08T17:41:37Z) - Detecting and Identifying Selection Structure in Sequential Data [53.24493902162797]
我々は,音楽のシーケンスなどの実践的な状況において,潜在目的に基づくデータポイントの選択的包摂が一般的である,と論じる。
選択構造はパラメトリックな仮定や介入実験なしで識別可能であることを示す。
また、他の種類の依存関係と同様に、選択構造を検知し、識別するための証明可能な正当性アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-29T20:56:34Z) - Data-Error Scaling in Machine Learning on Natural Discrete Combinatorial Mutation-prone Sets: Case Studies on Peptides and Small Molecules [0.0]
本研究では機械学習(ML)モデルにおけるデータエラースケーリングの傾向について検討する。
典型的なデータエラースケーリングとは対照的に,学習中に不連続な単調相転移がみられた。
学習曲線を正規化するための代替戦略とミュータントに基づくシャッフルの概念を提案する。
論文 参考訳(メタデータ) (2024-05-08T16:04:50Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Dynamical Regimes of Diffusion Models [14.797301819675454]
空間の次元とデータ数が大きい体制における生成拡散モデルについて検討する。
本研究は, 逆向き発生拡散過程における3つの異なる動的状態を明らかにするものである。
崩壊時間の次元とデータ数への依存性は、拡散モデルにおける次元の呪いの徹底的な評価を与える。
論文 参考訳(メタデータ) (2024-02-28T17:19:26Z) - Capturing dynamical correlations using implicit neural representations [85.66456606776552]
実験データから未知のパラメータを復元するために、モデルハミルトンのシミュレーションデータを模倣するために訓練されたニューラルネットワークと自動微分を組み合わせた人工知能フレームワークを開発する。
そこで本研究では, 実時間から多次元散乱データに適用可能な微分可能なモデルを1回だけ構築し, 訓練する能力について述べる。
論文 参考訳(メタデータ) (2023-04-08T07:55:36Z) - DIFFormer: Scalable (Graph) Transformers Induced by Energy Constrained
Diffusion [66.21290235237808]
本稿では,データセットからのインスタンスのバッチを進化状態にエンコードするエネルギー制約拡散モデルを提案する。
任意のインスタンス対間の対拡散強度に対する閉形式最適推定を示唆する厳密な理論を提供する。
各種タスクにおいて優れた性能を有する汎用エンコーダバックボーンとして,本モデルの適用性を示す実験を行った。
論文 参考訳(メタデータ) (2023-01-23T15:18:54Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - MoReL: Multi-omics Relational Learning [26.484803417186384]
ヘテロジニアスビューの分子間相互作用をコードする多部グラフを効率的に推定する新しいディープベイズ生成モデルを提案する。
このようなディープベイズ生成モデルにおける最適輸送正則化により、ビュー固有側情報を組み込むだけでなく、分布ベース正則化によるモデルの柔軟性も向上する。
論文 参考訳(メタデータ) (2022-03-15T02:50:07Z) - Multimodal Data Fusion in High-Dimensional Heterogeneous Datasets via
Generative Models [16.436293069942312]
我々は、教師なしの方法で高次元異種データから確率的生成モデルを学習することに興味がある。
本稿では,指数関数的な分布系を通じて異なるデータ型を結合する一般的なフレームワークを提案する。
提案アルゴリズムは、実数値(ガウス)とカテゴリー(マルチノミカル)の特徴を持つ、よく遭遇する異種データセットについて詳細に述べる。
論文 参考訳(メタデータ) (2021-08-27T18:10:31Z) - Model discovery in the sparse sampling regime [0.0]
深層学習が部分微分方程式のモデル発見をいかに改善できるかを示す。
その結果、ディープラーニングに基づくモデル発見は、基礎となる方程式を復元することができる。
我々は合成集合と実験集合の両方について主張する。
論文 参考訳(メタデータ) (2021-05-02T06:27:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。