論文の概要: On learning functions over biological sequence space: relating Gaussian process priors, regularization, and gauge fixing
- arxiv url: http://arxiv.org/abs/2504.19034v1
- Date: Sat, 26 Apr 2025 22:00:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.099951
- Title: On learning functions over biological sequence space: relating Gaussian process priors, regularization, and gauge fixing
- Title(参考訳): 生物列空間上の学習関数について--ガウス過程の先行、正規化、ゲージ固定に関連する
- Authors: Samantha Petti, Carlos Martí-Gómez, Justin B. Kinney, Juannan Zhou, David M. McCandlish,
- Abstract要約: 我々は、予測シーケンス・トゥ・ファンクション・マップの推測や、シーケンス・ファンクション・マップの分解といった関連するタスクに興味を持っている。
各列関数写像は、列列上の重み付け和として複数の方法で書くことができるので、これらの重みを有意に解釈するには「ゲージ固定」が必要である。
任意の明示的なガウス過程の先行値に対応する正則化器を多種多様なゲージと組み合わせて構築する方法を示す。
- 参考スコア(独自算出の注目度): 1.4349310453651394
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Mappings from biological sequences (DNA, RNA, protein) to quantitative measures of sequence functionality play an important role in contemporary biology. We are interested in the related tasks of (i) inferring predictive sequence-to-function maps and (ii) decomposing sequence-function maps to elucidate the contributions of individual subsequences. Because each sequence-function map can be written as a weighted sum over subsequences in multiple ways, meaningfully interpreting these weights requires "gauge-fixing," i.e., defining a unique representation for each map. Recent work has established that most existing gauge-fixed representations arise as the unique solutions to $L_2$-regularized regression in an overparameterized "weight space" where the choice of regularizer defines the gauge. Here, we establish the relationship between regularized regression in overparameterized weight space and Gaussian process approaches that operate in "function space," i.e. the space of all real-valued functions on a finite set of sequences. We disentangle how weight space regularizers both impose an implicit prior on the learned function and restrict the optimal weights to a particular gauge. We also show how to construct regularizers that correspond to arbitrary explicit Gaussian process priors combined with a wide variety of gauges. Next, we derive the distribution of gauge-fixed weights implied by the Gaussian process posterior and demonstrate that even for long sequences this distribution can be efficiently computed for product-kernel priors using a kernel trick. Finally, we characterize the implicit function space priors associated with the most common weight space regularizers. Overall, our framework unifies and extends our ability to infer and interpret sequence-function relationships.
- Abstract(参考訳): 生物学的配列(DNA、RNA、タンパク質)から配列機能の定量的測定へのマッピングは、現代生物学において重要な役割を担っている。
私たちは関連する仕事に興味があります
(i)予測シーケンス・トゥ・ファンクションマップの推測
(II)個々の部分列の寄与を解明するためにシーケンス関数写像を分解する。
各列函数写像は、複数の方法で部分列上の重み付き和として記述できるので、これらの重みを有意に解釈するには「ゲージ固定」、すなわち各写像に固有の表現を定義する必要がある。
最近の研究は、ほとんどの既存のゲージ固定表現は、正規化器の選択がゲージを定義する過パラメータ化された「重み空間」における$L_2$正規化回帰のユニークな解として生じることを証明している。
ここでは、過パラメータ化重み空間における正規化回帰と「函数空間」で作用するガウス過程アプローチ、すなわち有限列上のすべての実数値函数の空間との関係を確立する。
重み空間正規化器が学習関数に暗黙の先行を課す方法と、最適な重みを特定のゲージに制限する方法を両立させる。
また、任意の明示的なガウス過程と様々なゲージを組み合わせた正規化器を構築する方法を示す。
次に、ガウス過程の後部から導かれるゲージ固定重みの分布を導出し、長い列であっても、カーネルトリックを用いて製品カーネルの事前の分布を効率的に計算できることを実証する。
最後に、最も一般的な重み空間正規化器に付随する暗黙関数空間を特徴付ける。
全体として、我々のフレームワークは、シーケンス関数の関係を推論し、解釈する能力を統一し、拡張します。
関連論文リスト
- Associative Knowledge Graphs for Efficient Sequence Storage and Retrieval [3.355436702348694]
シーケンスの保存と認識に非常に効果的な連想的知識グラフを作成します。
個々のオブジェクト(ノードとして表現される)は、複数のシーケンスの一部あるいは単一のシーケンス内で繰り返し現れる。
このアプローチは、金融取引における異常検出や過去の行動に基づくユーザの振る舞いの予測など、さまざまな分野への応用の可能性を持っている。
論文 参考訳(メタデータ) (2024-11-19T13:00:31Z) - Random ReLU Neural Networks as Non-Gaussian Processes [20.607307985674428]
線形単位活性化関数が整列されたランダムニューラルネットワークは、ガウス過程を適切に定義していないことを示す。
副産物として、これらのネットワークは、衝動ホワイトノイズによって駆動される微分方程式の解であることを示す。
論文 参考訳(メタデータ) (2024-05-16T16:28:11Z) - A Robbins--Monro Sequence That Can Exploit Prior Information For Faster
Convergence [10.172984565625294]
先行情報であるRobins-Monro列は、幅広い先行分布に対して収束していることを示す。
我々は、その性能とパラメータの影響を理解するために、そのシーケンスを数値解析する。
論文 参考訳(メタデータ) (2024-01-06T12:42:58Z) - DBA: Efficient Transformer with Dynamic Bilinear Low-Rank Attention [53.02648818164273]
動的双線形低ランク注意(DBA)という,効率的かつ効果的な注意機構を提案する。
DBAは入力感度の動的射影行列によってシーケンス長を圧縮し、線形時間と空間の複雑さを実現する。
様々なシーケンス長条件のタスクに対する実験は、DBAが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2022-11-24T03:06:36Z) - Isotropic Gaussian Processes on Finite Spaces of Graphs [71.26737403006778]
種々の非重み付きグラフの集合上でガウス過程の先行を定義するための原理的手法を提案する。
さらに、未重み付きグラフの同値類の集合を検討し、それに対する事前の適切なバージョンを定義する。
化学の応用に触発されて、我々は、小データ構造における実際の分子特性予測タスクについて、提案手法を解説した。
論文 参考訳(メタデータ) (2022-11-03T10:18:17Z) - Riemannian optimization of photonic quantum circuits in phase and Fock space [4.601534909359792]
本稿では,ガウスオブジェクトからなる汎用フォトニック量子回路の設計と最適化を行うフレームワークを提案する。
また、我々のフレームワークをガウス的でない対象に拡張可能とし、ガウス的オブジェクトの線型結合として記述することができる。
論文 参考訳(メタデータ) (2022-09-13T15:23:55Z) - Generalized Variational Inference in Function Spaces: Gaussian Measures
meet Bayesian Deep Learning [9.106412307976067]
無限次元関数空間における一般化変分推論の枠組みを開発する。
我々はこれをガウス・ワッサーシュタイン推論(GWI)と呼ばれる方法を構築するために利用する。
GWIのエキサイティングな応用は、GWIの変分パラメトリションにおいてディープニューラルネットワークを使用する能力である。
論文 参考訳(メタデータ) (2022-05-12T20:10:31Z) - Better Regularization for Sequential Decision Spaces: Fast Convergence
Rates for Nash, Correlated, and Team Equilibria [121.36609493711292]
大規模2プレーヤワイドフォームゲームの計算平衡問題に対する反復的な一階法の適用について検討する。
正則化器を用いて一階法をインスタンス化することにより、相関平衡と元アンティー座標のチーム平衡を計算するための最初の加速一階法を開発する。
論文 参考訳(メタデータ) (2021-05-27T06:10:24Z) - Tensor Representations for Action Recognition [54.710267354274194]
シーケンスにおける人間の行動は、空間的特徴とその時間的ダイナミクスの複雑な相互作用によって特徴づけられる。
アクション認識タスクの視覚的特徴間の高次関係を捉えるための新しいテンソル表現を提案する。
我々は,高次テンソルといわゆる固有値パワー正規化(NEP)を用いて,高次事象のスペクトル検出を行う。
論文 参考訳(メタデータ) (2020-12-28T17:27:18Z) - Dimension-robust Function Space MCMC With Neural Network Priors [0.0]
本稿では、関数の領域の次元においてより有利にスケールする関数空間に関する新しい先例を紹介する。
その結果得られた未知関数の後方は、ヒルベルト空間マルコフ連鎖モンテカルロ法を用いてサンプリングできることがわかった。
我々の優先順位は競争的であり、他の関数空間よりも異なる利点があることを示している。
論文 参考訳(メタデータ) (2020-12-20T14:52:57Z) - Graph Gamma Process Generalized Linear Dynamical Systems [60.467040479276704]
実マルチ変数時系列をモデル化するために,グラフガンマ過程(GGP)線形力学系を導入する。
時間的パターン発見のために、モデルの下での潜在表現は、時系列を多変量部分列の同相集合に分解するために使用される。
非零次ノード数が有限であるランダムグラフを用いて、潜時状態遷移行列の空間パターンと次元の両方を定義する。
論文 参考訳(メタデータ) (2020-07-25T04:16:34Z) - Supervised Learning for Non-Sequential Data: A Canonical Polyadic
Decomposition Approach [85.12934750565971]
特徴相互作用の効率的なモデリングは、非順序的タスクに対する教師あり学習の基盤となる。
この問題を緩和するため、モデルパラメータをテンソルとして暗黙的に表現することが提案されている。
表現性を向上するため,任意の高次元特徴ベクトルに特徴写像を適用できるようにフレームワークを一般化する。
論文 参考訳(メタデータ) (2020-01-27T22:38:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。