論文の概要: Closed-Form Test Functions for Biophysical Sequence Optimization Algorithms
- arxiv url: http://arxiv.org/abs/2407.00236v1
- Date: Fri, 28 Jun 2024 21:13:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 05:50:47.947929
- Title: Closed-Form Test Functions for Biophysical Sequence Optimization Algorithms
- Title(参考訳): 生物物理系列最適化アルゴリズムのためのクローズドフォーム試験関数
- Authors: Samuel Stanton, Robert Alberstein, Nathan Frey, Andrew Watkins, Kyunghyun Cho,
- Abstract要約: 生物物理シーケンス最適化のための新しい閉形式テスト関数のクラスを提案し、このクラスをEhrlich関数と呼ぶ。
これらの機能は研究の興味深い対象であり、標準的な遺伝的最適化ベースラインで解決するのは簡単ではないことを示す実証的な結果を提供する。
- 参考スコア(独自算出の注目度): 35.95872277958525
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: There is a growing body of work seeking to replicate the success of machine learning (ML) on domains like computer vision (CV) and natural language processing (NLP) to applications involving biophysical data. One of the key ingredients of prior successes in CV and NLP was the broad acceptance of difficult benchmarks that distilled key subproblems into approachable tasks that any junior researcher could investigate, but good benchmarks for biophysical domains are rare. This scarcity is partially due to a narrow focus on benchmarks which simulate biophysical data; we propose instead to carefully abstract biophysical problems into simpler ones with key geometric similarities. In particular we propose a new class of closed-form test functions for biophysical sequence optimization, which we call Ehrlich functions. We provide empirical results demonstrating these functions are interesting objects of study and can be non-trivial to solve with a standard genetic optimization baseline.
- Abstract(参考訳): コンピュータビジョン(CV)や自然言語処理(NLP)といった分野における機械学習(ML)の成功を、生物物理学データを含むアプリケーションに再現しようとする動きが増えている。
CVとNLPの先行的な成功の鍵となる要素の1つは、重要なサブプロブレムを、どの研究員が調査できるような接近可能なタスクに蒸留する難しいベンチマークが広く受け入れられたことであるが、生物物理学領域の優れたベンチマークはまれである。
この不足の一部は、生物物理学データをシミュレートするベンチマークに焦点を絞ることによるものであり、代わりに、生物物理学的な問題を、重要な幾何学的類似点を持つより単純なものに慎重に抽象化することを提案する。
特に、生物物理シーケンス最適化のための新しい閉形式テスト関数のクラスを提案し、これはEhrlich関数と呼ばれる。
これらの機能は研究の興味深い対象であり、標準的な遺伝的最適化ベースラインで解決するのは簡単ではないことを示す実証的な結果を提供する。
関連論文リスト
- NeuroSym-BioCAT: Leveraging Neuro-Symbolic Methods for Biomedical Scholarly Document Categorization and Question Answering [0.14999444543328289]
本稿では,最適化されたトピックモデリングフレームワークであるOVB-LDAとBI-POP CMA-ES最適化技術を統合し,学術文書の抽象分類を強化した新しい手法を提案する。
我々は、ドメイン固有データに基づいて微調整された蒸留MiniLMモデルを用いて、高精度な回答抽出を行う。
論文 参考訳(メタデータ) (2024-10-29T14:45:12Z) - Boolean matrix logic programming for active learning of gene functions in genome-scale metabolic network models [4.762323642506732]
我々は、細胞工学の促進と生物学的発見を促進するために、論理ベースの機械学習技術を適用しようとしている。
我々は,情報的実験を導くことでゲノム仮説空間を効率的に探索する新しいシステム,BMLP_active$を導入する。
$BMLP_active$は、ランダムな実験よりもトレーニング例が少ない遺伝子ペア間の相互作用をうまく学べる。
論文 参考訳(メタデータ) (2024-05-10T09:51:06Z) - Hyperdimensional computing: a fast, robust and interpretable paradigm
for biological data [9.094234519404907]
多様な生物学的データソースを処理するための新しいアルゴリズムは、バイオインフォマティクスに革命をもたらした。
深層学習は、バイオインフォマティクス、アドレス配列、構造、機能解析を大きく変えてきた。
超次元コンピューティングは興味深い代替手段として登場した。
論文 参考訳(メタデータ) (2024-02-27T15:09:20Z) - An Evaluation of Large Language Models in Bioinformatics Research [52.100233156012756]
本研究では,大規模言語モデル(LLM)の性能について,バイオインフォマティクスの幅広い課題について検討する。
これらのタスクには、潜在的なコーディング領域の同定、遺伝子とタンパク質の命名されたエンティティの抽出、抗微生物および抗がんペプチドの検出、分子最適化、教育生物情報学問題の解決が含まれる。
以上の結果から, GPT 変種のような LLM がこれらのタスクの多くをうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2024-02-21T11:27:31Z) - Progress and Opportunities of Foundation Models in Bioinformatics [77.74411726471439]
基礎モデル(FM)は、特に深層学習の領域において、計算生物学の新しい時代に定着した。
我々の焦点は、特定の生物学的問題にFMを応用することであり、研究ニーズに適切なFMを選択するために研究コミュニティを指導することを目的としています。
データノイズ、モデル説明可能性、潜在的なバイアスなど、生物学においてFMが直面する課題と限界を分析します。
論文 参考訳(メタデータ) (2024-02-06T02:29:17Z) - ProBio: A Protocol-guided Multimodal Dataset for Molecular Biology Lab [67.24684071577211]
研究結果を複製するという課題は、分子生物学の分野に重大な障害をもたらしている。
まず、この目的に向けた最初のステップとして、ProBioという名前の包括的なマルチモーダルデータセットをキュレートする。
次に、透明なソリューショントラッキングとマルチモーダルなアクション認識という2つの挑戦的なベンチマークを考案し、BioLab設定におけるアクティビティ理解に関連する特徴と難しさを強調した。
論文 参考訳(メタデータ) (2023-11-01T14:44:01Z) - Deep Learning Methods for Protein Family Classification on PDB
Sequencing Data [0.0]
本稿では,新たな双方向LSTMや畳み込みモデルなどのディープラーニングフレームワークの性能を,広く利用可能なシークエンシングデータ上で実証し比較する。
我々のディープラーニングモデルは従来の機械学習手法よりも優れた性能を示し、畳み込みアーキテクチャは最も印象的な推論性能を提供する。
論文 参考訳(メタデータ) (2022-07-14T06:11:32Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。