論文の概要: OmniGenBench: Automating Large-scale in-silico Benchmarking for Genomic Foundation Models
- arxiv url: http://arxiv.org/abs/2410.01784v1
- Date: Wed, 2 Oct 2024 17:40:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-04 15:14:33.736262
- Title: OmniGenBench: Automating Large-scale in-silico Benchmarking for Genomic Foundation Models
- Title(参考訳): OmniGenBench:ゲノムファンデーションモデルのための大規模インシリコベンチマークの自動化
- Authors: Heng Yang, Jack Cole, Ke Li,
- Abstract要約: ゲノミクス基盤モデル(GFM)ベンチマーク専用のフレームワークであるGFMBenchを紹介する。
4つの大規模ベンチマークから数百のゲノムタスクに数百万のゲノム配列を統合する。
GFMBenchは、ユーザフレンドリーなインターフェースと多様なチュートリアルを提供するオープンソースソフトウェアとしてリリースされた。
- 参考スコア(独自算出の注目度): 6.781852451887055
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The advancements in artificial intelligence in recent years, such as Large Language Models (LLMs), have fueled expectations for breakthroughs in genomic foundation models (GFMs). The code of nature, hidden in diverse genomes since the very beginning of life's evolution, holds immense potential for impacting humans and ecosystems through genome modeling. Recent breakthroughs in GFMs, such as Evo, have attracted significant investment and attention to genomic modeling, as they address long-standing challenges and transform in-silico genomic studies into automated, reliable, and efficient paradigms. In the context of this flourishing era of consecutive technological revolutions in genomics, GFM studies face two major challenges: the lack of GFM benchmarking tools and the absence of open-source software for diverse genomics. These challenges hinder the rapid evolution of GFMs and their wide application in tasks such as understanding and synthesizing genomes, problems that have persisted for decades. To address these challenges, we introduce GFMBench, a framework dedicated to GFM-oriented benchmarking. GFMBench standardizes benchmark suites and automates benchmarking for a wide range of open-source GFMs. It integrates millions of genomic sequences across hundreds of genomic tasks from four large-scale benchmarks, democratizing GFMs for a wide range of in-silico genomic applications. Additionally, GFMBench is released as open-source software, offering user-friendly interfaces and diverse tutorials, applicable for AutoBench and complex tasks like RNA design and structure prediction. To facilitate further advancements in genome modeling, we have launched a public leaderboard showcasing the benchmark performance derived from AutoBench. GFMBench represents a step toward standardizing GFM benchmarking and democratizing GFM applications.
- Abstract(参考訳): 近年のLarge Language Models (LLMs)のような人工知能の進歩は、ゲノム基盤モデル(GFMs)のブレークスルーへの期待を加速させた。
生命の進化の始まりから多様なゲノムに隠された自然のコードは、ゲノムモデリングを通じて人間や生態系に影響を与える大きな可能性を秘めている。
Evoのような近年のGFMのブレークスルーは、長年の課題に対処し、サイリコのゲノム研究を自動化され、信頼性があり、効率的なパラダイムに転換するなど、ゲノムモデリングに多大な投資と関心を集めている。
ゲノミクスにおける連続的な技術革新の時代において、GFM研究は、GFMベンチマークツールの欠如と多様なゲノミクスのためのオープンソースソフトウェアがないという2つの大きな課題に直面している。
これらの課題は、GFMの急速な進化を妨げ、ゲノムの理解や合成といったタスクに広く応用され、何十年も続いている。
これらの課題に対処するために, GFM 指向のベンチマーク専用フレームワーク GFMBench を紹介する。
GFMBenchはベンチマークスイートを標準化し、幅広いオープンソースGFMのベンチマークを自動化する。
4つの大規模なベンチマークから数百のゲノミクスタスクに数百万のゲノム配列を統合し、広範囲のサイリコゲノム応用のためにGFMを民主化する。
さらに、GFMBenchはオープンソースソフトウェアとしてリリースされ、AutoBenchに適用可能なユーザフレンドリーなインターフェースと多様なチュートリアル、RNA設計や構造予測といった複雑なタスクを提供する。
ゲノムモデリングのさらなる進歩を促進するため、我々はAutoBenchのベンチマーク性能を示す公開リーダーボードを立ち上げた。
GFMBenchは、GFMベンチマークの標準化とGFMアプリケーションの民主化に向けたステップである。
関連論文リスト
- Lingma SWE-GPT: An Open Development-Process-Centric Language Model for Automated Software Improvement [62.94719119451089]
Lingma SWE-GPTシリーズは、現実世界のコード提出活動から学び、シミュレーションする。
Lingma SWE-GPT 72BはGitHubの30.20%の問題を解決する。
論文 参考訳(メタデータ) (2024-11-01T14:27:16Z) - dnaGrinder: a lightweight and high-capacity genomic foundation model [11.646351318648499]
現在のゲノム基盤モデルは、しばしば重要なトレードオフに直面している。
我々は、ユニークで効率的なゲノム基盤モデルであるdnaGrinderを紹介する。
dnaGrinderはゲノム配列内の長距離依存関係を管理するのに優れ、性能を損なうことなく計算コストを最小化できる。
論文 参考訳(メタデータ) (2024-09-24T03:20:07Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - Trackable Agent-based Evolution Models at Wafer Scale [0.0]
我々は,85万プロセッサCerebras Wafer Scale Engine(WSE)のエージェントベース進化から系統情報を抽出する問題に焦点をあてる。
We present a asynchronous island-based genetic algorithm (GA) framework for WSE hardware。
本研究は,これらの治験の系統的再構成を検証し,根底にある進化状態の推測に適合することを示す。
論文 参考訳(メタデータ) (2024-04-16T19:24:14Z) - Cancer-inspired Genomics Mapper Model for the Generation of Synthetic
DNA Sequences with Desired Genomics Signatures [0.0]
がんに触発されたゲノムマッパーモデル(CGMM)は、遺伝的アルゴリズム(GA)とディープラーニング(DL)の手法を組み合わせたものである。
我々はCGMMが、祖先や癌などの選択された表現型の合成ゲノムを生成できることを実証した。
論文 参考訳(メタデータ) (2023-05-01T07:16:40Z) - Generalized Visual Quality Assessment of GAN-Generated Face Images [79.47386781978531]
GAN生成顔画像(GFI)の汎用品質評価に向けた主観的・客観的品質の検討
我々は、利用可能なGANアルゴリズムと見えないGANアルゴリズムの両方から、GFIの正確な品質予測を可能にする品質評価モデルを開発する。
論文 参考訳(メタデータ) (2022-01-28T07:54:49Z) - Result Diversification by Multi-objective Evolutionary Algorithms with
Theoretical Guarantees [94.72461292387146]
両目的探索問題として結果の多様化問題を再構成し,多目的進化アルゴリズム(EA)を用いて解くことを提案する。
GSEMOが最適時間近似比1/2$を達成できることを理論的に証明する。
目的関数が動的に変化すると、GSEMOはこの近似比をランニングタイムで維持することができ、Borodinらによって提案されたオープンな問題に対処する。
論文 参考訳(メタデータ) (2021-10-18T14:00:22Z) - Cauchy-Schwarz Regularized Autoencoder [68.80569889599434]
変分オートエンコーダ(VAE)は、強力で広く使われている生成モデルのクラスである。
GMMに対して解析的に計算できるCauchy-Schwarz分散に基づく新しい制約対象を導入する。
本研究の目的は,密度推定,教師なしクラスタリング,半教師なし学習,顔分析における変分自動エンコーディングモデルの改善である。
論文 参考訳(メタデータ) (2021-01-06T17:36:26Z) - Benchmarking Graph Neural Networks [75.42159546060509]
グラフニューラルネットワーク(GNN)は、グラフ上のデータから分析および学習するための標準ツールキットとなっている。
成功している分野が主流で信頼性を持つようになるためには、進捗を定量化するためにベンチマークを開発する必要がある。
GitHubリポジトリは1,800のスターと339のフォークに到達し、提案されているオープンソースフレームワークの有用性を実証している。
論文 参考訳(メタデータ) (2020-03-02T15:58:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。