論文の概要: Nano Bio-Agents (NBA): Small Language Model Agents for Genomics
- arxiv url: http://arxiv.org/abs/2509.19566v1
- Date: Tue, 23 Sep 2025 20:44:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-25 20:53:19.601925
- Title: Nano Bio-Agents (NBA): Small Language Model Agents for Genomics
- Title(参考訳): ナノバイオエージェント(NBA):小言語モデルエージェント
- Authors: George Hong, Daniel Trejo Banos,
- Abstract要約: エージェント・フレームワークを用いたゲノム質問応答における小言語モデル(100億のパラメータ)の適用について検討する。
以上の結果から,SLMとこのようなエージェントフレームワークを組み合わせることで,同等かつ多くの場合,優れた性能が得られることが示唆された。
これは、効率向上、コスト削減、MLベースのゲノムツールの民主化の有望な可能性を示している。
- 参考スコア(独自算出の注目度): 0.1790445868185437
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We investigate the application of Small Language Models (<10 billion parameters) for genomics question answering via agentic framework to address hallucination issues and computational cost challenges. The Nano Bio-Agent (NBA) framework we implemented incorporates task decomposition, tool orchestration, and API access into well-established systems such as NCBI and AlphaGenome. Results show that SLMs combined with such agentic framework can achieve comparable and in many cases superior performance versus existing approaches utilising larger models, with our best model-agent combination achieving 98% accuracy on the GeneTuring benchmark. Notably, small 3-10B parameter models consistently achieve 85-97% accuracy while requiring much lower computational resources than conventional approaches. This demonstrates promising potential for efficiency gains, cost savings, and democratization of ML-powered genomics tools while retaining highly robust and accurate performance.
- Abstract(参考訳): 幻覚問題や計算コスト問題に対処するために,エージェント・フレームワークによる質問応答に対する小言語モデル(100億個のパラメータ)の適用について検討する。
私たちが実装したNano Bio-Agent(NBA)フレームワークは、NCBIやAlphaGenomeといった確立したシステムにタスク分解、ツールオーケストレーション、APIアクセスを組み込んでいる。
その結果,このようなエージェントフレームワークと組み合わせたSLMは,大規模モデルを用いた既存手法に比べて優れた性能を達成でき,GeneTuringベンチマークでは98%の精度で最高のモデルとエージェントの組み合わせを実現していることがわかった。
特に、小さな310Bパラメータモデルは、従来の手法よりもはるかに低い計算資源を必要とする一方で、85-97%の精度を一貫して達成している。
これは、非常に堅牢で正確なパフォーマンスを維持しながら、効率向上、コスト削減、ML駆動のゲノムツールの民主化の有望な可能性を示している。
関連論文リスト
- Low-Resource Fine-Tuning for Multi-Task Structured Information Extraction with a Billion-Parameter Instruction-Tuned Model [0.0]
金融コンプライアンス報告のようなドメインで構造化データ抽出のための大きな言語モデル(LLM)をデプロイすることは、大規模なアーキテクチャを実行するコストが高いことと、大規模で高品質なデータセットを作成するのが難しいため、小規模チームにとって現実的ではないことが多い。
本研究は,タスク毎のサンプル数,知識グラフ抽出,名前付きエンティティ認識に対して,低ランク適応を施した10億パラメータLLaMAモデルを提案する。
これらの結果は、十分に調整された小型モデルが、計算コストのごく一部で安定かつ正確な構造化された出力を提供できることを示し、資源中のコスト効率と信頼性の高い情報抽出パイプラインを可能にする。
論文 参考訳(メタデータ) (2025-09-10T08:19:07Z) - Automatic Differentiation of Agent-Based Models [3.0989255691168487]
エージェントベースモデル(ABM)は、個々のエージェントのボトムアップ相互作用をキャプチャすることで複雑なシステムをシミュレートする。
疫病や金融市場のような複雑なシステムの多くは、数千から数百万のエージェントを巻き込んでいる。
自動微分(AD)技術は,これらの計算負担を効果的に軽減できることを示す。
論文 参考訳(メタデータ) (2025-09-03T13:28:33Z) - Uncertainty-Aware Collaborative System of Large and Small Models for Multimodal Sentiment Analysis [17.98292973608615]
マルチモーダル感情分析のための強力なMLLMと軽量なベースラインモデルを編成する新しい不確実性認識協調システム(U-ACS)を提案する。
提案手法は,スタンドアロンのMLLMに比べて計算資源のごく一部しか必要とせず,最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-08-27T16:01:58Z) - OmniEAR: Benchmarking Agent Reasoning in Embodied Tasks [52.87238755666243]
OmniEARは,言語モデルが身体的相互作用やツールの使用,マルチエージェントの協調にどう影響するかを評価するためのフレームワークである。
我々は、家庭と工業領域にまたがる1500のシナリオにおける連続的な物理的特性と複雑な空間的関係をモデル化する。
我々の体系的な評価は、モデルが制約から推論しなければならない場合、厳しい性能劣化を示す。
論文 参考訳(メタデータ) (2025-08-07T17:54:15Z) - DrugPilot: LLM-based Parameterized Reasoning Agent for Drug Discovery [54.79763887844838]
大規模言語モデル(LLM)と自律エージェントの統合は、自動推論とタスク実行を通じて科学的発見を促進する大きな可能性を秘めている。
本稿では,薬物発見におけるエンドツーエンド科学のために設計されたパラメータ化推論アーキテクチャを備えたLSMベースのエージェントシステムであるDrarmPilotを紹介する。
DrugPilot は ReAct や LoT のような最先端のエージェントよりも優れており、タスク完了率は98.0%、93.5%、64.0%である。
論文 参考訳(メタデータ) (2025-05-20T05:18:15Z) - NbBench: Benchmarking Language Models for Comprehensive Nanobody Tasks [6.485214172837228]
我々は,ナノボディ表現学習のための最初の総合ベンチマークスイートであるNbBenchを紹介する。
NbBenchは構造アノテーション、バインディング予測、開発可能性評価を含む。
解析の結果,抗体言語モデルでは抗原関連タスクが優れており,熱安定性や親和性などの回帰タスクのパフォーマンスは依然として困難であることが判明した。
論文 参考訳(メタデータ) (2025-05-04T08:18:10Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。