論文の概要: Can AI-predicted complexes teach machine learning to compute drug binding affinity?
- arxiv url: http://arxiv.org/abs/2507.07882v1
- Date: Thu, 10 Jul 2025 16:05:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-11 16:40:15.481482
- Title: Can AI-predicted complexes teach machine learning to compute drug binding affinity?
- Title(参考訳): AI予測複合体は、薬物結合親和性を計算するために機械学習を教えることができるか?
- Authors: Wei-Tse Hsu, Savva Grevtsev, Thomas Douglas, Aniket Magarkar, Philip C. Biggin,
- Abstract要約: 機械学習に基づくスコアリング機能における合成データ拡張のための共フォールディングモデルの有効性を評価する。
以上の結果から,性能向上は拡張データの構造的品質に依存することが明らかとなった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We evaluate the feasibility of using co-folding models for synthetic data augmentation in training machine learning-based scoring functions (MLSFs) for binding affinity prediction. Our results show that performance gains depend critically on the structural quality of augmented data. In light of this, we established simple heuristics for identifying high-quality co-folding predictions without reference structures, enabling them to substitute for experimental structures in MLSF training. Our study informs future data augmentation strategies based on co-folding models.
- Abstract(参考訳): 機械学習に基づくアフィニティ予測のためのスコアリング機能(MLSF)の学習において、合成データ拡張のための共フォールディングモデルの有効性を評価する。
以上の結果から,性能向上は拡張データの構造的品質に大きく依存していることが示唆された。
そこで我々は,基準構造を使わずに高品質なコフォールディング予測を同定するための単純なヒューリスティックスを確立し,MLSFトレーニングにおいて実験構造に代えて適用できるようにした。
本研究では,コフォールディングモデルに基づく今後のデータ拡張戦略について報告する。
関連論文リスト
- Capacity Matters: a Proof-of-Concept for Transformer Memorization on Real-World Data [6.885357232728911]
本稿では,モデルアーキテクチャとデータ構成が生成変換器の実証記憶能力に与える影響について検討する。
これらのモデルは、SNOMED(Systematized Nomenclature of Medicine)から得られた合成テキストデータセットを用いて訓練される
論文 参考訳(メタデータ) (2025-06-17T16:42:54Z) - Enhancing Training Data Attribution with Representational Optimization [57.61977909113113]
トレーニングデータ属性法は、トレーニングデータがモデルの予測にどのように影響するかを測定することを目的としている。
本稿では,タスク固有表現とモデル整合表現をTDAで明示的に学習することで,このギャップを埋める表現ベースアプローチであるAirRepを提案する。
AirRepは、属性品質に合わせて調整されたトレーニング可能なエンコーダと、グループワイドの影響を正確に見積もるアテンションベースのプール機構の2つの重要なイノベーションを紹介している。
論文 参考訳(メタデータ) (2025-05-24T05:17:53Z) - CIKT: A Collaborative and Iterative Knowledge Tracing Framework with Large Language Models [14.273311275013057]
知識追跡は、学生の学習状態を時間とともにモデル化し、将来のパフォーマンスを予測することを目的としている。
従来のKTメソッドは、複雑な知識依存の説明可能性、スケーラビリティ、効果的なモデリングにおいてしばしば課題に直面します。
予測精度と説明可能性の両方を高めるために,大規模言語モデルを利用した協調反復的知識追跡(CIKT)を提案する。
論文 参考訳(メタデータ) (2025-05-23T10:16:16Z) - Multimodal Structure Preservation Learning [13.868320911807587]
データ表現を学習する新しい方法として,マルチモーダル構造保存学習(MSPL)を提案する。
合成時系列データ中の潜伏構造を解明し,全ゲノムシークエンシングおよび抗菌抵抗性データからクラスターを回収するためのMSPLの有効性を実証した。
論文 参考訳(メタデータ) (2024-10-29T20:21:40Z) - On Machine Learning Approaches for Protein-Ligand Binding Affinity Prediction [2.874893537471256]
本研究では,タンパク質-リガンド結合親和性予測における古典的木モデルと高度なニューラルネットワークの性能を評価する。
2次元モデルと3次元モデルを組み合わせることで、現在の最先端のアプローチを超えて、アクティブな学習結果が向上することを示す。
論文 参考訳(メタデータ) (2024-07-15T13:06:00Z) - Unveiling the Flaws: Exploring Imperfections in Synthetic Data and Mitigation Strategies for Large Language Models [89.88010750772413]
大規模言語モデル(LLM)の学習における高品質なデータ不足問題に対する解決法として,合成データを提案する。
我々の研究は、Q-A(Q-A)ペア、一般的な合成データに関連するこれらの特定の欠陥を掘り下げ、これらの欠陥を軽減するための未学習技術に基づく方法を提案する。
我々の研究は、より堅牢で効率的なLLMトレーニングを促進することを目的として、合成データの効果的な利用に関する重要な洞察を得た。
論文 参考訳(メタデータ) (2024-06-18T08:38:59Z) - PairCFR: Enhancing Model Training on Paired Counterfactually Augmented Data through Contrastive Learning [49.60634126342945]
Counterfactually Augmented Data (CAD)は、既存のデータサンプルのラベルを他のクラスに戻すのに、最小限かつ十分な修正を適用することで、新しいデータサンプルを作成する。
近年の研究では、CADを用いたトレーニングが、他の重要な文脈情報を無視しながら、モデルが修正機能に過度にフォーカスする可能性があることが示されている。
我々は、対実的手がかりの学習に加えて、グローバルな特徴アライメントを促進するために、対照的な学習を採用する。
論文 参考訳(メタデータ) (2024-06-09T07:29:55Z) - Federated Learning with Projected Trajectory Regularization [65.6266768678291]
フェデレーション学習は、ローカルデータを共有せずに、分散クライアントから機械学習モデルの共同トレーニングを可能にする。
連合学習における重要な課題の1つは、クライアントにまたがる識別できない分散データを扱うことである。
本稿では,データ問題に対処するための予測軌道正則化(FedPTR)を備えた新しいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-22T02:12:08Z) - Tackling Computational Heterogeneity in FL: A Few Theoretical Insights [68.8204255655161]
我々は、計算異種データの形式化と処理を可能にする新しい集約フレームワークを導入し、分析する。
提案するアグリゲーションアルゴリズムは理論的および実験的予測から広範囲に解析される。
論文 参考訳(メタデータ) (2023-07-12T16:28:21Z) - Audacity of huge: overcoming challenges of data scarcity and data
quality for machine learning in computational materials discovery [1.0036312061637764]
機械学習(ML)に加速された発見は、予測構造とプロパティの関係を明らかにするために大量の高忠実度データを必要とする。
材料発見に関心を持つ多くの特性において、データ生成の挑戦的な性質と高いコストは、人口が少なく、疑わしい品質を持つデータランドスケープを生み出している。
手作業によるキュレーションがなければ、より洗練された自然言語処理と自動画像解析により、文献から構造-プロパティ関係を学習できるようになる。
論文 参考訳(メタデータ) (2021-11-02T21:43:58Z) - Edge-assisted Democratized Learning Towards Federated Analytics [67.44078999945722]
本稿では,エッジ支援型民主化学習機構であるEdge-DemLearnの階層的学習構造を示す。
また、Edge-DemLearnを柔軟なモデルトレーニングメカニズムとして検証し、リージョンに分散制御と集約の方法論を構築する。
論文 参考訳(メタデータ) (2020-12-01T11:46:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。