論文の概要: Accurate ADMET Prediction with XGBoost
- arxiv url: http://arxiv.org/abs/2204.07532v1
- Date: Fri, 15 Apr 2022 16:15:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-04-18 12:49:07.089463
- Title: Accurate ADMET Prediction with XGBoost
- Title(参考訳): XGBoostを用いた高精度ADMET予測
- Authors: Hao Tian, Rajas Ketkar and Peng Tao
- Abstract要約: 指紋やディスクリプタなどの機能や,ツリーベースの機械学習モデル,極端な勾配向上,ADMETの正確な予測など,さまざまな機能を適用します。
我々のモデルはTherapeutics Data Commons ADMETベンチマークグループでよく機能する。
- 参考スコア(独自算出の注目度): 10.196256707940544
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The absorption, distribution, metabolism, excretion, and toxicity (ADMET)
properties are important in drug discovery as they define efficacy and safety.
Here, we apply an ensemble of features, including fingerprints and descriptors,
and a tree-based machine learning model, extreme gradient boosting, for
accurate ADMET prediction. Our model performs well in the Therapeutics Data
Commons ADMET benchmark group. For 22 tasks, our model is ranked first in 10
tasks and top 3 in 18 tasks.
- Abstract(参考訳): 吸収, 分布, 代謝, 排ガス, 毒性(ADMET)の特性は, 有効性と安全性を規定する薬物発見において重要である。
ここでは,指紋やディスクリプタなどの機能や,木に基づく機械学習モデル,極端な勾配向上,ADMETの正確な予測など,さまざまな機能を適用する。
我々のモデルはTherapeutics Data Commons ADMETベンチマークグループでよく機能する。
22タスクでは、私たちのモデルは10タスクで1位、18タスクで3位にランクされています。
関連論文リスト
- CaliciBoost: Performance-Driven Evaluation of Molecular Representations for Caco-2 Permeability Prediction [2.6621416538504827]
Caco-2の透過性は、初期薬物発見時の薬物候補の経口吸収を予測する重要なin vitro指標となる。
本研究では,2D/3D記述子,構造指紋,深層学習に基づく埋め込みを含む8種類の分子的特徴表現の影響について検討した。
PaDELとMordredの両方の表現に対して、3Dディスクリプタは2D機能のみを使用する場合に比べて15.73%削減された。
論文 参考訳(メタデータ) (2025-06-09T07:30:28Z) - Classifying Dental Care Providers Through Machine Learning with Features Ranking [0.0]
本研究では, 歯科医療機関の分類における機械学習(ML)モデルの適用について検討した。
データセットには、サービスカウント(予防、治療、試験)、デリバリーシステム(FFS、管理ケア)、受益者の人口統計が含まれる。
本研究は,モデル効率と精度の向上における特徴選択の重要性を浮き彫りにした。
論文 参考訳(メタデータ) (2025-06-04T21:45:40Z) - Beyond Scaling: Measuring and Predicting the Upper Bound of Knowledge Retention in Language Model Pre-Training [51.41246396610475]
本稿では,外部ツールを使わずにクローズドブック質問応答(QA)の性能を予測することを目的とする。
我々は、21の公開言語と3つのカスタムトレーニングされた大規模言語モデルの事前学習コーパスに対して、大規模な検索と意味解析を行う。
これらの基礎の上に構築されたSMI(Size-dependent Mutual Information)は,事前学習データの特徴を線形に相関させる情報理論の指標である。
論文 参考訳(メタデータ) (2025-02-06T13:23:53Z) - Efficient Multi-Agent System Training with Data Influence-Oriented Tree Search [59.75749613951193]
木探索とデータ選択の両方をガイドするデータインフルエンス指向木探索(DITS)を提案する。
インフルエンススコアを活用することで、システム改善のための最も影響力のあるデータを効果的に特定する。
非微分不可能な指標に適した影響スコア推定法を導出する。
論文 参考訳(メタデータ) (2025-02-02T23:20:16Z) - Effective Predictive Modeling for Emergency Department Visits and Evaluating Exogenous Variables Impact: Using Explainable Meta-learning Gradient Boosting [0.18846515534317265]
本稿では,毎日のED訪問を正確に予測するためのメタラーニンググラディエント・ブースター(Meta-ED)手法を提案する。
提案したMeta-EDは,4つの基礎学習者からなる。Catboost,Random Forest,Extra Tree,LightGBoostは信頼性の高いトップレベルの学習者,Multi-Layer Perceptron(MLP)である。
そこで本研究では,メタEDモデルの有効性を,23モデルを含む広範囲な比較分析により評価した。
論文 参考訳(メタデータ) (2024-11-18T04:23:20Z) - SMILES-Mamba: Chemical Mamba Foundation Models for Drug ADMET Prediction [16.189335444981353]
小分子の薬物の吸収、分布、代謝、排出、毒性を予測することは安全性と有効性を確保するために重要である。
本稿では,ラベル付きデータとラベル付きデータの両方を活用する2段階モデルを提案する。
その結果,SMILES-Mambaは22のADMETデータセットの競合性能を示し,14のタスクで最高スコアを達成した。
論文 参考訳(メタデータ) (2024-08-11T04:53:12Z) - SDoH-GPT: Using Large Language Models to Extract Social Determinants of Health (SDoH) [43.79125048893811]
SDoH-GPTは,医療用ノートから健康の社会的決定因子を抽出する,シンプルで効果的なLarge Language Model (LLM) 法である。
これは時間とコストでそれぞれ10倍と20倍の削減を実現し、コーエンのカッパの最大0.92で測定された人間のアノテータとの整合性が向上した。
本研究は, LLMを医療ノート分類に革命をもたらす可能性を強調し, 時間とコストを大幅に削減して, 高精度な分類を実現する能力を示す。
論文 参考訳(メタデータ) (2024-07-24T09:57:51Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - Tree Search for Language Model Agents [69.43007235771383]
対話型Web環境での探索と多段階計画を行うために,LMエージェントの推論時探索アルゴリズムを提案する。
我々のアプローチは、実環境空間内で機能する最優先木探索の一形態である。
現実的なWebタスクにおいて有効性を示すLMエージェントのための最初の木探索アルゴリズムである。
論文 参考訳(メタデータ) (2024-07-01T17:07:55Z) - Improving Entity Recognition Using Ensembles of Deep Learning and Fine-tuned Large Language Models: A Case Study on Adverse Event Extraction from Multiple Sources [13.750202656564907]
副作用イベント(AE)抽出は、免疫の安全プロファイルを監視し解析するために重要である。
本研究では,AE抽出における大規模言語モデル(LLM)と従来のディープラーニングモデルの有効性を評価することを目的とする。
論文 参考訳(メタデータ) (2024-06-26T03:56:21Z) - Monte Carlo Tree Search Boosts Reasoning via Iterative Preference Learning [55.96599486604344]
本稿では,Large Language Models (LLMs) の推論能力向上を目的とした,反復的な選好学習プロセスによるアプローチを提案する。
我々は、MCTS(Monte Carlo Tree Search)を用いて好みデータを反復的に収集し、そのルックアヘッド機能を利用して、インスタンスレベルの報酬をよりきめ細かいステップレベルの信号に分解する。
提案アルゴリズムはDPO(Direct Preference Optimization)を用いて,新たに生成されたステップレベルの優先度データを用いてLCMポリシーを更新する。
論文 参考訳(メタデータ) (2024-05-01T11:10:24Z) - SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。
湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
SSM-DTAフレームワークについて述べる。
論文 参考訳(メタデータ) (2022-06-20T14:53:25Z) - Tyger: Task-Type-Generic Active Learning for Molecular Property
Prediction [121.97742787439546]
分子の性質を正確に予測する方法は、AIによる薬物発見において重要な問題である。
アノテーションのコストを削減するため,注釈付けのための最も代表的で情報性の高いデータのみを選択するために,深層能動学習法が開発された。
本稿では,異なるタイプの学習タスクを統一的に処理できるタスク型汎用能動的学習フレームワーク(Tyger)を提案する。
論文 参考訳(メタデータ) (2022-05-23T12:56:12Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - Virtual Screening of Pharmaceutical Compounds with hERG Inhibitory
Activity (Cardiotoxicity) using Ensemble Learning [13.046396994731175]
本稿では,様々な機械学習手法の適用について考察し,分子活動予測のためのアンサンブルを提案する。
我々は,第1参照データセット上での心毒性の予測に2次元表記しか使用していない。
論文 参考訳(メタデータ) (2021-06-05T16:57:35Z) - Meta-Learning GNN Initializations for Low-Resource Molecular Property
Prediction [0.0]
モデル非依存メタラーニング(MAML)アルゴリズムにより学習したグラフニューラルネットワークの初期化の化学特性および活動タスクへの伝達性を評価する。
低リソース設定をエミュレートするためにChEMBL20データセットを使用して、我々のベンチマークは、メタ初期化がマルチタスク事前学習ベースラインと互換性があるか、あるいは性能が優れていることを示している。
最後に、メタ初期化は16, 32, 64, 18, 256$インスタンスで$kの微調整セットをまたいだ最高のパフォーマンスモデルをもたらすことを観察する。
論文 参考訳(メタデータ) (2020-03-12T19:49:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。