論文の概要: Measuring AI Progress in Drug Discovery: A Reproducible Leaderboard for the Tox21 Challenge
- arxiv url: http://arxiv.org/abs/2511.14744v1
- Date: Tue, 18 Nov 2025 18:43:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:53.266321
- Title: Measuring AI Progress in Drug Discovery: A Reproducible Leaderboard for the Tox21 Challenge
- Title(参考訳): 薬物発見におけるAIの進歩を測定する - Tox21チャレンジの再現可能なリーダーボード
- Authors: Antonia Ebner, Christoph Bartmann, Sonja Topf, Sohvi Luukkonen, Johannes Schimunek, Günter Klambauer,
- Abstract要約: 2015年、ディープニューラルネットワークは、Tox21 Data Challengeにおける従来のアプローチを超越した。
このマイルストーンは、製薬業界全体でのディープラーニングの採用を加速させた。
生物活性および毒性予測法が過去10年間にどのように改善されたかは、まだ不明である。
- 参考スコア(独自算出の注目度): 5.936994444758333
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning's rise since the early 2010s has transformed fields like computer vision and natural language processing and strongly influenced biomedical research. For drug discovery specifically, a key inflection - akin to vision's "ImageNet moment" - arrived in 2015, when deep neural networks surpassed traditional approaches on the Tox21 Data Challenge. This milestone accelerated the adoption of deep learning across the pharmaceutical industry, and today most major companies have integrated these methods into their research pipelines. After the Tox21 Challenge concluded, its dataset was included in several established benchmarks, such as MoleculeNet and the Open Graph Benchmark. However, during these integrations, the dataset was altered and labels were imputed or manufactured, resulting in a loss of comparability across studies. Consequently, the extent to which bioactivity and toxicity prediction methods have improved over the past decade remains unclear. To this end, we introduce a reproducible leaderboard, hosted on Hugging Face with the original Tox21 Challenge dataset, together with a set of baseline and representative methods. The current version of the leaderboard indicates that the original Tox21 winner - the ensemble-based DeepTox method - and the descriptor-based self-normalizing neural networks introduced in 2017, continue to perform competitively and rank among the top methods for toxicity prediction, leaving it unclear whether substantial progress in toxicity prediction has been achieved over the past decade. As part of this work, we make all baselines and evaluated models publicly accessible for inference via standardized API calls to Hugging Face Spaces.
- Abstract(参考訳): 2010年代初め以降のディープラーニングの興隆は、コンピュータビジョンや自然言語処理などの分野を変え、生物医学研究に強く影響を与えている。
2015年、深いニューラルネットワークがTox21 Data Challengeの従来のアプローチを超越した時に、特に薬物発見において、ビジョンの"ImageNet moment"に似た重要なインフレクションが登場した。
このマイルストーンは、製薬業界全体でディープラーニングの採用を加速させ、今日ではほとんどの大企業がこれらの手法を研究パイプラインに統合している。
Tox21 Challengeが終了した後、そのデータセットはMoleculeNetやOpen Graph Benchmarkなど、いくつかの確立したベンチマークに含まれた。
しかし、これらの統合の間、データセットが変更され、ラベルがインプットまたは製造されたため、研究間での互換性が失われました。
その結果, 生物活性および毒性予測法が過去10年間にどの程度改善されたかは明らかになっていない。
この目的のために、Hugging Faceにホストされた再現可能なリーダボードと、Tox21 Challengeデータセットと、ベースラインと代表メソッドのセットを紹介します。
リーダーボードの現在のバージョンは、オリジナルのTox21勝者(アンサンブルベースのDeepToxメソッド)と、2017年に導入されたディスクリプタベースの自己正規化ニューラルネットワークが、毒性予測のトップメソッドの競争力とランクを保ち続けていることを示している。
この作業の一環として、Hugging Face Spacesへの標準化されたAPI呼び出しを通じて、すべてのベースラインと評価されたモデルが、推論に公開アクセスできるようにする。
関連論文リスト
- A method for the systematic generation of graph XAI benchmarks via Weisfeiler-Leman coloring [4.187844916497259]
グラフニューラルネットワークは、構造化データから学習するデファクトモデルになっている。
この大きな問題に対処するために、グラフのための説明可能なAIテクニックがいくつか開発されている。
現在のグラフ-XAIベンチマークは、単純化された合成データセットや、ドメインの専門家がキュレートした現実的なタスクに限られている。
本稿では,グラフ分類データセットからXAIベンチマークを自動生成する手法を提案する。
論文 参考訳(メタデータ) (2025-05-18T14:19:52Z) - Completing Spatial Transcriptomics Data for Gene Expression Prediction Benchmarking [2.733766402579457]
26の公開データセットからなるデータベースであるSpaREDと、最先端のトランスフォーマーに基づく遺伝子発現補完モデルであるSpaCKLEを紹介する。
我々の貢献は、これまででもっとも包括的な組織像からの遺伝子発現予測のベンチマークとなっている。
論文 参考訳(メタデータ) (2025-05-05T19:17:29Z) - Deepfake Generation and Detection: A Benchmark and Survey [134.19054491600832]
Deepfakeは、特定の条件下で非常にリアルな顔画像やビデオを作成するための技術だ。
この調査は、ディープフェイクの発生と検出の最新の展開を包括的にレビューする。
本研究では, 顔交換, 顔再現, 話し顔生成, 顔属性編集の4つの代表的なディープフェイク分野の研究に焦点をあてる。
論文 参考訳(メタデータ) (2024-03-26T17:12:34Z) - Drug Discovery under Covariate Shift with Domain-Informed Prior
Distributions over Functions [30.305418761024143]
実世界の薬物発見タスクは、しばしばラベル付きデータの不足とかなりの範囲のデータによって特徴づけられる。
我々は、データ生成プロセスの明示的な事前知識を事前分布にエンコードする原理的な方法を提案する。
我々は,Q-SAVIを組み込んで,事前知識のような化学空間をモデリングプロセスに組み込むことで,相当な精度と校正が可能であることを実証した。
論文 参考訳(メタデータ) (2023-07-14T05:01:10Z) - The Second Monocular Depth Estimation Challenge [93.1678025923996]
MDEC (Monocular Depth Estimation Challenge) の第2版は、いかなる種類の監視方法にも開放された。
この課題はSynS-Patchesデータセットをベースとしており、高品質な高密度地下構造を持つ多様な環境を特徴としている。
上位の監督官は相対的なFスコアを27.62%改善し、上位の監督官は16.61%改善した。
論文 参考訳(メタデータ) (2023-04-14T11:10:07Z) - SurgT challenge: Benchmark of Soft-Tissue Trackers for Robotic Surgery [10.895748170187638]
本稿では,MICCAI 2022と共に編成されたSurgT: Surgery Trackingについて紹介する。
参加者は軟組織の動きを追跡するアルゴリズムを開発するタスクを割り当てられた。
課題の最後に、開発したメソッドは以前に隠されたテストサブセットに基づいて評価された。
論文 参考訳(メタデータ) (2023-02-06T18:57:30Z) - The Monocular Depth Estimation Challenge [74.0535474077928]
本稿では,WACV2103で組織された最初の単分子深度推定チャレンジ(MDEC)の結果を要約する。
この課題は、SynS-Patchesデータセット上での自己教師付き単眼深度推定の進捗を評価した。
論文 参考訳(メタデータ) (2022-11-22T11:04:15Z) - ImDrug: A Benchmark for Deep Imbalanced Learning in AI-aided Drug
Discovery [79.08833067391093]
現実世界の医薬品のデータセットは、しばしば高度に不均衡な分布を示す。
ImDrugはオープンソースのPythonライブラリを備えたベンチマークで、4つの不均衡設定、11のAI対応データセット、54の学習タスク、16のベースラインアルゴリズムで構成されています。
ドラッグ発見パイプラインの幅広い範囲にまたがる問題やソリューションに対して、アクセス可能でカスタマイズ可能なテストベッドを提供する。
論文 参考訳(メタデータ) (2022-09-16T13:35:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。