論文の概要: When AI Does Science: Evaluating the Autonomous AI Scientist KOSMOS in Radiation Biology
- arxiv url: http://arxiv.org/abs/2511.13825v1
- Date: Mon, 17 Nov 2025 19:00:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:52.746949
- Title: When AI Does Science: Evaluating the Autonomous AI Scientist KOSMOS in Radiation Biology
- Title(参考訳): AIが科学を行うとき - 放射線生物学における自律型AI科学者KoSMOSの評価
- Authors: Humza Nusrat, Omar Nusrat,
- Abstract要約: エージェントAIの「科学者」は、言語モデルを使って文学を検索し、分析し、仮説を生成する。
我々は,自律型AI科学者であるKOSMOSを,単純なランダム遺伝子ヌルベンチマークを用いて放射線生物学の3つの問題について評価した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agentic AI "scientists" now use language models to search the literature, run analyses, and generate hypotheses. We evaluate KOSMOS, an autonomous AI scientist, on three problems in radiation biology using simple random-gene null benchmarks. Hypothesis 1: baseline DNA damage response (DDR) capacity across cell lines predicts the p53 transcriptional response after irradiation (GSE30240). Hypothesis 2: baseline expression of OGT and CDO1 predicts the strength of repressed and induced radiation-response modules in breast cancer cells (GSE59732). Hypothesis 3: a 12-gene expression signature predicts biochemical recurrence-free survival after prostate radiotherapy plus androgen deprivation therapy (GSE116918). The DDR-p53 hypothesis was not supported: DDR score and p53 response were weakly negatively correlated (Spearman rho = -0.40, p = 0.76), indistinguishable from random five-gene scores. OGT showed only a weak association (r = 0.23, p = 0.34), whereas CDO1 was a clear outlier (r = 0.70, empirical p = 0.0039). The 12-gene signature achieved a concordance index of 0.61 (p = 0.017) but a non-unique effect size. Overall, KOSMOS produced one well-supported discovery, one plausible but uncertain result, and one false hypothesis, illustrating that AI scientists can generate useful ideas but require rigorous auditing against appropriate null models.
- Abstract(参考訳): エージェントAIの「科学者」は、言語モデルを使って文学を検索し、分析し、仮説を生成する。
我々は,自律型AI科学者であるKOSMOSを,単純なランダム遺伝子ヌルベンチマークを用いて放射線生物学の3つの問題について評価した。
仮説1: 塩基性DNA損傷応答(DDR)は放射線照射後のp53転写反応を予測する(GSE30240)。
仮説2:OGTとCDO1の塩基性発現は、乳癌細胞(GSE59732)の抑制および誘発放射線応答モジュールの強度を予測する。
前立腺放射線療法とアンドロゲン除去療法(GSE116918)の後に生化学的再発のない生存を予測している。
DDR-p53仮説は支持されなかった: DDRスコアとp53応答は負の相関が弱かった(Spearman rho = -0.40, p = 0.76)。
OGT は弱結合 (r = 0.23, p = 0.34) しか示さなかったが、CDO1 は明らかな外れ値 (r = 0.70, empirical p = 0.0039) であった。
12遺伝子シグネチャは0.61(p = 0.017)の一致指数を達成したが、非特異な効果サイズであった。
全体として、KoSMOSは、よく支持された1つの発見、1つの確実な結果、そして1つの誤った仮説を生み出し、AI科学者が有用なアイデアを生成できるが、適切なヌルモデルに対する厳密な監査を必要とすることを示唆した。
関連論文リスト
- A Multi-Evidence Framework Rescues Low-Power Prognostic Signals and Rejects Statistical Artifacts in Cancer Genomics [0.0]
我々は低出力癌コホートを解析するためのフレームワークを開発した。
我々のフレームワークは, RYR2を名目上の意義にもかかわらず偽陽性と正しく同定した。
KMT2Cは、限界的な重要性にもかかわらず、検証を必要とする複雑な候補として同定された。
論文 参考訳(メタデータ) (2025-10-21T12:27:18Z) - Artificial Intelligence-Based Classification of Spitz Tumors [0.6575918587295319]
従来の黒色腫と非定型的組織像の重複が原因で診断に難渋している。
従来の黒色腫とSpitz腫瘍を鑑別し, 組織学的, 臨床的特徴を用いたAIモデルの有効性を検討した。
論文 参考訳(メタデータ) (2025-08-07T13:41:04Z) - BioDSA-1K: Benchmarking Data Science Agents for Biomedical Research [29.469867701731374]
BioDSA-1Kは1029の仮説中心のタスクと1,177の分析計画からなる。
このベンチマークは,(1)仮説決定精度,(2)証拠と結論の整合性,(3)推論過程の正しさ,(4)AI生成解析コードの実行可能性の4つの軸に沿った評価を可能にする。
論文 参考訳(メタデータ) (2025-05-22T01:02:21Z) - Towards an AI co-scientist [48.11351101913404]
Gemini 2.0上に構築されたマルチエージェントシステムであるAIコサイシストを紹介する。
このAIの共同科学者は、新しい独創的な知識を解明し、明らかに新しい研究仮説を定式化することを目的としている。
システムの設計には、科学的手法にインスパイアされた仮説生成への生成、議論、進化のアプローチが組み込まれている。
論文 参考訳(メタデータ) (2025-02-26T06:17:13Z) - Multi-modal AI for comprehensive breast cancer prognostication [18.691704371847855]
我々は、デジタル病理と臨床データを統合する新しい人工知能(AI)ベースのアプローチを開発した。
この検査は15のコホートで計8,161人の乳がん患者のデータを用いて開発・評価された。
以上の結果から,我々のAIテストは既存の予後検査の精度を改善しつつ,幅広い患者に適用可能であることが示唆された。
論文 参考訳(メタデータ) (2024-10-28T17:54:29Z) - Brain Tumor Classification on MRI in Light of Molecular Markers [56.99710477905796]
1p/19q遺伝子の同時欠失は、低グレードグリオーマの臨床成績と関連している。
本研究の目的は,MRIを用いた畳み込みニューラルネットワークを脳がん検出に活用することである。
論文 参考訳(メタデータ) (2024-09-29T07:04:26Z) - Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文 参考訳(メタデータ) (2024-05-23T13:22:17Z) - Evaluating the Effectiveness of Artificial Intelligence in Predicting Adverse Drug Reactions among Cancer Patients: A Systematic Review and Meta-Analysis [0.0]
本研究の目的は, がん患者の薬物反応予測における人工知能モデルの性能を評価することである。
がん治療におけるAIの使用は、ADRの予測に高い特異性と感度を示すモデルによって、大きな可能性を示している。
しかし,証拠の質を向上させるためには,標準化された研究と多施設研究が必要である。
論文 参考訳(メタデータ) (2024-04-06T11:20:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。