論文の概要: CT Open: An Open-Access, Uncontaminated, Live Platform for the Open Challenge of Clinical Trial Outcome Prediction
- arxiv url: http://arxiv.org/abs/2604.16742v1
- Date: Fri, 17 Apr 2026 23:18:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.152852
- Title: CT Open: An Open-Access, Uncontaminated, Live Platform for the Open Challenge of Clinical Trial Outcome Prediction
- Title(参考訳): CT Open: 治験アウトカム予測のオープンチャレンジのためのオープンアセスメント, 未確認, ライブプラットフォーム
- Authors: Jianyou Wang, Youze Zheng, Longtian Bao, Hanyuan Zhang, Qirui Zheng, Yuhan Chen, Yang Zhang, Matthew Feng, Maxim Khan, Aditya K. Sehgal, Christopher D. Rosin, Ramamohan Paturi, Umber Dube, Leon Bergen,
- Abstract要約: 私たちは、毎年4つのチャレンジを実行する、オープンアクセスのライブプラットフォームであるCT Openを紹介します。誰でも、各チャレンジに対して予測を提出することができます。
CT Openは、提出時点で結果が公表されていないが、その後公表された試験について、これらの提出を評価している。
実験結果の最も早い言及を識別するために,反復的LLMを用いたWebサーチを用いた完全自動除染パイプラインを提案する。
- 参考スコア(独自算出の注目度): 9.368601866669787
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scientists have long sought to accurately predict outcomes of real-world events before they happen. Can AI systems do so more reliably? We study this question through clinical trial outcome prediction, a high-stakes open challenge even for domain experts. We introduce CT Open, an open-access, live platform that will run four challenge every year. Anyone can submit predictions for each challenge. CT Open evaluates those submissions on trials whose outcomes were not yet public at the time of submission but were made public afterwards. Determining if a trial's outcome is public on the internet before a certain date is surprisingly difficult. Outcomes posted on official registries may lag behind by years, while the first mention may appear in obscure articles. To address this, we propose a novel, fully automated decontamination pipeline that uses iterative LLM-powered web search to identify the earliest mention of trial outcomes. We validate the pipeline's quality and accuracy by human expert's annotations. Since CT Open's pipeline ensures that every evaluated trial had no publicly reported outcome when the prediction was made, it allows participants to use any methodology and any data source. In this paper, we release a training set and two time-stamped test benchmarks, Winter 2025 and Summer 2025. We believe CT Open can serve as a central hub for advancing AI research on forecasting real-world outcomes before they occur, while also informing biomedical research and improving clinical trial design. CT Open Platform is hosted at $\href{https://ct-open.net/}{https://ct-open.net/}$
- Abstract(参考訳): 科学者たちは、現実の出来事が起こる前に正確な結果を予測しようと長年努力してきた。
AIシステムは、もっと確実にできるのか?
本稿では,臨床治験結果の予測を通じてこの課題を考察する。
私たちは、毎年4つのチャレンジを実行するオープンアクセスのライブプラットフォームであるCT Openを紹介します。
誰でも各課題に対して予測を提出できる。
CT Openは、提出時点で結果が公表されていないが、その後公表された試験について、これらの提出を評価している。
裁判の結果がインターネット上で公開されるかどうかを、ある日付の前に決定するのは驚くほど難しい。
公式登録に投稿された成果は数年遅れる可能性があるが、最初の言及は不明瞭な記事に現れるかもしれない。
そこで本研究では,LLMを用いたWeb検索を用いて,実験結果の早期言及を識別する,新しい完全自動除染パイプラインを提案する。
人間のアノテーションによってパイプラインの品質と精度を検証する。
CT Openのパイプラインは、評価されたすべてのトライアルが予測された時に公式に報告された結果を持っていないことを保証しているため、参加者はいかなる方法論やデータソースも使用することができる。
本稿では,2025年冬と2025年夏という,トレーニングセットと2つのタイムスタンプテストベンチマークを公表する。
我々は、CT Openが、生医学の研究や臨床試験設計の改善を図りながら、現実の成果を予測するAI研究を前進させる中心的な役割を果たすと信じている。
CT Open Platformは$\href{https://ct-open.net/}{https://ct-open.net/}$でホストされている。
関連論文リスト
- Open-ended Scientific Discovery via Bayesian Surprise [63.26412847240136]
AutoDSは、ベイジアン・サプライズを用いた科学探査を駆動する、オープンエンドの科学的発見の方法である。
我々はAutoDSを、生物学、経済学、金融学、行動科学といった21の領域にまたがる実世界のデータセットにまたがるデータ駆動ディスカバリの設定で評価する。
論文 参考訳(メタデータ) (2025-06-30T22:53:59Z) - Position: The Artificial Intelligence and Machine Learning Community Should Adopt a More Transparent and Regulated Peer Review Process [4.280350793754043]
トップ層人工知能(AI)と機械学習(ML)カンファレンスへの応募の急速な増加により、多くの会場がクローズドからオープンなレビュープラットフォームに移行した。
一部はオープンなピアレビューを完全に受け入れており、プロセス全体を通してパブリックな可視性を実現している。
その他には、最終決定後のみレビューをリリースしたり、オープンなピアレビューシステムを使用してもレビューを非公開にしておくようなハイブリッドアプローチも採用されている。
論文 参考訳(メタデータ) (2025-02-02T18:58:08Z) - TrialEnroll: Predicting Clinical Trial Enrollment Success with Deep & Cross Network and Large Language Models [16.04933261211837]
本稿では,大規模言語モデル(LLM)を付加した新しいディープ・アンド・クロスネットワークを開発した。
論文 参考訳(メタデータ) (2024-07-18T02:50:40Z) - TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets [54.98321887435557]
本稿では, マルチモーダル入力特徴と臨床治験設計における8つの重要な予測課題を網羅した, 精巧にキュレートされた23個のAI対応データセットについて述べる。
データセットのユーザビリティと信頼性を確保するため、各タスクに基本的な検証方法を提供する。
このようなオープンアクセスデータセットが利用可能になることは、臨床試験設計のための高度なAIアプローチの開発を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-30T09:13:10Z) - Auditing for Human Expertise [12.967730957018688]
我々は、この問題を自然仮説テストとして適用できる統計的枠組みを開発する。
本稿では,専門家の予測が興味ある結果から統計的に独立しているかどうかを判定する簡単な手順を提案する。
我々のテストの拒絶は、人間の専門家が利用可能なデータに基づいてトレーニングされたアルゴリズムに価値を付加する可能性を示唆している。
論文 参考訳(メタデータ) (2023-06-02T16:15:24Z) - OpenGAN: Open-Set Recognition via Open Data Generation [76.00714592984552]
実世界の機械学習システムは、トレーニングデータとは異なる新しいテストデータを分析する必要がある。
オープンセット識別のための概念的にエレガントな2つのアイデアは、1) オープンvs閉鎖二元判別器を識別的に学習し、2) GAN を用いてクローズドセットデータ分布を教師なし学習する。
OpenGANは、それぞれのアプローチの限界をいくつかの技術的な洞察と組み合わせて解決します。
論文 参考訳(メタデータ) (2021-04-07T06:19:24Z) - HINT: Hierarchical Interaction Network for Trial Outcome Prediction
Leveraging Web Data [56.53715632642495]
臨床試験は、有効性、安全性、または患者採用の問題により、不確実な結果に直面する。
本稿では,より一般的な臨床試験結果予測のための階層型Interaction Network(HINT)を提案する。
論文 参考訳(メタデータ) (2021-02-08T15:09:07Z) - OpenHoldem: An Open Toolkit for Large-Scale Imperfect-Information Game
Research [82.09426894653237]
OpenHoldemは、NLTHを用いた大規模不完全情報ゲーム研究のための統合ツールキットです。
1)異なるNLTH AIを徹底的に評価するための標準化された評価プロトコル、2)NLTH AIのための3つの公的に利用可能な強力なベースライン、3)公開NLTH AI評価のための使いやすいAPIを備えたオンラインテストプラットフォーム。
論文 参考訳(メタデータ) (2020-12-11T07:24:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。