論文の概要: ProtoBERT-LoRA: Parameter-Efficient Prototypical Finetuning for Immunotherapy Study Identification
- arxiv url: http://arxiv.org/abs/2503.20179v1
- Date: Wed, 26 Mar 2025 03:09:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-27 13:21:12.517669
- Title: ProtoBERT-LoRA: Parameter-Efficient Prototypical Finetuning for Immunotherapy Study Identification
- Title(参考訳): ProtoBERT-LoRA : 免疫療法研究のためのパラメータ効率の良いプロトタイプファインタニング
- Authors: Shijia Zhang, Xiyu Ding, Kai Ding, Jacob Zhang, Kevin Galinsky, Mengrui Wang, Ryan P. Mayers, Zheyu Wang, Hadi Kharrazi,
- Abstract要約: ProtoBERT-LoRAはPubMedBERTとプロトタイプネットワークを組み合わせたハイブリッドフレームワークであり、ローランド適応(LoRA)を効率よく微調整する。
トレーニング(20正,20負),プロトタイプセット(10正,10負),バリデーション(20正,200負),テスト(71正,765負)に分けた。
- 参考スコア(独自算出の注目度): 2.5985905351898637
- License:
- Abstract: Identifying immune checkpoint inhibitor (ICI) studies in genomic repositories like Gene Expression Omnibus (GEO) is vital for cancer research yet remains challenging due to semantic ambiguity, extreme class imbalance, and limited labeled data in low-resource settings. We present ProtoBERT-LoRA, a hybrid framework that combines PubMedBERT with prototypical networks and Low-Rank Adaptation (LoRA) for efficient fine-tuning. The model enforces class-separable embeddings via episodic prototype training while preserving biomedical domain knowledge. Our dataset was divided as: Training (20 positive, 20 negative), Prototype Set (10 positive, 10 negative), Validation (20 positive, 200 negative), and Test (71 positive, 765 negative). Evaluated on test dataset, ProtoBERT-LoRA achieved F1-score of 0.624 (precision: 0.481, recall: 0.887), outperforming the rule-based system, machine learning baselines and finetuned PubMedBERT. Application to 44,287 unlabeled studies reduced manual review efforts by 82%. Ablation studies confirmed that combining prototypes with LoRA improved performance by 29% over stand-alone LoRA.
- Abstract(参考訳): GEO(Gene Expression Omnibus)のようなゲノムレポジトリにおける免疫チェックポイントインヒビター(ICI)の同定は、セマンティックな曖昧さ、極端なクラス不均衡、低リソース環境でのラベル付きデータによって依然として困難である。
本稿では,PubMedBERTをプロトタイプネットワークと組み合わせたハイブリッドフレームワークProtoBERT-LoRAと,ローランド適応(LoRA)を効率よく微調整するために提案する。
このモデルは、バイオメディカルドメイン知識を維持しながら、エピソードのプロトタイプトレーニングを通じて、クラス分離可能な埋め込みを強制する。
トレーニング(20正,20負),プロトタイプセット(10正,10負),バリデーション(20正,200負),テスト(71正,765負)の2つに分けた。
ProtoBERT-LoRAはテストデータセットに基づいて0.624(精度:0.481、リコール:0.887)のF1スコアを獲得し、ルールベースシステム、機械学習ベースライン、微調整されたPubMedBERTを上回った。
44,287件の無ラベル研究の適用により、手作業によるレビュー作業は82%削減された。
アブレーション研究により、プロトタイプとLoRAを組み合わせることで、スタンドアロンのLoRAよりも29%性能が向上したことが確認された。
関連論文リスト
- CRTRE: Causal Rule Generation with Target Trial Emulation Framework [47.2836994469923]
ターゲットトライアルエミュレーションフレームワーク(CRTRE)を用いた因果ルール生成という新しい手法を提案する。
CRTREは、アソシエーションルールの因果効果を推定するためにランダム化トライアル設計原則を適用している。
次に、病気発症予測などの下流アプリケーションにそのような関連ルールを組み込む。
論文 参考訳(メタデータ) (2024-11-10T02:40:06Z) - Development and prospective validation of a prostate cancer detection, grading, and workflow optimization system at an academic medical center [1.9729379339863824]
がん検出, グレーディング, IHC 注文症例のスクリーニングモデルを開発した。
タスク固有前立腺モデルの性能を汎用基礎モデルと比較した。
癌検出におけるタスク特異的モデルと基礎モデルの間に統計的に有意な差は認められなかった。
論文 参考訳(メタデータ) (2024-10-31T05:29:18Z) - Brain Tumor Classification on MRI in Light of Molecular Markers [61.77272414423481]
1p/19q遺伝子の同時欠失は、低グレードグリオーマの臨床成績と関連している。
本研究の目的は,MRIを用いた畳み込みニューラルネットワークを脳がん検出に活用することである。
論文 参考訳(メタデータ) (2024-09-29T07:04:26Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Supervised machine learning for microbiomics: bridging the gap between current and best practices [0.0]
機械学習(ML)は、臨床微生物学の革新を推進しようとしている。
本研究の目的は、微生物学における現在のML実践の改善に必要な重要な領域を特定することである。
論文 参考訳(メタデータ) (2024-02-27T15:49:26Z) - Test-Time Adaptation Induces Stronger Accuracy and Agreement-on-the-Line [65.14099135546594]
最近のテスト時間適応 (TTA) 法は, モデルに非常に弱い相関関係を示すシフトであっても, ACL と AGL の傾向を大幅に強化する。
この結果から,TTAとAGLに基づく推定手法を組み合わせることで,より広い分布シフトの集合に対する高精度なモデルOOD性能を推定できることが示唆された。
論文 参考訳(メタデータ) (2023-10-07T23:21:25Z) - Advancing Brain Metastases Detection in T1-Weighted Contrast-Enhanced 3D
MRI using Noisy Student-based Training [1.101002667958165]
本研究は, 未ラベルのT1cデータの大規模コーパスを活用するため, ノイズの多い学生による自己学習戦略により, フレームワークを前進させることを目的としている。
ラベル付き217とラベルなし1247のT1c試験を2倍のクロスバリデーションで行った。
ラベル付き試験のみを使用したフレームワークは、90%のBM検出感度で9.23の偽陽性を発生させ、一方、導入した学習戦略を使用したフレームワークは、9%の誤検出を減少させた。
論文 参考訳(メタデータ) (2021-11-10T21:44:57Z) - Assessing putative bias in prediction of anti-microbial resistance from
real-world genotyping data under explicit causal assumptions [3.795323061432507]
サンプリングが非ランダム化されているため、AMR予測ツールの開発にはバイアスがかかる。
遺伝子型・フェノタイプAMRデータを用いたAMR予測における確率に基づく再バランスと共起調整の有効性を評価した。
論文 参考訳(メタデータ) (2021-07-06T21:19:21Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。