論文の概要: Predictive Modeling and Explainable AI for Veterinary Safety Profiles, Residue Assessment, and Health Outcomes Using Real-World Data and Physicochemical Properties
- arxiv url: http://arxiv.org/abs/2510.01520v1
- Date: Wed, 01 Oct 2025 23:34:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.900192
- Title: Predictive Modeling and Explainable AI for Veterinary Safety Profiles, Residue Assessment, and Health Outcomes Using Real-World Data and Physicochemical Properties
- Title(参考訳): リアルワールドデータと物理化学的特性を用いた獣医学安全プロファイルの予測モデルと説明可能なAI
- Authors: Hossein Sholehrasa, Xuan Xu, Doina Caragea, Jim E. Riviere, Majid Jaberi-Douraki,
- Abstract要約: 逆事象(AEs)は、予期せぬまたは毒性の運動作用を示し、食物連鎖の違反的残基のリスクを増大させる。
本研究は,米国食品医薬品局(FDA)の獣医学センターからの128万件の報告を用いて,結果の分類(死対回復)を行うための予測的枠組みを紹介する。
- 参考スコア(独自算出の注目度): 4.53318808068234
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The safe use of pharmaceuticals in food-producing animals is vital to protect animal welfare and human food safety. Adverse events (AEs) may signal unexpected pharmacokinetic or toxicokinetic effects, increasing the risk of violative residues in the food chain. This study introduces a predictive framework for classifying outcomes (Death vs. Recovery) using ~1.28 million reports (1987-2025 Q1) from the U.S. FDA's OpenFDA Center for Veterinary Medicine. A preprocessing pipeline merged relational tables and standardized AEs through VeDDRA ontologies. Data were normalized, missing values imputed, and high-cardinality features reduced; physicochemical drug properties were integrated to capture chemical-residue links. We evaluated supervised models, including Random Forest, CatBoost, XGBoost, ExcelFormer, and large language models (Gemma 3-27B, Phi 3-12B). Class imbalance was addressed, such as undersampling and oversampling, with a focus on prioritizing recall for fatal outcomes. Ensemble methods(Voting, Stacking) and CatBoost performed best, achieving precision, recall, and F1-scores of 0.95. Incorporating Average Uncertainty Margin (AUM)-based pseudo-labeling of uncertain cases improved minority-class detection, particularly in ExcelFormer and XGBoost. Interpretability via SHAP identified biologically plausible predictors, including lung, heart, and bronchial disorders, animal demographics, and drug physicochemical properties. These features were strongly linked to fatal outcomes. Overall, the framework shows that combining rigorous data engineering, advanced machine learning, and explainable AI enables accurate, interpretable predictions of veterinary safety outcomes. The approach supports FARAD's mission by enabling early detection of high-risk drug-event profiles, strengthening residue risk assessment, and informing regulatory and clinical decision-making.
- Abstract(参考訳): 食品生産動物への医薬品の安全な使用は、動物福祉と人間の食品安全を守るために不可欠である。
逆事象(AEs)は、予期せぬ薬物動態または毒性運動作用を示し、食物連鎖の違反残基のリスクを増大させる。
本研究は,米国食品医薬品局(FDA)の獣医学センターから,約1.28万件の報告(1987-2025 Q1)を用いて,結果の分類(死対回復)を行うための予測的枠組みを紹介する。
プレプロセスパイプラインはリレーショナルテーブルを結合し、VeDDRAオントロジを通じてAEを標準化した。
データは正常化され,有意な値の欠如,高次心電図が減少し,物理化学的薬物特性が統合され,残留化学物質を捕捉した。
我々はRandom Forest, CatBoost, XGBoost, ExcelFormer, および大規模言語モデル(Gemma 3-27B, Phi 3-12B)の評価を行った。
クラス不均衡は、アンダーサンプリングやオーバーサンプリングのような問題に対処され、致命的な結果に対するリコールの優先順位付けに重点が置かれた。
アンサンブル法(Voting, Stacking)とCatBoostは、精度、リコール、F1スコアが0.95である。
AUM(Average Uncertainty Margin)をベースとした疑似ラベルを組み込むことで,特にExcelFormerやXGBoostでは,マイノリティクラスの検出が向上した。
SHAPによる解釈は、肺、心臓、気管支疾患、動物の人口統計、薬物の物理化学的性質など、生物学的にもっとも有効な予測因子を同定した。
これらの特徴は致命的な結果と強く結びついている。
このフレームワークは、厳密なデータエンジニアリング、高度な機械学習、説明可能なAIを組み合わせることで、獣医の安全結果の正確で解釈可能な予測を可能にする。
このアプローチはFARADのミッションをサポートし、ハイリスクな薬物服用プロファイルを早期に検出し、残留リスク評価を強化し、規制と臨床の意思決定を行う。
関連論文リスト
- Emergenet: A Digital Twin of Sequence Evolution for Scalable Emergence Risk Assessment of Animal Influenza A Strains [3.6744384899193405]
この研究は、列の進化のデジタル双対を推定するツールであるEmergenetを導入し、新しい変種が野生でどのように出現するかを示す。
220,151個のヘマグルチニン(HA)配列のみを用いて構築したエマージェネッツに基づく予測は、WHOの季節ワクチンの勧告を一貫して上回っている。
論文 参考訳(メタデータ) (2024-11-26T06:50:18Z) - Comprehensive Methodology for Sample Augmentation in EEG Biomarker Studies for Alzheimers Risk Classification [0.0]
主な型であるアルツハイマー病(AD)は70%の症例である。
脳波測定はADリスクを識別する可能性を示しているが、信頼性の高い比較のために大規模なサンプルを取得することは困難である。
本研究では,信号処理,調和化,統計的手法を統合し,サンプルサイズを向上し,ADリスク分類の信頼性を向上させる。
論文 参考訳(メタデータ) (2024-11-20T10:31:02Z) - CRTRE: Causal Rule Generation with Target Trial Emulation Framework [47.2836994469923]
ターゲットトライアルエミュレーションフレームワーク(CRTRE)を用いた因果ルール生成という新しい手法を提案する。
CRTREは、アソシエーションルールの因果効果を推定するためにランダム化トライアル設計原則を適用している。
次に、病気発症予測などの下流アプリケーションにそのような関連ルールを組み込む。
論文 参考訳(メタデータ) (2024-11-10T02:40:06Z) - Fuzzy Rule based Intelligent Cardiovascular Disease Prediction using Complex Event Processing [0.8668211481067458]
心血管疾患 (CVD) は、不健康な食事、身体活動の欠如、その他の要因により、急速に世界的な懸念が高まっている。
最近の研究は、リスクと死亡率を減らすための正確でタイムリーな病気予測に焦点を当てている。
本稿では,リアルタイム意思決定支援のためのファジィルールに基づく臨床データ監視システムを提案する。
論文 参考訳(メタデータ) (2024-09-19T16:36:24Z) - SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。
湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
SSM-DTAフレームワークについて述べる。
論文 参考訳(メタデータ) (2022-06-20T14:53:25Z) - Filter Drug-induced Liver Injury Literature with Natural Language
Processing and Ensemble Learning [0.0]
薬物性肝障害 (DILI) は、肝臓を損傷する薬物の副作用である。
重度DILI症例では肝不全や死亡などの生命予後も報告された。
過去の出版物からのデータ抽出は手動ラベリングに大きく依存している。
バイオメディカルテキストの自動処理を可能にする人工知能の最近の進歩
論文 参考訳(メタデータ) (2022-03-09T23:53:07Z) - DrugOOD: Out-of-Distribution (OOD) Dataset Curator and Benchmark for
AI-aided Drug Discovery -- A Focus on Affinity Prediction Problems with Noise
Annotations [90.27736364704108]
我々は、AI支援薬物発見のための体系的なOODデータセットキュレーターおよびベンチマークであるTarmOODを提案する。
DrugOODには、ベンチマークプロセスを完全に自動化するオープンソースのPythonパッケージが付属している。
我々は、薬物標的結合親和性予測という、AIDDにおける最も重要な問題の1つに焦点を当てる。
論文 参考訳(メタデータ) (2022-01-24T12:32:48Z) - Predicting Chemical Hazard across Taxa through Machine Learning [0.3262230127283452]
分類学と実験装置の関連性を分析し,それらを考慮に入れれば,分類性能の大幅な向上が期待できることを示す。
我々は、一般的な機械学習モデル(K-nearest neighbors、ランダムフォレスト、ディープニューラルネットワーク)と、最近提案されたリード・アクロス構造活動関係(RASAR)モデルを用いています。
論文 参考訳(メタデータ) (2021-10-07T15:33:58Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。