論文の概要: BMDetect: A Multimodal Deep Learning Framework for Comprehensive Biomedical Misconduct Detection
- arxiv url: http://arxiv.org/abs/2505.05763v2
- Date: Tue, 15 Jul 2025 05:12:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 15:29:04.589459
- Title: BMDetect: A Multimodal Deep Learning Framework for Comprehensive Biomedical Misconduct Detection
- Title(参考訳): BMDetect: 総合的な生体ミスコンダクト検出のためのマルチモーダルディープラーニングフレームワーク
- Authors: Yize Zhou, Jie Zhang, Meijie Wang, Lun Yu,
- Abstract要約: BMDetectは、包括的な原稿評価のためのジャーナルメタデータ、セマンティック埋め込み、テキスト属性を統合する。
74.33%のAUCを達成し、単一モダリティのベースラインを8.6%上回り、バイオメディカルサブフィールド間の転送可能性を示している。
- 参考スコア(独自算出の注目度): 3.306308939118107
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Academic misconduct detection in biomedical research remains challenging due to algorithmic narrowness in existing methods and fragmented analytical pipelines. We present BMDetect, a multimodal deep learning framework that integrates journal metadata (SJR, institutional data), semantic embeddings (PubMedBERT), and GPT-4o-mined textual attributes (methodological statistics, data anomalies) for holistic manuscript evaluation. Key innovations include: (1) multimodal fusion of domain-specific features to reduce detection bias; (2) quantitative evaluation of feature importance, identifying journal authority metrics (e.g., SJR-index) and textual anomalies (e.g., statistical outliers) as dominant predictors; and (3) the BioMCD dataset, a large-scale benchmark with 13,160 retracted articles and 53,411 controls. BMDetect achieves 74.33% AUC, outperforming single-modality baselines by 8.6%, and demonstrates transferability across biomedical subfields. This work advances scalable, interpretable tools for safeguarding research integrity.
- Abstract(参考訳): 生物医学研究における学術的不正行為検出は、既存の手法や断片化された分析パイプラインのアルゴリズム的狭さのため、依然として困難である。
文献メタデータ(SJR, 機関データ), セマンティック埋め込み(PubMedBERT), GPT-4oのテキスト属性(方法論統計, データ異常)を総合的な原稿評価のために統合した多モードディープラーニングフレームワークであるBMDetectを提案する。
主なイノベーションは,(1)検出バイアスを低減するために,ドメイン固有の特徴をマルチモーダルに融合し,(2)特徴の定量的評価,(2)ジャーナルオーソリティ指標(例えば, SJR-index)とテキスト異常(例えば, 統計的外れ値)を支配的予測因子として同定すること,(3)13,160個の抽出項目と53,411個の制御を持つ大規模ベンチマークであるBioMCDデータセットである。
BMDetectは74.33%のAUCを達成し、単一モダリティのベースラインを8.6%上回った。
この研究は、研究の完全性を保護するためのスケーラブルで解釈可能なツールを進歩させる。
関連論文リスト
- Platform for Representation and Integration of multimodal Molecular Embeddings [43.54912893426355]
既存の分子埋め込みのための機械学習手法は、特定のタスクやデータモダリティに制限されている。
既存の埋め込みは、ほとんど重複しない分子信号を取り込んでおり、埋め込み統合の価値を強調している。
我々は,多モード分子埋め込み(PRISME)の表現と統合のためのプラットフォームを提案し,不均一な埋め込みを統一された多モード表現に統合する。
論文 参考訳(メタデータ) (2025-07-10T01:18:50Z) - Advances in Automated Fetal Brain MRI Segmentation and Biometry: Insights from the FeTA 2024 Challenge [27.07002392996198]
FeTA Challenge 2024は胎児脳MRI解析を進歩させた。
組織セグメンテーションと並行して新しい課題としてバイオメトリ予測を導入した。
今回は、新しいローフィールド(0.55T)MRIデータセットからのデータを含む、多様なマルチ中心テストセットを初めて紹介しました。
論文 参考訳(メタデータ) (2025-05-05T16:54:04Z) - Uncertainty-aware abstention in medical diagnosis based on medical texts [87.88110503208016]
本研究は,AI支援医療診断における信頼性の重要課題について論じる。
本研究は,診断に自信がなければ,診断システムによる意思決定の回避を可能にする選択予測手法に焦点をあてる。
我々は、選択予測タスクにおける信頼性を高めるための新しい最先端手法であるHUQ-2を紹介する。
論文 参考訳(メタデータ) (2025-02-25T10:15:21Z) - Pub-Guard-LLM: Detecting Fraudulent Biomedical Articles with Reliable Explanations [11.082285990214595]
Pub-Guard-LLMは、バイオメディカルな論文の不正検出に適した、大規模な言語モデルベースのシステムである。
Pub-Guard-LLMは、様々なベースラインのパフォーマンスを一貫して上回る。
科学的不正検出における検出性能と説明可能性の両方を向上させることで、Pub-Guard-LLMは、新しい効果的なオープンソースツールによる研究完全性の保護に寄与する。
論文 参考訳(メタデータ) (2025-02-21T12:54:56Z) - CSTRL: Context-Driven Sequential Transfer Learning for Abstractive Radiology Report Summarization [0.37109226820205005]
放射線学報告は、診断の発見と印象を含むいくつかのセクションから構成される。
キーコンテンツ抽出とコヒーレント要約を保証するシーケンシャルトランスファー学習を導入する。
MIMIC-CXRとOpen-Iデータセットを用いて、我々のモデルであるCSTRLは最先端の性能を達成した。
論文 参考訳(メタデータ) (2025-02-21T08:32:11Z) - Survey on AI-Generated Media Detection: From Non-MLLM to MLLM [51.91311158085973]
AI生成メディアを検出する方法は急速に進化してきた。
MLLMに基づく汎用検出器は、信頼性検証、説明可能性、ローカライゼーション機能を統合する。
倫理的・セキュリティ的な配慮が、重要な世界的な懸念として浮上している。
論文 参考訳(メタデータ) (2025-02-07T12:18:20Z) - Causal Representation Learning from Multimodal Biomedical Observations [57.00712157758845]
バイオメディカルデータセットの理解を容易にするために,マルチモーダルデータに対するフレキシブルな識別条件と原理的手法を開発した。
主要な理論的貢献は、モジュラリティ間の因果関係の構造的空間性である。
実世界のヒト表現型データセットの結果は、確立された生物医学研究と一致している。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [52.228708947607636]
本稿では,新しい手法のモジュラーフレームワークであるADerを包括的視覚異常検出ベンチマークとして紹介する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Source-Free Collaborative Domain Adaptation via Multi-Perspective
Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。
ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。
しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。
我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文 参考訳(メタデータ) (2023-08-24T01:30:18Z) - BiomedGPT: A Generalist Vision-Language Foundation Model for Diverse Biomedical Tasks [68.39821375903591]
汎用AIは、さまざまなデータ型を解釈する汎用性のために、制限に対処する可能性を秘めている。
本稿では,最初のオープンソースかつ軽量な視覚言語基盤モデルであるBiomedGPTを提案する。
論文 参考訳(メタデータ) (2023-05-26T17:14:43Z) - In Silico Prediction of Blood-Brain Barrier Permeability of Chemical
Compounds through Molecular Feature Modeling [0.0]
中枢神経系障害を治療する新薬の開発は、血液脳関門をまたぐ浸透効果の低下により、ユニークな課題を呈している。
本研究では,化学物質の特徴を解析するMLモデルを用いて,この問題を軽減することを目的とする。
論文 参考訳(メタデータ) (2022-08-18T19:59:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。