論文の概要: NDAI-NeuroMAP: A Neuroscience-Specific Embedding Model for Domain-Specific Retrieval
- arxiv url: http://arxiv.org/abs/2507.03329v1
- Date: Fri, 04 Jul 2025 06:28:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.68795
- Title: NDAI-NeuroMAP: A Neuroscience-Specific Embedding Model for Domain-Specific Retrieval
- Title(参考訳): NDAI-NeuroMAP : ドメイン特異的検索のための神経科学特異的埋め込みモデル
- Authors: Devendra Patel, Aaditya Jain, Jayant Verma, Divyansh Rajput, Sunil Mahala, Ketki Suresh Khapare, Jayateja Kalla,
- Abstract要約: NDAI-NeuroMAPは、高精度情報検索タスクのために設計された最初の神経科学ドメイン固有の高密度ベクトル埋め込みモデルである。
本稿ではFremyCompany/BioLORD-2023ファンデーションモデルを用いた洗練された微調整手法を用いる。
約24,000のニューロサイエンス特化クエリからなるホールドアウトテストデータセットの総合的評価は、最先端の汎用埋め込みモデルよりも大幅に改善されていることを示す。
- 参考スコア(独自算出の注目度): 1.5705429611931057
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present NDAI-NeuroMAP, the first neuroscience-domain-specific dense vector embedding model engineered for high-precision information retrieval tasks. Our methodology encompasses the curation of an extensive domain-specific training corpus comprising 500,000 carefully constructed triplets (query-positive-negative configurations), augmented with 250,000 neuroscience-specific definitional entries and 250,000 structured knowledge-graph triplets derived from authoritative neurological ontologies. We employ a sophisticated fine-tuning approach utilizing the FremyCompany/BioLORD-2023 foundation model, implementing a multi-objective optimization framework combining contrastive learning with triplet-based metric learning paradigms. Comprehensive evaluation on a held-out test dataset comprising approximately 24,000 neuroscience-specific queries demonstrates substantial performance improvements over state-of-the-art general-purpose and biomedical embedding models. These empirical findings underscore the critical importance of domain-specific embedding architectures for neuroscience-oriented RAG systems and related clinical natural language processing applications.
- Abstract(参考訳): NDAI-NeuroMAPは,高精度情報検索タスクのために開発された,神経科学領域固有の高密度ベクトル埋め込みモデルである。
提案手法は,500,000個の精巧に構築された三つ子(クエリ陰性な構成)と,250,000個の神経科学特異的定義項目と,権威的神経学的オントロジーから派生した25万個の構造化知識グラフ三つ子からなる広範囲なドメイン固有トレーニングコーパスのキュレーションを含む。
本稿では,FremyCompany/BioLORD-2023ファンデーションモデルを用いて,コントラスト学習と三重項に基づくメートル法学習パラダイムを組み合わせた多目的最適化フレームワークを実装する。
約24,000の神経科学的なクエリからなるホールドアウトテストデータセットの包括的評価は、最先端の汎用およびバイオメディカルな埋め込みモデルに対して、大幅な性能向上を示す。
これらの経験的知見は、神経科学指向RAGシステムと関連する自然言語処理応用のためのドメイン特異的埋め込みアーキテクチャの重要性を浮き彫りにした。
関連論文リスト
- Enhancing Omics Cohort Discovery for Research on Neurodegeneration through Ontology-Augmented Embedding Models [0.14999444543328289]
NeuroEmbedは、コホートやサンプルを表現するための意味論的に正確な埋め込み空間のエンジニアリングのためのアプローチである。
本手法は,(1)公開リポジトリからのコホート抽出,(2)バイオメディカルクラスタリングと組込み空間でのクラスタリングを用いたコホートとサンプルのメタデータの半自動正規化と強化,(3)標準化されたメタデータ次元のランダムな組み合わせに基づくコホートとサンプルの問合せデータセットの自動生成,(4)クエリを最適化するためのドメイン固有の埋め込み器の微調整の4段階からなる。
論文 参考訳(メタデータ) (2025-06-16T13:27:10Z) - Towards a general-purpose foundation model for fMRI analysis [58.06455456423138]
我々は,4次元fMRIボリュームから学習し,多様なアプリケーション間で効率的な知識伝達を可能にするフレームワークであるNeuroSTORMを紹介する。
NeuroSTORMは、複数のセンターにまたがる5万人以上の被験者から5歳から100歳までの28.65万fMRIフレーム(→9000時間)で事前トレーニングされている。
年齢/性別予測、表現型予測、疾患診断、fMRI-to-image検索、タスクベースのfMRIの5つのタスクにおいて、既存の手法よりも優れています。
論文 参考訳(メタデータ) (2025-06-11T23:51:01Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - Rethinking model prototyping through the MedMNIST+ dataset collection [0.11999555634662634]
この作業では、MedMNIST+データセットコレクションの包括的なベンチマークを導入する。
我々は、一般的なCNN(Convolutional Neural Networks)とViT(Vision Transformer)アーキテクチャを、異なる医療データセットにわたって再評価する。
この結果から,計算効率のよいトレーニングスキームと最新の基礎モデルが,エンドツーエンドのトレーニングに有効な代替手段を提供する可能性が示唆された。
論文 参考訳(メタデータ) (2024-04-24T10:19:25Z) - Large-scale Long-tailed Disease Diagnosis on Radiology Images [51.453990034460304]
RadDiagは、様々なモダリティと解剖学にわたる2Dおよび3D入力をサポートする基礎モデルである。
私たちのデータセットであるRP3D-DiagDSは、5,568の障害をカバーする195,010のスキャンで40,936の症例を含む。
論文 参考訳(メタデータ) (2023-12-26T18:20:48Z) - NeuroBench: A Framework for Benchmarking Neuromorphic Computing Algorithms and Systems [50.076028127394366]
ニューロベンチ(NeuroBench)はニューロモルフィックコンピューティングアルゴリズムとシステムのためのベンチマークフレームワークである。
NeuroBenchは、業界や学界にまたがる研究者のオープンなコミュニティによる共同開発である。
論文 参考訳(メタデータ) (2023-04-10T15:12:09Z) - Deeper Clinical Document Understanding Using Relation Extraction [0.0]
名前付きエンティティ認識(NER)と関係抽出(RE)モデルからなるテキストマイニングフレームワークを提案する。
我々は2つの新しいREモデルアーキテクチャを導入し、BioBERTをベースとした精度最適化アーキテクチャと、フル接続ニューラルネットワーク(FCNN)上のクラフト機能を活用した速度最適化アーキテクチャを紹介した。
本稿では,この枠組みの実践的応用として,バイオメディカル知識グラフの構築と臨床コードへの実体マッピングの精度向上について述べる。
論文 参考訳(メタデータ) (2021-12-25T17:14:13Z) - A Dynamic Deep Neural Network For Multimodal Clinical Data Analysis [12.02718865835448]
AdaptiveNetは、異なるイベントの複数のリストを扱うことができる、新しいリカレントニューラルネットワークアーキテクチャである。
慢性関節リウマチにおける疾患進展予測に,スイス臨床品質管理登録簿を用いてアーキテクチャを適用した。
論文 参考訳(メタデータ) (2020-08-14T11:19:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。