論文の概要: Building Models of Neurological Language
- arxiv url: http://arxiv.org/abs/2506.06208v1
- Date: Fri, 06 Jun 2025 16:14:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.547681
- Title: Building Models of Neurological Language
- Title(参考訳): 神経言語構築モデル
- Authors: Henry Watkins,
- Abstract要約: 本稿では,神経学におけるドメイン固有言語モデルの開発と評価について述べる。
主な貢献は、神経学固有のデータセット(ケースレポート、QAセット、教科書由来のデータ)の作成、マルチワード表現抽出のためのツール、および医学用語のグラフベースの分析である。
パフォーマンスメトリクスとグラフコミュニティの結果が報告され、将来的にはphi-4のようなオープンソースのアーキテクチャを使ったマルチモーダルモデルに向けた作業が開かれる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This report documents the development and evaluation of domain-specific language models for neurology. Initially focused on building a bespoke model, the project adapted to rapid advances in open-source and commercial medical LLMs, shifting toward leveraging retrieval-augmented generation (RAG) and representational models for secure, local deployment. Key contributions include the creation of neurology-specific datasets (case reports, QA sets, textbook-derived data), tools for multi-word expression extraction, and graph-based analyses of medical terminology. The project also produced scripts and Docker containers for local hosting. Performance metrics and graph community results are reported, with future possible work open for multimodal models using open-source architectures like phi-4.
- Abstract(参考訳): 本稿では,神経学におけるドメイン固有言語モデルの開発と評価について述べる。
当初、Bespokeモデルの構築に重点を置いていたこのプロジェクトは、オープンソースおよび商用の医療用LLMの急速な進歩に適応し、検索強化世代(RAG)と、セキュアでローカルなデプロイメントのための表現モデルの利用にシフトした。
主な貢献は、神経学固有のデータセット(ケースレポート、QAセット、教科書由来のデータ)の作成、マルチワード表現抽出のためのツール、および医学用語のグラフベースの分析である。
プロジェクトは、ローカルホスティング用のスクリプトとDockerコンテナも生成した。
パフォーマンスメトリクスとグラフコミュニティの結果が報告され、将来的にはphi-4のようなオープンソースのアーキテクチャを使ったマルチモーダルモデルに向けた作業が開かれる。
関連論文リスト
- Evaluating Vision Language Model Adaptations for Radiology Report Generation in Low-Resource Languages [1.3699492682906507]
言語特化モデルは、放射線学レポートの生成において、一般モデルとドメイン特化モデルの両方で大きく上回った。
医学用語で微調整されたモデルでは、すべての言語で性能が向上した。
論文 参考訳(メタデータ) (2025-05-02T08:14:03Z) - LEMUR Neural Network Dataset: Towards Seamless AutoML [34.04248949660201]
LEMURは、ニューラルネットワークモデルのオープンソースデータセットであり、多様なアーキテクチャのためのよく構造化されたコードである。
LEMURは主に、機械学習タスクを自動化するために、大規模な言語モデルの微調整を可能にするように設計されている。
LEMURはMITライセンス下でオープンソースプロジェクトとしてリリースされ、論文が受理される。
論文 参考訳(メタデータ) (2025-04-14T09:08:00Z) - Activating Associative Disease-Aware Vision Token Memory for LLM-Based X-ray Report Generation [54.631356899598956]
本稿では,専門医が医療報告を書く過程を効果的に模倣する,新しい連想型記憶強調X線レポート生成モデルを提案する。
我々は,病気関連トークンのメモリアソシエーションを確立するために,ビジュアルホップフィールドネットワークを使用し,レポートホップフィールドネットワークを用いてレポートメモリ情報を検索する。
論文 参考訳(メタデータ) (2025-01-07T01:19:48Z) - Evaluation of Language Models in the Medical Context Under Resource-Constrained Settings [10.39989311209284]
医療分野における言語モデルに関する総合的な調査を行った。
医療用テキスト分類と条件付きテキスト生成のためのサブセットの評価を行った。
その結果、タスク全体での顕著なパフォーマンスが明らかとなり、特定のモデルが医療知識を含む可能性について評価された。
論文 参考訳(メタデータ) (2024-06-24T12:52:02Z) - Medical Vision-Language Pre-Training for Brain Abnormalities [96.1408455065347]
本稿では,PubMedなどの公共リソースから,医用画像・テキスト・アライメントデータを自動的に収集する方法を示す。
特に,まず大きな脳画像テキストデータセットを収集することにより,事前学習プロセスの合理化を図るパイプラインを提案する。
また,医療領域におけるサブフィギュアをサブキャプションにマッピングするというユニークな課題についても検討した。
論文 参考訳(メタデータ) (2024-04-27T05:03:42Z) - OpenMEDLab: An Open-source Platform for Multi-modality Foundation Models
in Medicine [55.29668193415034]
マルチモダリティ基盤モデルのためのオープンソースプラットフォームであるOpenMEDLabについて紹介する。
これは、最前線臨床および生体情報学応用のための大規模言語とビジョンモデルを刺激し、微調整する先駆的な試みの解決策をカプセル化する。
様々な医用画像のモダリティ、臨床テキスト、タンパク質工学など、事前訓練された基礎モデル群へのアクセスが可能である。
論文 参考訳(メタデータ) (2024-02-28T03:51:02Z) - Dolma: an Open Corpus of Three Trillion Tokens for Language Model Pretraining Research [139.69207791947738]
ドルマ (Dolma) は、ウェブコンテンツ、科学論文、コード、パブリックドメインの書籍、ソーシャルメディア、百科事典の素材を多用した3トリルの英語コーパスである。
我々はDolmaの設計原則、その構築の詳細、内容の要約を含む、Dolmaを文書化します。
我々は、重要なデータキュレーションの実践について学んだことを共有するために、Dolmaの中間状態の分析と実験結果を示す。
論文 参考訳(メタデータ) (2024-01-31T20:29:50Z) - An Iterative Optimizing Framework for Radiology Report Summarization with ChatGPT [80.33783969507458]
放射線医学報告の「印象」セクションは、放射線医と他の医師とのコミュニケーションにとって重要な基盤である。
近年の研究では、大規模医療用テキストデータを用いた印象自動生成の有望な成果が得られている。
これらのモデルは、しばしば大量の医療用テキストデータを必要とし、一般化性能が劣る。
論文 参考訳(メタデータ) (2023-04-17T17:13:42Z) - GERNERMED -- An Open German Medical NER Model [0.7310043452300736]
医療データ分析の分野でのデータマイニングは、関連するデータを取得するために、構造化されていないデータの処理にのみ依存する必要があることが多い。
本研究では,ドイツのテキストデータにおける医学的実体型を検出するためのNERタスクのための,最初のオープンなニューラルNLPモデルであるGERNERMEDを提案する。
論文 参考訳(メタデータ) (2021-09-24T17:53:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。