論文の概要: A Structured Dataset of Disease-Symptom Associations to Improve Diagnostic Accuracy
- arxiv url: http://arxiv.org/abs/2506.13610v2
- Date: Fri, 20 Jun 2025 04:41:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 12:57:34.501147
- Title: A Structured Dataset of Disease-Symptom Associations to Improve Diagnostic Accuracy
- Title(参考訳): 診断精度向上のための疾患・症状関連の構造的データセット
- Authors: Abdullah Al Shafi, Rowzatul Zannat, Abdul Muntakim, Mahmudul Hasan,
- Abstract要約: 疾患症状データセットは、医学研究、疾患診断、臨床意思決定、AIによる健康管理の応用に重要かつ需要がある。
本研究は, 各種オンライン資料, 医療文献, 公衆衛生データベースから, 疾患症状の関係を体系的にコンパイルする。
このデータは、ピアレビューされた医療論文、臨床ケーススタディ、および疾患症状関連報告を分析して収集された。
- 参考スコア(独自算出の注目度): 0.562479170374811
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Disease-symptom datasets are significant and in demand for medical research, disease diagnosis, clinical decision-making, and AI-driven health management applications. These datasets help identify symptom patterns associated with specific diseases, thus improving diagnostic accuracy and enabling early detection. The dataset presented in this study systematically compiles disease-symptom relationships from various online sources, medical literature, and publicly available health databases. The data was gathered through analyzing peer-reviewed medical articles, clinical case studies, and disease-symptom association reports. Only the verified medical sources were included in the dataset, while those from non-peer-reviewed and anecdotal sources were excluded. The dataset is structured in a tabular format, where the first column represents diseases, and the remaining columns represent symptoms. Each symptom cell contains a binary value (1 or 0), indicating whether a symptom is associated with a disease (1 for presence, 0 for absence). Thereby, this structured representation makes the dataset very useful for a wide range of applications, including machine learning-based disease prediction, clinical decision support systems, and epidemiological studies. Although there are some advancements in the field of disease-symptom datasets, there is a significant gap in structured datasets for the Bangla language. This dataset aims to bridge that gap by facilitating the development of multilingual medical informatics tools and improving disease prediction models for underrepresented linguistic communities. Further developments should include region-specific diseases and further fine-tuning of symptom associations for better diagnostic performance
- Abstract(参考訳): 疾患症状データセットは、医学研究、疾患診断、臨床意思決定、AIによる健康管理の応用に重要かつ需要がある。
これらのデータセットは、特定の疾患に関連する症状パターンを識別し、診断精度を改善し、早期発見を可能にする。
本研究で提示したデータセットは, 各種オンライン資料, 医療文献, 公衆衛生データベースから, 疾患症状の関係を体系的にコンパイルする。
このデータは、ピアレビューされた医療論文、臨床ケーススタディ、および疾患症状関連報告を分析して収集された。
確認済みの医療資料のみがデータセットに含まれており、非レビューおよび逸話資料からの資料は除外された。
データセットは表形式で構成され、最初の列は疾患を表し、残りの列は症状を表す。
各症状細胞はバイナリ値(1または0)を含み、症状が疾患と関連しているかどうかを示す(1は存在、0は不在)。
これにより、この構造化された表現は、機械学習ベースの疾患予測、臨床意思決定支援システム、疫学研究など、幅広い応用に非常に有用である。
疾患症状データセットの分野ではいくつかの進歩があるが、バングラ語の構造化データセットには大きなギャップがある。
このデータセットは、多言語医療情報ツールの開発を容易にし、表現不足の言語コミュニティにおける疾患予測モデルを改善することにより、そのギャップを埋めることを目的としている。
地域特異的疾患のさらなる進展と診断性能向上のための症状関連の微調整
関連論文リスト
- Patient Trajectory Prediction: Integrating Clinical Notes with Transformers [0.0]
本稿では,非構造的臨床ノートをトランスフォーマーベース深層学習モデルに統合し,シーケンシャルな疾患予測を行うアプローチを提案する。
MIMIC-IVデータセットの実験は、提案手法が構造化データのみに依存する従来のモデルよりも優れていることを示した。
論文 参考訳(メタデータ) (2025-02-25T09:14:07Z) - Assessing and Enhancing Large Language Models in Rare Disease Question-answering [64.32570472692187]
本稿では,レアな疾患の診断におけるLarge Language Models (LLMs) の性能を評価するために,レアな疾患問合せデータセット(ReDis-QA)を導入する。
ReDis-QAデータセットでは1360の高品質な質問応答ペアを収集し,205の稀な疾患をカバーした。
その後、いくつかのオープンソースのLCMをベンチマークし、希少疾患の診断がこれらのモデルにとって重要な課題であることを示した。
実験の結果,ReCOPは,ReDis-QAデータセット上でのLCMの精度を平均8%向上できることがわかった。
論文 参考訳(メタデータ) (2024-08-15T21:09:09Z) - Potential of Multimodal Large Language Models for Data Mining of Medical Images and Free-text Reports [51.45762396192655]
特にGemini-Vision-Series (Gemini) と GPT-4-Series (GPT-4) は、コンピュータビジョンのための人工知能のパラダイムシフトを象徴している。
本研究は,14の医用画像データセットを対象に,Gemini,GPT-4,および4つの一般的な大規模モデルの性能評価を行った。
論文 参考訳(メタデータ) (2024-07-08T09:08:42Z) - Explorative analysis of human disease-symptoms relations using the
Convolutional Neural Network [0.0]
本研究は, 疾患予測タスクにおける症状タイプの範囲を理解することを目的としている。
その結果,早期に98~100%の精度で機械学習が病気を診断できる可能性が示唆された。
論文 参考訳(メタデータ) (2023-02-23T15:02:07Z) - DDXPlus: A new Dataset for Medical Automatic Diagnosis [2.7126836481535213]
本研究は, 患者ごとの鑑別診断, 基礎的真理病理学を含む大規模合成データセットを提案する。
概念実証として,既存のADおよびASDシステムを拡張し,鑑別診断を取り入れた。
我々は,これらのシステムにおいて,差分を訓練信号に用いて差分を予測することが不可欠であることを示す経験的証拠を提供する。
論文 参考訳(メタデータ) (2022-05-18T18:03:39Z) - Domain Invariant Model with Graph Convolutional Network for Mammogram
Classification [49.691629817104925]
グラフ畳み込みネットワークを用いたドメイン不変モデル(DIM-GCN)を提案する。
まず,潜伏変数を病原性その他の疾患関連部位に明示的に分解するベイズネットワークを提案する。
マクロな特徴をよりよく捉えるために、我々は、GCN(Graph Convolutional Network)を介して、観察された臨床特性を再構築の目的として活用する。
論文 参考訳(メタデータ) (2022-04-21T08:23:44Z) - Context-aware Health Event Prediction via Transition Functions on
Dynamic Disease Graphs [15.17817233616652]
多くの機械学習アプローチは、患者の異なる訪問で病気の表現が静的であると仮定している。
動的疾患グラフ上の遷移関数を用いた文脈認識学習フレームワークを提案する。
2つの実世界のEHRデータセットの実験結果から、提案されたモデルは、健康事象を予測する上で、技術の現状よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-12-09T20:06:39Z) - Graph-Evolving Meta-Learning for Low-Resource Medical Dialogue
Generation [150.52617238140868]
ソース疾患からターゲット疾患へ診断経験を移すために、低リソースの医療対話生成を提案します。
また,新しい疾患の症状相関を推論するためのコモンセンスグラフの進化を学習するグラフ進化メタラーニングフレームワークを開発した。
論文 参考訳(メタデータ) (2020-12-22T13:20:23Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z) - A Deep Learning Pipeline for Patient Diagnosis Prediction Using
Electronic Health Records [0.5672132510411464]
我々は、公衆衛生データセットを普遍的なフォーマットに容易に変換するPythonパッケージを開発し、公開する。
複数の診断を同時に予測する2つの新しいモデルアーキテクチャを提案する。
どちらのモデルも高い精度で複数の診断を同時に予測できる。
論文 参考訳(メタデータ) (2020-06-23T14:58:58Z) - Dynamic Graph Correlation Learning for Disease Diagnosis with Incomplete
Labels [66.57101219176275]
胸部X線画像上の疾患診断は,多ラベル分類の課題である。
本稿では,異なる疾患間の相互依存を調査する新たな視点を提示する病的診断グラフ畳み込みネットワーク(DD-GCN)を提案する。
本手法は,相関学習のための動的隣接行列を用いた特徴写像上のグラフを初めて構築する手法である。
論文 参考訳(メタデータ) (2020-02-26T17:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。