論文の概要: Knowledge-Guided Data-Centric AI in Healthcare: Progress, Shortcomings,
and Future Directions
- arxiv url: http://arxiv.org/abs/2212.13591v1
- Date: Tue, 27 Dec 2022 19:35:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 14:34:25.398207
- Title: Knowledge-Guided Data-Centric AI in Healthcare: Progress, Shortcomings,
and Future Directions
- Title(参考訳): 医療における知識誘導型データ中心ai:進歩、欠点、今後の方向性
- Authors: Edward Y. Chang
- Abstract要約: ディープラーニングは、特定の概念や意味の幅広い例を学ぶことができる。
医学において、特定の疾患に関する多様なトレーニングデータを持つことは、疾患を正確に予測できるモデルの開発につながる可能性がある。
潜在的な利点にもかかわらず、高品質な注釈付きデータが欠如しているため、画像ベースの診断には大きな進歩はなかった。
この記事では、データ表現の質を改善するためにデータ中心のアプローチを使うことの重要性を強調します。
- 参考スコア(独自算出の注目度): 7.673853485227739
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The success of deep learning is largely due to the availability of large
amounts of training data that cover a wide range of examples of a particular
concept or meaning. In the field of medicine, having a diverse set of training
data on a particular disease can lead to the development of a model that is
able to accurately predict the disease. However, despite the potential
benefits, there have not been significant advances in image-based diagnosis due
to a lack of high-quality annotated data. This article highlights the
importance of using a data-centric approach to improve the quality of data
representations, particularly in cases where the available data is limited. To
address this "small-data" issue, we discuss four methods for generating and
aggregating training data: data augmentation, transfer learning, federated
learning, and GANs (generative adversarial networks). We also propose the use
of knowledge-guided GANs to incorporate domain knowledge in the training data
generation process. With the recent progress in large pre-trained language
models, we believe it is possible to acquire high-quality knowledge that can be
used to improve the effectiveness of knowledge-guided generative methods.
- Abstract(参考訳): ディープラーニングの成功は、主に、特定の概念や意味の幅広い例をカバーする大量のトレーニングデータが利用可能であることに起因する。
医学の分野では、特定の疾患に関する多様なトレーニングデータを持つことで、疾患を正確に予測できるモデルの開発につながる可能性がある。
しかし, 画像診断には高品質な注釈データがないため, 有意な進歩は見られなかった。
この記事では、データ表現の品質を改善するためにデータ中心のアプローチを使うことの重要性を強調します。
この「小規模データ」問題に対処するために、データ拡張、転送学習、フェデレーション学習、gans(generative adversarial networks)という4つのトレーニングデータの生成と集約について論じる。
また,学習データ生成プロセスにドメイン知識を組み込むための知識誘導型GANを提案する。
近年の大規模事前学習言語モデルの進歩により,知識誘導型生成手法の有効性向上に資する高品質な知識の獲得が可能と考えられる。
関連論文リスト
- A Survey of Few-Shot Learning for Biomedical Time Series [3.845248204742053]
データ駆動型モデルは、臨床診断を支援し、患者のケアを改善する大きな可能性を秘めている。
ラベル付きデータの不足を克服する新たなアプローチは、人間のような能力でAIメソッドを拡張して、少数ショット学習と呼ばれる限られた例で新しいタスクを学ぶことだ。
本調査は,生物医学的時系列アプリケーションのための数ショット学習手法の総合的なレビューと比較を行う。
論文 参考訳(メタデータ) (2024-05-03T21:22:27Z) - Amplifying Pathological Detection in EEG Signaling Pathways through
Cross-Dataset Transfer Learning [10.212217551908525]
実世界の病理分類課題におけるデータとモデルスケーリングとデータセット間の知識伝達の有効性について検討する。
ネガティブトランスファーの可能性の課題を特定し、いくつかの重要なコンポーネントの重要性を強調する。
以上の結果から,小規模で汎用的なモデル(ShallowNetなど)は単一データセット上では良好に動作するが,大規模なモデル(TCNなど)では,大規模かつ多様なデータセットからの転送や学習がより優れていることが示唆された。
論文 参考訳(メタデータ) (2023-09-19T20:09:15Z) - ProtoKD: Learning from Extremely Scarce Data for Parasite Ova
Recognition [5.224806515926022]
ProtoKDは,極端に少ないデータを用いたマルチクラス寄生生物認識の課題に対処するための最初のアプローチの一つである。
我々は、この重要な方向の研究を推進し、提案したProtoKDフレームワークが最先端のパフォーマンスを達成することを検証するために、新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2023-09-18T23:49:04Z) - Deep Reinforcement Learning Framework for Thoracic Diseases
Classification via Prior Knowledge Guidance [49.87607548975686]
関連疾患に対するラベル付きデータの不足は、正確な診断にとって大きな課題となる。
本稿では,診断エージェントの学習を指導するための事前知識を導入する,新しい深層強化学習フレームワークを提案する。
提案手法の性能はNIHX-ray 14とCheXpertデータセットを用いて実証した。
論文 参考訳(メタデータ) (2023-06-02T01:46:31Z) - Incomplete Multimodal Learning for Complex Brain Disorders Prediction [65.95783479249745]
本稿では,変換器と生成対向ネットワークを用いた不完全なマルチモーダルデータ統合手法を提案する。
アルツハイマー病神経画像イニシアチブコホートを用いたマルチモーダルイメージングによる認知変性と疾患予後の予測に本手法を適用した。
論文 参考訳(メタデータ) (2023-05-25T16:29:16Z) - More From Less: Self-Supervised Knowledge Distillation for Routine
Histopathology Data [3.93181912653522]
本研究では,情報深度データから情報疎度データのみを必要とするモデルへの学習中に知識を消耗させることが可能であることを示す。
これにより、情報スパースデータの下流分類精度が向上し、完全に教師されたベースラインに匹敵する。
このアプローチは、日常的な画像のみを必要とするモデルの設計を可能にするが、最先端のデータからの洞察を含んでおり、利用可能なリソースをより活用することができる。
論文 参考訳(メタデータ) (2023-03-19T13:41:59Z) - When Accuracy Meets Privacy: Two-Stage Federated Transfer Learning
Framework in Classification of Medical Images on Limited Data: A COVID-19
Case Study [77.34726150561087]
新型コロナウイルスのパンデミックが急速に広がり、世界の医療資源が不足している。
CNNは医療画像の解析に広く利用され、検証されている。
論文 参考訳(メタデータ) (2022-03-24T02:09:41Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Uncovering the structure of clinical EEG signals with self-supervised
learning [64.4754948595556]
教師付き学習パラダイムは、しばしば利用可能なラベル付きデータの量によって制限される。
この現象は脳波(EEG)などの臨床関連データに特に問題となる。
ラベルのないデータから情報を抽出することで、ディープニューラルネットワークとの競合性能に到達することができるかもしれない。
論文 参考訳(メタデータ) (2020-07-31T14:34:47Z) - Adversarial Multi-Source Transfer Learning in Healthcare: Application to
Glucose Prediction for Diabetic People [4.17510581764131]
本稿では,複数のソース間で類似した特徴表現の学習を可能にする多元逆変換学習フレームワークを提案する。
完全畳み込みニューラルネットワークを用いた糖尿病患者の血糖予測にこの考え方を適用した。
特に、異なるデータセットのデータを使用したり、あるいはデータセット内の状況にデータが少ない場合に輝く。
論文 参考訳(メタデータ) (2020-06-29T11:17:50Z) - GS-WGAN: A Gradient-Sanitized Approach for Learning Differentially
Private Generators [74.16405337436213]
我々は、GS-WGAN(Gradient-sanitized Wasserstein Generative Adrial Networks)を提案する。
GS-WGANは、厳格なプライバシー保証を備えた機密データの衛生的な形式での公開を可能にする。
このアプローチは、複数のメトリクスにわたる最先端のアプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2020-06-15T10:01:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。