論文の概要: Domain Adaptation in Highly Imbalanced and Overlapping Datasets
- arxiv url: http://arxiv.org/abs/2005.03585v2
- Date: Tue, 2 Jun 2020 10:23:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 22:50:11.259149
- Title: Domain Adaptation in Highly Imbalanced and Overlapping Datasets
- Title(参考訳): 高不均衡および重なり合うデータセットにおけるドメイン適応
- Authors: Ran Ilan Ber and Tom Haramaty
- Abstract要約: このようなデータセットに対する新規な教師なしドメイン適応スキームを提案する。
電子健康記録から生成されたデータセット上で実証される。
新型コロナウイルスの感染拡大でこの手法を用いることで、感染の頻度や確率を推定する可能性について論じる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many machine learning domains, datasets are characterized by highly
imbalanced and overlapping classes. Particularly in the medical domain, a
specific list of symptoms can be labeled as one of various different
conditions. Some of these conditions may be more prevalent than others by
several orders of magnitude. Here we present a novel unsupervised domain
adaptation scheme for such datasets. The scheme, based on a specific type of
Quantification, is designed to work under both label and conditional shifts. It
is demonstrated on datasets generated from electronic health records and
provides high quality results for both Quantification and Domain Adaptation in
very challenging scenarios. Potential benefits of using this scheme in the
current COVID-19 outbreak, for estimation of prevalence and probability of
infection are discussed.
- Abstract(参考訳): 多くの機械学習領域では、データセットは高度に不均衡で重複したクラスによって特徴づけられる。
特に医学領域では、特定の症状のリストは様々な病態の1つとして分類することができる。
これらの条件のいくつかは他の条件よりも数桁大きな値を持つ可能性がある。
ここでは、そのようなデータセットに対する新しい教師なしドメイン適応スキームを示す。
このスキームは、特定の種類の量子化に基づいて、ラベルシフトと条件シフトの両方で動作するように設計されている。
これは電子健康記録から生成されたデータセットで実証され、非常に困難なシナリオで量子化とドメイン適応の両方に高品質な結果を提供する。
新型コロナウイルスの感染拡大でこの手法を用いることで、感染の頻度や確率を推定する可能性について論じる。
関連論文リスト
- The Devil is in the Statistics: Mitigating and Exploiting Statistics Difference for Generalizable Semi-supervised Medical Image Segmentation [36.45117307751509]
この課題に対処するために、半教師付きドメインの一般化が提案されている。
医療機関間のドメインシフトが、異なる特徴統計を引き起こすことを観察する。
この現象は、目に見えない領域の一般化を促進するために利用することができる。
論文 参考訳(メタデータ) (2024-07-16T03:41:48Z) - Meta-Learners for Partially-Identified Treatment Effects Across Multiple Environments [67.80453452949303]
観察データから条件平均治療効果(CATE)を推定することは、パーソナライズされた医療など多くの応用に関係している。
ここでは、観測データが複数の環境からやってくる広範囲な環境に焦点を当てる。
任意の機械学習モデルと組み合わせて使用可能な境界を推定するために、異なるモデルに依存しない学習者(いわゆるメタ学習者)を提案する。
論文 参考訳(メタデータ) (2024-06-04T16:31:43Z) - Domain-invariant Clinical Representation Learning by Bridging Data
Distribution Shift across EMR Datasets [16.317118701435742]
適切な診断を行い、パーソナライズされた治療計画を設計する上で、効果的な予後モデルが期待されている。
疾患の初期段階では、限られたデータ収集と臨床経験に加えて、プライバシと倫理の懸念から、参照のためのデータ可用性が制限される可能性がある。
本稿では、ソースデータセットからターゲットデータセットへの遷移モデルを構築するためのドメイン不変表現学習手法を紹介する。
論文 参考訳(メタデータ) (2023-10-11T18:32:21Z) - UDAMA: Unsupervised Domain Adaptation through Multi-discriminator
Adversarial Training with Noisy Labels Improves Cardio-fitness Prediction [16.26599832125242]
UDAMAは、教師なしドメイン適応と多識別器適応訓練の2つの重要な要素を持つ手法である。
特に,心呼吸適合度(CRF)予測に応用することで,UDAMAの実用可能性を示す。
この結果から,様々なラベルシフト設定における分布シフトを緩和し,有望な性能を示す。
論文 参考訳(メタデータ) (2023-07-31T13:31:53Z) - Domain shifts in dermoscopic skin cancer datasets: Evaluation of
essential limitations for clinical translation [0.0]
メタデータに基づいて,ISICアーカイブから公開されている画像をグループ化し,意味のある領域を生成する。
複数の定量化手法を用いて、領域シフトの存在と強度を推定した。
グループ化されたドメインのほとんどでは、実際にはドメインシフトが存在します。
論文 参考訳(メタデータ) (2023-04-14T07:38:09Z) - Identifiable Latent Causal Content for Domain Adaptation under Latent Covariate Shift [82.14087963690561]
マルチソースドメイン適応(MSDA)は、ラベル付き対象ドメインのラベル予測関数を学習する際の課題に対処する。
本稿では,潜在コンテンツ変数と潜時スタイル変数とともに,ドメイン間の潜時雑音を導入し,複雑な因果生成モデルを提案する。
提案手法は、シミュレーションと実世界の両方のデータセットに対して、例外的な性能と有効性を示す。
論文 参考訳(メタデータ) (2022-08-30T11:25:15Z) - Domain Invariant Model with Graph Convolutional Network for Mammogram
Classification [49.691629817104925]
グラフ畳み込みネットワークを用いたドメイン不変モデル(DIM-GCN)を提案する。
まず,潜伏変数を病原性その他の疾患関連部位に明示的に分解するベイズネットワークを提案する。
マクロな特徴をよりよく捉えるために、我々は、GCN(Graph Convolutional Network)を介して、観察された臨床特性を再構築の目的として活用する。
論文 参考訳(メタデータ) (2022-04-21T08:23:44Z) - Mixture-of-experts VAEs can disregard variation in surjective multimodal
data [23.731871165711635]
1つのモダリティから1つのデータポイントが別のモダリティから複数のデータポイントを記述する主観的データを考える。
理論的および実験的に、後続の専門家の混在したマルチモーダルVAEが、そのような主観的データの変動を捉えるのに苦労することを実証する。
論文 参考訳(メタデータ) (2022-04-11T16:22:51Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。