論文の概要: Domain Adaptation in Highly Imbalanced and Overlapping Datasets
- arxiv url: http://arxiv.org/abs/2005.03585v2
- Date: Tue, 2 Jun 2020 10:23:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 22:50:11.259149
- Title: Domain Adaptation in Highly Imbalanced and Overlapping Datasets
- Title(参考訳): 高不均衡および重なり合うデータセットにおけるドメイン適応
- Authors: Ran Ilan Ber and Tom Haramaty
- Abstract要約: このようなデータセットに対する新規な教師なしドメイン適応スキームを提案する。
電子健康記録から生成されたデータセット上で実証される。
新型コロナウイルスの感染拡大でこの手法を用いることで、感染の頻度や確率を推定する可能性について論じる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many machine learning domains, datasets are characterized by highly
imbalanced and overlapping classes. Particularly in the medical domain, a
specific list of symptoms can be labeled as one of various different
conditions. Some of these conditions may be more prevalent than others by
several orders of magnitude. Here we present a novel unsupervised domain
adaptation scheme for such datasets. The scheme, based on a specific type of
Quantification, is designed to work under both label and conditional shifts. It
is demonstrated on datasets generated from electronic health records and
provides high quality results for both Quantification and Domain Adaptation in
very challenging scenarios. Potential benefits of using this scheme in the
current COVID-19 outbreak, for estimation of prevalence and probability of
infection are discussed.
- Abstract(参考訳): 多くの機械学習領域では、データセットは高度に不均衡で重複したクラスによって特徴づけられる。
特に医学領域では、特定の症状のリストは様々な病態の1つとして分類することができる。
これらの条件のいくつかは他の条件よりも数桁大きな値を持つ可能性がある。
ここでは、そのようなデータセットに対する新しい教師なしドメイン適応スキームを示す。
このスキームは、特定の種類の量子化に基づいて、ラベルシフトと条件シフトの両方で動作するように設計されている。
これは電子健康記録から生成されたデータセットで実証され、非常に困難なシナリオで量子化とドメイン適応の両方に高品質な結果を提供する。
新型コロナウイルスの感染拡大でこの手法を用いることで、感染の頻度や確率を推定する可能性について論じる。
関連論文リスト
- Domain-invariant Clinical Representation Learning by Bridging Data
Distribution Shift across EMR Datasets [16.317118701435742]
適切な診断を行い、パーソナライズされた治療計画を設計する上で、効果的な予後モデルが期待されている。
疾患の初期段階では、限られたデータ収集と臨床経験に加えて、プライバシと倫理の懸念から、参照のためのデータ可用性が制限される可能性がある。
本稿では、ソースデータセットからターゲットデータセットへの遷移モデルを構築するためのドメイン不変表現学習手法を紹介する。
論文 参考訳(メタデータ) (2023-10-11T18:32:21Z) - UDAMA: Unsupervised Domain Adaptation through Multi-discriminator
Adversarial Training with Noisy Labels Improves Cardio-fitness Prediction [16.26599832125242]
UDAMAは、教師なしドメイン適応と多識別器適応訓練の2つの重要な要素を持つ手法である。
特に,心呼吸適合度(CRF)予測に応用することで,UDAMAの実用可能性を示す。
この結果から,様々なラベルシフト設定における分布シフトを緩和し,有望な性能を示す。
論文 参考訳(メタデータ) (2023-07-31T13:31:53Z) - Can Domain Adaptation Improve Accuracy and Fairness of Skin Lesion
Classification? [55.49029146917322]
各種非教師付き領域適応法(UDA)の2値・多値皮膚病変分類における適用可能性について検討した。
実験の結果,UDAは二分分類に有効であり,不均衡が緩和された場合にはさらなる改善が見られた。
本研究は,少数派に対する偏見を効果的に低減し,公平性を重視したテクニックを明示的に用いなくても公平性を促進できることを示した。
論文 参考訳(メタデータ) (2023-07-06T17:32:38Z) - Domain shifts in dermoscopic skin cancer datasets: Evaluation of
essential limitations for clinical translation [0.0]
メタデータに基づいて,ISICアーカイブから公開されている画像をグループ化し,意味のある領域を生成する。
複数の定量化手法を用いて、領域シフトの存在と強度を推定した。
グループ化されたドメインのほとんどでは、実際にはドメインシフトが存在します。
論文 参考訳(メタデータ) (2023-04-14T07:38:09Z) - Domain Invariant Model with Graph Convolutional Network for Mammogram
Classification [49.691629817104925]
グラフ畳み込みネットワークを用いたドメイン不変モデル(DIM-GCN)を提案する。
まず,潜伏変数を病原性その他の疾患関連部位に明示的に分解するベイズネットワークを提案する。
マクロな特徴をよりよく捉えるために、我々は、GCN(Graph Convolutional Network)を介して、観察された臨床特性を再構築の目的として活用する。
論文 参考訳(メタデータ) (2022-04-21T08:23:44Z) - Mixture-of-experts VAEs can disregard variation in surjective multimodal
data [23.731871165711635]
1つのモダリティから1つのデータポイントが別のモダリティから複数のデータポイントを記述する主観的データを考える。
理論的および実験的に、後続の専門家の混在したマルチモーダルVAEが、そのような主観的データの変動を捉えるのに苦労することを実証する。
論文 参考訳(メタデータ) (2022-04-11T16:22:51Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Label scarcity in biomedicine: Data-rich latent factor discovery
enhances phenotype prediction [102.23901690661916]
低次元の埋め込み空間は、健康指標、ライフスタイル、および人口動態の予測をデータスカース化するために、英国バイオバンクの人口データセットから導出することができる。
半超越的アプローチによるパフォーマンス向上は、おそらく様々な医学データサイエンス応用にとって重要な要素となるだろう。
論文 参考訳(メタデータ) (2021-10-12T16:25:50Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z) - Embracing the Disharmony in Heterogeneous Medical Data [12.739380441313022]
医療画像データの不均一性は、しばしば機械学習の文脈でドメイン不変性を用いて取り組まれる。
本論文は異種性を受け入れ,マルチタスク学習問題として扱う。
提案手法は,主分類タスクにおけるデータセット間の分類精度を5~30%向上することを示す。
論文 参考訳(メタデータ) (2021-03-23T21:36:39Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。