論文の概要: Invariant Risk Minimisation for Cross-Organism Inference: Substituting
Mouse Data for Human Data in Human Risk Factor Discovery
- arxiv url: http://arxiv.org/abs/2111.07348v1
- Date: Sun, 14 Nov 2021 14:03:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-17 09:06:10.506429
- Title: Invariant Risk Minimisation for Cross-Organism Inference: Substituting
Mouse Data for Human Data in Human Risk Factor Discovery
- Title(参考訳): クロスオーガニズム推論のための不変リスク最小化:ヒトリスク要因発見におけるヒトデータに対するマウスデータ置換
- Authors: Odhran O'Donoghue, Paul Duckworth, Giuseppe Ughi, Linus Scheibenreif,
Kia Khezeli, Adrienne Hoarfrost, Samuel Budd, Patrick Foley, Nicholas Chia,
John Kalantari, Graham Mackintosh, Frank Soboczenski, Lauren Sanders
- Abstract要約: 本研究では、生体内データと動物モデルを用いて、小さなヒトの医療データセットを増強する。
我々のモデルはヒトの癌発生に関連する遺伝子を同定する。
- 参考スコア(独自算出の注目度): 5.488552935256511
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human medical data can be challenging to obtain due to data privacy concerns,
difficulties conducting certain types of experiments, or prohibitive associated
costs. In many settings, data from animal models or in-vitro cell lines are
available to help augment our understanding of human data. However, this data
is known for having low etiological validity in comparison to human data. In
this work, we augment small human medical datasets with in-vitro data and
animal models. We use Invariant Risk Minimisation (IRM) to elucidate invariant
features by considering cross-organism data as belonging to different
data-generating environments. Our models identify genes of relevance to human
cancer development. We observe a degree of consistency between varying the
amounts of human and mouse data used, however, further work is required to
obtain conclusive insights. As a secondary contribution, we enhance existing
open source datasets and provide two uniformly processed, cross-organism,
homologue gene-matched datasets to the community.
- Abstract(参考訳): 人間の医療データは、データのプライバシの懸念、特定の種類の実験の難しさ、あるいは関連するコストのために取得するのが困難である。
多くの環境では、動物モデルや生体内細胞からのデータを使って、人間のデータの理解を深めることができます。
しかし、このデータは人間のデータに比べてエチオロジーの妥当性が低いことが知られている。
本研究では,生体内データと動物モデルを用いて,小型のヒト医療データセットを増強する。
Invariant Risk Minimisation (IRM) を用いて、異なるデータ生成環境に属する組織間データを考慮し、不変性を解明する。
我々のモデルはヒトの癌発生に関連する遺伝子を同定する。
ヒトとマウスのデータ量の違いによる一貫性の度合いを観察するが、決定的な洞察を得るためにはさらなる作業が必要である。
コントリビューションとして、既存のオープンソースデータセットを強化し、2つの一様処理されたクロスオーガニゼーション、ホモログ遺伝子マッチングデータセットをコミュニティに提供する。
関連論文リスト
- Cross-Species Data Integration for Enhanced Layer Segmentation in Kidney Pathology [5.9813635886408045]
レイヤセグメンテーションのための高品質なディープラーニングモデルのトレーニングは、大量の注釈付きデータの可用性に依存している。
患者の医療データのプライバシーと臨床症例が少ないため、臨床資料からの病理的データセットは比較的困難で高価である。
マウス腎臓データのような種間データでは、人間の腎臓と高い構造を持ち、特徴的に類似しているため、モデルの性能を高める可能性がある。
論文 参考訳(メタデータ) (2024-08-17T19:30:40Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - Machine Learning Techniques for Sensor-based Human Activity Recognition with Data Heterogeneity -- A Review [0.8142555609235358]
HAR(Human Activity Recognition)はユビキタスコンピューティングにおいて重要である。
HARは特にデータ分散の仮定において、課題に直面します。
本稿では,機械学習がHARにおけるデータの不均一性にどのように対処するかを検討する。
論文 参考訳(メタデータ) (2024-03-12T22:22:14Z) - Reducing Intraspecies and Interspecies Covariate Shift in Traumatic
Brain Injury EEG of Humans and Mice Using Transfer Euclidean Alignment [4.264615907591813]
被験者間の高いばらつきは、現実世界の分類タスクのための機械学習モデルをデプロイすることに関して、大きな課題となる。
そのような場合、特定のデータセットで例外的なパフォーマンスを示す機械学習モデルは、同じタスクに対して異なるデータセットに適用した場合、必ずしも同様の習熟度を示すとは限らない。
本稿では,人間の生体医学的データの堅牢性に対処し,深層学習モデルの訓練を行うトランスファーユークリッドアライメントについて紹介する。
論文 参考訳(メタデータ) (2023-10-03T19:48:02Z) - Genetic InfoMax: Exploring Mutual Information Maximization in
High-Dimensional Imaging Genetics Studies [50.11449968854487]
遺伝子ワイド・アソシエーション(GWAS)は、遺伝的変異と特定の形質の関係を同定するために用いられる。
画像遺伝学の表現学習は、GWASによって引き起こされる固有の課題により、ほとんど探索されていない。
本稿では,GWAS の具体的な課題に対処するために,トランスモーダル学習フレームワーク Genetic InfoMax (GIM) を提案する。
論文 参考訳(メタデータ) (2023-09-26T03:59:21Z) - UnitedHuman: Harnessing Multi-Source Data for High-Resolution Human
Generation [59.77275587857252]
総合的な人間のデータセットは、必然的に、局所的な部分についての不十分で低解像度な情報を持っている。
本稿では,高解像度な人為的生成モデルを共同で学習するために,様々な解像度画像を用いたマルチソースデータセットを提案する。
論文 参考訳(メタデータ) (2023-09-25T17:58:46Z) - StyleGAN-Human: A Data-Centric Odyssey of Human Generation [96.7080874757475]
この研究は、データ中心の観点から、"データエンジニアリング"における複数の重要な側面を調査します。
さまざまなポーズやテクスチャを抽出した230万以上のサンプルで、大規模な人間の画像データセットを収集し、注釈付けします。
本稿では,データサイズ,データ分布,データアライメントといった,スタイルGANに基づく人為的生成のためのデータ工学における3つの重要な要素について精査する。
論文 参考訳(メタデータ) (2022-04-25T17:55:08Z) - SubOmiEmbed: Self-supervised Representation Learning of Multi-omics Data
for Cancer Type Classification [4.992154875028543]
マルチオミクスデータの統合と解析により腫瘍の広い視野が得られ,臨床診断の精度が向上する。
SubOmiEmbedは、非常に小さなネットワークを持つベースラインであるOmiEmbedに匹敵する結果を生成する。
この作業は、突然変異に基づくゲノムデータを統合するために改善される。
論文 参考訳(メタデータ) (2022-02-03T16:39:09Z) - TRAPDOOR: Repurposing backdoors to detect dataset bias in machine
learning-based genomic analysis [15.483078145498085]
データセット内のグループの下位表現は、特定のグループの不正確な予測につながる可能性があるため、システム的識別問題を悪化させる可能性がある。
本稿では,ニューラルネットワークのバックドアであるTRAPDOORを提案する。
実世界のがんデータセットを用いて、すでに白人個人に対して存在するバイアスでデータセットを分析し、データセットにバイアスを人工的に導入する。
論文 参考訳(メタデータ) (2021-08-14T17:02:02Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。