論文の概要: Density Estimation via Measure Transport: Outlook for Applications in the Biological Sciences
- arxiv url: http://arxiv.org/abs/2309.15366v4
- Date: Mon, 13 May 2024 02:17:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-15 01:12:47.479297
- Title: Density Estimation via Measure Transport: Outlook for Applications in the Biological Sciences
- Title(参考訳): 計測輸送による密度推定:生物科学への応用の展望
- Authors: Vanessa Lopez-Marrero, Patrick R. Johnstone, Gilchan Park, Xihaier Luo,
- Abstract要約: 本研究は, 計測輸送技術, 特に三角輸送地図の利用の可能性を評価することを目的とした研究結果である。
サンプルデータ量に制限がある分布密度関数を推定すると,適応輸送写像が有利であることがわかった。
特に、利用可能なデータサンプルの集合のランダムに選択された一連のサブセットに基づいて訓練された、一連の適応トランスポートマップから収集された統計は、データに隠された情報を明らかにする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One among several advantages of measure transport methods is that they allow for a unified framework for processing and analysis of data distributed according to a wide class of probability measures. Within this context, we present results from computational studies aimed at assessing the potential of measure transport techniques, specifically, the use of triangular transport maps, as part of a workflow intended to support research in the biological sciences. Scenarios characterized by the availability of limited amount of sample data, which are common in domains such as radiation biology, are of particular interest. We find that when estimating a distribution density function given limited amount of sample data, adaptive transport maps are advantageous. In particular, statistics gathered from computing series of adaptive transport maps, trained on a series of randomly chosen subsets of the set of available data samples, leads to uncovering information hidden in the data. As a result, in the radiation biology application considered here, this approach provides a tool for generating hypotheses about gene relationships and their dynamics under radiation exposure.
- Abstract(参考訳): 測度輸送手法のいくつかの利点の1つは、広範囲の確率測度に応じて分散されたデータの処理と分析のための統一されたフレームワークを可能にすることである。
本研究は, 生体科学研究を支援するためのワークフローの一環として, 三角輸送マップの利用について, 計測輸送技術の可能性を評価することを目的とした計算研究の結果を提示する。
放射線生物学などの分野に共通する限られたサンプルデータの入手が特徴のシナリオは特に興味深い。
サンプルデータ量に制限がある分布密度関数を推定すると,適応輸送写像が有利であることがわかった。
特に、利用可能なデータサンプルの集合のランダムに選択された一連のサブセットに基づいて訓練された、一連の適応トランスポートマップから収集された統計は、データに隠された情報を明らかにする。
その結果, 放射線生物応用において, 本手法は, 放射線被曝下での遺伝子関係とその動態に関する仮説を生成するためのツールを提供する。
関連論文リスト
- Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - TriSig: Assessing the statistical significance of triclusters [2.064612766965483]
本研究は、テンソルデータのパターンの確率を評価するための統計的枠組みを提案し、ヌル期待から逸脱する。
偽陽性発見のための二項検定に関する総合的な議論が欠かせない。
バイオケミカルおよびバイオテクノロジー分野における、異なる実世界のケーススタディに対する最先端のトリクラスタリングアルゴリズムの適用から得られた結果。
論文 参考訳(メタデータ) (2023-06-01T13:08:54Z) - Statistical inference of travelers' route choice preferences with
system-level data [4.120057972557892]
本研究では,システムレベルのデータを用いて旅行者の実用機能を複数の属性で推定する手法を開発した。
合成データを用いた実験では、係数は一貫して回復され、仮説テストはどの属性が旅行者の経路選択の決定要因であるかを特定する信頼できる統計量であることが示されている。
この方法論は、新型コロナウイルスの感染拡大時に収集された実際のFresnoworldマルチソースデータを使用して、大規模に展開される。
論文 参考訳(メタデータ) (2022-04-23T00:38:32Z) - Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects [82.20189909620899]
不均一な治療効果を推定することは、多くの領域において重要な問題である。
現在、現存するほとんどの作品は観測データにのみ依存している。
本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
論文 参考訳(メタデータ) (2022-02-25T18:59:54Z) - Probabilistic Spatial Analysis in Quantitative Microscopy with
Uncertainty-Aware Cell Detection using Deep Bayesian Regression of Density
Maps [8.534825157831387]
3d顕微鏡は多様な生物系の研究の鍵である。
本稿では,大規模顕微鏡画像上で動作可能な深層学習型細胞検出フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T18:52:16Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z) - Learning excursion sets of vector-valued Gaussian random fields for
autonomous ocean sampling [0.41998444721319217]
本研究では,複数の応答の所定のしきい値を超える同時超過によって定義される領域を特徴付けるための効率的な空間サンプリング手法を開発した。
具体的には,ベクトル値を持つガウス確率場の抽出の不確実性に基づく設計基準を定義する。
我々は、この基準が不明瞭な場所でのサンプリング作業の優先順位付けにどのように使われるかを示し、探索をより効果的にする。
論文 参考訳(メタデータ) (2020-07-07T18:23:46Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z) - Enabling Counterfactual Survival Analysis with Balanced Representations [64.17342727357618]
生存データは様々な医学的応用、すなわち薬物開発、リスクプロファイリング、臨床試験で頻繁に見られる。
本稿では,生存結果に適用可能な対実的推論のための理論的基盤を持つ統一的枠組みを提案する。
論文 参考訳(メタデータ) (2020-06-14T01:15:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。