論文の概要: Two-sample comparison through additive tree models for density ratios
- arxiv url: http://arxiv.org/abs/2508.03059v2
- Date: Mon, 18 Aug 2025 15:14:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.200862
- Title: Two-sample comparison through additive tree models for density ratios
- Title(参考訳): 密度比の加法木モデルによる2サンプル比較
- Authors: Naoki Awaya, Yuliang Xu, Li Ma,
- Abstract要約: 本研究では, 分散損失と呼ばれる新たな損失関数を用いて, 密度比の加算木モデルを訓練するアルゴリズムを提案する。
損失関数が指数族核に類似していることから、新しい損失は共役前駆体が存在する擬似類似体として機能することを示す。
本稿では,二分分類における指数的損失とf-発散の変分形式との密接な関係を通してのバランス損失について考察する。
- 参考スコア(独自算出の注目度): 3.0262553206264893
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The ratio of two densities characterizes their differences. We consider learning the density ratio given i.i.d. observations from each of the two distributions. We propose additive tree models for the density ratio along with efficient algorithms for training these models using a new loss function called the balancing loss. With this loss, additive tree models for the density ratio can be trained using algorithms original designed for supervised learning. Specifically, they can be trained from both an optimization perspective that parallels tree boosting and from a (generalized) Bayesian perspective that parallels Bayesian additive regression trees (BART). For the former, we present two boosting algorithms -- one based on forward-stagewise fitting and the other based on gradient boosting, both of which produce a point estimate for the density ratio function. For the latter, we show that due to the loss function's resemblance to an exponential family kernel, the new loss can serve as a pseudo-likelihood for which conjugate priors exist, thereby enabling effective generalized Bayesian inference on the density ratio using backfitting samplers designed for BART. The resulting uncertainty quantification on the inferred density ratio is critical for applications involving high-dimensional and complex distributions in which uncertainty given limited data can often be substantial. We provide insights on the balancing loss through its close connection to the exponential loss in binary classification and to the variational form of f-divergence, in particular that of the squared Hellinger distance. Our numerical experiments demonstrate the accuracy of the proposed approach while providing unique capabilities in uncertainty quantification. We demonstrate the application of our method in a case study involving assessing the quality of generative models for microbiome compositional data.
- Abstract(参考訳): 2つの密度の比は、それらの差を特徴づける。
2つの分布のそれぞれから観測された密度比について考察する。
そこで本研究では, 分散損失と呼ばれる新たな損失関数を用いて, 密度比に対する加法木モデルと, それらのモデルの学習アルゴリズムを提案する。
この損失により、密度比の加算木モデルを、教師付き学習用に設計されたアルゴリズムを用いて訓練することができる。
具体的には、木を増強する最適化の観点と、ベイズ加法回帰木(BART)を平行とする(一般化された)ベイズ的視点の両方から訓練することができる。
前者に対しては,2つのブースティングアルゴリズムを提示する。1つは前段階のフィッティングに基づくもので,もう1つは勾配ブースティングに基づくもので,どちらも密度比関数の点推定値を生成する。
後者の場合,損失関数が指数族核に類似していることから,新たな損失は共役前駆体が存在する擬似的類似体として機能し,BART用に設計したバックフィッティングサンプリングを用いて,密度比のベイズ推定を効果的に一般化できることを示す。
推定密度比の結果として生じる不確実性定量化は、与えられた不確実性データがしばしば実質的であるような高次元および複雑な分布を含むアプリケーションにとって重要である。
我々は、二項分類における指数損失と、f-発散の変分形式、特に正方形ヘルリンガー距離との密接な接続によるバランス損失についての洞察を与える。
数値実験により,不確実性定量化のユニークな機能を提供しながら,提案手法の精度を実証した。
マイクロバイオーム合成データの生成モデルの品質評価を含むケーススタディにおいて,本手法の適用を実証する。
関連論文リスト
- Binned semiparametric Bayesian networks [3.6998629873543125]
本稿では,カーネル密度推定の計算コストを削減するために,データ結合を利用した確率的半パラメトリックモデルを提案する。
新しい双対半パラメトリックベイズネットワークに対して,2つの条件付き確率分布が開発された。
論文 参考訳(メタデータ) (2025-06-27T08:07:34Z) - Binary Losses for Density Ratio Estimation [2.512309434783062]
有限個の観測値から2つの確率密度の比を推定することは、中央の機械学習問題である。
本研究では, 誤差の小さい密度比推定器が生じる損失関数を特徴付ける。
本研究では,大きな密度比値の正確な推定を優先するような,特定の特性を持つ損失関数を構成するための簡単なレシピを得る。
論文 参考訳(メタデータ) (2024-07-01T15:24:34Z) - Adaptive learning of density ratios in RKHS [3.047411947074805]
有限個の観測から2つの確率密度の比を推定することは、機械学習と統計学における中心的な問題である。
我々は、再生カーネルヒルベルト空間における真の密度比とモデルの間の正規化ブレグマン偏差を最小化する大規模な密度比推定法を分析する。
論文 参考訳(メタデータ) (2023-07-30T08:18:39Z) - Nonparametric Probabilistic Regression with Coarse Learners [1.8275108630751844]
我々は, 密度の形状や形状について最小限の仮定で, 正確な条件密度を計算することができることを示す。
このアプローチをさまざまなデータセットで実証し、特に大きなデータセットで競合性能を示す。
論文 参考訳(メタデータ) (2022-10-28T16:25:26Z) - Flexible Amortized Variational Inference in qBOLD MRI [56.4324135502282]
データから酸素抽出率(OEF)と脱酸素血液量(DBV)をより明瞭に決定する。
既存の推論手法では、DBVを過大評価しながら非常にノイズの多い、過小評価されたEFマップが得られる傾向にある。
本研究は, OEFとDBVの可算分布を推定できる確率論的機械学習手法について述べる。
論文 参考訳(メタデータ) (2022-03-11T10:47:16Z) - A Unified Framework for Multi-distribution Density Ratio Estimation [101.67420298343512]
バイナリ密度比推定(DRE)は多くの最先端の機械学習アルゴリズムの基礎を提供する。
ブレグマン最小化の発散の観点から一般的な枠組みを開発する。
我々のフレームワークはバイナリDREでそれらのフレームワークを厳格に一般化する手法に導かれることを示す。
論文 参考訳(メタデータ) (2021-12-07T01:23:20Z) - Density Ratio Estimation via Infinitesimal Classification [85.08255198145304]
そこで我々は, DRE-inftyを提案する。 DRE-inftyは, 密度比推定(DRE)を, より簡単なサブプロブレムに還元する手法である。
モンテカルロ法にインスパイアされ、中間ブリッジ分布の無限連続体を介して2つの分布の間を滑らかに補間する。
提案手法は,複雑な高次元データセット上での相互情報推定やエネルギーベースモデリングなどの下流タスクにおいて良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-22T06:26:29Z) - Featurized Density Ratio Estimation [82.40706152910292]
本研究では,2つの分布を推定前の共通特徴空間にマッピングするために,可逆生成モデルを活用することを提案する。
この偉業化は、学習された入力空間の密度比が任意に不正確な場合、潜在空間において密度が密接な関係をもたらす。
同時に、特徴写像の可逆性は、特徴空間で計算された比が入力空間で計算された比と同値であることを保証する。
論文 参考訳(メタデータ) (2021-07-05T18:30:26Z) - Meta-Learning for Relative Density-Ratio Estimation [59.75321498170363]
相対密度比推定(DRE)の既存の方法は、両方の密度から多くのインスタンスを必要とする。
本稿では,関係データセットの知識を用いて,相対密度比を数例から推定する,相対DREのメタラーニング手法を提案する。
提案手法の有効性を,相対的DRE,データセット比較,外乱検出の3つの問題を用いて実証的に実証した。
論文 参考訳(メタデータ) (2021-07-02T02:13:45Z) - Learning Optical Flow from a Few Matches [67.83633948984954]
密な相関体積表現は冗長であり、その中の要素のほんの一部で正確なフロー推定が達成できることを示した。
実験により,高い精度を維持しつつ計算コストとメモリ使用量を大幅に削減できることを示した。
論文 参考訳(メタデータ) (2021-04-05T21:44:00Z) - Telescoping Density-Ratio Estimation [21.514983459970903]
我々は、テレスコープ密度比推定(TRE)という新しいフレームワークを導入する。
TREは高次元空間における高相似密度の比を推定できる。
実験により、TREは既存の単一比法よりも大幅に改善できることが示された。
論文 参考訳(メタデータ) (2020-06-22T12:55:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。