論文の概要: Three approaches to supervised learning for compositional data with
pairwise logratios
- arxiv url: http://arxiv.org/abs/2111.08953v1
- Date: Wed, 17 Nov 2021 07:51:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-18 14:14:27.640384
- Title: Three approaches to supervised learning for compositional data with
pairwise logratios
- Title(参考訳): ペアワイズlogratiosを用いた合成データの教師付き学習への3つのアプローチ
- Authors: Germa Coenders and Michael Greenacre
- Abstract要約: 構成データ分析の一般的なアプローチは、対数によるデータ変換である。
構成部品の対(対対対対)の対は、多くの研究問題において最も容易に解釈できる。
一般化線形モデルにおいて、従属変数を最もよく説明できるペアワイズ対数を選択するために、段階的に教師付き学習法を3つ提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The common approach to compositional data analysis is to transform the data
by means of logratios. Logratios between pairs of compositional parts (pairwise
logratios) are the easiest to interpret in many research problems. When the
number of parts is large, some form of logratio selection is a must, for
instance by means of an unsupervised learning method based on a stepwise
selection of the pairwise logratios that explain the largest percentage of the
logratio variance in the compositional dataset. In this article we present
three alternative stepwise supervised learning methods to select the pairwise
logratios that best explain a dependent variable in a generalized linear model,
each geared for a specific problem. The first method features unrestricted
search, where any pairwise logratio can be selected. This method has a complex
interpretation if some pairs of parts in the logratios overlap, but it leads to
the most accurate predictions. The second method restricts parts to occur only
once, which makes the corresponding logratios intuitively interpretable. The
third method uses additive logratios, so that $K-1$ selected logratios involve
exactly $K$ parts. This method in fact searches for the subcomposition with the
highest explanatory power. Once the subcomposition is identified, the
researcher's favourite logratio representation may be used in subsequent
analyses, not only pairwise logratios. Our methodology allows logratios or
non-compositional covariates to be forced into the models based on theoretical
knowledge, and various stopping criteria are available based on information
measures or statistical significance with the Bonferroni correction. We present
an illustration of the three approaches on a dataset from a study predicting
Crohn's disease. The first method excels in terms of predictive power, and the
other two in interpretability.
- Abstract(参考訳): 構成データ分析の一般的なアプローチは、対数によるデータ変換である。
構成部品の対間の対数比(pairwise logratios)は、多くの研究課題において最も容易に解釈できる。
部品の数が大きければ、例えば、合成データセットにおける対数分散の最大割合を説明する対数対数の段階的選択に基づく教師なし学習法によって、ある種の対数選択が必須となる。
本稿では,一般化線形モデルにおいて従属変数を説明するのが最善であるペアワイズ対数式を選択するための3つのステップワイズ教師付き学習法を提案する。
最初の方法は制限のない検索を特徴とし、任意の対のlogratioを選択できる。
この手法は、対数のいくつかの部分の対が重なり合う場合、複雑な解釈を持つが、最も正確な予測につながる。
第2の方法は1回しか発生しない部分を制限するため、対応する対数法は直感的に解釈できる。
第3の方法は加算対数を使用するので、$K-1$選択対数には正確に$K$部分が含まれる。
この方法では、説明力が最も高い部分集合を探索する。
置換が特定されると、研究者の好む対比表現は、対対対対法だけでなく、その後の分析で用いられる。
本手法は,理論的知識に基づいて,対数や非構成共変をモデルに強制することを可能にし,ボンフェロニ補正による情報測度や統計的意義に基づいて,様々な停止基準が利用可能である。
クローン病を予測した研究から,データセット上の3つのアプローチの例を示す。
第1の方法は予測力の点で優れ、第2の方法は解釈可能性において優れている。
関連論文リスト
- D2 Pruning: Message Passing for Balancing Diversity and Difficulty in
Data Pruning [70.98091101459421]
コアセット選択は、トレーニングデータのサブセットを選択して、このサブセット(コアセットとも呼ばれる)でトレーニングされたモデルのパフォーマンスを最大化する。
コアセット選択のために,このデータセットグラフ上で前後のメッセージパッシングを利用する新しいプルーニングアルゴリズムD2プルーニングを提案する。
その結果、D2プルーニングは従来の最先端手法よりもコアセット選択を向上し、最大70%のプルーニングレートが得られた。
論文 参考訳(メタデータ) (2023-10-11T23:01:29Z) - Ensemble Transfer Learning for Multilingual Coreference Resolution [60.409789753164944]
非英語で作業する場合に頻繁に発生する問題は、注釈付きトレーニングデータの不足である。
我々は,様々なトランスファー学習技術を組み合わせた,シンプルだが効果的なアンサンブルベースのフレームワークを設計する。
また、ウィキペディアアンカーテキストを利用して、コア参照解決モデルをブートストラップする低コストのTL手法を提案する。
論文 参考訳(メタデータ) (2023-01-22T18:22:55Z) - Context-Aware Ensemble Learning for Time Series [11.716677452529114]
本稿では,ベースモデルの特徴ベクトルの結合である特徴のスーパーセットを用いて,ベースモデル予測を効果的に組み合わせたメタ学習手法を提案する。
我々のモデルは、ベースモデルの予測を機械学習アルゴリズムの入力として使用するのではなく、問題の状態に基づいて各時点における最良の組み合わせを選択する。
論文 参考訳(メタデータ) (2022-11-30T10:36:13Z) - Meta-Learning Approaches for a One-Shot Collective-Decision Aggregation:
Correctly Choosing how to Choose Correctly [0.7874708385247353]
単発の機械学習に基づくアグリゲーションアプローチを2つ提示する。
最初の予測では、集団の選択に関する複数の特徴が与えられた場合、どのアグリゲーション法が最善かが予想される。
2つ目は、どの決定が最適かを直接予測する。
論文 参考訳(メタデータ) (2022-04-03T15:06:59Z) - OneRel:Joint Entity and Relation Extraction with One Module in One Step [42.576188878294886]
統合エンティティと関係抽出は自然言語処理と知識グラフ構築において不可欠な課題である。
そこで我々は, 結合抽出を細粒度三重分類問題として用いた, OneRel という新しい結合実体と関係抽出モデルを提案する。
論文 参考訳(メタデータ) (2022-03-10T15:09:59Z) - On Modality Bias Recognition and Reduction [70.69194431713825]
マルチモーダル分類の文脈におけるモダリティバイアス問題について検討する。
本稿では,各ラベルの特徴空間を適応的に学習するプラグアンドプレイ損失関数法を提案する。
本手法は, ベースラインに比べ, 顕著な性能向上を実現している。
論文 参考訳(メタデータ) (2022-02-25T13:47:09Z) - Residual Overfit Method of Exploration [78.07532520582313]
提案手法は,2点推定値の調整と1点オーバーフィットに基づく近似探索手法を提案する。
このアプローチは、調整されたモデルと比較して、オーバーフィットモデルが最も過度な適合を示すアクションへの探索を促進する。
ROMEを3つのデータセット上の確立されたコンテキスト的帯域幅法と比較し、最も優れたパフォーマンスの1つとみなす。
論文 参考訳(メタデータ) (2021-10-06T17:05:33Z) - sJIVE: Supervised Joint and Individual Variation Explained [0.0]
同一対象データに対する複数ビューであるマルチソースデータの解析は, 生物医学研究においてますます一般的になっている。
本研究では,共有構造(共同)とソース固有構造(個別構造)を同時に識別する手法であるsjive(supervised joint and individual variation explained)を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:54:45Z) - Diverse Knowledge Distillation for End-to-End Person Search [81.4926655119318]
人物検索は、画像ギャラリーから特定の人物をローカライズし識別することを目的としている。
最近の手法は2つのグループ、すなわち2段階とエンドツーエンドのアプローチに分類できる。
ボトルネックを解消するために、多様な知識蒸留を備えたシンプルで強力なエンドツーエンドネットワークを提案します。
論文 参考訳(メタデータ) (2020-12-21T09:04:27Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。