論文の概要: Statistical Estimation from Dependent Data
- arxiv url: http://arxiv.org/abs/2107.09773v1
- Date: Tue, 20 Jul 2021 21:18:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-22 23:02:19.660226
- Title: Statistical Estimation from Dependent Data
- Title(参考訳): 従属データからの統計的推定
- Authors: Yuval Dagan, Constantinos Daskalakis, Nishanth Dikkala, Surbhi Goel,
Anthimos Vardis Kandiros
- Abstract要約: 本稿では,異なる観測領域にまたがるバイナリラベルが特徴ベクトル上で独立に条件付けられていないような一般的な統計的推定問題について考察する。
我々はこれらの依存関係をMarkov Random Fieldsの言語でモデル化する。
このモデルに対してアルゴリズムと統計的に効率的な推定率を提供する。
- 参考スコア(独自算出の注目度): 37.73584699735133
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider a general statistical estimation problem wherein binary labels
across different observations are not independent conditioned on their feature
vectors, but dependent, capturing settings where e.g. these observations are
collected on a spatial domain, a temporal domain, or a social network, which
induce dependencies. We model these dependencies in the language of Markov
Random Fields and, importantly, allow these dependencies to be substantial, i.e
do not assume that the Markov Random Field capturing these dependencies is in
high temperature. As our main contribution we provide algorithms and
statistically efficient estimation rates for this model, giving several
instantiations of our bounds in logistic regression, sparse logistic
regression, and neural network settings with dependent data. Our estimation
guarantees follow from novel results for estimating the parameters (i.e.
external fields and interaction strengths) of Ising models from a {\em single}
sample. {We evaluate our estimation approach on real networked data, showing
that it outperforms standard regression approaches that ignore dependencies,
across three text classification datasets: Cora, Citeseer and Pubmed.}
- Abstract(参考訳): 我々は,異なる観測値にまたがるバイナリラベルが特徴ベクトルに対して独立に条件付けされるのではなく,その特徴ベクトルに依存する一般統計量推定問題を考える。
これらの観測は、依存関係を誘発する空間領域、時間領域、あるいはソーシャルネットワーク上で収集される。
我々は、これらの依存関係をマルコフ確率場の言語でモデル化し、重要な点として、これらの依存関係が実質的なものであることを許容する。
私たちの大きな貢献として、このモデルにアルゴリズムと統計的に効率的な推定率を提供し、ロジスティック回帰、スパースロジスティック回帰、および依存データによるニューラルネットワーク設定の境界をいくつかのインスタンス化します。
提案手法は,パラメータを推定する新しい結果(すなわち,推定結果)から保証する。
Ising モデルの外部場と相互作用強度) {\displaystyle {\em single} サンプルから得られる。
筆者らは,実際のネットワークデータに対する推定手法を評価し,cora,citeseer,pubmedの3つのテキスト分類データセットにおいて,依存性を無視する標準的な回帰アプローチよりも優れていることを示した。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Inference at the data's edge: Gaussian processes for modeling and inference under model-dependency, poor overlap, and extrapolation [0.0]
ガウス過程 (GP) はフレキシブルな非線形回帰法である。
これは、予測された(非現実的な)値に対する不確実性を扱うための原則化されたアプローチを提供する。
これは外挿または弱い重なり合いの条件下では特に有用である。
論文 参考訳(メタデータ) (2024-07-15T05:09:50Z) - Bring Your Own Data! Self-Supervised Evaluation for Large Language
Models [52.15056231665816]
大規模言語モデル(LLM)の自己教師型評価のためのフレームワークを提案する。
閉書知識,毒性,長期文脈依存性を測定するための自己指導型評価戦略を実証する。
自己監督評価と人監督評価との間には強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-06-23T17:59:09Z) - Statistical inference of travelers' route choice preferences with
system-level data [4.120057972557892]
本研究では,システムレベルのデータを用いて旅行者の実用機能を複数の属性で推定する手法を開発した。
合成データを用いた実験では、係数は一貫して回復され、仮説テストはどの属性が旅行者の経路選択の決定要因であるかを特定する信頼できる統計量であることが示されている。
この方法論は、新型コロナウイルスの感染拡大時に収集された実際のFresnoworldマルチソースデータを使用して、大規模に展開される。
論文 参考訳(メタデータ) (2022-04-23T00:38:32Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Learning Invariant Representations with Missing Data [18.307438471163774]
相関誘導型テクトニュアンス変数を含む特定の依存性を満たすモデルでは、テスト性能が保証される。
欠損したニュアンスの下での非分散目的のためのアクロルトムド推定器を導出する。
シミュレーションと臨床データについて、これらの推定を最適化すると、全データを利用する推定器と同様のテスト性能が得られる。
論文 参考訳(メタデータ) (2021-12-01T23:14:34Z) - Aggregation as Unsupervised Learning and its Evaluation [9.109147994991229]
本稿では,他のアグリゲーションアプローチに対して提案手法を評価可能な経験的評価フレームワークを提案する。
UCI機械学習レポジトリからの回帰データセットを使用し、アグリゲーションのためのデータに依存しない、教師なしのアプローチをベンチマークする。
ベンチマークの結果,本手法は他のデータに依存しない,教師なしのアグリゲーション手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-10-28T14:10:30Z) - Evaluating Model Robustness and Stability to Dataset Shift [7.369475193451259]
機械学習モデルの安定性を解析するためのフレームワークを提案する。
本手法では,アルゴリズムが性能の悪い分布を決定するために,元の評価データを用いる。
我々は,アルゴリズムの性能を"Worst-case"分布で推定する。
論文 参考訳(メタデータ) (2020-10-28T17:35:39Z) - On Disentangled Representations Learned From Correlated Data [59.41587388303554]
相関データに対する最も顕著な絡み合うアプローチの挙動を解析することにより、現実のシナリオにギャップを埋める。
本研究では,データセットの体系的相関が学習され,潜在表現に反映されていることを示す。
また、トレーニング中の弱い監督や、少数のラベルで事前訓練されたモデルを修正することで、これらの潜伏相関を解消する方法を実証する。
論文 参考訳(メタデータ) (2020-06-14T12:47:34Z) - TraDE: Transformers for Density Estimation [101.20137732920718]
TraDEは自己回帰密度推定のための自己アテンションに基づくアーキテクチャである。
本稿では, 生成したサンプルを用いた回帰, 分布外検出, トレーニングデータにおける雑音に対する頑健性などのタスクについて述べる。
論文 参考訳(メタデータ) (2020-04-06T07:32:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。