論文の概要: High-Dimensional Tail Index Regression: with An Application to Text
Analyses of Viral Posts in Social Media
- arxiv url: http://arxiv.org/abs/2403.01318v1
- Date: Sat, 2 Mar 2024 21:37:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-05 14:21:00.480742
- Title: High-Dimensional Tail Index Regression: with An Application to Text
Analyses of Viral Posts in Social Media
- Title(参考訳): 高次元土壌指数回帰 : ソーシャルメディアにおけるウイルスポストのテキスト解析への応用
- Authors: Yuya Sasaki, Jing Tao, Yulong Wang
- Abstract要約: 正規化推定器を提案し、その整合性を確立し、収束率を導出する。
そこで本研究では,正規化推定を偏り,非偏り推定器の正規性を確立することを提案する。
これらの方法は、LGBTQ+に関するX(旧Twitter)のバイラルポストのテキスト解析に応用される。
- 参考スコア(独自算出の注目度): 21.647501478382747
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Motivated by the empirical power law of the distributions of credits (e.g.,
the number of "likes") of viral posts in social media, we introduce the
high-dimensional tail index regression and methods of estimation and inference
for its parameters. We propose a regularized estimator, establish its
consistency, and derive its convergence rate. To conduct inference, we propose
to debias the regularized estimate, and establish the asymptotic normality of
the debiased estimator. Simulation studies support our theory. These methods
are applied to text analyses of viral posts in X (formerly Twitter) concerning
LGBTQ+.
- Abstract(参考訳): ソーシャルメディアにおけるバイラルポストのクレジット(例えば「いいね」の数)の分布に関する経験的パワー法則に動機づけられ,高次元末尾指数回帰とそのパラメータの推定と推定の方法を紹介する。
正規化推定器を提案し,その一貫性を確立し,収束率を導出する。
そこで本研究では,正規化推定を脱バイアス化し,脱バイアス推定器の漸近正規性を確立することを提案する。
シミュレーション研究は私たちの理論を支持します。
これらの方法は、LGBTQ+に関するX(旧Twitter)のバイラルポストのテキスト解析に適用される。
関連論文リスト
- Semi-Supervised Deep Sobolev Regression: Estimation, Variable Selection
and Beyond [3.782392436834913]
本研究では,半教師付き深部ソボレフ回帰器であるSDOREを提案し,基礎となる回帰関数とその勾配を非パラメトリックに推定する。
我々は、SDOREの収束率を総合的に分析し、回帰関数の最小値の最適値を確立する。
また、重要なドメインシフトが存在する場合でも、関連するプラグイン勾配推定器の収束率を導出する。
論文 参考訳(メタデータ) (2024-01-09T13:10:30Z) - Conformal inference for regression on Riemannian Manifolds [49.7719149179179]
回帰シナリオの予測セットは、応答変数が$Y$で、多様体に存在し、Xで表される共変数がユークリッド空間にあるときに検討する。
我々は、多様体上のこれらの領域の経験的バージョンが、その集団に対するほぼ確実に収束していることを証明する。
論文 参考訳(メタデータ) (2023-10-12T10:56:25Z) - Quantifying predictive uncertainty of aphasia severity in stroke
patients with sparse heteroscedastic Bayesian high-dimensional regression [49.504432873468254]
高次元データに対する疎線型回帰法は、通常、残留物が一定の分散を持つと仮定するが、これは実際には破ることができる。
本稿では,ヘテロセダスティック分割経験的ベイズ期待条件最大化アルゴリズムを用いて,高次元ヘテロセダスティック線形回帰モデルを推定する。
論文 参考訳(メタデータ) (2023-09-15T22:06:29Z) - Communication-Efficient Distributed Estimation and Inference for Cox's
Model [1.5254598796939924]
我々は, 高次元のスパースコックス比例ハザードモデルにおいて, 推定と推定のための通信効率のよい反復分散アルゴリズムを開発した。
高次元ハザード回帰係数の線形結合に対する信頼区間を構築するために,新しい縮退法を提案する。
我々は、デコラートスコアテストに基づく任意の座標要素に対して、有効かつ強力な分散仮説テストを提供する。
論文 参考訳(メタデータ) (2023-02-23T15:50:17Z) - Nonconvex Stochastic Scaled-Gradient Descent and Generalized Eigenvector
Problems [98.34292831923335]
オンライン相関解析の問題から,emphStochastic Scaled-Gradient Descent (SSD)アルゴリズムを提案する。
我々はこれらのアイデアをオンライン相関解析に適用し、局所収束率を正規性に比例した最適な1時間スケールのアルゴリズムを初めて導いた。
論文 参考訳(メタデータ) (2021-12-29T18:46:52Z) - Heavy-tailed Streaming Statistical Estimation [58.70341336199497]
ストリーミング$p$のサンプルから重み付き統計推定の課題を考察する。
そこで我々は,傾きの雑音に対して,よりニュアンスな条件下での傾きの傾きの低下を設計し,より詳細な解析を行う。
論文 参考訳(メタデータ) (2021-08-25T21:30:27Z) - Statistical inference using Regularized M-estimation in the reproducing
kernel Hilbert space for handling missing data [0.76146285961466]
まずカーネルリッジレグレッションを用いてアイテム非応答の処理を行う。
カーネルヒルベルト空間を用いた非パラメトリック確率スコア推定器も開発した。
提案手法は,中国北京で測定された大気汚染データを解析するためのものである。
論文 参考訳(メタデータ) (2021-07-15T14:51:39Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - Uncertainty quantification for distributed regression [2.28438857884398]
平均推定器の不確かさを定量化する完全データ駆動手法を提案する。
すなわち、所定の決定論的予測セットに基づいて、平均推定器によって得られる予測に対して、同時的要素単位の信頼バンドを構築する。
また,本解析の副産物として,分割・分散型カーネルリッジ回帰に対するsup-norm整合性結果を得る。
論文 参考訳(メタデータ) (2021-05-24T17:33:19Z) - Estimation, Confidence Intervals, and Large-Scale Hypotheses Testing for
High-Dimensional Mixed Linear Regression [9.815103550891463]
本稿では,2つの線形回帰モデルのうちの1つから出力変数が得られた高次元混合線形回帰(MLR)について検討する。
本稿では, 2つの回帰ベクトルを推定し, その収束率を確立するための反復的手順を提案する。
回帰係数をテストするために大規模な多重検定手法を提案し, アルゴリズムによって偽発見率(FDR)を制御できることが示されている。
論文 参考訳(メタデータ) (2020-11-06T21:17:41Z) - Nonparametric Score Estimators [49.42469547970041]
未知分布によって生成されたサンプルの集合からスコアを推定することは確率モデルの推論と学習における基本的なタスクである。
正規化非パラメトリック回帰の枠組みの下で、これらの推定器の統一的なビューを提供する。
カールフリーカーネルと高速収束による計算効果を享受する反復正規化に基づくスコア推定器を提案する。
論文 参考訳(メタデータ) (2020-05-20T15:01:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。