論文の概要: High-Dimensional Tail Index Regression: with An Application to Text Analyses of Viral Posts in Social Media
- arxiv url: http://arxiv.org/abs/2403.01318v2
- Date: Sun, 06 Oct 2024 21:12:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-08 13:41:12.163785
- Title: High-Dimensional Tail Index Regression: with An Application to Text Analyses of Viral Posts in Social Media
- Title(参考訳): 高次元土壌指数回帰 : ソーシャルメディアにおけるウイルスポストのテキスト解析への応用
- Authors: Yuya Sasaki, Jing Tao, Yulong Wang,
- Abstract要約: 正規化推定器を示し、その整合性を確立し、収束率を導出する。
また,正規化推定器のデバイアス化手法を導入し,その正規性を証明する。
これらの手法をLGBTQ+トピックに関連するX上のバイラルポストのテキスト解析に応用する。
- 参考スコア(独自算出の注目度): 19.26106025181471
- License:
- Abstract: Motivated by the empirical observation of power-law distributions in the credits (e.g., "likes") of viral social media posts, we introduce a high-dimensional tail index regression model and propose methods for estimation and inference of its parameters. First, we present a regularized estimator, establish its consistency, and derive its convergence rate. Second, we introduce a debiasing technique for the regularized estimator to facilitate inference and prove its asymptotic normality. Third, we extend our approach to handle large-scale online streaming data using stochastic gradient descent. Simulation studies corroborate our theoretical findings. We apply these methods to the text analysis of viral posts on X (formerly Twitter) related to LGBTQ+ topics.
- Abstract(参考訳): ソーシャルメディア投稿のクレジット(例:「いいね!」)のパワー・ロー分布を実証的に観察した結果,高次元テール指数回帰モデルを導入し,そのパラメータの推定と推定法を提案する。
まず、正規化推定器を示し、その整合性を確立し、収束率を導出する。
第2に,正規化推定器のデバイアス化手法を導入し,その漸近的正規性を証明する。
第3に,確率勾配勾配を用いた大規模オンラインストリーミングデータを扱うためのアプローチを拡張した。
シミュレーション研究は、我々の理論的な発見を裏付ける。
これらの手法をLGBTQ+トピックに関連するX(旧Twitter)上のバイラル投稿のテキスト解析に適用する。
関連論文リスト
- Semi-Supervised Deep Sobolev Regression: Estimation, Variable Selection
and Beyond [3.782392436834913]
本研究では,半教師付き深部ソボレフ回帰器であるSDOREを提案し,基礎となる回帰関数とその勾配を非パラメトリックに推定する。
我々は、SDOREの収束率を総合的に分析し、回帰関数の最小値の最適値を確立する。
また、重要なドメインシフトが存在する場合でも、関連するプラグイン勾配推定器の収束率を導出する。
論文 参考訳(メタデータ) (2024-01-09T13:10:30Z) - Conformal inference for regression on Riemannian Manifolds [49.7719149179179]
回帰シナリオの予測セットは、応答変数が$Y$で、多様体に存在し、Xで表される共変数がユークリッド空間にあるときに検討する。
我々は、多様体上のこれらの領域の経験的バージョンが、その集団に対するほぼ確実に収束していることを証明する。
論文 参考訳(メタデータ) (2023-10-12T10:56:25Z) - Understanding Augmentation-based Self-Supervised Representation Learning
via RKHS Approximation and Regression [53.15502562048627]
最近の研究は、自己教師付き学習とグラフラプラシアン作用素のトップ固有空間の近似との関係を構築している。
この研究は、増強に基づく事前訓練の統計的分析に発展する。
論文 参考訳(メタデータ) (2023-06-01T15:18:55Z) - Testing Causality for High Dimensional Data [15.818502261466403]
本研究では,高次元の2つの確率変数間の因果方向を推定するために,エンフィナールトレース法を再検討する。
我々は、ある分布仮定の下でより鋭い信頼境界を持つ非線形トレース汎函数に結果を拡張する。
我々は,合成データセットに関する実験を奨励し,理論的結果を支持する。
論文 参考訳(メタデータ) (2023-03-14T10:25:56Z) - Tensor-on-Tensor Regression: Riemannian Optimization,
Over-parameterization, Statistical-computational Gap, and Their Interplay [9.427635404752936]
テンソル・オン・テンソル回帰(tensor-on-tensor regression)について検討し、テンソル応答とテンソル共変量とをタッカー階数パラメータ/行列で結合する。
我々は、未知の階級の課題に対処する2つの方法を提案する。
一般テンソル・オン・テンソル回帰に対する最初の収束保証を提供する。
論文 参考訳(メタデータ) (2022-06-17T13:15:27Z) - Nonconvex Stochastic Scaled-Gradient Descent and Generalized Eigenvector
Problems [98.34292831923335]
オンライン相関解析の問題から,emphStochastic Scaled-Gradient Descent (SSD)アルゴリズムを提案する。
我々はこれらのアイデアをオンライン相関解析に適用し、局所収束率を正規性に比例した最適な1時間スケールのアルゴリズムを初めて導いた。
論文 参考訳(メタデータ) (2021-12-29T18:46:52Z) - Heavy-tailed Streaming Statistical Estimation [58.70341336199497]
ストリーミング$p$のサンプルから重み付き統計推定の課題を考察する。
そこで我々は,傾きの雑音に対して,よりニュアンスな条件下での傾きの傾きの低下を設計し,より詳細な解析を行う。
論文 参考訳(メタデータ) (2021-08-25T21:30:27Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - Projected Statistical Methods for Distributional Data on the Real Line
with the Wasserstein Metric [0.0]
本研究では,実線上の確率分布のデータセットに関する統計解析を行うための,新規な予測手法を提案する。
特に主成分分析(PCA)と回帰に重点を置いています。
モデルのいくつかの理論的性質が研究され、一貫性が証明される。
論文 参考訳(メタデータ) (2021-01-22T10:24:49Z) - Estimation, Confidence Intervals, and Large-Scale Hypotheses Testing for
High-Dimensional Mixed Linear Regression [9.815103550891463]
本稿では,2つの線形回帰モデルのうちの1つから出力変数が得られた高次元混合線形回帰(MLR)について検討する。
本稿では, 2つの回帰ベクトルを推定し, その収束率を確立するための反復的手順を提案する。
回帰係数をテストするために大規模な多重検定手法を提案し, アルゴリズムによって偽発見率(FDR)を制御できることが示されている。
論文 参考訳(メタデータ) (2020-11-06T21:17:41Z) - Path Sample-Analytic Gradient Estimators for Stochastic Binary Networks [78.76880041670904]
二進的アクティベーションや二進的重みを持つニューラルネットワークでは、勾配降下によるトレーニングは複雑である。
そこで本研究では,サンプリングと解析近似を併用した新しい推定法を提案する。
勾配推定において高い精度を示し、深部畳み込みモデルにおいてより安定かつ優れた訓練を行うことを示す。
論文 参考訳(メタデータ) (2020-06-04T21:51:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。