論文の概要: Networked Information Aggregation for Binary Classification
- arxiv url: http://arxiv.org/abs/2605.01082v1
- Date: Fri, 01 May 2026 20:31:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.573144
- Title: Networked Information Aggregation for Binary Classification
- Title(参考訳): バイナリ分類のためのネットワーク情報集約
- Authors: MohammadHossein Bateni, Zahra Hadizadeh, MohammadTaghi Hajiaghayi, Mahdi JafariRaviz, Shayan Taherijam,
- Abstract要約: 各エージェントが共有データセットの特徴列のサブセットのみを観測する有向非巡回グラフ(DAG)上で、ネットワーク化されたバイナリ分類について検討する。
我々は,この逐次分散学習手法が情報集約を実現するか否かを問う。つまり,あるエージェントは,全ての特徴列へのアクセスで訓練された最適なロジスティック予測器と比較して,最小限の余剰損失を達成できる。
- 参考スコア(独自算出の注目度): 14.181355030230309
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study networked binary classification on a directed acyclic graph (DAG) where each agent observes only a subset of the feature columns of a shared dataset. Agents act sequentially along the DAG: each receives prediction columns from its parents (if any), augments its local features with these columns, fits a logistic predictor by minimizing binary cross-entropy (BCE), and forwards its prediction column to its outgoing neighbors. We ask whether this sequential distributed training procedure achieves information aggregation, meaning that some agent attains small excess loss compared to the best logistic predictor trained with access to all feature columns. This question was studied for linear regression under squared loss by Kearns, Roth, and Ryu (SODA 2026). Extending their guarantees to classification is nontrivial because their analysis relies on quadratic structure that does not directly transfer to BCE with a logistic link. We analyze the resulting sequential logit-passing protocol and prove: (i) an excess loss upper bound of $O(M/\sqrt{D})$ on depth-$D$ paths under the condition that every $M$ contiguous subsequence of $M$ agents collectively observe all features, and (ii) a close lower bound showing instances with excess loss of at least $Ω(k/D)$ where $k$ is the dimension of the feature space. Together, these results identify network depth as a fundamental bottleneck for information aggregation in networked logistic regression.
- Abstract(参考訳): 各エージェントが共有データセットの特徴列のサブセットのみを観測する有向非巡回グラフ(DAG)上で、ネットワーク化されたバイナリ分類について検討する。
エージェントはDAGに沿って順次行動する:それぞれのエージェントは両親から予測列を受け取り(もしあれば)、これらの列で局所的な特徴を増強し、バイナリクロスエントロピー(BCE)を最小化してロジスティックな予測子に適合し、その予測列を隣人に転送する。
我々は,この逐次分散学習手法が情報集約を実現するか否かを問う。つまり,あるエージェントは,全ての特徴列へのアクセスで訓練された最適なロジスティック予測器と比較して,最小限の余剰損失を達成できる。
この問題はKearns, Roth, Ryu (SODA 2026) の2乗損失下での線形回帰について検討した。
分類への保証を拡張することは、その解析は、ロジスティックリンクで直接BCEに転送しない二次構造に依存しているため、簡単ではない。
得られたシーケンシャルなロジットパスプロトコルを分析し、以下のことを証明します。
(i)$O(M/\sqrt{D})$の余剰損失上限 深さ-$D$パスの場合、各$M$連続サブシーケンス$M$エージェントがすべての特徴を総括的に観察し、
(ii)少なくとも$Ω(k/D)$の余分な損失を持つインスタンスを示す閉下界。
これらの結果は,ネットワーク化ロジスティック回帰における情報集約の基本的なボトルネックとしてネットワーク深度を同定する。
関連論文リスト
- Tight Convergence Rates for Online Distributed Linear Estimation with Adversarial Measurements [66.94250413799232]
分散パラメータ-サーバ-ワーカー設定における乱数ベクトル$X$の推定について検討する。
主な課題は、敵の計測と非同期である。
その結果, 分散線形推定におけるロバスト性, 識別性, 統計的効率の統一的有限時間評価が得られた。
論文 参考訳(メタデータ) (2026-04-07T11:45:55Z) - Networked Information Aggregation via Machine Learning [12.164465380249716]
有向非巡回グラフ(DAG)に学習エージェントを埋め込む分散学習問題について検討する。
DAGでは,情報集約が十分に長い経路で発生することが判明した。
論文 参考訳(メタデータ) (2025-07-13T15:42:59Z) - Exploring Microstructural Dynamics in Cryptocurrency Limit Order Books: Better Inputs Matter More Than Stacking Another Hidden Layer [9.2463347238923]
ニューラルネットワークに余分な隠蔽層やパラメータを追加することで、短期的な価格予測が真に向上するかどうかを検討することを目的としている。
我々は,BTC/USDT LOBスナップショットを100ミリ秒から複数秒間隔で公開して,解釈可能なベースライン,ロジスティック回帰,XGBoostからディープアーキテクチャ(DeepLOB,Conv1D+LSTM)まで,モデルをベンチマークする。
論文 参考訳(メタデータ) (2025-06-06T05:43:30Z) - Langevin dynamics for high-dimensional optimization: the case of multi-spiked tensor PCA [8.435118770300999]
本研究では,最大SNRに伴うスパイクの回復に必要なサンプルの複雑さが,シングルスパイクの場合のよく知られたアルゴリズムしきい値と一致することを示す。
重要なステップとして、高次元の軌道力学を捉えるスパイクと相互作用の詳細なキャラクタリゼーションを提供する。
論文 参考訳(メタデータ) (2024-08-12T12:09:25Z) - Federated Learning Resilient to Byzantine Attacks and Data Heterogeneity [59.17297282373628]
本稿では、データに対する悪意ある攻撃の文脈におけるグラディエント学習(FL)について述べる。
本稿では,収束解析と損失関数の中央値を用いた新しい平均ロバストアルゴリズム(RAGA)を提案する。
論文 参考訳(メタデータ) (2024-03-20T08:15:08Z) - Distributional Reinforcement Learning with Dual Expectile-Quantile Regression [51.87411935256015]
分布RLに対する量子レグレッションアプローチは、任意の戻り分布を柔軟かつ効果的に学習する方法を提供する。
我々は,分布推定が消失することを示し,推定分布が急速に平均に崩壊することを実証的に観察した。
我々は,$L$の学習効率に感化され,効率のよい学習方法として,返却分布の期待値と量子値を共同で学習することを提案する。
論文 参考訳(メタデータ) (2023-05-26T12:30:05Z) - Neural Collapse in Deep Linear Networks: From Balanced to Imbalanced
Data [12.225207401994737]
大量のパラメータを持つ複雑な系は、収束するまでのトレーニングで同じ構造を持つことを示す。
特に、最終層の特徴がクラス平均に崩壊することが観察されている。
本結果は,最終層の特徴と分類器をベクトルからなる幾何学へ収束させることを示す。
論文 参考訳(メタデータ) (2023-01-01T16:29:56Z) - On the Effective Number of Linear Regions in Shallow Univariate ReLU
Networks: Convergence Guarantees and Implicit Bias [50.84569563188485]
我々は、ラベルが$r$のニューロンを持つターゲットネットワークの符号によって決定されるとき、勾配流が方向収束することを示す。
我々の結果は、標本サイズによらず、幅が$tildemathcalO(r)$である、緩やかなオーバーパラメータ化をすでに維持しているかもしれない。
論文 参考訳(メタデータ) (2022-05-18T16:57:10Z) - Towards an Understanding of Benign Overfitting in Neural Networks [104.2956323934544]
現代の機械学習モデルは、しばしば膨大な数のパラメータを使用し、通常、トレーニング損失がゼロになるように最適化されている。
ニューラルネットワークの2層構成において、これらの良質な過適合現象がどのように起こるかを検討する。
本稿では,2層型ReLUネットワーク補間器を極小最適学習率で実現可能であることを示す。
論文 参考訳(メタデータ) (2021-06-06T19:08:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。