論文の概要: Graph Structured Combinatorial Semi-Bandit with Nonlinear Reward Associations through Separable Signals
- arxiv url: http://arxiv.org/abs/2606.14650v1
- Date: Fri, 12 Jun 2026 17:11:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:43.008266
- Title: Graph Structured Combinatorial Semi-Bandit with Nonlinear Reward Associations through Separable Signals
- Title(参考訳): 可分信号による非線形逆アソシエーションを有するグラフ構造化組合せ半帯域
- Authors: Christoph Bauschmann, Setareh Maghsudi,
- Abstract要約: 我々は,グラフに基づく因果報酬モデリングのためのルーチンを備えた,新しい汎用的かつ適応的な戦略を開発する。
時間的および時間的データボリュームの線形化に関する理論的性能保証を確立する。
我々は、ベンチマークされた合成データと実世界の輸送データの両方を用いて数値実験を行う。
- 参考スコア(独自算出の注目度): 9.51084845180104
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The identification of optimal structures within vast arrays of interconnected data necessitates significant sampling- and computational effort. Learning and leveraging underlying signal dependencies can improve efficiency and predictive capabilities considerably, but the ubiquity of nonlinear statistical relations amplifies the complexity of such undertakings. In this paper, we develop novel generic and adaptive strategies equipped with routines for graph-based causal reward modeling, analytic reproducing kernel methods, and Taylor approximation of functional processes. We establish theoretical performance guarantees sublinear in time and linear in data volume over time. Our analyses cover robustness to a multitude of uncertainties arising from noise interference, gradual model convergence, and solution space mismatch. The framework's general appeal is substantiated by a minimalistic set of conditions or reliance on prior estimates, while various outlined modifications address specific or extended settings. To demonstrate practical effectiveness, we conduct numerical experiments using both benchmarked synthetic and real-world transportation datasets.
- Abstract(参考訳): 大量の相互接続されたデータの配列内の最適な構造を特定するには、かなりのサンプリングと計算の努力が必要である。
基礎となる信号依存の学習と活用は効率と予測能力を大幅に向上させるが、非線形統計関係の普遍性はそのような作業の複雑さを増幅する。
本稿では,グラフに基づく因果報酬モデリング,解析再生カーネル法,および機能的プロセスのテイラー近似のためのルーチンを備えた,新しい汎用的適応戦略を開発する。
時間的および時間的データボリュームの線形化に関する理論的性能保証を確立する。
本分析は,ノイズ干渉,段階的モデル収束,解空間ミスマッチに起因する不確実性に対して,ロバスト性をカバーする。
フレームワークの一般的な魅力は、最小限の条件セットや事前の見積もりへの依存によって裏付けられている。
実効性を示すために,ベンチマークされた合成データと実世界の輸送データの両方を用いて数値実験を行った。
関連論文リスト
- Modeling Nonlinear Feature Interactions with Product-Unit Residual Networks [0.9367224590861915]
製品ユニット残基ネットワーク(PURe)は、乗法的積単位と残基接続を統合し、機能的結合を明示的にモデル化する。
相互作用駆動型合成ベンチマークと実世界の2つのデータセットの体系的評価を行う。
PUReは、競争力や性能の向上、低データのレシエーションにおけるロバスト性の向上、サンプル効率の向上、対話レベルの解釈性の向上を実現している。
論文 参考訳(メタデータ) (2026-06-05T03:11:08Z) - Bridging Training and Merging Through Momentum-Aware Optimization [8.035521056416242]
大規模ニューラルネットワークとタスク固有の計算モデルのトレーニングには、パラメータの重要度推定が必要である。
トレーニング中に現在の計算曲率情報を処理し、それを破棄し、類似した情報をマージするために再計算する。
トレーニング中に運動量と曲率の統計を分解し、類似した情報をマージするために再計算する統合フレームワークを導入する。
論文 参考訳(メタデータ) (2025-12-18T22:37:33Z) - Topology Identification and Inference over Graphs [61.06365536861156]
グラフ上で進化するプロセスのトポロジの同定と推論は、脳、輸送、金融、電力、および社会的および情報ネットワークを含むタイムリーな応用に現れる。
本章では,多次元データに対するグラフトポロジ同定と統計的推測手法の概要について述べる。
論文 参考訳(メタデータ) (2025-12-11T00:47:09Z) - Semi-parametric Functional Classification via Path Signatures Logistic Regression [1.210026603224224]
本稿では,ベクトル値関数データを分類するための半パラメトリックフレームワークであるPath Signatures Logistic Regressionを提案する。
この結果は, 粗い経路理論を現代的な関数型データ解析に組み込むことの実用的, 理論的利点を浮き彫りにしたものである。
論文 参考訳(メタデータ) (2025-07-09T08:06:50Z) - Generalization Bounds of Surrogate Policies for Combinatorial Optimization Problems [53.03951222945921]
我々はスムーズな(摂動された)ポリシーを解析し、線形オラクルが使用する方向に対して制御されたランダムな摂動を付加する。
我々の主な貢献は、過剰リスクを摂動バイアス、統計的推定誤差、最適化誤差に分解する一般化境界である。
車両のスケジューリングやスムーズ化がトラクタブルトレーニングと制御された一般化の両方を可能にしていることを示す。
論文 参考訳(メタデータ) (2024-07-24T12:00:30Z) - Efficient Interpretable Nonlinear Modeling for Multiple Time Series [5.448070998907116]
本稿では,複数時系列に対する効率的な非線形モデリング手法を提案する。
異なる時系列変数間の非線形相互作用を含む。
実験結果から,提案アルゴリズムは相似的にVAR係数の支持値の同定を改善することが示された。
論文 参考訳(メタデータ) (2023-09-29T11:42:59Z) - Distributionally Robust Model-based Reinforcement Learning with Large
State Spaces [55.14361269378122]
強化学習における3つの大きな課題は、大きな状態空間を持つ複雑な力学系、コストのかかるデータ取得プロセス、トレーニング環境の展開から現実の力学を逸脱させることである。
広範に用いられているKullback-Leibler, chi-square, および全変分不確実性集合の下で, 連続状態空間を持つ分布ロバストなマルコフ決定過程について検討した。
本稿では,ガウス過程と最大分散削減アルゴリズムを用いて,多出力名目遷移力学を効率的に学習するモデルベースアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-05T13:42:11Z) - Deep Equilibrium Assisted Block Sparse Coding of Inter-dependent
Signals: Application to Hyperspectral Imaging [71.57324258813675]
相互依存信号のデータセットは、列が強い依存を示す行列として定義される。
ニューラルネットワークは、事前に構造として機能し、基礎となる信号相互依存性を明らかにするために使用される。
ディープ・アンローリングとディープ・平衡に基づくアルゴリズムが開発され、高度に解釈可能で簡潔なディープ・ラーニング・ベース・アーキテクチャを形成する。
論文 参考訳(メタデータ) (2022-03-29T21:00:39Z) - Multiplicative noise and heavy tails in stochastic optimization [62.993432503309485]
経験的最適化は現代の機械学習の中心であるが、その成功における役割はまだ不明である。
分散による離散乗法雑音のパラメータによく現れることを示す。
最新のステップサイズやデータを含む重要な要素について、詳細な分析を行い、いずれも最先端のニューラルネットワークモデルで同様の結果を示す。
論文 参考訳(メタデータ) (2020-06-11T09:58:01Z) - Dynamic Federated Learning [57.14673504239551]
フェデレートラーニング(Federated Learning)は、マルチエージェント環境における集中的なコーディネーション戦略の包括的用語として登場した。
我々は、各イテレーションにおいて、利用可能なエージェントのランダムなサブセットがそのデータに基づいてローカル更新を実行する、フェデレートされた学習モデルを考える。
集約最適化問題に対する真の最小化器上の非定常ランダムウォークモデルの下で、アーキテクチャの性能は、各エージェントにおけるデータ変動率、各エージェントにおけるモデル変動率、アルゴリズムの学習率に逆比例する追跡項の3つの要因によって決定されることを示す。
論文 参考訳(メタデータ) (2020-02-20T15:00:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。