論文の概要: Convex Compositional Reasoning Models
- arxiv url: http://arxiv.org/abs/2605.23395v2
- Date: Mon, 25 May 2026 08:06:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 16:32:38.053132
- Title: Convex Compositional Reasoning Models
- Title(参考訳): 凸構成推論モデル
- Authors: Meir Roketlishvili, Semyon Semenov, Maksim Bobrin, Viktor Kovalchuk, Albert Baichorov, Abduragim Shtanchaev, Fakhri Karray, Dmitry V. Dylov, Martin Takáč, Arip Asadulaev,
- Abstract要約: 構成エネルギーに基づくモデルは,多くの局所的制約にまたがる学習因子エネルギーにより,より大きな推論問題に一般化可能であることを示す。
凸性は大域的な和の下で保存されるため、大域的な一階最適化が可能となる。
- 参考スコア(独自算出の注目度): 8.508815294591221
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Compositional energy-based models can generalize to larger combinatorial reasoning problems by reusing a learned factor energy across many local constraints. In our paper, we show that a key bottleneck in compositional reasoning is not composition itself, but the non-convex geometry of the learned energy landscape. To solve this problem, we introduce Convex Compositional Energy Minimization (CCEM), a framework that parameterizes each factor with an input-convex neural network and optimizes the composed energy over a tight convex relaxation of the feasible set. Because convexity is preserved under summation, the global relaxed objective remains convex, enabling deterministic projected first-order optimization. CCEM is trained in two stages: factor-level contrastive learning to shape local energy basins, followed by end-to-end refinement through an unrolled projected solver. Our experiments show that our models trained on small subproblems or a single problem size transfer to larger instances without retraining.
- Abstract(参考訳): 構成エネルギーに基づくモデルは、多くの局所的な制約を越えて学習された因子エネルギーを再利用することにより、より大きな組合せ推論問題に一般化することができる。
本稿では, 構成的推論における重要なボトルネックは, 構成そのものではなく, 学習エネルギー景観の非凸幾何学であることを示す。
この問題を解決するために、入力凸ニューラルネットワークを用いて各因子をパラメータ化し、構成エネルギーを構成可能な集合の厳密な凸緩和により最適化するフレームワークであるConvex Compositional Energy Minimization (CCEM)を導入する。
凸性は和の下で保存されるので、大域的緩和の対象は凸であり、決定論的一階最適化が可能となる。
CCEMは、局所的なエネルギー盆地を形成するための因子レベルのコントラスト学習と、未学習のプロジェクターによるエンドツーエンドの改良の2段階で訓練されている。
実験の結果、我々のモデルは小さなサブプロブレムや単一問題サイズでトレーニングされ、再訓練せずにより大きなインスタンスに転送されることがわかった。
関連論文リスト
- Diagonalizing the Softmax: Hadamard Initialization for Tractable Cross-Entropy Dynamics [29.85277126753054]
クロスエントロピー(CE)損失はディープラーニングを支配しているが、既存の理論はしばしば単純化に依存している。
標準的なニューラルネットワークベクトルを持つ標準ネットワークの詳細な特徴付けを行う。
論文 参考訳(メタデータ) (2025-12-03T17:45:09Z) - A Saddle Point Remedy: Power of Variable Elimination in Non-convex Optimization [37.51825281790747]
ローカルなミニマではなく、サドルポイントの拡散は、機械学習の大規模非最適化における障害である。
我々は, 変動除去が, 縮小した景観において, 決定的な最大質量を根本的に再認識することを示した。
論文 参考訳(メタデータ) (2025-11-03T05:19:43Z) - Generalizable Reasoning through Compositional Energy Minimization [91.76056742068813]
一般化は機械学習、特に推論タスクにおいて重要な課題である。
より小さく、よりトラクタブルなサブプロブレムの解空間上のエネルギーランドスケープを学習することで一般化を推論する新しい手法を提案する。
提案手法は既存の最先端手法よりも優れており,より大規模で複雑な問題に一般化できることを示す。
論文 参考訳(メタデータ) (2025-10-23T14:38:36Z) - MAP Image Recovery with Guarantees using Locally Convex Multi-Scale Energy (LC-MUSE) Model [12.218356507147583]
データ多様体の周囲の局所的に強く凸したマルチスケールの深部エネルギーモデルを提案する。
画像に基づく逆問題では学習エネルギーモデルを使用し、定式化はいくつかの望ましい性質を提供する。
並列磁気共鳴(MR)画像再構成の文脈において,提案手法は最先端の凸正則化器よりも優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2025-02-05T16:00:55Z) - Sample Complexity for Quadratic Bandits: Hessian Dependent Bounds and
Optimal Algorithms [64.10576998630981]
最適なヘッセン依存型サンプルの複雑さを, 初めて厳密に評価した。
ヘシアン非依存のアルゴリズムは、すべてのヘシアンインスタンスに対して最適なサンプル複雑さを普遍的に達成する。
本アルゴリズムにより得られたサンプルの最適複雑さは,重み付き雑音分布においても有効である。
論文 参考訳(メタデータ) (2023-06-21T17:03:22Z) - The star-shaped space of solutions of the spherical negative perceptron [4.511197686627054]
低エネルギー構成が複雑な連結構造によく見られることを示す。
我々は、他のほとんどの解と連結された非定型ハイマージンの部分集合を同定する。
論文 参考訳(メタデータ) (2023-05-18T00:21:04Z) - D4FT: A Deep Learning Approach to Kohn-Sham Density Functional Theory [79.50644650795012]
コーンシャム密度汎関数論(KS-DFT)を解くための深層学習手法を提案する。
このような手法はSCF法と同じ表現性を持つが,計算複雑性は低下する。
さらに,本手法により,より複雑なニューラルベース波動関数の探索が可能となった。
論文 参考訳(メタデータ) (2023-03-01T10:38:10Z) - Optimization Induced Equilibrium Networks [76.05825996887573]
暗黙の方程式によって定義されるディープニューラルネットワーク(DNN)のような暗黙の平衡モデルは最近ますます魅力的になりつつある。
我々は,パラメータが少ない場合でも,OptEqが従来の暗黙的モデルより優れていることを示す。
論文 参考訳(メタデータ) (2021-05-27T15:17:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。