論文の概要: Bethe Ansatz with a Large Language Model
- arxiv url: http://arxiv.org/abs/2603.29932v1
- Date: Tue, 31 Mar 2026 16:06:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.839043
- Title: Bethe Ansatz with a Large Language Model
- Title(参考訳): 大規模言語モデルによるAnsatzの実現
- Authors: Balázs Pozsgay, István Vona,
- Abstract要約: 数理物理学における特定の計算を行うための大規模言語モデルの能力について検討する。
タスクは、選択された可積分スピンチェーンモデルの座標Bethe Ansatz解を計算することである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We explore the capability of a Large Language Model (LLM) to perform specific computations in mathematical physics: the task is to compute the coordinate Bethe Ansatz solution of selected integrable spin chain models. We select three integrable Hamiltonians for which the solutions were unpublished; two of the Hamiltonians are actually new. We observed that the LLM semi-autonomously solved the task in all cases, with a few mistakes along the way. These were corrected after the human researchers spotted them. The results of the LLM were checked against exact diagonalization (performed by separate programs), and the derivations were also checked by the authors. The Bethe Ansatz solutions are interesting in themselves. Our second model manifestly breaks left-right invariance, but it is PT-symmetric, therefore its solution could be interesting for applications in Generalized Hydrodynamics. And our third model is solved by a special form of the nested Bethe Ansatz, where the model is interacting, but the nesting level has a free fermionic structure lacking $U(1)$-invariance. This structure appears to be unique and it was found by the LLM. We used ChatGPT 5.2 Pro and 5.4 Pro by OpenAI.
- Abstract(参考訳): 数理物理学における特定の計算を行うためのLarge Language Model (LLM) の能力について考察する。
解が公表されていない3つの可積分ハミルトニアンを選びます。
LLMは全ケースで半自動でタスクを解決し、途中でいくつかのミスを犯した。
人類の研究者たちが発見し、修正されました。
LLMの結果は、正確な対角化(個別のプログラムによって実行される)に対してチェックされ、その導出も著者によってチェックされた。
ベーテ・アンザッツの解はそれ自体が興味深い。
2つ目のモデルは明らかに左右の不変性を破るが、PT対称であるため、一般流体力学の応用にはその解が興味深い可能性がある。
3番目のモデルは、モデルが相互作用しているネストされたベテ・アンザッツの特別な形式によって解決されるが、ネストレベルは自由フェルミオン構造を持ち、$U(1)$-不変性を欠いている。
この構造は独特なようで、LLMによって発見された。
OpenAIではChatGPT 5.2 Proと5.4 Proを使用しました。
関連論文リスト
- Model Capability Dominates: Inference-Time Optimization Lessons from AIMO 3 [0.3142545134917645]
複数のLLM試行に対する多数決は数学的推論を改善するが、相関誤差は有効サンプルサイズを制限する。
自然な修正: 異なる有権者に構造的に異なる推論戦略を割り当て、誤りを訂正する。
AIMO3コンペティションでは、3つのモデル、23以上の実験、50 IMOレベルの問題を1つのH100 80GBで5時間制限でテストしています。
論文 参考訳(メタデータ) (2026-03-29T20:05:18Z) - Model Stealing for Any Low-Rank Language Model [25.16701867917684]
我々は、単純で数学的に計算可能な設定を研究することによって、言語モデルを盗むという理論的理解を構築する。
我々の主な成果は、低ランク分布を学習するための条件付きクエリモデルにおける効率的なアルゴリズムである。
これは、少なくとも理論的には、推論時に機械学習モデルがより複雑な問題を解くことができるという興味深い例である。
論文 参考訳(メタデータ) (2024-11-12T04:25:31Z) - Self-Ensembling Gaussian Splatting for Few-Shot Novel View Synthesis [55.561961365113554]
3D Gaussian Splatting (3DGS) は新規ビュー合成(NVS)において顕著な効果を示した
本稿では,Self-Ensembling Gaussian Splatting(SE-GS)を紹介する。
我々は,トレーニング中に不確実性を認識した摂動戦略を導入することで,自己理解を実現する。
LLFF, Mip-NeRF360, DTU, MVImgNetデータセットによる実験結果から, 本手法がNVSの品質を向上させることを示す。
論文 参考訳(メタデータ) (2024-10-31T18:43:48Z) - Bethe ansatz solutions and hidden $sl(2)$ algebraic structure for a
class of quasi-exactly solvable systems [0.638421840998693]
我々は、以前の文献では奇妙な解がほとんど見逃されていたモデルのクラスを再検討する。
これらのモデルの奇数セクターおよび偶数セクターに対する体系的かつ統一的な処理を提案する。
また、モデルパラメータの空間におけるベーテ・アンザッツ方程式の解の解析も進行する。
論文 参考訳(メタデータ) (2023-09-21T02:04:44Z) - Exact solution of the Bose Hubbard model with unidirectional hopping [4.430341888774933]
一方向ホッピングを持つ1次元ボース・ハバードモデルは、正確に解けることが示されている。
モデルの可積分性を証明し、ベーテ・アンザッツ方程式を導出する。
正確な固有値スペクトルはこれらの方程式を解くことで得られる。
論文 参考訳(メタデータ) (2023-04-30T09:50:51Z) - How Can We Know When Language Models Know? On the Calibration of
Language Models for Question Answering [80.82194311274694]
言語モデルがいつ、自信を持って、特定のクエリに対する答えを知っているか、どのように知ることができるか?
我々は,T5,BART,GPT-2の3つの強力な生成モデルを検討した。
次に、そのようなモデルの校正方法を検討し、その信頼性スコアを正しさの確率と相関させる。
論文 参考訳(メタデータ) (2020-12-02T03:53:13Z) - Model-Based Multi-Agent RL in Zero-Sum Markov Games with Near-Optimal
Sample Complexity [67.02490430380415]
モデルに基づくMARLは、Nash平衡値(NE)を求めるために$tilde O(|S||B|(gamma)-3epsilon-2)$のサンプル複雑性を実現する。
また、アルゴリズムが報酬に依存しない場合、そのようなサンプル境界は最小値(対数因子まで)であり、アルゴリズムは報酬知識のない遷移サンプルを問合せする。
論文 参考訳(メタデータ) (2020-07-15T03:25:24Z) - Hardness of Random Optimization Problems for Boolean Circuits,
Low-Degree Polynomials, and Langevin Dynamics [78.46689176407936]
アルゴリズムの族は高い確率でほぼ最適な解を生成できないことを示す。
ブール回路の場合、回路複雑性理論で知られている最先端境界を改善する。
論文 参考訳(メタデータ) (2020-04-25T05:45:59Z) - AvgOut: A Simple Output-Probability Measure to Eliminate Dull Responses [97.50616524350123]
機能エンジニアリングなしで、どの発話やトークンが退屈であるかを動的に認識する対話モデルを構築します。
最初のモデルMinAvgOutは、各バッチの出力分布を通して、ダイバーシティスコアを直接最大化する。
第2のモデルであるラベルファインチューニング(LFT)は、多様性スコアによって連続的にスケールされたラベルをソースシーケンスにプリペイドし、多様性レベルを制御する。
3つ目のモデルであるRLは強化学習を採用し、多様性スコアを報奨信号として扱う。
論文 参考訳(メタデータ) (2020-01-15T18:32:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。