論文の概要: Learning the Boundary of Solvability: Aligning LLMs to Detect Unsolvable Problems
- arxiv url: http://arxiv.org/abs/2512.01661v1
- Date: Mon, 01 Dec 2025 13:32:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.867872
- Title: Learning the Boundary of Solvability: Aligning LLMs to Detect Unsolvable Problems
- Title(参考訳): 解決可能性の境界を学習する:解決不可能な問題を検出するためのLLMの調整
- Authors: Dengyun Peng, Qiguang Chen, Bofei Liu, Jiannan Guan, Libo Qin, Zheng Yan, Jinhao Liu, Jianshu Zhang, Wanxiang Che,
- Abstract要約: 本研究では,実現可能な問題を解き,固有の矛盾を検知し,能力を超えたタスクを慎重に拒否するUnsolvableQAとUnsolvableRLを提案する。
具体的には、双トラック手法を用いて導出される、ペアで解決可能かつ解決不可能なインスタンスのデータセットであるUnsolvableQAを構築する。
このデータセット上に構築されたUnsolvableRLは,精度,未解決性,難易度を考慮した3つの報酬成分を備えた強化学習フレームワークである。
- 参考スコア(独自算出の注目度): 51.62477754641947
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ensuring LLM reliability requires not only solving complex problems but also recognizing when a problem is unsolvable. Current models often struggle to distinguish objective unsolvability (inherent contradictions in the problem) from subjective capability limitations (problems beyond the model's competence), which leads to hallucinations and overconfidence. To address this, we propose UnsolvableQA and UnsolvableRL to solve feasible problems, detect inherent contradictions, and prudently refuse tasks beyond capability. Specifically, we construct UnsolvableQA, a dataset of paired solvable and unsolvable instances derived via a dual-track methodology: programmatic generation for logic puzzles and a novel "Reverse Construction" method that injects contradictions into valid reasoning chains for mathematics. Building on this dataset, we introduce UnsolvableRL, a reinforcement learning framework with three reward components jointly accounting for accuracy, unsolvability, and difficulty. Empirical results show that our approach achieves near-perfect unsolvability detection while also improving accuracy on solvable tasks. Crucially, we identify Capability Collapse, demonstrating that explicit exposure to unsolvable data is indispensable for preventing models from becoming systematically overconfident. Our code and data are available at https://github.com/sfasfaffa/unsolvableQA.
- Abstract(参考訳): LLMの信頼性を保証するには、複雑な問題を解くだけでなく、問題が解決できないことを認識する必要がある。
現在のモデルは、客観的な未解決性(問題の本質的な矛盾)と主観的な能力の限界(モデルの能力を超える確率)を区別するのに苦労し、幻覚と過度な自信をもたらす。
そこで本研究では,実現可能な問題を解き,固有の矛盾を検知し,能力を超えたタスクを慎重に拒否するUnsolvableQAとUnsolvableRLを提案する。
具体的には、論理パズルのプログラム生成と、数学の有効な推論連鎖に矛盾を注入する新しい"リバースコンストラクション"手法という、双トラック手法によって導出されるペア解決可能および未解決のインスタンスのデータセットであるUnsolvableQAを構築する。
このデータセット上に構築されたUnsolvableRLは,精度,未解決性,難易度を考慮した3つの報酬成分を備えた強化学習フレームワークである。
実験結果から,本手法は解き易いタスクの精度を向上しつつ,ほぼ完全な解き易さ検出を実現することが示唆された。
重要なことに、我々は、解決不可能なデータへの明示的な露出が、モデルが体系的に過信されるのを防ぐのに不可欠であることを示すために、能力の崩壊を識別する。
私たちのコードとデータはhttps://github.com/sfasfaffa/unsolvableQA.comで公開されています。
関連論文リスト
- Thinker: Training LLMs in Hierarchical Thinking for Deep Search via Multi-Turn Interaction [57.67217258741752]
Thinkerはマルチターンインタラクションによるディープ検索のための階層的思考モデルである。
複素問題を独立に解ける部分確率に分解する。
サブプロブレム間の依存関係は、これらの論理関数を介してパラメータとして渡される。
論文 参考訳(メタデータ) (2025-11-11T07:48:45Z) - ReliableMath: Benchmark of Reliable Mathematical Reasoning on Large Language Models [70.33764118171463]
大きな言語モデル(LLM)は、解決不可能な問題やその能力を超える問題に直面した時に、信頼できない応答を作る傾向があります。
我々はオープンソースの解決可能問題と高品質の未解決問題を含むReliableMathデータセットを開発した。
LLMは解決不可能な問題を直接特定できず、常に生成された応答を生成する。
論文 参考訳(メタデータ) (2025-07-03T19:19:44Z) - EnigmaEval: A Benchmark of Long Multimodal Reasoning Challenges [17.056693711040747]
エニグマエスバル(EnigmaEval)は、パズル競技やイベントから派生した問題と解決策のデータセットである。
このデータセットは、暗黙の知識合成と多段階帰納的推論を実行するモデルの能力を探索する。
ベンチマークは1184のパズルで構成されており、複雑度は様々だ。
論文 参考訳(メタデータ) (2025-02-13T00:18:34Z) - MacGyver: Are Large Language Models Creative Problem Solvers? [87.70522322728581]
本稿では, 現代LLMの創造的問題解決能力について, 制約付き環境下で検討する。
我々は1,600以上の実世界の問題からなる自動生成データセットであるMACGYVERを作成する。
我々はLLMと人間の両方にコレクションを提示し、それらの問題解決能力を比較して比較する。
論文 参考訳(メタデータ) (2023-11-16T08:52:27Z) - Nonuniqueness and Convergence to Equivalent Solutions in Observer-based Inverse Reinforcement Learning [0.8943924354248618]
オンラインおよびリアルタイムに決定論的逆強化学習(IRL)問題を解決する上で重要な課題は、複数のソリューションの存在である。
非特異性は等価解の概念の研究を必要とする。
IRL問題のほぼ等価解に収束する正規化履歴スタックオブザーバを開発した。
論文 参考訳(メタデータ) (2022-10-28T17:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。