論文の概要: Scientific Knowledge-driven Decoding Constraints Improving the Reliability of LLMs
- arxiv url: http://arxiv.org/abs/2604.06603v1
- Date: Wed, 08 Apr 2026 02:38:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.303896
- Title: Scientific Knowledge-driven Decoding Constraints Improving the Reliability of LLMs
- Title(参考訳): LLMの信頼性を向上させる科学的知識駆動型復号法
- Authors: Maotian Ma, Zheni Zeng, Zhenghao Liu, Yukun Yan,
- Abstract要約: 大規模言語モデル(LLM)は、強力な知識保護とタスク解決能力を示しているが、それでも深刻な幻覚の課題に直面している。
主観的知識を強い制約と組み合わせたLLM生成法である textbfSciDC を提案する。
- 参考スコア(独自算出の注目度): 16.040771132830145
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large language models (LLMs) have shown strong knowledge reserves and task-solving capabilities, but still face the challenge of severe hallucination, hindering their practical application. Though scientific theories and rules can efficiently direct the behaviors of human manipulators, LLMs still do not utilize these highly-condensed knowledge sufficiently through training or prompting. To address this issue, we propose \textbf{SciDC}, an LLM generation method that integrate subject-specific knowledge with strong constraints. By adopting strong LLMs to automatically convert flexible knowledge into multi-layered, standardized rules, we build an extensible framework to effectively constrain the model generation on domain tasks. Experiments on scientific tasks including industrial formulation design, clinical tumor diagnosis and retrosynthesis planning, consistently demonstrate the effectiveness of our method, achieving a 12\% accuracy improvement on average compared with vanilla generation. We further discuss the potential of LLMs in automatically inductively summarizing highly-condensed knowledge, looking ahead to practical solutions for accelerating the overall scientific research process. All the code of this paper can be obtained (https://github.com/Maotian-Ma/SciDC).
- Abstract(参考訳): 大規模言語モデル(LLM)は、強力な知識保護とタスク解決能力を示してきたが、それでも深刻な幻覚の課題に直面しており、実践的な応用を妨げている。
科学的理論や規則は人間のマニピュレータの動作を効率的に導くことができるが、LLMはトレーニングやプロンプトを通じてこれらの高度に凝縮した知識を十分に利用していない。
この問題に対処するために,主観的知識を強い制約で統合する LLM 生成法である \textbf{SciDC} を提案する。
柔軟な知識を多層で標準化されたルールに自動的に変換するために強力なLLMを採用することで、ドメインタスクのモデル生成を効果的に制約する拡張可能なフレームワークを構築します。
工業的定式化設計,臨床腫瘍診断,レトロシンセプション計画などの科学的課題に関する実験は,バニラ生成と比較して平均12倍の精度向上を達成し,本手法の有効性を一貫して実証している。
さらに, 科学的研究プロセス全体を加速する実践的な解決策を期待しながら, 高密度知識を自動的に帰納的に要約するLLMの可能性についても論じる。
この論文のコードは、すべて入手できる(https://github.com/Maotian-Ma/SciDC)。
関連論文リスト
- KUDA: Knowledge Unlearning by Deviating Representation for Large Language Models [26.418820118903852]
大規模言語モデル(LLM)は、多種多様なコーパスの事前学習を通じて大量の知識を得る。
LLMのアンラーニングは、トレーニングデータにおける機密性、著作権、有害なコンテンツに関連するリスクを減らすための有望なテクニックである。
本研究では,LLMの知識レベルでの効果的な学習を実現するために,Deviating representAtion (KUDA) を用いた知識未学習を提案する。
論文 参考訳(メタデータ) (2026-02-22T17:16:49Z) - Detailed balance in large language model-driven agents [1.2687030176231846]
大規模言語モデル(LLM)によるエージェントは、複雑な問題を解決するための強力な新しいパラダイムとして登場しつつある。
本報告では, エージェント内に埋め込まれたLCMの生成方向を推定する手法を提案する。
論文 参考訳(メタデータ) (2025-12-10T20:04:23Z) - DySK-Attn: A Framework for Efficient, Real-Time Knowledge Updating in Large Language Models via Dynamic Sparse Knowledge Attention [2.168994673914057]
大きな言語モデル(LLM)は、その知識が静的で、すぐに時代遅れになるという限界に悩まされる。
我々は,LLMが動的外部ソースからリアルタイム知識を効率的に統合できる新しいフレームワークであるDySK-Attnを提案する。
論文 参考訳(メタデータ) (2025-08-10T05:22:38Z) - R1-Searcher: Incentivizing the Search Capability in LLMs via Reinforcement Learning [87.30285670315334]
textbfR1-Searcherは、大規模言語モデルの検索能力を高めるために設計された、2段階の結果に基づく新しいRLアプローチである。
本フレームワークは, コールドスタート時に, プロセス報酬や蒸留を必要とせず, RLのみに依存している。
提案手法は, クローズドソースGPT-4o-miniと比較して, 従来の強力なRAG法よりも有意に優れていた。
論文 参考訳(メタデータ) (2025-03-07T17:14:44Z) - KBM: Delineating Knowledge Boundary for Adaptive Retrieval in Large Language Models [69.99274367773997]
大規模言語モデル(LLM)は知識を動的に変化させ、未知の静的情報を扱うのにしばしば苦労する。
Retrieval-Augmented Generation (RAG) はこれらの課題に対処するために使われ、LLMの性能向上に大きな影響を与えている。
本稿では,ある質問の既知/未知を表現し,RAGを起動する必要があるかどうかを判断するための知識境界モデル(KBM)を提案する。
論文 参考訳(メタデータ) (2024-11-09T15:12:28Z) - LLMs are not Zero-Shot Reasoners for Biomedical Information Extraction [13.965777046473885]
大規模言語モデル(LLM)は、医療分野のアプリケーションにますます採用されている。
質問応答や文書要約といったタスクに関して、ドメインエキスパートのパフォーマンスに到達します。
LLMがバイオメディカル領域で伝統的に追求されるタスクでどの程度うまく機能するかは不明である。
論文 参考訳(メタデータ) (2024-08-22T09:37:40Z) - Supervised Knowledge Makes Large Language Models Better In-context Learners [94.89301696512776]
大規模言語モデル(LLM)は、素早い工学を通して、文脈内学習能力の出現を示す。
自然言語理解と質問応答におけるLLMの一般化性と事実性の向上という課題は、まだ未解決のままである。
本研究では, LLM の信頼性を高める枠組みを提案する。1) 分布外データの一般化,2) 差別モデルによる LLM のメリットの解明,3) 生成タスクにおける幻覚の最小化。
論文 参考訳(メタデータ) (2023-12-26T07:24:46Z) - Mitigating Large Language Model Hallucinations via Autonomous Knowledge
Graph-based Retrofitting [51.7049140329611]
本稿では,知識グラフに基づくリトロフィッティング(KGR)を提案する。
実験により,実QAベンチマークにおいて,KGRはLLMの性能を大幅に向上できることが示された。
論文 参考訳(メタデータ) (2023-11-22T11:08:38Z) - User-Controlled Knowledge Fusion in Large Language Models: Balancing
Creativity and Hallucination [5.046007553593371]
大規模言語モデル(LLM)は多様な、関連性があり、創造的な応答を生成する。
LLMの想像力と事実情報への固執のバランスを取ることは重要な課題である。
本稿では,LLMの想像能力と現実情報への忠実さのバランスを調節する,革新的なユーザ制御機構を提案する。
論文 参考訳(メタデータ) (2023-07-30T06:06:35Z) - Knowledge-Augmented Reasoning Distillation for Small Language Models in
Knowledge-Intensive Tasks [90.11273439036455]
大規模言語モデル(LLM)は知識集約推論タスクにおいて有望なパフォーマンスを示している。
外部知識ベースから得られた知識を付加したLPMから理性を生成するための,小型LMを微調整する新しい手法であるKARDを提案する。
我々は,KARDが知識集約型推論データセットにおいて,小さなT5モデルとGPTモデルの性能を著しく向上させることを示す。
論文 参考訳(メタデータ) (2023-05-28T13:00:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。