論文の概要: APCD: Adaptive Path-Contrastive Decoding for Reliable Large Language Model Generation
- arxiv url: http://arxiv.org/abs/2605.09492v1
- Date: Sun, 10 May 2026 11:57:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.277091
- Title: APCD: Adaptive Path-Contrastive Decoding for Reliable Large Language Model Generation
- Title(参考訳): APCD: 信頼性の高い大言語モデル生成のための適応パスコントラストデコーディング
- Authors: Tianyu Zheng, Hong Wu, Jiaji Zhong,
- Abstract要約: 大規模言語モデル(LLM)は、自動回帰復号における誤りの蓄積による幻覚に悩まされることが多い。
適応探索と制御された経路相互作用により出力信頼性を向上させる多経路復号化フレームワークである適応パスコントラスト復号(APCD)を提案する。
- 参考スコア(独自算出の注目度): 9.34156158035883
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) often suffer from hallucinations due to error accumulation in autoregressive decoding, where suboptimal early token choices misguide subsequent generation. Although multi-path decoding can improve robustness by exploring alternative trajectories, existing methods lack principled strategies for determining when to branch and how to regulate inter-path interactions. We propose Adaptive Path-Contrastive Decoding (APCD), a multi-path decoding framework that improves output reliability through adaptive exploration and controlled path interaction. APCD consists of two components: (1) Entropy-Driven Path Expansion, which delays branching until predictive uncertainty - measured by Shannon entropy over top candidate tokens - indicates multiple plausible continuations; and (2) Divergence-Aware Path Contrast, which encourages diverse reasoning trajectories while dynamically attenuating inter-path influence as prediction distributions diverge. Experiments on eight benchmarks demonstrate improved factual accuracy while maintaining decoding efficiency. Our code is available at https://github.com/zty-king/APCD.
- Abstract(参考訳): 大規模言語モデル(LLM)は、しばしば自己回帰復号における誤りの蓄積による幻覚に悩まされる。
マルチパスデコーディングは、代替トラジェクトリを探索することでロバスト性を向上させることができるが、既存の手法では、いつ分岐するか、どのようにパス間の相互作用を規制するかを決定するための原則的な戦略が欠如している。
適応探索と制御された経路相互作用により出力信頼性を向上させる多経路復号化フレームワークである適応パスコントラスト復号(APCD)を提案する。
APCDは,(1) 最上位候補トークンに対するシャノンエントロピーによって測定される分岐を遅延させるエントロピー駆動経路展開,(2) 予測分布が変化するにつれて経路間の影響を動的に減衰させ,多様な推論軌道を促進させるディバージェンス・アウェア・パス・コントラストの2つの構成要素から構成される。
8つのベンチマークの実験では、デコード効率を保ちながら、事実の精度が向上した。
私たちのコードはhttps://github.com/zty-king/APCDで利用可能です。
関連論文リスト
- PPO guided Agentic Pipeline for Adaptive Prompt Selection and Test Case Generation [0.30786914102688595]
本稿では,強化学習駆動型エージェントフレームワークを用いた新しいテストケース生成手法を提案する。
フェーズ1では、ToT誘導最適化エージェントが冗長性を取り除き、ソースコードを分割し、最小化する。
フェーズIIでは、8つの異なるプロンプト技術の中からプロンプトを選択する問題を解くために、PPOベースのポリシーネットワークを訓練する。
PPOエージェントは、ラインとブランチのカバレッジの増加、探索されていないブランチに対する罰則、ソースコードの長さを減らす報酬の組み合わせに基づいて報酬を受け取る。
論文 参考訳(メタデータ) (2026-05-01T06:19:51Z) - S-Path-RAG: Semantic-Aware Shortest-Path Retrieval Augmented Generation for Multi-Hop Knowledge Graph Question Answering [10.112212302226615]
S-Path-RAGは,大規模知識グラフ上でのマルチホップ質問応答を改善するためのフレームワークである。
S-Path-RAGは、有界長、意味的に重み付けされた候補経路を列挙することによって、一発のテキスト重み付き検索から離脱する。
我々は、標準的なマルチホップKGQAベンチマークと、改善と診断分析を通じてS-Path-RAGを検証する。
論文 参考訳(メタデータ) (2026-03-05T14:22:23Z) - Dynamic Delayed Tree Expansion For Improved Multi-Path Speculative Decoding [35.984745508100595]
本稿では,モデルファミリー,タスク,サンプリング体制間の検証戦略を体系的に評価する。
Traversal Verificationは、OTベースのメソッドがはるかに遅れているため、一貫して支配的だ。
我々は,部分的な単一経路を起草し,分岐点を遅らせる遅延木拡張を提案する。
論文 参考訳(メタデータ) (2026-02-19T01:41:58Z) - SAGE: Accelerating Vision-Language Models via Entropy-Guided Adaptive Speculative Decoding [15.734450444255787]
投機的復号化は、視覚言語モデルにおける推論を加速するための有望なアプローチとして現れている。
既存のメソッドはデコードプロセスを通して固定されている静的ツリー構造に依存している。
実時間予測の不確実性に基づいて投機木構造を動的に調整する新しいフレームワークであるSAGEを提案する。
論文 参考訳(メタデータ) (2026-01-31T05:35:40Z) - Beyond Confidence: Adaptive and Coherent Decoding for Diffusion Language Models [64.92045568376705]
コヒーレントコンテキストデコーディング(Coherent Contextual Decoding, CCD)は、2つのコアイノベーションに基づいて構築された新しい推論フレームワークである。
CCDは、歴史的文脈を活用してシーケンスコヒーレンスを高める軌道修正機構を採用している。
拡散ステップに基づく厳密なアロケーションの代わりに,各ステップのアンマスク予算を動的に調整する適応型サンプリング戦略を導入する。
論文 参考訳(メタデータ) (2025-11-26T09:49:48Z) - Unleashing the True Potential of LLMs: A Feedback-Triggered Self-Correction with Long-Term Multipath Decoding [4.220190655754022]
大規模言語モデル(LLM)は、様々なタスクで顕著なパフォーマンスを達成したが、推論中に誤ったコンテンツを生成することへの感受性は、決定的な未解決の課題である。
本稿では,ユーザフィードバックとデコードダイナミクスの強化を両立させる新しいフレームワークであるFeedback-Triggered Regeneration (FTR)を提案する。
具体的には、FTRは、負のユーザフィードバックを受けた場合にのみ応答再生を起動し、本来正しい出力を保持しながら、不良自己評価からのエラー伝播を回避する。
論文 参考訳(メタデータ) (2025-09-09T12:43:28Z) - Joint Transmit and Pinching Beamforming for Pinching Antenna Systems (PASS): Optimization-Based or Learning-Based? [89.05848771674773]
MISO (Multiple-input Single-output) フレームワークを提案する。
それは複数の導波路で構成されており、多数の低コストアンテナ(PA)を備えている。
PAの位置は、大規模パスと空間の両方にまたがるように再構成することができる。
論文 参考訳(メタデータ) (2025-02-12T18:54:10Z) - Semi-DETR: Semi-Supervised Object Detection with Detection Transformers [105.45018934087076]
半教師付き物体検出(SSOD)におけるDETRに基づくフレームワークの解析
本報告では,第1次変圧器を用いたエンド・ツー・エンド半教師対象検出器であるSemi-DETRについて述べる。
我々の手法は、最先端の手法をクリアマージンで上回る。
論文 参考訳(メタデータ) (2023-07-16T16:32:14Z) - Deep Metric Learning for Unsupervised Remote Sensing Change Detection [60.89777029184023]
リモートセンシング変化検出(RS-CD)は、マルチテンポラルリモートセンシング画像(MT-RSI)から関連する変化を検出することを目的とする。
既存のRS-CD法の性能は、大規模な注釈付きデータセットのトレーニングによるものである。
本稿では,これらの問題に対処可能なディープメトリック学習に基づく教師なしCD手法を提案する。
論文 参考訳(メタデータ) (2023-03-16T17:52:45Z) - Boosting Continuous Sign Language Recognition via Cross Modality
Augmentation [135.30357113518127]
連続手話認識は不整合のビデオテキストペアを扱う。
クロスモーダル拡張を用いた新しいアーキテクチャを提案する。
提案するフレームワークは、既存のCTCベースの連続SLRアーキテクチャに容易に拡張できる。
論文 参考訳(メタデータ) (2020-10-11T15:07:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。