論文の概要: Aligning with Your Own Voice: Self-Corrected Preference Learning for Hallucination Mitigation in LVLMs
- arxiv url: http://arxiv.org/abs/2604.24395v1
- Date: Mon, 27 Apr 2026 12:22:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.995402
- Title: Aligning with Your Own Voice: Self-Corrected Preference Learning for Hallucination Mitigation in LVLMs
- Title(参考訳): 自分の声に合わせる:LVLMにおける幻覚軽減のための自己修正された選好学習
- Authors: Byeonggeuk Lim, JungMin Yun, Junehyoung Kwon, Kyeonghyun Kim, YoungBin Kim,
- Abstract要約: LVLM(Large Vision-Language Models)はしばしば幻覚に悩まされる。
既存の嗜好学習ベースのアプローチは、嗜好データセットを構築するためのプロプライエタリなモデルに大きく依存している。
本稿では,本モデルの本質的な知識から導かれる分布内データを用いて,LVLMを整列するフレームワークであるVErified Self-correction DPO (AVES-DPO)を提案する。
提案手法では,多様な幻覚の診断にコンセンサスに基づく検証機構を用い,モデルを自己修正し,内部分布と厳密に整合した選好ペアを生成する。
- 参考スコア(独自算出の注目度): 17.56508975962831
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Vision-Language Models (LVLMs) frequently suffer from hallucinations. Existing preference learning-based approaches largely rely on proprietary models to construct preference datasets. We identify that this reliance introduces a distributional mismatch between the proprietary and target models that hinders efficient alignment. To address this, we propose Alignment via VErified Self-correction DPO (AVES-DPO), a framework that aligns LVLMs using in-distribution data derived from the model's intrinsic knowledge. Our approach employs a consensus-based verification mechanism to diagnose diverse hallucinations and guides the model to self-correct, thereby generating preference pairs strictly compatible with its internal distribution. Extensive experiments demonstrate that AVES-DPO surpasses existing baselines in hallucination mitigation while requiring only 5.2k samples.
- Abstract(参考訳): LVLM(Large Vision-Language Models)はしばしば幻覚に悩まされる。
既存の嗜好学習ベースのアプローチは、嗜好データセットを構築するためのプロプライエタリなモデルに大きく依存している。
我々は、この依存が、効率的なアライメントを妨げるプロプライエタリモデルとターゲットモデルの間に分布的ミスマッチをもたらすことを確認した。
そこで本研究では,本モデル固有の知識から得られた分布内データを用いてLVLMを整列するフレームワークであるVErified Self-correction DPO (AVES-DPO) によるアライメントを提案する。
提案手法では,多様な幻覚の診断にコンセンサスに基づく検証機構を用い,モデルを自己修正し,内部分布と厳密に整合した選好ペアを生成する。
大規模な実験では、AVES-DPOは5.2kサンプルしか必要とせず、幻覚の緩和において既存のベースラインを超えることが示されている。
関連論文リスト
- Dual-Teacher Distillation with Subnetwork Rectification for Black-Box Domain Adaptation [69.7036779439312]
ブラックボックスドメイン適応は、非常に実用的で非常に困難な設定である。
ブラックボックスソースモデルに埋め込まれた特定の知識を活用するサブネットワーク整合モデル(DDSR)を用いた二重蒸留法を提案する。
我々の手法は、ソースデータやモデルの使用を含む、最先端の手法に対する一貫した改善を実証する。
論文 参考訳(メタデータ) (2026-03-24T07:54:19Z) - SEM: Sparse Embedding Modulation for Post-Hoc Debiasing of Vision-Language Models [36.40093869747498]
本稿では,スパースオートエンコーダの潜在空間で動作するポストホック・ゼロショット脱バイアスフレームワークであるスパース埋め込み変調(SEM)を提案する。
SEMは、クエリ関連ニューロンを保持しながらバイアス関連ニューロンを特定し、調節する。
この結果から,疎度な潜在表現は,視覚言語モデルのポストホックなデバイアス化に有効な基盤となることが示唆された。
論文 参考訳(メタデータ) (2026-03-19T15:28:08Z) - Did Models Sufficient Learn? Attribution-Guided Training via Subset-Selected Counterfactual Augmentation [61.248535801314375]
Subset-Selected Counterfactual Augmentation (SS-CA)
我々は,モデル予測を選択的に変更可能な最小空間領域集合を識別するために,対実的LIMAを開発した。
実験により,SS-CAは分布内テストデータ(ID)の一般化を改善し,分布外ベンチマーク(OOD)において優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2025-11-15T08:39:22Z) - Mitigating Hallucinations in Large Vision-Language Models by Self-Injecting Hallucinations [73.37711261605271]
幻覚緩和法は主に嗜好アライメントに基づいており、嗜好データ収集には外部の人間のアノテーションや補助モデルが必要である。
本稿では,外部依存を伴わない幻覚を緩和する新規で一般化可能な手法である自己注入による自律的選好アライメント(APASI)を提案する。
APASIはターゲットのLVLMを利用して、生成した応答に幻覚を自己注入し、好みのレベルが異なるペアの応答を生成する。
論文 参考訳(メタデータ) (2025-09-14T14:26:53Z) - OViP: Online Vision-Language Preference Learning for VLM Hallucination [44.14029765850719]
大型視覚言語モデル(LVLM)は幻覚に弱いままであり、しばしば視覚入力と一致しないコンテンツを生成する。
本稿では,モデル自身の幻覚に基づいて,コントラスト学習データを動的に構築するオンラインビジョン言語嗜好学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-21T19:26:09Z) - Self-NPO: Negative Preference Optimization of Diffusion Models by Simply Learning from Itself without Explicit Preference Annotations [60.143658714894336]
拡散モデルは、画像、ビデオ、および3Dコンテンツ生成を含む様々な視覚生成タスクにおいて顕著な成功を収めている。
優先度最適化(PO)は、これらのモデルを人間の嗜好に合わせることを目的とした、顕著で成長している研究分野である。
モデル自体からのみ学習する負の選好最適化アプローチであるSelf-NPOを導入する。
論文 参考訳(メタデータ) (2025-05-17T01:03:46Z) - Multimodal Preference Data Synthetic Alignment with Reward Model [23.978820500281213]
本稿では,DPOトレーニングによる効果的なマルチモーダルアライメントのための人選好のプロキシとして,報酬モデルを用いて合成データを生成する新しいフレームワークを提案する。
実験結果から、生成モデルや報酬モデルのような選択された合成データの統合は、人手による注釈付きデータへの依存を効果的に軽減できることが示された。
論文 参考訳(メタデータ) (2024-12-23T09:29:40Z) - Self-Augmented Preference Optimization: Off-Policy Paradigms for Language Model Alignment [104.18002641195442]
既存のペアデータを必要としない、効果的でスケーラブルなトレーニングパラダイムである自己拡張型優先度最適化(SAPO)を導入する。
負の反応を自律的に生成するセルフプレイの概念に基づいて、我々はさらに、データ探索とエクスプロイトを強化するために、非政治的な学習パイプラインを組み込む。
論文 参考訳(メタデータ) (2024-05-31T14:21:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。