論文の概要: Dataset Cartography for Large Language Model Alignment: Mapping and Diagnosing Preference Data
- arxiv url: http://arxiv.org/abs/2505.23114v1
- Date: Thu, 29 May 2025 05:33:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.694918
- Title: Dataset Cartography for Large Language Model Alignment: Mapping and Diagnosing Preference Data
- Title(参考訳): 大規模言語モデルアライメントのためのデータセットカルトグラフィー:マッピングと参照データの診断
- Authors: Seohyeong Lee, Eunwon Kim, Hwaran Lee, Buru Chang,
- Abstract要約: 人間の嗜好データは、大きな言語モデルと人間の価値の整合において重要な役割を果たす。
本稿では,GPT-4o支援ツールであるアライメントデータマップについて紹介する。
- 参考スコア(独自算出の注目度): 12.113905795672899
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human preference data plays a critical role in aligning large language models (LLMs) with human values. However, collecting such data is often expensive and inefficient, posing a significant scalability challenge. To address this, we introduce Alignment Data Map, a GPT-4o-assisted tool for analyzing and diagnosing preference data. Using GPT-4o as a proxy for LLM alignment, we compute alignment scores for LLM-generated responses to instructions from existing preference datasets. These scores are then used to construct an Alignment Data Map based on their mean and variance. Our experiments show that using only 33 percent of the data, specifically samples in the high-mean, low-variance region, achieves performance comparable to or better than using the entire dataset. This finding suggests that the Alignment Data Map can significantly improve data collection efficiency by identifying high-quality samples for LLM alignment without requiring explicit annotations. Moreover, the Alignment Data Map can diagnose existing preference datasets. Our analysis shows that it effectively detects low-impact or potentially misannotated samples. Source code is available online.
- Abstract(参考訳): 人間の嗜好データは、大きな言語モデル(LLM)と人間の価値の整合において重要な役割を果たす。
しかし、そのようなデータ収集は高価で非効率であり、大きなスケーラビリティの課題を招いている。
そこで我々は,GPT-4o支援ツールであるAlignment Data Mapを紹介した。
LLMアライメントのプロキシとして GPT-4o を用いて,既存の選好データセットからの指示に対する LLM 生成応答のアライメントスコアを算出する。
これらのスコアは、その平均と分散に基づいてアライメントデータマップを構築するために使用される。
実験の結果、特に高平均低分散領域のサンプルであるデータのわずか33%を使用することで、データセット全体よりもパフォーマンスが向上することがわかった。
この結果は、アライメントデータマップが明示的なアノテーションを必要とせず、LCMアライメントのための高品質なサンプルを識別することで、データ収集効率を著しく向上させることができることを示唆している。
さらに、アライメントデータマップは、既存の好みデータセットを診断することができる。
分析の結果,低インパクトあるいは誤記の可能性のあるサンプルを効果的に検出できることが判明した。
ソースコードはオンラインで入手できる。
関連論文リスト
- Efficient Alignment of Large Language Models via Data Sampling [0.4915744683251149]
本稿では,少数の高品質サブセットを同定し,効率的なアライメントのための情報理論に基づく手法を提案する。
提案手法を用いたモデルでは,他のサンプリング手法よりも優れた性能を示し,全データセットに対応するモデルに匹敵する性能を示した。
論文 参考訳(メタデータ) (2024-11-15T19:36:15Z) - Magpie: Alignment Data Synthesis from Scratch by Prompting Aligned LLMs with Nothing [48.07915731998946]
我々はMagpieという名の大規模アライメントデータを生成する自己合成法を提案する。
我々はこの手法を用いてLlama-3-Instructを誘導し、対応する応答とともに400万の命令を生成する。
以上の結果から,Magpieを微調整したモデルでは,公式のLlama-3-8B-インストラクトと同等に動作することが示唆された。
論文 参考訳(メタデータ) (2024-06-12T17:52:30Z) - Spread Preference Annotation: Direct Preference Judgment for Efficient LLM Alignment [72.99676237703099]
大規模言語モデルと人間の嗜好の整合性を高める新しいフレームワークを提案する。
私たちのキーとなるアイデアは、小さな(種)データの中で人間の事前知識を活用することです。
本稿では,ノイズ認識型選好学習アルゴリズムを導入し,生成した選好データにおける品質低下のリスクを軽減する。
論文 参考訳(メタデータ) (2024-06-06T18:01:02Z) - No More Distractions: an Adaptive Up-Sampling Algorithm to Reduce Data
Artifacts [3.9777369380822956]
SNLIデータを解析し,その相関関係を可視化した。
データアーチファクトの修正に適応的なアップサンプリングアルゴリズムを提案する。
SNLIデータにおけるデータアーチファクトの修正にアルゴリズムを適用した実験を行った。
論文 参考訳(メタデータ) (2024-01-25T02:54:53Z) - Data Selection for Language Models via Importance Resampling [90.9263039747723]
我々は、望まれるターゲット分布に合わせるために、大規模な未ラベルデータセットのサブセットを選択するという問題を形式化する。
我々は、LMデータ選択のために低次元で使用される古典的な重要度再サンプリング手法を拡張した。
DSIRフレームワークをhash n-gram機能でインスタンス化し、4.5時間で1億のドキュメントを選択できる。
論文 参考訳(メタデータ) (2023-02-06T23:57:56Z) - LiDAR dataset distillation within bayesian active learning framework:
Understanding the effect of data augmentation [63.20765930558542]
アクティブラーニング(AL)は、アノテーションコストとデータセットサイズの削減に対処するため、最近再び注目されている。
本稿では,大規模なセマンティックKITTIデータセットの1/4分の1でALベースのデータセット蒸留を原理的に評価する。
我々は、選択したデータセット構成からのサンプルの60%のみを使用して、データ拡張が完全なデータセット精度を達成することを観察した。
論文 参考訳(メタデータ) (2022-02-06T00:04:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。