論文の概要: SelectLLM: Can LLMs Select Important Instructions to Annotate?
- arxiv url: http://arxiv.org/abs/2401.16553v1
- Date: Mon, 29 Jan 2024 20:44:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-31 17:03:46.357364
- Title: SelectLLM: Can LLMs Select Important Instructions to Annotate?
- Title(参考訳): SelectLLM: LLMはアノテーションに重要な命令を選択できるか?
- Authors: Ritik Sachin Parkar, Jaehyung Kim, Jong Inn Park, Dongyeop Kang
- Abstract要約: 大規模言語モデル(LLM)を大規模かつ多様な命令データセットで訓練することは、人間の指示を理解し、従うためにモデルを整列させる。
近年の研究では、小さな高品質な命令セットを使用することで、大きいがノイズの多い命令よりも優れた性能が得られることが示されている。
命令はラベルなしであり、その応答は自然なテキストであるため、モデルの信頼性を持つ従来のアクティブラーニングスキームはラベルなし命令の選択に直接適用できない。
- 参考スコア(独自算出の注目度): 21.432646818975016
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Training large language models (LLMs) with a large and diverse instruction
dataset aligns the models to comprehend and follow human instructions. Recent
works have shown that using a small set of high-quality instructions can
outperform using large yet more noisy ones. Because instructions are unlabeled
and their responses are natural text, traditional active learning schemes with
the model's confidence cannot be directly applied to the selection of unlabeled
instructions. In this work, we propose a novel method for instruction
selection, called SelectLLM, that leverages LLMs for the selection of
high-quality instructions. Our high-level idea is to use LLMs to estimate the
usefulness and impactfulness of each instruction without the corresponding
labels (i.e., responses), via prompting. SelectLLM involves two steps: dividing
the unlabelled instructions using a clustering algorithm (e.g., CoreSet) to
multiple clusters, and then prompting LLMs to choose high-quality instructions
within each cluster. SelectLLM showed comparable or slightly better performance
on the popular instruction benchmarks, compared to the recent state-of-the-art
selection methods. All code and data are publicly available
(https://github.com/minnesotanlp/select-llm).
- Abstract(参考訳): 大規模かつ多様な命令データセットを用いた大規模言語モデル(llm)のトレーニングは、モデルを理解し、人間の指示に従うように調整する。
近年の研究では、小さな高品質な命令セットを使用することで、大きいがノイズの多い命令よりも優れた性能が得られることが示されている。
命令はラベルなしであり、その応答は自然なテキストであるため、モデルの信頼性を持つ従来のアクティブラーニングスキームはラベルなし命令の選択に直接適用できない。
本研究では,高品質な命令の選択にLLMを利用するSelectLLMという命令選択手法を提案する。
我々の高レベルな考え方は、プロンプトによって対応するラベル(応答)を使わずに各命令の有効性と影響を推定するためにLSMを使うことである。
selectllmには2つのステップがある: クラスタアルゴリズム(coresetなど)を使用してラベルなしの命令を複数のクラスタに分割し、llmに各クラスタ内で高品質な命令を選択するように促す。
SelectLLMは、最近の最先端の選択方法と比較して、一般的な命令ベンチマークで同等またはわずかにパフォーマンスが向上した。
すべてのコードとデータは公開されている(https://github.com/minnesotanlp/select-llm)。
関連論文リスト
- On Unsupervised Prompt Learning for Classification with Black-box Language Models [71.60563181678323]
大規模言語モデル(LLM)は、テキスト形式学習問題において顕著な成功を収めた。
LLMは、熟練した人間のアノテータよりも品質の高いデータセットをラベル付けすることができる。
本稿では,ブラックボックス LLM を用いた分類のための教師なしのプロンプト学習を提案する。
論文 参考訳(メタデータ) (2024-10-04T03:39:28Z) - SELF-GUIDE: Better Task-Specific Instruction Following via Self-Synthetic Finetuning [70.21358720599821]
大規模言語モデル(LLM)は、適切な自然言語プロンプトを提供する際に、多様なタスクを解決するという約束を持っている。
学生LLMからタスク固有の入出力ペアを合成する多段階メカニズムであるSELF-GUIDEを提案する。
ベンチマークの指標から,分類タスクに約15%,生成タスクに18%の絶対的な改善を報告した。
論文 参考訳(メタデータ) (2024-07-16T04:41:58Z) - Boosting Zero-Shot Crosslingual Performance using LLM-Based Augmentations with Effective Data Selection [23.575482348558904]
大きな言語モデル(LLM)は、非常に熟練したテキストジェネレータである。
ゼロショットプロンプトによるタスク固有のデータ生成にこの機能を活用します。
感情分析や自然言語推論タスクにおいて,顕著なパフォーマンス向上が観察された。
論文 参考訳(メタデータ) (2024-07-15T10:00:22Z) - LLM-Select: Feature Selection with Large Language Models [64.5099482021597]
大規模言語モデル(LLM)は、データサイエンスの標準ツールに匹敵するパフォーマンスで、最も予測可能な機能を選択することができる。
以上の結果から,LSMはトレーニングに最適な機能を選択するだけでなく,そもそもどの機能を収集すべきかを判断する上でも有用である可能性が示唆された。
論文 参考訳(メタデータ) (2024-07-02T22:23:40Z) - Logit Separability-Driven Samples and Multiple Class-Related Words Selection for Advancing In-Context Learning [0.0]
本稿では,ロジットレベルのサンプルとクラス関連単語の明瞭度を評価するための基準であるロジット分離性を導入する。
各サンプルに複数のクラス関連語を組み込むことで,より広い範囲のラベル情報を提供することで,性能の向上が期待できる。
サンプルを共同で整理し,複数のクラス関連単語を各サンプルラベルペアに統合する,ロジット分離性に基づくlicLを提案する。
論文 参考訳(メタデータ) (2024-06-16T12:11:46Z) - Large Language Model-guided Document Selection [23.673690115025913]
大規模言語モデル(LLM)の事前学習は、ますます増加する計算予算を消費する。
近年の研究では、ドキュメントの選択がFLOPのごく一部で同等のモデル品質を実現することが実証されている。
拡張性のある汎用ドメイン文書選択のための有望な方向を探究する。
論文 参考訳(メタデータ) (2024-06-07T04:52:46Z) - CodecLM: Aligning Language Models with Tailored Synthetic Data [51.59223474427153]
命令追従能力のための高品質な合成データを適応的に生成するフレームワークであるCodecLMを紹介する。
まず、ターゲットの指示分布をキャプチャするために、オンザフライで生成された簡潔なキーワードであるメタデータにシード命令をエンコードする。
また、デコード中に自己論理とコントラストフィルタを導入し、データ効率の良いサンプルを調整する。
論文 参考訳(メタデータ) (2024-04-08T21:15:36Z) - LLMaAA: Making Large Language Models as Active Annotators [32.57011151031332]
本稿では,大規模な言語モデルをアノテータとして利用し,それをアクティブな学習ループに配置して,アノテートを効率的に行うLLMaAAを提案する。
我々は、エンティティ認識と関係抽出という、2つの古典的NLPタスクの実験と分析を行う。
LLMaAAでは、LLM生成ラベルからトレーニングされたタスク固有のモデルが、数百の注釈付きサンプルで教師より優れている。
論文 参考訳(メタデータ) (2023-10-30T14:54:15Z) - From Quantity to Quality: Boosting LLM Performance with Self-Guided Data Selection for Instruction Tuning [52.257422715393574]
本稿では,Large Language Models (LLMs) の自己誘導手法を導入し,オープンソースデータセットからサクラサンプルを自動識別し,選択する。
我々の重要な革新である命令追従困難度(IFD)メトリックは、モデルが期待する応答と本質的な生成能力の相違を識別するための重要な指標として現れます。
論文 参考訳(メタデータ) (2023-08-23T09:45:29Z) - AnnoLLM: Making Large Language Models to Be Better Crowdsourced Annotators [98.11286353828525]
GPT-3.5シリーズのモデルは、様々なNLPタスクにまたがる顕著な少数ショットとゼロショットの能力を示している。
本稿では,2段階のアプローチを取り入れたAnnoLLMを提案する。
我々はAnnoLLMを用いた対話型情報検索データセットを構築した。
論文 参考訳(メタデータ) (2023-03-29T17:03:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。