Fugu-MT 論文翻訳(概要): Harnessing the Power of David against Goliath: Exploring Instruction Data Generation without Using Closed-Source Models

論文の概要: Harnessing the Power of David against Goliath: Exploring Instruction Data Generation without Using Closed-Source Models

arxiv url: http://arxiv.org/abs/2308.12711v1
Date: Thu, 24 Aug 2023 11:07:47 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-25 14:15:23.329079
Title: Harnessing the Power of David against Goliath: Exploring Instruction Data Generation without Using Closed-Source Models
Title（参考訳）: Goliathに対するDavidの力の調和 - クローズドソースモデルを使用しないインストラクションデータ生成の探索
Authors: Yue Wang, Xinrui Wang, Juntao Li, Jinxiong Chang, Qishen Zhang, Zhongyi Liu, Guannan Zhang, Min Zhang
Abstract要約: クローズドソースモデルに依存しない高品質な命令データを生成するための代替手法を検討する。 2つのベンチマークとGPT-4モデルによる評価結果から,生成した命令データの有効性が示された。
参考スコア（独自算出の注目度）: 32.41573520305861
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Instruction tuning is instrumental in enabling Large Language Models~(LLMs) to follow user instructions to complete various open-domain tasks. The success of instruction tuning depends on the availability of high-quality instruction data. Owing to the exorbitant cost and substandard quality of human annotation, recent works have been deeply engaged in the exploration of the utilization of powerful closed-source models to generate instruction data automatically. However, these methods carry potential risks arising from the usage requirements of powerful closed-source models, which strictly forbid the utilization of their outputs to develop machine learning models. To deal with this problem, in this work, we explore alternative approaches to generate high-quality instruction data that do not rely on closed-source models. Our exploration includes an investigation of various existing instruction generation methods, culminating in the integration of the most efficient variant with two novel strategies to enhance the quality further. Evaluation results from two benchmarks and the GPT-4 model demonstrate the effectiveness of our generated instruction data, which can outperform Alpaca, a method reliant on closed-source models. We hope that more progress can be achieved in generating high-quality instruction data without using closed-source models.
Abstract（参考訳）: インストラクションチューニングは、Large Language Models~(LLM)がユーザ命令に従って様々なオープンドメインタスクを完了できるようにするのに役立ちます。命令チューニングの成功は、高品質な命令データの可用性に依存する。最近の研究は,人間のアノテーションの外部費用とサブスタンダード品質のために,命令データの自動生成のための強力なクローズドソースモデルの利用の探求に深く関わってきた。しかし、これらの手法は強力なクローズドソースモデルの使用要件から生じる潜在的なリスクを持ち、機械学習モデルを開発するために出力の使用を厳密に禁止している。この問題に対処するため,本研究では,クローズドソースモデルに依存しない高品質な命令データを生成するための代替手法を検討する。提案手法は,様々な命令生成手法を探索し,さらに品質を高めるための2つの新しい戦略と,最も効率的な変種の統合を導出する。 2つのベンチマークとgpt-4モデルによる評価結果から,クローズドソースモデルに依存するalpacaよりも優れる,生成された命令データの有効性が示された。クローズドソースモデルを用いることなく,高品質な命令データを生成する上で,さらなる進歩が期待できる。

関連論文リスト

Improving Model Alignment Through Collective Intelligence of Open-Source LLMS [34.23134719050941]
モデルアライメントのための高品質なデータを提供するために,様々な言語モデルの集合的強みを活用するMOAAを導入する。その結果,アリーナ・ハードでは19.5から48.3,アルパカ・エスバル2では22.33から57.23に,LLaMA-3.1-8B-インストラクトでは勝利率を向上させることができた。
論文参考訳（メタデータ） (2025-05-05T22:40:23Z)
BARE: Combining Base and Instruction-Tuned Language Models for Better Synthetic Data Generation [71.46236155101032]
本研究では,ベースモデルの多様性とインストラクション学習モデルの品質を組み合わせた合成データ生成手法であるBase-Refineを提案する。 BARE生成データによる微調整は, GSM8Kの命令のみのデータよりも101%, RAFTのSOTA法より18.4%向上することを示す。
論文参考訳（メタデータ） (2025-02-03T00:12:40Z)
Language Models as Continuous Self-Evolving Data Engineers [32.67875951851165]
大規模言語モデル(LLM)は、様々なタスクにおいて顕著な能力を示している。従来のトレーニングアプローチは、専門家ラベル付きデータに大きく依存しています。我々はLANCEという新しいパラダイムを提案し、LLMはデータの自動生成、クリーニング、レビュー、注釈付けによって自らを訓練することができる。
論文参考訳（メタデータ） (2024-12-19T18:28:41Z)
Unleashing LLM Reasoning Capability via Scalable Question Synthesis from Scratch [54.12139707822201]
本稿では,新しい,スケーラブルで費用対効果の高いデータ合成手法であるScaleQuestを提案する。スクラッチから多様な質問を生成することで、100万の問題解決ペアのデータセットを生成します。私たちの実験では、データに基づいてトレーニングされたモデルが、既存のオープンソースデータセットより優れています。
論文参考訳（メタデータ） (2024-10-24T12:42:04Z)
Infinity-MM: Scaling Multimodal Performance with Large-Scale and High-Quality Instruction Data [21.905041803331113]
VLM(Vision-Language Models)は近年大きな進歩を遂げているが、オープンソースの命令データの規模や品質に制限があるため、その性能は損なわれている。 Infinity-MMは4000万のサンプルを持つ大規模マルチモーダル・インストラクション・データセットであり、厳密な品質のフィルタリングと重複によって強化されている。また,詳細な画像アノテーションと多様な質問生成を用いた,オープンソースのVLMに基づく合成命令生成手法を提案する。
論文参考訳（メタデータ） (2024-10-24T09:03:48Z)
Forewarned is Forearmed: Leveraging LLMs for Data Synthesis through Failure-Inducing Exploration [90.41908331897639]
大規模言語モデル(LLM)は、多種多様な高品質なタスク特化データのトレーニングの恩恵を受けている。本稿では,効果的なトレーニングサンプルを自動生成する新しい手法であるReverseGenを提案する。
論文参考訳（メタデータ） (2024-10-22T06:43:28Z)
SIaM: Self-Improving Code-Assisted Mathematical Reasoning of Large Language Models [54.78329741186446]
本稿では,コードに基づく批判モデルを用いて,質問コードデータ構築,品質管理,補完的評価などのステップをガイドする新しいパラダイムを提案する。英語と中国語におけるドメイン内ベンチマークとドメイン外ベンチマークの両方の実験は、提案したパラダイムの有効性を実証している。
論文参考訳（メタデータ） (2024-08-28T06:33:03Z)
When Parameter-efficient Tuning Meets General-purpose Vision-language Models [65.19127815275307]
PETALは、一意のモード近似技術によって達成される全パラメータの0.5%しか必要とせず、トレーニングプロセスに革命をもたらす。実験の結果,PETALは現状の手法をほとんどのシナリオで上回るだけでなく,完全な微調整モデルよりも優れていることがわかった。
論文参考訳（メタデータ） (2023-12-16T17:13:08Z)
How Far Can Camels Go? Exploring the State of Instruction Tuning on Open Resources [117.6496550359768]
この研究は、オープンな命令追従データセットにおける命令チューニング言語モデルの最近の進歩を探求する。我々は、12の命令データセットに基づいて訓練された6.7Bから65Bのパラメータを含む、命令調整されたモデルの大規模なセットを提供する。それらの事実的知識、推論、多言語性、コーディング、そしてその後に続くオープン・エンド・インストラクションに基づいて評価する。
論文参考訳（メタデータ） (2023-06-07T19:59:23Z)
RLBoost: Boosting Supervised Models using Deep Reinforcement Learning [0.0]
RLBoostは、深層強化学習戦略を用いて、特定のデータセットを評価し、新しいデータの品質を推定できるモデルを得るアルゴリズムである。論文の結果から, このモデルでは, LOO, DataShapley, DVRLなどの最先端アルゴリズムよりも, より優れた, より安定した結果が得られることが示された。
論文参考訳（メタデータ） (2023-05-23T14:38:33Z)
DAGA: Data Augmentation with a Generation Approach for Low-resource Tagging Tasks [88.62288327934499]
線形化ラベル付き文に基づいて訓練された言語モデルを用いた新しい拡張手法を提案する。本手法は, 教師付き設定と半教師付き設定の両方に適用可能である。
論文参考訳（メタデータ） (2020-11-03T07:49:15Z)
MetaDistiller: Network Self-Boosting via Meta-Learned Top-Down Distillation [153.56211546576978]
本研究では,ラベル生成器を用いて高い適合性を有するソフトターゲットを生成することを提案する。このラベルジェネレータを最適化するためにメタ学習技術を用いることができる。実験は CIFAR-100 と ILSVRC2012 の2つの標準分類ベンチマークで実施された。
論文参考訳（メタデータ） (2020-08-27T13:04:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。