論文の概要: Split and Rephrase with Large Language Models
- arxiv url: http://arxiv.org/abs/2312.11075v2
- Date: Tue, 19 Dec 2023 07:47:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-20 20:29:36.934871
- Title: Split and Rephrase with Large Language Models
- Title(参考訳): 大規模言語モデルによる分割と再帰
- Authors: David Ponce, Thierry Etchegoyhen, Jes\'us Calleja P\'erez, Harritxu
Gete
- Abstract要約: Split and Rephrase タスクは、複雑な文を短い文法文の列に分割する。
本稿では,大きな言語モデルに基づくアプローチについて述べる。これはタスクのすべての主要な指標に対する大きなマージンによって,最先端の技術を向上する。
パラメータサイズが異なる微調整済みの事前学習言語モデルや、ゼロショットと少数ショットのインコンテキスト学習の適用など、さまざまな戦略を評価する。
- 参考スコア(独自算出の注目度): 2.7309692684728617
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Split and Rephrase task, which consists in splitting complex sentences
into a sequence of shorter grammatical sentences, while preserving the original
meaning, can facilitate the processing of complex texts for humans and machines
alike. In this work, we describe an approach based on large language models,
which improves over the state of the art by large margins on all the major
metrics for the task, on publicly available datasets. We also describe results
from two human evaluations that further establish the significant improvements
obtained with large language models and the viability of the approach. We
evaluate different strategies, including fine-tuning pretrained language models
of varying parameter size, and applying both zero-shot and few-shot in-context
learning on instruction-tuned language models. Although the latter were
markedly outperformed by fine-tuned models, they still achieved promising
results overall. Our results thus demonstrate the strong potential of different
variants of large language models for the Split and Rephrase task, using
relatively small amounts of training samples and model parameters overall.
- Abstract(参考訳): Split and Rephraseタスクは、複雑な文を短い文法文の列に分割し、本来の意味を保ちながら、人間や機械などの複雑なテキストの処理を容易にする。
本研究では,大規模言語モデルに基づくアプローチについて述べる。この手法は,公開データセット上で,タスクのすべての主要な指標に対する大きなマージンによって,最先端の技術を向上する。
また,大規模言語モデルによる大幅な改善と,その実現可能性を示す2つの人的評価の結果についても述べる。
パラメータサイズが異なる微調整済み言語モデルや、ゼロショットと少数ショットのインコンテキスト学習の両方をインストラクションチューニング言語モデルに適用するなど、さまざまな戦略を評価する。
後者は微調整されたモデルで顕著に優れていたが、全体としては有望な結果を得た。
そこで本研究では,比較的少量のトレーニングサンプルとモデルパラメータを用いて,スプライトとリフレーズタスクのための大規模言語モデルのバリエーションの強い可能性を示す。
関連論文リスト
- Boosting the Capabilities of Compact Models in Low-Data Contexts with Large Language Models and Retrieval-Augmented Generation [2.9921619703037274]
本稿では,形態素解析の言語タスクにおいて,より小さなモデルの出力を補正するために,大言語モデル(LLM)を基盤とした検索拡張生成(RAG)フレームワークを提案する。
データ不足や訓練可能なパラメータの不足を補うために,言語情報を活用するとともに,LLMを通して解釈・蒸留された記述文法からの入力を許容する。
コンパクトなRAG支援モデルがデータスカース設定に極めて有効であることを示し、このタスクとターゲット言語に対する新しい最先端技術を実現する。
論文 参考訳(メタデータ) (2024-10-01T04:20:14Z) - Language Models for Text Classification: Is In-Context Learning Enough? [54.869097980761595]
最近の基礎言語モデルでは、ゼロショットや少数ショットの設定で多くのNLPタスクで最先端のパフォーマンスが示されている。
より標準的なアプローチよりもこれらのモデルの利点は、自然言語(prompts)で書かれた命令を理解する能力である。
これにより、アノテーション付きインスタンスが限られているドメインのテキスト分類問題に対処するのに適している。
論文 参考訳(メタデータ) (2024-03-26T12:47:39Z) - Reimagining Retrieval Augmented Language Models for Answering Queries [23.373952699385427]
本稿では,大規模言語モデルに対する現実性チェックと,比較対象言語モデル検索の可能性を検証する。
このような言語モデルは半パラメトリックであり、モデルがモデルパラメータと外部データソースからの知識を統合して予測を行う。
論文 参考訳(メタデータ) (2023-06-01T18:08:51Z) - SimOAP: Improve Coherence and Consistency in Persona-based Dialogue
Generation via Over-sampling and Post-evaluation [54.66399120084227]
大規模コーパスで訓練された言語モデルは、オープンドメイン対話において驚くほど流動的な結果を生み出すことができる。
ペルソナに基づく対話生成タスクでは、一貫性と一貫性が言語モデルにとって大きな課題である。
オーバーサンプリングとポスト評価という2段階のSimOAP戦略が提案されている。
論文 参考訳(メタデータ) (2023-05-18T17:23:00Z) - mFACE: Multilingual Summarization with Factual Consistency Evaluation [79.60172087719356]
抽象的な要約は、事前訓練された言語モデルと大規模データセットの可用性のおかげで、近年で新たな関心を集めている。
有望な結果にもかかわらず、現在のモデルはいまだに現実的に矛盾した要約を生み出すことに苦しむ。
事実整合性評価モデルを利用して、多言語要約を改善する。
論文 参考訳(メタデータ) (2022-12-20T19:52:41Z) - Analyzing Bagging Methods for Language Models [0.5161531917413708]
我々は,バッジ言語モデルの解析を行い,単一言語モデルと最終モデルサイズで大まかに等価なタグ付きアンサンブルを比較した。
我々のアンサンブル法は、少なくとも1つのLMベースラインとほぼ同等である。
論文 参考訳(メタデータ) (2022-07-19T06:30:37Z) - An Application of Pseudo-Log-Likelihoods to Natural Language Scoring [5.382454613390483]
比較的少ないパラメータとトレーニングステップを持つ言語モデルは、最近の大規模なデータセットでそれを上回るパフォーマンスを得ることができる。
二項選択タスクにおける常識推論のための絶対的最先端結果を生成する。
より小さなモデルの堅牢性は、構成性の観点から理解されるべきである。
論文 参考訳(メタデータ) (2022-01-23T22:00:54Z) - Cross-lingual Approach to Abstractive Summarization [0.0]
言語間モデル転送は低リソース言語でうまく適用できる。
深層ニューラルネットワークとシークエンス・トゥ・シークエンスアーキテクチャに基づく事前学習型英語要約モデルを用いた。
対象言語データに異なる比率のモデルを開発し,微調整を行った。
論文 参考訳(メタデータ) (2020-12-08T09:30:38Z) - Unsupervised Paraphrasing with Pretrained Language Models [85.03373221588707]
教師なし環境で,事前学習した言語モデルを用いて高品質なパラフレーズを生成する訓練パイプラインを提案する。
提案手法は,タスク適応,自己スーパービジョン,動的ブロッキング(Dynamic Blocking)という新しい復号アルゴリズムから構成される。
提案手法は,Quora Question PairとParaNMTの両方のデータセット上で,最先端の性能を達成できることを示す。
論文 参考訳(メタデータ) (2020-10-24T11:55:28Z) - Comparison of Interactive Knowledge Base Spelling Correction Models for
Low-Resource Languages [81.90356787324481]
低リソース言語に対する正規化の推進は、パターンの予測が難しいため、難しい作業である。
この研究は、ターゲット言語データに様々な量を持つニューラルモデルとキャラクタ言語モデルの比較を示す。
我々の利用シナリオは、ほぼゼロのトレーニング例によるインタラクティブな修正であり、より多くのデータが収集されるにつれてモデルを改善する。
論文 参考訳(メタデータ) (2020-10-20T17:31:07Z) - Grounded Compositional Outputs for Adaptive Language Modeling [59.02706635250856]
言語モデルの語彙$-$典型的にはトレーニング前に選択され、後で永久に固定される$-$は、そのサイズに影響します。
言語モデルのための完全合成出力埋め込み層を提案する。
我々の知る限り、この結果はトレーニング語彙に依存しないサイズを持つ最初の単語レベル言語モデルである。
論文 参考訳(メタデータ) (2020-09-24T07:21:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。