Fugu-MT 論文翻訳(概要): The Extractive-Abstractive Axis: Measuring Content "Borrowing" in Generative Language Models

論文の概要: The Extractive-Abstractive Axis: Measuring Content "Borrowing" in Generative Language Models

arxiv url: http://arxiv.org/abs/2307.11779v1
Date: Thu, 20 Jul 2023 02:12:00 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-25 19:46:08.577098
Title: The Extractive-Abstractive Axis: Measuring Content "Borrowing" in Generative Language Models
Title（参考訳）: 抽出抽象軸:生成言語モデルにおける内容「バローイング」の測定
Authors: Nedelina Teneva
Abstract要約: 生成モデルのベンチマークを行うために,いわゆる抽出-抽象軸を提案する。対応するメトリクス、データセット、ガイドラインの開発の必要性を強調します。
参考スコア（独自算出の注目度）: 0.7614628596146599
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Generative language models produce highly abstractive outputs by design, in contrast to extractive responses in search engines. Given this characteristic of LLMs and the resulting implications for content Licensing & Attribution, we propose the the so-called Extractive-Abstractive axis for benchmarking generative models and highlight the need for developing corresponding metrics, datasets and annotation guidelines. We limit our discussion to the text modality.
Abstract（参考訳）: 生成言語モデルは、検索エンジンの抽出応答とは対照的に、設計によって非常に抽象的な出力を生成する。このLCMの特徴とコンテンツライセシング・アトリビューションへの影響を考慮し、生成モデルのベンチマークのためのいわゆる抽出・抽象軸を提案し、対応するメトリクスやデータセット、ガイドラインの開発の必要性を強調した。我々は議論をテキストモダリティに限定する。

関連論文リスト

From Annotation to Adaptation: Metrics, Synthetic Data, and Aspect Extraction for Aspect-Based Sentiment Analysis with Large Language Models [1.5020330976600738]
本研究では,Aspect-Based Sentiment Analysis(ABSA)におけるLarge Language Models(LLMs)の性能について検討する。合成スポーツフィードバックデータセットを用いて、アスペクトポーラリティペアを抽出するオープンウェイトLLMの能力を評価する。
論文参考訳（メタデータ） (2025-03-26T16:52:40Z)
Consistency Evaluation of News Article Summaries Generated by Large (and Small) Language Models [0.0]
大言語モデル (LLMs) は、流動的な抽象的な要約を生成することを約束しているが、ソーステキストに基づかない幻覚的な詳細を生成することができる。本稿では,TextRank,BART,Mistral-7B-Instruct,OpenAI GPT-3.5-Turboなど,さまざまな手法を用いてテキスト要約の探索を行う。 XL-Sumデータセットでテストすると,すべての要約モデルが一貫した要約を生成することがわかった。
論文参考訳（メタデータ） (2025-02-28T01:58:17Z)
Survey on Abstractive Text Summarization: Dataset, Models, and Metrics [0.8184895397419141]
トランスフォーマーモデルは、それらの注意機構、一般的な知識に基づく事前訓練、下流タスクの微調整によって区別される。本研究は,テキスト要約モデルにおける技術の現状を,抽象的要約アプローチに特化して検討する。
論文参考訳（メタデータ） (2024-12-22T21:18:40Z)
Think&Cite: Improving Attributed Text Generation with Self-Guided Tree Search and Progress Reward Modeling [63.98194996746229]
大型言語モデル(LLM)は幻覚を起こし、事実的に誤った情報を生み出す傾向にある。我々はThink&Citeと呼ばれる新しいフレームワークを提案し、検索と統合された多段階推論問題として属性付きテキスト生成を定式化する。
論文参考訳（メタデータ） (2024-12-19T13:55:48Z)
Guide-to-Explain for Controllable Summarization [11.904090197598505]
大規模言語モデル (LLMs) による制御可能な要約は未定である。制御可能な要約のためのガイド・ツー・説明フレームワーク(GTE)を提案する。我々のフレームワークは、初期ドラフトで間違った属性を識別し、前回の出力でエラーを説明するのに役立てます。
論文参考訳（メタデータ） (2024-11-19T12:36:02Z)
Towards Enhancing Coherence in Extractive Summarization: Dataset and Experiments with LLMs [70.15262704746378]
我々は,5つの公開データセットと自然言語ユーザフィードバックのためのコヒーレントな要約からなる,体系的に作成された人間アノテーションデータセットを提案する。 Falcon-40BとLlama-2-13Bによる予備的な実験では、コヒーレントなサマリーを生成するという点で大幅な性能向上(10%ルージュ-L)が見られた。
論文参考訳（メタデータ） (2024-07-05T20:25:04Z)
Learning to Extract Structured Entities Using Language Models [52.281701191329]
機械学習の最近の進歩は、情報抽出の分野に大きな影響を与えている。タスクをエンティティ中心にすることで、さまざまなメトリクスの使用を可能にします。我々は、Structured Entity extractを導入し、Adroximate Entity Set OverlaPメトリックを提案し、この分野にコントリビュートします。
論文参考訳（メタデータ） (2024-02-06T22:15:09Z)
Abstractive Summary Generation for the Urdu Language [1.9594639581421422]
我々は、自己認識機構を利用して入力テキストを符号化し、要約を生成するトランスフォーマーベースのモデルを用いる。実験の結果,我々のモデルは文法的に正し,意味的に意味のある要約を生成できることがわかった。
論文参考訳（メタデータ） (2023-05-25T15:55:42Z)
StreamHover: Livestream Transcript Summarization and Annotation [54.41877742041611]
ライブストリームの書き起こしを注釈付けして要約するフレームワークであるStreamHoverを紹介します。合計500時間以上のビデオに抽出的要約と抽象的要約を併用したベンチマークデータセットは,既存の注釈付きコーパスよりもはるかに大きい。我々のモデルはより一般化され、強力なベースラインよりも性能が向上することを示す。
論文参考訳（メタデータ） (2021-09-11T02:19:37Z)
Lexically-constrained Text Generation through Commonsense Knowledge Extraction and Injection [62.071938098215085]
我々は、ある入力概念のセットに対して妥当な文を生成することを目的としているcommongenベンチマークに焦点を当てる。生成したテキストの意味的正しさを高めるための戦略を提案する。
論文参考訳（メタデータ） (2020-12-19T23:23:40Z)
Liputan6: A Large-scale Indonesian Dataset for Text Summarization [43.375797352517765]
オンラインニュースポータルであるLiputan6.comから記事を抽出し、215,827のドキュメント-要約ペアを取得する。事前学習した言語モデルを用いて,データセット上のベンチマーク抽出および抽象的要約手法を開発する。
論文参考訳（メタデータ） (2020-11-02T02:01:12Z)
Topic-Guided Abstractive Text Summarization: a Joint Learning Approach [19.623946402970933]
本稿では,抽象テキスト要約のための新しいアプローチ,トピックガイドによる抽象要約を提案する。ニューラルネットワークをTransformerベースのシーケンス・ツー・シーケンス(seq2seq)モデルに結合学習フレームワークに組み込むことが目的だ。
論文参考訳（メタデータ） (2020-10-20T14:45:25Z)
GRIT: Generative Role-filler Transformers for Document-level Event Entity Extraction [134.5580003327839]
本稿では、文書レベルでコンテキストをモデル化するための生成トランスフォーマーベースのエンコーダデコーダフレームワーク(GRIT)を紹介する。我々は,MUC-4データセットに対する我々のアプローチを評価し,我々のモデルが先行作業よりもかなり優れていることを示す。
論文参考訳（メタデータ） (2020-08-21T01:07:36Z)
Few-Shot Learning for Opinion Summarization [117.70510762845338]
オピニオン要約は、複数の文書で表現された主観的な情報を反映したテキストの自動生成である。本研究では,要約テキストの生成をブートストラップするのには,少数の要約でも十分であることを示す。提案手法は, 従来の抽出法および抽象法を, 自動的, 人的評価において大きく上回っている。
論文参考訳（メタデータ） (2020-04-30T15:37:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。