Fugu-MT 論文翻訳(概要): Don't Take This Out of Context! On the Need for Contextual Models and Evaluations for Stylistic Rewriting

論文の概要: Don't Take This Out of Context! On the Need for Contextual Models and Evaluations for Stylistic Rewriting

arxiv url: http://arxiv.org/abs/2305.14755v1
Date: Wed, 24 May 2023 05:58:17 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-25 19:20:53.623382
Title: Don't Take This Out of Context! On the Need for Contextual Models and Evaluations for Stylistic Rewriting
Title（参考訳）: コンテキストから外すな! 文脈モデルの必要性とスタイリスティック書き直しの評価について
Authors: Akhila Yerukola, Xuhui Zhou, Maarten Sap
Abstract要約: 本稿では,先行するテクストコンテキストを,スタイリスティックテキストの書き直しと評価段階の両方に統合することを提案する。我々の実験は、人間が文脈的でないものよりも文脈的書き直しを好むことを示しているが、自動メトリクスはそうではない。
参考スコア（独自算出の注目度）: 15.018177306376298
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Most existing stylistic text rewriting methods operate on a sentence level, but ignoring the broader context of the text can lead to generic, ambiguous, and incoherent rewrites. In this paper, we propose the integration of preceding textual context into both the rewriting and evaluation stages of stylistic text rewriting, focusing on formality, toxicity, and sentiment transfer tasks. We conduct a comparative evaluation of rewriting through few-shot prompting of GPT-3.5 and GPT NeoX, comparing non-contextual rewrites to contextual rewrites. Our experiments show that humans often prefer contextual rewrites over non-contextual ones, but automatic metrics (e.g., BLEU, sBERT) do not. To bridge this gap, we propose context-infused versions of common automatic metrics, and show that these better reflect human preferences. Overall, our paper highlights the importance of integrating preceding textual context into both the rewriting and evaluation stages of stylistic text rewriting.
Abstract（参考訳）: 既存のスタイリスティックなテキスト書き換え手法のほとんどは文レベルで動作するが、テキストの広い文脈を無視して、汎用的で曖昧で一貫性のない書き直しにつながる可能性がある。本稿では,先述のテクストコンテキストを,形式性,毒性,感情伝達タスクに焦点をあてて,スタイル的テキスト書き換えの書き直しと評価段階の両方に統合することを提案する。 GPT-3.5 と GPT NeoX のプロンプトによる書き直しの比較評価を行い,非文脈的書き直しと文脈的書き直しを比較した。我々の実験では、人間が文脈的な書き直しを好むことが多いが、自動メトリクス(BLEU、sBERTなど)はそうではない。このギャップを埋めるために、一般的な自動メトリクスの文脈注入バージョンを提案し、これらが人間の好みを反映していることを示す。本論文は,文体書き直しと文体書き直しの両段階に先行する文脈を統合することの重要性を強調した。

関連論文リスト

Automatic Detection of Complex Quotation Patterns in Aggadic Literature [0.9476463361600828]
本稿では,ラビ語文学における聖書引用の自動検出のための新しい3段階アルゴリズムACTを提案する。提案手法は,Dicta,Passim,Text-Matcher,および人間注釈クリティカルエディションなど,主要なシステムに対して評価された。引用検出の改善に加えて、コーパスをまたいでスタイリスティックなパターンを分類するACTの能力は、ジャンル分類とテクスト間分析のための新しい道を開く。
論文参考訳（メタデータ） (2025-12-29T14:45:58Z)
SMILE: A Composite Lexical-Semantic Metric for Question-Answering Evaluation [55.26111461168754]
本稿では,文レベルの意味理解とキーワードレベルの意味理解と簡単なキーワードマッチングを組み合わせた新しいアプローチであるSemantic Metric Integrating Lexical Exactnessを紹介する。人間の判断と計算学的に軽量であり、語彙的評価と意味的評価のギャップを埋める。
論文参考訳（メタデータ） (2025-11-21T17:30:18Z)
Context is Enough: Empirical Validation of $\ extit{Sequentiality}$ on Essays [1.338174941551702]
コンテクスト版の連続性は, 談話レベルの特徴の人間による評価とより密接に一致していることを示す。本研究は,自動エッセイ評価および関連するNLPタスクの検証,解釈,補完機能としてコンテキストベースのシーケンシャル性の利用を支援する。
論文参考訳（メタデータ） (2025-11-12T10:31:07Z)
Context-Aware Hierarchical Merging for Long Document Summarization [56.96619074316232]
本論文では,階層的なマージをソース文書からコンテキストと統合する手法を提案する。法的および物語的領域を表すデータセットの実験結果は、文脈的拡張がゼロショットと階層的な融合ベースラインを一貫して上回っていることを示している。
論文参考訳（メタデータ） (2025-02-03T01:14:31Z)
Fine-grained Controllable Text Generation through In-context Learning with Feedback [57.396980277089135]
本稿では,依存度などの非自明な言語的特徴の特定の値に一致させるために,入力文を書き換える手法を提案する。従来の研究とは対照的に、本手法は微調整ではなく文脈内学習を用いており、データが少ないユースケースに適用できる。
論文参考訳（メタデータ） (2024-06-17T08:55:48Z)
CoheSentia: A Novel Benchmark of Incremental versus Holistic Assessment of Coherence in Generated Texts [15.866519123942457]
自動生成テキストの人間知覚コヒーレンスに関する新しいベンチマークである sc CoheSentia を紹介する。我々のベンチマークには、自動生成および人称注釈付き500の段落が含まれており、それぞれが両方の方法で注釈付けされている。解析の結果,インクリメンタルモードにおけるアノテータ間の合意は,総合的な代替よりも高いことがわかった。
論文参考訳（メタデータ） (2023-10-25T03:21:20Z)
TextFormer: A Query-based End-to-End Text Spotter with Mixed Supervision [61.186488081379]
Transformerアーキテクチャを用いた問合せベースのエンドツーエンドテキストスポッターであるTextFormerを提案する。 TextFormerは、画像エンコーダとテキストデコーダの上に構築され、マルチタスクモデリングのための共同セマンティック理解を学ぶ。分類、セグメンテーション、認識のブランチの相互訓練と最適化を可能にし、より深い特徴共有をもたらす。
論文参考訳（メタデータ） (2023-06-06T03:37:41Z)
Factually Consistent Summarization via Reinforcement Learning with Textual Entailment Feedback [57.816210168909286]
我々は,この問題を抽象的な要約システムで解くために,テキストエンテーメントモデルの最近の進歩を活用している。我々は、事実整合性を最適化するために、レファレンスフリーのテキストエンターメント報酬を用いた強化学習を用いる。自動測定と人的評価の両結果から,提案手法は生成した要約の忠実さ,サリエンス,簡潔さを著しく向上させることが示された。
論文参考訳（メタデータ） (2023-05-31T21:04:04Z)
Textual Entailment Recognition with Semantic Features from Empirical Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文参考訳（メタデータ） (2022-10-18T10:03:51Z)
SMART: Sentences as Basic Units for Text Evaluation [48.5999587529085]
本稿では,このような制約を緩和するSMARTと呼ばれる新しい指標を提案する。文をトークンの代わりにマッチングの基本単位として扱い,ソフトマッチ候補と参照文に文マッチング関数を用いる。この結果から,提案手法とモデルベースマッチング関数とのシステムレベルの相関は,全ての競合する指標よりも優れていた。
論文参考訳（メタデータ） (2022-08-01T17:58:05Z)
A General Contextualized Rewriting Framework for Text Summarization [15.311467109946571]
抽出文は比較的焦点が当てられているが、背景知識や談話の文脈が失われる可能性がある。コンテントベースのアドレッシングによって抽出文を識別し、グループタグアライメントを施したSeq2seqとしてコンテクスト化された書き直しを形式化する。その結果,本手法は強化学習を必要とせず,非コンテクスチュアライズされた書き換えシステムよりも優れていた。
論文参考訳（メタデータ） (2022-07-13T03:55:57Z)
CORE-Text: Improving Scene Text Detection with Contrastive Relational Reasoning [65.57338873921168]
自然界におけるテキストインスタンスのローカライズは、コンピュータビジョンにおける根本的な課題であると考えられている。本研究では,サブテキスト問題を定量的に解析し,シンプルで効果的な設計であるContrastive Relation(CORE)モジュールを提案する。我々は、COREモジュールをMask R-CNNの2段階テキスト検出器に統合し、テキスト検出器CORE-Textを考案する。
論文参考訳（メタデータ） (2021-12-14T16:22:25Z)
Video Text Tracking With a Spatio-Temporal Complementary Model [46.99051486905713]
テキストトラッキングは、ビデオ内の複数のテキストを追跡し、各テキストの軌跡を構築することである。既存の手法は、トラッキング・バイ・ディテククション・フレームワークを利用する。我々は、このパラダイムの追跡精度がより複雑なシナリオで著しく制限されていると論じる。
論文参考訳（メタデータ） (2021-11-09T08:23:06Z)
Sentence Semantic Regression for Text Generation [25.16392119801612]
本稿では文レベル言語モデリングに基づくセンテンス・セマンティック・レグレッション(textbfSSR)という新しいフレームワークを提案する。アイデア推論では、textbfSSR-AR と textbfSSR-NonAR の2つのアーキテクチャが、文の意味的回帰を自動回帰的に実行するように設計されている。表面実現の段階において、混合粒度文デコーダは、一貫性のあるテキストを生成するように設計されている。
論文参考訳（メタデータ） (2021-08-06T07:35:59Z)
A Case Study of Spanish Text Transformations for Twitter Sentiment Analysis [1.9694608733361543]
感性分析は、与えられたテキストの極性、すなわちその正性または負性を決定するテキストマイニングタスクである。テキスト表現の新しい形式は、スラング、正書法、文法的誤りを用いてテキストを分析するための新しい課題を示す。
論文参考訳（メタデータ） (2021-06-03T17:24:31Z)
Contextual Text Style Transfer [73.66285813595616]
コンテキストテキストスタイル転送は、文をその周囲のコンテキストを考慮した所望のスタイルに変換することを目的としている。本稿では,各入力文とその周辺コンテキストに対して2つの異なるエンコーダを使用するコンテキスト認識スタイル転送(CAST)モデルを提案する。 Enron-ContextとReddit-Contextという2つの新しいベンチマークが、フォーマル性と攻撃性スタイルの転送のために導入された。
論文参考訳（メタデータ） (2020-04-30T23:01:12Z)
Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。抽出した要約タスクを意味テキストマッチング問題として定式化する。我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文参考訳（メタデータ） (2020-04-19T08:27:57Z)
Extending Text Informativeness Measures to Passage Interestingness Evaluation (Language Model vs. Word Embedding) [1.2998637003026272]
本稿では、インフォマティヴネスの概念をインフォマティヴネスの一般化として定義する。次に、この一般化に対応するために、アートインフォーマティヴネス対策の状態を調査する。 CLEF-INEX Tweet Contextualization 2012 Logarithm similarity measure が最適であることを示す。
論文参考訳（メタデータ） (2020-04-14T18:22:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。