Fugu-MT 論文翻訳(概要): Generating (Formulaic) Text by Splicing Together Nearest Neighbors

論文の概要: Generating (Formulaic) Text by Splicing Together Nearest Neighbors

arxiv url: http://arxiv.org/abs/2101.08248v2
Date: Fri, 29 Jan 2021 18:44:33 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-22 01:36:36.677525
Title: Generating (Formulaic) Text by Splicing Together Nearest Neighbors
Title（参考訳）: 隣人同士をスプライシングして(形式的な)テキストを生成する
Authors: Sam Wiseman, Arturs Backurs, Karl Stratos
Abstract要約: 我々は、隣接するテキストのセグメントを直接操作して出力を形成するポリシーを学習する。このようなポリシーをトレーニングするための標準技術は、世代ごとにoracleの導出を必要とする。この方法で学んだポリシーは、テーブルからテキストへの解釈や見出し生成を可能にします。
参考スコア（独自算出の注目度）: 46.39976276319925
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose to tackle conditional text generation tasks, especially those which require generating formulaic text, by splicing together segments of text from retrieved "neighbor" source-target pairs. Unlike recent work that conditions on retrieved neighbors in an encoder-decoder setting but generates text token-by-token, left-to-right, we learn a policy that directly manipulates segments of neighbor text (i.e., by inserting or replacing them) to form an output. Standard techniques for training such a policy require an oracle derivation for each generation, and we prove that finding the shortest such derivation can be reduced to parsing under a particular weighted context-free grammar. We find that policies learned in this way allow for interpretable table-to-text or headline generation that is competitive with neighbor-based token-level policies on automatic metrics, though on all but one dataset neighbor-based policies underperform a strong neighborless baseline. In all cases, however, generating by splicing is faster.
Abstract（参考訳）: 本稿では、検索した「隣接」ソース-ターゲットペアからテキストセグメントを分割することで、条件付きテキスト生成タスク、特に定式テキストを生成するタスクに取り組むことを提案する。エンコーダ-デコーダ設定で検索された隣人の条件が、左から右へテキストトークンを生成する最近の作業とは異なり、隣接するテキストのセグメントを直接操作するポリシー(つまり、挿入または置換)を学習し、出力を生成する。このような政策を訓練する標準的な手法は,各世代にオラクルの導出を必要とするため,そのような導出が最短であることは,特定の重み付けされた文脈自由文法の下での構文解析に還元できることを示す。この方法で学んだポリシーは、近隣のトークンレベルポリシーと競合するテーブル・ツー・テキストや見出し生成を自動メトリクスで解釈できるが、近隣のスキーマベースのポリシー以外は、強力な近隣のベースラインを達成できない。しかし、いずれの場合もスプライシングによる生成は高速である。

関連論文リスト

BoundRL: Efficient Structured Text Segmentation through Reinforced Boundary Generation [26.825801831400003]
BoundRLは長い構造化テキストに対してトークンレベルのテキストセグメンテーションとラベル予測を行う。セグメントごとに完全なコンテンツを生成する代わりに、開始トークンのシーケンスだけを生成する。オリジナルテキスト内にこれらのトークンを配置することで、完全な内容を再構築する。
論文参考訳（メタデータ） (2025-10-23T02:56:10Z)
Attribute First, then Generate: Locally-attributable Grounded Text Generation [33.371400233333326]
本稿では,簡潔な属性を優先する局所帰属型テキスト生成手法を提案する。 Attribute First, then Generate"と名付けられたこの手法は,従来のエンドツーエンド生成プロセスを3つの直感的なステップに分解する。
論文参考訳（メタデータ） (2024-03-25T18:41:47Z)
An Autoregressive Text-to-Graph Framework for Joint Entity and Relation Extraction [4.194768796374315]
条件付きシーケンス生成問題としてフレーミングすることで、非構造化テキストから結合エンティティと関係抽出を行う新しい手法を提案する。ノードがテキストスパンを表し、エッジが関係トリプレットを表す線形化グラフを生成する。本手法では,スパンと関係型の動的語彙にポインティング機構を付加したトランスフォーマーエンコーダデコーダアーキテクチャを用いる。
論文参考訳（メタデータ） (2024-01-02T18:32:14Z)
Efficient Guided Generation for Large Language Models [0.21485350418225244]
本稿では, 有限状態マシンの状態間の遷移の観点から, ニューラルテキスト生成の問題を構成的に再構成する方法を示す。このフレームワークは、正規表現と文脈自由文法でテキスト生成を導くための効率的なアプローチをもたらす。
論文参考訳（メタデータ） (2023-07-19T01:14:49Z)
Copy Is All You Need [66.00852205068327]
既存のテキストコレクションからテキストセグメントを段階的にコピーするテキスト生成を定式化する。提案手法は, 自動評価と人的評価の両方により, より優れた生成品質を実現する。当社のアプローチでは,より大規模なテキストコレクションにスケールアップすることで,さらなるパフォーマンス向上を実現しています。
論文参考訳（メタデータ） (2023-07-13T05:03:26Z)
LRANet: Towards Accurate and Efficient Scene Text Detection with Low-Rank Approximation Network [63.554061288184165]
低ランク近似に基づく新しいパラメータ化テキスト形状法を提案する。異なるテキストの輪郭間の形状相関を探索することにより, 形状表現における一貫性, コンパクト性, 単純性, 頑健性を実現する。我々はLRANetという名前の正確で効率的な任意の形状のテキスト検出器を実装した。
論文参考訳（メタデータ） (2023-06-27T02:03:46Z)
Classifiers are Better Experts for Controllable Text Generation [63.17266060165098]
提案手法は, PPLにおける最近のPPLM, GeDi, DExpertsよりも有意に優れており, 生成したテキストの外部分類器に基づく感情の精度が高いことを示す。同時に、実装やチューニングも簡単で、制限や要件も大幅に少なくなります。
論文参考訳（メタデータ） (2022-05-15T12:58:35Z)
Text Revision by On-the-Fly Representation Optimization [76.11035270753757]
現在の最先端手法は、これらのタスクをシーケンスからシーケンスまでの学習問題として定式化している。並列データを必要としないテキストリビジョンのための反復的なインプレース編集手法を提案する。テキストの単純化に関する最先端の教師付き手法よりも、競争力があり、パフォーマンスも向上する。
論文参考訳（メタデータ） (2022-04-15T07:38:08Z)
StrokeNet: Stroke Assisted and Hierarchical Graph Reasoning Networks [31.76016966100244]
StrokeNetは、きめ細かいストロークをキャプチャすることで、テキストを効果的に検出する。テキスト領域を一連のポイントや長方形のボックスで表現する既存のアプローチとは異なり、各テキストインスタンスのストロークを直接ローカライズする。
論文参考訳（メタデータ） (2021-11-23T08:26:42Z)
POINTER: Constrained Progressive Text Generation via Insertion-based Generative Pre-training [93.79766670391618]
ハードコントラストテキスト生成のための新しい挿入ベースアプローチであるPOINTERを提案する。提案手法は,既存のトークン間で段階的に新しいトークンを並列に挿入することによって動作する。結果として生じる粗大な階層構造は、生成プロセスを直感的で解釈可能である。
論文参考訳（メタデータ） (2020-05-01T18:11:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。