論文の概要: Generating (Formulaic) Text by Splicing Together Nearest Neighbors
- arxiv url: http://arxiv.org/abs/2101.08248v2
- Date: Fri, 29 Jan 2021 18:44:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 01:36:36.677525
- Title: Generating (Formulaic) Text by Splicing Together Nearest Neighbors
- Title(参考訳): 隣人同士をスプライシングして(形式的な)テキストを生成する
- Authors: Sam Wiseman, Arturs Backurs, Karl Stratos
- Abstract要約: 我々は、隣接するテキストのセグメントを直接操作して出力を形成するポリシーを学習する。
このようなポリシーをトレーニングするための標準技術は、世代ごとにoracleの導出を必要とする。
この方法で学んだポリシーは、テーブルからテキストへの解釈や見出し生成を可能にします。
- 参考スコア(独自算出の注目度): 46.39976276319925
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose to tackle conditional text generation tasks, especially those
which require generating formulaic text, by splicing together segments of text
from retrieved "neighbor" source-target pairs. Unlike recent work that
conditions on retrieved neighbors in an encoder-decoder setting but generates
text token-by-token, left-to-right, we learn a policy that directly manipulates
segments of neighbor text (i.e., by inserting or replacing them) to form an
output. Standard techniques for training such a policy require an oracle
derivation for each generation, and we prove that finding the shortest such
derivation can be reduced to parsing under a particular weighted context-free
grammar. We find that policies learned in this way allow for interpretable
table-to-text or headline generation that is competitive with neighbor-based
token-level policies on automatic metrics, though on all but one dataset
neighbor-based policies underperform a strong neighborless baseline. In all
cases, however, generating by splicing is faster.
- Abstract(参考訳): 本稿では、検索した「隣接」ソース-ターゲットペアからテキストセグメントを分割することで、条件付きテキスト生成タスク、特に定式テキストを生成するタスクに取り組むことを提案する。
エンコーダ-デコーダ設定で検索された隣人の条件が、左から右へテキストトークンを生成する最近の作業とは異なり、隣接するテキストのセグメントを直接操作するポリシー(つまり、挿入または置換)を学習し、出力を生成する。
このような政策を訓練する標準的な手法は,各世代にオラクルの導出を必要とするため,そのような導出が最短であることは,特定の重み付けされた文脈自由文法の下での構文解析に還元できることを示す。
この方法で学んだポリシーは、近隣のトークンレベルポリシーと競合するテーブル・ツー・テキストや見出し生成を自動メトリクスで解釈できるが、近隣のスキーマベースのポリシー以外は、強力な近隣のベースラインを達成できない。
しかし、いずれの場合もスプライシングによる生成は高速である。
関連論文リスト
- Attribute First, then Generate: Locally-attributable Grounded Text Generation [33.371400233333326]
本稿では,簡潔な属性を優先する局所帰属型テキスト生成手法を提案する。
Attribute First, then Generate"と名付けられたこの手法は,従来のエンドツーエンド生成プロセスを3つの直感的なステップに分解する。
論文 参考訳(メタデータ) (2024-03-25T18:41:47Z) - An Autoregressive Text-to-Graph Framework for Joint Entity and Relation
Extraction [4.194768796374315]
条件付きシーケンス生成問題としてフレーミングすることで、非構造化テキストから結合エンティティと関係抽出を行う新しい手法を提案する。
ノードがテキストスパンを表し、エッジが関係トリプレットを表す線形化グラフを生成する。
本手法では,スパンと関係型の動的語彙にポインティング機構を付加したトランスフォーマーエンコーダデコーダアーキテクチャを用いる。
論文 参考訳(メタデータ) (2024-01-02T18:32:14Z) - Efficient Guided Generation for Large Language Models [0.21485350418225244]
本稿では, 有限状態マシンの状態間の遷移の観点から, ニューラルテキスト生成の問題を構成的に再構成する方法を示す。
このフレームワークは、正規表現と文脈自由文法でテキスト生成を導くための効率的なアプローチをもたらす。
論文 参考訳(メタデータ) (2023-07-19T01:14:49Z) - Copy Is All You Need [66.00852205068327]
既存のテキストコレクションからテキストセグメントを段階的にコピーするテキスト生成を定式化する。
提案手法は, 自動評価と人的評価の両方により, より優れた生成品質を実現する。
当社のアプローチでは,より大規模なテキストコレクションにスケールアップすることで,さらなるパフォーマンス向上を実現しています。
論文 参考訳(メタデータ) (2023-07-13T05:03:26Z) - LRANet: Towards Accurate and Efficient Scene Text Detection with
Low-Rank Approximation Network [63.554061288184165]
低ランク近似に基づく新しいパラメータ化テキスト形状法を提案する。
異なるテキストの輪郭間の形状相関を探索することにより, 形状表現における一貫性, コンパクト性, 単純性, 頑健性を実現する。
我々はLRANetという名前の正確で効率的な任意の形状のテキスト検出器を実装した。
論文 参考訳(メタデータ) (2023-06-27T02:03:46Z) - Classifiers are Better Experts for Controllable Text Generation [63.17266060165098]
提案手法は, PPLにおける最近のPPLM, GeDi, DExpertsよりも有意に優れており, 生成したテキストの外部分類器に基づく感情の精度が高いことを示す。
同時に、実装やチューニングも簡単で、制限や要件も大幅に少なくなります。
論文 参考訳(メタデータ) (2022-05-15T12:58:35Z) - Text Revision by On-the-Fly Representation Optimization [76.11035270753757]
現在の最先端手法は、これらのタスクをシーケンスからシーケンスまでの学習問題として定式化している。
並列データを必要としないテキストリビジョンのための反復的なインプレース編集手法を提案する。
テキストの単純化に関する最先端の教師付き手法よりも、競争力があり、パフォーマンスも向上する。
論文 参考訳(メタデータ) (2022-04-15T07:38:08Z) - StrokeNet: Stroke Assisted and Hierarchical Graph Reasoning Networks [31.76016966100244]
StrokeNetは、きめ細かいストロークをキャプチャすることで、テキストを効果的に検出する。
テキスト領域を一連のポイントや長方形のボックスで表現する既存のアプローチとは異なり、各テキストインスタンスのストロークを直接ローカライズする。
論文 参考訳(メタデータ) (2021-11-23T08:26:42Z) - POINTER: Constrained Progressive Text Generation via Insertion-based
Generative Pre-training [93.79766670391618]
ハードコントラストテキスト生成のための新しい挿入ベースアプローチであるPOINTERを提案する。
提案手法は,既存のトークン間で段階的に新しいトークンを並列に挿入することによって動作する。
結果として生じる粗大な階層構造は、生成プロセスを直感的で解釈可能である。
論文 参考訳(メタデータ) (2020-05-01T18:11:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。