論文の概要: Extraction of Templates from Phrases Using Sequence Binary Decision
Diagrams
- arxiv url: http://arxiv.org/abs/2001.10175v1
- Date: Tue, 28 Jan 2020 05:30:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 02:43:15.693807
- Title: Extraction of Templates from Phrases Using Sequence Binary Decision
Diagrams
- Title(参考訳): sequence binary decision diagram を用いた句からのテンプレート抽出
- Authors: Daiki Hirano, Kumiko Tanaka-Ishii and Andrew Finch
- Abstract要約: 本稿では、SeqBDD(Sequence Binary Decision Diagram)の緩和版を用いて、タグ付きテキストのみからテンプレートを抽出するための教師なしアプローチを提案する。
本論文の主な貢献はSeqBDD構築アルゴリズムの緩和形式であり、少量のデータから一般的な表現を作成できる。
実験の結果,ソーシャルメディアからの短いメッセージからコーパスやフレーズテンプレートから動詞+前置テンプレートをベースとしたタスクを高品質に抽出できることがわかった。
- 参考スコア(独自算出の注目度): 3.867363075280544
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The extraction of templates such as ``regard X as Y'' from a set of related
phrases requires the identification of their internal structures. This paper
presents an unsupervised approach for extracting templates on-the-fly from only
tagged text by using a novel relaxed variant of the Sequence Binary Decision
Diagram (SeqBDD). A SeqBDD can compress a set of sequences into a graphical
structure equivalent to a minimal DFA, but more compact and better suited to
the task of template extraction. The main contribution of this paper is a
relaxed form of the SeqBDD construction algorithm that enables it to form
general representations from a small amount of data. The process of compression
of shared structures in the text during Relaxed SeqBDD construction, naturally
induces the templates we wish to extract. Experiments show that the method is
capable of high-quality extraction on tasks based on verb+preposition templates
from corpora and phrasal templates from short messages from social media.
- Abstract(参考訳): 関連したフレーズの集合から ``regard X as Y'' のようなテンプレートを抽出するには、内部構造を識別する必要がある。
本稿では、SeqBDD(Sequence Binary Decision Diagram)の緩和版を用いて、タグ付きテキストのみからテンプレートを抽出するための教師なしアプローチを提案する。
SeqBDDは、一連のシーケンスを最小のDFAに相当するグラフィカルな構造に圧縮することができるが、よりコンパクトでテンプレート抽出のタスクに適している。
本論文の主な貢献はSeqBDD構築アルゴリズムの緩和形式であり、少量のデータから一般的な表現を作成できる。
Relaxed SeqBDD構築中にテキスト内の共有構造を圧縮するプロセスは、私たちが抽出したいテンプレートを自然に誘導します。
実験により,ソーシャルメディアからの短いメッセージからコーパスやフレーズテンプレートから動詞+前置テンプレートに基づくタスクを高品質に抽出できることがわかった。
関連論文リスト
- fPLSA: Learning Semantic Structures in Document Collections Using Foundation Models [19.099810900404357]
本稿では,基礎モデルに基づく確率的潜在意味解析(PLSA)手法であるfPLSAを紹介する。
PLSAは文書レベルのコンテキストに基づいて文書セグメントを反復的にクラスタしタグ付けする。
ストーリーライティング、数学、多段階推論データセットに関する実験は、fPLSAタグが既存のタグ付け手法よりもオリジナルテキストの再構築に役立つことを示した。
論文 参考訳(メタデータ) (2024-10-07T20:25:52Z) - Detection and Measurement of Syntactic Templates in Generated Text [58.111650675717414]
モデルにおける一般的な反復を特徴付けるための構文的特徴の解析を行う。
モデルでは、下流のタスクにおいて、人間の参照テキストよりも高いレートでテンプレートテキストを生成する傾向にある。
論文 参考訳(メタデータ) (2024-06-28T19:34:23Z) - A Quality-based Syntactic Template Retriever for
Syntactically-controlled Paraphrase Generation [67.98367574025797]
既存の構文制御されたパラフレーズ生成モデルは、人間の注釈付きまたはよく書かれた構文テンプレートで有望に機能する。
禁止コストにより、ソース文ごとに適切なテンプレートを手作業で設計することは不可能になります。
本稿では,QSTR(Quality-based Syntactic Template Retriever)を提案する。
論文 参考訳(メタデータ) (2023-10-20T03:55:39Z) - Diffusion Models for Open-Vocabulary Segmentation [79.02153797465324]
OVDiffは、教師なしオープン語彙セグメンテーションに生成テキストから画像への拡散モデルを利用する新しい手法である。
トレーニング済みのコンポーネントのみに依存し、トレーニングなしで合成セグメンタを直接出力する。
論文 参考訳(メタデータ) (2023-06-15T17:51:28Z) - Iterative Document-level Information Extraction via Imitation Learning [32.012467653148846]
複雑な関係を抽出するための新しい反復抽出モデルIterXを提案する。
我々の模倣学習アプローチは、マルコフ決定過程(MDP)として問題を提起する。
これは、2つの確立されたベンチマークの最先端の結果につながる。
論文 参考訳(メタデータ) (2022-10-12T21:46:04Z) - Classifiers are Better Experts for Controllable Text Generation [63.17266060165098]
提案手法は, PPLにおける最近のPPLM, GeDi, DExpertsよりも有意に優れており, 生成したテキストの外部分類器に基づく感情の精度が高いことを示す。
同時に、実装やチューニングも簡単で、制限や要件も大幅に少なくなります。
論文 参考訳(メタデータ) (2022-05-15T12:58:35Z) - PSG: Prompt-based Sequence Generation for Acronym Extraction [26.896811663334162]
頭字語抽出タスクのためのPrompt-based Sequence Generation (PSG) 手法を提案する。
具体的には、抽出した頭字語テキストを自動回帰でプロンプトするテンプレートを設計する。
生成した回答の位置を抽出する位置抽出アルゴリズムを設計する。
論文 参考訳(メタデータ) (2021-11-29T02:14:38Z) - Generating Synthetic Data for Task-Oriented Semantic Parsing with
Hierarchical Representations [0.8203855808943658]
本研究では,ニューラルセマンティック解析のための合成データ生成の可能性を検討する。
具体的には、まず既存のラベル付き発話からマスク付きテンプレートを抽出し、次に微調整BARTを用いて合成発話条件を生成する。
ナビゲーション領域のためのFacebook TOPデータセットを評価する際に、我々のアプローチの可能性を示す。
論文 参考訳(メタデータ) (2020-11-03T22:55:40Z) - GRIT: Generative Role-filler Transformers for Document-level Event
Entity Extraction [134.5580003327839]
本稿では、文書レベルでコンテキストをモデル化するための生成トランスフォーマーベースのエンコーダデコーダフレームワーク(GRIT)を紹介する。
我々は,MUC-4データセットに対する我々のアプローチを評価し,我々のモデルが先行作業よりもかなり優れていることを示す。
論文 参考訳(メタデータ) (2020-08-21T01:07:36Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z) - Variational Template Machine for Data-to-Text Generation [37.03488881357614]
テンプレートのオープンセットは、フレーズ構築を豊かにし、様々な世代を実現するために不可欠である、と我々は主張する。
本稿では,ペアデータと非ペアデータから再利用可能な「テンプレート」を自動的に学習する問題について検討する。
データテーブルからテキスト記述を生成する新しい手法である変分テンプレートマシン(VTM)を提案する。
論文 参考訳(メタデータ) (2020-02-04T04:53:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。