論文の概要: Iterative Paraphrastic Augmentation with Discriminative Span Alignment
- arxiv url: http://arxiv.org/abs/2007.00320v1
- Date: Wed, 1 Jul 2020 08:33:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 23:12:54.247110
- Title: Iterative Paraphrastic Augmentation with Discriminative Span Alignment
- Title(参考訳): 識別的スパンアライメントによる反復的パラフレッシック増強
- Authors: Ryan Culkin, J. Edward Hu, Elias Stengel-Eskin, Guanghui Qin, Benjamin
Van Durme
- Abstract要約: 文レベルの制約付きパラフレージングと差別的スパンアライメントに基づく新しいパラフレッシブ拡張戦略を導入する。
我々は,20年以上にわたる人的労働を対象とする大規模言語理解プロジェクトであるBerkeley FrameNetプロジェクトについて,我々のフレームワークを解説する。
- 参考スコア(独自算出の注目度): 33.965454610119046
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a novel paraphrastic augmentation strategy based on
sentence-level lexically constrained paraphrasing and discriminative span
alignment. Our approach allows for the large-scale expansion of existing
resources, or the rapid creation of new resources from a small,
manually-produced seed corpus. We illustrate our framework on the Berkeley
FrameNet Project, a large-scale language understanding effort spanning more
than two decades of human labor. Based on roughly four days of collecting
training data for the alignment model and approximately one day of parallel
compute, we automatically generate 495,300 unique (Frame, Trigger) combinations
annotated in context, a roughly 50x expansion atop FrameNet v1.7.
- Abstract(参考訳): 本稿では,文レベルの制約付き言い換えと識別的スパンアライメントに基づく新しい言い換え強化戦略を提案する。
我々のアプローチは、既存の資源を大規模に拡張したり、手動で生産された小さなシードコーパスから新しい資源を迅速に生成することを可能にする。
われわれのフレームワークは、20年以上にわたる人的労働にまたがる大規模な言語理解プロジェクトであるBerkeley FrameNetプロジェクトについて説明する。
約4日間のアライメントモデルのトレーニングデータ収集と,約1日間の並列計算に基づいて,コンテキストでアノテートされた495,300のユニークな(フレーム,トリガー)コンビネーションを,framenet v1.7の約50倍の拡張で自動生成する。
関連論文リスト
- An Efficient and Explanatory Image and Text Clustering System with Multimodal Autoencoder Architecture [0.5803309695504829]
我々は,従来のCVAEモデルのモダリティを拡張する畳み込み・繰り返し変分自動エンコーダモデルを開発した。
本研究では,フレームキャプションアライメント,潜在空間ベクトルクラスタリング,新しいLCMクラスタインタプリタなどを含む大規模システムにモデルを組み込む。
論文 参考訳(メタデータ) (2024-08-14T20:03:53Z) - Openstory++: A Large-scale Dataset and Benchmark for Instance-aware Open-domain Visual Storytelling [81.69474860607542]
画像とテキストの両方にインスタンスレベルのアノテーションを追加する大規模データセットであるOpenstory++を提示する。
また、長いマルチモーダルコンテキストが提供される際に、画像生成タスクを評価するための先駆的なベンチマークフレームワークであるCohere-Benchについても紹介する。
論文 参考訳(メタデータ) (2024-08-07T11:20:37Z) - Improving Retrieval Augmented Open-Domain Question-Answering with Vectorized Contexts [83.57864140378035]
本稿では,オープンドメイン質問応答タスクにおいて,より長いコンテキストをカバーできる手法を提案する。
コンテキストを効果的にエンコードする小さなエンコーダ言語モデルを利用し、エンコーダは元の入力とクロスアテンションを適用する。
微調整後、2つのホールドインデータセット、4つのホールドアウトデータセット、および2つのIn Context Learning設定のパフォーマンスが改善された。
論文 参考訳(メタデータ) (2024-04-02T15:10:11Z) - RAVEN: Rethinking Adversarial Video Generation with Efficient Tri-plane Networks [93.18404922542702]
本稿では,長期的空間的および時間的依存関係に対処する新しいビデオ生成モデルを提案する。
提案手法は,3次元認識型生成フレームワークにインスパイアされた,明示的で単純化された3次元平面のハイブリッド表現を取り入れたものである。
我々のモデルは高精細度ビデオクリップを解像度256時間256$ピクセルで合成し、フレームレート30fpsで5ドル以上まで持続する。
論文 参考訳(メタデータ) (2024-01-11T16:48:44Z) - Paragraph-to-Image Generation with Information-Enriched Diffusion Model [67.9265336953134]
パラディフュージョン(英: ParaDiffusion)は、パラディフュージョンモデルである。
これは、大きな言語モデルの広範囲な意味理解能力を画像生成のタスクに移すことを念頭に置いている。
コードとデータセットは、長文アライメントに関するコミュニティの研究を促進するためにリリースされます。
論文 参考訳(メタデータ) (2023-11-24T05:17:01Z) - Retrieve-and-Fill for Scenario-based Task-Oriented Semantic Parsing [110.4684789199555]
シナリオベースのセマンティックパーシングを導入し、最初に発話の「scenario」を曖昧にする必要がある元のタスクの変種を紹介します。
この定式化により、タスクの粗くきめ細かな側面を分離することが可能となり、それぞれがオフザシェルフニューラルネットワークモジュールで解決される。
私たちのモデルはモジュール化され、差別化可能で、解釈可能で、シナリオから余分な監督を得られるようになります。
論文 参考訳(メタデータ) (2022-02-02T08:00:21Z) - Improving the Diversity of Unsupervised Paraphrasing with Embedding
Outputs [28.16894664889912]
ゼロショットパラフレーズ生成のための新しい手法を提案する。
主な貢献は、翻訳された並列コーパスを用いて訓練されたエンドツーエンドの多言語パラフレーズモデルである。
論文 参考訳(メタデータ) (2021-10-25T19:33:38Z) - Sister Help: Data Augmentation for Frame-Semantic Role Labeling [9.62264668211579]
既存のフレーム固有のアノテーションを用いて、注釈のない同じフレームの他の語彙単位を自動的に注釈付けするデータ拡張手法を提案する。
本稿では,このデータ強化の重要性を示すフレーム・セマンティック・ロール・ラベリングの実験を行う。
論文 参考訳(メタデータ) (2021-09-16T05:15:29Z) - InFillmore: Neural Frame Lexicalization for Narrative Text Infilling [36.102931352145845]
フレームセマンティクス理論に触発された双方向文脈条件付き言語生成の構造化拡張を提案する。
インタラクティブなWebデモはhttps://nlp.jhu.edu/demos.comで公開しています。
論文 参考訳(メタデータ) (2021-03-08T17:59:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。