論文の概要: Unsupervised Inference of Data-Driven Discourse Structures using a Tree
Auto-Encoder
- arxiv url: http://arxiv.org/abs/2210.09559v1
- Date: Tue, 18 Oct 2022 03:28:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 14:29:57.652702
- Title: Unsupervised Inference of Data-Driven Discourse Structures using a Tree
Auto-Encoder
- Title(参考訳): ツリーオートエンコーダを用いたデータ駆動談話構造の教師なし推論
- Authors: Patrick Huber and Giuseppe Carenini
- Abstract要約: 本稿では,木構造をタスクに依存しない,教師なしの方法で生成するための新しい手法を提案する。
提案手法は,構文解析,談話解析などの木構造的目的に適用可能である。
- 参考スコア(独自算出の注目度): 30.615883375573432
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: With a growing need for robust and general discourse structures in many
downstream tasks and real-world applications, the current lack of high-quality,
high-quantity discourse trees poses a severe shortcoming. In order the
alleviate this limitation, we propose a new strategy to generate tree
structures in a task-agnostic, unsupervised fashion by extending a latent tree
induction framework with an auto-encoding objective. The proposed approach can
be applied to any tree-structured objective, such as syntactic parsing,
discourse parsing and others. However, due to the especially difficult
annotation process to generate discourse trees, we initially develop such
method to complement task-specific models in generating much larger and more
diverse discourse treebanks.
- Abstract(参考訳): 多くのダウンストリームタスクや実世界のアプリケーションにおいて、堅牢で一般的な談話構造の必要性が高まっているため、現在の高品質で高品質な談話ツリーの欠如は深刻な欠点となっている。
この制約を緩和するために,潜在木誘導フレームワークを自動エンコーディング目的に拡張することにより,タスクに依存しない教師なし方式で木構造を生成する新しい手法を提案する。
提案手法は,構文解析,談話解析などの木構造的目的に適用可能である。
しかし,談話木を生成するのが特に困難であるため,当初はタスク固有モデルを補完し,より大きく多様な談話木バンクを生成する手法を開発した。
関連論文リスト
- GrootVL: Tree Topology is All You Need in State Space Model [66.36757400689281]
GrootVLは、視覚的タスクとテキストタスクの両方に適用できる多目的マルチモーダルフレームワークである。
本手法は, 画像分類, オブジェクト検出, セグメンテーションにおいて, 既存の構造化状態空間モデルよりも大幅に優れる。
大規模言語モデルの微調整により,本手法は訓練コストの少ない複数のテキストタスクにおいて一貫した改善を実現する。
論文 参考訳(メタデータ) (2024-06-04T15:09:29Z) - RLET: A Reinforcement Learning Based Approach for Explainable QA with
Entailment Trees [47.745218107037786]
本稿では,強化学習に基づくEntailment Tree生成フレームワークであるRLETを提案する。
RLETは文の選択と推論生成モジュールによる単一ステップ推論を反復的に行う。
EntailmentBankデータセットの3つの設定の実験では、RLフレームワークを使用することの強みが示されている。
論文 参考訳(メタデータ) (2022-10-31T06:45:05Z) - Large Discourse Treebanks from Scalable Distant Supervision [30.615883375573432]
本稿では,感情分析の補助的課題に対する遠隔監視から「銀標準」談話木を生成する枠組みを提案する。
銀標準」の談話木は、より大きく、より多様性があり、ドメインに依存しないデータセットで訓練されている。
論文 参考訳(メタデータ) (2022-10-18T03:33:43Z) - A Tree-structured Transformer for Program Representation Learning [27.31416015946351]
プログラムには長期/グローバルな依存関係が広く存在し、ほとんどのニューラルネットワークはこれらの依存関係をキャプチャできない。
本稿では,この制限を克服することを目的とした,新しい木構造ニューラルネットワークであるTree-Transformerを提案する。
ボトムアップとトップダウンの伝搬を組み合わせることで、Tree-Transformerはグローバルコンテキストと有意義なノード機能の両方を学ぶことができる。
論文 参考訳(メタデータ) (2022-08-18T05:42:01Z) - Tree Reconstruction using Topology Optimisation [0.685316573653194]
本稿では,点雲データから木の枝構造を抽出する一般的な手法を提案する。
本稿では,木構造復元における新しいアプローチの利点と欠点について論じる。
本手法は,ほとんどの場合,詳細かつ正確な木構造を生成する。
論文 参考訳(メタデータ) (2022-05-26T07:08:32Z) - Incorporating Constituent Syntax for Coreference Resolution [50.71868417008133]
本稿では,構成構文構造をグラフベースで組み込む手法を提案する。
また、高次近傍情報を利用して構成木に富んだ構造をエンコードすることも検討する。
on the English and Chinese parts of OntoNotes 5.0 benchmark shows that our proposed model beats a strong baseline or a new-of-the-art performance。
論文 参考訳(メタデータ) (2022-02-22T07:40:42Z) - Unsupervised Learning of Discourse Structures using a Tree Autoencoder [8.005512864082126]
本研究では, 自動符号化目的による潜在木誘導フレームワークを拡張することにより, タスクに依存しない, 監視されていない方法で木構造を生成する新しい戦略を提案する。
提案されたアプローチは、構文解析、談話解析など、任意のツリー目的に適用することができる。
本稿では,複数の領域における自然文の一般的な木構造を推定し,様々なタスクで有望な結果を示す。
論文 参考訳(メタデータ) (2020-12-17T08:40:34Z) - MEGA RST Discourse Treebanks with Structure and Nuclearity from Scalable
Distant Sentiment Supervision [30.615883375573432]
本稿では,感情アノテートされたデータセットから遠方からの監視を用いて,談話木バンクを自動的に生成する新しい手法を提案する。
提案手法は,効率的なビーム探索手法を用いて,任意の長さの文書に構造と核性を取り入れた木を生成する。
実験により、MEGA-DTツリーバンクでトレーニングされた談話が、ドメイン間パフォーマンスの有望な向上をもたらすことが示された。
論文 参考訳(メタデータ) (2020-11-05T18:22:38Z) - MurTree: Optimal Classification Trees via Dynamic Programming and Search [61.817059565926336]
動的プログラミングと探索に基づいて最適な分類木を学習するための新しいアルゴリズムを提案する。
当社のアプローチでは,最先端技術が必要とする時間のごく一部しか使用せず,数万のインスタンスでデータセットを処理することが可能です。
論文 参考訳(メタデータ) (2020-07-24T17:06:55Z) - Exploiting Syntactic Structure for Better Language Modeling: A Syntactic
Distance Approach [78.77265671634454]
我々はマルチタスクの目的、すなわち、モデルが単語を同時に予測し、また「シンタクティック距離」と呼ばれる形態で真実解析木を解析する。
Penn Treebank と Chinese Treebank のデータセットによる実験結果から,地上の真理解析木を追加の訓練信号として提供すると,そのモデルはより低いパープレキシティを実現し,より良い品質で木を誘導できることが示された。
論文 参考訳(メタデータ) (2020-05-12T15:35:00Z) - Tree-structured Attention with Hierarchical Accumulation [103.47584968330325]
階層的累積」は解析木構造を一定時間複雑度で自己注意に符号化する。
提案手法は,4つの IWSLT 翻訳タスクと WMT'14 翻訳タスクにおいて,SOTA 法より優れている。
論文 参考訳(メタデータ) (2020-02-19T08:17:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。