論文の概要: Supertagging the Long Tail with Tree-Structured Decoding of Complex
Categories
- arxiv url: http://arxiv.org/abs/2012.01285v2
- Date: Fri, 11 Dec 2020 15:10:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 04:03:58.766353
- Title: Supertagging the Long Tail with Tree-Structured Decoding of Complex
Categories
- Title(参考訳): 複雑なカテゴリの樹状デコードによるロングテールの重畳
- Authors: Jakob Prange, Nathan Schneider, Vivek Srikumar
- Abstract要約: 現在のCCGスーパータガーは標準的なWSJテストセットで高い精度を達成するが、カテゴリの内部構造を利用するシステムはほとんどない。
木構造予測の新しい手法を含む内部構造を考慮した構築モデルについて検討する。
我々の最高のタグは、長い尾のスーパータグのかなりの部分を復元し、トレーニングで見たことのないCCGカテゴリを生成できる。
- 参考スコア(独自算出の注目度): 26.657488131046865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although current CCG supertaggers achieve high accuracy on the standard WSJ
test set, few systems make use of the categories' internal structure that will
drive the syntactic derivation during parsing. The tagset is traditionally
truncated, discarding the many rare and complex category types in the long
tail. However, supertags are themselves trees. Rather than give up on rare
tags, we investigate constructive models that account for their internal
structure, including novel methods for tree-structured prediction. Our best
tagger is capable of recovering a sizeable fraction of the long-tail supertags
and even generates CCG categories that have never been seen in training, while
approximating the prior state of the art in overall tag accuracy with fewer
parameters. We further investigate how well different approaches generalize to
out-of-domain evaluation sets.
- Abstract(参考訳): 現在のCCGスーパータガーは標準的なWSJテストセットで高い精度を達成するが、解析中に構文的導出を駆動するカテゴリの内部構造を利用するシステムはほとんどない。
タグセットは伝統的に切り捨てられ、長い尾にある多くの稀で複雑なカテゴリーの型を捨てる。
しかし、スーパータグはそれ自体が木である。
稀なタグを諦める代わりに,木構造予測のための新しい手法を含む内部構造を考慮した構成モデルを検討する。
我々の最高のタグは、長い尾のスーパータグの相当な部分を復元し、トレーニングで見たことのないCCGカテゴリを生成できると同時に、タグ全体の精度を少ないパラメータで予測できる。
さらに、異なるアプローチがドメイン外評価セットにどのように一般化するかについても検討する。
関連論文リスト
- Integrating Supertag Features into Neural Discontinuous Constituent Parsing [0.0]
伝統的な選挙区の見解では、構成要素は隣接した単語で構成されており、ドイツ語のような言語で一般的である。
トランジションベースの構文解析は、大きな注釈付きコーパス上で教師あり学習を用いて生のテキストを入力した木を生成する。
論文 参考訳(メタデータ) (2024-10-11T12:28:26Z) - Grokking of Hierarchical Structure in Vanilla Transformers [72.45375959893218]
トランスフォーマー言語モデルでは,極端に長い訓練期間を経て階層的に一般化できることが示される。
中間深度モデルは、非常に深い変圧器と非常に浅い変圧器の両方よりも良く一般化される。
論文 参考訳(メタデータ) (2023-05-30T04:34:13Z) - Geometry-Aware Supertagging with Heterogeneous Dynamic Convolutions [0.7868449549351486]
グラフ理論の観点から構築的なスーパータグ付けを再考する。
異種動的グラフ畳み込みに基づくフレームワークを提案する。
我々は、異なる言語にまたがる多くの分類文法データセットに対して、アプローチを検証した。
論文 参考訳(メタデータ) (2022-03-23T07:07:11Z) - Compositional Generalization Requires Compositional Parsers [69.77216620997305]
直近のCOGSコーパスにおける構成原理によって導かれるシーケンス・ツー・シーケンスモデルとモデルを比較した。
構造一般化は構成一般化の重要な尺度であり、複雑な構造を認識するモデルを必要とする。
論文 参考訳(メタデータ) (2022-02-24T07:36:35Z) - Something Old, Something New: Grammar-based CCG Parsing with Transformer
Models [13.035551917639692]
本稿では, Combinatory Categorial Grammar (CCG) の構文解析問題について述べる。
トランスフォーマーベースのニューラルモデルとシンボリックCG文法の組み合わせが、既存のアプローチよりも大幅に向上することを示している。
また、NLP法がこの期間にどのように進化してきたかを示す20年間の研究プログラムも文書化されている。
論文 参考訳(メタデータ) (2021-09-21T09:20:12Z) - Generating CCG Categories [20.154553201329712]
分類するよりもカテゴリを生成することを提案する。
このカテゴリに関する詳細なビューにより、異なるカテゴリのアノテーションを共有でき、文コンテキストとのインタラクションが強化できることを示した。
提案されたカテゴリジェネレータは、標準的なCCGBankで最先端のタグ付け(95.5%の精度)と解析(89.8%のラベル付きF1)を行うことができる。
論文 参考訳(メタデータ) (2021-03-15T05:01:48Z) - Span-based Semantic Parsing for Compositional Generalization [53.24255235340056]
SpanBasedSPは入力発話上のスパンツリーを予測し、部分的なプログラムが入力内のスパンをどのように構成するかを明示的に符号化する。
GeoQuery、SCAN、CLOSUREでは、SpanBasedSPはランダムスプリットの強いseq2seqベースラインと似ているが、構成一般化を必要とするスプリットのベースラインに比べて劇的に性能が向上する。
論文 参考訳(メタデータ) (2020-09-13T16:42:18Z) - Forest R-CNN: Large-Vocabulary Long-Tailed Object Detection and Instance
Segmentation [75.93960390191262]
我々は、オブジェクトカテゴリ間の関係に関する事前知識を利用して、きめ細かいクラスを粗い親クラスにクラスタリングする。
そこで本研究では,NMS再サンプリング法を提案する。
提案手法はフォレストR-CNNと呼ばれ,ほとんどのオブジェクト認識モデルに適用可能なプラグイン・アンド・プレイモジュールとして機能する。
論文 参考訳(メタデータ) (2020-08-13T03:52:37Z) - Solving Long-tailed Recognition with Deep Realistic Taxonomic Classifier [68.38233199030908]
ロングテール認識は、現実世界のシナリオにおける自然な非一様分散データに取り組む。
モダンは人口密度の高いクラスではうまく機能するが、そのパフォーマンスはテールクラスでは著しく低下する。
Deep-RTCは、リアリズムと階層的予測を組み合わせたロングテール問題の新しい解法として提案されている。
論文 参考訳(メタデータ) (2020-07-20T05:57:42Z) - Fine-Grained Visual Classification with Efficient End-to-end
Localization [49.9887676289364]
本稿では,エンド・ツー・エンドの設定において,分類ネットワークと融合可能な効率的なローカライゼーションモジュールを提案する。
我々は,CUB200-2011,Stanford Cars,FGVC-Aircraftの3つのベンチマークデータセット上で,新しいモデルを評価する。
論文 参考訳(メタデータ) (2020-05-11T14:07:06Z) - Hierarchical Entity Typing via Multi-level Learning to Rank [38.509244927293715]
本稿では,学習と予測の両方において,存在論的構造を取り入れた階層的実体分類手法を提案する。
また,本学習では,正の正の正の型と正の正の正の型を比較した。
予測中、既に予測されている親タイプに基づいて、オントロジーの各レベルで実行可能な候補を制限する粗大なデコーダを定義する。
論文 参考訳(メタデータ) (2020-04-05T19:27:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。