論文の概要: Not All Linearizations Are Equally Data-Hungry in Sequence Labeling
Parsing
- arxiv url: http://arxiv.org/abs/2108.07556v1
- Date: Tue, 17 Aug 2021 10:47:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-18 18:51:59.664887
- Title: Not All Linearizations Are Equally Data-Hungry in Sequence Labeling
Parsing
- Title(参考訳): 系列ラベル解析におけるすべての線形化が等しくデータハングリーであるとは限らない
- Authors: Alberto Mu\~noz-Ortiz, Michalina Strzyz, David Vilares
- Abstract要約: 依存関係解析をシーケンスラベリングとしてキャストするために線形化が提案されている。
我々は、これらの線形化が低リソースのセットアップでどのように振る舞うかを研究する。
その結果、ヘッドセレクション符号化はよりデータ効率が高く、理想的なフレームワークでより優れた性能を発揮することが示された。
- 参考スコア(独自算出の注目度): 19.9169198376948
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Different linearizations have been proposed to cast dependency parsing as
sequence labeling and solve the task as: (i) a head selection problem, (ii)
finding a representation of the token arcs as bracket strings, or (iii)
associating partial transition sequences of a transition-based parser to words.
Yet, there is little understanding about how these linearizations behave in
low-resource setups. Here, we first study their data efficiency, simulating
data-restricted setups from a diverse set of rich-resource treebanks. Second,
we test whether such differences manifest in truly low-resource setups. The
results show that head selection encodings are more data-efficient and perform
better in an ideal (gold) framework, but that such advantage greatly vanishes
in favour of bracketing formats when the running setup resembles a real-world
low-resource configuration.
- Abstract(参考訳): i) 見出し選択問題、(ii) トークンアークの表現を括弧列として見つけること、(iii) トランジッションベースのパーサの部分遷移シーケンスを単語に関連付けること。
しかし、これらの線形化が低リソース設定でどのように振る舞うかについては、ほとんど理解されていない。
ここでは、データ効率をまず研究し、多種多様なリッチソースツリーバンクからデータ制限された設定をシミュレートする。
第二に、そのような違いが本当に低リソースのセットアップに現れるかどうかをテストする。
その結果、ヘッドセレクション符号化はよりデータ効率が高く、理想的な(ゴールド)フレームワークでは性能が向上するが、実際の低リソース構成に類似した実行時のブラケットフォーマットでは、その利点は大きく失われることがわかった。
関連論文リスト
- Dependency Graph Parsing as Sequence Labeling [18.079016557290338]
我々は、グラフ解析をタグ付けタスクとしてキャストするのに使用できる、非有界および有界な線形化の範囲を定義する。
セマンティック依存関係とUD解析の強化に関する実験結果から, シーケンスラベル依存グラフは, 符号化の優れた選択により, 高い効率性と, 最先端の精度を両立させることがわかった。
論文 参考訳(メタデータ) (2024-10-23T15:37:02Z) - CorDA: Context-Oriented Decomposition Adaptation of Large Language Models for Task-Aware Parameter-Efficient Fine-tuning [101.81127587760831]
現在の微調整手法は、学習すべき下流タスクのコンテキストや、維持すべき重要な知識のコンテキストに広く適用できるアダプタを構築している。
学習可能なタスク対応アダプタを構築するコンテキスト指向の分解適応手法であるCorDAを提案する。
本手法は,知識保存型適応と指導レビュー型適応の2つの選択肢を実現する。
論文 参考訳(メタデータ) (2024-06-07T19:10:35Z) - Binning as a Pretext Task: Improving Self-Supervised Learning in Tabular Domains [0.565395466029518]
そこで本研究では,古典的ビンニング手法に基づく新しいプレテキストタスクを提案する。
その考え方は単純で、元の値ではなく、binインデックス(順序またはクラス)を再構築する。
我々の実証調査では、ビンニングの利点がいくつか確認されている。
論文 参考訳(メタデータ) (2024-05-13T01:23:14Z) - Learning Context-aware Classifier for Semantic Segmentation [88.88198210948426]
本稿では,文脈認識型分類器の学習を通じて文脈ヒントを利用する。
本手法はモデルに依存しないため,ジェネリックセグメンテーションモデルにも容易に適用できる。
無視できる追加パラメータと+2%の推論時間だけで、小型モデルと大型モデルの両方で十分な性能向上が達成されている。
論文 参考訳(メタデータ) (2023-03-21T07:00:35Z) - On Parsing as Tagging [66.31276017088477]
そこで我々は,現在最先端の選挙区タグであるテトラタグを減らして,シフト-リデュース解析を行う方法を示す。
我々は、線形化器、学習者、復号器の異なる選択でタグ付けパイプラインの分類を実証的に評価する。
論文 参考訳(メタデータ) (2022-11-14T13:37:07Z) - Addressing Resource and Privacy Constraints in Semantic Parsing Through
Data Augmentation [33.21612085142085]
低リソースなタスク指向のセマンティック解析のための新しいセットアップを提案する。
私たちの目標は、ユーザインタラクションを通じて収集された発話を用いて、低リソースのセマンティック拡張を改善することです。
論文 参考訳(メタデータ) (2022-05-18T01:14:47Z) - Pyramid-BERT: Reducing Complexity via Successive Core-set based Token
Selection [23.39962989492527]
BERTのようなトランスフォーマーベースの言語モデルは、様々なNLPタスクで最先端を達成しているが、計算的に禁止されている。
本稿では,従来の使用法を,理論的な結果によって正当化されたemコアセットベースのトークン選択法で置き換えるピラミッド-BERTを提案する。
コアセットベースのトークン選択技術により、高価な事前トレーニングを回避でき、空間効率の良い微調整が可能となり、長いシーケンス長を扱うのに適している。
論文 参考訳(メタデータ) (2022-03-27T19:52:01Z) - Parallel feature selection based on the trace ratio criterion [4.30274561163157]
本研究は,PFSTを用いた並列特徴選択という,新しい並列特徴選択手法を提案する。
提案手法は,Fisher's Discriminant Analysisで用いられるクラス分離性の尺度であるトレース基準を用いて特徴的有用性を評価する。
実験により,本手法は,比較対象の他の手法による時間的差のごく一部で,少数の特徴セットを生成できることが確認された。
論文 参考訳(メタデータ) (2022-03-03T10:50:33Z) - Auto-weighted Multi-view Feature Selection with Graph Optimization [90.26124046530319]
グラフ学習に基づく新しい教師なしマルチビュー特徴選択モデルを提案する。
1) 特徴選択過程において, 異なる視点で共有されたコンセンサス類似度グラフが学習される。
各種データセットを用いた実験により,提案手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-11T03:25:25Z) - Automated Concatenation of Embeddings for Structured Prediction [75.44925576268052]
本稿では, 埋め込みの自動結合(ACE)を提案し, 構造予測タスクにおける埋め込みのより優れた結合を見つけるプロセスを自動化する。
我々は、強化学習の戦略に従い、制御器のパラメータを最適化し、タスクモデルの精度に基づいて報酬を計算する。
論文 参考訳(メタデータ) (2020-10-10T14:03:20Z) - Selecting Relevant Features from a Multi-domain Representation for
Few-shot Classification [91.67977602992657]
本稿では,従来の特徴適応手法よりもシンプルかつ効果的である特徴選択に基づく新しい戦略を提案する。
このような特徴の上に構築された単純な非パラメトリック分類器は高い精度を示し、訓練中に見たことのない領域に一般化する。
論文 参考訳(メタデータ) (2020-03-20T15:44:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。