論文の概要: To Be or Not To Be a Verbal Multiword Expression: A Quest for
Discriminating Features
- arxiv url: http://arxiv.org/abs/2007.11381v1
- Date: Wed, 22 Jul 2020 12:47:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 22:38:05.437346
- Title: To Be or Not To Be a Verbal Multiword Expression: A Quest for
Discriminating Features
- Title(参考訳): 動詞のマルチワード表現であるかどうか:特徴を識別するクエスト
- Authors: Caroline Pasquer (1), Agata Savary (1), Jean-Yves Antoine (1), Carlos
Ramisch (2), Nicolas Labroche (1), Arnaud Giacometti (1) ((1) University of
Tours, France, (2) Aix Marseille Univ, Universit\'e de Toulon, CNRS, LIS,
Marseille, France)
- Abstract要約: この事実を利用して、教師付き分類設定で使用できる最適な特徴セットを決定する。
驚いたことに、単純な周波数ベースの特徴選択法は他の標準手法よりも効率的であることが証明される。
6つの機能しか持たない最適セットを用いたSVM分類器は、フランスで見られるデータに対する最近の共有タスクから最高のシステムよりも優れています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic identification of mutiword expressions (MWEs) is a pre-requisite
for semantically-oriented downstream applications. This task is challenging
because MWEs, especially verbal ones (VMWEs), exhibit surface variability.
However, this variability is usually more restricted than in regular (non-VMWE)
constructions, which leads to various variability profiles. We use this fact to
determine the optimal set of features which could be used in a supervised
classification setting to solve a subproblem of VMWE identification: the
identification of occurrences of previously seen VMWEs. Surprisingly, a simple
custom frequency-based feature selection method proves more efficient than
other standard methods such as Chi-squared test, information gain or decision
trees. An SVM classifier using the optimal set of only 6 features outperforms
the best systems from a recent shared task on the French seen data.
- Abstract(参考訳): mutiword expression (mwes) の自動識別は、セマンティック指向の下流アプリケーションのための前提条件である。
MWE、特にVMWE(英語版)は表面的変動を示すため、この課題は困難である。
しかしながら、この変数は通常、通常の(非VMWE)構造よりも制限され、様々な変数プロファイルをもたらす。
この事実を利用して、教師付き分類設定で使用可能な特徴の最適セットを決定し、VMWE識別のサブプロブレム、すなわち、以前に見られたVMWEの発生の識別を解決する。
驚いたことに、単純な周波数ベースの特徴選択法は、Chi-squaredテストや情報ゲイン、決定木といった他の標準手法よりも効率的である。
6つの機能しか持たない最適セットを用いたSVM分類器は、フランスで見られるデータに対する最近の共有タスクから最高のシステムより優れている。
関連論文リスト
- On the Expressiveness and Length Generalization of Selective State-Space Models on Regular Languages [56.22289522687125]
SSM(Selective State-space Model)はTransformerの代替品である。
正規言語タスクにおける表現性や長さの一般化性能を解析する。
本稿では,Selective Dense State-Space Model (SD-SSM)を紹介する。
論文 参考訳(メタデータ) (2024-12-26T20:53:04Z) - Sparse Attention Vectors: Generative Multimodal Model Features Are Discriminative Vision-Language Classifiers [79.45405711339322]
生成型大規模マルチモーダルモデル(LMM)は、画像キャプションや視覚的質問応答など、様々な視覚言語(VL)タスクに優れる。
本稿では,LMMを識別タスクに効果的に活用する手法を提案する。
論文 参考訳(メタデータ) (2024-11-28T18:55:41Z) - Contextual Feature Selection with Conditional Stochastic Gates [9.784482648233048]
条件ゲート(c-STG)は、文脈変数に基づいてパラメータが予測される条件変数を用いて、特徴の重要性をモデル化する。
我々は,c-STGは,予測精度と解釈可能性を高めつつ,特徴選択能力の向上につながることを示した。
論文 参考訳(メタデータ) (2023-12-21T19:12:59Z) - Temporal-aware Hierarchical Mask Classification for Video Semantic
Segmentation [62.275143240798236]
ビデオセマンティックセグメンテーションデータセットは、ビデオ毎のカテゴリが限られている。
VSSトレーニング中に意味のある勾配更新を受けるために、クエリの10%未満がマッチする可能性がある。
提案手法は,最新のVSSベンチマークVSPWにおいてベルやホイッスルを使わずに,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-09-14T20:31:06Z) - Learning Context-aware Classifier for Semantic Segmentation [88.88198210948426]
本稿では,文脈認識型分類器の学習を通じて文脈ヒントを利用する。
本手法はモデルに依存しないため,ジェネリックセグメンテーションモデルにも容易に適用できる。
無視できる追加パラメータと+2%の推論時間だけで、小型モデルと大型モデルの両方で十分な性能向上が達成されている。
論文 参考訳(メタデータ) (2023-03-21T07:00:35Z) - Data structure > labels? Unsupervised heuristics for SVM hyperparameter
estimation [0.9208007322096532]
Support Vector Machineは多くの機械学習アプローチのデファクト参照である。
パラメータの選択は通常、時間を要するグリッドサーチクロスバリデーション手順(GSCV)によって達成される
我々は、SVMパラメータ選択の改善を提案し、GSCVと、30以上の標準分類データセット上で、最先端のアーティファクトに対してテストした。
論文 参考訳(メタデータ) (2021-11-03T12:04:03Z) - Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。
現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。
我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-18T19:03:40Z) - MASKER: Masked Keyword Regularization for Reliable Text Classification [73.90326322794803]
文脈に基づく予測を容易にする微調整手法であるマスク付きキーワード正規化(MASKER)を提案する。
maskerはモデルを規則化し、他の単語からキーワードを再構築し、十分な文脈なしに低信頼の予測を行う。
分類精度を低下させることなくOOD検出とクロスドメインの一般化を改善したMASKERを提案する。
論文 参考訳(メタデータ) (2020-12-17T04:54:16Z) - A novel embedded min-max approach for feature selection in nonlinear
support vector machine classification [0.0]
min-max最適化問題に基づく組込み特徴選択法を提案する。
双対性理論を活用することにより、min-max問題を等価に修正し、それ以上のアドを伴わずに解決する。
提案手法の効率性と有用性は,いくつかのベンチマークデータセットで検証される。
論文 参考訳(メタデータ) (2020-04-21T09:40:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。