論文の概要: Your Next State-of-the-Art Could Come from Another Domain: A Cross-Domain Analysis of Hierarchical Text Classification
- arxiv url: http://arxiv.org/abs/2412.12744v1
- Date: Tue, 17 Dec 2024 10:08:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-18 14:02:16.370106
- Title: Your Next State-of-the-Art Could Come from Another Domain: A Cross-Domain Analysis of Hierarchical Text Classification
- Title(参考訳): あなたの次の状態は別のドメインから:階層的テキスト分類のクロスドメイン分析
- Authors: Nan Li, Bo Kang, Tijl De Bie,
- Abstract要約: 階層ラベルを用いたテキスト分類は、自然言語処理において一般的で困難な課題である。
我々は、最先端の手法を実証分析した最初の包括的クロスドメイン概要を提供する。
- 参考スコア(独自算出の注目度): 13.210645250173997
- License:
- Abstract: Text classification with hierarchical labels is a prevalent and challenging task in natural language processing. Examples include assigning ICD codes to patient records, tagging patents into IPC classes, assigning EUROVOC descriptors to European legal texts, and more. Despite its widespread applications, a comprehensive understanding of state-of-the-art methods across different domains has been lacking. In this paper, we provide the first comprehensive cross-domain overview with empirical analysis of state-of-the-art methods. We propose a unified framework that positions each method within a common structure to facilitate research. Our empirical analysis yields key insights and guidelines, confirming the necessity of learning across different research areas to design effective methods. Notably, under our unified evaluation pipeline, we achieved new state-of-the-art results by applying techniques beyond their original domains.
- Abstract(参考訳): 階層ラベルを用いたテキスト分類は、自然言語処理において一般的で困難な課題である。
例えば、ICDコードを患者の記録に割り当てたり、特許をIPCクラスにタグ付けしたり、EUROVOCディスクリプタを欧州の法律文書に割り当てたりしている。
広く応用されているにもかかわらず、様々な領域にわたる最先端の手法の包括的な理解は欠如している。
本稿では,最先端の手法を実証分析した最初の総合的クロスドメイン概要を提供する。
本研究では,各手法を共通構造内に配置し,研究を容易にする統一的な枠組みを提案する。
我々の経験的分析は重要な洞察とガイドラインをもたらし、効果的な手法を設計するために異なる研究領域にわたる学習の必要性を確認する。
特に、統合評価パイプラインの下では、元のドメインを越えてテクニックを適用して、新しい最先端の成果を達成しました。
関連論文リスト
- Text Classification using Graph Convolutional Networks: A Comprehensive Survey [11.1080224302799]
グラフ畳み込みネットワーク(GCN)ベースのアプローチは、この10年間、この分野で大きな注目を集めてきた。
本研究の目的は,GCNをベースとしたテキスト分類手法をアーキテクチャや監視方法に関して要約し,分類することである。
論文 参考訳(メタデータ) (2024-10-12T07:03:42Z) - Exploring Ordinality in Text Classification: A Comparative Study of Explicit and Implicit Techniques [3.197435100145382]
日常分類(OC)は自然言語処理(NLP)における課題である。
OCに挑戦する以前のアプローチは、ラベルの順序性について明確に説明されるような、既存の変更や新規な損失関数の作成に重点を置いていた。
Pretrained Language Models (PLMs) の出現により、ラベルのtextbfimplicit セマンティクスを通じて、オーディナリティに取り組むことが可能になった。
論文 参考訳(メタデータ) (2024-05-20T04:31:04Z) - Mind Your Neighbours: Leveraging Analogous Instances for Rhetorical Role Labeling for Legal Documents [1.2562034805037443]
本研究では,Rhetorical Role Labeling (RRL) の性能向上のための新しい手法を提案する。
推論に基づく手法では、ラベル予測を再学習せずに促進する手法を探索する。
トレーニングベースの手法では、埋め込み空間に直接作用する新しい談話対応コントラスト手法と学習を統合する。
論文 参考訳(メタデータ) (2024-03-31T08:10:45Z) - Cross-domain Chinese Sentence Pattern Parsing [67.1381983012038]
文パターン構造解析(SPS)は、主に言語教育に使用される構文解析法である。
既存のSPSは教科書のコーパスに大きく依存しており、クロスドメイン機能に欠ける。
本稿では,大規模言語モデル(LLM)を自己学習フレームワーク内で活用する革新的な手法を提案する。
論文 参考訳(メタデータ) (2024-02-26T05:30:48Z) - Bidirectional Generative Framework for Cross-domain Aspect-based
Sentiment Analysis [68.742820522137]
クロスドメインアスペクトベースの感情分析(ABSA)は、ソースドメインから知識を伝達することで、ターゲットドメイン上で様々なきめ細かい感情分析タスクを実行することを目的としている。
本稿では,多様なドメイン間ABSAタスクに対処するための統合双方向生成フレームワークを提案する。
我々のフレームワークは、テキストからラベルまでの方向とラベルからテキストへの方向の両方で生成モデルを訓練する。
論文 参考訳(メタデータ) (2023-05-16T15:02:23Z) - A Robust Contrastive Alignment Method For Multi-Domain Text
Classification [21.35729884948437]
マルチドメインテキスト分類は、様々なシナリオで自動的にテキストを分類することができる。
現在の高度なメソッドでは、プライベート共有のパラダイムを使用し、共有エンコーダによってドメイン共有の機能をキャプチャし、各ドメインに対してプライベートエンコーダをトレーニングしてドメイン固有の特徴を抽出する。
教師付きコントラスト学習により,異なる領域のテキスト分類特徴を同じ特徴空間に整列させる頑健なコントラストアライメント手法を提案する。
論文 参考訳(メタデータ) (2022-04-26T07:34:24Z) - Revise and Resubmit: An Intertextual Model of Text-based Collaboration
in Peer Review [52.359007622096684]
ピアレビューは、ほとんどの科学分野における出版プロセスの重要な要素である。
既存のNLP研究は個々のテキストの分析に重点を置いている。
編集補助は、しばしばテキストのペア間の相互作用をモデル化する必要がある。
論文 参考訳(メタデータ) (2022-04-22T16:39:38Z) - A Simple Information-Based Approach to Unsupervised Domain-Adaptive
Aspect-Based Sentiment Analysis [58.124424775536326]
本稿では,相互情報に基づくシンプルだが効果的な手法を提案し,それらの用語を抽出する。
実験の結果,提案手法はクロスドメインABSAの最先端手法よりも4.32%高い性能を示した。
論文 参考訳(メタデータ) (2022-01-29T10:18:07Z) - Structured Latent Embeddings for Recognizing Unseen Classes in Unseen
Domains [108.11746235308046]
本稿では,異なる領域からの画像を投影することで,ドメインに依存しない遅延埋め込みを学習する手法を提案する。
挑戦的なDomainNetとDomainNet-LSベンチマークの実験は、既存のメソッドよりもアプローチの方が優れていることを示している。
論文 参考訳(メタデータ) (2021-07-12T17:57:46Z) - Multifaceted Context Representation using Dual Attention for Ontology
Alignment [6.445605125467574]
オントロジーアライメントは、データ統合、データ転送、データ準備など、さまざまな分野に適用できる重要な研究課題である。
We propose VeeAlign, a Deep Learning based model that using a dual-attention mechanism to compute the contextualized representation of a concept to learn alignments。
我々は、異なるドメインや多言語設定の様々なデータセットに対するアプローチを検証するとともに、SOTA法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-10-16T18:28:38Z) - Text Recognition in Real Scenarios with a Few Labeled Samples [55.07859517380136]
Scene Text Recognition (STR) はコンピュータビジョン分野におけるホットな研究テーマである。
本稿では,数ショットの逆数列領域適応 (FASDA) を用いて構築シーケンスを適応する手法を提案する。
我々のアプローチは、ソースドメインとターゲットドメインの間の文字レベルの混乱を最大化することができる。
論文 参考訳(メタデータ) (2020-06-22T13:03:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。