論文の概要: Information Type Classification with Contrastive Task-Specialized
Sentence Encoders
- arxiv url: http://arxiv.org/abs/2312.11020v1
- Date: Mon, 18 Dec 2023 08:45:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-20 20:38:48.919101
- Title: Information Type Classification with Contrastive Task-Specialized
Sentence Encoders
- Title(参考訳): コントラスト型タスク特化文エンコーダを用いた情報型分類
- Authors: Philipp Seeberger, Tobias Bocklet, Korbinian Riedhammer
- Abstract要約: 下流分類のためのコントラスト型タスク特化文エンコーダを提案する。
本稿では,CrisisLex,HumAID,TrecIS情報型分類タスクにおけるF1スコアの性能向上を示す。
- 参考スコア(独自算出の注目度): 8.301569507291006
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: User-generated information content has become an important information source
in crisis situations. However, classification models suffer from noise and
event-related biases which still poses a challenging task and requires
sophisticated task-adaptation. To address these challenges, we propose the use
of contrastive task-specialized sentence encoders for downstream
classification. We apply the task-specialization on the CrisisLex, HumAID, and
TrecIS information type classification tasks and show performance gains w.r.t.
F1-score. Furthermore, we analyse the cross-corpus and cross-lingual
capabilities for two German event relevancy classification datasets.
- Abstract(参考訳): ユーザ生成情報コンテンツは危機的状況において重要な情報ソースとなっている。
しかし、分類モデルはノイズやイベント関連のバイアスに悩まされ、これは依然として困難な課題であり、高度なタスク適応を必要とする。
これらの課題に対処するために,下流分類におけるタスク特化文エンコーダの利用を提案する。
本稿では,CrisisLex,HumAID,TrecIS情報型分類タスクにタスク特殊化を適用し,F1スコアによる性能向上を示す。
さらに、ドイツの2つの事象関連分類データセットのクロスコーパスとクロスランガル機能を分析した。
関連論文リスト
- Rethinking Misalignment in Vision-Language Model Adaptation from a Causal Perspective [13.56923651751788]
本稿では,タスク非関連知識の干渉を軽減するために,因果性誘導セマンティックデカップリングと分類を提案する。
多様な意味論によって生成される各予測の不確実性を評価するために、Dempster-Shaferエビデンス理論を用いる。
論文 参考訳(メタデータ) (2024-10-01T09:33:45Z) - Measuring Spurious Correlation in Classification: 'Clever Hans' in Translationese [11.478503501597967]
トピックベースの素早い相関に注目し,2つの方向から質問にアプローチする。
本研究では,教師なしトピックと対象分類ラベルとのアライメントを指標として,データ中の素早いトピック情報の表示方法を開発した。
本手法はクラスタリングにおける純度と同一であることを示し,分類のための「トピックフロア」(「ノイズフロア」など)を提案する。
論文 参考訳(メタデータ) (2023-08-25T04:19:58Z) - PatchMix Augmentation to Identify Causal Features in Few-shot Learning [55.64873998196191]
少ないショット学習は、十分なカテゴリをラベル付けしたデータに基づいて学習した知識を、少ない既知の情報を持つ新しいカテゴリに転送することを目的としている。
我々はPatchMixと呼ばれる新しいデータ拡張戦略を提案し、この急激な依存関係を壊すことができる。
このような拡張メカニズムが,既存のメカニズムと異なり,因果的特徴を識別可能であることを示す。
論文 参考訳(メタデータ) (2022-11-29T08:41:29Z) - Enhancing Crisis-Related Tweet Classification with Entity-Masked
Language Modeling and Multi-Task Learning [0.30458514384586394]
本稿では,マルチタスク学習問題として,エンティティ・マスク言語モデリングと階層型マルチラベル分類の組み合わせを提案する。
我々は,TREC-ISデータセットからのつぶやきに対する評価を行い,動作可能な情報型に対して最大10%のF1スコアの絶対的なパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2022-11-21T13:54:10Z) - Association Graph Learning for Multi-Task Classification with Category
Shifts [68.58829338426712]
関連する分類タスクが同じラベル空間を共有し、同時に学習されるマルチタスク分類に焦点を当てる。
我々は、不足クラスのためのタスク間で知識を伝達する関連グラフを学習する。
我々の手法は代表的基準よりも一貫して性能が良い。
論文 参考訳(メタデータ) (2022-10-10T12:37:41Z) - Distant finetuning with discourse relations for stance classification [55.131676584455306]
そこで本研究では,定位分類のモデルとして,原文から銀ラベルでデータを抽出し,微調整する手法を提案する。
また,様々な段階において微調整に用いるデータのノイズレベルが減少する3段階のトレーニングフレームワークを提案する。
NLPCC 2021共有タスクArgumentative Text Understanding for AI Debaterでは,26の競合チームの中で1位にランクインした。
論文 参考訳(メタデータ) (2022-04-27T04:24:35Z) - On Guiding Visual Attention with Language Specification [76.08326100891571]
注意をそらすのではなく,タスク関連機能に分類証拠を限定するためのアドバイスとして,ハイレベルな言語仕様を用いる。
この方法で空間的注意を監督することは、偏りのあるノイズのあるデータを用いた分類タスクの性能を向上させる。
論文 参考訳(メタデータ) (2022-02-17T22:40:19Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - Predicting Themes within Complex Unstructured Texts: A Case Study on
Safeguarding Reports [66.39150945184683]
本稿では,教師付き分類手法を用いた保護レポートにおいて,主テーマの自動識別の問題に焦点をあてる。
この結果から,ラベル付きデータに制限のある複雑なタスクであっても,深層学習モデルが対象知識の振る舞いをシミュレートする可能性が示唆された。
論文 参考訳(メタデータ) (2020-10-27T19:48:23Z) - On Cross-Dataset Generalization in Automatic Detection of Online Abuse [7.163723138100273]
Wikipedia Detoxデータセットの良質な例は、プラットフォーム固有のトピックに偏っていることを示す。
教師なしトピックモデリングとトピックのキーワードの手動検査を用いてこれらの例を同定する。
頑健なデータセット設計のために、収集したデータを検査し、一般化不可能なコンテンツを小さくするために、安価な教師なし手法を適用することを提案する。
論文 参考訳(メタデータ) (2020-10-14T21:47:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。