論文の概要: TransPOS: Transformers for Consolidating Different POS Tagset Datasets
- arxiv url: http://arxiv.org/abs/2209.11959v1
- Date: Sat, 24 Sep 2022 08:43:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 14:01:24.921281
- Title: TransPOS: Transformers for Consolidating Different POS Tagset Datasets
- Title(参考訳): TransPOS: 異なるPOSタグセットを統合するためのトランスフォーマー
- Authors: Alex Li, Ilyas Bankole-Hameed, Ranadeep Singh, Gabriel Shen Han Ng,
Akshat Gupta
- Abstract要約: 本稿では、異なるタグ付け方式の下で、POSタグをラベル付けする2つのデータセットについて考察する。
完全に結合しない2つのデータセットを統合する問題に対処するため,Transformerを用いた新しい教師付きアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 0.8399688944263843
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In hope of expanding training data, researchers often want to merge two or
more datasets that are created using different labeling schemes. This paper
considers two datasets that label part-of-speech (POS) tags under different
tagging schemes and leverage the supervised labels of one dataset to help
generate labels for the other dataset. This paper further discusses the
theoretical difficulties of this approach and proposes a novel supervised
architecture employing Transformers to tackle the problem of consolidating two
completely disjoint datasets. The results diverge from initial expectations and
discourage exploration into the use of disjoint labels to consolidate datasets
with different labels.
- Abstract(参考訳): トレーニングデータの拡大を期待する研究者は、異なるラベリングスキームを使用して作成された2つ以上のデータセットをマージしたい場合が多い。
本稿では、異なるタグ付け方式の下で、POSタグをラベル付けする2つのデータセットを検討し、一方のデータセットの教師付きラベルを利用して、他方のデータセットのラベルを生成する。
本稿では, 提案手法の理論的難しさをさらに議論し, 2つの完全不整合データセットの統合問題に対処するため, トランスフォーマーを用いた新しい教師付きアーキテクチャを提案する。
結果は、最初の期待から分岐し、異なるラベルでデータセットを統合するために非結合ラベルの使用を阻止する。
関連論文リスト
- Exploiting Conjugate Label Information for Multi-Instance Partial-Label Learning [61.00359941983515]
MIPL(Multi-instance partial-label Learning)は、各トレーニングサンプルが1つの真のラベルといくつかの偽陽性を含む候補ラベルセットに関連付けられたマルチインスタンスバッグとして表現されるシナリオに対処する。
ELIMIPLは共役ラベル情報を利用して曖昧性を改善する。
論文 参考訳(メタデータ) (2024-08-26T15:49:31Z) - Label Dependencies-aware Set Prediction Networks for Multi-label Text Classification [0.0]
グラフ畳み込みネットワークを活用し,ラベル間の統計的関係に基づいて隣接行列を構築する。
我々は,Bhattacharyya距離を設定された予測ネットワークの出力分布に適用することにより,リコール能力を向上する。
論文 参考訳(メタデータ) (2023-04-14T09:31:17Z) - Learning Semantic Segmentation from Multiple Datasets with Label Shifts [101.24334184653355]
本論文では,ラベル空間が異なる複数のデータセットを対象としたモデルの自動学習手法であるUniSegを提案する。
具体的には,ラベルの相反と共起を考慮に入れた2つの損失を提案する。
論文 参考訳(メタデータ) (2022-02-28T18:55:19Z) - Semi-Supervised Semantic Segmentation with Cross Pseudo Supervision [56.950950382415925]
クロス擬似監督(CPS)と呼ばれる新しい整合性正規化手法を提案する。
CPS整合性には2つの役割がある: 同じ入力画像に対する2つの摂動ネットワークの予測間の高い類似性を奨励し、擬似ラベル付きラベル付きラベル付きデータを使用することでトレーニングデータを拡張する。
実験の結果,Cityscapes と PASCAL VOC 2012 を用いた半教師付きセグメンテーション性能が得られた。
論文 参考訳(メタデータ) (2021-06-02T15:21:56Z) - Group-aware Label Transfer for Domain Adaptive Person Re-identification [179.816105255584]
Unsupervised Adaptive Domain (UDA) Person Re-identification (ReID) は、ラベル付きソースドメインデータセットで訓練されたモデルを、さらなるアノテーションなしでターゲットドメインデータセットに適応することを目的としている。
最も成功したUDA-ReIDアプローチは、クラスタリングに基づく擬似ラベル予測と表現学習を組み合わせて、2つのステップを交互に実行する。
疑似ラベル予測と表現学習のオンラインインタラクションと相互促進を可能にするグループ認識ラベル転送(GLT)アルゴリズムを提案します。
論文 参考訳(メタデータ) (2021-03-23T07:57:39Z) - MATCH: Metadata-Aware Text Classification in A Large Hierarchy [60.59183151617578]
MATCHはメタデータと階層情報の両方を利用するエンドツーエンドのフレームワークである。
親による各子ラベルのパラメータと出力確率を正規化するさまざまな方法を提案します。
大規模なラベル階層を持つ2つの大規模なテキストデータセットの実験は、MATCHの有効性を示しています。
論文 参考訳(メタデータ) (2021-02-15T05:23:08Z) - Object Detection with a Unified Label Space from Multiple Datasets [94.33205773893151]
異なるラベル空間を持つ複数のデータセットが与えられた場合、この研究の目標は、すべてのラベル空間の結合について予測する単一のオブジェクト検出器をトレーニングすることである。
あるデータセットにアノテートされているが、別のデータセットにアノテートされていない顔のようなオブジェクトカテゴリを考えてみましょう。
顔のようないくつかのカテゴリは、あるデータセットでは前景と見なされるが、別のデータセットでは背景と見なされる。
本稿では,部分的だが正しいアノテーションを補完的だがノイズの多い擬似ラベルと注意深く統合する損失関数を提案する。
論文 参考訳(メタデータ) (2020-08-15T00:51:27Z) - openXDATA: A Tool for Multi-Target Data Generation and Missing Label
Completion [23.14045574165086]
機械学習の一般的な問題は、不整合ラベル空間と欠落ラベルを持つデータセットを扱うことである。
本研究では,一部ラベル付きあるいは非ラベル付きデータセットで不足ラベルを補完するopenXdataツールを紹介する。
根拠となる真理値に近づいたレートで、すべてのデータセットに対してカテゴリと連続ラベルの両方を推定する能力を示す。
論文 参考訳(メタデータ) (2020-07-27T22:05:53Z) - Unsupervised Multi-label Dataset Generation from Web Data [2.267916014951237]
本稿では,Webデータからマルチラベルデータセットを教師なしで生成するシステムを提案する。
シングルラベルデータセットの生成は、教師なしノイズ低減フェーズ(アンカーを使用したクラスタのクラスタリングと選択)を使用して、正しくラベル付けされた画像の85%を取得する。
次に、クラスアクティベーションマップと各クラスに関連する不確実性を用いて、データセット内の画像に新しいラベルを割り当てる、教師なしラベル拡張処理を実行する。
論文 参考訳(メタデータ) (2020-05-12T08:57:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。