論文の概要: Domain-Guided Task Decomposition with Self-Training for Detecting
Personal Events in Social Media
- arxiv url: http://arxiv.org/abs/2004.10201v1
- Date: Tue, 21 Apr 2020 14:50:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 06:22:37.473671
- Title: Domain-Guided Task Decomposition with Self-Training for Detecting
Personal Events in Social Media
- Title(参考訳): 個人イベント検出のための自己学習型ドメインガイドタスク分割
- Authors: Payam Karisani, Joyce C. Ho, and Eugene Agichtein
- Abstract要約: ソーシャルメディアをマイニングすることで、個人的な経験や出来事を検知したり、語彙の空間性に悩まされたり、トレーニングデータに乏しかったり、発明的な辞書を作ったりする。
ラベル付きデータを広範囲に作成することの負担を軽減するため、我々は2つのステップでこれらのタスクを実行することを提案する。
鍵概念を識別してタスクをドメイン固有のサブタスクに分解し、人間のドメイン理解を活用する。 2. ラベル付きトレーニングデータの要求を減らし、協調学習を用いて各鍵概念に対する学習者の結果を組み合わせる。
- 参考スコア(独自算出の注目度): 11.638298634523945
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mining social media content for tasks such as detecting personal experiences
or events, suffer from lexical sparsity, insufficient training data, and
inventive lexicons. To reduce the burden of creating extensive labeled data and
improve classification performance, we propose to perform these tasks in two
steps: 1. Decomposing the task into domain-specific sub-tasks by identifying
key concepts, thus utilizing human domain understanding; and 2. Combining the
results of learners for each key concept using co-training to reduce the
requirements for labeled training data. We empirically show the effectiveness
and generality of our approach, Co-Decomp, using three representative social
media mining tasks, namely Personal Health Mention detection, Crisis Report
detection, and Adverse Drug Reaction monitoring. The experiments show that our
model is able to outperform the state-of-the-art text classification
models--including those using the recently introduced BERT model--when small
amounts of training data are available.
- Abstract(参考訳): 個人的体験やイベントの検出、語彙的スパース、トレーニングデータ不足、発明的なレキシコンなどのタスクのためにソーシャルメディアコンテンツをマイニングする。
ラベル付きデータの作成の負担軽減と分類性能の向上を目的として,2つのステップでこれらのタスクを実行することを提案する。
1.重要な概念を識別し、人間のドメイン理解を活用することにより、タスクをドメイン固有のサブタスクに分解すること。
2. ラベル付きトレーニングデータの要件を減らすために、コートレーニングを用いて、各キー概念の学習者の結果を組み合わせること。
提案手法の有効性と汎用性を実証的に示すために,3つの代表的なソーシャルメディアマイニングタスクであるPersonal Health Mention Detection, Crisis Report Detection,Adverse Drug Reaction Monitoringを用いて検討した。
実験の結果,本モデルは,最近導入されたBERTモデルを含む最先端のテキスト分類モデルよりも優れており,少量のトレーニングデータが利用可能であることがわかった。
関連論文リスト
- Data-CUBE: Data Curriculum for Instruction-based Sentence Representation
Learning [85.66907881270785]
本稿では,学習用マルチタスクデータの順序を列挙するデータカリキュラム,すなわちData-CUBEを提案する。
タスクレベルでは、タスク間の干渉リスクを最小化するために最適なタスクオーダーを見つけることを目的としている。
インスタンスレベルでは、タスク毎のすべてのインスタンスの難易度を測定し、トレーニングのためにそれらを簡単に微分できるミニバッチに分割します。
論文 参考訳(メタデータ) (2024-01-07T18:12:20Z) - Distribution Matching for Multi-Task Learning of Classification Tasks: a
Large-Scale Study on Faces & Beyond [62.406687088097605]
マルチタスク学習(MTL)は、複数の関連するタスクを共同で学習し、共有表現空間から恩恵を受けるフレームワークである。
MTLは、ほとんど重複しない、あるいは重複しないアノテーションで分類タスクで成功することを示す。
本稿では,分散マッチングによるタスク間の知識交換を可能にする新しい手法を提案する。
論文 参考訳(メタデータ) (2024-01-02T14:18:11Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Leveraging Open Data and Task Augmentation to Automated Behavioral
Coding of Psychotherapy Conversations in Low-Resource Scenarios [35.44178630251169]
心理療法の相互作用において、セッションの質は会話中の参加者のコミュニケーション行動の体系化によって評価される。
本稿では、公開可能な会話ベースのデータセットを活用し、低リソースな行動符号化タスクに知識を伝達する。
本稿では,タスク拡張手法を導入して,対象タスクに類似したタスクを多数生成し,提案手法が他のベースラインモデルよりも正確に対象行動を予測することを示す。
論文 参考訳(メタデータ) (2022-10-25T18:15:25Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Boosting Supervised Learning Performance with Co-training [15.986635379046602]
我々は,教師付き学習性能を最小限のコストで向上させることができる,軽量な自己教師付き学習フレームワークを提案する。
以上の結果から,両タスクとも教師付きタスクの精度が向上し,ドメイン適応能力が向上することが示唆された。
論文 参考訳(メタデータ) (2021-11-18T17:01:17Z) - Reinforcement Learning with Prototypical Representations [114.35801511501639]
Proto-RLは、プロトタイプ表現を通じて表現学習と探索を結び付ける自己監督型フレームワークである。
これらのプロトタイプは、エージェントの探索経験の要約と同時に、観察を表す基盤としても機能する。
これにより、困難な連続制御タスクのセットで最新の下流ポリシー学習が可能になります。
論文 参考訳(メタデータ) (2021-02-22T18:56:34Z) - Self-supervised driven consistency training for annotation efficient
histopathology image analysis [13.005873872821066]
大きなラベル付きデータセットでニューラルネットワークをトレーニングすることは、計算病理学において依然として支配的なパラダイムである。
本研究では,非教師付き表現学習のための強力な監視信号を学ぶために,ヒストロジ全体スライディング画像の背景となる多段階的文脈的手がかりを利用する自己教師付きプレテキストタスクを提案する。
また,タスク固有の未ラベルデータとの予測整合性に基づいて,事前学習した表現を下流タスクに効果的に転送することを学ぶ教師による半教師付き一貫性パラダイムを提案する。
論文 参考訳(メタデータ) (2021-02-07T19:46:21Z) - Parrot: Data-Driven Behavioral Priors for Reinforcement Learning [79.32403825036792]
そこで本研究では,実験で得られた複雑なインプット・アウトプット関係を事前に学習する手法を提案する。
RLエージェントが新規な動作を試す能力を阻害することなく、この学習が新しいタスクを迅速に学習するのにどのように役立つかを示す。
論文 参考訳(メタデータ) (2020-11-19T18:47:40Z) - Unsupervised and Interpretable Domain Adaptation to Rapidly Filter
Tweets for Emergency Services [18.57009530004948]
本稿では,TRECインシデントストリームの公開データセットを用いて,危機時に関連するツイートを分類する新しい手法を提案する。
私たちは各タスクに専用の注意層を使用して、モデル解釈可能性を提供しています。
新型コロナウイルスのパンデミックに対するユースケースを提供することで、我々の仕事の実践的な意味を示す。
論文 参考訳(メタデータ) (2020-03-04T06:40:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。