論文の概要: AcTED: Automatic Acquisition of Typical Event Duration for Semi-supervised Temporal Commonsense QA
- arxiv url: http://arxiv.org/abs/2403.18504v1
- Date: Wed, 27 Mar 2024 12:33:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-28 17:08:03.943807
- Title: AcTED: Automatic Acquisition of Typical Event Duration for Semi-supervised Temporal Commonsense QA
- Title(参考訳): AcTED:半教師付き時間的コモンセンスQAにおける典型的事象継続時間の自動取得
- Authors: Felix Virgo, Fei Cheng, Lis Kanashiro Pereira, Masayuki Asahara, Ichiro Kobayashi, Sadao Kurohashi,
- Abstract要約: イベントの典型的な期間を自動的に取得するための投票駆動型アプローチを提案する。
擬似ラベルは驚くほど高い精度とバランスの取れたカバレッジを示す。
当社のベストアプローチは、エクササイズマッチを7%改善した最先端のパフォーマンスを確立することです。
- 参考スコア(独自算出の注目度): 28.40630495631702
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a voting-driven semi-supervised approach to automatically acquire the typical duration of an event and use it as pseudo-labeled data. The human evaluation demonstrates that our pseudo labels exhibit surprisingly high accuracy and balanced coverage. In the temporal commonsense QA task, experimental results show that using only pseudo examples of 400 events, we achieve performance comparable to the existing BERT-based weakly supervised approaches that require a significant amount of training examples. When compared to the RoBERTa baselines, our best approach establishes state-of-the-art performance with a 7% improvement in Exact Match.
- Abstract(参考訳): 本稿では,イベントの典型的な期間を自動的に取得し,擬似ラベル付きデータとして利用する投票駆動型半教師付き手法を提案する。
人間の評価は、我々の擬似ラベルが驚くほど高い精度とバランスの取れたカバレッジを示すことを示している。
時間的コモンセンスQAタスクにおいて、実験結果から、400件のイベントの擬似例のみを用いて、既存のBERTベースの弱教師付きアプローチに匹敵する性能を達成できることが示されている。
RoBERTaベースラインと比較して、我々のベストアプローチは、 Exact Matchを7%改善した最先端のパフォーマンスを確立することです。
関連論文リスト
- BAdd: Bias Mitigation through Bias Addition [19.140362626182856]
コンピュータビジョン(CV)データセットは、ディープラーニングモデルによって永続されるバイアスを示すことが多い。
本稿では,バイアスを導入した属性に不変な公平表現を学習する手法であるBAddを紹介する。
BAddは7つのベンチマークで評価され、競合性能を示し、単一のベンチマークとマルチ属性ベンチマークの両方で最先端の手法を上回っている。
論文 参考訳(メタデータ) (2024-08-21T08:50:31Z) - Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.23208041792073]
Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。
ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。
そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文 参考訳(メタデータ) (2024-06-26T05:30:21Z) - MedBN: Robust Test-Time Adaptation against Malicious Test Samples [11.397666167665484]
テスト時間適応(TTA)は、トレーニングデータとテストデータの間の予期せぬ分散シフトによるパフォーマンス劣化に対処する、有望なソリューションとして登場した。
以前の研究では、テストバッチのごく一部が不正に操作された場合でも、TTA内のセキュリティ脆弱性が明らかになった。
テスト時間推論におけるバッチ正規化層内の統計量推定に中央値のロバスト性を利用する中央値バッチ正規化(MedBN)を提案する。
論文 参考訳(メタデータ) (2024-03-28T11:33:02Z) - Generalized Robust Test-Time Adaptation in Continuous Dynamic Scenarios [18.527640606971563]
テスト時間適応(TTA)は、未ラベルのテストデータストリームのみを使用する推論フェーズにおいて、事前訓練されたモデルに分散をテストする。
本稿では,問題に効果的に対応する汎用ロバストテスト時間適応(GRoTTA)法を提案する。
論文 参考訳(メタデータ) (2023-10-07T07:13:49Z) - The Devil is in the Points: Weakly Semi-Supervised Instance Segmentation
via Point-Guided Mask Representation [61.027468209465354]
本稿では,ポイントラベル付き弱半教師付きインスタンスセグメンテーション(WSSIS)という新しい学習手法を提案する。
本稿では、予算に優しいポイントラベルを強力な弱監督源として効果的に活用できるWSSISの手法を提案する。
我々はCOCOとBDD100Kデータセットの広範な実験を行い、提案手法は完全な教師付きモデルのデータセットに匹敵する有望な結果を得る。
論文 参考訳(メタデータ) (2023-03-27T10:11:22Z) - Hierarchical Proxy Modeling for Improved HPO in Time Series Forecasting [9.906423777470737]
本稿では,時系列データセットに関連付けられたデータ階層を利用して,HPOをテストプロキシで駆動する新しい手法H-Proを提案する。
H-Proは、市販の機械学習モデルにも適用でき、HPOを実行することができる。
我々の手法は、観光、ウィキ、交通のデータセットにおける既存の最先端手法よりも優れています。
論文 参考訳(メタデータ) (2022-11-28T06:37:15Z) - Improve Event Extraction via Self-Training with Gradient Guidance [10.618929821822892]
本稿では、イベント抽出の進行を妨げる主な要因を克服するために、フィードバックによる自己評価(STF)フレームワークを提案する。
STFは,(1)既存のイベントアノテーションに基づいてトレーニングされたベースイベント抽出モデルと,(2)新しいイベント参照を擬似トレーニングサンプルとして予測するための大規模未ラベルコーパスと,(2)新しいイベントトリガ,引数,引数ロール,およびAMRグラフ内のそれらのパスを用いて互換性スコアを推定する新たなスコアリングモデルから構成される。
ACE05-E、ACE05-E+、EREを含む3つのベンチマークデータセットの実験結果
論文 参考訳(メタデータ) (2022-05-25T04:40:17Z) - Listen, Adapt, Better WER: Source-free Single-utterance Test-time
Adaptation for Automatic Speech Recognition [65.84978547406753]
Test-time Adaptationは、ソースドメインでトレーニングされたモデルに適応して、テストサンプルの予測を改善することを目的としている。
単一発話テスト時間適応 (SUTA) は音声領域における最初のTTA研究である。
論文 参考訳(メタデータ) (2022-03-27T06:38:39Z) - Dash: Semi-Supervised Learning with Dynamic Thresholding [72.74339790209531]
我々は、ラベルのない例を使ってモデルをトレーニングする半教師付き学習(SSL)アプローチを提案する。
提案手法であるDashは、ラベルなしデータ選択の観点から適応性を享受する。
論文 参考訳(メタデータ) (2021-09-01T23:52:29Z) - WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection [75.80075054706079]
弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
論文 参考訳(メタデータ) (2021-05-21T11:58:50Z) - Manual Evaluation Matters: Reviewing Test Protocols of Distantly
Supervised Relation Extraction [61.48964753725744]
2つのDS-REデータセット(NYT10とWiki20)に対して手動でアノテートしたテストセットを構築し、いくつかの競合モデルを徹底的に評価する。
その結果,手動による評価は,自動的な評価とは全く異なる結論を示すことがわかった。
論文 参考訳(メタデータ) (2021-05-20T06:55:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。