Fugu-MT 論文翻訳(概要): Reproducibility, Replicability and Beyond: Assessing Production Readiness of Aspect Based Sentiment Analysis in the Wild

論文の概要: Reproducibility, Replicability and Beyond: Assessing Production Readiness of Aspect Based Sentiment Analysis in the Wild

arxiv url: http://arxiv.org/abs/2101.09449v1
Date: Sat, 23 Jan 2021 07:45:27 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-20 13:50:06.055837
Title: Reproducibility, Replicability and Beyond: Assessing Production Readiness of Aspect Based Sentiment Analysis in the Wild
Title（参考訳）: 再現性、再現性およびそれ以上性:野生動物におけるアスペクトベース感情分析の生産準備性の評価
Authors: Rajdeep Mukherjee, Shreyas Shetty, Subrata Chattopadhyay, Subhadeep Maji, Samik Datta and Pawan Goyal
Abstract要約: 実践者のレンズを通して過去6年間に公開されたモデルの代表的なサンプルを批判的にレビューする。 2つの挑戦的なデータスライスの実験を報告し、12～55%の精度低下を観測した。インドにある大規模なeコマースポータルから2つの大規模なアノテートレビューコーパスをオープンソース化し、複製性と転送の研究を支援します。
参考スコア（独自算出の注目度）: 10.629712078346694
License: http://creativecommons.org/licenses/by/4.0/
Abstract: With the exponential growth of online marketplaces and user-generated content therein, aspect-based sentiment analysis has become more important than ever. In this work, we critically review a representative sample of the models published during the past six years through the lens of a practitioner, with an eye towards deployment in production. First, our rigorous empirical evaluation reveals poor reproducibility: an average 4-5% drop in test accuracy across the sample. Second, to further bolster our confidence in empirical evaluation, we report experiments on two challenging data slices, and observe a consistent 12-55% drop in accuracy. Third, we study the possibility of transfer across domains and observe that as little as 10-25% of the domain-specific training dataset, when used in conjunction with datasets from other domains within the same locale, largely closes the gap between complete cross-domain and complete in-domain predictive performance. Lastly, we open-source two large-scale annotated review corpora from a large e-commerce portal in India in order to aid the study of replicability and transfer, with the hope that it will fuel further growth of the field.
Abstract（参考訳）: オンラインマーケットプレースとユーザー生成コンテンツの増加に伴い、アスペクトベースの感情分析はこれまで以上に重要になっている。本研究では,過去6年間に公開されたモデルの代表的なサンプルを,実運用環境での展開に目を向けて,実践者のレンズを通して批判的にレビューする。まず、厳密な経験的評価により再現性が低いことが明らかとなり、サンプル全体で平均4-5%の検定精度が低下した。第2に,経験的評価の信頼性をさらに高めるため,2つの挑戦的なデータスライスの実験を報告し,一貫性のある12～55%の精度低下を観測した。第3に、ドメイン間の転送の可能性を調査し、同じローカライズ内の他のドメインからのデータセットと組み合わせて使用する場合、ドメイン固有のトレーニングデータセットの10～25%程度は、完全にクロスドメインと完全なドメイン内予測パフォーマンスのギャップを埋める。最後に、インドの大規模なeコマースポータルから2つの大規模なアノテートレビューコーパスをオープンソース化し、複製性と転送の研究を支援し、この分野のさらなる成長を促進することを期待している。

関連論文リスト

AutoMalDesc: Large-Scale Script Analysis for Cyber Threat Research [81.04845910798387]
脅威検出のための自然言語の説明を生成することは、サイバーセキュリティ研究において未解決の問題である。本稿では,大規模に独立して動作する自動静的解析要約フレームワークAutoMalDescを紹介する。アノテーション付きシード(0.9K)データセットや方法論,評価フレームワークなど,100万以上のスクリプトサンプルの完全なデータセットを公開しています。
論文参考訳（メタデータ） (2025-11-17T13:05:25Z)
Semi-Supervised Synthetic Data Generation with Fine-Grained Relevance Control for Short Video Search Relevance Modeling [8.807901064676802]
重要リソースを空にする4レベルの関連アノテーションを備えた中国語短いビデオデータセットを提示する。 2つの協調訓練されたモデルが、制御可能な関連ラベルを持つドメイン適応型ショートビデオデータを生成する半教師付き合成データパイプラインを提案する。本手法は, 未表現の中間関連ラベルのサンプルを合成することにより, 関連レベルの多様性を高める。
論文参考訳（メタデータ） (2025-09-20T15:00:28Z)
Generate to Discriminate: Expert Routing for Continual Learning [59.71853576559306]
Generate to Discriminate (G2D) は、合成データを利用してドメイン識別器を訓練する連続学習手法である。我々は、G2Dが視覚と言語の両方におけるタスクにおいて、競争力のあるドメイン・インクリメンタル・ラーニング手法より優れていることを観察する。
論文参考訳（メタデータ） (2024-12-22T13:16:28Z)
From Web Data to Real Fields: Low-Cost Unsupervised Domain Adaptation for Agricultural Robots [3.7619101673213664]
本稿では,Unsupervised Domain Adaptation (UDA) を用いて,特定分野への適応を低コストで行うことを目的とする。我々は、多様なインターネットソースデータのプールから、特定の場所でロボットが収集した小さなデータセットへの、新たなドメインシフトを探求する。我々は,マルチレベル注意に基づく適応識別器(MAAD)という新しいモジュールを導入し,任意の検出モデルの特徴抽出器レベルで統合する。
論文参考訳（メタデータ） (2024-10-31T13:11:09Z)
ACLSum: A New Dataset for Aspect-based Summarization of Scientific Publications [10.529898520273063]
ACLSumは、ドメインの専門家によって慎重に作成され、評価される新しい要約データセットである。以前のデータセットとは対照的に、ACLSumは科学論文のマルチアスペクト要約を容易にする。
論文参考訳（メタデータ） (2024-03-08T13:32:01Z)
On the Connection between Pre-training Data Diversity and Fine-tuning Robustness [66.30369048726145]
下流の有効ロバスト性に影響を与える主な要因はデータ量である。各種自然および合成データソースから抽出した事前学習分布について,本研究の成果を示す。
論文参考訳（メタデータ） (2023-07-24T05:36:19Z)
Generalizability of Adversarial Robustness Under Distribution Shifts [57.767152566761304]
本研究は, 実証的, 証明された敵対的堅牢性間の相互作用と, ドメインの一般化を両立させるための第一歩を踏み出した。複数のドメインでロバストモデルをトレーニングし、その正確性とロバスト性を評価する。本研究は, 現実の医療応用をカバーするために拡張され, 敵の増大は, クリーンデータ精度に最小限の影響を伴って, 強靭性の一般化を著しく促進する。
論文参考訳（メタデータ） (2022-09-29T18:25:48Z)
Mere Contrastive Learning for Cross-Domain Sentiment Analysis [23.350121129347556]
クロスドメイン感情分析は、ソースドメインでトレーニングされたモデルを使用して、ターゲットドメイン内のテキストの感情を予測することを目的としている。従来の研究はほとんどがクロスエントロピーに基づく手法であり、不安定性や一般化の低さに悩まされていた。我々は,同じクラスからの文表現を閉じるように,バッチ内の負のサンプルを付加した改良されたコントラスト目的を提案する。
論文参考訳（メタデータ） (2022-08-18T07:25:55Z)
An Empirical Study on Distribution Shift Robustness From the Perspective of Pre-Training and Data Augmentation [91.62129090006745]
本稿では,事前学習とデータ拡張の観点から分布シフト問題を考察する。我々は,事前学習とデータ拡張に焦点を当てた,最初の総合的な実証的研究を行った。
論文参考訳（メタデータ） (2022-05-25T13:04:53Z)
Improving Baselines in the Wild [9.216201990315364]
私たちは最近リリースされたWILDSベンチマークでの経験を共有しています。いくつかの実験では、WILDSに関する今後の研究に一般的に関心があると思われるいくつかの批判的な観察結果が得られている。
論文参考訳（メタデータ） (2021-12-31T16:59:03Z)
VisDA-2021 Competition Universal Domain Adaptation to Improve Performance on Out-of-Distribution Data [64.91713686654805]
Visual Domain Adaptation (VisDA) 2021コンペティションは、新しいテストディストリビューションに適応するモデルの能力をテストする。我々は,新しい視点,背景,モダリティ,品質劣化への適応性を評価する。厳密なプロトコルを使用してパフォーマンスを計測し、最先端のドメイン適応手法と比較する。
論文参考訳（メタデータ） (2021-07-23T03:21:51Z)
Gradient Matching for Domain Generalization [93.04545793814486]
機械学習システムの重要な要件は、見えないドメインに一般化する能力です。ドメインの一般化を目標とするドメイン間勾配マッチングの目的を提案する。我々は、その最適化を近似する単純な一階アルゴリズムfishを導出する。
論文参考訳（メタデータ） (2021-04-20T12:55:37Z)
Dual-Teacher++: Exploiting Intra-domain and Inter-domain Knowledge with Reliable Transfer for Cardiac Segmentation [69.09432302497116]
最先端の半教師付きドメイン適応フレームワークである Dual-Teacher++ を提案する。ソースドメイン(MRなど)からのクロスモダリティ優先度を探索するドメイン間教師モデルと、ラベルのないターゲットドメインの知識を調査するドメイン内教師モデルを含む、新しいデュアル教師モデルを設計する。このようにして、学生モデルは信頼できる二重ドメイン知識を得て、ターゲットドメインデータのパフォーマンスを向上させることができる。
論文参考訳（メタデータ） (2021-01-07T05:17:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。