論文の概要: Measuring Your ASTE Models in The Wild: A Diversified Multi-domain
Dataset For Aspect Sentiment Triplet Extraction
- arxiv url: http://arxiv.org/abs/2305.17448v1
- Date: Sat, 27 May 2023 11:21:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-30 19:16:50.205324
- Title: Measuring Your ASTE Models in The Wild: A Diversified Multi-domain
Dataset For Aspect Sentiment Triplet Extraction
- Title(参考訳): asteモデルを野生で測定する - アスペクト感情三重項抽出のための多種多様なマルチドメインデータセット
- Authors: Ting Xu, Huiyun Yang, Zhen Wu, Jiaze Chen, Fei Zhao, Xinyu Dai
- Abstract要約: DMASTEと呼ばれる新しいデータセットを導入し、実際のシナリオに適合するように手動で注釈付けします。
データセットには、さまざまな長さ、多様な表現、より多くのアスペクトタイプ、既存のデータセットよりも多くのドメインが含まれている。
- 参考スコア(独自算出の注目度): 27.004776842335136
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Aspect Sentiment Triplet Extraction (ASTE) is widely used in various
applications. However, existing ASTE datasets are limited in their ability to
represent real-world scenarios, hindering the advancement of research in this
area. In this paper, we introduce a new dataset, named DMASTE, which is
manually annotated to better fit real-world scenarios by providing more diverse
and realistic reviews for the task. The dataset includes various lengths,
diverse expressions, more aspect types, and more domains than existing
datasets. We conduct extensive experiments on DMASTE in multiple settings to
evaluate previous ASTE approaches. Empirical results demonstrate that DMASTE is
a more challenging ASTE dataset. Further analyses of in-domain and cross-domain
settings provide promising directions for future research. Our code and dataset
are available at https://github.com/NJUNLP/DMASTE.
- Abstract(参考訳): Aspect Sentiment Triplet extract (ASTE) は様々な用途で広く利用されている。
しかし、既存のasteデータセットは現実世界のシナリオを表現する能力に制限があり、この分野の研究の進歩を妨げる。
本稿では,DMASTEという新しいデータセットを紹介し,タスクに対してより多彩で現実的なレビューを提供することにより,現実のシナリオに適合するように手動でアノテートする。
データセットには、さまざまな長さ、多様な表現、より多くのアスペクトタイプ、既存のデータセットよりも多くのドメインが含まれている。
我々は,従来のASTE手法を評価するために,DMASTEを複数設定で広範な実験を行った。
実験の結果、DMASTEはより難しいASTEデータセットであることが示された。
ドメイン内およびクロスドメイン設定のさらなる分析は、将来の研究に有望な方向を提供する。
私たちのコードとデータセットはhttps://github.com/njunlp/dmasteで利用可能です。
関連論文リスト
- trajdata: A Unified Interface to Multiple Human Trajectory Datasets [32.93180256927027]
複数の人的トラジェクトリデータセットに対する統一インターフェースであるtrajdataを提案する。
Trajdataは、トラジェクトリとマップデータのためのシンプルで均一で効率的な表現とAPIを提供する。
論文 参考訳(メタデータ) (2023-07-26T02:45:59Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - MMRDN: Consistent Representation for Multi-View Manipulation
Relationship Detection in Object-Stacked Scenes [62.20046129613934]
我々は,MMRDN(Multi-view MRD Network)と呼ばれる新しい多視点融合フレームワークを提案する。
異なるビューからの2Dデータを共通の隠れ空間に投影し、埋め込みをVon-Mises-Fisher分布に適合させる。
これら2つのオブジェクトの相対位置を符号化した各オブジェクト対の点雲から、K$最大垂直近傍点(KMVN)の集合を選択する。
論文 参考訳(メタデータ) (2023-04-25T05:55:29Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - ASDOT: Any-Shot Data-to-Text Generation with Pretrained Language Models [82.63962107729994]
Any-Shot Data-to-Text (ASDOT)は、多様な設定に柔軟に適用可能な新しいアプローチである。
データ曖昧化と文の融合という2つのステップから構成される。
実験の結果, ASDOT はベースラインよりも顕著な改善が得られた。
論文 参考訳(メタデータ) (2022-10-09T19:17:43Z) - Multi-CPR: A Multi Domain Chinese Dataset for Passage Retrieval [19.000263567641817]
経路検索のための新しい多領域中国語データセット(Multi-CPR)を提案する。
データセットはEコマース、エンターテイメントビデオ、メディカルを含む3つの異なるドメインから収集される。
一般ドメインからのデータセットでトレーニングされた検索モデルの性能は、特定のドメインで必然的に低下する。
論文 参考訳(メタデータ) (2022-03-07T13:20:46Z) - MDMMT: Multidomain Multimodal Transformer for Video Retrieval [63.872634680339644]
MSRVTTおよびLSMDCベンチマークのテキストからビデオ検索タスクに新しい最新技術を紹介します。
異なるデータセットでのトレーニングは、互いにテスト結果を改善することができることを示す。
論文 参考訳(メタデータ) (2021-03-19T09:16:39Z) - WikiAsp: A Dataset for Multi-domain Aspect-based Summarization [69.13865812754058]
マルチドメインアスペクトベースの要約のための大規模データセットであるWikiAspを提案する。
具体的には、アスペクトアノテーションのプロキシとして、各記事のセクションタイトルとバウンダリを使用して、20の異なるドメインからウィキペディア記事を使用してデータセットを構築します。
その結果,既存の要約モデルがこの設定で直面する重要な課題,例えば引用されたソースの適切な代名詞処理,時間に敏感なイベントの一貫した説明などが浮き彫りになった。
論文 参考訳(メタデータ) (2020-11-16T10:02:52Z) - IDDA: a large-scale multi-domain dataset for autonomous driving [16.101248613062292]
本稿では,100以上の異なる視覚領域を持つセマンティックセグメンテーションのための大規模合成データセットを提案する。
このデータセットは、さまざまな天候や視点条件下でのトレーニングとテストデータのドメインシフトの課題に明示的に対処するために作成されている。
論文 参考訳(メタデータ) (2020-04-17T15:22:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。