論文の概要: LASTIST: LArge-Scale Target-Independent STance dataset
- arxiv url: http://arxiv.org/abs/2510.25783v1
- Date: Tue, 28 Oct 2025 11:07:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 16:05:09.479465
- Title: LASTIST: LArge-Scale Target-Independent STance dataset
- Title(参考訳): LASTIST: LArge-Scale Target-Independent STance dataset
- Authors: DongJae Kim, Yaejin Lee, Minsu Park, Eunil Park,
- Abstract要約: スタンス検出は人工知能分野の研究分野として浮上している。
現在、ほとんどの研究は目標に依存した姿勢検出タスクに重点を置いている。
ほとんどのベンチマークデータセットは英語に基づいているため、韓国語のような低リソース言語でモデルを開発するのは難しい。
本研究では,LArge-Scale Target-Independent STance (LASTIST)データセットを提案する。
- 参考スコア(独自算出の注目度): 16.439668986979353
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Stance detection has emerged as an area of research in the field of artificial intelligence. However, most research is currently centered on the target-dependent stance detection task, which is based on a person's stance in favor of or against a specific target. Furthermore, most benchmark datasets are based on English, making it difficult to develop models in low-resource languages such as Korean, especially for an emerging field such as stance detection. This study proposes the LArge-Scale Target-Independent STance (LASTIST) dataset to fill this research gap. Collected from the press releases of both parties on Korean political parties, the LASTIST dataset uses 563,299 labeled Korean sentences. We provide a detailed description of how we collected and constructed the dataset and trained state-of-the-art deep learning and stance detection models. Our LASTIST dataset is designed for various tasks in stance detection, including target-independent stance detection and diachronic evolution stance detection. We deploy our dataset on https://anonymous.4open.science/r/LASTIST-3721/.
- Abstract(参考訳): スタンス検出は人工知能分野の研究分野として浮上している。
しかし、現在、ほとんどの研究は、特定の目標に賛成または反対する人のスタンスに基づく、目標に依存したスタンス検出タスクに重点を置いている。
さらに、ほとんどのベンチマークデータセットは英語に基づいており、特にスタンス検出などの新興分野において、韓国語のような低リソース言語でモデルを開発することは困難である。
本研究では,LArge-Scale Target-Independent STance (LASTIST)データセットを提案する。
LASTISTデータセットは、韓国の政党に関する両党のプレスリリースから得られたもので、韓国の563,299の文をラベル付けしている。
我々は、データセットの収集と構築方法と、最先端のディープラーニングと姿勢検出モデルをトレーニングした方法について、詳細な説明を提供する。
我々のLASTISTデータセットは、ターゲット非依存の姿勢検出やダイアクロニック進化姿勢検出など、スタンス検出の様々なタスクのために設計されている。
私たちはデータセットをhttps://anonymous.4open.science/r/LASTIST-3721/にデプロイします。
関連論文リスト
- Zero-Shot Conversational Stance Detection: Dataset and Approaches [24.892337124161983]
スタンス検出は、ソーシャルメディアデータを用いて特定のターゲットに対する世論を識別することを目的としている。
我々は、ZS-CSDという、大規模で高品質なゼロショットスタンス検出データセットを手動でキュレートする。
SITPCL, 話者インタラクションとターゲット認識型プロトタイプ型コントラスト学習モデルを提案し, ゼロショット環境でのベンチマーク性能を確立する。
論文 参考訳(メタデータ) (2025-06-21T12:02:06Z) - Oriented Tiny Object Detection: A Dataset, Benchmark, and Dynamic Unbiased Learning [51.170479006249195]
本研究では,新しいデータセット,ベンチマーク,動的粗大な学習手法を提案する。
提案するデータセットであるAI-TOD-Rは、すべてのオブジェクト指向オブジェクト検出データセットの中で最小のオブジェクトサイズを特徴としている。
完全教師付きおよびラベル効率の両アプローチを含む,幅広い検出パラダイムにまたがるベンチマークを提案する。
論文 参考訳(メタデータ) (2024-12-16T09:14:32Z) - A Challenge Dataset and Effective Models for Conversational Stance Detection [26.208989232347058]
マルチターン会話姿勢検出データセット(textbfMT-CSD)を導入する。
本稿では,会話データに固有の長距離および短距離の依存関係に対処するグローバルローカルアテンションネットワーク(textbfGLAN)を提案する。
私たちのデータセットは、ドメイン間スタンス検出の進歩を触媒する貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-03-17T08:51:01Z) - Data Selection for Language Models via Importance Resampling [90.9263039747723]
我々は、望まれるターゲット分布に合わせるために、大規模な未ラベルデータセットのサブセットを選択するという問題を形式化する。
我々は、LMデータ選択のために低次元で使用される古典的な重要度再サンプリング手法を拡張した。
DSIRフレームワークをhash n-gram機能でインスタンス化し、4.5時間で1億のドキュメントを選択できる。
論文 参考訳(メタデータ) (2023-02-06T23:57:56Z) - Contextual information integration for stance detection via
cross-attention [59.662413798388485]
スタンス検出は、著者の目標に対する姿勢を特定することを扱う。
既存のスタンス検出モデルの多くは、関連するコンテキスト情報を考慮していないため、制限されている。
文脈情報をテキストとして統合する手法を提案する。
論文 参考訳(メタデータ) (2022-11-03T15:04:29Z) - X-Stance: A Multilingual Multi-Target Dataset for Stance Detection [42.46681912294797]
スイスの選挙候補者によるコメントから大規模な姿勢検出データセットを抽出する。
データセットはドイツ語、フランス語、イタリア語のテキストで構成されており、姿勢検出の言語横断的な評価を可能にする。
論文 参考訳(メタデータ) (2020-03-18T17:58:10Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。