論文の概要: Language Independent Stance Detection: Social Interaction-based Embeddings and Large Language Models
- arxiv url: http://arxiv.org/abs/2210.05715v2
- Date: Thu, 27 Feb 2025 09:17:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-28 14:55:06.230355
- Title: Language Independent Stance Detection: Social Interaction-based Embeddings and Large Language Models
- Title(参考訳): 言語に依存しないスタンス検出:社会的相互作用に基づく埋め込みと大規模言語モデル
- Authors: Joseba Fernandez de Landa, Rodrigo Agerri,
- Abstract要約: 本稿では,テキストそのものではなく,ソーシャルネットワーク上で利用できるインタラクションに重点を置くことで,姿勢検出の課題に取り組むことを目的とする。
埋め込みを生成することで友達のリツイートなどのソーシャル情報を活用できる新しい手法を提案する。
公開されている7つのデータセットと4つの異なる言語に関する実験により、リレーショナルな埋め込みと差別的なテキストの手法を組み合わせることで、パフォーマンスが大幅に向上することが示された。
- 参考スコア(独自算出の注目度): 4.899818550820576
- License:
- Abstract: The large majority of the research performed on stance detection has been focused on developing more or less sophisticated text classification systems, even when many benchmarks are based on social network data such as Twitter. This paper aims to take on the stance detection task by placing the emphasis not so much on the text itself but on the interaction data available on social networks. More specifically, we propose a new method to leverage social information such as friends and retweets by generating Relational Embeddings, namely, dense vector representations of interaction pairs. Our experiments on seven publicly available datasets and four different languages (Basque, Catalan, Italian, and Spanish) show that combining our relational embeddings with discriminative textual methods helps to substantially improve performance, obtaining state-of-the-art results for six out of seven evaluation settings, outperforming strong baselines based on Large Language Models, or other popular interaction-based approaches such as DeepWalk or node2vec.
- Abstract(参考訳): スタンス検出で実施された研究の大部分は、Twitterなどのソーシャルネットワークデータに基づくベンチマークが多い場合でも、多かれ少なかれ高度なテキスト分類システムの開発に焦点が当てられている。
本稿では,テキスト自体だけでなく,ソーシャルネットワーク上で利用可能なインタラクションデータにも重点を置いてスタンス検出作業を実施することを目的とする。
具体的には、リレーショナル・エンベディング、すなわち相互作用対の高密度ベクトル表現を生成することにより、友人やリツイートなどのソーシャル情報を活用する新しい手法を提案する。
7つの公開データセットと4つの異なる言語(バスク語、カタルーニャ語、イタリア語、スペイン語)に対する我々の実験は、我々のリレーショナル埋め込みと差別的なテキスト手法を組み合わせることで、パフォーマンスを大幅に向上し、7つの評価設定のうち6つの最先端結果を得ることができ、大規模言語モデルに基づく強力なベースライン、DeepWalkやnode2vecといった一般的なインタラクションベースのアプローチよりも優れています。
関連論文リスト
- Evaluating and explaining training strategies for zero-shot cross-lingual news sentiment analysis [8.770572911942635]
いくつかの低リソース言語で新しい評価データセットを導入する。
我々は、機械翻訳の使用を含む、様々なアプローチを実験する。
言語間の相似性は言語間移動の成功を予測するのに十分ではないことを示す。
論文 参考訳(メタデータ) (2024-09-30T07:59:41Z) - MultiSocial: Multilingual Benchmark of Machine-Generated Text Detection of Social-Media Texts [0.6053347262128919]
MultiSocial データセットには 472,097 のテキストが含まれており、そのうち約58k が人文で書かれている。
このベンチマークを用いて、ゼロショットの既存の検出手法と微調整形式を比較した。
以上の結果から,微調整された検出器はソーシャルメディア上でのトレーニングに問題はないことが示唆された。
論文 参考訳(メタデータ) (2024-06-18T12:26:09Z) - A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus [71.77214818319054]
自然言語推論は自然言語理解のプロキシである。
ルーマニア語のNLIコーパスは公開されていない。
58Kの訓練文対からなるルーマニア初のNLIコーパス(RoNLI)を紹介する。
論文 参考訳(メタデータ) (2024-05-20T08:41:15Z) - Text Intimacy Analysis using Ensembles of Multilingual Transformers [0.0]
本稿では,SemEval共有タスク9について,テキストの親密度を推定する作業について述べる。
データセットは10言語のツイートで構成されており、トレーニングデータセットで利用できるのは6つのみである。
言語固有の単言語モデルとともに多言語モデルのアンサンブルが最高の性能を持つことを示す。
論文 参考訳(メタデータ) (2023-12-05T09:04:22Z) - Beyond Contrastive Learning: A Variational Generative Model for
Multilingual Retrieval [109.62363167257664]
本稿では,多言語テキスト埋め込み学習のための生成モデルを提案する。
我々のモデルは、$N$言語で並列データを操作する。
本手法は, 意味的類似性, ビットクストマイニング, 言語間質問検索などを含む一連のタスクに対して評価を行う。
論文 参考訳(メタデータ) (2022-12-21T02:41:40Z) - IGLUE: A Benchmark for Transfer Learning across Modalities, Tasks, and
Languages [87.5457337866383]
画像認識言語理解評価ベンチマークについて紹介する。
IGLUEは、視覚的質問応答、クロスモーダル検索、グラウンドド推論、20言語にわたるグラウンドドエンターテイメントタスクをまとめて提供する。
翻訳-テストの転送はゼロショットの転送よりも優れており、少数ショットの学習は多くのタスクに役立てることが難しい。
論文 参考訳(メタデータ) (2022-01-27T18:53:22Z) - Few-Shot Cross-Lingual Stance Detection with Sentiment-Based
Pre-Training [32.800766653254634]
本研究は,現在までの言語間スタンス検出に関する最も包括的な研究である。
6つの言語ファミリーの12言語で15の多様なデータセットを使用します。
実験では,新しいラベルエンコーダの追加を提案し,パターン探索トレーニングを構築した。
論文 参考訳(メタデータ) (2021-09-13T15:20:06Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - Semi-automatic Generation of Multilingual Datasets for Stance Detection
in Twitter [9.359018642178917]
本稿では,Twitterにおける姿勢検出のための多言語データセットを得る手法を提案する。
ユーザベースの情報を利用して、大量のツイートを半自動でラベル付けします。
論文 参考訳(メタデータ) (2021-01-28T13:05:09Z) - Be More with Less: Hypergraph Attention Networks for Inductive Text
Classification [56.98218530073927]
グラフニューラルネットワーク(GNN)は、研究コミュニティで注目され、この標準タスクで有望な結果を実証している。
成功にもかかわらず、それらのパフォーマンスは、単語間の高次相互作用をキャプチャできないため、実際は大部分が危険に晒される可能性がある。
本稿では,テキスト表現学習において,少ない計算量でより表現力の高いハイパーグラフアテンションネットワーク(HyperGAT)を提案する。
論文 参考訳(メタデータ) (2020-11-01T00:21:59Z) - Language and Visual Entity Relationship Graph for Agent Navigation [54.059606864535304]
VLN(Vision-and-Language Navigation)は、エージェントが自然言語の指示に従って現実世界の環境をナビゲートする必要がある。
テキストと視覚間のモーダル関係をモデル化するための新しい言語とビジュアルエンティティ関係グラフを提案する。
実験によって、私たちは最先端技術よりも改善できる関係を利用しています。
論文 参考訳(メタデータ) (2020-10-19T08:25:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。