Fugu-MT 論文翻訳(概要): UstanceBR: a social media language resource for stance prediction

論文の概要: UstanceBR: a social media language resource for stance prediction

arxiv url: http://arxiv.org/abs/2312.06374v4
Date: Mon, 11 Nov 2024 14:28:51 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:30.043894
Title: UstanceBR: a social media language resource for stance prediction
Title（参考訳）: UstanceBR:スタンス予測のためのソーシャルメディア言語リソース
Authors: Camila Pereira, Matheus Pavan, Sungwon Yoon, Ricelli Ramos, Pablo Costa, Lais Cavalheiro, Ivandre Paraboni,
Abstract要約: この研究は、ターゲットベースの姿勢予測のためのブラジルのTwitterドメインのマルチモーダルコーパスであるUstanceBRを紹介する。コーパスは、選択された対象トピックに対する86.8kのラベル付きスタンスと、これらのスタンスをソーシャルメディアで公開したユーザに関する広範なネットワーク情報で構成されている。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This work introduces UstanceBR, a multimodal corpus in the Brazilian Portuguese Twitter domain for target-based stance prediction. The corpus comprises 86.8 k labelled stances towards selected target topics, and extensive network information about the users who published these stances on social media. In this article we describe the corpus multimodal data, and a number of usage examples in both in-domain and zero-shot stance prediction based on text- and network-related information, which are intended to provide initial baseline results for future studies in the field.
Abstract（参考訳）: この研究は、ターゲットベースの姿勢予測のためのブラジルのTwitterドメインのマルチモーダルコーパスであるUstanceBRを紹介する。コーパスは、選択された対象トピックに対する86.8kのラベル付きスタンスと、これらのスタンスをソーシャルメディアで公開したユーザに関する広範なネットワーク情報で構成されている。本稿では,コーパスマルチモーダルデータと,テキストおよびネットワーク関連情報に基づくドメイン内およびゼロショット姿勢予測における多くの利用例について述べる。

関連論文リスト

A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags [3.443622476405787]
本稿では,オーストリアの大手新聞DerStandardのオンラインプラットフォーム上でのユーザ活動の大規模・縦断的データセットについて紹介する。データセットは10年(2013-2022年)で、7500万以上のユーザコメント、4億以上の投票、記事やユーザインタラクションに関する詳細なメタデータが含まれている。
論文参考訳（メタデータ） (2025-06-27T13:40:20Z)
PredBench: Benchmarking Spatio-Temporal Prediction across Diverse Disciplines [86.36060279469304]
予測時間ネットワークの総合評価に適したベンチマークであるPredBenchを紹介する。このベンチマークでは、広く採用されている12のメソッドと、複数のアプリケーションドメインにまたがる多様なデータセットを統合する。その多次元評価フレームワークは、総合的なメトリクスセットで分析を広げる。
論文参考訳（メタデータ） (2024-07-11T11:51:36Z)
Constructing Colloquial Dataset for Persian Sentiment Analysis of Social Microblogs [0.0]
本稿ではまず,ITRC-Opinionというユーザ意見データセットを協調的かつインソース的に構築する。私たちのデータセットには、TwitterやInstagramといったソーシャルなマイクロブログから、6万の非公式で口語的なペルシア語のテキストが含まれています。次に,畳み込みニューラルネットワーク(CNN)モデルに基づく新しいアーキテクチャを提案する。
論文参考訳（メタデータ） (2023-06-22T05:51:22Z)
Contextual information integration for stance detection via cross-attention [59.662413798388485]
スタンス検出は、著者の目標に対する姿勢を特定することを扱う。既存のスタンス検出モデルの多くは、関連するコンテキスト情報を考慮していないため、制限されている。文脈情報をテキストとして統合する手法を提案する。
論文参考訳（メタデータ） (2022-11-03T15:04:29Z)
Relational Embeddings for Language Independent Stance Detection [4.492444446637856]
本稿では,リレーショナル埋め込みを生成することで,友人やリツイートなどのソーシャル情報を活用する新しい手法を提案する。我々の手法は手動のチューニングなしに任意の言語やターゲットに適用できる。
論文参考訳（メタデータ） (2022-10-11T18:13:43Z)
FRMT: A Benchmark for Few-Shot Region-Aware Machine Translation [64.9546787488337]
本稿では、Few-shot Region-aware Machine Translationのための新しいデータセットと評価ベンチマークFRMTを提案する。このデータセットは、英語からポルトガル語と中国語の2つの地域変種へのプロの翻訳で構成されている。
論文参考訳（メタデータ） (2022-10-01T05:02:04Z)
Designing weighted and multiplex networks for deep learning user geolocation in Twitter [0.0]
本研究は,重み付き多グラフの文献と最先端のディープラーニング技術を組み合わせた新しい手法を設計,評価することによって,この分野の研究に寄与する。本研究は,これらの手法の性能を評価し,公開されているTwitter-USデータセットのベースラインモデルと比較する。また、ラテンアメリカでの大規模なTwitterキャプチャに基づいて、新しいデータセットも公開しています。
論文参考訳（メタデータ） (2021-12-13T20:24:07Z)
NLP-CIC @ DIACR-Ita: POS and Neighbor Based Distributional Models for Lexical Semantic Change in Diachronic Italian Corpora [62.997667081978825]
本稿では,イタリア語に対する教師なし語彙意味変化のシステムと知見について述べる。その課題は、対象の単語が時間とともにその意味を進化させたかどうかを判断することであり、それは2つの時間固有のデータセットからの原文のみに依存する。本研究では,各期間に対象単語を表す2つのモデルを提案し,しきい値と投票方式を用いて変化単語を予測する。
論文参考訳（メタデータ） (2020-11-07T11:27:18Z)
Named Entity Recognition for Social Media Texts with Semantic Augmentation [70.44281443975554]
名前付きエンティティ認識のための既存のアプローチは、短いテキストと非公式テキストで実行される場合、データ空間の問題に悩まされる。そこで我々は,NER によるソーシャルメディアテキストに対するニューラルベースアプローチを提案し,ローカルテキストと拡張セマンティクスの両方を考慮に入れた。
論文参考訳（メタデータ） (2020-10-29T10:06:46Z)
NEMO: Frequentist Inference Approach to Constrained Linguistic Typology Feature Prediction in SIGTYP 2020 Shared Task [83.43738174234053]
タイプ的特徴間の相関関係を表現するために頻繁な推論を用い、この表現を用いて、個々の特徴を予測する単純なマルチクラス推定器を訓練する。テスト言語149言語に対して,マイクロ平均精度0.66を達成できた。
論文参考訳（メタデータ） (2020-10-12T19:25:43Z)
A Framework for Pre-processing of Social Media Feeds based on Integrated Local Knowledge Base [1.5749416770494706]
本稿では,ソーシャルメディアフィードの事前処理によるパフォーマンス向上のためのフレームワークを提案する。このフレームワークは、標準化されたデータセットで94.07%、ツイートから感情を抽出する際には、局所化されたデータセットで99.78%の精度を持っていた。
論文参考訳（メタデータ） (2020-06-29T07:56:22Z)
Mapping Languages: The Corpus of Global Language Use [0.0]
本稿では,このコーパスがデータ駆動型言語マッピングにどのように使用できるかに着目し,グローバル言語を用いたWebベースのコーパスについて述べる。コーパスには148の言語と158の国を表す423億語が含まれている。
論文参考訳（メタデータ） (2020-04-02T03:42:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。