論文の概要: ERTIM@MC2: Diversified Argumentative Tweets Retrieval
- arxiv url: http://arxiv.org/abs/2304.08047v1
- Date: Mon, 17 Apr 2023 08:06:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-18 16:16:14.504449
- Title: ERTIM@MC2: Diversified Argumentative Tweets Retrieval
- Title(参考訳): ertim@mc2: 多様な議論的ツイート検索
- Authors: K\'evin Deturck (ERTIM), Parantapa Goswami, Damien Nouvel (ERTIM),
Fr\'ed\'erique Segond (ERTIM)
- Abstract要約: 英語とフランス語のフェスティバルに関する最も議論の的かつ多様なつぶやきを、多言語による大規模なコレクションから検出する。
最初のステップでは、元のデータセットをフィルタリングして、タスクの言語とトピック要件に適合させる。
最後のステップでは、ツイートをテキストの内容に応じてクラスタリングし、各クラスタから最も議論的な引数を選択することで、最も多様な引数を抽出する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present our participation to CLEF MC2 2018 edition for the
task 2 Mining opinion argumentation. It consists in detecting the most
argumentative and diverse Tweets about some festivals in English and French
from a massive multilingual collection. We measure argumentativity of a Tweet
computing the amount of argumentation compounds it contains. We consider
argumentation compounds as a combination between opinion expression and its
support with facts and a particular structuration. Regarding diversity, we
consider the amount of festival aspects covered by Tweets. An initial step
filters the original dataset to fit the language and topic requirements of the
task. Then, we compute and integrate linguistic descriptors to detect claims
and their respective justifications in Tweets. The final step extracts the most
diverse arguments by clustering Tweets according to their textual content and
selecting the most argumentative ones from each cluster. We conclude the paper
describing the different ways we combined the descriptors among the different
runs we submitted and discussing their results.
- Abstract(参考訳): 本稿では,タスク2におけるCLEF MC2 2018版への参加について述べる。
英語とフランス語のフェスティバルに関する最も議論の的かつ多様なつぶやきを、膨大な多言語コレクションから検出する。
我々は、それに含まれる議論の量を計算するつぶやきの議論性を測定する。
我々は、議論化合物を、意見表現とその事実と特定の構造化との支持の組み合わせと考える。
多様性に関しては、つぶやきによってカバーされる祭りの側面の量を考慮する。
最初のステップでは、元のデータセットをフィルタリングして、タスクの言語とトピック要件に適合させる。
そして、我々は言語記述子を計算して統合し、つぶやきのクレームとそれぞれの正当化を検知する。
最後のステップでは、ツイートをテキストの内容に応じてクラスタリングし、各クラスタから最も議論的な引数を選択することで、最も多様な引数を抽出する。
論文の結論として,記述子をさまざまな実行に組み合わせる方法を説明し,その結果について論じた。
関連論文リスト
- CERD: A Comprehensive Chinese Rhetoric Dataset for Rhetorical Understanding and Generation in Essays [30.728539221991188]
既存の修辞的データセットやコーパスは主に単一の粗いカテゴリや細かいカテゴリに焦点を当てている。
提案手法は,4つの大まかなカテゴリからなる中国エッセイレトリックデータセット(CERD)を提案する。
CERDは、手動で注釈付きで包括的な中国の修辞的データセットで、5つの相互関連サブタスクがある。
論文 参考訳(メタデータ) (2024-09-29T12:47:25Z) - Uncovering Differences in Persuasive Language in Russian versus English Wikipedia [40.61046400448044]
英語とロシア語で書かれたウィキペディア記事間の説得力のある言語の違いが、それぞれの文化の異なる主題に対する視点を明らかにする方法について検討する。
我々は多言語テキスト中の説得的言語を識別する大規模言語モデル(LLM)システムを開発した。
論文 参考訳(メタデータ) (2024-09-27T21:23:19Z) - PanoSent: A Panoptic Sextuple Extraction Benchmark for Multimodal Conversational Aspect-based Sentiment Analysis [74.41260927676747]
本稿では,マルチモーダル対話感分析(ABSA)を導入することでギャップを埋める。
タスクをベンチマークするために、手動と自動の両方で注釈付けされたデータセットであるPanoSentを構築し、高品質、大規模、マルチモーダル、マルチ言語主義、マルチシナリオを特徴とし、暗黙の感情要素と明示的な感情要素の両方をカバーする。
課題を効果的に解決するために,新しい多モーダルな大規模言語モデル(すなわちSentica)とパラフレーズベースの検証機構とともに,新しい感覚の連鎖推論フレームワークを考案した。
論文 参考訳(メタデータ) (2024-08-18T13:51:01Z) - Argue with Me Tersely: Towards Sentence-Level Counter-Argument
Generation [62.069374456021016]
本稿では,文レベル逆問題生成のためのArgTerselyベンチマークを提案する。
また,Arg-LlaMAによる高品質な逆問題生成手法を提案する。
論文 参考訳(メタデータ) (2023-12-21T06:51:34Z) - Explainable Topic-Enhanced Argument Mining from Heterogeneous Sources [33.62800469391487]
核エネルギーのような物議を醸す標的が与えられれば、議論の採鉱は異質な情報源から議論のテキストを識別することを目的としている。
現在のアプローチでは、ターゲット関連セマンティック情報を議論テキストに統合するより良い方法を模索している。
提案手法は, トピック・エンハンスな議論マイニング手法である。
論文 参考訳(メタデータ) (2023-07-22T17:26:55Z) - Retrofitting Multilingual Sentence Embeddings with Abstract Meaning
Representation [70.58243648754507]
抽象的意味表現(AMR)を用いた既存の多言語文の埋め込みを改善する新しい手法を提案する。
原文入力と比較すると、AMRは文の中核概念と関係を明確かつ曖昧に表す構造的意味表現である。
実験結果から,多言語文をAMRで埋め込むと,意味的類似性と伝達タスクの両方において,最先端の性能が向上することがわかった。
論文 参考訳(メタデータ) (2022-10-18T11:37:36Z) - RuArg-2022: Argument Mining Evaluation [69.87149207721035]
本稿は、ロシア語テキストを扱う議論分析システムの最初のコンペティションの主催者の報告である。
新型コロナウイルスの感染拡大に伴う3つの話題について、9,550文(ソーシャルメディア投稿記事)のコーパスを用意した。
両タスクで第一位を獲得したシステムは、BERTアーキテクチャのNLI(Natural Language Inference)変種を使用した。
論文 参考訳(メタデータ) (2022-06-18T17:13:37Z) - IAM: A Comprehensive and Large-Scale Dataset for Integrated Argument
Mining Tasks [59.457948080207174]
本稿では,一連の議論マイニングタスクに適用可能なIAMという,包括的で大規模なデータセットを提案する。
データセットの70k近い文は、引数特性に基づいて完全に注釈付けされている。
議論準備プロセスに関連する2つの新しい統合された議論マイニングタスクを提案する。(1) 姿勢分類付きクレーム抽出(CESC)と(2) クレーム・エビデンス・ペア抽出(CEPE)である。
論文 参考訳(メタデータ) (2022-03-23T08:07:32Z) - Reinforcement Learning-based Dialogue Guided Event Extraction to Exploit
Argument Relations [70.35379323231241]
本稿では、イベント引数の関係を明示的に活用することで、イベント抽出のためのより良いアプローチを提案する。
我々は増補学習と漸進学習を用いて、多回反復的なプロセスを通じて複数の引数を抽出する。
実験の結果,提案手法は7つの最先端イベント抽出法より一貫して優れていることがわかった。
論文 参考訳(メタデータ) (2021-06-23T13:24:39Z) - Great Service! Fine-grained Parsing of Implicit Arguments [7.785534704637891]
ある種の暗黙の議論は、他のものよりも解析するのが困難であることを示す。
この作業は、暗黙的かつ未特定な言語をより理解しやすくし、それを意味表現にホリスティックに組み込む。
論文 参考訳(メタデータ) (2021-06-04T15:50:35Z) - The Discussion Tracker Corpus of Collaborative Argumentation [2.800857580710507]
ディベート・トラッカー・コーパスはアメリカ高校の英語の授業で収集された。
コーパスは、985分間の音声から書き起こされた英文学に関する29の多党の議論で構成されている。
論文 参考訳(メタデータ) (2020-05-22T18:27:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。