論文の概要: Chain-of-Thought Embeddings for Stance Detection on Social Media
- arxiv url: http://arxiv.org/abs/2310.19750v1
- Date: Mon, 30 Oct 2023 17:18:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-01 18:51:24.053041
- Title: Chain-of-Thought Embeddings for Stance Detection on Social Media
- Title(参考訳): ソーシャルメディアにおけるスタンス検出のためのチェーンオブソート埋め込み
- Authors: Joseph Gatto, Omar Sharif, Sarah Masud Preum
- Abstract要約: CoT(Chain-of-Thought)プロンプトは,最近,姿勢検出タスクのパフォーマンス向上を図っている。
本研究では,姿勢検出タスクにおけるCOT性能を向上させるCOT埋め込みについて紹介する。
本モデルはソーシャルメディアから収集した複数の姿勢検出データセット上でのSOTA性能を実現する。
- 参考スコア(独自算出の注目度): 3.5128547933798275
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Stance detection on social media is challenging for Large Language Models
(LLMs), as emerging slang and colloquial language in online conversations often
contain deeply implicit stance labels. Chain-of-Thought (COT) prompting has
recently been shown to improve performance on stance detection tasks --
alleviating some of these issues. However, COT prompting still struggles with
implicit stance identification. This challenge arises because many samples are
initially challenging to comprehend before a model becomes familiar with the
slang and evolving knowledge related to different topics, all of which need to
be acquired through the training data. In this study, we address this problem
by introducing COT Embeddings which improve COT performance on stance detection
tasks by embedding COT reasonings and integrating them into a traditional
RoBERTa-based stance detection pipeline. Our analysis demonstrates that 1) text
encoders can leverage COT reasonings with minor errors or hallucinations that
would otherwise distort the COT output label. 2) Text encoders can overlook
misleading COT reasoning when a sample's prediction heavily depends on
domain-specific patterns. Our model achieves SOTA performance on multiple
stance detection datasets collected from social media.
- Abstract(参考訳): ソーシャルメディアでのスタンス検出は大規模言語モデル(llm)では困難であり、オンライン会話における新しいスラングや口語は、しばしば暗黙のスタンスラベルを含んでいる。
CoT(Chain-of-Thought)プロンプトは、最近、スタンス検出タスクのパフォーマンスを改善することが示されている。
しかし、cotプロンプトは暗黙のスタンス識別に苦しむ。
この課題は、モデルがさまざまなトピックに関連するスラングや進化する知識に慣れるまでに、多くのサンプルが最初に理解することが難しいためである。
本研究では,COT推論を埋め込み,従来のRoBERTaを用いた姿勢検出パイプラインに統合することにより,姿勢検出タスクにおけるCOT性能を向上させるCOT埋め込みを導入することで,この問題に対処する。
私たちの分析は
1)テキストエンコーダは、COT出力ラベルを歪ませるような小さなエラーや幻覚を伴うCOT推論を利用することができる。
2)テキストエンコーダは,サンプルの予測がドメイン固有のパターンに大きく依存する場合,COT推論の誤解を招く可能性がある。
本モデルはソーシャルメディアから収集した複数の姿勢検出データセット上でのSOTA性能を実現する。
関連論文リスト
- A Hitchhikers Guide to Fine-Grained Face Forgery Detection Using Common Sense Reasoning [9.786907179872815]
視覚と言語の可能性は、いまだに偽造検出に過小評価されている。
顔偽造検出を視覚質問応答(VQA)タスクに変換する方法論が必要である。
このギャップに対処するために,従来の二項決定パラダイムから分岐する多段階的アプローチを提案する。
論文 参考訳(メタデータ) (2024-10-01T08:16:40Z) - A Challenge Dataset and Effective Models for Conversational Stance Detection [26.208989232347058]
マルチターン会話姿勢検出データセット(textbfMT-CSD)を導入する。
本稿では,会話データに固有の長距離および短距離の依存関係に対処するグローバルローカルアテンションネットワーク(textbfGLAN)を提案する。
私たちのデータセットは、ドメイン間スタンス検出の進歩を触媒する貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-03-17T08:51:01Z) - Chain of Thought Explanation for Dialogue State Tracking [52.015771676340016]
対話状態追跡(DST)は、会話中のユーザクエリと目標を記録することを目的としている。
DSTタスクに対してChain-of-Thought-Explanation(CoTE)というモデルを提案する。
CoTEはスロット値を決定した後、ステップバイステップで詳細な説明を作成するように設計されている。
論文 参考訳(メタデータ) (2024-03-07T16:59:55Z) - Assaying on the Robustness of Zero-Shot Machine-Generated Text Detectors [57.7003399760813]
先進的なLarge Language Models (LLMs) とその特殊な変種を探索し、いくつかの方法でこの分野に寄与する。
トピックと検出性能の間に有意な相関関係が発見された。
これらの調査は、様々なトピックにまたがるこれらの検出手法の適応性と堅牢性に光を当てた。
論文 参考訳(メタデータ) (2023-12-20T10:53:53Z) - Noise-Robust Dense Retrieval via Contrastive Alignment Post Training [89.29256833403167]
Contrastive Alignment POst Training (CAPOT) は、指数再生を必要とせず、モデルロバスト性を改善する高効率な微調整法である。
CAPOTはドキュメントエンコーダを凍結することで堅牢な検索を可能にし、クエリエンコーダはノイズの多いクエリを修正されていないルートに整列させる。
MSMARCO、Natural Questions、Trivia QAパス検索のCAPOTノイズ変動を評価し、CAPOTがオーバーヘッドを伴わないデータ増大に類似した影響があることを発見した。
論文 参考訳(メタデータ) (2023-04-06T22:16:53Z) - How would Stance Detection Techniques Evolve after the Launch of ChatGPT? [5.756359016880821]
2022年11月30日、新しい訓練済み言語モデルであるchatGPTが発売された。
ChatGPTは、SemEval-2016やP-Stanceといった一般的なデータセットに対して、SOTAまたは同様のパフォーマンスを達成することができる。
ChatGPTは、NLPのスタンス検出タスクにおいて、最高のAIモデルになる可能性がある。
論文 参考訳(メタデータ) (2022-12-30T05:03:15Z) - Catch Me If You Can: Deceiving Stance Detection and Geotagging Models to
Protect Privacy of Individuals on Twitter [3.928604516640069]
調査は2つの露光リスキーなタスク、姿勢検出とジオタグ付けに基礎を置いている。
そこで本研究では,テキスト修正のための多種多様なテクニックを探求する。例えば,テキストに接頭辞を挿入したり,言い換えたり,ダミーなソーシャルメディア投稿を追加したりすることなどである。
タイプミスは、ソーシャルネットワークに依存しているため、最先端のジオタグモデルに最小限の影響があることがわかった。
論文 参考訳(メタデータ) (2022-07-23T11:55:18Z) - AES Systems Are Both Overstable And Oversensitive: Explaining Why And
Proposing Defenses [66.49753193098356]
スコアリングモデルの驚くべき逆方向の脆さの原因について検討する。
のモデルとして訓練されているにもかかわらず、単語の袋のように振る舞うことを示唆している。
高い精度で試料を発生させる過敏性と過敏性を検出できる検出ベース保護モデルを提案する。
論文 参考訳(メタデータ) (2021-09-24T03:49:38Z) - Investigating the Reordering Capability in CTC-based Non-Autoregressive
End-to-End Speech Translation [62.943925893616196]
接続型時間分類(CTC)を用いた非回帰型音声-テキスト翻訳モデルの構築の可能性について検討する。
CTCの翻訳における成功は単調な仮定のため直感に反するため,再順序化能力の解析を行う。
解析の結果、トランスフォーマーエンコーダは単語の順序を変えることができることがわかった。
論文 参考訳(メタデータ) (2021-05-11T07:48:45Z) - Time to Transfer: Predicting and Evaluating Machine-Human Chatting
Handoff [36.62707486132739]
人間とアルゴリズムのコラボレーションを可能にするMHCH(Machine-Human Chatting Handoff)を紹介します。
正規/伝達可能な発話を検出するために,DAMI(Difficulty-Assisted Matching Inference)ネットワークを提案する。
文脈マッチング機能をキャプチャするためにマッチング推論機構が導入される。
論文 参考訳(メタデータ) (2020-12-14T15:02:08Z) - Exploiting Unsupervised Data for Emotion Recognition in Conversations [76.01690906995286]
会話における感情認識(Emotion Recognition in Conversations:ERC)は、会話における話者の感情状態を予測することを目的としている。
ERCタスクの教師付きデータは限られている。
教師なし会話データを活用する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-02T13:28:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。