論文の概要: Robust Dual-Signal Fusion: Hybrid Neuro-Symbolic Gating with Compressed Chain-of-Thought Refinement for Irony Detection in Social Media Texts
- arxiv url: http://arxiv.org/abs/2606.16845v1
- Date: Mon, 15 Jun 2026 15:22:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.665053
- Title: Robust Dual-Signal Fusion: Hybrid Neuro-Symbolic Gating with Compressed Chain-of-Thought Refinement for Irony Detection in Social Media Texts
- Title(参考訳): ロバストデュアルサインルフュージョン:ソーシャルメディアテキストにおける皮肉検出のための圧縮鎖切断によるハイブリッド神経-シンボリックゲーティング
- Authors: Ankit Bhattacharjee, Krityapriya Bhaumik,
- Abstract要約: 本稿では,Robust Dual-Signal (RDS) Fusionフレームワークを紹介する。
スーパービジョンファインチューニング(SFT)を使わずに軌道のチェーン・オブ・ソート(CoT)を圧縮する
精度は78.1%、マクロF1は0.777で、細調整されたBERTweetの絶対的なパフォーマンス天井と一致する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large Language Models (LLMs) natively default to literal semantic interpretations, making zero-shot irony detection a persistent challenge. We introduce the Robust Dual-Signal (RDS) Fusion framework, a hybrid neuro-symbolic architecture that compresses Chain-of-Thought (CoT) reasoning trajectories without Supervised Fine-Tuning (SFT). Evaluated on a strictly held-out TweetEval test set (N=734), RDS achieves 78.1% accuracy and a Macro F1 of 0.777, matching the absolute performance ceiling of the fine-tuned BERTweet. On the heavily imbalanced iSarcasm dataset, the frozen CoT pipeline filters 22.5% of out-of-distribution hallucinations, yielding a zero-shot Macro F1 of 0.6726 and Ironic F1 of 0.4821, outperforming multiple heavily supervised SemEval transformer ensembles. A statistical ablation confirms this structural synergy: adding the symbolic prior to the neural baseline yields no significant gain (p = 0.242), and the marginal benefit of adding the CoT pipeline to that prior is heavily compressed (p = 0.149). Only the complete, concurrent fusion of all three signals achieves a statistically validated improvement over the baseline (p = 0.005).
- Abstract(参考訳): 大言語モデル(LLM)は、リテラルセマンティックな解釈をネイティブにデフォルトとし、ゼロショットの皮肉検出は永続的な課題である。
本稿では, CoT (Chain-of-Thought) 推論トラジェクトリをSFT (Supervised Fine-Tuning) なしで圧縮するハイブリッドニューロシンボリックアーキテクチャであるRobust Dual-Signal (RDS) Fusionフレームワークを紹介する。
厳格に保持されたTweetEvalテストセット(N=734)に基づいて評価され、RDSは78.1%の精度と0.777のマクロF1を達成し、微調整されたBERTweetの絶対的なパフォーマンス天井と一致する。
非常に不均衡なiSarcasmデータセットでは、冷凍されたCoTパイプラインは分布外幻覚の22.5%をフィルターし、ゼロショットのマクロF1は0.6726、アイアンF1は0.4821となり、複数の重監督されたセムエスバル変圧器のアンサンブルを上回った。
統計的アブレーションは、この構造的相乗効果を裏付ける: 神経ベースラインに記号を加えると、有意な利得が得られず(p = 0.242)、それ以前のCoTパイプラインを追加するという限界的な利点は、強く圧縮される(p = 0.149)。
3つの信号の完全な同時融合のみが、ベースラインに対する統計的に検証された改善を達成する(p = 0.005)。
関連論文リスト
- Reliable Extraction of Clinical Follow-Up Instructions: A Hybrid Neural-Symbolic Pipeline [43.0484058393522]
我々は,ニューラルシンボリックなハイブリッドパイプラインを直接生成に対して試験する。
本研究は,2000点の合成外用コーパスについて検討した。
論文 参考訳(メタデータ) (2026-05-26T05:14:33Z) - Amplifying, Not Learning: Fine-Tuned AI Text Detectors Amplify a Pretrained Direction [51.56484100374058]
テキスト検出器は、事前訓練された典型軸を増幅する。
タスク監督前の生エンコーダでは、3つのアーキテクチャでNYT-vs-HC3 AUROC 0.806/0.944/0.834を達成する。
RoBERTaベースでは、生のプロジェクションは微調整を超えるが、RoBERTaベースでは、フル微調整は、試験された流線型人口の双方で生よりも識別を小さくする。
論文 参考訳(メタデータ) (2026-05-20T19:08:38Z) - A Reproducible Log-Driven AutoML Framework for Interpretable Pipeline Optimization in Healthcare Risk Prediction [7.356849324535381]
本研究では、決定論的かつログ駆動の自動機械学習フレームワークであるyvsoucom-iterkitを紹介する。
18,000以上のパイプライン構成にわたるPima Indians DiabetesとStrokeデータセットの実験は、部分的に冗長な検索スペースを明らかにしている。
このフレームワークは、アンサンブルモデルを使用して、強力で安定したパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-05-19T16:57:56Z) - Architecture-Agnostic Modality-Isolated Gated Fusion for Robust Multi-Modal Prostate MRI Segmentation [0.0]
多重化前立腺MRIは、T2パラメトリック(T2W)、見かけ拡散係数(ADC)、高b値拡散強調(HBV)配列を組み合わせる。
実際には、拡散配列は、T2Wよりも、取得のばらつき、動き、アーティファクトの影響を受けることが多い。
我々は、学習ゲーティングステージの前に、個別のモダリティ固有の符号化ストリームを維持するために、Modality-Isolated Gated Fusion (MIGF)を提案する。
論文 参考訳(メタデータ) (2026-04-12T15:54:21Z) - Low-Rank Adaptation Reduces Catastrophic Forgetting in Sequential Transformer Encoder Fine-Tuning: Controlled Empirical Evidence and Frozen-Backbone Representation Probes [3.305265383862785]
コンパニオン表現プローブを用いたシーケンシャルトランスフォーマーエンコーダにおけるローランド適応(LoRA)の実証的研究について述べる。
RTE->MRPC->CoLA->SST-2配列上の5つのフルバリデーションBERTベースでは、フル微調整の収率は19.9%+/-で、標準のLoRA(r、クエリ/バリューモジュール)は0.6%+/-1.4%である。
論文 参考訳(メタデータ) (2026-03-29T14:14:36Z) - Do Generative Metrics Predict YOLO Performance? An Evaluation Across Models, Augmentation Ratios, and Dataset Complexity [43.338311770275745]
本報告では, YOLOv11の合成増強の制御された評価法について述べる。
実際のトレーニングスプリットの10%から150%の増大率に対して, GAN, 拡散, ハイブリッドベースの6つのジェネレータをベンチマークした。
データセット生成/拡張設定毎に、マッチしたサイズのブートストラッププロトコルで事前トレーニングデータセットメトリクスを計算する。
論文 参考訳(メタデータ) (2026-02-20T03:02:36Z) - Towards Efficient Large Language Reasoning Models via Extreme-Ratio Chain-of-Thought Compression [55.63153956934198]
Chain-of-Thought (CoT)推論はLarge Language Models (LLMs)の推論能力をうまく向上させる
既存のCoT圧縮法は、しばしば高い圧縮比で論理的忠実度が著しく低下する。
本稿では,Extra-CoTと呼ばれる新しいEXTreme-RAtio Chain-of-Thought Compressionフレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-09T06:57:15Z) - Causal Data Augmentation for Robust Fine-Tuning of Tabular Foundation Models [45.21399037022976]
CausalMixFTは、微調整の堅牢性と下流のパフォーマンスを向上させる方法である。
ターゲットデータセットに適合した構造因果モデル(Structure Causal Models, SCM)を用いて、構造的に一貫した合成サンプルを生成する。
TabArenaの33の分類データセットと2300以上の微調整実行で評価された。
論文 参考訳(メタデータ) (2026-01-07T17:16:39Z) - A Two-Stage Strategy for Mitosis Detection Using Improved YOLO11x Proposals and ConvNeXt Classification [5.1547008655164195]
MIDOG 2025 Track 1は、非腫瘍性、炎症性、壊死性再腫瘍を含む全スライディングイメージ(WSI)におけるミトーシス検出を必要とする。
複雑で異質な文脈のため、しばしば偽陽性と偽陰性が存在するため、検出F1スコアは劣化する。
本稿では、有糸分裂候補を生成し、偽陽性を除去する2段階フレームワークを提案する。
MIDOG 2025 Track 1の予備テストセットでは、thealgorithmのスコアは0.7587である。
論文 参考訳(メタデータ) (2025-09-01T15:46:28Z) - MixedNUTS: Training-Free Accuracy-Robustness Balance via Nonlinearly Mixed Classifiers [41.56951365163419]
MixedNUTSは、ロバストな分類器の出力ロジットを3つのパラメータしか持たない非線形変換で処理する訓練不要の手法である。
MixedNUTSは変換されたロジットを確率に変換し、それらを全体の出力として混合する。
CIFAR-10、CIFAR-100、ImageNetデータセットでは、MixedNUTSの精度とほぼSOTAの堅牢性を大幅に改善した。
論文 参考訳(メタデータ) (2024-02-03T21:12:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。