Fugu-MT 論文翻訳(概要): A Syntax-Injected Approach for Faster and More Accurate Sentiment Analysis

論文の概要: A Syntax-Injected Approach for Faster and More Accurate Sentiment Analysis

arxiv url: http://arxiv.org/abs/2406.15163v1
Date: Fri, 21 Jun 2024 14:08:25 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-24 13:22:51.674534
Title: A Syntax-Injected Approach for Faster and More Accurate Sentiment Analysis
Title（参考訳）: 高速かつ高精度な感性分析のための構文注入手法
Authors: Muhammad Imran, Olga Kellert, Carlos Gómez-Rodríguez,
Abstract要約: 感性分析(SA)は自然言語処理(NLP)の重要な側面である本稿では、SELSP(Sequence Labeling Syntactic labeling)を用いて構文をSAに注入することでボトルネックを解決する。依存関係解析をシーケンス問題として扱うことにより,構文ベースSAの高速化を実現した。
参考スコア（独自算出の注目度）: 13.6275227161629
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Sentiment Analysis (SA) is a crucial aspect of Natural Language Processing (NLP), addressing subjective assessments in textual content. Syntactic parsing is useful in SA because explicit syntactic information can improve accuracy while providing explainability, but it tends to be a computational bottleneck in practice due to the slowness of parsing algorithms. This paper addresses said bottleneck by using a SEquence Labeling Syntactic Parser (SELSP) to inject syntax into SA. By treating dependency parsing as a sequence labeling problem, we greatly enhance the speed of syntax-based SA. SELSP is trained and evaluated on a ternary polarity classification task, demonstrating its faster performance and better accuracy in polarity prediction tasks compared to conventional parsers like Stanza and to heuristic approaches that use shallow syntactic rules for SA like VADER. This increased speed and improved accuracy make SELSP particularly appealing to SA practitioners in both research and industry. In addition, we test several sentiment dictionaries on our SELSP to see which one improves the performance in polarity prediction tasks. Moreover, we compare the SELSP with Transformer-based models trained on a 5-label classification task. The results show that dictionaries that capture polarity judgment variation provide better results than dictionaries that ignore polarity judgment variation. Moreover, we show that SELSP is considerably faster than Transformer-based models in polarity prediction tasks.
Abstract（参考訳）: 感性分析(SA)は自然言語処理(NLP)の重要な側面であり、テキストコンテンツにおける主観的評価に対処する。構文解析は、説明可能性を提供しながら、明確な構文情報により精度を向上させることができるため、SAでは有用であるが、解析アルゴリズムの遅さのため、実際は計算ボトルネックとなる傾向がある。本稿では、SELSP(Sequence Labeling Syntactic Parser)を用いて、SAに構文を注入することでボトルネックに対処する。依存関係解析をシーケンスラベリング問題として扱うことにより,構文ベースSAの高速化を実現した。 SELSPは3次極性分類タスクで訓練され評価され、Stanzaのような従来のパーサーやVADERのようなSAの浅い構文規則を使用するヒューリスティックアプローチと比較して、その性能と極性予測タスクの精度が向上した。このスピードの向上と精度の向上により、SELSPは特に研究と産業の両方のSA実践者にアピールする。さらに、SELSP上で複数の感情辞書をテストし、どの感情辞書が極性予測タスクの性能を改善するかを検証した。さらに,SELSP と Transformer を用いたモデルとの比較を行った。その結果, 極性判定変動を捉える辞書の方が, 極性判定変動を無視する辞書よりも優れた結果が得られることがわかった。さらに,SELSP は極性予測タスクにおいて Transformer ベースのモデルよりもかなり高速であることを示す。

関連論文リスト

Enhancing Automatic Term Extraction with Large Language Models via Syntactic Retrieval [7.767476858353642]
本稿では, 意味的類似性ではなく, エフェシンタクティック(enmphsyntactic)によるデモンストレーションを選択する検索ベースのプロンプト戦略を提案する。クエリ文と検索した例の語彙的重なり合いがパフォーマンスに与える影響を解析し、ドメイン内設定とクロスドメイン設定の両方でアプローチを評価する。
論文参考訳（メタデータ） (2025-06-26T13:14:52Z)
GliLem: Leveraging GliNER for Contextualized Lemmatization in Estonian [0.21485350418225246]
GliLemはエストニア人のための新しいハイブリッド補題システムである。本稿では,事前学習したGliNERモデルの柔軟性を活用し,Vabamorfの補間精度を向上させる。
論文参考訳（メタデータ） (2024-12-29T22:02:00Z)
CalibraEval: Calibrating Prediction Distribution to Mitigate Selection Bias in LLMs-as-Judges [21.580762639442913]
推論中に選択バイアスを緩和する新しいラベルフリー手法であるCalibraEvalを紹介する。 CalibraEvalは、バイアスのない予測分布に合わせて観測された予測分布を調整するための最適化タスクとしてデバイアスを再構成する。本稿では,CalibraEvalが選択バイアスを効果的に軽減し,既存のデバイアス法と比較して性能を向上させることを示す。
論文参考訳（メタデータ） (2024-10-20T13:47:39Z)
Quantifying Language Models' Sensitivity to Spurious Features in Prompt Design or: How I learned to start worrying about prompt formatting [68.19544657508509]
言語モデル(LLM)は、言語技術の基本コンポーネントとして採用されている。いくつかの広く使われているオープンソースLLMは、数ショット設定でプロンプトフォーマットの微妙な変更に対して非常に敏感であることがわかった。本稿では,与えられたタスクに対して有効なプロンプトフォーマットのサンプルセットを迅速に評価するアルゴリズムを提案し,モデル重み付けにアクセスせずに期待性能の間隔を報告する。
論文参考訳（メタデータ） (2023-10-17T15:03:30Z)
ASPEST: Bridging the Gap Between Active Learning and Selective Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文参考訳（メタデータ） (2023-04-07T23:51:07Z)
SUN: Exploring Intrinsic Uncertainties in Text-to-SQL Parsers [61.48159785138462]
本稿では,ニューラルネットワークに基づくアプローチ(SUN)における本質的な不確かさを探索することにより,テキストから依存への変換性能を向上させることを目的とする。 5つのベンチマークデータセットの大規模な実験により、我々の手法は競合より大幅に優れ、新しい最先端の結果が得られた。
論文参考訳（メタデータ） (2022-09-14T06:27:51Z)
Embarrassingly Simple Performance Prediction for Abductive Natural Language Inference [10.536415845097661]
本研究では,NLIモデルの性能を微調整せずに予測する手法を提案する。その結果,コサイン類似度手法の精度はパーソン相関係数0.65の分類手法の精度と強く相関していることがわかった。提案手法は,モデル選択の過程において,大幅な時間節約につながる可能性がある。
論文参考訳（メタデータ） (2022-02-21T18:10:24Z)
More Than Words: Towards Better Quality Interpretations of Text Classifiers [16.66535643383862]
MLモデルの入力インタフェースを考えると、トークンベースの解釈性は便利な第1選択であるが、あらゆる状況において最も効果的ではないことを示す。 1)ランダム化テストにより測定されるほど頑健であり,2)SHAPのような近似に基づく手法を用いた場合の変動性が低く,3)言語的コヒーレンスがより高い水準にある場合の人間には理解できない。
論文参考訳（メタデータ） (2021-12-23T10:18:50Z)
A Theory-Driven Self-Labeling Refinement Method for Contrastive Representation Learning [111.05365744744437]
教師なしのコントラスト学習は、正のイメージの作物と、負のイメージの作物とをラベル付けする。本研究は, コントラスト学習において, 不正確なラベル割り当てがセマンティック・インスタンス識別の一般化を著しく損なうことを最初に証明する。この理論に触発されて、コントラスト学習のための新しい自己ラベル改善手法を提案する。
論文参考訳（メタデータ） (2021-06-28T14:24:52Z)
Disentangled Contrastive Learning for Learning Robust Textual Representations [13.880693856907037]
運動量表現一貫性の概念を導入し,特徴を整合させ,一様性に適合しながらパワー正規化を活用する。 NLPベンチマークの実験結果から,本手法はベースラインよりも優れた結果が得られることが示された。
論文参考訳（メタデータ） (2021-04-11T03:32:49Z)
Fast Rates for Contextual Linear Optimization [52.39202699484225]
提案手法は, 下流決定性能を直接最適化する手法よりもはるかに高速な, 後悔の収束率を実現する。予測モデルは、既存のツールを使ったトレーニングが簡単かつ高速で、解釈が簡単で、私たちが示しているように、非常にうまく機能する決定につながる。
論文参考訳（メタデータ） (2020-11-05T18:43:59Z)
Reducing Confusion in Active Learning for Part-Of-Speech Tagging [100.08742107682264]
アクティブラーニング(AL)は、データ選択アルゴリズムを使用して、アノテーションコストを最小限に抑えるために有用なトレーニングサンプルを選択する。本研究では、特定の出力タグのペア間の混乱を最大に低減するインスタンスの選択問題について検討する。提案するAL戦略は,他のAL戦略よりも有意差で優れている。
論文参考訳（メタデータ） (2020-11-02T06:24:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。