論文の概要: negativas: a prototype for searching and classifying sentential negation in speech data
- arxiv url: http://arxiv.org/abs/2504.04275v1
- Date: Sat, 05 Apr 2025 20:09:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-08 14:12:43.149511
- Title: negativas: a prototype for searching and classifying sentential negation in speech data
- Title(参考訳): Negativas: 音声データにおける知覚否定の検索と分類のためのプロトタイプ
- Authors: Túlio Sousa de Gois, Paloma Batista Cardoso,
- Abstract要約: ブラジルポルトガル語では、最もよく使われる否定粒子は直であり、名詞や動詞をカバーできる。
転写データからNEG1,NEG2,NEG3を自動同定するnegativasを開発した。
このツールは3,338個の Nao インスタンスを特定し、2,085個を NEG1, NEG2, NEG3 に分類し、93%の成功率を達成した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Negation is a universal feature of natural languages. In Brazilian Portuguese, the most commonly used negation particle is n\~ao, which can scope over nouns or verbs. When it scopes over a verb, n\~ao can occur in three positions: pre-verbal (NEG1), double negation (NEG2), or post-verbal (NEG3), e.g., n\~ao gosto, n\~ao gosto n\~ao, gosto n\~ao ("I do not like it"). From a variationist perspective, these structures are different forms of expressing negation. Pragmatically, they serve distinct communicative functions, such as politeness and modal evaluation. Despite their grammatical acceptability, these forms differ in frequency. NEG1 dominates across Brazilian regions, while NEG2 and NEG3 appear more rarely, suggesting its use is contextually restricted. This low-frequency challenges research, often resulting in subjective, non-generalizable interpretations of verbal negation with n\~ao. To address this, we developed negativas, a tool for automatically identifying NEG1, NEG2, and NEG3 in transcribed data. The tool's development involved four stages: i) analyzing a dataset of 22 interviews from the Falares Sergipanos database, annotated by three linguists, ii) creating a code using natural language processing (NLP) techniques, iii) running the tool, iv) evaluating accuracy. Inter-annotator consistency, measured using Fleiss' Kappa, was moderate (0.57). The tool identified 3,338 instances of n\~ao, classifying 2,085 as NEG1, NEG2, or NEG3, achieving a 93% success rate. However, negativas has limitations. NEG1 accounted for 91.5% of identified structures, while NEG2 and NEG3 represented 7.2% and 1.2%, respectively. The tool struggled with NEG2, sometimes misclassifying instances as overlapping structures (NEG1/NEG2/NEG3).
- Abstract(参考訳): 否定は自然言語の普遍的な特徴である。
ブラジルポルトガル語では、最もよく使われる否定粒子はn\~aoであり、名詞や動詞をカバーできる。
動詞を包含すると、n\~aoは前動詞(NEG1)、二重否定(NEG2)、または後動詞(NEG3)、e g , n\~ao gosto, n\~ao gosto n\~ao、gosto n\~aoの3つの位置に現れる。
変分主義の観点から、これらの構造は否定を表現する異なる形態である。
実用的には、それらは丁寧さやモーダル評価など、異なるコミュニケーション機能に機能する。
文法的受容性にもかかわらず、これらの形式は周波数によって異なる。
NEG1はブラジル全域を支配し、NEG2とNEG3はより稀に出現し、その使用は文脈的に制限されていることを示唆している。
この低周波課題の研究は、しばしば主観的で一般化不可能なn~aoによる言語否定の解釈をもたらす。
そこで我々は,NEG1,NEG2,NEG3を転写データから自動的に識別するnegativasを開発した。
ツールの開発には4つの段階があった。
一 ファラレス・セルギパノスデータベースから22件の面接のデータセットを分析し、3人の言語学者が注釈を付けたもの
二 自然言語処理(NLP)技術を用いてコードを作成すること。
三 ツールを走らせること。
iv) 精度を評価すること。
Fleiss' Kappa を用いて測定したアノテータ間の一貫性は中等度 (0.57。
このツールは、n\~aoの3,338のインスタンスを特定し、2,085をNEG1、NEG2、NEG3に分類し、93%の成功率を達成した。
しかし、ネガティヴァには限界がある。
NEG1は91.5%、NEG2は7.2%、NEG3は1.2%である。
このツールはNEG2と競合し、時には重複構造(NEG1/NEG2/NEG3)としてインスタンスを誤って分類する。
関連論文リスト
- Vision-Language Models Do Not Understand Negation [50.27667000027403]
NegBenchは、イメージ、ビデオ、医療データセットにまたがる18のタスクのバリエーションと79kのサンプルに対する否定的理解を評価するために設計されたベンチマークである。
提案手法は, 否定的クエリに対するリコールが10%増加し, 否定的キャプションによる複数質問に対する精度が40%向上することを示す。
論文 参考訳(メタデータ) (2025-01-16T09:55:42Z) - Generating Diverse Negations from Affirmative Sentences [0.999726509256195]
否定は、動詞句、節、その他の表現において負の極性を符号化する現実世界の応用において重要である。
多様な否定型を生成することにより,否定データセットの欠如に対処する手法であるNegVerseを提案する。
我々は,構文構造に基づいて,否定が最も起こりやすい文の一部をマスキングするための新しい規則を提案する。
また, 否定の手がかりを同定し, 退化例を除去し, 多様な有意義な摂動を生じさせるフィルタリング機構を提案する。
論文 参考訳(メタデータ) (2024-10-30T21:25:02Z) - The Devil is in the Neurons: Interpreting and Mitigating Social Biases in Pre-trained Language Models [78.69526166193236]
プレトレーニング言語モデル(PLM)は、社会的バイアスのような有害な情報を含むことが認識されている。
我々は,社会バイアスなどの望ましくない行動に起因する言語モデルにおいて,正確に単位(すなわちニューロン)を特定するために,sc Social Bias Neuronsを提案する。
StereoSetの以前の測定値からわかるように、我々のモデルは、低コストで言語モデリング能力を維持しながら、より高い公平性を達成する。
論文 参考訳(メタデータ) (2024-06-14T15:41:06Z) - Paraphrasing in Affirmative Terms Improves Negation Understanding [9.818585902859363]
否定は共通の言語現象である。
本研究では,否定を伴う推論を必要とする大規模コーパスであるCondaQAの改良と5つの自然言語理解タスクを示す。
論文 参考訳(メタデータ) (2024-06-11T17:30:03Z) - A negation detection assessment of GPTs: analysis with the xNot360
dataset [9.165119034384027]
否定は自然言語の基本的側面であり、コミュニケーションと理解において重要な役割を果たす。
我々は,xNot360データセットに適用したゼロショット予測手法を用いて,自然言語における否定の識別に焦点を当てた。
GPT-4はGPT-3.5を上回り,GPT-3.5は顕著な性能低下を示した。
論文 参考訳(メタデータ) (2023-06-29T02:27:48Z) - We're Afraid Language Models Aren't Modeling Ambiguity [136.8068419824318]
あいまいさの管理は人間の言語理解の重要な部分です。
文中のあいまいさは,他の文との係り受け関係に与える影響によって特徴付けられる。
我々は,多ラベルNLIモデルが曖昧さによって誤解を招く野生の政治的主張にフラグを付けることができることを示す。
論文 参考訳(メタデータ) (2023-04-27T17:57:58Z) - CLSE: Corpus of Linguistically Significant Entities [58.29901964387952]
専門家が注釈を付けた言語学的に重要なエンティティ(CLSE)のコーパスをリリースする。
CLSEは74種類のセマンティックタイプをカバーし、航空券売機からビデオゲームまで様々なアプリケーションをサポートする。
言語的に代表されるNLG評価ベンチマークを,フランス語,マラティー語,ロシア語の3言語で作成する。
論文 参考訳(メタデータ) (2022-11-04T12:56:12Z) - CONDAQA: A Contrastive Reading Comprehension Dataset for Reasoning about
Negation [21.56001677478673]
本稿では,段落における否定文の意味に関する推論を必要とする,最初の英語読解データセットを提案する。
CONDAQAは1,182組の質問応答ペアと200以上のユニークな否定的手がかりを備える。
CONDAQAの最高のパフォーマンスモデル(UnifiedQA-v2-3b)は、我々の一貫性基準で42%しか達成できません。
論文 参考訳(メタデータ) (2022-11-01T06:10:26Z) - Not another Negation Benchmark: The NaN-NLI Test Suite for Sub-clausal
Negation [59.307534363825816]
否定は現在の言語モデルでは不十分だが、この問題の範囲は広く理解されていない。
自然言語推論(NLI)テストスイートを導入し,NLP手法の能力を検証した。
論文 参考訳(メタデータ) (2022-10-06T23:39:01Z) - A Question-Answer Driven Approach to Reveal Affirmative Interpretations
from Verbal Negations [6.029488932793797]
我々は4,472人の口頭弁論者からなる新しいコーパスを作成し、67.1%が実際に出来事が起こったことを伝えていることを発見した。
アノテーションは、肯定的な解釈を伝える3001の否定に対して7,277の質問を生成し、答える。
論文 参考訳(メタデータ) (2022-05-23T17:08:30Z) - Understanding by Understanding Not: Modeling Negation in Language Models [81.21351681735973]
否定は自然言語の中核構造である。
本稿では,否定された総称文に基づく不一致目的を用いて,言語モデリング目標の強化を提案する。
否定されたLAMAデータセットの平均top1エラー率を4%に削減します。
論文 参考訳(メタデータ) (2021-05-07T21:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。