論文の概要: AUTALIC: A Dataset for Anti-AUTistic Ableist Language In Context
- arxiv url: http://arxiv.org/abs/2410.16520v1
- Date: Mon, 21 Oct 2024 21:21:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-23 14:30:29.836910
- Title: AUTALIC: A Dataset for Anti-AUTistic Ableist Language In Context
- Title(参考訳): AUTALIC: 文脈における反自閉症のアブライスト言語のためのデータセット
- Authors: Naba Rizvi, Harper Strickland, Daniel Gitelman, Tristan Cooper, Alexis Morales-Flores, Michael Golden, Aekta Kallepalli, Akshat Alurkar, Haaset Owens, Saleha Ahmedi, Isha Khirwadkar, Imani Munyaka, Nedjma Ousidhoum,
- Abstract要約: AUTALICは、文脈における反音響的有能言語の検出に特化した最初のベンチマークデータセットである。
データセットはRedditから収集された2,400の自閉症関連文からなり、周囲の文脈を伴い、神経多様性の背景を持つ訓練された専門家によって注釈付けされている。
- 参考スコア(独自算出の注目度): 1.3334268990558924
- License:
- Abstract: As our understanding of autism and ableism continues to increase, so does our understanding of ableist language towards autistic people. Such language poses a significant challenge in NLP research due to its subtle and context-dependent nature. Yet, detecting anti-autistic ableist language remains underexplored, with existing NLP tools often failing to capture its nuanced expressions. We present AUTALIC, the first benchmark dataset dedicated to the detection of anti-autistic ableist language in context, addressing a significant gap in the field. The dataset comprises 2,400 autism-related sentences collected from Reddit, accompanied by surrounding context, and is annotated by trained experts with backgrounds in neurodiversity. Our comprehensive evaluation reveals that current language models, including state-of-the-art LLMs, struggle to reliably identify anti-autistic ableism and align with human judgments, underscoring their limitations in this domain. We publicly release AUTALIC along with the individual annotations which serve as a valuable resource to researchers working on ableism, neurodiversity, and also studying disagreements in annotation tasks. This dataset serves as a crucial step towards developing more inclusive and context-aware NLP systems that better reflect diverse perspectives.
- Abstract(参考訳): 自閉症や能力主義に対する理解が高まるにつれ、自閉症の人々に対する能力主義的言語に対する理解も高まっていく。
このような言語は、その微妙で文脈に依存した性質のため、NLP研究において重要な課題となっている。
しかし、既存のNLPツールは、そのニュアンスド表現をつかむのに失敗することが多い。
AUTALICは、文脈における反音響的有能言語の検出に特化した最初のベンチマークデータセットであり、この分野における大きなギャップに対処する。
データセットはRedditから収集された2,400の自閉症関連文からなり、周囲の文脈を伴い、神経多様性の背景を持つ訓練された専門家によって注釈付けされている。
我々の包括的評価は、現状のLLMを含む現在の言語モデルが、反音響的能力主義を確実に識別し、人間の判断と一致させることに苦慮し、この領域における彼らの限界を裏付けていることを示している。
我々は、アクティズム、神経多様性、およびアノテーションタスクにおける不一致を研究する研究者にとって貴重な資料となる個々のアノテーションとともに、AUTALICを公開している。
このデータセットは、多様な視点を反映したより包括的でコンテキスト対応のNLPシステムを開発するための重要なステップとなる。
関連論文リスト
- Negation Blindness in Large Language Models: Unveiling the NO Syndrome in Image Generation [63.064204206220936]
基礎的な大規模言語モデル(LLM)は、私たちが技術を理解する方法を変えました。
詩の執筆からコーディング、エッセイ生成、パズルの解決まで、様々な課題に長けていることが示されている。
画像生成機能の導入により、より包括的で汎用的なAIツールとなった。
現在特定されている欠陥には、幻覚、偏見、有害なコンテンツを生成するために制限されたコマンドをバイパスすることが含まれる。
論文 参考訳(メタデータ) (2024-08-27T14:40:16Z) - Exploiting ChatGPT for Diagnosing Autism-Associated Language Disorders and Identifying Distinct Features [13.006406004068117]
本研究では, 最先端の言語モデルであるChatGPTを用いて, 診断精度を高め, 自閉症を示す特定の言語特徴をプロファイリングする方法について検討した。
その結果、ChatGPTは従来の教師あり学習モデルよりも大幅に優れており、ゼロショット学習構成では精度とF1スコアの両方が13%以上向上していることがわかった。
我々の研究は、ChatGPTのような高度なAIツールを臨床環境に適用し、発達障害を評価し診断することを提唱している。
論文 参考訳(メタデータ) (2024-05-03T01:04:28Z) - A Survey on Lexical Ambiguity Detection and Word Sense Disambiguation [0.0]
本稿では自然言語処理(NLP)分野における言語におけるあいまいさの理解と解決に焦点を当てた手法について検討する。
ディープラーニング技術から、WordNetのような語彙的リソースや知識グラフの活用まで、さまざまなアプローチを概説している。
本研究は, 感覚アノテートコーパスの不足, 非公式な臨床テキストの複雑さなど, この分野における永続的な課題を明らかにした。
論文 参考訳(メタデータ) (2024-03-24T12:58:48Z) - Hear Me, See Me, Understand Me: Audio-Visual Autism Behavior Recognition [47.550391816383794]
本稿では,音声・視覚自閉症の行動認識の新たな課題について紹介する。
社会的行動認識は、AIによる自閉症スクリーニング研究において、これまで省略されてきた重要な側面である。
データセット、コード、事前トレーニングされたモデルをリリースします。
論文 参考訳(メタデータ) (2024-03-22T22:52:35Z) - Reliability Analysis of Psychological Concept Extraction and
Classification in User-penned Text [9.26840677406494]
私たちはLoSTデータセットを使って、Redditユーザーの投稿に低い自尊心があることを示唆するニュアンスのあるテキストキューをキャプチャします。
以上の結果から, PLM の焦点を Trigger と Consequences からより包括的な説明に移行する必要性が示唆された。
論文 参考訳(メタデータ) (2024-01-12T17:19:14Z) - We're Afraid Language Models Aren't Modeling Ambiguity [136.8068419824318]
あいまいさの管理は人間の言語理解の重要な部分です。
文中のあいまいさは,他の文との係り受け関係に与える影響によって特徴付けられる。
我々は,多ラベルNLIモデルが曖昧さによって誤解を招く野生の政治的主張にフラグを付けることができることを示す。
論文 参考訳(メタデータ) (2023-04-27T17:57:58Z) - Information-Restricted Neural Language Models Reveal Different Brain
Regions' Sensitivity to Semantics, Syntax and Context [87.31930367845125]
テキストコーパスを用いて語彙言語モデルGloveと超語彙言語モデルGPT-2を訓練した。
そして、これらの情報制限されたモデルが、自然主義的テキストを聴く人間のfMRI信号の時間軸を予測することができるかを評価した。
分析の結果、言語に関わるほとんどの脳領域は、構文変数と意味変数の両方に敏感であるが、これらの影響の相対的な大きさは、これらの領域で大きく異なることがわかった。
論文 参考訳(メタデータ) (2023-02-28T08:16:18Z) - Unpacking the Interdependent Systems of Discrimination: Ableist Bias in
NLP Systems through an Intersectional Lens [20.35460711907179]
大規模BERT言語モデルの単語予測に基づく各種解析について報告する。
統計的に有意な結果は、障害者が不利になる可能性があることを示している。
発見者はまた、相互に結びついた性別や人種のアイデンティティに関連する、重複する形の差別についても検討している。
論文 参考訳(メタデータ) (2021-10-01T16:40:58Z) - CogAlign: Learning to Align Textual Neural Representations to Cognitive
Language Processing Signals [60.921888445317705]
自然言語処理モデルに認知言語処理信号を統合するためのCogAlignアプローチを提案する。
我々は、CogAlignが、パブリックデータセット上の最先端モデルよりも、複数の認知機能で大幅な改善を実現していることを示す。
論文 参考訳(メタデータ) (2021-06-10T07:10:25Z) - AM2iCo: Evaluating Word Meaning in Context across Low-ResourceLanguages
with Adversarial Examples [51.048234591165155]
本稿では, AM2iCo, Adversarial and Multilingual Meaning in Contextを提案する。
言語間文脈における単語の意味の同一性を理解するために、最先端(SotA)表現モデルを忠実に評価することを目的としている。
その結果、現在のSotAプリトレーニングエンコーダは人間のパフォーマンスにかなり遅れていることが明らかとなった。
論文 参考訳(メタデータ) (2021-04-17T20:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。