論文の概要: Adapting Coreference Resolution for Processing Violent Death Narratives
- arxiv url: http://arxiv.org/abs/2104.14703v1
- Date: Fri, 30 Apr 2021 00:16:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-04 02:12:59.954128
- Title: Adapting Coreference Resolution for Processing Violent Death Narratives
- Title(参考訳): 暴力的な死の物語を処理するためのコリファレンスレゾリューションの適用
- Authors: Ankith Uppunda, Susan D. Cochran, Jacob G. Foster, Alina
Arseniev-Koehler, Vickie M. Mays, Kai-Wei Chang
- Abstract要約: 我々は,英語で書かれた行政文書の模範として,相互参照解決の課題を分析した。
確率的データプログラミングフレームワークを用いて,モデル性能を向上させるためのデータ拡張規則を開発した。
- 参考スコア(独自算出の注目度): 24.273188150386254
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Coreference resolution is an important component in analyzing narrative text
from administrative data (e.g., clinical or police sources). However, existing
coreference models trained on general language corpora suffer from poor
transferability due to domain gaps, especially when they are applied to
gender-inclusive data with lesbian, gay, bisexual, and transgender (LGBT)
individuals. In this paper, we analyzed the challenges of coreference
resolution in an exemplary form of administrative text written in English:
violent death narratives from the USA's Centers for Disease Control's (CDC)
National Violent Death Reporting System. We developed a set of data
augmentation rules to improve model performance using a probabilistic data
programming framework. Experiments on narratives from an administrative
database, as well as existing gender-inclusive coreference datasets,
demonstrate the effectiveness of data augmentation in training coreference
models that can better handle text data about LGBT individuals.
- Abstract(参考訳): コリファレンスレゾリューションは、行政データ(例えば、臨床や警察の情報源)からナラティブテキストを分析する上で重要な要素である。
しかし、一般言語コーポラで訓練された既存のコリファレンスモデルは、特にレズビアン、ゲイ、バイセクシュアル、トランスジェンダー(lgbt)の個人による性差データに適用された場合、ドメイン間ギャップによる転送性に乏しい。
本稿では,米国疾病予防管理センター(CDC)全国暴力死亡報告システム(CDC)の暴力的死亡談話を英語で記述した例の行政文書におけるコアスペクション解決の課題について分析した。
確率的データプログラミングフレームワークを用いて,モデル性能を向上させるためのデータ拡張規則を開発した。
行政データベースからのナラティブに関する実験や、既存のジェンダー排他的コリファレンスデータセットは、lgbt個人に関するテキストデータをよりうまく処理できるコリファレンスモデルのトレーニングにおけるデータ拡張の有効性を示しています。
関連論文リスト
- The Gender-GAP Pipeline: A Gender-Aware Polyglot Pipeline for Gender
Characterisation in 55 Languages [51.2321117760104]
本稿では,55言語を対象とした大規模データセットにおけるジェンダー表現を特徴付ける自動パイプラインであるGender-GAP Pipelineについて述べる。
このパイプラインは、性別付き人称名詞の多言語語彙を用いて、テキスト中の性別表現を定量化する。
本稿では、WMTのトレーニングデータとNewsタスクの開発データにジェンダー表現を報告し、現在のデータが男性表現にスキューされていることを確認する。
論文 参考訳(メタデータ) (2023-08-31T17:20:50Z) - Target-Agnostic Gender-Aware Contrastive Learning for Mitigating Bias in
Multilingual Machine Translation [28.471506840241602]
ジェンダーバイアスは機械翻訳において重要な問題であり、バイアス軽減技術の研究が進行中である。
本稿では,新しいアプローチに基づくバイアス緩和手法を提案する。
Gender-Aware Contrastive Learning, GACLは、文脈性情報を非明示性単語の表現にエンコードする。
論文 参考訳(メタデータ) (2023-05-23T12:53:39Z) - Counter-GAP: Counterfactual Bias Evaluation through Gendered Ambiguous
Pronouns [53.62845317039185]
バイアス測定データセットは、言語モデルのバイアスされた振る舞いを検出する上で重要な役割を果たす。
本稿では, 多様な, 自然な, 最小限のテキストペアを, 対物生成によって収集する新しい手法を提案する。
事前学習された4つの言語モデルは、各グループ内よりも、異なる性別グループ間でかなり不整合であることを示す。
論文 参考訳(メタデータ) (2023-02-11T12:11:03Z) - INCLUSIFY: A benchmark and a model for gender-inclusive German [0.0]
ジェンダーインクルージョン言語はジェンダーインフレクションを持つ言語においてジェンダー平等を達成するために重要である。
ジェンダーを包含する言語の使用を支援するために、いくつかのツールが開発されている。
ベンチマークのためのデータセットと尺度を示し、これらのタスクを実装するモデルを示す。
論文 参考訳(メタデータ) (2022-12-05T19:37:48Z) - Easy Adaptation to Mitigate Gender Bias in Multilingual Text
Classification [8.137681060429527]
ジェンダーをドメインとして扱い、標準領域適応モデルを示し、ジェンダーバイアスを低減する。
ヘイトスピーチ検出とレーティング予測という2つのテキスト分類タスクに対するアプローチを評価し,提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2022-04-12T01:15:36Z) - Collecting a Large-Scale Gender Bias Dataset for Coreference Resolution
and Machine Translation [10.542861450223128]
3つのドメインのコーパスにおいて,ステレオタイプおよび非ステレオタイプなジェンダーロール代入を示す文法パターンが発見された。
我々は、コーパスの品質を手動で検証し、様々なコア参照解像度と機械翻訳モデルにおける性別バイアスを評価する。
論文 参考訳(メタデータ) (2021-09-08T18:14:11Z) - On the Language Coverage Bias for Neural Machine Translation [81.81456880770762]
言語カバレッジバイアスは、ニューラルネットワーク翻訳(NMT)において重要である。
実験を慎重に設計することにより、トレーニングデータにおける言語カバレッジバイアスの包括的分析を行う。
本稿では,言語カバレッジバイアス問題を軽減するための,シンプルで効果的な2つのアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-07T01:55:34Z) - They, Them, Theirs: Rewriting with Gender-Neutral English [56.14842450974887]
私たちは、英語でジェンダーインクルージョンを促進する一般的な方法である特異点についてケーススタディを行います。
本研究では, 人為的データを持たない1%の単語誤り率で, ジェンダーニュートラルな英語を学習できるモデルについて述べる。
論文 参考訳(メタデータ) (2021-02-12T21:47:48Z) - Mitigating Gender Bias in Captioning Systems [56.25457065032423]
ほとんどのキャプションモデルは性別バイアスを学習し、特に女性にとって高い性別予測エラーにつながる。
本稿では, 視覚的注意を自己指導し, 正しい性的な視覚的証拠を捉えるためのガイド付き注意画像キャプチャーモデル(GAIC)を提案する。
論文 参考訳(メタデータ) (2020-06-15T12:16:19Z) - Multi-Dimensional Gender Bias Classification [67.65551687580552]
機械学習モデルは、性別に偏ったテキストでトレーニングする際に、社会的に望ましくないパターンを不注意に学習することができる。
本稿では,テキスト中の性バイアスを複数の実用的・意味的な次元に沿って分解する一般的な枠組みを提案する。
このきめ細かいフレームワークを用いて、8つの大規模データセットにジェンダー情報を自動的にアノテートする。
論文 参考訳(メタデータ) (2020-05-01T21:23:20Z) - Demographics Should Not Be the Reason of Toxicity: Mitigating
Discrimination in Text Classifications with Instance Weighting [36.87473475196733]
テキスト分類データセットにおける意図しないバイアスを,非識別分布から識別分布への選択バイアスの一種として定式化する。
本手法は, モデル一般化能力を著しく損なうことなく, 意図しないバイアスの影響を効果的に緩和することができる。
論文 参考訳(メタデータ) (2020-04-29T11:22:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。