Fugu-MT 論文翻訳(概要): Detecting Toxic Language: Ontology and BERT-based Approaches for Bulgarian Text

論文の概要: Detecting Toxic Language: Ontology and BERT-based Approaches for Bulgarian Text

arxiv url: http://arxiv.org/abs/2604.01745v1
Date: Thu, 02 Apr 2026 08:06:26 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-03 14:21:10.604275
Title: Detecting Toxic Language: Ontology and BERT-based Approaches for Bulgarian Text
Title（参考訳）: 有害言語の検出:ブルガリア語テキストのオントロジーとBERTに基づくアプローチ
Authors: Melania Berbatova, Tsvetoslav Vasev,
Abstract要約: 本稿では,本質的な情報へのアクセスを保ちながら,ブルガリア語のテキスト中の毒性を識別するための,よりニュアンスなアプローチを提案する。開発した手法は多種多様なオンラインプラットフォームやコンテンツモデレーションシステムにまたがるpo-tentialアプリケーションを有する。ブルガリアのオンラインフォーラムから, 有害言語, 医療用語, 非毒性ランゲージ, マイノリティ・コミュニティに関する4つのカテゴリの4,384文を手作業で分析したデータセットを構成する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Toxic content detection in online communication remains a significant challenge, with current solutions often inadvertently blocking valuable information, including medical terms and text related to minority groups. This paper presents a more nu-anced approach to identifying toxicity in Bulgarian text while preserving access to essential information. The research explores two distinct methodologies for detecting toxic content. The developed methodologies have po-tential applications across diverse online platforms and content moderation systems. First, we propose an ontology that models the potentially toxic words in Bulgarian language. Then, we compose a dataset that comprises 4,384 manually anno-tated sentences from Bulgarian online forums across four categories: toxic language, medical terminology, non-toxic lan-guage, and terms related to minority communities. We then train a BERT-based model for toxic language classification, which reaches a 0.89 F1 macro score. The trained model is directly applicable in a real environment and can be integrated as a com-ponent of toxic content detection systems.
Abstract（参考訳）: オンラインコミュニケーションにおける有害なコンテンツ検出は依然として重要な課題であり、現在のソリューションは、しばしば、少数派グループに関連する医療用語やテキストを含む、故意に貴重な情報をブロックする。本稿では,本質的な情報へのアクセスを保ちながら,ブルガリア語のテキスト中の毒性を識別するための,よりニュアンスなアプローチを提案する。この研究は、有毒物質を検出するための2つの異なる方法を探究する。開発した手法は多種多様なオンラインプラットフォームやコンテンツモデレーションシステムにまたがるpo-tentialアプリケーションを有する。まず,ブルガリア語の潜在的有害語をモデル化するオントロジーを提案する。次に, ブルガリアのオンラインフォーラムから, 有害言語, 医療用語, 非毒性ランゲージ, マイノリティコミュニティに関する4つのカテゴリの4,384文を手作業で分析したデータセットを構成する。次に、有害言語分類のためのBERTベースのモデルをトレーニングし、0.89 F1マクロスコアに達した。トレーニングされたモデルは、実環境に直接適用でき、有害なコンテンツ検出システムのコンプタントとして統合することができる。

関連論文リスト

Rethinking Toxicity Evaluation in Large Language Models: A Multi-Label Perspective [104.09817371557476]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて印象的な結果を得た。有害なコンテンツを生み出す可能性には、深刻な安全上の懸念が浮かび上がっている。毒性検出のための3つの新しいマルチラベルベンチマークを導入する。
論文参考訳（メタデータ） (2025-10-16T06:50:33Z)
Exploring Multimodal Challenges in Toxic Chinese Detection: Taxonomy, Benchmark, and Findings [48.841514684592426]
我々は、有害な中国語検出に言語モデルをデプロイする上で重要な課題として、中国語のマルチモーダル性を強調した。まず,3つの摂動戦略の分類法と,有毒な中国コンテンツに対する8つの具体的なアプローチを提案する。そして、この分類に基づいてデータセットをキュレートし、9つのSOTA LLM(米国と中国)をベンチマークして、乱れた有毒な漢文を検出できるかどうかを評価する。
論文参考訳（メタデータ） (2025-05-30T08:32:45Z)
PolygloToxicityPrompts: Multilingual Evaluation of Neural Toxic Degeneration in Large Language Models [27.996123856250065]
既存の毒性ベンチマークは圧倒的に英語に焦点を当てている。 PTP(PolygloToxicity Prompts)は、17言語にまたがる自然発生プロンプト425Kの大規模多言語毒性評価ベンチマークである。
論文参考訳（メタデータ） (2024-05-15T14:22:33Z)
Toxicity Detection with Generative Prompt-based Inference [3.9741109244650823]
言語モデル(LM)は、望ましくない内容を含むコーパスで訓練され、バイアスや毒性を示す能力を持つことは、長年にわたって知られていたリスクである。本研究では,ゼロショットプロンプトによる毒性検出の生成的変異について検討し,プロンプトエンジニアリングに関する総合的な試行を行った。
論文参考訳（メタデータ） (2022-05-24T22:44:43Z)
COLD: A Benchmark for Chinese Offensive Language Detection [54.60909500459201]
COLDatasetは、37kの注釈付き文を持つ中国の攻撃的言語データセットである。また、人気のある中国語モデルの出力攻撃性を研究するために、textscCOLDetectorを提案する。我々の資源と分析は、中国のオンラインコミュニティを解毒し、生成言語モデルの安全性を評価することを目的としている。
論文参考訳（メタデータ） (2022-01-16T11:47:23Z)
Mitigating Biases in Toxic Language Detection through Invariant Rationalization [70.36701068616367]
性別、人種、方言などの属性に対するバイアスは、毒性検出のためのほとんどのトレーニングデータセットに存在する。本稿では,論理生成器と予測器から構成されるゲーム理論フレームワークである不変合理化(InvRat)を用いて,特定の構文パターンの素早い相関を除外することを提案する。本手法は, 語彙属性と方言属性の両方において, 従来のデバイアス法よりも低い偽陽性率を示す。
論文参考訳（メタデータ） (2021-06-14T08:49:52Z)
Challenges in Automated Debiasing for Toxic Language Detection [81.04406231100323]
バイアスド・アソシエーションは、有害な言語を検出するための分類器の開発において課題となっている。我々は最近,有害な言語検出に適用されたテキスト分類データセットとモデルに対するデバイアス法について検討した。我々の焦点は語彙(例えば、誓い言葉、スラー、アイデンティティの言及)と方言マーカー(特にアフリカ系アメリカ人の英語)である。
論文参考訳（メタデータ） (2021-01-29T22:03:17Z)
Toxic Language Detection in Social Media for Brazilian Portuguese: New Dataset and Multilingual Analysis [4.251937086394346]
最先端のBERTモデルでは,バイナリケースのモノリンガルデータを用いて76%のマクロF1スコアを達成できた。より正確なモデルを作成するためには,大規模なモノリンガルデータが依然として必要であることを示す。
論文参考訳（メタデータ） (2020-10-09T13:05:19Z)
RealToxicityPrompts: Evaluating Neural Toxic Degeneration in Language Models [93.151822563361]
事前訓練されたニューラルネットワークモデル(LM)は、安全なデプロイメントを妨げる人種差別的、性差別的、その他の有害な言語を生成する傾向にある。本研究では, 予め訓練したLMが有害な言語を生成できる範囲と, 有害な変性を防止するための制御可能なテキスト生成アルゴリズムの有効性について検討する。
論文参考訳（メタデータ） (2020-09-24T03:17:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。