論文の概要: System Demo: Tool and Infrastructure for Offensive Language Error
Analysis (OLEA) in English
- arxiv url: http://arxiv.org/abs/2210.16398v1
- Date: Fri, 28 Oct 2022 20:38:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 15:02:19.610214
- Title: System Demo: Tool and Infrastructure for Offensive Language Error
Analysis (OLEA) in English
- Title(参考訳): システムデモ:英語の攻撃的言語エラー分析(OLEA)のためのツールと基盤
- Authors: Marie Grace, Xajavion "Jay" Seabrum, Dananjay Srinivas, Alexis Palmer
- Abstract要約: OLEAはオープンソースのPythonライブラリで、英語で攻撃的な言語を検出するコンテキストにおいて、エラー分析のための使いやすいツールを提供する。
OLEAはまた、新しいデータセットを再配布するためのインフラストラクチャも提供する。
- 参考スコア(独自算出の注目度): 1.7205106391379026
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The automatic detection of offensive language is a pressing societal need.
Many systems perform well on explicit offensive language but struggle to detect
more complex, nuanced, or implicit cases of offensive and hateful language.
OLEA is an open-source Python library that provides easy-to-use tools for error
analysis in the context of detecting offensive language in English. OLEA also
provides an infrastructure for re-distribution of new datasets and analysis
methods requiring very little coding.
- Abstract(参考訳): 攻撃的言語の自動検出は社会的ニーズを圧迫する。
多くのシステムは、明示的な攻撃的言語でうまく機能するが、より複雑、ニュアンス的、暗黙的な攻撃的、憎悪的な言語の事例を検出するのに苦労する。
OLEAはオープンソースのPythonライブラリで、英語で攻撃的な言語を検出するコンテキストにおいて、エラー分析のための使いやすいツールを提供する。
oleaは、新しいデータセットと分析メソッドを再配布するためのインフラも提供しています。
関連論文リスト
- A comprehensive cross-language framework for harmful content detection
with the aid of sentiment analysis [0.356008609689971]
この研究は、初めて、どんな言語にも適応可能な詳細なフレームワークを紹介します。
フレームワークの重要なコンポーネントは、汎用的で詳細なアノテーションガイドラインの開発である。
感情分析の統合は、有害な言語検出を強化する新しいアプローチである。
論文 参考訳(メタデータ) (2024-03-02T17:13:47Z) - DIALIGHT: Lightweight Multilingual Development and Evaluation of
Task-Oriented Dialogue Systems with Large Language Models [76.79929883963275]
DIALIGHTは多言語タスク指向対話(ToD)システムの開発と評価のためのツールキットである。
ローカル発話レベルとグローバル対話レベルの両方において、人間のきめ細かい評価のためのセキュアでユーザフレンドリーなWebインターフェースを備えている。
評価の結果, PLMの微調整により精度とコヒーレンスが向上する一方, LLMベースのシステムは多様で類似した応答を生成するのに優れていた。
論文 参考訳(メタデータ) (2024-01-04T11:27:48Z) - How to Solve Few-Shot Abusive Content Detection Using the Data We
Actually Have [83.93896701392238]
この作業では、すでに持っているデータセットを活用し、虐待的な言語検出に関連する幅広いタスクをカバーしています。
まず、マルチタスク方式でモデルをトレーニングし、ターゲット要件に数発の適応を実行する。
我々の実験は、既存のデータセットとターゲットタスクのほんの数ショットだけを活用することで、モデルの性能をモノリンガルだけでなく言語間でも改善できることを示した。
論文 参考訳(メタデータ) (2023-05-23T14:04:12Z) - Cross-Platform and Cross-Domain Abusive Language Detection with
Supervised Contrastive Learning [14.93845721221461]
我々は、教師付きコントラスト学習統合メタラーニングアルゴリズムであるSCL-Fishを設計し、目に見えないプラットフォーム上で乱用言語を検出する。
実験により,SCL-FishはEMMや既存の最先端モデルよりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2022-11-11T19:22:36Z) - CLSE: Corpus of Linguistically Significant Entities [58.29901964387952]
専門家が注釈を付けた言語学的に重要なエンティティ(CLSE)のコーパスをリリースする。
CLSEは74種類のセマンティックタイプをカバーし、航空券売機からビデオゲームまで様々なアプリケーションをサポートする。
言語的に代表されるNLG評価ベンチマークを,フランス語,マラティー語,ロシア語の3言語で作成する。
論文 参考訳(メタデータ) (2022-11-04T12:56:12Z) - COLD: A Benchmark for Chinese Offensive Language Detection [54.60909500459201]
COLDatasetは、37kの注釈付き文を持つ中国の攻撃的言語データセットである。
また、人気のある中国語モデルの出力攻撃性を研究するために、textscCOLDetectorを提案する。
我々の資源と分析は、中国のオンラインコミュニティを解毒し、生成言語モデルの安全性を評価することを目的としている。
論文 参考訳(メタデータ) (2022-01-16T11:47:23Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - A Self-Supervised Automatic Post-Editing Data Generation Tool [1.060224791367122]
我々は、ウェブアプリケーションとしてデプロイ可能で、人間の監督を最小限に抑え、パーソナライズされたAPEデータを構築するセルフ教師付きデータ生成ツールを開発した。
データ中心の APE 研究は,このツールを用いて行うことができる。
論文 参考訳(メタデータ) (2021-11-24T05:56:36Z) - Kungfupanda at SemEval-2020 Task 12: BERT-Based Multi-Task Learning for
Offensive Language Detection [55.445023584632175]
我々は,マルチタスク学習とBERTモデルを組み合わせた攻撃的言語検出システムを構築した。
我々のモデルは、英語のサブタスクAで91.51%のF1スコアを獲得し、これは第1位に匹敵する。
論文 参考訳(メタデータ) (2020-04-28T11:27:24Z) - Offensive Language Identification in Greek [17.38318315623124]
本稿では,攻撃的言語識別のためのギリシャ初の注釈付きデータセットであるOGTDについて述べる。
OGTDは、Twitterから4,779件の投稿が攻撃的であり、攻撃的ではないという手動の注釈付きデータセットである。
データセットの詳細な説明とともに、このデータに基づいてトレーニングおよびテストされたいくつかの計算モデルを評価する。
論文 参考訳(メタデータ) (2020-03-16T22:47:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。