論文の概要: Pegasus@Dravidian-CodeMix-HASOC2021: Analyzing Social Media Content for
Detection of Offensive Text
- arxiv url: http://arxiv.org/abs/2111.09836v1
- Date: Thu, 18 Nov 2021 18:03:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-19 14:40:01.761321
- Title: Pegasus@Dravidian-CodeMix-HASOC2021: Analyzing Social Media Content for
Detection of Offensive Text
- Title(参考訳): Pegasus@Dravidian-CodeMix-HASOC2021: 攻撃テキスト検出のためのソーシャルメディアコンテンツの解析
- Authors: Pawan Kalyan Jada, Konthala Yasaswini, Karthik Puranik, Anbukkarasi
Sampath, Sathiyaraj Thangasamy, Kingston Pal Thamburaj
- Abstract要約: ソーシャルメディアプラットフォーム上の攻撃的なコメントや投稿は、個人、グループ、あるいは未成年者にも影響を及ぼす可能性がある。
HASOC - DravidianCodeMix FIRE 2021共有タスクの一部として、TamilとMarayalamという2つの人気のあるDravidian言語でコメントやポストを分類するために、Transformerベースのプロトタイプを2つ採用しています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To tackle the conundrum of detecting offensive comments/posts which are
considerably informal, unstructured, miswritten and code-mixed, we introduce
two inventive methods in this research paper. Offensive comments/posts on the
social media platforms, can affect an individual, a group or underage alike. In
order to classify comments/posts in two popular Dravidian languages, Tamil and
Malayalam, as a part of the HASOC - DravidianCodeMix FIRE 2021 shared task, we
employ two Transformer-based prototypes which successfully stood in the top 8
for all the tasks. The codes for our approach can be viewed and utilized.
- Abstract(参考訳): 本研究は,非構造的,非構造的,誤記述的,コード混合的,不快なコメント・ポストを検知するための2つの手法を提案する。
ソーシャルメディアプラットフォーム上の不快なコメントや投稿は、個人やグループ、未成年者にも影響を与えうる。
タミル語とマラヤラム語という2つの人気言語でコメント/ポストを分類するために、hasoc - dravidiancodemix fire 2021共有タスクの一部として、2つのトランスフォーマーベースのプロトタイプを使用して、すべてのタスクでトップ8に立った。
私たちのアプローチのコードは閲覧して利用できます。
関連論文リスト
- SADAS: A Dialogue Assistant System Towards Remediating Norm Violations
in Bilingual Socio-Cultural Conversations [56.31816995795216]
SADAS(Socially-Aware Dialogue Assistant System)は、会話が敬意と理解で広がることを保証するためのシステムである。
本システムの新しいアーキテクチャは,(1)対話に存在する規範のカテゴリを特定すること,(2)潜在的な規範違反を検出すること,(3)違反の深刻さを評価すること,(4)違反の是正を目的とした対策を実施すること,を含む。
論文 参考訳(メタデータ) (2024-01-29T08:54:21Z) - BOOST: Harnessing Black-Box Control to Boost Commonsense in LMs'
Generation [60.77990074569754]
本稿では,凍結した事前学習言語モデルを,より汎用的な生成に向けて操る,計算効率のよいフレームワークを提案する。
具体的には、まず、文に常識的スコアを割り当てる参照なし評価器を構築する。
次に、スコアラをコモンセンス知識のオラクルとして使用し、NADOと呼ばれる制御可能な生成法を拡張して補助ヘッドを訓練する。
論文 参考訳(メタデータ) (2023-10-25T23:32:12Z) - Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z) - Verifying the Robustness of Automatic Credibility Assessment [50.55687778699995]
入力テキストにおける意味保存的変化がモデルを誤解させる可能性があることを示す。
また、誤情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAについても紹介する。
我々の実験結果によると、現代の大規模言語モデルは、以前のより小さなソリューションよりも攻撃に対して脆弱であることが多い。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - Transformer-based Model for Word Level Language Identification in
Code-mixed Kannada-English Texts [55.41644538483948]
コードミキシングしたカンナダ英語テキストにおける単語レベル言語識別のためのトランスフォーマーベースモデルを提案する。
The proposed model on the CoLI-Kenglish dataset achieves a weighted F1-score of 0.84 and a macro F1-score of 0.61。
論文 参考訳(メタデータ) (2022-11-26T02:39:19Z) - Findings of the Shared Task on Offensive Span Identification from
Code-Mixed Tamil-English Comments [2.8341970739919433]
タミル語でコード入りのソーシャルコメントと攻撃的なコメントを提供する。
本稿では,提案システムから得られたデータセット,メソッド,結果について概説する。
論文 参考訳(メタデータ) (2022-05-12T14:31:57Z) - Toxicity Detection for Indic Multilingual Social Media Content [0.0]
本稿では、emphIIIT-D Abusive Comment Identification Challengeにおいて、ShareChat/Mojが提供するデータを用いて、チーム「Moj Masti」によって提案されたシステムについて述べる。
我々は、多言語トランスフォーマーに基づく事前訓練および微調整モデルを用いて、コード混在/コード切替型分類タスクにアプローチする方法に焦点をあてる。
論文 参考訳(メタデータ) (2022-01-03T12:01:47Z) - IIITT@Dravidian-CodeMix-FIRE2021: Transliterate or translate? Sentiment
analysis of code-mixed text in Dravidian languages [0.0]
本研究は,カナダ語,タミル語,マラヤラム語において,コードミキシングによるソーシャルメディアコメントの感情分析という形で,この研究に小さな貢献をしている。
FIRE 2021でDravidian-CodeMix氏が行った共有タスクの作業について説明している。
結果は,タミル,カナダ,マラヤラムの各タスクにおいて,最良モデルが4位,第5位,第10位であった研究論文に記録されている。
論文 参考訳(メタデータ) (2021-11-15T16:57:59Z) - CMSAOne@Dravidian-CodeMix-FIRE2020: A Meta Embedding and Transformer
model for Code-Mixed Sentiment Analysis on Social Media Text [9.23545668304066]
コードミックス(CM)は、発話や文で複数の言語を使用する頻繁に観察される現象です。
感性分析(SA)はNLPの基本的なステップであり、モノリンガルテキストでよく研究されている。
本稿では,dravidian code-mixedデータセット上での感情分析のためのトランスフォーマによるメタ埋め込みを提案する。
論文 参考訳(メタデータ) (2021-01-22T08:48:27Z) - CUSATNLP@HASOC-Dravidian-CodeMix-FIRE2020:Identifying Offensive Language
from ManglishTweets [0.0]
本稿では,HASOC 攻撃言語識別-DravidianCodeMix のサブトラックである Task2 に提案する作業モデルを提案する。
これはメッセージレベルの分類タスクです。
埋め込みモデルに基づく分類器は、我々のアプローチにおける攻撃的コメントではなく攻撃的コメントを識別する。
論文 参考訳(メタデータ) (2020-10-17T10:11:41Z) - Deep Just-In-Time Inconsistency Detection Between Comments and Source
Code [51.00904399653609]
本稿では,コード本体の変更によりコメントが矛盾するかどうかを検出することを目的とする。
私たちは、コメントとコードの変更を関連付けるディープラーニングアプローチを開発しています。
より包括的な自動コメント更新システムを構築するために,コメント更新モデルと組み合わせて提案手法の有用性を示す。
論文 参考訳(メタデータ) (2020-10-04T16:49:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。