論文の概要: O-Dang! The Ontology of Dangerous Speech Messages
- arxiv url: http://arxiv.org/abs/2207.10652v1
- Date: Wed, 13 Jul 2022 11:50:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-24 11:38:11.822790
- Title: O-Dang! The Ontology of Dangerous Speech Messages
- Title(参考訳): オダン!
危険な音声メッセージのオントロジー
- Authors: Marco A. Stranisci, Simona Frenda, Mirko Lai, Oscar Araque, Alessandra
T. Cignarella, Valerio Basile, Viviana Patti, Cristina Bosco
- Abstract要約: O-Dang!:The Ontology of Dangerous Speech Messages, a systematic and interoperable Knowledge Graph (KG)
O-Dang!は、Lingguistic Linked Open Dataコミュニティで共有されている原則に従って、イタリアのデータセットを構造化されたKGにまとめ、整理するように設計されている。
ゴールド・スタンダードとシングル・アノテータのラベルをKGにエンコードするモデルを提供する。
- 参考スコア(独自算出の注目度): 53.15616413153125
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Inside the NLP community there is a considerable amount of language resources
created, annotated and released every day with the aim of studying specific
linguistic phenomena. Despite a variety of attempts in order to organize such
resources has been carried on, a lack of systematic methods and of possible
interoperability between resources are still present. Furthermore, when storing
linguistic information, still nowadays, the most common practice is the concept
of "gold standard", which is in contrast with recent trends in NLP that aim at
stressing the importance of different subjectivities and points of view when
training machine learning and deep learning methods. In this paper we present
O-Dang!: The Ontology of Dangerous Speech Messages, a systematic and
interoperable Knowledge Graph (KG) for the collection of linguistic annotated
data. O-Dang! is designed to gather and organize Italian datasets into a
structured KG, according to the principles shared within the Linguistic Linked
Open Data community. The ontology has also been designed to account for a
perspectivist approach, since it provides a model for encoding both gold
standard and single-annotator labels in the KG. The paper is structured as
follows. In Section 1 the motivations of our work are outlined. Section 2
describes the O-Dang! Ontology, that provides a common semantic model for the
integration of datasets in the KG. The Ontology Population stage with
information about corpora, users, and annotations is presented in Section 3.
Finally, in Section 4 an analysis of offensiveness across corpora is provided
as a first case study for the resource.
- Abstract(参考訳): nlpコミュニティ内には、特定の言語現象を研究する目的で、毎日作成、注釈、リリースされる言語リソースがかなりの量存在する。
このような資源を組織化するために様々な試みが行われてきたが、体系的な方法の欠如と資源間の相互運用の可能性はまだ残っている。
さらに,現代においても,言語情報を保存する上で最も一般的な実践は「金の標準」の概念であり,機械学習や深層学習の訓練において,異なる主観性と視点の重要性を強調することを目的とした最近のNLPの傾向とは対照的である。
本稿では,O-Dang!
言語注釈データ収集のための系統的・相互運用可能な知識グラフ(kg)「危険な音声メッセージのオントロジー」について
o-dang!は、言語結合オープンデータコミュニティで共有されている原則に従って、イタリアのデータセットを構造化されたkgに収集し、整理するように設計されている。
オントロジーはまた、金の標準ラベルと単記法ラベルの両方をkgでエンコードするモデルを提供するため、パースペクティビストのアプローチを説明するために設計されている。
紙の構造は以下の通りである。
第1節では、仕事の動機について概説する。
第2節では『O-Dang!
Ontology – KGにデータセットを統合するための共通セマンティックモデルを提供する。
コーパス、ユーザ、アノテーションに関する情報を含むオントロジーの人口ステージは、セクション3で示されます。
最後に、第4節では、その資源に対する最初のケーススタディとして、コーパス間の攻撃性の分析が提供される。
関連論文リスト
- AgoraSpeech: A multi-annotated comprehensive dataset of political discourse through the lens of humans and AI [1.3060410279656598]
アゴラ・スペーチ(AgoraSpeech)は、ギリシャ国民選挙中の2023年の6つの政党による171の政治演説を精巧にキュレートした高品質なデータセットである。
このデータセットには、テキスト分類、トピック識別、感情分析、名前付きエンティティ認識、分極、ポピュリズム検出の6つの自然言語処理(NLP)タスクのためのアノテーション(1段落)が含まれている。
論文 参考訳(メタデータ) (2025-01-09T18:17:59Z) - Leveraging Ontologies to Document Bias in Data [1.0635248457021496]
Doc-BiasOは、textitfair-MLの文献とその尺度で定義されたバイアスの統合語彙の作成を目的としたリソースである。
私たちの主な目的は、AIのあらゆる領域に急速に拡大するにつれて、バイアス研究に関する既存の用語を明確にすることへの貢献です。
論文 参考訳(メタデータ) (2024-06-29T18:41:07Z) - EventGround: Narrative Reasoning by Grounding to Eventuality-centric Knowledge Graphs [41.928535719157054]
本研究では,事象中心の知識グラフに自由文を接地する問題に対処するため,EventGroundと呼ばれる初期包括的フレームワークを提案する。
これらの問題に対処するために、単純で効果的な解析と部分的な情報抽出方法を提案する。
基礎知識を取り入れた我々の枠組みは、解釈可能な証拠を提供しながら最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-03-30T01:16:37Z) - IXA/Cogcomp at SemEval-2023 Task 2: Context-enriched Multilingual Named
Entity Recognition using Knowledge Bases [53.054598423181844]
3つのステップからなる新しいNERカスケードアプローチを提案する。
我々は、細粒度および新興物質を正確に分類する上で、外部知識基盤の重要性を実証的に示す。
本システムは,低リソース言語設定においても,マルチコネラ2共有タスクにおいて頑健な性能を示す。
論文 参考訳(メタデータ) (2023-04-20T20:30:34Z) - Variational Cross-Graph Reasoning and Adaptive Structured Semantics
Learning for Compositional Temporal Grounding [143.5927158318524]
テンポラルグラウンドティング(Temporal grounding)とは、クエリ文に従って、未編集のビデオから特定のセグメントを特定するタスクである。
新たに構成時間グラウンドタスクを導入し,2つの新しいデータセット分割を構築した。
ビデオや言語に内在する構造的意味論は、構成的一般化を実現する上で重要な要素である、と我々は主張する。
論文 参考訳(メタデータ) (2023-01-22T08:02:23Z) - Knowledge Graph Augmented Network Towards Multiview Representation
Learning for Aspect-based Sentiment Analysis [96.53859361560505]
本稿では,知識グラフ拡張ネットワーク(KGAN)を提案する。
KGANは感情の特徴表現を、文脈、構文、知識に基づく複数の視点から捉えている。
3つの人気のあるABSAベンチマークの実験は、我々のKGANの有効性と堅牢性を示している。
論文 参考訳(メタデータ) (2022-01-13T08:25:53Z) - Knowledge Graph Based Synthetic Corpus Generation for Knowledge-Enhanced
Language Model Pre-training [22.534866015730664]
我々は全英Wikidata KGを言語化した。
Wikidataのような包括的で百科事典的なKGを言語化することで、構造化されたKGと自然言語コーパスを統合することができることを示す。
論文 参考訳(メタデータ) (2020-10-23T22:14:50Z) - Computational linguistic assessment of textbook and online learning
media by means of threshold concepts in business education [59.003956312175795]
言語学的観点では、しきい値の概念は特別な語彙の例であり、特定の言語的特徴を示す。
ビジネス教育における63のしきい値の概念のプロファイルは、教科書、新聞、ウィキペディアで調査されている。
3種類のリソースは、しきい値の概念のプロファイルから区別できる。
論文 参考訳(メタデータ) (2020-08-05T12:56:16Z) - Cross-lingual Entity Alignment with Incidental Supervision [76.66793175159192]
本稿では,多言語KGとテキストコーパスを共通埋め込み方式で共同で表現する,偶発的に教師付きモデルであるJEANSを提案する。
ベンチマークデータセットの実験では、JEANSがエンティティアライメントとインシデントインシデントインシデントインスペクションの改善を期待できる結果となった。
論文 参考訳(メタデータ) (2020-05-01T01:53:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。