論文の概要: KhabarChin: Automatic Detection of Important News in the Persian
Language
- arxiv url: http://arxiv.org/abs/2312.03361v1
- Date: Wed, 6 Dec 2023 09:01:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-07 15:33:48.829694
- Title: KhabarChin: Automatic Detection of Important News in the Persian
Language
- Title(参考訳): khabarchin:ペルシア語における重要なニュースの自動検出
- Authors: Hamed Hematian Hemati (1), Arash Lagzian (1), Moein Salimi Sartakhti
(1), Hamid Beigy (1), Ehsaneddin Asgari (2) ((1) AI Group, Computer
Engineering Department, Sharif University of Technology, (2) AI Innovation,
Data:Lab Munich, Volkswagen AG)
- Abstract要約: 本稿では,未調査領域における重要なニュースの検出について紹介し,ペルシャ語で重要なニュースを検出するための新しいベンチマークデータセット(Khabarchin)を提案する。
我々は、重要なニュース記事を、社会のかなりの部分において重要なものとみなし、その考え方や意思決定に影響を与えることができるものとして定義する。
本稿では,ニュース記事において重要な文検出の2番目の課題を紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Being aware of important news is crucial for staying informed and making
well-informed decisions efficiently. Natural Language Processing (NLP)
approaches can significantly automate this process. This paper introduces the
detection of important news, in a previously unexplored area, and presents a
new benchmarking dataset (Khabarchin) for detecting important news in the
Persian language. We define important news articles as those deemed significant
for a considerable portion of society, capable of influencing their mindset or
decision-making. The news articles are obtained from seven different prominent
Persian news agencies, resulting in the annotation of 7,869 samples and the
creation of the dataset. Two challenges of high disagreement and imbalance
between classes were faced, and solutions were provided for them. We also
propose several learning-based models, ranging from conventional machine
learning to state-of-the-art transformer models, to tackle this task.
Furthermore, we introduce the second task of important sentence detection in
news articles, as they often come with a significant contextual length that
makes it challenging for readers to identify important information. We identify
these sentences in a weakly supervised manner.
- Abstract(参考訳): 重要なニュースに気付くことは、情報を提供し、適切に調整された決定を効率的に行うために重要である。
自然言語処理(NLP)アプローチはこのプロセスを大幅に自動化することができる。
本稿では,未調査領域における重要なニュースの検出について紹介し,ペルシャ語の重要ニュースを検出するための新しいベンチマークデータセット(Khabarchin)を提案する。
我々は、重要なニュース記事を、社会のかなりの部分において重要なものとして定義し、その考え方や意思決定に影響を与えることができる。
ニュース記事は7つの著名なペルシャのニュース機関から入手され、7,869のサンプルの注釈とデータセットの作成に繋がる。
クラス間の不一致と不均衡の2つの課題に直面し、それらに対する解決策が提供された。
また,本課題に取り組むために,従来の機械学習から最先端トランスフォーマーモデルまで,いくつかの学習モデルを提案する。
さらに,ニュース記事における重要文検出の2つ目の課題について紹介する。
我々はこれらの文を弱教師付きで識別する。
関連論文リスト
- A Regularized LSTM Method for Detecting Fake News Articles [0.0]
本稿では,偽ニュース記事を検出するための高度な機械学習ソリューションを開発する。
我々は、23,502の偽ニュース記事と21,417の正確なニュース記事を含む、包括的なニュース記事のデータセットを活用している。
私たちの研究は、そのようなモデルを現実世界のアプリケーションにデプロイする可能性を強調しています。
論文 参考訳(メタデータ) (2024-11-16T05:54:36Z) - Adapting Fake News Detection to the Era of Large Language Models [48.5847914481222]
我々は,機械による(言い換えられた)リアルニュース,機械生成のフェイクニュース,人書きのフェイクニュース,人書きのリアルニュースの相互作用について検討する。
我々の実験では、人書き記事のみに特化して訓練された検知器が、機械が生成したフェイクニュースを検出できる興味深いパターンを明らかにしましたが、その逆ではありません。
論文 参考訳(メタデータ) (2023-11-02T08:39:45Z) - The effect of stemming and lemmatization on Portuguese fake news text
classification [0.0]
インターネット、スマートフォン、ソーシャルメディアの普及に伴い、情報は迅速かつ容易に拡散されている。
情報の流れが大きくなって、偽情報や偽ニュースを広めようとしている人もいる。
いくつかのテクニックは、テキストデータを扱うときに良い結果に達するのに役立ちます。
論文 参考訳(メタデータ) (2023-10-17T15:26:40Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Towards Detecting Harmful Agendas in News Articles [24.119378818050038]
誤情報や偽情報検出は研究されているが,新聞記事の有害な議題を検出するオープン・チャレンジへの投資は不足している。
この課題に対して,解釈可能なシステムがいかに有効かを示し,ブラックボックスモデルと相容れない性能を示す。
論文 参考訳(メタデータ) (2023-01-31T21:08:58Z) - Nothing Stands Alone: Relational Fake News Detection with Hypergraph
Neural Networks [49.29141811578359]
本稿では,ニュース間のグループ間相互作用を表現するためにハイパーグラフを活用することを提案する。
提案手法は,ラベル付きニュースデータの小さなサブセットであっても,優れた性能を示し,高い性能を維持する。
論文 参考訳(メタデータ) (2022-12-24T00:19:32Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - Advanced Machine Learning Techniques for Fake News (Online
Disinformation) Detection: A Systematic Mapping Study [1.7121012334286438]
本稿では,情報戦争におけるフェイクニュースの歴史的展望と役割について述べる。
専門家の業績にのみ基づいたソリューションが分析される。
この研究の主な目的は、偽ニュースの検出における知識の現状を分析することである。
論文 参考訳(メタデータ) (2020-12-28T13:07:42Z) - A Deep Learning Approach for Automatic Detection of Fake News [47.00462375817434]
複数のドメインのオンラインニュースコンテンツにおいて、偽ニュース検出問題を解決するためのディープラーニングに基づく2つのモデルを提案する。
我々は、最近リリースされたFakeNews AMTとCelebrityという2つのデータセットを用いて、フェイクニュース検出のための手法を評価した。
論文 参考訳(メタデータ) (2020-05-11T09:07:46Z) - SirenLess: reveal the intention behind news [31.757138364005087]
本稿では,言語的特徴による誤ニュース検出のための視覚解析システムであるSirenLessを紹介する。
このシステムは、ニュースメタデータと言語機能を統合し、ニュース記事の意味構造を明らかにする新しいインタラクティブツールである、記事エクスプローラーを特徴とする。
我々は、SirenLessを用いて、異なるソースから18のニュース記事を分析し、誤ったニュース検出のためのいくつかの有用なパターンを要約する。
論文 参考訳(メタデータ) (2020-01-08T20:36:17Z) - Mining Disinformation and Fake News: Concepts, Methods, and Recent
Advancements [55.33496599723126]
偽ニュースを含む偽ニュースは 爆発的な成長により グローバルな現象になっています
偽情報や偽ニュースを検知する最近の進歩にもかかわらず、その複雑さ、多様性、多様性、事実チェックやアノテーションのコストが原因で、いまだに自明ではない。
論文 参考訳(メタデータ) (2020-01-02T21:01:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。