論文の概要: Incongruity Detection between Bangla News Headline and Body Content
through Graph Neural Network
- arxiv url: http://arxiv.org/abs/2211.07709v1
- Date: Wed, 26 Oct 2022 20:57:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-20 14:07:55.271991
- Title: Incongruity Detection between Bangla News Headline and Body Content
through Graph Neural Network
- Title(参考訳): グラフニューラルネットワークによるバングラニュース見出しとボディーコンテンツの違和感検出
- Authors: Md Aminul Haque Palash, Akib Khan, Kawsarul Islam, MD Abdullah Al
Nasim, Ryan Mohammad Bin Shahjahan
- Abstract要約: ニュースの見出しと内容の一致は、読者を惹きつけるのに使用される詐欺の一般的な方法である。
本稿では,Banglaニュースの見出しとコンテンツ段落の類似性と矛盾を効果的に学習するグラフベースの階層型デュアルエンコーダモデルを提案する。
提案したBanglaグラフベースのニューラルネットワークモデルは,さまざまなBanglaニュースデータセットに対して90%以上の精度を実現する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Incongruity between news headlines and the body content is a common method of
deception used to attract readers. Profitable headlines pique readers' interest
and encourage them to visit a specific website. This is usually done by adding
an element of dishonesty, using enticements that do not precisely reflect the
content being delivered. As a result, automatic detection of incongruent news
between headline and body content using language analysis has gained the
research community's attention. However, various solutions are primarily being
developed for English to address this problem, leaving low-resource languages
out of the picture. Bangla is ranked 7th among the top 100 most widely spoken
languages, which motivates us to pay special attention to the Bangla language.
Furthermore, Bangla has a more complex syntactic structure and fewer natural
language processing resources, so it becomes challenging to perform NLP tasks
like incongruity detection and stance detection. To tackle this problem, for
the Bangla language, we offer a graph-based hierarchical dual encoder (BGHDE)
model that learns the content similarity and contradiction between Bangla news
headlines and content paragraphs effectively. The experimental results show
that the proposed Bangla graph-based neural network model achieves above 90%
accuracy on various Bangla news datasets.
- Abstract(参考訳): ニュース見出しとボディーコンテンツの間の違和感は、読者を惹きつけるのによく使われるだまの方法である。
利益のある見出しは読者の興味をそそらせ、特定のウェブサイトを訪問するよう促す。
これは通常、配信されるコンテンツを正確に反映しないインテントを使用して、不正な要素を追加することで行われる。
その結果,言語分析によるヘッドラインとボディコンテンツ間の不一致ニュースの自動検出が,研究コミュニティの注目を集めている。
しかし、この問題に対処するための様々なソリューションが主に開発されており、低リソースの言語を図表から外している。
バングラ語は最も広く話されている言語のトップ100の中で7位であり、バングラ語に特別な注意を払う動機となっている。
さらに、Banglaはより複雑な構文構造を持ち、自然言語処理資源が少ないため、矛盾検出や姿勢検出といったNLPタスクの実行が困難になる。
この問題に対処するため、バングラ語では、Banglaニュースの見出しとコンテンツ段落の類似性と矛盾を効果的に学習するグラフベースの階層型二重エンコーダ(BGHDE)モデルを提供する。
実験結果から,提案したBanglaグラフベースニューラルネットワークモデルが,さまざまなBanglaニュースデータセットに対して90%以上の精度を実現することが示された。
関連論文リスト
- BanglaNLP at BLP-2023 Task 2: Benchmarking different Transformer Models
for Sentiment Analysis of Bangla Social Media Posts [0.46040036610482665]
本稿では,BLPワークショップ第2タスク(Bangla Social Media Posts の感性分析)について紹介する。
我々の定量的結果は、トランスファーラーニングが、この低リソース言語シナリオにおけるモデルのより優れた学習に役立つことを示している。
テストセットで67.02%のマイクロF1を取得し、この共有タスクのパフォーマンスをリーダーボードで21にランク付けする。
論文 参考訳(メタデータ) (2023-10-13T16:46:38Z) - NusaWrites: Constructing High-Quality Corpora for Underrepresented and
Extremely Low-Resource Languages [54.808217147579036]
インドネシアの地方言語について事例研究を行う。
データセット構築におけるオンラインスクラップ,人文翻訳,および母語話者による段落作成の有効性を比較した。
本研究は,母語話者による段落作成によって生成されたデータセットが,語彙的多様性と文化的内容の点で優れた品質を示すことを示す。
論文 参考訳(メタデータ) (2023-09-19T14:42:33Z) - On Evaluation of Bangla Word Analogies [0.8658596218544772]
本稿では,Bangla単語の埋め込み品質を評価するための高品質なデータセットを提案する。
世界で7番目に普及した言語であるにもかかわらず、Banglaは低リソース言語であり、人気のあるNLPモデルはうまく機能しない。
論文 参考訳(メタデータ) (2023-04-10T14:27:35Z) - Utilizing Wordnets for Cognate Detection among Indian Languages [50.83320088758705]
ヒンディー語と10のインド諸語間の単語対を検出する。
深層学習手法を用いて単語対が共生か否かを予測する。
性能は最大26%向上した。
論文 参考訳(メタデータ) (2021-12-30T16:46:28Z) - Harnessing Cross-lingual Features to Improve Cognate Detection for
Low-resource Languages [50.82410844837726]
言語間単語埋め込みを用いた14言語間のコニャートの検出を実証する。
インドの12言語からなる挑戦的データセットを用いて,コニャート検出手法の評価を行った。
我々は,コグネート検出のためのFスコアで最大18%の改善点を観察した。
論文 参考訳(メタデータ) (2021-12-16T11:17:58Z) - Fine-Grained Image Generation from Bangla Text Description using
Attentional Generative Adversarial Network [0.0]
本稿では,高解像度のBanglaテキスト・画像生成のための多段階処理を可能にするBangla Attentional Generative Adversarial Network (AttnGAN)を提案する。
初めて、注目GANを用いてBanglaテキストからきめ細かい画像を生成する。
論文 参考訳(メタデータ) (2021-09-24T05:31:01Z) - LadRa-Net: Locally-Aware Dynamic Re-read Attention Net for Sentence
Semantic Matching [66.65398852962177]
文意味マッチングのための新しい動的再読ネットワーク(DRr-Net)を開発した。
DRr-Netをローカルに認識する動的再読み取り注意ネット(LadRa-Net)に拡張する
2つの一般的な文意味マッチングタスクの実験により、DRr-Netは文意味マッチングの性能を大幅に改善できることを示した。
論文 参考訳(メタデータ) (2021-08-06T02:07:04Z) - End-to-End Natural Language Understanding Pipeline for Bangla
Conversational Agents [0.43012765978447565]
本稿では,バングラ語とバングラ語でコミュニケーション可能なビジネスアシスタントを構築するための新しい手法を提案する。
Rasa Open Source Framework、fastText組み込み、Polyglot組み込み、Fraskなどのシステムをビルディングブロックとして使用しています。
本稿では,意図分類と実体抽出のためのパイプラインを提案する。
論文 参考訳(メタデータ) (2021-07-12T16:09:22Z) - Bangla Text Classification using Transformers [2.3475904942266697]
テキスト分類はNLPの最も初期の問題の一つである。
本研究では,Banglaテキスト分類タスクのための多言語変換モデルを微調整する。
6つのベンチマークデータセットのアート結果の状態を把握し、前回の結果を5~29%の精度で改善する。
論文 参考訳(メタデータ) (2020-11-09T14:12:07Z) - Intrinsic Probing through Dimension Selection [69.52439198455438]
現代のほとんどのNLPシステムは、様々なタスクにおいて驚くほど高いパフォーマンスが得られる事前訓練された文脈表現を使用している。
このような高いパフォーマンスは、ある種の言語構造がこれらの表現に根ざしない限りはあり得ず、それを探究する研究が盛んに行われている。
本稿では,言語情報が表現内でどのように構造化されているかを示す内在的探索と,先行研究で広く普及している外在的探索とを区別し,抽出に成功したことを示すことによって,そのような情報の存在を主張するのみである。
論文 参考訳(メタデータ) (2020-10-06T15:21:08Z) - Information-Theoretic Probing for Linguistic Structure [74.04862204427944]
本稿では,相互情報を推定するための情報理論による探索運用手法を提案する。
我々は,NLP研究でしばしば不足している10の型的多様言語について評価した。
論文 参考訳(メタデータ) (2020-04-07T01:06:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。