論文の概要: Cognitive Representation Learning of Self-Media Online Article Quality
- arxiv url: http://arxiv.org/abs/2008.05658v1
- Date: Thu, 13 Aug 2020 02:59:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 23:03:43.227416
- Title: Cognitive Representation Learning of Self-Media Online Article Quality
- Title(参考訳): 自己媒介オンライン記事品質の認知表現学習
- Authors: Yiru Wang, Shen Huang, Gongfu Li, Qiang Deng, Dongliang Liao, Pengda
Si, Yujiu Yang, Jin Xu
- Abstract要約: セルフメディアオンライン記事は主にユーザによって作成され、異なるテキストレベルの外観特性とマルチモーダルハイブリッド編集が特徴である。
レイアウト構造, 特徴記述, テキスト意味論と組み合わせて, 共同モデルCoQANを構築した。
また,大規模な実世界評価データセットを構築した。
- 参考スコア(独自算出の注目度): 24.084727302752377
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The automatic quality assessment of self-media online articles is an urgent
and new issue, which is of great value to the online recommendation and search.
Different from traditional and well-formed articles, self-media online articles
are mainly created by users, which have the appearance characteristics of
different text levels and multi-modal hybrid editing, along with the potential
characteristics of diverse content, different styles, large semantic spans and
good interactive experience requirements. To solve these challenges, we
establish a joint model CoQAN in combination with the layout organization,
writing characteristics and text semantics, designing different representation
learning subnetworks, especially for the feature learning process and
interactive reading habits on mobile terminals. It is more consistent with the
cognitive style of expressing an expert's evaluation of articles. We have also
constructed a large scale real-world assessment dataset. Extensive experimental
results show that the proposed framework significantly outperforms
state-of-the-art methods, and effectively learns and integrates different
factors of the online article quality assessment.
- Abstract(参考訳): セルフメディアオンライン記事の自動品質評価は緊急かつ新しい問題であり、オンラインレコメンデーションと検索にとって非常に価値がある。
従来の記事と異なり、セルフメディアのオンライン記事は主にユーザによって作成され、様々なテキストレベルの外観特性とマルチモーダルなハイブリッド編集、多様なコンテンツの潜在的な特性、異なるスタイル、大きなセマンティックスパン、優れたインタラクティブな体験要求がある。
これらの課題を解決するために,レイアウト構成,特徴とテキストのセマンティクス,異なる表現学習サブネットワークの設計,特に特徴学習プロセスとモバイル端末での対話型読書習慣を組み合わせた共同モデルcoqanを構築した。
専門家による記事の評価を表現する認知的スタイルとより整合している。
大規模な実世界評価データセットも構築しました。
広範な実験結果から,提案手法は最先端手法を著しく上回り,オンライン記事品質評価の異なる要素を効果的に学習し,統合できることが判明した。
関連論文リスト
- Automated Genre-Aware Article Scoring and Feedback Using Large Language Models [8.10826723408637]
本稿では,高度知的物品スコアリングシステムの開発に焦点をあてる。
著作物の全体的な品質を評価し、様々なジャンルに合わせた詳細な特徴ベースのスコアを提供する。
論文 参考訳(メタデータ) (2024-10-18T04:13:51Z) - Multi-Facet Counterfactual Learning for Content Quality Evaluation [48.73583736357489]
コンテンツ品質評価の複数の側面を知覚する評価器を効率的に構築する枠組みを提案する。
我々は,コントラスト学習と教師付き学習に基づく共同学習戦略を活用し,評価者が異なる品質面を区別できるようにする。
論文 参考訳(メタデータ) (2024-10-10T08:04:10Z) - Language Guided Domain Generalized Medical Image Segmentation [68.93124785575739]
単一ソースドメインの一般化は、より信頼性が高く一貫性のあるイメージセグメンテーションを現実の臨床環境にわたって約束する。
本稿では,テキストエンコーダ機能によって案内されるコントラスト学習機構を組み込むことで,テキスト情報を明確に活用する手法を提案する。
文献における既存手法に対して,本手法は良好な性能を発揮する。
論文 参考訳(メタデータ) (2024-04-01T17:48:15Z) - Multi-Dimensional Evaluation of Text Summarization with In-Context
Learning [79.02280189976562]
本稿では,テキスト内学習を用いた多次元評価器として,大規模言語モデルの有効性について検討する。
実験の結果,テキスト要約作業において,文脈内学習に基づく評価手法が学習評価フレームワークと競合していることが判明した。
次に、テキスト内サンプルの選択や数などの要因がパフォーマンスに与える影響を分析する。
論文 参考訳(メタデータ) (2023-06-01T23:27:49Z) - OCRBench: On the Hidden Mystery of OCR in Large Multimodal Models [122.27878464009181]
テキスト関連視覚タスクにおいて, GPT4V や Gemini などの大規模マルチモーダルモデルの包括的評価を行った。
OCRBenchには29のデータセットがあり、最も包括的なOCR評価ベンチマークが利用できる。
論文 参考訳(メタデータ) (2023-05-13T11:28:37Z) - Large Language Models are Diverse Role-Players for Summarization
Evaluation [82.31575622685902]
文書要約の品質は、文法や正しさといった客観的な基準と、情報性、簡潔さ、魅力といった主観的な基準で人間の注釈者によって評価することができる。
BLUE/ROUGEのような自動評価手法のほとんどは、上記の次元を適切に捉えることができないかもしれない。
目的と主観の両面から生成されたテキストと参照テキストを比較し,総合的な評価フレームワークを提供するLLMに基づく新しい評価フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-27T10:40:59Z) - Investigating Fairness Disparities in Peer Review: A Language Model
Enhanced Approach [77.61131357420201]
我々は、大規模言語モデル(LM)の助けを借りて、ピアレビューにおける公平性格差の徹底した厳密な研究を行う。
我々は、2017年から現在までのICLR(International Conference on Learning Representations)カンファレンスで、包括的なリレーショナルデータベースを収集、組み立て、維持しています。
我々は、著作者性別、地理、著作者、機関的名声など、興味のある複数の保護属性に対する公平性の違いを仮定し、研究する。
論文 参考訳(メタデータ) (2022-11-07T16:19:42Z) - Interpretable Fake News Detection with Topic and Deep Variational Models [2.15242029196761]
我々は,解釈可能な特徴と手法を用いた偽ニュース検出に焦点をあてる。
我々は,テキストニュースの高密度表現を統合した深層確率モデルを開発した。
我々のモデルは最先端の競合モデルに匹敵する性能を達成する。
論文 参考訳(メタデータ) (2022-09-04T05:31:00Z) - KGEA: A Knowledge Graph Enhanced Article Quality Identification Dataset [4.811084336809668]
Baidu Encyclopediaに基づく知識グラフ強化記事品質識別データセット(KGEA)を提案する。
論文を7次元で定量化し,記事とBaidu百科事典の実体の共起を利用して,各記事の知識グラフを構築した。
また、いくつかのテキスト分類ベースラインを比較して、外部知識が、グラフニューラルネットワークとのより競争力のある分類に導くことができることを示した。
論文 参考訳(メタデータ) (2022-06-15T14:15:41Z) - Optical character recognition quality affects perceived usefulness of
historical newspaper clippings [0.6299766708197884]
フィンランドの新聞Uusi Suometar 1869-1918の記事を検索したユーザーは32人だった。
記事検索データベースは,各記事の2つのバージョンがあり,その品質は光学的文字認識が異なる。
論文 参考訳(メタデータ) (2022-06-01T10:07:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。