論文の概要: Multivariate Powered Dirichlet Hawkes Process
- arxiv url: http://arxiv.org/abs/2212.05995v2
- Date: Tue, 13 Dec 2022 09:38:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 15:52:05.520097
- Title: Multivariate Powered Dirichlet Hawkes Process
- Title(参考訳): 多変量駆動型ディリクレホークスプロセス
- Authors: Ga\"el Poux-M\'edard, Julien Velcin, Sabine Loudcher
- Abstract要約: 文書の公開時間は、その意味的内容に関する関連情報を運ぶ。
Dirichlet-Hawkesプロセスは、テキスト情報と出版ダイナミクスを共同でモデル化するために提案されている。
- 参考スコア(独自算出の注目度): 3.5450828190071655
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The publication time of a document carries a relevant information about its
semantic content. The Dirichlet-Hawkes process has been proposed to jointly
model textual information and publication dynamics. This approach has been used
with success in several recent works, and extended to tackle specific
challenging problems --typically for short texts or entangled publication
dynamics. However, the prior in its current form does not allow for complex
publication dynamics. In particular, inferred topics are independent from each
other --a publication about finance is assumed to have no influence on
publications about politics, for instance.
In this work, we develop the Multivariate Powered Dirichlet-Hawkes Process
(MPDHP), that alleviates this assumption. Publications about various topics can
now influence each other. We detail and overcome the technical challenges that
arise from considering interacting topics. We conduct a systematic evaluation
of MPDHP on a range of synthetic datasets to define its application domain and
limitations. Finally, we develop a use case of the MPDHP on Reddit data. At the
end of this article, the interested reader will know how and when to use MPDHP,
and when not to.
- Abstract(参考訳): 文書の公開時間は、その意味的内容に関する関連情報を運ぶ。
Dirichlet-Hawkesプロセスは、テキスト情報と出版ダイナミクスを共同でモデル化するために提案されている。
このアプローチは、最近のいくつかの作品で成功して使われており、特定の困難な問題 -- 典型的には、短いテキストや絡み合った出版ダイナミックスのために。しかし、現在の形式では、複雑な出版ダイナミクスは許可されていない。特に、推測された話題は互いに独立している -- 金融に関する出版は、例えば、政治に関する出版物には影響しないと仮定されている。
本研究では,この仮定を緩和する多変量dirichlet-hawkesプロセス(mpdhp)を開発した。
様々な話題に関する出版物が互いに影響を与えている。
相互作用するトピックから生じる技術的課題の詳細と克服。
我々は,様々な合成データセット上でmpdhpを体系的に評価し,そのアプリケーションドメインと制限を定義する。
最後に,redditデータを用いたmpdhpのユースケースを開発した。
この記事の最後には、興味のある読者がMPDHPの使用方法と使用時期、そうでないタイミングを知ることができる。
関連論文リスト
- Peer Review as A Multi-Turn and Long-Context Dialogue with Role-Based Interactions [62.0123588983514]
大規模言語モデル(LLM)は様々な分野にまたがる幅広い応用を実証してきた。
我々は、ピアレビュープロセスを多ターン長文対話として再構築し、著者、レビュアー、意思決定者に対して異なる役割を担っている。
複数の情報源から収集された92,017件のレビューを含む26,841件の論文を含む包括的データセットを構築した。
論文 参考訳(メタデータ) (2024-06-09T08:24:17Z) - A Topical Approach to Capturing Customer Insight In Social Media [0.0]
この研究は、ノイズの多いビッグデータコンテキストにおいて、完全に教師なしのトピック抽出の課題に対処する。
本稿では,変分オートエンコーダフレームワーク上に構築した3つのアプローチを提案する。
我々のモデルは最先端の手法よりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2023-07-14T11:15:28Z) - Peek Across: Improving Multi-Document Modeling via Cross-Document
Question-Answering [49.85790367128085]
我々は,事前学習対象に答える新しいクロスドキュメント質問から,汎用的なマルチドキュメントモデルを事前学習する。
この新規なマルチドキュメントQA定式化は、クロステキスト情報関係をよりよく回復させるようモデルに指示する。
分類タスクや要約タスクに焦点を当てた従来のマルチドキュメントモデルとは異なり、事前学習対象の定式化により、短いテキスト生成と長いテキスト生成の両方を含むタスクを実行できる。
論文 参考訳(メタデータ) (2023-05-24T17:48:40Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Le Processus Powered Dirichlet-Hawkes comme A Priori Flexible pour
Clustering Temporel de Textes [3.5450828190071655]
文書の内容と公開時間に応じて文書のクラスタを作成する手法を開発した。
PDHPは、時間的情報やテキストの内容が弱い場合に、最先端のモデルよりもはるかに優れた結果をもたらす。
論文 参考訳(メタデータ) (2022-01-29T11:48:45Z) - Powered Hawkes-Dirichlet Process: Challenging Textual Clustering using a
Flexible Temporal Prior [2.9972063833424216]
文書の内容と公開時間に応じて文書のクラスタを作成するフレキシブルな方法を開発した。
PDHPは、時間的情報やテキストの内容が弱い場合に、最先端のモデルよりもはるかに優れた結果が得られることを示す。
PDHPは、DHP(Dichlet-Hawkes Process)やUP(Uniform Process)など、以前の作業の一般化を実証する。
論文 参考訳(メタデータ) (2021-09-15T09:10:19Z) - Recurrent Coupled Topic Modeling over Sequential Documents [33.35324412209806]
現在のトピックは、結合重みが対応するすべてのトピックから進化し、マルチトピック・スレッドの進化を形成することを示す。
進化するトピック間のマルチカップリングを解消する,新しいデータ拡張手法を用いた新しいソリューションを提案する。
後方フィルタアルゴリズムを備えた新しいギブスサンプリング器は、閉形式の潜時時間パラメータを効率的に学習する。
論文 参考訳(メタデータ) (2021-06-23T08:58:13Z) - WikiAsp: A Dataset for Multi-domain Aspect-based Summarization [69.13865812754058]
マルチドメインアスペクトベースの要約のための大規模データセットであるWikiAspを提案する。
具体的には、アスペクトアノテーションのプロキシとして、各記事のセクションタイトルとバウンダリを使用して、20の異なるドメインからウィキペディア記事を使用してデータセットを構築します。
その結果,既存の要約モデルがこの設定で直面する重要な課題,例えば引用されたソースの適切な代名詞処理,時間に敏感なイベントの一貫した説明などが浮き彫りになった。
論文 参考訳(メタデータ) (2020-11-16T10:02:52Z) - VMSMO: Learning to Generate Multimodal Summary for Video-based News
Articles [63.32111010686954]
マルチモーダル出力(VMSMO)を用いたビデオベースマルチモーダル要約の課題を提案する。
このタスクの主な課題は、ビデオの時間的依存性と記事の意味を共同でモデル化することである。
本稿では,デュアルインタラクションモジュールとマルチモーダルジェネレータからなるDual-Interaction-based Multimodal Summarizer (DIMS)を提案する。
論文 参考訳(メタデータ) (2020-10-12T02:19:16Z) - Knowledge-Aware Procedural Text Understanding with Multi-Stage Training [110.93934567725826]
本稿では,このような文書の理解とプロセス中のエンティティの状態や場所の追跡を目的とした手続き的テキスト理解の課題に焦点をあてる。
常識的推論の難しさとデータ不足という2つの課題はまだ未解決のままである。
我々は、複数の外部知識を効果的に活用する、KnOwledge-Aware ProceduraL text understAnding (KOALA)モデルを提案する。
論文 参考訳(メタデータ) (2020-09-28T10:28:40Z) - Machine Identification of High Impact Research through Text and Image
Analysis [0.4737991126491218]
本稿では,引用の可能性が低い論文から高い論文を自動的に分離するシステムを提案する。
本システムでは,文書全体の外観を推測する視覚的分類器と,コンテンツインフォームド決定のためのテキスト分類器の両方を用いる。
論文 参考訳(メタデータ) (2020-05-20T19:12:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。