論文の概要: Archive TimeLine Summarization (ATLS): Conceptual Framework for Timeline
Generation over Historical Document Collections
- arxiv url: http://arxiv.org/abs/2301.13479v1
- Date: Tue, 31 Jan 2023 08:58:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-01 17:04:17.363258
- Title: Archive TimeLine Summarization (ATLS): Conceptual Framework for Timeline
Generation over Historical Document Collections
- Title(参考訳): アーカイブTimeLine Summarization (ATLS): 歴史的文書コレクション上のタイムライン生成のための概念的フレームワーク
- Authors: Nicolas Gutehrl\'e (CRIT), Antoine Doucet (L3I), Adam Jatowt
- Abstract要約: 本稿では,アーカイブコレクション上でのTimeLine Summarization(TLS)手法を拡張して研究を支援することを提案する。
本稿では,情報的,可読的,解釈可能なタイムラインを生成することを目的とした,アーカイブタイムライン要約(ATLS)システムの概念的フレームワークについて述べる。
- 参考スコア(独自算出の注目度): 17.332692582748408
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Archive collections are nowadays mostly available through search engines
interfaces, which allow a user to retrieve documents by issuing queries. The
study of these collections may be, however, impaired by some aspects of search
engines, such as the overwhelming number of documents returned or the lack of
contextual knowledge provided. New methods that could work independently or in
combination with search engines are then required to access these collections.
In this position paper, we propose to extend TimeLine Summarization (TLS)
methods on archive collections to assist in their studies. We provide an
overview of existing TLS methods and we describe a conceptual framework for an
Archive TimeLine Summarization (ATLS) system, which aims to generate
informative, readable and interpretable timelines.
- Abstract(参考訳): アーカイブコレクションは、主に検索エンジンインターフェースを通じて利用可能であり、ユーザーはクエリを発行することで文書を検索できる。
しかし、これらのコレクションの研究は、返されたドキュメントの圧倒的数や文脈知識の欠如など、検索エンジンのいくつかの側面によって損なわれる可能性がある。
独立して、あるいは検索エンジンと組み合わせて動作する新しいメソッドは、これらのコレクションにアクセスするために必要となる。
本稿では,その研究を支援するため,アーカイブコレクションにTimeLine Summarization(TLS)メソッドを拡張することを提案する。
本稿では,既存のTLS手法の概要と,情報,可読性,解釈可能なタイムラインを生成することを目的とした,アーカイブタイムライン要約(ATLS)システムの概念的フレームワークについて述べる。
関連論文リスト
- Reproducible Hybrid Time-Travel Retrieval in Evolving Corpora [1.9202615342033464]
本稿では,高速検索のためのLuceneと,バージョン付きおよびタイムスタンプ付きインデックスを維持する列ストア型検索システムを組み合わせたハイブリッド検索システムを提案する。
論文 参考訳(メタデータ) (2024-11-06T16:57:55Z) - Knowledge-Aware Query Expansion with Large Language Models for Textual and Relational Retrieval [49.42043077545341]
知識グラフ(KG)から構造化文書関係を付加したLLMを拡張した知識対応クエリ拡張フレームワークを提案する。
文書テキストをリッチなKGノード表現として活用し、KAR(Knowledge-Aware Retrieval)のための文書ベースの関係フィルタリングを利用する。
論文 参考訳(メタデータ) (2024-10-17T17:03:23Z) - DOCBENCH: A Benchmark for Evaluating LLM-based Document Reading Systems [99.17123445211115]
本稿では,大規模言語モデル(LLM)に基づく文書読解システムを評価するベンチマークであるDocBenchを紹介する。
我々のベンチマークには、人間のアノテーションの募集と、合成質問の生成が含まれる。
実際の文書は229件、質問は1,102件で、5つのドメインにまたがって4種類の質問がある。
論文 参考訳(メタデータ) (2024-07-15T13:17:42Z) - ColPali: Efficient Document Retrieval with Vision Language Models [15.369861972085136]
複数のドメイン、言語、設定にまたがる様々なページレベルの検索タスクで構成されるVisual Document Retrieval Benchmark ViDoReを紹介する。
現代のシステムの固有の欠点は、新しい検索モデルアーキテクチャであるColPaliの導入を動機付けている。
ColPaliは最新のドキュメント検索パイプラインよりも大幅に高速で、エンドツーエンドのトレーニングが可能である。
論文 参考訳(メタデータ) (2024-06-27T15:45:29Z) - PromptReps: Prompting Large Language Models to Generate Dense and Sparse Representations for Zero-Shot Document Retrieval [76.50690734636477]
本稿では,PmptRepsを提案する。このPmptRepsは,トレーニングを必要とせず,コーパス全体から検索できる機能である。
検索システムは、高密度テキスト埋め込みとスパースバッグ・オブ・ワード表現の両方を利用する。
論文 参考訳(メタデータ) (2024-04-29T04:51:30Z) - Understanding Archives: Towards New Research Interfaces Relying on the Semantic Annotation of Documents [0.2302001830524133]
本稿では,研究資料のコーパスのテキスト内容の意味的アノテーションが,その活用と評価を促進する方法を示す。
まず,テキスト・セマンティクスに基づく新しいインタフェース構築のための方法論的枠組みを提案する。
論文 参考訳(メタデータ) (2024-03-28T07:55:29Z) - Leveraging Collection-Wide Similarities for Unsupervised Document Structure Extraction [61.998789448260005]
本稿では,コレクション内の文書の典型的構造を特定することを提案する。
任意のヘッダのパラフレーズを抽象化し、各トピックを各ドキュメントのロケーションにグルーピングします。
文書間の類似性を利用した教師なしグラフベース手法を開発した。
論文 参考訳(メタデータ) (2024-02-21T16:22:21Z) - PDFTriage: Question Answering over Long, Structured Documents [60.96667912964659]
構造化文書をプレーンテキストとして表現することは、これらの文書をリッチな構造でユーザ精神モデルと矛盾する。
本稿では,構造や内容に基づいて,モデルがコンテキストを検索できるPDFTriageを提案する。
ベンチマークデータセットは,80以上の構造化文書に900以上の人間が生成した質問からなる。
論文 参考訳(メタデータ) (2023-09-16T04:29:05Z) - IncDSI: Incrementally Updatable Document Retrieval [35.5697863674097]
IncDSIは、データセット全体のモデルをトレーニングすることなく、リアルタイムでドキュメントを追加する方法である。
我々は、制約付き最適化問題として文書の追加を定式化し、ネットワークパラメータの変更を最小限に抑える。
私たちのアプローチは、データセット全体のモデルの再トレーニングと競合しています。
論文 参考訳(メタデータ) (2023-07-19T07:20:30Z) - Decomposing Complex Queries for Tip-of-the-tongue Retrieval [72.07449449115167]
複雑なクエリは、コンテンツ要素(例えば、書籍の文字やイベント)、ドキュメントテキスト以外の情報を記述する。
この検索設定は舌の先端 (TOT) と呼ばれ、クエリと文書テキスト間の語彙的および意味的重複に依存するモデルでは特に困難である。
クエリを個別のヒントに分解し、サブクエリとしてルーティングし、特定の検索者にルーティングし、結果をアンサンブルすることで、このような複雑なクエリを扱うための、シンプルで効果的なフレームワークを導入します。
論文 参考訳(メタデータ) (2023-05-24T11:43:40Z) - ArchivalQA: A Large-scale Benchmark Dataset for Open Domain Question
Answering over Archival News Collections [20.07130742712862]
本稿では,1067,056組の質問応答データセットArchivealQAを提案する。
課題の難易度と時間表現の包含に基づいて,データセットの4つの部分を作成する。
論文 参考訳(メタデータ) (2021-09-08T05:21:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。