論文の概要: Graphy'our Data: Towards End-to-End Modeling, Exploring and Generating Report from Raw Data
- arxiv url: http://arxiv.org/abs/2502.16868v1
- Date: Mon, 24 Feb 2025 06:10:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:52:15.709728
- Title: Graphy'our Data: Towards End-to-End Modeling, Exploring and Generating Report from Raw Data
- Title(参考訳): Graphy'our Data: エンドツーエンドモデリング,探索,生データからのレポート生成に向けて
- Authors: Longbin Lai, Changwei Luo, Yunkai Lou, Mingchen Ju, Zhengyi Yang,
- Abstract要約: Graphyは、データモデリング、探索、高品質なレポート生成を自動化するエンドツーエンドプラットフォームである。
文献調査のシナリオをどのように促進するかを示す,5万を越える論文(参考資料を含む)の事前スクラップグラフを紹介します。
- 参考スコア(独自算出の注目度): 5.752510084651565
- License:
- Abstract: Large Language Models (LLMs) have recently demonstrated remarkable performance in tasks such as Retrieval-Augmented Generation (RAG) and autonomous AI agent workflows. Yet, when faced with large sets of unstructured documents requiring progressive exploration, analysis, and synthesis, such as conducting literature survey, existing approaches often fall short. We address this challenge -- termed Progressive Document Investigation -- by introducing Graphy, an end-to-end platform that automates data modeling, exploration and high-quality report generation in a user-friendly manner. Graphy comprises an offline Scrapper that transforms raw documents into a structured graph of Fact and Dimension nodes, and an online Surveyor that enables iterative exploration and LLM-driven report generation. We showcase a pre-scrapped graph of over 50,000 papers -- complete with their references -- demonstrating how Graphy facilitates the literature-survey scenario. The demonstration video can be found at https://youtu.be/uM4nzkAdGlM.
- Abstract(参考訳): 大規模言語モデル(LLM)は、最近、Retrieval-Augmented Generation(RAG)や自律AIエージェントワークフローといったタスクにおいて、顕著なパフォーマンスを示している。
しかし、先進的な調査、分析、合成を必要とする大規模な非構造化文書(文献調査など)に直面した場合、既存のアプローチは不足することが多い。
Graphyは、ユーザフレンドリーな方法でデータモデリング、探索、高品質なレポート生成を自動化するエンドツーエンドプラットフォームです。
Graphyは、生文書をFactとDimensionノードの構造化グラフに変換するオフラインスクラッパーと、反復的な探索とLCM駆動のレポート生成を可能にするオンラインサーベイラで構成される。
文献調査のシナリオをどのように促進するかを示す,5万を越える論文(参考資料を含む)の事前スクラップグラフを紹介します。
デモビデオはhttps://youtu.be/uM4nzkAdGlMで見ることができる。
関連論文リスト
- Cascading Large Language Models for Salient Event Graph Generation [19.731605612333716]
CALLMSAEは、SAlient Event Graph生成のためのCAscading Large Language Modelフレームワークである。
まず、LSMにサマリを生成するよう促すことで、サレントイベントを識別する。
次に、イベント関係グラフを生成するための反復的コード改善促進戦略を開発する。
CALLMSAEにより、大規模な自動注釈付きイベントグラフデータセットである textitNYT-SEG を提示する。
論文 参考訳(メタデータ) (2024-06-26T15:53:54Z) - GraphReader: Building Graph-based Agent to Enhance Long-Context Abilities of Large Language Models [58.08177466768262]
大規模言語モデル(LLM)では、複雑なロングコンテクストのタスクに対処するためには、ロングコンテクストの能力が不可欠である。
グラフをグラフに構造化し、エージェントを使ってグラフを自律的に探索することで、長いテキストを扱うように設計されたグラフベースのエージェントシステムであるGraphReaderを紹介する。
LV-Evalデータセットの実験結果によると、GraphReaderは4kコンテキストウィンドウを使用して、16kから256kまでのコンテキスト長で一貫してGPT-4-128kを上回っている。
論文 参考訳(メタデータ) (2024-06-20T17:57:51Z) - DocGraphLM: Documental Graph Language Model for Information Extraction [15.649726614383388]
本稿では,事前学習した言語モデルとグラフセマンティクスを組み合わせたフレームワークDocGraphLMを紹介する。
これを実現するために,1)文書を表す共同エンコーダアーキテクチャを提案し,2)文書グラフを再構築するための新しいリンク予測手法を提案する。
3つのSotAデータセットに対する実験により、IEおよびQAタスクにおける一貫した改善とグラフ機能の導入が示された。
論文 参考訳(メタデータ) (2024-01-05T14:15:36Z) - Form follows Function: Text-to-Text Conditional Graph Generation based
on Functional Requirements [36.00630198983932]
この研究は、下流タスクにおけるグラフの機能的要求の記述に条件づけられたグラフを生成するという、新しい問題設定に焦点を当てる。
テキストからテキストへ生成する問題としてこの問題を提起し、事前学習された大規模言語モデル(LLM)を微調整してグラフを生成するアプローチに焦点を当てる。
論文 参考訳(メタデータ) (2023-11-01T11:12:02Z) - Scientific Paper Extractive Summarization Enhanced by Citation Graphs [50.19266650000948]
我々は、引用グラフを活用して、異なる設定下での科学的論文の抽出要約を改善することに重点を置いている。
予備的な結果は、単純な教師なしフレームワークであっても、引用グラフが有用であることを示している。
そこで我々は,大規模ラベル付きデータが利用可能である場合のタスクにおいて,より正確な結果を得るために,グラフベースのスーパービジョン・サムライゼーション・モデル(GSS)を提案する。
論文 参考訳(メタデータ) (2022-12-08T11:53:12Z) - Fine-Grained Scene Graph Generation with Data Transfer [127.17675443137064]
シーングラフ生成(SGG)は、画像中の三つ子(オブジェクト、述語、オブジェクト)を抽出することを目的としている。
最近の研究は、SGGを着実に進歩させ、高レベルの視覚と言語理解に有用なツールを提供している。
そこで本研究では,プレー・アンド・プラグ方式で適用可能で,約1,807の述語クラスを持つ大規模SGGに拡張可能な,内部・外部データ転送(IETrans)手法を提案する。
論文 参考訳(メタデータ) (2022-03-22T12:26:56Z) - Neural Language Modeling for Contextualized Temporal Graph Generation [49.21890450444187]
本稿では,大規模事前学習言語モデルを用いた文書のイベントレベル時間グラフの自動生成に関する最初の研究について述べる。
論文 参考訳(メタデータ) (2020-10-20T07:08:00Z) - Leveraging Graph to Improve Abstractive Multi-Document Summarization [50.62418656177642]
我々は、文書のよく知られたグラフ表現を活用することができる、抽象的多文書要約(MDS)モデルを開発する。
本モデルでは,長い文書の要約に欠かせない文書間関係を捉えるために,文書の符号化にグラフを利用する。
また,このモデルでは,要約生成プロセスの導出にグラフを利用することが可能であり,一貫性と簡潔な要約を生成するのに有用である。
論文 参考訳(メタデータ) (2020-05-20T13:39:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。