論文の概要: IoDResearch: Deep Research on Private Heterogeneous Data via the Internet of Data
- arxiv url: http://arxiv.org/abs/2510.01553v1
- Date: Thu, 02 Oct 2025 00:51:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.928605
- Title: IoDResearch: Deep Research on Private Heterogeneous Data via the Internet of Data
- Title(参考訳): IoDResearch: データのインターネットによるプライベートな異種データの研究
- Authors: Zhuofan Shi, Zijie Guo, Xinjian Ma, Gang Huang, Yun Ma, Xiang Jing,
- Abstract要約: IoDResearchはプライベートなデータ中心のDeep Researchフレームワークで、Internet of Dataパラダイムを運用している。
IoDResearchは異種資源をFAIR準拠のデジタルオブジェクトとしてカプセル化する。
マルチエージェントシステムは、信頼性の高い質問応答と構造化された科学的レポート生成の両方をサポートする。
- 参考スコア(独自算出の注目度): 6.542148733694304
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid growth of multi-source, heterogeneous, and multimodal scientific data has increasingly exposed the limitations of traditional data management. Most existing DeepResearch (DR) efforts focus primarily on web search while overlooking local private data. Consequently, these frameworks exhibit low retrieval efficiency for private data and fail to comply with the FAIR principles, ultimately resulting in inefficiency and limited reusability. To this end, we propose IoDResearch (Internet of Data Research), a private data-centric Deep Research framework that operationalizes the Internet of Data paradigm. IoDResearch encapsulates heterogeneous resources as FAIR-compliant digital objects, and further refines them into atomic knowledge units and knowledge graphs, forming a heterogeneous graph index for multi-granularity retrieval. On top of this representation, a multi-agent system supports both reliable question answering and structured scientific report generation. Furthermore, we establish the IoD DeepResearch Benchmark to systematically evaluate both data representation and Deep Research capabilities in IoD scenarios. Experimental results on retrieval, QA, and report-writing tasks show that IoDResearch consistently surpasses representative RAG and Deep Research baselines. Overall, IoDResearch demonstrates the feasibility of private-data-centric Deep Research under the IoD paradigm, paving the way toward more trustworthy, reusable, and automated scientific discovery.
- Abstract(参考訳): マルチソース、異種、マルチモーダルな科学データの急速な成長により、従来のデータ管理の限界が明らかになってきた。
既存のDeepResearch(DR)の取り組みのほとんどは、ローカルなプライベートデータを見下ろしながらWeb検索に重点を置いている。
その結果、これらのフレームワークはプライベートデータの検索効率が低く、FAIRの原則に従わなかったため、最終的には効率が悪く、再利用性が制限された。
この目的のために、我々は、IoT(Internet of Data)パラダイムを運用するプライベートデータ中心のDeep ResearchフレームワークであるIoDResearch(Internet of Data Research)を提案する。
IoDResearchは、異種資源をFAIR準拠のデジタルオブジェクトとしてカプセル化し、さらに原子知識単位と知識グラフに洗練し、多粒度検索のための異種グラフインデックスを形成する。
この表現に加えて、マルチエージェントシステムは信頼性の高い質問応答と構造化された科学的レポート生成の両方をサポートする。
さらに、IoDシナリオにおけるデータ表現とDeep Research機能の両方を体系的に評価するIoD DeepResearchベンチマークを確立する。
IoDResearchは,検索,QA,レポート作成タスクにおいて,RAGやDeep Researchのベースラインを一貫して上回っている。
全体として、IoDResearchは、IoDパラダイムの下でプライベートデータ中心のDeep Researchの実現可能性を示し、より信頼性が高く、再利用可能な、そして自動化された科学的発見への道を開いた。
関連論文リスト
- WebResearcher: Unleashing unbounded reasoning capability in Long-Horizon Agents [72.28593628378991]
WebResearcherは、マルコフ決定プロセスとしてディープリサーチを再構築する反復的なディープリサーチパラダイムである。
WebResearcherは最先端のパフォーマンスを実現し、フロンティアのプロプライエタリシステムを超えています。
論文 参考訳(メタデータ) (2025-09-16T17:57:17Z) - DatasetResearch: Benchmarking Agent Systems for Demand-Driven Dataset Discovery [26.388978716803464]
AIエージェントは、通常の検索を超越して、特定のユーザ要求を満たすデータセットを体系的に検出できるだろうか?
我々のベンチマークと包括的な分析は、次世代の自己改善型AIシステムの基礎を提供する。
論文 参考訳(メタデータ) (2025-08-09T12:15:08Z) - From Web Search towards Agentic Deep Research: Incentivizing Search with Reasoning Agents [96.65646344634524]
推論とエージェント能力を備えた大規模言語モデル(LLM)は、エージェントディープリサーチ(Agenic Deep Research)と呼ばれる新しいパラダイムを取り入れている。
静的なWeb検索から,計画,探索,学習を行う対話型エージェントベースのシステムへの進化を辿ります。
我々はエージェントディープリサーチが既存のアプローチを著しく上回るだけでなく、将来の情報探索において支配的なパラダイムになることを実証する。
論文 参考訳(メタデータ) (2025-06-23T17:27:19Z) - ScIRGen: Synthesize Realistic and Large-Scale RAG Dataset for Scientific Research [15.983924435685553]
我々は科学的なQAと検索のためのデータセット生成フレームワークであるScrirGenを開発した。
私たちはこれを使って、現実的なクエリ、データセット、論文を備えた大規模科学的検索強化世代(RAG)データセットを作成します。
論文 参考訳(メタデータ) (2025-06-09T11:47:13Z) - Assessing Scientific Contributions in Data Sharing Spaces [64.16762375635842]
本稿では、研究者の科学的貢献を測定するブロックチェーンベースのメトリクスであるSCIENCE-indexを紹介する。
研究者にデータ共有のインセンティブを与えるため、SCIENCE-indexはデータ共有パラメータを含むように拡張されている。
本モデルは, 地理的に多様な研究者の出力分布とh-indexの分布を比較して評価する。
論文 参考訳(メタデータ) (2023-03-18T19:17:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。