論文の概要: A Systematic Review of FAIR-compliant Big Data Software Reference Architectures
- arxiv url: http://arxiv.org/abs/2509.14370v1
- Date: Wed, 17 Sep 2025 19:10:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-19 17:26:52.949399
- Title: A Systematic Review of FAIR-compliant Big Data Software Reference Architectures
- Title(参考訳): FAIRに準拠したビッグデータソフトウェアリファレンスアーキテクチャの体系的レビュー
- Authors: João Pedro de Carvalho Castro, Maria Júlia Soares De Grandi, Cristina Dutra de Aguiar,
- Abstract要約: FAIR原則は、科学的データ検索、アクセシブル、インターオペラビリティ、再利用を可能にすることの重要性を強調している。
本稿では,このようなレポジトリのアーキテクチャソリューションに焦点をあてた研究成果の体系的なレビューを行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To meet the standards of the Open Science movement, the FAIR Principles emphasize the importance of making scientific data Findable, Accessible, Interoperable, and Reusable. Yet, creating a repository that adheres to these principles presents significant challenges. Managing large volumes of diverse research data and metadata, often generated rapidly, requires a precise approach. This necessity has led to the development of Software Reference Architectures (SRAs) to guide the implementation process for FAIR-compliant repositories. This article conducts a systematic review of research efforts focused on architectural solutions for such repositories. We detail our methodology, covering all activities undertaken in the planning and execution phases of the review. We analyze 323 references from reputable sources and expert recommendations, identifying 7 studies on general-purpose big data SRAs, 13 pipelines implementing FAIR Principles in specific contexts, and 3 FAIR-compliant big data SRAs. We provide a thorough description of their key features and assess whether the research questions posed in the planning phase were adequately addressed. Additionally, we discuss the limitations of the retrieved studies and identify tendencies and opportunities for further research.
- Abstract(参考訳): オープンサイエンス運動の標準を満たすため、FAIR原則は科学データ検索、アクセシブル、インターオペラビリティ、再利用の重要性を強調している。
しかし、これらの原則に準拠したリポジトリを作成することは、大きな課題をもたらします。
大量の多様な研究データとメタデータを管理することは、しばしば急速に生成されるが、正確なアプローチを必要とする。
この必要性は、FAIRに準拠したリポジトリの実装プロセスをガイドするSoftware Reference Architectures(SRA)の開発につながった。
本稿では,このようなレポジトリのアーキテクチャソリューションに焦点をあてた研究成果の体系的なレビューを行う。
レビューの計画と実行フェーズで実施されるすべての活動について、我々の方法論を詳述する。
評価可能なソースからの323の参照と専門家の推薦を分析し、汎用ビッグデータSRAに関する7つの研究、特定のコンテキストでFAIR原則を実装する13のパイプライン、FAIRに準拠した3つのビッグデータSRAを特定した。
本研究は,これらの重要な特徴を詳細に説明し,計画段階における研究課題が適切に対処されたかどうかを評価する。
さらに,得られた研究の限界について考察し,さらなる研究の傾向と機会を明らかにする。
関連論文リスト
- Towards Agentic RAG with Deep Reasoning: A Survey of RAG-Reasoning Systems in LLMs [69.10441885629787]
Retrieval-Augmented Generation (RAG) は、外部知識を注入することによって、Large Language Models (LLM) の事実性を高める。
逆に、純粋に推論指向のアプローチは、しばしば幻覚的あるいは誤った事実を必要とする。
この調査は両鎖を統一的推論-検索の観点から合成する。
論文 参考訳(メタデータ) (2025-07-13T03:29:41Z) - Research Knowledge Graphs: the Shifting Paradigm of Scholarly Information Representation [2.967893090870586]
研究知識グラフ(Research Knowledge Graphs, RKGs)は、研究成果物とその関連性を簡単に利用し、機械で操作可能な表現を提供することを目的としている。
本稿では、RKGビルディングブロックと原則の説明とともに、RKGビジョンの第一概念化、利用内RKGの分類について述べる。
論文 参考訳(メタデータ) (2025-06-08T21:10:30Z) - Insight-RAG: Enhancing LLMs with Insight-Driven Augmentation [4.390998479503661]
本稿では,インサイトに基づく文書検索のための新しいフレームワークであるInsight-RAGを提案する。
Insight-RAG の初期段階では,従来の検索手法の代わりに LLM を用いて入力クエリとタスクを解析する。
従来のRAG手法と同様に、元のクエリを抽出した洞察と統合することにより、最終的なLCMを用いて、文脈的に豊かで正確な応答を生成する。
論文 参考訳(メタデータ) (2025-03-31T19:50:27Z) - A Comprehensive Survey on Composed Image Retrieval [54.54527281731775]
Composed Image Retrieval (CIR)は、ユーザがマルチモーダルクエリを使ってターゲットイメージを検索できる、新しくて困難なタスクである。
現在、この分野のタイムリーな概要を提供するため、CIRの包括的なレビューは行われていない。
我々は、ACM TOIS、SIGIR、CVPRなど、トップカンファレンスやジャーナルで120以上の出版物から洞察を合成する。
論文 参考訳(メタデータ) (2025-02-19T01:37:24Z) - StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization [94.31508613367296]
Retrieval-augmented Generation(RAG)は、大規模言語モデル(LLM)を効果的に強化する鍵となる手段である。
本稿では,手前のタスクに対して最適な構造型を識別し,元の文書をこの構造化形式に再構成し,その結果に基づいて回答を推測するStructRAGを提案する。
実験の結果、StructRAGは最先端のパフォーマンスを実現し、特に挑戦的なシナリオに優れていた。
論文 参考訳(メタデータ) (2024-10-11T13:52:44Z) - STaRK: Benchmarking LLM Retrieval on Textual and Relational Knowledge Bases [93.96463520716759]
テキストと知識ベースを用いた大規模半構造検索ベンチマークSTARKを開発した。
本ベンチマークでは, 製品検索, 学術論文検索, 精密医療におけるクエリの3分野について検討した。
多様なリレーショナル情報と複雑なテキスト特性を統合した,現実的なユーザクエリを合成する,新しいパイプラインを設計する。
論文 参考訳(メタデータ) (2024-04-19T22:54:54Z) - FAIR Enough: How Can We Develop and Assess a FAIR-Compliant Dataset for Large Language Models' Training? [3.0406004578714008]
大規模言語モデルの急速な進化は、AI開発における倫理的考慮とデータの整合性の必要性を強調している。
FAIRの原則は倫理データのスチュワードシップに不可欠であるが、LLMトレーニングデータの文脈におけるそれらの特定の応用は未調査領域のままである。
本稿では,FAIR の原則を LLM 開発ライフサイクルに統合する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-19T21:21:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。