論文の概要: Provenance Analysis of Archaeological Artifacts via Multimodal RAG Systems
- arxiv url: http://arxiv.org/abs/2509.20769v1
- Date: Thu, 25 Sep 2025 05:52:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-26 20:58:12.714149
- Title: Provenance Analysis of Archaeological Artifacts via Multimodal RAG Systems
- Title(参考訳): マルチモーダルRAGシステムによる考古学的アーティファクトの出現解析
- Authors: Tuo Zhang, Yuechun Sun, Ruiliang Liu,
- Abstract要約: 本稿では,考古学的遺物の発見分析のためのRAGに基づくシステムを提案する。
このシステムは、参照テキストや画像からデュアルモーダルな知識ベースを構築し、ビジュアル、エッジ強化、セマンティック検索を可能にする。
大英博物館の東ユーラシア青銅器群について評価を行った。
- 参考スコア(独自算出の注目度): 10.02915777208789
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we present a retrieval-augmented generation (RAG)-based system for provenance analysis of archaeological artifacts, designed to support expert reasoning by integrating multimodal retrieval and large vision-language models (VLMs). The system constructs a dual-modal knowledge base from reference texts and images, enabling raw visual, edge-enhanced, and semantic retrieval to identify stylistically similar objects. Retrieved candidates are synthesized by the VLM to generate structured inferences, including chronological, geographical, and cultural attributions, alongside interpretive justifications. We evaluate the system on a set of Eastern Eurasian Bronze Age artifacts from the British Museum. Expert evaluation demonstrates that the system produces meaningful and interpretable outputs, offering scholars concrete starting points for analysis and significantly alleviating the cognitive burden of navigating vast comparative corpora.
- Abstract(参考訳): 本研究では,多モーダル検索と大規模視覚言語モデル(VLM)を統合することにより,専門家による推論を支援するために,考古学的アーティファクトの証明分析のための検索強化世代(RAG)システムを提案する。
このシステムは、参照テキストや画像からデュアルモーダルな知識ベースを構築し、ビジュアル、エッジ強化、セマンティック検索により、スタイリスティックに類似したオブジェクトを識別する。
検索候補はVLMによって合成され、時間的、地理的、文化的属性を含む構造的推論と解釈的正当化を生成する。
大英博物館の東ユーラシア青銅器群について評価を行った。
専門家による評価は、このシステムが有意義で解釈可能なアウトプットを生成し、研究者に分析のための具体的な出発点を提供し、巨大な比較コーパスをナビゲートする際の認知的負担を著しく軽減していることを示している。
関連論文リスト
- Explain Before You Answer: A Survey on Compositional Visual Reasoning [74.27548620675748]
構成的視覚推論は、マルチモーダルAIにおける重要な研究フロンティアとして登場した。
本調査は,トップ会場(CVPR,ICCV,NeurIPS,ICML,ACLなど)から260以上の論文を体系的にレビューする。
次に60以上のベンチマークとそれに対応するメトリクスを、基底精度、連鎖忠実性、高分解能知覚などの次元に沿って探索する。
論文 参考訳(メタデータ) (2025-08-24T11:01:51Z) - Federated Retrieval-Augmented Generation: A Systematic Mapping Study [11.931695766266879]
Federated Retrieval-Augmented Generation (Federated RAG)は、Federated Learning (FL)とRetrieval-Augmented Generation (RAG)を組み合わせる。
RAGは、外部知識のアウトプットを基礎にして、言語モデルの事実精度を向上させる。
本稿では,2020年から2025年の間に出版された文献を対象とした,フェデレートRAGの体系的マッピング研究について紹介する。
論文 参考訳(メタデータ) (2025-05-24T23:45:12Z) - Improving Multilingual Retrieval-Augmented Language Models through Dialectic Reasoning Argumentations [65.11348389219887]
そこで,Dialectic-RAG(Dialectic-RAG, DRAG)を提案する。
我々は、文脈内学習戦略と、より小さなモデルをインストラクションするための実演の構築の両方において、我々のフレームワークが与える影響を示す。
論文 参考訳(メタデータ) (2025-04-07T06:55:15Z) - A Survey of Model Architectures in Information Retrieval [59.61734783818073]
2019年から現在までの期間は、情報検索(IR)と自然言語処理(NLP)における最大のパラダイムシフトの1つとなっている。
従来の用語ベースの手法から現代のニューラルアプローチまで,特にトランスフォーマーベースのモデルとそれに続く大規模言語モデル(LLM)の影響が注目されている。
今後の課題と今後の方向性について、先見的な議論で締めくくります。
論文 参考訳(メタデータ) (2025-02-20T18:42:58Z) - OracleSage: Towards Unified Visual-Linguistic Understanding of Oracle Bone Scripts through Cross-Modal Knowledge Fusion [19.788896054132053]
中国最古の成熟した書記システムであるOracle bone script (OBS) は、自動認識において重大な課題を提起している。
私たちは、階層的な視覚的理解とグラフベースのセマンティック推論を統合する新しいクロスモーダルフレームワークであるOracleSageを紹介します。
論文 参考訳(メタデータ) (2024-11-26T19:26:06Z) - Multi-Dialectal Representation Learning of Sinitic Phonology [0.0]
Sinitic Historical Phonologyでは、機械学習の恩恵を受けることができる注目すべきタスクとして、方言の比較と原語体系の再構築がある。
そこで本研究では,Sinite 音節の多言語表現を得るためのアプローチを提案する。
論文 参考訳(メタデータ) (2023-06-30T02:37:25Z) - Multimodal Relation Extraction with Cross-Modal Retrieval and Synthesis [89.04041100520881]
本研究は,対象物,文,画像全体に基づいて,テキストおよび視覚的証拠を検索することを提案する。
我々は,オブジェクトレベル,画像レベル,文レベル情報を合成し,同一性と異なるモダリティ間の推論を改善する新しい手法を開発した。
論文 参考訳(メタデータ) (2023-05-25T15:26:13Z) - Knowledge Graph Augmented Network Towards Multiview Representation
Learning for Aspect-based Sentiment Analysis [96.53859361560505]
本稿では,知識グラフ拡張ネットワーク(KGAN)を提案する。
KGANは感情の特徴表現を、文脈、構文、知識に基づく複数の視点から捉えている。
3つの人気のあるABSAベンチマークの実験は、我々のKGANの有効性と堅牢性を示している。
論文 参考訳(メタデータ) (2022-01-13T08:25:53Z) - The computerization of archaeology: survey on AI techniques [6.985152632198481]
本論文は, 人工知能技術の考古学分野及びより具体的には, a) 展示の組織化のための創造的刺激としてのソフトウェアツールの利用について分析する。
遺跡出土の破片の分類及び陶器の復元
人類のカタログ化と研究は、属する社会的・歴史的文脈を理解するためである。
人類が到達できない深部に位置する海洋考古学遺跡の探査のための調査の設計は、自由に探索可能な3Dバージョンの構築を通じて行われた。
論文 参考訳(メタデータ) (2020-05-05T17:09:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。