論文の概要: LLM-Powered Agents for Navigating Venice's Historical Cadastre
- arxiv url: http://arxiv.org/abs/2505.17148v1
- Date: Thu, 22 May 2025 08:45:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.61162
- Title: LLM-Powered Agents for Navigating Venice's Historical Cadastre
- Title(参考訳): ヴェネツィアの歴史的カダストレを航海するLLMエージェント
- Authors: Tristan Karch, Jakhongir Saydaliev, Isabella Di Lenardo, Frédéric Kaplan,
- Abstract要約: カダストラルデータは、都市の歴史的組織に関する重要な情報を明らかにするが、多種多様なフォーマットや人間のアノテーションのために、しばしば標準化されていない。
我々は1740年から1808年までのケーススタディを探求し、古代共和国の滅亡とアンシエン・ルゲームの移行を捉えた。
この時代の複雑なカダストラルデータは、その体積と均一な構造が欠如していることが特徴であり、我々のアプローチが順応的にナビゲートする固有の課題を示している。
- 参考スコア(独自算出の注目度): 1.9963546427905992
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cadastral data reveal key information about the historical organization of cities but are often non-standardized due to diverse formats and human annotations, complicating large-scale analysis. We explore as a case study Venice's urban history during the critical period from 1740 to 1808, capturing the transition following the fall of the ancient Republic and the Ancien R\'egime. This era's complex cadastral data, marked by its volume and lack of uniform structure, presents unique challenges that our approach adeptly navigates, enabling us to generate spatial queries that bridge past and present urban landscapes. We present a text-to-programs framework that leverages Large Language Models (LLMs) to translate natural language queries into executable code for processing historical cadastral records. Our methodology implements two complementary techniques: a text-to-SQL approach for handling structured queries about specific cadastral information, and a text-to-Python approach for complex analytical operations requiring custom data manipulation. We propose a taxonomy that classifies historical research questions based on their complexity and analytical requirements, mapping them to the most appropriate technical approach. This framework is supported by an investigation into the execution consistency of the system, alongside a qualitative analysis of the answers it produces. By ensuring interpretability and minimizing hallucination through verifiable program outputs, we demonstrate the system's effectiveness in reconstructing past population information, property features, and spatiotemporal comparisons in Venice.
- Abstract(参考訳): カダストラルデータは、都市の歴史的組織に関する重要な情報を明らかにするが、多種多様なフォーマットや人間のアノテーションのために、大規模な分析を複雑にするため、しばしば標準化されていない。
我々は、1740年から1808年までの臨界期のヴェネツィアの都市史を研究し、古代共和国の滅亡とアンシエン・ルゲームの移行を捉えた。
この時代の複雑なカダストラルデータは、その体積と均一な構造が欠如していることが特徴であり、我々のアプローチが順応的にナビゲートするユニークな課題を示し、過去の都市景観と現在の都市景観を橋渡しする空間的なクエリを生成することができる。
本稿では,Large Language Models(LLMs)を利用して,自然言語クエリを実行可能コードに変換し,履歴カダストラルレコードの処理を行う。
提案手法では,特定のカダストラル情報に関する構造化クエリを処理するテキスト・ツー・SQLアプローチと,カスタムデータ操作を必要とする複雑な解析操作を行うテキスト・ツー・Pythonアプローチの2つの補完手法を実装している。
本稿では,その複雑さと解析的要求に基づいて歴史的研究課題を分類し,それらを最も適切な技術的アプローチにマッピングする分類法を提案する。
このフレームワークは、システムが生成する回答の質的な分析とともに、システムの実行一貫性の調査によって支持されている。
検証可能なプログラム出力による解釈可能性の確保と幻覚の最小化により,ヴェネツィアにおける過去の人口情報,財産の特徴,時空間比較の再構築におけるシステムの有効性を実証した。
関連論文リスト
- AIstorian lets AI be a historian: A KG-powered multi-agent system for accurate biography generation [19.656423980933944]
本稿では,知識グラフ(KG)を利用した検索強化世代(RAG)とアンチハロシン化マルチエージェントを特徴とする,新しいエンドツーエンドエージェントシステムであるAIstorianを紹介する。
具体的には、AIstorianは、コンテキスト内学習に基づくチャンキング戦略と、正確で効率的な参照検索のためのKGベースのインデックスを導入している。
実生活の歴史的神史データセットの実験では、アリストリア語は実際の精度が3.8倍向上し、幻覚率も47.6%低下した。
論文 参考訳(メタデータ) (2025-03-14T12:23:45Z) - PICASO: Permutation-Invariant Context Composition with State Space Models [98.91198288025117]
State Space Models (SSM) は、コンテキストのデータベースを固定次元の状態にマッピング可能にすることで、有望なソリューションを提供する。
本研究では,SSM力学から導かれる単純な数学的関係を,生のコンテキストトークンの連結効果を効率的に近似する複数の状態に構成する。
我々は,WikiText と MSMARCO をゼロショットと微調整の両方で評価し,平均5.4倍のスピードアップを楽しみながら最強の演奏ベースラインと一致できることを示す。
論文 参考訳(メタデータ) (2025-02-24T19:48:00Z) - Long-Span Question-Answering: Automatic Question Generation and QA-System Ranking via Side-by-Side Evaluation [65.16137964758612]
大規模言語モデルにおける長文文の活用について検討し,本書全体の読解データを作成する。
我々の目的は、長いテキストの詳細な理解を必要とする問題を分析し、理解し、推論するLLMの能力をテストすることである。
論文 参考訳(メタデータ) (2024-05-31T20:15:10Z) - STaRK: Benchmarking LLM Retrieval on Textual and Relational Knowledge Bases [93.96463520716759]
テキストと知識ベースを用いた大規模半構造検索ベンチマークSTARKを開発した。
本ベンチマークでは, 製品検索, 学術論文検索, 精密医療におけるクエリの3分野について検討した。
多様なリレーショナル情報と複雑なテキスト特性を統合した,現実的なユーザクエリを合成する,新しいパイプラインを設計する。
論文 参考訳(メタデータ) (2024-04-19T22:54:54Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - LoRaLay: A Multilingual and Multimodal Dataset for Long Range and
Layout-Aware Summarization [19.301567079372436]
テキスト要約は、自然言語処理コミュニティにとって人気のある課題であり、研究の活発な領域である。
すべての公開可能な要約データセットは、プレーンテキストコンテンツのみを提供する。
視覚/レイ情報を伴う長距離要約のためのデータセットのコレクションであるLoRaLayを提示する。
論文 参考訳(メタデータ) (2023-01-26T18:50:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。