論文の概要: A Multimodal Approach to Heritage Preservation in the Context of Climate Change
- arxiv url: http://arxiv.org/abs/2510.14136v1
- Date: Wed, 15 Oct 2025 22:07:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:14.638099
- Title: A Multimodal Approach to Heritage Preservation in the Context of Climate Change
- Title(参考訳): 気候変動の文脈における遺産保存へのマルチモーダルアプローチ
- Authors: David Roqui, Adèle Cormier, nistor Grozavu, Ann Bourges,
- Abstract要約: 本稿では,センサデータ(温度,湿度)と視覚画像とを融合させて,遺産の重症度を予測する軽量なマルチモーダルアーキテクチャを提案する。
ストラスブール大聖堂からのデータでは、標準的なマルチモーダルアーキテクチャよりも43%向上した76.9%のアクク・レシーを達成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cultural heritage sites face accelerating degradation due to climate change, yet tradi- tional monitoring relies on unimodal analysis (visual inspection or environmental sen- sors alone) that fails to capture the complex interplay between environmental stres- sors and material deterioration. We propose a lightweight multimodal architecture that fuses sensor data (temperature, humidity) with visual imagery to predict degradation severity at heritage sites. Our approach adapts PerceiverIO with two key innovations: (1) simplified encoders (64D latent space) that prevent overfitting on small datasets (n=37 training samples), and (2) Adaptive Barlow Twins loss that encourages modality complementarity rather than redundancy. On data from Strasbourg Cathedral, our model achieves 76.9% accu- racy, a 43% improvement over standard multimodal architectures (VisualBERT, Trans- former) and 25% over vanilla PerceiverIO. Ablation studies reveal that sensor-only achieves 61.5% while image-only reaches 46.2%, confirming successful multimodal synergy. A systematic hyperparameter study identifies an optimal moderate correlation target ({\tau} =0.3) that balances align- ment and complementarity, achieving 69.2% accuracy compared to other {\tau} values ({\tau} =0.1/0.5/0.7: 53.8%, {\tau} =0.9: 61.5%). This work demonstrates that architectural sim- plicity combined with contrastive regularization enables effective multimodal learning in data-scarce heritage monitoring contexts, providing a foundation for AI-driven con- servation decision support systems.
- Abstract(参考訳): 文化遺産は、気候変動による劣化が加速するが、トラディオンタルモニタリングは、環境ストロースと物質劣化の間の複雑な相互作用を捉えるのに失敗する、単調な分析(視覚検査または環境センセールのみ)に依存している。
本稿では,センサデータ(温度,湿度)を視覚的に融合させ,遺産の劣化度を予測する軽量なマルチモーダルアーキテクチャを提案する。
提案手法はPerceiverIOに,(1)小さなデータセット(n=37のトレーニングサンプル)への過度な適合を防止する簡易エンコーダ(64D潜在空間),(2)冗長性よりもモダリティの相補性を促進する適応バーローツインズ損失の2つの重要なイノベーションを取り入れた。
ストラスブール大聖堂のデータによると、私たちのモデルは76.9%のアクク・レシー、標準的なマルチモーダルアーキテクチャ(VisualBERT、Trans- former)の43%の改善、バニラ・ペルセヴェリオの25%を達成している。
アブレーション研究により、センサーのみは61.5%、画像のみは46.2%に達することが判明し、マルチモーダル・シナジーが成功している。
系統的ハイパーパラメーター研究は、整合度と相補性のバランスをとる最適な適度な相関ターゲット({\tau} =0.3)を特定し、他の {\tau}値({\tau} =0.1/0.5/0.7: 53.8%、 {\tau} =0.9: 61.5%)と比較して69.2%の精度を達成している。
この研究は、アーキテクチャのシム・プライオリティと対照的な正規化を組み合わせることで、データスカース遺産監視のコンテキストにおける効果的なマルチモーダル学習を可能にし、AI駆動のコンサーブレーション決定支援システムの基盤を提供することを示す。
関連論文リスト
- Breaking the Statistical Similarity Trap in Extreme Convection Detection [0.0]
ディープラーニング気象モデルの現在の評価指標は、希少で高影響のイベントを欠いている間、ぼやけた予測に報いる。
DARTは、粗大な大気予測を高解像度の衛星温度場に変換するという課題に対処するフレームワークである。
DARTは、背景/極端分解、物理的にモチベーションを得たオーバーサンプリング、タスク固有の損失関数を備えたデュアルデコーダアーキテクチャを採用している。
論文 参考訳(メタデータ) (2025-09-11T07:10:45Z) - ReconMOST: Multi-Layer Sea Temperature Reconstruction with Observations-Guided Diffusion [48.540756751934836]
ReconMOSTは多層水温再構築のためのデータ駆動誘導拡散モデルフレームワークである。
提案手法はMLベースのSST再構成をグローバルな多層設定に拡張し,92.5%以上の欠落データを処理する。
論文 参考訳(メタデータ) (2025-06-12T06:27:22Z) - A Statistical Evaluation of Indoor LoRaWAN Environment-Aware Propagation for 6G: MLR, ANOVA, and Residual Distribution Analysis [6.8093214146903875]
本研究では,1,328,334フィールドの広範囲なデータセットを用いて,複雑度を捕捉・解析するための2段階のアプローチを提案する。
従来の伝搬測定値と,提案する環境変数による拡張を含む,多重線形回帰モデルを実装した。
分散分析を用いて、これらの環境要因を追加することで、説明できない分散を42.22%削減できることを示した。
論文 参考訳(メタデータ) (2025-04-23T13:19:35Z) - Benchmarking Reasoning Robustness in Large Language Models [76.79744000300363]
新規データや不完全データでは,性能が著しく低下することがわかった。
これらの結果は、厳密な論理的推論に対するリコールへの依存を浮き彫りにした。
本稿では,情報不足によって引き起こされる幻覚を利用して推論ギャップを明らかにする,Math-RoBと呼ばれる新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2025-03-06T15:36:06Z) - Layer Pruning with Consensus: A Triple-Win Solution [0.0]
レイヤ・プルーニングのアプローチは、しばしば、レイヤの複雑な基盤となる特性を完全に捉えない単一の基準に依存します。
本稿では,複数の類似度指標を,コンセンサス基準(Consensus criterion)と呼ばれる低重要層の単一の表現尺度に組み合わせた新しい手法を提案する。
本手法は,低精度低下,高性能化,敵攻撃に対するロバスト性の向上という3つの解を提供する。
論文 参考訳(メタデータ) (2024-11-21T17:41:27Z) - Scaling Data Generation in Vision-and-Language Navigation [116.95534559103788]
本稿では,学習のための大規模データ生成に有効なパラダイムを提案する。
我々は、HM3DとGibsonのデータセットから1200以上のフォトリアリスティック環境を適用し、490万の命令軌道対を合成する。
我々の大規模データセットのおかげで、既存のエージェントの性能は(以前のSoTAでは+11%絶対)、単純な模倣学習によってR2Rテストの分割で80%の単ラン成功率で大幅に向上できる。
論文 参考訳(メタデータ) (2023-07-28T16:03:28Z) - Patch-Level Contrasting without Patch Correspondence for Accurate and
Dense Contrastive Representation Learning [79.43940012723539]
ADCLRは、正確で高密度な視覚表現を学習するための自己教師型学習フレームワークである。
提案手法は, コントラッシブな手法のための新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-23T07:38:09Z) - Towards a Competitive End-to-End Speech Recognition for CHiME-6 Dinner
Party Transcription [73.66530509749305]
本稿では,難しい場合であっても,ハイブリッドベースラインに近い性能を示すエンドツーエンドアプローチについて論じる。
CTC-Attention と RNN-Transducer のアプローチと RNN と Transformer のアーキテクチャを比較し,解析する。
RNN-Transducerをベースとしたベストエンド・ツー・エンドモデルでは、ビームサーチの改善とともに、LF-MMI TDNN-F CHiME-6 Challengeのベースラインよりも品質が3.8%向上した。
論文 参考訳(メタデータ) (2020-04-22T19:08:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。