論文の概要: Identification of Stone Deterioration Patterns with Large Multimodal Models
- arxiv url: http://arxiv.org/abs/2406.03207v1
- Date: Wed, 5 Jun 2024 12:44:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-06 18:30:28.148474
- Title: Identification of Stone Deterioration Patterns with Large Multimodal Models
- Title(参考訳): 大規模マルチモーダルモデルによる石の劣化パターンの同定
- Authors: Daniele Corradetti, Jose Delgado Rodrigues,
- Abstract要約: 岩盤要素の異常や劣化パターンを認識し,分類するための基礎的マルチモーダルモデルの能力を評価する。
主な石の劣化パターンと異常の分類を定式化した上で, 石造遺産の高度に代表的な354点の選抜をモデルに依頼した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The conservation of stone-based cultural heritage sites is a critical concern for preserving cultural and historical landmarks. With the advent of Large Multimodal Models, as GPT-4omni (OpenAI), Claude 3 Opus (Anthropic) and Gemini 1.5 Pro (Google), it is becoming increasingly important to define the operational capabilities of these models. In this work, we systematically evaluate the abilities of the main foundational multimodal models to recognise and classify anomalies and deterioration patterns of the stone elements that are useful in the practice of conservation and restoration of world heritage. After defining a taxonomy of the main stone deterioration patterns and anomalies, we asked the foundational models to identify a curated selection of 354 highly representative images of stone-built heritage, offering them a careful selection of labels to choose from. The result, which varies depending on the type of pattern, allowed us to identify the strengths and weaknesses of these models in the field of heritage conservation and restoration.
- Abstract(参考訳): 石をベースとした文化財の保存は、文化的・歴史的建造物の保存にとって重要な関心事である。
GPT-4omni (OpenAI)、Claude 3 Opus (Anthropic)、Gemini 1.5 Pro (Google)といった大規模マルチモーダルモデルの出現に伴い、これらのモデルの運用機能を定義することがますます重要になっている。
本研究では,世界遺産の保全と復元に有用な石元素の異常や劣化パターンを認識し,分類する基礎的マルチモーダルモデルの能力を体系的に評価する。
主な石の劣化パターンと異常の分類を定式化した上で,石造遺産の高度に代表される354枚の画像のキュレートされた選別を基本モデルに求め,選別対象のラベルを慎重に選別した。
パターンの種類によって異なる結果から,保存・復元の分野において,これらのモデルの強みと弱みを識別することができた。
関連論文リスト
- Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Causal Estimation of Memorisation Profiles [58.20086589761273]
言語モデルにおける記憶の理解は、実践的および社会的意味を持つ。
覚書化(英: Memorisation)とは、モデルがそのインスタンスを予測できる能力に対して、あるインスタンスでトレーニングを行うことによる因果的影響である。
本稿では,計量学の差分差分設計に基づく,新しい,原理的,効率的な記憶推定法を提案する。
論文 参考訳(メタデータ) (2024-06-06T17:59:09Z) - Diverse Feature Learning by Self-distillation and Reset [0.5221459608786241]
本稿では,重要な特徴保存アルゴリズムと新しい特徴学習アルゴリズムを組み合わせたDFLを紹介する。
重要な特徴を保存するために、トレーニング中に観察される意味のあるモデルの重みを選択することで、アンサンブルモデルの自己蒸留を利用する。
新機能の学習には、定期的にモデルの一部を初期化するリセットを採用しています。
論文 参考訳(メタデータ) (2024-03-29T02:49:15Z) - PFStorer: Personalized Face Restoration and Super-Resolution [19.479263766534345]
顔修復の最近の進歩は、高品質でライフスタイルのアウトプットを生み出すことに顕著な成果を上げている。
しかし、驚くべき結果は、モデルに必要なコンテキストが欠如しているため、人のアイデンティティに忠実でないことがしばしばあります。
提案手法では, 個人像を用いて復元モデルをパーソナライズし, 詳細な情報を保持しつつ, 個人像に対して調整した復元を行う。
論文 参考訳(メタデータ) (2024-03-13T11:39:30Z) - From Pampas to Pixels: Fine-Tuning Diffusion Models for Ga\'ucho
Heritage [0.0]
本稿では, 地域文化概念, 歴史人物, 絶滅危惧種の表現における潜在拡散モデル (LDM) の可能性について考察する。
我々の目標は、生産モデルが地域の文化的・歴史的アイデンティティを捉え保存するのにどう役立つか、より広い理解に貢献することである。
論文 参考訳(メタデータ) (2024-01-10T19:34:52Z) - A 3M-Hybrid Model for the Restoration of Unique Giant Murals: A Case
Study on the Murals of Yongle Palace [2.9491988705158843]
ヨンレ宮殿壁画の巨大なサイズとユニークなデータは、既存の深層学習に基づく復元手法の課題を提示する。
これらの課題に対処するために、3M-Hybridモデルが提案されている。
SSIMとPSNRをそれぞれ14.61%、PSNRを4.73%改善している。
論文 参考訳(メタデータ) (2023-09-12T13:03:32Z) - Subjectivity in Unsupervised Machine Learning Model Selection [2.9370710299422598]
本研究では、モデル選択に関わる主観性を調べる例として、隠れマルコフモデルを用いる。
主観性の源泉には、異なる基準とメトリクスの重要性についての異なる意見、モデルがどのように同化されるべきなのか、データセットのサイズがモデル選択にどのように影響するかについての異なる見解が含まれる。
論文 参考訳(メタデータ) (2023-09-01T01:40:58Z) - Minimal Value-Equivalent Partial Models for Scalable and Robust Planning
in Lifelong Reinforcement Learning [56.50123642237106]
モデルに基づく強化学習における一般的な実践は、エージェントの環境のあらゆる側面をモデル化するモデルを学ぶことである。
このようなモデルは、生涯にわたる強化学習シナリオにおいて、スケーラブルで堅牢な計画を実行するのに特に適していない、と我々は主張する。
我々は,「最小値部分モデル」と呼ぶ,環境の関連する側面のみをモデル化する新しい種類のモデルを提案する。
論文 参考訳(メタデータ) (2023-01-24T16:40:01Z) - On the Opportunities and Risks of Foundation Models [256.61956234436553]
これらのモデルの基礎モデルは、批判的に中心的だが不完全な性格を根底から立証するものです。
本報告では,基礎モデルの可能性とリスクについて概説する。
これらの疑問に対処するためには、基礎モデルに関する重要な研究の多くは、深い学際的なコラボレーションが必要であると信じている。
論文 参考訳(メタデータ) (2021-08-16T17:50:08Z) - Improving the Reconstruction of Disentangled Representation Learners via Multi-Stage Modeling [55.28436972267793]
現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。
本稿では,不整合因子をペナルティに基づく不整合表現学習法を用いて学習する,新しい多段階モデリング手法を提案する。
次に、低品質な再構成を、欠落した関連潜伏変数をモデル化するために訓練された別の深層生成モデルで改善する。
論文 参考訳(メタデータ) (2020-10-25T18:51:15Z) - Orthogonal Deep Models As Defense Against Black-Box Attacks [71.23669614195195]
攻撃者が標的モデルに類似したモデルを用いて攻撃を発生させるブラックボックス設定における深層モデル固有の弱点について検討する。
本稿では,深部モデルの内部表現を他のモデルに直交させる新しい勾配正規化手法を提案する。
様々な大規模モデルにおいて,本手法の有効性を検証する。
論文 参考訳(メタデータ) (2020-06-26T08:29:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。