Fugu-MT 論文翻訳(概要): Identification of Stone Deterioration Patterns with Large Multimodal Models

論文の概要: Identification of Stone Deterioration Patterns with Large Multimodal Models

arxiv url: http://arxiv.org/abs/2406.03207v1
Date: Wed, 5 Jun 2024 12:44:49 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-06 18:30:28.148474
Title: Identification of Stone Deterioration Patterns with Large Multimodal Models
Title（参考訳）: 大規模マルチモーダルモデルによる石の劣化パターンの同定
Authors: Daniele Corradetti, Jose Delgado Rodrigues,
Abstract要約: 岩盤要素の異常や劣化パターンを認識し,分類するための基礎的マルチモーダルモデルの能力を評価する。主な石の劣化パターンと異常の分類を定式化した上で, 石造遺産の高度に代表的な354点の選抜をモデルに依頼した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The conservation of stone-based cultural heritage sites is a critical concern for preserving cultural and historical landmarks. With the advent of Large Multimodal Models, as GPT-4omni (OpenAI), Claude 3 Opus (Anthropic) and Gemini 1.5 Pro (Google), it is becoming increasingly important to define the operational capabilities of these models. In this work, we systematically evaluate the abilities of the main foundational multimodal models to recognise and classify anomalies and deterioration patterns of the stone elements that are useful in the practice of conservation and restoration of world heritage. After defining a taxonomy of the main stone deterioration patterns and anomalies, we asked the foundational models to identify a curated selection of 354 highly representative images of stone-built heritage, offering them a careful selection of labels to choose from. The result, which varies depending on the type of pattern, allowed us to identify the strengths and weaknesses of these models in the field of heritage conservation and restoration.
Abstract（参考訳）: 石をベースとした文化財の保存は、文化的・歴史的建造物の保存にとって重要な関心事である。 GPT-4omni (OpenAI)、Claude 3 Opus (Anthropic)、Gemini 1.5 Pro (Google)といった大規模マルチモーダルモデルの出現に伴い、これらのモデルの運用機能を定義することがますます重要になっている。本研究では,世界遺産の保全と復元に有用な石元素の異常や劣化パターンを認識し,分類する基礎的マルチモーダルモデルの能力を体系的に評価する。主な石の劣化パターンと異常の分類を定式化した上で,石造遺産の高度に代表される354枚の画像のキュレートされた選別を基本モデルに求め,選別対象のラベルを慎重に選別した。パターンの種類によって異なる結果から,保存・復元の分野において,これらのモデルの強みと弱みを識別することができた。

関連論文リスト

Holmes: Towards Effective and Harmless Model Ownership Verification to Personalized Large Vision Models via Decoupling Common Features [54.63343151319368]
本稿では、類似の共通特徴を分離し、パーソナライズされたモデルに対する無害モデルオーナシップ検証手法を提案する。最初の段階では、データセット固有の機能を中断しながら、犠牲者モデルの共通の特徴を保持するシャドウモデルを作成します。その後、メタ分類器が訓練され、被害者のデータセット固有の特徴を含む不審なモデルを決定することで、盗まれたモデルを特定する。
論文参考訳（メタデータ） (2025-06-24T15:40:11Z)
Preference Learning for AI Alignment: a Causal Perspective [55.2480439325792]
私たちはこの問題を因果パラダイムに枠組み化し、永続的な課題を特定するための因果関係の豊富なツールボックスを提供します。因果推論の文献を継承し、信頼性の高い一般化に必要な重要な仮定を特定する。そこで本研究では, 因果関係に基づくアプローチがモデルロバスト性をいかに改善するかを, ナイーブ報酬モデルの障害モードを例示する。
論文参考訳（メタデータ） (2025-06-06T10:45:42Z)
Synthetic History: Evaluating Visual Representations of the Past in Diffusion Models [0.6445605125467574]
HistVisデータセットは、3つの最先端拡散モデルによって生成される3万の合成画像のキュレートされたコレクションである。生成した画像は3つの重要な側面 – 暗黙のスティリスティック・アソシエーション, ヒストリシスタンス, デモグラフィック・リ表現 – で評価した。歴史的にテーマ化された画像の体系的不正確さは,TTIが非定型的スタイルを取り入れた過去のステレオタイプをしばしばモデル化していることから明らかとなった。
論文参考訳（メタデータ） (2025-05-18T13:35:23Z)
Synthetic Data for Portfolios: A Throw of the Dice Will Never Abolish Chance [0.0]
本稿では、特にポートフォリオとリスクマネジメントにおいて、生成モデルの限界についてより深く理解するために貢献する。本稿では,米国株式の宇宙における従来の評価基準を満たす多変量回帰生成のためのパイプラインを提案する。
論文参考訳（メタデータ） (2025-01-07T18:50:24Z)
RADIOv2.5: Improved Baselines for Agglomerative Vision Foundation Models [60.596005921295806]
集約モデルは、ビジョンファウンデーションモデルをトレーニングするための強力なアプローチとして現れています。我々は、解像度モードシフト、教師の不均衡、慣用的教師アーティファクト、過剰な出力トークンなど、重要な課題を識別する。本稿では,マルチレゾリューショントレーニング,モザイク強化,教師の損失関数のバランスの改善など,いくつかの新しいソリューションを提案する。
論文参考訳（メタデータ） (2024-12-10T17:06:41Z)
Cultural Heritage 3D Reconstruction with Diffusion Networks [0.6445605125467574]
文化遺産の修復における最近の生成AIアルゴリズムの利用について検討する。 3次元点雲を効率的に再構成するために設計された条件拡散モデル。
論文参考訳（メタデータ） (2024-10-14T15:43:40Z)
Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文参考訳（メタデータ） (2024-06-19T08:07:14Z)
Causal Estimation of Memorisation Profiles [58.20086589761273]
言語モデルにおける記憶の理解は、実践的および社会的意味を持つ。覚書化(英: Memorisation)とは、モデルがそのインスタンスを予測できる能力に対して、あるインスタンスでトレーニングを行うことによる因果的影響である。本稿では,計量学の差分差分設計に基づく,新しい,原理的,効率的な記憶推定法を提案する。
論文参考訳（メタデータ） (2024-06-06T17:59:09Z)
Diverse Feature Learning by Self-distillation and Reset [0.5221459608786241]
本稿では,重要な特徴保存アルゴリズムと新しい特徴学習アルゴリズムを組み合わせたDFLを紹介する。重要な特徴を保存するために、トレーニング中に観察される意味のあるモデルの重みを選択することで、アンサンブルモデルの自己蒸留を利用する。新機能の学習には、定期的にモデルの一部を初期化するリセットを採用しています。
論文参考訳（メタデータ） (2024-03-29T02:49:15Z)
PFStorer: Personalized Face Restoration and Super-Resolution [19.479263766534345]
顔修復の最近の進歩は、高品質でライフスタイルのアウトプットを生み出すことに顕著な成果を上げている。しかし、驚くべき結果は、モデルに必要なコンテキストが欠如しているため、人のアイデンティティに忠実でないことがしばしばあります。提案手法では, 個人像を用いて復元モデルをパーソナライズし, 詳細な情報を保持しつつ, 個人像に対して調整した復元を行う。
論文参考訳（メタデータ） (2024-03-13T11:39:30Z)
From Pampas to Pixels: Fine-Tuning Diffusion Models for Ga\'ucho Heritage [0.0]
本稿では, 地域文化概念, 歴史人物, 絶滅危惧種の表現における潜在拡散モデル (LDM) の可能性について考察する。我々の目標は、生産モデルが地域の文化的・歴史的アイデンティティを捉え保存するのにどう役立つか、より広い理解に貢献することである。
論文参考訳（メタデータ） (2024-01-10T19:34:52Z)
A 3M-Hybrid Model for the Restoration of Unique Giant Murals: A Case Study on the Murals of Yongle Palace [2.9491988705158843]
ヨンレ宮殿壁画の巨大なサイズとユニークなデータは、既存の深層学習に基づく復元手法の課題を提示する。これらの課題に対処するために、3M-Hybridモデルが提案されている。 SSIMとPSNRをそれぞれ14.61%、PSNRを4.73%改善している。
論文参考訳（メタデータ） (2023-09-12T13:03:32Z)
Minimal Value-Equivalent Partial Models for Scalable and Robust Planning in Lifelong Reinforcement Learning [56.50123642237106]
モデルに基づく強化学習における一般的な実践は、エージェントの環境のあらゆる側面をモデル化するモデルを学ぶことである。このようなモデルは、生涯にわたる強化学習シナリオにおいて、スケーラブルで堅牢な計画を実行するのに特に適していない、と我々は主張する。我々は,「最小値部分モデル」と呼ぶ,環境の関連する側面のみをモデル化する新しい種類のモデルを提案する。
論文参考訳（メタデータ） (2023-01-24T16:40:01Z)
On the Opportunities and Risks of Foundation Models [256.61956234436553]
これらのモデルの基礎モデルは、批判的に中心的だが不完全な性格を根底から立証するものです。本報告では,基礎モデルの可能性とリスクについて概説する。これらの疑問に対処するためには、基礎モデルに関する重要な研究の多くは、深い学際的なコラボレーションが必要であると信じている。
論文参考訳（メタデータ） (2021-08-16T17:50:08Z)
Improving the Reconstruction of Disentangled Representation Learners via Multi-Stage Modeling [54.94763543386523]
現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。本稿では,不整合因子をペナルティに基づく不整合表現学習法を用いて学習する,新しい多段階モデリング手法を提案する。次に、低品質な再構成を、欠落した関連潜伏変数をモデル化するために訓練された別の深層生成モデルで改善する。
論文参考訳（メタデータ） (2020-10-25T18:51:15Z)
Orthogonal Deep Models As Defense Against Black-Box Attacks [71.23669614195195]
攻撃者が標的モデルに類似したモデルを用いて攻撃を発生させるブラックボックス設定における深層モデル固有の弱点について検討する。本稿では,深部モデルの内部表現を他のモデルに直交させる新しい勾配正規化手法を提案する。様々な大規模モデルにおいて,本手法の有効性を検証する。
論文参考訳（メタデータ） (2020-06-26T08:29:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。