論文の概要: A Preliminary Survey of Semantic Descriptive Model for Images
- arxiv url: http://arxiv.org/abs/2501.08352v1
- Date: Mon, 13 Jan 2025 08:40:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-16 16:46:28.25971
- Title: A Preliminary Survey of Semantic Descriptive Model for Images
- Title(参考訳): 画像のセマンティック記述モデルに関する予備調査
- Authors: Chengxi Yan, Jie Jian, Yang Li,
- Abstract要約: 本研究は北京宮殿博物館の ACP コレクションを利用して,図形学理論と用語抽出・マッピングの新しいワークフローを統合した意味モデルを構築した。
SDMは,より芸術的な知識組織とACPの文化的探究を支援するのに有効である。
- 参考スコア(独自算出の注目度): 2.4092255769809485
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Considering the lack of a unified framework for image description and deep cultural analysis at the subject level in the field of Ancient Chinese Paintings (ACP), this study utilized the Beijing Palace Museum's ACP collections to develop a semantic model integrating the iconological theory with a new workflow for term extraction and mapping. Our findings underscore the model's effectiveness. SDM can be used to support further art-related knowledge organization and cultural exploration of ACPs.
- Abstract(参考訳): 古代中国絵画(ACP)の主題レベルでのイメージ記述と深層文化分析の統一的枠組みが欠如していることを踏まえ,北京宮殿美術館のACPコレクションを用いて,図形学理論と用語抽出・マッピングの新しいワークフローを融合した意味モデルを構築した。
本研究の結果は, モデルの有効性を裏付けるものである。
SDMは、アート関連の知識組織とACPの文化的探究を支援するために使用できる。
関連論文リスト
- An Image is Worth $K$ Topics: A Visual Structural Topic Model with Pretrained Image Embeddings [40.701557052493214]
本稿では、事前学習した画像埋め込みと構造トピックモデルを組み合わせた視覚構造トピックモデル(vSTM)を提案する。
我々は、vSTMが、オンライン政治コミュニケーションの研究に、解釈可能で、一貫性があり、実質的に関係のあるトピックを特定できることを示した。
論文 参考訳(メタデータ) (2025-04-14T09:07:11Z) - Multi-Modal Foundation Models for Computational Pathology: A Survey [32.25958653387204]
基礎モデルは、計算病理学(CPath)の強力なパラダイムとして登場した。
我々は、32の最先端マルチモーダル基盤モデルを、視覚言語、視覚知識グラフ、視覚生成表現の3つの主要なパラダイムに分類する。
病理学に適した28の利用可能なマルチモーダルデータセットを分析し、画像テキストペア、命令データセット、画像以外のモダリティペアにグループ化する。
論文 参考訳(メタデータ) (2025-03-12T06:03:33Z) - A Survey of Model Architectures in Information Retrieval [64.75808744228067]
機能抽出のためのバックボーンモデルと、関連性推定のためのエンドツーエンドシステムアーキテクチャの2つの重要な側面に焦点を当てる。
従来の用語ベースの手法から現代のニューラルアプローチまで,特にトランスフォーマーベースのモデルとそれに続く大規模言語モデル(LLM)の影響が注目されている。
我々は、パフォーマンスとスケーラビリティのアーキテクチャ最適化、マルチモーダル、マルチランガルデータの処理、従来の検索パラダイムを超えた新しいアプリケーションドメインへの適応など、新たな課題と今後の方向性について議論することで結論付けた。
論文 参考訳(メタデータ) (2025-02-20T18:42:58Z) - A Framework for Critical Evaluation of Text-to-Image Models: Integrating Art Historical Analysis, Artistic Exploration, and Critical Prompt Engineering [0.0]
本稿では,テキスト・ツー・イメージ・モデルの批判的評価のための新たな学際的枠組みを提案する。
アート・ヒストリカル・アナリティクス、芸術的な探究、重要なプロンプト・エンジニアリングを統合することで、このフレームワークはこれらのモデルの能力と社会的意味についてより微妙な理解を提供する。
ケーススタディは、このフレームワークの実践的応用を実証し、性別、人種、文化的表現に関連するバイアスを明らかにする方法を示している。
論文 参考訳(メタデータ) (2024-12-17T10:35:27Z) - Physics Meets Pixels: PDE Models in Image Processing [55.2480439325792]
部分微分方程式 (Partial Differential Equations, PDE) は、画像処理と解析のための強力なツールとして長年認識されてきた。
画像処理タスクに特化して設計された新しい物理ベースPDEモデルを提案する。
論文 参考訳(メタデータ) (2024-12-11T23:11:50Z) - Language Model as Visual Explainer [72.88137795439407]
本稿では,木構造言語学的説明を用いた視覚モデル解釈のための体系的アプローチを提案する。
提案手法は,属性を付与した木の形で人間に理解可能な説明を提供する。
提案手法の有効性を確認するため,新しいベンチマークを導入し,厳密な評価を行う。
論文 参考訳(メタデータ) (2024-12-08T20:46:23Z) - PCEvE: Part Contribution Evaluation Based Model Explanation for Human Figure Drawing Assessment and Beyond [5.104096700315427]
本稿では,PCEvE(Part Contribution Evaluation based model explanation)フレームワークを提案する。
既存の属性ベースのXAIアプローチとは異なり、PCEvEはモデル決定の簡単な説明を提供する。
複数のHFDアセスメントデータセットに関する広範な実験を通じて,PCEvEを厳格に検証する。
論文 参考訳(メタデータ) (2024-09-26T20:13:03Z) - ComKD-CLIP: Comprehensive Knowledge Distillation for Contrastive Language-Image Pre-traning Model [49.587821411012705]
コントラスト言語画像前処理モデルのための包括的知識蒸留法ComKD-CLIPを提案する。
大規模な教師CLIPモデルからより小さな学生モデルに知識を抽出し、パラメータを著しく減らして同等のパフォーマンスを確保する。
EduAttentionは教師モデルで抽出したテキスト特徴と学生モデルで抽出した画像特徴との相互関係を探索する。
論文 参考訳(メタデータ) (2024-08-08T01:12:21Z) - Explore In-Context Segmentation via Latent Diffusion Models [132.26274147026854]
潜在拡散モデル(LDM)は、文脈内セグメンテーションに有効な最小限のモデルである。
画像とビデオの両方のデータセットを含む、新しい、公正なコンテキスト内セグメンテーションベンチマークを構築します。
論文 参考訳(メタデータ) (2024-03-14T17:52:31Z) - Learning to Extract Structured Entities Using Language Models [52.281701191329]
機械学習の最近の進歩は、情報抽出の分野に大きな影響を与えている。
タスクをエンティティ中心にすることで、さまざまなメトリクスの使用を可能にします。
我々は、Structured Entity extractを導入し、Adroximate Entity Set OverlaPメトリックを提案し、この分野にコントリビュートします。
論文 参考訳(メタデータ) (2024-02-06T22:15:09Z) - From Knowledge Representation to Knowledge Organization and Back [11.970701039437493]
知識表現(KR)と顔分析知識組織(KO)は、データと知識モデリングの最も顕著な2つの方法論である。
本稿では,KR法とfacet-analytical KO法の両方を詳細に解明し,それらの機能的マッピングを提供する。
論文 参考訳(メタデータ) (2023-12-12T14:23:18Z) - Diffusion Models for Image Restoration and Enhancement -- A
Comprehensive Survey [96.99328714941657]
本稿では,近年の拡散モデルに基づく画像復元手法について概観する。
我々は、赤外線とブラインド/現実世界の両方で拡散モデルを用いて、革新的なデザインを分類し、強調する。
本稿では,拡散モデルに基づくIRの今後の研究に向けた5つの可能性と課題を提案する。
論文 参考訳(メタデータ) (2023-08-18T08:40:38Z) - A Diagnostic Study of Explainability Techniques for Text Classification [52.879658637466605]
既存の説明可能性技術を評価するための診断特性のリストを作成する。
そこで本研究では, モデルの性能と有理性との整合性の関係を明らかにするために, 説明可能性手法によって割り当てられた有理性スコアと有理性入力領域の人間のアノテーションを比較した。
論文 参考訳(メタデータ) (2020-09-25T12:01:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。