論文の概要: (Re)framing Built Heritage through the Machinic Gaze
- arxiv url: http://arxiv.org/abs/2310.04628v1
- Date: Fri, 6 Oct 2023 23:48:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 17:10:48.571511
- Title: (Re)framing Built Heritage through the Machinic Gaze
- Title(参考訳): (再)マシニック・ガゼを通して建築遺産を造る
- Authors: Vanicka Arora, Liam Magee, Luke Munn
- Abstract要約: 機械学習とビジョン技術の普及は、遺産の新たな光学的レギュレーションを生み出している、と我々は主張する。
我々は,AIモデルによる遺産表現の再構成を概念化するために,「機械的視線」という用語を導入する。
- 参考スコア(独自算出の注目度): 3.683202928838613
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Built heritage has been both subject and product of a gaze that has been
sustained through moments of colonial fixation on ruins and monuments,
technocratic examination and representation, and fetishisation by aglobal
tourist industry. We argue that the recent proliferation of machine learning
and vision technologies create new scopic regimes for heritage: storing and
retrieving existing images from vast digital archives, and further imparting
their own distortions upon its visual representation. We introduce the term
`machinic gaze' to conceptualise the reconfiguration of heritage representation
via AI models. To explore how this gaze reframes heritage, we deploy an
image-text-image pipeline that reads, interprets, and resynthesizes images of
several UNESCO World Heritage Sites. Employing two concepts from media studies
-- heteroscopia and anamorphosis -- we describe the reoriented perspective that
machine vision systems introduce. We propose that the machinic gaze highlights
the artifice of the human gaze and its underlying assumptions and practices
that combine to form established notions of heritage.
- Abstract(参考訳): 建築遺産は、遺跡やモニュメントに植民地が定着した瞬間、テクノクラティックな検査と表現、そして世界規模の観光産業によるフェチシゼーションを通じて維持されてきた視線の主題と産物である。
近年の機械学習とビジョン技術の普及は、既存の画像を巨大なデジタルアーカイブから保存・検索し、さらにその視覚的表現に歪みを与えるという、遺産の新たな可視的レギュレーションを生み出している、と我々は主張する。
本稿では,AIモデルによる遺産表現の再構成を概念化する「機械的視線」という用語を紹介する。
この視点がどのように遺産を再構成するかを探るため、ユネスコの世界遺産の画像を読み取り、解釈し、再合成するイメージテキストイメージパイプラインをデプロイします。
ヘテロスコピアとアナモルフィシスというメディア研究の2つの概念を用いて、機械ビジョンシステムがもたらす方向転換の視点について述べる。
本研究は,人間の視線の構図と,その根底にある前提と実践を強調し,確立された遺産概念を形成することを提案する。
関連論文リスト
- KITTEN: A Knowledge-Intensive Evaluation of Image Generation on Visual Entities [93.74881034001312]
テキスト・画像生成モデルにおける実体の忠実度に関する系統的研究を行う。
我々はランドマークの建物、航空機、植物、動物など、幅広い現実世界の視覚的実体を生成する能力に焦点をあてる。
その結果、最も高度なテキスト・画像モデルでさえ、正確な視覚的詳細を持つエンティティを生成できないことが判明した。
論文 参考訳(メタデータ) (2024-10-15T17:50:37Z) - When Does Perceptual Alignment Benefit Vision Representations? [76.32336818860965]
視覚モデル表現と人間の知覚的判断との整合がユーザビリティに与える影響について検討する。
モデルと知覚的判断を一致させることで、多くの下流タスクで元のバックボーンを改善する表現が得られることがわかった。
その結果,人間の知覚的知識に関する帰納バイアスを視覚モデルに注入することは,より良い表現に寄与することが示唆された。
論文 参考訳(メタデータ) (2024-10-14T17:59:58Z) - Attention is All You Want: Machinic Gaze and the Anthropocene [2.4554686192257424]
計算ビジョンは、人類新世の表現を解釈し、合成する。
我々は、この創発的な機械的視線が、その未来的な風景の組成を通してどのように見えるか、そして、観察され観察される人間の対象に向かって振り返るかを考察する。
様々な補助的、監視的、生成的役割において、コンピュータビジョンは人間の欲望を反映するだけでなく、独自の斜めの要求を明瞭に反映する。
論文 参考訳(メタデータ) (2024-05-16T00:00:53Z) - Restoring Ancient Ideograph: A Multimodal Multitask Neural Network
Approach [11.263700269889654]
本稿では,古文書を復元する新しいマルチモーダルマルチタスク復元モデル(MMRM)を提案する。
文脈理解と、損傷した古代の遺物からの残余の視覚情報を組み合わせることで、損傷した文字を予測し、同時に復元された画像を生成する。
論文 参考訳(メタデータ) (2024-03-11T12:57:28Z) - From Pampas to Pixels: Fine-Tuning Diffusion Models for Ga\'ucho
Heritage [0.0]
本稿では, 地域文化概念, 歴史人物, 絶滅危惧種の表現における潜在拡散モデル (LDM) の可能性について考察する。
我々の目標は、生産モデルが地域の文化的・歴史的アイデンティティを捉え保存するのにどう役立つか、より広い理解に貢献することである。
論文 参考訳(メタデータ) (2024-01-10T19:34:52Z) - Knowledge-Aware Artifact Image Synthesis with LLM-Enhanced Prompting and
Multi-Source Supervision [5.517240672957627]
本稿では,失った歴史的物体を視覚的形状に正確に反映する,知識を意識した新しい人工物画像合成手法を提案する。
既存の手法と比較して,提案手法は文書に含まれる暗黙の細部や歴史的知識とよく一致した高品質なアーティファクト画像を生成する。
論文 参考訳(メタデータ) (2023-12-13T11:03:07Z) - Unsupervised Compositional Concepts Discovery with Text-to-Image
Generative Models [80.75258849913574]
本稿では、異なる画像の集合を考えると、各画像を表す生成概念を発見できるかという逆問題を考える。
本稿では,画像の集合から生成概念を抽出し,絵画やオブジェクト,キッチンシーンからの照明から異なる美術スタイルを分離し,イメージネット画像から得られる画像クラスを発見するための教師なしアプローチを提案する。
論文 参考訳(メタデータ) (2023-06-08T17:02:15Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - Automatic Modeling of Social Concepts Evoked by Art Images as Multimodal
Frames [1.4502611532302037]
非物理的オブジェクトを参照する社会的概念は、視覚データの内容を記述、インデックス化、クエリするための強力なツールである。
本稿では,社会概念をマルチモーダル・フレームとして表現するためのソフトウェア手法を提案する。
本手法は,視覚芸術作品から興味ある概念をタグ付けしたマルチモーダル特徴の抽出,解析,統合に焦点を当てる。
論文 参考訳(メタデータ) (2021-10-14T14:50:22Z) - Enhancing Photorealism Enhancement [83.88433283714461]
本稿では,畳み込みネットワークを用いた合成画像のリアリズム向上手法を提案する。
一般的に使用されるデータセットのシーンレイアウトの分布を分析し、重要な方法で異なることを見つけます。
近年のイメージ・ツー・イメージ翻訳法と比較して,安定性とリアリズムの大幅な向上が報告されている。
論文 参考訳(メタデータ) (2021-05-10T19:00:49Z) - Learning Patterns of Tourist Movement and Photography from Geotagged
Photos at Archaeological Heritage Sites in Cuzco, Peru [73.52315464582637]
我々は、ペルーのクズコにある既知の考古学遺産サーキットを横断する旅行パターンを特定するために、視覚と遺産観光に関連する現在の人類学の理論的談話を構築した。
本研究の目的は,(1)観光の強化が遺産規制やソーシャルメディアとどのように交わり,クズコの遺産景観を横断する旅行パターンの具体化に寄与するかを理解すること,(2)旅行物語がソーシャルメディア上でキュレーションされ,歴史史跡表現に根ざした観光客の期待と相まって,美的嗜好と視覚性がいかに絡み合うかを評価することである。
論文 参考訳(メタデータ) (2020-06-29T22:49:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。