Fugu-MT 論文翻訳(概要): WhiteTesseract: Reframing the Interpretation of Cultural Heritage through XR and Conversational AI

論文の概要: WhiteTesseract: Reframing the Interpretation of Cultural Heritage through XR and Conversational AI

arxiv url: http://arxiv.org/abs/2605.16972v1
Date: Sat, 16 May 2026 12:50:37 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-19 17:57:47.396873
Title: WhiteTesseract: Reframing the Interpretation of Cultural Heritage through XR and Conversational AI
Title（参考訳）: WhiteTesseract: XRと会話型AIによる文化遺産の解釈
Authors: Jingjing Li, Zhi Liu, Xiyao Jin, Tatsuki Fushimi, Yoichi Ochiai,
Abstract要約: WhiteTesseractは高解像度のXRと会話型AIによるその場解釈を可能にする。このシステムをクロードモネ展示に導入し,26名の参加者を対象に制御されたユーザスタディを行った。その結果、WhiteTesseractは平均視聴時間が35.3秒から98.3秒に大幅に増加した。
参考スコア（独自算出の注目度）: 17.00861279826617
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Cultural heritage exhibitions often struggle to sustain attention and support reflective engagement. Physical exhibitions rely on fixed interpretive aids that lack adaptability to individual backgrounds or curiosity, and their effectiveness depends heavily on a visitor's Personal Context, prior knowledge, and cultural literacy. Meanwhile, digital exhibitions prioritize convenience and accessibility but risk weakening the Physical and Social Contexts that define embodied cultural experience. WhiteTesseract addresses this gap by enabling in-situ interpretation through high-resolution XR and conversational AI. The system integrates spatial intelligence via artwork recognition to allow visitors to selectively reduce environmental distractions (via diminished reality) and engage in context-aware dialogue (via large language models). The goal is to preserve the richness of the physical and social environment while providing a flexible space for personal reflection, enhancing Personal Context without compromising physical authenticity. We deployed the system in a Claude Monet exhibition and conducted a controlled user study with 26 participants. Quantitative results showed that WhiteTesseract modulation significantly increased average viewing duration from 35.3 to 98.3 seconds (p < 0.001). Analysis of 529 visitor-AI interactions revealed that 60% extended beyond factual queries to include analytical, emotional, and comparative inquiries. These findings demonstrate how XR and AI can enrich the physical exhibition experience by supporting deeper, more personalized engagement without displacing the embodied value of cultural heritage. We discuss technical and social constraints for real-world deployment and limitations of our controlled setting.
Abstract（参考訳）: 文化遺産の展示は、しばしば注意を保ち、反射的なエンゲージメントを支援するのに苦労する。物理的な展示は、個々の背景や好奇心への適応性に欠ける固定された解釈支援に依存しており、それらの効果は訪問者の個人的文脈、事前の知識、文化的リテラシーに大きく依存している。一方、デジタル展示は利便性とアクセシビリティを優先するが、具体的文化体験を定義する身体的・社会的文脈を弱めるリスクがある。 WhiteTesseractはこのギャップに対処し、高解像度のXRと会話型AIによるその場解釈を可能にする。このシステムは、空間知能をアートワーク認識を通じて統合し、訪問者が(現実を減らした)環境の邪魔を選択的に減らし、(大規模言語モデルによる)文脈認識対話を行うことを可能にする。目的は、身体的・社会的環境の豊かさを保ちつつ、個人のリフレクションのためのフレキシブルな空間を提供し、身体的信頼性を損なうことなく、個人的コンテキストを高めることである。このシステムをクロードモネ展示に導入し,26名の参加者を対象に制御されたユーザスタディを行った。定量分析の結果、ホワイトテッセラクトの変調により平均視聴時間は35.3秒から98.3秒(p < 0.001)に増加した。 529件のビジターとAIの相互作用の分析の結果,60%が事実クエリを超えて,分析的,感情的,比較的な問合せを含むことがわかった。これらの結果は、XRとAIが、文化的遺産の具体的価値を損なうことなく、より深く、よりパーソナライズされたエンゲージメントをサポートすることで、物理的な展示体験を豊かにすることができることを示す。実世界の展開における技術的・社会的制約と制御された環境の制約について議論する。

関連論文リスト

Vision Language Models are Confused Tourists [31.85723694463742]
視覚言語モデル(VLM)の評価を目的とした,新しい文化的対人ロバストネススイートであるConfusedTouristを紹介する。私たちの実験では、単純なイメージスタッキングの摂動の下で精度が大幅に低下し、画像生成に基づく変異によってさらに悪化する重大な脆弱性が明らかになりました。これらの発見は、視覚的文化的概念の混合が、最先端のVLMさえも実質的に損なわれるという、重要な課題を浮き彫りにしている。
論文参考訳（メタデータ） (2025-11-21T07:14:46Z)
AI-Agents for Culturally Diverse Online Higher Education Environments [3.479757825266597]
この章は、既存の研究をレビューし、文化的に多様なオンライン高等教育環境におけるエンゲージメントを促進し、学習成果を改善するために、文化的に意識されたAIエージェントの使用を提案する。
論文参考訳（メタデータ） (2025-10-12T09:42:09Z)
'Too much alignment; not enough culture': Re-balancing cultural alignment practices in LLMs [0.0]
本稿では、AIアライメントプラクティスへの質的なアプローチの統合へのシフトを論じる。クリフォード・ゲールツ(Clifford Geertz)の"thick description"の概念からインスピレーションを得たAIシステムは、より深い文化的意味を反映したアウトプットを生成する必要がある。
論文参考訳（メタデータ） (2025-09-30T12:22:53Z)
CultureScope: A Dimensional Lens for Probing Cultural Understanding in LLMs [57.653830744706305]
CultureScopeは、大規模な言語モデルにおける文化的理解を評価するための、これまでで最も包括的な評価フレームワークである。文化的な氷山理論に触発されて、文化知識分類のための新しい次元スキーマを設計する。実験結果から,文化的理解を効果的に評価できることが示唆された。
論文参考訳（メタデータ） (2025-09-19T17:47:48Z)
Toward Socially Aware Vision-Language Models: Evaluating Cultural Competence Through Multimodal Story Generation [2.0467354053171243]
本稿では,マルチモーダルストーリー生成による視覚言語モデル(VLM)の文化的能力の総合評価を行う。分析の結果,文化的に特有な語彙が多岐にわたる文化的適応能力,家族用語,地理的マーカーが明らかとなった。文化的な能力はアーキテクチャによって劇的に変化し、いくつかのモデルは逆の文化的アライメントを示し、自動化されたメトリクスは人間の評価と矛盾するアーキテクチャ上のバイアスを示しています。
論文参考訳（メタデータ） (2025-08-22T19:39:02Z)
CAIRe: Cultural Attribution of Images by Retrieval-Augmented Evaluation [61.130639734982395]
本稿では,画像の文化的関連度を評価する新しい評価指標であるCAIReを紹介する。本フレームワークは,イメージ内の実体と概念を知識ベースに基盤として,実情報を用いて各文化ラベルに対して独立した評価を行う。
論文参考訳（メタデータ） (2025-06-10T17:16:23Z)
A Reference Architecture for Gamified Cultural Heritage Applications Leveraging Generative AI and Augmented Reality [4.228905912230226]
本稿では,ジェネレーティブAIと拡張現実を活用した,ゲーミフィケーション文化遺産アプリケーションのためのリファレンスアーキテクチャを提案する。ゲーミフィケーションはモチベーションを高め、人工知能は適応的なストーリーテリングとパーソナライズされたコンテンツを可能にする。
論文参考訳（メタデータ） (2025-06-04T15:49:05Z)
RAVENEA: A Benchmark for Multimodal Retrieval-Augmented Visual Culture Understanding [79.44246283490665]
本稿では,検索による視覚文化理解の促進を目的とした新しいベンチマークであるRAVENEAを紹介する。 RAVENEAは、文化中心の視覚的質問応答(cVQA)と文化インフォームドイメージキャプション(cIC)の2つのタスクに焦点を当てている。画像クエリ毎に7つのマルチモーダルレトリバーを訓練・評価し、14の最先端の視覚言語モデルにおける検索強化入力の下流への影響を計測する。
論文参考訳（メタデータ） (2025-05-20T14:57:16Z)
CAReDiO: Cultural Alignment of LLM via Representativeness and Distinctiveness Guided Data Optimization [50.90288681622152]
大規模言語モデル(LLM)は、より深く様々な地域における人間の生活に統合される。既存のアプローチは、文化固有のコーパスを微調整することで、文化的に整合したLCMを開発する。本稿では,新しい文化データ構築フレームワークであるCAReDiOを紹介する。
論文参考訳（メタデータ） (2025-04-09T13:40:13Z)
Mind the Gesture: Evaluating AI Sensitivity to Culturally Offensive Non-Verbal Gestures [67.89565097372751]
ジェスチャーは非言語コミュニケーションの不可欠な部分であり、文化によって異なる意味を持つ。 AIシステムがよりグローバルなアプリケーションに統合されるにつれて、文化的な犯罪が必然的に持続しないことが重要になります。攻撃性,文化的意義,文脈的要因を付加した288のジェスチャー・カントリーペアのデータセットであるMC-SIGNS(Multi-Cultural Set of In appropriate Gestures and Nonverbal Signs)を紹介する。
論文参考訳（メタデータ） (2025-02-24T23:10:08Z)
Massively Multi-Cultural Knowledge Acquisition & LM Benchmarking [48.21982147529661]
本稿では,多文化知識獲得のための新しいアプローチを提案する。本手法は,文化トピックに関するウィキペディア文書からリンクページの広範囲なネットワークへ戦略的にナビゲートする。私たちの仕事は、AIにおける文化的格差のギャップを深く理解し、橋渡しするための重要なステップです。
論文参考訳（メタデータ） (2024-02-14T18:16:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。