論文の概要: Show Me the Infographic I Imagine: Intent-Aware Infographic Retrieval for Authoring Support
- arxiv url: http://arxiv.org/abs/2604.07989v1
- Date: Thu, 09 Apr 2026 08:58:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.814219
- Title: Show Me the Infographic I Imagine: Intent-Aware Infographic Retrieval for Authoring Support
- Title(参考訳): I imagine: Intent-Aware Infographic Retrieval for Authoring Support
- Authors: Jing Xu, Jiarui Hu, Zhihao Shuai, Yiyun Chen, Weikai Yang,
- Abstract要約: ユーザクエリとインフォグラフィックデザインの整合性を向上する意図認識型インフォグラフィック検索フレームワークを開発した。
我々は、人々がインフォグラフィックをどのように記述するかのフォーマティブな研究を行い、コンテンツとビジュアルデザインの面にまたがる意図的な分類法を導出する。
この分類法は、自由形式のユーザクエリを豊かに洗練するために利用され、検索プロセスを意図特異的な手がかりで導く。
- 参考スコア(独自算出の注目度): 9.13926478956597
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While infographics have become a powerful medium for communicating data-driven stories, authoring them from scratch remains challenging, especially for novice users. Retrieving relevant exemplars from a large corpus can provide design inspiration and promote reuse, substantially lowering the barrier to infographic authoring. However, effective retrieval is difficult because users often express design intent in ambiguous natural language, while infographics embody rich and multi-faceted visual designs. As a result, keyword-based search often fails to capture design intent, and general-purpose vision-language retrieval models trained on natural images are ill-suited to the text-heavy, multi-component nature of infographics. To address these challenges, we develop an intent-aware infographic retrieval framework that better aligns user queries with infographic designs. We first conduct a formative study of how people describe infographics and derive an intent taxonomy spanning content and visual design facets. This taxonomy is then leveraged to enrich and refine free-form user queries, guiding the retrieval process with intent-specific cues. Building on the retrieved exemplars, users can adapt the designs to their own data with high-level edit intents, supported by an interactive agent that performs low-level adaptation. Both quantitative evaluations and user studies are conducted to demonstrate that our method improves retrieval quality over baseline methods while better supporting intent satisfaction and efficient infographic authoring.
- Abstract(参考訳): インフォグラフィックは、データ駆動ストーリーを伝えるための強力な媒体になっているが、特に初心者ユーザーにとっては、それらをスクラッチから作成することは難しい。
大規模なコーパスから関連する例を回収することで、デザインのインスピレーションを与え、再利用を促進することができ、インフォグラフィックのオーサリングに対する障壁を大幅に減らすことができる。
インフォグラフィックはリッチで多面的なビジュアルデザインを具現化しているのに対し,ユーザは曖昧な自然言語でデザイン意図を表現することが多いため,効果的な検索は困難である。
その結果、キーワードベースの検索は設計意図を捉えるのに失敗することが多く、自然画像に基づいて訓練された汎用視覚言語検索モデルは、インフォグラフィックのテキスト重大で多成分的な性質に不適合である。
これらの課題に対処するため,ユーザクエリとインフォグラフィックデザインの整合性を向上する意図認識型インフォグラフィック検索フレームワークを開発した。
まず、人々がインフォグラフィックをどのように記述するかを形式的に研究し、コンテンツやビジュアルデザインの面にまたがる意図的な分類法を導出する。
この分類法は、自由形式のユーザクエリを豊かに、洗練するために利用され、検索プロセスを意図特異的な手がかりで導く。
検索した例に基づき、ユーザは、低レベルの適応を実行する対話エージェントによってサポートされた高レベルの編集インテントで、設計を自身のデータに適応することができる。
定量的評価とユーザスタディの両方を行ない,本手法がベースライン法よりも検索品質を向上させるとともに,インテント満足度と効率的なインフォグラフィックオーサリングを向上することを示す。
関連論文リスト
- Towards More Accurate Personalized Image Generation: Addressing Overfitting and Evaluation Bias [52.590072198551944]
画像パーソナライズの目的は、ユーザが提供する課題に基づいて画像を作成することである。
現在の手法では、テキストプロンプトへの忠実性を保証する上で、課題に直面している。
トレーニング画像の歪みを除去するアトラクタを組み込んだ,新たなトレーニングパイプラインを導入する。
論文 参考訳(メタデータ) (2025-03-09T14:14:02Z) - Personalized Graph-Based Retrieval for Large Language Models [51.7278897841697]
ユーザ中心の知識グラフを利用してパーソナライゼーションを強化するフレームワークを提案する。
構造化されたユーザ知識を直接検索プロセスに統合し、ユーザ関連コンテキストにプロンプトを拡大することにより、PGraphはコンテキスト理解と出力品質を向上させる。
また,ユーザ履歴が不足あるいは利用できない実環境において,パーソナライズされたテキスト生成タスクを評価するために設計された,パーソナライズドグラフベースのテキスト生成ベンチマークを導入する。
論文 参考訳(メタデータ) (2025-01-04T01:46:49Z) - Visual Analytics for Efficient Image Exploration and User-Guided Image
Captioning [35.47078178526536]
事前訓練された大規模言語画像モデルの最近の進歩は、視覚的理解の新しい時代を後押ししている。
本稿では,視覚分析の領域でよく知られた2つの問題に取り組み,(1)大規模画像データセットの効率的な探索と潜在的なデータバイアスの同定,(2)画像キャプションの評価と生成過程のステアリングを行う。
論文 参考訳(メタデータ) (2023-11-02T06:21:35Z) - Exploring Large Language Model for Graph Data Understanding in Online
Job Recommendations [63.19448893196642]
本稿では,大規模言語モデルが提供するリッチな文脈情報と意味表現を利用して行動グラフを解析する新しいフレームワークを提案する。
この機能を利用することで、個々のユーザに対してパーソナライズされた、正確なジョブレコメンデーションが可能になる。
論文 参考訳(メタデータ) (2023-07-10T11:29:41Z) - Let the Chart Spark: Embedding Semantic Context into Chart with
Text-to-Image Generative Model [7.587729429265939]
画像視覚化は、データとセマンティックコンテキストを視覚表現にシームレスに統合する。
本稿では,テキストから画像への生成モデルに基づく意味コンテキストをグラフに組み込む新しいシステムであるChartSparkを提案する。
本研究では,テキストアナライザ,編集モジュール,評価モジュールを統合したインタラクティブなビジュアルインタフェースを開発し,画像視覚化の生成,修正,評価を行う。
論文 参考訳(メタデータ) (2023-04-28T05:18:30Z) - SGEITL: Scene Graph Enhanced Image-Text Learning for Visual Commonsense
Reasoning [61.57887011165744]
マルチモーダルトランスフォーマーはVisual Commonsense Reasoningのタスクにおいて大きな進歩を遂げた。
視覚的なシーングラフを常識的推論に組み込むためのScene Graph Enhanced Image-Text Learningフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-16T03:16:30Z) - Exploiting Structured Knowledge in Text via Graph-Guided Representation
Learning [73.0598186896953]
本稿では、知識グラフからのガイダンスを用いて、生テキスト上で学習する2つの自己教師型タスクを提案する。
エンティティレベルのマスキング言語モデルに基づいて、最初のコントリビューションはエンティティマスキングスキームです。
既存のパラダイムとは対照的に,本手法では事前学習時にのみ,知識グラフを暗黙的に使用する。
論文 参考訳(メタデータ) (2020-04-29T14:22:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。