論文の概要: Beauty in the Eye of AI: Aligning LLMs and Vision Models with Human Aesthetics in Network Visualization
- arxiv url: http://arxiv.org/abs/2604.03417v1
- Date: Fri, 03 Apr 2026 19:30:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.562649
- Title: Beauty in the Eye of AI: Aligning LLMs and Vision Models with Human Aesthetics in Network Visualization
- Title(参考訳): AIの目における美: ネットワークの可視化における人間の美学によるLLMと視覚モデルのアライメント
- Authors: Peng Zhang, Xuefeng Li, Xiaoqi Wang, Han-Wei Shen, Yifan Hu,
- Abstract要約: 人間の判断のためのプロキシとして,大規模言語モデル (LLM) と視覚モデル (VM) について検討する。
画像埋め込みなどの多種多様な入力形式を組み合わさったプロンプトエンジニアリングにより,LLMと人間のアライメントが大幅に向上することを示す。
以上の結果から,AIが人間のラベル付けのスケーラブルなプロキシとして機能する可能性が示唆された。
- 参考スコア(独自算出の注目度): 47.53880889741314
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Network visualization has traditionally relied on heuristic metrics, such as stress, under the assumption that optimizing them leads to aesthetic and informative layouts. However, no single metric consistently produces the most effective results. A data-driven alternative is to learn from human preferences, where annotators select their favored visualization among multiple layouts of the same graphs. These human-preference labels can then be used to train a generative model that approximates human aesthetic preferences. However, obtaining human labels at scale is costly and time-consuming. As a result, this generative approach has so far been tested only with machine-labeled data. In this paper, we explore the use of large language models (LLMs) and vision models (VMs) as proxies for human judgment. Through a carefully designed user study involving 27 participants, we curated a large set of human preference labels. We used this data both to better understand human preferences and to bootstrap LLM/VM labelers. We show that prompt engineering that combines few-shot examples and diverse input formats, such as image embeddings, significantly improves LLM-human alignment, and additional filtering by the confidence score of the LLM pushes the alignment to human-human levels. Furthermore, we demonstrate that carefully trained VMs can achieve VM-human alignment at a level comparable to that between human annotators. Our results suggest that AI can feasibly serve as a scalable proxy for human labelers.
- Abstract(参考訳): ネットワークの可視化は伝統的にストレスのようなヒューリスティックな指標に依存してきた。
しかし、一つの計量が常に最も効果的な結果を生み出すことはない。
データ駆動の代替手段は人間の好みから学び、アノテータは同じグラフの複数のレイアウトの中で好きな視覚化を選択することである。
これらの人間の嗜好ラベルは、人間の美的嗜好を近似する生成モデルを訓練するために使用することができる。
しかし、人間のラベルを大規模に取得するにはコストと時間を要する。
結果として、この生成的アプローチは、これまでマシンラベル付きデータでのみテストされてきた。
本稿では,人間の判断のためのプロキシとして,大規模言語モデル (LLM) と視覚モデル (VM) の利用について検討する。
27名の被験者を対象とする慎重にデザインされたユーザスタディを通じて,人間の嗜好ラベルを多数収集した。
私たちはこのデータを使って、人間の好みをよりよく理解し、LLM/VMラベルをブートストラップしました。
画像埋め込みなどの多彩な入力形式と少数ショットの例を組み合わせた迅速なエンジニアリングにより,LLMと人間のアライメントが大幅に向上し,LLMの信頼性スコアによる追加フィルタリングによって人間-人間のレベルへのアライメントが促進されることを示す。
さらに、慎重に訓練されたVMは、人間のアノテータと同等のレベルで、VMと人間のアライメントを達成できることを示す。
以上の結果から,AIが人間のラベル付けのスケーラブルなプロキシとして機能する可能性が示唆された。
関連論文リスト
- Improving Large Vision and Language Models by Learning from a Panel of Peers [27.83658413272528]
本研究では,人間同士の協調学習に触発された新しいパネル・オブ・ピアス学習フレームワークを提案する。
ピアレビューシステムをシミュレートすることで、我々のモデルは、キュレートされた一連のプロンプトに応答して出力を生成し、評価し、精製する。
本実験は,複数のベンチマークにおいて有意な改善を示し,自己監督アライメントに代わるスケーラブルな代替手段としてのピア評価の可能性を示した。
論文 参考訳(メタデータ) (2025-09-01T16:43:48Z) - Maximizing Alignment with Minimal Feedback: Efficiently Learning Rewards for Visuomotor Robot Policy Alignment [73.14105098897696]
本研究では,人間の嗜好フィードバックをはるかに少なくして視覚的報酬を学習するための表現適応型選好学習(RAPL)を提案する。
RAPLは、エンドユーザの視覚表現に合わせて微調整された事前学習された視覚エンコーダに焦点を合わせ、特徴マッチングによって密集した視覚報酬を構築する。
RAPLは人間の嗜好に沿った報酬を学習し、より効率的に嗜好データを使用し、ロボットの具体化を一般化できることを示す。
論文 参考訳(メタデータ) (2024-12-06T08:04:02Z) - Hybrid Preferences: Learning to Route Instances for Human vs. AI Feedback [87.37721254914476]
我々はHyPERを紹介した。HyPERは、人間または言語モデル(LM)にアノテーションを付与するハイブリッド推論ルータである。
その結果,HyPERを用いた人工選好と直接選好の混合は,RewardBenchでは7-13%しか使用せず,RM性能が向上していることがわかった。
また、HyPERの機能を分析した結果、安全上の懸念や複雑さが人間のフィードバックから最も恩恵を受けていることがわかりました。
論文 参考訳(メタデータ) (2024-10-24T20:04:15Z) - VisAlign: Dataset for Measuring the Degree of Alignment between AI and
Humans in Visual Perception [32.376529738717736]
画像分類の観点からAIと人間の視覚的アライメントを測定するための新しいデータセットを提案する。
我々のデータセットは、Must-Act(Must-Classify)、Must-Abstain、Uncertainの3つのサンプルからなる。
一般的な5つの視覚知覚モデルと7つの禁忌手法の視覚的アライメントと信頼性を分析した。
論文 参考訳(メタデータ) (2023-08-03T04:04:03Z) - Towards Good Practices for Efficiently Annotating Large-Scale Image
Classification Datasets [90.61266099147053]
多数の画像の分類ラベルを収集するための効率的なアノテーション戦略を検討する。
人間のラベリング作業を最小化するための修正とベストプラクティスを提案します。
ImageNet100の125kイメージサブセットのシミュレーション実験では、平均で0.35のアノテーションで80%のトップ-1の精度でアノテートできることが示されている。
論文 参考訳(メタデータ) (2021-04-26T16:29:32Z) - A Machine Learning Approach for Predicting Human Preference for Graph
Layouts [46.31441679172231]
グラフレイアウトの人間の好みを予測するための最初の機械学習アプローチを紹介します。
基本真理の人間の好みデータセットを用いた実験結果から,モデルがグラフレイアウトの人間の好みを正しく予測できることが示された。
論文 参考訳(メタデータ) (2021-03-01T23:54:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。