論文の概要: On the rankability of visual embeddings
- arxiv url: http://arxiv.org/abs/2507.03683v1
- Date: Fri, 04 Jul 2025 16:03:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.835319
- Title: On the rankability of visual embeddings
- Title(参考訳): 視覚埋め込みのランク可能性について
- Authors: Ankit Sonthalia, Arnas Uselis, Seong Joon Oh,
- Abstract要約: 本研究では,視覚埋め込みモデルが線形方向に沿って連続的,順序的特性を捉えているかどうかを考察する。
このような軸に埋め込まれた埋め込みが属性の順序を保存する場合、モデルを定義します。
7つの一般的なエンコーダと9つのデータセットがあり、年齢、群衆数、頭部ポーズ、美学、そして相対性といった属性があるため、多くの埋め込みが本質的にランク付け可能であることが分かりました。
- 参考スコア(独自算出の注目度): 15.248236864362577
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study whether visual embedding models capture continuous, ordinal attributes along linear directions, which we term _rank axes_. We define a model as _rankable_ for an attribute if projecting embeddings onto such an axis preserves the attribute's order. Across 7 popular encoders and 9 datasets with attributes like age, crowd count, head pose, aesthetics, and recency, we find that many embeddings are inherently rankable. Surprisingly, a small number of samples, or even just two extreme examples, often suffice to recover meaningful rank axes, without full-scale supervision. These findings open up new use cases for image ranking in vector databases and motivate further study into the structure and learning of rankable embeddings. Our code is available at https://github.com/aktsonthalia/rankable-vision-embeddings.
- Abstract(参考訳): 本研究では, 視覚埋め込みモデルが直線方向に沿って連続的, 順序的特性を捉えているかどうかを考察する。
このような軸に埋め込まれた埋め込みが属性の順序を保存する場合、モデルを定義します。
7つの一般的なエンコーダと9つのデータセットがあり、年齢、群衆数、頭部ポーズ、美学、そして相対性といった属性があるため、多くの埋め込みが本質的にランク付け可能であることが分かりました。
驚くべきことに、少数のサンプル、あるいは2つの極端なサンプルでさえ、フルスケールの監視なしに有意義なランク軸を回収するのに十分であることが多い。
これらの知見は、ベクトルデータベースにおける画像ランキングの新しいユースケースを開拓し、ランク付け可能な埋め込みの構造と学習に関するさらなる研究を動機付けている。
私たちのコードはhttps://github.com/aktsonthalia/rankable-vision-embeddings.comで利用可能です。
関連論文リスト
- Balancing Lexical and Semantic Quality in Abstractive Summarization [0.38073142980733]
本稿では,リランカが語彙的品質と意味的品質のバランスをとる新しいトレーニング手法を提案する。
CNN/DailyMail と XSum のデータセットを用いた実験では,語彙的側面を著しく劣化させることなく要約の意味を推定できることがわかった。
論文 参考訳(メタデータ) (2023-05-17T02:18:31Z) - MoBYv2AL: Self-supervised Active Learning for Image Classification [57.4372176671293]
画像分類のための自己教師型アクティブラーニングフレームワークであるMoBYv2ALを提案する。
私たちの貢献は、最も成功した自己教師付き学習アルゴリズムであるMoBYをALパイプラインに持ち上げることです。
近年のAL法と比較すると,最先端の結果が得られている。
論文 参考訳(メタデータ) (2023-01-04T10:52:02Z) - Reinforcement Learning Enhanced Weighted Sampling for Accurate Subgraph
Counting on Fully Dynamic Graph Streams [35.943447765433774]
完全動的グラフストリームにおける部分グラフ数を推定するための重み付きサンプリングアルゴリズムWSDを提案する。
強化学習に基づく新しい手法を用いて,エッジの重みをデータ駆動方式で決定する。
論文 参考訳(メタデータ) (2022-11-13T03:01:34Z) - Can I see an Example? Active Learning the Long Tail of Attributes and
Relations [64.50739983632006]
視覚シーンの属性や関係を問う,新たな逐次能動学習フレームワークを提案する。
従来のアクティブな学習手法では、特定の例のラベルを求めるが、エージェントが特定のカテゴリからサンプルを求めることができるように、このフレーミングを反転させる。
このフレーミングを用いて、データ分布の尾からサンプルを求めるアクティブサンプリング手法を導入し、Visual Genomeの古典的アクティブラーニング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-03-11T19:28:19Z) - DapStep: Deep Assignee Prediction for Stack Trace Error rePresentation [61.99379022383108]
本稿では,バグトリアージ問題を解決するための新しいディープラーニングモデルを提案する。
モデルは、注目された双方向のリカレントニューラルネットワークと畳み込みニューラルネットワークに基づいている。
ランキングの質を向上させるために,バージョン管理システムのアノテーションから追加情報を利用することを提案する。
論文 参考訳(メタデータ) (2022-01-14T00:16:57Z) - Perceptual Score: What Data Modalities Does Your Model Perceive? [73.75255606437808]
モデルが入力特徴の異なる部分集合に依存する度合いを評価する指標である知覚スコアを導入する。
近年,視覚的質問応答に対するマルチモーダルモデルでは,前者よりも視覚的データを知覚しにくい傾向がみられた。
知覚スコアを使用することで、スコアをデータサブセットのコントリビューションに分解することで、モデルのバイアスを分析することもできる。
論文 参考訳(メタデータ) (2021-10-27T12:19:56Z) - Exploring the Representational Power of Graph Autoencoder [1.005130974691351]
グラフオートエンコーダの第1層には,Degree,Local Clustering Score,Interferness Centrality,Eigenvector Centrality,Triangle Countが保存されている。
また、そのような特性を持つモデルが、特定の下流タスク、特にそのタスクに関連のある保存機能において、他のモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-06-22T18:23:26Z) - Visual Distant Supervision for Scene Graph Generation [66.10579690929623]
シーングラフモデルは通常、大量のラベル付きデータを人間のアノテーションで教師付き学習する必要がある。
本研究では,人間ラベルデータを用いずにシーングラフモデルを訓練できる視覚関係学習の新しいパラダイムである視覚遠方監視を提案する。
包括的な実験結果から、我々の遠隔監視モデルは、弱い監督と半監督のベースラインよりも優れています。
論文 参考訳(メタデータ) (2021-03-29T06:35:24Z) - Looking back to lower-level information in few-shot learning [4.873362301533825]
本稿では,隠れたニューラルネットワーク層の特徴埋め込みを低レベル支援情報として活用し,分類精度を向上させることを提案する。
筆者らは,MiniImageNet と tieredImageNet という2つの人気の数点学習データセットを用いた実験を行い,この手法がネットワークの低レベル情報を利用して最先端の分類性能を向上できることを示した。
論文 参考訳(メタデータ) (2020-05-27T20:32:13Z) - Learning What Makes a Difference from Counterfactual Examples and
Gradient Supervision [57.14468881854616]
ニューラルネットワークの一般化能力を改善するための補助的学習目標を提案する。
我々は、異なるラベルを持つ最小差の例のペア、すなわち反ファクトまたはコントラストの例を使用し、タスクの根底にある因果構造を示す信号を与える。
このテクニックで訓練されたモデルは、配布外テストセットのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2020-04-20T02:47:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。