論文の概要: Connecting Images through Time and Sources: Introducing Low-data,
Heterogeneous Instance Retrieval
- arxiv url: http://arxiv.org/abs/2103.10729v1
- Date: Fri, 19 Mar 2021 10:54:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 14:32:02.109025
- Title: Connecting Images through Time and Sources: Introducing Low-data,
Heterogeneous Instance Retrieval
- Title(参考訳): 時間とソースによる画像の接続:低データ、不均一なインスタンス検索の導入
- Authors: Dimitri Gominski and Val\'erie Gouet-Brunet and Liming Chen
- Abstract要約: バリエーションやセマンティックな内容のパネルによく反応する機能を選択するのは簡単ではないことを示す。
Alegoriaベンチマークの新しい拡張バージョンを導入し、詳細なアノテーションを使って記述子を比較します。
- 参考スコア(独自算出の注目度): 3.6526118822907594
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: With impressive results in applications relying on feature learning, deep
learning has also blurred the line between algorithm and data. Pick a training
dataset, pick a backbone network for feature extraction, and voil\`a ; this
usually works for a variety of use cases. But the underlying hypothesis that
there exists a training dataset matching the use case is not always met.
Moreover, the demand for interconnections regardless of the variations of the
content calls for increasing generalization and robustness in features.
An interesting application characterized by these problematics is the
connection of historical and cultural databases of images. Through the
seemingly simple task of instance retrieval, we propose to show that it is not
trivial to pick features responding well to a panel of variations and semantic
content. Introducing a new enhanced version of the Alegoria benchmark, we
compare descriptors using the detailed annotations. We further give insights
about the core problems in instance retrieval, testing four state-of-the-art
additional techniques to increase performance.
- Abstract(参考訳): 機能学習に依存するアプリケーションの印象的な結果により、ディープラーニングはアルゴリズムとデータの境界を曖昧にした。
トレーニングデータセットを選択し、特徴抽出のためにバックボーンネットワークを選択し、voil\`a を選択する。
しかし、ユースケースにマッチするトレーニングデータセットが存在するという基本的な仮説は、必ずしも満たされていない。
さらに,内容の変動によらず相互接続の需要は,特徴の一般化とロバスト性を高めることを要求している。
これらの問題に特徴付けられる興味深い応用は、歴史的および文化的画像データベースの関連である。
インスタンス検索という一見単純なタスクを通じて、バリエーションやセマンティックな内容のパネルによく反応する特徴を選択することは簡単ではないことを示す。
Alegoriaベンチマークの新しい拡張バージョンを導入し、詳細なアノテーションを使って記述子を比較します。
さらに、インスタンス検索における中核的な問題に関する洞察を与え、パフォーマンスを高めるための4つの最新技術をテストする。
関連論文リスト
- Query-oriented Data Augmentation for Session Search [71.84678750612754]
本稿では,検索ログの強化とモデリングの強化を目的としたクエリ指向データ拡張を提案する。
検索コンテキストの最も重要な部分を変更することで補足的なトレーニングペアを生成する。
我々は、現在のクエリを変更するためのいくつかの戦略を開発し、その結果、様々な難易度で新しいトレーニングデータを得る。
論文 参考訳(メタデータ) (2024-07-04T08:08:33Z) - Retrieval-Enhanced Visual Prompt Learning for Few-shot Classification [9.843214426749764]
本稿では,下流タスクの知識をキャッシュし再利用するための検索強化ビジュアルプロンプト学習(RePrompt)を提案する。
推測中、我々の拡張モデルは、より正確な予測を行うために、検索によってもたらされた類似のサンプルを参照することができる。
RePromptは、幅広いビジョンデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-06-04T03:06:37Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - Active Learning of Ordinal Embeddings: A User Study on Football Data [4.856635699699126]
人間は本来、未知の類似性関数を使用してラベル付けされていないデータセットのインスタンス間の距離を計測する。
この研究はディープ・メトリック・ラーニングを使用して、大規模なフットボールの軌跡データセットのアノテーションからユーザ定義の類似性関数を学習する。
論文 参考訳(メタデータ) (2022-07-26T07:55:23Z) - Can I see an Example? Active Learning the Long Tail of Attributes and
Relations [64.50739983632006]
視覚シーンの属性や関係を問う,新たな逐次能動学習フレームワークを提案する。
従来のアクティブな学習手法では、特定の例のラベルを求めるが、エージェントが特定のカテゴリからサンプルを求めることができるように、このフレーミングを反転させる。
このフレーミングを用いて、データ分布の尾からサンプルを求めるアクティブサンプリング手法を導入し、Visual Genomeの古典的アクティブラーニング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-03-11T19:28:19Z) - A Contrastive Distillation Approach for Incremental Semantic
Segmentation in Aerial Images [15.75291664088815]
現在のディープニューラルアーキテクチャに関する大きな問題は、破滅的な忘れこととして知られている。
我々は、任意の入力を拡張バージョンと比較する、対照的な正則化を提案する。
私たちは、Potsdamデータセットにおけるソリューションの有効性を示し、各テストにおけるインクリメンタルベースラインよりも優れています。
論文 参考訳(メタデータ) (2021-12-07T16:44:45Z) - SwAMP: Swapped Assignment of Multi-Modal Pairs for Cross-Modal Retrieval [15.522964295287425]
未知のクラスを自己ラベル化した新たな損失関数を提案する。
我々は,テキストベースビデオ検索,スケッチベース画像検索,画像テキスト検索など,実世界のクロスモーダル検索問題に対するアプローチを検証した。
論文 参考訳(メタデータ) (2021-11-10T17:17:09Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z) - Cross-Modal Retrieval Augmentation for Multi-Modal Classification [61.5253261560224]
画像の非構造化外部知識源とそれに対応するキャプションを用いて視覚的質問応答を改善する。
まず,画像とキャプションを同一空間に埋め込むための新しいアライメントモデルを訓練し,画像検索の大幅な改善を実現する。
第2に、トレーニングされたアライメントモデルを用いた検索強化マルチモーダルトランスは、強いベースライン上でのVQAの結果を改善することを示す。
論文 参考訳(メタデータ) (2021-04-16T13:27:45Z) - Part2Whole: Iteratively Enrich Detail for Cross-Modal Retrieval with
Partial Query [25.398090300086302]
本稿では,この問題に対処する対話型検索フレームワークPart2Wholeを提案する。
Interactive Retrieval Agentは、初期クエリを洗練するための最適なポリシーを構築するために訓練される。
テキスト画像データセット以外の人手による注釈データを必要としない弱教師付き強化学習法を提案する。
論文 参考訳(メタデータ) (2021-03-02T11:27:05Z) - Learning to Match Jobs with Resumes from Sparse Interaction Data using
Multi-View Co-Teaching Network [83.64416937454801]
ジョブ列のインタラクションデータは疎結合でノイズが多く、ジョブ列のマッチングアルゴリズムのパフォーマンスに影響する。
求人情報マッチングのための疎相互作用データから,新しいマルチビュー協調学習ネットワークを提案する。
我々のモデルは求人マッチングの最先端手法より優れている。
論文 参考訳(メタデータ) (2020-09-25T03:09:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。