論文の概要: What Images are More Memorable to Machines?
- arxiv url: http://arxiv.org/abs/2211.07625v2
- Date: Tue, 11 Jul 2023 13:47:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-13 16:55:08.159021
- Title: What Images are More Memorable to Machines?
- Title(参考訳): マシンにとって記憶に残る画像は?
- Authors: Junlin Han, Huangying Zhan, Jie Hong, Pengfei Fang, Hongdong Li, Lars
Petersson, Ian Reid
- Abstract要約: 人間と同様、機械は特定の種類の画像を記憶する傾向があるが、機械と人間の画像の種類は異なる。
本研究は,機械記憶可能性の概念を提案し,マシンメモリと視覚データとのインタフェースに新たな研究方向を開く。
- 参考スコア(独自算出の注目度): 87.14558566342322
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper studies the problem of measuring and predicting how memorable an
image is to pattern recognition machines, as a path to explore machine
intelligence. Firstly, we propose a self-supervised machine memory
quantification pipeline, dubbed ``MachineMem measurer'', to collect machine
memorability scores of images. Similar to humans, machines also tend to
memorize certain kinds of images, whereas the types of images that machines and
humans memorize are different. Through in-depth analysis and comprehensive
visualizations, we gradually unveil that``complex" images are usually more
memorable to machines. We further conduct extensive experiments across 11
different machines (from linear classifiers to modern ViTs) and 9 pre-training
methods to analyze and understand machine memory. This work proposes the
concept of machine memorability and opens a new research direction at the
interface between machine memory and visual data.
- Abstract(参考訳): 本稿では、画像がパターン認識マシンにどれだけ記憶可能かを測定し予測する問題を、機械学習を探索するための経路として検討する。
まず, 「MachineMem measurer'」 と呼ばれる自己教師型マシンメモリ量子化パイプラインを提案し, 画像の記憶可能性スコアを収集する。
人間と同様に、機械は特定の種類の画像を記憶する傾向があるが、機械と人間が記憶する画像の種類は異なる。
詳細な分析と包括的可視化を通じて、我々は「複雑な」画像が通常機械にとって記憶に残るものであることを徐々に明らかにした。
さらに11の異なるマシン(線形分類器から現代のViTまで)と9つの事前学習手法を用いてマシンメモリの解析と理解を行う。
本研究は,機械記憶可能性の概念を提案し,マシンメモリと視覚データとのインタフェースに新たな研究方向を開く。
関連論文リスト
- An Image is Worth More Than 16x16 Patches: Exploring Transformers on Individual Pixels [65.64402188506644]
バニラ変換器は個々のピクセルをトークンとして扱い、高性能な結果を得られる。
主にコンピュータビジョンにおける3つのよく研究されたタスクにおける画素・アズ・トークンの有効性を示す。
論文 参考訳(メタデータ) (2024-06-13T17:59:58Z) - Survey on Memory-Augmented Neural Networks: Cognitive Insights to AI
Applications [4.9008611361629955]
メモリ拡張ニューラルネットワーク(MANN)は、ヒューマンライクなメモリプロセスをAIに混ぜる。
本研究は, ホップフィールドネットワーク, ニューラルチューリングマシン, 相関行列記憶, メムフォーマ, ニューラルアテンション記憶などの高度なアーキテクチャについて検討した。
自然言語処理、コンピュータビジョン、マルチモーダルラーニング、検索モデルにまたがるMANNの現実的利用に潜んでいる。
論文 参考訳(メタデータ) (2023-12-11T06:05:09Z) - Can I say, now machines can think? [0.0]
人工知能対応マシンの能力を分析し,検討した。
チューリングテストは、機械の能力を評価する上で重要な側面である。
インテリジェンスには他にも側面があり、AIマシンはこれらの側面の多くを表現している。
論文 参考訳(メタデータ) (2023-07-11T11:44:09Z) - A neuromorphic approach to image processing and machine vision [0.9137554315375922]
画像分割,視覚的注意,物体認識などの視覚的タスクの実装について検討する。
我々は,人工視覚システムを実現するために,メムリスタなどの不揮発性メモリデバイスの利用を強調してきた。
論文 参考訳(メタデータ) (2022-08-07T05:01:57Z) - Automatic Image Content Extraction: Operationalizing Machine Learning in
Humanistic Photographic Studies of Large Visual Archives [81.88384269259706]
本稿では,機械学習による大規模画像アーカイブの検索と解析のための自動画像コンテンツ抽出フレームワークを提案する。
提案する枠組みは、人文科学と社会科学のいくつかの分野に適用できる。
論文 参考訳(メタデータ) (2022-04-05T12:19:24Z) - Self-supervised machine learning model for analysis of nanowire
morphologies from transmission electron microscopy images [0.0]
本稿では,少数のラベル付き顕微鏡画像を用いた自己教師ありトランスファー学習手法を提案する。
具体的には、ラベルのない画像で画像エンコーダを訓練し、そのエンコーダを用いて異なる下流画像タスクの変換学習を行う。
論文 参考訳(メタデータ) (2022-03-25T19:32:03Z) - Masked Visual Pre-training for Motor Control [118.18189211080225]
実世界の画像からの自己教師付き視覚前訓練は、画素から運動制御タスクを学習するのに有効である。
私たちはビジュアルエンコーダを凍結し、強化学習でニューラルネットワークコントローラをトレーニングします。
これは、モーター制御のために現実の画像を大規模に活用した初めての自己教師型モデルである。
論文 参考訳(メタデータ) (2022-03-11T18:58:10Z) - Automated Graph Machine Learning: Approaches, Libraries, Benchmarks and Directions [58.220137936626315]
本稿では,グラフ機械学習の自動手法について論じる。
当社の専用かつ世界初のグラフ機械学習のためのオープンソースライブラリであるAutoGLを紹介します。
また、統一的で再現性があり、効率的な評価をサポートする調整されたベンチマークについて述べる。
論文 参考訳(メタデータ) (2022-01-04T18:31:31Z) - Multimodal Material Classification for Robots using Spectroscopy and
High Resolution Texture Imaging [14.458436940557924]
近赤外分光法と近距離高分解能テクスチャイメージングを利用したマルチモーダルセンシング技術を提案する。
この表現により、ロボットは従来の最先端のアプローチと比較して、より優れた性能で材料を認識できることが示される。
論文 参考訳(メタデータ) (2020-04-02T17:33:54Z) - Reservoir memory machines [79.79659145328856]
本稿では,ニューラルチューリングマシンのベンチマークテストのいくつかを解くことができる貯水池メモリマシンを提案する。
我々のモデルは、外部メモリによるエコー状態ネットワークの拡張と見なすことができ、干渉することなく任意の長さの記憶が可能となる。
論文 参考訳(メタデータ) (2020-02-12T01:45:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。