論文の概要: A Framework for Generating Artificial Datasets to Validate Absolute and Relative Position Concepts
- arxiv url: http://arxiv.org/abs/2509.18177v1
- Date: Wed, 17 Sep 2025 18:37:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.458649
- Title: A Framework for Generating Artificial Datasets to Validate Absolute and Relative Position Concepts
- Title(参考訳): 絶対的および相対的な位置概念を検証するための人工データセット生成フレームワーク
- Authors: George Corrêa de Araújo, Helena de Almeida Maia, Helio Pedrini,
- Abstract要約: このフレームワークは、オブジェクト認識、絶対位置と相対位置、属性識別といった基本的な概念に焦点を当てている。
提案するフレームワークは、多種多様な包括的なデータセットを生成するための貴重な手段を提供する。
- 参考スコア(独自算出の注目度): 2.0391237204597368
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In this paper, we present the Scrapbook framework, a novel methodology designed to generate extensive datasets for probing the learned concepts of artificial intelligence (AI) models. The framework focuses on fundamental concepts such as object recognition, absolute and relative positions, and attribute identification. By generating datasets with a large number of questions about individual concepts and a wide linguistic variation, the Scrapbook framework aims to validate the model's understanding of these basic elements before tackling more complex tasks. Our experimental findings reveal that, while contemporary models demonstrate proficiency in recognizing and enumerating objects, they encounter challenges in comprehending positional information and addressing inquiries with additional constraints. Specifically, the MobileVLM-V2 model showed significant answer disagreements and plausible wrong answers, while other models exhibited a bias toward affirmative answers and struggled with questions involving geometric shapes and positional information, indicating areas for improvement in understanding and consistency. The proposed framework offers a valuable instrument for generating diverse and comprehensive datasets, which can be utilized to systematically assess and enhance the performance of AI models.
- Abstract(参考訳): 本稿では,人工知能(AI)モデルの学習概念を探索するための広範なデータセットを生成するための新しい手法であるScrapbookフレームワークを提案する。
このフレームワークは、オブジェクト認識、絶対位置と相対位置、属性識別といった基本的な概念に焦点を当てている。
Scrapbookフレームワークは、個々の概念と幅広い言語的バリエーションに関する多くの疑問を持つデータセットを生成することにより、より複雑なタスクに取り組む前に、これらの基本的な要素に対するモデルの理解を検証することを目的としている。
実験結果から,現代モデルでは物体の認識と列挙に熟練度が示される一方で,位置情報の理解や質問への追加的制約による対処が困難であることが明らかとなった。
特に, MobileVLM-V2 モデルでは, 肯定的回答に対するバイアスがみられ, 幾何学的形状や位置情報に関わる問題に悩まされ, 理解と整合性の向上のための領域が示唆された。
提案するフレームワークは,AIモデルのパフォーマンスを体系的に評価し,拡張するために使用可能な,多種多様な包括的なデータセットを生成するための貴重な手段を提供する。
関連論文リスト
- Explaining What Machines See: XAI Strategies in Deep Object Detection Models [0.0]
説明可能な人工知能(XAI)は、モデル決定をより透明化し、解釈可能で、人間にふさわしいものにすることを目的としている。
本稿では,オブジェクト検出モデルに特化して適用される最新技術説明可能性手法を包括的に分析する。
論文 参考訳(メタデータ) (2025-09-02T06:16:30Z) - Video Event Reasoning and Prediction by Fusing World Knowledge from LLMs with Vision Foundation Models [10.1080193179562]
現在の理解モデルは「何」を認識するのに優れているが、因果推論や将来の予測のような高いレベルの認知タスクでは不足している。
本稿では,知識駆動型推論コアとして機能するLarge Language Model (LLM)を用いて,視覚の深層認識のための強力なビジョン基礎モデルと融合する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-08T09:43:17Z) - Coding for Intelligence from the Perspective of Category [66.14012258680992]
符号化の対象はデータの圧縮と再構成、インテリジェンスである。
最近の傾向は、これらの2つの分野の潜在的均一性を示している。
本稿では,カテゴリ理論の観点から,インテリジェンスのためのコーディングの新たな問題を提案する。
論文 参考訳(メタデータ) (2024-07-01T07:05:44Z) - Deep Learning-Based Object Pose Estimation: A Comprehensive Survey [73.74933379151419]
ディープラーニングに基づくオブジェクトポーズ推定の最近の進歩について論じる。
また、複数の入力データモダリティ、出力ポーズの自由度、オブジェクト特性、下流タスクについても調査した。
論文 参考訳(メタデータ) (2024-05-13T14:44:22Z) - Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。
モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。
このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文 参考訳(メタデータ) (2023-07-25T17:59:18Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z) - FACT: Learning Governing Abstractions Behind Integer Sequences [7.895232155155041]
完全なフィニシャルな記述を認める概念の学習に関する新しい見解を紹介する。
機械学習モデルによる概念理解を目的としたベンチマークタスクのセットを配置する。
知識表現と推論の研究をさらに支援するため,FACT(Finitary Abstraction Toolkit)を提案する。
論文 参考訳(メタデータ) (2022-09-20T08:20:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。