論文の概要: Identifying concept libraries from language about object structure
- arxiv url: http://arxiv.org/abs/2205.05666v1
- Date: Wed, 11 May 2022 17:49:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-12 18:06:01.272191
- Title: Identifying concept libraries from language about object structure
- Title(参考訳): オブジェクト構造に関する言語から概念ライブラリを識別する
- Authors: Catherine Wong, William P. McCarthy, Gabriel Grand, Yoni Friedman,
Joshua B. Tenenbaum, Jacob Andreas, Robert D. Hawkins, Judith E. Fan
- Abstract要約: 自然言語記述を2Kプロシージャ生成オブジェクトの多種多様なセットに利用して,ユーザが使用する部分を特定する。
我々は、異なる部分概念を含むプログラムライブラリの空間の探索として、この問題を形式化する。
自然言語と構造化されたプログラム表現を組み合わせることで、人々が名前をつける部分概念を規定する基本的な情報理論的なトレードオフを発見する。
- 参考スコア(独自算出の注目度): 56.83719358616503
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Our understanding of the visual world goes beyond naming objects,
encompassing our ability to parse objects into meaningful parts, attributes,
and relations. In this work, we leverage natural language descriptions for a
diverse set of 2K procedurally generated objects to identify the parts people
use and the principles leading these parts to be favored over others. We
formalize our problem as search over a space of program libraries that contain
different part concepts, using tools from machine translation to evaluate how
well programs expressed in each library align to human language. By combining
naturalistic language at scale with structured program representations, we
discover a fundamental information-theoretic tradeoff governing the part
concepts people name: people favor a lexicon that allows concise descriptions
of each object, while also minimizing the size of the lexicon itself.
- Abstract(参考訳): 私たちの視覚世界に対する理解は、オブジェクトを意味のある部分、属性、関係に解析する能力を含む、オブジェクトの命名を超えています。
本研究では,自然言語記述を多種多様な2Kプロシージャ生成オブジェクトの集合に活用して,人々が使用する部分と,これらを他よりも好むべき原則を特定する。
我々は,各ライブラリで表現されたプログラムが,人間の言語とどのように一致しているかを評価するために,機械翻訳のツールを用いて,異なる部分概念を含むプログラムライブラリの空間を探索する際の問題を定式化する。
自然言語を大規模に構成されたプログラム表現と組み合わせることで、各オブジェクトの簡潔な記述を許容するレキシコンと、レキシコン自体のサイズを最小化する部分概念を統治する基本的な情報理論上のトレードオフが発見される。
関連論文リスト
- SAGE: Bridging Semantic and Actionable Parts for GEneralizable Manipulation of Articulated Objects [9.500480417077272]
本稿では,自然言語命令下での汎用的な操作を実現するために,意味的および動作可能なオブジェクトをブリッジする新しいフレームワークを提案する。
パーシャルグラウンドモジュールは、セマンティックな部分を「ジェネリザブル・アクティブル・パート(GAParts)」と表現し、パートモーションに関する情報を本質的に保持する。
インタラクティブなフィードバックモジュールが障害に対応するために組み込まれており、ループを閉じ、全体的なフレームワークの堅牢性を高める。
論文 参考訳(メタデータ) (2023-12-03T07:22:42Z) - Comparative Analysis of Widely use Object-Oriented Languages [0.0]
オブジェクト指向パラダイムの学習は、すべてのコンピュータサイエンス専攻で義務付けられている。
オブジェクト指向の原則を教えるために、どれが最初のプログラミング言語かを選択するのは難しい。
論文 参考訳(メタデータ) (2023-06-02T12:28:13Z) - Embodied Concept Learner: Self-supervised Learning of Concepts and
Mapping through Instruction Following [101.55727845195969]
本研究では,対話型3D環境におけるEmbodied Learner Concept (ECL)を提案する。
ロボットエージェントは視覚概念をグラウンディングし、セマンティックマップを構築し、タスクを完了させるためにアクションを計画することができる。
ECLは完全に透明で、長期計画において段階的に解釈可能である。
論文 参考訳(メタデータ) (2023-04-07T17:59:34Z) - Position-Aware Contrastive Alignment for Referring Image Segmentation [65.16214741785633]
マルチモーダル特徴のアライメントを強化するために,位置認識型コントラストアライメントネットワーク(PCAN)を提案する。
1)自然言語記述に関連するすべてのオブジェクトの位置情報を提供する位置認識モジュール(PAM)と,2)マルチモーダルアライメントを強化するコントラスト言語理解モジュール(CLUM)の2つのモジュールで構成されている。
論文 参考訳(メタデータ) (2022-12-27T09:13:19Z) - Differentiable Parsing and Visual Grounding of Verbal Instructions for
Object Placement [26.74189486483276]
言語条件のオブジェクト配置のためのPARsing and visual GrOuNdingフレームワークであるParaGonを紹介する。
言語命令をオブジェクト間の関係に解析し、それらのオブジェクトを視覚的なシーンでグラウンド化する。
ParaGonは、これらの手順をすべてニューラルネットワークにエンコードして、エンドツーエンドのトレーニングを行う。
論文 参考訳(メタデータ) (2022-10-01T07:36:51Z) - Leveraging Language to Learn Program Abstractions and Search Heuristics [66.28391181268645]
LAPS(Language for Abstraction and Program Search)は、自然言語アノテーションを用いて、ライブラリとニューラルネットワークによる合成のための検索モデルの共同学習をガイドする手法である。
最先端のライブラリ学習システム(DreamCoder)に統合されると、LAPSは高品質なライブラリを生成し、検索効率と一般化を改善する。
論文 参考訳(メタデータ) (2021-06-18T15:08:47Z) - Low-Dimensional Structure in the Space of Language Representations is
Reflected in Brain Responses [62.197912623223964]
言語モデルと翻訳モデルは,単語の埋め込み,構文的・意味的タスク,将来的な単語埋め込みとの間を円滑に介在する低次元構造を示す。
この表現埋め込みは、各特徴空間が、fMRIを用いて記録された自然言語刺激に対する人間の脳反応にどれだけうまく対応しているかを予測することができる。
これは、埋め込みが脳の自然言語表現構造の一部を捉えていることを示唆している。
論文 参考訳(メタデータ) (2021-06-09T22:59:12Z) - Understanding Synonymous Referring Expressions via Contrastive Features [105.36814858748285]
画像とオブジェクトインスタンスレベルでのコントラスト機能を学ぶためのエンドツーエンドのトレーニング可能なフレームワークを開発しています。
提案アルゴリズムをいくつかのベンチマークデータセットで評価するための広範囲な実験を行った。
論文 参考訳(メタデータ) (2021-04-20T17:56:24Z) - Language-Mediated, Object-Centric Representation Learning [21.667413971464455]
我々はLORL(Language-mediated, Object-centric Representation Learning)を提案する。
LORLは、視覚と言語から乱れたオブジェクト中心のシーン表現を学習するためのパラダイムである。
言語に依存しない様々な教師なしセグメンテーションアルゴリズムと統合できます。
論文 参考訳(メタデータ) (2020-12-31T18:36:07Z) - Machine learning approach of Japanese composition scoring and writing
aided system's design [0.0]
合成スコアシステムは、言語学習者を支援することができる。
何かを出力するプロセスにおいて、言語をリーン化するのです。
特に外国語学習者にとって、語彙内容と構文内容は、通常、彼らがより関心を持っているものである。
論文 参考訳(メタデータ) (2020-08-26T11:01:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。