論文の概要: Identifying concept libraries from language about object structure
- arxiv url: http://arxiv.org/abs/2205.05666v1
- Date: Wed, 11 May 2022 17:49:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-12 18:06:01.272191
- Title: Identifying concept libraries from language about object structure
- Title(参考訳): オブジェクト構造に関する言語から概念ライブラリを識別する
- Authors: Catherine Wong, William P. McCarthy, Gabriel Grand, Yoni Friedman,
Joshua B. Tenenbaum, Jacob Andreas, Robert D. Hawkins, Judith E. Fan
- Abstract要約: 自然言語記述を2Kプロシージャ生成オブジェクトの多種多様なセットに利用して,ユーザが使用する部分を特定する。
我々は、異なる部分概念を含むプログラムライブラリの空間の探索として、この問題を形式化する。
自然言語と構造化されたプログラム表現を組み合わせることで、人々が名前をつける部分概念を規定する基本的な情報理論的なトレードオフを発見する。
- 参考スコア(独自算出の注目度): 56.83719358616503
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Our understanding of the visual world goes beyond naming objects,
encompassing our ability to parse objects into meaningful parts, attributes,
and relations. In this work, we leverage natural language descriptions for a
diverse set of 2K procedurally generated objects to identify the parts people
use and the principles leading these parts to be favored over others. We
formalize our problem as search over a space of program libraries that contain
different part concepts, using tools from machine translation to evaluate how
well programs expressed in each library align to human language. By combining
naturalistic language at scale with structured program representations, we
discover a fundamental information-theoretic tradeoff governing the part
concepts people name: people favor a lexicon that allows concise descriptions
of each object, while also minimizing the size of the lexicon itself.
- Abstract(参考訳): 私たちの視覚世界に対する理解は、オブジェクトを意味のある部分、属性、関係に解析する能力を含む、オブジェクトの命名を超えています。
本研究では,自然言語記述を多種多様な2Kプロシージャ生成オブジェクトの集合に活用して,人々が使用する部分と,これらを他よりも好むべき原則を特定する。
我々は,各ライブラリで表現されたプログラムが,人間の言語とどのように一致しているかを評価するために,機械翻訳のツールを用いて,異なる部分概念を含むプログラムライブラリの空間を探索する際の問題を定式化する。
自然言語を大規模に構成されたプログラム表現と組み合わせることで、各オブジェクトの簡潔な記述を許容するレキシコンと、レキシコン自体のサイズを最小化する部分概念を統治する基本的な情報理論上のトレードオフが発見される。
- 全文 参考訳へのリンク
関連論文リスト
- AUTOLEX: An Automatic Framework for Linguistic Exploration [93.89709486642666]
本稿では言語学者による言語現象の簡潔な記述の発見と抽出を容易にするための自動フレームワークを提案する。
具体的には、この枠組みを用いて、形態的一致、ケースマーキング、単語順序の3つの現象について記述を抽出する。
本研究では,言語専門家の助けを借りて記述を評価し,人間の評価が不可能な場合に自動評価を行う手法を提案する。
論文 参考訳(メタデータ) (2022-03-25T20:37:30Z) - Neural Abstructions: Abstractions that Support Construction for Grounded
Language Learning [69.1137074774244]
言語の相互作用を効果的に活用するには、言語基底に対する2つの最も一般的なアプローチの制限に対処する必要がある。
本稿では,ラベル条件付き生成モデルの推論手順に対する制約のセットであるニューラル・アブストラクションの考え方を紹介する。
この手法により,マインクラフトにおけるオープンエンドハウスタスクのセマンティックな変更をユーザ人口が構築できることが示される。
論文 参考訳(メタデータ) (2021-07-20T07:01:15Z) - Leveraging Language to Learn Program Abstractions and Search Heuristics [66.28391181268645]
LAPS(Language for Abstraction and Program Search)は、自然言語アノテーションを用いて、ライブラリとニューラルネットワークによる合成のための検索モデルの共同学習をガイドする手法である。
最先端のライブラリ学習システム(DreamCoder)に統合されると、LAPSは高品質なライブラリを生成し、検索効率と一般化を改善する。
論文 参考訳(メタデータ) (2021-06-18T15:08:47Z) - Low-Dimensional Structure in the Space of Language Representations is
Reflected in Brain Responses [62.197912623223964]
言語モデルと翻訳モデルは,単語の埋め込み,構文的・意味的タスク,将来的な単語埋め込みとの間を円滑に介在する低次元構造を示す。
この表現埋め込みは、各特徴空間が、fMRIを用いて記録された自然言語刺激に対する人間の脳反応にどれだけうまく対応しているかを予測することができる。
これは、埋め込みが脳の自然言語表現構造の一部を捉えていることを示唆している。
論文 参考訳(メタデータ) (2021-06-09T22:59:12Z) - Emergent Communication of Generalizations [13.14792537601313]
共有された視覚的コンテキストにおける1つのオブジェクトのコミュニケーションは、過度に適合する傾向があり、具体的な参照を超えて、言語が役に立つことを奨励しない、と我々は主張する。
抽象的な視覚概念を表すオブジェクトの集合上での通信一般化を必要とするゲームを提案する。
これらのゲームは学習言語の体系性と解釈可能性を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-04T19:02:18Z) - Pre-training Universal Language Representation [46.51685959045527]
この研究は普遍言語表現学習、すなわち、一様ベクトル空間に非常に多様な長さを持つ言語単位やテキストの異なるレベルの埋め込みを導入している。
我々は、よく設計された事前学習スキームが、効果的に普遍的な言語表現をもたらすことを実証的に検証する。
論文 参考訳(メタデータ) (2021-05-30T09:29:01Z) - Understanding Synonymous Referring Expressions via Contrastive Features [105.36814858748285]
画像とオブジェクトインスタンスレベルでのコントラスト機能を学ぶためのエンドツーエンドのトレーニング可能なフレームワークを開発しています。
提案アルゴリズムをいくつかのベンチマークデータセットで評価するための広範囲な実験を行った。
論文 参考訳(メタデータ) (2021-04-20T17:56:24Z) - Language-Mediated, Object-Centric Representation Learning [21.667413971464455]
我々はLORL(Language-mediated, Object-centric Representation Learning)を提案する。
LORLは、視覚と言語から乱れたオブジェクト中心のシーン表現を学習するためのパラダイムである。
言語に依存しない様々な教師なしセグメンテーションアルゴリズムと統合できます。
論文 参考訳(メタデータ) (2020-12-31T18:36:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。