論文の概要: Structure from Rank: Rank-Order Coding as a Bridge from Sequence to Structure
- arxiv url: http://arxiv.org/abs/2603.08380v1
- Date: Mon, 09 Mar 2026 13:41:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:16.100513
- Title: Structure from Rank: Rank-Order Coding as a Bridge from Sequence to Structure
- Title(参考訳): 位階から構造:順序から構造への橋渡しとしての位階符号化
- Authors: Xiaodan Chen, Alexandre Pitti, Mathias Quoy, Nancy Chen,
- Abstract要約: 本稿では,STG-LIFG-PMC経路にインスパイアされたランク順ベースニューラルネットワークを提案する。
まず、このモデルが部分的手がかりから全発話を復元する能力を維持しつつ、効率よく入力を圧縮できることを実証する。
次に,このネットワークは,P3Bノベルティ波に似た,世界レベルのノベルティ検出を行うことを示す。
- 参考スコア(独自算出の注目度): 42.559054240539915
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Understanding how structured sequence information can be represented and generalized in neural systems is key to modeling the transition from acoustic input to emergent structure. In this study, we propose a rank-order based neural network inspired by the STG-LIFG-PMC pathway, modeling the bottom-up transition from acoustic input to abstract rank representation, and the top-down generation from that representation to motor execution. Building on previous work in rank coding, we first demonstrate that this model efficiently compresses input while retaining the capacity to reconstruct full utterances from partial cues, revealing emergent structure-sensitive generation process that reflects context-general representations of sensorimotor states, which are later shaped into context-specific motor plans during speech planning. We then show that the network exhibits global-level novelty detection similar to the P3B novelty wave, replicating the global-sequence-sensitive mechanism. As a supplement, we also compare the model's behavior under local (index-level) and global (rank-level) perturbations, revealing robustness to superficial variation and sensitivity to abstract structural violation, key features associated with proto-syntactic generalization. These results suggest that rank-order coding not only serve as a compact encoding scheme but also support encoding hierarchical grammar.
- Abstract(参考訳): 構造的シーケンス情報をニューラルネットワークでどのように表現し一般化するかを理解することは、音響入力から創発的構造への遷移をモデル化する鍵となる。
本研究では,STG-LIFG-PMC経路にインスパイアされたランク順ベースニューラルネットワークを提案し,音響入力から抽象ランク表現へのボトムアップ遷移と,その表現からモータ実行へのトップダウン生成をモデル化した。
本モデルでは, 音声プランニングにおいて, 音素状態の文脈一般表現を反映した創発的構造感性生成プロセスを明らかにするとともに, 音声プランニングにおいて, 入力を効率よく圧縮し, 部分的キューから全発話を再構成する能力を維持しながら, 入力を効率よく圧縮することを示した。
次に,このネットワークはP3Bノベルティ波と同様のグローバルレベルのノベルティ検出を示し,グローバルシーケンスに敏感なメカニズムを再現していることを示す。
補足として,局所的(指数レベル)と大域的(ランクレベル)摂動下でのモデルの挙動を比較し,表面的変動に対する堅牢性と抽象的構造的違反に対する感受性を明らかにする。
これらの結果から,階数次符号化はコンパクトな符号化スキームとして機能するだけでなく,階層文法の符号化もサポートすることが示唆された。
関連論文リスト
- Communication-Inspired Tokenization for Structured Image Representations [74.17163003465537]
COMiT(Communication inspired Tokenization)は、構造化された視覚トークンシーケンスを学習するためのフレームワークである。
セマンティックアライメントが基盤となる一方で、解釈可能なオブジェクト中心のトークン構造を誘導するためには、注意的なシーケンシャルトークン化が重要であることを示す。
論文 参考訳(メタデータ) (2026-02-24T09:53:50Z) - Entropy-Aware Structural Alignment for Zero-Shot Handwritten Chinese Character Recognition [7.632962062462334]
ゼロショット手書き漢字認識は、急進的な意味合成を活用することで、目に見えない文字を認識することを目的としている。
本稿では,情報理論モデリングにより視覚と意味のギャップを埋めるエントロピー対応構造アライメントネットワークを提案する。
ICDAR 2013データセットで55.04%の精度を達成し,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2026-02-03T16:08:40Z) - Towards Efficient General Feature Prediction in Masked Skeleton Modeling [59.46799426434277]
マスクスケルトンモデリングのための新しい汎用特徴予測フレームワーク(GFP)を提案する。
我々の重要な革新は、局所的な動きパターンからグローバルな意味表現にまたがる、従来の低レベルな再構築を高レベルな特徴予測に置き換えることです。
論文 参考訳(メタデータ) (2025-09-03T18:05:02Z) - Inducing Systematicity in Transformers by Attending to Structurally
Quantized Embeddings [60.698130703909804]
トランスフォーマーは、複雑なデータセットでトレーニングされた後、構造と実体の新規な構成に一般化する。
本稿では,SQ-Transformerを提案する。
SQ-Transformerは,複数の低複雑さ意味解析および機械翻訳データセット上で,バニラ変換器よりも強い構成一般化を実現することを示す。
論文 参考訳(メタデータ) (2024-02-09T15:53:15Z) - Graph-Induced Syntactic-Semantic Spaces in Transformer-Based Variational
AutoEncoders [5.037881619912574]
本稿では,トランスフォーマーを用いたVAEにおける構造構文注入のための潜時空間分離法について検討する。
具体的には、グラフベースおよびシーケンシャルモデルの統合により、符号化段階で構文構造をどのように活用するかを検討する。
我々の経験的評価は、自然言語文と数学的表現に基づいて行われ、提案したエンドツーエンドのVAEアーキテクチャにより、潜在空間の全体構造がより良くなることを示している。
論文 参考訳(メタデータ) (2023-11-14T22:47:23Z) - Real-World Compositional Generalization with Disentangled
Sequence-to-Sequence Learning [81.24269148865555]
最近提案されたDunangled sequence-to-sequence model (Dangle)は、有望な一般化能力を示している。
このモデルに2つの重要な変更を加え、より不整合表現を奨励し、その計算とメモリ効率を改善する。
具体的には、各タイミングでソースキーと値を適応的に再エンコードするのではなく、表現をアンタングルし、キーを定期的に再エンコードする。
論文 参考訳(メタデータ) (2022-12-12T15:40:30Z) - Auto-Parsing Network for Image Captioning and Visual Question Answering [101.77688388554097]
本稿では,入力データの隠れ木構造を発見し,活用するための自動パーシングネットワーク(APN)を提案する。
具体的には、各自己注意層における注意操作によってパラメータ化された確率的グラフモデル(PGM)を課し、スパース仮定を組み込む。
論文 参考訳(メタデータ) (2021-08-24T08:14:35Z) - Investigating the Compositional Structure Of Deep Neural Networks [1.8899300124593645]
本稿では,一方向線形活性化関数の構成構造に基づく新しい理論的枠組みを提案する。
予測ラベルと予測に使用する特定の(線形)変換の両方に関して、入力データのインスタンスを特徴付けることができる。
MNISTデータセットの予備テストでは、ニューラルネットワークの内部表現における類似性に関して、入力インスタンスをグループ化することが可能である。
論文 参考訳(メタデータ) (2020-02-17T14:16:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。