論文の概要: Eyla: Toward an Identity-Anchored LLM Architecture with Integrated Biological Priors -- Vision, Implementation Attempt, and Lessons from AI-Assisted Development
- arxiv url: http://arxiv.org/abs/2604.00009v1
- Date: Mon, 09 Mar 2026 17:22:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 02:36:13.184327
- Title: Eyla: Toward an Identity-Anchored LLM Architecture with Integrated Biological Priors -- Vision, Implementation Attempt, and Lessons from AI-Assisted Development
- Title(参考訳): Eyla: 統合された生物学的優先 - ビジョン、実装の試行、AI支援開発からの教訓 - を備えた、アイデンティティ対応のLLMアーキテクチャを目指して
- Authors: Arif Aditto,
- Abstract要約: Eylaは、生物学的にインスパイアされたサブシステムを統合するIDアンコールLDMアーキテクチャである。
本稿では,Eylaの設計的根拠,実装の試み,失敗解析について述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present the design rationale, implementation attempt, and failure analysis of Eyla, a proposed identity-anchored LLM architecture that integrates biologically-inspired subsystems -- including HiPPO-initialized state-space models, zero-initialized adapters, episodic memory retrieval, and calibrated uncertainty training -- into a unified agent operating system running on consumer hardware. Unlike existing approaches that optimize models for generic helpfulness, Eyla targets identity consistency: the ability to maintain a coherent self-model under adversarial pressure, admit uncertainty, and resist manipulation. We propose the Identity Consistency Score (ICS), a novel benchmark for evaluating this property across LLMs. We then present an honest account of attempting to implement this architecture using AI coding assistants (Claude Code, Cursor) as a non-programmer, documenting a $1,000+ failure that produced a 1.27B parameter model with 86 brain subsystems contributing less than 2% to output. Our analysis identifies five systematic failure modes of AI-assisted development for novel architectures and offers concrete recommendations. To our knowledge, this is the first paper to combine an architectural vision with a documented first-person failure analysis of AI-assisted LLM development, providing lessons for both the AI systems and AI-assisted software engineering communities.
- Abstract(参考訳): 本稿では,生物にインスパイアされたサブシステム(HiPPO初期化状態空間モデル,ゼロ初期化アダプタ,エピソードメモリ検索,キャリブレーション不確実性学習など)を,コンシューマハードウェア上で動作する統一エージェントオペレーティングシステムに統合する。
一般的な有用性のためにモデルを最適化する既存のアプローチとは異なり、Eylaはアイデンティティ一貫性をターゲットにしている。
LLM間の特性評価のための新しいベンチマークであるICS(Identity Consistency Score)を提案する。
次に、AIコーディングアシスタント(Claude Code、Cursor)を非プログラマとして使用し、86の脳サブシステムが2%未満の出力に寄与する1.27Bパラメータモデルを生成する1000ドル以上の失敗を文書化する。
我々の分析では、新しいアーキテクチャのためのAI支援開発における5つの体系的な障害モードを特定し、具体的な推奨を提供する。
我々の知る限り、この論文は、アーキテクチャのビジョンと、AI支援のLLM開発に関する文書化された一人称の失敗分析を組み合わせる最初の論文であり、AIシステムとAI支援のソフトウェアエンジニアリングコミュニティの両方に教訓を提供する。
関連論文リスト
- Engineering AI Agents for Clinical Workflows: A Case Study in Architecture,MLOps, and Governance [0.21748200848556345]
我々は、ヒューマン・イン・ザ・ループ(Human-in-the-Loop)ガバナンスモデルが、単に安全チェックとしてだけでなく、継続的な改善のための重要なイベント駆動データソースとして技術的に統合されていることを示す。
我々は、このプラットフォームをリファレンスアーキテクチャとして提示し、メンテナンス可能でスケーラブルで説明可能なAI対応システムを高レベルなドメインで構築するエンジニアに実践的な教訓を提供する。
論文 参考訳(メタデータ) (2026-01-31T14:33:57Z) - EmboCoach-Bench: Benchmarking AI Agents on Developing Embodied Robots [68.29056647487519]
Embodied AIは、高忠実度シミュレーションと大規模データ収集によって実現されている。
しかし、このスケーリング能力は、労働集約的な手作業の監視に依存しているため、いまだにボトルネックになっている。
実装ポリシーを自律的に構築するための LLM エージェントの能力を評価するベンチマークである textscEmboCoach-Bench を紹介する。
論文 参考訳(メタデータ) (2026-01-29T11:33:49Z) - AI-NativeBench: An Open-Source White-Box Agentic Benchmark Suite for AI-Native Systems [52.65695508605237]
我々は、Model Context Protocol(MCP)とAgent-to-Agent(A2A)標準に基づいて、アプリケーション中心でホワイトボックスのAI-NativeベンチマークスイートであるAI-NativeBenchを紹介する。
エージェントスパンを分散トレース内の第一級市民として扱うことにより,本手法は,単純な機能以上の工学的特性の粒度解析を可能にする。
この研究は、モデル能力の測定から信頼性の高いAI-Nativeシステムへの移行を導く最初の体系的な証拠を提供する。
論文 参考訳(メタデータ) (2026-01-14T11:32:07Z) - Fundamentals of Building Autonomous LLM Agents [64.39018305018904]
本稿では,大規模言語モデル(LLM)を用いたエージェントのアーキテクチャと実装手法について概説する。
この研究は、複雑なタスクを自動化し、人間の能力でパフォーマンスのギャップを埋めることのできる「アジェンティック」なLLMを開発するためのパターンを探求することを目的としている。
論文 参考訳(メタデータ) (2025-10-10T10:32:39Z) - A Comprehensive Survey on Benchmarks and Solutions in Software Engineering of LLM-Empowered Agentic System [56.40989626804489]
この調査は、Large Language Modelsを使ったソフトウェアエンジニアリングに関する、最初の総合的な分析を提供する。
本稿では,150以上の最近の論文をレビューし,(1)素早い,微調整,エージェントベースのパラダイムに分類した解法,(2)コード生成,翻訳,修復などのタスクを含むベンチマークという2つの重要な側面に沿った分類法を提案する。
論文 参考訳(メタデータ) (2025-10-10T06:56:50Z) - Towards the Next Generation of Software: Insights from Grey Literature on AI-Native Applications [13.876049229274114]
AIネイティブアプリケーションは、ソフトウェアの設計、開発、進化の方法を根本的に再定義する、ソフトウェアエンジニアリングの新しいパラダイムである。
人気が高まっているにもかかわらず、AIネイティブアプリケーションには、統一されたエンジニアリング定義とアーキテクチャの青写真がない。
本研究は、AIネイティブアプリケーションの定義特性、キー品質特性、および典型的な技術スタックを識別することにより、AIネイティブアプリケーションの包括的な理解を確立することを目的とする。
論文 参考訳(メタデータ) (2025-09-16T15:01:23Z) - MeLA: A Metacognitive LLM-Driven Architecture for Automatic Heuristic Design [16.216869444746898]
MeLAはメタ認知型LLM駆動アーキテクチャで、AHD(Automatic Heuristic Design)の新しいパラダイムを提供する
MeLAは、これらを生成する際にLLM(Large Language Model)を導くために使われる命令プロンプトを進化させる。
プロンプト進化」のこのプロセスは、新しいメタ認知フレームワークによって駆動される。
論文 参考訳(メタデータ) (2025-07-28T05:56:40Z) - Generalising from Self-Produced Data: Model Training Beyond Human Constraints [0.0]
本稿では,AIモデルが新たな知識を自律的に生成し,検証する新しい枠組みを提案する。
このアプローチの中心は、人間のベンチマークを必要とせずに学習をガイドする、無制限で使い捨ての数値報酬である。
論文 参考訳(メタデータ) (2025-04-07T03:48:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。