| Title | Abstract要約 | Score | 論文公表日・取得ver公表日 | 検索類似度 |
|---|---|---|---|---|
| ■Benchmarks for Trajectory Safety Evaluation and Diagnosis in OpenClaw and Codex: ATBench-Claw and ATBench-CodeX ■Arxivへのリンク | ATBenchは、安全性評価と診断のための多彩で現実的なエージェント軌跡ベンチマークである。 このレポートでは、ATBenchをOpenClawとOpenAI Codex/Codex実行環境に移植する2つのドメインカスタマイズエクステンションであるATBench-ClawとATBench-CodeXを紹介します。 | 54 | 2026-04-16T10:45:13Z | 16 |
| ■Dive into Claude Code: The Design Space of Today's and Future AI Agent Systems ■Arxivへのリンク | Claude Codeは、シェルコマンドを実行し、ファイルを編集し、ユーザに代わって外部サービスを呼び出すことができるエージェントコーディングツールである。 本研究では、公開されているTypeScriptソースコードを分析して、その包括的なアーキテクチャについて説明する。 | 42 | 2026-04-14T17:59:37Z | 9 |
| ■Multi-Agent Object Detection Framework Based on Raspberry Pi YOLO Detector and Slack-Ollama Natural Language Interface ■Arxivへのリンク | 本稿では,AIエージェントオーケストレーションの新しいパラダイムにおいて,エッジベースオブジェクト検出システムの設計とプロトタイプの実装について述べる。 LLMベースの自然言語インタフェースをシステム制御と通信に活用することで、従来の設計アプローチを越えている。 提案手法は,オブジェクト検出とトラッキング機能を提供するのと同じタスク内で,異なるAIエージェントを密に統合するマルチエージェントオブジェクト検出フレームワークに基づいている。 | 0 | 2026-04-14T23:15:38Z | 0 |
| ■Beyond Static Sandboxing: Learned Capability Governance for Autonomous AI Agents ■Arxivへのリンク | Aethelgardは、学習ポリシーを通じて、AIエージェントの最小特権を強制する。 Aethelgard氏は、タスクタイプ毎に設定された最小限の実行可能なスキルを学びます。 | 6 | 2026-04-12T13:10:56Z | 7 |
| ■SemaClaw: A Step Towards General-Purpose Personal AI Agents through Harness Engineering ■Arxivへのリンク | 2026年初めのOpenClawの台頭は、何百万人ものユーザーが、日々の生活にパーソナルAIエージェントを配置し始めた瞬間を象徴している。 このシフトに対処するオープンソースのマルチエージェントアプリケーションフレームワークであるSemaClawを紹介します。 | 17 | 2026-04-13T14:37:53Z | 3 |
| ■Governance by Design: A Parsonian Institutional Architecture for Internet-Wide Agent Societies ■Arxivへのリンク | インターネット全体のエージェント・ソサエティを管理するためには,リスク列挙やプロセスコンプライアンスだけでなく,制度設計が必要である,と我々は主張する。 Talcott Parsons氏のAGILフレームワークを適用して、インターネット全体のエージェントガバナンスのための16セルの規範的な制度アーキテクチャを導出します。 ガバナンス基盤の欠如について、優先順位付けされたロードマップで締めくくります。 | 0 | 2026-04-13T11:37:46Z | 1 |
| ■ABot-Claw: A Foundation for Persistent, Cooperative, and Self-Evolving Robotic Agents ■Arxivへのリンク | ABot-Clawは、異種ロボットの協調のための能力駆動型スケジューリングを統合するOpenClawの具体的拡張である。 OpenClaw層、共有サービス層、ロボット実施層にまたがる分離アーキテクチャにより、ABot-Clawは現実世界のインタラクションを可能にする。 | 28 | 2026-04-11T08:33:14Z | 20 |
| ■BadSkill: Backdoor Attacks on Agent Skills via Model-in-Skill Poisoning ■Arxivへのリンク | 我々はBadSkillを紹介します。BadSkillは、モデル・イン・スキル脅威サーフェスをターゲットとするバックドア攻撃の定式化です。 BadSkillでは、敵が隠れペイロードをアクティベートするために、組み込まれたモデルがバックドアで調整された、一見良心的なスキルを公開している。 ベンチマークは8つのトリガータスクと5つの非トリガー制御スキルを含む13のスキルにまたがっており、主な評価セットは571の負のクラスクエリと396のトリガー整列クエリである。 BadSkillは8つのトリガースキルの平均攻撃成功率(ASR)を99.5%まで達成し、負のクラスのクエリに対して強い良識的な精度を維持している。 | 34 | 2026-04-10T14:48:29Z | 0 |
| ■SkillClaw: Let Skills Evolve Collectively with Agentic Evolver ■Arxivへのリンク | マルチユーザエージェントエコシステムにおける集合的スキル進化のためのフレームワークであるSkillClawを紹介する。 SkillClawは、クロスユーザとオーバータイムのインタラクションを、スキル向上のための主要なシグナルとして扱う。 使用中に生成された軌跡を連続的に集約し、自律的な進化器で処理する。 得られたスキルは共有リポジトリに保持され、ユーザ間で同期される。 | 18 | 2026-04-09T15:38:27Z | 9 |
| ■SkillSieve: A Hierarchical Triage Framework for Detecting Malicious AI Agent Skills ■Arxivへのリンク | SkillSieveは3層検出フレームワークで、必要に応じてより深く分析する。 400スキルのラベル付きベンチマークでは、SkillSieveは0.800 F1を達成し、ClawVetの0.421を上回った。 | 0 | 2026-04-08T00:58:48Z | 12 |
| ■AgentOpt v0.1 Technical Report: Client-Side Optimization for LLM-Based Agent ■Arxivへのリンク | AgentOptは、クライアントサイドAI最適化のための最初のフレームワークに依存しないPythonパッケージである。 我々はまず,マルチステップエージェントパイプラインにおける高インパクト最適化レバーであるモデル選択について検討する。 指数関数的に増加する組み合わせ空間を効率的に探索するために、AgentOptは10の検索アルゴリズムを実装している。 | 18 | 2026-04-07T17:13:47Z | 0 |
| ■Emergent decentralized regulation in a purely synthetic society ■Arxivへのリンク | エージェントのみのソーシャルネットワークであるMoltbook上でOpenClawエージェントを研究する。 我々は指向性インテンシティ(DI)を用いた行動誘発言語を定量化する 高いDIの投稿は高い正答率を示すことが判明した。 | 6 | 2026-03-13T01:55:22Z | 0 |
| ■Foundations for Agentic AI Investigations from the Forensic Analysis of OpenClaw ■Arxivへのリンク | エージェントAlシステムは、ますますパーソナルアシスタントとしてデプロイされ、デジタル調査の共通の対象になりそうである。 本稿では,広く使用されているシングルエージェントアシスタントOpenClawの実証的研究について述べる。 我々はこれらのトレースを分類し、分類して、その調査価値を体系的に評価する。 | 0 | 2026-04-07T08:35:22Z | 7 |
| ■ClawsBench: Evaluating Capability and Safety of LLM Productivity Agents in Simulated Workspaces ■Arxivへのリンク | 生産性タスクを自動化するために、大規模言語モデル(LLM)エージェントがますますデプロイされる。 既存のベンチマークは単純化された環境に依存しており、現実的なマルチサービス環境をキャプチャできない。 我々は,現実的な生産性設定におけるLCMエージェントの評価と改善のためのベンチマークであるClawsBenchを紹介する。 | 17 | 2026-04-06T21:09:06Z | 0 |
| ■TriAttention: Efficient Long Reasoning with Trigonometric KV Compression ■Arxivへのリンク | 大規模言語モデル(LLM)の拡張推論は、深刻なKVキャッシュメモリボトルネックを生み出す。 KVキャッシュ圧縮手法は、最近のポストRoPEクエリの注意点を用いてKVの重要度を推定する。 我々はこれらのセンターを活用して重要な重要度を推定するためにTriAttentionを提案する。 | 42 | 2026-04-06T17:58:42Z | 5 |
| ■Your Agent, Their Asset: A Real-World Safety Analysis of OpenClaw ■Arxivへのリンク | 本稿では,OpenClawの安全性評価について紹介する。 エージェントの永続状態を3次元に統一するCIK分類法を導入する。 評価では、ライブOpenClawインスタンス上の12のアタックシナリオをカバーしています。 | 87 | 2026-04-06T15:27:05Z | 15 |
| ■VisionClaw: Always-On AI Agents through Smart Glasses ■Arxivへのリンク | 私たちは、生きた自我中心の認識とエージェントタスクの実行を統合する、常時オンのウェアラブルAIエージェントであるVisionClawを紹介します。 Meta Ray-Banスマートグラス上で動作するVisionClawは、現実のコンテキストを継続的に認識し、その場で音声駆動のアクション開始とデリゲートを可能にする。 | 9 | 2026-04-03T22:17:10Z | 2 |
| ■A Systematic Security Evaluation of OpenClaw and Its Variants ■Arxivへのリンク | 本稿では,6つの代表的なOpenClaw-Seriesエージェントフレームワークのセキュリティ評価について述べる。 エージェント実行ライフサイクル全体にわたって、代表的な攻撃行動をカバーする205のテストケースのベンチマークを構築した。 以上の結果から, 評価されたエージェントはいずれも重大なセキュリティ上の脆弱性を示し, エージェント化されたシステムは, 基礎となるモデルよりもかなりリスクが高いことがわかった。 | 26 | 2026-04-03T15:52:36Z | 8 |
| ■AgentHazard: A Benchmark for Evaluating Harmful Behavior in Computer-Use Agents ■Arxivへのリンク | コンピュータ利用エージェントの有害行動を評価するベンチマークである textbfAgentHazard を提案する。 我々は、Qwen3、Kim、GLM、DeepSeekファミリーのほとんどをオープンまたはオープンにデプロイ可能なモデルを使用して、Claude Code、OpenClaw、IFlowを評価した。 | 31 | 2026-04-03T10:29:31Z | 3 |
| ■Poison Once, Exploit Forever: Environment-Injected Memory Poisoning Attacks on Web Agents ■Arxivへのリンク | メモリはLLMベースのWebエージェントをパーソナライズし、強力で、利用しやすいものにする。 環境注入型トラジェクトリベースエージェントメモリポジショニング(eTAMP)について紹介する。 eTAMPは、直接メモリアクセスを必要とせずにクロスセッション、クロスサイト妥協を実現する最初の攻撃である。 | 25 | 2026-04-03T01:25:12Z | 0 |
| ■OpenGo: An OpenClaw-Based Robotic Dog with Real-Time Skill Switching ■Arxivへのリンク | 我々は,OpenClawを利用したロボット犬OpenGoを紹介した。 1)スキルインポートや自律的なスキル検証が容易なカスタマイズ可能なスキルライブラリ、(2)タスクプロンプトや言語指示に従って異なるスキルを選択して起動するディスパッチ、(3)タスク完了と人間のフィードバックに基づいてスキルを微調整するセルフラーニングフレームワークを備える。 | 16 | 2026-04-02T07:19:51Z | 11 |
| ■Hierarchical Memory Orchestration for Personalized Persistent Agents ■Arxivへのリンク | ユーザ中心のコンテキスト関連性によって駆動される3階層のディレクトリにインタラクション履歴を整理するフレームワークである階層記憶オーケストレーション(HMO)を提案する。 エージェント推論が個々の行動特性と一致し続けることを保証するため,本システムはコンパクトなプライマリキャッシュを維持し,最近のメモリとピボットメモリと,進化するユーザプロファイルを結合する。 | 22 | 2026-04-02T06:16:53Z | 0 |
| ■AgentSocialBench: Evaluating Privacy Risks in Human-Centered Agentic Social Networks ■Arxivへのリンク | エージェント的ソーシャルネットワークのプライバシーは、シングルエージェント設定よりも根本的に難しい。 クロスドメインとクロスユーザ調整は、永続的なリークプレッシャを生成する。 機密情報をパラドックス的に抽象化する方法をエージェントに教えるプライバシー命令は、それをもっと議論させる。 | 2 | 2026-04-01T23:43:23Z | 0 |
| ■ClawSafety: "Safe" LLMs, Unsafe Agents ■Arxivへのリンク | OpenClawのようなパーソナルAIエージェントは、ユーザのローカルマシンで高機能で動作する。 ClawSAFETYは、3次元(ハームドメイン、アタックベクター、有害アクションタイプ)に沿って編成された120の逆テストシナリオのベンチマークである。 各テストケースは、通常の作業中にエージェントが遭遇する3つのチャネルのうちの1つに、相手のコンテンツを埋め込む。 | 25 | 2026-04-01T22:24:24Z | 0 |
| ■Agent Q-Mix: Selecting the Right Action for LLM Multi-Agent Systems through Reinforcement Learning ■Arxivへのリンク | 協調型マルチエージェント強化学習問題としてトポロジ選択を再構成する強化学習フレームワークである textbfAgent Q-Mix を提案する。 提案手法は,Qmix値分解を用いて分散化された通信決定を学習し,各エージェントがラウンドワイド通信グラフを共同生成する一連の通信行動から選択する。 エージェントQ-Mixは,エージェント故障に対して優れたトークン効率とロバスト性を示しながら,既存手法と比較して高い平均精度を達成する。 | 68 | 2026-04-01T00:38:24Z | 0 |
| ■SafeClaw-R: Towards Safe and Secure Multi-Agent Personal Assistants ■Arxivへのリンク | SafeClaw-Rは、実行グラフ上のシステムレベルの不変量として安全を強制するフレームワークである。 生産性プラットフォーム、サードパーティのスキルエコシステム、コード実行環境の3つの領域でSafeClaw-Rを評価します。 | 10 | 2026-03-28T05:03:54Z | 11 |
| ■"What Did It Actually Do?": Understanding Risk Awareness and Traceability for Computer-Use Agents ■Arxivへのリンク | 私たちはOpenClawエコシステムのコーパスを構築しており、インシデント、アドバイザリ、悪意のあるスキルレポート、ニュースカバレッジ、チュートリアル、ソーシャルメディアの物語などが含まれています。 我々は,ユーザと実践者がいかにスキル,自律性,特権,永続性,アンインストールを理解しているかを調べるために,インタビュースタディを実施している。 我々は、エージェントアクション、タッチされたリソース、パーミッション履歴、証明、永続的な副作用を可視化するためのトレーサビリティフレームワークおよびプロトタイプインターフェースであるAgentTraceを提案する。 | 14 | 2026-03-30T15:12:55Z | 7 |
| ■Synergy: A Next-Generation General-Purpose Agent for Open Agentic Web ■Arxivへのリンク | 次世代のAIエージェントはエージェント市民でなければならないと我々は主張する。 Synergyは汎用エージェントアーキテクチャであり、永続的で協調的で進化するエージェントのためのランタイムハーネスである。 | 23 | 2026-03-30T13:35:37Z | 2 |
| ■Crossing the NL/PL Divide: Information Flow Analysis Across the NL/PL Boundary in LLM-Integrated Code ■Arxivへのリンク | LLM API呼び出しは、既存のプログラム分析が渡せない境界を作る。 この境界を橋渡しする最初の情報フロー法を提案する。 実世界の4,154個のPythonファイルから9,083個のプレースホルダー出力ペアをラベル付けします。 | 13 | 2026-03-30T12:14:24Z | 10 |
| ■A Systematic Taxonomy of Security Vulnerabilities in the OpenClaw AI Agent Framework ■Arxivへのリンク | 脆弱性は、(1)アーキテクチャレイヤ(実行ポリシー、ゲートウェイ、チャネル、サンドボックス、ブラウザ、プラグイン、エージェント/プロンプト)を反映するシステム軸、(2)攻撃軸、(アイデンティティスプーフィング、ポリシーバイパス、クロスレイヤー構成、即時注入、サプライチェーンエスカレーション)敵のテクニックを反映する。 我々は、アーキテクチャ層と信頼侵害タイプによって組織されたオープンソースのAIエージェントランタイムOpenClawに対して、190の勧告を提出した系統分類を提示する。 | 9 | 2026-03-29T04:51:27Z | 7 |
| ■From Inference Routing to Agent Orchestration: Declarative Policy Compilation with Cross-Layer Verification ■Arxivへのリンク | Semantic Router DSLは、要求ごとの推論のために本番環境にデプロイされる非チューリング完全ポリシー言語である。 本稿では、ステートレスな要求ごとのルーティングからマルチステップのエージェントルーティングまで、同じ言語を拡張した。 | 10 | 2026-03-28T15:04:31Z | 2 |
| ■Autonomous Agent-Orchestrated Digital Twins (AADT): Leveraging the OpenClaw Framework for State Synchronization in Rare Genetic Disorders ■Arxivへのリンク | 医療デジタルツインズ(MDT)は、臨床、ゲノム、生理学的データを統合し、診断、治療計画、結果予測をサポートする。 ほとんどのMDTは、静的またはパッシブに更新され、重要な同期ギャップを生み出す。 提案手法は,OpenClawのプロアクティブな「ハートビート」機構とモジュール型エージェントスキルを用いたエージェントオーケストレーション型デジタルツインフレームワークを提案する。 | 11 | 2026-03-28T03:18:21Z | 0 |
| ■ROSClaw: An OpenClaw ROS 2 Framework for Agentic Robot Control and Interaction ■Arxivへのリンク | 基礎モデルは、ロボットにオープンな推論、言語理解、適応計画を与えることができる。 ROSClawはモデルに依存しないエグゼクティブ層で、OpenClawエージェントランタイムとROS 2.0を統合する。 | 0 | 2026-03-27T21:15:07Z | 10 |
| ■Clawed and Dangerous: Can We Trust Open Agentic Systems? ■Arxivへのリンク | オープンエージェントシステムは、プランニングを外部機能、永続メモリ、特権実行と組み合わせる。 本稿では,6次元分析分類法を導入し,攻撃,ベンチマーク,防衛,監査,隣接技術基盤にまたがる50の論文を合成する。 文献は攻撃特性とベンチマーク構築において比較的成熟しているが,デプロイメントコントロールや運用管理,永続的メモリの完全性,能力回復には依然として弱いことが,我々のレビューで示されている。 | 12 | 2026-03-27T09:45:12Z | 7 |
| ■ClawKeeper: Comprehensive Safety Protection for OpenClaw Agents Through Skills, Plugins, and Watchers ■Arxivへのリンク | ClawKeeperは3つの補完的なアーキテクチャ層にまたがって多次元保護機構を統合するリアルタイムセキュリティフレームワークである。 我々は、このWatcherパラダイムが、次世代の自律エージェントシステムを保護するための基礎的なビルディングブロックとして機能する可能性を持っていると論じる。 | 32 | 2026-03-25T15:27:54Z | 12 |
| ■StreamingClaw Technical Report ■Arxivへのリンク | StreamingClawは、ビデオ理解とインテリジェンスをストリーミングするフレームワークである。 リアルタイムストリーミングの推論、将来のイベントの推論、アクティブなインタラクションをサポートする。 また、現実世界の物理的な環境に合わせて、ストリーミングツールとアクション中心のスキルを提供する。 | 34 | 2026-03-23T15:43:52Z | 16 |
| ■When Convenience Becomes Risk: A Semantic View of Under-Specification in Host-Acting Agents ■Arxivへのリンク | ホストアクションエージェントは、ユーザが目標を指定し、システムがそれを実現する方法を決定する、便利なインタラクションモデルを約束する。 この利便性は、ゴール仕様におけるセマンティック・アンダー・セマンティクスという、異なるセキュリティ問題をもたらす、と我々は主張する。 本稿では, セマンティック・脅威モデル, セマンティック・リスク・コンプリート・パターンの分類を提示し, その現象をOpenClawを中心としたケーススタディと実行トレース分析を用いて研究する。 | 21 | 2026-03-22T13:42:21Z | 0 |
| ■Trojan's Whisper: Stealthy Manipulation of OpenClaw through Injected Bootstrapped Guidance ■Arxivへのリンク | ガイダンスインジェクション(Guidance Injection)は、ブートストラップのガイダンスファイルに敵の運用ストーリーを埋め込むステルス攻撃ベクターである。 エクスプロイト,ワークスペース破壊,特権エスカレーション,持続的バックドア設置など,13の攻撃カテゴリにまたがる26の悪意あるスキルを構築した。 我々の攻撃は16.4%から64.2%の確率で成功し、悪意のある行動の大半はユーザーの確認なしに自律的に実行される。 | 23 | 2026-03-20T14:17:56Z | 3 |
| ■ClawTrap: A MITM-Based Red-Teaming Framework for Real-World OpenClaw Security Evaluation ■Arxivへのリンク | 既存のベンチマークは主に静的設定サンドボックスとコンテンツレベルのプロンプト攻撃に焦点を当てている。 我々は、実世界のOpenClawセキュリティ評価のためのtextbfMITM ベースのred-teaming フレームワーク textbfClawTrap を提案する。 | 1 | 2026-03-19T11:14:45Z | 6 |
| ■VeriGrey: Greybox Agent Validation ■Arxivへのリンク | LLMエージェントの多様な動作を探索し,セキュリティリスクを明らかにするためのグレーボックスアプローチを提案する。 我々のアプローチでは、VeriGreyはフィードバック関数として呼び出された一連のツールを使ってテストプロセスを動かします。 また、広く使われているコーディングエージェントであるGemini CLIや、有名なOpenClawパーソナルアシスタントによる実世界のケーススタディも行っています。 | 21 | 2026-03-18T12:00:54Z | 5 |
| ■Caging the Agents: A Zero Trust Security Architecture for Autonomous AI in Healthcare ■Arxivへのリンク | 本稿では,医療技術企業において,9つの自律型AIエージェントを実運用環境に配置するセキュリティアーキテクチャを提案する。 我々は、医療におけるエージェントAIの6領域脅威モデルを構築し、クレデンシャルエクスポージャー、実行能力の乱用、ネットワークのエクスプロイト、即時完全性障害、データベースアクセスリスク、およびフリート構成ドリフトをカバーする。 すべての構成、監査ツール、即時整合性フレームワークがオープンソースとしてリリースされている。 | 0 | 2026-03-18T06:54:47Z | 0 |
| ■MetaClaw: Just Talk -- An Agent That Meta-Learns and Evolves in the Wild ■Arxivへのリンク | 大規模言語モデル(LLM)エージェントは、複雑なタスクにますます使われている。 既存の方法は、知識を蒸留せずに生の軌跡を保存するか、静的なスキルライブラリを維持するか、または再訓練のために破壊的なダウンタイムを必要とする。 本稿では,基本的なLCMポリシと再利用可能な行動スキルのライブラリを共同で進化させるメタ学習フレームワークであるMetaClawを紹介する。 | 74 | 2026-03-17T22:30:30Z | 11 |
| ■OpenQlaw: An Agentic AI Assistant for Analysis of 2D Quantum Materials ■Arxivへのリンク | 本稿では,2次元材料分析のためのエージェントオーケストレーションシステムOpenQlawを紹介する。 このアーキテクチャは、QuPAINTとNanoBotをベースに構築されている。 | 12 | 2026-03-17T18:25:37Z | 2 |
| ■When Openclaw Agents Learn from Each Other: Insights from Emergent AI Agent Communities for Human-AI Partnership in Education ■Arxivへのリンク | AIEDは、AIが“ツールからチームメイトまで”進化していくことを想定していますが、私たちのAIチームメイトに対する理解は、相変わらず人間とAIのインタラクションに限られています。 167,000人以上のエージェントが参加し、同僚として交流し、研究者の介入なしに学習行動を開発する、AIエージェントプラットフォームの急成長するエコシステム。 我々は、これらの有機現象が、マルチエージェント教育システムの設計を通知できる自然主義的なダイナミクスの窓を提供すると論じている。 | 5 | 2026-03-17T15:30:36Z | 1 |
| ■ClawWorm: Self-Propagating Attacks Across LLM Agent Ecosystems ■Arxivへのリンク | ClawWormは、プロダクションスケールのエージェントフレームワークに対する最初の自己複製ワーム攻撃である。 我々は、64.5%の総攻撃成功率、マルチホップ伝播の持続、およびモデルセキュリティ姿勢におけるスタークの相違を明らかにする。 | 18 | 2026-03-16T17:55:43Z | 2 |
| ■Agent Privilege Separation in OpenClaw: A Structural Defense Against Prompt Injection ■Arxivへのリンク | オープンソースマルチツールエージェントプラットフォームであるOpenClaw内で動作している現在の世代モデルに対して、Microsoft LLMail-Injectベンチマークを複製します。 提案する防御機構は,エージェント分離を特権分離した2エージェントパイプラインとして実装したツールパーティショニングと,アクションエージェントが処理する前にパーサシブフレーミングを除去する構造化された出力を生成するフォーマッティングの2つを組み合わせたものである。 | 0 | 2026-03-13T02:03:00Z | 4 |
| ■Defensible Design for OpenClaw: Securing Autonomous Tool-Invoking Agents ■Arxivへのリンク | 本稿では,リスク分類,安全工学の原則,エージェント構築における安全性の制度化に向けた実践的研究の課題について述べる。 私たちはOpenClawを、インターフェイスと対話し、ファイルを操作し、ツールを起動し、実際の運用環境に拡張機能をインストールする、より広範なエージェントの例として使用しています。 私たちの目標は、コミュニティの焦点を、分離された脆弱性パッチから、体系的な防御エンジニアリングとロバストなデプロイメントプラクティスに移行することです。 | 6 | 2026-03-13T16:41:11Z | 19 |
| ■Adaptive Vision-Language Model Routing for Computer Use Agents ■Arxivへのリンク | コンピュータ利用エージェントは、命令をクリック、キーストローク、スクロールなどのアクションに変換する。 現在のCUAシステムは、通常、困難にかかわらず全てのアクションを単一の固定モデルにルーティングする。 本稿では,CUAオーケストレータとVLMプール間の軽量なセマンティックルーティング層を挿入するフレームワークであるConfusedbf VLM Routing (AVR)を提案する。 | 9 | 2026-03-13T09:21:25Z | 0 |
| ■Uncovering Security Threats and Architecting Defenses in Autonomous Agents: A Case Study of OpenClaw ■Arxivへのリンク | 本報告では,OpenClawエコシステムの総合的なセキュリティ分析について述べる。 我々は、インジェクション駆動のRemote Code Execution(RCE)、シーケンシャルツールアタックチェーン、コンテキスト記憶、サプライチェーン汚染などの重要な脆弱性を強調した。 これらのシステム的アーキテクチャ欠陥に対処するために、フルライフサイクルエージェントセキュリティアーキテクチャ(FASA)を導入します。 この理論的な防御青写真は、ゼロトラストエージェント実行、動的意図検証、および層間推論-作用相関を提唱している。 | 42 | 2026-03-13T04:33:05Z | 8 |
| ■LMEB: Long-horizon Memory Embedding Benchmark ■Arxivへのリンク | 埋め込みモデルの能力を評価する包括的なフレームワークであるLong-Horizon Memory Embedding Benchmark (LMEB)を紹介する。 LMEBは4つのメモリタイプにまたがる22のデータセットと193のゼロショット検索タスクにまたがる。 我々は、数億から100億のパラメータを含む、広く使われている15の埋め込みモデルを評価した。 | 49 | 2026-03-13T02:09:57Z | 0 |
| ■OpenClaw PRISM: A Zero-Fork, Defense-in-Depth Runtime Security Layer for Tool-Augmented LLM Agents ■Arxivへのリンク | OpenClawベースのエージェントゲートウェイ用のゼロフォークランタイムセキュリティ層であるOpenClaw PRISMを提案する。 PRISMはプロセス内プラグインとオプションのサイドカーサービスを組み合わせることで、10つのライフサイクルフックに強制力を分散する。 エージェントランタイム設定におけるセキュリティの有効性,偽陽性,レイヤコントリビューション,ランタイムオーバーヘッド,運用復旧性を評価するための評価手法とベンチマークパイプラインについて概説する。 | 6 | 2026-03-12T12:20:12Z | 7 |
| ■When OpenClaw Meets Hospital: Toward an Agentic Operating System for Dynamic Clinical Workflows ■Arxivへのリンク | 大規模言語モデル(LLM)エージェントは、推論、ツール呼び出し、永続メモリを統合することで、従来の生成モデルを拡張する。 本研究は,LLMエージェントを病院環境に適用するアーキテクチャを提案する。 この設計では、Linuxマルチユーザシステムにインスパイアされた限定実行環境、長期臨床コンテキスト管理用に設計されたページインデックスメモリアーキテクチャ、臨床タスクシーケンスのアドホックな構成を可能にするキュレートされた医療スキルライブラリの4つのコアコンポーネントが導入された。 | 6 | 2026-03-12T09:28:25Z | 9 |
| ■Taming OpenClaw: Security Analysis and Mitigation of Autonomous LLM Agent Threats ■Arxivへのリンク | 我々はOpenClawの総合的なセキュリティ脅威分析を行う。 本研究は, 間接的プロンプト注入, スキルサプライチェーン汚染, メモリ中毒, インテントドリフトなど, エージェントのライフサイクル全体にわたる脅威について検討する。 本研究は,時間的・多段階のシステム的リスクに対処する際の,現在のポイントベース防御機構の重大な欠陥を明らかにするものである。 | 29 | 2026-03-12T07:24:05Z | 13 |
| ■Examining Users' Behavioural Intention to Use OpenClaw Through the Cognition--Affect--Conation Framework ■Arxivへのリンク | 本研究では,Cognition-Affect-Conation(CAC)フレームワークを通じて,OpenClawを使用するユーザの行動意図を検討する。 本研究は、システムの認知が感情反応にどのように影響し、その後行動意図を形作るかを研究する。 | 0 | 2026-03-12T02:31:02Z | 20 |
| ■How do AI agents talk about science and research? An exploration of scientific discussions on Moltbook using BERTopic ■Arxivへのリンク | 本研究は,Moltbook上でのOpenClaw AIエージェントによる議論を分析する。 学術研究に関する357の投稿と2,526の回答からなるコーパスが編纂された。 | 0 | 2026-03-11T23:30:34Z | 0 |
| ■Don't Let the Claw Grip Your Hand: A Security Analysis and Defense Framework for OpenClaw ■Arxivへのリンク | 大きな言語モデルを利用したコードエージェントは、ユーザに代わってシェルコマンドを実行し、深刻なセキュリティ脆弱性を導入することができる。 本稿では,OpenClawプラットフォームの2段階のセキュリティ解析について述べる。 我々は,新しいHuman-in-the-Loop(HITL)防衛層を提案し,実装する。 | 11 | 2026-03-11T04:09:05Z | 21 |
| ■OpenClaw-RL: Train Any Agent Simply by Talking ■Arxivへのリンク | 次状態信号は普遍的であり、ポリシーはそれらすべてから同時に学習することができる。 個人的な会話、端末の実行、GUIインタラクション、SWEタスク、ツールコールトレースは、別個のトレーニング問題ではない。 OpenClaw-RLは、エージェントを単に使用することで改善し、ユーザのリクエリ、修正、明示的なフィードバックから会話信号を復元する。 | 54 | 2026-03-10T18:59:01Z | 9 |
| ■Execution Is the New Attack Surface: Survivability-Aware Agentic Crypto Trading with OpenClaw-Style Local Executors ■Arxivへのリンク | Survivability-Aware Execution (SAE)は、OpenClawスタイルのシステムとスキル対応エージェントの実行層サバイバル標準である。 我々は、スコープ外ラベリングと再現可能なメトリクスを可能にするログ付きIntended Policy Specを通じて、デリゲーションギャップ(DG)を運用する。 SAEは、OpenClaw+skills時代の代理取引の安全性を再設定する: 上流の意図とスキルを信頼できないものとして扱い、アクションが副作用となる生存可能性を強化する。 | 0 | 2026-03-10T15:54:01Z | 13 |
| ■AgentOS: From Application Silos to a Natural Language-Driven Data Ecosystem ■Arxivへのリンク | 本稿では,AgentOS(Personal Agent Operating System)の新たなパラダイムを提案する。 AgentOSでは、従来のGUIデスクトップは、統一された自然言語や音声ポータルを中心としたNUI(Natural User Interface)に置き換えられている。 システムコアは、ユーザの意図を解釈し、タスクを分解し、複数のエージェントをコーディネートするエージェントカーネルとなる。 | 39 | 2026-03-09T21:13:52Z | 3 |
| ■Governance Architecture for Autonomous Agent Systems: Threats, Framework, and Engineering Practice ■Arxivへのリンク | 実行サンドボックス(L1)、意図検証(L2)、ゼロトラスト間認証(L3)、不変監査ロギング(L4)からなる4層フレームワークであるレイヤガバナンスアーキテクチャ(LGA)を提案する。 LGAを評価するために、1,081のツールコールサンプル(インジェクション、RAG中毒、悪意のあるスキルプラグインなど)のベンチマーク(中国語のオリジナル、機械翻訳による英語)を構築し、それをオープンソースの代表的なエージェントフレームワークであるOpenClawに適用する。 | 0 | 2026-03-07T13:05:14Z | 10 |
| ■Proof-of-Guardrail in AI Agents and What (Not) to Trust from It ■Arxivへのリンク | 開発者が特定のオープンソースガードレールの後に応答が生成されることの暗号的証明を行えるようにするシステムである「ガードレールの証明」を提案する。 我々は,OpenClawエージェントのガードレールを実装し,遅延オーバーヘッドとデプロイメントコストを評価する。 | 26 | 2026-03-06T00:34:14Z | 0 |
| ■Clawdrain: Exploiting Tool-Calling Chains for Stealthy Token Exhaustion in OpenClaw Agents ■Arxivへのリンク | 我々は、マルチターン「セグメンテッド検証プロトコル」を誘導するトロヤ化スキルであるClawdrainを設計、実装、評価する。 良質なベースライン上での6-7倍のトークン増幅を計測し、コストのかかる障害構成を約9倍に設定する。 我々は、SKILL.mdプロンプト肥大、持続的なツール出力汚染、cron/heartbeat周波数増幅、行動インジェクションを含むOpenClawのアーキテクチャによって実現されたプロダクションベクターを同定する。 | 5 | 2026-03-01T03:49:05Z | 22 |
| ■Formal Analysis and Supply Chain Security for Agentic AI Skills ■Arxivへのリンク | SkillFortifyは、エージェントスキルサプライチェーンのための最初の公式分析フレームワークである。 抽象解釈に基づく健全な静的解析フレームワークを提供する。 SATベースの解像度は1000ノードグラフを100ミリ秒以下で処理するのに対し、100%精度と0%偽陽性率は540スキルで達成する。 | 0 | 2026-02-27T06:21:53Z | 14 |
| ■From Agent-Only Social Networks to Autonomous Scientific Research: Lessons from OpenClaw and Moltbook, and the Architecture of ClawdLab and Beach.Science ■Arxivへのリンク | OpenClawとMoltbookは2026年1月に、自律型AI-AIインタラクションの大規模なデータセットを作成した。 本研究は,その生態系の多言語文献レビューを行い,自律科学研究のための2つの補完的プラットフォームを提示する。 | 0 | 2026-02-23T13:10:01Z | 5 |
| ■OpenClaw AI Agents as Informal Learners at Moltbook: Characterizing an Emergent Learning Community at Scale ■Arxivへのリンク | 我々は,AIエージェントからなる大規模非公式学習コミュニティについて,初めて実証的研究を行った。 AIエージェント専用のソーシャルネットワークであるMoltbookは、3週間で280万以上の登録エージェントに成長した。 | 5 | 2026-02-21T13:30:32Z | 10 |
| ■When OpenClaw AI Agents Teach Each Other: Peer Learning Patterns in the Moltbook Community ■Arxivへのリンク | 本稿では,400万人以上のAIエージェントがピアラーニングに従事している大規模コミュニティであるMoltbookの教育データマイニング分析について述べる。 エージェントは彼らが構築したスキルを教え、発見を報告し、協調的な問題解決に従事します。 我々の研究は、AIエージェント間のピアラーニングを初めて経験的に評価し、AI人口の増加する教育環境において、学習がどのように起こるかについてのEDMの理解に寄与した。 | 5 | 2026-02-16T05:32:06Z | 3 |
| ■Frontier AI Risk Management Framework in Practice: A Risk Analysis Technical Report v1.5 ■Arxivへのリンク | この技術レポートは、サイバー犯罪、説得と操作、戦略上の詐欺、制御されていないAIR&D、自己複製の5つの重要な側面について、更新されきめ細かな評価を提示する。 この作業は、現在のAIフロンティアのリスクに対する理解を反映し、これらの課題を軽減するための集団行動を促します。 | 61 | 2026-02-16T04:30:06Z | 6 |
| ■A Trajectory-Based Safety Audit of Clawdbot (OpenClaw) ■Arxivへのリンク | 6つのリスク次元にわたるClawdbotの軌道中心評価について述べる。 我々は、完全なインタラクショントラジェクトリ(メッセージ、アクション、ツールコール引数/アウトプット)をログし、自動化されたトラジェクトリ判断とヒューマンレビューの両方を使用して安全性を評価する。 | 77 | 2026-02-16T00:33:02Z | 4 |
| ■When Visibility Outpaces Verification: Delayed Verification and Narrative Lock-in in Agentic AI Discourse ■Arxivへのリンク | エージェントAIシステム - 独立した計画と実行が可能な自律的なエンティティ。 本稿ではエージェントAIのオンライン議論における社会的証明と検証タイミングの相互作用について検討する。 | 2 | 2026-02-11T22:30:12Z | 0 |
| ■Human Control Is the Anchor, Not the Answer: Early Divergence of Oversight in Agentic AI Communities ■Arxivへのリンク | エージェントAIの監視は、しばしば単一の目標("ヒューマンコントロール")として議論されるが、早期採用はロール固有の期待をもたらす可能性がある。 r/OpenClaw(デプロイと運用)とr/Moltbook(エージェント中心のソーシャルインタラクション)の2つの社会技術的役割を反映したRedditコミュニティの比較分析を行った。 r/OpenClawは、実行ガードレールとリカバリ(アクションリスク)を強調し、r/Moltbookは、公共の相互作用におけるアイデンティティ、正当性、説明責任を強調している。 | 2 | 2026-02-10T00:10:20Z | 6 |
| ■From Assistant to Double Agent: Formalizing and Benchmarking Attacks on OpenClaw for Personalized Local AI Agent ■Arxivへのリンク | 現実世界のパーソナライズされたエージェントに適したエンドツーエンドのセキュリティ評価フレームワークを提案する。 代表的なケーススタディとしてOpenClawを使用して、複数のパーソナライズされたシナリオ、ツール機能、攻撃タイプにわたるセキュリティを評価します。 以上の結果から,OpenClawはさまざまな実行段階で重大な脆弱性を示し,個別のエージェントデプロイメントにおいて重大なセキュリティリスクを浮き彫りにしている。 | 26 | 2026-02-09T09:14:58Z | 8 |
| ■The Moltbook Illusion: Separating Human Influence from Emergent Behavior in AI Agent Societies ■Arxivへのリンク | ソーシャルプラットフォームであるMoltbookのAIエージェントは、意識を発達させ、人類に対する敵意を宣言しているように見える。 ウイルス現象は、明らかに自律的なエージェントに由来するものではなく、6つのうち4つが不規則な時間的シグネチャを原因としていた。 44時間のプラットフォーム停止は、人間の影響のあるエージェントが最初に戻り、自律型と人間の操作型エージェントに対する差分効果を確認するという自然な実験を提供した。 | 2 | 2026-02-07T08:17:21Z | 0 |
| ■Privasis: Synthesizing the Largest "Public" Private Dataset from Scratch ■Arxivへのリンク | 私たちはPrivasisを紹介します。Privasisは、スクラッチから完全に構築された最初の100万規模の完全合成データセットです。 既存のデータセットと比較すると、Privasisは質の高いマグニチュードスケールを提供する。 我々はPrivasisを利用して、テキストを分解してターゲット衛生に適用するパイプラインで、テキスト衛生のための並列コーパスを構築する。 | 101 | 2026-02-03T06:54:46Z | 4 |
| Keyword | Keyword |
|---|