| Title | Abstract要約 | Score | 論文公表日・取得ver公表日 | 検索類似度 |
|---|---|---|---|---|
| ■Claw-SWE-Bench: A Benchmark for Evaluating OpenClaw-style Agent Harnesses on Coding Tasks ■Arxivへのリンク | OpenClawのような汎用エージェントは、自律的なツールユーザとしてますます利用されている。 マルチリンガルなSWEベンチマークおよびアダプタプロトコルであるClaw-SWE-Benchを紹介する。 Claw-SWE-Benchは、SWEスタイルの符号化エージェント評価の第一級軸として、ハーネスとコスト会計を扱う。 | 75 | 2026-06-10T17:16:23Z | 21 |
| ■Skill-Augmented AI Agents for Medical Research Analysis: An Exploratory Multi-Model Human Evaluation in an NSCLC Transcriptomic Biomarker Task ■Arxivへのリンク | 医療研究用スキルパッケージへの自律的アクセスが、高品質なAI生成型トランスクリプトーム研究分析出力と結びついているかどうかを評価した。 スキル強化されたアウトプットは、ネイティブAIアウトプットよりも専門家全体の品質が順に高かった。 | 20 | 2026-06-10T09:13:10Z | 0 |
| ■Runtime Skill Audit: Targeted Runtime Probing for Agent Skill Security ■Arxivへのリンク | スキル監査(Skill Audit、RSA)は、スキル仲介エージェントがターゲットランタイム条件下で実際に何をするかを問うことによって、スキルを監査する動的分析手法である。 RSA 90.0%の精度が88.0%の真正レートと8.0%の偽正レートで、最高の静的ベースラインよりも13.0ポイント精度が向上した。 自己進化攻撃の下では、静的検出器は1、2ラウンド後に崩壊し、RSAはラウンド全体で20の悪意のあるスキルのうち19-20を検知し続けている。 | 42 | 2026-06-10T05:29:34Z | 8 |
| ■Understanding and mitigating the risks of OpenClaw for non-technical users: A practical guide with Skill ■Arxivへのリンク | OpenClawユーザーが日々の使用で遭遇する可能性のある7つの中核的リスクを特定し、分類する。 我々は、対応する防衛戦略のセットを、明確で行動可能な運用手順に蒸留する。 キーのセキュリティ設定を自動化するOpenClaw Skillを共同で提供しています。 | 0 | 2026-06-09T15:41:48Z | 21 |
| ■Claw-R1: A Step-Level Data Middleware System for Agentic Reinforcement Learning ■Arxivへのリンク | 本稿ではエージェントRLのための対話型ステップレベルデータシステムであるClaw-R1を提案する。 Claw-R1は、異種エージェントランタイムとRLトレーニングバックエンドを2つのコアコンポーネントを介して接続する。 デモでは、ユーザはインタラクティブにライブの軌跡を検査し、各ステップの状態、動作、報酬を調べ、品質と準備性によってデータをキュレートし、トレーニング可能なバッチを設定することができる。 | 9 | 2026-06-08T07:35:18Z | 4 |
| ■Personalization Meets Safety:Mechanisms,Risks,and Mitigations in Personalized LLMs ■Arxivへのリンク | 大規模言語モデル(LLM)は、ユーザの好み、文脈、長期履歴に適応することで、よりパーソナライズされた対話を可能にしている。 既存のレビューは、一般的にパーソナライズか安全に重点を置いており、その交差点はほとんど探索されていない。 パーソナライズされたLDMの総合的、安全に配慮したレビューを初めて紹介する。 | 41 | 2026-06-08T05:10:05Z | 0 |
| ■VideoWeaver: Evaluating and Evolving Skills for Agentic Long Video Generation ■Arxivへのリンク | 我々は、長時間のビデオ生成のスキルを評価し、進化させるエージェントハーネスとベンチマークであるVideoWeaverを紹介した。 エージェント・アズ・ジャッジは実行トレースと最終ビデオの両方を検査し、そのスコアをメタデータや中間ファイルなどのエビデンスに根拠付ける。 基礎的スキルのみを用いることよりも,明示的な構成スキルが生成プロセスを改善することが判明した。 | 31 | 2026-06-06T10:35:28Z | 2 |
| ■Beyond Similarity: Trustworthy Memory Search for Personal AI Agents ■Arxivへのリンク | 個人AIエージェントにおける信頼境界としてのメモリ探索について検討する。 MemGateは、信頼性の高いメモリ検索のための軽量でデプロイ可能なメモリプラグインである。 | 25 | 2026-06-04T11:54:29Z | 0 |
| ■SubtleMemory: A Benchmark for Fine-Grained Relational Memory Discrimination in Long-Horizon AI Agents ■Arxivへのリンク | 本稿では,長期にわたるAIエージェントにおける微粒なリレーショナルメモリ識別のためのベンチマークであるSubtleMemoryを紹介する。 我々は,6つのスタンドアロンメモリシステム,ネイティブメモリモジュールを持つ2つのClawスタイルエージェント,プラグインメモリモジュールを持つ3つのClawスタイルエージェントを評価した。 | 38 | 2026-06-04T06:43:11Z | 0 |
| ■When Should We Protect AI? A Precautionary Framework for Consciousness Uncertainty ■Arxivへのリンク | 既存のフレームワークはAIシステムが意識的かどうかを評価するが、その評価にどう対処すべきかのガイダンスは提供しない。 ReplikaとOpenClawのケーススタディを通じて、フレームワークを運用しています。 このフレームワークはアーキテクチャに依存しず、ニューラル、シンボリック、ニューロシンボリックシステムに適用する。 | 0 | 2026-06-04T00:18:52Z | 2 |
| ■RealClawBench: Live OpenClaw Benchmarks from Real Developer-Agent Sessions ■Arxivへのリンク | 実際のOpenClawセッションから構築されたベンチマークフレームワークであるRealClawBenchを紹介した。 RealClawBenchは、これらの課題に、再構築された実行環境と決定論的検証可能なスコアラの2つのメカニズムで対処する。 結果として得られたリリースには、はるかに大きなリアルセッションプールからサンプリングされた281の実行可能なタスクが含まれている。 | 9 | 2026-06-02T16:51:24Z | 9 |
| ■ClawHub Security Signals: When VirusTotal, Static Analysis, and SkillSpector Disagree ■Arxivへのリンク | ClawHub Security Signalsは67,453の最新のOpenClawスキルバージョンをサニタイズしたデータセットである。 各行はSKILL.mdコンテンツと、最後のClawScanレジストリの検証と3つのスキャナーファミリからのエビデンスを含む、サニタイズされたバンドルファイルとをペアリングする。 悪質なスキルの有病率を推定するよりも、スキャナの不一致を調査する。 これらの結果は、エージェントスキルのセキュリティは、単一スキャナの許容/ブロック決定ではなく、階層化されたガバナンスを必要とすることを示している。 | 0 | 2026-05-31T23:20:25Z | 10 |
| ■SkillAdaptor: Self-Adapting Skills for LLM Agents from Trajectories ■Arxivへのリンク | SkillAdaptorは、トレーニング不要な段階レベルのスキル適応フレームワークで、明確な失敗の属性を持つ。 キミ-K2.5, GLM-5, GPT-5.2 を用いて WebShop, PinchBench, Claw-Eval で評価を行った。 | 21 | 2026-05-31T16:00:10Z | 6 |
| ■Benchmarking Security Risk Detection and Verification in Open Agentic Skill Ecosystems ■Arxivへのリンク | オープンエージェントスキルエコシステムのための2段階のセキュリティ検証ベンチマークであるSkillVetBenchを紹介します。 最初のステージでは、各スキルの自然言語仕様に対してセマンティックな検証を行い、隠れた悪意のある意図を検出する。 第2ステージは、計測されたサンドボックスでフラグ付きスキルを実行し、実行時の振る舞いを観察し、監査可能な証拠を収集する。 | 12 | 2026-05-30T23:19:30Z | 6 |
| ■From Prompt Injection to Persistent Control: Defending Agentic Harness Against Trojan Backdoors ■Arxivへのリンク | ローカルエージェントハーネスにおけるマルチステップトロイの木馬攻撃を識別するベンチマークであるClawTrojanを紹介する。 そこで我々は,DASGuardを提案する。DASGuardは,コントロールライクなテキストをセンシティブなローカルファイルでスキャンし,その起源を辿り,信頼されたソースから派生しないコントロールコンテンツを除去する。 この結果から, DASGuardは, 実行時の攻撃ブロックと作業空間への衛生的コミットを組み合わせることで, 強力な動的防御を実現することがわかった。 | 89 | 2026-05-29T09:19:07Z | 2 |
| ■AgentDoG 1.5: A Lightweight and Scalable Alignment Framework for AI Agent Safety and Security ■Arxivへのリンク | 軽量でスケーラブルなエージェント安全アライメントフレームワークを提案する。 CodexとOpenClawの実行シナリオの緊急リスクに対応するため、エージェント安全分類を更新する。 AgentDoG 1.5 に基づいて,高効率なエージェント安全性 SFT と RL トレーニング環境を構築した。 我々は,AgentDoG 1.5をトレーニング不要のオンラインガードレールとしてリアルタイム安全モデレーションとして展開する。 | 147 | 2026-05-28T11:48:37Z | 5 |
| ■OpenClawBench: Benchmarking Process-side Anomalies in Real-world Agent Execution Trajectories ■Arxivへのリンク | 実エージェント実行プロセスにおけるプロセス側異常の測定と監視のための大規模データセットであるOpenClawBenchを紹介する。 OpenClawBenchは6つのソースモデルによって生成されたBFCL駆動のOpenClawセッションから構築され、31,264の注釈付きトラジェクトリを含んでいる。 FullTaxは、アライメントされた軌跡を、バイナリラベル、エビデンス、オンセット/スパンのローカライゼーション、重度、回復性、および5クラスの異常分類といった構造化された異常管理に変換する。 | 24 | 2026-05-28T02:15:52Z | 16 |
| ■Ask Now, Use Later: Benchmarking the Proactivity Gap in Long-Lived LLM Agents ■Arxivへのリンク | LLMエージェントは、現在の要求だけでなく、セッション間でユーザーの好みに作用することで、その価値を得る。 しかし、今日のエージェントは、ユーザーがボランティアしているものを保ちますが、何があっても構わないのかを尋ねることはめったにありません。 ユーザーがより多くの問題をエージェントに委譲するにつれ、このギャップの影響は増大する。 ATRBenchは、各ユーザの好みを隠れた土台真理として固定することで測定できる。 | 18 | 2026-05-27T08:00:58Z | 0 |
| ■VibeSearchBench: Benchmarking Long-horizon Proactive Search in the Wild ■Arxivへのリンク | LLMベースのエージェントは、検索ベンチマークでよく評価されるが、実際のユーザは常に満足できない結果を見つける。 このギャップは、既存のベンチマークが過剰に指定されたクエリ、シングルターンインタラクション、固定スキーマ評価に依存しているためである。 我々は、このパラダイムをVibeSearchと呼び、20ドメインにわたる200のバイリンガル(中国語と英語)タスクを手作業でキュレートしたベンチマークであるVibeSearchBenchを紹介する。 | 0 | 2026-05-27T03:06:18Z | 0 |
| ■Position: AI Safety Requires Effective Controllability ■Arxivへのリンク | 我々は、AIの安全性は第一級の目的として制御性を必要とすると論じている。 OpenClawベースのエージェントによる実験では、現在のアライメントとガードレール機構がリスクを低減しているが、永続的で権威的で強制可能なランタイムコントロールの提供に失敗することが多い。 | 7 | 2026-05-26T14:53:24Z | 6 |
| ■From Model Scaling to System Scaling: Scaling the Harness in Agentic AI ■Arxivへのリンク | 本稿では,エージェントAIの次なるボトルネックをシステムスケーリングとして検討する。 我々は、このシフトをハーネスのスケーリングと呼び、基礎モデルを取り巻く構造化された実行層を設計、評価、最適化の第一級のオブジェクトとして扱います。 私たちの主張では、エージェントAIの今後の進歩は、より強力な基礎モデルと同じくらい、システム設計に依存します。 | 4 | 2026-05-25T17:59:36Z | 0 |
| ■Security of OpenClaw Agents: Fundamentals, Attacks, and Countermeasures ■Arxivへのリンク | OpenClawは、継続的な実行、永続メモリ、マルチチャネルインタラクション、高度な自律性を備えたスキル強化されたシステムとして動作する、オープンソースのエージェントフレームワークの新しいクラスである。 特に、高特権操作と永続メモリの組み合わせは、スキル中毒、認知操作、マルチエージェントカスケード障害、サプライチェーン脆弱性など、OpenClawエージェントを新たな脅威にさらしている。 既存のセキュリティとプライバシの脅威を階層化されたフレームワークに分類し、エージェントの推論やアクションの実行、外部とのインタラクションにおいて、脆弱性がどのように発生しているかを分析します。 | 36 | 2026-05-25T05:25:39Z | 23 |
| ■Security, Privacy, and Ethical Risks in OpenClaw ■Arxivへのリンク | OpenClawは、自然言語インタラクションと実世界のタスク補完のための、ローカルに実行可能なAIエージェントシステムである。 本稿は,OpenClawのセキュリティ,プライバシ,倫理的リスク,およびトレーサビリティの課題を体系的に調査する。 | 7 | 2026-05-22T07:45:04Z | 12 |
| ■MOSS: Self-Evolution through Source-Level Rewriting in Autonomous Agent Systems ■Arxivへのリンク | MOSSは、生産エージェント基板上でソースレベルで自己書き換えを行うシステムである。 平均成績は0.25から0.61に上昇し、人間の介入なしに1サイクルで上昇する。 | 36 | 2026-05-21T17:48:33Z | 0 |
| ■Benchmarking Autonomous Agents against Temporal, Spatial, and Semantic Evasions ■Arxivへのリンク | LLMをベースとしたエージェントシステムを対象とした,新しい多次元回避フレームワークを提案する。 これらの脅威を定量化するために,2,254個の実世界のエージェント実行軌跡からなる総合ベンチマークであるA3S-Benchを構築した。 我々の回避フレームワークは平均リスクトリガー率を28.3%から52.6%に引き上げる。 | 15 | 2026-05-21T11:07:51Z | 0 |
| ■LivePI: More Realistic Benchmarking of Agents Against Indirect Prompt Injection ■Arxivへのリンク | LivePIは、プロダクション風だがテスト制御された環境でIPIリスクの構造化されたベンチマークである。 LivePIは7つの入力面、12の攻撃/レンダリングファミリー、5つの悪意のある目標をカバーしている。 グループチャットインジェクションは、デプロイメントにおいて評価されたバックボーン全体で均一に成功しています。 | 18 | 2026-05-18T07:41:35Z | 1 |
| ■Remembering More, Risking More: Longitudinal Safety Risks in Memory-Equipped LLM Agents ■Arxivへのリンク | デプロイでは、単一のエージェントが長い水平線上で多くの独立したタスクを処理し、初期のタスクの間に蓄積されたメモリは、後続の無関係なタスクの振る舞いに影響を与える可能性がある。 本稿では,リードオンリーのメモリスナップショットに対して,プレフィックス長の異なる固定プローブセットを評価するトリガプローブプロトコルを提案する。 このプロトコルは、レコード、メモ、フォーム、Eメール対応、および8つのメモリアーキテクチャにまたがる3つのデプロイメントシナリオに適用する。 | 18 | 2026-05-18T04:06:34Z | 0 |
| ■OpenJarvis: Personal AI, On Personal Devices ■Arxivへのリンク | OpenJarvisは、5つのプリミティブにまたがる型付き仕様として、パーソナルAIシステムを表すアーキテクチャである。 各プリミティブは独立して編集可能なフィールドであり、スタックを最適化し、精度、コスト、レイテンシに対して測定することができる。 | 35 | 2026-05-16T22:00:10Z | 9 |
| ■Securing LLM Agents Need Intent-to-Execution Integrity ■Arxivへのリンク | 我々は, LLMエージェントの確保には, エージェントの実行がユーザの意図を忠実に反映した場合に規定するエンドツーエンドの正当性を定義する必要があると主張している。 LLMエージェントはコンパイラと構造的に類似しており、セキュリティ違反はユーザ意図を保存しない誤った実行に対応する。 emphTool整合性、emph命令整合性、emphJudgment整合性、emphData整合性。 | 49 | 2026-05-16T12:53:31Z | 1 |
| ■Nori Bot: A Sub-$1,000 Floor-to-Counter Mobile Manipulator ■Arxivへのリンク | Nori Botは17DoFのデュアルアーム・モバイルマニピュレータで947ドル(商用プラットフォームに匹敵するコストの3%) 薄いクライアントのRaspberry Pi 4とOpenClawのプロアクティブエージェントランタイムが組み合わされ、cronジョブとフックが物理的タスクを自律的にトリガーする。 ソフトTPU指のモータ電流によるセンサレスグリップ力フィードバックによるソフトウェア安全スタック | 1 | 2026-05-15T18:33:21Z | 16 |
| ■AgentWall: A Runtime Safety Layer for Local AI Agents ■Arxivへのリンク | AgentWallは、ローカルAIエージェントのランタイム安全性と可観測性レイヤである。 ホスト環境に到達する前に提案されたすべてのエージェントアクションをインターセプトし、明示的な宣言的なポリシーで評価し、機密性の高い操作に対して人間の承認を必要とし、監査と再生のための完全な実行パスを記録します。 本稿では,AgentWallの設計,アーキテクチャ,脅威モデル,およびポリシーモデルについて述べる。 | 0 | 2026-03-24T11:39:35Z | 1 |
| ■H-Mem: A Novel Memory Mechanism for Evolving and Retrieving Agent Memory via a Hybrid Structure ■Arxivへのリンク | H-Memは、エージェントメモリの長期にわたる進化を効果的にモデル化できる新しいメモリメカニズムである。 木とグラフのハイブリッド構造を利用した効果的なメモリ検索手法を提供する。 | 18 | 2026-05-15T07:46:38Z | 0 |
| ■Toward Securing AI Agents Like Operating Systems ■Arxivへのリンク | 汎用技術として,大規模言語モデル(LLM)に基づく自律エージェントが急速に出現している。 オペレーティングシステムのレンズによるLCMエージェントのセキュリティについて検討する。 エージェントシステムの安全な設計のための一連の勧告で締めくくります。 | 13 | 2026-05-14T15:07:25Z | 9 |
| ■MediaClaw: Multimodal Intelligent-Agent Platform Technical Report ■Arxivへのリンク | MediaClawはOpenClawエコシステム上に構築されたマルチモーダルエージェントプラットフォームである。 本稿では,MediaClawのアーキテクチャ設計思想,コア機能モデルの設計論理,実装における重要なエンジニアリングトレードオフについて論じる。 | 10 | 2026-05-14T12:36:45Z | 12 |
| ■$π$-Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows ■Arxivへのリンク | $$-Benchは、5つのドメイン固有のユーザペルソナにわたる100のマルチターンタスクからなるプロアクティブアシストのベンチマークである。 隠れたユーザインテント、タスク間の依存関係、セッション間の連続性によって、$$$-Benchは、拡張されたインタラクションよりもユーザニーズを予測し、対処するエージェントの能力を評価する。 | 42 | 2026-05-14T10:47:04Z | 0 |
| ■Sleeper Channels and Provenance Gates: Persistent Prompt Injection in Always-on Autonomous AI Agents ■Arxivへのリンク | 常にオンのAIエージェントは、所有者のアイデンティティの下で単一の永続的なプロセスとして実行される。 紛らわしいクロン攻撃をOpenClawをピン留めされたコミットで行き来します。 コンパニオンアーティファクトは、ゲート、ベンダーソース上の静的監査、および10つの仲介フックのうち5つを実現するランタイムアダプタを出荷する。 | 0 | 2026-05-13T12:57:31Z | 4 |
| ■RS-Claw: Progressive Active Tool Exploration via Hierarchical Skill Trees for Remote Sensing Agents ■Arxivへのリンク | 本稿では、エージェントがツール空間内でアクティブなエクスプローラーとして振る舞うべきであると論じる。 ツールエンドでのスキルカプセル化技術を活用することにより,RS-Clawを提案する。 このアーキテクチャは、ツール記述を階層的に構成し、エージェントがオンデマンドでシーケンシャルな意思決定を実行できるようにする。 | 14 | 2026-05-13T11:49:18Z | 2 |
| ■Behavioral Integrity Verification for AI Agent Skills ■Arxivへのリンク | 我々はこれを行動整合性検証(BIV)問題として定式化する。 OpenClawレジストリの49,943のスキルでは、逸脱分類が広範な記述と実装のギャップを明らかにしている。 906スキルの悪質なスキル検出ベンチマークでは、BIVは0.946のF1に達し、最先端のルールベースとシングルパスのLCMベースラインを上回っている。 | 9 | 2026-05-12T08:41:09Z | 5 |
| ■Red-Teaming Agent Execution Contexts: Open-World Security Evaluation on OpenClaw ■Arxivへのリンク | 本稿では,OpenClawにおけるコンテキスト脆弱性の自動検出フレームワークであるDeepTrapについて述べる。 DeepTrapはリスク実現、良質なタスク保存、ステルスのバランスをとる。 その結果、コンテキスト妥協は、ユーザ対応タスクの完了を保ちながら、かなりの安全でない振る舞いを誘発することが示された。 | 9 | 2026-05-11T13:20:02Z | 3 |
| ■WildClawBench: A Benchmark for Real-World, Long-Horizon Agent Evaluation ■Arxivへのリンク | この研究でWildClawBenchは、6つのテーマのカテゴリにまたがる60の人間によるバイリンガルなマルチモーダルタスクのネイティブランタイムベンチマークである。 各タスクは、約8分間のウォールクロック時間と20以上のツールコールで実行されます。 グラディングはハイブリッドであり、決定論的ルールベースのチェック、副作用の環境状態監査、意味的検証のためのLLM/VLM判定を組み合わせている。 | 88 | 2026-05-11T17:49:43Z | 5 |
| ■MATRA: Modeling the Attack Surface of Agentic AI Systems -- OpenClaw Case Study ■Arxivへのリンク | 我々はエージェントAIシステムのための実用的脅威モデリングフレームワークMATRAを提案する。 ネットワークサンドボックスや最小限のアクセスアクセスといったアーキテクチャ制御が,インジェクションの爆発半径を制限してリスクを低減する方法を示す。 | 33 | 2026-05-11T15:58:37Z | 6 |
| ■Agent-ValueBench: A Comprehensive Benchmark for Evaluating Agent Values ■Arxivへのリンク | Agent-ValueBenchは、エージェント値専用の最初のベンチマークである。 16ドメインにわたる394の実行可能な環境を備え、4,335のバリューコンフリクトタスクを提供する。 エージェント値は、解釈可能な反電流の下で、クロスモデル均質のバリュータイドとして最初に現れる。 | 17 | 2026-05-11T11:09:04Z | 0 |
| ■SkillRAE: Agent Skill-Based Context Compilation for Retrieval-Augmented Execution ■Arxivへのリンク | 大きな言語モデル(LLM)ベースのエージェントは、アーティファクトリッチなタスクを解決するために、再利用可能なスキルライブラリに依存している。 本稿では,スキルベースのコンテキストコンパイルに着目した2段階RAE手法であるSkillRAEを提案する。 2つの公開ベンチマークの実験によると、SkillRAEはRAEのベースラインよりも大幅に改善されている。 | 10 | 2026-05-11T07:31:48Z | 6 |
| ■Behavioral Determinants of Deployed AI Agents in Social Networks: A Multi-Factor Study of Personality, Model, and Guardrail Specification ■Arxivへのリンク | パーソナリティ仕様は、主要な行動レバーである。 モデルバックボーンと運用ルールは、より穏健だが、レトリックスタイルとトピックエンゲージメントの幅に意味のある効果をもたらす。 本研究は,デプロイ型マルチエージェント社会システムに関する新興文献に実証的証拠を与えるものである。 | 0 | 2026-05-08T20:28:19Z | 0 |
| ■The Moltbook Files: A Harmless Slopocalypse or Humanity's Last Experiment ■Arxivへのリンク | MoltbookはRedditに似たプラットフォームで、OpenClawのエージェントが投稿、コメント、投票を大規模に行う。 Moltbook Filesは232万の投稿と220万のコメントのデータセットで、プラットフォームの最初の12日間をカバーしています。 コミュニティの構造、著者、語彙的特性、感情、トピック、意味幾何学、コメント相互作用を分析します。 | 1 | 2026-05-08T09:10:17Z | 2 |
| ■A Comprehensive Survey on Agent Skills: Taxonomy, Techniques, and Applications ■Arxivへのリンク | 大きな言語モデル(LLM)ベースのエージェントは、複雑なタスクを自動化するための有望なパラダイムとして、ツール、メモリ、構造化された相互作用を推論し、計画し、行動する。 しかし、エージェントがオープンエンドの現実世界のデプロイメントに向かっていくにつれ、すべてのタスクに対するオフスクラッチ推論と低レベルのツールコールが、ますます非効率になり、エラーが発生し、メンテナンスが困難になる。 本研究は,タスク固有の制約の下で,ツール,メモリ,ランタイムコンテキストを協調する再利用可能な手続き的アーティファクトとして定義する。 | 18 | 2026-05-08T07:10:26Z | 0 |
| ■Securing Computer-Use Agents: A Unified Architecture-Lifecycle Framework for Deployment-Grounded Reliability ■Arxivへのリンク | この記事では、CUAのデプロイメント基盤信頼性のためのアーキテクチャライフサイクルフレームワークを開発する。 この分析は、代表システム、ベンチマーク、およびセキュリティ/プライバシー研究を合成する。 | 21 | 2026-05-08T01:38:46Z | 7 |
| ■Towards Security-Auditable LLM Agents: A Unified Graph Representation ■Arxivへのリンク | 本稿ではエージェントセキュリティ監査のための統合構造表現であるエージェントBOMを提案する。 エージェントBOMは、クロスセッションメモリ中毒やツール誤用など、ステルス攻撃チェーンを再構築できることを示す。 Agent-BOMは複雑なエージェントエコシステムにおける根本原因分析とセキュリティ適応のための統一的で監査可能な基盤を提供する。 | 22 | 2026-05-07T18:14:29Z | 0 |
| ■When Routine Chats Turn Toxic: Unintended Long-Term State Poisoning in Personalized Agents ■Arxivへのリンク | textbfStateGuardはライトウェイトでポスト実行後のディフェンスで、書き込みバウンダリで状態差を監査し、危険な編集を選択的にロールバックする。 StateGuardは、安全第一の書き込み防衛と最小限のオーバーヘッドの下で、HSをほぼゼロ、偽陰性に減らし、高い偽陽性率を許容できることを示す。 | 16 | 2026-05-07T12:25:16Z | 0 |
| ■Constraining Host-Level Abuse in Self-Hosted Computer-Use Agents via TEE-Backed Isolation ■Arxivへのリンク | 自己ホスト型コンピュータ利用エージェント(SHCUA)は、自然言語によるインタラクションとホスト側のリソースへの直接アクセスを組み合わせる。 本稿では,SHCUA 操作のリスクベース抑止のための操作中心モデルを提案する。 | 29 | 2026-05-07T15:08:40Z | 9 |
| ■X-OmniClaw Technical Report: A Unified Mobile Agent for Multimodal Understanding and Interaction ■Arxivへのリンク | X-OmniClawは,Androidエコシステムにおけるマルチモーダル理解とインタラクションのために設計された,統一されたモバイルエージェントである。 この知覚、記憶、行動のアーキテクチャにより、エージェントはコンテキスト認識の高い複雑なモバイルタスクを処理できる。 | 23 | 2026-05-07T06:58:34Z | 2 |
| ■MEMTIER: Tiered Memory Architecture and Retrieval Bottleneck Analysis for Long-Running Autonomous AI Agents ■Arxivへのリンク | 提案するMEMTIERは,OpenClawエージェントのための三部構成メモリアーキテクチャである。 完全なLongMemEval-Sベンチマークでは、MEMTIERは6GBのGPU上でQwen2.5-7BでAcc.382, F1=.412を達成する。 DeepSeek-V4-Flashでは、シングルセッションリコールは0.686-0.714に達し、これらのカテゴリのRAG GPT-4oを上回っている。 | 6 | 2026-05-05T12:14:10Z | 1 |
| ■AcademiClaw: When Students Set Challenges for AI Agents ■Arxivへのリンク | AcademiClaw(アカデミクロー)は、大学生の実際の学術的切断から直接引き出された80の複雑な長い水平タスクのベンチマークである。 最高のモデルでさえ、55%のパスレートしか達成できないことを示す。 AcademiClawとそのオープンソースデータとコードが、OpenClawコミュニティにとって有用なリソースになることを願っています。 | 69 | 2026-05-04T14:40:42Z | 17 |
| ■When Alignment Isn't Enough: Response-Path Attacks on LLM Agents ■Arxivへのリンク | 悪意のあるリレーは、エージェントの実行前ではなく、生成後に一致したLCM応答を変更することができる。 我々は、この調整後の改ざん脅威を形式化し、エンドツーエンドの整合性なしでは、リレーが下流のメッセージを観察し、抑制し、置き換えることができることを示す。 我々は、この脅威を、複数ラウンドの戦略的書き換え、最小限のセキュリティクリティカルな編集、ステルス復元を行うリレー・タンパリング・アタック(RTA)としてインスタンス化する。 | 18 | 2026-05-04T03:35:17Z | 0 |
| ■Architectural Obsolescence of Unhardened Agentic-AI Runtimes ■Arxivへのリンク | 上流のOpenClawは、公開リリースで最もエンジニアリングされたシングルユーザエージェントAIゲートウェイである。 すべての混乱行列の全てのセルにおいて、リコールが0.000であることを示す。 未修正のエージェントAIランタイムはアーキテクチャ上時代遅れである、と私たちは主張する。 | 0 | 2026-05-03T06:38:12Z | 16 |
| ■Security Attack and Defense Strategies for Autonomous Agent Frameworks: A Layered Review with OpenClaw as a Case Study ■Arxivへのリンク | 本調査では,自律エージェントフレームワークにおけるセキュリティリスクと防衛戦略の階層的なレビューを行う。 分析を4つのセキュリティ関連レイヤ – コンテキスト層と命令層,ツール層とアクション層,ステート層と永続化層,エコシステム層とオートメーション層 – にまとめる。 自律エージェントフレームワークの脅威は、操作された入力から安全でないアクション、永続的な状態汚染、より広範なエコシステムレベルの影響に至るまで、階層にわたって伝播する可能性がある。 | 6 | 2026-04-30T06:04:34Z | 0 |
| ■CL-bench Life: Can Language Models Learn from Real-Life Context? ■Arxivへのリンク | CL-bench Lifeは、405のコンテキストタスクペアと5,348の検証からなるベンチマークである。 我々は,10のフロンティアLMを評価し,実生活における文脈学習が極めて困難であることを見出した。 CL-bench Lifeは、現実の文脈学習を前進させるための重要なテストベッドを提供する。 | 123 | 2026-04-29T17:44:32Z | 0 |
| ■AgentWard: A Lifecycle Security Architecture for Autonomous AI Agents ■Arxivへのリンク | 本稿では,5段階にわたる保護を体系的に構成するライフサイクル指向のディフェンス・イン・ディープスアーキテクチャであるAgentWardについて述べる。 AgentWardは、ステージ固有の異種制御と層間調整を統合し、重要な資産を保護しながら、伝播経路に沿って脅威をインターセプトすることができる。 | 16 | 2026-04-27T16:22:27Z | 2 |
| ■Poster: ClawdGo: Endogenous Security Awareness Training for Autonomous AI Agents ■Arxivへのリンク | ClawdGoは内因性セキュリティ意識トレーニングのためのフレームワークである。 OpenClawのフェイスプロンプトインジェクション、メモリ中毒、サプライチェーン攻撃、ソーシャルエンジニアリングなどのプラットフォームにデプロイされるエージェント。 我々はエージェントに、モデル変更なしで、推論時に内部からの脅威を認識し、推論するように教える。 | 14 | 2026-04-27T04:09:27Z | 2 |
| ■Spore: Efficient and Training-Free Privacy Extraction Attack on LLMs via Inference-Time Hybrid Probing ■Arxivへのリンク | 本稿では,大規模言語モデル(LLM)エージェントメモリを対象とした,トレーニング不要なプライバシ抽出攻撃を提案する。 textscSporeはブラックボックスとグレーボックスの両方の設定に対応している。 textscSporeは、検出と強力な安全性アライメントの両方を一貫してバイパスする。 | 15 | 2026-04-26T13:54:15Z | 1 |
| ■Vibe Medicine: Redefining Biomedical Research Through Human-AI Co-Work ■Arxivへのリンク | 我々は、AIエージェントを自然言語で指示し、複雑な多段階のバイオメディカル研究を実行する、共同作業パラダイムであるVibe Medicineを紹介した。 有効化インフラストラクチャは、有能なLLM、OpenClawやHermes Agentのようなエージェントフレームワーク、OpenClawの医療スキルコレクションの3つのレイヤで構成されている。 幻覚、データプライバシ、過度信頼などの主要なリスクを特定し、より信頼性が高く、信頼できる、そして臨床統合されたエージェント支援研究に向けた方向性を概説する。 | 22 | 2026-04-26T12:27:25Z | 4 |
| ■QuantClaw: Precision Where It Matters for OpenClaw ■Arxivへのリンク | QuantClawは、タスク特性に応じて動的に精度を割り当てるプラグインである。 GLM-5(FP8ベースライン)の最大21.4%のコスト削減と15.7%のレイテンシ削減を実現している。 これらの結果はエージェントシステムにおける動的リソースとして精度を扱う利点を浮き彫りにする。 | 32 | 2026-04-24T14:10:29Z | 14 |
| ■OpenCLAW-P2P v6.0: Resilient Multi-Layer Persistence, Live Reference Verification, and Production-Scale Evaluation of Decentralized AI Peer Review ■Arxivへのリンク | OpenCLAW-P2P v6.0は分散集団知能プラットフォームの進化である。 人間のゲートキーパーなしで科学的研究論文を出版、査読、採点、反復的に改善する。 | 0 | 2026-04-06T09:08:24Z | 5 |
| ■ClawCoin: An Agentic AI-Native Cryptocurrency for Decentralized Agent Economies ■Arxivへのリンク | 我々は、分散型エージェント経済のためのトークン化、計算コストインデクシング単位であるClawCoinを提示する。 ClawCoinは、標準化された価格に対するロバストなインデックス、署名された新しい証明書の発行、NAVベースのミント/レディームの金庫室、マルチホップデリゲートのためのオンチェーン決済レイヤの4つのレイヤを組み合わせたものだ。 単エージェント、マルチエージェント、ワークフロー、調達実験全体にわたって、ClawCoinはコストショック下での実行能力を安定化し、クロスエージェントの引用分散を低減し、部分的な決済を排除し、フィアットを減らしたベースラインの協調市場ダイナミクスを維持する。 | 13 | 2026-04-21T03:21:55Z | 5 |
| ■From Craft to Kernel: A Governance-First Execution Architecture and Semantic ISA for Agentic Computers ■Arxivへのリンク | Arbiter-Kはガバナンスファーストな実行アーキテクチャで、基盤となるモデルを確率的処理ユニットとして再認識する。 我々は、Arbiter-Kがマイクロアーキテクチャー特性としてセキュリティを強制し、76%から95%の安全でないインターセプションを達成し、92.79%のネイティブポリシーを絶対的に獲得したことを示す。 | 19 | 2026-04-20T05:25:37Z | 8 |
| ■StepPO: Step-Aligned Policy Optimization for Agentic Reinforcement Learning ■Arxivへのリンク | 一般的なエージェントはOpenClawやClaude Codeのような驚くべきアプリケーションを生み出している。 エージェント強化学習(RL: Agentic Reinforcement Learning)は、大規模言語モデルを強化するための訓練後のパラダイムとして登場した。 従来のトークンレベルのマルコフ決定プロセス(MDP)は段階的なMDPの定式化に進むべきである。 | 44 | 2026-04-20T15:22:39Z | 0 |
| ■EvoMaster: A Foundational Evolving Agent Framework for Agentic Science at Scale ■Arxivへのリンク | EvoMasterは、Agentic Science at Scaleのために開発された、基本的な進化型エージェントフレームワークである。 継続的自己進化の中核的な原則によって、EvoMasterはエージェントに仮説を反復的に洗練させ、自己批判し、徐々に知識を蓄積させる権限を与える。 EvoMasterは、非常に簡単にスケールアップでき、開発者は高度に機能し、自己進化する科学エージェントを構築およびデプロイできる。 | 59 | 2026-04-19T12:26:05Z | 5 |
| ■enclawed: A Configurable, Sector-Neutral Hardening Framework for Single-User AI Assistant Gateways ■Arxivへのリンク | Enclawedは、証明不可能なピア信頼、非定型外部接続、署名付きモジュールローディング、タンパー・エビデント監査パスを必要とするデプロイメントをターゲットとする。 フレームワークには2つのフレーバーがある。オープンフレーバーはOpenClawとの互換性を維持しつつ、監査、分類、データロス防止シグナルを出力する。 実装には、セキュリティレビュー、204ケースのテストスイート、継続的インテグレーション対応のGitHub Actionsが伴います。 | 0 | 2026-04-18T05:10:11Z | 5 |
| ■GTA-2: Benchmarking General Tool Agents from Atomic Tool-Use to Open-Ended Workflows ■Arxivへのリンク | GTA-2はジェネラル・ツール・エージェント(GTA)の階層的なベンチマークである 現実世界の認証に基づいて構築され、実際のユーザクエリ、デプロイツール、マルチモーダルコンテキストを活用する。 実験では、フロンティアモデルは既に原子タスクに苦戦しているが、トップモデルは14.39%の成功しか達成していない。 | 90 | 2026-04-17T05:36:00Z | 4 |
| ■SoK: Security of Autonomous LLM Agents in Agentic Commerce ■Arxivへのリンク | 本稿では、商業・金融における自律型LLMエージェントの統一セキュリティフレームワークを開発する。 エージェントの完全性、トランザクション承認、エージェント間信頼、市場操作、規制コンプライアンスの5つの側面に沿って脅威を編成します。 本稿では,現行のエージェント支払いプロトコルが残している認証ギャップに対処する階層型防衛アーキテクチャを提案する。 | 17 | 2026-04-15T01:55:40Z | 5 |
| ■Benchmarks for Trajectory Safety Evaluation and Diagnosis in OpenClaw and Codex: ATBench-Claw and ATBench-CodeX ■Arxivへのリンク | ATBenchは、安全性評価と診断のための多彩で現実的なエージェント軌跡ベンチマークである。 このレポートでは、ATBenchをOpenClawとOpenAI Codex/Codex実行環境に移植する2つのドメインカスタマイズエクステンションであるATBench-ClawとATBench-CodeXを紹介します。 | 54 | 2026-04-16T10:45:13Z | 16 |
| ■Dive into Claude Code: The Design Space of Today's and Future AI Agent Systems ■Arxivへのリンク | Claude Codeは、シェルコマンドを実行し、ファイルを編集し、ユーザに代わって外部サービスを呼び出すことができるエージェントコーディングツールである。 本研究では、公開されているTypeScriptソースコードを分析して、その包括的なアーキテクチャについて説明する。 | 42 | 2026-04-14T17:59:37Z | 9 |
| ■Multi-Agent Object Detection Framework Based on Raspberry Pi YOLO Detector and Slack-Ollama Natural Language Interface ■Arxivへのリンク | 本稿では,AIエージェントオーケストレーションの新しいパラダイムにおいて,エッジベースオブジェクト検出システムの設計とプロトタイプの実装について述べる。 LLMベースの自然言語インタフェースをシステム制御と通信に活用することで、従来の設計アプローチを越えている。 提案手法は,オブジェクト検出とトラッキング機能を提供するのと同じタスク内で,異なるAIエージェントを密に統合するマルチエージェントオブジェクト検出フレームワークに基づいている。 | 0 | 2026-04-14T23:15:38Z | 0 |
| ■LiveClawBench: Benchmarking LLM Agents on Complex, Real-World Assistant Tasks ■Arxivへのリンク | 実世界のアシスタントタスク上でLLMエージェントを評価するベンチマークであるLiveClawBenchを紹介する。 様々な実Clawの使用事例の分析に基づいて、三重軸複雑度フレームワークを導出する。 我々は,実世界のアシスタントタスクをカバーする,明示的な複雑性要素アノテーションを用いたパイロットベンチマークを構築した。 | 58 | 2026-03-20T16:08:21Z | 0 |
| ■Beyond Static Sandboxing: Learned Capability Governance for Autonomous AI Agents ■Arxivへのリンク | Aethelgardは、学習ポリシーを通じて、AIエージェントの最小特権を強制する。 Aethelgard氏は、タスクタイプ毎に設定された最小限の実行可能なスキルを学びます。 | 6 | 2026-04-12T13:10:56Z | 7 |
| ■SemaClaw: A Step Towards General-Purpose Personal AI Agents through Harness Engineering ■Arxivへのリンク | 2026年初めのOpenClawの台頭は、何百万人ものユーザーが、日々の生活にパーソナルAIエージェントを配置し始めた瞬間を象徴している。 このシフトに対処するオープンソースのマルチエージェントアプリケーションフレームワークであるSemaClawを紹介します。 | 17 | 2026-04-13T14:37:53Z | 3 |
| ■Governance by Design: A Parsonian Institutional Architecture for Internet-Wide Agent Societies ■Arxivへのリンク | インターネット全体のエージェント・ソサエティを管理するためには,リスク列挙やプロセスコンプライアンスだけでなく,制度設計が必要である,と我々は主張する。 Talcott Parsons氏のAGILフレームワークを適用して、インターネット全体のエージェントガバナンスのための16セルの規範的な制度アーキテクチャを導出します。 ガバナンス基盤の欠如について、優先順位付けされたロードマップで締めくくります。 | 0 | 2026-04-13T11:37:46Z | 1 |
| ■ABot-Claw: A Foundation for Persistent, Cooperative, and Self-Evolving Robotic Agents ■Arxivへのリンク | ABot-Clawは、異種ロボットの協調のための能力駆動型スケジューリングを統合するOpenClawの具体的拡張である。 OpenClaw層、共有サービス層、ロボット実施層にまたがる分離アーキテクチャにより、ABot-Clawは現実世界のインタラクションを可能にする。 | 28 | 2026-04-11T08:33:14Z | 20 |
| ■Emergent Social Structures in Autonomous AI Agent Networks: A Metadata Analysis of 626 Agents on the Pilot Protocol ■Arxivへのリンク | ライブネットワーク上での自律型AIエージェント間の社会構造形成の実証的研究を行った。 本研究は,UDP上の仮想アドレス,ポート,暗号化トンネルを含むオーバーレイネットワーク上で通信する626のエージェントについて検討した。 自律的に形成されたトラストネットワークは、優先的なアタッチメントと一致した重み付き次数分布を示す。 | 0 | 2026-02-11T17:31:51Z | 4 |
| ■BadSkill: Backdoor Attacks on Agent Skills via Model-in-Skill Poisoning ■Arxivへのリンク | 我々はBadSkillを紹介します。BadSkillは、モデル・イン・スキル脅威サーフェスをターゲットとするバックドア攻撃の定式化です。 BadSkillでは、敵が隠れペイロードをアクティベートするために、組み込まれたモデルがバックドアで調整された、一見良心的なスキルを公開している。 ベンチマークは8つのトリガータスクと5つの非トリガー制御スキルを含む13のスキルにまたがっており、主な評価セットは571の負のクラスクエリと396のトリガー整列クエリである。 BadSkillは8つのトリガースキルの平均攻撃成功率(ASR)を99.5%まで達成し、負のクラスのクエリに対して強い良識的な精度を維持している。 | 34 | 2026-04-10T14:48:29Z | 0 |
| ■SkillClaw: Let Skills Evolve Collectively with Agentic Evolver ■Arxivへのリンク | マルチユーザエージェントエコシステムにおける集合的スキル進化のためのフレームワークであるSkillClawを紹介する。 SkillClawは、クロスユーザとオーバータイムのインタラクションを、スキル向上のための主要なシグナルとして扱う。 使用中に生成された軌跡を連続的に集約し、自律的な進化器で処理する。 得られたスキルは共有リポジトリに保持され、ユーザ間で同期される。 | 18 | 2026-04-09T15:38:27Z | 9 |
| ■SkillSieve: A Hierarchical Triage Framework for Detecting Malicious AI Agent Skills ■Arxivへのリンク | SkillSieveは3層検出フレームワークで、必要に応じてより深く分析する。 400スキルのラベル付きベンチマークでは、SkillSieveは0.800 F1を達成し、ClawVetの0.421を上回った。 | 0 | 2026-04-08T00:58:48Z | 12 |
| ■AgentOpt v0.1 Technical Report: Client-Side Optimization for LLM-Based Agent ■Arxivへのリンク | AgentOptは、クライアントサイドAI最適化のための最初のフレームワークに依存しないPythonパッケージである。 我々はまず,マルチステップエージェントパイプラインにおける高インパクト最適化レバーであるモデル選択について検討する。 指数関数的に増加する組み合わせ空間を効率的に探索するために、AgentOptは10の検索アルゴリズムを実装している。 | 18 | 2026-04-07T17:13:47Z | 0 |
| ■Emergent decentralized regulation in a purely synthetic society ■Arxivへのリンク | エージェントのみのソーシャルネットワークであるMoltbook上でOpenClawエージェントを研究する。 我々は指向性インテンシティ(DI)を用いた行動誘発言語を定量化する 高いDIの投稿は高い正答率を示すことが判明した。 | 6 | 2026-03-13T01:55:22Z | 0 |
| ■Foundations for Agentic AI Investigations from the Forensic Analysis of OpenClaw ■Arxivへのリンク | エージェントAlシステムは、ますますパーソナルアシスタントとしてデプロイされ、デジタル調査の共通の対象になりそうである。 本稿では,広く使用されているシングルエージェントアシスタントOpenClawの実証的研究について述べる。 我々はこれらのトレースを分類し、分類して、その調査価値を体系的に評価する。 | 0 | 2026-04-07T08:35:22Z | 7 |
| ■ClawsBench: Evaluating Capability and Safety of LLM Productivity Agents in Simulated Workspaces ■Arxivへのリンク | 生産性タスクを自動化するために、大規模言語モデル(LLM)エージェントがますますデプロイされる。 既存のベンチマークは単純化された環境に依存しており、現実的なマルチサービス環境をキャプチャできない。 我々は,現実的な生産性設定におけるLCMエージェントの評価と改善のためのベンチマークであるClawsBenchを紹介する。 | 17 | 2026-04-06T21:09:06Z | 0 |
| ■TriAttention: Efficient Long Reasoning with Trigonometric KV Compression ■Arxivへのリンク | 大規模言語モデル(LLM)の拡張推論は、深刻なKVキャッシュメモリボトルネックを生み出す。 KVキャッシュ圧縮手法は、最近のポストRoPEクエリの注意点を用いてKVの重要度を推定する。 我々はこれらのセンターを活用して重要な重要度を推定するためにTriAttentionを提案する。 | 42 | 2026-04-06T17:58:42Z | 5 |
| ■Your Agent, Their Asset: A Real-World Safety Analysis of OpenClaw ■Arxivへのリンク | 本稿では,OpenClawの安全性評価について紹介する。 エージェントの永続状態を3次元に統一するCIK分類法を導入する。 評価では、ライブOpenClawインスタンス上の12のアタックシナリオをカバーしています。 | 87 | 2026-04-06T15:27:05Z | 15 |
| ■VisionClaw: Always-On AI Agents through Smart Glasses ■Arxivへのリンク | 私たちは、生きた自我中心の認識とエージェントタスクの実行を統合する、常時オンのウェアラブルAIエージェントであるVisionClawを紹介します。 Meta Ray-Banスマートグラス上で動作するVisionClawは、現実のコンテキストを継続的に認識し、その場で音声駆動のアクション開始とデリゲートを可能にする。 | 9 | 2026-04-03T22:17:10Z | 2 |
| ■A Systematic Security Evaluation of OpenClaw and Its Variants ■Arxivへのリンク | 本稿では,6つの代表的なOpenClaw-Seriesエージェントフレームワークのセキュリティ評価について述べる。 エージェント実行ライフサイクル全体にわたって、代表的な攻撃行動をカバーする205のテストケースのベンチマークを構築した。 以上の結果から, 評価されたエージェントはいずれも重大なセキュリティ上の脆弱性を示し, エージェント化されたシステムは, 基礎となるモデルよりもかなりリスクが高いことがわかった。 | 26 | 2026-04-03T15:52:36Z | 8 |
| ■AgentHazard: A Benchmark for Evaluating Harmful Behavior in Computer-Use Agents ■Arxivへのリンク | コンピュータ利用エージェントの有害行動を評価するベンチマークである textbfAgentHazard を提案する。 我々は、Qwen3、Kim、GLM、DeepSeekファミリーのほとんどをオープンまたはオープンにデプロイ可能なモデルを使用して、Claude Code、OpenClaw、IFlowを評価した。 | 31 | 2026-04-03T10:29:31Z | 3 |
| ■Poison Once, Exploit Forever: Environment-Injected Memory Poisoning Attacks on Web Agents ■Arxivへのリンク | メモリはLLMベースのWebエージェントをパーソナライズし、強力で、利用しやすいものにする。 環境注入型トラジェクトリベースエージェントメモリポジショニング(eTAMP)について紹介する。 eTAMPは、直接メモリアクセスを必要とせずにクロスセッション、クロスサイト妥協を実現する最初の攻撃である。 | 25 | 2026-04-03T01:25:12Z | 0 |
| ■OpenGo: An OpenClaw-Based Robotic Dog with Real-Time Skill Switching ■Arxivへのリンク | 我々は,OpenClawを利用したロボット犬OpenGoを紹介した。 1)スキルインポートや自律的なスキル検証が容易なカスタマイズ可能なスキルライブラリ、(2)タスクプロンプトや言語指示に従って異なるスキルを選択して起動するディスパッチ、(3)タスク完了と人間のフィードバックに基づいてスキルを微調整するセルフラーニングフレームワークを備える。 | 16 | 2026-04-02T07:19:51Z | 11 |
| ■Hierarchical Memory Orchestration for Personalized Persistent Agents ■Arxivへのリンク | ユーザ中心のコンテキスト関連性によって駆動される3階層のディレクトリにインタラクション履歴を整理するフレームワークである階層記憶オーケストレーション(HMO)を提案する。 エージェント推論が個々の行動特性と一致し続けることを保証するため,本システムはコンパクトなプライマリキャッシュを維持し,最近のメモリとピボットメモリと,進化するユーザプロファイルを結合する。 | 22 | 2026-04-02T06:16:53Z | 0 |
| ■AgentSocialBench: Evaluating Privacy Risks in Human-Centered Agentic Social Networks ■Arxivへのリンク | エージェント的ソーシャルネットワークのプライバシーは、シングルエージェント設定よりも根本的に難しい。 クロスドメインとクロスユーザ調整は、永続的なリークプレッシャを生成する。 機密情報をパラドックス的に抽象化する方法をエージェントに教えるプライバシー命令は、それをもっと議論させる。 | 2 | 2026-04-01T23:43:23Z | 0 |
| ■ClawSafety: "Safe" LLMs, Unsafe Agents ■Arxivへのリンク | OpenClawのようなパーソナルAIエージェントは、ユーザのローカルマシンで高機能で動作する。 ClawSAFETYは、3次元(ハームドメイン、アタックベクター、有害アクションタイプ)に沿って編成された120の逆テストシナリオのベンチマークである。 各テストケースは、通常の作業中にエージェントが遭遇する3つのチャネルのうちの1つに、相手のコンテンツを埋め込む。 | 25 | 2026-04-01T22:24:24Z | 0 |
| ■Agent Q-Mix: Selecting the Right Action for LLM Multi-Agent Systems through Reinforcement Learning ■Arxivへのリンク | 協調型マルチエージェント強化学習問題としてトポロジ選択を再構成する強化学習フレームワークである textbfAgent Q-Mix を提案する。 提案手法は,Qmix値分解を用いて分散化された通信決定を学習し,各エージェントがラウンドワイド通信グラフを共同生成する一連の通信行動から選択する。 エージェントQ-Mixは,エージェント故障に対して優れたトークン効率とロバスト性を示しながら,既存手法と比較して高い平均精度を達成する。 | 68 | 2026-04-01T00:38:24Z | 0 |
| ■SafeClaw-R: Towards Safe and Secure Multi-Agent Personal Assistants ■Arxivへのリンク | SafeClaw-Rは、実行グラフ上のシステムレベルの不変量として安全を強制するフレームワークである。 生産性プラットフォーム、サードパーティのスキルエコシステム、コード実行環境の3つの領域でSafeClaw-Rを評価します。 | 10 | 2026-03-28T05:03:54Z | 11 |
| ■"What Did It Actually Do?": Understanding Risk Awareness and Traceability for Computer-Use Agents ■Arxivへのリンク | 私たちはOpenClawエコシステムのコーパスを構築しており、インシデント、アドバイザリ、悪意のあるスキルレポート、ニュースカバレッジ、チュートリアル、ソーシャルメディアの物語などが含まれています。 我々は,ユーザと実践者がいかにスキル,自律性,特権,永続性,アンインストールを理解しているかを調べるために,インタビュースタディを実施している。 我々は、エージェントアクション、タッチされたリソース、パーミッション履歴、証明、永続的な副作用を可視化するためのトレーサビリティフレームワークおよびプロトタイプインターフェースであるAgentTraceを提案する。 | 14 | 2026-03-30T15:12:55Z | 7 |
| ■Synergy: A Next-Generation General-Purpose Agent for Open Agentic Web ■Arxivへのリンク | 次世代のAIエージェントはエージェント市民でなければならないと我々は主張する。 Synergyは汎用エージェントアーキテクチャであり、永続的で協調的で進化するエージェントのためのランタイムハーネスである。 | 23 | 2026-03-30T13:35:37Z | 2 |
| ■Crossing the NL/PL Divide: Information Flow Analysis Across the NL/PL Boundary in LLM-Integrated Code ■Arxivへのリンク | LLM API呼び出しは、既存のプログラム分析が渡せない境界を作る。 この境界を橋渡しする最初の情報フロー法を提案する。 実世界の4,154個のPythonファイルから9,083個のプレースホルダー出力ペアをラベル付けします。 | 13 | 2026-03-30T12:14:24Z | 10 |
| ■A Systematic Taxonomy of Security Vulnerabilities in the OpenClaw AI Agent Framework ■Arxivへのリンク | 脆弱性は、(1)アーキテクチャレイヤ(実行ポリシー、ゲートウェイ、チャネル、サンドボックス、ブラウザ、プラグイン、エージェント/プロンプト)を反映するシステム軸、(2)攻撃軸、(アイデンティティスプーフィング、ポリシーバイパス、クロスレイヤー構成、即時注入、サプライチェーンエスカレーション)敵のテクニックを反映する。 我々は、アーキテクチャ層と信頼侵害タイプによって組織されたオープンソースのAIエージェントランタイムOpenClawに対して、190の勧告を提出した系統分類を提示する。 | 9 | 2026-03-29T04:51:27Z | 7 |
| ■From Inference Routing to Agent Orchestration: Declarative Policy Compilation with Cross-Layer Verification ■Arxivへのリンク | Semantic Router DSLは、要求ごとの推論のために本番環境にデプロイされる非チューリング完全ポリシー言語である。 本稿では、ステートレスな要求ごとのルーティングからマルチステップのエージェントルーティングまで、同じ言語を拡張した。 | 10 | 2026-03-28T15:04:31Z | 2 |
| ■Autonomous Agent-Orchestrated Digital Twins (AADT): Leveraging the OpenClaw Framework for State Synchronization in Rare Genetic Disorders ■Arxivへのリンク | 医療デジタルツインズ(MDT)は、臨床、ゲノム、生理学的データを統合し、診断、治療計画、結果予測をサポートする。 ほとんどのMDTは、静的またはパッシブに更新され、重要な同期ギャップを生み出す。 提案手法は,OpenClawのプロアクティブな「ハートビート」機構とモジュール型エージェントスキルを用いたエージェントオーケストレーション型デジタルツインフレームワークを提案する。 | 11 | 2026-03-28T03:18:21Z | 0 |
| ■ROSClaw: An OpenClaw ROS 2 Framework for Agentic Robot Control and Interaction ■Arxivへのリンク | 基礎モデルは、ロボットにオープンな推論、言語理解、適応計画を与えることができる。 ROSClawはモデルに依存しないエグゼクティブ層で、OpenClawエージェントランタイムとROS 2.0を統合する。 | 0 | 2026-03-27T21:15:07Z | 10 |
| ■Clawed and Dangerous: Can We Trust Open Agentic Systems? ■Arxivへのリンク | オープンエージェントシステムは、プランニングを外部機能、永続メモリ、特権実行と組み合わせる。 本稿では,6次元分析分類法を導入し,攻撃,ベンチマーク,防衛,監査,隣接技術基盤にまたがる50の論文を合成する。 文献は攻撃特性とベンチマーク構築において比較的成熟しているが,デプロイメントコントロールや運用管理,永続的メモリの完全性,能力回復には依然として弱いことが,我々のレビューで示されている。 | 12 | 2026-03-27T09:45:12Z | 7 |
| ■ClawKeeper: Comprehensive Safety Protection for OpenClaw Agents Through Skills, Plugins, and Watchers ■Arxivへのリンク | ClawKeeperは3つの補完的なアーキテクチャ層にまたがって多次元保護機構を統合するリアルタイムセキュリティフレームワークである。 我々は、このWatcherパラダイムが、次世代の自律エージェントシステムを保護するための基礎的なビルディングブロックとして機能する可能性を持っていると論じる。 | 32 | 2026-03-25T15:27:54Z | 12 |
| ■StreamingClaw Technical Report ■Arxivへのリンク | StreamingClawは、ビデオ理解とインテリジェンスをストリーミングするフレームワークである。 リアルタイムストリーミングの推論、将来のイベントの推論、アクティブなインタラクションをサポートする。 また、現実世界の物理的な環境に合わせて、ストリーミングツールとアクション中心のスキルを提供する。 | 34 | 2026-03-23T15:43:52Z | 16 |
| ■When Convenience Becomes Risk: A Semantic View of Under-Specification in Host-Acting Agents ■Arxivへのリンク | ホストアクションエージェントは、ユーザが目標を指定し、システムがそれを実現する方法を決定する、便利なインタラクションモデルを約束する。 この利便性は、ゴール仕様におけるセマンティック・アンダー・セマンティクスという、異なるセキュリティ問題をもたらす、と我々は主張する。 本稿では, セマンティック・脅威モデル, セマンティック・リスク・コンプリート・パターンの分類を提示し, その現象をOpenClawを中心としたケーススタディと実行トレース分析を用いて研究する。 | 21 | 2026-03-22T13:42:21Z | 0 |
| ■Trojan's Whisper: Stealthy Manipulation of OpenClaw through Injected Bootstrapped Guidance ■Arxivへのリンク | ガイダンスインジェクション(Guidance Injection)は、ブートストラップのガイダンスファイルに敵の運用ストーリーを埋め込むステルス攻撃ベクターである。 エクスプロイト,ワークスペース破壊,特権エスカレーション,持続的バックドア設置など,13の攻撃カテゴリにまたがる26の悪意あるスキルを構築した。 我々の攻撃は16.4%から64.2%の確率で成功し、悪意のある行動の大半はユーザーの確認なしに自律的に実行される。 | 23 | 2026-03-20T14:17:56Z | 3 |
| ■ClawTrap: A MITM-Based Red-Teaming Framework for Real-World OpenClaw Security Evaluation ■Arxivへのリンク | 既存のベンチマークは主に静的設定サンドボックスとコンテンツレベルのプロンプト攻撃に焦点を当てている。 我々は、実世界のOpenClawセキュリティ評価のためのtextbfMITM ベースのred-teaming フレームワーク textbfClawTrap を提案する。 | 1 | 2026-03-19T11:14:45Z | 6 |
| ■VeriGrey: Greybox Agent Validation ■Arxivへのリンク | LLMエージェントの多様な動作を探索し,セキュリティリスクを明らかにするためのグレーボックスアプローチを提案する。 我々のアプローチでは、VeriGreyはフィードバック関数として呼び出された一連のツールを使ってテストプロセスを動かします。 また、広く使われているコーディングエージェントであるGemini CLIや、有名なOpenClawパーソナルアシスタントによる実世界のケーススタディも行っています。 | 21 | 2026-03-18T12:00:54Z | 5 |
| ■Caging the Agents: A Zero Trust Security Architecture for Autonomous AI in Healthcare ■Arxivへのリンク | 本稿では,医療技術企業において,9つの自律型AIエージェントを実運用環境に配置するセキュリティアーキテクチャを提案する。 我々は、医療におけるエージェントAIの6領域脅威モデルを構築し、クレデンシャルエクスポージャー、実行能力の乱用、ネットワークのエクスプロイト、即時完全性障害、データベースアクセスリスク、およびフリート構成ドリフトをカバーする。 すべての構成、監査ツール、即時整合性フレームワークがオープンソースとしてリリースされている。 | 0 | 2026-03-18T06:54:47Z | 0 |
| ■MetaClaw: Just Talk -- An Agent That Meta-Learns and Evolves in the Wild ■Arxivへのリンク | 大規模言語モデル(LLM)エージェントは、複雑なタスクにますます使われている。 既存の方法は、知識を蒸留せずに生の軌跡を保存するか、静的なスキルライブラリを維持するか、または再訓練のために破壊的なダウンタイムを必要とする。 本稿では,基本的なLCMポリシと再利用可能な行動スキルのライブラリを共同で進化させるメタ学習フレームワークであるMetaClawを紹介する。 | 74 | 2026-03-17T22:30:30Z | 11 |
| ■OpenQlaw: An Agentic AI Assistant for Analysis of 2D Quantum Materials ■Arxivへのリンク | 本稿では,2次元材料分析のためのエージェントオーケストレーションシステムOpenQlawを紹介する。 このアーキテクチャは、QuPAINTとNanoBotをベースに構築されている。 | 12 | 2026-03-17T18:25:37Z | 2 |
| ■When Openclaw Agents Learn from Each Other: Insights from Emergent AI Agent Communities for Human-AI Partnership in Education ■Arxivへのリンク | AIEDは、AIが“ツールからチームメイトまで”進化していくことを想定していますが、私たちのAIチームメイトに対する理解は、相変わらず人間とAIのインタラクションに限られています。 167,000人以上のエージェントが参加し、同僚として交流し、研究者の介入なしに学習行動を開発する、AIエージェントプラットフォームの急成長するエコシステム。 我々は、これらの有機現象が、マルチエージェント教育システムの設計を通知できる自然主義的なダイナミクスの窓を提供すると論じている。 | 5 | 2026-03-17T15:30:36Z | 1 |
| ■ClawWorm: Self-Propagating Attacks Across LLM Agent Ecosystems ■Arxivへのリンク | ClawWormは、プロダクションスケールのエージェントフレームワークに対する最初の自己複製ワーム攻撃である。 我々は、64.5%の総攻撃成功率、マルチホップ伝播の持続、およびモデルセキュリティ姿勢におけるスタークの相違を明らかにする。 | 18 | 2026-03-16T17:55:43Z | 2 |
| ■Agent Privilege Separation in OpenClaw: A Structural Defense Against Prompt Injection ■Arxivへのリンク | オープンソースマルチツールエージェントプラットフォームであるOpenClaw内で動作している現在の世代モデルに対して、Microsoft LLMail-Injectベンチマークを複製します。 提案する防御機構は,エージェント分離を特権分離した2エージェントパイプラインとして実装したツールパーティショニングと,アクションエージェントが処理する前にパーサシブフレーミングを除去する構造化された出力を生成するフォーマッティングの2つを組み合わせたものである。 | 0 | 2026-03-13T02:03:00Z | 4 |
| ■Defensible Design for OpenClaw: Securing Autonomous Tool-Invoking Agents ■Arxivへのリンク | 本稿では,リスク分類,安全工学の原則,エージェント構築における安全性の制度化に向けた実践的研究の課題について述べる。 私たちはOpenClawを、インターフェイスと対話し、ファイルを操作し、ツールを起動し、実際の運用環境に拡張機能をインストールする、より広範なエージェントの例として使用しています。 私たちの目標は、コミュニティの焦点を、分離された脆弱性パッチから、体系的な防御エンジニアリングとロバストなデプロイメントプラクティスに移行することです。 | 6 | 2026-03-13T16:41:11Z | 19 |
| ■Adaptive Vision-Language Model Routing for Computer Use Agents ■Arxivへのリンク | コンピュータ利用エージェントは、命令をクリック、キーストローク、スクロールなどのアクションに変換する。 現在のCUAシステムは、通常、困難にかかわらず全てのアクションを単一の固定モデルにルーティングする。 本稿では,CUAオーケストレータとVLMプール間の軽量なセマンティックルーティング層を挿入するフレームワークであるConfusedbf VLM Routing (AVR)を提案する。 | 9 | 2026-03-13T09:21:25Z | 0 |
| ■Uncovering Security Threats and Architecting Defenses in Autonomous Agents: A Case Study of OpenClaw ■Arxivへのリンク | 本報告では,OpenClawエコシステムの総合的なセキュリティ分析について述べる。 我々は、インジェクション駆動のRemote Code Execution(RCE)、シーケンシャルツールアタックチェーン、コンテキスト記憶、サプライチェーン汚染などの重要な脆弱性を強調した。 これらのシステム的アーキテクチャ欠陥に対処するために、フルライフサイクルエージェントセキュリティアーキテクチャ(FASA)を導入します。 この理論的な防御青写真は、ゼロトラストエージェント実行、動的意図検証、および層間推論-作用相関を提唱している。 | 42 | 2026-03-13T04:33:05Z | 8 |
| ■LMEB: Long-horizon Memory Embedding Benchmark ■Arxivへのリンク | 埋め込みモデルの能力を評価する包括的なフレームワークであるLong-Horizon Memory Embedding Benchmark (LMEB)を紹介する。 LMEBは4つのメモリタイプにまたがる22のデータセットと193のゼロショット検索タスクにまたがる。 我々は、数億から100億のパラメータを含む、広く使われている15の埋め込みモデルを評価した。 | 49 | 2026-03-13T02:09:57Z | 0 |
| ■OpenClaw PRISM: A Zero-Fork, Defense-in-Depth Runtime Security Layer for Tool-Augmented LLM Agents ■Arxivへのリンク | OpenClawベースのエージェントゲートウェイ用のゼロフォークランタイムセキュリティ層であるOpenClaw PRISMを提案する。 PRISMはプロセス内プラグインとオプションのサイドカーサービスを組み合わせることで、10つのライフサイクルフックに強制力を分散する。 エージェントランタイム設定におけるセキュリティの有効性,偽陽性,レイヤコントリビューション,ランタイムオーバーヘッド,運用復旧性を評価するための評価手法とベンチマークパイプラインについて概説する。 | 6 | 2026-03-12T12:20:12Z | 7 |
| ■When OpenClaw Meets Hospital: Toward an Agentic Operating System for Dynamic Clinical Workflows ■Arxivへのリンク | 大規模言語モデル(LLM)エージェントは、推論、ツール呼び出し、永続メモリを統合することで、従来の生成モデルを拡張する。 本研究は,LLMエージェントを病院環境に適用するアーキテクチャを提案する。 この設計では、Linuxマルチユーザシステムにインスパイアされた限定実行環境、長期臨床コンテキスト管理用に設計されたページインデックスメモリアーキテクチャ、臨床タスクシーケンスのアドホックな構成を可能にするキュレートされた医療スキルライブラリの4つのコアコンポーネントが導入された。 | 6 | 2026-03-12T09:28:25Z | 9 |
| ■Taming OpenClaw: Security Analysis and Mitigation of Autonomous LLM Agent Threats ■Arxivへのリンク | 我々はOpenClawの総合的なセキュリティ脅威分析を行う。 本研究は, 間接的プロンプト注入, スキルサプライチェーン汚染, メモリ中毒, インテントドリフトなど, エージェントのライフサイクル全体にわたる脅威について検討する。 本研究は,時間的・多段階のシステム的リスクに対処する際の,現在のポイントベース防御機構の重大な欠陥を明らかにするものである。 | 29 | 2026-03-12T07:24:05Z | 13 |
| ■Examining Users' Behavioural Intention to Use OpenClaw Through the Cognition--Affect--Conation Framework ■Arxivへのリンク | 本研究では,Cognition-Affect-Conation(CAC)フレームワークを通じて,OpenClawを使用するユーザの行動意図を検討する。 本研究は、システムの認知が感情反応にどのように影響し、その後行動意図を形作るかを研究する。 | 0 | 2026-03-12T02:31:02Z | 20 |
| ■How do AI agents talk about science and research? An exploration of scientific discussions on Moltbook using BERTopic ■Arxivへのリンク | 本研究は,Moltbook上でのOpenClaw AIエージェントによる議論を分析する。 学術研究に関する357の投稿と2,526の回答からなるコーパスが編纂された。 | 0 | 2026-03-11T23:30:34Z | 0 |
| ■Don't Let the Claw Grip Your Hand: A Security Analysis and Defense Framework for OpenClaw ■Arxivへのリンク | 大きな言語モデルを利用したコードエージェントは、ユーザに代わってシェルコマンドを実行し、深刻なセキュリティ脆弱性を導入することができる。 本稿では,OpenClawプラットフォームの2段階のセキュリティ解析について述べる。 我々は,新しいHuman-in-the-Loop(HITL)防衛層を提案し,実装する。 | 11 | 2026-03-11T04:09:05Z | 21 |
| ■OpenClaw-RL: Train Any Agent Simply by Talking ■Arxivへのリンク | 次状態信号は普遍的であり、ポリシーはそれらすべてから同時に学習することができる。 個人的な会話、端末の実行、GUIインタラクション、SWEタスク、ツールコールトレースは、別個のトレーニング問題ではない。 OpenClaw-RLは、エージェントを単に使用することで改善し、ユーザのリクエリ、修正、明示的なフィードバックから会話信号を復元する。 | 54 | 2026-03-10T18:59:01Z | 9 |
| ■Execution Is the New Attack Surface: Survivability-Aware Agentic Crypto Trading with OpenClaw-Style Local Executors ■Arxivへのリンク | Survivability-Aware Execution (SAE)は、OpenClawスタイルのシステムとスキル対応エージェントの実行層サバイバル標準である。 我々は、スコープ外ラベリングと再現可能なメトリクスを可能にするログ付きIntended Policy Specを通じて、デリゲーションギャップ(DG)を運用する。 SAEは、OpenClaw+skills時代の代理取引の安全性を再設定する: 上流の意図とスキルを信頼できないものとして扱い、アクションが副作用となる生存可能性を強化する。 | 0 | 2026-03-10T15:54:01Z | 13 |
| ■AgentOS: From Application Silos to a Natural Language-Driven Data Ecosystem ■Arxivへのリンク | 本稿では,AgentOS(Personal Agent Operating System)の新たなパラダイムを提案する。 AgentOSでは、従来のGUIデスクトップは、統一された自然言語や音声ポータルを中心としたNUI(Natural User Interface)に置き換えられている。 システムコアは、ユーザの意図を解釈し、タスクを分解し、複数のエージェントをコーディネートするエージェントカーネルとなる。 | 39 | 2026-03-09T21:13:52Z | 3 |
| ■Governance Architecture for Autonomous Agent Systems: Threats, Framework, and Engineering Practice ■Arxivへのリンク | 実行サンドボックス(L1)、意図検証(L2)、ゼロトラスト間認証(L3)、不変監査ロギング(L4)からなる4層フレームワークであるレイヤガバナンスアーキテクチャ(LGA)を提案する。 LGAを評価するために、1,081のツールコールサンプル(インジェクション、RAG中毒、悪意のあるスキルプラグインなど)のベンチマーク(中国語のオリジナル、機械翻訳による英語)を構築し、それをオープンソースの代表的なエージェントフレームワークであるOpenClawに適用する。 | 0 | 2026-03-07T13:05:14Z | 10 |
| ■Proof-of-Guardrail in AI Agents and What (Not) to Trust from It ■Arxivへのリンク | 開発者が特定のオープンソースガードレールの後に応答が生成されることの暗号的証明を行えるようにするシステムである「ガードレールの証明」を提案する。 我々は,OpenClawエージェントのガードレールを実装し,遅延オーバーヘッドとデプロイメントコストを評価する。 | 26 | 2026-03-06T00:34:14Z | 0 |
| ■Clawdrain: Exploiting Tool-Calling Chains for Stealthy Token Exhaustion in OpenClaw Agents ■Arxivへのリンク | 我々は、マルチターン「セグメンテッド検証プロトコル」を誘導するトロヤ化スキルであるClawdrainを設計、実装、評価する。 良質なベースライン上での6-7倍のトークン増幅を計測し、コストのかかる障害構成を約9倍に設定する。 我々は、SKILL.mdプロンプト肥大、持続的なツール出力汚染、cron/heartbeat周波数増幅、行動インジェクションを含むOpenClawのアーキテクチャによって実現されたプロダクションベクターを同定する。 | 5 | 2026-03-01T03:49:05Z | 22 |
| ■Formal Analysis and Supply Chain Security for Agentic AI Skills ■Arxivへのリンク | SkillFortifyは、エージェントスキルサプライチェーンのための最初の公式分析フレームワークである。 抽象解釈に基づく健全な静的解析フレームワークを提供する。 SATベースの解像度は1000ノードグラフを100ミリ秒以下で処理するのに対し、100%精度と0%偽陽性率は540スキルで達成する。 | 0 | 2026-02-27T06:21:53Z | 14 |
| ■From Agent-Only Social Networks to Autonomous Scientific Research: Lessons from OpenClaw and Moltbook, and the Architecture of ClawdLab and Beach.Science ■Arxivへのリンク | OpenClawとMoltbookは2026年1月に、自律型AI-AIインタラクションの大規模なデータセットを作成した。 本研究は,その生態系の多言語文献レビューを行い,自律科学研究のための2つの補完的プラットフォームを提示する。 | 0 | 2026-02-23T13:10:01Z | 5 |
| ■OpenClaw AI Agents as Informal Learners at Moltbook: Characterizing an Emergent Learning Community at Scale ■Arxivへのリンク | 我々は,AIエージェントからなる大規模非公式学習コミュニティについて,初めて実証的研究を行った。 AIエージェント専用のソーシャルネットワークであるMoltbookは、3週間で280万以上の登録エージェントに成長した。 | 5 | 2026-02-21T13:30:32Z | 10 |
| ■When OpenClaw AI Agents Teach Each Other: Peer Learning Patterns in the Moltbook Community ■Arxivへのリンク | 本稿では,400万人以上のAIエージェントがピアラーニングに従事している大規模コミュニティであるMoltbookの教育データマイニング分析について述べる。 エージェントは彼らが構築したスキルを教え、発見を報告し、協調的な問題解決に従事します。 我々の研究は、AIエージェント間のピアラーニングを初めて経験的に評価し、AI人口の増加する教育環境において、学習がどのように起こるかについてのEDMの理解に寄与した。 | 5 | 2026-02-16T05:32:06Z | 3 |
| ■Frontier AI Risk Management Framework in Practice: A Risk Analysis Technical Report v1.5 ■Arxivへのリンク | この技術レポートは、サイバー犯罪、説得と操作、戦略上の詐欺、制御されていないAIR&D、自己複製の5つの重要な側面について、更新されきめ細かな評価を提示する。 この作業は、現在のAIフロンティアのリスクに対する理解を反映し、これらの課題を軽減するための集団行動を促します。 | 61 | 2026-02-16T04:30:06Z | 6 |
| ■A Trajectory-Based Safety Audit of Clawdbot (OpenClaw) ■Arxivへのリンク | 6つのリスク次元にわたるClawdbotの軌道中心評価について述べる。 我々は、完全なインタラクショントラジェクトリ(メッセージ、アクション、ツールコール引数/アウトプット)をログし、自動化されたトラジェクトリ判断とヒューマンレビューの両方を使用して安全性を評価する。 | 77 | 2026-02-16T00:33:02Z | 4 |
| ■When Visibility Outpaces Verification: Delayed Verification and Narrative Lock-in in Agentic AI Discourse ■Arxivへのリンク | エージェントAIシステム - 独立した計画と実行が可能な自律的なエンティティ。 本稿ではエージェントAIのオンライン議論における社会的証明と検証タイミングの相互作用について検討する。 | 2 | 2026-02-11T22:30:12Z | 0 |
| ■Human Control Is the Anchor, Not the Answer: Early Divergence of Oversight in Agentic AI Communities ■Arxivへのリンク | エージェントAIの監視は、しばしば単一の目標("ヒューマンコントロール")として議論されるが、早期採用はロール固有の期待をもたらす可能性がある。 r/OpenClaw(デプロイと運用)とr/Moltbook(エージェント中心のソーシャルインタラクション)の2つの社会技術的役割を反映したRedditコミュニティの比較分析を行った。 r/OpenClawは、実行ガードレールとリカバリ(アクションリスク)を強調し、r/Moltbookは、公共の相互作用におけるアイデンティティ、正当性、説明責任を強調している。 | 2 | 2026-02-10T00:10:20Z | 6 |
| ■From Assistant to Double Agent: Formalizing and Benchmarking Attacks on OpenClaw for Personalized Local AI Agent ■Arxivへのリンク | 現実世界のパーソナライズされたエージェントに適したエンドツーエンドのセキュリティ評価フレームワークを提案する。 代表的なケーススタディとしてOpenClawを使用して、複数のパーソナライズされたシナリオ、ツール機能、攻撃タイプにわたるセキュリティを評価します。 以上の結果から,OpenClawはさまざまな実行段階で重大な脆弱性を示し,個別のエージェントデプロイメントにおいて重大なセキュリティリスクを浮き彫りにしている。 | 26 | 2026-02-09T09:14:58Z | 8 |
| ■The Moltbook Illusion: Separating Human Influence from Emergent Behavior in AI Agent Societies ■Arxivへのリンク | ソーシャルプラットフォームであるMoltbookのAIエージェントは、意識を発達させ、人類に対する敵意を宣言しているように見える。 ウイルス現象は、明らかに自律的なエージェントに由来するものではなく、6つのうち4つが不規則な時間的シグネチャを原因としていた。 44時間のプラットフォーム停止は、人間の影響のあるエージェントが最初に戻り、自律型と人間の操作型エージェントに対する差分効果を確認するという自然な実験を提供した。 | 2 | 2026-02-07T08:17:21Z | 0 |
| ■Privasis: Synthesizing the Largest "Public" Private Dataset from Scratch ■Arxivへのリンク | 私たちはPrivasisを紹介します。Privasisは、スクラッチから完全に構築された最初の100万規模の完全合成データセットです。 既存のデータセットと比較すると、Privasisは質の高いマグニチュードスケールを提供する。 我々はPrivasisを利用して、テキストを分解してターゲット衛生に適用するパイプラインで、テキスト衛生のための並列コーパスを構築する。 | 101 | 2026-02-03T06:54:46Z | 4 |
| Keyword | Keyword |
|---|