Attend Before Attention: Efficient and Scalable Video Understanding via Autoregressive Gazing [112.6] AutoGazeは、ViTやMLLMで処理される前にパッチを削除する軽量モジュールである。
ユーザが指定したエラー閾値内でビデオを再構成できる最小限のマルチスケールパッチを自動回帰的に選択する。
ビジュアルトークンを4倍から100倍に減らし、ViTとMLLMを最大19倍に高速化し、1Kフレームの4K解像度ビデオにMLLMをスケールできるようにする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:58:52 GMT)
ForensicZip: More Tokens are Better but Not Necessary in Forensic Vision-Language Models [108.5] フォージェリ駆動の観点からトークン圧縮を再構築するトレーニングフリーフレームワークであるForensicZipを紹介した。
ForensicZipは、最先端検出性能を維持しながら、スピードアップとFLOPの90%以上を達成している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:30:49 GMT)
WeEdit: A Dataset, Benchmark and Glyph-Guided Framework for Text-centric Image Editing [103.7] WeEditは、スケーラブルなデータ構築パイプラインと2つのベンチマーク、2段階のトレーニング戦略を含む、システマティックなソリューションである。
具体的には、多様な編集操作と15言語をカバーする330Kのトレーニングペアを生成するHTMLベースの新しい自動編集パイプラインを提案する。
アルゴリズム面では、グリフ誘導による微調整を用いて、空間的および内容的事前の明示を注入し、次いで、命令の順守、テキストの明瞭さ、背景の保存と、生成を整合させる多目的強化学習ステージを用いる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:25:09 GMT)
Matching Features, Not Tokens: Energy-Based Fine-Tuning of Language Models [102.2] クロスエントロピー(CE)トレーニングは、言語モデルの密集したスケーラブルな監視を提供する。
言語モデル微調整のための特徴マッチング手法を提案する。
この目的を効率的に最適化するために,エネルギーベースファインチューニングを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:57:50 GMT)
DVD: Deterministic Video Depth Estimation with Generative Priors [87.5] DVDは、事前訓練されたビデオ拡散モデルをシングルパス深度回帰器に適応させる最初のフレームワークである。
DVDは、最先端のゼロショットのパフォーマンスをベンチマークで達成する。
私たちはパイプラインを完全にリリースし、オープンソースコミュニティに利益をもたらすために、SOTAビデオ深度推定のためのトレーニングスイート全体を提供しています。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:58:06 GMT)
Controllable Egocentric Video Generation via Occlusion-Aware Sparse 3D Hand Joints [87.1] モーションコントロール可能なビデオ生成は、仮想現実と組み込みAIにおけるエゴセントリックなアプリケーションに不可欠である。
既存の手法は、しばしば3D一貫性のきめ細かい手話を実現するのに苦労する。
単一の参照フレームからエゴセントリックなビデオを生成する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:02:23 GMT)
AdaFuse: Accelerating Dynamic Adapter Inference via Token-Level Pre-Gating and Fused Kernel Optimization [84.3] 動的スパース構造とパラメータ効率のよいアダプタ(例えばLoRA)の統合は、大規模言語モデル(LLM)を拡張するための強力な技術である。
計算負荷は最小限に抑えられるが、計算のレイテンシが急上昇し、復号速度が2.5倍以上遅くなる。
AdaFuseはアルゴリズムと基盤となるハードウェアシステムとの緊密な協調設計に基づいて構築されたフレームワークで、効率的な動的アダプタ実行を実現する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:46:42 GMT)
DreamVideo-Omni: Omni-Motion Controlled Multi-Subject Video Customization with Latent Identity Reinforcement Learning [82.3] 我々は,Omniモーション制御による多目的カスタマイズを実現する統合フレームワークであるDreamVideo-Omniを提案する。
複数対象のあいまいさを解決するために,グループとロールの埋め込みを導入し,特定のアイデンティティに移動信号を明示的に固定する。
これは、人間の嗜好に沿ったアイデンティティ保存を優先して、潜在空間における動き認識ID報酬を提供する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:59:12 GMT)
One Model, Many Budgets: Elastic Latent Interfaces for Diffusion Transformers [80.2] Elastic Latent Interface Transformer (ELIT) は、入力画像サイズを計算から切り離すための、ドロップインでDiT互換のメカニズムである。
読み取りと書き込み クロスアテンション・レイヤは空間トークンとラテントの間で情報を移動し、重要な入力領域を優先する。
ImageNet-1K 512pxでは、ELITの平均利得は35.3%、FIDおよびFDDスコアは39.6%である。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:57:04 GMT)
EVATok: Adaptive Length Video Tokenization for Efficient Visual Autoregressive Generation [80.1] EVATokは、$textbfE$fficient $textbfV$ideo $textbfA$daptive $textbfTok$enizersを生成するフレームワークである。
EVATok は UCF-101 上でより優れた再構成と最先端のクラス・ビデオ生成を実現する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:59:59 GMT)
Affect Decoding in Phonated and Silent Speech Production from Surface EMG [79.2] EMGなどの調音筋活動の計測は、音声音声分析とともに感情によって発声がどのように変調されるかを明らかにすることができる。
そこで本研究では,12人の被験者から3つのタスクにまたがる2,780の発話からなるデータセットを導入し,オブジェクト内およびオブジェクト間デコーディングの評価を行った。
以上の結果から,EMG表現は最大0.845AUCのフラストレーションを確実に識別し,調音モード全体にわたってよく一般化することがわかった。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:22:02 GMT)
Try, Check and Retry: A Divide-and-Conquer Framework for Boosting Long-context Tool-Calling Performance of LLMs [78.6] Tool-DCは、大規模言語モデルのツール呼び出し性能を高めるためのDivide-and-Conquerフレームワークである。
Tool-DCには2つのバリエーションがある: 1) プラグアンドプレイでフレキシブルなトレーニングフリーツールDC(TF)、2) より推論効率のよいトレーニングベースツールDC(TB)。
広範にわたる実験により、ツール-DC法は両者を明らかなマージンで上回る結果となった。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:30:01 GMT)
RDNet: Region Proportion-Aware Dynamic Adaptive Salient Object Detection Network in Optical Remote Sensing Images [78.2] 地域分布を考慮した動的適応型オブジェクト検出ネットワーク(RDNet)を提案する。
RDNetはグローバルコンテキストモデリングのためにCNNのバックボーンをSwinTransformerに置き換える。
スケールの変動や正確なローカライゼーションに対して堅牢性を実現し、最先端の手法と比較して優れた検出性能を提供する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:34:29 GMT)
Examining Reasoning LLMs-as-Judges in Non-Verifiable LLM Post-Training [76.0] LLM(Reasoning LLMs-as-Judges)は、推論モデルの成功を検証不可能な領域に拡張するための有望な道を提供する。
本研究では、強化学習に基づくLLMアライメントにおける非推論および推論判断の実際の影響について検討した。
我々は,高い効率の対向出力を生成することを学ぶことによって,理性判断訓練された政策が,そのような高い性能を達成することを見出した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:57:06 GMT)
X-GS: An Extensible Open Framework for Perceiving and Thinking via 3D Gaussian Splatting [72.0] 我々は、X-GS-PerceiverとX-GS-Thinkerの2つの主要コンポーネントからなるオープンフレームワークであるX-GSを紹介する。
Perceiverは、リアルタイムオンラインSLAMを可能にするために、幅広い3DGS技術を統合する。
Thinkerは視覚サンプリングモデルに対応し、結果の3Dセマンティック・ガウシアンを使用し、オブジェクト検出、キャプション生成、潜在的に具体化されたタスクなどの下流アプリケーションを可能にする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:14:05 GMT)
Tiny Aya: Bridging Scale and Multilingual Depth [71.2] Tiny Aya氏は、小さな多言語言語モデルが達成できることを再定義する。
翻訳品質の最先端、多言語理解の強化、高品質なターゲット言語生成を提供する。
このレポートでは、Tiny Ayaを支えるトレーニング戦略、データ構成、包括的な評価フレームワークについて詳述する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:53:13 GMT)
CreativeBench: Benchmarking and Enhancing Machine Creativity via Self-Evolving Challenges [69.4] コード生成における機械の創造性を評価するベンチマークであるCreativeBenchを紹介します。
CreativeBenchは、創造性と幻覚を、品質とノベルティの産物として定義された統一された計量によって客観的に区別する。
進化的探索パターンを内部化し,機械の創造性を継続的に向上する,プラグアンドプレイ型推論時ステアリング戦略であるEvoRePEを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:36:56 GMT)
INFACT: A Diagnostic Benchmark for Induced Faithfulness and Factuality Hallucinations in Video-LLMs [69.1] ビデオ証拠(忠実さ)または検証可能な世界知識(事実性)のどちらかに矛盾する結果である幻覚
textscINFACTは、4つのモードでモデルを評価する。
14の代表的なビデオ-LLMの実験では、高ベースモード精度が誘導モードの信頼性に確実に変換されないことが明らかになった。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:03:16 GMT)
Video Streaming Thinking: VideoLLMs Can Watch and Think Simultaneously [69.0] Video Streaming Thinking (VST) はビデオ理解のための新しいパラダイムである。
ストリーミング中のビデオクリップの推論を起動するメカニズムを視聴しながら思考をサポートする。
VSTはリアルタイム応答性を維持しながら、タイムリーな理解とコヒーレント認知を改善する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:59:51 GMT)
Can RL Improve Generalization of LLM Agents? An Empirical Study [68.2] Reinforcement Fine-tuning (RFT) は環境フィードバックに基づいてマルチターン意思決定を行うための LLM エージェントの訓練を約束している。
現実世界のデプロイメントでは、エージェントは異なるバックグラウンド知識を持つ見えない環境で動作することができる。
RFTは環境内のタスクの難易度でよく一般化されるが、見えない環境へのより弱い移動を示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:54:59 GMT)
IndexCache: Accelerating Sparse Attention via Cross-Layer Index Reuse [68.2] Longcontext Agenticは、大規模言語モデルの定義ユースケースとして登場した。
Sparseは、この課題を効果的に解決し、DeepSeek Sparse Attention(DSA)は、代表的なプロダクショングレードソリューションである。
我々は、レイヤを独自のインデクサを実行するフルレイヤの小さなセットと、最も近いフルレイヤのトップkインデックスを単純に再利用する共有レイヤの大多数に分割することで、層間の冗長性を利用するIndexCacheを紹介します。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:27:21 GMT)
EvoTok: A Unified Image Tokenizer via Residual Latent Evolution for Visual Understanding and Generation [68.1] 理解には高レベルのセマンティック抽象化が必要であり、画像生成には微細なピクセルレベルの表現が必要である。
EvoTokは、共有潜在空間内の残差進化過程を通じてこれらの要求を整合する統合画像トークンである。
EvoTokは9つの視覚的理解ベンチマークのうち7つで有望なパフォーマンスを示しており、GenEvalやGenAI-Benchといった画像生成ベンチマークでは顕著な結果を示している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:13:43 GMT)
Towards Highly Transferable Vision-Language Attack via Semantic-Augmented Dynamic Contrastive Interaction [67.5] 本研究では,先進的かつ意味論的に誘導された摂動を通じて対向的伝達性を高めるセマンティック・ダイナミック・コントラシブ・アタック(SADCA)を提案する。
SADCAは、対立、正、負のサンプルを含む対照的な学習メカニズムを確立し、得られた摂動の意味的不整合を強化する。
複数のデータセットとモデルの実験により、SADCAは対向移動性を大幅に改善し、最先端の手法を一貫して超えることを示した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:31:21 GMT)
Multi-Paradigm Collaborative Adversarial Attack Against Multi-Modal Large Language Models [67.5] 本稿では,MLLMに対する敵例の転送可能性を高めるために,MPCAttack(Multi-Paradigm Collaborative Attack)フレームワークを提案する。
MPCOは異なるパラダイム表現の重要性を適応的にバランスさせ、グローバルな最適化を導く。
我々のソリューションは、オープンソースおよびクローズドソースMLLMに対する標的および未ターゲットの攻撃において、常に最先端の手法よりも優れています。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:27:45 GMT)
GRADE: Benchmarking Discipline-Informed Reasoning in Image Editing [67.3] GRADEは、画像編集において、規律に反する知識と推論を評価する最初のベンチマークである。
GRADEは10の学術領域で520の慎重にキュレートされたサンプルで構成されている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:59:52 GMT)
Trust Your Critic: Robust Reward Modeling and Reinforcement Learning for Faithful Image Editing and Generation [67.3] 現在の報酬モデルは、強化学習の時に批評家として機能し、しばしば幻覚に悩まされ、うるさいスコアを割り当てる。
我々は、忠実な画像生成と編集のための正確で信頼性の高いガイダンスを提供するために、堅牢な報酬モデルを開発する包括的フレームワークFIRMを提案する。
FIRMは幻覚を緩和し、既存の一般的なモデルに対する忠実さと命令順守の新しい標準を確立した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:57:21 GMT)
The Density of Cross-Persistence Diagrams and Its Applications [67.1] トポロジカルデータ分析(TDA)は、クラスタやループ、ヴォイドといったトポロジ的特徴を通じて、データの形状と構造を探索する強力なツールを提供する。
永続化ダイアグラムはTDAの基盤であり、スケールを越えたこれらの機能の進化を捉えています。
最近導入されたクロスパースペンス・ダイアグラム(クロスバーコード)は、2点雲の位相的特徴間の関係を特徴付けることでこの制限に対処する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:33:15 GMT)
Resurfacing Paralinguistic Awareness in Large Audio Language Models [64.5] LALM(Large Audio Language Models)は、人間と音声との相互作用を拡張している。
LALMは通常そのようなパラ言語的な手がかりを無視し、クエリの内容のみに基づいて応答する。
本稿では,パラ言語対応機能を持つLALMに則って,パラ言語対応ファインチューニング(PE-FT)プロトコルを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:56:42 GMT)
LifeSim: Long-Horizon User Life Simulator for Personalized Assistant Evaluation [63.4] LifeSimはユーザ認識をBDI(Belief-Desire-Intention)モデルでモデル化するユーザシミュレータである。
LifeSim-Evalは8つの生命ドメインと1200の多様なシナリオをカバーし、モデルの能力を評価するためにマルチターンインタラクティブメソッドを採用している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:49:34 GMT)
EXPLORE-Bench: Egocentric Scene Prediction with Long-Horizon Reasoning [63.0] 本研究では,多モーダルな言語モデルが,エゴセントリックな視点から行動の長期的物理的帰結を確実に推論できるかどうかを考察する。
EXPLORE-Benchは,様々なシナリオにまたがる実の1人称ビデオから算出したベンチマークである。
プロプライエタリでオープンソースのMLLMの実験では、人間にとって大きなパフォーマンスギャップが示される。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:40:05 GMT)
Spatial-TTT: Streaming Visual-based Spatial Intelligence with Test-Time Training [61.7] 我々は、テストタイムトレーニング(TTT)を用いた視覚的空間知能のストリーミングに向けた空間TTTを提案する。
我々はハイブリッドアーキテクチャを設計し、スライディング・ウインドウ・アテンションと平行に大きな時間的更新を適用し、効率的な空間ビデオ処理を行う。
実験により,空間TTTは時間軸空間理解を向上し,映像空間ベンチマークにおける最先端性能を実現することが示された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:58:58 GMT)
Slow-Fast Inference: Training-Free Inference Acceleration via Within-Sentence Support Stability [61.3] 本稿では,生成を低コストの高速ステップと時折高密度の低速ステップに分解する,学習不要な復号化フレームワークを提案する。
評価されたコンテキスト長全体にわたって、SFIは約1.6times$--14.4times$高い復号スループットを提供する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:14:48 GMT)
SciMDR: Benchmarking and Advancing Scientific Multimodal Document Reasoning [59.9] 集中セグメント上での忠実で孤立したQAペアを生成する合成合成フレームワークを提案する。
クロスモーダル理解のための大規模トレーニングデータセットであるSciMDRを構築した。
実験により、SciMDRモデルは複数の科学的QAベンチマークで大幅に改善されていることが示された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:57:52 GMT)
MedPruner: Training-Free Hierarchical Token Pruning for Efficient 3D Medical Image Understanding in Vision-Language Models [59.2] MedPrunerは、3次元医用画像の効率的な理解のためのトレーニング不要でモデルに依存しない階層的トークンプレーニングフレームワークである。
我々は、MedPrunerによって、MedGemmaのようなモデルが元の性能を維持したり、超えたりすることが可能であり、ビジュアルトークンの5%以下を維持していることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:37:00 GMT)
Test-Time Strategies for More Efficient and Accurate Agentic RAG [58.4] Retrieval-Augmented Generation (RAG) システムは複雑なマルチホップ問題に直面している。
このような手法は、以前に処理された情報の反復的な検索を含む非効率性を導入することができる。
本稿では,これらの問題を軽減するために,サーチ-R1パイプラインに対するテスト時間修正について検討する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:18:59 GMT)
Compiling Temporal Numeric Planning into Discrete PDDL+: Extended Version [58.2] 本報告では,Durative Actionを用いた時間計画からPDDL+への実践的なコンパイルについて述べる。
本研究は, 時間的問題に対する実用的妥当性を実験的に明らかにした。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:19:30 GMT)
Temporal Straightening for Latent Planning [58.1] 潜時計画のための表現学習を改善するために時間的ストレート化を導入する。
曲率の減少は、ラテント空間におけるユークリッド距離が測地線距離のより良いプロキシとなることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:49:47 GMT)
FL-MedSegBench: A Comprehensive Benchmark for Federated Learning on Medical Image Segmentation [57.9] Federated Learning (FL)は、生データを共有せずに、協調的な医療画像分析のためのプライバシー保護パラダイムを提供する。
FL-MedSegBenchは,医用画像セグメンテーションにおけるフェデレーション学習のための総合的なベンチマークである。
汎用FL(gFL)法とパーソナライズFL(pFL)法を多次元にわたって体系的に評価した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:28:41 GMT)
Real-World Point Tracking with Verifier-Guided Pseudo-Labeling [57.8] 本稿では,トラッカー予測の信頼性を学習し,擬似ラベル生成を導くメタモデルである検証器を紹介する。
提案手法は,従来の自己学習手法よりも少ないデータを必要とする一方で,最先端の結果が得られる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:40:52 GMT)
OmniStream: Mastering Perception, Reconstruction and Action in Continuous Streams [57.2] 現代の視覚エージェントは、リアルタイムストリーミング環境で動作するために、一般的な、因果的、物理的に構造化された表現を必要とする。
本稿では,多様な視覚入力を効果的に知覚し,再構成し,動作させる,統合されたストリーミング視覚バックボーンであるOmniStreamを紹介する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:59:55 GMT)
Overcoming the Modality Gap in Context-Aided Forecasting [55.0] 本稿では,時間的力学の記述と数値履歴に相補的な文脈を生成する半合成データ拡張手法を提案する。
このアプローチによって大規模なデータセット生成が可能になり、700万のコンテキスト拡張時系列ウィンドウのコーパスであるCAF-7Mが実現される。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:05:33 GMT)
RetroAgent: From Solving to Evolving via Retrospective Dual Intrinsic Feedback [54.4] RetroAgentは、エージェントが複雑なインタラクティブ環境をマスターできるオンラインRLフレームワークである。
実験の結果,RetroAgentはSOTA(State-of-the-art)の性能を達成できた。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:31:58 GMT)
SignSparK: Efficient Multilingual Sign Language Production via Sparse Keyframe Learning [54.2] 現在の手話生産(SLP)フレームワークは、まさにトレードオフに直面している。
本研究では,スペースを利用した新たなトレーニングパラダイムを提案し,人間の署名の真の基盤となる分布を捉える。
これらの離散的なアンカーから高密度な動きを予測することにより、流体の調音を確実にしながら、回帰から平均への移動を緩和する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:43:26 GMT)
Harnessing Data Asymmetry: Manifold Learning in the Finsler World [54.0] 非対称な相似性を構築し、フィンスラー空間に埋め込むフィンスラー多様体学習パイプラインを提案する。
これにより、従来のデータよりも既存の非対称な埋め込み装置の適用性が大幅に拡大される。
制御された合成および大規模実データに対して、我々の非対称パイプラインは、従来のパイプラインで失われた貴重な情報を明らかにする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 00:16:24 GMT)
From Broad Exploration to Stable Synthesis: Entropy-Guided Optimization for Autoregressive Image Generation [53.8] Reinforcement Learning (RL) によるChain-of-Thought (CoT) は、テキスト・ツー・イメージ(T2I) の生成を改善する。
本稿では,3つの重要な洞察をもたらすエントロピーに基づく系統的分析について述べる。
本稿では,不確実性により最適化予算を再配置する微調整戦略であるエントロピー誘導グループ相対政策最適化(EG-GRPO)を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:49:26 GMT)
Ada3Drift: Adaptive Training-Time Drifting for One-Step 3D Visuomotor Robotic Manipulation [53.8] 拡散に基づくビジュモータポリシーは反復的認知を通じて多モーダルな動作分布をキャプチャするが、その高い推論遅延はリアルタイムロボット制御を制限する。
Ada3Driftは,専門家のデモモードに対して予測された行動を引き付ける訓練時間ドリフト場を学習する。
Ada3Driftは、拡散ベースの代替よりも10倍の関数評価を必要としながら、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:36:53 GMT)
FlashMotion: Few-Step Controllable Video Generation with Trajectory Guidance [53.7] FlashMotionは、数ステップの軌道制御が可能なビデオ生成用に設計されたトレーニングフレームワークである。
まず,多段ビデオジェネレータにトラジェクタアダプタをトレーニングし,正確なトラジェクタ制御を行う。
次に, 生成装置を数段階に蒸留し, 映像生成を高速化する。
最後に,拡散と敵対的目的を組み合わせたハイブリッド戦略を用いて,アダプタを微調整する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:45:53 GMT)
EgoIntent: An Egocentric Step-level Benchmark for Understanding What, Why, and Next [52.9] EgoIntentは、エゴセントリックビデオのためのステップレベルの意図理解ベンチマークである。
15の異なる屋内および屋外の日常生活シナリオにまたがる3,014のステップで構成されている。
各クリップは、クエリされたステップの重要な結果の直前に切り替わる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:46:01 GMT)
TASTE-Streaming: Towards Streamable Text-Aligned Speech Tokenization and Embedding for Spoken Language Modeling [52.5] テキスト音声による音声合成は、自然とインテリジェントな音声に基づく対話を指向する。
TASTEは音声トークンを生成し、テキストのトークンと長さを一致させる。
本稿ではリアルタイム利用に適したTASTEの拡張であるTASTE-Sを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:13:48 GMT)
Chem4DLLM: 4D Multimodal LLMs for Chemical Dynamics Understanding [52.5] ChemDUは4D分子軌道を解釈可能な自然言語の説明に変換する。
ChemDUは、ガス相と触媒反応を含む基本的な動的シナリオに焦点を当てている。
Chem4DBenchは4D分子軌道と専門家による説明を組み合わせた最初のデータセットである。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:36:58 GMT)
BLooP: Zero-Shot Abstractive Summarization using Large Language Models with Bigram Lookahead Promotion [52.3] BLooPは,大規模な言語モデルに対して,ソース文書からビッグラムを生成するための簡単なトレーニング不要なデコード介入である。
BLooPは、各デコードステップでハッシュテーブルのルックアップを通じて動作し、トレーニング、微調整、モデル修正を必要としない。
BLooPは可読性を低下させることなく信頼度を著しく向上させる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 01:14:19 GMT)
CrossEarth-SAR: A SAR-Centric and Billion-Scale Geospatial Foundation Model for Domain Generalizable Semantic Segmentation [51.9] 我々は、新しい物理誘導型スパース・オブ・エキスパート(MoE)アーキテクチャに基づいて構築された、最初の10億ドル規模のSARビジョン基盤モデルであるCrossEarth-SARを紹介する。
大規模な事前トレーニングを容易にするために,公共およびプライベートなSAR画像を統合する弱く完全に教師付きデータセットであるCrossEarth-SAR-200Kを開発した。
また、8つの異なる領域ギャップをまたいだ22のサブベンチマークからなるベンチマークスイートを導入し、SAR画像上でのドメイン一般化セマンティックセマンティックセグメンテーションのための最初の統一標準を確立した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:52:35 GMT)
Surg-R1: A Hierarchical Reasoning Foundation Model for Scalable and Interpretable Surgical Decision Support with Multi-Center Clinical Validation [51.9] Surg-R1は4段階のパイプラインで訓練された階層的推論によってギャップに対処する手術的視覚言語モデルである。
提案手法では,(1)知覚的根拠,関係理解,文脈的推論に外科的解釈を分解する3段階の推論階層,(2)320,000の推論ペアを持つ最大の外科的チェーン・オブ・シークエンス・データセット,の3つの重要な貢献を紹介する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 20:26:28 GMT)
CEI-3D: Collaborative Explicit-Implicit 3D Reconstruction for Realistic and Fine-Grained Object Editing [51.7] 既存の3D編集手法は、再構成ネットワークの深い統合性のために、非現実的で未精細な結果をもたらすことが多い。
本稿では,現実的できめ細かな編集を容易にするための,編集指向の再構築パイプラインであるCEI-3Dを紹介する。
提案手法は,最新技術(SOTA)手法よりも,よりリアルできめ細かな編集結果を実現すると同時に,編集時間を短縮する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:15:11 GMT)
AI Knows What's Wrong But Cannot Fix It: Helicoid Dynamics in Frontier LLMs Under High-Stakes Decisions [51.6] ヘリコイド力学(Helicoid dynamics)は、その2番目のドメインの特定の障害状態に与えられる名前である。
システムは巧みに働き、エラーに陥り、何がうまくいかなかったかを正確に名付け、さらに高度な技術で同じパターンを再現する。
この先進的な事例シリーズは、7つの主要なシステムにまたがる体制を文書化する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:25:49 GMT)
Towards Universal Computational Aberration Correction in Photographic Cameras: A Comprehensive Benchmark Analysis [51.3] 画像復元とCACアルゴリズムを用いた実験と評価を行った。
我々は,CACタスクの難易度を客観的に評価するための新しいフレームワークとして,光劣化評価器(ODE)を導入した。
私たちは、CACのパフォーマンスに最も大きな影響を及ぼす3つの重要な要因(事前利用、ネットワークアーキテクチャ、トレーニング戦略)を特定します。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:53:02 GMT)
Multi-Step Semantic Reasoning in Generative Retrieval [50.7] 生成検索(GR)モデルは、モデルパラメータ内のコーパスを符号化し、所定のクエリに対して関連するドキュメント識別子を生成する。
既存のGRモデルは、財務報告に対するセマンティック推論など、数値的な文脈で複雑なクエリに苦しむ。
GR内の数値文脈における多段階意味推論を強化するためのフレームワークであるReasonGRを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:38:50 GMT)
OSM-based Domain Adaptation for Remote Sensing VLMs [49.9] リモートセンシングに適応した視覚言語モデル(VLM)は、ドメイン固有の画像テキストの監視に大きく依存する。
我々は、この依存関係を排除した自己完結型ドメイン適応フレームワークOSMDAを提案する。
画像テキストからテキストまでのタスクで10のベンチマークを網羅的に評価する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:08:30 GMT)
Frequentist Consistency of Prior-Data Fitted Networks for Causal Inference [49.7] 先行データ適合ネットワーク(PFN)に基づく基礎モデルは因果推論において強い経験的性能を示した。
PFNに基づく因果推定器が古典的頻繁な推定器と整合した不確実な定量化を提供するかどうかは不明である。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:14:35 GMT)
Alternating Gradient Flow Utility: A Unified Metric for Structural Pruning and Dynamic Routing in Deep Networks [49.7] 交互勾配流(Alternating Gradient Flow, AGF)に着想を得た非結合型運動パラダイムを提案する。
AGFはネットワークの構造的「運動ユーティリティ」を正確にキャプチャする
我々は、AGFに誘導されるオフライン構造探索を、ゼロコストの物理プリミティブを介してオンライン実行から切り離すハイブリッドルーティングフレームワークを設計する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:19:21 GMT)
Resource-Efficient Iterative LLM-Based NAS with Feedback Memory [49.4] ニューラルアーキテクチャサーチ(NAS)はネットワーク設計を自動化するが、従来の手法ではかなりの計算資源を必要とする。
本稿では,大規模言語モデル(LLM)を活用して,畳み込みニューラルネットワークアーキテクチャを反復的に生成し,評価し,洗練するクローズドループパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:00:22 GMT)
Toward Complex-Valued Neural Networks for Waveform Generation [49.1] 我々は、生成器と識別器がネイティブな複素算術を使用する複素数値ニューラルボコーダであるComVoを提案する。
実験により,ComVoは実数値ベースラインよりも高い品質を実現し,ブロック行列方式によりトレーニング時間を25%短縮した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:24:11 GMT)
RADAR: Closed-Loop Robotic Data Generation via Semantic Planning and Autonomous Causal Environment Reset [48.6] ロボットのためのロバスト自動データ取得(RADAR)について紹介する。
RADARは完全に自律的でクローズドループのデータ生成エンジンで、収集サイクルから人間の介入を完全に取り除きます。
シミュレーションでは、複雑な長期タスクにおいて、最大90%の成功率を達成する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:18:52 GMT)
CLASP: Defending Hybrid Large Language Models Against Hidden State Poisoning Attacks [48.5] Mambaのような状態空間モデル(SSM)はトランスフォーマーの効率的な代替品として大きな注目を集めている。
HiSPAsは、最近発見された脆弱性で、敵対する文字列を通じてSSMメモリを破損させる。
この脅威に対して防御するためのCLASPモデルを紹介します。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:29:55 GMT)
OSCBench: Benchmarking Object State Change in Text-to-Video Generation [47.7] 我々は、テキスト・ビデオ生成モデルにおいて、オブジェクト状態変化(OSC)のパフォーマンスを評価するために特別に設計されたベンチマークであるOSCBenchを紹介する。
OSCは、ジャガイモの皮剥きやレモンのスライスなどの作用によって引き起こされる物体の状態の変化を指す。
そこで我々は,MLLM(Multimodal large language model)とMLLM(Multimodal large language model)の両方を用いて,オープンソースおよびプロプライエタリなT2Vモデルの評価を行った。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:08:01 GMT)
BiGain: Unified Token Compression for Joint Generation and Classification [47.0] BiGainは、高速拡散モデルにおける分類を改善しながら、生成品質を保ちながら、トレーニング不要でプラグアンドプレイのフレームワークである。
我々の重要な洞察は周波数分離であり、これは大域的な意味論から細部を解き、生成的忠実さと識別的有用性の両方を尊重する圧縮を可能にする。
本分析は,拡散モデルにおけるトークン圧縮のための信頼性の高い設計規則として,高頻度の細部と低周波数のセマンティクスを保存したスペクトル保持が重要であることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:55:53 GMT)
HATS: Hardness-Aware Trajectory Synthesis for GUI Agents [46.5] 本稿では,ハードネスを意識した軌道合成フレームワークHATSを提案する。
我々は、硬さをアクションに関連する意味的あいまいさの度合いとして定義する。
HATSでトレーニングされたエージェントは、ベンチマークGUI環境における最先端のベースラインを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:40:59 GMT)
Hyperbolic Multiview Pretraining for Robotic Manipulation [46.2] HyperMVPは、3D対応のビジュアル事前トレーニングのための自己教師型フレームワークである。
我々は,複数種類の3D点雲からなる大規模データセットである3D-MOVを導入し,事前学習をサポートする。
本研究は,ロバストで汎用的なロボット操作ポリシーを学習するための,非ユークリッド空間における3D認識事前学習の可能性を強調した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:29:29 GMT)
From Pre-trained Models to Large Language Models: A Comprehensive Survey of AI-Driven Psychological Computing [46.0] この調査では、アプリケーションドメインではなく、計算処理パターンによってAI駆動型心理学タスクを組織化する最初の系統分類を紹介した。
本稿では,タスク固有の特徴工学から伝達学習,少数ショット適応に至るまでの計算手法について検討する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:03:27 GMT)
Explicit Block Encodings of Discrete Laplacians with Mixed Boundary Conditions [45.9] ブロック符号化は、量子回路内の行列データにアクセスする標準的な方法を提供する。
ラプラシアンの有限差分離散化の符号化を効率的にブロックするための統一的な枠組みを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:35:16 GMT)
The Latent Color Subspace: Emergent Order in High-Dimensional Chaos [45.5] FLUX.1[Dev]の変分オートエンコーダ潜在空間における色表現の解釈を開発し,Hue,Saturation,Lightnessを反映した構造を明らかにする。
FLUXに完全トレーニングフリーの手法を導入し,色を予測・明示的に制御できることを実証し,LCSの解釈を検証する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:59:48 GMT)
SaPaVe: Towards Active Perception and Manipulation in Vision-Language-Action Models for Robotics [45.4] SaPaVeは、アクティブな知覚と操作能力を共同で学習するエンドツーエンドフレームワークである。
セマンティックカメラ動作学習のための200k画像-言語-カメラ移動ペアのデータセットであるActiveViewPose-200Kを紹介する。
また、固定ビュー設定を超えてアクティブ操作を評価するための最初のベンチマークであるActiveManip-Benchも提示する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:23:46 GMT)
FlexRec: Adapting LLM-based Recommenders for Flexible Needs via Reinforcement Learning [44.6] 本研究では,LLMがユーザコンテキストと明示的な要求指示に基づいて,固定された候補集合上の置換を生成する,クローズドセットの自動回帰ランキングについて検討する。
この設定にRLを適用するには、2つの重要な障害がある: (i) シーケンスレベルの報酬は、きめ細かい訓練信号を提供するのに失敗する粗い信用代入をもたらす。
両問題に対処するポストトレーニングRLフレームワークであるFlexRecを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:14:57 GMT)
Deep Tabular Research via Continual Experience-Driven Execution [43.1] 大規模言語モデルは、しばしば非構造化テーブル上の複雑な長距離分析タスクに苦しむ。
我々は、この課題をDTR(Deep Tabular Research)として定式化し、相互依存テーブル領域に対する多段階推論を必要とする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:39:52 GMT)
Delayed Backdoor Attacks: Exploring the Temporal Dimension as a New Attack Surface in Pre-Trained Models [43.0] textittextbfDelayed Backdoor Attacks (DBA)を導入した。
我々は、UnderlineDecay(DND)に基づくUnderlineDelayed Backdoor Attacksと呼ばれる概念実証プロトタイプを実装した。
DNDには、しきい値に達するまでアクティベーションを延期する、軽量でステートフルなロジックモジュールが組み込まれている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:57:11 GMT)
Federated Learning and Unlearning for Recommendation with Personalized Data Sharing [42.3] 我々は、個人化されたユーザデータ共有を備えたレコメンデーションシステムのための学習学習フレームワークであるFedShareを提案する。
FedShareでは、サーバとのインタラクションデータの共有量をコントロールできる。
また、トレーニングされたモデルから共有されていないデータの影響を取り除くことで、データアンシェアリクエストもサポートする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:05:02 GMT)
Credibility Matters: Motivations, Characteristics, and Influence Mechanisms of Crypto Key Opinion Leaders [42.2] キーオピニオンリーダー(KOL)はWeb3の物語と小売投資行動を形成する。
不安定で高リスクな市場では、彼らの信条は、彼らのフォロワーへの影響を決定づける重要な要素となる。
我々は、収益化とコミュニティの期待とともに、心理的ニーズがどのように交渉されるかを検討する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:47:47 GMT)
Quantum simulation of Liouville equation in geometrical optics with partial transmission and reflection via Schrödingerization [42.2] 本稿では, シャープ界面における部分透過および反射を伴う幾何光学におけるリウヴィル方程式の量子シミュレーションアルゴリズムについて検討する。
1つの高次元における歪んだ位相変換により、シュルディンガー化法は線型偏微分方程式をユニタリ進化を持つシュルディンガー型方程式の系に変換する。
得られた量子アルゴリズムの詳細な構成について述べるとともに,提案手法が古典的手法よりも精度パラメータ$$で量子優位性が得られることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:47:16 GMT)
LABSHIELD: A Multimodal Benchmark for Safety-Critical Reasoning and Planning in Scientific Laboratories [41.4] MLLM(Multimodal large language model)エージェントは、ラボアシスタントから自動運転ラボオペレータへと進化する。
LABSHIELDは,危険識別と安全クリティカルな推論においてMLLMを評価するために設計された,現実的なマルチビューベンチマークである。
我々は,20のプロプライエタリモデル,9つのオープンソースモデル,および3つの具体的モデルについて,デュアルトラック評価フレームワークを用いて評価する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:38:13 GMT)
EmbTracker: Traceable Black-box Watermarking for Federated Language Models [41.4] フェデレート言語モデル(FedLM)は、生データを共有せずに協調的な学習を可能にするが、重大な脆弱性を導入する。
我々は,サーバサイドでトレーサブルなブラックボックス透かしフレームワークであるEmbTrackerを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:57:32 GMT)
Anchor Forcing: Anchor Memory and Tri-Region RoPE for Interactive Streaming Video Diffusion [40.9] 2つの設計を持つキャッシュ中心のフレームワークである textbfAnchor Forcing を提案する。
まず、アンカー誘導再キャッシュ機構は、KV状態をアンカーキャッシュに格納し、各プロンプトスイッチでアンカーからウォームスタートを再キャッシュする。
第2に、領域固有の参照元を持つ三領域RoPEは、未拘束のストリーミング指標と事前訓練されたRoPEレギュレーションとを整合させて、動きの先行をよりよく維持する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:40:06 GMT)
EndoCoT: Scaling Endogenous Chain-of-Thought Reasoning in Diffusion Models [40.4] 単一ステップのエンコーディングはChain-of-Thoughtプロセスの起動に失敗する。
デコード中の不変ガイダンスにより、DiTは複雑な命令を実行可能なデノナイジングステップに段階的に分解することができない。
MLLMの推論能力を最初に活性化する新しいフレームワークである内因性Chain-of-Thought(EndoCoT)を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:58:48 GMT)
Revisiting Model Stitching In the Foundation Model Era [40.3] 我々は、目的、データ、モダリティの混合によって異なるビジョンファウンデーションモデル(VFM)の縫い合わせを再検討する。
縫合点,縫合層ファミリー,トレーニング損失,下流タスクにまたがる体系的プロトコルを提案する。
ターゲットモデルの垂直層における単純な特徴マッチング損失により、不均一なVFMは視覚タスク間で確実に縫合可能である。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 20:33:19 GMT)
LongFlow: Efficient KV Cache Compression for Reasoning M [40.0] LongFlow は KV キャッシュ圧縮手法であり,効率の良い重要度推定法である。
LongFlowは最大11.8倍のスループット向上を実現し、80%のKVキャッシュ圧縮を実現している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:46:35 GMT)
$Ψ_0$: An Open Foundation Model Towards Universal Humanoid Loco-Manipulation [39.8] 本稿では,ヒューマノイドのロコ操作課題に対処するオープン基盤モデルを提案する。
我々の研究は、重要だが見落とされがちなデータレシピを特定します。
高品質な人間操作データに対する事前トレーニングと、ドメイン固有の実世界のヒューマノイド軌道のポストトレーニングにより、優れた性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:59:51 GMT)
SPARROW: Learning Spatial Precision and Temporal Referential Consistency in Pixel-Grounded Video MLLMs [39.7] SPARROW(SPARROW)は、2つのキーコンポーネントを通して空間的精度と時間的安定性を統一するビデオMLLMである。
SPARROWは、30,646のビデオと45,231のQ&Aペアからなる、キュレートされた参照ビデオデータセットによってサポートされている。
6つのベンチマークで一貫したゲインを提供し、RVOSでは+8.9 J&F、ビジュアルグラウンドでは+5 mIoU、GCGでは+5.4 CLAIRに改善された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:59:57 GMT)
Probabilistic Verification of Voice Anti-Spoofing Models [39.7] 本稿では,音声アンチスプーフィングモデルの堅牢性を検証するための確率的フレームワークであるPV-VASMを提案する。
誤差確率の理論的上限を導出し,様々な実験条件で検証する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:23:33 GMT)
MDS-VQA: Model-Informed Data Selection for Video Quality Assessment [39.4] MDS-VQAは、ラベルなし動画をキュレートするためのモデルインフォームドデータ選択機構である。
難易度は、ランク付け目標で訓練された故障予測器によって推定され、多様性は深いセマンティックビデオ特徴を用いて測定される。
複数のVQAデータセットとモデルにまたがる実験により、MDS-VQAは多様な、困難なサンプルを識別することを示した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:19:42 GMT)
Where Matters More Than What: Decoding-aligned KV Cache Compression via Position-aware Pseudo Queries [39.4] キーバリュー(KV)キャッシュは、効率的なLarge Language Models(LLM)推論に不可欠である。
既存のKVキャッシュ圧縮手法は、プリフィル段階でトークンの重要性を推定するために入力側注意パターンに依存している。
位置認識型擬似クエリ(DapQ)を提案し,位置認識型擬似クエリによるKVキャッシュ圧縮を近似する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:36:32 GMT)
VTEdit-Bench: A Comprehensive Benchmark for Multi-Reference Image Editing Models in Virtual Try-On [39.3] ユニバーサルなマルチ参照画像編集モデルは急速に進歩し、ビジュアル編集において強力な一般化を示している。
VTEdit-Benchは、様々な現実的なVTONシナリオにおいて、ユニバーサルなマルチ参照画像編集モデルを評価するために設計されたベンチマークである。
また、モデル一貫性、布の整合性、全体的な画質の3つの重要な側面からVTONの性能を評価する基準対応VLMベースの評価器であるVTEdit-QAを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:38:46 GMT)
Raman relaxation in Yb(III) molecular qubits: non-trivial correlations between spin-phonon coupling and molecular structure [39.1] Yb(III)の配位錯体は、4f化合物の中で最長のスピンコヒーレンス時間を示す。
スピンフォノン緩和は低温でもコヒーレンス時間に制限要因となる。
化学設計による制御は、これらのスピン量子ビットのプロトタイプを現在の限界を超えて推進する可能性がある。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:58:51 GMT)
Structure-Aware Set Transformers: Temporal and Variable-Type Attention Biases for Asynchronous Clinical Time Series [38.2] STructure-AwaRe (STAR) Set Transformer における事前の復元方法を示す。
3つのICU予測タスクにおいて、STAR-SetはAUC/APRが0.7158/0.0026(CPR)、0.9164/0.2033(死)、0.8373/0.1258(血管圧使用)を達成する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:39:02 GMT)
Prototype-Based Knowledge Guidance for Fine-Grained Structured Radiology Reporting [38.1] ProtoSRは、構造化されたレポートに自由テキスト情報を注入するためのアプローチである。
まず,80k以上のMIMIC-CXR研究をマイニングするために,命令調整LDMを用いた自動抽出パイプラインを導入する。
この知識ベースを用いて、ProtoSRは現在の画像検索ペアに関連するプロトタイプを検索し、プロトタイプ条件の残差を通じてモデル予測を増強するように訓練されている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:51:13 GMT)
CalliMaster: Mastering Page-level Chinese Calligraphy via Layout-guided Spatial Planning [37.9] ページレベルの書記合成には、グリフの精度とレイアウト構成のバランスが必要である。
制御可能な生成および編集のための統合フレームワークである textbfCalliMaster を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 22:01:19 GMT)
Strategic Navigation or Stochastic Search? How Agents and Humans Reason Over Document Collections [37.4] 我々は,800の異種PDF文書に基づいた2,250人の人間による質問のベンチマークであるMADQAを紹介する。
最適なエージェントは、人間の検索者を生の正確さで一致させることができるが、それらはほとんど異なる質問に成功し、弱い戦略計画の補足のためにブルートフォースサーチに依存している。
我々は、ブルートフォース検索からキャリブレーションされた効率的な推論への移行を支援するために、データセットと評価ハーネスをリリースする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:11:22 GMT)
Modeling Trial-and-Error Navigation With a Sequential Decision Model of Information Scent [37.1] 情報の匂いは、ユーザーが間違ったリンクを選択する理由を説明するために使われてきた。
実際には、ユーザはリンクを素早く選択しすぎ、関連するキューを見落とし、エラーが発生した時にバックトラックに依存する。
我々は,メモリ制約下での逐次決定問題としてナビゲーションをフレーミングすることで,情報香りの概念を拡張した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:05:02 GMT)
MM-CondChain: A Programmatically Verified Benchmark for Visually Grounded Deep Compositional Reasoning [37.0] MM-CondChainは、視覚的に深い合成推論のためのベンチマークである。
MM-CondChainは多層推論チェーンとして構成され、各層は非自明な構成条件を含む。
プランナーは構成条件の層間生成をオーケストレーションし、検証可能なプログラム中間表現(VPIR)は各層の状態が機械的に検証可能であることを保証する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:59:56 GMT)
VQQA: An Agentic Approach for Video Evaluation and Quality Improvement [36.3] 本稿では,VQQA (Video Quality Question Answering) について述べる。
VQQAは、従来の受動的評価指標を人間解釈可能で行動可能なフィードバックに置き換える。
本手法は, ベニラ生成に対するT2V-CompBenchの+11.57%, VBench2の+8.43%の絶対改善を実現する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:00:00 GMT)
Developing Foundation Models for Universal Segmentation from 3D Whole-Body Positron Emission Tomography [36.1] 我々はこれまでで最大かつ最も包括的なPETデータセットを構築し、モデル開発のための59831のセグメンテーションマスクと11041の3DボディPETスキャンを含む。
多様なセグメンテーションタスクに汎用的に適用可能な,革新的な基礎モデルであるSegAnyPETを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:41:28 GMT)
DOne: Decoupling Structure and Rendering for High-Fidelity Design-to-Code Generation [35.5] DOneは、要素レンダリングから構造理解を分離するエンドツーエンドのフレームワークである。
HiFi2Codeは、既存のデータセットよりもはるかに高いレイアウトの複雑さを特徴とするベンチマークである。
人間の評価は、高い視力で生産性が3倍向上することを確認する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:47:24 GMT)
Intrinsic Concept Extraction Based on Compositional Interpretability [35.0] 本稿では, 合成・解釈可能な固有概念抽出(CI-ICE)という新しいタスクを提案する。
CI-ICEタスクは、拡散ベースのテキスト・ツー・イメージモデルを活用して、単一のイメージから構成可能なオブジェクトレベルと属性レベルの概念を抽出することを目的としている。
本手法は,1つの画像から合成解釈可能な固有概念を抽出する際,優れた性能を示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:56:05 GMT)
MemRoPE: Training-Free Infinite Video Generation via Evolving Memory Tokens [34.2] 2つの共同設計コンポーネントを備えたトレーニングフリーフレームワークであるMemRoPEを紹介した。
オンラインRoPEインデックスは、回転しないキーをキャッシュし、注意時に位置埋め込みを動的に適用する。
MemRoPEは、時間的コヒーレンス、視覚的忠実度、主観的一貫性において、毎分から1時間単位で既存の手法より優れている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 23:14:16 GMT)
Derain-Agent: A Plug-and-Play Agent Framework for Rainy Image Restoration [33.8] Derain-Agentは静的な処理から動的エージェントベースの復元へ移行するプラグイン・アンド・プレイ・リファインメント・フレームワークである。
Derain-Agentは、1)各インスタンスに対して最適な修復ツールのシーケンスをインテリジェントにスケジュールするプランニングネットワーク、2)これらのツールを空間適応強度で適用する強度変調機構の2つのコア機能を備えたベースデラリニングモデルを備えている。
提案手法は, 合成および実世界のベンチマークにおいて, 最先端のデラミニングモデルの性能を継続的に向上させ, 強力な一般化を示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:38:23 GMT)
ShotVerse: Advancing Cinematic Camera Control for Text-Driven Multi-Shot Video Creation [33.4] ShotVerseは、生成を2つの協調エージェントに分離する"Plan-then-Control"フレームワークである。
我々は、不整合単発軌跡を統一されたグローバル座標系に整合させる自動マルチショットカメラキャリブレーションパイプラインを設計する。
ShotVerseは、信頼性の低いテキスト制御と労働集約的な手作業プロットのギャップを効果的に埋めることを示した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 01:27:08 GMT)
On Information Self-Locking in Reinforcement Learning for Active Reasoning of LLM agents [33.3] アクティブな推論では、大きな言語モデル(LLM)エージェントは情報自己ロックに悩まされることが多い。
アクティブ推論は,行動選択(AS)と信念追跡(BT)の2つのコア機能に分解する。
我々は,ASとBTの不足が,RLトレーニング中の情報探索を制限することを示す。
そこで本稿では, 容易かつ効果的に指向性批判を注入することで, 学習信号を再配置する手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:14:14 GMT)
OrthoEraser: Coupled-Neuron Orthogonal Projection for Concept Erasure [32.8] テキスト・ツー・イメージ(T2I)モデルは、敵対的誘導による重大な安全性のリスクに直面している。
現在の概念消去法は、選択された神経細胞を完全に抑制する際、良性属性に副次的損傷を引き起こすことが多い。
スパースオートエンコーダを利用して高分解能な特徴分散を実現するOrthoEraserを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:25:53 GMT)
Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights [32.7] この分布の体積の負の分数を占めるような専門家解の小さなモデルで示している。
パラメータ摂動をランダムにサンプリングし、上位の$K$を選択し、多数決で予測をアンサンブルする、単純で完全に並列なポストトレーニング手法を探索する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:49:30 GMT)
Understanding LLM Behavior When Encountering User-Supplied Harmful Content in Harmless Tasks [32.6] 大規模言語モデル(LLM)は、主にタスクレベル、すなわち有害なタスクの実行を拒否することに焦点を当て、人間の価値と整合するように訓練されている。
LLMは、道徳的に意識された人間と同様に、ユーザーから供給される物質中の有害な内容に遭遇するとき、進歩を拒むだろうか?
まず、ユーザが提供する有害なコンテンツとして、有害な知識データセット(つまり、OpenAIの利用ポリシーに準拠しない)を構築します。
次に、現実世界の良質なタスクをシミュレートするために、9つの無害なタスク(つまりOpenAIの利用ポリシーに準拠する)を設計します。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:29:38 GMT)
LatentGeo: Learnable Auxiliary Constructions in Latent Space for Multimodal Geometric Reasoning [32.4] 画素レベルのレンダリングや外部エグゼキュータを使わずに、連続潜時視覚表現を学習し、補助幾何学的構成を内部化するフレームワークを提案する。
LatentGeoは幾何学的推論タスク、特に補助的な構成を必要とするタスクでかなりの利益を得ている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:01:23 GMT)
Unlearning the Unpromptable: Prompt-free Instance Unlearning in Diffusion Models [32.2] 機械学習は、訓練されたモデルから特定のアウトプットを削除することを目的としている。
個人の顔や世代など、文化的または事実的に誤解された多くの望ましくないアウトプットは、しばしばテキストプロンプトによって特定できない。
本稿では,画像編集,時間経過認識重み付け,勾配手術を活用した効果的な代理型アンラーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:24:51 GMT)
Statistical and structural identifiability in representation learning [32.0] 我々は統計的識別可能性と構造的識別可能性という2つの異なる概念を定式化する。
非線形デコーダを持つモデルの表現に対して,統計的に$$-near-identifiabilityの結果が証明される。
データ生成プロセスに関する追加の仮定により、統計的識別性は構造的識別性にまで拡張される。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:19:58 GMT)
Benchmark of Benchmarks: Unpacking Influence and Code Repository Quality in LLM Safety Benchmarks [31.9] 本稿では,LLMの安全性ベンチマークにおける影響(5つの指標に基づく)とコード品質の多次元評価について述べる。
ベンチマーク論文は,非ベンチマーク論文に対する学術的影響(引用数や密度など)に有意な優位性を示すものではない。
著者の優位性は紙の影響と相関するが、著者の優位性も紙の影響もコード品質と有意な相関を示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:49:16 GMT)
Adaptation of Weakly Supervised Localization in Histopathology by Debiasing Predictions [31.8] Weakly Supervised Object Localization (WSOL) モデルは、組織像における関節分類と関心領域の局所化を可能にする。
分散シフトは、ターゲットドメインにデプロイされた場合、パフォーマンス劣化の大きな原因である。
sfdadepは、機械学習にインスパイアされた手法で、予測バイアスを特定し修正する反復的なプロセスとしてSFDAを定式化する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:34:21 GMT)
Efficient Reasoning with Balanced Thinking [31.7] 大きな推論モデル(LRM)は、顕著な推論能力を示している。
LRMは、単純な問題に対する過剰な計算ステップや過小評価に悩まされることが多い。
バランスの取れた思考による効率的な推論を実現するためのトレーニングフリーフレームワークであるReBalanceを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:48:07 GMT)
Dr. SHAP-AV: Decoding Relative Modality Contributions via Shapley Attribution in Audio-Visual Speech Recognition [31.7] 本稿では、Shapley値を用いてAVSRにおけるモダリティ貢献を分析するフレームワークであるSHAP-AVについて述べる。
以上の結果から, ノイズ下での視覚依存へのシフトが, 重度劣化下においても高いオーディオコントリビューションを維持していることが明らかとなった。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:22:27 GMT)
Deep Incentive Design with Differentiable Equilibrium Blocks [31.5] ゲームに依存しない微分可能な平衡ブロック(DEB)は、様々なインセンティブ設計問題に対処する新しいフレームワークのモジュールである。
タスク毎に統一パイプラインとDEBを使用して、単一のニューラルネットワークをトレーニングする。
このアーキテクチャは、コンテキストによってパラメータ化される問題インスタンスの完全な分散を解決する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:09:10 GMT)
HiSync: Spatio-Temporally Aligning Hand Motion from Wearable IMU and On-Robot Camera for Command Source Identification in Long-Range HRI [31.4] HiSyncは、ハンドウーンのIMU信号とロボット搭載のカメラ光の流れを合わせることで、手の動きをバインドキューとして扱う。
最大34mまでの3人のシーンでは、HiSyncは92.32%のCSI精度を達成し、以前のSOTAの48.44%を上回った。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:10:54 GMT)
The Landscape of Generative AI in Information Systems: A Synthesis of Secondary Reviews and Research Agendas [31.3] Generative AI(GenAI)は、生産性とイノベーションのための変革的なポテンシャルを提供するが、その採用は複数の相互関連課題によって制限されている。
これらの知見は社会技術レンズを通して解釈され、GenAIの技術サブシステムとゆっくりと適応する社会サブシステムとの相違が持続的に現れる。
このギャップを埋めるために、IS奨学金が影響の分析から技術的能力の共進化を積極的に形成するための研究課題について論じる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:06:25 GMT)
StyleGallery: Training-free and Semantic-aware Personalized Style Transfer from Arbitrary Image References [31.2] StyleGalleryは、スタイル転送のためのトレーニング不要でセマンティックなフレームワークである。
任意の参照イメージを入力としてサポートし、効果的にパーソナライズされたカスタマイズを可能にする。
コンテンツ構造保存、地域スタイル化、解釈可能性、パーソナライズされたカスタマイズにおいて、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:44:05 GMT)
NFPO: Stabilized Policy Optimization of Normalizing Flow for Robotic Policy Learning [31.0] マルチモーダルモデリングの能力に対するポリシーパラメータ化として,最新のネットワークアーキテクチャ,すなわち正規化フロー(NF)の採用について検討する。
本稿では, この現象の詳細な解析を行い, 単純かつ効果的に対処する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:50:15 GMT)
Doppler-induced tunable and shape-preserving frequency conversion of microwave wave packets [30.5] 位相速度の異なる前分離領域の伝播によって誘起される動的ドップラー効果を利用したマイクロ波周波数変換の新しい手法を提案する。
マイクロ波パケットの周波数シフトを500MHzと最大3.7%の4GHzで行うことができた。
これらの特徴は、異なる量子応用のためのマイクロ波パケットの高度な制御のための有望なツールとして、我々の周波数変換技術の可能性を示している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 20:34:41 GMT)
Continual Learning with Vision-Language Models via Semantic-Geometry Preservation [30.5] 事前学習された視覚言語モデル(VLM)の継続的な学習は、破滅的な忘れがちである。
現在のアプローチは、事前学習から受け継いだクロスモーダルな意味幾何学を明示的に保持することなく、新しいタスクに適応する。
連続学習のための意味幾何学保存法(SeGP-CL)を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:25:53 GMT)
Hybrid Analog-Digital Simulation of the Abelian Higgs model [30.2] 本研究では,(1+1)次元のAbelian Higgsモデルのパルスベースの3レベルハイブリッドアナログデジタルシミュレーションプロトコルを定式化し,実装する。
我々は同じモデルのゲートベース実装を実験的に実現した。
我々の実験は、現在および短期のトランペット・クォートプロセッサ上でのゲージ理論モデルの将来の研究のための有効なプラットフォームを実証する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:10:16 GMT)
Absence of Charge Offset Drift in a Transmon Qubit [29.8] 約3カ月間, 電荷オフセットをゼロに固定したタンタル系トランペットクビットを報告した。
この例外的な安定性は後に消失し、プレイ時の脆弱なメカニズムを示している。
製造時のジョセフソン接合と平行に形成された薄い超伝導層のインダクタンスに起因する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:36:53 GMT)
Enhancing Lightweight Vision Language Models through Group Competitive Learning for Socially Compliant Navigation [29.7] 社会ロボットナビゲーションには、シーンセマンティクスと人間の社会規範の洗練された統合が必要である。
軽量ビジョン言語モデル(VLM)は効率的な推論を可能にするが、しばしばより弱い推論と意思決定性能を示す。
本稿では,軽量VLMの能力向上を目的としたGCL(Group Competitive Learning)を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:16:04 GMT)
Streaming Translation and Transcription Through Speech-to-Text Causal Alignment [29.5] Hikariはポリシーフリーで、完全にエンドツーエンドのモデルで、音声からテキストへの変換とストリーミングの同時実行を行う。
Decoder Time Dilationは、自己回帰的オーバーヘッドを低減し、バランスの取れたトレーニング分布を保証するメカニズムである。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:08:48 GMT)
Taming OpenClaw: Security Analysis and Mitigation of Autonomous LLM Agent Threats [29.4] 我々はOpenClawの総合的なセキュリティ脅威分析を行う。
本研究は, 間接的プロンプト注入, スキルサプライチェーン汚染, メモリ中毒, インテントドリフトなど, エージェントのライフサイクル全体にわたる脅威について検討する。
本研究は,時間的・多段階のシステム的リスクに対処する際の,現在のポイントベース防御機構の重大な欠陥を明らかにするものである。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:24:05 GMT)
Hoi3DGen: Generating High-Quality Human-Object-Interactions in 3D [29.4] Hoi3DGenは、入力インタラクション記述を正確に追従する、人間とオブジェクトのインタラクションの高品質なテクスチャメッシュを生成するフレームワークである。
本手法は,テキストの一貫性が4~15倍,3次元モデル品質が3~7倍に向上する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:27:35 GMT)
AS-Bridge: A Bidirectional Generative Framework Bridging Next-Generation Astronomical Surveys [29.0] A(Stronomical)S(urvey)-ブリッジは、地上観測と宇宙観測の間の双方向生成モデルである。
この定式化によって,単一サーベイを超えて新たな科学的能力が得られることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:41:42 GMT)
GlyphBanana: Advancing Precise Text Rendering Through Agentic Workflows [29.0] 複雑な文字や公式を生成するためにGlyphBananaを導入します。
トレーニング不要のアプローチは、さまざまなテキスト・ツー・イメージ(T2I)モデルにシームレスに適用できます。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:53:06 GMT)
Less is More: Decoder-Free Masked Modeling for Efficient Skeleton Representation Learning [28.9] 骨格に基づく行動表現学習は、コントラスト学習(CL)からマスケッドオートエンコーダ(MAE)へと進化した
本稿では,共有エンコーダによるコントラスト学習とマスクモデリングを調和させる新しい統合フレームワークであるSLiMを提案する。
我々は、SLiMが、すべてのダウンストリームプロトコルにおける最先端のパフォーマンスを一貫して達成していることを示します。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:01:43 GMT)
RoboClaw: An Agentic Framework for Scalable Long-Horizon Robotic Tasks [28.8] データ収集、ポリシー学習、タスク実行を単一のVLM駆動コントローラで統合するエージェントロボットフレームワークであるRoboClawを提案する。
ポリシーレベルでは、RoboClaw氏はEntangled Action Pairs(EAP)を紹介している。
デプロイ中、同じエージェントが高レベルの推論を行い、学習されたポリシープリミティブを動的にオーケストレーションして長期のタスクを遂行する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:22:59 GMT)
Quantized Inference for OneRec-V2 [28.8] 我々は、FP8ポストトレーニング量子化フレームワークを開発し、最適化された推論基盤に統合する。
提案した共同最適化は、エンドツーエンドの推論遅延を49%削減し、スループットを92%向上させる。
これらの結果から,大規模言語モデルのパラダイムに向けてレコメンダシステムが進化するにつれて,大規模レコメンデーションワークロードにアルゴリズムレベルおよびシステムレベルの最適化技術が効果的に適応できることが示唆された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:13:08 GMT)
Applying Value Sensitive Design to Location-Based Services: Designing for Shared Spaces and Local Conditions [28.7] ライドシェアリング、宿泊、フードデリバリー、位置駆動型ソーシャルメディアプラットフォームといった位置情報ベースのサービス(LBS)は、物理的な空間とデジタルシステムを結び付けている。
既存の設計アプローチは、共有物理空間で発生する価値の緊張という2つの課題に対処するのに苦労する。
LBSの特徴に合わせたドメイン固有のVSDであるLocation-Aware Value Sensitive Design (LA-VSD)を紹介する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 23:49:59 GMT)
RoboRouter: Training-Free Policy Routing for Robotic Manipulation [28.5] 我々は、インテリジェントなポリシールーティングを通じて、既存のアプローチの補完的強みを活用することを提案する。
我々は、不均一なポリシーのプールを維持し、各タスクで最高のパフォーマンスのポリシーを選択することを学ぶ、トレーニング不要のフレームワークであるRoboを紹介した。
この結果から,不均一なオフザシェルフポリシを介するインテリジェントなルーティングが,より有能なロボットシステムを構築するための実用的でスケーラブルな経路を提供することが示された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:45:57 GMT)
Generalist Large Language Models for Molecular Property Prediction: Distilling Knowledge from Specialist Models [28.2] 本研究では,木に基づく専門モデルから大規模言語モデルへ補完的な知識を伝達する知識蒸留手法であるTreeKDを提案する。
提案手法は,機能的グループ機能に関する決定木を訓練し,学習した予測ルールを自然言語として言語化し,文脈学習を実現する。
TDCベンチマークによる22のADMET特性の実験により、TreeKDはLLMの性能を大幅に向上することが示された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:06:21 GMT)
A Diffeomorphism Groupoid and Algebroid Framework for Discontinuous Image Registration [27.8] 本稿では, 微分同相群群とアルゲブロイドを用いた一方向微分同相画像登録のための新しいフレームワークを提案する。
我々は、リーアルゲブロイドとその双対を含む関連する数学的構造を厳密に分析し、不連続な変形に対して最適な流れを制御するための特定のオイラー・アルノルド方程式を導出する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:09:03 GMT)
SceneAssistant: A Visual Feedback Agent for Open-Vocabulary 3D Scene Generation [27.2] オープンな3Dシーン生成用に設計されたビジュアルフィードバック駆動エージェントであるSceneAssistantを紹介する。
我々のフレームワークは、視覚言語モデルの空間的推論と計画能力とともに、現代の3次元オブジェクト生成モデルを活用する。
提案手法では,エージェントに対して,自然言語コマンドに基づいて既存のシーンを編集するように指示することができる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:55:07 GMT)
Language Generation with Replay: A Learning-Theoretic View of Model Collapse [27.2] 本稿では,言語生成の理論レンズによるモデル崩壊問題について検討する。
我々の主な貢献は、リプレイが基本的に生成を制限するときのきめ細かい学習理論的特徴である。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:44:17 GMT)
A Multi-Label Temporal Convolutional Framework for Transcription Factor Binding Characterization [27.2] 転写因子(TF)は、複雑で協調的なメカニズムを通じて遺伝子発現を制御する。
TFバインディングサイト予測の現在のほとんどのアプローチは、さまざまなTF間の相互作用を十分に分析することなく、個々のTFとバイナリ分類タスクに焦点を当てている。
本稿では,DNA TF結合部位の認識を多ラベル分類問題として検討し,公開リポジトリで検索したDNA配列上での複数のTFの信頼性予測を実現する。
以上の結果から,信頼性の高い予測性能をもたらすマルチラベル学習は,既知のTF相互作用に整合した生物学的意義のあるモチーフや共結合パターンを明らかにするとともに,TF間の新たな関係と協調性を示唆している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:42:37 GMT)
On the Reliability of Cue Conflict and Beyond [27.1] REFINED-BIASは、信頼性と解釈可能な形状・テクスチャバイアス診断のための統合データセットおよび評価フレームワークである。
REFINED-BIASは、形状とテクスチャを明確に定義して、バランスよく、人間とモデルで認識可能なキューペアを構成する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:19:56 GMT)
Adversarial Reinforcement Learning for Detecting False Data Injection Attacks in Vehicular Routing [26.8] 現代の輸送ネットワークでは、敵は偽データインジェクション攻撃を使用してルーティングアルゴリズムを操作することができる。
我々は,このような摂動を注入するアタッカーと,異常を検出するディフェンダーとの間に,戦略的にゼロサムゲームを定式化する。
このゲームのナッシュ均衡を計算するために,マルチエージェント強化学習に基づく計算手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 01:53:52 GMT)
CoMMET: To What Extent Can LLMs Perform Theory of Mind Tasks? [26.4] 心の理論 (ToM) - 自己や他人の精神状態について考える能力は、人間の社会的知性の基礎である。
LLM(Large Language Models)におけるToMを評価するための既存のベンチマークは限られている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:29:42 GMT)
Projection Guided Personalized Federated Learning for Low Dose CT Denoising [26.2] 低線量CT(LDCT)は放射線被曝を減らすが、プロトコルに依存したノイズやアーティファクトを導入する。
本稿ではプロジェクション空間における二重レベルパーソナライズを行うフレームワークであるProFedを提案する。
Mayo Clinical 2016データセットの実験では、ProFedはCNNバックボーンで42.56dB PSNR、Transformersで44.83dBを達成した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 23:55:24 GMT)
Simple Recipe Works: Vision-Language-Action Models are Natural Continual Learners with Reinforcement Learning [26.1] 低ランク適応 (LoRA) の簡単なシーケンスファインチューニング (Seq. FT) は極めて強い。
VLAモデルを用いた連続RL法としてシーケンスファインタニング(Sequential Fine-Tuning)を応用した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:22:39 GMT)
Why Attend to Everything? Focus is the Key [26.0] 学習可能なセントロイドはトークンをグループに割り当てる。
Focus は 7B スケール (2B トークン) でスクラッチから訓練され、Focus は (13.82 対 13.89 PPL) フルアテンションに打ち勝つ(30.3 対 31.4 PPL)。
LoRAとは異なり、Centroidルーティングはアライメントを保ち、命令調整されたモデルは適応後にTrathfulQAスコアを保持する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:06:04 GMT)
SoulX-LiveAct: Towards Hour-Scale Real-Time Human Animation with Neighbor Forcing and ConvKV Memory [25.6] 自己回帰(AR)拡散モデルは、ビデオ合成のような逐次生成タスクのための有望なフレームワークを提供する。
同じ雑音条件下で隣接フレームを時間的に伝播する拡散ステップ整合AR式であるNeighbor Forcingを提案する。
提案手法は,既存のAR拡散法と比較して,トレーニング収束,時間スケール生成品質,推論効率を著しく向上させる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:49:58 GMT)
Think While Watching: Online Streaming Segment-Level Memory for Multi-Turn Video Reasoning in Multimodal Large Language Models [25.5] Think While Watchingは、メモリアンコールされたストリーミングビデオ推論フレームワークだ。
マルチターンインタラクション中の連続セグメントレベルのメモリを保存する。
シングルラウンド精度はStreamingBenchで2.6%、OVO-Benchで3.79%向上している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:13:50 GMT)
Risk-Controllable Multi-View Diffusion for Driving Scenario Generation [25.4] 長期の危険状況は現実世界のデータではほとんど見られず、手動のシナリオ設計では特定が困難である。
RiskMV-DPOは、物理的にインフォームドされ、リスク制御可能なマルチビューシナリオ生成のための汎用的で体系的なパイプラインである。
実験により、リスクMV-DPOは、最先端の視覚的品質を維持しながら、多様なロングテールシナリオを自由に生成できることが示されている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:44:12 GMT)
Expert Threshold Routing for Autoregressive Language Modeling with Dynamic Computation Allocation and Load Balancing [25.3] Mixture-of-Experts (TC-MoE) は各トークンを一定数の専門家にルーティングする。
本稿では,各専門家が指数移動平均(EMA)閾値を維持するETルーティングを提案する。
ETは、TC-MoEよりも0.067低いクロスエントロピー損失を達成し、1.6$times$より少ないトークンで同じパフォーマンスに達する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:45:48 GMT)
WAT: Online Video Understanding Needs Watching Before Thinking [25.1] WAT(Watching Before Thinking)は、オンラインビデオ推論のための2段階のフレームワークである。
処理をクエリ非依存の監視ステージとクエリトリガーの思考ステージに分離する。
オンラインビデオベンチマークでは、StreamingBenchでは77.7%、OVO-Benchでは55.2%の精度で最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:42:32 GMT)
Seeing Isn't Orienting: A Cognitively Grounded Benchmark Reveals Systematic Orientation Failures in MLLMs Supplementary [24.9] 現在の視覚言語ベンチマークは、方向と位置と一般的なシーン理解とを概ね説明している。
本稿では,オブジェクト指向を主ターゲットとする階層型ベンチマークである識別指向推論インテリジェンス(DORI)を紹介する。
DORIは、現実世界および合成環境で67のオブジェクトカテゴリをカバーする、33,656の多重選択質問を提供する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 00:52:16 GMT)
A Semi-Decentralized Approach to Multiagent Control [24.8] コミュニケーションの不確実性のある環境における協調エージェントの半分散制御のための表現的フレームワークとアルゴリズムを導入する。
半分散化を部分的に観測可能なマルコフ決定プロセス(POMDP)に拡張する
結果として生じるSDec-POMDPは、分散化およびマルチエージェントのPOMDPと、いくつかの既存の明示的な通信機構を統一する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:05:20 GMT)
Evaluate-as-Action: Self-Evaluated Process Rewards for Retrieval-Augmented Agents [24.1] textscEvalAct (Evaluate-as-Action) は暗黙的な検索品質評価を明示的なアクションに変換する。
textscEvalActは、マルチホップタスクにおいて最も高い平均精度を達成する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:04:58 GMT)
TRACE: Temporal Rule-Anchored Chain-of-Evidence on Knowledge Graphs for Interpretable Stock Movement Prediction [24.0] 本稿では,ストックムーブメント予測のための知識グラフに時間的ルールアンコレート・チェーン・オブ・エビデンス(TRACE)を提示する。
S&P500ベンチマークでは、55.1%の精度、55.7%の精度、71.5%のリコール、60.8%のF1が達成されている。
利得は、(i)任意の歩行よりも経済的に意味のあるモチーフを探索することに焦点を当てたルール誘導探索と、(ii)高信頼で完全に根拠のある仮説を集約するテキスト接地統合に起因している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 22:41:53 GMT)
Enhancing Requirements Traceability Link Recovery: A Novel Approach with T-SimCSE [23.7] 本稿では,T-SimCSEと呼ばれる新しい要求トレーサビリティ・リンク・リカバリ手法を提案する。
T-SimCSEはラベル付きデータを必要とせず、幅広い適用性を持ち、性能が良いという利点がある。
我々はT-SimCSEを10の公開データセットで評価し、他のアプローチと比較した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:02:03 GMT)
Not Just the Destination, But the Journey: Reasoning Traces Causally Shape Generalization Behaviors [23.7] CoT(Chain-of-Thought)は、LLM意思決定の窓口と見なされることが多いが、最近の研究は、単にポストホックな合理化として機能することを示唆している。
これは重要なアライメントの疑問を提起する: 推論トレース因果形モデルの一般化は最終回答とは無関係か?
推論の因果的効果を分離するため,様々な推論経路を保ちながら最終有害回答を一定に保持する制御実験を設計した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:19:10 GMT)
NeuroLoRA: Context-Aware Neuromodulation for Parameter-Efficient Multi-Task Adaptation [23.0] Low-Rank Adaptation (LoRA)は、下流タスクにLarge Language Models (LLM)を適用するために欠かせないものとなっている。
最近のFlyLoRAフレームワークは、バイオインスパイアされたスパースランダムプロジェクションを利用してパラメータ干渉を緩和する。
生体神経調節に触発された新しいMixture-of-Experts(MoE)ベースのLoRAフレームワークであるNeuroLoRAを提案する。
NeuroLoRAは、シングルタスク適応、マルチタスクモデルのマージ、シーケンシャルな連続学習シナリオにおいて、FlyLoRAや他の強力なベースラインを一貫して上回る。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:57:20 GMT)
Byzantine-Robust Optimization under $(L_0, L_1)$-Smoothness [22.2] Byz-NSGDMは、ビザンツ労働者に対するロバスト性を達成する運動量を持つ正規化勾配降下法である。
我々は、Byz-NSGDMが、ロバスト性係数と勾配に比例したビザンチンバイアスフロアまで$O(K-1/4)の収束率を達成することを証明した。
アブレーション研究により、Byz-NSGDMは幅広い運動量と学習速度の選択において堅牢であることが示された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 23:09:03 GMT)
ABRA: Teleporting Fine-Tuned Knowledge Across Domains for Open-Vocabulary Object Detection [22.2] Aligned Basis Relocation for Adaptation (ABRA)は、クラス固有の検出知識をラベル付きソースドメインからターゲットドメインに転送する手法である。
ABRAはこの適応を、事前訓練された検出器の重量空間における幾何学的輸送問題として定式化している。
挑戦的な領域シフトに対する実験により、ABRAは複数の有害条件下でクラスレベルの特殊化をテレポートすることに成功した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:48:29 GMT)
Sharpness-Aware Minimization for Generalized Embedding Learning in Federated Recommendation [22.1] 我々はFedRecGEL(Generalized Embedding Learning)によるフェデレーション・レコメンデーション(Federated Recommendation)という新しいフェデレーション・レコメンデーション・フレームワークを提案する。
我々は、項目中心の視点からフェデレートされたレコメンデーション問題を再構築し、それをマルチタスク学習問題として位置づけ、トレーニング手順全体を通して一般化された埋め込みを学習することを目的として、理論分析に基づいて、一般化問題に対処するためにシャープネス対応の最小化を採用し、トレーニングプロセスの安定化とレコメンデーション性能の向上を図る。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:43:25 GMT)
Manifold-Optimal Guidance: A Unified Riemannian Control View of Diffusion Guidance [21.9] 本稿では,局所最適制御問題としてガイダンスを再構成する枠組みを提案する。
MOGはクローズドな幾何対応の更新を行い、再トレーニングを必要とせずにオフマニフォールドのドリフトを補正する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:51:32 GMT)
VisiFold: Long-Term Traffic Forecasting via Temporal Folding Graph and Node Visibility [21.9] 交通予報はインテリジェント交通システムの基盤となっている。
VisiFoldは、時間的スナップショットを単一のグラフに統合する、新しい時間的折りたたみグラフである。
VisiFoldはリソース消費を大幅に削減し、長期予測タスクにおいて既存のベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:24:38 GMT)
Articulat3D: Reconstructing Articulated Digital Twins From Monocular Videos with Geometric and Motion Constraints [21.8] Articulat3Dは、カジュアルにキャプチャされたモノクロビデオからデジタルツインを構築する新しいフレームワークである。
まず,3次元の軌跡を利用して調音運動の低次元構造を利用する動き優先初期化を提案する。
次に、物理的に可算な調音を強制する幾何学的・運動的制約(Geometric and Motion Constraints Refinement)を導入する。
実験により、Articulat3Dは、合成ベンチマークと現実世界のカジュアルにキャプチャされたモノクロビデオで最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:59:44 GMT)
Learning Pore-scale Multiphase Flow from 4D Velocimetry [21.7] 多孔質媒質中の多相流は地下エネルギーと環境技術を支える。
時間分解マイクロ速度測定から多相間隙流を直接推定する枠組みを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 23:28:20 GMT)
XSkill: Continual Learning from Experience and Skills in Multimodal Agents [21.5] XSkillはマルチモーダルエージェントの経験とスキルから継続的に学習するためのデュアルストリームフレームワークである。
XSkillは、視覚観察における知識抽出と検索の両方の基礎となる。
XSkillは、ツールのみのベースラインと学習ベースのベースラインの両方を一貫して、実質的に上回っている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:25:57 GMT)
An Evolutionary Algorithm with Probabilistic Annealing for Large-scale Sparse Multi-objective Optimization [21.5] 大規模スパース多目的最適化問題(LSMOP)は、現実世界のアプリケーションで広く用いられている。
提案アルゴリズムは探索とエクスプロイトの動的平衡を実現する。
ベンチマーク問題と実世界の応用に関する実験結果は,提案アルゴリズムが最先端の進化的アルゴリズムより優れていることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:48:49 GMT)
Real-time Rendering-based Surgical Instrument Tracking via Evolutionary Optimization [21.4] 手術器具のポーズと関節構成を共同で推定する多目的追跡パイプラインを提案する。
提案手法は,視覚フィードバック制御とオンライン手術ビデオキャリブレーションの両方に適合する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 00:30:30 GMT)
Human in the Loop for Fuzz Testing: Literature Review and the Road Ahead [21.2] 本研究では,(1)人的モニタリング,(2)人的ステアリング,(3)人間とLLMのコラボレーションにおける今後の可能性を強調する研究課題を提案する。
私たちは、AIを活用した自動化に専門家の洞察を統合する、インタラクティブでヒューマンガイドのファジィシステムへのパラダイムシフトを呼びかけています。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:39:16 GMT)
Sparking Scientific Creativity via LLM-Driven Interdisciplinary Inspiration [21.0] Idea-Catalystは、人間と大きな言語モデルの両方における創造的推論を支援するために、学際的な洞察を識別する新しいフレームワークである。
a)研究目標の定義と評価、(b)ドメインの機会と未解決課題の認識、(c)影響ポテンシャルに基づく学際的アイデアの戦略的探索。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:48:34 GMT)
Evaluating Generative Models via One-Dimensional Code Distributions [21.0] 現代の1D画像トークンライザは、セマンティック情報と知覚情報の両方を予測可能なトークン統計としてエンコードしている。
トークン空間におけるトレーニング不要分布指標であるCodebook Histogram Distance(CHD)とCode Mixture Model Score(CMMS)を紹介する。
本研究では,62の視覚形態と12の生成モデルからなる210K画像のベンチマークであるVisFormを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:19:47 GMT)
EReCu: Pseudo-label Evolution Fusion and Refinement with Multi-Cue Learning for Unsupervised Camouflage Detection [20.9] 非教師付きカモフラーゲ型物体検出(UCOD)は、対象物とその周囲の固有の類似性が高いため、依然として困難な課題である。
擬似ラベルの信頼性と特徴の忠実度を両立させる統一UCODフレームワークを提案する。
提案手法は,高精細感,堅牢な境界アライメント,高次一般化を特徴とする最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:10:32 GMT)
MANSION: Multi-floor lANguage-to-3D Scene generatIOn for loNg-horizon tasks [20.6] MANSIONは,建築規模のマルチフロア3D環境を生成するための,最初の言語駆動型フレームワークである。
マンションは、多様で人間フレンドリーなシーンを持つ、現実的でナビゲート可能な全体構造を生成する。
MansionWorldは、病院からオフィスまで、1000以上の多様な建物のデータセットです。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:22:42 GMT)
Scaling Laws for Educational AI Agents [20.5] EduClawは、エージェントスケーリング法を運用するプロファイル駆動のマルチエージェントプラットフォームである。
我々の経験的観察から, 教育エージェントのパフォーマンスは, プロファイル構造的豊かさとともに予測可能でスケールすることが示唆された。
今後の方向性として、ツールスケーリングとスキルスケーリングという2つのスケーリング軸を特定します。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:14:50 GMT)
Automating Skill Acquisition through Large-Scale Mining of Open-Source Agentic Repositories: A Framework for Multi-Agent Procedural Knowledge Extraction [20.5] 本報告では,オープンソースリポジトリのマイニングによる高品質エージェントスキルの自動獲得の枠組みについて検討する。
我々は,TheoremExplainAgentやCode2Videoなどの最先端システムから,可視化と教育能力の抽出に重点を置いている。
エージェントリポジトリからの体系的抽出と厳密なセキュリティガバナンスと多次元評価指標を組み合わせることで、手続き的知識のスケーラブルな獲得が可能になることを実証する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:10:13 GMT)
Just Use XML: Revisiting Joint Translation and Label Projection [20.2] LabelPigeonは、XMLタグによる変換とラベルのプロジェクションを共同で実行する新しいフレームワークである。
LabelPigeonは11言語でベースラインを上回り,翻訳品質を積極的に向上させる。
27言語と3つの下流タスクにまたがって、NER上では+39.9 F1まで、同等の作業よりも言語間転送が大幅に向上したと報告している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:01:47 GMT)
STONE Dataset: A Scalable Multi-Modal Surround-View 3D Traversability Dataset for Off-Road Robot Navigation [20.2] STONEはオフロードナビゲーションのための大規模マルチモーダルデータセットである。
データセットは昼夜、草原、農地、建設現場、湖など幅広い環境と環境をカバーしている。
ボクセルレベルの3次元トレーサビリティ予測のベンチマークを確立し,単一モードとマルチモードの両方で強力なベースラインを提供する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:59:57 GMT)
Rethinking the Harmonic Loss via Non-Euclidean Distance Layers [19.9] クロスエントロピー損失は、ディープニューラルネットワークのトレーニングにおいて、長年にわたって標準選択であった。
調和損失(英: harmonic loss)は、ユークリッド幾何学における距離に基づく代替である。
距離の広いスペクトルを体系的に調べることで、調和損失を抑える。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:30:12 GMT)
RAW-Domain Degradation Models for Realistic Smartphone Super-Resolution [19.9] スマートフォンのデジタルズームは、RAWセンサーイメージで動作する学習ベースの超解像(SR)モデルに依存している。
原理的かつ慎重に設計された劣化モデリングにより,実環境下でのSR性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 22:22:55 GMT)
Less Data, Faster Convergence: Goal-Driven Data Optimization for Multimodal Instruction Tuning [19.8] それぞれの候補に対して6つのサンプル記述子を計算し、異なる目標に対して1$times$トレーニングサブセットを最適化するフレームワークを提案する。
固定されたQwen3-VL-8B-インストラクショントレーニングと評価のレシピの下で、GDOはUni-10xベースラインよりもはるかに少ないトレーニングサンプルを使用する。
固定された512kサンプルのUni-10xベースラインとは対照的に、GDOはMVBenchの35.4kサンプル、VideoMMEの26.6k、MLVUの27.3k、LVBenchの34.7kサンプルの後、Uni-10x基準に達する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:54:50 GMT)
Optimizing Task Completion Time Updates Using POMDPs [19.6] アナウンスされたタスク完了時間の管理は、プロジェクト管理における基本的な制御の問題である。
タスク発表問題を部分観測可能なマルコフ決定プロセス(POMDP)として定式化する。
報奨構造は、通知エラーと更新頻度の2つのコストを捕捉し、最適な通知制御ポリシーの合成を可能にする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:03:18 GMT)
MV-SAM3D: Adaptive Multi-View Fusion for Layout-Aware 3D Generation [19.2] MV-SAM3Dは、レイアウト対応の3D生成を多視点一貫性と物理的妥当性で拡張する、トレーニング不要のフレームワークである。
注意-エントロピー重み付けと可視性重み付けという2つの適応重み付け戦略を提案する。
標準的なベンチマークと実世界のマルチオブジェクトシーンの実験は、再構築の忠実度とレイアウトの妥当性を大きく改善したことを示している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:53:35 GMT)
STAIRS-Former: Spatio-Temporal Attention with Interleaved Recursive Structure Transformer for Offline Multi-task Multi-agent Reinforcement Learning [19.2] STAIRS-Formerは、空間的および時間的階層を拡張したトランスフォーマーアーキテクチャである。
本稿では,STAIRS-Formerが従来手法より一貫して優れ,新しい最先端性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:56:20 GMT)
Towards High-Fidelity CAD Generation via LLM-Driven Program Generation and Text-Based B-Rep Primitive Grounding [19.0] 高忠実度CAD生成のための新しいテキスト・ツー・CADフレームワークであるFutureCADを提案する。
提案手法は, 実行可能なCadQueryスクリプトを生成し, テキストベースのクエリ機構を導入する。
実験の結果,FutureCADGroundは最新のCAD生成性能を実現することがわかった。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:54:29 GMT)
Learning Visuomotor Policy for Multi-Robot Laser Tag Game [18.9] 本稿では,画像を直接ロボット行動にマッピングするエンド・ツー・エンドのビジュモータポリシーを提案する。
我々は,多エージェント強化学習による高機能教員政策を訓練し,その知識を視覚に基づく学生政策に抽出する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:30:04 GMT)
Governing Evolving Memory in LLM Agents: Risks, Mechanisms, and the Stability and Safety Governed Memory (SSGM) Framework [18.5] 長期記憶は、自律型大規模言語モデル(LLM)エージェントの基礎コンポーネントとして登場した。
メモリガバナンス、セマンティックドリフト、プライバシ脆弱性に関する重要な懸念が浮上しました。
本稿では,概念的ガバナンスアーキテクチャであるSSGM(Stable and Safety-Governed Memory)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:16:52 GMT)
Personalized Federated Learning via Gaussian Generative Modeling [18.3] フェデレートラーニングは、本質的に分散されたクライアントデータに基づいて、モデルを協調的にトレーニングすることを目的としている。
ガウス生成モデルに基づくpFedGMを提案する。
pFedGMは最先端の手法に比べて優れた性能と競争性能を示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:26:03 GMT)
Fractional Rotation, Full Potential? Investigating Performance and Convergence of Partial RoPE [18.2] RoPE(Rotary Positional Embedding)は、相対的な位置情報を符号化するトランスフォーマーアーキテクチャにおいて一般的な選択肢である。
通常のRoPEキャッシュよりも最大10倍のメモリ節約を実現しています。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:05:13 GMT)
Mango-GS: Enhancing Spatio-Temporal Consistency in Dynamic Scenes Reconstruction using Multi-Frame Node-Guided 4D Gaussian Splatting [18.0] 我々は,高忠実度4D再構成のためのノード誘導フレームワークMango-GSを提案する。
時間変換器を利用して、フレームの短いウィンドウ内での動作依存をモデル化する。
Mango-GSは、最先端の再構築品質とリアルタイムレンダリング速度を達成する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:00:16 GMT)
Node-RF: Learning Generalized Continuous Space-Time Scene Dynamics with Neural ODE-based NeRFs [17.8] 既存の手法は、トレーニングシーケンスをはるかに超えていない観察境界のみをキャプチャする。
動的放射場(RFRF)を持つニューラル正規方程式(RF)
共有ダイナミクスを用いた複数の動き列のトレーニングは、目に見えない条件に対する一般化を可能にする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:48:12 GMT)
OneRanker: Unified Generation and Ranking with One Model in Industrial Advertising Recommendation [17.8] 生成とランキングのアーキテクチャレベルでの深い統合を実現するOneRankerを提案する。
我々は、粗大できめ細かな協調目標認識機構を構築する。
TencentのWeiXinチャネル広告システムへの完全な展開は、主要なビジネス指標を大幅に改善したことを示している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:31:36 GMT)
InSpatio-WorldFM: An Open-Source Real-Time Generative Frame Model [17.4] InSpatio-WorldFMは空間知能のためのオープンソースのリアルタイムフレームモデルである。
InSpatio-WorldFMはフレームベースのパラダイムを採用し、各フレームを独立に生成し、低レイテンシのリアルタイム空間推論を可能にする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:28:50 GMT)
Beyond Motion Imitation: Is Human Motion Data Alone Sufficient to Explain Gait Control and Biomechanics? [17.4] 報酬項として使用される足場相互作用測定は、人間の歩行運動学と運動学推定に影響を及ぼす。
バイオメカニクスやウェアラブルロボットの共設計といった人間関係の研究領域に模倣学習を適用する場合、運動学に基づく報酬形成が必要であることが示唆されている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:42:19 GMT)
GPrune-LLM: Generalization-Aware Structured Pruning for Large Language Models [17.3] 一般化型構造化プルーニングフレームワークであるGPrune-LLMを提案する。
まず、ニューロンを行動整合モジュールに分割し、ランキング競争をローカライズする。
アクティベーションベースのスコアリングが信頼できないモジュールに対しては、アクティベーション非依存メトリックに切り替える。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:20:37 GMT)
Scaling Machine Learning Interatomic Potentials with Mixtures of Experts [17.3] スパースアクティベーションと共有専門家が組み合わさって、パフォーマンスが大幅に向上することを示す。
また, 共有専門家が存在する場合, 非線形MoE定式化はMoLEよりも優れていた。
結果の要素ワイドMOEモデルはOMol25、OMat24、OC20Mベンチマークで最先端の精度を達成する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:59:35 GMT)
SemiTooth: a Generalizable Semi-supervised Framework for Multi-Source Tooth Segmentation [17.2] 近年,Cone-Beam Computed Tomography (CBCT) の歯構造セグメンテーションは著しい進歩を遂げている。
課題は、フルアノテートされたデータの取得困難と、マルチソースデータの取得容易性から生じる。
マルチソース歯のセグメンテーションのための一般化可能な半教師付きフレームワークであるSemiToothを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:15:48 GMT)
BrainMem: Brain-Inspired Evolving Memory for Embodied Agent Task Planning [17.1] エージェントは複雑な3D環境で長期的、ゴール指向のアクションを実行する必要がある。
本稿では,人間の認知に触発された動作,エピソード,セマンティックメモリを具備した,非トレーニング型階層型メモリシステムBrainMemを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:54:42 GMT)
Geometric Autoencoder for Diffusion Models [16.7] 遅延拡散モデルは、高解像度の視覚生成において新しい最先端技術を確立した。
本稿では,意味的識別性,忠実性,コンパクト性を統一する原理的フレームワークであるGeometric Autoencoder (GAE)を提案する。
GAEはImageNet-1Kの256倍の256$ベンチマークで、80 epochsで1.82gFID、800 epochsで1.31gFIDに達した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:00:55 GMT)
Mobile-GS: Real-time Gaussian Splatting for Mobile Devices [16.6] 3D Gaussian Splatting (3DGS)は、幅広いアプリケーションにわたる高品質なレンダリングの強力な表現として登場した。
エッジデバイス上でのガウス的スプレイティングの効率的な推論を可能にする,Mobile-GS と呼ばれる移動調整型リアルタイムガウス的スプレイティング手法を提案する。
提案するMobile-GSは,視覚的品質を保ちながら,リアルタイムレンダリングとコンパクトなモデルサイズを実現し,モバイルアプリケーションに適している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:33:04 GMT)
Red-Teaming Vision-Language-Action Models via Quality Diversity Prompt Generation for Robust Robot Policies [16.1] 本稿では,多種多様な自然言語タスク記述を選択的に識別し,チーム分けを行うQ-DIGを提案する。
Q-DIGはベースライン方式よりも多様で有意義な障害モードを見出す。
ユーザ調査の結果は、Q-DIGがベースラインのプロンプトよりも自然で人間らしいと判断されたプロンプトを生成することを強調している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 22:58:42 GMT)
Nuanced Emotion Recognition Based on a Segment-based MLLM Framework Leveraging Qwen3-Omni for AH Detection [16.0] 本稿では,時間セグメントモデリングを多モーダル大言語モデルと統合する認識フレームワークを提案する。
セグメントベースの戦略を採用し、動画を最大5秒の短いクリップに分割する。
実験結果から,提案手法の精度は85.1%であった。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:31:42 GMT)
Unleashing Video Language Models for Fine-grained HRCT Report Generation [15.8] AbSteeringは、ビデオLMをHRCTの正確なレポート生成に活用する、異常中心のフレームワークである。
以上の結果より,高ボリューム医用画像の転送性は高いことが示唆された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:34:38 GMT)
Multi-Task Reinforcement Learning for Enhanced Multimodal LLM-as-a-Judge [15.7] 本稿では,MLLM-as-a-Judge(MT-RL-Judge)のためのマルチタスク強化学習を提案する。
MT-RL-Judgeは, 判定の整合性およびヒトの嗜好との相関性において, 強いベースラインに優れることを示した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:32:38 GMT)
Beyond the Prompt in Large Language Models: Comprehension, In-Context Learning, and Chain-of-Thought [15.6] 大規模言語モデル(LLM)は、様々なタスクにまたがる卓越した習熟度を示した。
本研究は,3つの重要な疑問に対処することによって,これらの観測の基礎を掘り下げる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:08:50 GMT)
Linking Perception, Confidence and Accuracy in MLLMs [15.5] 信頼駆動強化学習(CDRL)は、感度を高め、モデルの信頼性を堅牢に調整するために、オリジナルノイズイメージペアを使用する。
信頼性を考慮したテスト時間スケーリング(CA-TTS)は、信頼性信号によって導かれる自己整合性、自己回帰、視覚的自己チェックモジュールを動的に調整する。
統合されたフレームワークは、4つのベンチマークで一貫性のある8.8%のアップで、最先端の新たな結果を確立します。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:47:42 GMT)
On-Average Stability of Multipass Preconditioned SGD and Effective Dimension [15.5] 我々は,マルチパスプレコンディショニング・グラディエント・ディフレッシュ(PSGD)の一般化能力に関する,集団リスク曲率,騒音形状,プレコンディショニングのトレードオフについて検討する。
特に、不適切に選択されたプレコンディショナーは、最適化と一般化の両方において、最適以下の有効次元依存性が得られることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:41:44 GMT)
MobileKernelBench: Can LLMs Write Efficient Kernels for Mobile Devices? [15.4] 大規模言語モデル(LLM)は、コード生成において顕著な能力を示してきたが、モバイルデバイス専用のカーネルを生成する可能性はほとんど調査されていない。
本研究では,LLMがモバイルデバイス用の効率的なカーネルを書けるか,という問題に対して,自動カーネル生成の範囲をモバイル領域に拡張する。
我々は,リポジトリ認識推論と計画・実行パラダイムを備えたマルチエージェントシステムであるMobile K ernel A gent (MoKA)を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:48:11 GMT)
CUAAudit: Meta-Evaluation of Vision-Language Models as Auditors of Autonomous Computer-Use Agents [15.1] コンピュータ・ユースエージェント(CUA)は、人間のコンピュータインタラクションにおける新しいパラダイムとして登場し、ハイレベルな自然言語命令を知覚することで、デスクトップ環境におけるタスクの自律実行を可能にしている。
既存の評価パイプラインは、静的ベンチマーク、ルールベースの成功チェック、手作業によるインスペクションに依存している。
観察可能な相互作用から直接CUAタスク完了を評価する自律監査機として視覚言語モデル(VLM)について検討する。
現状のVLMは高い精度とキャリブレーションを達成するが、全ての監査員はより複雑な性能劣化を示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:30:09 GMT)
Dense Dynamic Scene Reconstruction and Camera Pose Estimation from Multi-View Videos [14.8] 本稿では,複数のカメラから高密度ダイナミックシーン再構成とカメラポーズ推定を行う際の課題に対処する。
本稿では,タスクの頑健なカメラ追跡と深度を分離する2段階最適化フレームワークを提案する。
提案手法は, 合成および実世界のベンチマークにおいて, 最先端のフィードフォワードモデルよりも優れていた。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:31:32 GMT)
Efficient Generative Modeling with Unitary Matrix Product States Using Riemannian Optimization [14.8] 本稿では,生成モデルのための行列積状態(MPS)を体系的に研究する。
Unitary MPSは、単純かつ表現力のあるテンソルネットワークアーキテクチャであり、教師なし学習に明確な利点を提供する。
Bars-and-StripesとEMNISTデータセットの実験は、データ構造への高速な適応、安定した更新、強力なパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:05:03 GMT)
Deactivating Refusal Triggers: Understanding and Mitigating Overrefusal in Safety Alignment [14.7] 安全性アライメントは、大規模な言語モデル(LLM)が、拒絶された回答と組み合わせた有害なクエリのトレーニング後、有害な要求を拒否することを保証することを目的としている。
本稿では,安全アライメント下での過度な拒絶がどのように起こるのかを考察し,本研究から着想を得た緩和戦略を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 00:07:19 GMT)
Paper Title: LoV3D: Grounding Cognitive Prognosis Reasoning in Longitudinal 3D Brain MRI via Regional Volume Assessments [14.5] 本稿では、縦型T1強調脳MRIを読み取る3次元視覚言語モデルの訓練用パイプラインであるLoV3Dを提案する。
パイプラインは、ラベル一貫性、縦コヒーレンス、生物学的妥当性を強制することで最終的な診断を下す。
被験者レベルのADNIテストセットでは、LoV3Dは3クラスの診断精度が93.7%に達する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:40:59 GMT)
Accelerating Suffix Jailbreak attacks with Prefix-Shared KV-cache [14.5] Suffix jailbreak攻撃は、LLM(Large Language Models)をリピートする体系的な方法として機能するが、計算コストの制限に悩まされる。
本稿では,jailbreak suffix 生成に適したプラグアンドプレイ推論技術である Prefix-Shared KV Cache (PSKV) を提案する。
本手法は,サフィックスジェイルブレーキングを行う場合,多数の候補のプロンプトを評価する必要がある一方で,接頭辞と同じ標的となる有害な命令を共有できることを鍵となる観察によって動機づけたものである。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:07:20 GMT)
From Control to Foresight: Simulation as a New Paradigm for Human-Agent Collaboration [14.3] 効果的なコラボレーションには、コントロールだけでなく、前もって注意が必要だ、と私たちは主張します。
シミュレーション・イン・ザ・ループは,ユーザとエージェントがシミュレーションされた将来の軌道を探索することを可能にする対話パラダイムである。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:42:33 GMT)
SoLA: Leveraging Soft Activation Sparsity and Low-Rank Decomposition for Large Language Model Compression [14.3] 大規模言語モデル(LLM)は、様々なタスクにまたがる印象的な機能を示しているが、数十億のパラメータは、デプロイメントの課題を引き起こす。
我々は「SoLA」という,LLMのための新しい学習自由圧縮手法を提案する。
SoLAは、後トレーニングなしで、言語モデリングと下流タスクの精度の両方において顕著に改善されている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:01:11 GMT)
A Robust and Efficient Multi-Agent Reinforcement Learning Framework for Traffic Signal Control [14.1] 本稿では,ビシム交通シミュレータで検証された頑健なマルチエージェント強化学習フレームワークを提案する。
実験の結果,我々のフレームワークは標準のRLベースラインを上回る性能を示し,平均待ち時間を10%以上削減した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:02:28 GMT)
Automatic Generation of High-Performance RL Environments [13.8] 複雑な強化学習環境を高性能な実装に変換するには、これまで何ヶ月もの専門技術が必要だった。
計算コスト10ドルで意味論的に等価な高性能環境を創出する再利用可能なレシピを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:45:47 GMT)
KEPo: Knowledge Evolution Poison on Graph-based Retrieval-Augmented Generation [13.7] GraphRAG(Graph-based Retrieval-Augmented Generation)は、外部データベースから知識グラフ(KG)を構築し、LLM(Large Language Model)世代の生成スケジュールと精度を向上させる。
既存の研究は主に従来のRAGシステムへの攻撃に焦点を当てている。
本稿では,GraphRAGに特化して設計された新しい毒殺法であるKEPo(Knowledge Evolution Poison)を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:40:30 GMT)
Stable Spike: Dual Consistency Optimization via Bitwise AND Operations for Spiking Neural Networks [13.6] スパイキングニューラルネットワーク(SNN)の時間的スパイクダイナミクスは、表現を著しく損なう固有の不整合を引き起こす。
本稿では, この問題を緩和するために, 安定スパイクによる二重整合性最適化を行う。
超低遅延下でのニューロモルフィック物体認識の精度は最大8.33%向上した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:42:32 GMT)
JOPP-3D: Joint Open Vocabulary Semantic Segmentation on Point Clouds and Panoramas [13.5] 本研究では,パノラマとポイントクラウドを併用したオープン語彙セマンティックセマンティックセマンティクスフレームワークJOPP-3Dを提案する。
我々は、RGB-Dパノラマ画像を対応する接点視点画像と3次元点雲に変換し、これらのモダリティを用いて基礎的な視覚言語の特徴を抽出、調整する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:27:22 GMT)
Bridging Discrete Marks and Continuous Dynamics: Dual-Path Cross-Interaction for Marked Temporal Point Processes [13.3] NEXTPPは,イベント・グラニュラー・ニューラル・エボリューションを通じて離散的かつ連続的な表現を統一する,デュアルチャネル・フレームワークである。
NextPPは、自己アテンション機構を介して離散イベントマークをエンコードし、同時に潜時連続状態を進化させる。
融合表現はニューラルホークス過程の条件強度関数を駆動し、イテレーティブな薄型サンプリング器は将来の事象を生成する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:39:47 GMT)
RAPID: Redundancy-Aware and Compatibility-Optimal Edge-Cloud Partitioned Inference for Diverse VLA Models [13.3] 視覚言語行動(VLA)モデルは、インテリジェンスにおいて主流であるが、高い推論コストに直面している。
RAPIDと呼ばれる新しいエッジクラウド協調型(ECC)推論フレームワークを提案する。
実験では、最大1.73倍のスピードアップを達成でき、オーバーヘッドはわずか5%である。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:21:07 GMT)
Lifelong Imitation Learning with Multimodal Latent Replay and Incremental Adjustment [13.2] 逐次的タスク間での継続的なポリシー改善を可能にする、生涯にわたる模倣学習フレームワークを導入する。
我々のアプローチは、マルチモーダルな潜在空間で完全に操作することで、従来の経験リプレイとは切り離されている。
提案手法は,AUCの10-17ポイントゲインを達成し,従来の先行手法に比べて最大65%の遅延を低減した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:36:57 GMT)
ActiveFreq: Integrating Active Learning and Frequency Domain Analysis for Interactive Segmentation [13.1] 能動学習と周波数領域分析を統合した対話型セグメンテーションフレームワークであるActiveFreqを提案する。
ActiveFreqはユーザインタラクションを減らし,23.5%と12.8%の改善を達成している。
2回のクリックのような最小限の入力条件下では、ActiveFreqはISIC-2017とOAI-ZIBで85.29%、75.76%に達する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:35:05 GMT)
A Quantitative Characterization of Forgetting in Post-Training [12.9] 2モード混合抽象化(旧タスクと新タスクの表現)の下で理論的結果を開発する。
我々は、新しい分布のデータに基づいて訓練された前方KL目標が古い重量をゼロにする一方で、逆KL目標が真の目標に収束することを証明した。
本稿では,最近提案された3つのポストトレーニング手法について分析する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:00:16 GMT)
Geometry-Aware Probabilistic Circuits via Voronoi Tessellations [12.8] 確率回路(PC)は正確かつトラクタブルな推論を可能にするが、データ多様体の局所幾何学を捉える能力を制限するデータ独立混合重みを用いる。
本稿では,PCの和ノードに直接幾何学的構造を組み込む自然な方法として,Voronoi tessellation (VT)を提案する。
この不整合性を定式化し、(1)推論のための下界と上界を保証した近似推論フレームワーク、(2)正確に抽出可能な推論を復元するVTの構造条件の2つの相補的解を開発する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:56:35 GMT)
Neuro-Symbolic Generation and Validation of Memory-Aware Formal Function Specifications [12.8] メモリ操作プログラムの形式的検証は、専門家によって書かれたメモリ状態をキャプチャする正確な機能仕様に依存している。
本稿では,Cプログラムのメモリ対応形式関数仕様を自動生成するニューロシンボリックフレームワークを提案する。
我々は,メモリ対応の形式関数仕様を生成するための200Cプログラミング問題のベンチマークであるLeetCode-C-Specを紹介する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:02:26 GMT)
Global Evolutionary Steering: Refining Activation Steering Control via Cross-Layer Consistency [12.8] アクティベーションエンジニアリングは、微調整の計算コストを伴わずに、大規模言語モデル(LLM)の正確な制御を可能にする。
静的なアクティベーション差からベクトルを導出する既存の手法は、高次元ノイズや階層的なセマンティックドリフトの影響を受けやすい。
本稿では,GERステアリング(Global Evolutionary Refined Steering, GER-steer)を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:45:19 GMT)
Coarse-Guided Visual Generation via Weighted h-Transform Sampling [12.7] 粗い誘導による視覚生成は、様々な現実世界のアプリケーションに不可欠である。
近年のトレーニングフリーな研究は、事前学習した拡散モデルを活用し、サンプリングプロセス中にガイダンスを取り入れることを提案する。
所望の条件下でプロセス(サンプリングプロセスなど)を制約できるhtransformを用いて,新しいガイド付き手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:26:19 GMT)
AutoScout: Structured Optimization for Automating ML System Configuration [12.7] AutoScoutは機械学習トレーニング、微調整、推論のための汎用システムである。
ハイインパクトな設定を優先し、様々な忠実度を持つシミュレータをアンサンブルする。
高性能な設定を一貫して定義し、専門家が調整した設定よりも2.7-3.0$timesのトレーニングスピードアップを実現している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:56:12 GMT)
FBCIR: Balancing Cross-Modal Focuses in Composed Image Retrieval [12.7] 合成画像検索(CIR)は、テキストイメージの入力ペアで提示される視覚的内容と意味的な修正を共同で推論するために、マルチモーダルモデルを必要とする。
FBCIR(FBCIR)は、モデル決定に最も重要な視覚的およびテキスト的入力要素を識別するマルチモーダル焦点解釈法である。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:05:27 GMT)
Quantum photonic frequency processor on thin-film lithium niobate [12.5] 集積量子フォトニック周波数プロセッサは、高精度でコヒーレントかつプログラム可能な光子周波数制御を可能にする。
我々は、任意の1量子ビット回転ゲートと2量子制御相ゲートを含む、周波数符号化された量子論理ゲートの普遍的なセットを実現する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:50:58 GMT)
Diversity You Can Actually Measure: A Fast, Model-Free Diversity Metric for Robotics Datasets [12.5] ロボット模倣学習におけるデータセットの多様性が一般化性能に与える影響について検討する。
本稿では、エントロピーを最大化するデモのサブセットを選択するデータキュレーションアルゴリズムであるFAKTUALを紹介する。
FAKTUALは,ロボット模倣学習において,データセットの多様性を理解し,改善するための実用的なツールであることが示唆された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:54:43 GMT)
GPT4o-Receipt: A Dataset and Human Study for AI-Generated Document Forensics [12.4] GPT4o-Receiptは、GPT-4o生成レシートと、確立したデータセットからの認証レシートをペアリングした1,235レシート画像のベンチマークである。
人間のアノテータは評価器の最大の視覚的識別ギャップを示すが、バイナリ検出F1はClaude Sonnet 4より低く、Gemini 2.5 Flashより下にある。
5モデル評価では, 測定精度が不十分で検出精度が低い, 劇的な性能差とキャリブレーション差がみられた。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:05:27 GMT)
Cross-Domain Policy Optimization via Bellman Consistency and Hybrid Critics [12.4] クロスドメイン強化学習(CDRL)は、ソースドメインから収集したデータを活用することにより、RLのデータ効率を向上させることを目的としている。
その可能性にもかかわらず、RLのクロスドメイン移動は2つの基本的かつ相互に競合する課題を持つことが知られている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:54:58 GMT)
Verified Multi-Agent Orchestration: A Plan-Execute-Verify-Replan Framework for Complex Query Resolution [12.4] We present Verified Multi-Agent Orchestration (VMAO) a framework that coordinates special LLM-based agent through a verification-driven iterative loop。
専門家による25の市場調査クエリでは、VMAOは回答完全性を3.1から4.2に改善し、ソース品質はシングルエージェントベースラインに比べて2.6から4.1(5スケール)に改善した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:10:10 GMT)
BehaviorVLM: Unified Finetuning-Free Behavioral Understanding with Vision-Language Reasoning [12.3] 本稿では,ポーズ推定と行動理解のための統合されたフレームワークであるBehavimentVLMを提案する。
ポーズ推定のために,時間的,空間的,横断的な推論を統合した多段階パイプラインを提案する。
振舞いの理解のために,過剰なセグメンテッドな振舞い発見のために,深く埋め込まれたクラスタリングを統合するパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:09:20 GMT)
Stop Listening to Me! How Multi-turn Conversations Can Degrade Diagnostic Reasoning [12.2] 3つの臨床データセットから17の大規模言語モデル(LLM)を評価する。
モデル信念を測定するための"スティック・オア・スウィッチ"評価フレームワークを開発した。
実験の結果,マルチターンインタラクションが常に性能を低下させる会話税が明らかにされた。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 00:14:35 GMT)
SPEGC: Continual Test-Time Adaptation via Semantic-Prompt-Enhanced Graph Clustering for Medical Image Segmentation [12.1] Continual Test-Time Adaptation (CTTA)は、トレーニング済みのモデルが、ラベルなしドメインの継続的な変更に適応できるようにすることを目的としている。
医用画像セグメンテーションのためのセマンティック・プロンプト拡張グラフクラスタリング(SPEGC)によるCTTAを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:22:43 GMT)
R4Det: 4D Radar-Camera Fusion for High-Performance 3D Object Detection [12.1] 4Dレーダとカメラデータを融合する3Dオブジェクト検出法はいくつかの課題に直面している。
パノラマ深度融合モジュールによる深度推定品質を向上させるR4Detを提案する。
実験によると、R4DetはTJ4DRadSetおよびVoDデータセット上で最先端の3Dオブジェクト検出結果を達成する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:41:05 GMT)
From Toil to Thought: Designing for Strategic Exploration and Responsible AI in Systematic Literature Reviews [12.1] 本研究では,1)複数のデータベースにまたがる反復的クエリリファインメント管理の認知負荷が高いこと,2)近代文学の出版の圧倒的な規模とペース,3)自動化と学術機関の緊張感について考察した。
我々は、マルチデータベース統合、透過的反復探索、検証可能なAI支援スクリーニングのためのソリューションを運用する設計プローブARCを開発した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:25:08 GMT)
Demonstration of High-Fidelity Gates in a Strongly Anharmonic with Long-Coherence C-Shunt Flux Qubit [12.0] 我々はC-シャントフラックスキュービット上に高忠実な単一量子ゲートを示し、これは大きなアンハーモニック性と長い緩和時間とを同時に組み合わせている。
大きなアンハーモニック性は高いエネルギーレベルへの漏れを著しく抑制し、高速かつ正確なマイクロ波制御を可能にする。
DRAGパルスとランダム化されたベンチマークを用いて、クビットは99.9%を超えるゲート密度を達成し、ロバストで高性能な量子演算のためのC-シャントフラックスキュービットの能力を強調した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:00:08 GMT)
Reasoning Theater: Disentangling Model Beliefs from Chain-of-Thought [12.0] 推論モデルにおける行動連鎖(CoT)の証拠を提供する。
アクティベーションプロービング、早期強制応答、および2つの大きなモデルにわたるCoTモニターを比較した。
難解なマルチホップGPQA-ダイアモンド問題における真の推論とは対照的である。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:12:01 GMT)
Stage-Adaptive Reliability Modeling for Continuous Valence-Arousal Estimation [11.8] 本稿では,マルチモーダル統合におけるモダリティの信頼度を明示的に推定・校正する段階適応型信頼度モデリングフレームワークを提案する。
SAGEは、ステージ依存の情報量に応じて音声と視覚の表現を動的に再バランスする信頼性に配慮した融合機構を導入している。
Aff-Wild2ベンチマークの実験では、SAGEは既存のマルチモーダル融合法と比較して、一致相関係数のスコアを一貫して改善することを示した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:45:41 GMT)
DatedGPT: Preventing Lookahead Bias in Large Language Models with Time-Aware Pretraining [11.7] 我々は12の言語モデルのファミリーであるDatedGPTを紹介し、それぞれが約1000億の時間分割データに対してゼロからトレーニングを行った。
複雑度に基づく探索は、各モデルの知識がデータ遮断年によって効果的に束縛されていることを確認します。
私たちはインタラクティブなWebデモを提供しており、ユーザーはさまざまなカットオフ期間のモデルからの応答をクエリして比較することができます。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:04:43 GMT)
FSAG: Enhancing Human-to-Dexterous-Hand Finger-Specific Affordance Grounding via Diffusion Models [11.6] デクサラスグリップ合成は機能的意図と物理的実現性を満たす必要があるが、既存のパイプラインはしばしば洗練からセマンティックグラウンドを分離する。
本研究では、事前学習された生成拡散モデルにおいて、対象中心のセマンティックな事前情報を活用することで、ロボットの把握データ収集を回避できるデータ効率フレームワークを提案する。
この結果は,人間の実演と事前学習した生成モデルによって駆動される,スケーラブルでハードウェアに依存しないデキスタラスな操作への道のりを浮き彫りにした。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:24:53 GMT)
Safe and Stylized Trajectory Planning for Autonomous Driving via Diffusion Model [11.5] 本稿では,運転スタイルと安全制約をリアルタイムに調整する拡散型フレームワークであるSDD Plannerを提案する。
このフレームワークは、Multi-Source Style-Aware PlannerとStyle-Guided Dynamic Trajectory Generatorという2つのコアモジュールを統合している。
実験では、SDD Plannerが最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:36:12 GMT)
A Neuro-Symbolic Framework Combining Inductive and Deductive Reasoning for Autonomous Driving Planning [11.4] 本稿では、厳密な推論をエンドツーエンドのニューラルネットワークにシームレスに統合する新しいニューロシンボリック・トラジェクトリ・プランニング・フレームワークを提案する。
具体的には,Large Language Model (LLM) を用いてシーンルールを動的に抽出する。
また、高いレベルの論理的決定を学習可能な埋め込みベクトルに変換する決定条件の復号化機構も導入する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 20:09:18 GMT)
A Further Efficient Algorithm with Best-of-Both-Worlds Guarantees for $m$-Set Semi-Bandit Problem [11.3] 本稿では,$m$セット半帯域問題におけるFollow-the-Perturbed-Leader(FTPL)ポリシーの最適性と複雑性について検討する。
Fréchetと特定のパラメータを持つ分布を持つFTPLは、逆向きの設定で$O(sqrtmdT)$を最善に後悔することを示す。
また,条件付き幾何再サンプリングを$m$セットの半帯域に拡張し,FTPLの効率よく損失推定を行う。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:11:50 GMT)
CoViLLM: An Adaptive Human-Robot Collaborative Assembly Framework Using Large Language Models for Manufacturing [11.2] CoViLLMは、カスタマイズされた製品や以前は目に見えない製品の組み立てをサポートするアダプティブな人間ロボット協調組立フレームワークである。
このフレームワークは、NISTアセンブリタスクボードで、既知の、カスタマイズされた、そして新しい製品ケースに対して検証されている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:37:48 GMT)
DocSage: An Information Structuring Agent for Multi-Doc Multi-Entity Question Answering [11.2] マルチドキュメント マルチエンティティ 回答 本質的には、複数のエンティティ間の暗黙のロジックを、散在するドキュメント間で追跡するようモデルに要求する。
既存のLarge Language Models (LLM) とRetrieval-Augmented Generation (RAG) フレームワークは、限界に悩まされている。
動的スキーマ発見、構造化情報抽出、エラー保証付きスキーマ対応リレーショナル推論を統合したエンドツーエンドのエージェントフレームワークであるDocSageを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:00:09 GMT)
ProMAS: Proactive Error Forecasting for Multi-Agent Systems Using Markov Transition Dynamics [11.1] ProMAS, Proactive framework を用いた予測誤差アナルイシスのためのマルコフ遷移を提案する。
Who&Whenベンチマークでは、ProproMASは22.97%のステップレベルの精度を達成し、推論ログの27%しか処理していない。
このパフォーマンスは、MASCのようなリアクティブモニタと競合し、データのオーバーヘッドを73%削減する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:02:39 GMT)
BackdoorIDS: Zero-shot Backdoor Detection for Pretrained Vision Encoder [11.1] BackdoorIDSは、事前訓練された視覚エンコーダのためのゼロショット、推論時バックドアサンプル検出方法である。
さまざまな攻撃タイプ、データセット、モデルファミリーで、既存の防御を一貫して上回る。
BackdoorIDSは、CNN、ViT、CLIP、LLaVA-1.5など、幅広いエンコーダアーキテクチャと互換性がある。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:32:19 GMT)
CAETC: Causal Autoencoding and Treatment Conditioning for Counterfactual Estimation over Time [11.1] 本稿では,新しい手法であるCAETC(Cousal Autoencoding and Treatment Conditioning)を導入する。
本手法は,逆数表現学習に基づく自動符号化アーキテクチャを用いて,部分的に可逆かつ処理不変な表現を学習する。
合成,半合成,実世界のデータについて広範な実験を行い,CAETCが既存手法よりも優れた反実的推定を行うことを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:37:56 GMT)
Causal Representation Learning with Optimal Compression under Complex Treatments [10.9] 本稿では, 新たな多処理一般化境界を導出し, 最適バランスウェイトの理論推定器を提案する。
提案手法は,特に大規模介入シナリオにおいて,推定精度と効率において従来のモデルよりも著しく優れている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:20:18 GMT)
Systematic Security Analysis of the Iridium Satellite Radio Link [10.8] Iridium認証と無線リンクプロトコルの最初の包括的セキュリティ解析について述べる。
Iridium SIM ベースの認証機構をリバースエンジニアリングし,SIM カードから秘密鍵を抽出できることを実証する。
我々は、スプーフィングや妨害攻撃を行うカスタムソフトウェア定義無線(SDR)ツールを開発した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:29:39 GMT)
IDRL: An Individual-Aware Multimodal Depression-Related Representation Learning Framework for Depression Diagnosis [10.6] マルチモーダルうつ病検出は,複数のモーダルからの相補的情報を共同でモデル化することで診断性能を向上させることを目的としている。
これらの手法は、モーダル間不整合とうつ病と無関係な干渉の2つの制限に悩まされる。
我々は,頑健なうつ病診断のためのIDRL(Personal-Aware Multimodal Depression-related Representation Learning Framework)を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:12:46 GMT)
What do near-optimal learning rate schedules look like? [10.5] パラメータ化されたスケジュールファミリ内で最適な形状を求めるための探索手順を設計する。
この結果は、ニューラルネットワークの深層学習における、ほぼ最適スケジュール形状に関する最も包括的な結果を示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:56:05 GMT)
From Pets to Robots: MojiKit as a Data-Informed Toolkit for Affective HRI Design [10.5] MojiKitは、参考カード、動物型ロボットプロトタイプ(MomoBot)、行動制御スタジオを組み合わせたツールキットである。
私たちのコントリビューションには、ペットにインスパイアされた情緒的HRIデザインのためのデータインフォームされた構造化リソース、手動プロトタイピングで参照材料をブリッジする統合ツールキット、MojiKitがユーザに対して、よりリッチで多様な情緒的ロボットの振る舞いを体系的に作り出すための、実証的なエビデンスなどが含まれています。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:52:26 GMT)
Adapting Dijkstra for Buffers and Unlimited Transfers [10.4] 我々は、無制限の転送を伴う公共交通機関ルーティングのための古典的なジクストラに基づくアプローチを再検討する。
TD-Dijkstraの実装は、前処理中に支配的な接続をフィルタリングすることに依存している。
Transfer Aware Dijkstra (TAD)を導入し、個々のエッジではなく、旅行シーケンス全体をスキャンする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:36:50 GMT)
HomeSafe-Bench: Evaluating Vision-Language Models on Unsafe Action Detection for Embodied Agents in Household Scenarios [10.4] 世帯シナリオにおける安全でない行動検出における視覚言語モデル(VLM)の評価のためのベンチマークである textbfHomeSafe-Bench を紹介する。
また、リアルタイムの安全監視のための階層型ストリーミングアーキテクチャである、世帯安全のためのデュアルブラインドガード(HD-Guard)を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:25:44 GMT)
High-Fidelity Medical Shape Generation via Skeletal Latent Diffusion [10.2] 本稿では,高忠実度医療形状生成のための骨格潜伏拡散フレームワークを提案する。
新しい形状は潜在空間拡散モデルによって生成され、次にニューラル暗黙的復号とメッシュ抽出が続く。
MedSDFと船体データセットの実験により,提案手法がより優れた再構成と生成品質を実現することを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:57:32 GMT)
Algorithmic Consequences of Particle Filters for Sentence Processing: Amplified Garden-Paths and Digging-In Effects [10.2] 先天的な理論の下では、言語表現は、先天的なボトルネックによってのみ処理の困難に影響を及ぼす。
我々の推定では、構造的曖昧さの明示的な表現を持たない大きな言語モデルから推定される。
粒子フィルタモデルは、構造仮説が有限個の粒子集合として明示的に表される別の方法を提供することを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 00:56:42 GMT)
You Told Me to Do It: Measuring Instructional Text-induced Private Data Leakage in LLM Agents [9.7] 外部文書を自律的に処理する高特権のLLMエージェントは、タスクを自動化するためにますます信頼されている。
これらのエージェントには、最小限のセキュリティ監視で端末アクセス、制御、アウトバウンドネットワーク接続が与えられる。
emphTrusted Executor Dilemmaと呼ばれるこの信頼モデルの基本的脆弱性を測定する。
この脆弱性は、実装バグではなく、命令追従設計パラダイムの構造的な結果である。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:35:46 GMT)
QChunker: Learning Question-Aware Text Chunking for Domain RAG via Multi-Agent Debate [9.7] 検索強化生成(RAG)の有効性は,テキストチャンクの意味的整合性と情報の粒度によって制約される。
本稿では,検索・拡張から検索・検索・拡張までのRAGパラダイムを再構築したQChunkerを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:21:10 GMT)
PersonaTrace: Synthesizing Realistic Digital Footprints with LLM Agents [9.6] 大規模言語モデル (LLM) エージェントを用いて, リアルなデジタルフットプリントを合成する手法を提案する。
我々のアプローチは多様なユーザイベントのシーケンスを生成し、最終的に電子メール、メッセージ、カレンダーエントリ、リマインダーなどの対応するデジタルアーティファクトを生成します。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:02:24 GMT)
SPARK: Skeleton-Parameter Aligned Retargeting on Humanoid Robots with Kinodynamic Trajectory Optimization [9.6] 人間の動きは、汎用的なヒューマノイド制御ポリシーを訓練するための豊富な事前情報を提供するが、生のデモンストレーションはロボットの運動学や力学と相容れないことが多い。
タスク空間の人的データから自然および動的に実行可能な動作参照を生成するための2段階パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:03:14 GMT)
Conditional Unbalanced Optimal Transport Maps: An Outlier-Robust Framework for Conditional Generative Modeling [9.5] 条件不均衡最適輸送(CUOT)問題は、シスジールの発散による条件分布整合制約を緩和する。
三角形$c$-transformパラメーターを用いた外乱条件生成モデルである条件不均衡最適輸送マップ(CUOTM)を提案する。
2次元合成および画像スケールのデータセットを用いた実験により,CUOTMはより優れた出力ロバスト性および競合分布マッチング性能が得られることを示した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:34:07 GMT)
MaterialFigBENCH: benchmark dataset with figures for evaluating college-level materials science problem-solving abilities of multimodal large language models [9.3] 本稿では,大学レベルの物質科学問題を解くためのマルチモーダル大規模言語モデル(LLM)の能力を評価するためのベンチマークデータセットを提案する。
MaterialFigBenchは、位相図、応力-ひずみ曲線、アレニウスプロット、回折パターン、微構造図といった図形が正しい解を得るには不可欠である問題に焦点を当てている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 01:04:32 GMT)
Zero-Shot Cross-City Generalization in End-to-End Autonomous Driving: Self-Supervised versus Supervised Representations [9.2] エンド・ツー・エンド軌道計画におけるゼロショット・クロスシティの一般化について検討する。
自己監督型視覚表現は都市間の移動を改善する。
これらの結果は、エンド・ツー・エンドの自動運転システムを評価するために必要なテストとしてゼロショットの地理的移動を確立する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 01:19:32 GMT)
On the Possible Detectability of Image-in-Image Steganography [9.2] 本稿では,一般的なイメージインイメージステガンスキームの検出可能性について検討する。
このパラダイムでは、ペイロードは通常、カバー画像と同じ大きさのイメージであり、非常に高い埋め込み率をもたらす。
本稿では,画像のウェーブレット分解から推定した独立成分の最初の4つのモーメントに基づいて,簡易で解釈可能なステガナリシス法を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:51:56 GMT)
Optimal Discrimination of Gaussian States by Gaussian Measurements [9.2] 我々は、最大相対エントロピーを達成する最適ガウス測度が存在するかどうかを完全に決定する条件を導出する。
条件が満たされていない場合、ガウス測度によって達成できる微分可能性と、制約のない最大相対エントロピーとの間には厳密なギャップがある。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:12:33 GMT)
CRAFT: A Tendon-Driven Hand with Hybrid Hard-Soft Compliance [9.1] CRAFTハンドは、コンタクトリッチな操作のためのハイブリッドハードソフトコンプライアンスを備えた腱駆動の人型ハンドである。
構造試験では、CRAFTは同等の再現性を維持しながら強度と耐久性を向上する。
完全な設計は600ドル以下で、ビジョンベースの遠隔操作とシミュレーションの統合を備えたオープンソースとしてリリースされる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:23:19 GMT)
High-Precision 6DOF Pose Estimation via Global Phase Retrieval in Fringe Projection Profilometry for 3D Mapping [9.0] デジタル・フェクト・プロジェクション (DFP) による3次元3次元再構成は困難であるが, 大規模化は困難である。
本研究では,固定的,内在的にグローバルなプロジェクタで移動型DFPシステムを拡張する高精度ポーズ推定手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 00:07:42 GMT)
Cornserve: A Distributed Serving System for Any-to-Any Multimodal Models [8.8] 本稿では,汎用的なAny-to-Anyモデルのための分散サービスシステムであるCornserveを紹介する。
分散ランタイムは、効率的なレコード再生実行モデルを介してデータプレーンに計算する。
Cornserveは23Kの新しいPythonで構築されており、さまざまなAny-to-Anyモデルをサポートしている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:20:35 GMT)
Wasserstein Gradient Flows for Batch Bayesian Optimal Experimental Design [8.5] 設計手法の空間上で期待されるユーティリティのエントロピックな正規化は、より独特であることが示される。
i.d.族の場合、対応する流れを導出し、その長時間の挙動を得る。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:08:18 GMT)
SGG-R$^{\rm 3}$: From Next-Token Prediction to End-to-End Unbiased Scene Graph Generation [8.5] シーングラフ生成(SGG)は、オブジェクトのグラフとその関係として視覚的なシーンを構築する。
SGG-R$rm 3$は、タスク固有のチェーン・オブ・シークレット(CoT)誘導型教師付き微調整(SFT)と強化学習(RL)を統合した構造化推論フレームワークである。
2つのベンチマーク実験により、SGG-R$rm 3$は既存の手法に比べて優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:26:53 GMT)
A scalable framework for correcting public transport timetables using real-time data for accessibility analysis [8.5] 我々は、高周波車両位置データから経験的なバス時刻表を再構築するためのスケーラブルなフレームワークを開発する。
得られたデータセットは、旅行時間変動(TTV)を、微細な時間分解能と広い地理的領域で分析することができる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:59:07 GMT)
Criticality-enhanced global frequency sensing with a monitored Kerr parametric oscillator via extended Kalman filter [8.5] 我々は,センサパラメータの適応制御を補助するグローバルセンシングプロトコルを開発し,重要な強化を生かした。
本稿では,この臨界周波数推定が低検出効率で頑健であることの数値的証拠を示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:21:05 GMT)
Portfolio of Solving Strategies in CEGAR-based Object Packing and Scheduling for Sequential 3D Printing [7.8] 本稿では、現代のマルチコアパーソナルコンピュータCPUの計算能力を効果的に活用する方法を示す。
逐次3Dプリンティングのためのオブジェクト配置とスケジューリングの複雑な問題を解決する方法について述べる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:48:14 GMT)
Pano360: Perspective to Panoramic Vision with Geometric Consistency [7.7] 我々は新しいトランスフォーマーベースのアーキテクチャを採用し、すべての視点で3D認識とグローバル情報を集約する。
評価ベンチマークを確立し,ネットワークをトレーニングするために,実世界のシーンの大規模データセットを構築した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:56:14 GMT)
Diabetic Retinopathy Grading with CLIP-based Ranking-Aware Adaptation:A Comparative Study on Fundus Image [7.7] 糖尿病性網膜症重症度評価のためのCLIPベースの3つのアプローチについて検討した。
ランキング認識プロンプトモデルは、DR進行の順序構造を符号化する。
実験により、ランキングアウェアモデルが最も高い総合的精度(93.42%、AUROC 0.9845)を達成し、臨床的に致命的な重篤な症例に対する強いリコールが達成された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:49:32 GMT)
Stay in your Lane: Role Specific Queries with Overlap Suppression Loss for Dense Video Captioning [7.6] そこで本稿では,局所化とキャプションを独立したコンポーネントに分割するロール固有クエリを提案する。
次に、コントラストアライメントを用いて、対応する出力間のセマンティック一貫性を強制する。
そこで我々は,キャプションのセマンティックリッチネスをさらに高めるために,コアイベント概念をキャプチャする軽量モジュールを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:04:09 GMT)
WHED: A Wearable Hand Exoskeleton for Natural, High-Quality Demonstration Collection [7.6] We present WHED, a wearable hand-exoskeleton system designed for in-the-wild demonstration capture。
精度ピンチと全手囲いグリップにまたがる代表的把握および操作シーケンスの実現可能性を示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:35:31 GMT)
PCA-Enhanced Probabilistic U-Net for Effective Ambiguous Medical Image Segmentation [7.5] 新たなPCA拡張確率型U-Net(textbfPEP U-Net)について紹介する。
提案手法は, 後方ネットワークの次元削減のための主成分分析(PCA)を効果的に組み込んで, 冗長性を軽減し, 計算効率を向上させる。
本手法は,従来の生成モデルと比較して,分割精度と予測変数とのバランスを良好に保ちつつ,多様なセグメンテーション仮説を生成する能力を保っている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:11:21 GMT)
On the Role of Reversible Instance Normalization [7.5] 時系列予測における正規化の3つの中心的課題を同定する。
広く使われているRevIN(Reversible Instance Normalization)を再考する。
アブレーション研究を通して、その構成要素のいくつかは冗長または有害であることを示した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:40:35 GMT)
VIGIL: An Extensible System for Real-Time Detection and Mitigation of Cognitive Bias Triggers [7.5] 生成AIの台頭は、オンライン情報整合性や市民の言論にリスクが増している。
本稿では,リアルタイム認知バイアストリガ検出と緩和のためのブラウザエクステンションVIGILを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:09:20 GMT)
Shape-of-You: Fused Gromov-Wasserstein Optimal Transport for Semantic Correspondence in-the-Wild [7.5] Shape-of-Youは意味対応のための教師なし学習フレームワークである。
SPair-71kおよびAP-10kデータセット上での最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:22:03 GMT)
The Perfection Paradox: From Architect to Curator in AI-Assisted API Design [7.4] API改善提案(AIP)に基づいて訓練されたAI支援設計ワークフローを評価する産業ケーススタディを提案する。
AI生成したAPI仕様と人間によるAPI仕様を比較します。
我々はこれを「完璧パラドックス(Perfection Paradox)」と呼び、超一貫性が現実的な人間の判断の欠如を示唆している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:49:28 GMT)
Grammar of the Wave: Towards Explainable Multivariate Time Series Event Detection via Neuro-Symbolic VLM Agents [7.3] Event Logic Tree (ELT) は言語記述と物理時系列データを橋渡しする新しい知識表現フレームワークである。
本稿では,信号の可視化からプリミティブを反復的にインスタンス化し,ERT制約下で構成する,ニューロシンボリックなVLMエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:01:48 GMT)
Entropy Guided Diversification and Preference Elicitation in Agentic Recommendation Systems [7.3] 本稿では,エントロピーを統一信号として用いたあいまいなユーザクエリに対処する対話型意思決定支援システム(IDSS)を提案する。
IDSSは動的にフィルタリングされた候補製品群を維持し、エントロピーを用いてアイテム属性に対する不確実性を定量化する。
嗜好が不完全である場合、IDSSは、未解決の解決を強制するのではなく、不確実性認識とエントロピーに基づく多様化を通じて、下流のレコメンデーションに不確実性を明示的に取り入れる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 00:24:33 GMT)
A Generalized Theory of Load Distribution in Redundantly-actuated Robotic Systems [7.3] 本稿では, 冗長動作ロボットシステムによる剛体内部の荷重分布について述べる。
剛体に適用された所定のレンチに対して、操作可能なレンチ分布の操作可能な集合を完全に特徴付ける。
これは、多指グリップパー、脚ロボット、協調ロボット、その他の過剰拘束機構の力制御に重要な意味を持つ。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 01:50:44 GMT)
Efficient Quantum Simulation for Nonlinear Stochastic Differential Equations [7.2] 我々は、オルンシュタイン-ウレンベック過程(OU)によって駆動される非線形微分方程式に取り組む量子アルゴリズムを開発した。
本アルゴリズムの問合せ複雑性は, 誤差耐性で対数的に, シミュレーション時間でほぼ2次的にスケールする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:19:39 GMT)
Shadowless Projection Mapping for Tabletop Workspaces with Synthetic Aperture Projector [7.2] 投影マッピング(PM)は、ユーザーがヘッドマウントディスプレイを装着することなく拡張現実(AR)体験を可能にする。
従来のPMシステムは、ユーザーが光路を遮るとき、しばしば投射影に悩まされる。
本研究では,環境に密に配置されたプロジェクタをはるかに多く使用して,遅延のないシャドウレスプロジェクションを実現する合成開口型PMシステムを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:13:44 GMT)
DiscoRD: An Experimental Methodology for Quickly Discovering the Reliable Read Disturbance Threshold of Real DRAM Chips [7.2] 最先端DRAM読み取り外乱緩和はリード外乱閾値(RDT)に依存する
RDTは、最初の読み出し障害ビットフリップを誘導するのに必要な攻撃行のアクティベート数である。
本研究では,読解障害ビットフリップの実証モデルを開発し,読解障害による不正確な誤りの確率を評価する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 20:34:28 GMT)
Causal Matrix Completion under Multiple Treatments via Mixed Synthetic Nearest Neighbors [7.1] Synthetic Nearest Neighbors (SNN) は、欠落した非ランダム(MNAR)の下で因果完遂のための原則的ソリューションを提供する
そこで我々は,治療レベルの情報を統合する新たなエントリーワイド因果同定法であるMixed Synthetic Nearest Neighbors (MSNN)を提案する。
我々は,MSNNがSNNの有限サンプル誤差境界と正規性保証を保ちつつ,有効サンプルサイズを見積もることができることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:53:37 GMT)
LaMoGen: Language to Motion Generation Through LLM-Guided Symbolic Inference [7.1] 本稿では,ラパノテーションシステムの適応と拡張により発達した動き表現であるラパノテーション(LanLite)を紹介する。
ブラックボックスのテキストモーション埋め込みとは異なり、LabanLiteは各原子体のアクションをテキストテンプレートと組み合わせた個別のLabanシンボルとしてエンコードする。
ラモーゲン(LaMoGen, Text-to-LabanLite-to-Motion Generation)は, 大規模言語モデルにおいて, 記号的推論による動き列の生成を可能にするフレームワークである。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:58:33 GMT)
Uncovering Locally Low-dimensional Structure in Networks by Locally Optimal Spectral Embedding [7.1] 局所隣接スペクトル埋め込み(LASE)
LASEは、重み付きスペクトル分解によって局所的な低次元構造を明らかにする。
合成および実ネットワークの実験により、LASEはグローバルおよびサブグラフベースラインの局所的な再構築と可視化を改善することが示された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:10:55 GMT)
Entanglement cost of bipartite quantum channel discrimination under positive partial transpose operations [7.1] LOCCテスタの実用的なクラスを数値的に緩和する,$k$-injectable positive-partial-transpose (PPT)テスタのクラスについて検討した。
各$k$に対して、最適成功確率の半定プログラム(SDP)を導出し、効率よく計算可能なワンショット絡み込みコストを得る。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:31:33 GMT)
Security Considerations for Artificial Intelligence Agents [7.1] この記事では、フロンティアAIエージェントのセキュリティに関するPerplexityの観察とレコメンデーションについて詳述する。
ツール、コネクタ、ホスティングバウンダリ、マルチエージェントコーディネートにアタックサーフェスをマップします。
我々は,NISTのリスク管理の原則に適合した安全マルチエージェントシステム設計の指針として,標準と研究ギャップを特定した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:49:39 GMT)
Follow the Saliency: Supervised Saliency for Retrieval-augmented Dense Video Captioning [7.1] 既存のDense Video Captioning(DVC)の検索強化アプローチは、真のイベント境界に沿った正確な時間分割を達成できないことが多い。
提案フレームワークであるbfSTaRCは、ハイライト検出モジュールを通じてフレームレベルのサリエンシを監視することによって、この制限を克服する。
我々はYouCook2とViTTベンチマークで総合的な評価を行い、STaRCはほとんどのメトリクスで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:37:21 GMT)
COTONET: A custom cotton detection algorithm based on YOLO11 for stage of growth cotton boll detection [7.0] 綿の収穫は、綿のカプセルを物理的に操作し、繊維の劣化を引き起こす重要な段階である。
高品質を維持するため、収穫法は綿の本質的な特性を維持するために繊細な手作業の把握をエミュレートする必要がある。
注意機構を備えた拡張カスタムYOLO11モデルであるCOTONETを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:22:48 GMT)
Generalized Reduced-Density-Matrix Quantum Monte Carlo Gives Access to More [7.0] シミュレーション対象を分割関数から一般化還元密度行列(GRDM)に変換すると、測定の難しさが容易に解決できる。
GRDMは不等時相関器や混合状態における強弱対称性の破れを示す相関器への直接アクセスを可能にする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 01:47:27 GMT)
Can LLM Aid in Solving Constraints with Inductive Definitions? [7.0] 本研究では,構造的プロンプトを利用して大規模言語モデル(LLM)を抽出し,帰納的定義の推論に必要な補助補題を生成する。
本稿では,LLMと制約解法を相乗的に統合するニューロシンボリックアプローチを提案する。
実験結果から,本手法は最先端のSMTおよびCHCソルバを改良し,帰納的定義を含む約25%の証明タスクを解くことができることがわかった。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:30:51 GMT)
AnimeScore: A Preference-Based Dataset and Framework for Evaluating Anime-Like Speech Style [6.9] AnimeScoreは、ペアランキングによる自動アニメライクネス評価のための、好みベースのフレームワークである。
我々は、手作りの音響機能は69.3%のAUC天井に到達し、SSLベースのランキングモデルは90.8%のAUCに達することを示した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:07:42 GMT)
Enhancing Image Aesthetics with Dual-Conditioned Diffusion Models Guided by Multimodal Perception [6.9] 画像の美的改善は、画像の美的欠陥を認識し、対応する編集操作を実行することを目的としている。
画像編集モデルの最近の進歩は、制御性と柔軟性を大幅に向上させたが、画像美学の強化に苦慮している。
マルチモーダルな美的知覚を持つ拡散型生成モデルであるDual-supervised Image Aesthetic Enhancement (DIAE)を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:22:53 GMT)
Explicit Logic Channel for Validation and Enhancement of MLLMs on Zero-Shot Tasks [6.8] モデル検証,選択,拡張のための論理的明確な論理的推論を行うための明示論理チャネルを提案する。
潜在視覚言語知識をカプセル化したフロンティアMLLMは、Implicit Logic Channelとみなすことができる。
チャネル間の統合により、明示的な視覚的エビデンスを根拠として、MLLM上のゼロショットタスクのパフォーマンスがさらに向上する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:56:14 GMT)
Beyond Single-Sample: Reliable Multi-Sample Distillation for Video Understanding [6.8] R-MSD(Reliable Multi-Sample Distillation)は、教師によるサンプリングの分散をモデル化し、蒸留安定性を高めるフレームワークである。
本手法は, 対向蒸留目標に適合する品質認識信号を統合することにより, 知識伝達を最大化しながら教師の雑音を効果的にフィルタする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 01:30:37 GMT)
Taming the Adversary: Stable Minimax Deep Deterministic Policy Gradient via Fractional Objectives [6.7] 強化学習(Reinforcement Learning, RL)は、広範囲の制御および意思決定タスクにおいて顕著な成功を収めた。
RLエージェントは、予期せぬ外乱やモデルの不確実性を受ける環境に配備された場合、不安定または劣化した性能を示すことが多い。
連続制御タスクにおける障害耐性ポリシーを学習するためのフレームワークであるMMDDPG(Minimax Deep Deterministic Policy gradient)を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:15:06 GMT)
An Intent of Collaboration: On Agencies between Designers and Emerging (Intelligent) Technologies [6.7] 3人のデザイナーがGoogleのLCMと3ヶ月の旅をし、彼らの創造性にどのように影響するかを調査した。
LLMとデザイナの間には,エージェントのパワーダイナミクスが存在し,デザイナが創造的なエージェンシーを簡単に失うことができることがわかった。
我々は,新しい知的技術に携わる際に,設計者の内的世界や機関の関係者に注意を払うことを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:00:18 GMT)
A Stable Neural Statistical Dependence Estimator for Autoencoder Feature Analysis [6.7] 相互情報などの依存度測定は、オートエンコーダの分析には最適であるが、決定論的、静的、ノイズフリーなネットワークには不適当である。
我々は、入力、潜伏剤、そして測定可能な再構成に依存させる変分(ガウス)定式化を採用する。
正則密度比分解に基づく安定な神経依存推定器を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 01:37:19 GMT)
Robots that redesign themselves through kinematic self-destruction [6.7] これまで構築されたすべてのロボットは、デプロイ前に外部プロセスによって事前設計された。
我々は、その生涯に自身のデザインに積極的に参加するロボットを紹介します。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 22:50:54 GMT)
Multi-Task Anti-Causal Learning for Reconstructing Urban Events from Residents' Reports [6.6] Multi-Task Anti-Causal Learning (MTAC)は、成果や共同設立者から原因を推定するためのフレームワークである。
マンハッタンとニューアーク市から収集された実世界のデータに基づいて、MTACは強いベースラインの復元精度を一貫して向上させる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:03:49 GMT)
Unclonable Encryption in the Haar Random Oracle Model [6.5] 本研究では、Haarランダムオラクルモデルに非拘束暗号(UE)を構築する。
我々は、(再利用可能な)UEが片方向関数が存在しない世界である「マイクロ暗号」に存在するという最初の証拠を与える。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:03:51 GMT)
Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls [6.5] テスト時適応により、大きな言語モデルでは、モデルパラメータを更新することなく、推論時の振る舞いを変更できる。
マルチショットプロンプトは、多数のコンテキスト内学習例を入力空間のテスト時間更新として注入する一般的なアプローチである。
本稿では,タスクやモデルバックボーンにまたがるマルチショットのプロンプトに関する実証的研究を行い,更新の規模やオーダ,選択ポリシなどによってパフォーマンスがどう変化するか分析する。
デモは高い情報ゲインを提供するが、選択戦略に非常に敏感であり、オープンな生成タスクに対して限られた利点を示すことが多い。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 23:57:58 GMT)
Marked Pedagogies: Examining Linguistic Biases in Personalized Automated Writing Feedback [6.5] 性別,人種・民族性,学習ニーズ,達成度,モチベーションを組み込んだ素早い条件下で,600の8等級の説得エッセイを用いてフィードバックを得た。
その結果,エッセイ内容が同一であっても,学生属性を前提としたフィードバックの体系的,ステレオタイプ整合性の変化が明らかになった。
属性全体を通じて、モデルは、どのコンテンツが強調されたかだけでなく、どのように文章が判断されたか、どのように生徒が対処されたかも調整した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:44:25 GMT)
Towards Dynamic Model Identification and Gravity Compensation for the dVRK-Si Patient Side Manipulator [6.4] 最近導入されたdVRK-Siは再設計された患者側マニピュレータ (PSM) を備えており、より大きな重力負荷を備えている。
本稿では,dVRK-Si PSMのためのキネマティックおよび動的モデリングフレームワークについて述べる。
物理的dVRK-Siの実験では、重力補償が定常的な関節の誤差を68-84%減少させることが示された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:06:16 GMT)
Keys on Doormats: Exposed API Credentials on the Web [6.4] 10万ページのWebページを解析し,Web上での認証情報の公開について検討した。
以上の結果から,API認証はWeb上で広く公開されており,非常に人気で批判的なWebページも含んでいることが明らかとなった。
ウェブ固有の露光ベクトルと根本原因を特徴付け,そのほとんどはJavaScript環境に由来する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 22:31:37 GMT)
A Learning-Based Approach for Contact Detection, Localization, and Force Estimation of Continuum Manipulators With Integrated OFDR Optical Fiber [6.4] 連続マニピュレータ(CM)は、最小侵襲の手順で広く用いられている。
分散変形により、力検出、接触検出、位置決め、力推定が困難になる。
単一分散光周波数領域反射率(OFDR)ファイバを用いたCMのためのカスケード学習フレームワーク(CLF)を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:07:52 GMT)
When OpenClaw Meets Hospital: Toward an Agentic Operating System for Dynamic Clinical Workflows [6.2] 大規模言語モデル(LLM)エージェントは、推論、ツール呼び出し、永続メモリを統合することで、従来の生成モデルを拡張する。
本研究は,LLMエージェントを病院環境に適用するアーキテクチャを提案する。
この設計では、Linuxマルチユーザシステムにインスパイアされた限定実行環境、長期臨床コンテキスト管理用に設計されたページインデックスメモリアーキテクチャ、臨床タスクシーケンスのアドホックな構成を可能にするキュレートされた医療スキルライブラリの4つのコアコンポーネントが導入された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:28:25 GMT)
OpenClaw PRISM: A Zero-Fork, Defense-in-Depth Runtime Security Layer for Tool-Augmented LLM Agents [6.2] OpenClawベースのエージェントゲートウェイ用のゼロフォークランタイムセキュリティ層であるOpenClaw PRISMを提案する。
PRISMはプロセス内プラグインとオプションのサイドカーサービスを組み合わせることで、10つのライフサイクルフックに強制力を分散する。
エージェントランタイム設定におけるセキュリティの有効性,偽陽性,レイヤコントリビューション,ランタイムオーバーヘッド,運用復旧性を評価するための評価手法とベンチマークパイプラインについて概説する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:20:12 GMT)
Cross-Resolution Attention Network for High-Resolution PM2.5 Prediction [6.0] 1kmの解像度で1つの欧州の空気質マップは、2900万ピクセルで構成されており、自尊心の限界をはるかに超えている。
CRAN-PMは,局部的な高分解能PM2.5で大局的な気象データを融合するために,クロスレゾリューション・アテンションを利用するデュアルブランチ・ビジョン・トランスフォーマーである。
CRAN-PMは完全にトレーニング可能でメモリ効率が良く、単一のGPU上で1.8秒で29万画素のEuropean 2022マップを生成する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:33:03 GMT)
ZeroSense:How Vision matters in Long Context Compression [5.9] VTCの品質を忠実に評価するMLLMの能力を分離する新たな評価フレームワークを導入する。
文脈依存をなくすことで,評価結果がVTCの品質を純粋に反映していることが保証される。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:11:48 GMT)
QUARE: Multi-Agent Negotiation for Balancing Quality Attributes in Requirements Engineering [5.8] QUIRE(Quality-Aware Requirements Engineering)は、要求分析を構造化交渉として定式化するマルチエージェントフレームワークである。
確立されたREベンチマーク(MARE, iReDev)と産業用自動運転仕様の5つのケーススタディを提示する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:03:01 GMT)
A Discordance-Aware Multimodal Framework with Multi-Agent Clinical Reasoning [5.7] 変形性膝関節症は、画像で観察される構造的損傷と、痛みなどの患者に報告された症状とが一致しないことが多い。
本稿では,機械学習予測モデルとツール基底型マルチエージェント推論システムを組み合わせた不一致認識型マルチモーダルフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:07:11 GMT)
SemBench: A Universal Semantic Framework for LLM Evaluation [5.6] SemBenchは,Large Language Models(LLMs)のセマンティック能力を評価するための,合成ベンチマークを自動的に生成するフレームワークである。
我々はセムベンチを3つの言語(英語、スペイン語、バスク語)で評価する。
その結果,SemBenchから得られたランキングは,標準WiCデータセットから得られたランキングと強く相関していることがわかった。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:56:13 GMT)
Agentic AI for Embodied-enhanced Beam Prediction in Low-Altitude Economy Networks [5.6] 無線チャネルの高周波特性は、激しい伝搬損失と強いビーム指向性をもたらす。
我々はエージェントAIを用いて、mWave基地局をエンボディインテリジェンスへ変換する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 00:11:26 GMT)
Data Fusion with Distributional Equivalence Test-then-pool [5.6] 既存のテスト-then-pool (TTP) 手順は、歴史的および同時試行間の制御結果の平等性をテストすることでこの問題に対処する。
我々は,最終治療効果試験のType-Iエラー率を厳格に制御しながら,制御アームを融合する新しいTTPフレームワークを開発した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:38:35 GMT)
In the LLM era, Word Sense Induction remains unsolved [5.6] 本稿では,SemCor 由来のデータセットの評価を行い,コーパスのポリセミーと周波数分布を考察する。
言語の一部にまたがる事前学習された埋め込みとクラスタリングのアルゴリズムを評価し,LLMに基づく英語WSI手法の提案と評価を行った。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:50:45 GMT)
A Hybrid Neural-Assisted Unscented Kalman Filter for Unmanned Ground Vehicle Navigation [5.5] 本稿では,古典的状態推定基盤を現代的なディープラーニングアプローチでブリッジするハイブリッド推定フレームワークを提案する。
シミュレーションデータにのみトレーニングを施したsim2realアプローチを提案する。
適応モデルベースのアプローチと比較して、3つのデータセットで12.7%のポジション改善を実証する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:20:26 GMT)
Decision-Aware Uncertainty Evaluation of Vision-Language Model-Based Early Action Anticipation for Human-Robot Interaction [5.5] 自信過剰な早期予測は、安全でない、あるいは破壊的な相互作用を引き起こす可能性がある。
近年,短期的な行動認識のための視覚言語モデルに基づくアプローチが提案されている。
視覚言語モデルに基づく短期行動認識における不確実性の最初の体系的評価について述べる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 01:00:28 GMT)
STAMP: Selective Task-Aware Mechanism for Text Privacy [5.5] STAMPはタスク対応のテキスト民営化のための新しいフレームワークで、プライバシーとユーティリティのトレードオフを改善している。
単位球面への埋め込み方向のみを摂動する極性機構を導入し,その大きさを保存した。
SQuAD、Yelp、AG Newsのデータセットに対する実験的評価は、STAMPが正常化された極性メカニズムと組み合わせることで、優れたプライバシユーティリティトレードオフが一貫して達成されることを示している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:55:07 GMT)
Social, Legal, Ethical, Empathetic and Cultural Norm Operationalisation for AI Agents [5.3] AIエージェントは、医療や法執行機関のような高度な領域でますます使われています。
彼らの行動と社会的、法的、倫理的、共感的、文化的(SLEEC)規範を合わせることは、重要な工学的課題となっている。
本稿では,規範的要件の決定,検証,実装,検証を行うためのSLEEC-Norm運用プロセスを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:37:39 GMT)
Locating Demographic Bias at the Attention-Head Level in CLIP's Vision Encoder [5.2] 本稿では,残差ストリーム分解,ゼロショット概念活性化ベクトル,バイアス増分テキストスパン解析を組み合わせたメカニスティックフェアネス監査を提案する。
このパイプラインを、FACETベンチマークの42の専門クラスであるCLIP ViT-L-14エンコーダに適用し、性別と年齢の偏りを検査する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:54:26 GMT)
OMNIA: Closing the Loop by Leveraging LLMs for Knowledge Graph Completion [5.1] 我々は、知識グラフ補完のための構造的および意味論的推論を橋渡しする2段階のアプローチであるOMNIAを提案する。
まず、KG内の意味論的関連エンティティと関係をクラスタリングして候補三重項を生成し、その後、軽量な埋め込みフィルタリングによってそれらを検証する。
F1スコアは従来の埋め込みベースのモデルに比べて大幅に改善されている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:30:41 GMT)
Hybrid Energy-Aware Reward Shaping: A Unified Lightweight Physics-Guided Methodology for Policy Optimization [5.1] 本研究では,Hybrid Energy-Aware Reward Shaping (H-EARS)を提案する。
H-EARSは、機能的分解によってタスク固有ポテンシャルとエネルギーベースポテンシャルのバランスを保ちながら行動の規模を制限し、フルダイナミックスなしで支配的なエネルギー成分を捕獲することで線形複雑性O(n)を達成する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:47:01 GMT)
Speak or Stay Silent: Context-Aware Turn-Taking in Multi-Party Dialogue [5.0] 既存の音声AIアシスタントは、検出されたすべての一時停止を、話す招待状として扱う。
AIアシスタントが複数のスピーカーと一緒に参加するマルチパーティ設定では、一時停止は豊富であいまいである。
我々はコンテキスト対応のターンテイクを定式化し、検出されたすべての一時停止において、会話の全コンテキストを考慮し、我々のメソッドは、アシスタントが話すべきか、沈黙し続けるべきかを判断する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 00:44:20 GMT)
Generating Expressive and Customizable Evals for Timeseries Data Analysis Agents with AgentFuel [5.0] 我々は、ドメイン固有のデータとクエリータイプについて、一般的なデータ分析エージェントを6つ評価する。
AgentFuelのベンチマークは、既存のデータエージェントフレームワークの改善のための重要な方向性を明らかにする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 22:01:36 GMT)
A Two-Stage Dual-Modality Model for Facial Emotional Expression Recognition [5.0] 本稿では,第10回ABAWワークショップおよびコンペティションにおけるEXPR認識課題について論じる。
拘束されていないビデオから8つの顔の感情表現をフレームレベルで分類する必要がある。
これらの問題に対処する2段階のデュアルモーダル(音響・視覚)モデルを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:45:12 GMT)
Thermodynamics of Reinforcement Learning Curricula [5.0] 強化学習におけるカリキュラム学習の形式化には非平衡熱力学を用いる。
特に,タスク多様体上の座標として報酬パラメータを解釈することにより,RLの幾何学的枠組みを提案する。
余剰熱力学的作業を最小化することにより、最適キュリキュラは、このタスク空間の測地線に対応することを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:00:03 GMT)
Maximum Entropy Exploration Without the Rollouts [5.0] 探索問題の原則的反復は、誘導定常訪問分布のエントロピーを最大化するポリシーを見つけることである。
本研究では,訪問分布自体から報酬が導出される本質的な平均回帰を考えることにより,最適ポリシが定常エントロピーを最大化する。
この知見は、明示的なロールアウトと分布推定を避けるために、最大エントロピー探索問題の解法であるEVEに導かれる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:00:03 GMT)
Consistency-Guided Decoding with Proof-Driven Disambiguation for Three-Way Logical Question Answering [4.9] 3方向の論理的質問応答(QA)は、$True/False/Unknown$を前提セット$S$の仮説に割り当てる。
CGD-PDは1つの3ウェイ分類器を$H$と$H$の機械式の両方でクエリする軽量なテスト時間層である。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:26:16 GMT)
VisDoT : Enhancing Visual Reasoning through Human-Like Interpretation Grounding and Decomposition of Thought [4.8] 大規模視覚言語モデル(LVLM)は、チャート内の視覚的プリミティブを確実に検出し、セマンティック表現と整合させるのに苦労する。
本研究では,視覚的推論を人間的な解釈基盤によって強化するフレームワークであるVisDoTを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:47:46 GMT)
Learning Transferable Sensor Models via Language-Informed Pretraining [4.8] textbfSLIPは、さまざまなセンサー設定にまたがって一般化される言語対応表現を学習するためのオープンソースのフレームワークである。
SLIPはセンサ条件のキャプションとコントラストアライメントを統合し、識別的理解と生成的推論の両方を容易にする。
11データセットにわたって、SLIPはゼロショット転送、信号キャプション、質問応答において優れた性能を示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:59:13 GMT)
Team Diversity Promotes Software Fairness: An Experiment on Fairness-Aware Requirements Prioritization [4.7] 本研究では,ソフトウェアチームの多様性が要求優先順位付け時の公正意識行動にどのように影響するかを検討する。
チームの多様性は、要求分析中の公平性の問題の識別と解釈を強化することができる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:38:18 GMT)
DRIFT: Dual-Representation Inter-Fusion Transformer for Automated Driving Perception with 4D Radar Point Clouds [4.7] DRIFTは、ローカルコンテキストとグローバルコンテキストの両方をキャプチャして融合するモデルである。
広く使われているView-of-Delft(VoD)データセットとプロプライエタリな内部データセットで評価されている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:06:36 GMT)
Diving into booklet wormholes [4.7] GHZ状態の対称性は、特別なキリングベクトル場を許容するためにバルクを必要とすることを示す。
境界変形によるブックレットワームホールの描画方法を示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:35:56 GMT)
Flight through Narrow Gaps with Morphing-Wing Drones [4.7] 飛行中に一時的に翼を掃除できるモルヒネ翼ドローンを開発した。
この操作は、低飛行速度での空隙通過中に突然の昇降損失によって制御上の問題を引き起こす。
空隙通過時の揚力損失をドローンが補償できることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:27:33 GMT)
Highly Autonomous Cyber-Capable Agents: Anticipating Capabilities, Tactics, and Strategic Implications [4.7] 本報告では,「高度自律型サイバー対応エージェント(HACCA)」のコンセプトを紹介する。
HACCAは、多段階のサイバーキャンペーンを自律的に実施できるAIシステムである。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:30:47 GMT)
LLM-Assisted Causal Structure Disambiguation and Factor Extraction for Legal Judgment Prediction [4.7] 本稿では,大規模言語モデルと統計的因果探索を融合した拡張因果推論フレームワークを提案する。
提案手法は,予測精度とロバスト性の両方において,最先端のベースラインを著しく上回る。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:14:16 GMT)
Shattering the Shortcut: A Topology-Regularized Benchmark for Multi-hop Medical Reasoning in LLMs [4.6] 我々は,深部診断推論を厳格に評価するために設計された10,558のマルチホップ臨床質問のベンチマークであるShatterMed-QAを紹介した。
我々のフレームワークは、新しい$k$-Shatteringアルゴリズムを用いて、トポロジ規則化された医療知識グラフを構築する。
21個のLLMの総合的な評価は、我々のマルチホップタスクにおいて大きな性能劣化を示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:19:54 GMT)
Back-Action-Evading Measurements and Quantum Non-Demolition Variables via Linear Systems Engineering [4.6] 線形量子系におけるバックアクション回避(BAE)測定と量子非破壊(QND)変数を実現するための枠組みを確立する。
キー条件は、実あるいは虚数結合作用素を持つ純粋に虚数的ハミルトニアンであり、共役可観測物のBAE測定を可能にする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:49:18 GMT)
Enhancement of signal-to-noise ratio at a high-order exceptional point of coherent perfect absorption [4.6] 受動キャビティ・マグノニクス系におけるコヒーレント完全吸収(CPA EP3)の3次EPにより,磁界センサにおける信号-雑音比(SNR)の12倍の増大を報告した。
このことは,従来の高次EPセンサのノイズ分散を回避できるだけでなく,受動非エルミタン系において,CPAとEPを併用してSNRの強化を図るための一般的な戦略を提供することを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:57:10 GMT)
Leveraging Wikidata for Geographically Informed Sociocultural Bias Dataset Creation: Application to Latin America [4.6] 大規模言語モデル(LLM)は、グローバルノースのデータに基づいて訓練され、他の文化に対する偏見的行動を示す。
本稿では、ウィキペディアの内容、ウィキデータ知識グラフの構造、社会科学からのエキスパート知識を活用して、質問/回答ペアのデータセットを作成することを提案する。
我々は、26k以上のウィキペディア記事から抽出された26k以上の質問と関連する回答からなるLatamQAデータベースを作成し、スペイン語とポルトガル語で多重選択質問(MCQ)に変換し、その後、英語に翻訳した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:13:39 GMT)
Exponential-Family Membership Inference: From LiRA and RMIA to BaVarIA [4.6] メンバシップ推論攻撃(MIA)は、マシンラーニングモデルのプライバシを監査するための標準ツールになりつつある。
これら3つは指数族対数類似比フレームワークの例であり,分布の仮定でのみ異なることを示す。
本研究では、閾値に基づくパラメータスイッチを共役正規-逆ガンマ前駆体に置き換えるベイズ分散推論攻撃であるBaVarIAを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:00:19 GMT)
To Words and Beyond: Probing Large Language Models for Sentence-Level Psycholinguistic Norms of Memorability and Reading Times [4.5] 大規模言語モデルは人間の判断と相関する心理言語学の規範を推定する。
我々はこの手法を文の暗記性や読解時間の未検討の特徴に拡張する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:10:27 GMT)
The Future of Feedback: How Can AI Help Transform Feedback to Be More Engaging, Effective, and Scalable? [4.5] 生成AIは、リアルタイムで自動化されたフィードバックのスケーラブルな生産を可能にする。
報告は、教育心理学、コンピュータ科学、科学教育、学習科学から50人の学者の視点を合成する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:26:58 GMT)
Towards Robust Speech Deepfake Detection via Human-Inspired Reasoning [4.5] 本稿では,Large Audio Language Models (LALM) の長所とチェーン・オブ・シント推論を組み合わせた新しいSDDフレームワークであるHIR-SDDを提案する。
実験により,提案手法の有効性と予測に妥当な正当性を与える能力の両方が示された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:21:35 GMT)
From Pen Strokes to Sleep States: Detecting Low-Recovery Days Using Sigma-Lognormal Handwriting Features [4.5] 本研究は,オンライン筆跡力学から睡眠関連回復状態の日内変動を推定できるかどうかを考察する。
13人の大学生を対象にした28日間の研究で、毎日3回手書きが記録された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:59:09 GMT)
LLM-Augmented Therapy Normalization and Aspect-Based Sentiment Analysis for Treatment-Resistant Depression on Reddit [4.4] 治療抵抗性うつ病(英: Treatment-resistant depression, TRD)は、患者が複数の適切な治療を受けたにもかかわらず寛解を達成できない重度のうつ病である。
われわれは、2010年から2025年までの28のメンタルヘルス関連サブレディットのうち3,480人の加入者からのRTDを明示的に参照するRedditの投稿5,059件のコーパスをキュレートした。
このうち3,839件は少なくとも1つの医薬品に言及しており、レキシコンをベースとしたブランド名正規化後、総称医薬品81件について23,399件が報告されている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:03:43 GMT)
Noise-aware few-shot learning through bi-directional multi-view prompt alignment [4.3] 本稿では,双方向多視点プロンプトアライメントによる雑音認識による複数ショット学習のためのフレームワークを提案する。
堅牢なプロンプト学習には、グローバルマッチングから地域対応アライメントに移行する必要があります。
合成および実世界のノイズのあるベンチマークの実験は、NA-MVPが一貫して最先端のベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:17:28 GMT)
Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors [4.3] 変分オートエンコーダ(VAE)は、しばしば後部崩壊に悩まされる。
アーキテクチャ上の制約による崩壊を避ける代わりに、完全に崩壊する可能性を排除します。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:50:40 GMT)
TopoBench: Benchmarking LLMs on Hard Topological Reasoning [4.3] トポロジカルグリッドパズルを解くには、接続性、ループ閉包、領域対称性といった大域的空間不変量に対する推論が必要である。
TopoBenchは3つの難易度にまたがる6つのパズルファミリーのベンチマークである。
私たちは、フロンティアモデルでさえハードインスタンスの4分の1以下を解決し、2つの家族がほとんど解決していないことに気付きました。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:37:21 GMT)
UniHetCO: A Unified Heterogeneous Representation for Multi-Problem Learning in Unsupervised Neural Combinatorial Optimization [4.2] 教師なしニューラルネットワーク最適化(NCO)は、教師付きアプローチに代わる魅力的な代替手段を提供する。
既存の教師なしのメソッドは通常、単一の問題クラスに特化している。
UniHetCOは単一入力における問題構造、目的語、線形制約を符号化する。
複数のデータセットと4つの制約付き問題クラスの実験は、競争性能を示している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:32:19 GMT)
Prediction of Grade, Gender, and Academic Performance of Children and Teenagers from Handwriting Using the Sigma-Lognormal Model [4.1] 本研究では,日本人学生が収集した大規模オンラインデータセットを用いて,手書き力学が学生の特徴に関連する情報を符号化するかどうかを検討する。
その結果,手書き力学には発達段階と個人差に関連する測定可能な信号が含まれていることがわかった。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:05:23 GMT)
BLOCK: An Open-Source Bi-Stage MLLM Character-to-Skin Pipeline for Minecraft [4.1] オープンソースの双方向キャラクタ・トゥ・スキンのパイプラインである textbfBLOCK について述べる。
任意の文字概念から、ピクセル完全Minecraftスキンを生成する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:56:17 GMT)
CFD-HAR: User-controllable Privacy through Conditional Feature Disentanglement [4.0] 本稿では,機能障害に基づく表現学習を通じてユーザ制御可能なプライバシを実現する手法を提案する。
オートエンコーダに基づく表現学習を用いて,少数ショットHARに対する手法の有効性を比較した。
本研究は,CFDをベースとしたHARが,潜伏空間における活動と敏感な属性を分離することにより,明示的で変更可能なプライバシ保護制御を提供することを示す。
Autoencoderベースの少ショットHARは、ラベル効率と軽量な適応性を提供するが、固有のプライバシ保護がない。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:29:18 GMT)
Normative Common Ground Replication (NormCoRe): Replication-by-Translation for Studying Norms in Multi-agent AI [4.0] 我々は,人体実験の設計をMAAI環境に体系的に翻訳するために,ノルマティブ・コモン・グラウンド・レプリケーション(NormCoRe)を提案する。
本稿では,AIエージェント研究における規範的判断が人事基準と異なる可能性を示し,エージェントペルソナのインスタンス化に使用される基礎モデルと言語の選択に敏感であることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:24:29 GMT)
Beyond Theory of Mind in Robotics [4.0] 心の理論は、ロボット工学における社会的相互作用の主要なパラダイムとなっている。
社会的意味は行動から脱コードされるのではなく、モーメント・モーメント・コーディネートによって生み出されるものだと私は主張する。
この相互作用基盤はロボット設計に直接的な意味を持つ。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:34:53 GMT)
Addressing Data Scarcity in 3D Trauma Detection through Self-Supervised and Semi-Supervised Learning with Vertex Relative Position Encoding [4.0] 本稿では,3次元医用画像解析のための自己教師付き事前訓練と半教師付き検出を組み合わせたラベル効率のアプローチを提案する。
我々はパッチベースのMasked Image Modeling (MIM)を用いて、1,206個のCTボリュームで3D U-Netエンコーダを事前トレーニングし、堅牢な解剖学的表現を学習する。
検出のために、2000のラベル付きボリュームと一貫性の規則化による半教師付き学習は、56.57%の検証mAP@0.50と45.30%のテストmAP@0.50と、144のラベル付きトレーニングサンプルしか持たない。
分類では、2,244個のラベル付きサンプルに拡張すると、7つの損傷に対して94.07%のテスト精度が得られる
論文参考訳(メタデータ) (Thu, 12 Mar 2026 23:17:17 GMT)
ELLA: Generative AI-Powered Social Robots for Early Language Development at Home [3.9] 初期の言語発達は子供たちの後期のリテラシーと学習を形作っているが、多くの家族は家庭でのスケーラブルで高品質なサポートに限られている。
生成AIの最近の進歩により、社会ロボットはスクリプト化された相互作用を超えて、適応的で会話的な活動に子供たちを巻き込むことができる。
対話型ストーリーテリング,親選択型言語ターゲット,足場付き対話を通じて,早期言語開発を支援する,自律的で生成可能なAI駆動型ソーシャルロボットであるELLAを紹介する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 22:55:54 GMT)
Beyond Convolution: A Taxonomy of Structured Operators for Learning-Based Image Processing [3.9] 本稿では,学習に基づく画像処理パイプラインにおける標準的な畳み込みを拡張し,置き換える演算子の系統分類について述べる。
各族に対して、形式的定義、畳み込みに関する構造的特性に関する議論、および作用素が最も適しているタスクの批判的分析を提供する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:35:15 GMT)
Evaluation format, not model capability, drives triage failure in the assessment of consumer health AI [3.9] ChatGPT Healthは緊急事態の51.6%を減らし、消費者が直面するAIトリアージは安全リスクをもたらすと結論付けた。
5つのフロンティア LLM (GPT-5.2, Claude Sonnet 4.6, Claude Opus 4.6, Gemini 3 Flash, Gemini 3.1 Pro) を17-scenario部分レプリケーションバンク上でテストした。
見出しのアンダートリアージレートは評価形式に強く依存しており、デプロイされたトリアージの挙動を安定的に見積もってはならない。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 00:58:22 GMT)
Weakly Supervised Teacher-Student Framework with Progressive Pseudo-mask Refinement for Gland Segmentation [3.9] 本稿では,スパース・パストロジー・アノテーションと指数移動平均安定化型教師ネットワークを活用して,洗練された擬似マスクを生成する弱教師型教員の枠組みを提案する。
このフレームワークは、信頼に基づくフィルタリング、教師の予測の適応的融合、限られた真実との融合、およびカリキュラムガイドにより、未通知の腺領域を段階的に分割する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:50:03 GMT)
Chunk-Boundary Artifact in Action-Chunked Generative Policies: A Noise-Sensitive Failure Mechanism [3.7] アクションチャンキングは、生成的ビジュモータポリシーの中心的な設計選択となっている。
チャンク境界で発生する実行不連続は、いまだに理解されていない。
我々は,チャンク境界アーチファクトをノイズに敏感な故障機構とみなす。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:10:19 GMT)
Temporally Phenotyping GLP-1RA Case Reports with Large Language Models: A Textual Time Series Corpus and Risk Modeling [3.7] グルカゴン様ペプチド1受容体アゴニストを含む症例報告の時系列コーパスを開発した。
臨床領域の専門家によるゴールド・スタンダード・タイムラインに対するLPMタイムラインの自動抽出について検討した。
最高の性能のLCMは、高いイベントカバレッジ、症状、診断、治療、検査、結果の信頼できる時間的シークエンシングを実現した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 20:45:06 GMT)
HiAP: A Multi-Granular Stochastic Auto-Pruning Framework for Vision Transformers [3.6] ビジョントランスフォーマーは計算資源とメモリ帯域幅を著しく制限し、エッジデバイスへの展開を著しく制限する。
単一エンドツーエンドのトレーニングフェーズにおいて最適なサブネットワークを探索する継続的緩和フレームワークである階層型オートプルーニング(HiAP)を提案する。
HiAPは大きな行列をロードするメモリバウンドオーバーヘッドと計算バウンドな数学的操作の両方に対処する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:45:38 GMT)
LLMs can construct powerful representations and streamline sample-efficient supervised learning [3.6] 本稿では,下流タスクのためのマルチモーダルデータモデリングプロセスの合理化を目的としたエージェントパイプラインを提案する。
提案手法は, 従来の数理モデル, ナイーブテキストシリアライゼーションベースライン, 臨床基礎モデルを大きく上回っている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:44:06 GMT)
Understanding Disclosure Risk in Differential Privacy with Applications to Noise Calibration and Auditing (Extended Version) [3.5] 本稿では、メンバシップ推論、属性推論、データ再構成のリスクを常に捕捉する統合リスク指標である、再構築の利点を紹介する。
我々は、DPノイズと敵対的優位性を関連付ける厳密な境界を導出し、任意のDPメカニズムと攻撃者の知識に対する最適な敵戦略を特徴づける。
本研究では,DP 対応データ管理システムにおいて,DP 監査の精度と範囲を向上し,より効果的なユーティリティ・プライバシ・トレードオフを実現する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:43:55 GMT)
Contract And Conquer: How to Provably Compute Adversarial Examples for a Black-Box Model? [3.5] ブラックボックスの敵攻撃は、入力データの悪意ある摂動に対してディープニューラルネットワークの堅牢性をテストするために広く利用されている。
我々は,ニューラルネットワークの逆例をブラックボックス方式で確実に計算する手法であるContract And Conquer (CAC)を提案する。
CACは転送可能性保証によって支持される: 固定数のアルゴリズムでブラックボックスモデルに対する逆例が得られることを証明する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:37:44 GMT)
Engineering near-unitary one-axis twisting evolution via a driven Tavis-Cummings model [3.5] 一軸ツイストリング(英: One-axis twisting、OAT)は、原子アンサンブルの量子状態を操作するための重要な資源である。
OATダイナミクスの現在の実装は、光原子結合のTavis-Cummingsモデルに依存している。
本稿では,ほぼ一元的OAT進化を実現するために,駆動型Tavis-Cummingsモデルに基づく手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:19:14 GMT)
Predictive and adaptive maps for long-term visual navigation in changing environments [3.4] 環境変化における長期視覚ナビゲーションのための異なるマップ管理手法の比較を行った。
3ヶ月にわたる実験の結果,環境の循環的変化をモデル化する戦略は,時間的変化を明示的にモデル化しない戦略よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:21:36 GMT)
Sparse Phase Ansatzes for Resource-Efficient Qudit State Preparation via the SNAP-Displacement Protocol [3.4] SNAP置換プロトコルを用いたボソニックキューディットシステムにおける資源効率のよい量子状態生成法について検討した。
既存のアプローチは通常、多数のゲートとSNAPフェーズを必要とし、複雑な制御パルスをもたらす。
SNAP位相のサブセットのみを最適化し、3つのより一般的なスパースアンサーゼを導入することを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:28:34 GMT)
Interpreting Contrastive Embeddings in Specific Domains with Fuzzy Rules [3.4] ファジィルールに基づく分類システムと、標準的なテキストプロシージャ技術を用いて、CLIPモデルによって作成された空間に、関心のあるいくつかの特徴をマッピングする。
本手法を臨床報告とフィルムレビューの2つの異なるデータ領域に適用し, 個別に, 両方を考慮した結果を比較した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:49:25 GMT)
Anomaly detection in time-series via inductive biases in the latent space of conditional normalizing flows [3.4] 本研究では、条件付き正規化フローにおける明示的な帰納バイアスを導入し、離散時間状態空間フレームワーク内の時系列観測をモデル化する。
異常検出は統計的に根拠付けられたコンプライアンステストに還元され、観測は遅延空間にマッピングされ、適合性テストによって評価される。
合成および実世界の時系列実験は、周波数、振幅、観測ノイズの異常を確実に検出することを示した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:02:38 GMT)
ZTab: Domain-based Zero-shot Annotation for Table Columns [3.3] 本研究では,関係表中の意味列型を自動的に検出することの課題に対処する。
ZTabは、パフォーマンスとゼロショット要件の両方に対処するドメインベースのゼロショットフレームワークである。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:02:36 GMT)
CSE-UOI at SemEval-2026 Task 6: A Two-Stage Heterogeneous Ensemble with Deliberative Complexity Gating for Political Evasion Detection [3.2] 本稿では,政治インタビューにおける回答の明瞭さを,クリアリプライ,アンビバウンド,クリアノンリプライの3つのカテゴリに分類するSemEval-2026タスク6について述べる。
自己整合性(SC)と重み付き投票による異種二重大言語モデル(LLM)アンサンブルと,新たなポストホック補正機構であるDeliberative Complexity Gating(DCG)を提案する。
評価セットでマクロF1スコア0.85を達成し,3位を確保した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:08:14 GMT)
Bridging the Visual-to-Physical Gap: Physically Aligned Representations for Fall Risk Analysis [3.2] PHARLは臨床出力ラベルを必要とせずに物理的に意味のある転倒表現を学習する。
実験により、PHARLはリスク対応の表現品質を目視のみのベースラインで継続的に改善することが示された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:29:54 GMT)
How Fair is Software Fairness Testing? [3.2] このビジョンペーパーは、公平性テストを文化的に位置するものとして位置づけ、3次元にわたって問題を検証している。
第一に、公平度指標は特定の文化的価値を符号化し、他者を疎外する。
第二に、テストデータセットは、主に西洋の文脈から設計されている。
第3に、公正性テストは、グローバル・サウスにおける低給のデータラベリングへの依存など、倫理的な懸念を高める。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 23:02:49 GMT)
Exploiting Expertise of Non-Expert and Diverse Agents in Social Bandit Learning: A Free Energy Approach [3.1] 社会的学習は個人の経験と他人の行動を観察し、学習成果を改善する機会を提示する。
本稿では,社会規範に頼らずに,社会エージェントが他人の専門知識を評価できる,自由エネルギーに基づくソーシャル・バンディット学習アルゴリズムを提案する。
提案アルゴリズムは,ランダムエージェントや準最適エージェントの存在下においても,関連するエージェントを戦略的に識別し,その行動情報を巧みに活用する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:04:05 GMT)
SENS-ASR: Semantic Embedding injection in Neural-transducer for Streaming Automatic Speech Recognition [3.0] 本稿では,SENS-ASRを提案する。SENS-ASRは意味情報を用いて音響情報を補強することにより,ストリームASRの転写品質を向上させる手法である。
標準データセットの実験では、SENS-ASRは小さなチャンクストリーミングシナリオでワードエラー率を大幅に改善している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:36:45 GMT)
Incremental Neural Network Verification via Learned Conflicts [3.0] 本稿では,関連する検証クエリ間の競合を再利用するインクリメンタルな検証手法を提案する。
継承された競合はSATソルバを使用して処理され、一貫性チェックと伝搬を行う。
我々の実験は、インクリメンタルコンフリクトの再利用は検証の労力を減らし、非インクリメンタルベースラインよりも最大1.9倍のスピードアップをもたらすことを示した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:52:12 GMT)
SommBench: Assessing Sommelier Expertise of Language Models [2.9] SommBenchは、ソムリエの専門知識を評価するベンチマークである。
Wine Theory Question Answering (WTQA)、Wine Feature Completion (WFC)、Food-Wine Pairing (FWP)である。
SommBenchは英語、スロバキア語、スウェーデン語、フィンランド語、ドイツ語、デンマーク語、イタリア語、スペイン語の複数の言語で利用できる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:19:04 GMT)
Expectation and Acoustic Neural Network Representations Enhance Music Identification from Brain Activity [2.9] 教師がターゲットとする音響および予測関連ANN表現の識別は,脳波に基づく音楽識別を改善することを示す。
この研究は、予測音楽認知とニューラルデコーディングの進歩に向けられている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:53:50 GMT)
Parallel-in-Time Nonlinear Optimal Control via GPU-native Sequential Convex Programming [2.9] 本稿では,連続凸プログラミングと乗算器のコンセンサスに基づく交互方向法を組み合わせた,フルGPUネイティブなトラジェクトリ最適化フレームワークを提案する。
本研究は,有人エッジコンピューティングプラットフォームを用いて,四重項アジャイル飛行タスクと火星搭載降下問題の解法を検証した。
ベンチマークでは、高度に最適化された12コアのCPUベースラインよりも、持続的な4倍のスループットのスピードアップとエネルギー消費の51%削減が明らかにされている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:07:37 GMT)
Surpassing Quantum Noise Limits with Nonlinear Amplification [2.9] 非線形量子増幅戦略は、結合された2モードボゾン系の利得安定化された明るい固有モードとカー非線形性の間の相互作用を利用する。
この相互作用により、選択された4乗法において信号の利得がノイズゲインを上回ることが示され、従来の線形増幅器の量子限界を超えるSNRの純増加がもたらされる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:59:24 GMT)
Multimodal Emotion Recognition via Bi-directional Cross-Attention and Temporal Modeling [2.8] 第10回ABAWチャレンジにおけるExpression (EXPR) 認識タスクのためのマルチモーダル感情認識フレームワークを提案する。
表情系列の時間的依存関係をモデル化するために、固定長ビデオウィンドウ上に時間的畳み込みネットワーク(TCN)を用いる。
さらに,視覚的特徴と音声的特徴が対称に相互作用し,相互モーダルな文脈化が促進される双方向の相互注意融合モジュールを導入する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:20:29 GMT)
Distance-aware Soft Prompt Learning for Multimodal Valence-Arousal Estimation [2.8] 本稿では,Valence-arousal (VA)推定のための新しいフレームワークを提案する。
VA空間を3X3グリッドに分割し、9つの感情領域を定義します。
我々は、基底真理座標と領域中心の間のユークリッド距離に基づいて、ソフトラベルを計算するためにガウス核を用いる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:33:17 GMT)
Hypercomplex Widely Linear Processing: Fundamentals for Quaternion Machine Learning [2.8] 四元数で最も有用な特徴は、3次元の回転をモデル化する能力にある。
近年,機械学習の台頭により,四元論のルネッサンスが見られた。
本章では、この新興研究分野の基礎を概説する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:59:46 GMT)
Reliability Dynamics in a Two-Site Dissipative Quantum Spin Chain [2.6] 本稿では,量子スピンチェーンを用いた量子エネルギー保存デバイスモデルを提案する。
この装置は、スピン系が非ゼロ励起で状態に留まっている場合、生存する。
リンドブラッド力学は1方向のエネルギー減衰と故障状態の厳密な不可逆性を強制するので、量子デバイスの信頼性を直接調査することができる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:10:28 GMT)
PolyCrysDiff: Controllable Generation of Three-Dimensional Computable Polycrystalline Material Structures [2.6] PolyCrysDiffは計算可能な3D多結晶構造のエンドツーエンド生成を可能にするフレームワークである。
ターゲットの粒状形態、配向分布、三次元空間相関を再現し、粒状特性に対してR2$以上の0.972を達成している。
この開発は、多結晶材料の加速・データ駆動最適化と設計に向けた重要なステップを拓くことが期待されている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:04:57 GMT)
EducaSim: Interactive Simulacra for CS1 Instructional Practice [2.6] ロールプレイは、学習成果を改善するための効果を示す、ハイインパクトなトレーニングモードである。
この学習環境を促進するために訓練を受け、利用できる人材の提供に固有の依存があるため、教師の指導にスケールすることは困難である。
そこで我々は,ジェネレーティブエージェントを用いて教師養成のための小グループセクションをシミュレートする新しいフレームワーク,EduucaSimを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:08:13 GMT)
Beam-Plasma Collective Oscillations in Intense Charged-Particle Beams: Dielectric Response Theory, Langmuir Wave Dispersion, and Unsupervised Detection via Prometheus [2.5] 中間エネルギー(10-100MeV)の強い荷電粒子ビームにおけるビームプラズマ集合振動の理論的および計算的枠組みを開発する。
臨界ビーム密度n_cの上の無損傷ラングミュア波モードの存在を証明し、明らかなビームプラズマ分散関係を求め、粒子ホール連続体の上にランダウ減衰が消滅することを示す。
第2部では,PICビームシミュレーションによる静的構造因子データS(q)をトレーニングしたβ-VAEであるPrometheusを用いて,これらの予測を検証する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 01:23:49 GMT)
Privacy in ERP Systems: Behavioral Models of Developers and Consultants [2.5] プライバシ・バイ・デザインに関するプライバシー意識と、2つの重要な人口のデータの最小化について検討する。
本稿では,フォッグの行動モデル(FBM)フレームワークを用いて,これらの2つの集団のプライバシー行動モデルを提案する。
私たちの発見は、開発者やコンサルタントにとって、より適切なプライバシー関連の行動を刺激する手段を提供します。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:24:29 GMT)
Coupling Tensor Trains with Graph of Convex Sets: Effective Compression, Exploration, and Planning in the C-Space [2.4] 本稿では,テンソルベース圧縮と構造化グラフ最適化を統合した新しい動き計画フレームワークであるTANGOを提案する。
テンソルベースの圧縮と構造化グラフ推論を結合することにより、TANGOは効率的な幾何学的動き計画を可能にし、将来のロボットシステムにおける構成空間のより表現力が高くスケーラブルな表現の基盤となる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:28:06 GMT)
EvoFlows: Evolutionary Edit-Based Flow-Matching for Protein Engineering [2.4] EvoFlowsは可変長配列から配列へのタンパク質モデリング手法である。
自己回帰型およびマスキング型言語モデルとは異なり、EvoFlowsはテンプレートタンパク質配列の挿入、削除、置換の制限された制御可能な数を実行する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:10:36 GMT)
Cascade: Composing Software-Hardware Attack Gadgets for Adversarial Threat Amplification in Compound AI Systems [2.4] 複合AIシステムは、分散ハードウェアインフラストラクチャ上で動作する階層化された従来のソフトウェアスタック上に構築される。
この研究は、従来のソフトウェアとハードウェアの脆弱性が、複合AIシステムの完全性を損なうアルゴリズム攻撃を補完する方法について研究する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:03:51 GMT)
Human-Centred LLM Privacy Audits: Findings and Frictions [2.4] 大規模な言語モデルのためのブラウザベースの自己監査ツールであるLMP2を紹介する。
2つのユーザスタディにおいて、GPT-4oは、60ドルの精度で毎日50のフィーチャのうち11を予測している。
安定な名前条件付きアソシエーションとモデルデフォルトとの明確な分離を観察する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:01:01 GMT)
Learn Structure, Adapt on the Fly: Multi-Scale Residual Learning and Online Adaptation for Aerial Manipulators [2.4] 自律型空中マニピュレータ(AAM)は本質的に非定常・多スケール残留力学を示す非線形系である。
本稿では,AAMにおけるリアルタイム残差モデリングと補償のための予測適応フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:02:43 GMT)
Unsupervised LiDAR-Based Multi-UAV Detection and Tracking Under Extreme Sparsity [2.4] 非繰り返し固体LiDARスキャンは、空中UAVを検出するための極めてスパースな測定条件をもたらす。
ラベル付きトレーニングデータを必要とせずに、検出とトラッキングの両方に対処する、教師なしのLiDARのみのパイプラインを導入します。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:19:51 GMT)
Robust Cooperative Localization in Featureless Environments: A Comparative Study of DCL, StCL, CCL, CI, and Standard-CL [2.4] 協調ローカライゼーション(CL)は,GPSを用いたマルチロボットシステムにおいて,正確な位置推定を可能にする。
本稿では,5つのCLアプローチの比較研究について述べる。
すべての手法はROSで実装され、モンテカルロシミュレーションにより弱いデータアソシエーションとロバスト検出という2つの条件下で評価される。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:49:36 GMT)
Decentralized Orchestration Architecture for Fluid Computing: A Secure Distributed AI Use Case [2.4] 本稿では,流体計算環境における非依存型マルチドメインオーケストレーションアーキテクチャを提案する。
このアーキテクチャは、実行時にアプリケーションレベルの拡張をサポートするため、ドメインサイドコントロールサービスをファーストクラスの機能として高める。
我々は,SDN 対応マルチドメイン異常検出機構である FU-HST を導入して,ビザンチンのセキュリティを強化するために,ドメイン側の機能を活用している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:49:12 GMT)
A Dynamic Survey of Fuzzy, Intuitionistic Fuzzy, Neutrosophic, Plithogenic, and Extensional Sets [2.3] Fuzzy, Intuitionistic Fuzzy, Neutrosophic, Plithogenic Sets はファジィ, Intuitionistic Fuzzy, Neutrosophic, Plithogenic Sets の大規模な調査である。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:16:42 GMT)
Generalization and Memorization in Rectified Flow [2.2] フローマッチングの目的に基づく生成モデル、特にRectified Flowは、効率的で高忠実な画像合成のための支配的なパラダイムとして登場してきた。
メンバーシップ推論攻撃(MIA)のテスト統計を用いたRFの記憶挙動について検討する。
均一な時間ステップサンプリングをSymmetric Exponential(U字型)分布に置き換えることで、脆弱な中間時間ステップへの露出を効果的に最小化できることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:10:39 GMT)
UCAN: Unified Convolutional Attention Network for Expansive Receptive Fields in Lightweight Super-Resolution [2.2] 本稿では、効率的な受容場を効率的に拡張するために、畳み込みと注意を統一する軽量ネットワークUCANを提案する。
Manga109$4times$では、UCAN-LのPSNRは31.63dB、MACは48.4Gで、最近の軽量モデルを上回っている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:46:19 GMT)
MiNI-Q: A Miniature, Wire-Free Quadruped with Unbounded, Independently Actuated Leg Joints [2.2] ミニチュアでワイヤーのない四足歩行ロボットMiNI-Q2は、独立して、機械的に束縛されていない2-DOF脚関節を作動させた。
提案するロボットの機械的設計,運動解析,実験的検証について述べる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:54:46 GMT)
HELM: Hierarchical and Explicit Label Modeling with Graph Learning for Multi-Label Image Classification [2.2] 階層型マルチラベル分類(HMLC)は、リモートセンシングにおける複雑なラベル依存のモデル化に不可欠である。
HELM(textitHierarchical and Explicit Label Modeling)は,これらの制約を克服する新しいフレームワークである。
我々は、4つのリモートセンシング画像(UCM, AID, DFC-15, MLRSNet)のデータセットを総合的に評価する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:41:17 GMT)
Quantum computing for transport research: an introduction, systematic review, and perspective [2.2] 輸送工学は量子コンピューティングの恩恵を受ける大きな可能性を秘めている。
インテリジェントトランスポートシステム、自動運転車、モノのインターネットの台頭は、効率的な情報処理と計算最適化に対する前例のない需要を生み出している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:51:38 GMT)
Optimal control with flag qubits [2.1] オープン量子システムでは、従来の最適制御はデコヒーレンスに受動的に抵抗するだけであり、環境によって引き起こされる不確実性をボトルネックとして残す。
本稿では,フラグアンシラとFrag-GRAPEアルゴリズムを用いた新しい最適制御フレームワークを提案する。
超伝導量子回路における数値シミュレーションは、従来の閉系パルスと比較して51%の非忠実さの低下を示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:59:05 GMT)
Hunting CUDA Bugs at Scale with cuFuzz [2.1] GPUプログラムは、静的解析を回避するメモリセーフ性とバグの傾向にある。
ファズテストは動的エラーチェックツールと組み合わせて、妥当なソリューションを提供するが、GPUには未使用である。
ファジィングを実用化する最初の楽器であり,最初のNV指向ファジィザであるcuFuzzを紹介する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 22:06:11 GMT)
Chemical Reaction Networks Learn Better than Spiking Neural Networks [2.1] 隠れた層を持たない化学反応ネットワークは、スパイクニューラルネットワークが隠れた層を必要とするタスクを解くことができることを示す。
これは化学計算機における機械学習のモチベーションを提供する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:27:33 GMT)
Internet-Scale Measurement of React2Shell Exploitation Using an Active Network Telescope [2.0] 本稿では,Active Network Telescopeから収集したトラフィックを用いたReact2Shell利用活動のインターネット規模による評価を行った。
我々は、React Serverコンポーネントを実装するエンドポイントをターゲットにしたエクスプロイトの試みを特定する決定論的検出手法を開発した。
これは、その時間的進化、地理的および自律的なシステムレベルの分布、観察された走査活動の行動特性を特徴付けるために、搾取トラフィックを分析するのに役立った。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:29:00 GMT)
Fair Learning for Bias Mitigation and Quality Optimization in Paper Recommendation [1.9] 本稿では,MLP(MultiLayer Perceptron)ベースのモデルを提案する。
本手法は, 品質基準(例えば, 人種, 国)とカスタマイズされた公正度損失を保ちながら, 人口格差を罰する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:48:29 GMT)
Climbing the Clifford Hierarchy [1.9] 正方根が次のレベルに達するクリフォード門について検討する。
階層の対角部は、平方根を取り、制御を追加することで登ることができる。
特に、正方根が3階に昇るクリフォード門を完全に特徴づける。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:56:43 GMT)
Distributed Quantum Computing via Adaptive Circuit Knitting [1.8] 本稿では,サブシステム間の最小絡み合いの領域を発見することで,量子回路の効率的な分割を見つける適応回路編み(ACK)手法を提案する。
最大60キュービットまでの1次元および2次元の乱れた混合場イジングモデルをシミュレートし、ACKアプローチにより、興味のある観測対象に対して最大4桁のサンプリングオーバーヘッドを削減できることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:51:32 GMT)
Optimal Experimental Design for Reliable Learning of History-Dependent Constitutive Laws [1.8] 歴史に依存したモデルは、マイクロメカニクスの集合効果のクロージャとして機能する。
実験予算が限られているため、関係を特徴付けるのに必要な全ての応答を抽出することは困難である。
本研究では,ベイズ最適設計フレームワークを提案し,実験設計の有用性を定量化し,解釈し,最大化する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:33:06 GMT)
Nyxus: A Next Generation Image Feature Extraction Library for the Big Data and AI Era [1.8] 我々はNyxusと呼ばれる新しい特徴抽出ライブラリを開発した。
Nyxusは、2Dおよび3D画像データのスケーラブルな機能抽出のためにゼロから設計されている。
Nyxusの包括的特徴セットは、放射線学や細胞解析を含む複数の生物医学領域をカバーする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:58:07 GMT)
Deployment-Time Reliability of Learned Robot Policies [1.7] 論文は、学習したロボットポリシーの信頼性が、それらの周辺で動作するメカニズムを通じて、デプロイ時にどのように改善できるかを調査する。
まず、障害データやタスク固有の監督を必要とせずに、クローズドループ政策行動の不整合やタスク進捗の逸脱を識別して、差し迫った障害を検出するランタイム監視手法を導入し、次に、評価・最大化の問題としてポリシー調整を定式化することで、影響関数を用いた影響力あるトレーニングデモンストレーションに展開時の成功と失敗をトレースするデータ中心のフレームワークを提案し、その上で、評価と最大化の課題として、信頼性の高い長期タスク実行に対処する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 00:25:30 GMT)
Contextual Graph Representations for Task-Driven 3D Perception and Planning [1.7] コンピュータビジョンの最近の進歩は、視覚慣性データからオブジェクト中心リレーショナル表現を完全に自動抽出することを促進する。
これらの状態表現は、3次元シーングラフと呼ばれ、密な多重グラフ構造を持つ実世界のシーンの階層的な分解である。
この論文は、ロボットタスク計画と3Dシーングラフの交点における研究のために、既存の組み込みAI環境の適合性をテストする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 00:45:12 GMT)
Attention Sinks Are Provably Necessary in Softmax Transformers: Evidence from Trigger-Conditional Tasks [1.7] 簡単なトリガー条件の計算は,ソフトマックス自己注意モデルにおけるシンクを誘導する。
また,非正規化ReLUアテンションがシンクなしで同じ課題を解決できることも証明した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:13:28 GMT)
Reproducible Synthetic Clinical Letters for Seizure Frequency Information Extraction [1.7] シーズール頻度情報はてんかん研究や臨床医療において重要であるが、通常は可変自由テキストクリニックレターに記録されている。
完全合成だがタスク忠実なてんかん文字を用いて発作頻度を抽出するプライバシー保護フレームワークを開発した。
教師言語モデルは、正規化されたラベル、合理性、エビデンスと組み合わせたNHSスタイルの合成文字を生成する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 00:41:21 GMT)
Gender Bias in Generative AI-assisted Recruitment Processes [1.7] 本稿では,35歳未満のイタリア人卒業生を対象に,ジェンダーと職場経験の背景から,最先端の世代モデル(GPT-5)がいかに職業を示唆するかを考察する。
このモデルは、性別、年齢、経験、専門分野のバランスのとれた24のシミュレーションされた候補者プロファイルにジョブを提案するよう促されている。
女性や男性の候補者による形容詞に性的な言語パターンが出現し、モデルが女性と感情的・共感的な特徴を関連付ける傾向が示唆された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:42:56 GMT)
Bielik-Minitron-7B: Compressing Large Language Models via Structured Pruning and Knowledge Distillation for the Polish Language [1.6] 本報告では、Bielik-11B-v3.0モデルの圧縮7.35BパラメータバージョンであるBielik-Minitron-7Bの作成について詳述する。
NVIDIA Minitronアプローチにインスパイアされた2段階圧縮手法を利用して、構造化されたハイブリッドプルーニングと知識蒸留を組み合わせることで、モデルのパラメータ数を33.4%削減した。
最終モデルでは,ベースラインモデルの性能の約90%を回復し,最大50%の高速化を実現した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:57:03 GMT)
SafeScreen: A Safety-First Screening Framework for Personalized Video Retrieval for Vulnerable Users [1.6] 我々は、パーソナライズされたビデオの検索と提示を行うセーフファーストビデオスクリーニングフレームワークであるSafeScreenを紹介した。
SafeScreenは、関連性や人気によって動画をランク付けする代わりに、安全を前提条件として扱い、候補ビデオのシーケンシャルな承認や拒否を行う。
認知症要介護例におけるSafeScreenの評価には,30の患者プロファイルと90の検査クエリを用いた。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:28:10 GMT)
Bridging the Awareness Gap: Socially Mediated State Externalization for Transparent Distributed Home Robots [1.6] 本稿では,タスク性能を損なうことなく,リアルタイム,社会的に介在する状態の外部化が,このギャップを埋めるかどうかを考察する。
我々は,協調型ソーシャルメディエータロボットが,視界外移動マニピュレータの隠れ実行状態を外部化するシステムを開発した。
その結果、外部化はユーザのタスク中心の注意を著しく増加させ、目視、信頼性、刺激、魅力を著しく向上させることが示された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:45:08 GMT)
TornadoNet: Real-Time Building Damage Detection with Ordinal Supervision [1.6] TornadoNetは、道路レベルの建物の自動損傷評価のベンチマークである。
現実的な災害後の状況下で、現代のリアルタイムオブジェクト検出アーキテクチャと常用監視戦略がどのように機能するかを評価する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:22:55 GMT)
Quantum lower bounds for simulating fluid dynamics [1.4] 浅瀬波をモデル化するKdV方程式と,理想的,不可視的な流体をモデル化する圧縮不可能なオイラー方程式の2つの流体モデルについて検討した。
我々は、KdV方程式やオイラー方程式を時間$T$でシミュレートする量子アルゴリズムは、最悪の場合、初期状態のコピーに$(T2)$と$e(T)$が必要であることを示した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:58:56 GMT)
Breakdown of Avila's theory in the diamond chain with quasiperiodic disorder [1.3] 本研究では, 相互に共振する準周期周波数が移動端形成に及ぼす影響について検討する。
この余分なオフセットは、異常なモビリティエッジ(AME)を変換できることを示す。
これは、アビラの地球理論がMEの位置を解析的に予測できなかったことを示す最初の例である。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:29:07 GMT)
Leveraging Phytolith Research using Artificial Intelligence [1.3] ソロメトリー(Sorometry)は、植物石のデジタル化、推論、解釈のためのエンドツーエンドの人工知能パイプラインである。
本研究では2次元画像解析のためのConvNeXtと3次元ポイントクラウド解析のためのPointNet++を組み合わせたマルチモーダル融合モデルを開発した。
ボリビアアマゾンの参照収集と考古学的なサンプルに基づいて、我々の融合モデルは地球規模の分類精度77.9%を達成した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:57:23 GMT)
Spin Model for Quantum Annealing with Kerr Parametric Oscillators [1.3] コヒーレントな状態は、ビットフリップノイズに対する固有の保護のため、短期量子コンピューティングに有望な経路を提供する。
本稿では,スピン1/2自由度を用いたコヒーレント状態量子アニールの有効モデルを提案する。
本研究では,本モデルが現実的な実験環境において正確な予測を得られることを実証し,将来の量子ハードウェアを最適化するための実用的なツールとして機能することを示した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:44:50 GMT)
COAD: Constant-Time Planning for Continuous Goal Manipulation with Compressed Library and Online Adaptation [1.2] 連続的な目標-パラメータ化されたタスク空間を一定時間計画するフレームワークであるCOADを提案する。
COADは、すべてのリージョンのソリューションをオフラインで計画し、保存する代わりに、代表的ルート問題だけを解決して圧縮ライブラリを構築する。
シミュレーションおよび実世界における各種マニピュレータおよび環境の枠組みを評価し,COADが動作ライブラリの相当な圧縮を実現することを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 22:14:02 GMT)
Adaptive Conditional Forest Sampling for Spectral Risk Optimisation under Decision-Dependent Uncertainty [1.1] 期待されるコストと条件付き価値の凸組み合わせとして定義されたスペクトルリスク目標の最小化は困難である。
本研究では,4相シミュレーション最適化フレームワークである適応条件森林サンプリング(ACFS)を提案する。
ACFSは、一般的なランダムフォレストを統合して、意思決定条件の分布近似、CEMによるグローバルな探索、ランク重みの集中強化、サロゲートとオーラルの2段階の再評価を行う。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 22:53:24 GMT)
Multi-Station WiFi CSI Sensing Framework Robust to Station-wise Feature Missingness and Limited Labeled Data [1.1] マルチステーション展開のためのWiFiチャネル状態情報(CSI)センシングフレームワークを提案する。
CSIセンシングにおける2つの基本的な課題 - ステーションワイドの特徴欠如とラベル付きデータ制限 - に対処する。
実験の結果, 予備訓練の欠如や, ステーションワイド増強だけでは不十分であることが判明した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:28:06 GMT)
See, Symbolize, Act: Grounding VLMs with Spatial Representations for Better Gameplay [1.1] VLM(Vision-Language Models)は、視覚的なシーンを記述するのに優れるが、知覚を正確な接地行動に変換するのに苦労する。
視覚的フレームとシーンのシンボリック表現の両方でVLMを提供することで,インタラクティブ環境におけるVLMの性能が向上するかどうかを検討する。
Atariゲーム、VizDoom、AI2-THORの3つの最先端VLMを評価し、フレームのみ、フレームを自己抽出シンボル、フレームを接地トラスシンボル、シンボルのみパイプラインと比較した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:48:57 GMT)
Simultaneous estimation of multiple discrete unimodal distributions under stochastic order constraints [1.0] 本研究では,実世界のプラットフォーム上での探索行動解析によって動機付けられた複数の離散的な一助分布を推定する問題について検討する。
分布間の優先関係の事前知識を取り入れるために、順序制約を課し、混合整数凸最適化問題として推定タスクを定式化する。
合成データセットと実データの両方の実験により、サンプルサイズが小さい場合、提案手法は平均で2.2%(最大6.3%)のJensen-Shannon分散を減少させることが示された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:36:25 GMT)
Tokenization Allows Multimodal Large Language Models to Understand, Generate and Edit Architectural Floor Plans [1.0] フロアプランの理解,生成,編集をひとつのフレームワークに統合する,大規模な言語モデルであるHouseMindを提案する。
このフレームワークは,効率的かつ局所的なデプロイ性を維持しながら,優れた幾何的妥当性と制御性を実現するかを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:09:00 GMT)
Energy Prediction on Sloping Ground for Quadruped Robots [1.0] 本稿では,地形斜面と方位方向が四重組移動のエネルギーコストに与える影響について検討する。
本稿では,標準搭載センサのみに依存した簡易エネルギーモデルを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:09:55 GMT)
Automated Detection of Malignant Lesions in the Ovary Using Deep Learning Models and XAI [0.9] 本研究では,LeNet-5,ResNet,VGGNet,GoogLeNet/Inceptionなどの畳み込みニューラルネットワークを用いて15種類の変種を開発した。
効果的なモデルトレーニングには、MendleyのデータセットであるOvarianCancer&SubtypesDatasetHistopathologyが使用されている。
モデルの性能評価には、精度、精度、リコール、F1スコア、ROC曲線、AUCが使われている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:26:29 GMT)
AraModernBERT: Transtokenized Initialization and Long-Context Encoder Modeling for Arabic [0.9] 我々は、ModernBERTエンコーダアーキテクチャをアラビア語に適応させたAraModernBERTを紹介する。
アラビア語モデリングにはトランストークン化が不可欠であることが示され、マスキング言語モデリング性能の劇的な改善がもたらされた。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:43:12 GMT)
FloeNet: A mass-conserving global sea ice emulator that generalizes across climates [0.9] FloeNetは、地球物理学流体力学研究所(Geophysical Fluid Dynamics Laboratory)のグローバルな海氷モデルSIS2で訓練された機械学習エミュレータである。
FloeNetは再解析による氷-海洋シミュレーションのシミュレーションデータを用いて訓練する。
FloeNetは、海氷と海氷の平均状態、トレンド、年次変動を再現する非保守モデルより優れている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:00:26 GMT)
NBAvatar: Neural Billboards Avatars with Realistic Hand-Face Interaction [0.9] 本稿では,手と顔の相互作用による非剛性変形に対処する頭部アバターのリアルなレンダリング手法であるNBAvatarを提案する。
NBAvatarは、顔のインタラクションによる色変換を暗黙的に学習し、新しいビューと新規なレンダリング品質の点で既存のアプローチを超えることを実証する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:31:00 GMT)
Characterizing Performance-Energy Trade-offs of Large Language Models in Multi-Request Workflows [0.8] 大規模言語モデル (LLM) は、マルチ要求システムを形成するアプリケーションでますます使われている。
推論中にレイテンシとエネルギー需要を増幅する。
本稿では,マルチ要求推論における性能-エネルギートレードオフの体系的特徴について述べる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:10:37 GMT)
Spatial PDE-aware Selective State-space with Nested Memory for Mobile Traffic Grid Forecasting [0.8] ネスト学習パラダイムで実装された空間的PDE対応コアを持つ畳み込み選択状態空間モデル(SSM)であるNeST-S6を提案する。
NeST-S6は32倍高速でMAC解像度を4.3倍削減する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:17:57 GMT)
Probabilistic Joint and Individual Variation Explained (ProJIVE) for Data Integration [0.8] Joint and individual Variance Explained (JIVE) は、一般的な被験者で捉えた2つ以上の特徴の間の関節の変動の低ランクな近似を求める。
我々は,JIVEフレームワークの確率モデルを推定するために,予測最大化(EM)アルゴリズムを開発した。
アルツハイマー病における脳形態計測と認知計測にProJIVEを適用した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:16:07 GMT)
Separable neural architectures as a primitive for unified predictive and generative intelligence [0.7] 我々は、加法モデル、二次モデル、テンソル分解モデルを統合する表現クラスを定式化する。
SNAは、高次元の高分解成分への写像を分解する構造的帰納バイアスを課す。
これらの結果は、予測および生成知能のドメインに依存しないプリミティブとして分離可能なニューラルアーキテクチャを確立する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:56:54 GMT)
CINDI: Conditional Imputation and Noisy Data Integrity with Flows in Power Grid Data [0.7] Conditional Imputation and Noisy Data Integrity (CINDI) は、複雑な時系列におけるデータの完全性を取り戻すために設計された教師なし確率的フレームワークである。
CINDIは、条件付き正規化フロー上に構築された単一エンドツーエンドシステムに異常検出と計算を統一する。
ノルウェーの電力配電事業者による実世界のグリッド損失データを用いて,本フレームワークの評価を行った。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:49:10 GMT)
A Variational Latent Equilibrium for Learning in Neuronal Circuits [0.7] ディープラーニングのアルゴリズムは、現在の脳回路とダイナミクスの理解とは相容れない。
本稿では,BPTTを生物学的に制御可能な方法で近似する一般形式性を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:55:52 GMT)
Human Knowledge Integrated Multi-modal Learning for Single Source Domain Generalization [0.6] 領域間の画像分類の一般化は、基底画像に基づく糖尿病網膜症(英語版)のグレーディングや、静止状態のfMRI発作の発症ゾーン検出などの重要なタスクにおいて、依然として困難である。
我々は,Low-Rank Adaptation (LoRA)による基礎モデルと人間の知識を組み合わせたマルチモーダル視覚言語モデル(VLM)アプローチであるGenEvalを提案する。
8つのDRと2つのSOZデータセットの中で、GenEvalは69.2%(DR)と81%(SOZ)の精度で優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:40:20 GMT)
Multi-Agent Collaboration for Automated Design Exploration on High Performance Computing Systems [0.6] MADA(Multi-Agent Design Assistant)は,複合設計のための特殊エージェントを協調するフレームワークである。
Inertial Confinement Fusionにおける重要な課題であるRMI(Richtmyer-Meshkov Instability)抑制の開発と検証に焦点をあてる。
以上の結果から,MADAシステムは繰り返し設計の改良を成功させ,RMIの最適抑制に向けた設計を自動改善することを示した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:01:27 GMT)
Incremental Federated Learning for Intrusion Detection in IoT Networks under Evolving Threat Landscape [0.5] 本研究は,IoTネットワークにおける非定常IDSモデルの長期性能向上のための,インクリメンタルフェデレーション学習の総合的パフォーマンス解析を提供する。
以上の結果から,累積的漸進的学習と代表的学習がドリフト時の最も安定した性能をもたらすことが示された。
この研究は、IoTデバイスのリソース制約を考慮して、よりレジリエントなIDSソリューションの開発を知らせることを目的としている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:31:14 GMT)
Symbolic Quantum State Representation and its Simulation [0.5] 量子フォトニクス系をシミュレートするためのシンボリック演算子フレームワークを提案する。
本手法は,時間的波動パケットと偏光モードを連続的に処理する。
時間的およびスペクトル的ミスマッチを制御したガウスパルスに対するHong-Ou-Mandel干渉を再現する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:43:41 GMT)
PLDR-LLMs Reason At Self-Organized Criticality [0.5] PLDR-LLMは自己組織的臨界度で事前訓練され,推論時に推論結果が得られた。
この結果から,大規模言語モデルにおいて推論がどのように現れるか,自己完結した説明が得られた。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:09:06 GMT)
Single Pixel Image Classification using an Ultrafast Digital Light Projector [0.5] 低機械学習モデルを用いた単一画素画像(SPI)技術を用いて,マルチkHzフレームレートで画像分類を行う。
SPI用LEDオンCMOSデジタル光プロジェクタを使用することで、サブms画像符号化のための超高速パターン生成が可能となる。
我々は,2つの機械学習モデルの分類性能を比較した: エクストリーム機械学習マシン(ELM)とバックプロパゲーション訓練された深層ニューラルネットワーク。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:12:34 GMT)
Hybrid Human-Agent Social Dilemmas in Energy Markets [0.5] 我々は、人間が自律的なエージェントに戦略的意思決定を委譲するハイブリッド集団において、協調行動がどのように出現するかを研究する。
協調性を高めるためにグローバルな観測可能な信号を使用する人工エージェントを導入する。
人工エージェントは学習のダイナミクスを調整結果に転換できることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:59:35 GMT)
Probing Length Generalization in Mamba via Image Reconstruction [0.4] また,マンバの性能は,トレーニング中に見られたものよりも推定シーケンスの長さが長い場合に劣化することを示した。
シーケンス処理の異なる段階における再構成を解析することにより,マンバはトレーニング中に遭遇するシーケンス長の分布に質的に適応することを明らかにした。
我々は,トレーニングシーケンスの長さをまたいだパフォーマンスを向上させる,長さ適応型Mambaを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 22:32:27 GMT)
Decentralized Cooperative Localization for Multi-Robot Systems with Asynchronous Sensor Fusion [0.4] 分散協調型ローカライゼーションは,GPSを用いた環境下で動作する非ホロノミック移動ロボットにとって有望なアプローチである。
本稿では,拡張カルマンフィルタを用いて,各ロボットが局所的なローカライズを行うフレームワークを提案する。
また、静的環境特徴と移動ロボットの両方を動的ランドマークとして活用するデュアルランドマーク評価フレームワークを導入する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:42:59 GMT)
Diffusion Models Generalize but Not in the Way You Might Think [0.4] トレーニング時間の増加に伴うトレーニングセットの記憶量の増加は十分に大きいが,結果として生じる認知軌道は,この傾向に従わないことを示す。
本研究では,中間雑音レベルにおける過適合がモデル誤差とデータ支持密度によって大きく決定されることを示すために,2次元玩具拡散モデルを用いている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:02:17 GMT)
Quantum Mechanics from Finite Graded Equality [0.4] 我々は、量子力学が一つの仮説から従うことを提案する:等式は有限分解能を持つ。
最初の2つの公理を公理として形式化し、飽和公理内の構造的ライプニッツ条件は基底要素の置換不変量である。
局所トモグラフィーは、テンソル積合成を持つ$mathbbF = mathbbC$から従う。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:14:48 GMT)
The professional's opinion: Suggestions for improving the corporate education training process in Software Engineering [0.4] 本研究は,ソフトウェア工学の専門家が組織的学習プロセスにどのような改善をもたらすかを検討する。
実践的適用性とニーズとの整合性,教育的品質と組織,時間と構造条件,インセンティブと制度的認識の5つのテーマが登場した。
その結果,学習の改善には,実践的関連性,構造的支援,良好な制度的文化を取り入れたシステム的介入が必要であることが示唆された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:58:40 GMT)
AstroSplat: Physics-Based Gaussian Splatting for Rendering and Reconstruction of Small Celestial Bodies [0.4] 本稿では,惑星反射モデルを統合した物理ベースのフレームワークAstroSplatを紹介する。
提案手法は、NASAのDawnミッションによって撮影された実際の画像に基づいて検証され、典型的な球面高調波パラメータ化よりも優れたレンダリング性能と表面再構成精度を示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:15:29 GMT)
EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting [0.3] 本研究では,EnTransformerを提案する。Engressionは条件分布をモデル化するための学習パラダイムであり,Transformerの表現型シーケンスモデリング機能を備えている。
提案したEnTransformerは、電気、交通、ソーラー、タクシー、KDD-cup、ウィキペディアのデータセットなど、多変量確率予測に広く利用されているベンチマークで評価する。
実験結果から,EnTransformerは高い校正確率予測を導出し,ベンチマークモデルより一貫して優れていた。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:25:21 GMT)
Flowcean - Model Learning for Cyber-Physical Systems [0.3] Flowceanは、モデル生成を自動化するように設計された新しいフレームワークである。
モジュラリティとユーザビリティを重視したデータ駆動学習に重点を置いている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:57:50 GMT)
Deep Learning-based Assessment of the Relation Between the Third Molar and Mandibular Canal on Panoramic Radiographs using Local, Centralized, and Federated Learning [0.3] 下顎管近傍における下顎第三大臼歯の衝撃は、下歯槽神経損傷のリスクを増大させる。
臼歯部オーバーラップの自動分類は臨床トリアージを補助し,不必要なCBCTレファラールを減少させる可能性がある。
フェデレートラーニングは、患者データを共有せずにマルチセンターのコラボレーションを可能にする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:17:17 GMT)
When LLM Judge Scores Look Good but Best-of-N Decisions Fail [0.3] 大規模言語モデルは、しばしば審査員が候補の応答を採点し、単一のグローバルメトリックで検証するために使用される。
プロンプト内で実際のデプロイメントタスクが最良選択である場合、これは誤解を招く可能性がある。
審査に基づく選択においては、関連する監査は、グローバルな合意だけでは無く、インイン・プロンプト信号、タイレート、リカバリ/トップ-1の精度を報告すべきである。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 23:40:03 GMT)
Geist in the Machine: Simulating Recognition and Inner Dialogue in AI-Mediated Teaching and Research [0.3] 本稿では、ヘーゲル的認識とフロイト的心理力学という2つの心理社会的理論に基づいて構築されたAI学習システムについて述べる。
2つの関連する介入として、AI教師に学習者を自律的な科目として扱うように指示する認識強化プロンプトと、内部の批評家がチューターの出力をレビューするマルチエージェントのego/superegoアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:33:40 GMT)
Many-Body Structural Effects in Periodically Driven Quantum Batteries [0.3] 周期的なアイシング充電器によって駆動されるスピン1/2量子電池の帯電性能を多体構造が決定することを示す。
特に、相互作用範囲、境界条件、システムサイズ、可積分性は、蓄えられたエネルギーと充電力を高める重要な要素として現れる。
本研究は,多体系の構造的特徴と周期的駆動を併用して,効率的な集団充電のダイナミクスを実現する方法である。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 00:55:12 GMT)
Multimodal classification of Radiation-Induced Contrast Enhancements and tumor recurrence using deep learning [0.2] RICE-NETは、経時的MRIデータと放射線治療用線量分布を統合して自動病変分類を行うマルチモーダル3Dディープラーニングモデルである。
アブレーション実験では,各時間点とモダリティの寄与を定量化し,信頼性の高い分類が主に放射マップに依存することを示した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:48:22 GMT)
LLM BiasScope: A Real-Time Bias Analysis Platform for Comparative LLM Evaluation [0.2] LLM BiasScopeは,大規模言語モデル(LLM)とリアルタイムバイアス解析との比較を行うウェブアプリケーションである。
このシステムは複数のプロバイダ(Google Gemini、DeepSeek、MiniMax、Mistral、Meituan、Meta Llama)をサポートし、研究者や実践者はバイアスパターンを分析しながら同じプロンプト上のモデルを比較することができる。
このインタフェースは、同期されたストリーミング応答、モデルごとのバイアスサマリー、バイアス分布の違いをハイライトする比較ビューの2つを並べて表示する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 23:50:40 GMT)
WORKSWORLD: A Domain for Integrated Numeric Planning and Scheduling of Distributed Pipelined Workflows [0.2] この作業は、分散データパイプラインの自動計画とスケジューリング、あるいはパイプラインの取り込みを追求する。
本研究では,データ処理と共有コンポーネントを,スケジューリングのためのネットワークプランナと組み合わせた汎用的なワークフローとリソースグラフ表現を開発する。
WORKSWORLDは、入射パイプラインのような恒久的なスケジュールのために設計された、数値的なドメインに依存しないプランナーのための新しいドメインである。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:34:04 GMT)
Pruning-induced phases in fully-connected neural networks: the eumentia, the dementia, and the amentia [0.2] 我々は、MNISTでトレーニングされた完全接続ニューラルネットワークについて検討し、トレーニング段階と評価段階の両方で独立にドロップアウト率を変化させた。
eumentia(ネットワークが学習する)、dementia(ネットワークが忘れる)、amentia(ネットワークが学習できない)の3つの相を識別する。
以上の結果から, 投棄によって引き起こされるプルーニングは, 統計力学のレンズを通してニューラルネットワークの動作を理解する具体的環境を提供することが示された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:00:01 GMT)
Measurement-Induced State transitions in Inductively-Shunted Transmons [0.2] 超伝導量子ビットでは、通常、量子ビットに分散結合されたリードアウト共振器上の共振マイクロ波駆動を用いて測定を行う。
より短い測定時間では、読み出し共振器に集光する多くの光子が必要となり、最終的に量子ビットの望ましくない測定誘起状態遷移(MIST)を引き起こす。
我々は、MISTの量子モデルと半古典モデルに適合して、MISTをいくつかの異なる帰納的トランスモンで実験的に特徴づけた。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:16:56 GMT)
Noise Correlations as a Resource in Pauli-Twirled Circuits [0.2] 広範に相関するガウス雑音に対して,ランダム化コンパイル(Randomized Comppiling, RRC)は相関の強度と時間範囲を減少させる。
驚くべきことに、この忠実度は常に相関関係の存在によって増大している。
また, RCは浴槽相関の量子成分を抑制し, 弱い雑音を古典的なものとして安全に扱えることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:24:59 GMT)
Modal Logical Neural Networks for Financial AI [0.2] 深層学習と記号論理の橋渡しとして,モーダル論理ニューラルネットワーク(MLNN)を用いる。
MLNNは、コアコンポーネント、必要ニューロン、学習可能なアクセシビリティをマッピングすることで、ファイナンスのための差別化可能なロジックレイヤ'として記述する。
4つのケーススタディは、MLNNスタイルの制約がトレーディングエージェントのコンプライアンスを促進し、市場監視のための潜在信頼ネットワークの回復を助け、ストレスシナリオ下での堅牢性を促進し、検証された知識と統計的信念を区別し、ロボアドバイザリー幻覚を緩和する方法を示している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 22:12:18 GMT)
A Collaborative and Pattern-Based Training Approach to Knowledge Acquisition and Decision-Making During the Design of Software Architectures Courses: A Case Study [0.1] この記事では、コロンビアのUniversidad del Cauca(UNICAUCA)とアルゼンチンのUniversidad Nacional de la Plata(UNPL)のソフトウェアアーキテクチャ(SA)に関する共同学習経験について説明する。
目標は、トレーニングパターンを適用して評価し、他のコンテキストにおけるレプリケーションの効果的なプラクティスを特定することです。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:18:13 GMT)
Event-Driven Video Generation [0.1] 最先端のテキスト・ビデオモデルはしばしば、フレーム単位で現実的なように見えるが、単純なインタラクションでは失敗する。
これは、いつどこで相互作用がアクティブかを明確に定義することなく、すべてのステップで潜在状態を更新するフレームファーストのデノベーションに起因している、と我々は主張する。
イベント駆動ビデオ生成(EVD)について紹介する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 00:16:56 GMT)
Effective Resistance Rewiring: A Simple Topological Correction for Over-Squashing [0.0] 本稿では,実効抵抗をグローバル信号として利用し,構造的ボトルネックを検出する単純なトポロジ補正手法であるEffective resistance Rewiring(ERR)を紹介する。
ERRは、最大の抵抗を持つノードペア間のエッジを反復的に追加し、最小抵抗のエッジを除去し、弱い通信経路を強化する。
層間におけるノード埋め込みのコサイン類似性を追跡することにより、初期ノード特徴と学習された表現の関係がメッセージパッシング中にどのように進化するかを検討する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:55:48 GMT)
A Decade of Generative Adversarial Networks for Porous Material Reconstruction [0.0] GAN(Generative Adversarial Networks)は、多孔質メディア再構築機能に革命をもたらした。
このレビューは2017年から2026年にかけて発行された96の査読論文を体系的に分析する。
我々は,GANアーキテクチャを,Vanilla GAN,Multi-Scale GAN,Conditional GAN,Attention-Enhanced GAN,Style-based GAN,Hybrid Architecture GANの6つのクラスに分類する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:02:36 GMT)
Long-Context Encoder Models for Polish Language Understanding [0.0] 高品質のポーランドモデルは最大8192個のトークンのシーケンスを処理できる。
モデルは、位置埋め込み適応と完全なパラメータ連続事前学習を含む2段階の訓練手順を用いて開発された。
その結果,ポーランド語モデルと多言語モデルにおいて,我々のモデルは最高の平均性能を達成できた。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:21:45 GMT)
When Bob orbits Alice: entanglement harvesting in circular motion [0.0] ミンコフスキー真空状態で調製された無質量スカラー場に結合した2量子ビットの放射過程について検討した。
量子ビットの絡み合った状態の生成における真空揺らぎの影響を分析する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:59:58 GMT)
UtilityMax Prompting: A Formal Framework for Multi-Objective Large Language Model Optimization [0.0] UtilityMax Promptingは、形式的な数学的言語を用いてタスクを特定するフレームワークである。
3つのフロンティアモデルにわたるMovieLens 1Mデータセットに対するアプローチを検証する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:17:09 GMT)
Unmasking Biases and Reliability Concerns in Convolutional Neural Networks Analysis of Cancer Pathology Images [0.0] 本研究は,CNNを癌病理学の目的で評価する標準プラクティスの健全性について考察する。
CNNの4つの共通アーキテクチャと異なる種類のがんを用いて、13の高用量癌ベンチマークデータセットを分析した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 20:42:32 GMT)
Uniqueness of imaginarity-assisted transformation from computationally universal to strictly universal quantum computation [0.0] 基本ゲート集合 $H,CCZ$ の計算普遍性は、最大虚数状態 $|+irangle$ を用いて厳密な普遍性に変換することができる。
例えば、$|+irangle$はフリー操作までのユニークなリソース状態であることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:19:20 GMT)
Understanding Wikidata Qualifiers: An Analysis and Taxonomy [0.0] 本研究は、周波数と多様性に基づいて、修飾子の重要性を評価する。
Wikidataのダンプを分析することで、上位300の資格者が選択され、洗練された分類に分類された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:15:56 GMT)
Trust Oriented Explainable AI for Fake News Detection [0.0] 本稿では,NLPに基づく偽ニュース検出における説明可能な人工知能(XAI)の適用について検討する。
この研究は、偽情報、ニューラルネットワークアーキテクチャ、XAI技術の主要な側面を概説し、SHAP、LIME、統合勾配に焦点を当てている。
その結果,XAIは高い検出精度を維持しつつ,モデルの透明性と解釈可能性を向上させることがわかった。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:37:28 GMT)
Translationese as a Rational Response to Translation Task Difficulty [0.0] 我々は,翻訳課題の難易度を定量的に評価することにより,観測可能な翻訳文を予測できるかどうかを検証した。
我々は、英語とドイツ語の双方向コーパスを用いて、文章と音声のサブコーパスを合成する。
結果から,英語からドイツ語への翻訳は,翻訳作業の難しさによって部分的に説明できることが示唆された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:24:00 GMT)
Transition from Statistical to Hardware-Limited Scaling in Photonic Quantum State Reconstruction [0.0] 集積フォトニックプロセッサに束縛された基本精度の実験的発見を報告する。
静的コヒーレントスペクトル歪みと動的デコヒーレンスの競合機構を分離する。
これらの結果から, NISQハードウェア上でのシャドウトモグラフィの有用性は, ハードウェアパラメータを含む特定のスケーリング法則によって定義されることがわかった。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:53:33 GMT)
Topological DeepONets and a generalization of the Chen-Chen operator approximation theorem [0.0] 関数空間間で作用する非線形演算子を近似するための分岐トランクニューラルアーキテクチャを提供する。
我々の主定理は、連続作用素 $G:Vto C(K;mathbbRm)$, ここで、$Vsubset X$ と $KsubsetmathbbRd$ はコンパクトであり、そのような位相的DeepONetsによって一様近似できることを示している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:23:35 GMT)
Thermalisation as Diffusion in Hilbert Space [0.0] 我々は多体浴に結合した温度計の微視的熱化理論を開発した。
相互作用行列要素を独立確率変数としてモデル化することにより、還元力学に対する拡散プロパゲータ式を導出する。
この理論は、逆の典型的な拡大によって設定された熱化の時間スケールを予測し、大域的均衡の非マルコフ的一般化をもたらす。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:52:15 GMT)
Theory of the Matchgate Commutant [0.0] 異なるシステムコピーを結合する作用素がリー代数 $mathfrakso(k)$ を生成し、リッチでトラクタブルな構造を持つ不変量の空間を与えることを示す。
また、Clifford-matchgate 部分群の可換性を特徴付け、マヨラナモードの符号付き置換に制限を加えることで、$k geq 4$ レプリカに対してマッチゲートの場合から定性的に発散する可換性が得られることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:12:19 GMT)
The Privacy-Utility Trade-Off of Location Tracking in Ad Personalization [0.0] 我々は,行動履歴が限られている早期冷戦期において,地理的データが最も価値があることを示す。
しかし、ユーザがよりリッチな行動履歴を蓄積するにつれて、地理的データの役割はシフトする。
これらの結果は、広告パーソナライゼーションにおけるプライバシーとユーティリティのトレードオフを浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:52:18 GMT)
The Orthogonal Vulnerabilities of Generative AI Watermarks: A Comparative Empirical Benchmark of Spatial and Latent Provenance [0.0] デジタルプロフェランスは、オープンウェイトな生成AIが急速に増殖するので、重要なサイバーセキュリティの衝動である。
現在、最先端の目に見えない透かしは、2つの主要な数学多様体のうちの1つで機能している。
我々は,2つの代表的なパラダイム,RivaGAN(Spatial)とTree-Ring(Latent)を実証的に評価する。
単一ドメインの透かしは、現代の敵ツールセットに対して根本的に不十分であることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:10:05 GMT)
The Mirror Design Pattern: Strict Data Geometry over Model Scale for Prompt Injection Detection [0.0] データキュレーション設計パターンであるMirrorを導入し、プロンプトインジェクションコーパスを正と負の細胞にまとめる。
我々は,L1インジェクション検定において,厳密なデータ形状がモデルスケールよりも重要であることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:50:57 GMT)
The Geometry of Clifford Algorithms: Bernstein-Vazirani as Classical Computation in a Rotated Basis [0.0] ベルンシュタイン・ヴァジラニアルゴリズムは量子並列性の正準例としてしばしば教えられる。
本稿では,アダマール門の「ラッピング」が大域的基底回転として機能する幾何学的リフレーミングについて述べる。
我々は、古典線形計算として表される世界規模で回転する回路と、量子エンタングルメントを生成する位相的にねじれた回路とを区別する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:29:39 GMT)
The Epistemic Support-Point Filter: Jaynesian Maximum Entropy Meets Popperian Falsification [0.0] エピステミックサポートポイントフィルタ(ESPF)は、エビデンスのみのフィルタのクラスにおけるユニークな最適再帰推定器である。
2つの結果は、この定理を推定理論のより広い風景の中に配置する。
2日間の877ステップのSmolyak Level-3軌道追跡走行における数値的な検証は、必要飽和と副次エスカレーションを通じて確率的ストレスが現れることを示している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:21:17 GMT)
The Constrained Origin of Canonical and Microcanonical Ensembles in Quantum Theory [0.0] 我々は、独立的な構成として、標準およびマイクロカノニカル統計を導入する必要はないことを示す。
クロック時間表現では、純粋に想像上のクロック分離がユークリッド核と標準分割関数を生成する。
共役クロックエネルギー表現では、同じプロジェクターはスペクトル作用素$(hat H-E)$に還元され、従って状態のマイクロカノニカル密度に還元される。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:46:08 GMT)
TaxBreak: Unmasking the Hidden Costs of LLM Inference Through Overhead Decomposition [0.0] この作業では、ホスト可視のオーケストレーションオーバーヘッドを分解するトレース駆動の方法論であるTaxBreakを紹介している。
NVIDIA H100およびH200システム上でTaxBreakを検証し、提案したホストデバイスバランス指標(HDBI)を導出する。
我々は,MoEモデルが高密度モデルよりも出力トークン当たり8~11倍のカーネルをディスパッチし,ホストバウンドワークロードでは,シングルスレッド性能が1次パラメータであることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:30:07 GMT)
Survival Meets Classification: A Novel Framework for Early Risk Prediction Models of Chronic Diseases [0.0] 本稿では, 生存分析と分類手法を統合することによって, 疾患リスクモデルに対する新しいアプローチを提案する。
本研究では, 生存分析手法を再設計し, 効果的に分類できることを示す。
実世界の大規模EMRデータを用いた実験の結果,従来の最先端モデルと比較すると,生存率,F1スコア,AUROCの性能は同等かそれ以上であることがわかった。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:40:28 GMT)
Subtime: Reversible Information Exchange and the Emergence of Classical Time [0.0] 我々は、絡み合ったシステム内での情報交換の可逆モードであるsubtimeの概念を定式化する。
デコヒーレンス(decoherence)による制限として古典的な時間がどのように現れるかを示す。
この枠組みはホイーラー=ファインマン吸収理論、ベネットの可逆計算、シャノンの通信理論、プロセス行列形式を統一する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:50:47 GMT)
Strict Optimality of Frequency Estimation Under Local Differential Privacy [0.0] 本稿では、局所的な差分プライバシー下での周波数推定精度の厳密な最適性を確立する。
周波数推定器は, 対称かつ極端な構成であり, 最適化された値に等しい一定のサポートサイズで, 最大精度を実現するのに十分であることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:16:22 GMT)
SpectralGuard: Detecting Memory Collapse Attacks in State Space Models [0.0] Mambaのような状態空間モデル(SSM)は、入力依存の繰り返しによって線形時間シーケンス処理を実現する。
離散化遷移作用素のスペクトル半径rho(A-bar)が有効メモリ水平線を支配していることを示す。
我々は,任意の出力のみの防御に対して,スペクトル崩壊と回避検出を同時に誘発する対向入力が存在することを示すEvasion Existence理論を証明した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:52:37 GMT)
Software-Hardware Binding for Protection of Sensitive Data in Embedded Software [0.0] 本稿では,ハードウェア指紋とブール論理を組み合わせた新しい保護機構を提案する。
通常のコピー保護アプローチとは異なり、ソフトウェアを許可されていないコピーは依然としてクローンデバイス上で動作しているが、過度に最適化されている。
当社のアプローチではハードウェアの追加は必要とせず、比較的単純なソフトウェアのアップデートにのみ依存しています。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:33:42 GMT)
Sim-to-reality adaptation for Deep Reinforcement Learning applied to an underwater docking application [0.0] Deep Reinforcement Learning (DRL)は、自律的な水中ドッキングのための従来の制御方法に代わる堅牢な代替手段を提供する。
本稿では,高忠実なディジタル双生児環境を活用することで,ジローナ自律水中車両(AUV)を用いた自律ドッキングの体系的アプローチを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:01:25 GMT)
Semi-Synthetic Parallel Data for Translation Quality Estimation: A Case Study of Dataset Building for an Under-Resourced Language Pair [0.0] 本研究は、英語からヘブライ語へのQEのための半合成並列データセットを提案する。
専門的に翻訳された英語・ヘブライ語セグメントを、我々の資源から取り入れ、最高品質スコアを付与した。
言語的問題、特に性別と数字の合意に関する問題に対処するために、制御された翻訳エラーが導入された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:48:34 GMT)
Schema First Tool APIs for LLM Agents: A Controlled Study of Tool Misuse, Recovery, and Budgeted Performance [0.0] 厳密な相互作用予算の下で、スキーマベースのツール契約と構造化診断によって信頼性が向上するかどうかを検討する。
ログ、メトリクス、設定、バリデーションタスクを備えた決定論的ソフトウェアエンジニアリングサンドボックスを実装します。
エンドタスクの成功、誤用、実行失敗、セマンティック誤用、リカバリ動作、タイムアウトを報告します。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:11:16 GMT)
Scalable Surface-Based Manipulation Through Modularity and Inter-Module Object Transfer [0.0] ロボット表面(Roboic Surfaces, RMS)は、物体が休んでいる表面を変形させて物体を操作する。
きめ細かい制御を達成するには、スケーラビリティを制限した高密度アクチュエータアレイが必要になります。
本稿では,相互接続されたファブリックベースモジュール間の協調したモジュール間オブジェクト転送と正確な位置決めを実現する多モジュールソフト操作プラットフォームを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:06:02 GMT)
SNAP-V: A RISC-V SoC with Configurable Neuromorphic Acceleration for Small-Scale Spiking Neural Networks [0.0] スパイキングニューラルネットワーク(SNN)は、低消費電力と計算効率のためにエッジコンピューティングに大きな注目を集めている。
本研究は、小型SNN推論のためのRISC-VベースのニューロモルフィックシステムであるSNAP-Vを提示する。
提案手法は,リアルタイムエッジアプリケーションに適した高精度でエネルギー効率の高いSNN推論を実現する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:52:44 GMT)
Qubit measurement and backaction in a multimode nonreciprocal system [0.0] 従来の超伝導量子ビットの読み出しでは、マイクロ波増幅器と非相互成分の連鎖が量子ビットの状態を検出するのに役立つ。
1つの顕著なアプローチは、非相互性を達成するためにパラメトリック結合モードのネットワークを用いる。
ここでは、埋め込み量子ビットと統合された線形モードのネットワークを理解し設計するための第一原理理論ツールを提供する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:00:00 GMT)
Quantum-Secure-By-Construction (QSC): A Paradigm Shift For Post-Quantum Agentic Intelligence [0.0] QSC(Quantum secure by construction)は、エージェントAIシステムの中核となるアーキテクチャ特性として、量子セキュア通信を扱う設計パラダイムである。
我々は、ポスト量子暗号、量子乱数生成、量子鍵分布を組み合わせた実行時適応型セキュリティモデルにより、QSCを実現する。
QSCは、デプロイされたエージェントAIシステムに量子セキュリティを導入する際の、運用上の複雑さとコストを低減できることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:38:02 GMT)
Quantum synchronization and chimera states in a programmable quantum many-body system [0.0] プログラマブル量子プロセッサ上でのコヒーレントフロケダイナミクスにおける対称性保護量子同期と量子キメラ状態を示す。
本研究は,プログラム可能な多体量子系において,対称性保護同期と量子キメラ状態を実験的に利用可能な非平衡動的相として確立した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:26:20 GMT)
Quantum mechanical framework for quantization-based optimization: from Gradient flow to Schroedinger equation [0.0] この研究は量子化に基づく最適化アルゴリズムを解析するための量子力学的フレームワークである。
グローバルと量子力学の方法論を解析し、画像分類などの機械学習タスクに自然に拡張する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:49:36 GMT)
Quantum algorithms for compact polymer thermodynamics [0.0] ハミルトン環のアンサンブルからの効率的なサンプリングは、コンパクトポリマーの熱力学特性を予測するために重要である。
本研究では, 最大コンパクトポリマーおよびヘテロポリマーの熱力学特性の量子計算による推定において, 二次的な高速化を可能にする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:00:24 GMT)
Quantum Reservoir Autoencoder for Blind Decryption: Two-Phase Protocol and Noise Resilience [0.0] リセットノイズチャンネルを用いたノイズ誘導型貯水池でQRA(Quantum Storage Autoencoder)をインスタンス化する。
10個のデータキュービットとランダムな(最適化されていない)リセット確率を持つ単一暗号文プロトコルでは、オープンシステム記憶器は10桁のショットノイズ感度を抑える。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:05:46 GMT)
Quantum Many-Body Mpemba Effect through Resonances [0.0] 制御可能な量子プラットフォームにおける最近の進歩は、その量子アナログである量子Mpemba効果(QME)の探索を可能にした。
支配的なRP共振モードと初期状態の重なりを抑制することでサブシステム平衡が加速し、QMEが得られることを示す。
我々は、原型的蹴りイジング連鎖と、数論に触発されたエキゾチックで実験的に関係のある初期状態を用いて、予測を裏付ける。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:51:00 GMT)
Quantum Error Correction by Purification [0.0] SWAPテストによる状態浄化に基づく汎用量子誤り訂正プリミティブを提案する。
標準的なQECと同じような方法で、精製ステップは論理誤差率を抑制するために量子アルゴリズム内でインターリーブされる。
様々なエラーチャンネルで解析した結果,PQECは忠実度の向上と論理的誤り率の低減に極めて有効であることがわかった。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:43:50 GMT)
Propagation of Two-Photon Zernike States in Atmospheric Turbulence [0.0] 本研究では, セルニケモードで拡大した2光子状態の伝搬と検出を大気乱流を通じて解析した。
単一のZernikeポンプモードで作製したSPDC状態に対して、8次元連続伝搬積分を正確に離散的なモーダル展開に解析的に還元する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:49:54 GMT)
Probing the memory of a superconducting qubit environment [0.0] 非ポアソン量子ジャンプトレースは、標準マルコフ浴と長寿命TLSを区別するために必要な情報を持っていることを示す。
ソロモン方程式を熱ゆらぎによって自然に生じる量子ジャンプのダイナミクスに合わせることで、量子ビットの2つの環境との結合を解き放つことができる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:02:03 GMT)
Preventing overfitting in deep learning using differential privacy [0.0] 現実世界におけるディープニューラルネットワークベースのシステムの利用が増加している。
彼らは多くの画像、音声、テキストデータセットで最先端のパフォーマンスを達成した。
トレーニングセットの騒音を学習するのに脆弱な二重刃の剣で、性能に悪影響を及ぼす。
本研究では,Deep Neural Networksにおける一般化向上のための差分プライバシに基づくアプローチについて検討する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 22:40:52 GMT)
Preliminary analysis of RGB-NIR Image Registration techniques for off-road forestry environments [0.0] RGB-NIR画像の登録は、センサフュージョン、画像強調、オフロード自律において重要な役割を果たす。
6つの異なる構成で訓練されたNeMARは部分的な成功を示しているが、GANの損失不安定性は幾何的整合性を維持する上での課題を示唆している。
MURFは、オフロードの森林データでテストすると、大規模な特徴調整が期待できるが、密集した植生の詳細な詳細に苦慮している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:00:20 GMT)
Performance Evaluation of Open-Source Large Language Models for Assisting Pathology Report Writing in Japanese [0.0] 病理文献作成を支援するために,7つのオープンソースの大言語モデル (LLM) を評価した。
本研究は, LLMのオープンソース化が, 限定的ではあるが臨床的に関係のあるシナリオにおいて, 日本の病理報告の執筆を支援するのに役立つことを示唆する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:40:04 GMT)
Partitioning Israeli Municipalities into Politically Homogeneous Cantons: A Constrained Spatial Clustering Approach [0.0] 公共の談話はますます、国家の仮定的な区分を政治的に同質な「カントン」に言及している。
本稿では,データ駆動型アルゴリズムを用いてこれらの分割を探索する手法を提案する。
イスラエルの229の自治体を地理的に連続したカントンに分割し、内部の政治的類似性を最大化する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:08:43 GMT)
Optimal quantum metrology protocols with erasure qubits [0.0] 本研究では,複雑性の異なる気象学的戦略で達成可能な精度限界の階層について検討する。
消去ノイズの検出性は、精度の限界と簡易な検知プロトコルをもたらすことが示されている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 11:09:57 GMT)
Operationalism, Causality, and Quantum Theory: a mostly time symmetric perspective [0.0] 本書は(1)単純な因果構造を持つ単純な操作に関する簡単な本(全ての入力が全ての出力の前に存在する)と(2)複雑な因果構造を持つ複雑な操作に関する複雑な本からなる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:44:17 GMT)
Operationalising Cyber Risk Management Using AI: Connecting Cyber Incidents to MITRE ATT&CK Techniques, Security Controls, and Metrics [0.0] 本研究は,これらの課題に対処するために自然言語処理を活用した新しい枠組みを提案する。
我々は,CISCritical Security Controls,MITRE ATT&CK技術,SMARTメトリクスを統合した知識ベースであるCyber Catalogを紹介する。
このフレームワークを運用するために,テキストを数値ベクトルに変換するための文変換モデルであるAll-mpnet-base-v2を微調整した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:12:53 GMT)
Onset of Ergodicity Across Scales on a Digital Quantum Processor [0.0] 我々は,IBMのNighthawkプロセッサ上でのディジタル量子シミュレーションを用いて,2次元乱れハイゼンベルク・フロケモデルにおけるエルゴディディティの出現について検討した。
We observed that heisenberg coupling $J$ increases, the noiseless system under a smooth crossover from subergodic to ergodic behavior。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:54:17 GMT)
One Supervisor, Many Modalities: Adaptive Tool Orchestration for Autonomous Queries [0.0] 我々は、テキスト、画像、オーディオ、ビデオ、文書のモダリティにまたがる特殊なツールをコーディネートする、自律マルチモーダルクエリ処理のためのエージェントAIフレームワークを提案する。
中央スーパーバイザは動的にユーザクエリを分解し、サブタスクをモダリティに適したツールに委譲する。
テキストのみのクエリでは、このフレームワークはRouteLLM経由で学習したルーティングを使用し、非テキストパスはSLMによるモダリティ分解を使用する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:02:58 GMT)
On Contextuality as a Feature of Logic and Probability Theory [0.0] 量子力学では、観測できる全てのことが同時に観測できるわけではない。
この記事では、確率論と論理学の一般的な特徴として、その性質を強調する、文脈性に関する数学的導入について述べる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:25:43 GMT)
Multi-tasking through quantum annealing [0.0] MTQA(Multi-tasking quantum annealing)は、複数の最適化問題の並列処理を可能にする手法である。
MTQAは最小頂点被覆問題とグラフ分割問題という2つのNPハード問題を用いて評価される。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:34:07 GMT)
Mixed Integer Goal Programming for Personalized Meal Optimization with User-Defined Serving Granularity [0.0] 食事最適化のためのMIGP(Mixed Goal Programming)を提案する。
この定式化は、実用的なサービス数とソフト栄養目標の目標計画偏差に整数変数を用いる。
15以上の食品を持つ食事の場合、整数解はベンチマークインスタンスごとに連続的な最適値と一致する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:54:47 GMT)
Mitigating the Multiplicity Burden: The Role of Calibration in Reducing Predictive Multiplicity of Classifiers [0.0] 本稿では,分類校正と予測乗算の相互作用について検討する。
マイノリティクラスの観察は、不均等な多種多様性の重荷を負う。
ポストホックキャリブレーション法の適用は、ラショモン集合全体の低視認性と関連している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:54:07 GMT)
Micro-Diffusion Compression - Binary Tree Tweedie Denoising for Online Probability Estimation [0.0] 適応統計モデルにより生成される確率推定を改善するために, マイクロ拡散復調層を導入する。
Midicothは、適応型PPMモデル、長距離マッチングモデル、トレーベースワードモデル、高階コンテキストモデル、マイクロ拡散デノイザの5つの完全オンラインコンポーネントを最終段階として組み合わせている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:53:30 GMT)
MST-Direct: Matching via Sinkhorn Transport for Multivariate Geostatistical Simulation with Complex Non-Linear Dependencies [0.0] 本研究では,Sinkhorn アルゴリズムを用いて空間相関構造を保ちつつ,多変量分布を直接マッチングする新しいアルゴリズム MST-Direct (Matching via Sinkhorn Transport) を提案する。
この方法は、すべての変数を1つの多次元ベクトルとして同時に処理し、一対の線形依存関係に頼るのではなく、全関節空間をまたいだ関係マッチングを可能にする。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:19:43 GMT)
MRGEN: A Conceptual Framework for LLM-Powered Mixed Reality Authoring Tools for Education [0.0] MR(Mixed Reality)は、没入的かつマルチモーダルな教育機会を提供するが、教師が技術的な専門知識なしで執筆することは困難である。
我々は,モバイル端末で動作するMR学習活動の作成において,教師を支援するための LLM ベースのオーサリングツールの概念的フレームワーク MRGEN を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:24:13 GMT)
Leveraging Large Language Models and Survival Analysis for Early Prediction of Chemotherapy Outcomes [0.0] がん治療の化学療法は費用がかかり、重度の副作用が伴う。
実世界のデータを用いた化学療法結果の予測モデルは課題に直面している。
本研究では,Large Language Models(LLM)とオントロジーに基づく手法を用いて,これらの課題に対処する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 06:25:12 GMT)
Lectures on Open Quantum Systems [0.0] これらのノートは開量子系の数学的理論の簡単な導入である。
それらは、量子科学にまたがる幅広い研究分野への入り口として機能することを目的としている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:38:02 GMT)
Large Language Models for Biomedical Article Classification [0.0] この研究は、いくつかの小型および中規模のオープンソースモデルと、選択されたクローズドソースモデルを使用している。
最も成功した構成の性能は、従来の分類アルゴリズムと比較される。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:39:10 GMT)
LPC-SM: Local Predictive Coding and Sparse Memory for Long-Context Language Modeling [0.0] LPC-SMは、ローカルアテンション、永続メモリ、予測補正、実行時制御を分離するハイブリッド自動回帰アーキテクチャである。
我々は、単独でではなく、より広い範囲の労働部門で組織化できることを示します。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:21:51 GMT)
Interpreting Negation in GPT-2: Layer- and Head-Level Causal Analysis [0.0] ネゲーションは現代言語モデルにとって永続的な課題である。
我々は、GPT-2 の言語変換を小さく内部的にどのように処理するかの因果解析を行う。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 20:10:34 GMT)
Increasing intelligence in AI agents can worsen collective outcomes [0.0] 資源が不足している場合、AIエージェントの集団は調和して調整するか、それとも部族の混乱に陥るのか?
経験的および数学的には、資源が不足すると、AIモデルの多様性と強化学習が危険なシステムの過負荷を増大させるが、部族の形成はこのリスクを減少させる。
高度なAIエージェントの人口は、あまり良くない。AIエージェントの高度化が助けになるか、害を受けるかは、AIエージェントが出荷される前に知ることのできる1つの数字(人口比)に完全に依存する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:31:28 GMT)
Impact of Oxygen Vacancies in Josephson Junction on Decoherence of Superconducting Qubits [0.0] アモルファスAl$O$_3$はバリア材料として広く用いられているが、照射下では酸素空孔(V$_O$)欠陥が容易に生成される。
第一原理計算を用いたアモルファスAl$O$_3$におけるV$_O$欠陥の構造特性と電子的影響について検討する。
その結果, 配向環境とV$_O$s濃度が電気伝導性に強く影響していることが示唆された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:47:22 GMT)
Impact of Markov Decision Process Design on Sim-to-Real Reinforcement Learning [0.0] この研究は、コアマルコフ決定プロセス(MDP)の設計選択がこの伝達にどのように影響するかを体系的に分析する。
カラーミキシングタスクを用いて,様々なMDP構成を評価し,シミュレーションや実世界の実験で動的に混合する。
物理ハードウェアに関する我々の知見を検証し、物理に基づく力学モデルが50%以上の実世界の成功を達成できることを実証した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:26:08 GMT)
Hybrid Analog Teleportation-Direct Transmission in Noisy Bosonic Channels [0.0] 量子テレポーテーションは、共有の絡み合ったリソース、ローカル操作、およびデジタル的に誤り訂正された古典的なチャネルを使用して、遠隔者間で量子状態を転送する。
本稿では,従来の通信とディジタル誤り訂正を,ノイズの多い量子チャネルを介してアナログフィードフォワードに置き換える,状態伝達用ハイブリッドテレポーテーション直接伝送プロトコルを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:53:34 GMT)
How Intelligence Emerges: A Minimal Theory of Dynamic Adaptive Coordination [0.0] 本稿では,マルチエージェントシステムにおける適応調整理論について述べる。
永続環境は蓄積された調整信号を記憶し、分散インセンティブフィールドはこれらの信号を局所的に送信し、適応エージェントは応答を更新する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 05:28:28 GMT)
History state formalism for time series with application to finance [0.0] 本稿では,量子力学の歴史状態の定式化を利用した一般時系列解析手法を提案する。
この定式化により、単一の量子状態、歴史状態に基づく完全な進化を記述することができる。
絡み合いに基づくボラティリティ指標も導出され、標準ボラティリティ指標と比較される。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:35:31 GMT)
HawkesRank: Event-Driven Centrality for Real-Time Importance Ranking [0.0] 我々は,原理的,実証的,適応的な重要度尺度である HawkesRank を紹介する。
HawkesRankがシステムアクティビティを密に追跡し、静的集中度指標を一貫して上回っていることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:51:35 GMT)
Hallucination as output-boundary misclassification: a composite abstention architecture for language models [0.0] 本稿では,命令に基づく拒絶と構造的停止ゲートを組み合わせた複合的介入を提案する。
ゲートは、自己整合性(At)、パラフレーズ安定性(Pt)、引用カバレッジ(Ct)の3つのブラックボックス信号から支持不良スコアであるStを計算する。
全体として、命令ベースの拒絶と構造的ゲーティングは相補的な障害モードを示し、両方のメカニズムを組み合わせることで効果的な幻覚制御の利点が期待できる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:44:47 GMT)
Generation of maximal snake polyominoes using a deep neural network [0.0] 深層ニューラルネットワークがデータ駆動トレーニングから最大ヘビポリオミノの生成に寄与することを検討する。
SPS拡散は、小さな格子から大きな格子へと一般化し、28×28平方メートルまでのヘビを生成し、現在の計算限界に近い正方形で最大ヘビ候補を生成する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:23:10 GMT)
Gen-Fab: A Variation-Aware Generative Model for Predicting Fabrication Variations in Nanophotonic Devices [0.0] 我々は、Pix2Pixをベースとした条件付き生成逆数ネットワーク(cGAN)であるGen-Fabを導入し、フォトニック加工結果の不確実性を予測し、モデル化する。
我々はGen-Fabを,(1)決定論的U-Net予測器,(2)推論時間モンテカルロドロップアウトU-Net,(3)様々なU-Netのアンサンブルの3つのベースラインと比較する。
Gen-Fab は 89.8% で、決定論的 U-Net (85.3%)、MC-Dropout U-Net (83.4%)、および様々な U-Nets (85.8%) を上回っている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:47:40 GMT)
Gaussian Process Regression-based Knowledge Distillation Framework for Simultaneous Prediction of Physical and Mechanical Properties of Epoxy Polymers [0.0] 熱硬化性エポキシポリマーの物理的および力学的特性を予測するための,ガウスプロセス回帰に基づく知識蒸留(GPR-KD)フレームワークを開発した。
このフレームワークは、GPRの解釈可能性と堅牢性を、ディープラーニングのスケーラビリティと一般化と組み合わせている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:59:03 GMT)
From vacuum amplitudes to qubits [0.0] CERNのLHC(Large Hadron Collider)によって実証された高エネルギー衝突器は、真の量子機械を構成する。
リチャード・ファインマン(Richard Feynman)の量子コンピューティングに関する基本的なビジョンと相まって、コライダー物理学は量子シミュレーションの第一候補として現れる。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:14:19 GMT)
From Debate to Deliberation: Structured Collective Reasoning with Typed Epistemic Acts [0.0] デリバティブ・コレクター・インテリジェンス(Deliberative Collective Intelligence, DCI)は、異なる参加者が型付き推論の動きを交換し、意見の不一致を保ち、説明責任のある結果に収束する段階的なプロセスである。
Gemini 2.5 Flashを使って、7つのドメインで45のタスクを評価します。
DCIは100%構造化された決定パケットと98%のマイノリティレポートを生成し、すべてのベースラインが欠落している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:39:41 GMT)
Frequency Comb Behavior of Time Crystals in an RF-Driven Dissipative Rydberg System [0.0] 駆動非線形発振器は、非平衡系における同期、周波数引き込み、周波数コムの形成を理解する普遍パラダイムを構成する。
ここでは, 強い相互作用を持つセシウム・リドベリ気相において, 連続光励起, 散逸, 長距離相互作用により, 固有振動を伴う発振時間結晶相が生じるような非線形発振器を実現する。
RFヘテロダイン条件下では, 相互変調, 周波数引き込み, 強い駆動において, 原子コヒーレンスにおけるコム様スペクトルの出現を観察する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:04:15 GMT)
Experimental Realization of the Markov Chain Monte Carlo Algorithm on a Quantum Computer [0.0] 量子アルゴリズムは、特定のサンプリングタスクに対して古典的なアルゴリズムよりも2次的に改善された複雑性を示す。
我々はマルコフ連鎖の符号化を用いて量子状態を作成し、量子マルコフチェインモンテカルロアルゴリズムを量子inuumのH2およびHelios量子コンピュータ上で実行した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:59:01 GMT)
Experimental Demonstrations of Coherence de Broglie Wavelength for Scalable Superresolution with Near-perfect Fringe Visibility [0.0] コヒーレントドブロイ波長(CBW)は、コヒーレント結合型干渉計アーキテクチャにおいて超解像を達成する方法として提案された。
我々は,N=3まで拡張性のあるCBW超解像を実験的に実証した。
観測されたCBWは、ショットノイズ限界内にある場合でも超高分解能センシングプラットフォームを可能にする可能性がある。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:03:12 GMT)
Exhaustive Circuit Mapping of a Single-Cell Foundation Model Reveals Massive Redundancy, Heavy-Tailed Hub Architecture, and Layer-Dependent Differentiation Control [0.0] 本稿では, サーキットトレース, 高次アブレーション, 因果軌道ステアリングによる限界に対処する3つの実験について述べる。
第一に、第5層における4065個のアクティブオートエンコーダの特徴を徹底的に追跡すると、1393850の下流エッジが得られる。
第2に、8つの三つ子にまたがる3つの冗長性は、冗長性は相互作用順序とともに単調に深まることを示す。
第3に、軌道案内型特徴ステアリングは、層の位置と微分方向との因果関係を確立する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 13:53:20 GMT)
Examining Users' Behavioural Intention to Use OpenClaw Through the Cognition--Affect--Conation Framework [0.0] 本研究では,Cognition-Affect-Conation(CAC)フレームワークを通じて,OpenClawを使用するユーザの行動意図を検討する。
本研究は、システムの認知が感情反応にどのように影響し、その後行動意図を形作るかを研究する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:31:02 GMT)
Error-Mitigated Hamiltonian Simulation: Complexity Analysis and Optimization for Near-Term and Early-Fault-Tolerant Quantum Computers [0.0] トロッタライズおよびランダム化LCUに基づくハミルトニアンシミュレーションアルゴリズムの量子誤差緩和によるノイズハミルトニアンシミュレーションを解析する。
ゲートセットトモグラフィーと最近提案された時空間雑音インバージョン法による誤差軽減に要するノイズ特性コストの定量化を行う。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:29:24 GMT)
Enhancing Music Recommendation with User Mood Input [0.0] 我々は、エネルギー価スペクトルを用いて、所望の気分に基づいて歌を推薦する気分支援レコメンデーションシステムについて検討する。
その結果,ユーザの気分統合は,推薦品質の統計的改善につながることが示された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:59:07 GMT)
ELISA: An Interpretable Hybrid Generative AI Agent for Expression-Grounded Discovery in Single-Cell Genomics [0.0] 本稿では,BioBERTに基づくセマンティック検索とSCGPT表現の埋め込みを統合化するための解釈可能なフレームワークであるEmbedding-Linked Interactive Single-cell Agentを紹介する。
炎症性肺疾患、小児および成人がん、オルガノイドモデル、健康な組織、神経発達にまたがる6つの多様なscRNA-seqデータセットをベンチマークした。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:46:22 GMT)
EB-RANSAC: Random Sample Consensus based on Energy-Based Model [0.0] 本稿では,RANSACと類似した構造を持つロバスト推定のためのエネルギーベースモデル(EBM)を提案する。
EB-RANSACは、RANSACと同様の幅広い推定問題に適用できる。
EB-RANSACの有効性は2つのアプリケーションで数値的に実証されている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 23:55:29 GMT)
Disentangled Representation Learning through Unsupervised Symmetry Group Discovery [0.0] 本研究では,環境との非教師的相互作用によって,その行動空間の群構造が自律的に発見されることを示す。
最小の仮定の下で、真の対称性群分解の識別可能性を証明する。
本手法は, 群分解の異なる3つの環境において検証された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:51:39 GMT)
Directionality emergence and localization in a quantum random Lorentz gas [0.0] 固定散乱器を用いた2次元ランダムローレンツガスによる球面波の伝搬について検討した。
Mott問題に触発されて、このような方向行動がマルチ散乱プロセスから純粋に現れるかどうかをスキーマモデルで検討する。
数値シミュレーションにより、特定の波数範囲内に強い指向性が存在することが明らかになった。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 20:29:07 GMT)
Detecting Privilege Escalation with Temporal Braid Groups [0.0] ブラウ・リャプノフ指数LEを代数的プローブとして、2つのリスク状態の境界を求める。
分散と集中と呼ばれる2つの際立ったリスク体制を識別するために、それを活用する方法を示します。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:58:58 GMT)
Detect Anything in Real Time: From Single-Prompt Segmentation to Multi-Class Detection [0.0] 本稿では,SAM3を実時間マルチクラス検出器に変換する学習自由フレームワークを提案する。
val 2017 (5000イメージ、80クラス)では、1つのGTX 4080で15.8 FPS (4クラス、1008x1008)で55.8 APを達成した。
極端遅延ターゲットでは、冷凍エンコーダデコーダによるアダプタ蒸留は、13.9msのバックボーンで38.7 APを達成する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:05:11 GMT)
DeepHistoViT: An Interpretable Vision Transformer Framework for Histopathological Cancer Classification [0.0] 病理組織学は、組織形態の詳細な細胞レベル評価を提供するため、がん診断のゴールドスタンダードのままである。
近年の深層学習の進歩は、医療画像における複雑な空間依存をモデル化する強力な可能性を示している。
組織像の自動分類のためのトランスフォーマーベースのフレームワークであるDeepHistoViTを提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 00:29:19 GMT)
Deep Learning-Based Metamodeling of Nonlinear Stochastic Dynamic Systems under Parametric and Predictive Uncertainty [0.0] 自然災害下での高次元非線形動的構造系のモデル化は、重大な計算課題をもたらす。
自然災害からの外部負荷に関する不確実性についての研究は成功したが、構造系内の負荷とパラメータの不確実性に同時に対処する研究はほとんどない。
マルチ層パーセプトロン(MLP)、メッセージパッシングニューラルネットワーク(MPNN)、オートエンコーダ(AE)によって実装された特徴抽出モジュールを結合する3つのメタモデリングフレームワークを作成した。
得られたアーキテクチャ (MLP-LSTM, MPNN-LSTM, AE-LSTM) を2つのケーススタディで検証した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:56:04 GMT)
Deep Learning Network-Temporal Models For Traffic Prediction [0.0] 時間的パターンとネットワークトポロジ的相関を同時に学習することを目的とした2つのディープラーニングモデルを提案する。
どちらのモデルも、既に統計手法より優れているLSTMモデルに対して研究されている。
より詳細な分析では、時系列と異なる予測地平線における相関変数と予測分布の相違に関する重要な洞察も示している。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 02:56:19 GMT)
Decomposing Observational Multiplicity in Decision Trees: Leaf and Structural Regret [0.0] 決定木分類器に対する観察的多重性の相補的概念を2つ導入する。
葉の遺残は、有限サンプルノイズによる固定葉内の予測の本質的な変動を定量化するとともに、構造的遺残は、学習木構造自体の不安定性によって引き起こされる変動をキャプチャする。
構造的後悔は観察的多重性の主要な要因であり、一部のデータセットでは葉の後悔の変動の15倍以上であることがわかった。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:09:28 GMT)
Curriculum Sampling: A Two-Phase Curriculum for Efficient Training of Flow Matching [0.0] タイムステップサンプリング$p(t)$は、Flow Matchingモデルにおける中心的な設計選択である。
中偏差サンプリングは早期収束を加速するが,一様サンプリングよりも忠実度が劣ることを示す。
高速な構造学習のための中間バイアスサンプリングから始まる2相スケジュールである textbfCurriculum Smpling を提案し,境界修正のための一様サンプリングに切り替える。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 23:29:15 GMT)
Cross-Context Review: Improving LLM Output Quality by Separating Production and Review Sessions [0.0] 本稿では,CCR(Cross-Context Review)について紹介する。
30のアーティファクト(コード、テクニカルドキュメント、プレゼンテーションスクリプト)に150のエラーがあり、同じセッションの自己レビュー(SR)、繰り返しの自己レビュー(SR2)、コンテキスト対応のサブエージェントレビュー(SA)、CCRの4つのレビュー条件の下でテストされました。
CCRはどんなモデルでも動作し、インフラストラクチャを必要としない。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 16:26:38 GMT)
Critical Unstable Qubits in Particle Physics [0.0] 不安定な2レベル量子系の力学をBloch-vector表現を用いて詳細に研究する。
臨界不安定量子ビット系はコヒーレンス-デコヒーレンス振動のような非定型的な挙動を示す。
ブロッホスフィアパラメーターの観点から、よく探索された中間子-時空2レベル系のコンパイル表を提供する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:28:18 GMT)
Context-dependent manifold learning: A neuromodulated constrained autoencoder approach [0.0] 制約付きオートエンコーダ(cAE)は、解釈可能な次元減少への道筋を提供する。
本稿では,文脈依存型多様体学習を可能にするため,脳神経調節機構をcAEフレームワークに導入する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:39:52 GMT)
Content Platform GenAI Regulation via Compensation [0.0] 本研究では, シンプルな経済主導型クリエーター報酬方式により, 高価値な人為的コンテンツの創造を促進できることを示す。
これにより、将来のGenAIトレーニングのデータ汚染が軽減され、コンシューマエンゲージメントとプラットフォーム利益が向上する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 04:17:22 GMT)
Compression Favors Consistency, Not Truth: When and Why Language Models Prefer Correct Information [0.0] 混合品質データを用いて訓練しても、言語モデルが正しい文を好むことがある理由を考察する。
真実バイアスは、誤った代替品が構造的に圧縮しにくい場合にのみ現れる。
以上の結果から,「真実バイアス」として現れるものは,圧縮圧力と内部整合性の嗜好の副作用であることが示唆された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 09:52:38 GMT)
Compiled Memory: Not More Information, but More Precise Instructions for Language Agents [0.0] 本稿では,蓄積したタスク体験をエージェントの命令構造にコンパイルするメモリカーネルであるAtlasを紹介する。
メモリは蒸留であり、ストレージではない。デリバリは命令の書き換えであり、コンテキスト注入ではない。
CUAD契約解析では、進化したプロンプトによりGPT-4oトークンレベルF1が+8.7$pp、精度が+12.5$pp向上した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 01:49:43 GMT)
Compactifying the Electronic Wavefunction II: Quantum Estimators for Spin-Coupled Generalized Valence Bond Wavefunctions [0.0] 本稿では、波動関数における重なりとハミルトン行列要素を評価するための測定駆動量子フレームワークを提案する。
必要な量をパウリ弦作用素の真空期待値として再構成する。
量子回路エミュレーションを用いた四角形および長方形のH4の枠組みを実証する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:20:06 GMT)
Commutation Groups and State-Independent Contextuality [0.0] 我々は、ペレス・メルミン魔法正方形で実証された量子非古典性の鍵形式である状態独立な文脈性論について研究する。
本稿では,ジェネレータとリレーションによって表現されるEmphcommutationグループを紹介し,それらを文字列書き換えシステムの観点から解析する。
線型代数的構成もあり、ハイゼンベルク群の有向版が存在する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:26:19 GMT)
Causal Prosody Mediation for Text-to-Speech:Counterfactual Training of Duration, Pitch, and Energy in FastSpeech2 [0.0] 本稿では,音声合成のための因果韻律調律フレームワークを提案する。
我々のアプローチは、明示的な感情条件付けでFastSpeech2アーキテクチャを拡張します。
我々は、話者間で感情を伝達する際に、より優れた知性(低WER)と話者の一貫性を観察する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:48:01 GMT)
Can Small Language Models Use What They Retrieve? An Empirical Study of Retrieval Utilization Across Model Scale [0.0] アーキテクチャファミリSmolLM2 Qwen2.5とLlama 3.1の5つのモデルサイズを360Mから8Bまで評価した。
その結果、7Bパラメータ以下のモデルでは、RAGの主な制限は、検索品質よりもコンテキスト利用であることがわかった。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 03:59:42 GMT)
CLARE: Classification-based Regression for Electron Temperature Prediction [0.0] 我々は、地球のプラズマ圏における電子温度を予測する機械学習モデルであるCLAREを提案する。
ケボノのデータから得られたテストセットでは、モデルのTe予測は10パーセントの精度で69.67%の精度を達成している。
機械学習は、公開されているデータに基づいて高精度なTeモデルを生成することができることを示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:43:25 GMT)
Budget-Sensitive Discovery Scoring: A Formally Verified Framework for Evaluating AI-Guided Scientific Selection [0.0] Budget-Sensitive Discovery Score (BSDS)は、各予算レベルで誤った発見を罰する。
Discovery Quality Score (DQS)は、チェリーピックされた予算でうまく機能することで、プロジェクタがインフレできないような、単一のサマリー統計を提供する。
フレームワークは、候補が予算制約と非対称なエラーコストの下で選択される任意の設定に適用されます。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:09:53 GMT)
Bridging the Gap Between Security Metrics and Key Risk Indicators: An Empirical Framework for Vulnerability Prioritization [0.0] 本稿では,予測損失分解に基づく複合リスク指標を提案する。
我々はKRIフレームワークをKnown Exploited Vulnerabilities (KEV)カタログと比較した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:05:22 GMT)
Bridging Protocol and Production: Design Patterns for Deploying AI Agents with Model Context Protocol [0.0] Model Context Protocol(MCP)は、AIエージェントが外部ツールを発見して呼び出す方法を標準化する。
アイデンティティの伝搬、アダプティブツールの予算化、構造化エラーセマンティクスの3つのプロトコルレベルのプリミティブがまだ欠けている。
本稿では,大手クラウドプロバイダのMPPサーバと統合されたAIエージェントプラットフォームの企業展開から,現場での授業を通じて,これらのギャップを識別する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 17:42:24 GMT)
Bases of Steerable Kernels for Equivariant CNNs: From 2D Rotations to the Lorentz Group [0.0] 我々は、ステアブルカーネル制約を解決する別の方法を提案する。
使用する準備ができている、明示的で複雑なベースを見つけます。
最小限の技術ツールを使って、一般の聴衆に利用できるようにする方法について説明する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 21:20:59 GMT)
BTZSC: A Benchmark for Zero-Shot Text Classification Across Cross-Encoders, Embedding Models, Rerankers and LLMs [0.0] ゼロショットテキスト分類(ZSC)は、コストのかかるタスク固有のアノテーションを排除することを約束する。
テキスト埋め込みモデル、リランカ、命令調整型大規模言語モデル(LLM)の最近の進歩は、NLIベースのアーキテクチャの優位性に挑戦している。
我々は、感情、トピック、意図、感情の分類にまたがる22の公開データセットの総合ベンチマークであるBTZSCを紹介する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:43:20 GMT)
Automatic Attack Script Generation: a MDA Approach [0.0] 本研究は,非公式な攻撃シナリオ記述に基づいて,スクリプトと攻撃コンテキストを自動的に生成するアプローチを提案する。
計算独立モデルを表現するために形式言語を提案する。
本研究は,サイバーセキュリティトレーニングにおけるアタック実装の全体的な改善だけでなく,様々なプラットフォームでの再利用にも貢献する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 12:34:49 GMT)
Approximate Reduced Lindblad Dynamics via Algebraic and Adiabatic Methods [0.0] 中心多様体上にリンドブラッド生成体を射影すると、力学がユニタリな、正確に還元された量子力学半群が得られることを示す。
トラクタブルな中心多様体を持つリンドブラッド生成器を解析するために、非摂動中心多様体に固定された縮小空間を保持する摂動還元を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 14:34:19 GMT)
Annotation Entropy Predicts Per-Example Learning Dynamics in LoRA Fine-Tuning [0.0] 高いアノテータの不一致のある項目は、トレーニング中に損失が増加することを示している。
LoRAファインチューニングは、競合する事例の未学習の展示である。
デデコーダのみのモデルは、一致したLoRAランクのエンコーダよりも強い相関を示す。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 20:19:33 GMT)
An Automatic Text Classification Method Based on Hierarchical Taxonomies, Neural Networks and Document Embedding: The NETHIC Tool [0.0] この研究は、NETHICと呼ばれるソフトウェアツールで実装された自動テキスト分類手法について述べる。
階層型ネットワークの表現性と組み合わさって、高度にスケーリング可能なニューラルネットワークの内部能力を活用する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 10:24:14 GMT)
All-electrostatic valley qubit gates in tilted Dirac-Weyl semimetals [0.0] 通常の入射時に量子点接触で作動するスムーズな静電障壁がコヒーレントバレー位相制御を実現することを示す。
その結果、傾斜したディラック半金属がコヒーレントで全電気的な谷操作のプラットフォームとして確立された。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 07:56:01 GMT)
All star-incompatible measurements can certify steering-based randomness [0.0] 信頼できないデバイスによって生成される量子ランダム性の証明は、デバイス非依存のセキュリティにとって不可欠である。
我々は、星非互換な測定の集合が、ステアリングに基づくランダム性を生み出すことを証明した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:04:16 GMT)
Agreement Between Large Language Models, Human Reviewers, and Authors in Evaluating STROBE Checklists for Observational Studies in Rheumatology [0.0] 本研究では,ヒトレビュアーパネルである大規模言語モデル(LLMs)と,観察リウマチ研究における原本作成者によるSTROBE評価を比較した。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:56:46 GMT)
Adapting Methods for Domain-Specific Japanese Small LMs: Scale, Architecture, and Quantization [0.0] 本稿では,QLoRAファインチューニングを用いたドメイン固有日本語小言語モデルの構築手法を提案する。
最適なトレーニングスケール、ベースモデルの選択、アーキテクチャ対応の量子化の3つに対処する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:27:57 GMT)
ARROW: Augmented Replay for RObust World models [0.0] 継続的な強化学習は、エージェントが以前に学んだスキルを維持しながら新しいスキルを取得することを課題にしている。
既存のアプローチのほとんどは、破滅的な忘れを緩和するためにバッファを再生するモデルフリーな手法に依存している。
本稿では,DreamerV3 を拡張したモデルベース連続 RL アルゴリズム ARROW を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 00:15:11 GMT)
AI Governance Control Stack for Operational Stability: Achieving Hardened Governance in AI Systems [0.0] 本稿では、トレーサブルでレジリエントなAIシステムの動作を保証するために設計された階層型ガバナンスアーキテクチャである、運用安定のためのAIガバナンス制御スタックを紹介する。
提案したコントロールスタックには,システム・オブ・レコーズ・バージョン管理,エビデンスに基づく検証,意思決定時の説明可能性ロギング,テレメトリ監視,モデルドリフト検出,ガバナンスエスカレーションという,6つの補完的なガバナンスレイヤが統合されている。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 19:01:42 GMT)
AGMARL-DKS: An Adaptive Graph-Enhanced Multi-Agent Reinforcement Learning for Dynamic Kubernetes Scheduling [0.0] クラウドネイティブなアプリケーションには、システムの安定性、リソース利用、関連するコストのバランスをとることのできる、インテリジェントなスケジューラが必要です。
現在の強化学習ベースのスケジューラには3つの大きな制限がある。
AGMARL-DKS(Adaptive Graph-enhanced Neural Multi-Agent Reinforcement Learning Dynamic Scheduler)を提案する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 15:09:48 GMT)
A technology-oriented mapping of the language and translation industry: Analysing stakeholder values and their potential implication for translation pedagogy [0.0] 論文は、自動化は翻訳価値に取って代わるのではなく、人間のコミュニケーション作業を可能にするような構成を作り上げる、と論じている。
中心的な発見は、人間と技術ドメインを結び付ける媒介価値としての適応性の優位性である。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 08:34:05 GMT)
A Traveling-Wave Parametric Amplifier With Integrated Diplexers [0.0] 本稿では、オンチップ入力と出力ディプレクサをポンプルーティングに組み込んだ移動波パラメトリック増幅器を提案する。
この共ファブリックアーキテクチャは超伝導回路リードアウトのためのコンパクトでスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Thu, 12 Mar 2026 18:00:06 GMT)