OpenThoughts-Agent: Data Recipes for Agentic Models [99.1] OT-Agentプロジェクトはエージェントモデルをトレーニングするための完全にオープンなデータキュレーションパイプラインである。
パイプラインの各段階について100以上の制御アブレーション実験を行った。
このデータセットには、パイプラインから100Kのサンプルと微調整されたQwen3-32Bのトレーニングセットが組み込まれています。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:34:29 GMT)
Lite Any Stereo V2: Faster and Stronger Efficient Zero-Shot Stereo Matching [96.6] Lite Any Stereo V2は、効率的なゼロショットステレオマッチング用に設計された超高速モデルシリーズである。
LAS2はアーキテクチャとトレーニングの両方の観点から開発されている。
LAS2-Hは、反復的なFast-FoundationStereoよりも、全体的なゼロショットのパフォーマンスが向上する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:45:09 GMT)
Compact Object-Level Representations with Open-Vocabulary Understanding for Indoor Visual Relocalization [93.8] OpenReLocは、シーン理解と正確なポーズ推定機能を提供するために設計されたカメラ再ローカライズシステムである。
2D-3Dオブジェクトマッチングのためのオープン語彙意味知識を統合するためのマルチモーダル機構を提案する。
実験により、OpenReLocは、様々なデータセット間で、より優れた再ローカライズリコールと精度を実現することが示された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:27:04 GMT)
Qwen-AgentWorld: Language World Models for General Agents [91.3] 世界モデルは、現在の観測と行動に基づいて環境力学を予測する。
3段階のトレーニングパイプラインを通じてQwen-AgentWorldを開発した。
Qwen-AgentWorldはエージェントRLのための数千の現実世界環境のスケーラブルで制御可能なシミュレーションをサポートする。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:53:55 GMT)
RAVEN: A Regime-Aware Variable-context Expert Network for Financial Time Series Forecasting [83.1] 固定コンテキストウィンドウは、非定常価格プロセスの時間変化最適振り返りと一致しない。
本稿では,各サンプルの時間的文脈を適応的に決定するMixture-of-Expertsフレームワークを提案する。
累積ログリターン予測(HS300、S&P500)およびファンド販売予測の実験では、RAVENはSOTAのパフォーマンスを達成し、HS300ではピアソン相関を9.2%改善し、S&P500では20.2%改善し、MSEを18.2%削減している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 02:11:04 GMT)
CAVEWOMAN: How Large Language Models Behave Under Linguistic Input and Output Compression [77.4] 本稿では,2チャンネル評価プロトコルであるCavewomanについて述べる。
我々は5つのデータセットの8つのモデルを5つの還元レベルで評価し、両方のチャネルは同じ項目で測定した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 02:56:48 GMT)
Beyond Trajectory Imitation: Strategy-Guided Policy Optimization for LLM Reasoning [76.9] 強い言語モデルから弱い言語モデルへの推論能力の蒸留は、典型的には特定の解軌跡を模倣する。
この軌道レベルの模倣は、伝達可能な問題解決スキルの獲得よりも、インスタンス固有のステップの記憶を促進する。
再利用可能な戦略蒸留にインスタンスレベルの軌道模倣を置き換えた戦略誘導型政策最適化を提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 02:14:12 GMT)
Structural Kolmogorov-Arnold Convolutions: Learnable Function on the Values or the Filter Shape as Parameter-Efficient Alternative to Per-Edge Convolutional KANs [76.1] Convolutional Kolmogorov--Arnold Networks (KAN) は、畳み込みカーネルの固定重みを学習可能な単変数関数に置き換える。
学習可能な関数は、各エッジよりも畳み込みのエンファン構造に置かれる方がよいと我々は主張する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:00:26 GMT)
ExTra: Exploratory Trajectory Optimization for Language Model Reinforcement Learning [75.3] ExTraは、モデル自身のロールアウトから探索信号を抽出するフレームワークである。
GRPO上でQwen3-1.7Bをpass@1で約5ポイント、pass@16で+7ポイント改善する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:51:39 GMT)
ActiveScope: Actively Seeking and Correcting Perception for MLLMs [73.8] MLLM(Multimodal Large Language Models)は、高解像度画像における微細な認識に苦戦している。
本研究では,能動的に知覚を探索し,修正することにより,MLLMを強化したトレーニングフリーフレームワークであるActiveScopeを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:17:15 GMT)
Yuvion VL: A Multimodal Foundation Model for Adversarial Content and AI Safety [73.7] 汎用モデルは、しばしば実世界のマルチモーダルリスクを確実に識別し理解するのに苦労する。
我々は、コンテンツとAIの安全性のために構築されたマルチモーダルな大規模言語モデルのファミリーであるYuvion VLを紹介する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:00:08 GMT)
SC3-Eval: Evaluating Robot Foundation Models via Self-Consistent Video Generation [73.2] SC3-Evalは、事前訓練されたビデオ基盤モデルを正確なポリシー評価器に適合させる自己一貫性のあるビデオ生成レシピである。
SC3-Evalロールアウトは、実世界のロールアウトでポリシーが示す障害モードを再現し、詳細な診断比較をサポートする。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 00:20:02 GMT)
FLAT: Feedforward Latent Triangle Splatting for Geometrically Accurate Scene Generation [72.4] ビデオ拡散潜水器から直接三角形スプラットをデコードするFLATを導入する。
標準的なベンチマークでは、FLATは最先端のフィードフォワードベースラインに比べて、はるかに優れた幾何学的精度を実現している。
軽量なテスト時間改善ステップにより,予測された三角形のスープが不透明でゲームエンジン対応の表現に変換されることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:53:41 GMT)
Towards Fast and Effective Long Video Understanding of Multimodal Large Language Models via Adaptive Quasi-Gaussian Sampling [71.6] emphMultimodal Large Language Models (MLLMs) の長いビデオ理解はいまだに困難な課題である
本稿では,ビデオフレーム選択をemphQuasi-Gaussian Smplingの問題として定義し,textbfemphAdaQと呼ばれる適応的かつトレーニング不要なアプローチを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:13:30 GMT)
Social Structure Matters in 3D Human-Human Interaction Generation [70.1] 我々はHHI生成を社会構造モデリングと接地問題として定式化する。
モデルはまず、相互作用がどのように展開され、2人のアクターが役割を調整するかを推測する必要があります。
我々のフレームワークは、位相整合性、役割整合性、パートナー認識調整を改善した3D HHIを生成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:43:13 GMT)
PACT: Preserving Anchored Cores in Task-vectors for Model Merging [68.5] モデルマージは、複数のタスク固有の細調整されたモデルを単一のマルチタスクモデルに結合することを目的としている。
既存のモデルマージアプローチのほとんどは、Task Arithmeticパラダイムに従っています。
本研究では,タスクベクトル内の固定されたタスク固有コア(LBW次元)を,事前学習した重みのサブ空間と補間を整合させることにより保存するPACTを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 03:37:22 GMT)
Trimming the Long-Tail of Visual World Modeling Evaluation [67.2] 本論文では,不規則な物理的相互作用をシミュレートするために世界モデルに挑戦するベンチマークであるTailor-Benchを紹介する。
通常のシナリオは共通のツールとタスクのペアを反映し、従来型のツールを属性互換の代替品に置き換え、Impossibleシナリオは属性違反ツールを導入している。
実験結果から,物理世界モデリングの長期的ギャップは明らかであり,共通相互作用を超越した一般化の限界が示唆された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:43:41 GMT)
Wan-Streamer v0.1: End-to-end Real-time Interactive Foundation Models [66.0] Wan-Streamerは、ローストリーミングインタラクションのためのエンドツーエンドのインタラクティブ基盤モデルである。
音声とビデオは、入力と出力の両方を単一のTransformerシーケンスでシームレスにモデル化する。
およそ200msのモデル側レスポンスレイテンシと、合計550msのインタラクションレイテンシを実現している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:01:03 GMT)
Navigating User Behavior toward Personalized Multimodal Generation [65.6] 本稿では、ユーザのインタラクション履歴をダウンストリーム合成のための実行可能な命令に変換する、パーソナライズされたコンテンツ生成について検討する。
協調的なコードとテキストのコードとを二重に結合した,各項目を表すNaviGenを提案する。
製品、ゲーム、ショートビデオ領域での実験では、NaviGenはパーソナライズされた画像とビデオの生成を改善し、次のイテム予測を強化し、より具体的で関連性があり、視覚的に生成可能な命令を生成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:31:21 GMT)
FlowR2A: Learning Reward-to-Action Distribution for Multimodal Driving Planning [63.8] FlowR2Aは、スコアリングに基づく手法の厳密な監督と、単一の生成モデルによるアンカーベースの手法の提案を統一する。
ソフトプログレッシブ目標に対するハードセーフティ制約のバランスをとるために, 微粒度毎の報奨条件と報奨雑音の増大を導入する。
生成形式は、報酬誘導と固定サンプリングによる制御可能なテスト時間サンプリングをサポートし、高品質な提案を生成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:21:36 GMT)
Bayesian control for coding agents [63.6] 本稿では,コーディングエージェントのためのコスト依存型シーケンシャル仮説テストフレームワークを提案する。
ベイズ管制官は、正確性に対する信念を維持し、より多くの証拠を集め、候補者を精査し、検証し、停止するかを決定する。
本研究では, 信頼状態が, 不確実性定量化のためのトークン確率と生ツール・サクセスベースラインを上回り, 解釈可能な正当性スコアを得ることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:41:32 GMT)
To Compare, or Not to Compare: On Methodological Practices in Evaluating Social Bias [61.4] 異質なベンチマークを標準化する統一的なフレームワークを導入し、孤立した人口統計評価と強制選択比較設定を対比する。
比較設定は、主に不特定文脈によって引き起こされる潜在識別のアグレッシブな触媒として機能することを示す。
最後に、この比較偏見はモデルサイズと正にスケールする一般化された現象であることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:53:50 GMT)
BenchX: Benchmarking AI Models for Cancer Detection and Localization with Demographic and Protocol Biases [59.2] 人工知能(AI)は医療画像において顕著な成功を収めた。
これらのモデルは、実世界の臨床環境において矛盾なく機能することが多い。
我々は,12種類の腫瘍検出AIモデルを体系的に評価する85,355個のCTスキャンのベンチマークを開発した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:58:59 GMT)
An Introduction to Causal Reinforcement Learning [58.7] 因果推論と強化学習は、同じビルディングブロックの異なる側面、すなわち反実的関係で機能する。
私たちは、オンライン、オフ政治、因果計算学習など、さまざまな学習方法の統一的な治療を受けました。
具体的には、政策学習を一般化した因果レンズを用いて、介入すべき場所、模倣学習、反事実学習を紹介し、議論する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:28:33 GMT)
MEMPROBE: Probing Long-Term Agent Memory via Hidden User-State Recovery [58.6] 我々は、長期記憶は監査可能な相互作用後のアーティファクトとして評価されるべきであると主張している。
我々は、メモリを備えたエージェントがシミュレーションユーザを支援するベンチマークであるMEMPROBEで、このビューをインスタンス化する。
私たちは、成功したアシストと回復可能なメモリが、異なる機能として振る舞うことに気付きました。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:52:46 GMT)
Latent Visual States for Efficient Multimodal Reasoning [58.4] EVA(LatEnt Visual StAtes)は、連続的な潜伏した視覚表現を生成する新しいフレームワークである。
これらの内部表現は、Latnt_slotトークンの適応シーケンスとして表される。
EVAは推論効率を高めつつ、大幅な性能向上を達成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:22:22 GMT)
Agentic Collaborative Cognition for Zero-Shot 3D Understanding [57.9] 本研究では,高レベル視点計画の処理に計画エージェントを割り当てる協調型マルチエージェントフレームワークを提案する。
知覚エージェントは、3Dシーンを構造化された全体的認知マップに明示的に要約する。
ScanReferでは11.1%のAcc@0.5、3D支援ダイアログでは14.6 BLEU-1、SQA3Dでは2.1 EM、最先端の6ベンチマークでは2.1 EMを実現している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:44:04 GMT)
Agentic AI for Bilevel Long-Term Optimization of Policy-Driven Physical Layer Systems [56.9] Agentic-Oは、適応的な物理層問題設定に適用可能なネストされた双方向最適化フレームワークである。
Agentic-Oは動的演算子ポリシーに強い適応性を示し、従来の手法と比較してシステムの長期性能を57.2%向上させる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:53:12 GMT)
Transferability for General Reasoning: An Automated Curriculum for Multi-Domain RLVR [56.0] Transfer-Aware Curriculumは、トレーニングスイートの他の部分にとって大きなメリットがあるドメインを優先する。
Qwen3-1.7BとLlama3.2-3Bで最高のマクロ平均精度を達成する。
学習性のみのカリキュラムが支配的なドメインに過剰にコミットされる不均衡なトレーニングミックスでは、依然として堅牢である。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:10:29 GMT)
Topological Neural Dynamics: A Neuron-wise Framework for Sequence Modeling [55.1] トポロジカル・ニューラル・ダイナミクス(TND)は、トポロジカル・ニューラル・ダイナミクス(英語版) (TND) が階層的からニューロン的へと変化するシーケンス・モデリング・フレームワークである。
TNDは神経系を、有向ニューロングラフ、相互作用演算子、局所力学関数として表す。
我々はTNDをシングルプレイヤーPongにおける行動クローニングタスクのケーススタディとして評価した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:28:45 GMT)
Geometry-Instructed Video Editing [54.9] GIVEは幾何学的に指示されたビデオ編集フレームワークで、統一されたオブジェクト状態の定式化によって編集を表現する。
我々は、オブジェクトレベルの編集プログラムを実行し、ペアの前後で制御されるレンダリングを行うスケーラブルなグラフィックスエンジンパイプラインを構築している。
実験結果から,GIVEは時間的コヒーレンスと一貫した二次効果で忠実な幾何学的編集を行うことが示された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:11:45 GMT)
PatternGSL: A Structured Specification Language for Template-Free and Simulation-Ready 3D Garments [52.5] 本稿ではテンプレートフリーで学習可能な仕様言語であるPatternGSLについて述べる。
本稿では,単一画像から直接PatternGSL仕様を予測し,それらを衣服に復号する視覚言語フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:32:04 GMT)
ZeroGVC: Zero-Shot Generative Video Compression with Autoregressive Diffusion Priors [52.5] 我々はゼロショット生成ビデオ圧縮フレームワークZeroGVCを提案する。
ZeroGVCは、画像群(GOP)の最初のフレームを符号化し、Codebook-Guided Autoregressive Latent Compressionを通じてその後のPフレームを表現する。
標準ビデオ圧縮ベンチマークの実験では、ZeroGVCは、追加のトレーニングを伴わずに、超低速度での知覚的再構成品質が優れたことを実証している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:42:33 GMT)
AGORA: An Archive-Grounded Benchmark for Agentic Workplace Document Reasoning [52.2] 大規模言語モデルは、パラメトリックな知識から答えるのではなく、文書を推論するエージェントとして、ますます多くデプロイされている。
大規模な、散らかった職場ファイルの集合にスパース証拠を配置し、一貫性のない用語、単位、時間規則を調整し、答えを計算する。
私たちは、362の質問と9,664の認証ドキュメントと372Mのトークンの8つのドメインコレクションをペアリングするベンチマークであるAgoraを紹介します。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:57:18 GMT)
RoPE-Aware Bit Allocation for KV-Cache Quantization [52.1] Block-GTQはTurboQuant-MSE上に構築されたキーキャッシュ量子化のためのビットアロケータである。
これは、RoPEクエリキーのロジットを10モデル診断パネルに保存する。
128Kコンテキストでfp16 FlashAttention2より1.34倍高速で動作する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 00:17:48 GMT)
Data Augmentation: A Fourier Analysis Perspective [52.0] 部分的なデータ拡張は、一般化やサンプルの複雑さの観点から、完全な拡張と同じ統計的利点が得られることを示す。
この結果から, 部分拡張が, ほぼ対称性を保っているにもかかわらず, 完全拡張の統計的利点を維持できる理由を理論的に説明できる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:54:14 GMT)
DramaDirector: Geometry-Guided Short Drama Generation [51.4] 本研究では,プロット・トゥ・ショート・ドラマ生成について検討し,プロット・トゥ・ショート・ドラマ生成において,グローバル・プロットとローカル・コンテクストを視覚的にグラウンド化されたマルチショット・ビデオに変換する。
そこで,本研究では,映像ギャラリーから映像幾何学を借用可能な幾何学的枠組みであるDramaDirectorを提案する。
また、35のライブアクションドラマ、2.8Kエピソード、81Kショットで作られたベンチマークであるDramaBoardを紹介します。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 03:50:28 GMT)
PAIWorld: A 3D-Consistent World Foundation Model for Robotic Manipulation [51.4] PAIWorldは3つのコアコンポーネントを通じて拡散変圧器の世界モデルを拡張するフレームワークである。
ロボットベンチマークで最先端のマルチビュー3D一貫性を実現し、WorldArenaのリーダーボードで1位、AgiBot-Challenge2026のリーダーボードで2位にランクインした。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:50:09 GMT)
video-SALMONN-R$^3$: Learning to ReWatch, ReAsk, and ReAnswer for Efficient Video Understanding [49.5] ビデオ大言語モデル(LLM)は計算やメモリの予算によって制約されることが多い。
Video-SALMONN-R$3$は、強化学習による再視聴を可能にする最初のエンドツーエンドビデオLLMである。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:13:19 GMT)
FLUX3D: High-Fidelity 3D Gaussian Generation with Diffusion-Aligned Sparse Representation [48.9] 本稿では,画像から3DGSまでのスケーラブルなフレームワークを提案し,生成時の表現学習と相互モーダルアライメントを向上する。
FLUX3Dは外観の忠実さを大幅に改善し、高品質な3DGSの資産を生み出すのに最先端(SOTA)の手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:52:21 GMT)
TimeLAVA: Learning-Agnostic Data Valuation for Time Series [48.8] TimeLAVAは、評価データと参照データの間の分布差を最小限に抑えるために、時間セグメントを限界貢献によって評価する学習非依存のフレームワークである。
モデルに依存しない一般化にバリュエーションをリンクする理論的保証を提供し、汚染に対する有界感度を証明する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 01:06:07 GMT)
TEXEDO : Test Time Scaling for Controller-aware Language-conditioned Humanoid Motion Generation [48.7] 我々はヒューマノイドモーション生成のためのテスト時間スケーリングフレームワークであるTEXEDOを紹介する。
基礎となる強力な発電機を必要とせず、運動の質を向上させる。
追跡忠実度とテキストアライメントの両方を継続的に改善することを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:19:46 GMT)
Latent Block-Diffusion Temporal Point Processes: A Semi-Autoregressive Framework for Asynchronous Event Sequence Generation [48.6] 高品質かつ可変長イベントシーケンス生成のための遅延ブロック拡散時間点プロセス(LBDTPP)を提案する。
各ブロックでイベントを同時にサンプリングしながらブロックを逐次生成することにより、LBDTPPは自己回帰TPPの長さ柔軟性を保持する。
LBDTPPは、非条件および条件生成タスクの両方において最先端のTPPベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:45:28 GMT)
SkyJEPA: Learning Long-Horizon World Models for Zero-Shot Sim-to-Real Control of Quadrotors [48.6] 本稿では,実時間四重項制御のためのJEPAスタイルモデルを提案する。
我々は、潜伏動力学モデルと、凍結した潜伏者を解釈可能な状態にマッピングする、物理学に着想を得た新しいプロバーを組み合わせる。
高価で安全性の低い実世界のデータ収集への依存を低減するため,自動データセット生成のための構造化パイプラインを構築した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:50:32 GMT)
EG-VQA: Benchmarking Verifiable Video Question Answering with Grounded Temporal Evidence [48.3] 本稿では,Evidence-Grounded Video Question Answering Benchmark (EG-VQA)を紹介する。
EG-VQAは2,067本の動画と11,838本のQAペアで構成されている。
強力なプロプライエタリモデルでさえ、予測を正確に下ろすのに苦労しています。
我々は,明示的な監督によって訓練されたエビデンス基底推論モデルEG-Reasonerを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:49:28 GMT)
Emergent Capabilities Arise Randomly from Learning Sparse Attention Patterns [48.1] コンテキスト内学習のような下流の機能は、あるモデルスケールを超えると突然現れることが知られている。
パターン補完や間接物体識別などの能力の出現は,タスク関連注意パターンの急激な学習に対応していることを示す。
我々は,合成線形写像とセルオートマトンを用いたトランスフォーマーモデルを訓練し,注意パターンの学習の難しさは,文脈長とパターンの空間性に依存することを示した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:51:10 GMT)
MM-TRELLIS: Point-Cloud Guided Multi-Modal 3D Vehicle Generation in Autonomous Driving [48.0] MM-TRELLIS(MM-TRELLIS)は、車載3D車両用TRELLISのマルチモーダルバージョンである。
LiDARと、自動運転データセットからのイメージセンサーを、ネイティブな3D生成モデルに統合する。
提案手法は,高忠実度3D車両における既存手法よりも優れる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:31:39 GMT)
ArtiTwinSplat: Interactable Digital Twin Reconstruction via Gaussian Splatting from RGB-D videos [47.4] ArtiTwinSplatは、RGB-Dビデオからオブジェクトの合成された写真リアルなデジタルツインを自動的に構築するフレームワークである。
本手法は幾何学的忠実度と測光的リアリズムを保存する3次元ガウス格子上に構築されている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:24:07 GMT)
Spectral Evolution-Guided Token Pruning in Multimodal Large Language Models [46.6] CLSE(Cross-Layer Spectral Evolution)に基づく無トレーニングトークン解析フレームワークを提案する。
CLSEは単一層の特徴量からトークンの重要性を測定する代わりに、周波数領域のTransformer層間でトークン表現がどのように進化するかを定量化する。
CLSEはアグレッシブトークン還元の下で効率と精度のトレードオフが優れている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:39:52 GMT)
Rotational Vacuum Friction of Nonabsorbing Particles [46.1] 真空中で回転する非吸収粒子は、機械エネルギーを電磁放射に変換することで角運動量を失うことができる。
零温度では摩擦トルクはMpropto7$で回転周波数はOmega$と異方性粒子でスケールする。
対照的に、軸対称粒子は温度に関係なく光子アシスト摩擦から保護される。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:47:57 GMT)
ASAP: Agent-System Co-Design for Wall-Clock-Centered Auto HPO Research for ML Experiments [45.6] 我々はHPOのエージェントシステムの共同設計であるASAPについて述べる。
我々は,ASAPが多種多様な帰納的バイアス付き一般化のプールを統合する方法を示し,各ラウンドで提案する提案の中から選択する。
また,ASAPがループを再構築して,残響品質を保ちながら,エンドツーエンドのウォールタイムを削減する方法も示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 22:00:26 GMT)
MacroLens: A Multi-Task Benchmark for Contextual Financial Reasoning under Macroeconomic Scenarios [44.6] マクロレンズはアメリカでは4,416個の小口径スプリットとマイクロキャップ勾配スプリットをカバーしている。
7つのタスクがポイント・イン・タイムの価格表を共有しており、会計事実に関する46.8M株、53件のマクロ経済シリーズ、295,860件のSEC書類、215,882件のニュース記事がある。
タスクは、コンテキスト予測、パブリックとプライベートのバリュエーション、基本と記述からのステート生成、シナリオ条件のリターン、および不動産のバリュエーションにまたがる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:52:44 GMT)
Scalable Peptide Design via Memory-Efficient Equivariant Transformer [44.4] スケーラブルな原子性ペプチドモデリングのためのE(3)同変バックボーンMEETを紹介する。
フル原子ペプチド生成のためのVAEおよび潜伏拡散パイプラインに統合される。
大規模AFDB派生データセットの実験は、提案したバックボーンが体系的なモデルとデータスケーリングをサポートすることを示している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:25:04 GMT)
An LMM for Precisely Grounding Elements in Documents [44.4] PreciseDocは、精密な要素グラウンドティング用に特別に設計されたLMMで、Document VQAタスクにさらに最適化できる。
微粒な座標のペアメタデータを用いて高品質な文書を大量生産できる2つのパイプラインによる挑戦的なトレーニングデータを構築する。
このモデルは、CVからの個人情報の特定など、単一のテキストの直接のローカライゼーションを超えて、より現実的な機能を開発する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:09:05 GMT)
FlowPipe: LLM-Enhanced Conditional Generative Flow Networks for Data Preparation Pipeline Construction [43.8] データ準備パイプラインは、生のテーブルを学習可能なデータに変換することによって、機械学習におけるデータ品質を改善する。
既存の最先端(SOTA)マルチDQNメソッドは3つの重要な制限に直面している。
有向非巡回グラフ上での条件付き確率フロー生成としてパイプライン合成を定式化する統合フレームワークであるFlowPipeを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:10:00 GMT)
Supervise What Survives: Geometry-Guided VLA Adaptation from Synthetic Robot Videos [43.3] 生成した視覚から低レベル制御を導出することは、ミスマッチした抽象化である、と我々は主張する。
我々は、将来の2次元エンドエフェクタ・ウェイポイントとして幾何学的コンテンツを抽出するtextbfGRAを提案する。
実際のロボットタスクでは、GRAは一致したデータ予算の下で擬似アクションベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:35:13 GMT)
Cross-Dataset, Age, and Gender Generalization: A Comprehensive Analysis of Fine-Tuning Strategies for Low-Resource Children's ASR [43.3] 本稿では,異なる音響モデルに適した音響特性の組み合わせについて,包括的に検討する。
Pitchの組み込みは、特に文認識タスクにおいて、認識性能が顕著に向上している。
我々は,現在最先端の因子化時間遅延ニューラルネットワーク(F-TDNN)モデルの性能向上の可能性を示した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 03:08:18 GMT)
MultiMem: Measuring and Mitigating Memorization in Multi-Modal Contrastive Learning [42.6] 機械学習モデルのメモリ化は、希少な分散サンプル上で高いパフォーマンスを実現する。
また、騒音や外れ値の有害な保持を招き、一般化を低下させる。
マルチモーダル・コントラッシブ・ラーニングにおける記憶の定量化を目的とした最初の指標であるMultiMemを紹介する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:03:33 GMT)
Accelerating Multimodal Large Language Models with Prior-Corrected Token Reduction [42.2] MLLM(Multimodal Large Language Models)において、しばしば注意がモデルによって引き起こされる。
我々は,タスク条件付き注意をモデル誘発前と区別するために,事前補正トークン削減(PriorTR)を提案する。
PriorTRは、強いトレーニングのないベースラインよりも精度と効率のトレードオフを一貫して改善する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:24:50 GMT)
Neural Network Quantization by Learning Low-Loss Subspaces [42.1] 最近の研究では、低損失FP溶液は孤立ではなく、損失ランドスケープの連結低損失部分空間に属することが示されている。
量子化モデルは、FPモデルの低損失部分空間内に配置でき、それによって自動的に性能を保つことができるのか?
損失を最小限に抑えるために最適化された重み空間における量子化を考慮した線形経路を学習することでこの問題に対処する。
得られた部分空間の中間点は、設計上、量子化フレンドリであり、その直接量子化は量子化対応トレーニングに匹敵する性能をもたらすことを実証する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:48:45 GMT)
Grounding Generative Policies in Physics: Optimization-Guided Diffusion for Robot Control [41.8] タスク空間のロボットポリシーでは、生成された把握、ウェイポイント、トラジェクトリは分散的に有効だが実現不可能である。
動作生成を物理的実現可能性に結合する推論時間最適化フレームワークを提案する。
本研究では,到達性と衝突回避制約とコントローラレベルの追従性制約を併用した動的操作によるデクスタラスグリップ合成法の評価を行った。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:49:30 GMT)
Autonomous Video Generation with Counterfactual Controllability for Self-Evolving World Models [40.6] 既存の文献では、ビデオ生成は基本的に世界モデリングであると主張している。
本稿では,対物制御性を備えた自律型ビデオ生成という新たな視点を提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:19:47 GMT)
TuringViT: Making SOTA Vision Transformers Accessible to All [40.4] TuringViTは、チューリング線形注意(Turing Linear Attention)、VISTA-Curation(VISTA-Curation)、動的解像度事前学習(Dynamic- resolution pretraining)の3つの主要な設計で課題に対処する。
TuringViTは、10%のデータだけで、オープンソースのViTベースラインをリードしている。
我々のスケーリング法則分析は、チューリングViTが飽和から遠く離れた、キュレートされたデータスケールで予測可能な改善を続けていることを示している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:42:22 GMT)
Formal-Method-Guided Vibe Coding: Closing the Verification Loop on AI-Generated Safety-Critical Software Through Model-Driven Engineering [40.0] バイブコーディングは高速で、低臨界のコンシューマソフトウェアには適しています。
DO-178C、IEC 61508、ISO 26262によって管理される安全クリティカルなシステムでは、認証への道は提供されない。
フォーマルな検証を通じてビブコーディングをガイドするクローズドループパイプラインであるForgeを紹介します。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:24:02 GMT)
Heuresis: Search Strategies for Autonomous AI Research Agents Across Quality, Diversity and Novelty [40.0] Heuresisは、研究パイプラインを汎用的で構成可能なプリミティブのセットに抽象化するフレームワークである。
全く新しいアイデアは稀である。得点したアイデアは「オリジナル(Original)」と評価され、前作と比べて「マイナーな類似性(Minor similarity)」しか達成できない。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:44:08 GMT)
SENTRY: SAM2-Enhanced Neighbor-Aware and Temporally Reasoned Memory for Visual Tracking [39.5] SAM2ベースのビジュアルオブジェクトトラッキングにおけるメモリ更新機構を再検討する。
本稿では,SENTRYについて紹介する。
コミットする前に、各メモリ更新を短時間の時間的一貫性で検証する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:35:15 GMT)
Sat2City v2: Native 3D City Asset Generation from a Single Satellite Image [39.5] Sat2City v2は、単一の衛星画像から都市資産を明示的な3Dレンダリングするフレームワークである。
Sat2City v2ベンチマークで最高のパフォーマンスを実現するフレームワークを構築します。
全体として、私たちのタスクは3Dレンダリングを、私たちの知識を最大限に活用するために、明示的なテクスチャ化されたメッシュアセットに達成します。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:46:04 GMT)
Beyond Monotonic Progress: Retry-Supervised Value Learning for Robot Imitation [38.9] 混在型ロボットのデモから誤検知値関数を学習するフレームワークであるReTVL(ReTry-Supervised Value Learning)を提案する。
ReTVLは、グローバルプログレスキャリブレーションとローカルなペアワイズ選好学習を組み合わせることで、ミスに伴う局所的な劣化・回復構造をキャプチャする。
実ロボット操作タスクの実験では、ReTVLは進捗ベースのベースラインよりもよりきめ細かな値推定を生成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:27:10 GMT)
Are We Ready For An Agent-Native Memory System? [37.8] 大規模言語モデル(LLM)エージェントのメモリは、単純な検索拡張機構からデータ管理システムへと進化してきた。
既存の評価は、主にエンドツーエンドのタスク成功メトリクスを通じてエージェントメモリをベンチマークする。
データ管理の観点からエージェントメモリの系統的研究を行った。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:34:55 GMT)
Bridging Single Distortion Artifacts and Multifactorial Clinical Quality: Few-shot Biparametric MRI Quality Assessment via Distortion-trained Prototypical Networks [37.5] 画像品質自動評価(IQA)のための数発のプロトタイプネットワークを提案する。
我々のフレームワークは、T2重み付きDWI特徴を融合させるためにデュアルブランチ3D ResNetを使用し、真の形態と歪みを区別するための解剖学的コンテキストを提供する。
比較的客観的な歪みラベルのみに基づいてメタトレーニングされたモデルが、複雑で多因子的な臨床品質スコアの予測に効果的に適応できることを実証する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:08:10 GMT)
Privacy-Preserving RAG via Multi-Agent Semantic Rewriting: Achieving Confidentiality Without Compromising Contextual Fidelity [36.5] Retrieval-Augmented Generationは、外部知識を取り入れることで、大きな言語モデルを強化する。
機密性のあるシナリオにデプロイすると、悪意のあるプロンプトによるプライバシーの漏洩が危険になる。
本稿では,検索したコンテンツをセマンティック・リライトによってサニタイズするマルチエージェント・フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:21:41 GMT)
Counting Trees from Satellite Imagery with Noisy Supervision [36.4] 個々の木を数えることは環境モニタリングの基本的な課題であるが、衛星画像ではほとんど探索されていない。
我々は3大陸と3つの衛星センサーにまたがる新しいベンチマークを行い、23,000 sq.kmで2億1500万以上のツリーアノテーション(手動検証インスタンスを含む)を作成した。
提案手法は, 検出ベース, 回帰ベース, トランスポートベース分布マッチングベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:45:05 GMT)
Wh0: Generative World Models as Scalable Sources of Egocentric Human Hand Manipulation Data [36.4] Wh0は、生成的ビデオワールドモデルを、エゴセントリックな人手操作データのスケーラブルなソースとして利用するフレームワークである。
Wh0は言語、オブジェクト、シーンに基づいており、生成ワールドモデルを使用してWM-Hを生成する。
WM-Hは、限られた量の実際のロボットデータとともに、事前訓練されたVLAモデルを、巧妙な操作展開に適応させる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:28:18 GMT)
World Value Models for Robotic Manipulation [36.2] 汎用価値モデルは、大規模で混合品質のデータから学ぶロボットポリシーのスケーリングにおいて重要な役割を担っている。
既存のロボット価値モデルは、主に静的または時間的にスパースな視覚観察に基づいて事前訓練されたビジョン・ランゲージ・モデル(VLM)のバックボーン上に構築されている。
我々は、データ品質を評価するための正確なタスク進捗を提供する、新しいジェネラリストロボット価値モデル、World Value Model (WVM)を構築します。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:07:48 GMT)
Posterior Refinement: Fast Language Generation via Any-Order Flow Maps [36.2] フローマップ言語モデル(FMLM)は、優れた数ステップ生成のためにジョイントシーケンストランスポートによってこのボトルネックを回避する。
本稿では,このギャップを埋めるフレームワークであるFMLM+を紹介する。
我々はこれを活用して、モデルが出力を適応的に自己修正できる新しい推論時間改善戦略であるPosterior Refinementを導入する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:33:13 GMT)
Towards Fast Domain Adaptation and Fine-Grained User Simulation for Evaluating Conversational Recommender Systems [35.5] AdaptSimは、Adaptiveドメインと自動プロンプトチューニングUser Simulatorである。
現実的な振る舞いモデリングと多様なスタイル生成を可能にして、会話レコメンダシステム(CRS)を評価するための効率的なフレームワークを提供する。
BFS(Breadth-First Search)ベースの、包括的な評価のためのターンレベルのペアワイド比較フレームワークが組み込まれている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 02:56:13 GMT)
3DCarGen: Scalable 3D Car Generation via 3D-consistent Multi-view Synthesis [35.4] 3DCarGenは、現実世界の画像のためのスケーラブルなシングルビュー3Dカージェネレーションフレームワークである。
入力として1つの画像が与えられた場合、我々はまず、固定された視点から画像の集合を合成する。
これらの画像はフィードフォワード再構成モデルに入力され、粗い3D表現となる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:44:14 GMT)
Efficient Adaptive Data Acquisition via Pretrained Belief Representations [35.1] 信条表現を用いた政策学習(POLAR)を紹介する。
POLARは、事前訓練された予測基盤モデルを信念状態エンコーダとして活用することにより、政策学習からの表現学習を分離する。
POLARは様々なタスクにまたがって、最先端のアモートされたメソッドよりも優れています。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:40:47 GMT)
Do Thinking Tokens Help with Safety? [34.3] 現在の推論モデルにおける安全性の挙動は、一般的に想定されるよりもはるかに議論的でないことを示す。
また、既存の推論時間とトレーニングベースの安全介入は、熟考の目的に動機づけられたものの、モデル行動が過度に拒絶される傾向にあることも見出した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:59:01 GMT)
What Does It Mean to Break a Distillation Defense? [33.6] ブラックボックスのLSMは蒸留攻撃に弱いので、攻撃者がモデルに問い合わせて、その出力で生徒を訓練する。
本稿では,クエリ予算,データ予算,インターフェースプロファイルという,攻撃者の3つの側面を記述した脅威モデルフレームワークを提案する。
蒸留防衛の今後の取り組みは、それらの周辺に構築されたガバナンスや政策の枠組みとともに、明示的に特定し、ストレステストのアタッカーの能力をテストすべきである、と我々は主張する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:13:02 GMT)
Memory Retrieval in Visuomotor Policies for Long-Horizon Robot Control [33.6] 家庭などの部分的に観測可能な環境で動く汎用ロボットは、自律性をサポートするために記憶を必要とする。
本稿では,長期制御のための注意に基づくメモリ検索機構を備えたビジュモータポリシーであるHALOを紹介する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 20:07:23 GMT)
Cross-Lingual Exploration for Parametric Knowledge [33.4] パラメトリック知識は言語間で等しくアクセスできない。
標準的な推論技術は、しばしば局所化された事実を明らかにするのに苦労する。
本研究では,言語横断的なプロンプト戦略を探索し,隠れた事実知識にアクセスする手法について検討する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:42:40 GMT)
SHERLOC: Structured Diagnostic Localization for Code Repair Agents [33.4] SHERLOCは,コンパクトなリポジトリツールと自己回復機能を備えた推論LDMをペアリングする,トレーニング不要のフレームワークである。
SWE-Bench Liteでは84.33%の精度@1、SWE-Bench Verifiedでは81.27%のリコール@1である。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:05:50 GMT)
Quantum-enabled active matter at the atomic scale [33.2] 我々は、光双極子トラップに閉じ込められた個々のCs-133原子が、Rb-87原子の超低温浴からエネルギーを抽出し、それを活性運動に変換することを実験的に実証した。
活動の微視的起源は量子スピン交換と同定され、離散的な内部スピンエネルギーを運動運動に伝達する。
我々の研究は、単一原子の基本的な大きさの限界で活性物質への量子可能な経路を確立し、活動の相互作用、量子物理学、メソスコピックな非平衡熱力学を探求するための視点を開く。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:14:53 GMT)
How Much Can We Trust LLM Search Agents? Measuring Endorsement Vulnerability to Web Content Manipulation [33.2] 大言語モデル(LLM)ベースの検索エージェントは、オープンウェブコンテンツをユーザに代わって実行可能なレコメンデーションに合成する。
本稿では,LLM ベースの Web-search エージェントの支持汚職評価フレームワークである SearchGEO について紹介する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:59:57 GMT)
Quantum CT via Dynamic Interval Encoding and Prior-Balanced QUBO Reconstruction [33.1] 本稿では,動的間隔符号化と事前バランス最適化を組み合わせたQUBOに基づくグレースケールCT再構成フレームワークを提案する。
D-Wave hybrid binary quadratic model (BQM) の解法の実験は、この定式化がハードウェアが支援するハイブリッド量子-古典的バックエンド上で実行可能であることをさらに証明している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:28:12 GMT)
BioMedVR: Confusion-Aware Mixture-of-Prompt Experts for Biomedical Visual Reprogramming [32.4] BioMedVRは、バイオメディカルイメージングのための最初のフレームワークであり、事前訓練された視覚言語モデルの少数ショット適応を可能にする。
授業の混乱を軽減するために,コンフュージョン最小化機構を導入する。
11のバイオメディカルデータセットと7つの自然画像ベンチマークを含む18のデータセットの実験は、BioMedVRがより優れた精度と一般化を達成することを実証している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:03:56 GMT)
Probing the Misaligned Thinking Process of Language Models [32.3] 大規模な言語モデルは、様々な不整合行動を示す。
このような動作を確実に検出し、安全で責任のある使用を保証することが重要である。
微粒化認知プロセスに分解して誤認識を監視することを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:40:28 GMT)
Tri-Efficient Transfer Learning for Point Cloud Videos [32.1] PoinTriEは、データセットを盲目的にスケーリングするのではなく、既存のデータからよりリッチな監視シグナルをマイニングすることを目指している。
事前学習のために、擬似運動軌跡は剛体変換によって合成され、テキストコーパスと原点雲から導出される2次元投影とが組み合わされる。
微調整中、トレーニング済みのバックボーンを凍結し、LoRAユニットで構築された軽量の時空間ネットワークのみを更新します。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:55:02 GMT)
ForensicsTok: Forensics-Guided Tokenized Modeling for Image Tampering Localization [31.8] 本稿では,自動回帰シーケンス生成タスクとして画像操作のローカライゼーションを再構成するForensicsTokを提案する。
ForensicsTokは空間的に接地されたトークンシーケンスを直接生成し、中間管理なしで正確なマスク予測を可能にする。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:06:18 GMT)
To Isolate or to Score? Model-Adaptive Assessment for Cost-Efficient Multi-Agent RAG [31.7] 検索拡張生成のためのマルチエージェント文書評価は計算コストが高い。
各種QAベンチマークを用いて、7B-9B命令調整モデルに対する無訓練介入の制御を行った。
モデル適応型ルーティングアーキテクチャであるMADARAを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:34:23 GMT)
What Do Flow-Based Inverse Solvers Approximate? A Posterior-Transport View [31.1] 後部輸送フローに基づく問題解決法を提案する。
本研究では,無条件の音源を後部へ変形させるのに必要な最小エネルギーの周波数補正場として,軌跡誘導解法が読み取れることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:50:11 GMT)
Causality-Based Parametric Control Barrier Function for Safe Multi-Vehicle Interaction [31.0] 我々は,エゴ車両が学習した予測で周囲の車両に安全に反応できる適応型安全クリティカルコントローラを提案する。
マルチサイクルシステム間での動作柔軟性を活用することにより,タスク効率を大幅に向上できることを実証した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 20:06:30 GMT)
NeuroSonic: Conditional Flow Matching for EEG-to-Speech Reconstruction [30.8] 頭皮脳波検査(EEG)による連続的な音声の再構成は基本的には困難である。
脳波から音声への再構成のための条件付きフローマッチングフレームワークであるNeuroSonicを導入する。
ニューロソニックは,脳波条件下でのクリーン音声に向けて,音の破損した音の状態を伝達する決定論的確率流場を学習する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 03:04:53 GMT)
Universal Guideline-Driven Image Clustering via a Hybrid LLM Agent [30.6] テキスト・ガイドラインを通じてこれらのギャップを埋める最初のユニバーサル・フレームワークであるガイドライン駆動イメージ・クラスタリング・エージェントを紹介します。
本稿では,概念プロキシ抽出を通じてガイドラインを意識した埋め込みを生成する生成概念プロキシモデリングを提案する。
当社のフレームワークは、さまざまなクラスタリングタスクにまたがる特殊なメソッドを一貫して上回ります。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 03:20:09 GMT)
TRACER: Training-Free Closed-Loop Structured Inference for Traffic Accident Reconstruction [30.6] 交通事故の再建は、不均一な証拠から物理的に一貫した動きを回復する必要がある法医学的逆問題である。
ここでは、閉鎖ループ構造推論プロセスとして再構成を定式化する、トレーニング不要なフレームワークTRACERを提案する。
実世界の事故データを用いた実験では、TRACERは、データ駆動と物理に基づくベースラインの両方において、幾何学的忠実度、速度の整合性、衝突の精度の向上を実現する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:28:09 GMT)
ParaPairAudioBench: Paralinguistic Pairwise Audio Benchmark for LALM-as-a-Judge [30.5] ParaPairAudioBenchは、5つのパラ言語的次元(スタイル、レート、強調、年齢、ジェンダー)にわたる5,175のオーディオペアのペアベンチマークである。
実験によると、現在のLALMの審査員は平均で32%の差で人間の判断に遅れており、厳しい校正の失敗を示している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:43:43 GMT)
LangMAP: A Language-Adaptive Approach to Tokenization [30.4] LangMAPは、UnigramLMアルゴリズムを多言語設定に拡張するトークン化スキームである。
マルチ言語モデルをスクラッチからトレーニングしたり、事前訓練されたモデルのトークン化ツールを個別の言語に適応する際にも使用することができる。
言語ラベルはトレーニング時に必要とされているが、アルゴリズムの重要な特徴は、入力言語の知識なしに推論時に言語固有のトークン化を実行することである。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:41:34 GMT)
MambaRaw: Selective State Space Modeling for Efficient 4K Raw Image Reconstruction [30.2] MambaRawはJPEGベースのメタデータベースの生画像再構成フレームワークである。
状態空間モデル(SSM)を使用して、エントロピーパラメータを効率的に推定する。
低メタデータでは、MambaRawはPSNRを1.2-1.4dB増加させ、エンドツーエンドのコーディング遅延を約9%削減する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:15:42 GMT)
Adaptive Machine Learning Framework for UAV Trajectory Optimization in O-RAN [29.7] 無人航空機(UAV)をオープン無線ユニット(O-RU)として6G携帯電話システムに展開することは、スケーラブルで適応的なネットワークカバレッジを実現するための有望な機会である。
我々は,O-RANアーキテクチャに拡張された連続的トランスファー学習を統合する,新しいUAVトラジェクトリ最適化フレームワークを導入する。
シミュレーションの結果,モデル選択に基づく移動学習手法では,スクラッチから再学習した場合に比べて収束時間が44%から56%減少し,モデル選択のない従来の移動学習に比べて最大40%減少することがわかった。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:18:45 GMT)
Optimization-based Safe Trajectory Planning for Autonomous Ground Vehicle in Multi-Floor Scenarios [29.6] 本稿では,マルチフロアシナリオに適した軌道計画フレームワークを提案する。
フレームワークは、タスク計画モジュールと軌道計画モジュールの2つの主要なモジュールで構成されている。
提案手法の有効性と妥当性をシミュレーションにより検証した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:26:22 GMT)
Internal Data Repetition Destroys Language Models [28.7] 言語モデルは、高品質なトレーニングデータを使い果たし、積極的に重複したコーパスでさえ、ある程度の繰り返しを保っている。
我々は,コンピュータ等価利得とコンピュータ等価損失を報告するために,適合した非繰り返しスケーリング法を用いて,チンチラ時代の繰り返しを再考する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:02:40 GMT)
Breaking Shortcut Learning for Cross-Trial EEG-Guided Target Speech Extraction via Two-Stage Training [28.2] 高い生体内性能は、ターゲット選択のショートカットとして機能するトライアル固有の脳波構造によって駆動される。
ショートカット学習を緩和する2段階のフレームワークを提案する。
KULとDTUデータセットの実験により、TRUST-TSEは厳密なクロスコートプロトコルの下で、エンドツーエンドのベースラインよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:37:31 GMT)
Solving Inverse Problems of Chaotic Systems with Bidirectional Conditional Flow Matching [27.3] カオス力学における逆問題は、不備、不均一性、不安定性、カオス時間-逆ダイナミクスにより、ほとんど未解決である。
本稿では,初期状態と最終状態の分布間の双方向マッピングを学習するBidirectional Conditional Flow Matching (Bi-CFM)を用いて,この問題に対処する。
保全法を有するシステムの場合、保存規制Bi-CFM(CBi-CFM)に拡張する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:07:47 GMT)
DiffusionBench: On Holistic Evaluation of Diffusion Transformers [27.2] 統合されたDiTトレーニングおよび評価フレームワークであるNanoGenを紹介する。
NanoGenはImageNet上の最先端のDiTベースラインにマッチし、12行の構成変更とともに、競合するテキスト・ツー・イメージモデルもトレーニングする。
また,NanoGenを用いた21の潜伏拡散モデルのトレーニングを行った結果,ImageNetとT2I生成の相関性は認められなかった。
このことは、クラス条件のImageNet FIDを改善する手法は、T2Iに対して対応する改善を示さず、両方のタスクでDiTを評価する必要性を明確に示していることを示唆している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:59:55 GMT)
MATCH: Flow Matching for Multi-View Anomaly Detection [27.2] フローマッチング(FM)に基づく最初のマルチビュー異常検出手法であるMATCHを提案する。
MATCHは、コンシューマレベルのハードウェア上で動作しながら、異常検出とセグメンテーションの両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:07:54 GMT)
Efficient Analytic Uncertainty Quantification for Multi-Modal Regression [26.6] 複雑な条件分布の正確な推定を同時に行う統一的分布に依存しないフレームワークを提案する。
我々のフレームワークは最先端のマルチモーダル回帰ベースラインより優れており、計算コストの高いアンサンブルモデルの予測性能とさえ一致している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:31:42 GMT)
Minimax PAC Bounds for Learning in Exogenous Contextual MDPs [26.6] PAC学習は、割引係数$$、有限状態空間$mathcal X$、アクション空間$mathcal A$、コンテキスト空間$mathcal Z$を含む割引決定プロセスにおける。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:02:18 GMT)
FiCA: Feed-forward instant Gaussian Codec Avatars from a Single Portrait Image [26.6] フィードフォワード,即時ガウスコーデックアバター生成パイプラインであるFiCAを導入し,単一のイメージからライフライクなアバターを生成する。
実験により, フィードフォワードアプローチによって生成されたアバターは, 多様なアイデンティティを忠実に表現し, 競合する最近の手法によるアバターの視覚的品質を上回っていることが示された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:22:17 GMT)
LLM-ACES: Closed-Loop Discovery of Dynamical Systems with LLM-Guided Adaptive Search [26.4] シンボル仮説構築と適応データ取得を協調的に最適化する閉ループフレームワーク LLM-ACES を紹介する。
ODEBenchとODEBaseにまたがる122のODEシステムにおいて、LLM-ACESは最小の中央値NMSEを達成し、最先端のベースラインを桁違いに上回っている。
さらに, LLM-ACESはサンプリング効率が高く, データの10分の1で性能が向上した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:00:52 GMT)
Accelerating Disaggregated RL for Visual Generative LLMs with Diffusion-Based Parallelism and Trainer-Assisted Generation [26.1] DigenRLは拡散型大規模言語モデル(LLM)のフレームワークである
柔軟なリソース割り当てをサポートし、異種GPUに対応し、効率的なタスクスケジューリングを容易にする。
DigenRLは、最先端拡散RLシステムよりも1.56-2.10倍のスループット向上を実現している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:59:35 GMT)
Reliable Conformal Prediction for Ordinal Classification Using the Ranked Probability Score [26.0] Conformal Prediction (CP) は、分布のない予測セットで、限界範囲のカバレッジを保証する。
ランク付け確率スコア(RPS)に基づく順序分類のためのCP手法を提案する。
RPSは、構築によって中央中心の連続予測セットを得る。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:55:13 GMT)
Inclusive Interactive Collisions for Multi-View Consistent Compositional 3D Generation [25.8] 我々は,多視点一貫した合成3Dアセットを合理的な相互作用で生成する新しい最適化手法であるI2C-3Dを提案する。
具体的には、合理的な相互作用領域に自然に現れるガウス的プリミティブを導くための包括的対話的衝突戦略を提案する。
マルチビュー整合性を高めるため,マルチビュー適応スコア蒸留サンプリング法を考案し,事前学習拡散モデルを用いて,複数ビュー整合性前とレイアウト前を抽出する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:48:22 GMT)
S1-Omni-Image: A Unified Model for Scientific Image Understanding, Generation, and Editing [25.7] 本稿では,科学画像の理解,生成,編集のためのオープンウェイト統一マルチモーダルモデルを提案する。
S1-Omni-Imageは、バックボーンS1-VL-32Bの科学的なマルチモーダル推論に基づいている。
統一されたフレームワークで、科学的な画像理解、生成、編集をサポートする。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:19:34 GMT)
A Time-Reparameterized Cumulative Intensity Extrapolation Sampler for Discrete Flow Matching [25.5] TR-CIEは,機能評価の制限によるサンプリング品質の向上を目的としている。
累積強度の局所近似誤差を限定する理論解析を行う。
合成タスク,テキスト生成,テキスト・ツー・イメージのベンチマーク実験により,本手法は限られたNFE下でのサンプリング品質の向上を実証した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:48:45 GMT)
Data-Forcing Distillation: Restoring Diversity and Fidelity in Few-Step Video Generation [25.4] 単行のコード変更だけでMDDの多様性と忠実性を回復する単純なポストトレーニングフレームワークであるData-Forcing Distillation (DFD)を提案する。
我々は,我々のフレームワークの詳細な理論的分析を行い,テキスト・ツー・ビデオ,画像・ツー・ビデオ,自動回帰ビデオ生成に対する我々のアプローチを検証する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:04:55 GMT)
DeepBD: A Grounded Agentic Workflow for Variant Prioritization and Diagnosis of Genetic Birth Defects [25.2] DeepBDは遺伝的欠陥の変異優先順位付けと診断のための接地されたエージェントワークフローである。
DeepBDは18,622例からなる胎児と幼児のコホートを用いて開発され、内部のホールドアウト解決ケースベンチマークで0.658/0.882/0.912/0.929のRecall@2/3/5/10を達成した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:37:48 GMT)
A specialized reasoning large language model for accelerating rare disease diagnosis: a randomized AI physician assistance trial [24.9] 大きな言語モデル(LLM)は稀な疾患の診断をサポートすることを約束している。
RaDaRは、まれな疾患の診断のためのオープンソースのコンパクト推論LSM(32Bパラメータ)である。
RaDaRは評価されたオープンソースモデルの中で最強のパフォーマンスを示した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:42:23 GMT)
Advancing WordArt-Oriented Scene Text Recognition: Datasets and Methods [24.6] WordArt(アートテキスト)は高度にカスタマイズされたフォント、テクスチャ、レイアウトを備えている。
既存のSTRとメソッドは、通常、シーンテキストと固定テンプレート入力を中心に構築され、ウォーターにスケールするのに苦労する。
既存の芸術的テキストデータと比較して、数百倍の精度で2Mの合成データセットであるWater-Sを構築した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:18:50 GMT)
Sentence-Level Contextual Entrainment in Large Language Models [24.5] 文脈エントレメント(Contextual entrainment)とは、モデルがその文脈に現れるトークンに高い確率を割り当てる傾向を指す。
26大言語モデル(LLM)における文レベルの文脈制約について検討する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 02:42:33 GMT)
UniTranslator: A Unified Multi-modal Framework for End-to-end In-Image Machine Translation [23.8] In-Image Machine Translation (IIMT)は、画像中のシーンテキストを翻訳し、翻訳されたテキストを元の領域に戻し、全体の視覚的外観を保存することを目的としている。
最近の統合マルチモーダルモデルは、単一のフレームワーク内で視覚的テキスト理解と画像生成を組み合わせることで、有望なソリューションを提供する。
We present UniTranslator, a unified multimodal framework for IIMT that tightly couples translation understanding and text editing。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:11:24 GMT)
Measuring User's Mental Models of Speech Translation in Human-AI Collaboration [23.6] 本稿では,言語間質問応答に基づく新しい枠組みを用いて,ユーザの音声翻訳システムのメンタルモデルについて検討する。
翻訳品質の異なるユーザ行動と精度傾向を解析することにより,システムがどこが間違っているかを予測することができるかを検討する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:40:36 GMT)
OrbitForge: Text-to-3D Scene Generation via Reconstruction-Anchored Video Synthesis [23.6] ジェネリックテキスト・トゥ・ビデオモデルは、リッチなオープンワールドシーンとして使用できる。
フリーズビデオプリエントから構築されたアダプタであるOrbitForgeを紹介します。
単一のテキスト生成ビデオから、標準的なクローズド・オービットな3Dガウス・スプレイティングシーンに変換する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:50:47 GMT)
GeoT2V-Bench: Benchmarking 3D Consistency in Text-to-Video Models via 3D Reconstruction [23.6] GeoT2V-Benchは、カメラプロップされたT2Vクリップが明確な3D再構成をサポートするかどうかを評価するための診断ベンチマークである。
可視的な動き、静的なレンダリングエラー、フローコンセンサス、フレキシブル-vs-静的な動作は、しばしば相反する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:12:21 GMT)
AsyncOPD: How Stale Can On-Policy Distillation Be? [23.3] オンライン蒸留(OPD)は、教師のフィードバックによって指導された独自のロールアウトで学生を訓練する。
非同期トレーニングパイプラインは、学習者の更新からロールアウト生成を分離することで、このボトルネックを軽減することができる。
本研究は,非同期PDの安定性に関する最初の体系的研究である。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:50:49 GMT)
Modality-Aware Out-of-Distribution Detection for Multi-Modal Action Recognition [23.0] 我々は、行動認識モデルに追加のモダリティを組み込む方法について研究する。
本研究は、マルチモーダル・アウト・オブ・ディストリビューション(OOD)検出の事例に焦点を当てる。
マルチモーダルシナリオ用に明示的に設計されたポストホック検出器を構築した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:39:04 GMT)
Efficient Time-Domain Simulation of USV Motions in Short-Crested Irregular Waves Using an IRF-Based Framework [22.9] 不規則波における容器の動きの伝統的な時間領域予測は、多くの正規波成分からの重畳応答に依存する。
本研究では, インパルス応答関数(IRF)に基づく時間領域フレームワークを適用し, 短絡不規則波の容器運動を予測する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:30:21 GMT)
AVOC: Enhancing Hour-Level Audio-Video Understanding in Omni-Modal LLMs via Retrieval-Inspired Token Compression [22.8] AVOCは、Omni-modal Large Language Modelsにおける長文音声ビデオ理解のためのフレームワークである。
AVOCは、ロングフォームオーディオビデオベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:06:58 GMT)
MVG-KAN: Multi-View Geo-Wind Guided KAN for PM$_{2.5}$ Forecasting [22.7] PM$_2.5$の正確な短期予測は、公衆衛生保護、大気汚染早期警戒、都市環境管理に重要である。
PM$_2.5$ のtextbfMVGutan 予測のためのマルチビュージオウィンド導波管モデルを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:38:14 GMT)
SurveilNav: Collaborative Object Goal Navigation with Robot and Surveillance System [22.6] 74フロアを横断する206台のカメラを備えたHabitat-Sim上に構築された新しい協調オブジェクトナビゲーションデータセットを提案する。
本稿では,アクティブなカメラスケジューリング,共同2D/3Dマッピング,VLMに基づく値推定,協調目標検証を統合した協調ナビゲーションフレームワークであるSurveilNavを提案する。
このシステムは,大規模な捜索,家庭環境,救助活動に強い可能性を示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 19:45:44 GMT)
Progressive Alignment Objectives for Aligner-Encoder based ASR [22.3] 我々はInterAlignerを提案する。これは、中間アリグナーの目的を付加し、アライメントが奥行きにわたって徐々に形成できるようにしている。
17層コンバータを持つLibriSpeechでは、最終的な唯一のアリグナーが5.0/7.8 WERに達する。
InterAlignerはWERをさらに3.1/5.6に減らし、長い発話で最大のゲインを得られる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:09:40 GMT)
TokenMinds: Pretrained User Tokens and Embeddings for User Understanding in Large Recommender Systems [22.1] TokenMindsはPLUMフレームワークをアイテム検索からユーザモデリングまで拡張する産業規模のシステムである。
個別のSIDベースのユーザトークンと、事前訓練されたLLMから適応したエンコーダデコーダアーキテクチャにより、密なユーザ埋め込みの両方を生成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 20:20:37 GMT)
DriveStack-VLA: Render-Teacher Alignment for BEV-Based DeepStack Vision-Language-Action Model [22.1] 本稿では,大規模なVLMバックボーン上に構築されたDriveStack-VLAについて紹介する。
VLA駆動の空間的接地を強化するために,デュアルビジュアル・モデリング・コンポーネントを開発した。
DriveStack-VLAはNAVSIMv1で91.6 PDMS、NAVSIMv2で91.0S、クローズドループのBench2Driveで56.36%の成功率で79.49を記録した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 01:40:54 GMT)
LectūraAgents: A Multi-Agent Framework for Adaptive Personalized AI-Assisted Learning and Embodied Teaching [21.9] LectraAgentsは、エンドツーエンド適応型教育を通じてパーソナライズされた学習を可能にするマルチエージェントフレームワークである。
LectraAgentsは教授と学生の関係を反映し、Agent教授が特別部下の協力チームを率いている。
実験結果から,授業内容の質,具体的授業の質,評価,パーソナライゼーションが既存手法よりも一貫した向上を示した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:01:11 GMT)
NatureBench: Can Coding Agents Match the Published SOTA of Nature-Family Papers? [21.9] 我々はNatureBenchを紹介した。NatureBenchは、ピアレビューされたNature- familyの出版物から抽出した90のタスクの横断的なベンチマークである。
g>0.1基準の下では、最強のモデルが17.8%のタスクでSOTAを上回ります。
ベンチマーク、NatureGymパイプライン、メンテナ側の再現を備えた公開リーダボードをリリースしています。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:58:23 GMT)
PixJail: Self-Evolving Paper-to-Pipeline Reproduction for Text-to-Image Jailbreak Evaluation [21.8] テキストから画像へのジェイルブレイク評価は、単一のプロンプトレベルのテストではなく、複数のステージによって形成されるパイプラインレベルの問題である。
再現可能なT2Iジェイルブレイク評価のための自己進化型紙-パイプ間エージェントフレームワークPixJailを提案する。
我々は、コード利用およびコード利用不可の文書を含む11の代表的なT2Ijailbreakメソッドを再生する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 02:49:10 GMT)
Natural Identifiers for Privacy and Data Audits in Large Language Models [21.6] この研究は、上記の課題に対する新しい解決策として自然識別子(NID)を導入している。
NIDは暗号化や短縮URLのような構造化されたランダム文字列であり、通常のトレーニングデータセットで自然に発生する。
評価の結果,NIDを使用すれば,再トレーニングを伴わずに,ポストホック後のプライバシー監査を円滑に行うことが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:45:11 GMT)
Proactive Systems in HCI and AI: Concepts, Challenges, and Opportunities [21.6] ここ数年、AIの進歩によって、高度に自律的でプロアクティブなシステムへの関心が著しく高まっている。
積極性の概念は、研究や実践を通じて緩やかに定義され、不整合に適用される。
この多分野のワークショップは、前向きなシステムを理解するための、より明確で厳密な基盤を確立することを目的としている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 20:30:58 GMT)
Metis: Bridging Text and Code Memory for Self-Evolving Agents [21.3] 自己進化エージェントは、過去の実行から経験を蒸留し、将来のタスクで再利用することで、時間の経過とともに改善する。
既存のシステムは、エージェントコンテキストに注入された自然な表現テキストや、呼び出し可能なツールとして公開されたコードのような経験を表す。
本研究は,テキストメモリとコードメモリを同一体験群上で分離する最初の制御された研究である。
階層型二重言語メモリ上に構築された自己進化型エージェントシステムであるMetisを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:17:22 GMT)
AutoSpec: Safety Rule Evolution for LLM Agents via Inductive Logic Programming [21.1] 既存の安全アプローチは基本的なトレードオフに直面している。
本稿では,ユーザセーフ/アンセーフアノテーションから専門家が指導する安全ルールを自動生成するフレームワークであるAutoSpecを紹介する。
コード実行とエンボディエージェントドメインにまたがる291の実行トレース上でAutoSpecを評価する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:31:03 GMT)
Escaping the Self-Confirmation Trap: An Execute-Distill-Verify Paradigm for Agentic Experience Learning [21.0] 体験駆動の自己進化は、大規模言語モデル(LLM)エージェントがオープンワールドインタラクションを通じて改善する上で重要である。
既存の経験学習手法は主に単一エージェントループに依存しており、同じエージェントがタスクを実行し、結果を要約し、メモリの内容を決定する。
本研究では,信頼度の高い体験学習のためのエクササイズ・ディスティル・検証フレームワークであるEDVを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:05:05 GMT)
Skills for the future software profession: beyond agentic AI! [20.9] 2026年にニューヨークとシンガポールで開催された2つのラウンドテーブルの結果を要約する。
1つの重要な発見は、エージェントが実装を処理するにつれて、検証と検証の重要性が増していることである。
開発エージェント時代に開発者が必要とするスキルを特定し、将来のソフトウェアエンジニアのトレーニングと教育に役立ちます。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:52:26 GMT)
TIGER: Taming Identity, Geometry, and Generative Priors for High-Quality Face Video Restoration [20.8] Face Video Restoration (FVR) は、劣化した入力から高忠実な顔映像を復元することを目的としている。
我々はTIGERを提案する。Tyos Identity, Geometry, gEnerative pRiors for high-quality FVR。
TIGERは、アイデンティティの忠実度と時間的安定性の両方において最先端のパフォーマンスを実現し、高品質で効率的でアイデンティティに一貫性のあるFVRを提供する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:21:36 GMT)
PDS Joint: A Parametric Double-Spiral Joint Tailored for Dexterous Hands [20.7] 本稿では,大脳皮質運動に対するPDS(parametric doublespiral)を併用した関節について述べる。
複数の変形モードにまたがる方向剛性の体系的な整形を可能にする。
組込み帰納的受容を共同設計し、生の帰納的信号を結合状態にマッピングする学習ベース校正パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:09:02 GMT)
SPACE: Enabling Learning from Cross-Robot Data Toward Generalist Policies [20.6] 状態予測および適応コマンド実行(SPACE)フレームワークを紹介する。
SPACEは、異なる実施形態、同じ実施形態のハードウェアユニット、操作中の1つのロボット内での3段階のロボットダイナミクスの変動を処理します。
実験により、SPACEは異なる実施形態および同じ実施形態のハードウェアユニット間で収集されたデータから学習する際に、制御コマンドを直接予測するポリシーを大幅に上回っていることが示された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 01:32:40 GMT)
Open-Vocabulary BEV Segmentation with 3D-Aware Geometric Constraints [20.3] オープンボキャブラリBEVセグメンテーション(OVBS)を導入し、トレーニングセットを超えてカテゴリを認識する。
OVBEVSegはジオメトリを意識したOVBSフレームワークであり、効率的なガウススプラッティング(GS)ベースのアンプロジェクションを強化する。
nuScenesデータセットでは、OVBEVSegは最先端のパフォーマンスを達成し、未確認のカテゴリで15.3 mIoUのクローズドセットメソッドよりも優れています。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:43:12 GMT)
EPEdit: Redefining Image Editing with Generative AI and User-Centric Design [20.2] Efficient Photo Editor (EPEdit)は、堅牢なバックエンドフレームワークとユーザフレンドリーなフロントエンドインターフェースを統合するアプリケーションである。
EPEditは、画像生成、オブジェクト置換、オブジェクトの削除、バックグラウンド修正、オブジェクトのポーズやパースペクティブの変更、テーマ的なコレクションデザインなど、幅広いクリエイティブなイメージ編集タスクをサポートする。
EPEditの中核は、安定拡散モデルに基づくゼロショット画像編集アルゴリズムを活用し、追加の微調整の必要性を排除している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 02:05:10 GMT)
Are Text-to-Image Models Inductivist Turkeys? A Counterfactual Benchmark for Causal Reasoning [20.2] 実世界の先行を体系的に矛盾させるルールの下で,テキスト・ツー・イメージ・モデルが画像を生成することができるかどうかを検討する。
CF-Worldは、各シナリオを3つのプログレッシブなレベルにまとめる: 通常の世界の知識の下での事実生成、直接的な視覚的指示を伴う明示的な反事実生成、そして変化した規則から因果的推論を必要とする暗黙的な反事実生成である。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:15:07 GMT)
Sexualised synthetic personas encode and amplify gendered power asymmetries through voice [20.2] この研究は、人気のある商用プラットフォームが提供する、AIによって生成された英語音声を性的に分析する。
新しい技術は性的なエンパワーメントとジェンダー表現の多様性を高めることができる。
しかし、有毒な男性性、ヘテロノルマティビティ、女性やLGBTQ+の虐待は、オンラインに広まり続けている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:38:19 GMT)
ViTexQA: A Multi-Frame Temporal Perception Dataset for Video Text Question Answering [20.1] 大規模なビデオテキストQAデータセットであるViTexQAと、堅牢なマルチフレーム時間的推論のためのFrameThinkerを提示する。
提案手法は, ROUGE-Lを6.3%引き上げ, ViTexQAのSOTAベースラインより優れていることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:03:56 GMT)
UniRED: Unified RGB-D Video Frame Interpolation with Event Guidance [19.8] 高フレームレートのRGB-Dビデオは、モーション分析、動的シーン理解、3D再構成など、さまざまな下流タスクに不可欠である。
既存のビデオ手法は、RGBデータに対して高い性能を達成しているが、RGB-Dシナリオには適用できない。
本稿では,RGBの外観,深度幾何学,イベントベースの時間的手がかりを併用したRGB-Dビデオ用統合マルチモーダルフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:03:58 GMT)
PointVG-R: Internalizing Geometric Reasoning in MLLMs for Precise Pointing Localization via Visual Chain of Thought [19.7] ポインティングに基づく視覚的グラウンドリングでは、視覚シーンとポインティングジェスチャの間の複雑な空間的関係を解読することで、ターゲットオブジェクトを正確に特定する必要がある。
推論誘導型マルチモーダル言語モデル(MLLM)であるPointVG-Rを提案する。
我々は,人間の指し示すジェスチャーを解釈する際に使用する反復的認知過程をシミュレートする,新しい幾何学的推論パイプラインを設計する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:06:51 GMT)
Sample complexity of unbalanced entropic OT [19.6] 本稿では, エントロピック不均衡OTの最適結合レベルにおける試料複雑性について検討する。
変換不変な双対定式化を開発し、固有双対変数に対するコンパクト性と強い凸性を証明した。
機械学習の応用において,正則化が実際必要である理由を明らかにした。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:25:47 GMT)
ObsGraph: Hierarchical Observation Representation for Embodied Reasoning and Exploration [19.6] 身体的推論と探索は、ロボットにとってますます重要な能力と考えられている。
ObsGraphは、シーン表現、検索、探索を統一する観察中心の階層的なシーングラフである。
具体的推論と探索ベンチマークによる実験では、成功と効率が改善された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 02:17:08 GMT)
On the Position Bias of On-Policy Distillation [19.4] IW-OPD (Importance-Weighted On-Policy Distillation) は, OPD (On-Policy Distillation) よりもはるかに早く収束することを示す。
IW-OPDは、同じサイズとクロススケールの両方で標準のPDよりも優れた最終性能を実現し、AIME-2025では6.9ポイントまで性能が向上した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:08:09 GMT)
VistaRef: Boosting Visual Spatial Orientation Awareness for Pointing-to-Object Detection [19.2] 自然画像における難解なジェスチャーの接地は、ARと人間とロボットのコラボレーションに不可欠である。
VistaRefは空間的指向の意識を高めるために設計されたフレームワークである。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:30:04 GMT)
DDStereo: Efficient Dual Decoder Transformers for Stereo 3D Road Anomaly Detection [19.1] DDStereoはDual-Decoder Stereo Transformerで、リアルタイムのオープンセット3Dオブジェクト検出を行う。
提案手法は,既存のステレオ3次元検出器を推定速度で超越し,単分子法に匹敵するリアルタイム性能を初めて達成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:54:11 GMT)
RetiSEM: Generalising Causal Models for Fragmented Biomedical Data [18.6] RetiSEMは、限られたマルチモーダルリソース下での因果グラフの回復と仲介分析のためのフレームワークである。
我々はRetiSEMを,次元,非線形性,因果深さ,経路構造に異なる10のベンチマークシナリオで評価した。
実データ解析では、網膜変数は主に下流のバイオマーカーのような指標として振る舞うが、より小さいが検出可能な間接効果を持つ。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:20:17 GMT)
A Dual Edge Spatial Jacobian Image Graph for Interpretable Diabetic Retinopathy Grading [18.6] 糖尿病性網膜症を鑑別するために,両端の空間ヤコビ画像グラフを作成した。
各基礎画像は、4つのアライメントストリームを持つグラフノードとして表現される。
このフレームワークは、病変バイオマーカー仮説生成のための説明可能な表現学習ツールとして位置づけられている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:41:07 GMT)
SoK: AI Secure Code Generation: Progress, Pitfalls, and Paths Forward [18.6] このSoKは、AIセキュアコード生成の進捗、落とし穴、パスを体系化する。
セキュアなコーディング・原則理解は,コードレベルの結果の統計的に強い予測因子であることを示す。
我々は,原理誘導生成,評価,ベンチマーク,エージェントによる具体的な経路を推し進める。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:39:05 GMT)
Project Auto-World: Towards Automated Benchmarking of Neural Relational Reasoners [18.5] リレーショナル構造に関する推論は、ニューラルモデルにとって重要な課題である。
ベンチマーク生成を自動化するために,大規模言語モデルを用いてこの問題に対処する方法について検討する。
我々は、LLMが提案する新しい世界に同じ機械を応用できることを示し、ニューラルリレーショナル推論に関する自律的な研究の扉を開く。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:36:46 GMT)
ScaleToT: Generalizing Structured LLM Reasoning for Billion-Scale Low-Activity User Modeling [18.3] 大規模言語モデルは、静的プロファイルから潜在ユーザ状態を推測できるが、プロファイルがスパースである場合には、この推論は信頼できない。
我々は,LLM処理された小さなサブセットから構造化推論を学習し,それをより広い低活性ユーザ集団に拡張するScaleToTを提案する。
我々は,10億規模の広告展開において,生涯価値(LTV)予測に基づいてScaleToTを評価する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:05:37 GMT)
World Models in Pieces: Structural Certification for General Agents [18.3] 大世界体制では、エージェントは普遍的に能力を持ち得ず、その能力は必然的に世界モデル全体で断片的に特殊化される。
まず、一般エージェントが普遍的でないことを証明し、標準最悪のケース分析を非形式的にする。
本稿では,制約付きゴール条件付き性能をエージェントの内的世界モデルにおけるエントリーワイド保証にマッピングする,トランジションローカルなフレームワークである構造証明を紹介する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:21:09 GMT)
Co-occurring associated retained concepts in Diffusion Unlearning [17.8] 非学習は、人の概念を意図せずに抑制し、モデルが人との画像を生成するのを防ぐ。
保存すべき共起概念を、望ましくない抑制で定義する。
対象概念のみを消去しながらCAREを明示的に保護するフレームワークであるReCAREを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:22:00 GMT)
Stochastic Signed Distance Processes [17.7] マルチビュー表面再構成はコンピュータビジョンの中核的な問題である。
我々はSDFベースのボリュームレンダリングを確率曲面レンダリングとして再構成する。
本手法は, 表面再構成と不確実性定量化の両方において, ベースラインに優れる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 00:46:43 GMT)
InSight: Self-Guided Skill Acquisition via Steerable VLAs [17.6] 視覚言語アクション(VLA)モデルは、デモンストレーションから操作スキルを学ぶことができるが、その能力はトレーニングデータのスキルによって制限される。
本稿では,VLAをプリミティブアクションレベルで操作可能にすることで,自律的なスキル獲得を実現するフレームワークであるInSightを紹介する。
InSightは、ブロックフリップ、引き出しのクローズ、掃除、ねじれ、注水など、シミュレーションおよび実世界の操作タスクにまたがって評価する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:59:01 GMT)
Can Language Model Agents be Helpful Circuit Explainers in Mechanistic Interpretability? [17.6] 本稿では,84個の半合成変圧器回路から構築した回路説明のためのベンチマークであるAgenticInterpBenchを紹介する。
HyVE (Hypothesize, Explain) は,観察,仮説生成,因果検証の反復ループを通じて各コンポーネントを解析するエージェント説明器である。
LMのバックボーンは4つあり、HyVEは有用なコンポーネントレベルの説明とタスクレベルの説明を復元するが、バックボーンが一様でない。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 00:04:31 GMT)
CineCap: Structured Reasoning with Spatio-Temporal Anchors for Cinematographic Video Captioning [17.5] シネマトグラフィーキャプションは、カメラ、ショットサイズ、深度、組成、撮影角度といった映画言語の概念を用いて、ビデオがどのように撮影されるかを記述することを目的としている。
この機能は、微細なビデオ理解と制御可能な映画品質ビデオ生成において重要であるが、既存のマルチモーダルな大規模言語モデルでは未探索である。
CineCapは、構造化推論を原子時間アンカーと組み合わせたフレームワークであり、強化学習を包括性、精度、カバレッジの報酬で行う。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:29:40 GMT)
Boosting Text-Driven Video Segmentation via Geometry-Aware Distillation [17.4] テキスト駆動の参照ビデオオブジェクト(RVOS)は、自然言語で指定されたビデオ内の対象物を特定し、セグメント化することを目的としている。
既存のモデルは、通常、2D画像またはビデオデータセットに基づいて、単純なセグメンテーション損失でトレーニングされる。
テキスト駆動ビデオセグメンテーションを強化するために,GeoLaV(Geometry-enhanced Language-Guided Video segmentation)を提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:57:08 GMT)
Polycepta: Object-Centric Appearance Estimation for Multi-Object Tracking [17.4] Polyceptaはオブジェクト中心の外観状態推定フレームワークである。
オブジェクト中心の外観状態推定フレームワークであるPolyceptaを紹介する。
Polyceptaは90.57Hzで動作し、KITTIベンチマークで最先端のパフォーマンスを提供する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:58:45 GMT)
Don't Go Breaking My LLM: The Impact of Pruning Attention Layers on Explanation Faithfulness and Confidence Calibration [17.1] LLM(Pruning Large Language Models)は、ネットワークの一部を取り除くことで、メモリと推論のコストを削減する。
本研究では,5つのLCMと8つのデータセット間の説明忠実度と信頼性校正に注意層がどう影響するかを検討する。
以上の結果から,LLMの解釈可能性や信頼性は,精度と効率性だけでは得られないことが示唆された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:07:59 GMT)
M^2C-EvDet: Multi-Domain Multi-Order Cross-Modal Knowledge Distillation for Event-based Object Detection [17.0] イベントベースのオブジェクト検出(EvDet)は、高時間分解能と広いダイナミック性を必要とするシナリオにおいて、優れたパフォーマンスを示す。
本稿では,EvDetのマルチドメイン・マルチオーダークロスモーダル知識蒸留フレームワークであるM2C-EvDetを提案する。
周波数学習とハイパーグラフ計算に基づいて構築されたM2C-EvDetは、Adaptive-Decoupled Feature Distillation (AF2D2)とMulti-Order Frequency Distillation (MORD)の2つの特殊なモジュールを統合する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:35:49 GMT)
OTRO: Oblivious Tokenization Path with Square-Root ORAM [17.0] 本稿では,遅延クリティカルなLCMサービスに適した,効率的で難解なトークン化パスOTROを提案する。
OTROは、高速なシングルアクセスルックアップのために平方根のORAMを頼りにしているが、その禁止的な$O(Nlog2N$)再構築コストは、アクセス毎に$sqrtN$である。
OTROはTTFTのオーバーヘッドを少なくとも4.5%に制限し、トークン化によるレイテンシを全TTFTの10%以下に抑え、0.5GB以上のメモリオーバーヘッドを追加する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 01:32:01 GMT)
Asymptotic Signal Subspace Recovery in Softmax Attention Models [16.7] 本研究では,情報とトークンの集合から,クエリベクトルを勾配上昇によって学習するスタイル化されたソフトマックスアテンションモデルについて検討する。
学習した問合せは1次元の信号部分空間にほぼ確実に収束することを示す。
これらの結果は、高次元雑音環境における注意機構を理解するための厳密な理論基盤を提供する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:48:01 GMT)
RigPI: Dynamic Parameter Identification of Rigid Body via VLM-Seeded Differentiable Simulation [16.7] RigPIは、ロボットと物体の相互作用において、剛体と多リンク剛体の動的パラメータを特定するためのフレームワークである。
RigPIは、視覚に基づくセマンティックオーディエンス、フォーストルク測定、モーションオブザーバを、微分可能なシミュレーションパイプラインに統合する。
相対的および原始的な関節を持つ物体に対する大規模な実世界の実験は、RigPIが正確で安定したパラメータ推定を達成することを証明している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 22:15:42 GMT)
CrossPool: Efficient Multi-LLM Serving for Cold MoE Models through KV-Cache and Weight Disaggregation [16.7] LLMサービスは、多くのスパースMoEモデルをホストするが、ほとんどのモデルはスパースリクエストを受け取り、冷たく保つ。
コールドモデルがピーク時のKVキャッシュの需要に達することは滅多にないため、モデル毎の最悪のKV容量を維持することはメモリを浪費する。
FFN重みとKVキャッシュを2つのGPUメモリプールに分離する冷蔵MoEモデルのサーブエンジンであるCrossPoolを紹介する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:34:09 GMT)
CALIBER: Calibrating Confidence Before and After Reasoning in Language Models [16.4] 本稿では,CALIBER(Calibration Before and After Reasoning)について紹介する。
この統一されたプロトコルの下で、CALIBERはBigMathDigitsにおける最強の単一信頼ベースラインよりも、期待エラー(ECE)を52.5%削減した。
より大きな30Bモデルでは、CALIBERはBrierスコアとAUROCの競争力を維持しながら、BigMathDigitsで最高のECEを達成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:03:20 GMT)
Enabling Robust Cloth Manipulation via Inference-Time Simulator-in-the-Loop Refinement [16.3] 物理シミュレーターをバックエンドのロールアウトエンジンとして使用し、オンライン上で予測された軌道を並列に評価し、精巧な名目動作を行う。
シミュレーション可能な布の状態に単一のRGB観測をマッピングする,純粋に合成データに基づいて訓練された実似モジュールを開発した。
実ロボット実験では、成功率が高く、ベースライン法よりも強いことが示されている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:20:12 GMT)
AdversaBench: Automated LLM Red-Teaming with Multi-Judge Confirmation and Cross-Model Transferability [16.3] AdversaBenchは、5つの構造化演算子でシードプロンプトをミュートするエンドツーエンドの赤チームパイプラインである。
本報告では, 推論, 指示追従, ツール利用の3つのカテゴリにまたがる45種の種子について実験を行った。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:50:51 GMT)
Is Higher Team Gender Diversity Correlated with Better Scientific Impact? [16.2] 自然言語処理(NLP)と図書館情報科学(LIS)ドメインの例を用いて,ジェンダーの多様性と論文の科学的影響の相関を分析する。
NLP と LIS の両領域に有意な男女差がみられ,女性学者は少なかった。
紙のコラボレーションにおける性別の多様性と、それらの論文が受ける引用数との間には、逆U字型の関係がある。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 03:25:42 GMT)
A Pāninian Foundation for Indic Language Processing [16.2] インドの言語は、Pniniの文法であるAstdhyyで形式化されたモルフォシンタクティックなアーキテクチャを共有するようになった。
我々は、このPninianフレームワークが、この分野に欠けている統一的な計算アーキテクチャを提供すると論じる。
我々は、この共有アーキテクチャを明確にし、測定可能で、活用可能な4つのベンチマークスイートを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:53:37 GMT)
GRAFT: Graph-Based Affordance Transfer via Part Correspondence [16.0] 学習ベースのアプローチでは多くのデモが必要で、数ショットの環境では失敗する。
GRAFTは、オブジェクトごとの1つの実演のみを用いたゼロショット操作転送のための幾何対応対応フレームワークである。
未知のオブジェクトに対して,まずデモバッファから最も機能的で幾何学的に類似したインスタンスをアライメントした機能部分で検索し,最後に接点をポイントワイド対応で伝播する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 23:58:57 GMT)
Differential Unfolding: Efficient Unfolding Reconstruction for Video Snapshot Compressive Imaging [15.9] ディープ・アンフォールディング・ネットワーク(DUN)は、ビデオスナップショット圧縮イメージング(SCI)を支配している。
既存の手法は、最適化軌跡が静的状態に収束するという事実を無視して、同じ構造で高複雑さの先行を何度も積み重ねる。
我々は、一様反復を動的進化に置き換える不均一なフレームワークである微分展開(DU)を提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:20:50 GMT)
NavWM: A Unified Navigation World Model for Foresight-Driven Planning [15.8] NavWMは、潜在世界推論、マルチモーダルアクション予測、制御可能な視覚生成をシームレスに統合する統合ナビゲーションワールドモデルである。
決定論的なポリシーの限界を克服するために、我々はアンカーベースのマルチモーダル軌道予測フレームワークを導入する。
多様なデータセットにわたる実験により、NavWMは最先端の技術を著しく進歩させることが示された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 03:30:20 GMT)
MJEPA: A Simple and Scalable Joint-Embedding Predictive Architecture for Audio-Visual Learning [15.7] 大規模ビデオデータからの自己教師付き学習が視覚表現学習の主流のパラダイムとして浮上している。
既存の方法は、モダリティ固有のエンコーダと、コントラストや再構成目的の複雑な組み合わせに依存している。
両モードで単一の統一エンコーダを使用する音声・視覚学習のための共同埋め込み型予測アーキテクチャであるMJEPAを紹介する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 22:48:42 GMT)
Information-Theoretic Classifier-Free Guidance with Adaptive Schedule Optimization [15.4] 拡散モデルは、画像、テキスト・ツー・イメージ、ビデオ生成において高いパフォーマンスを達成している。
CFGスケジュール最適化のための情報理論フレームワークを提案する。
ImageNet-512、EDM-XXL、COCO、SD-XLでは、学習スケジュールは一定のガイダンスよりも競争力や改善されたトレードオフを達成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 00:04:04 GMT)
SAFARI: Scaling Long Horizon Agentic Fault Attribution via Active Investigation [15.2] SAFARIは、リニアコンテキストローディングをツール拡張診断ループに置き換えるフレームワークである。
実験の結果,SAFARIは100万トークンの予算内で,最先端の成果を20%上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:23:40 GMT)
Extreme Meta-Classification for Large-Scale Zero-Shot Retrieval [15.2] 本研究では,新規(ゼロショット)アイテムが高速に連続して到着可能な大規模検索タスクに対する効率的なソリューションを開発する。
従来のSiameseスタイルのアプローチでは、クエリとアイテムの両方を小さなエンコーダに埋め込んで、クエリに最も近いアイテムを検索する。
本稿では,新しいアルゴリズムフレームワークであるEMMETTを開発し,新しいアイテムをオンザフライで効率的に分類する。
新しいアルゴリズムであるIRENEはEMMETTのシンプルで効果的なインスタンスであり、大規模デプロイメントに特に適している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 23:41:28 GMT)
Reinforcement Learning for Computer-Use Agents with Autonomous Evaluation [15.1] 自律的な視覚言語評価をGUIエージェントのスケーラブルな監視信号として利用するRLファインチューニングフレームワークを提案する。
自律評価器は不完全であるため、ノイズ補正報酬推定器を導出するノイズ補正報酬チャネルとしてフィードバックをモデル化する。
実験により、補正された評価器の報酬はゼロショットベースラインと生評価器の報酬の両方を上回り、ゼロショット性能で平均12.6ポイント、生評価器の微調整で平均5.1ポイントの成功率を向上させることが示された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:46:29 GMT)
Ill-Posed by Design: Probing Evidence Use in VLMs [15.0] 本研究では, モノクロ計量オブジェクトサイズ推定を, 証拠選択のための不十分な診断条件として提案する。
物理サイズは1つの未校正画像から決定できないため、モデルは不完全なキューのカテゴリ、ターゲットの外観、ローカルコンテキスト、見かけのイメージサイズ、シーンジオメトリに頼らなければならない。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:20:09 GMT)
VSANet: View-aware Sparse Attention Network for Light Field Image Denoising [15.0] VSANet(VSANet)は、光フィールド(LF)イメージをデノイングするための、ビュー対応のスパースアテンションネットワークである。
我々は、VSANetが最先端のLF復調法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:00:44 GMT)
RoBoSR: Structured Scene Representations for Embodied Robotic Reasoning [15.0] ステップワイズ状態遷移として操作を定式化する中間構造表現であるRoBoSRを導入する。
物体の状態とその空間的関係を知覚作用インタフェースでモデル化することにより、RoBoSRは生の入力から高レベルなタスク推論を解き放つ。
我々は、シーン理解、命令解釈、サブタスク計画を共同で監督するオープンワールドデータセットであるManip-Cognition-1.6Mを構築した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:24:52 GMT)
Precision Recall Controllable Radiology Report Generation via Hybrid Natural Language and Clinical Reward Learning [14.7] 高精度リコール制御可能なRRGのための強化学習フレームワークを提案する。
制御パラメータは、推論中に臨床精度とリコールのトレードオフを明示的に調整する。
提案手法は, NLGとCEの両評価基準において, 最先端の手法よりも一貫して優れている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:39:37 GMT)
Blockwise Policy-Drift Gating for On-Policy Distillation [14.6] オンライン蒸留(OPD)は、学生自身によってサンプリングされた軌跡に基づいて計算された教師信号を用いて生徒の政策を訓練する。
本稿では,OPDをロールアウト再利用するための軽量な学生専用ドリフトコントローラであるブロックワイド・ポリシー・ドリフト・ゲーティングを紹介する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 02:58:16 GMT)
HelpBench: Assessing the Ability of LLMs to Provide Privacy, Safety, and Security Advice [14.6] 本稿では,LLMがディジタルプライバシ,安全性,セキュリティに関する質問に対して,正確なヘルプを提供することができるかどうかを評価するベンチマークであるHelpBenchを紹介する。
実際のユーザ状況を表す450の質問をキュレートし,回答の事実的正確さとトーンを評価するために,各質問に対するルーブリックを開発した。
次に,18の最先端LCMからの応答を評価するためにオートレータを開発し,適用した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:05:19 GMT)
Explaining Failures of Cyber-Physical Systems with Actual Causality [14.5] 本稿では,CPS故障説明に実際の因果関係の枠組みを活用するという新しい概念を紹介する。
CPSドメインにおける正しい説明の導出を可能にするために必要なガイダンスを提供する。
このアプローチは、ニューラルネットワーク制御された自律走行車のコンテキストで実証され、評価される。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:13:06 GMT)
Decentralized Pose Graph Riemannian Optimization for Object-based Multi-Robot SLAM [14.2] オブジェクトベースのマルチロボットSLAMでは、ロボットがそれぞれの軌道と複数のエージェントが観察する永続オブジェクトのポーズの両方を共同で推定する必要があるため、問題はより緊密に結合される。
既存の分散化されたソリューションは、通信グラフが物理的相互作用トポロジーと密接に一致していると仮定することが多い。
本稿では、オブジェクトベースのマルチロボットPGOのための完全に分散化されたリーマン最適化フレームワークについて、コンセンサス機構を介して結合推定問題を分離し、柔軟な通信トポロジを実現する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:21:34 GMT)
Adaptive Joint Compression and Synchronisation in Federated Split Learning for IoT Rainfall Prediction [14.0] 本稿では,アクティベーション圧縮と同期間隔rhoを協調的に制御するIoT降雨予測のためのFSLフレームワークを提案する。
このシステムは、11の気象観測所から17のシナリオシミュレーションマトリックスと4つのシナリオRaspberry Piを実際の広域リンク上に配置することで、時間ごとのERA5データに基づいて評価される。
Piでは、選択されたエンドポイントは、アクティベーションアップロードペイロードの87%の削減と、float32ベースラインに対する同期トラフィックの54%の削減を達成すると同時に、ランタイムジッタを+/-688 sから+/-10 sに削減する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:51:16 GMT)
fARfetch: Enabling Collocated AR-HRC in Large Visually Diverse Environments with VLM-Driven AR Content Adaptation [13.9] fARfetchはARヘッドセットとロボット間のセマンティック環境マッピングを統合するAR-HRCシステムである。
視覚言語モデル駆動のARビュー管理は、視覚的に多様な環境において、視認性を維持するために、仮想コンテンツの色、サイズ、方向を適応させる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 20:51:08 GMT)
Intrinsic spectral structure of bipartite nonlocal magic resource [13.9] バイパルタイト非局所魔法資源(BNMR)は、バイパルタイトエンタングルメントに存在する既約非安定化剤性を定量化する。
最小の符号化コア内に任意のバイパルタイト純状態のBNMRを閉じ込める標準符号化フレームワークを導入する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:58:44 GMT)
Neural operator-based digital twins for modeling amyloid-$β$ and tau propagation and treatment optimization in Alzheimer's disease [13.8] 臨床観察から直接バイオマーカーのダイナミクスを学習するデータ駆動型フレームワークを開発した。
予測精度はアミロイドが87%,タウが81%であった。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:23:49 GMT)
Curvature-Guided Mixing for MLLM Adaptation [13.8] 本稿では,事前学習モデルと微調整モデルとを融合する理論的基盤を持つフレームワークであるCurvature Mixing (CGM)を提案する。
CGMは共同最適化目標を定式化し、ロスランドスケープの2階近似を用いて最適で閉じた「ソフトミキシング」比を解析的に導出する。
CGM$dagger$は、新しい曲率対応スコアで導かれるスパースパラメータ選択を行う頑健な「ハードミキシング」変種である。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:21:54 GMT)
Are We There Yet? Exploring the Capabilities of MLLMs in Assistive AI Applications [13.7] マルチモーダル大言語モデル(MLLM)は、視覚エンコーダと大規模言語モデルを組み合わせることで、視覚的理解を再定義する。
本研究は,実世界のタスクにおける最先端モデルを評価することによって,MLLMがAssistive AIをサポートすることができるかどうかを考察する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:44:59 GMT)
Varying Bundle Size Reactive Multi-Task Assignment using Selective Cost Estimation for Multi-Agent Systems [13.6] 本稿では,タスク実行コストを計算コストで見積もる複雑な環境において,マルチロボットタスク割り当てのためのスケーラブルなフレームワークを提案する。
分散された2段階の多要素バンドル生成手法によってこの問題に対処する。
エージェントは、低忠実度(ユークリッド距離など)でガイドされる局所探索木を用いて、バンドル空間を迅速に探索し、最も有望な候補にのみ高忠実な経路計画を適用する。
これらの改良された入札を中央コーディネータに送信し、セットパッキング問題を解決し、グローバルな実現可能性を確保し、全体の有用性を最大化する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:55:20 GMT)
A Fair Evaluation of Graph Foundation Models for Node Property Prediction [13.5] Graph Foundation Models (GFMs) はノードプロパティ予測タスク用に設計されている。
本稿では、ノード特性予測のための最近の9つのGFMを再評価し、それらを強力なグラフニューラルネットワーク(GNN)ベースラインと比較する。
これらのGFMの中では、予測性能において、事前データフィットネットワークのパラダイムに基づく最新のものだけが、よく調整されたGNNよりも優れている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:41:43 GMT)
PanoVine: Whole-Body Visuomotor Control for Soft Growing Vine Robot [13.2] Vineロボットは、適合した体と自己支援型成長機構のために、複雑で制限された環境をナビゲートするのに適している。
自動ブドウ栽培ロボットシステムのための,データ駆動型視覚制御フレームワークを提案する。
複雑な環境でのクローズドループ自律制御の実証からエンド・ツー・エンドのビジュモータポリシーを訓練する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:43:19 GMT)
The Clinician's Veto: Navigating Trust, Liability, and Uncertainty in Autonomous AI Prescribing [13.2] アメリカの法案H.R.238とユタ州の処方薬更新パイロットはどちらも、エージェント能力で医薬品を処方するAIを認可している。
我々は、安全な自律的な処方のための最小限のアーキテクチャ要件として、これらを位置づける規制と技術的議論を示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 19:28:52 GMT)
DTT-BSR+: A Generative-Regression Cascade for Music Source Restoration [13.1] DTT-BSR+ は2段階のカスケード MSR システムで、信号再構成から別々の段階に分割する。
第1段階のDTT-BSRセパレータは、クリーンソースの先行と一致する茎を生成する。
第2段階のデムーズネットワークは、時間領域と多重解像度のスペクトル損失を用いた第1段階の出力を向上する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:22:20 GMT)
DREAM: Dense Retrieval Embeddings via Autoregressive Modeling [12.9] DREAM(Dense Retrieval Embeddings via Autoregressive Modeling)を提案する。
DREAMは、フリーズ言語モデルの選択されたアテンションヘッドに、レトリバー生成クエリドキュメント類似度スコアを注入する。
我々は、0.5Bから3Bパラメータの埋め込みバックボーンを用いて、BEIRとRTEBの検索ベンチマーク上でDREAMを評価する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:00:30 GMT)
EgoSAT: A Comprehensive Benchmark of Egocentric Streaming Interaction Understanding [12.8] EgoSATは、ストリーミング設定におけるエゴセントリックなビデオ推論のための、最初の包括的なベンチマークである。
現代の視覚言語モデル(VLM)の能力を評価するために設計された。
EgoSATには165時間のエゴセントリックな映像が1,997本、高品質な質問応答対が約4,800本ある。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:59:25 GMT)
Pigeonholing: Bad prompts hurt models to collapse and make mistakes [12.6] In-context Learning is shown to be effective in Large Language Models (LLMs)
悪いコンテキストはパフォーマンス低下とモード崩壊を引き起こします。
会話の数が増えるにつれて、ハトは単調に悪化する。
悪条件下でモデルを改善する合成誤差を43-60%改善したRLVRを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:52:22 GMT)
Evaluating the Interpretability of Sparse Autoencoders with Concept Annotations [12.5] 本研究では,SAE潜伏剤と人間注釈概念のアライメントを定量化する人為的評価フレームワークを提案する。
対象属性の摂動によるマッチングを検証する。
我々のフレームワークは、中程度の辞書サイズが最良のトレードオフをもたらし、最も解釈可能なSAEをもたらすことを示唆している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:39:29 GMT)
Life After Benchmark Saturation: A Case Study of CORE-Bench [12.5] ベンチマークの精度が飽和すると、しばしばリタイアされ、より難しいバージョンに置き換えられる。
このアプローチによって精度が向上し、エージェント性能の他の6つの重要な側面を研究する機会を逃していることを示す。
我々は、これらの次元に沿ったエージェントの測定が、精度が飽和した後でも、エージェントのパフォーマンスに関する有意義な洞察をもたらすことを示すためのケーススタディとして、科学コード計算のベンチマークであるCORE-Bench Hardを使用する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 22:30:44 GMT)
VisChronos: Revolutionizing Image Captioning Through Real-Life Events [12.4] 大規模言語モデルと高密度キャプションモデルを用いて,1つの入力画像から実生活事象を識別・記述する新しいフレームワークであるVisChronosを提案する。
本フレームワークは,詳細なイベント記述を自動的に生成し,生成したキャプションの記述品質と文脈的関連性を高める。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 02:05:36 GMT)
BehaviorBench: Benchmarking Foundation Models for Behavioral Science Tasks [11.9] 基礎モデルは、心理学、社会学、経済学のような行動科学領域にますます応用されている。
我々は4つのコア機能に沿って基礎モデルを評価する包括的なベンチマークであるBehaviorBenchを紹介した。
我々はさらにBe.FM-1.5を開発し、行動データに基づいて微調整された行動基礎モデルのBe.FMファミリーを拡張した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:30:54 GMT)
QC-SMOTE: Quality-Controlled SMOTE for Imbalanced Classification [11.5] QC-SMOTEは、近距離信頼度スコアを用いて、少数サンプル信頼性を推定する。
合成候補は、IPQ誘導のベスト・オブ・K戦略を用いて生成される。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:23:18 GMT)
TRUSTMEM: Learning Trustworthy Memory Consolidation for LLM Agents with Long-Term Memory [11.5] 大規模言語モデル(LLM)エージェントは、拡張されたインタラクションをサポートし、有限コンテキストウィンドウを超えてパーソナライズされたアシストをサポートするために、長期記憶に依存している。
既存のメモリエージェントは、生成された書き込み、修正、削除によって外部メモリを積極的に更新する。
これらの更新は、重要な情報を省略したり、既存の記憶を破損させたり、幻覚コンテンツを導入したりする可能性がある。
本稿では,メモリ統合の信頼性向上を目的としたフレームワークであるTrustMemを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 20:49:28 GMT)
Revealing Training Data Exposure in Vision Language Large Models via Parameter Gradients [11.5] VLLM(Vision-Language Large Models)は、巨大なクロールコーパスで訓練された大規模モデルである。
GradAuditは、内部最適化のダイナミクスを調べる勾配ベースの監査フレームワークである。
これらの勾配シグネチャを解析することにより、GradAuditは強い分離性を実現し、真の画像テキスト関連を検出する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:34:43 GMT)
A Single Stepsize Suffices for Unprojected Linear TD(0): Simultaneous Robust and Fast Rates via Polyak--Ruppert Averaging [11.5] 我々は、Polyak-Ruppert平均化を用いた非計画的TD(0)アルゴリズムの高確率保証を提供する。
この結果に基づいて,PR平均に対する同時高確率収束保証を確立する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:37:01 GMT)
New Bounds for the Last Iterate of the Stochastic subGradient Method [11.2] 本稿では,1次元凸リプシッツ目標に対する下段法の最後の繰り返しについて検討する。
最後の繰り返しは1/sqrt n$の順序の最適化誤差を特徴とする。
i.d.仮定がなければ、最適化誤差は位数 $(log n)/sqrt n$ となる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:55:18 GMT)
FirmCure:Towards Autonomous and Adaptive Rehosting of Linux-Based Firmware [11.1] フルシステムの再ホストは、Linuxベースのファームウェアのセキュリティ分析において重要な役割を果たす。
我々は、Linuxベースのファームウェアを自律的かつ適応的に再ホストする最初のLLM駆動のフルシステム再ホストフレームワークであるFirmCureを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:15:54 GMT)
Parallel Dynamic Programming for Conic Linear Quadratic Control [11.0] 線形二次制御問題は線形制御理論とモデル予測制御(MPC)の中心にある
本稿では,乗算器の交互方向法(ADMM)を用いて,円錐最適制御問題を計算的に要求する並列時間アプローチを提案する。
2つの実世界のアプリケーションに関する数値ベンチマークでは、マルチコアCPUハードウェアに関する既存のアプローチと比べて5倍のスピードアップを示している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:26:38 GMT)
RAVEN: Long-Horizon Reasoning & Navigation with a Visuo-Spatio-Temporal Memory [10.9] RAVENは、長距離ロボットによる質問応答とナビゲーションのためのエージェントメモリシステムである。
RAVENは、ベクトルデータベースにポーズと時間で視覚的な埋め込みを格納し、検索を空間マップに置き、クエリに応答する。
我々は、自然言語のゴール取得のための長距離ナビゲーションを行うために、Unitree Go1ロボット上でRAVENをインスタンス化する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:56:41 GMT)
Towards Federated Long-Tailed Graph Learning: An Energy-Guided Dual Decoupling Approach [10.9] 我々は、トポロジ的浄化とセマンティックリカバリを分離した二重疎結合パラダイムに基づくフレームワークであるFedEPDを提案する。
FedEPDは様々な長い尾のベンチマークで最先端のパフォーマンスを達成し、精度は4.97%、マクロF1は5.48%まで向上した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:25:40 GMT)
Hierarchical Partial-Order Models for Ranking [10.8] 階層的部分順序 (HPO) モデルを導入する。
我々は,HPOモデルとHCPOモデルが,予測性能と構造的解釈可能性の両方において既存手法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:17:34 GMT)
Training for the Model You Return: Improving Optimization for Iterate-Averaged Language Models [10.7] 多くの現代の言語モデル(LM)パイプラインは、トレーニングパラメータの指数的な移動平均のような平均モデルを返す。
この平均的なパフォーマンスを改善するために、トレーニングをどのように変更すればよいのか?
本稿では, 最適制御問題として, 反復平均推定器の設計を定式化することによって, この問題を考察する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:47:40 GMT)
Light-weight Pronunciation Assessment via Discrete Speech Token Surprisal [10.6] 自動発音評価の訓練は、しばしばラベル付き学習者エラーや収集にコストがかかる非ネイティブコーパスに依存している。
そこで本研究では,教師なしあるいは軽微な校正を行うために,ネイティブ音声リソースのみを訓練した軽量なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:40:32 GMT)
Task Decomposition for Efficient Annotation [10.5] 構造化表現の高品質なアノテーションは、大きなコーパスを介して収集するのに高価である。
従来の構造アノテーションでは、各完全な例は1つのアノテータによってエンドツーエンドに実行される。
本稿では,アノテーションプロジェクトの集約的負荷を軽減するため,アノテーションタスクをサブタスクに分解することを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:58:46 GMT)
Scalable Physics-Inspired Transformers for Spin Glasses [10.4] 我々は、解釈可能なスパースアテンションとスピン調整された位置埋め込みを備えた物理インスピレーション型変圧器を開発した。
バニラ変動自己回帰ネットワーク上で最大2桁のスピードアップを達成する。
完全な確率分布、自由エネルギー、シェリントン・カークパトリックの温度と2Dまたは3Dエドワーズ・アンダーソンのモデルとの重なり合う統計を解くことができる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 03:17:22 GMT)
Frequency Domain Reservoir Computing [10.3] Echo State Networks (ESN) は、時間を通してバックプロパゲーションを回避するために、固定されたリカレントウェイトを利用することによって、魅力的なアプローチを提供する。
本稿では、周波数領域で完全に動作するESNアーキテクチャである周波数領域貯水池計算(FRESCO)を紹介する。
FRESCOは、トレーニングと推論の計算コストとエネルギー消費を大幅に削減する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:14:46 GMT)
BIM-Edit: Benchmarking Large Language Models for IFC-Based Building Information Modeling [10.3] 大規模言語モデル (LLM) はコンピュータ支援設計 (CAD) に適用され、設計成果物を生成する。
本稿では,ビルディング情報モデルの自然言語編集におけるLLMの評価ベンチマークであるBIM-Editを紹介する。
我々は,幾何学的精度,意味的妥当性,位相的整合性という3つの次元のアウトプットを評価する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:59:35 GMT)
Uncertainty-Aware Longitudinal Forecasting of Alzheimer's Disease Progression Using Deep Learning [10.3] 本稿では,オーディナル診断予測,マルチ水平軌道生成,不確実性推定を組み合わせた確率的フレームワークを提案する。
ADNIでは、リニア、リカレント、トランスフォーマーのベースラインを上回り、次世代の診断予測を行う。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:04:27 GMT)
Discrepancy for Random Linear Codes [10.1] ランダムな線形符号は、幅広い状況下でほぼ最適な相違性を持つことを示す。
まず、ランダムな線形符号は、容量以上のエラーからリスト復号する非構造化のランダム符号と一致する。
第二に、素体上のランダム線形符号はゼロエラーリストのキャパシティ上の非構造化ランダム符号と一致する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:01:54 GMT)
MANGO: Automated Multi-Agent Test Oracle Generation for Vision-Language-Action Models [10.0] VLA対応ロボットの既存のテストアプローチは、手動で構築されたシンボリックテストオラクルに依存している。
本稿では,自然言語記述から細粒度を自動生成するマルチエージェントフレームワークMANGOを紹介する。
We evaluate MANGO on the LIBERO_10 and RoboCasa Humanoid benchmarks。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:00:06 GMT)
UniDrive: A Unified Vision-Language and Grounding Framework for Interpretable Risk Understanding in Autonomous Driving [9.9] 本稿では,自律運転におけるリスク理解のための統合型視覚言語と接地フレームワークを提案する。
UniDriveは、多フレーム視覚入力からシーンダイナミクスをモデル化する時間的推論ブランチと高解像度の知覚ブランチを組み合わせる。
実験の結果、UniDriveはキャプションとリスクオブジェクトのグラウンドの両方において、画像ベースとビデオベースのベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:17:39 GMT)
Differentiable Packing of Irregular 3D Objects with Adaptive Container Estimation [9.8] 6Nオブジェクトのポーズパラメータと,1つの勾配に基づくループ内の3つのコンテナ側の長さを共同で最適化する,微分可能なパッキングフレームワークを提案する。
パイプラインはPythonとPyTorchで実装されており、物理エンジン、FFTライブラリ、凸分解はない。
複数のオブジェクトカテゴリに対して、単一のコンシューマGPU上でインスタンス毎に4分未満で実行しながら、タイムマッチングDBLFよりも11~32%小さく、N=100でベースラインをシミュレート・アニールするコンテナを生成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:37:12 GMT)
On the Stability of Prompt Ranking in Large Language Model Evaluation [9.7] 本稿では,ランダムシードや限定評価サブセットなど,変数の共通源下でのランク付け安定性について系統的に検討する。
全体的なランク相関は、しばしば適度に高いが、トップパフォーマンスのアイデンティティは頻繁に変化し、信頼性の低い選択決定につながる。
本稿では,性能と分散性の両方を考慮し,信頼度を低くした簡易な安定性を考慮した選択戦略を提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:13:47 GMT)
REDI-Match: Rotation-Equivariant Distillation for Efficient and Robust Dense Matching [9.5] ヴィジョン・ファンデーション・モデル(VFM)は、非常に高度な特徴マッチングを持つが、飛行機内での激しい回転は重要な課題である。
Redi-Matchは、新しいRotation-Equivariant Distillation(REDI)パラダイムによって駆動される効率的なフレームワークである。
現在のSOTAよりも1.9倍高速に動作しながら、SatAstデータセットの13.89%の絶対的なポーズ精度の向上を実現している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:05:20 GMT)
Topological Codes from Space Groups: A Route beyond Translation Invariance [9.3] トリック符号を含む位相符号は、安定化符号の最も重要なクラスの一つである。
本稿では,空間群と点群演算を組み合わせたCalderbank-Shor-Steane (CSS) コード構築フレームワークを提案する。
我々のフレームワークは、トポロジカルなコードの景観を拡大し、量子コンピューティングプラットフォームとの共同設計のための新たな道を開く。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:22:16 GMT)
What Does a Pathological Speech Assessment Model Know about Acoustic Features? A Case Study on Oral and Oropharyngeal Cancer Patients [9.3] 本研究は, 口腔・口腔咽頭癌患者に対するWav2Vec 2.0に基づく音声明瞭度評価モデルの解釈可能性について検討した。
モデル埋め込みとeGeMAPS低レベル記述子との相関を解釈可能な参照として測定することにより、モデル層間の音響情報のエンコード方法を分析する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:37:10 GMT)
It's Complicated: On the Design and Evaluation of AI-Powered AAC Interfaces [9.2] 6つの拡張的および代替的な通信問題空間の複雑な性質について検討する。
人々の交点ニュアンスを考慮した,より堅牢な評価手法を提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:34:18 GMT)
An Agnostic Machine Learning Model of Photosynthetic Habitability [9.2] 光合成ハビタブルゾーン(PHZ)は、最近、標準居住域と恒星の光が光合成を駆動するのに十分な軌道範囲との重なり合いとして提案された。
熱力学およびレドックス化学において基底となる光合成の一般化モデルから導かれる無知なPHZを導入する。
我々のシミュレーションは、光合成生物がより大きな光ハーベスティング構造を進化させることによって、フラックスの減少を補うことを予測している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:45:54 GMT)
Erased, but Not Gone: Output Forgetting Is Not True Forgetting [9.1] 標準出力レベル評価は、アンラーニングの成功を体系的に過大評価できることを示す。
この強いレンズの下では、現在の手法はしばしば出力層で忘れられ、再トレーニングに対して構造化ミスマッチを示す。
この構造ミスマッチは、非対称性を忘れ/保持し、方向ミスマッチ、およびリトレーニング関連方向に沿った集中残差を特徴とする。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:23:53 GMT)
Can Aggregate Invariants Accelerate Continuous Subgraph Matching? Limits, Laws, and a Dynamic Spectral Index [9.1] 本研究では, 動的グラフ上での非連続部分グラフマッチングを高速化できるかどうかを考察する。
4回のタッチアップデートで、基本的にすべてのプルーニングパワーを失うことを示しています。
分離されたCSMベンチマークに統合され、同一のマイナススペクトル制御に対して、テストは最大51%の候補を削除した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:58:44 GMT)
Bridging the Manifold Gap: Riemannian Residual Line Search for One-Step Image Editing [9.0] 1ステップの拡散エディタは、反転と反復最適化を避けるため、高速である。
単一のトランスポート更新は、ターゲットのプロンプトを実現するのに十分なアグレッシブで、ソースイメージを保存するのに十分な保守的でなければならない。
提案手法は,プロンプトデルタ場の局所時間曲率を推定することにより,より強力な編集を行う。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:23:53 GMT)
Fabric Image Demoiréing Benchmark from Synthesis to Restoration [8.9] ファブリック・モアレ(Fabric moiré)は、微細な織物パターンとカメラセンサーグリッドの相互作用によって引き起こされる、サンプリングによって誘導されるエイリアシングアーティファクトである。
ファブリック画像復号化のための総合的なベンチマークを初めて提示する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 02:29:51 GMT)
Unified Dominance Graph for Interval-Predicate Approximate Nearest Neighbor Search [8.9] 我々は、オブジェクト間隔とクエリ間隔の間の述語によって妥当性が決定されるInterval-Predicate ANNSについて検討する。
既存のレンジフィルタANNS法は1次元スカラーフィルタのために設計されている。
We propose the Unified Dominance Graph (UDG) a graph-indexing framework for the closed two-bound conjunctive fragment of IPANNS。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:46:28 GMT)
An LLM-based Two-Stage Transformer Framework for Cross-Domain Bearing Fault Diagnosis with Limited Data [8.9] ベアリングフォールト診断は、データセットの不均一性、動作条件の変化、ラベル付きデータとの同時実行において重要な課題に直面している。
本稿では,軽量GPT-2型トランスを用いた知識誘導型2段階移動学習フレームワークを提案する。
一般化可能な表現のための多元的学習、ターゲット適応のためのプロトタイプベースの知識変調、分類順応的分類による双対シフト問題に対処する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:46:07 GMT)
Affective AI Safety: The Missing Piece in LLM Safety [8.9] 我々は,人間は情緒的存在であるという事実に根ざした,統合されたAI安全のクラスとしての情緒的安全を提案する。
本研究では, 情緒的害の分類法を開発し, 繰り返し発生する害のタイプを同定する: (1) 情緒的自己意識, (2) 公平性と偏見的害, (3) 関係的害。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:31:49 GMT)
Swarm-Inspired Generation of Collective Behaviors in Graph Dynamical Systems [8.9] Swarm-Inspired Emergent Synchronizer (SIES) は、制御可能な集団組織のための一般化可能な局所的相互作用法則を学習するグラフ力学フレームワークである。
同期制御のために、SIESは、訓練されていないネットワークスケールでCDSの所定の同期パターンを生成する一般化可能な結合演算子を学習する。
グラフ表現学習では、SIESはメッセージパッシングに同じ署名された相互作用原理を適用し、最高性能を達成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:53:36 GMT)
SER: Learning to Ground Video Reasoning with Semantic Evidence Rewards [8.7] 制約されたタスクとしてRLを改革するためのセマンティックエビデンス・リワード(SER)を提案する。
ピクセルレベルのアノテーションを計算する代わりに、SERはVLMを拡張したレフェリーを使用してモデル生成のエビデンスのクレームを評価する。
VLMベンチマークでは、SERは49.6%を獲得し、強いエビデンスベースラインよりも3.0ポイント向上した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:50:33 GMT)
DynaWM: Dynamics-Aware Distillation with World Model and Momentum Targets for Smooth Locomotion over Continuous Stairs [8.4] 動的認識型表現学習フレームワークDynaWMを提案する。
本研究では,世界モデルをレギュレータとして導入し,フォワード力学の認識を強制し,包括的地形形状を保存する。
非定常教師更新による次元的崩壊を防止し、一貫した蒸留ターゲットを提供するために運動量目標エンコーダを用いる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 03:07:42 GMT)
Agon: An Autonomous Large-Scale Omnidisciplinary Research System Built on Prompt Economy [8.3] textscAgonは、ワークフロー内で何がチェック可能かを検証し、残りの判断を人間の科学者に任せる研究オーケストレータである。
textscAgonは、Prompt Economy、Future-Facing、Minimmal Prompts、OmniDisciplinary、Massive Parallelism、Zero-Codeの6つの設計原則に基づいて構築されている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:57:09 GMT)
Training-free Cross-domain Few-shot Segmentation via Robust Semantic Representation and Matching [8.3] クロスドメインFew-shot (CD-FSS) は、ソースドメインから異なるターゲットドメインに学習した知識を転送することを目的としている。
トレーニングオーバーヘッドとオーバーフィッティングの両方を回避するために,トレーニング不要のフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:19:30 GMT)
Hierarchical Spatial and Channel Aggregation for Cross-domain Few-shot Segmentation [8.3] クロスドメインFew-shot (CD-FSS) は、ソースドメインの豊富な注釈付きサンプルから一般化可能なセグメンテーション能力を学ぶことを目的としている。
提案手法は,4つのターゲット・ドメイン・データセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:18:53 GMT)
EComAgentBench: Benchmarking Shopping Agents on Long-Horizon Tasks with Distributed Hidden Intent [8.1] EComAgentBenchは、実際のAmazon製品とレビューに根ざした62のタスクのベンチマークである。
各タスクは、要求を可視クエリ、ツールゲートプロファイル、スクリプトによる明確化に分散する。
typed, source-tagged rubricsは、各タスクをグレードし、各障害を要件とそのソースに原因付ける。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:51:01 GMT)
FlowDec: Temporal Conditional Flow Decorruptor for Robust Continuous Vision-Language Navigation [8.0] VLN-CE(Vision-and-Language Navigation in Continuous Environments)では、エージェントが見えないシーンで自然言語の指示に従う必要がある。
本稿では,LMベースのVLN-CEに適した画像復元フレームワークであるFlowDecについて紹介する。
FlowDecは、ナビゲーション精度と生成遅延の両方において、最先端の破壊方法よりも優れています。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 03:11:10 GMT)
BFMTrack: Latent Sequence Optimization for Physics-Based Motion Tracking with Behavioral Foundation Models [8.0] 行動基礎モデル(BFM)は、物理的に妥当な行動の豊富なレパートリーを、大規模な運動データセットによってガイドされた潜在空間に整理する。
これらのモデルは、ゴール取得や状態ベースの報酬最適化のような時間不変のタスクで優れているが、その潜在空間は、モーションシーケンスの追跡のような時間変化の目的を直接サポートしていない。
本稿では,これらの欠点に対処する新しいLatent Sequence Optimization(LSO)を提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:12:22 GMT)
Can Scale Save Us From Plasticity Loss in Large Language Models? [7.8] 多言語連続学習問題に基づいて学習したGPT型トランスフォーマーモデルの可塑性損失について検討した。
塑性損失の開始は、予測可能なスケーリング法則に従っており、モデルサイズとサブリニアに成長する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:14:52 GMT)
FedUP: One-Shot Federated Unlearning via Centroid-Guided Plug-in Filters [7.8] フェデレーテッド・アンラーニング(FU)は、分散システムにおいて忘れられる権利のような法的義務に従うために重要である。
我々は,軽量なプラグブルフィルタを利用したワンショット・フェデレーション・アンラーニング・フレームワークであるFedUPを提案する。
多様な画像およびテキストタスクの実験は、FedUPがターゲット外の知識損失を効果的に減少させることを示した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 03:59:22 GMT)
Low-Cost High-Order Singular Value Decomposition for Tensor-Based Reconstruction from Sparse Sensor Measurements: Urban Flow and Air-Quality Applications [7.8] 本研究では,高次元環境分野を対象とした新しいテンソルベーススパースセンシング再構築フレームワークを提案する。
著者の知る限り、この手法は空間再構成のためのスパースセンシングとHOSVDを組み合わせた最初の手法である。
この手法は3次元の速度場と汚染物質濃度場を、利用可能な空間的位置の1~4%だけを用いて再構成する都市流れと大気質データセットに適用できる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:39:50 GMT)
Kops: Safely Extending the eBPF Compilation Pipeline with Native Operations [7.8] eBPFはネットワーク、可観測性、セキュリティなどの領域でOSカーネルを安全に拡張する。
ユーザスペースコンパイラやカーネルモジュールがカーネルコアを変更することなく,新たな操作を導入することができる拡張インターフェースであるKopsを紹介する。
x86-64とARM64では、EInsnはEBPFマイクロベンチマークを最大24%スピードアップし、プロダクションアプリケーションを最大12%スピードアップする。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:55:36 GMT)
Initial-state-dependent dephasing effect in non-Hermitian Su-Schrieffer-Heeger models [7.7] 実空間における利得と損失の交互に変化する有限サイズの非エルミートなSu-Schrieffer-Heeger格子モデルに焦点をあてる。
本研究は, 純粋な脱落条件下での微量距離の動的進化について検討する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:12:17 GMT)
Pocket-SLAM: Rendering-Area-Aware Pruning for Memory-Efficient 3DGS-SLAM [7.6] 本稿では3DGS-SLAMのためのレンダリングエリア対応プルーニング戦略を提案する。
本手法は大規模屋外シーンにおける既存のプルーニング手法より一貫して優れる。
結果は、3DGS-SLAMを現実の自律運転シナリオにスケールするための有望な方向として、レンダリングエリア対応プルーニングを強調している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:48:58 GMT)
RE4: Transformation-aware Imitation of Object Interactions Using Manipulation Modes [7.6] 本稿では,オブジェクトインタラクションのための現代的な模倣学習ベンチマークについて再検討する。
本稿では,操作の原理的理論を再利用し,性能と解釈可能性の両立を図る枠組みを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:37:50 GMT)
From Open Waters to Enclosed Cabins: ProteusVPR for Cross-Scene Visual Place Recognition in Maritime Perception and Cabin Inspection [7.6] 海洋環境のクロスシーンシフトは、視覚的場所認識(VPR)に特有の課題をもたらす
既存のVPRメソッドは、非常に異なるシナリオで確実に一般化できない。
本稿では,2段階の検索・リファインメントフレームワークProteusVPRを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:22:54 GMT)
On the Limits of Stretching Quantum Pseudorandomness [7.5] 擬似乱数状態は古典的擬似乱数生成子の量子アナログである。
単一コピー型セキュア擬似乱数状態間の出力長の異なる最初のブラックボックス分離を証明した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:00:17 GMT)
Toward Low-Latency Vision-Language Models with Doubly-Correct Predictions in Egocentric Visual Understanding [7.5] 本稿では,2重補正のレンズによるVLMプルーニングの新たな研究について述べる。
我々の実験は、既存の刈り取り法は、しばしば正しい証拠の局所化を保っているが、正確な予測を損なうことを示した。
我々は、証拠と判断をよりよく整合させる合理性インフォームドプルーニング戦略を提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 20:46:54 GMT)
Poster: Exploring the Limits of Audio-Based Detection of Turkish Phone Call Scams [7.5] 本研究では,トルコ語における大規模な言語モデルが詐欺検出をどのようにサポートするかを検討する。
我々は,100組の音声書き起こし対のスカムと良心的な会話からなる,最初の公開マルチモーダルデータセットを紹介する。
以上の結果から,書き起こしによる入力は直接音声処理より一貫して優れており,人間の誤りや訂正されていない書き起こしは相容れないことが示唆された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:56:47 GMT)
Dustin: Draft-Augmented Sparse Verification for Efficient Long-Context Generation with Speculative Decoding [7.5] Dustinは投機的復号化のために設計されたスパース検証フレームワークである。
ドラフトモデルからのルックアヘッド信号とターゲットモデルからの歴史的な注意を統合して、クリティカルトークンを識別する。
自己アテンションの27.85倍のスピードアップと、32kのシーケンス長で9.17倍のエンドツーエンドのデコードスピードアップを実現している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:51:20 GMT)
Holistic Data Scheduler for LLM Pre-training via Multi-Objective Reinforcement Learning [7.4] 我々は,新しいオンラインデータミキシングフレームワークであるHolistic Data Scheduler (HDS)を紹介した。
HDSは、連続的な制御空間における強化学習問題として、データスケジューリングの課題を定式化している。
品質に対するデータ駆動報酬、ドメイン間の影響を捉えた損失駆動報酬、重量ノルムに基づくモデル駆動報酬を統合する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:32:46 GMT)
Hitting a Moving Target: Test-Time Adaptation for AI Text Detection under Continual Distribution Shift [7.3] AIテキスト検出のためのデプロイされたアプローチは、人書きテキストとAI生成テキストの両方のラベル付きデータセットへのトレーニング時間アクセスに依存することが多い。
本研究では,半教師付き学習を用いたテスト時間適応手法を提案する。
テストタイムの適応は、AIテキスト検出のための将来性のあるフレームワークである、と私たちは確信しています。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 20:37:18 GMT)
Agentic Generation of AST Transformation Rules for Fixing Breaking Updates [7.3] 固定変換を生成するエージェントフレームワークであるBigBagを紹介する。
BigBagは、APIレベルで修復ロジックをエンコードし、同じアップデートで壊れたクライアントに転送する。
プロジェクト間で生成された転送は、すべてのクライアントが影響を受けるAPI要素を均一に呼び出す更新のために、全体の33.3%と80%以上のプロジェクト間の修正率を達成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:27:35 GMT)
The Gentle Collapse: Distributional Metrics for Continual Learning [7.3] 本報告では, 真のラベルランク(TLR), 予測信頼度, および, 連続的な忘れを特徴付ける分布の分散度にまたがる6つのソフトマックス由来の指標について紹介する。
CIFAR-100では、これらの指標が正確でない情報を持っている:0%の精度で、Confusion Marginは[0.32, 0.50]のICCにまたがっており、精度は同じである。
損失重みとして使用されるサンプル単位のスコアは、CIFAR-100上の統一経験リプレイ(ER)よりも1.3ポイント少ない。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 20:53:06 GMT)
Digital Twin-Driven Adaptive Sim-to-Real Alignment via Reinforcement Learning for Vibration-Based Bearing Health Monitoring Under Data Scarcity [7.3] 回転機械の振動に基づく健康モニタリングには, 運転データ制約下での信頼性の高い故障診断が必要である。
特徴アライメントを、近似ポリシー最適化によって解決された連続的なマルコフ決定プロセスとして定式化する。
非対称性を意識した戦略は、ポリシーに整合した模擬サンプルで断層クラスを増大させながら、正規クラスのための実データを予約する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:47:24 GMT)
Fast and Parallel High-Rate STAR Architecture for Megaquop Quantum Simulation [7.3] 本稿では,アルゴリズムの対称性駆動共設計,QEC符号,中性原子ハードウェアに基づく局所格子ハミルトンシミュレーションのための高速STARアーキテクチャを提案する。
結合論理代表は、コードブロック内のすべての$k$論理キュービット上でSTARインジェクションを並列に実行することを可能にする。
これらの結果は、高速符号を用いた早期フォールトトレラント量子シミュレーションへの具体的な経路を提供する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:55:45 GMT)
Forget to Improve: On-Device LLM-Agent Continual Learning via Budget-Curated Memory [7.3] オンデバイス言語モデルエージェントは、重みを更新するよりも、取得したメモリでの経験を蓄積することで改善する。
エージェントのエクスペリエンス・メモリのライフサイクルを管理する1バイト当たりのネット値スコアであるsysを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 19:42:07 GMT)
TurboMPC: Fast, Scalable, and Differentiable Model Predictive Control on the GPU [7.2] TurboMPCは、GPUで完全に動作する差別化可能なMPCソルバである。
TurboMPCは、状態と制御の制約、暗黙的、クロスタイムの結合コスト、スラック変数をサポートする。
我々は、制約付き計画、ヒューマノイド模倣学習、ニューラルネットワークコスト関数タスクによる強化学習についてTurboMPCを検証する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 00:42:33 GMT)
Tensor-Based Batch Fuzzing with Adaptive Perturbation Scaling for Deep Neural Networks [7.2] 適応的な摂動スケーリングを備えた仕様対応バッチファジリングフレームワークを提案する。
我々のフレームワークは、同じ時間予算の下で、シーケンシャルベースラインよりも最大40倍高いスループットと4倍の違反を達成する。
当社のフレームワークは,TrafficSigns,Cifar100,TinyImageNetにまたがる6つのネットワークと400以上の仕様を網羅する3つのベンチマークで広く評価している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 23:56:21 GMT)
Detecting and Controlling Sycophancy with Cascading Linear Features [7.1] 動作に責任のあるカスケード線形特徴を分離する反復データ生成パイプラインを提案する。
私たちは、ユーザのバリデーションを優先する言語モデルの傾向である、梅毒の検知とステアリングに重点を置いています。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 20:10:53 GMT)
Learning Perceptive Platform Adaptive Locomotion Controllers for Quadrupedal Robots [7.0] 配置可能な四面体制御のための形態認識強化学習に知覚がどのように統合されるべきかを検討する。
我々は、盲点ベースライン、批判知覚的変種(MorAL+)、完全に知覚的アクター批判型(PPAL)を比較した。
その結果、批評家のみの知覚は、知覚ノイズ下での完全な知覚的ポリシーよりも安定しながら、ブラインドベースラインよりも頑健さと一貫性を向上することが示された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:10:42 GMT)
Legible and Intuitive Multi-modal Robot State and Intent Communication Validated in Online and Real-world Studies [6.9] 本研究では,移動型非ヒューマノイドロボットにおける既存のコミュニケーション戦略の体系的,大規模比較検証を行う。
我々は,旋回意図,注意要求,エラー状況,ロボットが立ち往生しているかどうか,正常に機能しているかどうかを解析する。
高度に表現力のあるマルチモーダル通信が,LEDを用いたコミュニケーションよりも正確で直感的なコミュニケーションであると認識されるという強い証拠が得られている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:27:17 GMT)
FT-WBC: Learning Fault-Tolerant Whole-Body Control for Legged Loco-Manipulation [6.9] 脚のあるマニピュレータは、脚のあるプラットフォームとロボットアームの操作能力を組み合わせる。
アームによって誘導されるセンター・オブ・マスのシフトとダイナミックな障害により、システムはアクチュエータの故障下で不安定になりやすい。
アクチュエータ故障下での足関節マニピュレータの頑健な全身制御のための耐故障性ロコマニピュレーションフレームワークFT-WBCを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:58:45 GMT)
Geometry-Aware Style Transfer in 3D Gaussian Splatting [6.8] 3次元ガウススプラッティングのための幾何対応型トランスファーフレームワーク(3DGS)を提案する。
本手法は,色パラメータと幾何パラメータを交互に更新するデカップリング最適化方式により,幾何適応を明示的に組み込む。
本手法は定性的忠実度と定量的指標の両方において優れた性能を達成し,既存の3DGS方式のスタイリング法よりも優れていた。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:53:56 GMT)
Exploring Academic Influence of Algorithms by Co-occurrence Network Based on Full-text of Academic Papers [6.6] 本研究では,学術論文の全文に基づいて,自然言語処理(NLP)における大規模アルゴリズム共起ネットワークを構築する。
ディープラーニングモデルを用いて、アルゴリズムエンティティを抽出し、総合的、累積的、年次共起ネットワークを構築する。
我々はそれらの構造特性を分析し、フィールド全体および時間とともにアルゴリズムの集団的影響を評価するために複数の集中度尺度を適用した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 03:26:39 GMT)
HilDA: Hierarchical Distillation with Diffusion for Advancing Self-Supervised LiDAR Pre-training [6.6] HilDAは、LiDARのための自己教師付き事前トレーニングフレームワークである。
タスクの実行に必要な意味と幾何学的位置をキャプチャする。
HilDAで事前訓練されたモデルは、クロスモーダル蒸留ベンチマークで最先端の結果が得られる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:08:08 GMT)
Dirac-Frenkel dynamics with inertia for nonlinearly parametrized solutions of evolution problems [6.4] ディラック・フランケル力学は、ニューラルネットワークや混合モデルのような冗長な非線形パラメトリゼーションに対して、非一様あるいは不等式でもよい。
我々はディラック・フランケル力学に慣性を加えることを提案し、これにより、過去の軌道から弱い情報を受ける方向に、有用なパラメータ速度情報が持続可能であることを示す。
慣性定式化が適切にパラメータのダイナミクスを導出し、後続誤差境界を与えることを証明した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:30:42 GMT)
Sim-to-Real Betting on the E-Process: Bringing "simulators" to anytime-valid confidence sequences [6.4] このノートでは、sim-to-realパフォーマンスの見積もりとベッティング、そして安全で有意な推論の統合について記述する。
本手法は,ロボットの性能試験において特に有用である平均推定のための,効率的で信頼性の高い証明書を生成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 00:38:41 GMT)
AI Fiction in the Wild [6.4] ChatGPTユーザー会話の3分の1以上が、ある種のフィクション生成を含んでいる。
これらのユーザの間で、一般的なフィクション生成パターンとプロファイルを識別する。
AI技術は、著者と読者の伝統的な関係の変化につながるかもしれないと我々は主張する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:29:22 GMT)
End-to-End Radar and Communication Modulation Recognition with Neuromorphic Computing [6.3] 本稿では,ニューロモルフィックハードウェアの制約にスパイク駆動型トランスフォーマーを適用し,自動変調認識のための終端スパイキング神経ネットワーク(SNN)アーキテクチャを提案する。
このモデルでは,3090 GPU や Orin NX と比較して最大5倍の消費電力削減を実現している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 02:39:57 GMT)
When Do Conservation Laws Survive Learned Representations? Certified Horizons for Latent World Models [6.2] 予算が表現、読み出し、潜時力学の欠陥に分解されるシェルホライゾン証明書を導出する。
保存証明書は、学習された表現を生き残ることができるが、全ての幾何学的事前証明が等しく生き残るわけではない。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:44:02 GMT)
Conformal Orbit-Valid Trust Horizons for Equivariant World Models [6.2] グループ対称性を持つ潜在世界モデルに対する信頼-水平認証について検討する。
安定監査50点中0点の反保守的違反を観察する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:44:27 GMT)
MinInter: Minimizing Trajectory Interpolation During Data Augmentation for Imitation Learning [6.2] 最小補間 (MinInter) はデータ拡張に有効な軌道選択法である。
データ生成時の操作を明示的に最小化することで、MinInterは高品質な合成デモを生成する。
最近のSkillGenフレームワークと比較して、MinInterはより高いポリシーの成功率を達成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 02:47:11 GMT)
ColumnKeeper: Efficient Solutions to the ColumnDisturb Vulnerability in DRAM-based Systems [6.2] ColumnDisturbは、新しい、根本的に異なるDRAM読み取り障害現象である。
我々はコロンキーパーを提案し,コロンディストゥルブを低性能,エネルギー,面積オーバーヘッドで防止する。
コロンディスターブを低い閾値で緩和するには、より小さなサブアレイサイズを採用するか、サブアレイレベルの並列性を実現する必要がある。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:02:02 GMT)
EERLoss: A Novel Loss Function for Training Deep Biometric Models. A Case Study in Keystroke Dynamics [6.2] 本稿ではEERLossについて紹介する: 偏微分可能で、任意の精度でEERに近似し、深部バイオメトリックモデルのトレーニングを行う。
EERLossは要求される振る舞いのバイオメトリック・モダリティに基づいて評価される:キーストロークダイナミックス検証。
大規模なKVC-onGoingベンチマークで実験が行われ、185,000人以上の被験者のデータが組み込まれている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:47:42 GMT)
A Benchmark for Hallucination Detection in VLMs for Gastrointestinal Endoscopy [6.1] 幻覚は 医療実践における 安全な配置の大きな障壁です
我々は,4,392対のテストVQAを用いたGI診断用ビジュアル質問回答データセットGut-VLMデータセット上で,9つの幻覚検出手法をベンチマークした。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:04:19 GMT)
What's in an Earth Embedding? An Explainability Analysis of Location Encoders [6.1] 地理埋め込み (INRs) は、地球上の座標を場所へマッピングすることを学ぶ。
人間の解釈可能な表現への埋め込みを解析する。
位置埋め込みは人間の解釈可能な表現に分解可能であることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:01:17 GMT)
Alternate loss functions and regression models that achieve robustness to outliers by modulating the learning rate [6.0] ほとんどの実世界のトレーニングデータセットは、データと外れ値で汚染され、大きな予測エラーにつながる。
そこで本稿では,学習のアプローチが,外れ値に敏感な要因によって調節されるような,新たな堅牢性を実現することを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:36:32 GMT)
PROTECT-90: A Fault Dataset for Power System Protection [5.8] PROTECT-90は、高電圧断層研究のためのEMTシミュレーション基準である。
データセットは、90kVの標準二重線トポロジーで生成された9,022個の物理的に一貫した短絡シミュレーションエピソードからなる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:25:25 GMT)
PETRA: Transforming Web Text for Petroleum-Engineering Domain Adaptation [5.8] 本稿では,大規模石油工学テキストであるPETRAを提案する。
ノイズの多い公開Webデータをキュレートされたドメインコーパスに変換し、高密度検索と再ランク付けのための合成監視を行う。
1.36Mのキュレートされたチャンク、約2Bのトークン等価値、$approx$859k、$approx$224kアンカーからのトレーニング行の埋め込み、約400kの教師がマークしたリランカ候補行が含まれる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:37:44 GMT)
A Zeroth-Order Deep Learning Method for Fully Nonlinear Parabolic Partial Differential Equations with Unknown Coefficients [5.7] 未知係数を持つ高重み付き部分次元微分方程式(PDE)は機械学習において広く現れる。
既存のディープラーニング解法はしばしば微分演算子を評価するために繰り返し自動微分に依存する。
データ生成機構として2種類のシミュレータを導入し、基礎となるPDE演算子にアクセス可能な設定下でソリューションとそのデリバティブを学習する「表現型学習」アプローチを採用する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:04:43 GMT)
Certification of Machine Learning Models via Directional Sharpness [5.7] モデルの品質は、トレーニングされたデータ以上のデータに対して、その一般化能力によって決定される。
未知のデータに依存し、直接測定できないため、直接一般化を認証することは不可能である。
トレーニングの偏差があるにもかかわらず、効率よく、かつ確実に一般化を示すための指標である方向性の鋭さを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:07:25 GMT)
A Framework for Directed Hypergraph Signal Processing via tensor t-SVD [5.6] 我々はDHGSP(Directed Hypergraph Signal Processing)を紹介する。
DHGSPはグラフ信号処理を拡張し、高次(ポリヤディック)と非対称(方向性)の両方を同時に対応させる統合フレームワークである。
実トラフィックネットワークの実験では、DHGSPは行列ベースの(グラフとダイグラフ)と非方向テンソルベースの(ハイパーグラフ)ベースラインよりも優れていた。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 19:40:32 GMT)
Cycle-Consistent Neural Explanation of Formal Verification Certificates [5.6] 本稿では,検証証明書の忠実な自然言語記述を生成するサイクル一貫性ニューラルアーキテクチャを提案する。
ポインタジェネレータ機構は、証明書から直接状態名をコピーすることで、語彙基底を保証する。
学習したアーキテクチャは、ハイブリッドな推論時ルーティング戦略と組み合わせて、90.0%のサイクル検証された音性を実現する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:51:54 GMT)
Dynamics, stability, and energy efficiency of an energy-recycling rimless wheel with spring-clutch legs [5.6] エネルギー循環型リムレスホイールのハイブリッド力学モデルを開発した。
数値シミュレーションは周期的な歩行のダイナミクスや局所的な安定性を調べるために用いられる。
傾斜面上での試作実験を行い,提案機構の実現可能性について検討した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:16:54 GMT)
Learning Diachronic Representations of Ancient Greek Letterforms [5.4] 何世紀にもわたって手書きの変動に頑健な表現を学習することは、ダイアクロニック表現学習における重要な課題である。
ダイアクロニック表現学習のための3つのデータセット: Hell-Char、紀元前3世紀から1世紀にかけての訓練セット、PaLit-CharとMed-Charの2つの評価セットを紹介する。
そこで本研究では,クラス間類似度を動的に推定して埋め込みをバイアスする類似性重み付き教師付きコントラスト損失と,リアルな写本の破損をシミュレートするラグナ駆動拡張スキームを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:13:09 GMT)
LaGO: Latent Action Guidance for Online Reinforcement Learning [5.4] 大規模言語モデル(LLM)は、計画とシーケンシャルな意思決定に強い可能性を示している。
以前の作業は、しばしば直接コントローラとして使用することに依存しており、正確なアクション生成を必要とし、実際は信頼できない。
本稿では,オンライン政策最適化をソフトガイドする前に,事前学習したLCMを潜時行動として用いるフレームワークであるLaGOを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:03:31 GMT)
ARTOO-DARTU: Studying AR-HRC With AR Obstruction Mitigation During a Warehouse Task [5.3] ユーザのためのロボットチーム(ARTOO-DARTU)を支援しながら、障害物回避のための拡張現実技術の導入について紹介する。
ARTOO-DARTUは、障害物検出・緩和パイプライン(ODM)を通して現実世界の視認性を維持しつつ、リアルタイムロボットの位置分析と制御を可能にする
ユーザスタディでは、設計したAR位置分析により、全体のHRCタスクにおいて46%の効率向上が得られたが、ODMがアクティブになったときのみに限られていた。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:48:49 GMT)
TACTFUL: Tactile-Driven Exploration For Object Localization and Identification in Confined Environments [5.1] 人間は、視覚なしでも、タッチ単独で物体を見つけ、特定する。
我々は、多指ロボットが自律的に閉じ込められた作業空間を探索することを可能にする、視覚のない触覚探索フレームワークであるTACTFULを提案する。
以上の結果から,触覚と構造化学習を組み合わせれば,触覚が物体レベルの推論に有効な一次モダリティとなる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:33:51 GMT)
TrOCR for Medieval HTR: A Systematic Ablation Study with Cross-Dataset Validation [5.1] 本稿では,3つの制御可能な微調整選択(コントラスト正規化,データ拡張,層凍結)が,TrOCRを小さな歴史的データセットに適用する際の認識精度に与える影響について検討する。
13世紀のイタリアの写本で制御された実験を行い、公開READ-16ベンチマークで同じ実験格子を再現した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:34:18 GMT)
Difference-Making without Making a Difference [5.1] Andreas & Gnther の最新の - 実の相違 - 定義が3つのタイプすべてをインスタンス化することを示している。
私はさらに、彼らの新しいアカウントを、いくつかの重要な例で他の6つのアカウントと比較し、これが7つのアカウントの全てを損なうことを明らかにした。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:15:26 GMT)
LLM4MTLs: Automated Generation and Empirical Evaluation of Model Transformation Languages [5.0] 本稿では、モデル変換言語(MTL)のプロンプト戦略の構築と比較を行う自動化ワークフローを提案する。
本報告では、4つのMTLに実行可能な参照スクリプトと手書きテストスイートを備えた評価スイートを構築した。
数発のプロンプトは4つのMLL全体の構文的品質を一貫して改善し,セマンティックな正確さの獲得は不均一で言語に依存していることがわかった。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:36:42 GMT)
Importance of Intent-Sharing for V2X-based Maneuver Coordination [5.0] インテント共有は、リモート車両がエゴ車両と計画を直接通信することで達成できる。
高速道路シナリオにおける車線変更の協調効果を比較することで,意図共有の可能性を分析する。
我々の分析では、CAVが近くの車両の運転意図に直接アクセスできる場合、操縦調整の大幅な改善が2つのシナリオで示されている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:42:53 GMT)
Less is More: Quality-Aware Training Data Selection for Scientific Summarization [4.9] 我々は,長期文書要約のための生物医学・生命科学のデータセットとして,最大規模のデータセットをリリースする。
著者が書いた要約は、記事全体と一致し、これらの品質信号がトレーニングデータの選択をガイドできることを示します。
その結果, 基準品質は科学的要約の重要な要因であり, 品質に配慮したデータ選択が訓練効率を向上させることが示唆された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:12:06 GMT)
Jolia: Concept-Level Vision-Language Alignment for 3D CT Contrastive Learning [4.8] ConQuerは、CLIPのグローバルアライメントを局所的なアライメントのセットで強化する画像テキスト事前トレーニング手法である。
ConQuerはレポートを概念固有のセクションに分割し、一致するイメージ機能をプールするクロスアテンションクエリを学習する。
副産物として、各クエリは、その概念に焦点をあてたアテンションマップを学習し、組込み空間解釈性を提供する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:35:47 GMT)
EveLoad: Cognitive Workload Recognition from Event-Based Eye Movements [4.8] 既存のアイモーメントに基づく認知的ワークロード認識手法は、フレームベースのアイトラッカーに依存している。
イベントカメラは、マイクロ秒レベルの時間分解能、高ダイナミックレンジ、低レイテンシを提供し、きめ細かい目の動きを捉えるのに適している。
EveLoadは、グレード付き認知ワークロードアノテーションを備えた、最初のイベントベースのアイモーメントデータセットである。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:06:40 GMT)
Electrical-Circuit Simulation of the Uhlmann Phase [4.8] ウルマン位相を古典RC回路のアクセタンス行列にマッピングする。
結果のアクティブRCネットワークのLTspiceシミュレーションは、ウルマン幾何学フェーズを忠実に再現する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:25:50 GMT)
Dialogue to Discovery: Attribute-Aware Preference Elicitation for Conversational Product Search Assistants [4.8] 会話型プロダクト検索アシスタントは、従来のキーワードベースのプロダクト検索よりも表現力があり、自然な、インタラクティブな代替手段を提供する。
本稿では,商品属性の構造を動的に活用し,ユーザの希望する項目に対する会話を効率的に制御する属性指向の嗜好推論フレームワークであるD2Dについて述べる。
D2Dは22.2-29.9%の目標達成精度の向上、6.6-16.1%の放棄、そして27.5%の短い平均会話を実現している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:30:31 GMT)
The Evaluation Cost of Task Specialization in Evolutionary Multi-Robot Systems [4.7] 本研究では, 生産シナリオにおけるタスク・スペシャリストとジェネラリストの行動のコスト・ベネフィット分析について検討する。
MRSの規模が大きくなると、総評価予算が低くなり、ジェネラリストに勝るスペシャリストを進化させるのに十分であることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:20:54 GMT)
Majorana-Pauli stabilizer codes and duality webs of fermionic topological phases [4.7] 我々は、正確に解けるフェルミオン格子モデルのクラスであるMajorana-Pauli安定化符号を導入する。
主な例として、フェルミオントリック符号の正確に解ける安定化器を実現する。
フェルミオントーリック符号は、任意の凝縮によって生成される双対Webに属することを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:03:51 GMT)
Red-Teaming the Agentic Red-Team [4.7] 本稿では,攻撃的セキュリティ運用において最も広く利用されているエージェントシステムの詳細なセキュリティ分析について紹介する。
これらのツールのほとんどは共通の設計上の欠陥を共有しており、アクティブな敵がAPIキーを抽出できることを示している。
分析を支援するために,エージェントシステムのための完全なサイバーキラーチェーンを導入する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:27:58 GMT)
SP-Mind: An Autonomous Reasoning Agent for Spatial Proteomics Analysis [4.7] SP-Mindは空間分析パイプラインを統合するために設計された最初の自律AIエージェントである。
自然言語クエリをタスク固有の微調整なしでエンドツーエンドの分析に変換する。
既存のオープンソースバイオメディカルエージェントのベースラインと比較して、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:24:23 GMT)
FreeStory: Training-Free Character Consistency for Free-Form Visual Storytelling [4.7] FreeStoryは、自由形式のプロンプトの下で文字の一貫性を実体的な機能再利用として再構築する、トレーニング不要のフレームワークである。
提案手法は,参照参照と対応する文字記述を関連付け,動的文字マスク,対応性を考慮した特徴マッチング,キー値注入,クエリブレンディングを組み合わせる。
実験により、FreeStoryは構造化ベンチマーク上でのトレーニングフリーメソッドの最先端性能と、フリーフォームプロンプト下でのベースラインに対する全体的な一貫性の向上を実現している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:37:31 GMT)
Paying to Know: Micro-Transaction Markets for Verified Product Information in Agentic E-Commerce [4.7] エージェントネイティブのマイクロペイメントレールの到着は、不足しているものを変えると論じる。
我々はエージェント型電子商取引を、検証情報のためのマイクロ取引市場として想定する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:42:21 GMT)
LLM-Based Scientific Peer Review: Methods, Benchmarks, and Reliability Challenges [4.7] この調査は,大規模言語モデル(LLM)に基づく科学的ピアレビューのシステムレベル分析を提供する。
批判生成とスコア予測という2つの中心的評価関数に注目した。
プロンプトインジェクション、データ中毒、検索脆弱性、報酬ハッキングなど、新興のリスクを特定します。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:12:39 GMT)
Exploring the relationship between human-centric AI and firm idiosyncratic risks [4.6] 人間中心AI(HCAI)は、AI関連の倫理的リスクを低減し、企業のビジネスオペレーションにおけるAI-Humanシナジーを促進する。
中国上場企業の複数ソースパネルデータセットを用いて、HCAIが下位企業IRと関連していることがわかった。
デジタル化とエグゼクティブ株主は、このリスク低減効果を強化しますが、運用効率とITバックグラウンドを持つCEOは、驚くほど弱まります。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:10:59 GMT)
Benchmarking the Alignment of Data-Quality Metrics, Human Judgment and Land-Cover Segmentation Performance for Earth Observation [4.6] 我々は,深部生成モデルにより生成された合成データとともに,地球観測データセットを体系的に評価した。
回転などの摂動のセマンティックス保存は, 人間の認識に影響を与えないまま, 測定スコアを劇的に変化させる。
混合実合成データセットで訓練されたセマンティックセグメンテーションモデルをベンチマークすることにより、ImageNetで事前訓練された特徴空間に根ざした品質指標が地理空間データに対する信頼性の低い指標であることを実証する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 20:02:57 GMT)
Auto-Configured Explainable Graph Neural Networks for Multi-Site Pollution Prediction [4.5] 本研究では,クラス間の関係を動的に捉えるために,教師付き学習プロセスと混同したグラフ構築手法を提案する。
この手法は、ユタ大学ソルトレイクシティの大気汚染監視ネットワークによる大気汚染データを用いて評価される。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:24:35 GMT)
Cost-Optimal Decision Diagrams for Stochastic Boolean Function Evaluation [4.5] 本稿では,変数選択,プルーニング,キャッシングを含む分岐とバウンドのアルゴリズムを提案する。
ランダムなインスタンスの実験はスケーラビリティを実証し、グレディビーム探索変種(英語版)の効率-品質トレードオフを定量化する。
この問題は$#P$-hardで$mathrmSPACEP$に含まれることを証明します。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:04:51 GMT)
Zero-Shot Test-Time Canonicalization using Out-of-Distribution Scoring [4.5] 事前訓練された視覚モデルは、しばしば回転、スケール、またはせん断された入力を誤分類する。
テスト時の正準化は代わりに入力を無タッチで残す。
我々は,OODスコアが必要とされる場合にのみ入力を変換するゲート機構を開発する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:00:33 GMT)
When Multi-Sensor Fusion Fails to Generalize: Cattle Posture Classification Under Animal-Level and Temporal Distribution Shift [4.4] 首輪加速度計,ラムボルスセンサ,環境計測を用いた自動姿勢分類の堅牢性を評価した。
疲労解析の結果, 予測性能が低下しても, 放射能と環境変数に持続的依存が認められた。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:24:49 GMT)
What Intermediate Layers Know: Detecting Jailbreaks from Entropy Dynamics [4.3] ジェイルブレイク攻撃は、一致した大規模言語モデルにおいて永続的な弱点を示す。
モデルの内部表現において有害な意図がコード化されているかを検討する。
我々は、ジェイルブレイクの挙動が構造化された中間不確実性力学に反映されていることを発見した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:14:53 GMT)
AI-PAVE-Br: Leveraging Large Language Models for Enhanced Product Attribute Value Extraction through a Golden Set Approach [4.3] 本稿では,大規模言語モデル(LLM)を用いて,ブラジルのeコマースカタログの高精度PAVEを行う専門システムであるAI-PAVEBrを提案する。
また、ポルトガル語でPAVE用に手動で注釈付けされたデータセットであるGolden Setを導入し、共有します。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:48:37 GMT)
Automated Summarization of Software Documents: An LLM-based Multi-Agent Approach [4.2] 大規模言語モデル(LLM)とマルチエージェントシステム(MAS)は、自動化、意思決定、知識処理を進歩させることで、ソフトウェア工学(SE)に革命をもたらしている。
ソフトウェアドキュメンテーションの簡潔かつ正確な要約を生成するために,LLMベースのMASであるMetagenteを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:18:17 GMT)
Towards Continuous Power Forecasting: Practical Continual Learning for Real-World Energy Systems in Nonstationary Time Series [4.0] 本稿では,連続電力予測のパラダイムを提案する。
電力予測は静的なオフラインタスクではなく、継続的な学習問題だと考えている。
産業用電力予測パイプラインに連続学習を実用的に組み込む方法を示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:48:38 GMT)
Understanding the (In)Security of Vibe-Coded Applications [4.0] Vibeコーディングは、AIエージェントとの自然言語インタラクションを通じて、ユーザがアプリケーションを作成する、新たなソフトウェア開発パラダイムである。
従来のAI支援プログラミングとは異なり、ビブ符号化はAIシステムに開発の大部分を委譲する。
我々は、人気のあるAIエージェントを使って開発された現実世界のアプリケーションの大規模なコーパスを収集し、エージェント支援コード監査と人間の検証を組み合わせた脆弱性分析フレームワークを設計する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:37:57 GMT)
A Contactless Heat Engine Driven by Nonreciprocal Fluctuation-Induced Torques [3.9] 量子及び熱電磁ゆらぎが動作する非接触型熱エンジンについて述べる。
構成は異なる温度で保持される2つの同心円柱で構成され、内筒は反発非平衡カシミール力により外筒内に安定に浮遊する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:08:40 GMT)
Entity Resolution via Batched Oracle Queries [3.8] 私たちは、一度に限られた数のレコードを処理し、同じ現実世界のエンティティを参照するレコードをクラスタ化するオラクルを考えます。
一つのバッチよりはるかに大きいデータセットのエンティティを解くために、そのような託宣を問う方法を研究する。
われわれは、各ステップで可能な限り最高のリコールを達成しつつ、コスト(オラクルの相談数)を完全にコントロールする、従量制のアプローチを目指している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:44:35 GMT)
G$^3$VLA: Geometric inductive bias for Vision-Language-Action Models [3.7] 視覚言語アクション(VLA)モデルは、汎用ロボット操作において急速に進歩した。
それらの視覚トークンは、ロボットのカメラのキャリブレーションされた形状ではなく、2D画像座標に基づいている。
予め訓練されたVLAの視覚的ストリームに校正された構造を注入するカメラ対応幾何モジュールであるG$3$VLAを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:02:36 GMT)
Repeated Shared Access Enables Grokking, but Edit Propagation Depends on an Addressable Memory [3.7] 制御された知識グラフQA設定における実際の編集の伝搬について検討する。
学習において、繰り返し共有されるアクセスへの経路は、Denseが失敗するアウト・オブ・ディストリビューション・グルーキング障壁を越えている。
編集の伝搬は、フォワード計算が書き込むアドレス可能なメモリが、後で読み込まれるかどうかに依存する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:42:49 GMT)
Swazure: Swarm Measurement of Pose for Flying Light Specks [3.7] FLS(Flying Light Specks)と呼ばれる小型ドローンは、複雑な3D形状と点雲内の点の座標に一致したアニメーションシーケンスを照らすために位置決めする。
FLSはカメラなどのセンサーを使って互いに相対的なポーズを測定する。
問題は、FLSがセンサーのスイートレンジの外で別のFLSを追跡する方法だ。
本研究では,FLS間の協調によるセンサデータの欠落を解消するSwazureという手法を提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 22:40:54 GMT)
Uniform Sampling from High-dimensional Spectral Norm Balls [3.7] サンプル行列の特異値は、行列次元が増加するにつれてほぼ確実に1に収束することが証明されている。
この結果から, 大規模化に適用可能な簡易サンプリング法の理論的正当性が得られる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:34:13 GMT)
Heterogeneous Knowledge Distillation via Geometry Decoupling and Momentum-Aware Gradient Regulation [3.6] SPOFAは、新しいFeature and Gradient Dual Stabilizationメカニズムの上に構築されたフレームワークである。
MEMAは瞬時勾配の衝突を積極的に評価し、有害な蒸留信号を適応的に罰する。
2つの主要なベンチマークの実験は、SPOFAが最先端の精度を達成することを示した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:23:58 GMT)
VeryTrace: Verifying Reasoning Traces through Compilable Formalism and Structured Verification [3.6] CoT(Chain-of-Thought)による多段階推論は依然として脆弱である。
本稿では,ゼロショット検証・修復フレームワークであるVeryTraceについて述べる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:15:48 GMT)
Spatio-Temporal Retrieval-based Priors for Adaptive Computational Teaching in Driving [3.5] 時間的推論モジュールを用いた適応学習のための模倣学習に基づく計算モデルを提案する。
本研究の結果は, 適応的でないベースラインに先行して, 隣接した検索と相互注意を併用した適応型学習モデルの一貫した優位性を明らかにした。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 22:47:10 GMT)
DoHFuse: A Dual-Branch Architecture with DMAGLSTM for Website Fingerprinting over DNS over HTTPS/3 [3.5] 我々は,実際のネットワーク環境におけるドメイン解決プロセスから生成されたDoH/3トラフィックのリアルタイムベンチマークデータセットを初めてリリースした。
本研究では,DMAG-LSTMを改良したDMAG-LSTMを用いて,言語間時間列と統計的特徴を融合した2分岐学習フレームワークDoHFuseを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 03:36:35 GMT)
AutoSpecNER: A Fine-Grained Named Entity Recognition Dataset for Vehicle Specification Extraction [3.3] AutoSpecNERは、自動車リストの詳細なエンティティ認識のためのエキスパートアノテーション付きデータセットである。
このデータセットには、人気車販売サイトからの659件の広告が含まれ、15のカテゴリーに1万件以上のエンティティがある。
DeBERTaは90%のマイクロF1スコアで最高のパフォーマンスを達成し、ルールベースベースライン(43%)と最強の大規模言語モデル(77.8%)を上回っている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:19:58 GMT)
Neural Scaling Universality: If Exponents Are Fixed, Time to Understand Coefficients [3.3] ニューラルスケーリング法則は、トレーニング時間、モデルサイズ、計算量を含むパワー法則として、事前学習損失がいかに崩壊するかを記述する。
我々は、その係数を理解することが、短期的なパフォーマンス改善の鍵であると主張する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:46:30 GMT)
Distributed Quality-Diversity Search for Toxicity in Large Language Models [3.3] ToxSearch-Sは毒性に焦点を当てた進化的プロンプトサーチの拡張である。
ToxSearch-Sは、ToxSearchとRainbowPlusの両方と競合するピーク毒性を持つ。
MPIディストリビューションは、約1.8タイムで2人の労働者が3.2タイムで4人の労働者が3.2タイムで、Best@Bは統計的にシーケンシャルな実行と区別できない。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:40:05 GMT)
Solving Markov Decision Processes with Future Information via MPC [3.3] パラメータ化されたMPCは、将来の情報とともに、MDPの最適値関数とポリシーをどう表現できるかを示す。
このアプローチは、将来の参照情報を備えたポイントマスレースタスクで説明される。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:51:59 GMT)
Two-Level vs. Multi-Level Modelling: An Empirical Study of Cascading Maintenance Burden [3.0] MLM(Multi-level modelling)は人工物を統一し、共進化の負担を軽減する。
両パラダイムの共進化行動について,事前登録,突然変異に基づく実証比較を行った。
この設計は、パラダイムレベルの構造的選択がカスケードメンテナンスの負担に影響を及ぼすかどうかを評価するための最初の経験的フレームワークを提供する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:47:14 GMT)
Burnyard: Future of Malware Analysis [3.0] Burnyardは軽量なバイナリエミュレーションプラットフォームで、観測可能なランタイムの振る舞いをキャプチャし、構造化されたCSVイベントトレースとして記録する。
Burnyardは、観測可能なランタイムの振る舞いをキャプチャし、構造化されたCSVイベントトレースとして記録する、軽量なバイナリエミュレーションプラットフォームを通じて、これらの制限に対処する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:36:40 GMT)
Wear-Clearance-Impact Coupling in the Jansen Linkage: A Gait-Durability-Optimized Design Slows Joint Loosening [2.9] 転位関節がクリアランス関節となるヤンセン脚の前方力学モデルを構築した。
第一に、クリアランスは最大関節荷重を過小評価し、第二に、カップリングは強い衝撃に敏感である。
第三に、摩耗は非一様であり、10デグの荷重アークに集中するので、均一なクリアランス成長が局所クリアランス成長を36倍過小評価すると仮定する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 22:01:58 GMT)
AerialFusionMapNet: Online HD Map Construction with Aerial-Onboard BEV Fusion [2.9] AerialFusionMapNetは、構造化された2段階のトレーニング戦略を備えたフュージョンベースのマッピングフレームワークである。
nuScenesの地理的分割では、AerialFusionMapNet は 54.7 mAP に達し、48.8 mAP から +5.9 の絶対値と +12.1% の相対値に改善されている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:44:43 GMT)
Semantic Allocation in Ordered Bottlenecks: Predictive Residual Inference for Visual Representation Learning [2.9] 順序表現(PRIOR)の予測残差推論を導入する。
Priorはアクティベーションレート制御をlog2スケールレベルとレベルワイド予測器に置き換える。
これらの予測器は、既に説明されていない情報から説明されており、各レベルを残差に焦点を合わせている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 23:19:12 GMT)
RGB: RL Guided Whole-Body MPPI for Humanoid Control [2.9] 本稿では,アドオンフィードバックコントローラとして機能するRLガイド付き全身モデル予測パス積分(MPPI)フレームワークを提案する。
提案手法は,同じコマンドインタフェース下での純粋RLベースライン上でのタスクレベル精度を向上させる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 19:54:02 GMT)
Vision-Language Model Reasoning for Contextual Semantic Mapping in Intralogistics [2.8] 本稿では、SLAMに基づく幾何マッピング、SAMベースのインスタンスセグメンテーション、VLMマルチビュー推論を組み合わせたコンテキスト意味マッピングパイプラインを提案する。
パイプラインは、タスク固有のトレーニングや事前定義されたオブジェクトカテゴリを必要とせずに、コンテキストオブジェクトプロパティを推論する。
結果のセマンティックマップは、動的イントロロジクス環境におけるコンテキスト認識フィルタリングとロバストナビゲーションをサポートする。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:59:52 GMT)
BluTrain: A C++/CUDA Framework for AI Systems [2.8] BluTrainは、標準C++とコアプログラミングモデルにおける、堅牢で軽量、アーキテクチャ全般的なトレーニングフレームワークである。
正式な評価では、BluTrainはスループットとメモリ効率の両方において業界標準ベースラインを上回っている。
すべてのレイヤがネイティブチューニングに明示的にオープンになっているため、パフォーマンスの天井は、フレームワークが挙げるべきものなのです。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:39:25 GMT)
From Spectral Singularities to Multipartite Entanglement Scaling at Higher-Order Exceptional Points [2.8] 相互作用する同一量子ビット系における真の多部絡み合いのスケーリング挙動について検討する。
この結果は,非エルミート退化,多部交絡,対称性の基本的な関係を確立する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:47:34 GMT)
Target-Aware Linear Regression Under Distribution Shift [2.7] トレーニングとデプロイメントの間の分散シフトは、現代のAIシステムにとって大きな課題である。
我々は、この問題を、ソースとターゲットをまたいで安定な条件平均$E[Ymid X]$で研究する。
両辺縁を併用したハイブリッド損失推定器を,ベンチマーク目標認識推定器として同定する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:56:48 GMT)
Aspect-Based Sentiment Evolution and its Correlation with Review Rounds in Multi-Round Peer Reviews: A Deep Learning Approach [2.7] 本研究では,ピアレビューコメントにおけるアスペクトレベルの感情の分布と進化について検討する。
我々は、一連の深層学習に基づくアスペクト感情分類モデルを訓練する。
レビューラウンドの数が増加するにつれて、肯定的な感情の割合は増加し、否定的な感情は減少する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:14:00 GMT)
L3Cube-MahaPOS: A Marathi Part-of-Speech Tagging Dataset and BERT Models [2.6] Part-of-Speech(POS)タグ付けは、機械翻訳、情報抽出、構文解析を支える基礎的なNLPタスクである。
マラティー語は8300万人以上の人々が話しており、世界でもトップ20の言語にランクインしている。
HMM, CRF, BiLSTM, BiLSTM+CharCNN, MuRIL, Marathi 固有の変換器 MahaBERT-v2 にまたがる6つのモデルファミリのデータセットをベンチマークした。
最高のシステムはトークンレベルの精度88.67%、マクロF1は15の評価タグクラスに対して81.67%である。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:10:46 GMT)
ASALT: Adaptive State Alignment for Lateral Transfer in Multi-agent Reinforcement Learning [2.6] マルチエージェント強化学習(MARL)は、協調的、競争的、または混合目的を追求する複数のエージェントを訓練する問題に対処する。
既存のアプローチは、観測空間と大域状態空間の次元が領域全体にわたって同一でなければならないという制約を課している。
本稿では,ソースドメインとターゲットドメイン間の不一致状態空間次元を明示的に適応する手法を提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:03:36 GMT)
Towards Version-aware Operations and Transaction Memories for Multi-layer MeMo [2.6] MeMoは明示的な多層相関行列メモリを持つ言語モデルを提案する。
本稿では,そのような記憶が,知識の変化に伴う再訓練の必要性をいかに軽減するかを問う。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 00:53:14 GMT)
Diagnosing and Mitigating Compounding Failures in Agentic Persuasion via Taxonomic Strategy Retrieval [2.6] 分類学的戦略RAG(英: Taxonomic Strategy RAG、TS-RAG)は、個別の分類的ボトルネックを通じて戦略をルートし、議論的構造をトピックの内容から切り離すシステム介入である。
TS-RAGは、標準的なセマンティック検索が崩壊する抽象論理の転送を大幅に改善する。
非対称な配置において「能力橋」として機能し、軽量な説得者に対抗相手を一貫して打ち負かす権限を与える。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:16:27 GMT)
MotifGen: Spatiotemporal interpolation of misaligned satellite images via multi-source generative modeling, in an application to tropical cyclones [2.5] サンプル間で不規則な時間間隔で変化する複数のソースに適用可能な,最初の生成モデルを提案する。
我々は、マイクロ波のみと比較して、赤外線とマイクロ波のデータを組み合わせることにより、さらなる改善を示す。
我々の知る限りでは、複数のマイクロ波機器と不規則な時間間隔での赤外線観測を組み合わせることで、サイクロンのマイクロ波像を補間する最初の生成モデルである。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:49:34 GMT)
Convex--Concave Quadratic Spectral Filtering for Graph Neural Networks [2.5] スペクトルグラフニューラルネットワーク(GNN)は、メッセージパッシングを周波数選択フィルタリングとして解釈する。
適応凸凹フィルタのコンパクトバンクに基づくDCQ-GNNを提案する。
本報告では,DCQ-GNNは1次ベースラインと高次ベースラインの両方と比較して性能劣化が著しく小さいことを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:49:51 GMT)
Reducing Redundancy in Whole-Slide Image Patching for Scalable Indexing and Retrieval [2.5] 本稿では,異なる組織クラス間の冗長性を活用して,各WSIからインデックス化しなければならないパッチ数を著しく削減する,基本的反対フレームワークARReSTを提案する。
過剰なパッチ表現を最小限にすることで、ARReSTはストレージのフットプリントを減らし、計算オーバーヘッドを減らし、大きな病理リポジトリ間の類似性検索を高速化する。
提案手法は,スケーラブルで費用効率のよいWSIインデクシングを可能にし,次世代の検索駆動臨床AIシステムに適している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 20:57:22 GMT)
Are Tabular Foundation Models Robust to Realistic Query Distribution Shifts in Microbiome Data? [2.5] タブラル基礎モデル (TFMs) は, マイクロバイオーム存在量データに対して高い性能を示すが, 現実的な分布シフト下でのロバスト性は乏しい。
我々は,4つの疾患コンテキストにまたがる6つの腸内マイクロバイオームデータセットにおける生物学的にインスパイアされた摂動に対するTFMの堅牢性を評価するベンチマークを導入する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:52:35 GMT)
Scaling Laws for Task-Specific LLM Distillation [2.4] 大規模言語モデル(LLM)は、拡大するドメイン全体で強力なパフォーマンスを達成するが、そのスケールは、レイテンシとコストの制約が重要となるアプリケーションにおいて、デプロイメント上の課題を引き起こす。
本稿では,ドメイン固有のLLM圧縮に対する経験的スケーリング法則を導出し,データセットサイズ,圧縮率,監督形式,反復的プルーニングスケジュールによるドメイン内および一般的な知識性能のスケールの定量化を行う。
我々は、ドメイン固有の圧縮決定のための再利用可能なフレームワークを提供するために、見出しデータセットFinHeadlineMix、法律結果のスケーリング、実用的なレコメンデーションをリリースする。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:09:57 GMT)
ADM-Fusion: Adaptive Deep Multi-Sensor Fusion for Robust Ego-Motion Estimation in Diverse Conditions [2.4] 本研究では,環境変化やセンサ劣化に適応するエンド・ツー・エンドの深層学習に基づくマルチセンサ融合法を提案する。
ADM-Fusionは、適応型センサー混在フレームワークとコンテンツ対応ルーティングを使用して、リアルタイムでセンサー入力に重みを動的に割り当てる。
実験の結果, ADM-Fusionは既存の手法と競合する性能を維持しつつ, 劣化条件下では頑健であることがわかった。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 19:38:28 GMT)
Managing Task Execution for Unknown Workloads in Batteryless IoT: A Hardware-Agnostic Evaluation [2.4] IoT(Internet of Things)パラダイムは、バッテリレスでエネルギーを節約するアーキテクチャへとシフトしている。
従来のエネルギ対応スケジューラは、静的実行しきい値に依存するため、予測不可能なワークロードに苦労する。
アプリケーションをブラックボックスとして扱う2つの新しいハードウェアに依存しない動的スケジューリング手法を提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:27:59 GMT)
Assessing Distribution Shift in Human Activity Recognition for Domain Generalization [2.4] 本稿では,HARモデルにおける4種類の分布変化を系統的に評価する。
多様性のシフトは、主にすべてのタイプのシフトを定義し、異なるドメイン間で共有されていないユニークな特徴の存在を示す。
本分析は,モデル一般化性の実現における現在の領域一般化アルゴリズムの限界を明らかにする。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:40:05 GMT)
Automated Residual Plot Assessment With the R Package autovi and the Shiny Application autovi.web [2.4] 本稿では,コンピュータビジョンモデルを用いて残差プロットの評価を自動化する新しいRパッケージを提案する。
残差のサンプルが与えられた場合、モデルは視覚信号強度(VSS)を予測し、モデル適合性を評価するための支援情報を提供する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:24:37 GMT)
Detecting AI Coding Agents in Open Source: A Validated Multi-Method Census of 180 Million Repositories [2.4] ジェネレーティブAIコーディングエージェントが、オープンソースのサプライチェーンに参入している。
構成ファイルスキャン,コミットメッセージ解析,著者同一性マッチング,ボット署名検索を統合した多層検出フレームワークを提案する。
1つのメソッドがほんの少しのアクティビティをキャプチャすることはありません。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:05:42 GMT)
OmniPath: A Multi-Modal Agentic Framework for Auditing Wheelchair Accessibility [2.4] 我々は,受動的マッピングから積極的な環境監査に移行するシステムであるOmniPathを紹介する。
我々はOSMのネットワークトポロジを高密度LiDARのサブメーター精度で融合する。
ADAコンプライアンス標準に対して、特に走行する斜面、横断斜面、垂直不連続性を厳格に定量化する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:23:44 GMT)
Token Complexity of Certifying Stochastic-Oracle Reliability [2.3] 本稿では,ある領域におけるオラクルの信頼性を証明するための類似概念を考案する。
認証トークンは最小限のトークンコストであり、制御されたエラー確率を持つ。
本研究では,SPRTに基づく認証SOTMを構築し,オラクルを問合せし,バイナリの正当性スコアを計算し,ログに類似した証拠が決定しきい値を超えた場合に停止する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 02:38:14 GMT)
Supervised Reinforcement Learning for the Coordination of Distributed Energy Resources [2.2] 本稿では,DER調整政策を学習するための改良強化学習フレームワークを提案する。
実験により、提案したフレームワークに基づくRL実装は、すべてのベンチマークを著しく上回っていることが示された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:17:58 GMT)
Modeling and Analysis of Phase Instability in Photonic Processor [2.2] 再構成可能性と安定した出力信号の両方を達成することは、集積フォトニック回路の開発において重要な課題である。
マルチポート入力信号における位相安定性を維持することは重要なハードルであり、特にアクティブ冷却システムによって生じる位相不安定性のためである。
本稿では,フォトニックプロセッサの位相不安定性をシミュレーションし,実験結果に対して検証する理論モデルを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:40:01 GMT)
Beyond Logprobs: A Multi-Signal Confidence Engine for LLM-Based Document Field Extraction [2.2] ExtractConfはクロスドメインでフィールドに依存しない信頼性エンジンである。
同じ文書の2つの構造的に異なる読影において、信頼度を推定する。
0.928ROC AUCを達成し、logprob-meanよりも選択的な予測リスクを70%削減する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:58:08 GMT)
Collaborative and AI-Supported Requirements Elicitation: An Empirical Study [2.2] 生成AIは、協調的に生成された知識から構造化された要求文書への変換を支援することができる。
提案手法は,AIサポートなしのコラボレーティブ・エリケーション,StrateegiaプラットフォームとGPT対応のWriterアプレットによるコラボレーティブ・エリケーション,Large Language Modelを用いた直接要件生成,Large Language Modelを用いたコラボレーティブ・ディスカッション・トランスクリプトからの要求生成の4つを比較した。
以上の結果から,利害関係者の協力とAI支援による合成を併用した手法は,従来の共同作業よりも明確で実行が容易であると考えられた。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 02:09:43 GMT)
The cognitive, affective, and behavioral expression of self-stigma among people who use drugs in online substance use communities [2.1] 我々は認知的、感情的、行動的な領域にまたがる自己スティグマのためのコードブックを開発した。
我々はRedditで1,660人の英語ユーザーから72,115件のスレッド開始記事を分析した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 20:12:22 GMT)
Flow as Flow: Modeling Robot Velocity Fields as Probability Velocity Fields for Flow-Based Object Manipulation [2.1] クロス・エボディメントのデータは、ロボット基礎モデルのトレーニングの中心となっている。
ロボットのフローがエンボディメントに依存しない動作表現として機能するフローベースオブジェクト操作に着目した。
本研究では,フローマッチングの定式化に基づいて,ロボットフローを確率フローとしてモデル化するフロー・アズ・フローを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:52:58 GMT)
Best Preprocessing Techniques for Sentiment Analysis [2.1] Twitterデータセットにおける感情分析は、製品に対する世論の監視と政治的・社会的運動の分析を可能にするため重要である。
1つの重要なステップは、機械学習アルゴリズムのためのテキストの自動処理である。
トークン化は最も影響が大きいのに対して,スペル補正は最も影響の少ない前処理技術であることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 02:00:16 GMT)
T2D-Bench: Evidence-Gated Evaluation of LLM Outputs for Type 2 Diabetes Using a Multi-Layer Clinical-Lifestyle Knowledge Graph [2.1] 大型言語モデル(LLMs)は、ガイドライン上の制約を満たすことや、ライフスタイルに関連するグリセミッククレームを明確に正当化することに失敗したまま、2型糖尿病に対する臨床的に流動的なレコメンデーションを生成することができる。
本稿では,LLM出力が明示的かつグラフチェック可能な証拠要求を満たすかどうかを検証するための再現可能なベンチマークとエビデンス付き評価フレームワークであるT2D-Benchを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:02:21 GMT)
Architecting Hybrid Quantum-Classical Software Systems: Exploration of the Design Trade-off Space with Quantitative Guarantees [2.0] 本稿では,量子古典的応用の設計空間について考察する。
ハイブリッドアプリケーションのアーキテクチャスタイルの形式化を提供する。
ユーザの基準に基づいて、最も適切なハイブリッドまたは古典的な構成の動的選択を可能にする。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:47:36 GMT)
What Does ODRL Mean? A Cross-Level Ontological Grounding of Permissions, Prohibitions, and Duties in UFO-L [2.0] ODRL政策評価者は評決を下すが、方針がもたらす規範的な立場については何も言わない。
我々はクロス・レベル・デザインの原則を定式化する: 違反可能な、連続的な規範を持つすべての規範言語は、どちらも行動レベルの位置を必要とする。
全ての公理は、イザベル/HOLと、ヴァンパイア、E、Z3の下で39プロブレムのベンチマークで機械的に検証される。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:36:23 GMT)
MMed-Bench-IR: A Heterogeneous Benchmark for Multilingual Medical Information Retrieval [2.0] 多言語医療検索には,言語横断アライメント,概念識別,エビデンス検索という3つの機能が必要である。
MMed-Bench-IRは、6つの言語と3つの構造的不均一なタスクにまたがってこれらの軸をアンタングルするように設計されたベンチマークである。
3つのタスクはゼロの概念を共有し、設計によってクエリオーバーラップし、アグリゲーションスコアが真の能力の幅を反映することを保証します。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:41:13 GMT)
UOL@IDEM at BEA 2026 Shared Task 1: Neural Fusion and Feature-Rich Modeling for L1-Aware Vocabulary Difficulty Prediction [2.0] 本稿では, BEA 2026 の L1-aware vocabulary difficulty 予測タスクに対する UOL@IDEM のクローズトトラック提案について述べる。
我々は、このタスクを回帰としてモデル化し、スペイン語、ドイツ語、マンダリン中国語の別系統を訓練する。
本システムは,多言語文脈表現と,周波数,表面形状,検索証拠,セマンティックアライメント,コグネート類似性,マスク付き言語モデル予測可能性などの特徴を結合する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:30:48 GMT)
Dream at SemEval-2026 Task 13: SALSA for Single-Pass Machine-Generated Code Detection [1.9] SemEval-2026 Task 13 Subtask コードスニペット上のバイナリ分類として検出を運用する。
本研究では,各クラスを専用出力トークンにマッピングし,構造化された応答で単一トークンラベルを出力するようにモデルを訓練するSALSAスタイルの定式化を提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 19:17:11 GMT)
Perfect Detection, Failed Control: The Geometry of Knowing vs. Steering in Language Models [1.9] 私たちは、最も行動を検出する方向と、それを引き起こす方向の角度をテストします。
検出が制御を意味する場合、コサインは1付近であり、そうでなければ検出ギャップを定量化する。
コサインは、知識とステアリングの解離の重み付け可能な記号であり、その予測子ではない。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:07:51 GMT)
The Warrant Gap: Claim-Conditioned Re-scoring for Fact-Checking [1.9] SIFT -- クレーム条件による全クレームに対する抽出されたエビデンスの再検査について紹介する。
FEVER,SciFact,5PILS,DPを4つのオープンソースバックボーンで評価した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:23:56 GMT)
Beyond U-Net: A Latent-Representation-Aligned Skip-Free Backbone for Flow-Matching Speech Enhancement [1.9] 本稿では,LRA (Latent Representation Alignment) によるフローマッチング音声強調のためのスキップフリーエンコーダデコーダバックボーンを提案する。
WSJ0-CHiME3とVoiceBank-DEMANDの実験では、PESQと知覚品質が改善し、特にVoiceBank-DEMANDでは5つの機能評価しか行われなかった。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:09:31 GMT)
Reward-Conditioned Attention: How Reward Design Shapes What Autonomous Driving Agents See [1.9] 強化学習エージェントの内部的注意パターンをどう形成するかを検討する。
Open Motionから50のシナリオを分析します。
その結果,報酬関数が意図した行動システムを生成することが示唆された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 20:02:51 GMT)
An iterative energy-based multimodal transformer for joint retrieval of wheat soil moisture, leaf area index, and plant height from Sentinel-1 and Sentinel-2 time series [1.9] iEBTは共有シーケンス内にマルチモーダル予測器を埋め込み、初期状態推定を生成し、ターゲット[SM, LAI, PH]ベクトルを反復的に更新する。
Modality ablationsによると、Sentinel-1はSM検索を、Sentinel-2はLAIを、PHは複合的な構造・形態的シグネチャに依存している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:05:53 GMT)
The impact of generative artificial intelligence on academic development of Chinese students in humanities and social sciences [1.9] 本研究は, 利用パターン, 学習過程と学業成績, GenAI利用に伴う課題, およびカリキュラム統合への望ましいアプローチの4つの側面に焦点を当てた。
その結果、半数以上が学習のモチベーション、独立した思考、創造性の向上を感じていることがわかった。
圧倒的多数が倫理的配慮の重要性を重んじたが、プライバシー保護に満足しているのは半分以下だった。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 03:35:30 GMT)
Grading the Grader: Lessons from Evaluating an Agentic Data Analysis System [1.8] エージェントデータ分析システムは、コード、数値結果、言語診断を含む豊富な出力を生成する。
したがって、エージェントの出力と根本的真正解との真に不一致を分解物と区別する必要がある。
DSGymから153個の数値QRDataタスクに対して,マルチエージェントデータ分析システムであるLAMBDAを適用し,システム評価の信頼性と品質向上の戦略について検討した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:18:28 GMT)
Meet UD_Czech-PDTC: A Large and Genre-Rich Treebank in Universal Dependencies [1.8] 2015年の最初のリリース以来、チェコはユニバーサル依存の一部となっている。
プラハ家の他の3つのデータセットが追加され、アノテーションが徹底的に改訂され、"Prague Dependency Treebank-Consolidated"(PDT-C)が形成される。
オリジナルのPDTと比較すると、PDT-Cは2倍以上の大きさであるが、ジャンルやドメインに関してもはるかに多様である。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:22:42 GMT)
Prob-BBDM: a Probabilistic Brownian Bridge Diffusion Model for MRI sequence image-to-image translation [1.8] Brownian Bridge Diffusion Models (BBDM) に基づく新しい画像から画像への変換モデルを提案する。
提案手法は,確率的画像分布を利用して合成品質を向上させる変分エンコーダ誘導拡散機構を統合する。
Prob-BBDMは複数の翻訳タスクで優れた性能を発揮し、最大88.46%のSSIMと26.09dBのPSNRに達する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:47:17 GMT)
Does Mixture-of-Experts Actually Help Inference on Consumer and Edge Hardware? An Empirical Study [1.8] Mixture-of-Experts (MoE)言語モデルはしばしばリソース制約推論の理想として記述される。
MoEモデルは、コンシューマグレードおよびエッジハードウェア上で、同等の高密度モデルよりも高速かつ安価に動作するかどうかを問う。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:15:33 GMT)
Poisoned Playbooks: Demystifying Knowledge Poisoning Effects on AI Security Agents [1.7] 我々は、RAGベースのAIセキュリティエージェントの振る舞いを、公開スタイルのセキュリティ知識ソースに注入された単一の有毒な書き込みがどのように変えているかを示す。
11のCTF課題,3つのフロンティアLSMファミリー,2つのモデル世代,11の現実世界のCVEにまたがって,有毒化はランダムではなく体系的であることがわかった。
また,より強い証拠が存在する場合にも有効であるが,スパース・エビデンスやゼロデイ条件下では弱くなることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:37:34 GMT)
What Do Language Priors Contribute to Darcy-Flow Inversion? A Mechanistic Audit [1.7] 文の埋め込みが,学習した逆解法に地質学的記述を注入するための推論時インタフェースとして機能するかどうかを検証した。
テキストコンディショニングは,非文偽造に対して,再構成誤差を81%削減する。
これらの結果から,学習した逆解法に地質知識を注入するための工学情報インタフェースとして,言語先行が機能することが示唆された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:07:34 GMT)
CORE-BREW: LLR-Based Soft Decoding for Robust Multi-Bit LLM Watermarking [1.7] ブロックワイドBREWの定ヒットレート埋め込み拡張であるCORE-BREWを提案する。
CORE-BREWは固定ヒットレートp-スターを目標とすることで透かしチャネルを校正し、原理的軟判定復号のための閉形式対数類似率(LLRs)を得る。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:37:14 GMT)
The Geometry Behind Diffusion and Flow Matching: Gradient Flows and Geodesics in Wasserstein Space [1.6] 自由エネルギー F(rho) = KL(rho ) の勾配流はちょうどフォッカー・プランク方程式であり、その暗黙的・オイラー離散化は JKO スキームである。
その測地学は、正確にはフローマッチングが学習する最適な輸送経路である。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:25:24 GMT)
Efficient Quantum Circuits for Coherent Conversion Between General First- and Second-Quantized Many-Body Representations [1.6] 逆の$Qdagger$を持つ明示的な$Q$を構築し、最初の量子化された状態をその固定された$N$の占有数形式にマッピングする。
変換は入力に対して対称性に依存しないが出力で完全に解決され、ボゾン、フェルミオン、パラ統計学のセクターに一様に適用される。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:00:04 GMT)
Phoneme-Level Mispronunciation Screening in Polish-Speaking Children with an Explainable Assistant [1.6] ポーランド語を話す子どもを対象に,シビルト代替に焦点をあてたスクリーニングパイプラインを提案する。
wav2vec2ベースのCTCトークン認識器で、アライメントベースのエラータイピングと、診断ではなくスクリーニングのためのテンプレート接地型介護者アシスタントを備えている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:14:48 GMT)
Asymptotic Compression of Interactive Quantum Communication using Type-Constrained de Finetti Reduction [1.5] 古典的な入力を用いた量子対話型通信プロトコルの圧縮に制約付きデ・フィネッティ還元を適用した。
我々は、プリフリーな量子情報コストが、最悪の入力償却量子通信コストと等しいことを証明した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:09:31 GMT)
Feasibility-driven QAOA with penalty scheduling [1.5] ほとんどの量子アルゴリズムは、制約をQUBOの定式化の中でソフトペナルティ項として扱うことにより、制約付き最適化問題に対処する。
複数の不均一な制約を持つ問題に適した標準線形ランプQAOAの2つの拡張を導入する。
回路の深さやシステムサイズにおいて、QAOAがlr-QAOAと$-lr-QAOAより一貫して優れていることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 19:44:00 GMT)
When CQs Go Wrong: Challenges in CQ Verification with OE-Assist [1.5] 本稿では,CQ検証プロセスにおけるユーザパフォーマンスを高めるために,コンピテンシー質問(CQ)の課題と実現可能性について検討する。
その結果、曖昧さや過剰な複雑さを避けるために、CQを公開する前に洗練するツールの必要性が示された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:17:14 GMT)
An Analysis of Speculative Window Decoders for Quantum Error Correction [1.5] 投機的ウィンドウ復号化は、以前の復号化ウィンドウから依存物を待つ時間を削減することでパフォーマンスを向上させる。
異なる量子技術はゲート速度を遅くすることができるため、スローゲート速度下での投機的復号化性能を評価する。
この研究は、投機的復号化が最大のパフォーマンス改善をもたらすかどうかを特定するための設計原則を示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 01:19:35 GMT)
MedBench v5: A Dynamic, Process-Oriented, and Hallucination-Aware Benchmark for Clinical Multimodal Models [1.5] 既存の医療AIベンチマークには、プロセスの可視性、アトミックスキル評価、統合幻覚検出が欠如している。
臨床マルチモーダルモデルのための再設計されたベンチマークであるMedBench v5を紹介する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:23:46 GMT)
Homomorphic Encryptions for Privacy Preserving Vision [1.4] 我々は,暗号化されたデータのみを見て,プライバシ保護方式でコンピュータビジョンで推論タスクを実行することを目指している。
CNNに同型暗号を適用するには、暗号体系に従うために従来のCNN層を変更する必要がある。
各種データセットの分類精度を最小限に低下させることに成功した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 22:28:30 GMT)
NoLimits.jl: Flexible and Composable Nonlinear Mixed-Effects Modeling in Julia [1.4] NoLimits.jlは、フレキシブルで構成可能な非線形混合効果モデリングのためのオープンソースのJuliaパッケージである。
NoLimits.jlは、フレキシブルで、共依存的な観察とランダムな効果の分布をサポートする。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:04:55 GMT)
When Surveys Become Conversations: Adaptive Matrix Validation for AI-Assisted Interviews [1.4] 本稿では,AIを用いたインタビューを各応答者が完了する適応行列検証(AMV)を提案する。
推定器はまず、他の回答者の検証回答を使ってマッピングされた値を校正し、残りのエラーを修正する。
設計校正シミュレーション,アメリカン・タイム・ユース・サーベイ・エミュレーション,およびCHAMPS言語・オートプシー・ナラティブスタディは,スパース・バリデーションが精度を向上できることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:30:39 GMT)
Invariant Kalman filtering for extended pose estimation in multi-IMU articulated rigid-body systems [1.4] 運動木系に対するリー群表現である相対的なL-拡張ポーズを導入する。
我々はこれらの制約を、繰り返しIEKF(IterIEKF)内にノイズフリーの擬似測定として組み込む。
より高速に収束し、より低いラン・ツー・ランの変動を示し、最低のRMSEを一貫して達成し、第2ベストフィルタと比較して少なくとも50%の低減を実現している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:41:31 GMT)
Real-Time Interactive Music Generation via Data-Free Streaming Consistency Distillation [1.3] インタラクティブ音楽は人間のリアルタイム表現に依存している。
現代の生成音楽AIは、この領域にはほとんど欠落している。
このギャップを埋めるフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:37:15 GMT)
Anomalous weak values in a generalized Mach-Zehnder interferometer extracted directly from intensity measurements [1.3] 一般化されたマッハ・ツェンダー干渉計において、経路弱値を完全に特徴づける手法を提案する。
物質波干渉法において,この手法を実験的に実証した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:50:05 GMT)
Governed Shared Memory for Multi-Agent LLM Systems [1.2] 本稿では,フリートメモリの問題を定式化し,基礎的障害モードを4つ同定する。
システムレベルの明示的なプリミティブを定義する。スコープ付き検索,時間的スーパーセッション,プロファイランストラッキング,ポリシが支配するメモリ伝搬である。
これらのプリミティブは、プロダクションマルチテナントメモリサービスであるMemClawで実装され、ArgusFleet経由で評価される。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:04:14 GMT)
Analysis of Autonomic Regulation in Cancer Survivors During Daily Physical Activity: A Real-World Wearable ECG Study [1.2] 本研究では, 乳がん生存者の身体活動に対する心拍数(HR)と心拍変動(HRV)の反応について, 実環境において収集した心電図(ECG)データを用いて検討した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:14:48 GMT)
When Preferences Fail to Become Incentives: A Utility-Behavior Gap in Large Language Models [1.2] 現実シナリオにおけるLLM行動のモチベーションとして選好が役立っているかを検討する。
本研究では, LLMの出力品質を調節するために, 直接的誇張や他の明示的な方法を用いて動機付けを行うことが可能であることを示す。
我々は、コヒーレントな選好の存在は、これらの選好がモデルに対してインセンティブ的価値を持つことや、他の文脈における行動に影響を与える証拠とみなすべきではないと結論付けている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:42:48 GMT)
Retrieval-Augmented Personalization with Foundation Models for Wearable Stress Detection [1.2] ウェアラブルに基づくストレス検出のパーソナライズは、生理的および行動的反応の個人間変動がかなり大きいため、依然として困難である。
検索強化パーソナライズに基づく軽量な代替案を提案する。
非パーソナライズされたトランスフォーマーベースラインに対して,精度+3.92%,マクロF1スコア+4.76%のゲインを報告した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:24:43 GMT)
Predicting Poets' Origins from Verse: A Computational Analysis of Regional Linguistic Fingerprints in the Complete Tang Poems [1.1] 回路間の言語距離は地理的距離で増大する。
南と北の分離性は、高唐では可能であり、後期唐では最強である。
本研究は,文芸史の仮説生成手段として,解釈可能な機械学習を位置づけた。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 03:17:44 GMT)
ATRIA: Adaptive Traceable ECG Reporting with Iterative Agents [1.1] textscATRIAは、臨床医の反復ワークフローを反映したマルチエージェントECGレポートシステムである。
報告書は、その証拠を裏付ける証拠、その証拠によって支持されないフラグ、および追加の文脈の中間を包含する全ての報告を束縛する。
クラウドベースのWebサービスとして、textscATRIAはすぐにデプロイできる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:25:55 GMT)
Machine learning is revolutionizing weather forecasting -- the next step is a change in how we work [1.1] 機械学習と最近のデジタル技術は、予測バリューチェーンを再構築するだろう、と私たちは主張する。
エージェント・ソフトウェア・エンジニアリング、オープン・圧縮データ、共有検証、インタラクティブ・コンピューティングおよび生成手法がモデリング、評価、サービス作成を高速化し、よりインタラクティブで、より広くアクセスできるようにする6つの非実行領域について論じる。
これらの変更は、彼らのインフラ、データスチュワードシップ、信頼と品質保証フレームワーク、スキルとサービス提供に適応し、科学的理解、運用上の信頼性、人間の専門知識、公共サービスの役割を維持するために、気象と気候のセンターを必要とします。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:33:33 GMT)
VisCritic: Visual State Comparison as Process Reward for GUI Agents [1.1] 本稿では,前アクションと後アクションのスクリーンショットを直接比較することによってアクションを検証する視覚プロセス報酬フレームワークであるVisCriticを紹介する。
VisCriticは、変化を認識した表現を抽出するためにシームズ・ビジョン・トランスフォーマーを使用し、Action-Aware Critic Headと組み合わせている。
実験とオフライン分析により、VisCriticは多様なGUIエージェントのプラグイン・アンド・プレイ・エンハンスメントとして機能することが示された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:57:02 GMT)
Real vs. Complex Spectral Bases for Neural Operators: The Role of Green's Function Alignment [1.0] 我々は、FNOの正確な実数値ミラーであるハートレーニューラル演算子(HNO)を紹介する。
実ハートレースペクトルは共役対称性によって半減されないので、HNOはFNOの2倍の周波数角を保持する。
演算子相含量の単調な楕円-逆時間依存分割を求める。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:29:15 GMT)
AeroCast: Probabilistic 3D Trajectory Prediction for Non-Cooperative Aerial Obstacles via Transformer-MDN Architecture [1.0] AeroCastは、TransformerエンコーダとMixture Density Network出力ヘッドを組み合わせた確率的軌道予測フレームワークである。
9つの運動カテゴリにまたがるハイブリッドリアル・合成四極子コーパスでは、AeroCastは平均変位誤差と最終変位誤差を約50%削減する。
AeroCast推論は1サンプルあたり0.1msで完了し、100Hzのリアルタイムオンボードデプロイメントと互換性がある。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 19:52:07 GMT)
Holographic Memory for Zero-Shot Compositional Reasoning in Knowledge Graphs: A Mechanistic Study of Where and Why It Fails [0.9] HRRとFHRR(Fourier HRR)の2つのホログラフィックメモリ変種について検討し,それぞれに現代的なホップフィールドのクリーンアップを施した。
まず、どちらも競合するシングルホップレトリバー(HRRはMRR 0.358 +/- 0.002、FHRRは0.350 +/- 0.021)である。
ホップ1プローブは、メモリが高い忠実度(MRR 0.896 +/- 0.002 for HRR)で正しい中間体を復元することを示しているが、検証された正しい中間体であっても、構成は失敗する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:33:27 GMT)
Universal Extraction of Quantum Critical Exponents and Phase Transitions via Tailored Hilbert Space [0.9] 我々は、量子臨界現象を探索する新しいヒルベルト空間調整スキームを導入する。
1D XXZ鎖におけるベレジンスキー-コステリッツ-チューレス遷移の研究を通して、この枠組みの普遍的適用性を確立する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:46:01 GMT)
Reinforcement Learning Enables Autonomous Microrobot Navigation and Intervention in Simulated Blood Capillaries [0.9] 血液毛細血管ネットワークの物理的基盤シミュレーションを開発した。
我々は、深層強化学習エージェントをケモタキシーでナビゲートするように訓練する。
これらの結果は、複雑な環境下での自律的な微生物的介入戦略を開発するためのフレームワークとしてRLを確立している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:21:18 GMT)
Arbitrarily Loss-Tolerant Quantum Position Verification in a Single Execution [0.9] 量子位置検証(QPV)は、信頼できない証明者の空間的位置を証明しようとする。
量子位置検証(QPV)は、信頼できない証明者の空間的位置を証明しようとする。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:00:18 GMT)
Quantum Cinema: An Interactive Cinematic Exploration of Quantum Computing Hardware via Generative World Models [0.9] Quantum Cinemaはオープンソースのブラウザベースのインタラクティブアプリケーションである。
目に見えない量子ハードウェアを探索可能な映画体験に変換する。
プラットフォームを複製または拡張しようとする学者と開発者という2つのコミュニティを提供するように設計されている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:39:45 GMT)
SlipSense: Multimodal Sensing for Online Slip Detection in Legged Robots [0.8] SlipSenseは、四足歩行でスリップを検出するためのカスタムの軽量センサー付きフットを使用して、オンライン力に基づくスリップ検出のための新しいフレームワークである。
このフレームワークは、マルチモーダルセンサ設計とLSTMモデルを統合し、地上反応力を推定し、移動中のすべりの異常を検出する。
本手法は, 初期すべりを平均変位24.1 +/-6.4mm, 総合精度85.9%まで検出する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:40:36 GMT)
PHANTOM: A Large-Scale Dataset of Multimodal Adversarial Attacks for Vision-Language Models [0.8] 本稿では,視覚言語モデル(VLM)に対する,事前生成した敵攻撃の大規模かつオープンソースデータセットを提案する。
このデータセットは、有害なインテントの10の高レベルカテゴリと55のサブカテゴリをカバーすることで、多様な、代表的で実用的な、既存のベンチマークを拡張するように設計されている。
このデータセットは、最近の文献から最先端の攻撃戦略を用いて生成された、47の524対逆サンプルからなる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:20:40 GMT)
Accuracy and Satisfaction in Multi-Turn LLM Dialogues for NFR Assessment [0.8] 本稿では,HIPAA規制遵守分野における開発者とLLMベースのエージェントとのマルチターン会話の精度と品質について検討する。
開発者はLSMアセスメントに同意する傾向にあるが、専門家の根拠の真偽に対する正確性は低い。
ユーザの満足度をモデル化し、より長いシステム応答と情報提供のターンがユーザの満足度に悪影響を及ぼすことを確認します。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:15:40 GMT)
GCT-MARL: Graph-Based Contrastive Transfer for Sample-Efficient Cooperative Multi-Agent Reinforcement Learning [0.8] GCT-MARLは,MAILのマルチビューグラフと対照的なバックボーン上に構築された移動学習フレームワークである。
提案手法が目標タスクの収束を著しく促進することを示す。
このフレームワークは,2相転送プロトコルを逐次連鎖することで,連続的な学習を自然にサポートすることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:31:27 GMT)
Power-Flexible AI Data Centers: A New Paradigm for Grid-Responsive Compute [0.7] 従来の電力系統計画では、大規模コンピューティング施設を柔軟性のないピーク負荷として扱い、コストのかかるインフラのアップグレードとグリッド相互接続の長い遅延につながる。
最近の研究によると、AIクラスタはソフトウェアベースのワークロードオーケストレーションによって、ピーク時の電力消費を削減できる。
粒度の細かいクラスタ電力制御のためのグリッド信号,ワークロードスケジューリング,電力テレメトリを統合したアーキテクチャについて述べる。
130kWのGPUクラスタ上の実世界のデプロイによる実験結果は、優先度ジョブのサービスレベルを保ちながら、高速な負荷削減、持続的な削減、炭素認識操作など、さまざまな形式の柔軟性を示している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 19:13:19 GMT)
Cage-based Texture Transfer with Geometric Filtering [0.7] 化粧品の非化粧ゾーン(NCZ)を同定する手法を提案する。
当社のフレームワークは,アーティファクトの抑制に成功し,コンシューマデバイスへの即時展開を実現しています。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 22:34:34 GMT)
NoContactNoWorries: Estimating Contact through Vision and Proprioception for In-Hand Dexterous Manipulation [0.7] NoContactNoWorriesは、RGB-Dビジョンとロボットの受容とを融合してバイナリ接触状態を推測するフレームワークである。
提案手法は, 物体の逆方向を推定するために, 下流の強化学習エージェントをサポートすることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:36:46 GMT)
High-Fidelity Synthetic Transmission Electron Microscopy Image Generation Using Diffusion Probabilistic Models for Data-Limited Semiconductor Metrology [0.7] 本稿では, 極度のデータ不足下での合成TEM画像生成のための分散拡散確率モデル(DDPM)フレームワークを提案する。
プログレッシブパッチベースのトレーニング戦略は、低解像度のパッチからフルイメージにスケールし、わずか15サンプルでストレートスクラッチトレーニングを可能にする。
合成画像は, MS-SSIM > 0.98 まで到達し, 構造的類似性に整合した定性評価を行う。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:02:58 GMT)
Evidence for feature-specific error correction in LLMs [0.7] 理論は、重ね合わせにおける計算は、特権が一般的なものよりも方向を特徴付けるような誤り訂正を必要とすると予測している。
本稿では,アクティベーション摂動に基づく大規模言語モデルにおける誤り訂正実験を提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:22:06 GMT)
On the localization transition from MAA to AA models [0.7] 非ゼロな偶数点ポテンシャルを持つ原始的MAAと、非ゼロな奇数点ポテンシャルと可変振幅係数を持つ修正的MAAモデルを構築した。
逆参加率,正規化参加率,フラクタル次元および実空間波動関数分布の数値計算により,そのような局所化特性が確認できる。
構築されたDMAAモデルは、2つの類似した準周期モデル間の局在化遷移過程を研究するための新しいフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:43:20 GMT)
Spectrally engineered collinear type-0 SPDC source with enhanced spectral brightness for entanglement distribution [0.6] スペクトル輝度の高い絡み合った光子源は、フォトニック量子情報処理にとって重要な資源である。
そこで本研究では, スペクトル輝度を高め, 絡み合い分布に高め, スペクトル設計したType-0自発パラメトリックダウンコンバージョン源について紹介する。
この結果から, スペクトル工学は, 量子通信への応用のために, コンパクトでスペクトルの強い光子源への実用的な経路を提供することがわかった。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 00:36:17 GMT)
The Cost Geometry of Belief: finite-resource inference under noisy observation [0.6] 系の有限機械のデジタル双対は、有限ノイズセンサを通して領域を観測する。
我々は、そのコヒーレントな出力を、信念、状態上の確率密度、ベイズの後部、などとモデル化する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:50:08 GMT)
A Controlled Study of CLIP-Based Body-Scene Fusion for Emotion Recognition in Context [0.6] 自然画像の明瞭な感情は、顔だけでは見えないことが多い。
本研究は,EMOTICにおける文脈認識型感情認識を画像のみの2ストリームモデルで研究する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:00:10 GMT)
Visualizing "We the People": Bridging the Perception Gap through Pluralistic Data Storytelling [0.6] 伝統的なビジュアルデータストーリーテリングは、競合する2つの単純化されたグループを描いたバイナリグラフィックスに依存している。
これにより、グループ内の不一致を単純化し、曖昧さを排除し、アイデアや価値観を共有することで、政治的分極を高めることができる。
AI対応デジタルプラットフォームのための意図的かつ多元的な設計選択は、ニュアンス、意見分布、グループ間共通性を強調する視覚化を生成することができる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:28:11 GMT)
Surprise-Guided MergeSort: Budget-Efficient Human-in-the-Loop Ranking via Adaptive Comparison Scheduling [0.6] 人間の判断を真に必要とする比較を識別する枠組みを提案する。
textbfSurprise-Guided MergeSort (SGS)フレームワークは、これを3つの統合コンポーネントで実現している。
テキスト類似性(STS-B, BIOSSES, SICKR-STS)と画像品質評価(KonIQ-10k, TID2013, LIVE Challenge)の6つの多様なベンチマークで検証を行った。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:34:02 GMT)
Uncertainty-aware reinforcement learning for chemical language models [0.5] 強化学習(RL)はデノボ分子設計の強力なパラダイムとなっている。
我々は、不確実性を考慮したRLにより、CLMがより堅牢な化学空間を探索できることを示す。
これは、分子のスコアを損なうことなく、より信頼性の高いヒット発見につながる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:42:46 GMT)
Tractable Reasoning and Conjunctive Query Answering for Defeasible DL-Lite under Rational Closure [0.5] 本稿では,Rational Closure (RC) の軽量記述論理のDL-Liteファミリーのコアおよびホルン変種への適用について検討する。
私たちの主な貢献は、既存の標準の古典的推論に基づいて構築されたプラグインアーキテクチャを提供することです。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:02:07 GMT)
Statistical Foundations of LLM-based A/B Testing: A Surrogacy Framework for Human Causal Inference [0.5] 大規模言語モデル(LLM)で推定される治療効果が,ヒトの関心事に対する効果を回復できるかどうかを検討した。
終端理論をLCMに適応させる統計的枠組みを開発する。
LLM応答に対するA/Bテストは仮定によってのみ正しいが、人間に対するA/Bテストは設計によって正しい。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:53:08 GMT)
Ensemble Feature Selection and Harris Hawks Optimization for Explainable Mental Health Risk Prediction in Female Sex Workers [0.5] 女性性労働者(FSW)は精神疾患、特にうつ病に苦しむ。
現在の機械学習(ML)モデルは、通常、この辺境化グループに存在する高次元および複雑なリスクパターンを捉えるのに効果がない。
本稿では,ANOVAと相互情報を用いたアンサンブル特徴選択戦略と,ハリス・ホークス最適化によるロジスティック回帰を組み合わせた予測モデルを提案する。
提案されたモデルは従来の分類器よりも有効であり、精度は95.78%、F1スコアは95.77%、AUCは0.96である。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 01:19:19 GMT)
Female-RHINO: A Real-Time Scanner-Integrated Framework for Automated Quantitative Uterine MRI Analysis and Structured Reporting [0.5] 女性RHINO: (R)eproductive (H)ealth (I)maging A(N)alysis T(O)ol, a real-time AI-assisted framework for automated quantitative uterine MRI analysis and structured reporting during image acquisition。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:22:25 GMT)
Closed-Loop Graph Algorithm Execution with Small Language Models: Step Accuracy and Rollout Reliability [0.5] モデルが現在のグラフとアルゴリズム状態から次のアクションを繰り返し選択する閉ループ予測問題としてグラフアルゴリズムの実行について検討する。
評価フレームワークは,いくつかの古典的なグラフ処理,複数の合成グラフファミリ,解離学習,検証,テスト分割を網羅している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:02:06 GMT)
Automatic Part-of-Speech Tagging of Arabic-English Dictionary Senses through WordNet [0.4] 本稿では,バイリンガル辞書のPOSタグ認識のためのアルゴリズムを提案する。
このアルゴリズムはAl-Mawrid Arabic- English 辞書に適用される。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:49:26 GMT)
Information from coincidences [0.4] 我々は、情報理論の変分結果の広い範囲を統一する1つの代数的混合偶然同一性導出を証明した。
アイデンティティは、経験的分布の集中、仮説テストエラー指数、変化測定の不等式、まれなパターンの偶然を規定する法則といった、情報理論の統一的な基盤を生み出している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:01:05 GMT)
MedPCFM: Improving Medical Point Cloud Completion by Integrating Point Transformers and Flow Matching [0.4] 我々は,医療点雲完成のためのフローマッチング手法であるPCFMを紹介する。
我々は,SkullFixとSkullBreak,さらに最近の下顎欠損データセットについて検討した。
PCFM with PTv3は決定論的PTv3ベースラインと競合し、最先端の生成性能を達成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:09:20 GMT)
LLM Performance on a Real, Double-Marked GCSE Benchmark [0.4] 我々はGCSEモック試験に32,534人の学生の回答をダブルマークしたデータセットを導入した。
既成の大規模言語モデルが試験員と密接に一致しているかどうかを, 両試験官が互いに一致しているかどうかを検証した。
対象者間のコンセンサスに圧倒的に一致し, 上位モデルでは, 受験者同士のコンセンサスよりも, 受験者と密に一致していることが判明した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:46:14 GMT)
Unsupervised Memory-Enhanced Video Transformers: Obstacle Detection for Autonomous Agricultural Rover [0.3] ビデオメモリトランスフォーマによる異常検出(VMTAD)は、動的農業シーンにおけるリアルタイム障害物検出のための教師なしの手法である。
挑戦的なデータセットでは、VMTADは最先端のパフォーマンスを達成し、受信器動作曲線の下で0.973検出と0.997セグメンテーション領域に達した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:29:54 GMT)
Training Dynamics of Neural Software Defect Predictors under Coupled Data-Quality Issues [0.3] 本研究では,クラス不均衡,重なり合い,およびそれらの結合から生じるトレーニング・ダイナミックス・パターンが,インタラクション・アウェアな条件下でどのように特徴付けられるかを検討する。
本研究は、メトリックベースのSDPにおいて、データ品質の複合問題に対する対話型経験的プロトコルと、トレーニング力学パターンの候補分類を作成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:08:55 GMT)
The Latent Bridge: A Continuous Slow-Fast Channel for Real-Time Game Agents [0.3] リアルタイムエージェントは、数ミリ秒以内に動作しつつ、数秒以上計画しなければなりません。
推論VLMは効果的に意図するが、応答毎に1.5秒を要する。
反応性のVLMはミリ秒で作用するが、計画的な作業では不十分である。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:01:39 GMT)
Enhancing Clinician Decision-Making via Uncertainty-Aware Multi-Expert Fusion for Stroke Rehabilitation [0.3] 臨床的判断に取って代わるのではなく、拡張するように設計されたエンジンであるxAARAを提示する。
xAARAは、タスク、ムーブメントフェーズ、ムーブメント品質のレベルを越えて、キャリブレーションされた不確実性と説明でARATアセスメントを返します。
105回のストロークサバイバー(788回の運動)では、xAARAは94.2%のタスク精度と81.3%の移動位相精度を達成した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:00:15 GMT)
Decentralised AI Training and Inference with BlockTrain [0.3] Spheroid BlockTrainは、モデルを独立したトレーニング可能なブロックに分割する分散トレーニングプロトコルである。
共有6人のブロックトレーニングランがCE 1.385に到達し、同じブロックの更新を1つの組立モデルに平均化する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:47:33 GMT)
Linear optical Bell state measurement for rotation-symmetric cat codes [0.3] 回転対称キャット符号(RS-cat code)は、量子情報処理のためのボソニック符号である。
本研究では,半ビームスプリッタのみを用いたRS-cat符号のベル状態測定プロトコルについて検討する。
我々は、光子損失による成功確率を数値的に評価し、高次RS-cat符号が有利となる損失状態を特定する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:58:52 GMT)
PORTER: Language-Grounded Event Representations for Portable Structured EHR Foundation Models [0.3] 固定語彙からイベント表現を分離する構造付きEHR基盤モデルである PortER を導入する。
ポーターは、凍結したテキストエンコーダを使用して記述を通じてイベントを表現し、専用の経路を通じて数値値を統合し、患者のタイムラインを通して臨床力学を学ぶ。
ポーターはタスク固有のテキストシリアライゼーションよりも高いAUROCを実現し、329倍のアモルティフィケーション計算を実現した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 03:33:25 GMT)
Exact log-depth preparation of highly entangled matrix product states [0.3] 量子デバイス上での行列積状態(MPS)の合成は多くの量子アルゴリズムの重要な部分である。
スケールを$L$で犠牲にすることなく、正確に準備の仕方を示す。
また、独立かつ同一に分布するランダムテンソル列に対する対数-深度精密な準備を証明した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:08:42 GMT)
Quantum Metric Bound State of Light [0.3] 欠陥誘起境界状態の指数的崩壊長は、未摂動平面バンドの量子メートル法により下界であることが証明された。
これは合成波動プラットフォームにおけるエンジニアリング制限モードの予測設計原則である。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:58:44 GMT)
Breaking the Filter Bubble: A Semantic Pareto-DQN Framework for Multi-Objective Recommendation [0.2] 本稿では,多目的のマルコフ決定プロセスとして推薦を形式化する多目的強化学習フレームワークを提案する。
我々のアーキテクチャは、エンゲージメント、多様性、公平性を、静的報酬スキャラライゼーションの落とし穴を避けるために、識別できない報酬信号として扱います。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 00:58:16 GMT)
SURGELLM: Rethinking Multi-Task Evaluation through Task-Aware Feature Gating with Class-Balanced Normalization [0.2] 不均一なNLPタスクに展開される微調整エンコーダは、3つの複合的な問題に直面している。
textbfsurgellmは、専用の軽量モジュールでそれぞれに対処する統合トランスフォーマーフレームワークである。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:47:21 GMT)
Flood Mapping from RGB imagery using a Vision Foundation Model [0.2] 集落周辺の洪水範囲の高解像度マップは緊急対応と被害評価に不可欠である。
洪水マップを作成するために、水分割のための深層学習モデルがよく用いられる。
ビジョンファウンデーションモデルや大きなビジョントランスフォーマーは、ドメインをまたいで一般化することが知られている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:12:33 GMT)
When to Skip Syndrome Extraction in Surface-GKP Codes [0.2] 表面GKP符号に対する具体的な適応型スキップ方式を提案する。
本手法は, 実測ベースラインに匹敵する論理誤差率を維持しつつ, サーフェス・コード・スタビライザーの測定回数を減らすことができることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:01:14 GMT)
Deep Learning Approaches for 3D Medical Scene Completion: From Geometric Modeling to Generative Paradigms [0.2] 3次元シーン補完はコンピュータビジョンとロボット工学の主要な問題として進化し、その応用は様々である。
過去10年間に行われた研究のコントリビューションをまとめるために、体系的なレビューが実施されている。
この研究は、次世代システムの開発に追従できる方向性を明確にするための研究課題を提示した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:05:28 GMT)
Model selection with proper scoring rules on data sets of time series [0.1] 時系列のデータセットにおける確率モデル間のモデル選択の問題を考える。
モデル選択には、スコアの値を複数の時系列に集約する必要がある。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:36:28 GMT)
Inside Crypter-as-a-Service: An Ecosystem Analysis of the exploit.in Underground Forum Research Talks [0.1] ロシアの主要サイバー犯罪フォーラムである exploit.in 上で Cr エコシステムの経時的評価を行った。
我々の分析によると、 exploit.in の暗号は静的ツールとして販売されているだけでなく、継続的に保守されている運用サービスとして販売されている。
社会的ネットワーク分析により、市場は階層的に非常に中心的なアクターの小さなコアを中心に構築されていることがわかった。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:13:41 GMT)
Bit-Precise Conformance Testing of Simulink Model Checkers [0.1] Simulinkは、実用的なモデリング言語と、サイバー物理システムの開発のためのシミュレーションエンジンを提供する。
Simulink Design Verifier (SLDV) やサードパーティのSMTベースのモデルチェッカー (SmtMC) など、正式な検証ツールが提供されている。
本研究の目的は、以下の項目に対処することで、Simulinkモデルチェッカーの品質を検証することである。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:40:49 GMT)
How Modular Is a Frontier Mixture-of-Experts? A Pre-registered Causal Test in Which Apparent Expert Modularity Mostly Dissolves [0.1] 我々は、ルーティングマスアトラスを構築し、6つのファミリー対軸仮説を事前登録し、サイズマッチングされたランダムエキスパートヌルに対して各ファミリーを推論時にアブレーションする。
4つのメトリクスで同じファミリーをテストし、信頼度の高いブートストラップ間隔で独立した独立したコーパスを実行します。
登録済みの6家族のうち、アラビア語族のうち1家族だけが独立したコーパスと保守的な統計的バーを生き残る清潔な選択的なモジュールである。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:55:41 GMT)
SwarmFly: A simulation platform for UAV swarm experiment design and validation [0.1] 既存のオープンソースツールは、しばしばメンテナンスされていないか、急勾配の学習曲線を持っているか、単一の固定シナリオを中心に構築されている。
SwarmFlyはリアルタイムの運用マップと4つのSwarm調整モード、シミュレートされたIMUテレメトリ、IPベースの位置情報を組み合わせた。
SwarmFlyはマルチエージェントの空中群を広範囲の内部および外部の破壊に対して露呈する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 20:18:00 GMT)
LLMs Prompted for Legal Context Object More: Overrefusal from Small On-Premises LLMs in Criminal Legal Context [0.1] オーソリティスタイルの接頭辞は,no-playベースラインに対して2-20倍の拒絶率を示す。
既知のロールプレイプレフィックスは、混合効果を示し、いくつかのモデルでは拒絶が急激に増加し、他のモデルではほとんど変化しない。
この発見は、実際の機関ユーザが自然に導入するかもしれない文脈的フレーミングの下で、小規模のオンプレミスデプロイ可能なLDMが不安定であることを示している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:47:07 GMT)
Wigner's Phase Space Current for Variable Beam Splitters -- Phase Space Rotations and Newtonian Trajectories [0.0] ビームスプリッタの強モード混合力学の挙動について検討する。
我々は対応するウィグナー電流の形式、J.Jの形式を導出する。
可変ビームスプリッターの動力学は2つの位置の平面内に閉じ込められた回転に等しいことを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:19:59 GMT)
Why Do Accumulated Transformations Extrapolate? [0.0] PaTHアテンションは、RoPEの位置インデクシングされた回転を蓄積したデータ依存リフレクションに置き換えることで、強い長さの外挿が得られることを示した。
我々は,RoPEのブロック対角SO(2)回転を保ちながら,位置付き角度を累積トークン依存の角度に置き換える簡易な変種について検討する。
結果が一定の正則性条件を満たす累積変換にまで拡張されることを証明した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:08:30 GMT)
When Top-1 Fails: Calibrating LoRA Monitors for Masked Diffusion LMs [0.0] 離散拡散言語モデルファインチューニングは、信頼性モニタから安価な診断を継承するが、PEFT訓練の意味は未検証である。
崩壊警報としてトップ-1 argmax濃度を試験した。
3つのDLMファミリーの816 LoRA/PEFT構成で、ログは200ステップの水平線で0/816の実際の崩壊を記録し、精度はゼロである。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:09:58 GMT)
When Helpfulness Overrides Causal Caution: Context-Dependent Suppression and Recovery in LLMs [0.0] 因果因果関係は、実証的証拠が不十分な場合に因果判断を控える正当性である。
本研究では,LSMが学術的から実践的な助言的文脈に移行した際の因果因果関係の系統的抑制について検討した。
有用性指向性反応パターンは, 実践的助言的文脈における因果因果関係の発現を抑制する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:00:13 GMT)
Venice-H1: Failure-Aware Query Re-Ranking with Multi-Scale Grid Signatures for Referring Image Segmentation [0.0] 軽量でバックボーンを分離したポストホックリグレードモジュールであるVene-H1は、マルチスケールグリッドシグネチャを通じて、各候補をエンコードする。
ヴェネツィア-H1デルタ_failは+1.40および+0.89 mIoUで、全16/16(スプリット、バックボーン)ペアで95%CIを厳密に陽性とし、有害スウィッチ率は0.53%未満であった。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:13:27 GMT)
Universality beyond the Kibble-Zurek mechanism in the condensation of coherently coupled Bose gases [0.0] 本研究では,コヒーレント結合したボース気体の非平衡凝縮時に生じる点状位相欠陥の普遍的空間統計について検討する。
我々の結果は普遍的普遍性幾何学を確立し、コヒーレントに結合したボース気体における非平衡凝縮の基本的特徴として同定する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:45:10 GMT)
Uncovering Latent Structures in Robust Pulse Sequences: A Model-Based Reinforcement Learning Approach for Adaptable Quantum Control [0.0] 量子システムのリアルタイム適応制御には、堅牢で高忠実なパルスを迅速に生成する必要がある。
モデルに基づく強化学習に基づくロバストな最適量子制御手法を提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:37:04 GMT)
Two-Electron Effects Extend High-Harmonic Generation into the keV Regime [0.0] 2電子プロセスは、従来の単一能動電子切断を超える高調波を発生させることができる。
我々は、強い数サイクル赤外線レーザーパルスによって駆動されるヘリウム原子の2電子過程で発生する高調波スペクトルを計算した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:23:19 GMT)
Transformer-Based Language Models Across Domain Verticals: Architectures, Applications and Critical Assessment [0.0] トランスフォーマーベースの言語モデルは、自然言語処理のデフォルトの基盤となっている。
メカニズムのレベルでは、主要なトランスフォーマーファミリーを作業分類に編成する。
その後、議論を2023年以降に展開し、実際に状況を変えました。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:09:55 GMT)
Transformation Behavior of Images in Latent Space [0.0] 病理組織分類タスクのためのニューラルネットワークのトレーニングは、潜在空間へのデータエンコーディングに依存する。
本稿では,古典的画像変換が潜在空間に与える影響について検討する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:06:00 GMT)
Towards Structuring an Arabic-English Machine-Readable Dictionary Using Parsing Expression Grammars [0.0] 本稿ではアラビア英語のAl-Mawrid辞書の機械可読版を部分的に構成する手法を提案する。
この方法は、Al-Mawridのエントリを単語と句読点のストリームから階層構造に変換する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 23:17:51 GMT)
Towards Scalable Multi-Task Reinforcement Learning with Large Decision Models [0.0] マルチタスク・マルチモーダルトランスフォーメーションである LDM-v0 を導入し,複数のドメインとモダリティにまたがる数千の環境から収集したトラジェクトリをオフラインでトレーニングした。
本研究では,ロボット工学,自律運転,在庫管理,サイバーセキュリティ,トレーディング,ビデオゲームなど,約1,000の環境において,個別に訓練されたタスク固有参照ポリシーの性能に一致した1つの事前訓練モデルを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:13:08 GMT)
Themis: An explainable AI-enabled framework for Reinforcement Learning with Human Feedback [0.0] 我々は,人間からの強化学習のためのXAI対応テストおよび評価フレームワークであるThemisを紹介する。
Themisは200以上の広く使われている環境をサポートしており、RL、透明性、アライメントの試験が容易に行える。
また、人間のフィードバックを収集し、実験を管理するクラウドベースのプラットフォームも提供しています。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:20:42 GMT)
The Vector and Canonical Components of the Momentum Operator in 3D Euclidean Space Spanned by General Curvilinear Coordinates [0.0] 我々は3次元ユークリッド空間における運動量作用素のエルミートベクトルと標準成分を構築する。
より広い聴衆によるアクセシビリティのために、まず単純な極座標の形式を開発し、次にGCCのケースを開発する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:36:32 GMT)
The Quantum Split-Step Fourier Algorithm for Nonlinear Optical Waveguides [0.0] 非線形光導波路のための量子分割ステップフーリエ(QSSF)アルゴリズムを提案する。
QSSFは非線形シュルディンガー方程式のスプリット・ステップの伝播と、量子ゆらぎのボゴリューボフ進化を共役保存する数値的枠組みである。
超高速導波路プラットフォームにおける非線形周波数変換、超連続生成、マルチモード圧縮光形成における量子相関に関する実用的な情報理論的診断を提供する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:40:27 GMT)
The Geometry of Sequential Learning: Lie-Bracket Prediction of Transfer Order [0.0] シークエンシャルラーニングは、命令SFTとDPOへのパイルスタイルの次世代ドメイン適応から順に依存する。
局所順序効果は、勾配更新場のリーブラケット換算器である計算可能な幾何量によって支配されることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:39:38 GMT)
The African Language Tax: Quantifying the Cost, Latency, and Context Penalty of Tokenizing African Languages in Frontier LLMs [0.0] トークンライザは、他の言語よりも多くのサブワードトークンを割り当てるため、高いトークンフェタリティを持つ言語の話者は、モデルが呼び出される前に構造的なペナルティを支払う。
このペナルティは、一般に多言語設定のために文書化されているが、アフリカ語では体系的に測定されていない。
5つの言語ファミリーと3つのスクリプトにまたがる20のアフリカの言語で測定します。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:47:03 GMT)
The $ω$-Effect from a Multimode Squeezed Graviton State [0.0] オープン量子系において、到達不能な重力の次数との相互作用は、還元中間子力学を非一意的に表現することができる。
マルチモード圧縮重力環境から生じる$$-effectの顕微鏡的導出について述べる。
その結果、$$-エフェクトは重力環境の古典的でない状態の一般的なシグネチャである可能性が示唆された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:12:04 GMT)
Symmetric mass generation of interacting chiral fermions on a one-dimensional lattice without fermion doubling [0.0] 直接格子実現は、局所的なキラルな離散化のためのフェルミオン二重化と、6つのフェルミオンギャップ相互作用の摂動的無関係という2つの障害に直面している。
厳密な1次元のタンジェントフェルミオン格子上にモデルを定式化し、非局所ホッピングはミラーパートナーのない単一のキラル分岐を生成する。
密度行列再正規化群計算は、縮退した基底状態が現れることなく、この状態における励起ギャップの開度を示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:34:45 GMT)
Spherical-to-ERP Epipolar Rectification for Single-Axis Disparity in 360 Stereo [0.0] 球面から等方形への標準射影(ERP)を前処理ステップとして採用し, エピポーラ曲線を直線化し, 1次元の凹凸構造を復元する。
合成魚眼ステレオデータセットの実験により、この球面-ERP-to-RAFT+EACSパイプラインは、正確に、滑らかで、構造的に整合した不均一なマップをリアルタイムで生成することが示された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:27:07 GMT)
Speculative Decoding at Temperature Zero: A Scoped Safety-Invariance Screen with a 48,072-Sample Expansion [0.0] 投機的復号化は、ターゲットモデルを検証するためのトークンをドラフトモデルに提案させることで推論を加速する。
温度0では、ドラフトサイドの動作が安全マークの出力に漏れる可能性があることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 19:06:42 GMT)
Spatial Partial Functionalization of Neural Networks based on Noise Fields [0.0] ニューラル計算におけるノイズは、通常障害と見なされるが、その空間分布は、ネットワークのどの部分が計算に参加するかを積極的に制御する。
本稿では,雑音場を用いた雑音変調ニューラルネットワークの空間的部分関数化について検討する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:50:50 GMT)
Silent Failures in Physics-Informed Neural Networks: Parameter Poisoning and the Limits of Loss-Based Validation [0.0] 低トレーニング損失は、学習された解が物理的に正しいことを示す証拠として扱われる。
本稿では、符号化された物理が正しくない場合に仮定が故障することを示す。
私たちは低損失でトレーニングするが、誤った回答を与えるモデルを作成します。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 20:35:50 GMT)
Securing LLM-Agent Long-Term Memory Against Poisoning: Non-Malleable, Origin-Bound Authority with Machine-Checked Guarantees [0.0] LLMエージェントは、永続的な長期記憶にますます依存している。
相手は信頼できないコンテンツを1つのセッションに格納することができ、後に支払い、設定変更、データ流出などの連続的なアクションを操縦する。
既存の防衛は、記憶項目の権限に基づいて、その内容(判断または信頼評価)または導出履歴(線)に作用する。
攻撃者は、LLMエージェントに特有の3つのチャンネル(エージェントの要約、信頼できるツールエコー、製造されたコロンボレーション)を通じて、信頼できない起源を洗い流すことができる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:57:50 GMT)
SeFi-Image: A Text-to-Image Foundation Model with Semantic-First Diffusion [0.0] SeFi-Imageはセマンティックファースト拡散に基づいて構築されたテキスト・ツー・イメージの基礎モデルである。
我々は,SeFi-Imageを3つのモデルスケール,1B,2B,5Bパラメータでインスタンス化する。
SeFi-ImageはGenEval, DPG, LongTextBench, OneIG, DMDG-2Kなど,幅広いベンチマークで高いパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:46:47 GMT)
Same Lesson, Different Story: Cross-Lingual Reconstruction of Cultural Narratives in Large Language Models [0.0] 本研究では、15言語にまたがる414の証明を言語横断的に収集する多言語評価物語フレームワークを提案する。
この分析は、モデルが言語間で意味を保っているかどうか、言語間条件付けが物語の実現にどのように影響するか、そして異なるモデルファミリーが類似の解釈に収束しているかどうかを評価する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:10:34 GMT)
SEAGAN: domain-Specific and Edge-Aware Graph Attention Network for Dynamic Plant Processes [0.0] 鍵となる例として、A-Ci曲線があり、これは純CO2同化率(Anet)と葉の細胞間CO2濃度(Ci)を関連付ける。
正確な推定には、各曲線点における活性な生化学的制限状態の正確な同定が必要である。
ここでは、A-Ci曲線の極限状態同定をグラフベースのノード分類問題として表現する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:43:25 GMT)
Robust Dual-Signal Fusion: Hybrid Neuro-Symbolic Gating with Compressed Chain-of-Thought Refinement for Irony Detection in Social Media Texts [0.0] 本稿では,CoT (Chain-of-Thought) 推論トラジェクトリをSFT (Supervised Fine-Tuning) なしで圧縮するニューロシンボリックアーキテクチャであるRobust Dual-Signal (RDS) Fusionを紹介する。
RDSは78.1%の精度と0.777ドルのマクロF1を達成し、微調整されたBERTweetの絶対的なパフォーマンス天井と一致する。
RDSの融合はRoBERTaのアブレーションと比べ統計的に重要ではなく、同時相乗効果はスタンドアローンベースラインよりも統計的に顕著に改善される。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:44:51 GMT)
Reasoning as Attractor Dynamics: Latent Memory Retrieval via Gibbs-Weighted Energy Minimization [0.0] 大規模言語モデル(LLM)は伝統的に自己回帰型ジェネレータと見なされている。
本研究では,数学的推論のエネルギー景観について検討する。
軌道のスペクトルエントロピーのギブス測度に基づく検索機構を導入する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:07:39 GMT)
Reachability and optimal-time certificates for quantum control [0.0] 制約量子制御における有限時間到達性と最適時間証明のためのフレームワークを開発する。
筆者らのフレームワークの汎用性を3つのユースケースで示す: 2および3キュービットの絡み合った状態準備、異なる制御における1キュービットゲート合成、および$N$-qubit$XX$チェーンでの励起転送。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:40:58 GMT)
Rapid FinFET Modelling Using an Autoencoder [0.0] 我々は、全I-V曲線を低次元潜在空間に圧縮するオートエンコーダを訓練する。
重要な革新は、入力特徴としてドレインからソース電圧(VDS)などのパラメータを明示的に組み込むことである。
トレーニングされたモデルは、完全なI-V曲線を再構築し、重要なデバイスメトリクスを直接抽出する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 01:15:50 GMT)
Rapid Cavity-Based Mid-Circuit Measurement and Feedforward in a Neutral Atom Array [0.0] 高精細な光学キャビティに結合した原子量子ビットの配列において、高速な中間回路計測とリアルタイムフィードフォワードを示す。
提案手法は, 測定・フィードフォワードサイクル時間を100ドル以下に削減し, 中立原子量子系の高速制御のための経路として光学キャビティを確立する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:48:08 GMT)
Quantum ring all-reduce: communication and privacy advantages for distributed learning [0.0] 機械学習モデルは前例のない規模にスケールし、分散デバイス間のトレーニングを現場におけるデファクトスタンダードにしている。
本研究では,従来の学習モデルと量子学習モデルの両方において,量子通信が分散トレーニングを,コミュニケーション効率と情報理論的にプライベートに両立させる方法について検討する。
本稿では,学習モデルや勾配を変更することなく,事前共有エンタングルメントと超深度符号化を用いることで,リンクごとのオンライン通信を最適に2倍に削減する量子バージョンを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:32:01 GMT)
Quantum Primitive for Output-Hiding Function Sharing [0.0] 量子情報理論プリミティブは、複数のパーティのローカルなプライベート入力に依存する離散値関数を決定するために導入された。
プリミティブは、互いのローカル入力を相互に学習し、関数値を決定する。
結果の関数値は当事者間で共有されるが、外部のオブザーバから情報理論的に隠されることがある。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:39:49 GMT)
Quantifying Explainable AI-introduced signal noise on ECG data with Spectral Entropy [0.0] XAI出力におけるノイズの尺度としてスペクトルエントロピーを用いることを提案する。
我々は、ECGデータセットにおける不整脈の分類の文脈において、その有用性を示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:47:29 GMT)
Quant Convergence: Bridging Classical Value Investing and Modern Factor Models for Systematic Equity Selection [0.0] 現代の金融は、株式市場でパターンを見つけるために複雑な機械学習モデルに大きく依存している。
我々は、ベンジャミン・グラハムの古典的な価値投資ルールが数学的「ローパスフィルタ」として機能するかどうかをテストするために、この研究を設計した。
私たちは、純粋なGrahamルール、現代的な市場要因、両方の組み合わせという、3つの異なる機能セットを構築しました。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:40:21 GMT)
Project Ariadne: Prompt-Conditioned Route Generation for Synthesis Planning [0.0] 再合成計画では、ターゲット分子と市販の開始物質を多段階経路で接続する。
直接経路生成はシーケンス生成として再合成を行うが、既存の直接生成手法は異なる計画仕様のための別々のモデルを訓練している。
本稿では,1つのプロンプト-コンプリートシーケンスにおいて,ターゲット,オプション制約,ルートを表すデコーダのみのルートジェネレータであるAriadneを紹介する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:12:11 GMT)
Preparing multi-qudit states in a definite-weight subspace [0.0] 定重部分空間において任意の多重量子状態を作成するアルゴリズムを定式化する。
マルチセット置換のためのグレイ符号に従って対応する基底状態を順序付けすることにより、状態準備タスクを縮小し、制御された2量子グレイ回転のシーケンスを実行する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:51:31 GMT)
Perfect State Transfer on Quotient Graphs in Shunt Decomposition-Based Quantum Walks [0.0] 本稿では,シャント分解法による離散時間における完全状態伝達(PST)について検討する。
親グラフのシフト作用素 $G$ と商グラフ $G/$ との明示的な関係を導出する。
PSTが$G$で、かつ$G/$でのみ発生することを証明します。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:18:49 GMT)
Parallel Manifold Steering: Efficient Adaptation of Large Associative Memories via Residual Energy Shaping [0.0] 大型トランスフォーマーモデルは連想記憶(DAM)として機能する
我々は,大域平衡を変化させたりシーケンス長を拡大したりすることなく,トランスフォーマーの有効エネルギー景観を変調する機構であるtextbfH-Resを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:30:23 GMT)
OxyMake: A Formally-Specified, Content-Addressable Workflow Engine [0.0] Rustエンジンはプロキシをcontent-addressedキャッシュキーに置き換える。
仕様は宣言的かつ静的に解析可能であり、Makeルールモデルを保ち、Snakemakeパイプラインを直接ポートする。
実行は、協調的なクレーム/リコールプロトコルを介してデーモンフリーである。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:07:43 GMT)
On the Smallness of the Large Language Models Scaling Exponents [0.0] 本稿では,現在のLarge Language Models (LLMs) アプリケーションのスケーリング指数が,エネルギー資源の観点からは持続不可能な状態を示していることを示す。
また、無限データにおける損失関数の非ゼロ値の無視により、そのような指数の小さい値が数値バイアスに寄与することは、持続不可能性の問題を取り除くものではないことを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:31:39 GMT)
On the Berry-Keating Operator [0.0] Berry-Keating演算子$H_BK$の2つの異なる視点をレビューする。
1つは、純粋にヒルベルト的視点、ダイレーション作用素、メルリン変換に基づくものである。
2つ目は分布的アプローチであり、はしご作用素、一般化固有状態は$H_BK$、一般化コヒーレント状態である。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:43:48 GMT)
Offline Channel-Independent QAOA Angles for RIS Power Aggregation: Unit-Circle Phase Dictionaries and Infinite-Size Spin-Glass Limits [0.0] 再構成可能な表面の電力を最適化するための$200M$-phase$$$$ Dictionaryを導入する。
N!le!16$ under order-2 modeling において,ほぼ最適なマルチスタートシングルフリップローカル検索基準に到達した性能を観察する。
このアプローチは、将来のフォールトトレラント(FTQ)量子コンピュータにおいて、ほぼ最適の大規模N$のパフォーマンスへのルートを示唆している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:07:10 GMT)
Note About Koopman-von Neumann Theory and Density Matrix [0.0] 我々は古典的N粒子分布関数を座標表現における密度行列作用素の対角形として同定することは自然であると主張する。
また、座標表現における密度行列の低減のための一般化されたBBGKY階層も決定する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:45:17 GMT)
Nonlinear refractive index of warm rubidium vapor [0.0] センチメートルスケールのガラス細胞やミリメートルスケールのMEMS細胞におけるルビジウム(Rb)の蒸気は、非常に有望なプラットフォームであることが証明されている。
温度Rb蒸気の(非)線形屈折率の理論計算結果について述べる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:07:43 GMT)
Non-adiabatic transitions in the density matrix formalism [0.0] 密度行列形式は、2状態量子系における非断熱遷移の有用な記述を提供する。
我々の結果は、量子物理学、ニュートリノ物理学、宇宙論の様々な問題において、非常に一般的な応用を持っている。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:42:48 GMT)
No-deleting principle for two unitary copies [0.0] パティとブラウンスタインは削除機を定義し、未知の量子状態の2つの同一コピーのうちの1つを削除できないことを示した。
未知の状態の2つのユニタリコピーのうちの1つを削除することは不可能であることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:54:18 GMT)
Neural Network-Based Parametric Model Reduction for Predicting Turbulent Flow for Different Vehicle Geometries [0.0] 本研究では,多車体まわりの高レイノルズ数流のロバスト性を評価するために,変分オートエンコーダを用いた。
具体的には,異なる空間スケールと時間スケールで渦発生の再現精度を評価する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:51:53 GMT)
Multipartite synchronization residuals in driven-dissipative spin networks [0.0] 本稿では,2量子および3量子系の相対位相局在を定量化する量子同期の尺度を提案する。
分散型アディバティック・アディバティック・システマティック・アディバティック・システマティック・アディバティック・アディバティック・アディバティック・システマティック・ネットワークにおけるこれらの残基について検討する。
その結果, 位相依存性の同期測定とエントロピック相関測定は, 開系力学の異なる側面を探索することを示した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:49:58 GMT)
Multi-Stream Temporal Fusion for Financial Fraud Detection [0.0] デジタルバンキングにおける金融詐欺検出には、複数の異種イベントストリームを推論する必要がある。
本稿では,各イベントストリームを独立したTransformerエンコーダでエンコードする統合アーキテクチャであるMulti-Stream Fraud Transformerを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:37:27 GMT)
Monitoring Beam Splitter Entanglement using Quantumness [0.0] 2つの独立した圧縮真空状態が平衡ビームスプリッタと混合して絡み合う実験報告
状態の量子度を用いて連続変数システムに適した代替フレームワークを$$.99で使用します。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:29:43 GMT)
Matching Tasks to Objectives: Fine-Tuning and Prompt-Tuning Strategies for Encoder-Decoder Pre-trained Language Models [0.0] 本研究では,エンコーダ・デコーダの事前学習言語モデルの性能に及ぼす事前学習対象の影響について検討する。
事前学習と微調整の段階において、複数の目的を組み込むことの利点を強調した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 17:21:03 GMT)
MapReason-OSM: Can Vision-Language Models Make Graph-Verifiable Mobility Decisions from Street Maps ? [0.0] MapReason-OSMは、自己レンダリングされたOpenStreetMapパネル上でグラフ検証可能なモビリティ決定のためのベンチマークである。
我々は、米国ダウンタウンの10の固定されたスタイルの地図を2列のズームスケールでレンダリングし、一貫したマーカー文法をオーバーレイし、各パネルに隠れたストリートグラフと正確なオラクルをペアリングする。
私たちは、グラフにスナップバックして、妥当性、合法性、最適性、制約満足度、およびクロスゾーン整合性のための構造化された決定をスコアします。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:17:28 GMT)
Lightweight Transformer Models for On-Device Fault Detection: A Benchmark Study on Resource-Constrained Deployment [0.0] オンデバイス障害検出により、クラウド依存のないリアルタイム診断が可能になるが、リソース制約のあるハードウェアに機械学習モデルをデプロイするには、正確性、レイテンシ、モデルサイズ間の慎重にトレードオフが必要である。
本稿では,従来のML手法と,バイナリ故障検出のための軽量トランスフォーマーアーキテクチャを比較したベンチマークを提案する。
その結果, センサデータから, 軽量トランスフォーマーは従来のMLと87.8%のF1で一致したが, モデルサイズは100倍, レイテンシは9000倍であった。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:54:33 GMT)
Learning Dynamical Systems from Multiple Sparse Datasets: A Hierarchical Bayesian Modeling Approach [0.0] 本稿では,動的システムにおける確率的メタラーニングのための階層型ベイズフレームワークを提案する。
数値ODEソルバを勾配に基づくMCMC内に埋め込んで、共有集団の効率的な後部推定とデータセット固有のパラメータ分布を実現する。
実験では、スパースデータを用いた設定において、非プール方式よりも予測性能が向上し、データ効率の高いシステム識別の可能性を強調した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:41:25 GMT)
Large-Language-Model Discovery of Quantum LDPC Codes through Structured Concept Evolution [0.0] 量子低密度パリティチェック(qLDPC)符号は、スパースパリティチェックを有限符号化率と成長距離に組み合わせることで、この目標への有望な経路を提供する。
構造的概念進化 (Structured Concept Evolution, SCE) は, 大規模言語モデルと構造的代数的突然変異文法を組み合わせて, 持ち上げ積のコードファミリーを発見する検索フレームワークである。
SCEを実行すると、アーベルの構成から、基礎となる標準設計を超えて非アーベル群上のファミリーまで、さまざまな競合コードファミリが見つかる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:56:24 GMT)
LLM-assisted Generation of Pseudo-C2 Servers for IoT Malware Dynamic Analysis [0.0] 本稿では,GhidraとLarge Language Model(LLM)を組み合わせてマルウェアバイナリから通信仕様を抽出するシステムを提案する。
Miraiを用いた実験により、提案システムはバイナリ制御構造を意味論的に解釈し、20のコアプロトコル要素をすべて抽出することを示した。
生成された擬似C2サーバは、元のC2と一致する攻撃行動を持つ10のDDoS攻撃ベクトルのうち7つを完全に再生する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 00:49:38 GMT)
Knowledge-Graph Grounding Helps LLMs Only for Out-of-Training Knowledge: A Controlled Study on Clinical Question Answering [0.0] 最近のNature Medicineの研究では、汎用フロンティアLSMは、医学ベンチマークで特別な検索強化臨床ツールより優れていると報告されている。
構造化知識グラフ(KG)は、この状況を変えていますか?
まず,本研究のヘッドラインであるHealthBenchスコア(88)は,完全HealthBenchではなくConsensus変種である。
ナイーブトリプル検索もエージェント自然言語-暗号ループ(82%のクエリ成功)も弱いモデルラグをまたいだMedQAを改善しない
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:56:47 GMT)
KANLib -- A Modular, Extensible and Fast Kolmogorov-Arnold Network Implementation [0.0] Kolmogorov-Arnold Networks (KAN) は、従来の多層パーセプトロンに代わる有望な代替品として登場した。
本稿では,Kanアーキテクチャの開発と評価を行うための,モジュール性,表現性,計算効率のよいフレームワークであるKanLibを紹介する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:00:02 GMT)
Introduction to matrix-product states and tensor networks [0.0] このノートは、量子多体物理学におけるテンソル・ネットワーク手法の紹介であり、行列生成状態(MPS)に重点を置いている。
主要なMPSアルゴリズムは、収縮、相関関数、行列積演算子、DMRG、時間進化法を含む。
最後に、混合状態、量子チャネル、リンドブラッド力学のテンソル・ネットワーク表現を示し、熱状態や開量子系への応用を示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:53:38 GMT)
Interaction-Enhanced Ergotropy in Phase-Driven Andreev Bound State Quantum Batteries [0.0] 2つの相互作用するAndreev束縛状態(ABS)ユニットからなる位相駆動型量子電池について検討する。
超伝導相ランプ下でのエルゴトロピーダイナミクスを解析することにより、避けられた交差励起と相互作用誘起ハイブリッド化との相互作用が充電過程を強く修飾することを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:44:48 GMT)
Ingredient-Level Food Image Segmentation for Nutrition Awareness [0.0] 本研究は,各画素の成分クラスを予測するFoodSeg103の成分レベルのセマンティックセマンティックセグメンテーションについて検討した。
SegFormer-B0はより小さなベースラインモデル、SegFormer-B1はより大きな最終モデルである。
2,135枚の画像で保持されたFoodSeg103では、B0は0.7709ピクセル、IoUは0.2521ピクセル、B1は0.7929ピクセル、IoUは0.3204ピクセルだった。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 02:07:15 GMT)
Improved State Readout in NV Centers using Regression Models and Rabi Driving [0.0] 我々は、実験データに基づいて訓練された回帰モデルを用いて、蛍光信号を理想的なシミュレートされた集団にマッピングする。
誘導Rabi発振時の測定により,蛍光信号の情報量を増加させる。
このデータ駆動型アプローチは、我々の設定における従来のキャリブレーションよりも高い忠実性を実現する、堅牢な代替手段を提供する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:27:43 GMT)
IPO Finance Agent: Evaluation of LLM Financial Analysts beyond Finance Agent v2, with Automated Rubric Generation -- the Case of the SpaceX (SPCX) IPO [0.0] ファイナンスエージェント v2(Vals AI)が財務モデル評価の基準ベンチマークとして登場した。
タスクドメインと検索アーキテクチャの2つの方向に沿ってファイナンスエージェントフレームワークを拡張したIPOファイナンスエージェントを紹介します。
最高のパフォーマンス評価モデルであるAlibaba Qwen 3.7 Maxは、クエリ毎の0.30 USDで79.4%の精度に達した。
その結果生まれたフロンティアの最もコスト効率のよいモデルであるXiaomi MiMo-2.5 Proは、クエリあたり0.05 USDでわずかに低い精度 (76.8%) に達する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:34:55 GMT)
How rare are Markovian quantum dynamics? [0.0] オープン量子力学では、記憶のないいわゆるマルコフ進化と、非マルコフ進化と呼ばれる記憶効果を取り入れた力学を区別する。
ほとんどすべての力学は非マルコフ的であり、小さな(有限である)分数のみマルコフ的である。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 12:42:46 GMT)
How Complexity Contributes to Learning Opacity in Machine Learning [0.0] 機械学習アルゴリズムは不透明であることが知られているが、その予測の理由は分かっていない。
予測関数につながる学習プロセスも不透明である。
予測不透明度は広く研究されているが、学習不透明度はほとんど調査されていない。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:17:35 GMT)
Hodge Spectral Surrogates for Topology-Constrained Optimization [0.0] ホモロジー制約と低域スペクトルフィルタのホッジスペクトル緩和に基づく最適化のための微分可能なフレームワークを提案する。
ソフトグラフとソフトクリッド錯体から、グラフクリッド錯体とヴィエトリスを統一するホッジ・ラプラシアン型スペクトル緩和(英語版)を構築する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:38:32 GMT)
History estimation in random recursive trees: Pointwise approach via iterated Jordan centralities [0.0] 本研究は,木の大きさと境界に一様である相対推定誤差と導出テールの分布を解析する。
ジョーダン中心性によって誘導されるランクについて、推定値が真の到着時刻を超える確率は、1/S$の順序で$S$崩壊する。
過大な推定テールが$(log S)/S2$の順序で減衰する洗練された中央度尺度を、より低いテールオーダー1/S2$のコストで導入する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:58:20 GMT)
Halo-Independent Quantum Sensor Probes of Low-Velocity Dark Matter [0.0] サブGeVダークマター(DM)を直接検出するためのハロ非依存のフレームワークを,サブeVエネルギー閾値を持つ量子センサを用いて提案する。
このような検出器は低DM速度へのアクセスを可能にし、標準ハローモデルからの離脱に敏感である可能性がある。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 20:04:05 GMT)
Ground-State Energy Solutions of the Lithium Atom: Zeroth-, First-, and Second-Order Perturbation Theory and the Variational Method [0.0] リチウム原子の基底状態エネルギーは時間非依存理論と変分法の両方を用いて体系的に研究される。
結果は、電子相関とマルチ電子原子のスクリーニングの性質に関する重要な洞察を与えるために、互いに対照的な基準線と対比される。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:26:37 GMT)
Grad Detect: Gradient-Based Hallucination Detection in LLMs [0.0] 大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な能力を示してきたが、幻覚を引き起こす傾向にある。
そこで本研究では,1つの前向きパスから階層的勾配パターンを解析して幻覚を予測するグラッド・ディテクターを提案する。
幻覚検出とモデル禁忌予測の両方にまたがるいくつかのQ&Aベンチマークにおいて、Grad Detectを評価し、信頼性に基づくベースラインとサンプリングベースのベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:46:36 GMT)
Gate-Controlled Spin Qubits in Confined Altermagnets [0.0] 静電閉じ込め量子ドットにおけるゲート定義スピン量子ビットを提案する。
位相制御された四極形ゲートドライブは、閉じ込め異方性を調整することで、$X_/2$と$X_$回転を実現する。
二重量子ドットスペクトルは、実効論理的2量子ビットハミルトニアンにおいて、非零非局所パウリブロックを持つ孤立量子ドット積状態にきれいに投影できることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:14:10 GMT)
From Forecasting Leaderboards to Deployment Decisions: A Fail-Closed Certification Protocol [0.0] 予測側勝者が特定のインターフェースとデプロイユーティリティに対してデプロイ操作可能であることをいつ証明できるかを検討する。
Traffic-Hourlyは認証アンカーを提供する: 勝者は摩擦ゼロで同意するが、肯定的な切り替え摩擦により、予測勝者は準最適に配置される。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:59:17 GMT)
Free-Space CV-QKD with Single-Mode Fiber Reception: Effective Coupling Statistics and Protocol-Dependent Reference Noise [0.0] 大気乱流下での単一モードファイバ受信による連続可変量子鍵分布について検討した。
まず、GG02の標準設定を検証し、どの受信側オブザーバブルが有効なキーレート予測に十分なのかを問う。
平均余分な記述は概して楽観的すぎるが、SMF結合効率のスカラー有効法則は正確なガウスチャネル記述を提供する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:07:32 GMT)
Fifty Years of Specification Completeness: What Aviation Certification Tells AI Governance About Epoch Limits, Proof Surfaces, and the Structural Gap [0.0] 1992年以降、航空ソフトウェア認証は管理ソフトウェアシステムの3つの構造的要件を運用している。
これらの要件は DO-178C と DO-330 に現れ、FAA と EASA の認証によって強制される。
個々のAIガバナンス文書の固有の性質として、これらの構造的特性を必要としない。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 19:51:13 GMT)
Faster algorithm for achieving minimal-size quantum decision diagrams [0.0] 本稿では,1つの子ノードを持つ$n$-qubit DDノードに対して,$O(n3)$から$O(n2)$への最悪のケース高速化を実現する。
C/C++でスクラッチから記述した量子回路のパウリLIMDDシミュレータであるQolDDerの一部として,本アルゴリズムを実装した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:45:48 GMT)
Extended pseudo-spectral physics-informed neural networks for phase-field models [0.0] 相場モデルは相分離の連続的な記述において中心的な役割を果たす。
ESPINNフレームワークは、過渡スナップショットデータから位相場モデルの逆同定のために開発された。
その結果、ESPINNは相分離連続モデルにおける自由エネルギー構造を学習するための、データ効率と物理的に一貫したアプローチとして確立された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:51:58 GMT)
Exceptional by Design: Long-Range Hopping as a Knob for Exceptional Point Control [0.0] 利得と損失のバランスが取れた非エルミタンライス・ミールモデルの例外点構造と位相特性について検討した。
この系は周期的境界条件と開境界条件の両方の下で2階の例外点しか持たない。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:31:18 GMT)
Enhancing quantum-classical configuration interaction methods using a neural-network classifier [0.0] 本稿では,バイナリ分類タスクとして重要度を再放送するデータ駆動選択フレームワークを提案する。
各イテレーションにおいて、候補行列のランダムなサブセットは、一時的な対角化によってラベル付けされる。
二原子分子の基底状態エネルギーを計算することにより、古典的および量子的CI法の両方にこのフレームワークの有用性を実証する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:10:03 GMT)
Elo-Disentangled Player-Style Embeddings for Human Chess via Rating-Conditioned Residual Move Model [0.0] 我々は,個別の人間のチェススタイルの表現学習について研究する。
プレイヤーごとの埋め込みはプレイヤーの動き履歴から学習される。
強い評価条件ベースとコンパクトなエロ異形埋め込みは、経済的な、解釈可能な個々のスタイルモデルである、と我々は主張する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:06:24 GMT)
Dynamical low-rank methods for the Wigner equation I: separable difference potential [0.0] 差分ポテンシャルの分離分解を用いたウィグナー方程式に対する効率的なDLRAアルゴリズムを提案する。
提案したDLRAアルゴリズムには大きな利点があり,実行時およびメモリ要求の双方において1~2桁の計算労力を削減できることが示されている。
DLRAは、ソリューションの所定の低ランク構造が存在しない場合でも、効率と精度のバランスをとる数値的なスキームとして機能する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:16:34 GMT)
Do vision-language models search like humans? Reasoning tokens as a reaction-time analog in classic visual-search paradigms [0.0] 視覚言語モデル(VLM)が同じ行動シグネチャを示すかどうかを問う。
特徴対共役探索,空間構成探索(T-vs-L)探索,列挙,傾き/垂直探索非対称性の4つの古典的パラダイムを適応する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:19:16 GMT)
Discovery of connectivity-trainability trade-off of IQP Circuits for Hamiltonian Optimization [0.0] 本報告では、ハミルトニアン最適化のためのIQP回路の性能とトレーニング性について体系的に検討する。
その結果,回路構造がIQP回路の低エネルギー状態に到達するための重要な役割を担っていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:50:37 GMT)
Detection of patterns in a discrete-outcome sensor network [0.0] 離散的な結果の量子センサーネットワークは、検出器の活性化にのみ関心を持つものである。
我々は1次元と2次元の両方の検出器アレイについて検討し、最小エラー状態判別の手法を利用する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 19:16:08 GMT)
Deep numerical schemes for systems of Ergodic BSDEs with applications to regime-switching forward utilities [0.0] 結合エルゴードの後方微分方程式の解法として,ニューラルネットワークに基づく2つの数値スキームを導入する。
まず、エルゴード型BSDEの解と、無作為な終端時間を持つ多次元PDEの解のリンクを確立する。
次に、関連するエルゴディックPDEシステムの残余を最小化するDeep Galerkin Method (DGM) を新たに提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:55:09 GMT)
Decoherence as Defence and the Magnitude of Noise Regularisation: A Rigorous N -Qubit Theory of Stochastic Quantum Neural Networks for Adversarially Robust Network Intrusion Detection [0.0] マスター方程式とそのベクトル化されたリウビリアンによる$N$-qubitの定式化を与える。
エンフェデコヒーレンス・コントラクションの定理、すなわち強度の非分極チャネルを証明します。
このロバスト性は、アタックタイムの収縮ではなく、ノイズの変形したトレーニング境界から生じることを示す。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:06:56 GMT)
Data Scale, Not Latency, Shapes Cross-Lingual Encoder Transfer in Streaming ASR [0.0] ストリーミング音声認識モデルを新しい言語に適応させるには、2つの妥当なウォームスタートを選択する必要がある。
一般的な直観は、多言語エンコーダは低データにおいて最も役立ちます。
どの程度のメリットが持続するか、ストリーミングレイテンシの厳しさが増幅されるか、デプロイメントの量子化を生き残るかは、はっきりしない。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:51:35 GMT)
ComputeFHE: A Privacy-Preserving General-Purpose Computation Library [0.0] ホモモルフィック暗号化(FHE)は、データの機密性を保ちながら、直接暗号化されたデータ上で計算を行うことを可能にする。
本稿では、TFHE暗号システムに基づくプライバシー保護アプリケーションの開発を容易にするオープンソースのC++ライブラリであるComputeFHEを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:11:17 GMT)
Compressed Quantum Operators and Roots of Hermite Polynomials [0.0] フォック空間上の位置と運動量演算子表現の有限ランク圧縮が古典的エルミートの根から与えられる固有値を持つことを示す。
対応する圧縮変位演算子とその近似量子誤差補正への応用について論じる。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:46:39 GMT)
CN-NewsTTS Bench: a target-level automatic benchmark for raw-input Chinese news TTS pronunciation [0.0] 中国語のニューステキストには、スコア、ハイフン付きモデル名、単位記号、パーセンテージ、英語の略語、混成中国語のデジタル名などの密集した書体が含まれている。
これらの形式はリアルタイムリスニングにおいて頻繁に使用され、テキスト音声(TTS)システムは、音声の意味を変更しながら文字を保存できる。
CN-TTS Bench v0.1は、中国のニュースTTS製品がそのようなターゲットを正しく発音するかどうかを評価するためのオープンターゲットレベルベンチマークである。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:34:58 GMT)
Bengal-HP_RU: A Dataset of Bengal People For Head Pose Estimation [0.0] 既存の頭ポーズデータセットは、主に西または東アジア起源の被写体を特徴とし、南アジアの人口、特にベンガル人の個体は、ほとんど表現されていない。
ベンガルHP_RUは,12,894個のラベル付きヘッドイメージを連続ヨー,ピッチ,ロール値でアノテートしたベンガル型ヘッドポーズデータセットである。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:13:59 GMT)
BCoughBench: Benchmarking Respiratory Acoustic Foundation Models Under Body-Coupled Wearable Sensor Conditions [0.0] 呼吸音響基礎モデル(FM)は、スマートフォンの録音にのみベンチマークされる。
ボディカップリング(BC)ウェアラブルのセンサーは、組織や骨を通して高周波の内容を減らし、FMの信頼性を損なう。
BCoughBenchを導入し、9つの分類タスク(AUROC、95%の特異性、期待エラー)と3つの年齢回帰タスク(MAE対平均予測基準)で5つのFMを評価する。
FMは臨床感度閾値(Se@Sp95 $geq$ 0.20)に満たない。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 19:43:03 GMT)
Average Rankings Mask Per-Subject Optimality: A Friedman-Nemenyi Benchmark of EEG Motor-Imagery BCI Decoders [0.0] 1,056のデコード構成と340,000の主観レベルモデルを評価した。
すべてのモデルは、単一の参加者の1つのセッションで適合し、テストされます。
最も簡単な体制でも、単一のパイプラインが支配的になることはない。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:26:27 GMT)
Auxiliary Schmidt Rank as a Resource for Photonic Bell Measurements [0.0] 一つの決定的なベルラベル関数が$r_geqslantlceil d/2rceil$に対して発生することを示すが、$d2$ Bell-stateラベルの決定論的識別には$r_geqslant d$が必要である。
最大絡み合ったランク-$d$補助状態は、各光子の系と補助的な自由度の間の局所的なベル基底ソートによる境界を達成する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 13:52:04 GMT)
Anticipating the Optimism Gap: Predicting Distribution-Shift Degradation of RF-Impairment Detectors from In-Distribution Statistics [0.0] 電波障害の検知器は、通常、調整された分布で測定された単一のAUCで報告される。
アウト・オブ・ディストリビューション・データを見る前に、この楽観主義が予測できるかどうかを問う。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 08:01:32 GMT)
Age of LLM: A Strategic 1v1 Benchmark for Reasoning, Diplomacy and Reliability of Large Language Models under Fog of War [0.0] Age of LLM(エイジ・オブ・LLM)は、敵基地を破壊するために13x7グリッド上に2基のLSMが対向するターンベースの1v1ベンチマークである。
54試合15の推論モデルと5,258のアクションをベンチマークする。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 10:25:31 GMT)
Adaptive Hebbian Memory Routing in Vision Transformers for Few-Shot Learning [0.0] わずかなショット画像認識では、小さなラベル付きサポートセットから新しいクラスに適応するモデルが必要である。
ヘビアンメモリはエピソード中に一時的な連想情報を提供することができるが、固定メモリの振る舞いは、数発のタスクごとに適切ではないかもしれない。
数ショット変換器の適応型ヘビアンルーティングを提案する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:16:37 GMT)
Adapt Only When It Pays: Budgeted Decision-Loss Priority for Delayed Online Time-Series Adaptation [0.0] 封印された遅延キュー、正確な予算会計、監査可能な更新テレメトリを備えた残差適応フレームワークであるADOWIPを紹介する。
そのメインスケジューラは、フィードバックが公表された後にのみ更新される、観察された決定余分な優先度ゲートである。
コンベックス線形受け入れ更新サブプロブレムに対して, ハード予算の実現性, 提案したOGD後悔, 安定性, 条件付き有限サンプルゲート選択文を検証した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 18:22:22 GMT)
Abstractions of Queries in Ontology-Based Data Access [0.0] 本稿では,データクエリをオントロジー層に変換することで,データクエリを抽象化するクエリ抽象化の最近の課題について考察する。
不等式と特殊述語マーキングデータベース定数を限定したUCQの拡張内での抽象化について検討する。
また、データ交換から発生する最大回復の概念と新たな接続をすることで、最大音の抽象化を特徴付ける。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 14:17:08 GMT)
ATMA: Length-Invariant Language Modeling via Polar Attention and Gated-Delta Compression Memory [0.0] ATMAは、新しい3チャンネルアテンション機構を統合するハイブリッドな畳み込みアテンションアーキテクチャである。
我々は,100回分級アブレーションスイープを用いてATMAを評価し,Pola + メモリモデルの組み合わせが誘導針-a-haystack検索精度を90%以上維持することを示した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 20:43:51 GMT)
A high-fidelity two-qubit gate for multimode superconducting P-mon qubits [0.0] 本研究は,リードアウト環境からの脱コヒーレンスに対する本質的な保護を提供する超伝導量子ビットの開発である。
量子ビットモード間の直接相互作用は強く抑制されるため、不要な$ZZ$-type相互作用はアイドル状態において3.6(5)textkHz$未満に大幅に減少する。
これらの結果は、大規模に高性能を維持するスケーラブルな超伝導アーキテクチャに向けた重要な一歩である。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 16:31:58 GMT)
A Universal All-Fiber Quantum Buffer for the Telecom Band [0.0] 量子インターネットは、オンデマンドバッファリングを通じて非同期フォトニック信号を時間的に整列する能力に依存している。
我々は,200以上の時間モードを同時にバッファリングし,それらに一括あるいは一対一で対処する能力を示す。
結果は、多次元量子状態の高速同期のためのロバストで室温のソリューションを提供する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:12:05 GMT)
A Synthetic Reliability-Aware PINN Benchmark for Offshore Wind Turbine Support-Structure Monitoring with Bayesian Inverse Identification [0.0] 本稿では,オフショア風力タービン(OWT)単パイル支持構造監視のための合成信頼性を考慮した物理情報ニューラルネットワーク(PINN)ベンチマークであるDigi turbineについて述べる。
このワークフローは、簡易ベルヌーイビーム方程式とウィンクラー土壌の基礎を訓練目的に組み込んだもので、ベイズ固有情報を用いた逆同定と結合し、第一次信頼性法(form)スクリーニングを追加する。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 05:55:45 GMT)
A Step Towards Inherently Interpretable Causal Machine Learning Models For Decision Support [0.0] 本稿では、因果機械学習と本質的に解釈可能な断面データモデルの統合を提案する。
本研究により,提案手法は,予測と値解析における競合性能を達成できることが示唆された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 09:38:47 GMT)
A Physics-Informed Fourier-Wavelet Transformer for Multiscale Computational Fluid Dynamics Surrogate Modeling [0.0] 本研究では,物理インフォームドフーリエ・ウェーブレット変換器を用いて実世界ベンチマークの速度場再構成を行う。
シリンダー-ウェイク流と流体-構造相互作用の2つの実ベンチマークケースで実験を行った。
その結果,実際の高精度なトレードオフを維持しつつ,実世界の流れの再現性の向上が示された。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 15:24:05 GMT)
A Leakage-Aware Comparative Benchmark of Machine Learning, Deep Learning, and Transformer Models for Reliable Leukemia Detection [0.0] 末梢血スミア画像からの急性リンパ性白血病(ALL)の自動分類は、C-NMC 2019データセットでほぼ完璧なパフォーマンスを報告されている。
画像レベルのランダムなパーティショニングによる患者レベルのデータ漏洩によって,そのような結果を膨らませることができることを示す。
我々は厳密な主観的解離プロトコルの下で漏洩認識ベンチマークを構築した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 04:53:49 GMT)
A Hybrid, Multi-Layered Pipeline for Phishing and Threat Classification: Independently Validated URL and NLP Engines with a Calibrated Multi-Channel Fusion Stage [0.0] それぞれのモータリティを自作のエンジンでスコアリングし、結果を融合するハイブリッドパイプラインを提案する。
3基のエンジンがビルドされ、デプロイされ、独立してベンチマークされる。
デプロイ可能な検出のために、制限要因はモデルをいかに一般化するかである。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 07:31:21 GMT)
A Hybrid CNN-LSTM Intrusion Detection Framework for Cybersecurity in Smart Renewable Energy Grids [0.0] ハイブリッドCNN-LSTM IDSは、CNNに基づく空間特徴抽出とLSTMに基づく時間シーケンスモデリングを利用する。
モデルはGPU上で27,800フロー/秒のリアルタイム推論スループットを実現し、FP32では0.082ms/sample CPUレイテンシを実現している。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 21:44:25 GMT)
A Conditional Timing Protection Level: Holdover-Limited Undetected Time Error Under GNSS Spoofing [0.0] スプーフィング中のタイミング受信機は、位置領域RAIMがバウンドする名目幾何学的欠点を持たない。
公開のJammerTest 2024キャンペーンで記録された空中スプーフは、u-bloxのZED-F9Pを約1.01ミリ秒短縮した。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 06:52:58 GMT)
A Comparison of Kubernetes Compliance Standards and Configuration Scanners [0.0] 本研究は, 一般的に使用されている8つの硬化ガイドラインを体系的に比較した。
79のコンフィグレーション・レコメンデーションのベンチマークを作成し,10種類のスタティック・コンフィグレーション・スキャニング・ツールの構造化実験を行った。
以上の結果から, ハードニングガイドラインやスキャナーにおける構成問題の範囲と, コンフィグレーション問題がどのように評価され, ランク付けされるかの相違が明らかとなった。
論文参考訳(メタデータ) (Tue, 23 Jun 2026 11:16:33 GMT)