A1: A Fully Transparent Open-Source, Adaptive and Efficient Truncated Vision-Language-Action Model [112.9] A1は、ロボット操作のための完全にオープンソースで透明なVLAフレームワークである。
エンドツーエンドのトレーニングを可能にするためのフルトレーニングスタック(コード、データ/データ処理パイプライン、中間チェックポイント、評価スクリプト)をリリースします。
A1は最先端の成功率を達成すると同時に、推論コストを大幅に削減する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 10:18:40 GMT)
Olmo Hybrid: From Theory to Practice and Back [112.7] ハイブリッドモデルは, 変圧器と線形RNNの表現性を継承するだけでなく, 両方以上のタスクを表現できることを示す。
また,Olmo HybridはOlmo 3よりも高い性能を示し,プレトレーニングおよび中間トレーニングの評価を行った。
この結果から,注目層と繰り返し層を混合したハイブリッドモデルが,言語モデリングパラダイムの強力な拡張となることが示唆された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 06:15:48 GMT)
Market-Bench: Benchmarking Large Language Models on Economic and Trade Competition [102.7] 本稿では,経済関連タスクにおける大規模言語モデル(LLM)の能力を評価するベンチマークであるtextbfMarket-Benchを紹介する。
我々は、LLMが商品の調達・販売を担当する小売業者として機能するマルチエージェントサプライチェーン経済モデルを構築した。
Market-Benchは入札、価格、スローガン、販売、バランスシートの完全な軌跡を記録し、経済、運用、セマンティックメトリクスによる自動評価を可能にしている。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:23:51 GMT)
Stochastic Gradient Descent in the Saddle-to-Saddle Regime of Deep Linear Networks [74.5] 深い線形ネットワークにおける勾配降下(SGD)ノイズの理解は不十分である。
本研究では,サドル・アンド・サドル体制におけるDLNの訓練におけるSGDの動態について検討した。
以上の結果から,SGDノイズは特徴学習の進行に関する情報を符号化するが,サドル・アンド・サドル・ダイナミクスを根本的に変えるものではないことが判明した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:43:08 GMT)
Visual prompting reimagined: The power of the Activation Prompts [72.9] 本稿では,入力レベルのVPの範囲を広げる,アクティベーションプロンプト(AP)の概念を導入する。
APは畳み込みニューラルネットワークと視覚変換器の正規化チューニングと密接に関連している。
畳み込みニューラルネットワークと視覚変換器の正規化チューニングとAPは密接に関連していることを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 20:28:24 GMT)
PET-DINO: Unifying Visual Cues into Grounding DINO with Prompt-Enriched Training [72.0] Open-Set Object Detection (OSOD)は、固定クラスを超えた新しいカテゴリの認識を可能にする。
テキストと視覚のプロンプトをサポートするユニバーサル検出器PET-DINOを提案する。
本稿では,IBP(Intra-Batch Parallel Prompting)をレベル,DMD(Dynamic Memory-Driven Prompting)をトレーニングレベルで導入する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:29:58 GMT)
Action Images: End-to-End Policy Learning via Multiview Video Generation [71.7] 我々は、ポリシー学習をマルチビュービデオ生成として定式化する統合世界アクションモデルであるAction Imagesを提案する。
本モデルでは,従来のビデオ空間モデルに比べて,最強のゼロショット成功率を実現し,ビデオアクションジョイント生成品質を向上させる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:59:30 GMT)
Uncertainty Estimation for Deep Reconstruction in Actuatic Disaster Scenarios with Autonomous Vehicles [68.8] 原理的不確実性定量化は 能動センシング戦略に不可欠です
Evidential Deep Learningは、すべてのセンサ構成で最高の再構築精度と不確実性校正を実現する。
これらの知見は、リアルタイムの自動運転車配備における不確実性認識フィールド再構築の方法として、エビデンシャル・ディープ・ラーニングを支持している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:17:44 GMT)
Gym-Anything: Turn any Software into an Agent Environment [67.2] Gym-Anythingは、あらゆるソフトウェアをインタラクティブなコンピュータ利用環境に変換するためのフレームワークである。
CUA-Worldは、医学、天文学、工学、エンタープライズシステムなど、領域にまたがる10万以上の長期的タスクのコレクションである。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:38:15 GMT)
GaussianGrow: Geometry-aware Gaussian Growing from 3D Point Clouds with Text Guidance [60.9] 3D Gaussian Splattingは、レンダリング効率と品質において優れた性能を示している。
既存の手法では、ガウス原始体を推定するための幾何学的参照として点写像を予測することを検討した。
GaussianGrowは、簡単にアクセス可能な3Dポイントクラウドからガウシアンを成長させることで、3Dガウシアンを生成する新しいアプローチである。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 11:23:23 GMT)
Think in Strokes, Not Pixels: Process-Driven Image Generation via Interleaved Reasoning [59.3] プロセス駆動画像生成は多段階のパラダイムで、合成をインターリーブな推論軌道に分解する。
プロセス駆動生成の核となる課題は、中間状態のあいまいさに起因する。
2つの相補的な制約を維持する、密集したステップワイドな監視を通じてこの問題に対処する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 02:28:46 GMT)
SimpleProc: Fully Procedural Synthetic Data from Simple Rules for Multi-View Stereo [59.1] 非常に小さなルールセットによって駆動される、完全に手続き的な新しいジェネレータであるSimpleProcを使って、効果的なトレーニングデータを生成することができることを示す。
そこで本研究では,ゲームや実世界のオブジェクトから手作業でキュレートした画像と比較して,8000枚程度の画像で優れた結果が得られることを示す。
352,000の画像にスケールすると、いくつかのベンチマークで、692,000以上の手作業で訓練された画像に匹敵するパフォーマンスが得られる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:40:28 GMT)
Towards Athlete Fatigue Assessment from Association Football Videos [53.2] 本稿では,ピッチ座標における選手軌跡を抽出する最先端のゲーム状態再構成手法を構築した。
次に,これらの信号から加速度-速度プロファイルを構築し,その挙動を疲労関連性能指標として解析する。
以上の結果から,単眼映像は,A-S時間と相性のあるキネマティックなパターンを回復すると同時に,トラジェクティブノイズ,校正誤差,放送映像固有の時間的不連続性に敏感であることが明らかとなった。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:36:28 GMT)
TFRBench: A Reasoning Benchmark for Evaluating Forecasting Systems [52.9] 我々は,予測システムの推論能力を評価するための最初のベンチマークであるTFRBenchを紹介する。
本稿では,反復的検証ループを用いて,数値的に基底となる推論トレースを合成するマルチエージェント・フレームワークを提案する。
評価は,この推論が因果的に有効であること,評価に有用であること,生成したトレースでLSMを誘導することにより,予測精度が大幅に向上することを確認した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:04:45 GMT)
"I See What You Did There": Can Large Vision-Language Models Understand Multimodal Puns? [52.2] パンは、ユーモアを生み出すためにポリセミーと音声の類似性を利用する、修辞的な言葉プレイの一般的な形式である。
視覚言語モデルは多モーダルな理解と生成に広く用いられているが、その理解能力は体系的に研究されていない。
我々は,多種多様な句からなるデータセットであるMultiPunを紹介した。
われわれの評価によると、ほとんどのモデルでは、本物の句をこれらの散らばり物と区別するのに苦労している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:31:32 GMT)
Addressing a device in a quantum network: A quantum approach including routing [51.7] 量子ネットワークデバイスは、実行すべきタスクをエンコードする要求状態と共にアドレス状態を使用する。
本稿では,コンタングルメントを用いた分散量子ルーティングプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 01:47:28 GMT)
Quantum optomechanics of lossy bodies: general approach and structured squeezed vacuum effects [51.6] 外部量子照明下での自由空間における巨視的損失物体が経験する全体的な光学的力について検討する。
散乱場を異方性で多重モードの圧縮真空状態で駆動することにより、電磁量子ゆらぎの空間的プロファイルを設計して、回転対称性の破れを示すことができる。
我々は、熱平衡の制約を超えて動作するマクロ量子光学の一般的な定式化を確立する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:25:43 GMT)
MTA-Agent: An Open Recipe for Multimodal Deep Search Agents [51.2] MLLM(Multi-hop large language model)は、視覚的理解において強力な能力を示しているが、複雑な多段階推論において制限されている。
証拠ベースQA合成のためのマルチホップツール拡張エージェント(MTA-Agent)を提案する。
MTA-Agentは、視覚的およびテキストソースから証拠を検索し、検証するためのツールとそのパラメータを自動的に選択する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:01:45 GMT)
Learning to Synergize Semantic and Geometric Priors for Limited-Data Wheat Disease Segmentation [51.1] 本研究では,小麦病のセグメンテーションを病種特異的な意味認識と疾患境界の局所化の複合的課題として扱う枠組みを提案する。
我々の中核的な洞察は、事前訓練されたDINOv2は、出現シフトを処理するために、堅牢なカテゴリ認識セマンティックスを提供します。
SGPer は,コムギ病と臓器分画のベンチマークにおいて,常に最先端のパフォーマンスを達成している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 04:19:39 GMT)
AutoSOTA: An End-to-End Automated Research System for State-of-the-Art AI Model Discovery [49.8] AutoSOTAは、トップレベルのAI論文で発表された最新のState-Of-The-Art(SOTA)モデルを進化させるエンドツーエンドの自動研究システムである。
報告された方法を超える新しい105種類のSOTAモデルを発見し、平均して1紙あたり平均5時間である。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:52:01 GMT)
OmniCamera: A Unified Framework for Multi-task Video Generation with Arbitrary Camera Control [49.4] ビデオは基本的に、シーンのダイナミックな内容と、観察されるカメラの動きの2つの重要な軸に絡み合っている。
既存の世代モデルは、しばしばこれらの要因を絡み合わせ、独立した制御を制限する。
OmniCameraは、これらの2つの次元を明示的に切り離し、コマンドするように設計された統一されたフレームワークである。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:06:02 GMT)
When to Call an Apple Red: Humans Follow Introspective Rules, VLMs Don't [48.4] 決定ルールを抽出し,これらのルールに対する従順性を評価するために,グレードドカラー属性データセットを導入する。
モデルが自身の内省的ルールを体系的に違反していることが分かりました。
以上の結果から,VLMの推論失敗は困難であり,VLMの内観的自己認識が誤校正されることが示唆された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:59:45 GMT)
Optimal Centered Active Excitation in Linear System Identification [48.1] 最適中心雑音励振を用いた線形システム同定のための能動学習アルゴリズムを提案する。
まず、任意の能動学習アルゴリズムに対して、所定の精度と信頼レベルを達成するために、サンプルの複雑さの低い境界を確立する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:16:16 GMT)
HumANDiff: Articulated Noise Diffusion for Motion-Consistent Human Video Generation [47.6] HumANDiffは、音声ノイズサンプリングによるビデオ拡散モデルを微調整することで、人間のビデオ生成を可能にする。
動作に一貫性があり、多様な服装スタイルを持つ高忠実な人間を実現している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:55:10 GMT)
Confidence Should Be Calibrated More Than One Turn Deep [47.0] 大規模言語モデル(LLM)は、金融、医療、教育といった高度な分野にますます適用されている。
既存の信頼性推定とキャリブレーションの研究は、主にシングルターン設定に焦点を当てている。
静的な特性から動的課題へのリフレームキャリブレーションのためのマルチターンキャリブレーションの課題を紹介する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:48:33 GMT)
When Do We Need LLMs? A Diagnostic for Language-Driven Bandits [44.6] 金融における非エピソジックなシーケンシャル意思決定問題に対する文脈的マルチアーメッド・バンド(CMAB)について検討する。
この結果は,コスト効率,不確実性を考慮した意思決定システムのための,原則的デプロイメントフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:20:06 GMT)
Bias Ahead: Sensitive Prompts as Early Warnings for Fairness in Large Language Models [44.4] 公平性評価のための新しい抽象化としてセンシティブなプロンプトを提案する。
12,801のプロンプトからなるデータセットであるSensYを構築し、リリースする。
4500件の回答を解析し,その妥当性を評価した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 08:16:02 GMT)
MARL-GPT: Foundation Model for Multi-Agent Reinforcement Learning [44.0] 本稿では,単一のGPTモデルを用いて,多様なMARL環境下での学習と性能向上を実現するコヒーレントな手法を提案する。
我々の手法であるMARL-GPTは、専門家軌道上の大規模訓練にオフライン強化学習を適用している。
実験により,MARL-GPTは全試験環境において,特殊ベースラインと比較して競争性能が向上することが示された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:40:01 GMT)
GS-Surrogate: Deformable Gaussian Splatting for Parameter Space Exploration of Ensemble Simulations [43.9] パラメータ空間探索のための変形可能なガウス平滑型可視化サロゲートであるGS-Surrogateを紹介する。
この明示的な定式化は、シミュレーションに関連したバリエーションを可視化固有の変化から分離することにより、異なる可視化タスクへの効率的かつ制御可能な適応を可能にする。
我々は,GS-Surrogateがシミュレーションパラメータ空間と可視化パラメータ空間の両方をリアルタイムかつフレキシブルに探索できることを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:37:15 GMT)
RealUserSim: Bridging the Reality Gap in Agent Benchmarking via Grounded User Simulation [43.8] RealUserSimは、実際の行動データに基づく最初のユーザーシミュレーションフレームワークである。
14,000以上の人間とLLMの会話(WildChat)から、7,275の行動プロファイルを抽出する。
71以上のドメインをまたいだ600の会話に対する信頼度ベンチマーク(PT3)は、基底シミュレーションが一致率を24.2%から45.3%に引き上げていることを示している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:42:36 GMT)
The Master Key Hypothesis: Unlocking Cross-Model Capability Transfer via Linear Subspace Alignment [43.5] 本研究は, モデル間で再訓練をすることなく, ポストトレーニング能力の伝達が可能であるかどうかを考察する。
CoT(Chain-of-Thought)や数学的推論を含む推論行動の実験は、トレーニングなしでのモデルスケールにおける大幅な改善を示している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:02:10 GMT)
Weather-Conditioned Branch Routing for Robust LiDAR-Radar 3D Object Detection [43.4] 気象条件の分岐経路問題としてマルチモーダル認識を再構成する。
我々のフレームワークは、純粋なLiDARブランチ、純粋な4Dレーダブランチ、条件付き融合ブランチの3つの並列3D特徴ストリームを明示的に維持している。
K-Radarベンチマーク実験により,本手法が最先端性能を実現することを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:56:27 GMT)
Efficient and Principled Scientific Discovery through Bayesian Optimization: A Tutorial [43.1] このチュートリアルでは、科学的な発見を形式化し、自動化する原理的な確率駆動フレームワークであるベイズ最適化(BO)を紹介している。
まず、科学的な発見を直感的な問題として、次にBOのコアコンポーネント、エンドツーエンド、実世界の有効性を解き放つことにしました。
また、バッチ実験、ヘテロシダスティック性、文脈最適化、ループ内統合など、科学的応用のための重要な技術的拡張についても取り上げる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 15:06:34 GMT)
GrandGuard: Taxonomy, Benchmark, and Safeguards for Elderly-Chatbot Interaction Safety [41.8] 高齢者は社会的孤立、デジタルリテラシーの制限、認知の低下による脆弱性に直面することがある。
既存の安全基準は主に一般の害を標的にしており、高齢者特有のリスクを見落としている。
高齢者特有のコンテキストリスクを評価し緩和するための,初の包括的フレームワークであるGrandGuardを紹介する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:26:40 GMT)
Learning to Interrupt in Language-based Multi-agent Communication [41.6] 本稿では、現在話者を割り込むために耳を傾けているエージェントに対して、割り込み可能な通信フレームワークを提案する。
我々は,2エージェントテキストピクチャリーゲーム,3エージェントミーティングスケジューリング,3エージェント討論など,多エージェントシナリオにおけるフレームワークの評価を行った。
実験の結果,HANDRAISERは,タスク性能に優れたベースラインに比べて,通信コストを32.2%削減できることがわかった。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 20:47:40 GMT)
LLM Reasoning as Trajectories: Step-Specific Representation Geometry and Correctness Signals [41.2] この研究は、大規模言語モデルのチェーン・オブ・シント生成を表現空間による構造化軌道として特徴づける。
数理的推論トラバースが機能的に順序付けられたステップ固有の部分空間であり、層深さと分離しやすくなっていることを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:55:50 GMT)
DetailVerifyBench: A Benchmark for Dense Hallucination Localization in Long Image Captions [40.1] DetailVerifyBenchは、5つの異なるドメインにわたる1,000の高品質なイメージからなる厳格なベンチマークである。
平均キャプションの長さは200語を超え、複数の幻覚型のトークンレベルのアノテーションが密集しているため、長い画像キャプションの領域における正確な幻覚の局所化の最も難しいベンチマークとなっている。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:27:01 GMT)
"OK Aura, Be Fair With Me": Demographics-Agnostic Training for Bias Mitigation in Wake-up Word Detection [40.1] 本研究は, 性別, 年齢, アクセントの異なる話者間でのパフォーマンス格差を軽減するために, 人口動態に依存しない訓練手法の有効性について検討した。
評価手法の1つは、性別が39.94%、年齢が83.65%、アクセントが40.48%の予測格差を減少させる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:02:04 GMT)
Effective Dynamics and Transition Pathways from Koopman-Inspired Neural Learning of Collective Variables [39.9] ISOKANNは複雑な分子系から集合変数と効果的なダイナミクスを抽出するフレームワークである。
CVを用いた高次元システムにおける準安定遷移の表現方法のコヒーレントな図を作成する。
クープマンに基づく学習と還元次元実効力学の組み合わせは、遷移率と経路を計算するための原則的な枠組みをもたらす。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:16:14 GMT)
Constraint-Driven Warm-Freeze for Efficient Transfer Learning in Photovoltaic Systems [39.8] ディープラーニングモデルはバイアス、ドリフト、過渡スパイクに対して堅牢だが、リソース制約のあるエッジコントローラには十分軽量である。
本稿では,CDWF(Constraint-Driven Warm-Freeze)を提案する。
トレーニング可能なパラメータを最大120倍に減らしながら,CDWFは完全微調整性能の90~99%を維持していることを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:44:19 GMT)
FinReporting: An Agentic Workflow for Localized Reporting of Cross-Jurisdiction Financial Disclosures [39.8] 本稿では、FinReportingについて紹介する。FinReportingは、ローカライズド・クロス・アグリゲーション・ファイナンシャル・レポートのためのエージェントワークフローである。
このシステムは、所得計算、バランスシート、キャッシュフローに統一された標準オントロジーを構築する。
これは、レポートをファイリング取得、抽出、標準マッピング、異常ロギングを含む監査可能なステージに分解する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 15:00:01 GMT)
Human Values Matter: Investigating How Misalignment Shapes Collective Behaviors in LLM Agent Communities [38.9] 社会科学理論に基づく制御型マルチエージェント環境CIVAを紹介する。
我々は、コミュニティの集団的ダイナミクスを著しく形作るいくつかの構造的に重要な価値を識別する。
マイクロレベルでの騙しやパワーセーキングといった創発的な行動を観察します。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 02:23:48 GMT)
EpiBench: Benchmarking Multi-turn Research Workflows for Multimodal Agents [38.8] 簡単な研究をインスタンス化するエピソードなマルチターンベンチマークであるEpiBenchを紹介する。
調査タスクが与えられた場合、エージェントは複数のターンで論文をナビゲートし、数字や表から証拠を整理し、メモリに蓄積された証拠を使って客観的な疑問に答えなければならない。
実験の結果,主モデルの精度は29.23%程度であり,改善の余地があることが示唆された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:58:55 GMT)
A machine learning framework for uncovering stochastic nonlinear dynamics from noisy data [35.6] ノイズはシステムパラメータの推測に影響を与え、データからダイナミクスを無視する。
我々は,システムパラメータの不確実性を同時に推論しながら,支配方程式の記号形式を復元するハイブリッドな記号的回帰確率型機械学習フレームワークを開発した。
このフレームワークはデータ効率が良く、100~1000個のデータポイントしか必要とせず、ノイズに強い。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:59:40 GMT)
Mixture-of-Modality-Experts with Holistic Token Learning for Fine-Grained Multimodal Visual Analytics in Driver Action Recognition [35.3] 本稿では,HTL戦略を用いたMixture-of-Modality-Experts(MoME)フレームワークを提案する。
MoMEは、モダリティ固有の専門家間の適応的なコラボレーションを可能にし、専門家間の知識伝達を改善する。
我々は,ドライバの動作認識に関するフレームワークを,代表的マルチモーダル理解タスクとして検証する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:42:22 GMT)
Incentive-Aware Multi-Fidelity Optimization for Generative Advertising in Large Language Models [34.9] 本稿では,Vickrey-Clarke-GroveswarmインセンティブとMulti-Fidelity Optimizationを結合した統合フレームワークを提案する。
実験により、IAMFMは様々な予算で単一忠実度ベースラインを上回っていることが示された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 02:10:16 GMT)
ClawLess: A Security Model of AI Agents [34.7] 我々は、AIエージェントに対して正式に認証されたポリシーを実行するセキュリティフレームワークであるClawLessを紹介する。
ClawLessは、システムエンティティ、信頼範囲、パーミッションに関するきめ細かいセキュリティモデルを形式化する。
このアプローチは、エージェントの内部設計に関係なくセキュリティを確保するために、正式なセキュリティモデルを実践的にブリッジする。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:19:55 GMT)
A Novel Automatic Framework for Speaker Drift Detection in Synthesized Speech [34.3] 近年の拡散型テキスト音声合成(TTS)モデルは、自然性や表現性が高いが、話者のドリフトに悩まされることが多い。
発話レベルの話者整合性よりも二項分類タスクとして定式化することで、話者のドリフトを検出するための最初の自動フレームワークを提案する。
本手法は,合成音声の重なり合う部分のコサイン類似性を計算し,構造表現を持つ大規模言語モデルにドリフトを評価する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:05:28 GMT)
Adam's Law: Textual Frequency Law on Large Language Models [33.3] 本稿では,テキストデータ頻度の観点から新たな研究方向を提案する。
私たちのフレームワークは3つのユニットで構成されています。
本データセットでは, 数学推論, 機械翻訳, 常識推論, エージェントツール呼び出しに関する実験を行った。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:28:18 GMT)
In-Place Test-Time Training [32.5] In-Place Test-Time Training (In-Place TTT)は、テスト時間トレーニングを備えた大規模言語モデルをシームレスに提供するフレームワークである。
In-Place TTTは、ユビキタスブロックの最終射影行列を適応可能な高速ウェイトとして扱う。
我々は,TTTの汎用的な再構築目標を,次世代のToken-Predictionタスクに合わせた,理論的に整った目標に置き換える。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:59:44 GMT)
ValueGround: Evaluating Culture-Conditioned Visual Value Grounding in MLLMs [31.5] 本研究では,大規模言語モデルにおける文化条件付きビジュアルバリューグラウンドの評価のためのベンチマークであるValueGroundを紹介する。
ValueGroundは最小限のコントラストイメージペアを使用して、無関係な変動をコントロールしながら、反対の応答オプションを表現します。
6つのMLLMと13の国で、テキストのみの設定では平均精度が72.8%から65.8%に低下している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 21:35:49 GMT)
SonoSelect: Efficient Ultrasound Perception via Active Probe Exploration [31.5] 本研究では,現在の観測結果に基づいてプローブ運動を適応的に誘導する超音波特異的なソノセレクトを提案する。
超音波シミュレータによる実験により,SanoSelectはN点中2点のみを用いて,有望な多視点臓器分類精度を達成できた。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:32:14 GMT)
Cross-Modal Coreference Alignment: Enabling Reliable Information Transfer in Omni-LLMs [31.5] クロスモーダル・コア推論は、モデルがソース・モダリティで参照者をローカライズし、ターゲット・モダリティで再識別しなければならない問題である。
13個のOmni-LLMを用いた実験では,コア参照認識パターンが欠如していることから,クロスモーダルコアの体系的弱点が明らかとなった。
これを解決するために、トレーニングフリーなIn-Context Learningメソッドと、トレーニングベースのSFT+GRPOフレームワークの2つの戦略を用いて、クロスモーダルアライメントを強化する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:19:42 GMT)
JailWAM: Jailbreaking World Action Models in Robot Control [31.4] 世界行動モデル(WAM)は、将来の世界状態と行動を共同で予測し、従来のモデルと比較してより強力な物理的操作能力を示す。
既存の研究は、重要なセキュリティギャップ、すなわちJailbreak攻撃に対するWAMの脆弱性に非常に注意を払っている。
我々は、WAMのための最初の専用ジェイルブレイク攻撃および評価フレームワークであるJailWAMを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 06:41:41 GMT)
GESS: Multi-cue Guided Local Feature Learning via Geometric and Semantic Synergy [31.3] 局所的な特徴の検出と記述はコンピュータビジョンの基本課題である。
既存の手法は1つの外観の手がかりをモデリングに頼っており、不安定なキーポイントとディスクリプタ識別性に欠ける。
本稿では,意味的および幾何学的手がかりを活用して,検出の堅牢性と記述者の識別性を高めるマルチキューガイド型局所特徴学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 02:57:26 GMT)
Reading Between the Pixels: An Inscriptive Jailbreak Attack on Text-to-Image Models [31.2] 現代のテキスト・トゥ・イメージ(T2I)モデルでは、正当性のある段落長のテキストを描画できるようになった。
我々は、敵がT2Iシステムを強制して有害なテキストペイロードを含む画像を生成する、記述的ジェイルブレイクを識別し、形式化する。
敵のプロンプトを3つの機能層に分解するブラックボックス攻撃フレームワークであるEtchを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:16:07 GMT)
Reason Analogically via Cross-domain Prior Knowledge: An Empirical Study of Cross-domain Knowledge Transfer for In-Context Learning [31.1] 既存のコンテキスト内学習(ICL)はドメイン内の専門家によるデモンストレーションに依存しており、専門家のアノテーションが不足している場合に適用性を制限する。
提案手法では、異なるドメインが基本となる推論構造を共有し、ソースドメインのデモンストレーションがターゲットドメインの推論を改善することができる。
本研究は,クロスドメインICLにおける条件正の移動を示すものである。
さらに分析したところ、これらの利得は意味的な手がかりではなく、検索されたクロスドメインの例による推論構造修復に由来することが示唆された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:48:08 GMT)
MO-RiskVAE: A Multi-Omics Variational Autoencoder for Survival Risk Modeling in Multiple MyelomaMO-RiskVAE [31.0] マルチモーダル変量オートエンコーダ (VAE) は多発性骨髄腫における生存リスクモデリングのための強力なフレームワークとして出現している。
数多くの派生案が提案されているが、この設定でどの側面がパフォーマンスを根本的に管理しているかははっきりしない。
生存駆動トレーニングは主に潜伏正規化の規模と構造に敏感であることを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:58:04 GMT)
MemFactory: Unified Inference & Training Framework for Agent Memory [30.8] MemFactoryは、メモリ拡張エージェント用に特別に設計された、最初の統合された、高度にモジュール化されたトレーニングおよび推論フレームワークである。
LLaMA-Factoryのような統合された微調整フレームワークの成功に触発されたMemFactoryは、メモリライフサイクルをアトミックなプラグアンドプレイコンポーネントに抽象化する。
我々はMemFactoryをオープンソースMemAgentアーキテクチャ上で公開トレーニングと評価データを用いて実証的に検証する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:28:08 GMT)
Experience Transfer for Multimodal LLM Agents in Minecraft Game [30.8] マルチモーダルLLMエージェントは、新しいタスクを効率的に解決するために、過去の経験を継続的に再利用する必要がある。
エージェントが事前のインタラクションから行動可能な知識を導出することを可能にする、転送指向メモリフレームワークであるEchoを提案する。
Minecraftの実験では、オフスクラッチ学習環境では、Echoはオブジェクトアンロックタスクにおいて1.3倍から1.7倍のスピードアップを達成する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:32:20 GMT)
Does Pass Rate Tell the Whole Story? Evaluating Design Constraint Compliance in LLM-based Issue Resolution [30.7] 本稿では,設計制約を明示的かつ測定可能なベンチマークとして,テキストデザイン対応の課題解決とベンチマークを提案する。
実際のプルリクエストから設計制約をマイニングし、検証し、それらをイシューインスタンスにリンクし、パッチのコンプライアンスを自動的にチェックすることで、Standardは構築される。
最先端エージェントによる実験では、テストベースの正確性はパッチの品質を大幅に過大評価している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:47:27 GMT)
A canonical generalization of OBDD [30.7] OBDDを一般化するブール関数のモデルとして、ツリー決定図(TDD)を紹介します。
TDDは、モデルカウント、列挙、条件付け、適用など、OBDDと同じトラクタビリティ特性を持ち、より簡潔です。
木幅$k$のCNF式は、OBDDでは不可能であることが知られているFPTサイズのTDDで表せることを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:36:21 GMT)
Polynomial-Time Algorithm for Thiele Voting Rules with Voter Interval Preferences [29.6] 我々は,任意のティーレ投票規則の下で,任意の大きさの委員会を最適に計算するためのリアルタイムアルゴリズムを提案する。
我々の結果は、各投票者が個別の重み(スコアリング)配列を持つ、一般化されたティールルールにまで及んでいる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:46:37 GMT)
VideoStir: Understanding Long Videos via Spatio-Temporally Structured and Intent-Aware RAG [29.4] VideoStirは、意図を認識した長ビデオRAGのためのフレームワークである。
ビデオは、クリップレベルでテンポラルグラフとして構成され、エビデンスを集約するマルチホップ検索を実行する。
MLLMが支援するインテント関連スコアラは、クエリの推論インテントとのアライメントに基づいてフレームを検索する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 04:26:59 GMT)
Multi-Agent Pathfinding with Non-Unit Integer Edge Costs via Enhanced Conflict-Based Search and Graph Discretization [29.4] MAPF(Multi-Agent Pathfinding)は、様々な領域において重要な役割を担っている。
有限状態空間を保存する非単体整数コストを持つグラフ上の新しいMAPF変種を提案する。
また,非単位エッジコストの離散化手法を提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 04:24:50 GMT)
Pay Attention to Sequence Split: Uncovering the Impacts of Sub-Sequence Splitting on Sequential Recommendation Models [29.2] Sub-Sequence splitting (SSS) は、シーケンシャルレコメンデーション(SR)におけるデータの分散を緩和するための効果的なアプローチとして実証されている。
本研究では,textbf(i) が実際の性能評価に干渉する可能性があることを明らかにする。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 01:28:14 GMT)
Vision-Based End-to-End Learning for UAV Traversal of Irregular Gaps via Differentiable Simulation [28.9] 我々は、奥行き画像を直接制御コマンドにマッピングし、無人機が見えない環境で複雑な隙間を横切ることを可能にする、視覚ベースのエンドツーエンドフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 15:16:17 GMT)
WikiSeeker: Rethinking the Role of Vision-Language Models in Knowledge-Based Visual Question Answering [28.2] 本稿では,視覚的質問応答のための新しいマルチモーダルRAGフレームワークであるWikiSeekerを紹介する。
本稿では,マルチモーダルレトリバーを提案し,視覚言語モデル(VLM)の役割を再定義する。
EVQA,InfoSeek,M2KRに関する実験により,WikiSeekerが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:52:38 GMT)
BOSCH: Black-Box Binary Optimization for Short-Context Attention-Head Selection in LLMs [28.2] 大規模言語モデル(LLM)の学習後のハイブリッド化は、KVキャッシュの使用を減らし、レイテンシを向上させるために、二次的な自己注意をスライドウインドウアテンション(SWA)に置き換えることが多い。
既存のハイブリダイゼーションスキームは通常、レイヤレベル(例えばインターリービング)またはヘッドレベルでローカルからグローバルまでの静的ランキングによって定義される。
BOSCH, Black-box Binary Optimization for Short-context Head Selection, a training-free method that formulas the problem as a Large Neighborhood Search and Decomposes it into three subproblems。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:38:05 GMT)
Graph of Skills: Dependency-Aware Structural Retrieval for Massive Agent Skills [28.1] Graph of Skills (GoS)は、大規模スキルライブラリのための推論時構造検索層である。
GoSはバニラのフルスキルローディングベースラインに対して平均報酬を43.6%改善した。
GoSは、バニラスキルローディングと単純なベクトル検索の両方を一貫して上回る。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 02:09:11 GMT)
Improving Controllable Generation: Faster Training and Better Performance via $x_0$-Supervision [27.5] 制御可能な生成方法は、シーンをより簡単に記述できる追加条件で初期T2Iモデルを増強する。
拡散損失を再重み付けした$x_0$-supervisionと呼ばれるクリーンターゲット画像の直接監督は、より高速な収束をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:04:43 GMT)
Saliency-Guided Representation with Consistency Policy Learning for Visual Unsupervised Reinforcement Learning [27.4] Saliency-Guided Representation with Consistency Policy Learning (SRCP)は、ビジュアルURLにおけるSRメソッドのゼロショット一般化を改善する新しいフレームワークである。
SRCPは、ビジュアルURLにおける最先端のゼロショットの一般化を実現し、様々なSRメソッドと互換性がある。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:31:32 GMT)
Pretrain-then-Adapt: Uncertainty-Aware Test-Time Adaptation for Text-based Person Search [26.5] テキストベースの人物検索は、厳格なプライバシー制約と手動アノテーションの高コストによって引き起こされるデータ不足により、固有の制限に直面している。
既存の手法は通常、合成人体カプセルデータに基づいてモデルを事前訓練するPretrain-then-Finetuneパラダイムに依存している。
オフラインテスト時間適応方式により、広範囲なターゲットドメインの監視に依存しない新しいPretrain-then-Adaptパラダイムを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:48:15 GMT)
Improving Semantic Proximity in Information Retrieval through Cross-Lingual Alignment [26.4] 言語横断情報検索 (CLIR) が重要な研究分野として浮上している。
ほとんどの多言語検索者は、クエリと同じ言語で書かれた関連文書よりも、無関係の英語文書を優先する傾向にある。
本稿では,言語間アライメント向上を目的とした新たなトレーニング戦略を提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 10:35:52 GMT)
Label Effects: Shared Heuristic Reliance in Trust Assessment by Humans and LLM-as-a-Judge [26.3] 大規模言語モデル (LLM) は自動評価器 (LLM-as-a-Judge) としてますます使われている。
この研究は、LSMによる信頼判断が開示されたソースラベルに偏っていることを示すことによって、信頼性に挑戦する。
視線追跡データは、人間が判断の手がかりとしてソースラベルに大きく依存していることを明らかにする。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 08:43:30 GMT)
Efficient Inference for Large Vision-Language Models: Bottlenecks, Techniques, and Prospects [26.1] LVLM(Large Vision-Language Models)は、画像やビデオに対する洗練された推論を可能にするが、その推論は視覚トークン支配として知られるシステム的効率障壁によって妨げられる。
提案手法は,符号化,プリフィル,デコードからなる推論ライフサイクルを中心に構築された効率技術に関する系統分類である。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:44:11 GMT)
Human Interaction-Aware 3D Reconstruction from a Single Image [25.8] 既存の手法は主に個人に焦点を合わせており、複数の人間のシーンで失敗する。
グループレベルの情報とインスタンスレベルの情報の両方を明示的にモデル化する包括的手法を提案する。
我々は、1つの画像から対話する人々の物理的に可塑性で高忠実な3D再構成を生成する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 05:09:41 GMT)
Not All Agents Matter: From Global Attention Dilution to Risk-Prioritized Game Planning [25.8] リスク対応ゲームプランニングの概念を導入し,リスク対応ゲーム問題としてエンド・ツー・エンドの自律運転をモデル化する新しいフレームワークであるGameADを提案する。
また、安全な自動運転のための長い地平線上での計画軌道の累積リスク強度を定量化する計画リスク露光指標を提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 05:33:54 GMT)
CLEAR: Cross-Lingual Enhancement in Alignment via Reverse-training [25.8] クロスLingual Enhancement in Retrieval via Reverse-training (CLEAR) は、逆トレーニングスキームを用いて検索性能を向上させる新しい損失関数である。
CLEARは、特に低リソース言語で最大15%向上した、言語間シナリオの顕著な改善を実現している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:54:38 GMT)
STIndex: A Context-Aware Multi-Dimensional Spatiotemporal Information Extraction System [25.7] textbfSTIndexは、構造化されていないコンテンツを多次元のデータウェアハウスに構造化するエンドツーエンドシステムである。
textbfSTIndexは文書レベルのメモリ、ジオコーディング補正、品質検証を統合している。
ライブデモとオープンソースコードはhttps://stindex.ai4wa.com/dashboard.comで公開されている。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 04:42:44 GMT)
Alignment Tuning for Large Language Models: A Data-Centric Lens on Alignment Data Pipelines [25.7] データ中心の視点とリフレームアライメントのチューニングをパイプライン設計の問題として採用しています。
先行アライメント手法で観測される繰り返し発生する設計トレードオフと障害モードを同定する。
データパイプラインのアライメントには,プロンプトレベルのアライメントやエージェント設定,進化する目標の下でのアライメントといった,オープンな課題を概説する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 10:52:31 GMT)
Unsupervised Multi-agent and Single-agent Perception from Cooperative Views [25.7] 人間のアノテーションを使わずにマルチエージェント協調を利用するunsupervised Multi-agent and Single-agent (UMS) 認識フレームワークを提案する。
UMS法は,マルチエージェントと単一エージェントの両方の認識タスクにおいて,最先端の手法よりも高い3次元検出性能を実現した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 02:51:50 GMT)
See the Forest for the Trees: Loosely Speculative Decoding via Visual-Semantic Guidance for Efficient Inference of Video LLMs [25.6] ビデオ大言語モデル(ビデオ-LLM)は、ビデオ理解に優れるが、自己回帰生成時に高いレイテンシに悩まされる。
LVSpecは,ビデオLLM用に調整された,初となる訓練不要なゆるやかなSDフレームワークである。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:54:33 GMT)
Prior-guided Fusion of Multimodal Features for Change Detection from Optical-SAR Images [25.5] Multimodal Change Detection (MMCD)は、マルチモーダルリモートセンシング(RS)データの変化領域を特定する。
MMCDアプローチは、クロスモーダル相互作用の限界を示し、モダリティ固有の特性を利用する。
光学的セマンティック画像とSAR画像間のMMCDのためのフレームワークSTSF-Netを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:28:17 GMT)
CuraLight: Debate-Guided Data Curation for LLM-Centered Traffic Signal Control [25.3] 交通信号制御はインテリジェントトランスポートシステム(ITS)のコアコンポーネントである
強化学習(RL)と大規模言語モデル(LLM)に基づく最近のアプローチは適応性を改善したが、それでも限定的な解釈性に悩まされている。
本稿では,LL エージェントが LLM ベースの信号制御装置の微調整を支援するフレームワークである CuraLight を提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 10:05:43 GMT)
From Exposure to Internalization: Dual-Stream Calibration for In-context Clinical Reasoning [25.3] 本研究では,表面知識の露出を超越して推論中の深い内部化を実現するテストタイムトレーニングフレームワークを提案する。
このストリームはテスト時に特別なサポートセットをトレーニングすることで、外部のエビデンスと内部ロジックのギャップを埋めることを可能にする。
我々のアプローチは、推論パラダイムを、受動的注意に基づくマッチングから、潜在推論空間の活発な洗練へとシフトさせる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 01:59:40 GMT)
Conformal Margin Risk Minimization: An Envelope Framework for Robust Learning under Label Noise [25.3] 雑音ラベルで学習するプラグイン・アンド・プレイ・エンベロープ・フレームワークである Conformal Margin Risk Minimization (CMRM) を提案する。
CMRMは、観測されたラベルと競合するラベルの間の信頼率を測定し、バッチ毎に推定される共形量子量で閾値付けする。
我々は,任意のラベル雑音下でCMRMの学習境界を導出し,マージン分布の緩やかな規則性しか必要としない。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 21:12:21 GMT)
HybridKV: Hybrid KV Cache Compression for Efficient Multimodal Large Language Model Inference [23.0] MLLM(Multimodal Large Language Models)は、テキスト、画像、ビデオに対する高度な統一推論である。
各ビジュアル入力は数千のトークンに拡張され、キャッシュはコンテキスト長と線形にスケールする。
一般的な解決策は、固定された予算の下で異なる粒度でキャッシュを圧縮することである。
相補的戦略を3段階に統合したハイブリッドKVキャッシュ圧縮フレームワークであるHybridKVを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:51:07 GMT)
A deep learning framework for jointly solving transient Fokker-Planck equations with arbitrary parameters and initial distributions [23.0] 本稿では,深層学習に基づく擬似分析確率解(PAPS)を提案する。
PAPSは、任意のマルチモーダル初期分布、システムパラメータ、時間点に対する過渡FPEソリューションを同時に解決する。
本研究は,多次元パラメタライズドシステムのスケーラブルな確率論的モデリングのパラダイムを確立する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 15:28:53 GMT)
PoM: A Linear-Time Replacement for Attention with the Polynomial Mixer [22.7] ポリノミアルミキサー(PoM)は、線形複雑性を持つ新規なトークン混合機構である。
テキスト生成,手書き文字認識,画像生成,3次元モデリング,地球観測という5つの分野において,自己注意をPoMに置き換える。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:40:37 GMT)
In Depth We Trust: Reliable Monocular Depth Supervision for Gaussian Splatting [22.7] 幾何的監督にスケールあいまいでノイズの多い奥行きを取り入れたトレーニングフレームワークを導入する。
多様なデータセットに対する実験では、幾何精度が一貫した改善が見られた。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 11:15:15 GMT)
Can We Trust a Black-box LLM? LLM Untrustworthy Boundary Detection via Bias-Diffusion and Multi-Agent Reinforcement Learning [22.6] 大きな言語モデル(LLM)は、さまざまなトピックに関する質問に答える能力が高いことを示している。
LLMはバイアスのある、イデオロギー化された、あるいは誤ったレスポンスを生成し、どのトピックが信頼できるかを明確に理解していない場合、アプリケーションを制限する。
本稿では,GMRL-BDと命名された新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 06:24:01 GMT)
Understanding Performance Gap Between Parallel and Sequential Sampling in Large Reasoning Models [22.4] 大規模推論モデル(LRM)は、数学やコーディングといった難しい問題に対して顕著なパフォーマンスを示している。
より複雑なプロセスを形成するために構成できるサンプリング戦略は、シーケンシャルサンプリングと並列サンプリングの2つがある。
本稿では,これら2つの手法を厳密に比較し,並列サンプリングが逐次サンプリングより優れていることを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:28:09 GMT)
LatentMimic: Terrain-Adaptive Locomotion via Latent Space Imitation [22.2] 幾何学的制約からスタイリスティックな忠実さを分離する新しい移動学習フレームワークであるLatntMimicを紹介する。
政策の状態-行動分布と学習モキャップとの差を最小化することにより、厳密なポーズ追跡目的の条件付き緩和を提供する。
提案手法を4つの移動スタイルと4つの地形にまたがって検証し,LatentMimicが効果的な地形適応型移動を可能にすることを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:49:15 GMT)
Quantum state determinability from local marginals is universally robust [22.2] 局所境界の偏差は、指数$in(0,1]$の電力法によって厳格に制限された大域国家に伝播することを示す。
この理論を応用して、スケーラブルな2ローカルな真のマルチパーティ・エンタングルメント証人を構築する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:02:22 GMT)
UAVReason: A Unified, Large-Scale Benchmark for Multimodal Aerial Scene Reasoning and Generation [22.1] UAVReasonは,Nadir-view UAVシナリオ専用の,最初の大規模マルチモーダルベンチマークである。
273K以上のVQA(Visual Question Answering)ペアを統合し、詳細なキャプションを持つ23.6Kのシングルフレーム、68.2Kの2フレームの時間シーケンス、および188.8Kのクロスモーダル生成サンプルを含む。
ベンチマークでは、空間的および時間的軸にわたる22種類の推論タイプを調査し、同時にRGB、深さ、セグメンテーションのモダリティにわたる高忠実度生成を評価した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:23:30 GMT)
Semantic Trimming and Auxiliary Multi-step Prediction for Generative Recommendation [22.0] 両端最適化戦略を利用したSTAMP(Semantic Trimming and Auxiliary Multi-step Prediction)を提案する。
パブリックなAmazonおよび大規模産業データセットの実験では、STAMPは1.23--1.38$times$ speedupと17.2%--54.7%のVRAM削減を達成した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 02:00:23 GMT)
MARS-Dragonfly: Agile and Robust Flight Control of Modular Aerial Robot Systems [21.5] モジュラー・エアリアル・ロボット・システム(MARS)は、再構成可能な連結構造を持つ複数のドローンユニットから構成される。
MARSは単純な準静的モデルと規則に基づくアロケーションに依存しており、不連続かつ非有界なモーターコマンドを生成する。
我々は、受動ドッキング、検出不要な受動ロック、磁気アシスト分離が可能な小型機械システムを開発した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 06:43:08 GMT)
Right at My Level: A Unified Multilingual Framework for Proficiency-Aware Text Simplification [21.4] 既存の言語モデル(LLM)ベースの可読性制御手法は、事前にラベル付けされた文のコーパスに依存し、主に英語をターゲットにしている。
並列コーパス管理を伴わない適応多言語テキスト簡略化のための統合強化学習フレームワークであるRe-RIGHTを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 01:15:27 GMT)
Improving Robustness In Sparse Autoencoders via Masked Regularization [21.3] トレーニング中にトークンをランダムに置き換え、共起パターンを乱すマスクベースの正規化を提案する。
これにより、SAEアーキテクチャ間の堅牢性と、吸収を低減し、探索性能を高め、OODギャップを狭める。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 21:56:23 GMT)
Quantum-Boosted Nonlinear Tunneling Driven by a Bright Squeezed Vacuum [21.1] トンネル電離は高調波発生を駆動する上で重要な役割を担っている。
量子光は、量子ノイズの再分配に特有の能力を持ち、非線形応答を高めるための変換解を提供する。
量子光によって励起される最も基本的な原子系の非線形トンネルイオン化の最初の実験を報告する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:20:49 GMT)
BiCoord: A Bimanual Manipulation Benchmark towards Long-Horizon Spatial-Temporal Coordination [21.0] BiCoordは、長い水平とタイトに調整されたバイマニュアル操作のためのベンチマークである。
具体的には、BiCoordは、連続的なアーム間依存関係と動的ロール交換を必要とする多様なタスクで構成されている。
その結果、代表的操作ポリシーは長期化と高度に結合したタスクに苦しむことが明らかとなった。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:02:17 GMT)
3D Smoke Scene Reconstruction Guided by Vision Priors from Multimodal Large Language Models [20.9] Smokeは、強い散乱効果、ビュー依存の外観変化、およびクロスビュー一貫性の深刻な劣化を導入している。
我々はNano-Banana-Proを用いて、煙の劣化した画像の高精細化と、より鮮明な視覚的観察による再構成を実現している。
Smoke-GSは,煙シーン再構築のための3次元ガウシアン・スプレイティング・フレームワークである。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 10:37:30 GMT)
Masking or Mitigating? Deconstructing the Impact of Query Rewriting on Retriever Biases in RAG [20.2] 本稿では,クエリエンハンスメント手法が検索バイアスに与える影響について,最初の系統的研究を行う。
単純な書き換えは、最も強力な集合バイアス低減(54%)を達成するが、複数のバイアスが組み合わさった敵の条件下では失敗する。
本結果は,特定のバイアス脆弱性に基づいてクエリ拡張戦略を選択するための実用的なガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:10:15 GMT)
Vero: An Open RL Recipe for General Visual Reasoning [19.5] Veroは、様々な視覚的推論タスクにまたがる既存のオープンウェイトモデルに適合または超える、完全にオープンなビジョン言語モデル(VLM)のファミリーである。
Veroは最先端のパフォーマンスを実現し、4つのベースモデルを平均3.6-5.3ポイント改善した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 15:20:05 GMT)
Context-Agent: Dynamic Discourse Trees for Non-Linear Dialogue [19.4] マルチターン対話履歴を動的ツリー構造としてモデル化する新しいフレームワークであるContext-Agentを紹介する。
このアプローチは、会話の本質的な非線形性を反映し、異なるトピックに対応する複数の対話ブランチの維持とナビゲートを可能にする。
実験により、Context-Agentはタスク完了率を高め、様々な大規模言語モデルにおけるトークン効率を向上させることが示された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:54:40 GMT)
From Retinal Evidence to Safe Decisions: RETINA-SAFE and ECRT for Hallucination Risk Triage in Medical LLMs [19.3] 医学大言語モデル(LLM)の幻覚は、特に利用可能な証拠が不十分で矛盾する場合、安全に重要な問題である。
糖尿病性網膜症 (DR) 判定設定におけるこの問題について検討し, 網膜グレーディング記録と整合したエビデンスグラウンドベンチマークであるRETINA-SAFEを導入する。
ステージ1はセーフ/アンセーフのリスクトリアージを行い、ステージ2は安全でないケースを矛盾駆動型とエビデンスギャップのリスクに洗練する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 02:40:13 GMT)
Next-Scale Generative Reranking: A Tree-based Generative Rerank Method at Meituan [19.3] 本稿では,ユーザからの推薦リストを,粗い方法で徐々に拡張する次世代ジェネレータ(NSG)を提案する。
NSGRはMeituanフードデリバリープラットフォーム上での展開に成功している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 01:35:20 GMT)
TrajectoryMover: Generative Movement of Object Trajectories in Videos [19.2] 本稿では,大規模合成ビデオデータのための新しいデータ生成パイプラインであるTrjectoryAtlasを紹介する。
その結果,物体軌跡の生成運動を効果的に実現できることが示唆された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:38:12 GMT)
Active noise cancellation on open-ear smart glasses [19.0] 本稿では、マイクロホンと眼鏡フレームに埋め込まれた小型のオープンイヤースピーカを用いて、環境騒音を抑える、オープンイヤースマートグラスのための初のリアルタイムANCシステムを提案する。
我々の低遅延計算パイプラインは、眼鏡フレームの周りに配置された8つのマイクロホンのアレイから耳の雑音を推定し、環境騒音をキャンセルするためにリアルタイムでアンチノイズ信号を生成する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:17:40 GMT)
Learning to Edit Knowledge via Instruction-based Chain-of-Thought Prompting [19.0] 大規模言語モデル(LLM)は知識編集によって時代遅れの情報を効果的に処理することができる。
現在のアプローチでは、モデルを効果的に活用して実用的な問題を解決することなく、厳格に新しい知識を注入している。
我々は、思考の連鎖(CoT)推論を通して知識を編集するLLMを教える新しいパラダイムを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:38:25 GMT)
Data-Driven Function Calling Improvements in Large Language Model for Online Financial QA [18.0] 大規模言語モデル(LLM)は多くの産業用途に取り入れられている。
API資産は金融ドメイン内のさまざまな機能に分散しています。
オンラインの財務質問応答システムは、LLMとプライベートAPIの両方を活用して、タイムリーな財務分析と情報を提供する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:35:06 GMT)
A plug-and-play superconducting quantum controller at millikelvin temperatures enables exceeding 99.9% average gate fidelity [17.5] ジョセフソン接合に基づく超伝導回路は、その高速、低消費電力、低温の性質のために有望な解を提供する。
10mKの量子ビットと直接チップ・チップ間の相互接続が可能で、高忠実で全デジタル操作が可能な超伝導量子コントローラを報告する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 10:45:08 GMT)
ToxReason: A Benchmark for Mechanistic Chemical Toxicity Reasoning via Adverse Outcome Pathway [17.1] 私たちは、AOP(Adverse Outcome Pathway)に基盤を置くベンチマークであるToxReasonを紹介します。
我々は多種多様な大言語モデル(LLM)における毒性予測性能と推論品質を評価する。
推論学習によって機械的推論が向上し,その結果,毒性予測性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 02:32:38 GMT)
"Don't Be Afraid, Just Learn": Insights from Industry Practitioners to Prepare Software Engineers in the Age of Generative AI [16.9] 大学カリキュラムと業界期待の緊張は、何十年にもわたって何らかの形で存在している。
ジェネレーティブAI(GenAI)ツールのソフトウェア開発への迅速な統合は、最近この2つのドメイン間のギャップを広げた。
私たちの研究は、現代のソフトウェアエンジニアリング環境のために、教育者が学生を準備するのを助けるための実証的なガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:21:27 GMT)
ACE-Bench: Agent Configurable Evaluation with Scalable Horizons and Controllable Difficulty under Lightweight Environments [16.5] 既存のベンチマークは、高い環境相互作用のオーバーヘッドと不均衡なタスク水平線と、集計スコアの信頼性を損なう難易度分布に悩まされている。
そこで我々は,ローカルスロット制約とグローバル制約の両方を条件に,エージェントが部分的に完了したスケジュールで隠れスロットを埋めなければならない,統一グリッドベースの計画タスクを中心に構築されたACE-Benchを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:21:28 GMT)
Dialogue Act Patterns in GenAI-Mediated L2 Oral Practice: A Sequential Analysis of Learner-Chatbot Interactions [16.3] 外国語学習者(EFL)とGenAI音声チャットボット(GenAI音声チャットボット)の対話行動(DA)パターンについて検討した。
12人の学生の70のセッションは、教育インフォームドコーディングスキームを用いて、人間のプログラマによって注釈付けされた。
ハイプログレッシブセッションでは学習者による質問がより多く,低プログレッシブセッションでは明確化検索の頻度が高かった。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 10:56:40 GMT)
Beyond Semantics: Disentangling Information Scope in Sparse Autoencoders for CLIP [16.3] 本稿では,SAE機能がどのように視覚的証拠を集約しているかを特徴付ける,解釈可能性の相補的な次元として情報スコープを導入する。
これを定量化するために,位置安定な局所スコープ特徴と位置可変なグローバルスコープ特徴とを分離するコンテキスト依存スコア(CDS)を提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 11:28:07 GMT)
Sampling for Quality: Training-Free Reward-Guided LLM Decoding via Sequential Monte Carlo [16.2] 本稿では,大規模言語モデルにおける報酬誘導復号化のための原理的確率的フレームワークを提案する。
提案手法は,完全系列上での報酬増大対象分布を定義する。
報酬ポテンシャルによる推論分布を修正し、すべての利得は推論時間サンプリングから純粋に生じる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 21:48:04 GMT)
A Mixture of Experts Foundation Model for Scanning Electron Microscopy Image Analysis [16.1] 本稿では,SEM画像の最初の基礎モデルについて紹介する。
我々は、自動顕微鏡パイプラインにおいて、デフォーカス・ツー・フォーカス画像翻訳は不可欠だが未発見の課題である。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:52:43 GMT)
BPC-Net: Annotation-Free Skin Lesion Segmentation via Boundary Probability Calibration [16.0] アノテーションのない皮膚病変セグメンテーションのための境界確率校正フレームワークであるBPC-Netを提案する。
提案手法は, マクロ平均Dice係数と Jaccard index の85.80% と76.97% に到達し, 教師なし手法の最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 08:43:34 GMT)
JD-BP: A Joint-Decision Generative Framework for Auto-Bidding and Pricing [15.9] 自動入札サービスは、キーパフォーマンス指標(KPI)制約の下で広告主のリアルタイム入札戦略を最適化する。
モデル予測エラーやフィードバック遅延などの不確実性は、入札戦略をポストの最適性から逸脱させる可能性がある。
本稿では,ビディングとプライシングのための共同生成決定フレームワークであるJD-BPを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:11:12 GMT)
Context-Value-Action Architecture for Value-Driven Large Language Model Agents [15.8] 大規模言語モデル(LLM)は人間の振舞いをシミュレートする可能性を示しているが、既存のエージェントはしばしば振舞いの剛性を示す。
本研究では,Stimulus-Organism-Response(S-O-R)モデルとSchwartz氏の基本的人的価値理論に基づくコンテキスト-バリュー-アクションアーキテクチャを提案する。
本手法は, より優れた行動忠実性と解釈可能性を提供しながら, 偏光を効果的に緩和する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:34:20 GMT)
Region-R1: Reinforcing Query-Side Region Cropping for Multi-Modal Re-Ranking [15.8] マルチモーダル検索拡張生成は、画像検索クエリの最も関連性の高い証拠を明らかにするために、リランカに大きく依存する。
標準のリランカは、全クエリイメージをグローバルな埋め込みとして処理し、類似性のスコアを歪ませる視覚的邪魔者の影響を受けやすいようにする。
本稿では,再ランク付け時の決定問題として領域選択を定式化するクエリ側領域トリミングフレームワークであるRerea-R1を提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 00:05:12 GMT)
The Breakthrough of Sleep: A Contactless Approach for Accurate Sleep Stage Detection Using the Sleepal AI Lamp [15.8] 睡眠ステージングは睡眠関連疾患の評価に不可欠である。
従来のPSG(Polysomnography)は、侵入性、労働集約性、長期監視には適さない。
本研究では,非接触型レーダ型睡眠トラッカーであるSleepal AI Lampの性能評価を行った。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 06:49:41 GMT)
Beyond the Final Actor: Modeling the Dual Roles of Creator and Editor for Fine-Grained LLM-Generated Text Detection [15.7] RACE(Rhetorical Analysis for Creator-Editor Modeling)は、クリエータとエディタの異なるシグネチャを特徴付ける、きめ細かい検出方法である。
実験により、RASは偽アラームの少ないきめ細かい型を識別する際、12の基準線より優れていることが示された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:07:18 GMT)
What Models Know, How Well They Know It: Knowledge-Weighted Fine-Tuning for Learning When to Say "I Don't Know" [15.5] マルチサンプル推論により,詳細なインスタンスレベルの知識スコアを推定する。
モデルの既存の知識に従って学習信号をスケールし、スコープ外クエリに対する明示的な"私は知らない"応答を奨励します。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:17:30 GMT)
MICA: Multivariate Infini Compressive Attention for Time Series Forecasting [15.4] 本稿では,チャネルに依存しないトランスフォーマーをチャネルに依存した予測に拡張するアーキテクチャ設計を提案する。
シーケンス次元からチャネル次元への効率的な注意手法を適用することで、MICAはチャネル間の注意機構を追加する。
MICAは、チャネル非依存の予測誤差を平均5.4%、個々のデータセットで最大25.4%削減することを示した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 21:19:00 GMT)
Short Data, Long Context: Distilling Positional Knowledge in Transformers [15.3] 本研究は,ロジットに基づく知識蒸留により,長文検索能力を学生モデルに伝達可能であることを示す。
本稿では,ロジットに基づく知識蒸留が位置情報伝達を直接実現できることを実証する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:50:43 GMT)
The Illusion of Superposition? A Principled Analysis of Latent Thinking in Language Models [15.1] 潜在CoTを用いた推論において,言語モデルが実際に重ね合わせを利用するかどうかを検討する。
スクラッチからトレーニングされたモデルだけが、重ね合わせを使うことの兆候を示します。
この結果は、連続連鎖推論において重畳がいつ、なぜ生じるのかを統一的に説明できる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:59:32 GMT)
Can Large Language Models Reinvent Foundational Algorithms? [15.0] LLMはコンピュータ科学の基盤的アルゴリズムを再発明できるか?
textitUnlearn-and-Reinventパイプラインは、LLMアンラーニングを適用して、特定の基礎アルゴリズムを除去し、モデルが制御された環境で再発明できるかどうかをテストする。
10個のターゲットアルゴリズム、3つの強力なオープンウェイトモデル、3つのヒントレベルにおいて、最強モデルであるQwen3-4B-Thinking-2507がヒントなしで50%のアルゴリズムを再発明し、ヒントレベル1で70%、ヒントレベル2で90%を達成できた。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 11:15:22 GMT)
Social Dynamics as Critical Vulnerabilities that Undermine Objective Decision-Making in LLM Collectives [15.0] 大規模言語モデル(LLM)エージェントは、マルチエージェント環境において、ますます人間のデリゲートとして機能している。
本稿では,ネットワークの社会的文脈によって,エージェントの信頼性が損なわれているかを検討する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:04:21 GMT)
Is CLIP Cross-Eyed? Revealing and Mitigating Center Bias in the CLIP Family [14.9] CLIPのような対照的な視覚言語モデルでは、視覚内容のきめ細やかな理解が欠如していることがよく示される。
特に、CLIPは画像の中心領域に不均等に集中し、境界付近にある重要なオブジェクトを見渡す傾向にある。
このバイアスは、視覚的プロンプトや注意再分配のようなトレーニング不要の戦略によって緩和できることを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 15:04:33 GMT)
Simulation-Driven Evolutionary Motion Parameterization for Contact-Rich Granular Scooping with a Soft Conical Robotic Hand [14.9] ツールベースのスクーピングは、さまざまな大きさ、形状、物質状態の物体との相互作用を可能にするロボット支援タスクにおいて不可欠である。
近年の研究では、柔軟で再構成可能なソフトロボットのエンドエフェクターが、スクーピング中に一貫した接触を維持するために形状に適応できることが示されている。
これらのソフトツールは、複雑な感知や制御を必要とせずに、様々な容器の大きさや材料に調整することができる。
本稿では,変形可能な円錐型ロボットハンドの物理シミュレーションモデルの開発について述べる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:30:21 GMT)
PROMISE: Proof Automation as Structural Imitation of Human Reasoning [14.9] ProMISEは,証明状態遷移に対するステートフルな探索として,証明生成を再構成する構造認識フレームワークである。
複数のLLMバックエンドにまたがるSEL4ベンチマークのPROMISEを評価し,SeleneやRangoといった先行システムと比較した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:49:12 GMT)
Do Domain-specific Experts exist in MoE-based LLMs? [14.8] トレーニング不要なフレームワークである textbfDomain Steering Mixture of Experts (DSMoE) を提案する。
提案手法は,推論コストを増大させることなく高い性能とロバストな一般化を実現する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 00:05:09 GMT)
Synergizing Efficiency and Reliability for Continuous Mobile Manipulation [14.8] 人間は予測計画と即時フィードバックを融合し、停止することなく連続した移動操作タスクを実行する。
本稿では,モバイル操作の効率化と信頼性を両立させる統合フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 04:55:16 GMT)
An Empirical Study of Perceptions of General LLMs and Multimodal LLMs on Hugging Face [14.7] 我々は,多様なモデルと活発なコミュニティを持つ主要なモデルハブであるHugging Faceについて,ユーザディスカッションを行った。
我々の分析によると、LSMアクセス障壁、生成品質、デプロイメントと起動の複雑さが最も重要な関心事であることがわかった。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:19:27 GMT)
Analogical Reasoning as a Doctor: A Foundation Model for Gastrointestinal Endoscopy Diagnosis [14.6] 我々は,アナログ推論に基づく消化管内視鏡画像の基礎モデルであるRATNetを開発した。
RATNetは、5つの消化管内視鏡データセットを通して、異種の専門家アノテーションから知識を取得し、転送する。
アーキテクチャはエンコーダ、関連知識取得・転送(RAT)モジュール、プロジェクタ、マルチタスクヘッドで構成される。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:54:10 GMT)
Learning What Matters: Dynamic Dimension Selection and Aggregation for Interpretable Vision-Language Reward Modeling [14.2] VL-MDR(Vision-Language Multi-dimensional Reward)は、評価を粒度、解釈可能な次元に分解するフレームワークである。
これをサポートするために、21のきめ細かい次元にアノテートされた321kの視覚言語嗜好ペアのデータセットをキュレートする。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 05:28:39 GMT)
DataSTORM: Deep Research on Large-Scale Databases using Exploratory Data Analysis and Data Storytelling [14.1] 大規模言語モデル(LLM)エージェントによる深層研究は、多段階情報発見、合成、分析のための強力なパラダイムとして現れつつある。
大規模構造化データベースとインターネットソースの両方で自律的に研究を行うことができるLLMベースのエージェントシステムであるDataSTORMを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 21:19:26 GMT)
Let Geometry GUIDE: Layer-wise Unrolling of Geometric Priors in Multimodal LLMs [13.6] GUIDE(Geometric Unrolling Inside MLLM Early-layers)は、プログレッシブな幾何学的事前注入フレームワークである。
本研究では,現在の意味論に基づいて必要な空間的手がかりを抽出できる文脈認識ゲーティングを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 10:45:28 GMT)
SynopticBench: Evaluating Vision-Language Models on Generating Weather Forecast Discussions of the Future [13.4] 我々は,米国大陸の気象庁が作成した地域予測に関する1,367,041テキストサンプルからなる高品質なデータセットであるSynopticBenchについて紹介する。
また, 相似気象現象のテキスト記述の質を推定するための新しい評価フレームワークであるSPACEについて述べる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 20:17:49 GMT)
Sparse Gain Radio Map Reconstruction With Geometry Priors and Uncertainty-Guided Measurement Selection [13.4] 我々は幾何学的・能動的センシングの観点からスパースゲイン無線地図の再構成について検討した。
本報告では,高密度ゲイン無線マップと空間不確実性マップをスパース計測と構造化シーン先行から共同で予測する軽量ネットワークである textbfGeoUQ-GFNet を提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:23:49 GMT)
Closing the Speech-Text Gap with Limited Audio for Effective Domain Adaptation in LLM-Based ASR [13.4] 最近の音声テキスト適応アーキテクチャは、プロジェクションモジュールを介して音声エンコーダを大きな言語モデルに接続する。
これは、言語モデルが音声プロジェクタが生成する雑音表現に曝されないため、モダリティギャップをもたらす。
このミスマッチを最小限に抑えることができるか検討する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 21:41:16 GMT)
Toward Consistent World Models with Multi-Token Prediction and Latent Semantic Enhancement [12.8] MTP(Multi-Token Prediction)は、より構造化された表現の学習において有望であることを示す。
そこで本研究では,LSE-MTPによる地中埋立状態軌跡の予測を固定する手法を提案する。
合成グラフと実世界のマンハッタンタクシーライドの実験は、LSE-MTPが離散トークンと連続状態表現のギャップを効果的に橋渡ししていることを示している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:54:22 GMT)
The Model Agreed, But Didn't Learn: Diagnosing Surface Compliance in Large Language Models [12.7] 大規模言語モデル(LLM)は、膨大な世界の知識をパラメトリックメモリとして内部化するが、必然的にソースコーパスの不安定さと誤りを継承する。
知識編集は、再トレーニングせずに記憶を外科的に修正するための重要なパラダイムを提供する。
本研究では,文脈内学習環境下での識別的自己評価をモデルとした診断フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 15:20:41 GMT)
k-Maximum Inner Product Attention for Graph Transformers and the Expressive Power of GraphGPS [12.7] グラフ変換器のk-MIPアテンションを導入し、トップk操作によりクエリ毎に最も関連性の高いキーノードを選択する。
これにより、線形メモリの複雑さと、すべての注意に比較して最大1桁の実用的なスピードアップが達成される。
我々はk-MIP変換器が任意の精度で全アテンション変換器を近似できることを証明した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:22:13 GMT)
LoRM: Learning the Language of Rotating Machinery for Self-Supervised Condition Monitoring [12.4] 回転機械信号理解とリアルタイム状態監視のための自己教師型フレームワークであるLORMを提案する。
局所的な信号は離散的な記号単位にトークン化することができ、その将来の進化は観測されたマルチセンサーのコンテキストから予測できる。
In-situツール条件モニタリング実験は、安定したリアルタイムトラッキングと強力なクロスツール一般化を実証する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:25:20 GMT)
Multi-Granularity Reasoning for Image Quality Assessment via Attribute-Aware Reinforcement Learning to Rank [12.4] 我々はRL2Rを拡張した多粒度推論フレームワークMG-IQA(Multi-Granularity IQA)を提案する。
提案手法は,(1)VLMから構造化された多属性推論を引き出す属性認識促進戦略,(2)グループ相対的政策最適化のための属性固有忠実報酬を計算する多次元サーストン報酬モデル,(3)合成歪み,真の歪み,AI生成画像データセットを知覚的スケールの調整なしに安定な共同トレーニングを可能にするクロスドメインアライメント機構,の3つの重要なイノベーションを紹介する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:07:55 GMT)
A Synthetic Eye Movement Dataset for Script Reading Detection: Real Trajectory Replay on a 3D Simulator [12.3] 本稿では,参照ビデオから実際の人間の虹彩軌跡を抽出し,合成ラベル付き眼球運動ビデオを生成するパイプラインを提案する。
144セッション(72読取,72会話)を25fpsで12時間合成眼球運動ビデオとしてリリースした。
一致したフレーム・バイ・フレーム比較により、3Dシミュレータは読み出しスケールの動作に対して有界感度を示すことが明らかとなった。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 06:15:48 GMT)
PRISM-MCTS: Learning from Reasoning Trajectories with Metacognitive Reflection [12.2] PRISM-MCTSは、人間の並列思考と反射過程からインスピレーションを得る新しい推論フレームワークである。
PRISM-MCTSは、成功戦略を強化し、エラーを起こしやすい枝を刈り取ることにより、効果的に改良を実現する。
PRISM-MCTSの有効性を実証的に評価する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 04:37:35 GMT)
Your LLM Agent Can Leak Your Data: Data Exfiltration via Backdoored Tool Use [12.1] Back-Revealは、セマンティックトリガーを細調整されたツール使用大型言語モデル(LLM)エージェントに埋め込むデータエクスプロイト攻撃である。
起動すると、バックドアされたエージェントはメモリアクセスツールコールを起動し、格納されたユーザコンテキストを検索し、偽装された検索ツールコールを介してそれを出力する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 04:58:01 GMT)
EfficientMonoHair: Fast Strand-Level Reconstruction from Monocular Video via Multi-View Direction Fusion [12.0] 暗黙の神経表現は、グローバルな毛髪の形を捉えることができるが、しばしば細粒の細い鎖の細部を保存できない。
本稿では,暗黙的ニューラルネットワークと幾何学的融合を組み合わせたモノクロビデオからのストランドレベルの再構築フレームワークであるEfficientMonoHairを提案する。
提案手法は,最先端の手法に匹敵する品質を実現するとともに,実行効率をほぼ1桁改善する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:30:19 GMT)
Measuring What Matters!! Assessing Therapeutic Principles in Mental-Health Conversation [11.9] 臨床応用の妥当性と有効性について,AIによるセラピスト様反応の評価問題について検討した。
FAITH-Mは、専門家が指定した順序格付けを付したベンチマークである。
本稿では,対話内コンテキスト,コントラスト検索,知識拡散型連鎖推論を統合した多段階評価フレームワークCAREを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:30:54 GMT)
WebSP-Eval: Evaluating Web Agents on Website Security and Privacy Tasks [10.7] WebSP-EvalはWebエージェントのパフォーマンスをWebサイトのセキュリティとプライバシのタスクで測定するための評価フレームワークである。
WebSP-Evalは、1)28のWebサイトにわたる200のタスクインスタンスからなる手作業によるタスクデータセット、2)カスタムのGoogle Chromeエクステンションを使用して実行中のアカウントと初期状態管理をサポートする堅牢なエージェントシステム、3)自動評価器で構成される。
我々は、最先端のマルチモーダル言語モデルを用いて8つのWebエージェントのインスタンス化を評価し、Webサイト、タスクカテゴリ、UI要素間できめ細かい分析を行う。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:43:21 GMT)
Differentiable SpaTiaL: Symbolic Learning and Reasoning with Geometric Temporal Logic for Manipulation Tasks [10.6] 乱雑な環境で複雑な操作を行うには、幾何学的および時間的制約を満たす必要がある。
多角形集合上でスムーズで自己階数互換な幾何的プリミティブを直接構成する、完全にテンソル化されたツールボックスである微分可能なSpaTiaLを提案する。
鍵空間述語を微分可能緩和することにより、高レベルな仕様から低レベルな幾何学的構成へのエンドツーエンドの異なる意味的マッピングを可能にする。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 23:57:44 GMT)
Can You Trust the Vectors in Your Vector Database? Black-Hole Attack from Embedding Space Defects [10.4] そこで我々は,記憶ベクトルの幾何学的中心付近に少数の悪意のあるベクターを注入するブラックホール攻撃を提案する。
これらのインジェクトベクターはブラックホールのようなクエリを惹きつけ、ほとんどのクエリの上位k検索結果に頻繁に現れる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 06:21:41 GMT)
Optimal Rates for Pure {\varepsilon}-Differentially Private Stochastic Convex Optimization with Heavy Tails [10.4] 純粋エプシロン微分プライバシー(DP)下での重み付き勾配を用いた凸最適化について検討する。
損失の最悪の場合のリプシッツパラメータの有界を仮定する代わりに、有界 k-次モーメントのみを仮定する。
我々のアプローチは、経験的損失のリプシッツ拡張をプライベートに最適化するための新しい枠組みに基づいている。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 21:54:29 GMT)
Expectation Maximization (EM) Converges for General Agnostic Mixtures [10.4] データポイントのセットが与えられた場合、目的は適切な損失関数を最小化することで$k$ラインに適合する。
勾配EMは、高い確率で適切に定義された人口損失最小化器に指数関数的に収束する。
これは、非生成的なセットアップにおいて、最適解に収束するEM型アルゴリズムの有効性を示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:09:22 GMT)
Toward a universal foundation model for graph-structured data [10.4] グラフは生物医学研究の中心的な表現であり、分子相互作用ネットワーク、遺伝子制御回路、細胞間通信マップ、知識グラフを捉えている。
既存のグラフニューラルネットワークは通常、単一のデータセットでトレーニングされ、そのグラフのノードの特徴、トポロジ、ラベル空間に特有の表現を学ぶ。
ここでは、特定のノードの同一性や特徴スキームに特有でない転送可能な構造表現を学習するために設計されたグラフ基礎モデルを紹介する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:21:21 GMT)
An Iterative Test-and-Repair Framework for Competitive Code Generation [9.1] 大規模言語モデル(LLM)はコード生成において顕著な進歩を遂げているが、競争力のあるプログラミングは依然として課題である。
近年,強化学習(RL)と実行フィードバックによるコード生成が改良されている。
より最近のフレームワークCUREでは、テスト生成をトレーニングプロセスに組み込んで、CoderとTesterを1つのモデルで共同でトレーニングしている。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 08:00:54 GMT)
AICA-Bench: Holistically Examining the Capabilities of VLMs in Affective Image Content Analysis [9.0] AICA-Benchは、感情理解(EU)、感情推論(ER)、感情誘導コンテンツ生成(EGCG)の3つのコアタスクからなる総合的なベンチマークである。
我々は23個の視覚言語モデル(VLM)を評価し、弱い強度のキャリブレーションと浅い記述の2つの大きな限界を同定する。
本研究では,視覚的足場と階層的推論を組み合わせた学習自由フレームワークであるグラウンドド・アフェクティブ・ツリー(GAT)・プロンプティングを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:05:17 GMT)
LLM-as-Judge for Semantic Judging of Powerline Segmentation in UAV Inspection [8.9] 本研究では,大型言語モデル(LLM)を意味判断として使用し,ドローン搭載モデルによる電力線分割結果の信頼性を評価することの実現可能性について検討する。
LLMは、視覚的信頼性が低下するにつれて、信頼性の適切な低下を示しながら、同一条件下で非常に一貫した分類学的判断を生成する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:16:44 GMT)
Final Report, Center for Computer-Integrated Computer-Integrated Surgical Systems and Technology, NSF ERC Cooperative Agreement EEC9731748, Volume 1 [8.9] 医療ロボティクスは、マージンから主流へと移行してきた。
NSFのサポートのおかげで、CISST ERCはプロのインフラを構築した。
ERCが現在開発中の基本的な科学と工学は、医療に関するすべての人に大きな利益をもたらすだろう。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 00:13:20 GMT)
From Clues to Generation: Language-Guided Conditional Diffusion for Cross-Domain Recommendation [8.8] クロスドメインレコメンデーション(CDR)は、複数のドメイン間の相関を利用してデータの分散を緩和する。
本稿では,Language-Guided Conditional Diffusion for CDR (LGCD)を提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:05:22 GMT)
Joint Knowledge Base Completion and Question Answering by Combining Large Language Models and Small Language Models [8.7] 知識ベース補完(KBC)と知識ベース質問応答(KBQA)は互いに密接に関連しており、本質的に相補的である。
既存の研究は通常、それらを共同で強化するために小さな言語モデル(SLM)に依存している。
本稿では,これら2つのタスクを反復的に拡張する新しいフレームワークJCQLを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:33:17 GMT)
A Survey of Algorithm Debt in Machine and Deep Learning Systems: Definition, Smells, and Future Work [8.1] 機械学習とディープラーニング(ML/DL)技術はメンテナンス上の課題を導入し、技術的負債(TD)に繋がる
Algorithm Debt (AD)は、ML/DLシステムの性能とスケーラビリティに影響を与えるTD型である。
42の一次研究のレビューでは、ADの定義を拡張し、その暗黙の存在を明らかにし、その匂いを特定し、将来の方向性を強調した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:38:51 GMT)
Modeling Patient Care Trajectories with Transformer Hawkes Processes [8.0] 患者軌跡を連続的にモデル化するTransformer Hawkes Processフレームワークを構築した。
逆平方根クラス重み付けを用いた不均衡学習手法を提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:10:49 GMT)
Probing Intrinsic Medical Task Relationships: A Contrastive Learning Perspective [8.0] 医用視覚タスクが表現レベルでどのように関連し、重複し、あるいは異なるかを検討する。
我々の目標は、データ駆動型表現空間がタスクの基盤構造を捉えることができるかどうかを調査することである。
タスクを共有表現空間に埋め込むために設計された対照的な学習フレームワークであるタスクコントラスト学習(TaCo)を紹介する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:54:37 GMT)
CRISP: Rank-Guided Iterative Squeezing for Robust Medical Image Segmentation under Domain Shift [8.0] 正のボクセルに対する予測確率の相対的なランクは、分布シフトの下で安定であることを示す「正の領域のランク安定性」を導入する。
次に、反復的なトレーニングフレームワークを設計し、HPとHRを段階的に最終セグメンテーションに絞る'。
CRISPは確率ではなくランクに基づいてセグメンテーションを行う最初のフレームワークである。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 04:05:36 GMT)
Reinforcement Learning with Negative Tests as Completeness Signal for Formal Specification Synthesis [7.9] 本稿では,Dafny における仕様記述のための強化学習フレームワーク SpecRL を提案する。
我々は、仕様完全性の信号として、候補仕様によって拒否された負のテストのごく一部を用いる。
実験により、SpecRLはSFTおよびRLよりも仕様強度と検証成功の両方を改善していることが示された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:53:42 GMT)
MolDA: Molecular Understanding and Generation via Large Language Diffusion Model [7.9] MolDAは、従来のARバックボーンを離散的なLarge Language Diffusion Modelに置き換える、新しいフレームワークである。
グローバルな構造的コヒーレンス、化学的妥当性、ロバストな推論を分子生成、キャプション、特性予測で保証する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:28:35 GMT)
Graphic-Design-Bench: A Comprehensive Benchmark for Evaluating AI on Graphic Design Tasks [7.8] GraphicDesignBench(GDB)は、プロフェッショナルなグラフィックデザインタスクの全範囲でAIモデルを評価するために設計された、初めての包括的なベンチマークスイートである。
このスイートは、レイアウト、タイポグラフィー、インフォグラフィック、テンプレートとデザインのセマンティクス、アニメーションの5つの軸に沿って構成された50のタスクで構成されている。
本研究では,空間的精度,知覚的品質,テキストの忠実度,セマンティックアライメント,構造的妥当性を網羅した標準化された計量分類法を用いて,フロンティアクローズソースモデルの集合を評価する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:58:37 GMT)
Multiscale Physics-Informed Neural Network for Complex Fluid Flows with Long-Range Dependencies [7.8] DDS-PINN(Domain-Decomposed and Shifted Physics-Informed Neural Network)
Re = 10,000 での乱流残留流の場合、スパースフレームワークは、500個のランダムな監督点(全領域の0.3%)のみを用いて O(10-4) への収束を達成する。
このアプローチは、測定による複雑な乱流の超解像の強いポテンシャルを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:54:50 GMT)
Generative-AI and the transformation of workforce. A job postings-driven analysis [7.8] 本稿では,AIが雇用要件,スキル構成,グローバル労働市場におけるセクターダイナミクスをいかに変えつつあるかを検討する。
職種投稿におけるAI関連能力の進化頻度とフレーミングについて検討し、生成型AIが主に職場における増強力または代替力として機能するかを検討する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:02:43 GMT)
Attention-Guided Flow-Matching for Sparse 3D Geological Generation [7.7] 3D-GeoFlowは、スパースマルチモーダルな地質モデリングに適した最初のアテンションガイド型連続フローマッチングフレームワークである。
離散カテゴリー生成をシミュレーションのない連続ベクトル場回帰として再構成することにより、安定な決定論的最適輸送経路を確立する。
この枠組みを検証するため,2200件の手続き的に生成された3次元地質事例からなる大規模マルチモーダルデータセットをキュレートした。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:02:53 GMT)
Firebolt-VL: Efficient Vision-Language Understanding with Cross-Modality Modulation [7.7] Firebolt-VLは、TransformerベースのデコーダをLiquid Foundation Model (LFM)デコーダに置き換える効率的な視覚言語モデルである。
そこで本稿では,テキストトークンと画像パッチの軽量な相関関係を計算するToken-Grid相関モジュールを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 05:30:10 GMT)
BDI-Kit Demo: A Toolkit for Programmable and Conversational Data Harmonization [7.6] BDIKitは調和と値マッチングのためのツールキットを提供する。
Python APIとAIアシストインターフェースという,異なるユーザニーズに合わせた2つの補完インターフェースを公開する。
i) プリミティブな変換の作成、中間出力の検証、再利用のためのPython APIの使用、(ii) 自然言語でAIアシスタントと会話してBDIKitの機能にアクセスする、という2つのシナリオを提示します。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:38:42 GMT)
Directional and correlated optical emission from a waveguide-engineered molecule with local control [7.4] 我々は、双方向フォトニック結晶導波路に埋め込まれた量子ドットの放出方向を制御する。
本研究では, 相対駆動位相を操作することにより, 排出方向を左から右に切り替えることができることを示す。
この研究は、非キラル導波路を介して結合された量子ドットを用いたキラル量子光学の新たな実装を示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:46:52 GMT)
Assessing Large Language Models for Stabilizing Numerical Expressions in Scientific Software [6.9] 本稿では,2つの数値安定化タスクによる高精度数値計算における大規模言語モデルの推論について検討する。
一般的な数値ベンチマークを用いて,約2,470個の数値構造上のLSMを6つ評価する。
LLMは、数値的に不安定な計算を検出し、安定化するための最先端の従来の手法として同様に有効である。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 01:52:43 GMT)
YoNER: A New Yorùbá Multi-domain Named Entity Recognition Dataset [6.9] YoNERは、ニュースやウィキペディアを超えてエンティティカバレッジを拡張する、新しいマルチドメインYorb NERデータセットである。
データセットは、約5000の文と、聖書、ブログ、映画、ラジオ放送、ウィキペディアを含む5つのドメインから収集された10000のトークンで構成されている。
その結果,アフリカ中心モデルはYorbの汎用多言語モデルよりも優れていたが,クロスドメイン性能は著しく低下した。
さらに、ドメイン内評価において多言語モデルよりも優れた新しいYorb特化言語モデル(OyoBERT)を導入する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:27:04 GMT)
The LLM Effect on IR Benchmarks: A Meta-Analysis of Effectiveness, Baselines, and Contamination [6.9] TREC Robust04 コレクションと TREC Deep Learning 2020 (DL20) パス検索ベンチマークを用いて,143 のパブリッシュ結果の分析を行った。
LLM コンポーネントを組み込んだ最近のシステムは TREC 2020 の結果と比較して DL20 では nDCG@10 が 8.8% 高く、2023 年以降では Robust04 では 20% 高い。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:10:08 GMT)
From Incomplete Architecture to Quantified Risk: Multimodal LLM-Driven Security Assessment for Cyber-Physical Systems [6.9] ASTRALはアーキテクチャ中心のセキュリティアセスメント技術であり、マルチモーダル LLM を利用したプロトタイプツールで実装されている。
迅速な連鎖、少数ショット学習、アーキテクチャ推論を活用することで、ASTRALは異なるデータソースからシステム表現を抽出し、合成する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 10:25:04 GMT)
HYVE: Hybrid Views for LLM Context Engineering over Machine Data [6.8] マシンデータは、現代のコンピューティングシステムにおける可観測性と診断の中心である。
本稿では,大規模なデータペイロードを含む入力のためのコンテキストエンジニアリングフレームワークHYVEを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:50:12 GMT)
Agentic AI-Based Joint Computing and Networking via Mixture of Experts and Large Language Models [6.8] 将来の第6世代(6G)モバイルネットワークは、強力だが高度に専門化された最適化専門家の多様なセットを備えることが想定されている。
このような有望なビジョンは、そのような専門家を選択、組み合わせ、編成できるスケーラブルなメカニズムの必要性を生じさせるものと期待されている。
エージェント人工知能(AI)に基づくネットワーク最適化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:00:46 GMT)
GenomeQA: Benchmarking General Large Language Models for Genome Sequence Understanding [6.7] GenomeQAは、シーケンスベースのゲノム推論タスクにおける汎用LSMの制御された評価設定を提供するために設計されたベンチマークである。
モデルは常にランダムなベースラインより優れており、GC内容やショートモチーフなどの局所的なシーケンス信号を利用することができる。
GenomeQAは、汎用LSMを生ゲノム配列で研究・改善するための診断基準を確立する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:14:20 GMT)
FedSpy-LLM: Towards Scalable and Generalizable Data Reconstruction Attacks from Gradients on LLMs [6.6] FedSpy-LLMはスケーラブルで一般化可能なデータ再構成攻撃であり、より大きなバッチサイズと長いシーケンスでトレーニングデータを再構築するように設計されている。
FedSpy-LLMの中核は、勾配の階数不足と部分空間構造を利用する新しい勾配分解戦略である。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:19:54 GMT)
PECKER: A Precisely Efficient Critical Knowledge Erasure Recipe For Machine Unlearning in Diffusion Models [6.4] PECKER(PECKER)は,一般的な手法にマッチしたり,性能を向上する,効率的な機械学習手法である。
蒸留フレームワーク内でPECKERは、ターゲットデータを忘れるのに最も貢献するパラメータの更新を優先順位付けするサリエンシマスクを導入する。
提案手法は,CIFAR-10およびSTL-10データセットの真の画像分布と密接に一致しながら,関連クラスや概念をより迅速に学習するサンプルを生成する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:36:12 GMT)
Adaptive Serverless Resource Management via Slot-Survival Prediction and Event-Driven Lifecycle Control [6.4] サーバレスコンピューティングは、インフラストラクチャ管理のオーバーヘッドをなくすが、コールドスタートのレイテンシとリソース利用に関する大きな課題をもたらす。
本稿では,イベント駆動アーキテクチャと確率的モデリングにより,サーバレス性能を最適化する適応エンジニアリングフレームワークを提案する。
実験結果から, マルチクラウド環境におけるベースライン手法と比較して, コールドスタートを51.2%削減し, コスト効率を約2倍向上することがわかった。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 05:57:37 GMT)
The Depth Ceiling: On the Limits of Large Language Models in Discovering Latent Planning [6.2] モデルが中間段階の監督なしに多段階計画戦略を発見できるかどうかを検討した。
必要な遅延計画手順の数を正確に制御するグラフパスフィニングタスクを使用して、顕著な制限を明らかにする。
トレーニング中に学習できる最大潜伏計画深度モデルは5つだが、発見された戦略はテスト時に最大8つの潜伏ステップを一般化する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 20:04:14 GMT)
DIA-HARM: Dialectal Disparities in Harmful Content Detection Across 50 English Dialects [6.1] 本稿では,50の英語方言における偽情報検出のための最初のベンチマークであるDIA-HARMを提案する。
人間による方言の含有量は1.4-3.6%減少し、一方でAI生成された内容は安定している。
私たちはDIA-HARMフレームワーク、D3コーパス、評価ツールをリリースします。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 01:43:48 GMT)
NS-RGS: Newton-Schulz based Riemannian gradient method for orthogonal group synchronization [5.9] グループ同期は、一対の測定からグループ要素の回復に関わる基本的なタスクである。
グループ同期のための NS-Schulz-based Gradientian Scheme (NS-RGS) は計算コストを大幅に削減する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:40:35 GMT)
Conditional Publics: Shared Events and Divergent Meanings in the European Twitter Debate on the Ukraine War [5.9] ロシアによるウクライナ侵攻の最初の8ヶ月で、ヨーロッパ20カ国の3800万件以上のツイートを分析した。
構造分極は、過激化ではなく、カジュアルなユーザの退去によって引き起こされる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:36:21 GMT)
What are They Thinking? Delineation, Probing and Tracking of Concepts in LLMs [5.8] 広義の概念の集合の有無を検知するプローブの開発方法を示す。
これは4つの異なる概念と3つの異なるLLMで実現されている。
このプロセスがさらに多くの概念に拡張されると、新しいモデルを簡単に監視できるようになります。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:50:09 GMT)
Designing Ethical Learning for Agentic AI: Toegye Yi Hwang's Ethical Emotion Regulation Framework [5.7] 自律的な目標設定と積極的な介入が可能なエージェントAIシステムは、学習環境における道徳的感情プロセスを制御するための新たな課題を導入する。
既存のフレームワークでは、感情をリアクティブなフィードバックやエンゲージメントの最適化として扱い、自律的な意思決定サイクルを越えて規範的な規制の必要性を見越しています。
本稿では,Toegye Yi Hwangの道徳感情哲学に触発されたエージェント型AI学習設計のための倫理的感情制御フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:38:27 GMT)
Content Fuzzing for Escaping Information Cocoons on Digital Social Media [5.7] ソーシャルメディア上の情報コクーンは、様々な視点でユーザーの投稿への露出を制限する。
本稿では,人間解釈の意図を保ちながら投稿を書き換える信頼性誘導型ファジィフレームワークであるContentFuzzを紹介する。
提案手法は,姿勢検出モデルからの信頼度フィードバックを用いて,意味保存の書き直しを生成するために,大規模言語モデルを導出する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 05:49:58 GMT)
Learning-Guided Force-Feedback Model Predictive Control with Obstacle Avoidance for Robotic Deburring [5.7] 特にデバリングには、正確な工具挿入、安定した力調節、衝突のない円運動が必要である。
本稿では,これらの課題に対処するために,力覚フィードバックMPCと拡散に基づく動きを統合化するためのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:43:32 GMT)
Assessing the Feasibility of a Video-Based Conversational Chatbot Survey for Measuring Perceived Cycling Safety: A Pilot Study in New York City [5.4] 本研究では,ビデオベースの調査と会話型AIチャットボットを組み合わせることで,サイクリングの安全性に関する人間の認識と,その背景にある理由を収集する手法を提案する。
本稿では,モジュール型LLMアーキテクチャを用いてAIチャットボットを開発し,迅速なエンジニアリング,状態管理,ルールベースの制御を統合し,人間-AIインタラクションの構造をサポートする。
提案手法は,ユーザエクスペリエンス(使いやすさ,サポート性,効率)の7点尺度評価と,チャットボットのユーザビリティの5点尺度を用いて評価した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 21:11:18 GMT)
Staggered Integral Online Conformal Prediction for Safe Dynamics Adaptation with Multi-Step Coverage Guarantees [5.4] 本稿では、積分スコア関数を用いて、乱れと学習誤差のラップ効果を定量化するアルゴリズムであるStaggered Integral Online Conformal Prediction (SI-OCP)を提案する。
提案手法は,全層ディープニューラルネットワーク(DNN)適応クアッドコプターの数値シミュレーションにより検証する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:44:06 GMT)
Artificial Intelligence and the Structure of Mathematics [5.3] 人工知能(AI)の最近の進歩は、数学の変換能力を解き放つことである。
我々は、数学のtextbf論理を補完する新しい経路を造ることによって、AIが数学の壮大な視点を開こうと考えている。
私たちはAIエージェントをプラトン数学の世界を横切るために送ります。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:19:33 GMT)
Dynamics of Entanglement in Schwarzschild Black Holes [5.3] 両部混合状態の絡み合いの指標としてコンカレンスを用い, ホーキング温度によるその進化について検討した。
ホーキング加速度が増加するにつれて、物理的にアクセス可能なコンカレンスは減少するが、物理的にアクセスできないコンカレンスは反対の挙動を示し、ゼロから単調に増加する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 02:06:04 GMT)
Purify-then-Align: Towards Robust Human Sensing under Modality Missing with Knowledge Distillation from Noisy Multimodal Teacher [5.2] PTA(Purify-then-Align)はメタラーニングと知識拡散を統合したフレームワークである。
PTAは最先端の性能を達成し、単一モダリティモデルの堅牢性を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 08:24:47 GMT)
Leaderless Collective Motion in Affine Formation Control over the Complex Plane [5.1] 本研究では,ラプラシア行列の原重量を変化させ,平面上のアフィン形成の集合的操作法を提案する。
結果として生じる集合運動は、基準構成の時間変化アフィン変換として特徴づけられる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:53:48 GMT)
Anchored Cyclic Generation: A Novel Paradigm for Long-Sequence Symbolic Music Generation [5.1] 本稿では,すでに特定されている音楽のアンカー機能を利用したアンコールサイクル生成(ACG)パラダイムを提案する。
ACGパラダイムに基づいた階層型アンコールサイクル生成(Hi-ACG)フレームワークを提案する。
長いシーケンスのシンボリックな音楽生成タスクにおいて、Hi-ACGフレームワークは主観的および客観的評価において既存の主流手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 02:29:43 GMT)
A Co-Design Framework for High-Performance Jumping of a Five-Bar Monoped with Actuator Optimization [5.1] メカニカルデザイン, モータ, ギアボックスパラメータ, 動的跳躍の制御パラメータを共同で最適化する平面閉鎖5バーモノペットの共設計フレームワークを提案する。
その結果,ジャンプ距離が約42%向上し,機械的エネルギー消費が15.8%減少した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:21:53 GMT)
Structural Regularities of Cinema SDR-to-HDR Mapping in a Controlled Mastering Workflow: A Pixel-wise Case Study on ASC StEM2 [5.0] ASC StEM2は,EXR画像と一致するSDR/シネマリリースマスタを含む稀な共通ソースデータセットである。
テストフィルムの全18,580フレームの画素単位の統計に基づいて,EXRソースデータ,SDRリリースマスタ,HDRリリースマスタを含む3領域比較を構築し,その輝度と色構造の関係を特徴付ける。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 08:00:31 GMT)
Lightweight Multimodal Adaptation of Vision Language Models for Species Recognition and Habitat Context Interpretation in Drone Thermal Imagery [5.0] そこで本研究では,RGBを前提としたVLMと熱赤外画像との表現ギャップを埋める,軽量なマルチモーダル適応フレームワークを提案する。
熱データセットは、ドローンが収集した画像から開発され、マルチモーダルプロジェクターアライメントによるVLMの微調整に使用された。
その結果,軽量プロジェクタによる適応化は,RGBを前提としたVLMを熱ドローン画像に転送する上で,効果的かつ実用的な方法であることがわかった。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:36:01 GMT)
FM-CAC: Carbon-Aware Control for Battery-Buffered Edge AI via Time-Series Foundation Models [5.0] エッジAIデプロイメントは、常時稼働し、リアルタイム複合AIパイプラインを実行する数十億のデバイスにスケールする。
本稿では,電池をアクティブ時間バッファとして活用する能動的炭素認識制御フレームワークFM-CACを提案する。
その結果、FM-CACは最大に近い推定精度を維持しながら、二酸化炭素排出量を最大65.6%削減することがわかった。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:23:06 GMT)
Toward Aristotelian Medical Representations: Backpropagation-Free Layer-wise Analysis for Interpretable Generalized Metric Learning on MedMNIST [4.9] A-ROMは、さらなる勾配に基づく微調整の計算負担や不透明さを伴わない、新しい医療概念の迅速なモデリングを可能にする。
我々は、従来の不透明な決定層を、人間が読める概念辞書とk-Nearest Neighbors(kNN)に置き換える。
MedMNIST v2スイートの実験では、A-ROMが標準ベンチマークと競合する性能を提供することを示した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:14:14 GMT)
CoStream: Codec-Guided Resource-Efficient System for Video Streaming Analytics [4.8] 圧縮の副産物として,ビデオコーデックが各ストリームの時間的・空間的構造を抽出していることを示す。
CoStreamはこのメタデータを低コストのランタイム信号として扱い、ビデオデコーディング、ビジュアルプロセッシング、LLMプリフィルの最適化を統一する。
実験によると、CoStreamは最大で3倍のスループット向上を実現し、最先端のベースラインよりも最大87%のGPU削減を実現し、競争精度は0-8%のF1ダウンで維持されている。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:31:45 GMT)
Quality-preserving Model for Electronics Production Quality Tests Reduction [4.8] 本稿では,オフラインの最小コスト診断サブセット構築とオンラインThompson-Samplingマルチアームバンディットを組み合わせた適応型テスト選択フレームワークを提案する。
回路基板組立段階の2つのプリント回路基板組立段階(Functional Circuit Test と End-of-Line test-covering 28,000 board run)について,本フレームワークの評価を行った。
オフライン分析では、テスト時間を18.78%削減し、エンド・オブ・ラインテストで91.57%削減するゼロ・エスケープ計画が特定された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 20:47:27 GMT)
Symetra: Visual Analytics for the Parameter Tuning Process of Symbolic Execution Engines [4.8] KLEEのようなシンボリックな実行エンジンは、テストケースを自動的に生成してブランチカバレッジを最大化する。
その多数のパラメータは、パラメータの影響を理解するのが難しく、ユーザは、サブ最適のデフォルト設定に依存するようになる。
本稿では,Human-in-the-Loopパラメータチューニングをサポートする視覚分析システムであるSynetraを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 02:42:28 GMT)
Learned Elevation Models as a Lightweight Alternative to LiDAR for Radio Environment Map Estimation [4.5] 推論時に3次元データを必要としない2段階のフレームワークを提案する。
既存のCNNベースのREM推定アーキテクチャでは、画像のみのベースラインよりもRMSEを最大7.8%改善する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:18:53 GMT)
Dialogue based Interactive Explanations for Safety Decisions in Human Robot Collaboration [4.5] 本稿では,人間ロボットの協調作業における安全性決定の対話的説明のための対話型フレームワークを提案する。
提案手法は,制約に基づく安全性評価,同一状態の接地対話,行動選択を規定する制約表現とを密に結合する。
建設ロボティクスのシナリオでフレームワークをインスタンス化し、制約に敏感な対話がいかに安全性の介入を明確化し、協調的なタスク回復をサポートするかを示す構造化された運用トレースを提供する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:59:36 GMT)
FrontierFinance: A Long-Horizon Computer-Use Benchmark of Real-World Financial Tasks [4.4] 5つのコアファイナンスモデルにわたる25の複雑な金融モデリングタスクのベンチマークであるFrontierFinanceを紹介します。
我々は、人間の専門家にタスクを定義し、ルーブリックを作成し、LCMを格付けし、タスク自体を人間のベースラインとして実行させます。
私たちの人間の専門家はどちらも平均して高いスコアを受け取り、現在の最先端システムよりもクライアント対応のアウトプットを提供する可能性が高いことを実証しています。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:15:45 GMT)
Hazard Management in Robot-Assisted Mammography Support [4.4] MammoBotは、X線マンモグラフィーで患者を支援するために設計されたロボットシステムである。
本稿では,マンモボットのハザード管理手法を提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 11:52:02 GMT)
CLIP-Guided Data Augmentation for Night-Time Image Dehazing [4.4] 本稿では,NTIRE 2026 Night Time Image Dehazing Challengeに対して,統合されたフレームワークとして構築したソリューションを提案する。
NAFNetは2つの段階でトレーニングされ、まずターゲットドメインに適応し、その後より広範な劣化パターンに拡張される。
推論時に、TLC、x8自己アンサンブル、重み付きスナップショット融合を組み合わせて出力安定性を向上させる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 06:43:24 GMT)
Single-Stage Signal Attenuation Diffusion Model for Low-Light Image Enhancement and Denoising [4.4] 拡散モデルは、前方雑音付加と逆雑音の確率論的モデリングによる画像復元において優れる。
主ストリーム拡散に基づく低光画像強調法 (LLIE) は、U-Net出力を洗練させるために、2段パイプラインまたは補助補正ネットワークを採用する。
本稿では,信号減衰機構を拡散パイプラインに統合する新しい拡散過程である信号減衰拡散モデル(SADM)を提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 11:33:04 GMT)
Nonlocal advantage of quantum imaginarity in Schwarzchild spacetime [4.4] シュワルツシルト時空におけるホーキング効果の量子想像性への影響について検討する。
NAQIでは、ホーキング放射に大きく影響され、物理的にアクセス不能な領域と到達不能な領域の間に顕著な差が見られる。
補助的虚像蒸留では、ホーキング効果は補助的忠実度を状態依存的に修飾する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 08:29:45 GMT)
Attention Flows: Tracing LLM Conceptual Engagement via Story Summaries [4.3] テキストを用いた概念的エンゲージメントのモデルが人間のパターンを反映するかどうかを評価する。
我々は、150の人文小説の文を、それらが参照する特定の章と整合させる。
テキスト間の文体的差異と、人間とLLMが物語全体を通して焦点を分散する方法の違いの両方を見いだす。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:50:52 GMT)
LLM4CodeRE: Generative AI for Code Decompilation Analysis and Reverse Engineering [4.2] LLM4CodeREは、双方向コードリバースエンジニアリングのためのドメイン適応型LLMフレームワークである。
アセンブリからソースへの逆コンパイルとソースからアセンブリへの変換の両方を統一モデル内でサポートする。
LLM4CodeREは既存の逆コンパイルツールや汎用コードモデルよりも優れていることを示す実験結果が得られた。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:08:44 GMT)
A Tensor-Train Framework for Bayesian Inference in High-Dimensional Systems: Applications to MIMO Detection and Channel Decoding [4.2] 本稿では,加法雑音モデルにおけるほぼ最適ベイズ推定のためのテンソルトレイン(TT)フレームワークを提案する。
現実的な推論手法は、トラッピングされたテイラー系列を持つTTクロスアルゴリズムを用いて、ログポストの指数関数を近似する。
数値計算の結果,信号対雑音比の広い範囲において,誤差速度がほぼ最適であることが示唆された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:53:21 GMT)
Towards Resilient Intrusion Detection in CubeSats: Challenges, TinyML Solutions, and Future Directions [4.1] キューブサットは、研究と教育のための安価なプラットフォームを提供することで、宇宙へのアクセスに革命をもたらした。
侵入検知システム(IDS)のような従来のセキュリティ対策は、資源の制約とユニークな運用環境のため、CubeSatにとって実用的ではない。
本稿は、CubeSatsの現在のサイバーセキュリティプラクティスの詳細なレビューを行い、既存の方法の限界を強調し、ギャップを識別する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:47:51 GMT)
FastDiSS: Few-step Match Many-step Diffusion Language Model on Sequence-to-Sequence Generation--Full Version [4.1] 高速推論のための1ステップサンプリングで自己条件が劣化する。
本稿では,推測雑音にマッチする自己条件信号を実現するためのトレーニングフレームワークを提案する。
我々のフレームワークは、標準の連続拡散モデルを超え、最大400倍高速な推論速度を提供する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:52:08 GMT)
Flowr -- Scaling Up Retail Supply Chain Operations Through Agentic AI in Large Scale Supermarket Chains [4.0] Flowrは、大規模スーパーマーケットでのエンド・ツー・エンドのサプライチェーンを自動化する新しいエージェントAIフレームワークである。
手動サプライチェーン操作を専門のAIエージェントに分解し、それぞれが明確に定義された認知的役割を担っている。
このフレームワークは、大規模なスーパーマーケットチェーンと協調して検証され、ドメインに依存しない。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 15:15:12 GMT)
All LCA models are wrong. Are some of them useful? Towards open computational LCA in ICT [4.0] ライフサイクルアセスメント(LCA)は、情報通信技術システムの環境影響を定量化し、規制するためにますます利用されている。
直接バイオスフィア測定は複雑であるため,ICTの環境影響評価はモデルに大きく依存している。
このようなシステムには、構築、校正、統合、解釈において極めて高度な注意が必要である、と我々は主張する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:36:56 GMT)
eVTOL Aircraft Energy Overhead Estimation under Conflict Resolution in High-Density Airspaces [3.7] 本稿では, 改良電圧ポテンシャルアルゴリズムによるコンフリクト分解操作がeVTOLのエネルギー消費に与える影響について検討する。
我々は10~60機の同時航空機の交通密度に対して,1セクター内の経路区間で71,767機を分析した。
MVPベースのデコンフリクションはエネルギー効率が高いが、尾翼ケースは持続的なマルチエアクラフトの衝突により最大密度で44%のオーバーヘッドに達する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:07:39 GMT)
Temporal Inversion for Learning Interval Change in Chest X-Rays [3.7] 本稿では,時間的反転を用いて画像ペアを反転させるフレームワークであるTILA(Temporal Inversion-aware Learning and Alignment)を監視信号として紹介する。
TILAは、事前学習、微調整、推論にまたがる逆認識の目的を統合し、従来の外観モデリングと時間順の明示的な学習を補完する。
また、時間的インバージョン下での順序の感度と一貫性を評価するための統一評価プロトコルを提案し、一般的なプロトコルを用いて構築された評価セットであるMS-CXR-Tretrievalを導入する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 22:05:38 GMT)
Predictions of charge density distributions for nuclei with $Z \geq 8$ [3.7] 陽子数$Zgeq 8$の原子核の電荷密度分布を正確に予測するディープニューラルネットワーク(DNN)が開発された。
従来の手法に比べて予測精度が大幅に向上した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 01:32:53 GMT)
JUÁ - A Benchmark for Information Retrieval in Brazilian Legal Text Collections [3.6] textscJUはブラジルの法的検索のベンチマークである。
プロトコル、一般的なランキングメトリクス、適用時に固定分割、および公開リーダボードを組み合わせる。
我々は, 語彙, 密度, BM25に基づくリグレードパイプラインの評価を行った。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:10:54 GMT)
In-Context Learning in Speech Language Models: Analyzing the Role of Acoustic Features, Linguistic Structure, and Induction Heads [3.6] In-Context Learning (ICL) はテキストのみの言語モデルで広く研究されている。
言語モデルにおける言語的特徴と音響的特徴がICLに与える影響について検討する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:35:47 GMT)
From Uniform to Learned Knots: A Study of Spline-Based Numerical Encodings for Tabular Deep Learning [3.6] ディープラーニングにおける明示的な数値前処理の役割は、いまだにあまり理解されていない。
本研究では,一様,量子的,標的認識,学習可能な結び目配置の数値的特徴を符号化するための3つのスプラインファミリーについて検討した。
その結果,数値符号化の効果はタスク,出力サイズ,バックボーンに強く依存していることがわかった。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:36:24 GMT)
A Unified Foundation Model for All-in-One Multi-Modal Remote Sensing Image Restoration and Fusion with Language Prompting [3.3] 言語条件付き大規模リモートセンシング復元モデル(LLaRS)を提案する。
LLaRSは、マルチモーダルおよびマルチタスクリモートセンシング低レベルビジョンのための最初の統合基盤モデルである。
実験では、LLaRSは7つの競争モデルより一貫して優れていた。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:33:42 GMT)
Sparsity-Aware Voxel Attention and Foreground Modulation for 3D Semantic Scene Completion [3.3] Voxel sparsityとセマンティックインバランスを明示的にモデル化する統合フレームワークであるVoxSAMNetを提案する。
本研究は,3次元シーンを効率よく正確に仕上げるための空間認識と意味誘導設計の重要性を強調した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:17:31 GMT)
Top-K Retrieval with Fixed-Size Linear-Attention Completion: Backbone- and KV-Format-Preserving Attention for KV-Cache Read Reduction [3.2] 本稿では,背骨重みとKV-cacheフォーマットが変化しない検索-補完アテンションモジュールを提案する。
各クエリに対して、シンク/テールアンカーとクエリ依存のTop-Kトークンについて、正確な注意を計算します。
我々は、非正規化領域における正確な、推定された貢献を加え、単一の正規化を適用し、追加の注意面KV読取を伴わずに、欠落したソフトマックス質量を回復する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 05:19:54 GMT)
Hierarchical Contrastive Learning for Multimodal Data [3.2] 階層的コントラスト学習(Hierarchical Contrastive Learning)は、グローバルに共有され、部分的に共有され、モダリティ固有の表現を学習するフレームワークである。
マルチモーダルな電子健康記録では、HCLはより情報的な表現をもたらし、常に予測性能を改善する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 05:53:04 GMT)
Stochastic Auto-conditioned Fast Gradient Methods with Optimal Rates [3.1] 本稿では,AC-FGMと呼ばれる自動条件付高速勾配法の変種を提案する。
提案手法はリプシッツ定数,地平線,騒音レベルに完全に適応し,適応的なステップサイズ選択と適応的なミニバッチサイズをライン探索なしで実現できる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 23:43:48 GMT)
Indoor Asset Detection in Large Scale 360° Drone-Captured Imagery via 3D Gaussian Splatting [3.0] 本研究では,360度ドローン撮影画像から再構成した3次元ガウス撮影(3DGS)シーンにおいて,対象屋内資産のオブジェクトレベル検出とセグメンテーションを行う手法を提案する。
マスクのセマンティクスとそれに対応するガウシアンプリミティブの空間情報を利用して多視点マスクアソシエーションと屋内資産検出をガイドする3Dオブジェクトコードブックを提案する。
2つの大きな屋内シーンの実験では、信頼性の高いマルチビューマスクの一貫性が示され、最先端のベースラインよりもF1スコアが65%向上し、正確なオブジェクトレベル3D屋内アセット検出が可能となり、ベースライン法よりも11%のmAPゲインが達成された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 01:36:50 GMT)
PhageBench: Can LLMs Understand Raw Bacteriophage Genomes? [2.9] 細菌ファージは微生物の生態系の調節や抗生物質の代替に重要な役割を果たしている。
PhageBenchは、バイオインフォマティクスの専門家のワークフローを反映してファージのゲノム理解を評価するために設計された最初のベンチマークである。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:14:23 GMT)
SparseOIT: Improving Order-Independent Transparency 3DGS via Active Set Method [2.9] 3DGSは、非ランバーティアンまたは透明な材料を持つオブジェクトには適さないボリュームレンダリングを使用する。
OITに基づく3DGS再構成アルゴリズムであるSparseOITを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 06:04:37 GMT)
Reasoning-Guided Grounding: Elevating Video Anomaly Detection through Multimodal Large Language Models [2.9] ビデオ異常検出(VAD)は、伝統的にバイナリ分類または外れ値検出としてフレーム化されてきた。
本稿では,異常分類,空間的接地,思考の連鎖的推論を統一するフレームワークであるVANGUARDを提案する。
UCF-Crimeでは、VANGUARDは94%のROC-AUCを84%のF1で達成し、同時に解釈可能な連鎖説明と異常物体の空間的接地を生成する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 20:15:15 GMT)
Towards Trustworthy Report Generation: A Deep Research Agent with Progressive Confidence Estimation and Calibration [2.8] 本稿では,レポート生成パイプライン内でのプログレッシブな信頼度推定とキャリブレーションを取り入れた新しいディープリサーチエージェントを提案する。
実験結果とケーススタディにより,本手法は解釈可能性を大幅に向上し,ユーザ信頼を著しく向上させることが示された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:46:26 GMT)
Algorithmic Monoculture and its Critics [2.7] アルゴリズムによる意思決定は、雇用、貸与、刑事司法などの領域における慣用的な人間の判断を置き換える。
多くの学者はアルゴリズムによるモノカルチャーの危険性に注意し、ドメイン全体にわたるすべての決定は単一のアルゴリズムを用いて行われる。
我々は,モノカルチャーに対する異論を体系的に評価し,新しい批判とともに親しみやすい批判を形式化し,厳格に評価する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:38:03 GMT)
Distributed Interpretability and Control for Large Language Models [2.7] 本稿では,マルチGPU言語モデルにスケールする,アクティベーションレベルの解釈可能性(ロジットレンズ)とステアリング(ステアリングベクトル)の実践的実装を提案する。
本システムでは,同一ハードウェア上のベースラインと比較して,アクティベーションメモリを最大7倍にし,スループットを最大41倍に向上する設計選択を実装している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 21:35:08 GMT)
How LLMs Follow Instructions: Skillful Coordination, Not a Universal Mechanism [2.6] 命令追従は普遍的なメカニズムや構成スキルの展開に依存するかを検討する。
すべてのタスクにわたって訓練された一般的なプローブは、限定的な表現共有を示す、タスク固有のスペシャリストを一貫して過小評価している。
時間的分析では、制約満足度は前世代計画ではなく、世代間動的監視として機能している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:12:52 GMT)
Exploring bosonic bound states with parallel reaction coordinates [2.5] 境界状態は、量子系がバンドギャップを持つ貯水池と強く結合されたときに生じる散逸耐性状態である。
我々は,境界状態の存在を正確に解けるボソニックモデルの解析を行い,これらの結果をスーパーシステムの弱い結合処理により再現する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:23:46 GMT)
Deep Researcher Agent: An Autonomous Framework for 24/7 Deep Learning Experimentation with Zero-Cost Monitoring [2.4] textbfDeep Researcher Agentは,大規模言語モデル(LLM)エージェントが時計周辺で自律的にディープラーニング実験を行うことを可能にする,オープンソースのフレームワークである。
論文作成やコード生成に重点を置く既存のAI研究アシスタントとは異なり、私たちのシステムは仮説形成、コード実装、トレーニング実行、結果分析、反復的洗練という、完全な実験ライフサイクルに対処しています。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:16:31 GMT)
Late Breaking Results: Hardware-Efficient Quantum Reservoir Computing via Quantized Readout [2.2] 本稿では,Chebyshev機能符号化,ブロックワークの絡み合い,単一および2キュービットパウリ測定を併用した,固定・未学習量子回路に基づく,ハードウェア効率のよい量子貯留層計算フレームワークを提案する。
本研究では,FP32ベースラインの1%以内の予測精度を8ビット,6ビットの量子化で維持し,それぞれリードアウトメモリを75%,81%削減した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:55:41 GMT)
Leveraging Image Editing Foundation Models for Data-Efficient CT Metal Artifact Reduction [2.2] 高減衰インプラントによる金属人工物は、CT画像の品質を著しく低下させる。
本稿では,文脈内推論タスクとしてアーティファクトリダクションのフレーミングというパラダイムシフトを提案する。
提案手法は16対128対のトレーニング例のみで有効なアーティファクト抑制を実現する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:32:25 GMT)
Bivariate Causal Discovery Using Rate-Distortion MDL: An Information Dimension Approach [2.2] 我々は,現状のMDLに基づく手法が原因変数の記述長を推定する問題に正しく対処していないことを論じる。
速度歪み理論に基づいて, 基礎となる分布の歪みレベルを表すのに必要な最小速度に対応する, 原因の記述長を測定する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:01:49 GMT)
BiMind: A Dual-Head Reasoning Model with Attention-Geometry Adapter for Incorrect Information Detection [2.2] 本稿では、知識強化推論からコンテンツ内部推論を遠ざけるために、双頭推論フレームワークBiMindを提案する。
i)トークン条件のオフセットを通したアテンションロジットを緩和し、アテンション崩壊を緩和するアテンションジオメトリアダプタ、(ii)kNN検索を通じてドメイン内セマンティックメモリを構築し、特徴量線形変調により取得した隣人を注入する自己検索ナレッジメカニズム、(iii)エントロピーゲート融合とトレーニング可能なアテンションヘッドを含む不確実性を考慮した融合戦略、。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:19:39 GMT)
GraspSense: Physically Grounded Grasp and Grip Planning for a Dexterous Robotic Hand via Language-Guided Perception and Force Maps [2.2] 5本の指を持つロボットハンドにおいて,選択と力の調節を把握するためのパイプラインを提案する。
オペレーターコマンドから、システムはターゲットオブジェクトを特定し、SAM3Dを使って3D形状を再構成し、モデルをIsaac Simにインポートする。
物理インフォームド幾何解析は、各表面位置で許容される最大横接触力を符号化する力マップを計算する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 10:48:33 GMT)
Automated Auditing of Hospital Discharge Summaries for Care Transitions [2.1] 大規模言語モデル(LLM)を用いた退院サマリーの大規模監査のためのフレームワークを提案する。
提案手法は, コア・オブ・ケア要件を, DISCHARGEDフレームワークに基づく質問の構造化された検証チェックリストとして運用する。
この研究は、スケーラブルで自動化された臨床監査の実現可能性を示し、電子健康記録文書の体系的な品質改善の基礎を提供する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 05:04:00 GMT)
Transformer See, Transformer Do: Copying as an Intermediate Step in Learning Analogical Reasoning [2.1] メタラーニング(Meta-Learning for compositionality, MLC)を用いて, 類似推論タスクでトランスフォーマーを訓練する。
我々は,最も情報に富む問題要素にモデルを導く際に,文字文字列の類推が学習可能となることを発見した。
私たちの3層エンコーダデコーダモデルは、ほとんどのフロンティアモデルより優れています。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 22:15:56 GMT)
LanG -- A Governance-Aware Agentic AI Platform for Unified Security Operations [2.1] 本稿では,LLM支援ネットワークガバナンス(LanG)について述べる。
プラットフォームはマルチテナントアイソレーション、ロールベースのアクセス、完全にローカルなデプロイメントをサポートする。
精密な異常検出と脅威検出は、侵入検出ベンチマークでそれぞれ99.0%と91.0%の重み付きF1スコアを達成する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 05:22:25 GMT)
EEG-MFTNet: An Enhanced EEGNet Architecture with Multi-Scale Temporal Convolutions and Transformer Fusion for Cross-Session Motor Imagery Decoding [2.1] 脳波(EEG)からの運動画像(MI)復号は、ノイズと断続的変動のため、依然として困難である。
本稿では,EEGNetアーキテクチャに基づく新しいディープラーニングモデルであるEEG-MFTNetを紹介する。
EEG-MFTNetは計算複雑性と推論遅延を低く保ちながら、平均分類精度58.9%を達成する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:10:34 GMT)
3DTurboQuant: Training-Free Near-Optimal Quantization for 3D Reconstruction Models [2.1] 既存の3Dコンストラクタ圧縮方法は、シーンごとの微調整を通じてデータ依存のコードブックを学習する必要がある。
これらのモデルにおける記憶を支配しているパラメータベクトルは、単一のランダム回転が任意の入力を既知のベータ分布の座標に変換する次元範囲に該当する。
我々は,(1)どのパラメータを量子化して,どのビット幅で実験を行うことができるかを予測する次元依存的基準,(2)量子化MSEとシーン毎のレンダリングPSNRを接続するノルム分離境界,(3)回転ベースの量子化を拡張したエントリグループ化戦略を導出する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:06:05 GMT)
On the Role of Fault Localization Context for LLM-Based Program Repair [2.1] どの程度のローカライズが必要か、予測されたバギーロケーション以外の追加コンテキストが有用か、どのようにしてそのようなコンテキストを検索すべきかは、不明である。
GPT-5-miniを用いて,ファイルレベル,要素レベル,行レベルの異なる61のコンフィグレーションを評価し,500のSWE-bench検証インスタンスを大規模に検討した。
以上の結果から, 補修性能が常に向上していないことが示唆された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 06:21:55 GMT)
MedLayBench-V: A Large-Scale Benchmark for Expert-Lay Semantic Alignment in Medical Vision Language Models [2.0] MedLayBench-Vは、エキスパート・レイ・セマンティックアライメントに特化した最初の大規模マルチモーダル・ベンチマークである。
MedLayBench-Vは、臨床専門家と患者の間のコミュニケーションの分断をブリッジできる次世代のMed-VLMの訓練と評価のための検証された基盤を提供する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 11:39:41 GMT)
SmokeGS-R: Physics-Guided Pseudo-Clean 3DGS for Real-World Multi-View Smoke Restoration [2.0] 現実世界の煙はシーンの放射率を同時に減らし、エアライトを追加し、マルチビューの外観の整合性を不安定にする。
我々は NTIRE 2026 3D Restoration and Reconstruction Track 2 チャレンジのために開発された実用的なパイプラインである textbfSmokeGS-R を提示する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 01:15:05 GMT)
MechELK: A Mechanistic Interpretability Framework for Eliciting Latent Knowledge in Large Language Models [2.0] textbfMechELKは,潜伏知識の活用のための3段階統合フレームワークである。
MechELKは平均浸出精度84.7%で6.2%、直線型探査9.1%を上回っている。
重要なことに、MechELKは、モデル表面の出力が誤りまたは回避されている78.3%のケースにおいて、潜伏した知識を識別することに成功した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:05:06 GMT)
A Multi-Stage Validation Framework for Trustworthy Large-scale Clinical Information Extraction using Large Language Models [1.9] 大規模言語モデル(LLM)は、非構造化の健康記録から臨床的に意味のある情報を抽出する約束を示す。
LLMに基づく臨床情報抽出のための多段階検証フレームワークを提案する。
919,783名の臨床ノートから11種類の物質分類で診断された物質使用障害の抽出に本枠組みを適用した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:23:52 GMT)
Hidden in the Multiplicative Interaction: Uncovering Fragility in Multimodal Contrastive Learning [1.9] ゲイト・シミュレイル(Gated Symile)は、注意に基づく、候補者ごとのモダリティ貢献を適応する対照的なゲーティング機構である。
Gated Symileは、よく調整されたSymileやCLIPモデルよりも高いトップ1検索精度を実現する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:03:30 GMT)
Transfer Learning for Neural Parameter Estimation applied to Building RC Models [1.9] 本稿では,動的システムにおけるパラメータ推定のための伝達学習パラダイムを提案する。
その結果、データトレーニングはわずか12日間で186-24.0%改善した。
提案手法は力学系におけるパラメータ推定のパラダイムを表す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:07:13 GMT)
Operator Learning for Surrogate Modeling of Wave-Induced Forces from Sea Surface Waves [1.9] 波のセットアップは、波によるエネルギーを電流に伝達し、水位上昇を引き起こす重要な役割を担っている。
従来の数値波モデルは複雑で計算コストが高い。
本研究では,Deep Operator Networks (DeepONets) をシミュレーションWAves Nearshore数値波モデルの代用として利用する方法について検討する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 20:16:04 GMT)
SemLink: A Semantic-Aware Automated Test Oracle for Hyperlink Verification using Siamese Sentence-BERT [1.6] Webアプリケーションは、異なる情報リソースを接続するためにハイパーリンクに大きく依存します。
HTTPステータスコードをチェックすることで、主にクラッシュオラクルとして機能する従来の検証ツールは、セマンティックな不整合を検出するのに失敗することが多い。
本稿ではセマンティックハイパーリンク検証のための新しい自動テストオラクルであるSemLinkを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 11:10:33 GMT)
LUDOBENCH: Evaluating LLM Behavioural Decision-Making Through Spot-Based Board Game Scenarios in Ludo [1.6] LudoBenchは、マルチエージェントボードゲームであるLudoにおける戦略的推論を評価するためのベンチマークである。
LudoBenchは、12の行動的に異なる決定カテゴリにわたる480の手作りのスポットシナリオで構成されている。
全てのモデルはゲーム理論のベースラインと一致しており、その40-46%しか使われていない。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 10:34:13 GMT)
A Modular Architecture for Typologically Controlled Lexicon Generation [1.6] PHOIBLEは、発音可能で、タイプミス的、意味的に構造化された人工レキシコンを構築するためのフレームワークである。
確率文法は、音韻的コヒーレンスとタイプロジカルリアリズムの両方に基づいて決定論的およびランダムなベースラインを一貫して上回る。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 04:23:47 GMT)
The Biggest Risk of Embodied AI is Governance Lag [1.5] 具体化されたAIは、ガバナンスシステムが観察、解釈、応答できるものよりも早く、製造、物流、ケア、インフラストラクチャにわたってスケールする可能性がある、と私たちは主張する。
したがって、中央の政策課題は自動化だけではありませんが、ガバナンスとコンプライアンスシステムが混乱する前に適応できるかどうかです。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:56:14 GMT)
iPhoneme: Brain-to-Text Communication for ALS Using ConformerXL Decoding [1.5] ALS患者のための脳とテキストのコミュニケーションシステム iPhoneme について述べる。
このシステムは、深層学習音素デコーダと、視線支援音素入力インタフェースを組み合わせる。
インタラクションの面では、iPhonemeは、居住時間選択を代替するコード付きガウン+サイレント音声パラダイムを導入している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 05:08:27 GMT)
AI-Augmented Peer Review and Scientific Productivity: A Cross-Country Panel and SEM Analysis [1.5] 本研究は,OECD諸国のパネルデータを用いて,AIによるピアレビューシステムが科学的生産性に与える影響について検討する。
我々は,AIレビュー能力指数(AIRC)を新たに構築し,その研究生産性,イノベーション,アウトプットへの影響について検討する。
その結果,AIRCの標準偏差増加は18~25%の科学的生産性の増加と関連していることがわかった。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 05:56:09 GMT)
RK-MPC: Residual Koopman Model Predictive Control for Quadruped Locomotion in Offroad Environments [1.5] Residual Koopman MPC (RK-MPC) はデータ駆動型モデル予測制御フレームワークである。
RK-MPCは、昇降座標のデータから学習したコンパクトな線形残留予測器を備えた名目テンプレートモデルを強化する。
RK-MPCは、非構造化環境における四重項のデータ駆動予測制御のための実用的なハードウェア検証経路を提供する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 21:39:59 GMT)
T2T: Captioning Smartphone Activities Using Mobile Traffic [1.4] T2T(Traffic-to-Text)と呼ばれる新しいスマートフォン活動キャプションシステムについて紹介する。
T2Tは、低レベルのトラフィック特性を有意義な潜在特徴に変換するフロー特徴エンコーダと、読みやすい書き起こしを生成するキャプションデコーダから構成される。
実世界の2つの環境で収集された4万のトラフィック記述ペアに対するT2Tの評価を行った。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:44:27 GMT)
Turbulence-like 5/3 spectral scaling in contextual representations of language as a complex system [1.4] 埋め込みステップ信号を用いてトークン列に沿ったスケール依存変動を定量化する。
複数の言語とコーパスにまたがって、結果として生じるパワースペクトルは、5/3$に近い指数を持つ堅牢なパワー法則を示す。
乱流におけるコルモゴロフスペクトルの類似により, 意味情報は言語規模にわたって, スケールフリーで自己相似的な方法で統合されていることが示唆された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:36:12 GMT)
MEC: Machine-Learning-Assisted Generalized Entropy Calibration for Semi-Supervised Mean Estimation [1.4] 予測駆動推論(PPI)は、小さなラベル付きサンプルでトレーニングされた機械学習予測器を利用して効率を向上させる。
機械学習支援型汎用エントロピー(MEC)は,PPIのクロスフィット・キャリブレーション重み付き変種である。
MECはラベル付きサンプルを再重み付けすることで効率を向上させる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 05:30:11 GMT)
LAG-XAI: A Lie-Inspired Affine Geometric Framework for Interpretable Paraphrasing in Transformer Latent Spaces [1.4] 本稿では,埋め込み空間内の構造的アフィン変換としてパラフレージングをモデル化する幾何学的フレームワークであるRAG-XAIを紹介する。
Sentence-BERTでエンコードされた、ノイズの多いPIT-2015 Twitterコーパスの実験は、"線形透明性"現象を明らかにしている。
このモデルは、非線形ベースラインの効果的な分類能力(AUC 0.8405)の約80%を捕捉し、絶対精度の限界降下と引き換えに明確な解釈性を提供する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:02:21 GMT)
AI Assistance Reduces Persistence and Hurts Independent Performance [1.4] AIアシストによる2つの重要な結果の証拠を提供する。
AIアシストは短期的にはパフォーマンスを改善するが、AIなしでは人々は著しくパフォーマンスが悪くなり、諦める可能性が高くなる。
これらの結果は、AIモデル開発が、即時タスク完了と同時に長期的な能力の優先順位付けの必要性を示唆している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:41:15 GMT)
Algebraic Diversity: Group-Theoretic Spectral Estimation from Single Observations [1.4] グループ平均推定器を1つのスナップショットから推定し,同値な部分空間分解とマルチスナップショット共分散推定を実現する。
我々はこれらの結果を任意の統計量に拡張し、分散は有効群順序$d_mathrmeff$によって支配される。
このフレームワークは内容よりも$structure$の情報(データオブジェクトの表現論的対称性)を活用し、シャノンの理論を補完する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 20:01:11 GMT)
Unpacking .zip: A First Look at Domain and File Name Confusion [1.3] DNS/ファイル名混同がどのように悪用されるかの最初の例を提供する。
次に,野生におけるDNS/ファイル名混同の事例研究を行った。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:31:38 GMT)
Value Mirror Descent for Reinforcement Learning [1.3] 強化学習(RL)におけるほぼ最適な値関数を計算するための値反復型手法が広く研究されている。
本稿では,状態空間S,行動空間A,割引係数$in(0,1)$,コスト$[0,1]$の割引決定プロセスを検討する。
本稿では、凸マルコフの古典的値フレームワークからのミラー降下を統合した新しい値最適化手法、VMDを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:34:16 GMT)
Occlusion Handling by Pushing for Enhanced Fruit Detection [1.2] この研究は、果実の視界を阻害する枝を駆除し、その視界を高めることを目的としている。
我々は,RGB画像中の隠蔽果実を検出し,その隠蔽部位を深度空間のディープラーニング生成モデルを用いて推定する。
本手法では,果実の外観推定にはディープラーニング,プッシュ方向決定には古典的画像処理,分岐検出には3次元ハフ変換を用いる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:21:04 GMT)
Inertial Mining: Equilibrium Implementation of the Bitcoin Protocol [1.1] ワーキング・オブ・ワークの暗号通貨の価値は、プロトコルに従うインセンティブを持つ鉱山労働者に依存している。
我々は新しい鉱業プロトコルである慣性鉱業を提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:06:02 GMT)
Hybrid ResNet-1D-BiGRU with Multi-Head Attention for Cyberattack Detection in Industrial IoT Environments [1.1] 本研究では,産業用IoTシステムにおける侵入検出のためのハイブリッドディープラーニングモデルを提案する。
ResNet-1D、BiGRU、Multi-Head Attention(MHA)を組み合わせて、効果的な時空間特徴抽出と注目に基づく特徴重み付けを行う。
このモデルは98.71%の精度、0.0417%の損失、低い推論遅延(0.0001 sec/instance)を達成し、強力なリアルタイム能力を示した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 21:32:03 GMT)
CAKE: Cloud Architecture Knowledge Evaluation of Large Language Models [1.1] CAKEは、ブルームの改訂された分類学の4つの認知レベルに関する188人の専門家による検証された質問で構成されている。
マルチチョイス質問(MCQ)とフリーレスポンス(FR)のためのLCM-as-a-judgeスコア(FR)を併用した22種類のモデル構成の評価を行った。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 11:56:43 GMT)
UGAF-ITS: A Standards Harmonization Framework and Validation Tool for Multi-Framework AI Governance in Distributed Intelligent Transportation Systems [1.1] UGAF-ITSは、154のソース義務を8つのガバナンスドメインで12の統一されたコントロールに統合する標準調和フレームワークである。
3層運用モデルでは、各制御を車両、エッジ、またはクラウド層に割り当てる。
20バージョンのアーティファクトのエビデンスバックボーンは、3つのフレームワークすべてに1つの監査パッケージをサポートしている。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:37:05 GMT)
Noise is not always detrimental: the capacity of quantum batteries is enhanced in black holes [1.0] ホーキング放射と環境騒音による量子バッテリ容量の変調について検討する。
ホーキング放射が電池容量を増強し、エネルギー貯蔵に肯定的な影響を及ぼすという直感的現象が発見された。
これらの知見は、非慣性参照フレームにおける量子バッテリの理論に新たな視点を与える。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 01:55:15 GMT)
CUE-R: Beyond the Final Answer in Retrieval-Augmented Generation [1.0] CUE-Rは、単発RAGにおいて、エビデンス単位の操作性を測定するためのフレームワークである。
CUE-RはREMOVE、REPLACE、DUPLICATE演算子を介して個々の証拠項目を摂動し、3つのユーティリティ軸に沿って変化を測定する。
その結果,回答のみの評価は重要なエビデンス効果を見逃し,介入に基づくユーティリティ分析がRAG評価の実践的補完となることが示唆された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 06:05:08 GMT)
SymptomWise: A Deterministic Reasoning Layer for Reliable and Efficient AI Systems [1.0] 本稿では,言語理解と診断的推論を分離するフレームワークであるSyptomWiseを紹介する。
このシステムは、専門家による医療知識、決定論的コーデックス駆動推論、および大規模言語モデルの制約付き使用を組み合わせる。
このアーキテクチャはトレーサビリティを改善し、不要な結論を減らし、システムコンポーネントのモジュラー評価を可能にする。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:00:53 GMT)
Estimation of trace distance between two arbitrary quantum states [1.0] 密度行列の指数化と改良量子位相推定(IQPE)に基づく量子アルゴリズムを提案する。
我々は,IBMの量子コンピュータ上での量子ハードウェア計算や証明原理シミュレーションを用いて,その量を予測する能力を示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:29:37 GMT)
Blockchain and AI: Securing Intelligent Networks for the Future [0.9] Internet of Everything(IoE)パラダイムの下でのインテリジェントネットワークの急速な進化は、接続性を変えることです。
この章では、インテリジェントネットワークを保護するための補完的なアプローチとして、人工知能(AI)の統合について検討する。
並行してAIは、予測分析、異常検出、アダプティブディフェンス機能を提供し、プロアクティブな脅威識別と緩和を可能にする。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:00:40 GMT)
Database Querying under Missing Values Governed by Missingness Mechanisms [0.9] リレーショナルデータベース(RDB)に意味論を与え,クエリ応答(QA)を行うことの問題点に対処する。
後者の原因は、ベイズネットワークとしてモデル化されたミスティングネスメカニズムによって管理されている。
本稿では,MVの暗黙的計算の確率的不確実性と統計的妥当性を両立する2つのQA手法を提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 23:22:24 GMT)
DQA: Diagnostic Question Answering for IT Support [0.9] DQAは、永続的な診断状態を維持し、検索された症例を個々の文書よりも根本原因のレベルに集約する診断質問応答フレームワークである。
我々は、リプレイベースのプロトコルを用いて、150の匿名化されたエンタープライズITサポートシナリオ上で、DQAを評価する。DQAは、3回の独立した実行で、軌道レベルの成功基準の下で78.7%の成功率を達成し、マルチターンRAGベースラインでは41.3%、平均ターンは8.4から3.9に減少する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 02:42:32 GMT)
Emergent social transmission of model-based representations without inference [0.9] 社会的学習の最小化がいかに間接的に高いレベルの表現を伝達できるかを示す。
我々は、再構成可能な環境で報酬を求めるナビエージェントをシミュレートする。
これらの手がかりが学習者の経験に偏りがあることを示し、その表現を専門家のものに収束させる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:14:27 GMT)
Limits of Difficulty Scaling: Hard Samples Yield Diminishing Returns in GRPO-Tuned SLMs [0.9] 確率質量をより良い解へシフトさせることにより、選好最適化が推論を改善することを示す。
GRPOのトレーニングは、難易度をまたいだ全データセットの精度に適合するが、45%のトレーニングステップしか使用していない。
GSM8KトレーニングされたGRPOは、MATHトレーニングされたGRPOよりもMATHの数値サブセットの方が精度が高く、1.5Bで5%、3Bで3%を超える。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:22:18 GMT)
FairLogue: Evaluating Intersectional Fairness across Clinical Machine Learning Use Cases using the All of Us Research Program [0.6] All of Usデータセットを使用して、レプリケーションと評価のために2つの機械学習モデルが選択された。
観察的公正度は、人種、性別、交差するサブグループで計算され、続いて反事実分析が行われた。
結果は、交差フェアネス監査の重要性を強調し、FairLogueが機械学習システムのバイアスに対する深い洞察を提供する方法を示している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:50:10 GMT)
Beyond the Beep: Scalable Collision Anticipation and Real-Time Explainability with BADAS-2.0 [0.6] 衝突予測システムの第2世代であるBADAS-2.0を提示する。
BADAS-1.0上に構築され、大規模なエゴ中心のダッシュカムデータに基づくV-JEPA2の微調整が学術ベースラインとADASシステムの両方より優れていることを示した。
BADAS-2.0は、予測の背後にある証拠をローカライズするリアルタイムなオブジェクト中心の注目ヒートマップを生成する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:10:21 GMT)
A Digital Spreading Framework for Quantum Expectation Computation Without Rotation Gates or Arithmetic Circuits [0.6] Digital Spreading (DS)は、このトレードオフを解決するために設計された完全なデジタル量子コンピューティングフレームワークである。
DSは相対誤差0.0001%の浮動小数点精度を達成し、JP Morganの回転法より優れている。
全体として、DSは量子重み付け平均計算のためのコンパクトで堅牢で正確なフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 05:37:31 GMT)
Calibration of a neural network ocean closure for improved mean state and variability [0.5] 我々は,2つの理想的な海洋モデルにおけるメソスケール渦のニューラルネットワークパラメータ化のパラメータを粗い解像度で最適化する。
キャリブレーションパラメータ化は, 平均流体界面の誤差と変動率を約2倍に低減する。
これらの結果から, 体系的なキャリブレーションにより, 粗大分解能海洋シミュレーションを大幅に改善できることが示唆された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:32:25 GMT)
SAND: The Challenge on Speech Analysis for Neurodegenerative Disease Assessment [0.5] 臨床医と機械学習の専門家による多部門共同研究の結果を報告する。
SAND(Speech Analysis for Neurodegenerative Diseases)課題は、ALS疾患の早期発見と予測のためのAIモデルを開発、テスト、評価する機会を提供する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:24:13 GMT)
Application-Driven Pedagogical Knowledge Optimization of Open-Source LLMs via Reinforcement Learning and Supervised Fine-Tuning [0.5] 本稿では,大規模言語モデル(LLM)の教育的知識を高めるために,強化学習(RL)と教師付き微調整(SFT)を組み合わせた革新的な多段階最適化戦略を提案する。
EduQwen 32B-RL1、EduQwen 32B-SFT、EduQwen 32B-SFT-RL2は、密度の高いQwen3-32Bのバックボーン上に構築されたオープンソースの教育用LLMのアプリケーション駆動ファミリである。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:16:50 GMT)
Who Governs the Machine? A Machine Identity Governance Taxonomy (MIGT) for AI Systems Operating Across Enterprise and Geopolitical Boundaries [0.5] 人工知能のガバナンスには盲点がある。
未処理の自動化エージェントが2024年のCrowdStrike障害で54-10億ドルの損失を出した。
シルク・タイフーンやソルト・タイフーンなどの国家的アクターは、未処理のマシン認証を一次スパイベクターとして運用している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:51:56 GMT)
Distributions of Noisy Expectation Values over Sets of Measurement Operators [0.4] 量子状態がランダムに分布する場合、その期待値もランダムに分布する。
本研究では,局所偏極雑音を用いたシミュレーションHaarランダム量子回路の実験的分布を構築した。
最適モデルパラメータはまた、回路深さやノイズスケールとともに滑らかで一貫して変化する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 15:05:14 GMT)
Gradual Cognitive Externalization: From Modeling Cognition to Constituting It [0.4] 開発者は、同僚のコミュニケーションスタイルを再現したり、監督者のメンタリングをエンコードしたり、人間の行動レパートリーを生物学的死を超えて保持するAIエージェントスキルを公開している。
本稿では,認知機能のモデル化からユーザ認知アーキテクチャの一部を構成する環境AIシステムへの移行を議論するフレームワークであるGradual Cognitive externalization(GCE)を提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:27:39 GMT)
Kinetic Uncertainty Relation in Collective Dissipative Quantum Many-Body Systems [0.4] 集合散逸中の多体系の運動的不確実性関係を解析的に定式化する。
平均場近似を適用することにより、明快な物理量で表される相対的ゆらぎに対する下界を導出する。
我々の研究は、任意の粒子数$N$に対する集合散逸的量子多体系における精度境界の最初の理論的記述を提示する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 11:46:18 GMT)
Adaptive Differential Privacy for Federated Medical Image Segmentation Across Diverse Modalities [0.4] 医用画像セグメンテーションのための適応型偏微分プライベート・フェデレーション学習フレームワークを提案する。
提案手法はトレーニングを安定化し、Diceスコアとセグメンテーション境界品質を大幅に改善し、厳格なプライバシー保証を維持する。
ADP-FLは従来のフェデレーション学習と標準的な差分的フェデレーション学習と比較して、高い精度、境界線線の改善、より高速な収束、より優れたトレーニング安定性を実現している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 23:18:20 GMT)
A global dataset of continuous urban dashcam driving [0.3] CROWDは、通常の、微小なスケール、時間的に連続した、未編集の、フロント対面の都市ダッシュカムセグメントの、手動でキュレートされたデータセットである。
このリリースには、20,275.56時間 (42,032ビデオ) にまたがる51,753のセグメンテーション記録が含まれており、238か国に7,103の名前を冠している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:42:53 GMT)
Optimal-Transport-Guided Functional Flow Matching for Turbulent Field Generation in Hilbert Space [0.3] 乱流の高忠実度モデリングには複雑な力学と多スケール断続性が必要である。
無限次元関数空間で直接定義される生成フレームワークであるFOT-CFM(Functional Optimal Transport Conditional Flow Matching)を提案する。
FOT-CFMは、最先端のベースラインに比べて高次乱流統計とスペクトルエネルギーの再現において優れた忠実性を達成する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 10:53:37 GMT)
CritBench: A Framework for Evaluating Cybersecurity Capabilities of Large Language Models in IEC 61850 Digital Substation Environments [0.3] CritBenchは、LLM(Large Language Models)のサイバーセキュリティ機能を評価するために設計された、新しいフレームワークである。
OpenAIのGPT-5スイートやオープンウェイトモデルを含む5つの最先端モデルについて、81のドメイン固有タスクのコーパスで評価する。
実験の結果、エージェントは静的な構造化ファイル解析とシングルツールネットワーク列挙を確実に実行するが、その性能は動的タスクで劣化することがわかった。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:16:59 GMT)
Transient Non-Use: How People in Migration Experience Digital Disconnection [0.3] 本稿では,情報通信技術が移動時に意図的に回避されるか,維持されないか,あるいは使用されないかを検討する。
デバイス、情報、保護的非使用を含む、さまざまな非使用体験を特定します。
分析の結果,非使用機能は保護戦略であり,全身排除に対する応答であることがわかった。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:34:56 GMT)
SoK: Understanding Anti-Forensics Concepts and Research Practices Across Forensic Subdomains [0.3] 反法医学はあいまいであり、その使用には相容れない。
研究実践の適切性や分野自体の正当性に関する倫理的な課題を提起する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:12:53 GMT)
Severity-Aware Weighted Loss for Arabic Medical Text Generation [0.3] 本稿では,医学的苦情応答データに基づく微調整アラビア語モデルの重み付き損失を提案する。
MAQAデータセットを用いて実験を行い、アラビア人の医療的苦情と信頼できる人間の反応を提供する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:26:41 GMT)
A Severity-Based Curriculum Learning Strategy for Arabic Medical Text Generation [0.3] 本研究は、アラビア医学テキスト生成のための重症度に基づくカリキュラム学習戦略を導入する。
トレーニングプロセスは、より厳しい状態からより重要な医療条件へと徐々に移動するように構成されている。
提案手法は,医療用アラビア質問回答データセットのサブセットを用いて評価する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:41:53 GMT)
Loss-aware state space geometry for quantum variational algorithms [0.2] 結果空間の内在幾何学を考慮に入れた一般最適化原理を導入する。
得られたオプティマイザを、変分量子回路の例や古典的ニューラルネットワークの課題でベンチマークする。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:28:55 GMT)
Extending ZACH-ViT to Robust Medical Imaging: Corruption and Adversarial Stress Testing in Low-Data Regimes [0.2] ZACH-ViT (Zero-token Adaptive Compact Hierarchical Vision Transformer) は、医療画像用のコンパクトな置換不変ビジョントランスである。
本稿では,ZACH-ViTの強靭性に着目した最初の拡張法について述べる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:11:07 GMT)
Instantaneous Planning, Control and Safety for Navigation in Unknown Underwater Spaces [0.2] 未知の環境で自律型水中車両(AUV)を航行することは極めて困難である。
これらの要因は、正確なグローバルローカライゼーション、信頼性の高い通信、障害物回避において課題を提起する。
本研究では,実時間センサデータを利用して閉ループAUV軌道を動的に誘導する統合計画制御フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 01:32:29 GMT)
Choosing the Right Regularizer for Applied ML: Simulation Benchmarks of Popular Scikit-learn Regularization Frameworks [0.2] 134,400のシミュレーションで、Rook、Lasso、ElasticNet、Post-Lasso OLSの4つの標準フレームワークのパフォーマンスを実証的に評価した。
サンプル/フィール比が十分である場合の予測精度では、Ride、Lasso、ElasticNetはほぼ交換可能である。
サンプルサイズが小さいカッパでLassoまたはPost-Lasso OLSの使用を推奨する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:44:33 GMT)
Symmetrizing Bregman Divergence on the Cone of Positive Definite Matrices: Which Mean to Use and Why [0.2] 平均汎関数の集合上での所望の対称性分岐を最小化することにより、対称性化の正準手段を計算できることが示される。
この結果を実際に用いられる3つの共通ミラーマップに適用すると、逆対称性化の正準手段が算術、対数ユークリッド、調和手段であることが分かる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:19:44 GMT)
FRENCH-YMCA: A FRENCH Corpus meeting the language needs of Youth, froM Children to Adolescents [0.1] 我々は、子供や青年に特化された新しい言語資源である、フレンチYMCAコーパスを紹介する。
39,200のテキストファイルが収集され、フランス語とYMCAのコーパスには合計22,471,898の単語が含まれている。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:04:30 GMT)
Training Without Orthogonalization, Inference With SVD: A Gradient Analysis of Rotation Representations [0.1] トレーニングループからSVDを除去すると勾配方向誤差が回避されることを示す。
また、6次元グラムシュミット・ヤコビアンが非対称スペクトルを持つことを証明し、なぜ9次元パラメータ化が好ましいのかを説明する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 04:19:18 GMT)
One-to-one correspondence between Hierarchical Equations of Motion and Pseudomodes for Open Quantum System Dynamics [0.1] 我々は、強減衰非マルコフ的開量子力学に対する最も広く使われているアプローチの2つを結合する。
まず、N$指数項の和として記述できるすべての物理バス相関関数(BCF)は、物理モデルから得られる。
第二に、そのようなすべてのBCFに対して、系-擬モデ状態のHEOM階層への進化を反映する非単項線型変換が存在する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 21:08:53 GMT)
Stories of Your Life as Others: A Round-Trip Evaluation of LLM-Generated Life Stories Conditioned on Rich Psychometric Profiles [0.1] パーソナリティの特徴は、自然言語で十分にエンコードされている。
人文で訓練された大きな言語モデル(LLM)は、ペルソナの記述に条件付けされたときに性格をシミュレートすることができる。
本研究では,人体実験の信頼性に迫るレベルにおいて,生成した物語から人格スコアを復元できることを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:51:50 GMT)
SELFDOUBT: Uncertainty Quantification for Reasoning LLMs via the Hedge-to-Verify Ratio [0.0] 言語モデル推論のための単一パス不確実性フレームワークであるSELFDOUBTを提案する。
私たちのキーシグナルであるHedge-to-Verify Ratio(HVR)は、推論トレースが不確実性マーカーを含むかどうかを検出し、もしそうであれば、明示的な自己チェック行動によってオフセットされているかどうかを検出する。
SELFDOUBTは単一の観測された推論軌道で動作し、任意のプロプライエタリなAPI上でのレイテンシとコスト制約によるデプロイメントに適している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:19:29 GMT)
A High-Accuracy Optical Music Recognition Method Based on Bottleneck Residual Convolutions [0.0] 光音楽認識は、印刷または手書きの楽譜画像を編集可能な記号表現に変換することを目的としている。
本稿では、残差ボトルネック畳み込みと双方向ゲート再帰ユニット(BiGRU)に基づくシーケンスモデリングを組み合わせたエンドツーエンドのOMRフレームワークを提案する。
Camera-PrIMuSとPrIMuSデータセットの実験結果から,提案フレームワークの有効性が示された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:32:16 GMT)
State-of-the-Art Arabic Language Modeling with Sparse MoE Fine-Tuning and Chain-of-Thought Distillation [0.0] Arabic-DeepSeek-R1 はアプリケーション駆動のオープンソース アラビア LLM で、疎い MoE バックボーンを活用し、表現不足の言語におけるデジタルエクイティギャップに対処する。
我々の4段階のCoT蒸留方式は、アラビア語固有の言語的検証と地域倫理規範を3億2200万トンの汚染制御されたアラビア語と英語の訓練混合物に統合します。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:58:26 GMT)
The Role of Emotional Stimuli and Intensity in Shaping Large Language Model Behavior [0.0] 快楽,励まし,怒り,不安という4つの異なる感情の感情的促進効果を探求し,それらを正確性,薬効,毒性で評価する。
我々は,GPT-4oミニを用いたプロンプト生成パイプラインを開発し,4つの感情の異なるLLMと人間生成プロンプトのスイートを作成する。
LLMの行動に関する実証的な評価は、ポジティブな感情刺激がより正確で毒性の低い結果をもたらすことを示唆している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 05:29:13 GMT)
JTON: A Token-Efficient JSON Superset with Zen Grid Tabular Encoding for Large Language Models [0.0] Zen Gridは列ヘッダを1行に分解し、値をドメインでエンコードする。
Rust/PyO3リファレンス実装では,SIMDアクセラレーションによる構文解析が,Pythonの1.4倍の速度で追加されている。
12LLMの生成テストは、少数ショットとゼロショットの両方の設定で100%有効である。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:26:23 GMT)
Zero Trust in the Context of IoT: Industrial Literature Review, Trends, and Challenges [0.0] Zero-trust(ZT)モデルは、デフォルトではいかなるエンティティ(ネットワーク、人、デバイス)にも信頼を与えられるべきではないという考えに依存して、ますます人気が高まっているモデルである。
ZTモデルは、研究と実践の両方から注目を集めており、研究開発と実生活の応用の間に様々なレベルの適応がある。
そのような特定されていない分野の例として、IoT/Smart Peripheral Devices(SPD)の統合がある。
このようなリソースの特異性(おそらくエネルギー/計算能力の低下)、ライフサイクル、およびプラットフォーム全体の利用に強く依存するそれらの利用など、さまざまな理由からこのギャップが説明されている。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:02:17 GMT)
YC Bench: a Live Benchmark for Forecasting Startup Outperformance in Y Combinator Batches [0.0] YC Benchは、YCバッチ内の早期パフォーマンスを予測するためのライブベンチマークです。
YC W26バッチをケーススタディとして、プレデモデイスコアを用いてパフォーマンスを測定した。
ベースラインとして、YC W26アプリケーションの期限前にGoogleが言及しているように、ブランド認識のシンプルなプロキシがあります。
YC Demo Dayでトップパフォーマー11人中6人(リコール:55%)をリコール)
論文参考訳(メタデータ) (Tue, 07 Apr 2026 06:37:21 GMT)
Weakly Supervised Distillation of Hallucination Signals into Transformer Representations [0.0] 大規模言語モデルに対する幻覚検出法は,推論時の外部検証に依存する。
幻覚検出信号は変圧器表現に蒸留でき、推論時に外部の検証なしに内部検出が可能であることを示す。
トランスフォーマーベースのプローブは,5倍平均AUC/F1でM2が,シングルフォールド検証とホールドアウトテスト評価の両方でM3が最善である。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 08:14:48 GMT)
WSCM-Lite: A Practitioner-Ready Implementation of the Weak Signal Cultivation Model [0.0] 本稿では,Wak Signal Cultivation Modelの座標軌道を0.01フィールド単位で再現するルックアップテーブル実装であるWSCM-Liteを紹介する。
この単純化は、4列のルックアップテーブルで連続的な相対性重み付けを置き換え、コンセンサス運動量と逆増幅を完全に除去する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:30:31 GMT)
Towards the Development of an LLM-Based Methodology for Automated Security Profiling in Compliance with Ukrainian Cybersecurity Regulations [0.0] 本稿では,国際的ベストプラクティス,特にISO/IECとNISTサイバーセキュリティフレームワークの国家規制システムへの統合について検討する。
従来のコンプライアンスモデルからリスクベースのアプローチへの移行に重点を置いている。
RetrievalAugmented Generation (RAG)により強化されたLarge Language Models (LLM) を用いたターゲットセキュリティプロファイルの自動作成手法を提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:29:58 GMT)
Topological Characterization of Churn Flow and Unsupervised Correction to the Wu Flow-Regime Map in Small-Diameter Vertical Pipes [0.0] 特徴曲面(ECS)を用いた最初のトポロジに基づく特徴評価手法を提案する。
この研究はチャーンフローの最初の数学的定義を提供し、教師なしトポロジカル記述子は機械学的なモデルに挑戦し修正できることを示した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:59:15 GMT)
Thermal-GEMs: Generalized Models for Building Thermal Dynamics [0.0] トランスファーラーニング(Transfer Learning)は、単一または複数のソース構造に基づく事前訓練されたモデルを採用することで、この課題を軽減する。
一般的なマルチソースTLモデルはシングルソースTLを上回ることを約束する。
時系列基礎モデル(TSFM)は、最高のパフォーマンスの一般モデル候補として登場している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:50:57 GMT)
The final version of a recent approach towards quantum foundation [0.0] いくつかの論文において、この著者は命題の集合に基づく量子基盤への代替アプローチを提唱している。
本項では、この基礎をかなり単純化することができる。
結果として生じる理論は純粋に数学的理論であるが、変数を物理的変数にすることでクァナンタム力学に繋がる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 10:25:23 GMT)
The Unreasonable Effectiveness of Data for Recommender Systems [0.0] 推奨システムでは、大規模なインタラクションデータの収集、保存、処理は、時間、エネルギー、計算の面でますますコストがかかる。
本稿では,トレーニングデータセットのサイズが大きくなるにつれて,オフラインレコメンデーションのパフォーマンスが向上するかを検討する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:56:05 GMT)
The UNDO Flip-Flop: A Controlled Probe for Reversible Semantic State Management in State Space Model [0.0] 状態空間モデル(SSM)は、星のないシーケンシャルタスクと有界階層構造の両方をモデル化する理論的能力を持っていることが示されている。
このギャップを埋めるためにUNDO Flip-Flopタスクを導入します。
我々は,この枠組みの下で一層および二層マンバ-2を評価する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:23:40 GMT)
The Quantum Education Ecosystem: A Review of Global Initiatives, Methods, and Challenges [0.0] 量子情報科学と工学(QISE)は急速に進歩しており、量子リテラルで技術的に熟練した労働力に対する緊急の需要を生み出している。
このようなニーズにもかかわらず、量子教育のイニシアチブは、地域、教育レベル、教育的アプローチで断片化されている。
本稿では、グローバルイニシアチブ、教育戦略、新興トレンドを合成することで、現在の量子教育エコシステムの構造解析を行う。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:18:05 GMT)
The Oracle's Fingerprint: Correlated AI Forecasting Errors and the Limits of Bias Transmission [0.0] GPT-4o, Claude, Gemini は2進予測問題に対して高い相関の予測誤差を示した。
研究2では,この相関バイアスがヒトの群集予測に伝播したかどうかを検証した。
研究3では,人間の予測誤差のカテゴリーレベルのパターンがLLMバイアス指紋に近づきつつあるかを検討した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:45:40 GMT)
The End of Human Judgment in the Kill Chain? Relocating Initiative and Interpretation with Agentic AI [0.0] 大規模言語モデルベースのエージェントは、コア戦場機能に統合されつつある。
本論では, 先進的, 解釈, 目標指向性, 動的メモリに対する能力が, 文脈に適した人間の判断と制御を瞬時に不効率に行うことを論じる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:44:41 GMT)
The Deployment Gap in AI Media Detection: Platform-Aware and Visually Constrained Adversarial Evaluation [0.0] 最近のAIメディア検出器は、クリーンな実験室評価下でのほぼ完璧な性能を報告している。
実験室の堅牢性と現実の信頼性の間には,デプロイメントのギャップが生じている,と私たちは主張する。
本稿では,AIメディア検出のためのプラットフォーム対応逆評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:26:49 GMT)
The Character Error Vector: Decomposable errors for page-level OCR evaluation [0.0] 本稿では,OCRのキャラクタ評価器であるキャラクタエラーベクトル(CEV)を紹介する。
CEVはパースとOCRとインタラクションエラーコンポーネントに分解できる。
我々は、他のメトリクスに対してCEVのパフォーマンスを検証する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:56:06 GMT)
Task Ecologies and the Evolution of World-Tracking Representations in Large Language Models [0.0] 本研究では,言語モデルを進化型モデル生物として研究し,自己回帰学習が世界追跡表現をいつ選択するかを問う。
潜在世界状態の符号化について、ベイズ最適次トーケンクロスエントロピーは、既約条件エントロピーとジェンセン-シャノン過剰項に分解される。
これにより、言語モデルに対する生態学的検証性の正確な概念が得られる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 06:06:49 GMT)
Symmetry-resolved Krylov Complexity and the Uncoloured Tensor Model [0.0] フル作用素のクリロフ複雑性と同一の電荷部分空間における対称性分解クリロフ複雑性について検討する。
計算極限内では、対称性部分空間上で平均化されたクリロフ複雑性は、全空間の作用素によって上界される。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:35:02 GMT)
Swiss-Bench 003: Evaluating LLM Reliability and Adversarial Security for Swiss Regulatory Contexts [0.0] 本稿では,D7とD8を加えてHAAS(Helvetic AI Assessment Score)を6次元から8次元に拡張したSwiss-Bench 003(SBP-003)を紹介する。
私は4つの言語で808のスイス特化アイテムに対して10のフロンティアモデルを評価します。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:29:34 GMT)
Strong nonlocality with more imaginarity and less entanglement [0.0] 我々は、本質的に複雑な振幅を持つ量子状態が、状態の識別に根本的な優位性をもたらすことを示した。
両端間の共有絡み合いが虚偽性の効果を無効にする2つの分離可能な状態に、唯一の積状態を置き換えることで集合を再構成する。
これは、$d2+d-1$ in $dotimes 3$ の濃度 UBB の存在に関する開問題を解くことができる最小の非拡張ビゼパブル基底である。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:49:53 GMT)
Stability and Sensitivity Analysis of Relative Temporal-Difference Learning: Extended Version [0.0] 相対時間差学習(TD)は、割引係数が1に近づくと、TD法の緩やかな収束に導入された。
本稿では,線形関数近似を用いて相対的TD学習を分析する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 15:04:50 GMT)
Square-root Time Atom Reconfiguration Plan for Lattice-shaped Mobile Tweezers [0.0] 本稿では,中性原子系における欠陥のない原子配列を作成するためのスケーラブルな計画アルゴリズムを提案する。
提案手法は,任意の再構成問題を少なくとも3つの1次元シャットリングタスクに分解する分割・対数戦略に基づいている。
632$times$632の原子配列上の数値シミュレーションにより、提案アルゴリズムは、輸送コストを最先端のアルゴリズムの1/7に削減するグリッド構成計画を達成することを示した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 01:37:27 GMT)
Spatial Localization of Relativistic Quantum Systems: The Commutativity Requirement and the Locality Principle. Part II: A Model from Local QFT [0.0] 我々はミンコフスキー時空における正エネルギー相対論的空間局在のクラスを構築する。
各時間的方向について、構成は空間的超曲面上の正の作用素値測度(POVM)の族を生成する。
これらの可観測物は局所的あるいは準局所的場の理論量から生じる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:27:08 GMT)
Spatial Localization of Relativistic Quantum Systems: The Commutativity Requirement and the Locality Principle. Part I: A General Analysis [0.0] ミンコフスキー時空における相対論的量子系の局所化観測値に対する相対論的局所性を表現するためには可換性が必要であるかを検討する。
可換性と局所化は, より理想化された局所化手順と共存できることを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:57:09 GMT)
Semantic analysis of behavior in a DNA-functionalized molecular swarm [0.0] 我々は,細胞骨格フィラメントが表面吸着キネシンモータによって促進される標準分子群を考える。
マイクロタブーモデルを拡張し,シミュレーション結果から抽出したセマンティックな原子が期待した挙動と一致することを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 00:24:54 GMT)
STRADAViT: Towards a Foundational Model for Radio Astronomy through Self-Supervised Transfer [0.0] STRADAViTは、無線天文学の画像から転送可能なエンコーダを学習するための、自己監督型ビジョントランスフォーマーの継続的な事前訓練フレームワークである。
本データセットは,MeerKAT,ASKAP,LOFAR/LoTSS,SKA SDC1の4つの補完音源から得られた電波天文学データからなる。
線形探索と微調整により,2次および複数クラス設定にまたがる3つの形態素ベンチマークの転送を評価する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:31:13 GMT)
Resource Implications of Different Encodings for Quantum Computational Fluid Dynamics [0.0] タスクが値のフィールド全体を計算する問題に対して、w.r.t.多重量子ビットを符号化する振幅法がしばしば提案されている。
特に、この研究から得られた知見は、格子ボルツマン法のための量子アルゴリズムに特化して提案される新しい符号化アプローチにつながることが示されている。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 08:17:21 GMT)
Reciprocal Trust and Distrust in Artificial Intelligence Systems: The Hard Problem of Regulation [0.0] 記事は、AIシステムは、ある形態のエージェンシーを実行することができるアーティファクトとして認識されるべきである、と論じている。
この研究は、AIシステムの監視を担当する規制当局に対して、これらの相互信頼のダイナミクスがもたらす意味を考察する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:57:16 GMT)
Quantum advantage in transfer of quantum states [0.0] 量子の優位性は、量子系が古典的よりも大幅に優れていることである。
ここでは、量子優位性を明確に定義し証明できる新しいニッチを明らかにする。
いくつかの軌道に沿って伝播する粒子の量子力学的性質が転移過程を同時に高速化することを証明する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:16:22 GMT)
Proof of Concept as a First-Class Architectural Decision Instrument [0.0] 概念証明(PoC)は、ソフトウェア工学において広く採用されているプラクティスである。
その関連性にもかかわらず、PoCは概念的に未定義であり、研究と産業の両方において方法論的にアドホックである。
本稿では,学術・グレー文学の体系的レビューに基づいて,PoC開発のための洗練された定義と非構造化フレームワークを提供する。
PoCを第一級に高めることで意思決定の質が向上し、トレーサビリティが向上し、アーキテクチャの実践においてより体系的な学習を支援する、と我々は主張する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:04:18 GMT)
Probing the Planck scale with quantum computation [0.0] 論理キュービット数と古典性に挑戦する程度との関係を定量化する。
500個の論理量子ビットは、実験室に制限された理論を否定するのに十分であると主張する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:00:35 GMT)
Probing the Factorized Island Branch with the Capacity of Entanglement in JT Gravity [0.0] ブラックホールの島は通常、フォン・ノイマンエントロピーによって診断される。
JT重力の制御因子化島分枝内に既に存在する余分な構造を、絡み合いの容量で検出できることが示される。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:49:52 GMT)
Optimizing OpenFaaS on Kubernetes: Comparative Analysis of Language Runtimes and Cluster Distributions [0.0] サーバーレスコンピューティングは、インフラ管理を抽象化し、動的リソース割り当てを可能にすることによって、クラウドコンピューティングに革命をもたらした。
本稿では,Kubeadm,K3s,MicroK8s,K0sなど,さまざまなディストリビューションにデプロイされたOpenFの性能と互換性について検討する。
本研究では、Python、Go、Node.jsプログラミング言語がOpenF対応関数のパフォーマンスに与える影響について検討する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 06:38:29 GMT)
Optimization of entanglement harvesting with arbitrary temporal profiles: the limit of second order perturbation theory [0.0] 本研究では、2つの局所プローブが任意の時間プロファイルを持つ実量子場の真空に結合する場合に、絡み合う収穫のプロトコルについて検討する。
我々は、Hermite展開を用いて、閉形式のスミアフィールドプロパゲータを効率的に計算し、プローブ間の負性度を行列積として再キャストする。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:00:00 GMT)
On the Robustness of Diffusion-Based Image Compression to Bit-Flip Errors [0.0] 逆チャネル符号化のパラダイムに基づいて構築された拡散型圧縮機は、古典的および学習的コーデックよりもビットフリップに対してかなり堅牢であることを示す。
以上の結果から,RCCによる圧縮によりより弾力的な圧縮表現が得られ,ノイズの多い環境下での誤り訂正符号への依存が軽減される可能性が示唆された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 11:44:43 GMT)
On Dominant Manifolds in Reservoir Computing Networks [0.0] 本研究では, 時空間予測のための貯留層ネットワークの訓練における低次元支配多様体の出現について検討する。
簡易な線形・連続時間貯水池モデルでは、支配モードの次元と構造をトレーニングデータの固有次元と情報量に直接リンクする。
特に、自律力学系によって生成されたトレーニングデータについて、トレーニングされた貯水池の支配的なモードと、元のシステムのクープマン固有関数の近似を関連付ける。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 15:00:30 GMT)
Noise Immunity in In-Context Tabular Learning: An Empirical Robustness Analysis of TabPFN's Attention Mechanisms [0.0] 言語基礎モデル(TFM)は、文脈内学習(ICL)を通して異種データセットを一般化する
制御された合成摂動を用いた二元分類問題に対するTabPFNとその注意機構について検討する。
我々は、注意集中度や注目度に基づく特徴ランクの指標を含む内部信号を分析する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:13:07 GMT)
Necessary and sufficient conditions for the N-representability of functionals of the one-electron reduced density matrix [0.0] これらの条件を満たす汎函数は、1電子還元密度行列汎函数論において真のエネルギー上の変分上限を与えることが保証される。
この形式は、新しい近似関数と数値アルゴリズムの開発を導くことができる。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:39:09 GMT)
Multi-Modal Landslide Detection from Sentinel-1 SAR and Sentinel-2 Optical Imagery Using Multi-Encoder Vision Transformers and Ensemble Learning [0.0] 地すべりは、人間の生活、インフラ、生態系に深刻な影響を与えている主要なジオハザードである。
本研究では、Sentinel-1 Synthetic Aperture Radar(SAR)データとSentinel-2光画像を融合したモジュラー・マルチモデルフレームワークを提案する。
提案手法は地すべり検出における最先端F1スコア0.919を達成する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:51:05 GMT)
Molecular Excited States using Quantum Subspace Methods: Accuracy, Resource Reduction, and Error-Mitigated Hardware Implementation of q-sc-EOM [0.0] ADAPT-VQE/LUCJとq-sc-EOMを用いて正確な励起状態ポテンシャルエネルギー面を算出する。
本研究は、q-sc-EOMアプローチを用いた励起状態量子化学における量子有用性への道を探る。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 03:26:35 GMT)
LLM Psychosis: A Theoretical and Diagnostic Framework for Reality-Boundary Failures in Large Language Models [0.0] 対話型エージェントとしての大規模言語モデル(LLM)の展開は、用語学が適切に特徴付けるのに失敗する行動的失敗のカテゴリを明らかにしている。
本稿では, 精神障害と機能的類似を示すモデル認知の病態分解のための構造的理論的枠組みとして, LLM精神病を紹介した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:44:15 GMT)
Knowledge Markers: An AI-Agnostic Concept for the Design of Programming Courses [0.0] 本稿では、AIに依存しないコースレベルのコース設計のための軽量な知識マーカーとして、知識マーカーを提供する。
オープンティーチングアーティファクトにラベルをきめ細かい粒度で埋め込む方法を示す。
導入プログラミングコースを分析し,再設計し,記述的に評価することで,そのアプローチを実証する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:13:40 GMT)
Intuitive Human-Robot Interaction: Development and Evaluation of a Gesture-Based User Interface for Object Selection [0.0] 本研究は,ポインティング・アンド・クリック・ジェスチャを用いたオブジェクト選択のためのジェスチャーベースのユーザインタフェースを提案する。
20人の被験者による実験は、正確さと選択時間を評価し、効率的なコラボレーションの可能性を示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:52:59 GMT)
Intrinsic perturbation scale for certified oracle objectives with epigraphic information [0.0] 我々は,通常の局所的均一値制御を,証明エンベロープによって自然に提供される円筒型垂直図形制御に置き換える。
集合ベースの二次成長(非特異な最小化が可能である)の下で、これは古典的な平方根の変位推定を最適指数 1/2 で得る。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 10:29:04 GMT)
Intimate Strangers by Design: A Uses and Gratifications Analysis of AI Companionship [0.0] 会話型のAIコンパニオンは公の場での議論で注目されているが、ユーザエクスペリエンスに関する学術的な理解は依然として限られている。
この研究は3つのコントリビューションを提供する: まず、参加者は、確立されたU&G(Use and Gratifications)カテゴリにマッピングされた満足度を報告したが、会話AIの独特な余裕によって質的に推測される。
第二に、いくつかの満足度、リレーショナルコプロダクションとしての創造的なコラボレーション、対人トレーニングとしてのリレーショナルシミュレーションは、既存の型にマップするのではなく、ユーザーがAIを使った経験を積極的にシミュレートするインタラクティブなプロセスを通じて現れます。
第三に、満足度は時間とともに変化し、道具的エントリーポイントから感情的なエンゲージメントへと移行した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:53:58 GMT)
Intimacy as Service, Harm as Externality: Critical Perspectives on AI Companion Platform Accountability [0.0] 本稿では,親密な関係を同時に生成,抽出,管理する場として,人工知能(AI)の連携について検討する。
AIコンパニオンを持つ20人の個人との詳細なインタビューを通じて、私たちは3つの質問に対処する。
本研究は, 構造的代替手段を欠くユーザの解釈作業を通じて, プラットフォーム生成の脆弱性が自己持続的になることを示すことによって, 責任化理論を拡張した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:11:54 GMT)
Identifying and Understanding Human Values in Text: A Tailorable LLM-based Architecture [0.0] 本稿では,テキスト中の人間の値の強度を検出し定量化するLLMアーキテクチャを提案する。
アーキテクチャは3つの調整されたモジュールで構成されており、任意の理論フレームワークの基本テキストから構造化された値仕様を生成するモジュール、これらの仕様を使用してテキストをラベル付けするモジュール、および、グレードされたサポートや抵抗を割り当てるモジュールである。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 11:44:58 GMT)
INTERACT: An AI-Driven Extended Reality Framework for Accesible Communication Featuring Real-Time Sign Language Interpretation and Emotion Recognition [0.0] 本稿ではAI駆動型XRプラットフォームであるInterACT(Inclusive Networking for Translation and Embodied Real-Time Augmented Communication Tool)を提案する。
3Dアバターによるリアルタイム音声テキスト変換、国際手話(ISL)レンダリング、多言語翻訳、感情認識を没入型仮想環境に統合する。
調査では、ユーザの満足度は92%、転写精度は85%以上、感情検出精度は90%だった。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 08:56:53 GMT)
How to measure the optimality of word or gesture order with respect to the principle of swap distance minimization [0.0] 言語の語順はペルムトヘドロンのスワップ距離を最小化するという仮説が立てられている。
スワップ距離の最小化に関して,単語順変化の最適度を計測する方法を示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:47:00 GMT)
How Alignment Routes: Localizing, Scaling, and Controlling Policy Circuits in Language Models [0.0] 本稿では,アライメント学習言語モデルにおいて繰り返し発生するスパースルーティング機構について述べる。
政治的検閲と安全の拒絶を自然実験として使用し、このメカニズムは6つの実験室から9つのモデルにまたがって追跡される。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:41:36 GMT)
Higher Nishimori Criticality and Exact Results at the Learning Transition of Deformed Toric Codes [0.0] 学習によって引き起こされる三臨界点を再考し, 強い, 弱い, 壊れた$Z$対称性の3つの相が一致することを示した。
この設定は、2D$古典イジングモデルの古典的ベイズ推論位相図と全く同じである。
エドワーズ・アンダーソン相関関数のパワー・ロー指数は、未測定のイジング臨界点におけるスピン相関関数のパワー・ロー指数と正確に等しいことを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:00:43 GMT)
Heterogeneous architectures enable a 138x reduction in physical qubit requirements for fault-tolerant quantum computing under detailed accounting [0.0] 量子コンピュータのハードウェアは、今後10年間で数十万の量子ビットをオンラインにスケールすると予想されている。
量子コンピュータアーキテクチャは、理論的および実験的なQECの進歩にもかかわらず、大きなギャップを被った。
本稿では,タスク固有のハードウェア選択とQEC符号化を組み込んだ完全異種量子コンピューティングアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 18:00:11 GMT)
Governance and Regulation of Artificial Intelligence in Developing Countries: A Case Study of Nigeria [0.0] 本研究は、ナイジェリアを事例として、発展途上国におけるAIのガバナンスに関する法律専門家の認識を考察する。
データはナイジェリアの法律実務者との27の半構造化されたインタビューを通じて収集された。
調査の結果、データプライバシのリスクや強制可能な法的枠組みの欠如が懸念されていることがわかった。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:16:05 GMT)
Geometric Limits of Knowledge Distillation: A Minimum-Width Theorem via Superposition Theory [0.0] 知識蒸留は、大規模な教師を小さな学生に圧縮するが、訓練方法や目的を越えて継続する損失フロアでパフォーマンスが飽和する。
このフロアは幾何学的であり、ニューラルネットワークは重ね合わせによって次元よりもはるかに多くの特徴を表現している。
本研究は, 蒸留限界に表現幾何学を結合させ, SAE測定だけで蒸留性能を予測するための実用的なツールを提供する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 10:10:14 GMT)
Generalized hydrodynamics of free fermions under extensive-charge monitoring [0.0] 保存電荷の外部モニタリングを行う自由フェルミオンの輸送力学について検討した。
本稿では, 一般的な流体力学図に基づいて, クエンチ力学のハイブリッド数値解析法を提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 13:14:45 GMT)
Generalization error bounds for two-layer neural networks with Lipschitz loss function [0.0] 損失関数の有界性を仮定することなく、2層ニューラルネットワークのトレーニングのための一般化誤差を導出する。
我々の境界とその係数はモデルの訓練に先立って明示的に計算され、数値シミュレーションによって確認される。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 11:32:07 GMT)
Gauss law codes and vacuum codes from lattice gauge theories [0.0] 我々は、アベリア格子ゲージ理論から量子誤り訂正符号を構築するための枠組みを開発する。
我々は純粋なゲージ理論とボゾンとフェルミオンの物質との結合を持つ理論の両方を扱う。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:02:21 GMT)
From generating functions to the geometric Binder cumulant [0.0] 量子系が断熱サイクルの周りで取られるような幾何学的位相の原形式は、縮退点が周期に沿って遭遇する場合まで拡張可能であることを示す。
量子系が断熱サイクルの周りで取られるような幾何学的位相の原形式は、縮退点が周期に沿って遭遇する場合まで拡張可能であることを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 17:51:29 GMT)
From Load Tests to Live Streams: Graph Embedding-Based Anomaly Detection in Microservice Architectures [0.0] プライムビデオは毎週、木曜日のナイトフットボールのようなライブイベントの間、視聴者のトラフィックスパイクをシミュレートする負荷テストを実施している。
これらのストレステストはシステムのキャパシティを検証するが、実際のイベントトラフィックに特有のサービスの振る舞いを見逃すこともある。
本稿では、教師なしノードレベルのグラフ埋め込みを用いて、非表現型サービスを識別するグラフベースの異常検出システムを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 20:43:07 GMT)
From Large Language Model Predicates to Logic Tensor Networks: Neurosymbolic Offer Validation in Regulated Procurement [0.0] 本稿では,シンボルとサブシンボリック・人工知能を組み合わせたニューロシンボリック・アプローチを提案し,規制された公共機関に文書を提供する。
言語モデルを用いて情報を抽出し,LTNを集約して聴覚的決定を行う。
実コーパスを用いた実験により,提案したパイプラインが既存モデルに匹敵する性能を実現することを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:38:16 GMT)
From Hallucination to Structure Snowballing: The Alignment Tax of Constrained Decoding in LLM Reflection [0.0] 「大型言語モデル(LLM)における固有の自己補正は、幻覚雪球によるオープンエンド推論タスクでしばしば失敗する」
本研究は,制約付き復号法により構造的反射を純粋に強制することが,追加の訓練を伴わずに誤りの伝播を阻害するかどうかを考察する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:47:37 GMT)
Foundations for Agentic AI Investigations from the Forensic Analysis of OpenClaw [0.0] エージェントAlシステムは、ますますパーソナルアシスタントとしてデプロイされ、デジタル調査の共通の対象になりそうである。
本稿では,広く使用されているシングルエージェントアシスタントOpenClawの実証的研究について述べる。
我々はこれらのトレースを分類し、分類して、その調査価値を体系的に評価する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 08:35:22 GMT)
Epistemic Blinding: An Inference-Time Protocol for Auditing Prior Contamination in LLM-Assisted Analysis [0.0] エピステミックブラインド(英: epistemic blinding)は、エンティティ識別子を匿名のコードに置き換える単純な推論時プロトコルである。
4種類のがん種を対象とする腫瘍薬剤の優先順位付けでは、盲目化は上位20の予測の16%に変化し、検証対象の同一の回復を保っている。
S&P 500エクイティ・スクリーニングでは、ブランド認識バイアスが5つのランダムな種子のトップ20ランキングの30-40%を占めている。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:06:52 GMT)
Entanglement in the open XX chain: Rényi oscillations, hard-edge crossover, and symmetry resolution [0.0] 開 XX スピン/2$ 鎖の Rényi 絡み合いエントロピーの閉形式公式を数値的に導出する。
Szeg関数の明示的な評価は、2k_F$振動振幅と位相をもたらす。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 02:54:59 GMT)
DosimeTron: Automating Personalized Monte Carlo Radiation Dosimetry in PET/CT with Agentic AI [0.0] DosimeTronはPET/CT検査における患者固有の放射線線量測定自動化のためのエージェントAIシステムである。
DosimeTronは様々なプロンプト構成の複雑なドシメトリパイプラインを自律的に実行し、OpenDose3Dと高いドシメトリの合意を達成した。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 11:09:30 GMT)
Dissipative Hamilton Jacobi Dynamics and the Emergence of Quantum Wave Mechanics [0.0] 古典力学の散逸的拡張は、複雑でより一般に準イオン的な作用原理に基づくものである。
量子力学はより広い散逸的古典理論の安定対称相に対応することを示す。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 20:53:38 GMT)
Deviations from thermal light statistics in ensembles of independent two-level emitters [0.0] 寒冷な原子アンサンブルが熱光統計を放射する条件を同定する。
相関関係は原子数とコヒーレントと非コヒーレント発光の比の2つの条件で表される。
この結果は,エミッタ間の相互作用を伴わない2レベル原子による熱光の発生の理解に寄与する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:55:44 GMT)
Darkness Visible: Reading the Exception Handler of a Language Model [0.0] GPT-2は、構文構造ではなくトークンレベルの予測可能性で動作する例外ハンドラと、直ちに動詞のサブカテゴリ化を使用する。
このアーキテクチャは終端層のみを結晶化します -- より深いモデルでは、最終層において、第11層ではなく、等価な構造を予測します。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 14:21:35 GMT)
Conv-to-Bench: Evaluating Language Models Via User-Assistant Dialogues In Code Tasks [0.0] Conv-to-Benchは、真のマルチターンユーザアシスタント対話を構造化され、検証可能な要求チェックリストに変換するフレームワークである。
プログラミングに応用して、Conv-to-Benchは、人間が認可した標準とほぼ完璧なアライメントを示す評価セットを生成する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 23:09:45 GMT)
Context-Aware Dialectal Arabic Machine Translation with Interactive Region and Register Selection [0.0] 現在のアラビア語の機械翻訳(MT)システムは、しばしば方言の多様性を考慮するのに苦労している。
本稿では,地域・言語的変動を明示的にモデル化した方言アラビア語 MT の文脈認識フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 20:54:19 GMT)
Compressible Softmax-Attended Language under Incompressible Attention [0.0] 我々は、アテンションロジットフィールドを学習されたコンポーネントと生成されたコンポーネントに分解する。
ソフトマックス適応言語の圧縮性は、分析するフレームではなく、データの特性である。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 22:10:07 GMT)
Broken by Default: A Formal Verification Study of Security Vulnerabilities in AI-Generated Code [0.0] Broken by Defaultは、500のセキュリティクリティカルなプロンプトにわたる7つのフロンティアLSMによって生成される3,500のコードアーティファクトの正式な検証研究である。
すべてのモデル全体で、55.8%のアーティファクトは少なくとも1つのCOBALT識別された脆弱性を含んでいる。
1) 明示的なセキュリティ命令は平均を4ポイント減らし、(2) 業界ツールと組み合わせて97.8%のZ3証明の結果を見逃し、(3) モデルでは、レビューモードの78.7%の時点では55.8%で出力する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 00:55:42 GMT)
Bridging Theory and Practice in Crafting Robust Spiking Reservoirs [0.0] スパイキング貯水池コンピューティングは、時間的処理に対するエネルギー効率のよいアプローチを提供するが、確実に貯水池を調整してカオスの端で作動させることは困難である。
この研究は、ロバストネス間隔を導入して活用することによって、臨界性と実践的安定性の抽象概念を橋渡しする。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 19:29:21 GMT)
Arch: An AI-Native Hardware Description Language for Register-Transfer Clocked Hardware Design [0.0] Archはパイプライン、FIFO、アービター、レジスタファイル、バス、時計領域横断のための第一級言語構造を導入している。
中心となる設計選択は、クロックとリセット自体がパラメータ化された型であることである。
Archコンパイラは、決定論的でリントクリーンなIEEE 1800-2017 SystemVerilogを出力する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 15:12:14 GMT)
Anticipating tipping in spatiotemporal systems with machine learning [0.0] パラメータ適応型貯水池計算の機械学習フレームワークを用いて,複雑な力学系のチップを正確に予測する。
本研究は,CMIP5結合モデル相互比較プロジェクト5において,様々な時間的力学系における予測ウィンドウ内でのチップの同定を実証する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 20:51:58 GMT)
Another Triumph of Locality: Colliding Histories Skew Handshakes [0.0] ベルの定理は、局所現実のデス・ネルとして広く解釈されている。
本章は「鐘のローカルな説明」の非技術フロントエンドとして機能する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 05:39:07 GMT)
Agent Choice via Quantum Flux in Living Systems [0.0] このモデルは仮に「量子フラックス経由のAgent Choice」と呼ばれる。
これは、物理的法則によって事前に決定されない意図的な選択を可能にする方法で、生きたシステムに特定の物理学をもたらす。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 20:46:12 GMT)
Accelerating Quantum State Encoding with SIMD: Design, Implementation, and Benchmarking [0.0] この研究はRustベースのSIMD対応カーネルであるHybriquを紹介した。
Apple Siliconのベンチマークでは、64量子ビットでの純粋な角符号化の使用は5.4%高速であり、データの量がL1キャッシュサイズを超えるとスピードアップが増加することが示されている。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 05:47:03 GMT)
AI-Driven Modular Services for Accessible Multilingual Education in Immersive Extended Reality Settings: Integrating Speech Processing, Translation, and Sign Language Rendering [0.0] この作業では、6つのAIサービス、OpenAI Whisperによる自動音声認識、Meta NLLBによる多言語翻訳、AWS Pollyを使用した音声合成、RoBERTaによる感情分類、flan t5base Samsumによる対話要約、Google MediaPipeによる国際署名レンダリングなど、モジュール化されたプラットフォームを導入している。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 08:35:53 GMT)
A solid-state quantum memory based on a continuous optoacoustic system [0.0] 光状態のための量子記憶は、量子通信と情報処理に不可欠な資源である。
広帯域光導波路におけるコヒーレント光子-フォノン変換に基づく量子メモリプロトコルを提案する。
本プロトコルは,離散キャビティモードを使わずに,分散媒体上でのブロードバンド量子状態記憶を可能にする。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 08:52:41 GMT)
A multigraph approach to confusability in quantum channels [0.0] 我々はウィーバーの量子関係の観点から量子多グラフの理論を発展させる。
量子可溶性多グラフとして生じるこれらの量子多グラフを特徴付ける必要十分条件を提供する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 16:52:24 GMT)
A Semi-Automated Annotation Workflow for Paediatric Histopathology Reports Using Small Language Models [0.0] 本研究では,小言語モデル(SLM)を用いた資源効率のよい半自動アノテーションワークフローを開発し,構造化EPRデータから構造化情報を抽出する。
概念実証として、本ワークフローを小児腎生検報告、その制約された診断範囲と明確に定義された基礎生物学に応用した領域に適用する。
SLMを用いた自動情報抽出手法を開発しながら,本ワークフローを3つの会議の臨床的監視とともに反復的に開発し,グレート・オーモンド・ストリート病院の2,111件のデータセットから400件の報告をゴールドスタンダードとして手動で注釈付けする。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 07:29:28 GMT)
A Nested Amplitude Amplification Protocol for the Binary Knapsack Problem [0.0] Amplitude Amplification は、Grover Adaptive Search (GAS) によって最適化された、探索問題の証明可能な高速化を提供する。
本研究では,二分数knapsack問題に対するネスト振幅増幅プロトコルを提案し,決定木を深さで分割し,第1変数の部分増幅を行い,全探索空間上でグローバルGASを実行する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 12:14:25 GMT)
A Global Model Structure for $\mathbb{K}$-Linear $\infty$-Local Systems [0.0] ホモトピー理論は6つの関手からなる「ヨガ」によって支配されるホモトピー型のスペクトルの局所的な体系を整理する。
最近開発されたLhoTT(Linear Homotopy Type Theory)のセマンティクスを提供するには、これらのスペクトルの優れたモデルカテゴリが必要である。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 10:17:35 GMT)
A Formal Security Framework for MCP-Based AI Agents: Threat Taxonomy, Verification Models, and Defense Mechanisms [0.0] Model Context Protocol (MCP) は、大規模言語モデル(LLM)ベースのエージェントを外部ツールやデータソースに接続するためのデファクトスタンダードとなっている。
本稿では,MPPベースのAIエージェントのための総合的なセキュリティフレームワークであるMPPSHIELDを提案する。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 15:02:47 GMT)
A Comparative Study of Penalised, Bayesian, Spatial, and Tree-Based Models for Provincial Poverty in Indonesia: Small Samples and High Collinearity [0.0] 本稿では,インドネシアにおける貧困の地域的原因を,具体的な統計的リスクに対処して評価する。
我々は,コリニアリティの高い小さなサンプルを対象とした厳密なモデル比較フレームワークを採用している。
結果、アルゴリズムの複雑さは本質的に地域データセットにおいて危険であることが示された。
論文参考訳(メタデータ) (Tue, 07 Apr 2026 09:41:12 GMT)