Think-While-Generating: On-the-Fly Reasoning for Personalized Long-Form Generation [91.9] FlyThinkerは、パーソナライズされたロングフォーム・ジェネレーションのための効率的な「思考時生成」フレームワークである。
FlyThinkerは、遅延トークンレベルの推論を並列に生成する別の推論モデルを採用し、反応生成を動的に導くために生成モデルに融合する。
実世界のベンチマークの実験では、FlyThinkerはトレーニングと推論の効率を維持しながら、よりパーソナライズされた生成を実現している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 06:49:41 GMT)
NeuralRemaster: Phase-Preserving Diffusion for Structure-Aligned Generation [88.1] 相保存拡散-PDは拡散過程のモデル非依存的な再構成である。
-PDは大きさをランダム化しながら入力フェーズを保存し、アーキテクチャ変更なしに構造整合生成を可能にする。
-PDは推論時間を追加せず、画像やビデオの拡散モデルと互換性がある。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:41:35 GMT)
RDSplat: Robust Watermarking Against Diffusion Editing for 3D Gaussian Splatting [86.9] 3DGSの透かし法は拡散ベースの編集に非常に脆弱である。
本稿では拡散に基づく編集に対するロバストなウォーターマーキングパラダイムであるRDSplatを紹介する。
RDSplatは、拡散ベースの編集が本質的に保存する3DGSコンポーネントに透かしを埋め込む。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 10:26:35 GMT)
VideoVLA: Video Generators Can Be Generalizable Robot Manipulators [86.7] ロボット操作の一般化は、オープンワールド環境におけるロボットの展開に不可欠である。
本稿では,大容量ビデオ生成モデルをロボットVLAマニピュレータに変換する可能性を探る,シンプルなアプローチであるVideoVLAを提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 18:57:15 GMT)
VDOT: Efficient Unified Video Creation via Optimal Transport Distillation [70.0] 本稿では,VDOT という名前の効率的な統合ビデオ生成モデルを提案する。
我々は,実測値分布と偽測値分布の差分を最適化するために,新しい計算最適輸送(OT)技術を用いる。
統合ビデオ生成モデルの訓練を支援するため,ビデオデータアノテーションとフィルタリングのための完全自動パイプラインを提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 11:31:00 GMT)
The Role of Entropy in Visual Grounding: Analysis and Optimization [69.5] 本稿では,効率的なエントロピー制御のための解釈可能なアルゴリズムであるECVGPO(Entropy Control Visual Grounding Policy Optimization)を紹介する。
実験によると、ECVGPOは様々なベンチマークやモデルで広範囲に改善されている。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 08:33:55 GMT)
Hide-and-Seek Attribution: Weakly Supervised Segmentation of Vertebral Metastases in CT [68.1] 脊椎レベルの健康・悪性のラベルにのみ、病変マスクを伴わずに訓練を施した弱い指導方法を提案する。
マスクの監視がないにも関わらず,強い爆発・解析性能を達成する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 14:03:28 GMT)
OXtal: An All-Atom Diffusion Model for Organic Crystal Structure Prediction [63.3] 分子内コンフォーメーションと周期的パッキングの条件付き関節分布を学習する大規模100Mパラメータ全原子拡散モデルであるOXtalを導入する。
実験的に検証された600Kの結晶構造の大規模なデータセットを活用することで、OXtalは、以前のabinitio機械学習CSPメソッドよりも改善の順序を達成できる。
オキシタルは80%以上のパッキング類似率を獲得し、分子結晶化の熱力学的および運動論的規則性の両方をモデル化する能力を示している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 20:46:30 GMT)
MeshSplatting: Differentiable Rendering with Opaque Meshes [59.2] メッシュベースの再構成手法であるMeshSplattingを提案する。
Mip-NeRF360では、メッシュベースの新規ビュー合成のために現在の最先端のMiLoよりもPSNRを+0.69dB向上させる。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 12:31:04 GMT)
From Next-Token to Next-Block: A Principled Adaptation Path for Diffusion LLMs [58.6] 原理的AR-to-block-diffusion適応は,DLMをスクラッチからトレーニングする上で,有効かつ効率的な代替手段であることを示す。
NBDiff-7B(BaseとInstruct)は、長文のモデリングと推論機能を継承し、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 10:28:21 GMT)
JT-DA: Enhancing Data Analysis with Tool-Integrated Table Reasoning Large Language Models [58.4] JT-DA-8Bは、様々な現実世界のシナリオにまたがる複雑なテーブル推論タスクのために設計された、特殊な大規模言語モデルである。
我々は、29のパブリックテーブルQAデータセットと300万のテーブルを集約することにより、34の明確に定義されたテーブル推論タスクを備えた包括的で多様なトレーニングコーパスを構築した。
実験結果から,JT-DA-8Bは様々なテーブル推論タスクにおいて高い性能を示すことがわかった。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 14:29:23 GMT)
State Diversity Matters in Offline Behavior Distillation [58.1] トレーニング損失がかなり大きい場合、状態多様性の高いデータセットは、より高い状態品質のデータセットよりも優れていることを示す。
本稿では, 蒸留目標の重み付けにより, 状態の多様性を強調する新しいアルゴリズム, 状態密度重み付け (SDW) OBDを提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 06:55:08 GMT)
Task-Model Alignment: A Simple Path to Generalizable AI-Generated Image Detection [57.2] 視覚言語モデル(VLM)はAI生成画像(AIGI)検出にますます採用されている。
VLMのアンダーパフォーマンスはタスクモデルのミスアライメントに起因する。
本稿では,AIGI検出を2つの補完的タスクとして形式化する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:19:00 GMT)
PersonaMem-v2: Towards Personalized Intelligence via Learning Implicit User Personas and Agentic Memory [56.8] パーソナライゼーションは、AI能力とアライメントの進歩における次のマイルストーンの1つだ。
PersonaMem-v2は300以上のシナリオ、20,000以上のユーザの好み、128kのコンテキストウィンドウで、1,000の現実的なユーザ-チャットボットインタラクションをシミュレートする。
我々はQwen3-4BをトレーニングしてGPT-5を上回り、暗黙のパーソナライゼーションにおいて53%の精度を達成した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 06:48:23 GMT)
NeuroABench: A Multimodal Evaluation Benchmark for Neurosurgical Anatomy Identification [56.1] MLLM(Multimodal Large Language Models)は、外科的ビデオ理解において大きな可能性を秘めている。
Neurosurgical Anatomy Benchmark (NeuroABench)は、神経外科領域における解剖学的理解を評価するために明示的に作成された最初のマルチモーダルベンチマークである。
NeuroABenchは89の異なる手順をカバーする9時間の注釈付き神経外科ビデオで構成されている。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 17:00:25 GMT)
Personalized Image Descriptions from Attention Sequences [55.7] 異なる領域、オブジェクト、詳細をさまざまな順序で参照し、異なる言語スタイルで記述する。
パーソナライズされた画像記述のための既存のモデルは、個々の視聴パターンを活用する以前の作業がなく、言語スタイルのみに焦点を当てている。
我々は、パーソナライズされた視聴動作を記述生成のコアファクターとして明示的にモデル化することで、このギャップに対処する。
そこで,本手法では,補助的な注意制御タスクによって誘導される言語スタイルと視聴行動の両方をキャプチャする対象埋め込みについて学習する。軽量なアダプタは,これらの埋め込みを凍結した視覚言語モデルと整合させ,再訓練を行なわずにパーソナライズすることができる。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 05:23:18 GMT)
WisPaper: Your AI Scholar Search Engine [55.1] textscWisPaperは、インテリジェントな学術検索と文献管理プラットフォームである。
文献発見、管理、研究フロンティアの継続的な追跡をシームレスに接続するクローズドループワークフローを提供する。
プラットフォームは一般公開されており、学術や産業の研究者に利用されている。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 15:10:20 GMT)
CoT4Det: A Chain-of-Thought Framework for Perception-Oriented Vision-Language Tasks [53.9] Chain-of-Thought for Detection (CoT4Det)は、知覚タスクを3つの解釈可能なステップに再構成するシンプルだが効率的な戦略である。
一般的な視覚言語能力を損なうことなく,CoT4Detは認識性能を著しく向上させることを示す。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 05:26:30 GMT)
1 + 1 > 2: Detector-Empowered Video Large Language Model for Spatio-Temporal Grounding and Reasoning [53.3] 本稿では,DEViL の略である Detector-Empowered Video LLM を提案する。
DEViLはオープンボキャブラリ検出器(OVD)とビデオLLMを結合する
単に空間的なプロンプトやセグメンタスイッチとして機能するトークンとは異なり、RTTは制御信号とOVDのテキスト埋め込みの置き換えの両方として機能する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 06:11:15 GMT)
MagicSkin: Balancing Marker and Markerless Modes in Vision-Based Tactile Sensors with a Translucent Skin [52.9] MagicSkinは、視覚ベースの触覚センサーのためのマーカーとマーカーのモードのバランスをとる、透明で色のついたマーカーを備えた、新しい触覚皮膚である。
同時に接尾辞の変位追跡、力予測、表面保存の細部が可能である。
透光性マーカーは、従来のマーカーレスマーカーやインケインマーカーの設計と比較して、感度を劣化させるよりも著しく向上する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 12:59:15 GMT)
Parent-Guided Semantic Reward Model (PGSRM): Embedding-Based Reward Functions for Reinforcement Learning of Transformer Language Models [51.6] PGSRM(Parent-Guided Semantic Reward Model)を紹介する。
PGSRMはバイナリの正当性信号、人間の嗜好データ、訓練された報酬モデルを単純な信号で置き換える。
PGSRMは2次報酬ベースラインよりもスムーズな報酬改善とより安定したPPOダイナミクスを実現している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 16:58:22 GMT)
JoPano: Unified Panorama Generation via Joint Modeling [51.4] 本稿では,2つのコアタスクをDiTモデル内に統一する共同顔パノラマ(JoPano)生成手法を提案する。
テキスト・ツー・パノラマ・ビュー・トゥ・パノラマ生成タスクにおいて,JoPanoは高品質なパノラマを生成することができることを示す。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 15:19:26 GMT)
DoVer: Intervention-Driven Auto Debugging for LLM Multi-Agent Systems [50.7] DoVerは、大規模言語モデル(LLM)ベースのマルチエージェントシステムのための介入駆動デバッグフレームワークである。
ターゲットの介入を通じて、アクティブな検証によって仮説生成を増強する。
DoVerは失敗試験の18~28%を成功させ、最大16%のマイルストーンを達成し、失敗仮説の30~60%を検証または否定する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:23:48 GMT)
Evaluating and Preserving High-level Fidelity in Super-Resolution [50.7] 超解像モデル(SR)は、細部を再構築し、快適な視覚出力を提供することで印象的な効果を達成している。
しかし、過剰な生成能力は時として幻覚を起こし、画像の内容を変えることがある。
この種のハイレベルな変化は、人間によって容易に識別できるが、既存の低レベルの画像品質指標では十分に研究されていない。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 22:53:34 GMT)
Pseudo-Label Refinement for Robust Wheat Head Segmentation via Two-Stage Hybrid Training [48.9] 我々はグローバル小麦フルセマンティックコンペティションのための体系的な自己学習フレームワークを開発した。
このフレームワークは、2段階のハイブリッドトレーニング戦略と広範なデータ拡張を組み合わせたものだ。
私たちのコアモデルは、MiT-B4(Mix Transformer)バックボーンを備えたSegFormerです。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 02:48:50 GMT)
LLM as a Neural Architect: Controlled Generation of Image Captioning Models Under Strict API Contracts [48.8] LLM誘導型ニューラルネットワーク探索パイプラインであるNN-Captionを提案する。
LEMURの分類バックボーンからCNNエンコーダを構成することで、実行可能な画像キャプチャモデルを生成する。
この作業では、プロンプトベースのコード生成と自動評価を統合するパイプラインを提示する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 10:47:28 GMT)
CAuSE: Decoding Multimodal Classifiers using Faithful Natural Language Explanation [46.9] 我々は,事前訓練されたマルチモーダル分類器に対して忠実なNLEを生成する新しいフレームワークであるCAuSE(Causal Abstraction under Simulated Explanations)を提案する。
我々は、CAuSEが広範囲な経験的評価を通じてデータセットやモデルにまたがる一般化を実証する。
さらに、マルチモーダル設定における因果的忠実度を測定するために、再設計された基準によってこれを検証する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 12:15:21 GMT)
MMDuet2: Enhancing Proactive Interaction of Video MLLMs with Multi-Turn Reinforcement Learning [46.1] 本稿では,プロアクティブインタラクションのための新しいテキスト・テキスト・アプローチを提案する。
我々は、SFTとRLによる2種類の対話を伴う52kビデオのデータセット上で、モデルMDDuet2を訓練する。
実験の結果,MDDuet2は既存のプロアクティブビデオMLLMベースラインよりも応答時間と品質が優れていた。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 12:03:04 GMT)
Generative Teaching via Code [43.5] TeachMasterは、解釈可能、編集可能、カリキュラム対応の教育ビデオの制作を自動化するための、計画、設計、レンダリングの協力的なチームである。
TeachMasterは構造的コヒーレンスや視覚的忠実さを損なうことなく生産効率を大幅に向上させる。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 12:52:24 GMT)
EMGauss: Continuous Slice-to-3D Reconstruction via Dynamic Gaussian Modeling in Volume Electron Microscopy [41.8] 本稿では,平面走査型2次元スライスからの3次元再構成のための一般的なフレームワークであるEMGaussについて紹介する。
我々の重要な革新は、ガウススプラッティングに基づく3次元動的シーンレンダリング問題としてスライス・ツー・3D再構成を再構成することである。
EMGausは拡散およびGANに基づく再構成法と比較して、品質を大幅に向上し、連続的なスライス合成を可能にし、大規模プレトレーニングの必要性を排除している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 06:39:57 GMT)
Decouple to Generalize: Context-First Self-Evolving Learning for Data-Scarce Vision-Language Reasoning [41.5] 最近の視覚言語モデル(VLM)は強化学習(RL)を通して顕著な推論を実現する
RLは、経験の時代に連続的に進化する大規模視覚言語モデル(LVLM)を実現するための実現可能なソリューションを提供する。
合成データや自己回帰機構といった既存の戦略は、限られた分布とアライメントの困難に悩まされている。
問題解決ではなく,まず文脈から学習するようにモデルに誘導する,二重分離フレームワークDoGeを提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 13:17:31 GMT)
From Zero to High-Speed Racing: An Autonomous Racing Stack [40.6] 本稿では,IU Luddy Autonomous Racing team for the Indy Autonomous Challenge (IAC)によって開発されたAutonomous Race Stack (ARS)を紹介する。
ARSの3つのイテレーションをそれぞれ異なるトラックで検証し、最大260km/hの速度を達成する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 15:35:16 GMT)
Towards Robust Pseudo-Label Learning in Semantic Segmentation: An Encoding Perspective [39.7] ECOCSegは、誤り訂正出力符号(ECOC)を利用して各クラスに対してきめ細かいエンコーディングを作成するセグメンテーションモデルのための新しい視点である。
まず、ECOCベースの分類器を導入し、モデルがクラスを属性に切り離し、部分的不正確なビットを処理できるようにする。
第2に、高品質な擬似ラベルを生成するためにビットレベルのラベル記述機構を開発し、未ラベル画像に対する適切な、堅牢な監視を提供する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 14:56:29 GMT)
Multi-Docker-Eval: A `Shovel of the Gold Rush' Benchmark on Automatic Environment Building for Software Engineering [38.7] マルチDocker-Evalベンチマークには、9つのプログラミング言語にまたがる40の現実世界リポジトリが含まれている。
現在のモデル全体の成功率は低く(F2Pは37.7%)、環境構築が主要なボトルネックとなっている。
これらの発見は、スケーラブルで完全に自動化されたSWEパイプラインを構築するための実行可能なガイドラインを提供する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 16:43:45 GMT)
UARE: A Unified Vision-Language Model for Image Quality Assessment, Restoration, and Enhancement [38.5] 低レベルの視覚において、画質評価と画像復元が根本的な問題である。
統合マルチモーダル理解世代モデルの最近の進歩は有望な結果を示している。
我々は、画像品質評価、復元、拡張のための最初の統一視覚言語モデルUAREを提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:26:53 GMT)
An Index-based Approach for Efficient and Effective Web Content Extraction [38.4] 索引に基づくWebコンテンツ抽出について紹介する。
我々はHTMLを構造対応のアドレス可能なセグメントに分割し、あるクエリに関連するコンテンツの位置インデックスのみを抽出する。
本手法は、コンテンツ長からの抽出遅延を分離し、高速なクエリ関連抽出を可能にする。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 03:18:19 GMT)
Balanced Learning for Domain Adaptive Semantic Segmentation [37.7] 意味的セグメンテーションのための教師なしドメイン適応(UDA)は、ラベル付きソースドメインからラベル付きターゲットドメインへ知識を転送することを目的としている。
UDAにおける自己学習技術の有効性にもかかわらず、各クラスは、固有のクラス不均衡とデータとドメイン間のラベル空間の分散シフトのために、バランスの取れた方法で学習するのに苦労している。
本稿では,分布シフトに関する事前知識を必要とせずに,クラスバイアスを直接評価・緩和するための新しいアプローチであるBallotd Learning for Domain Adaptation (BLDA)を提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 15:21:22 GMT)
Rhea: Role-aware Heuristic Episodic Attention for Conversational LLMs [36.9] 大規模言語モデル(LLM)はシングルターンタスクにおいて顕著な性能を達成しているが、その効果はマルチターン会話において悪化している。
本稿では,会話履歴を2つの機能独立メモリモジュールに分離する新しいフレームワークRheaを提案する。
実験により、Rheaは性能低下を緩和し、総合的な精度を10点スケールで1.04ポイント向上することが示された。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 14:50:03 GMT)
Becoming Experienced Judges: Selective Test-Time Learning for Evaluators [36.0] トレーニングや検証セットを必要とせずに,評価者が推論時に逐次改善できるフレームワークであるLWE(Learning While Evaluation)を導入する。
LWEは、(i)サンプル固有の評価命令を生成し、(ii)自己生成フィードバックを通じて自分自身を洗練させるメタプロンプトの進化を維持している。
本稿では,自己一貫性のあるケースのみにメタプロンプトを更新するSelective LWEを提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:28:39 GMT)
Gaussian Swaying: Surface-Based Framework for Aerodynamic Simulation with 3D Gaussians [35.7] ガウススウェイディング(英: Gaussian Swaying)は、3Dガウスを用いた空力シミュレーションのための表面ベースのフレームワークである。
我々のフレームワークはシミュレーションとレンダリングを同じ表現で統一する: ガウスパッチ。
本フレームワークは,現実的な空力シーンシミュレーションのためのスケーラブルなアプローチとして,最先端の性能と効率性を実現する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 07:38:46 GMT)
Power of Boundary and Reflection: Semantic Transparent Object Segmentation using Pyramid Vision Transformer with Transparent Cues [35.7] 本稿では,境界特徴強調および反射特徴強調モジュールによる強力な視覚的手がかりの導入を提案する。
提案するフレームワークであるTransCuesは、透明なオブジェクトをセグメント化するためのピラミッド変換器エンコーダデコーダアーキテクチャである。
提案手法は,Trans10K-v2で+4.2% mIoU,MSDで+5.6% mIoU,RGBD-Mirrorで+10.1% mIoU,TROSDで+13.1% mIoU,Stanford2D3Dで+8.3% mIoUを達成している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 22:52:53 GMT)
ADAM Optimization with Adaptive Batch Selection [35.6] 我々は,AdamをAdamに組み込むAdamial Bandit Sampling (AdamCB)を紹介した。
我々は,AdamCBが以前のBandit-based variantを含むAdam-based法よりも高速に収束することを示す。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 11:15:14 GMT)
MINES: Explainable Anomaly Detection through Web API Invariant Inference [34.8] MINESは、詳細な生ログインスタンスではなく、スキーマレベルから異常検出のための説明可能なAPI不変量を推論する。
我々は、TrainTicket、NiceFish、Gitea、Mastodon、NextCloudのベンチマークに対するWeb-tamper攻撃に対して、MINESを広範囲に評価した。
その結果、MINESは、ほぼゼロの偽陽性を導入しながら、異常に対する高いリコールを達成し、新たな最先端技術を示すことがわかった。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 16:13:35 GMT)
XAM: Interactive Explainability for Authorship Attribution Models [34.5] IXAMでは、モデルの埋め込み空間をインタラクティブに探索し、モデルの予測を説明することができる。
事前定義された形式的説明と比較して,フレームワークの価値を実証する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 17:07:12 GMT)
Statistic-Augmented, Decoupled MoE Routing and Aggregating in Autonomous Driving [32.6] Large Model (LM)-Driven Mixture of Experts (MoE)パラダイムは、有望なソリューションを提供する。
LM駆動のMoE出力とアグリゲーション機構(MoE-RAM)を提案する。
MoE-RAMは、LM抽出された潜在特徴と最も関係のある専門家のキャッシュされた特徴とを一致させる統計的検索機構を組み込むことで、専門家のルーティングを強化する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 05:28:40 GMT)
FedDSR: Federated Deep Supervision and Regularization Towards Autonomous Driving [32.6] Federated Deep Supervision and Regularization (FedDSR) は、Federated ADシステムにマルチアクセス中間層監視と正規化を組み込んだパラダイムである。
FedDSRはmIoUが最大8.93%改善し、トレーニングラウンドが28.57%削減された。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 06:23:59 GMT)
VisChainBench: A Benchmark for Multi-Turn, Multi-Image Visual Reasoning Beyond Language Priors [32.5] VisChainBenchは、LVLM(Large Vision-Language Models)を厳格に評価するために設計されたベンチマークである。
3つの異なる領域(例えば、日々のシナリオ、エンジニアリングのトラブルシューティング)にわたる20,000以上のイメージにまたがる1,457のタスクを含んでいる。
ユニークなことに、ベンチマークはマルチエージェント生成パイプラインを使用して構築されており、高い視覚的多様性と制御された言語バイアスを保証する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:48:10 GMT)
Less Is More, but Where? Dynamic Token Compression via LLM-Guided Keyframe Prior [32.0] LLM-Guided Keyframe prior (DyToK)による動的トークン圧縮を提案する。
分析の結果、VLLMの注意層はクエリ条件付き事前情報を自然に符号化し、DyToKはフレーム単位のトークン保持率を動的に調整することがわかった。
実験により、DyToKは最先端の効率-精度トレードオフを達成することが示された。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 14:42:10 GMT)
Latency-Response Theory Model: Evaluating Large Language Models via Response Accuracy and Chain-of-Thought Length [31.9] 本稿では、応答精度とCoT長の両方をモデル化した理論応答(LaRT)モデルを提案する。
本稿では,遅延特性推定において,より優れた推定精度と短い信頼区間の点で,IRTに対するLaRTの利点を実証する。
LaRT は IRT データセットと異なる LLM ランキングを出力し,予測能力,項目効率,ランキング妥当性,LLM 評価効率など,複数の重要な評価指標で IRT を上回ります。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 22:06:51 GMT)
Vector Quantization using Gaussian Variational Autoencoder [30.6] ベクトル量子化変分オートエンコーダ(VQ-VAE)は、画像を離散トークンに圧縮する離散自動エンコーダである。
本稿では,ガウス量子(GQ)と呼ばれる手法を提案する。これは,ガウスのVAEを一定の制約で訓練せずにVQ-VAEに変換する手法である。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 00:57:58 GMT)
Permission Manifests for Web Agents [30.2] LLM(Large Language Model)ベースのWebエージェントの台頭は、Webとの対話の自動化において、大きな変化をもたらしている。
どのインタラクションが許可されているかを指定する方法がないため、Webサイトオーナーはますます、ブランケットブロッキングとCAPTCHAに依存している。
ロボット.txtスタイルのインターフェースマニフェストであるエージェントパーミッションを導入し,API参照によって補完される,Webサイトが許可されたインタラクションを指定する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 17:45:01 GMT)
A Technical Policy Blueprint for Trustworthy Decentralized AI [29.3] ガバナンス要件をポリシー・アズ・コード・オブジェクトとしてエンコードする技術ポリシー青写真を提案する。
我々は、資産政策の検証と資産政策の執行を分離する技術政策の青写真を提案している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 21:27:48 GMT)
Singing Timbre Popularity Assessment Based on Multimodal Large Foundation Model [28.4] Sing-MDは, 呼吸制御, 音質, 感情表現, 発声技術という4次元の専門家によって注釈付けされた大規模データセットである。
次に,マルチモーダル大言語モデル(MLLM)の完全長歌の分析におけるメモリ制限に対処し,VocalVerseを提案する。
第3に、自動計量不足に対処するために、モデルが知覚的に有効なランキングを生成する能力を評価するH-TPRベンチマークを確立する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 21:06:16 GMT)
A New Trajectory-Oriented Approach to Enhancing Comprehensive Crowd Navigation Performance [28.1] 群集のナビゲーションは近年、かなりの研究の関心を集めている。
現在のDRLアプローチは一般的に効率と快適さを優先している。
本稿では,軌道曲率最適化を明確に強調する新たな報酬形成戦略を提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 00:52:07 GMT)
Dynamic Visual SLAM using a General 3D Prior [27.5] 動的シーンにおけるカメラのポーズを頑健に推定できる新しいモノクロ視覚SLAMシステムを提案する。
具体的には,動的領域を正確にフィルタするフィードフォワード再構成モデルを提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 14:44:06 GMT)
Structural and Disentangled Adaptation of Large Vision Language Models for Multimodal Recommendation [27.2] マルチモーダルレコメンデーションは、視覚信号とテキスト信号を活用することで精度を高め、その成功は、高品質なクロスモーダル表現の学習に大きく依存する。
近年のLVLM(Large Vision-Language Models)は,マルチモーダル表現学習の統一化を実現している。
SDA は,Cross-Modal Structure Alignment (CMSA) とModality-Disentangled Adaptation の2つのコンポーネントを統合した,構造的・不整合適応のための軽量フレームワークである。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 15:18:04 GMT)
Lightweight Wasserstein Audio-Visual Model for Unified Speech Enhancement and Separation [26.5] 音声強調(SE)と音声分離(SS)は伝統的に、音声処理において異なるタスクとして扱われてきた。
単一モデルでSEとSSを統一する軽量かつ教師なしオーディオ視覚フレームワークUniVoiceLiteを提案する。
UniVoiceLiteはノイズとマルチスピーカの両方のシナリオで高いパフォーマンスを実現し、効率と堅牢な一般化を組み合わせた。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 06:48:54 GMT)
Non-Orthogonal Multiple-Access for Coherent-State Optical Quantum Communications Under Lossy Photon Channels [25.8] コヒーレント状態は光量子通信(OQC)においてますます検討されている。
非直交多重アクセス(NOMA)は、自然にマルチユーザOQCの実装に寄与する。
アップリンクNOMA-OQCシステムのためのSICベースのケネディ受信機を提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:04:36 GMT)
Towards Cross-View Point Correspondence in Vision-Language Models [25.8] クロスビュー対応は、空間的理解と具体的AIの基本的な能力である。
階層設計の総合的なベンチマークであるクロスビューポイント対応タスクとクロスポイントベンチを提案する。
我々のCroPondはCrossPoint-Benchの最先端性能を達成し、Gemini-2.5-Proを39.7%精度で上回っている。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 03:55:16 GMT)
Neural Tucker Convolutional Network for Water Quality Analysis [24.7] 本稿では,水質データ計算のためのニューラルタッカー畳み込みネットワーク(NTCN)モデルを提案する。
3つの実世界の水質データセットの実験により、提案したNTCNモデルは精度でいくつかの最先端の計算モデルより優れていることが示された。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 13:18:38 GMT)
Non-Orthogonal Multiple Access-Based Continuous-Variable Quantum Key Distribution: Secret Key Rate Analysis and Power Allocation [24.5] 悪質な量子攻撃下でのマルチユーザ量子鍵分布問題に対処し、大規模な量子インターネットの実現に不可欠である。
本稿では,新規なアップリンク非直交多重アクセスに基づく連続可変QKD(NOMA-CVQKD)の集団攻撃時の秘密鍵レート(SKR)を最大化する。
本研究では,エントロピーパワーの不等式と最大エントロピー原理による正規ユーザ獲得可能な鍵レートと,ホレボ情報に基づく盗聴者の傍受情報との閉形式境界を導出する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:20:44 GMT)
SparseCoop: Cooperative Perception with Kinematic-Grounded Queries [24.5] SparseCoopは3次元検出と追跡のための完全にスパースな協調認識フレームワークである。
2X-SeqとGriffinのデータセットの実験は、SparseCoopが最先端のパフォーマンスを達成することを示している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 13:22:06 GMT)
Stitch and Tell: A Structured Multimodal Data Augmentation Method for Spatial Understanding [23.4] 既存の視覚言語モデルは、しばしば空間幻覚に悩まされる。
$textStitchとTell$は、構造化された空間的監視をデータに注入する。
SiTeは、空間軸に沿って画像を縫合することで、縫合された画像テキストペアを構成する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 10:07:59 GMT)
LightSearcher: Efficient DeepSearch via Experiential Memory [23.3] 本稿では,DeepSearchパラダイムの精度と効率を両立させる効率的な強化学習フレームワークを提案する。
4つのマルチホップQAベンチマークの実験は、LightSearcherがSOTAベースラインのReSearchに匹敵する精度を維持していることを示している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 04:29:52 GMT)
ELANA: A Simple Energy and Latency Analyzer for LLMs [22.9] 我々は,大規模な言語モデルを評価するための簡単なプロファイリングツールである textbfELANA をオープンソース化した。
Elanaは、モデルサイズ、キー値(KV)キャッシュサイズ、プレフィル遅延を分析するための軽量で学術的フレンドリなプロファイラとして設計されている。
Hugging Faceで利用可能なすべてのモデルをサポートし、簡単なコマンドラインインターフェースとオプションのエネルギー消費ログを提供する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 18:43:47 GMT)
Optimal and Diffusion Transports in Machine Learning [21.7] 機械学習における問題は、時間進化確率分布の設計と解析として自然に表される。
本研究は,拡散法と最適輸送の2つの相補的アプローチの概要を示す。
我々は、サンプリング、ニューラルネットワーク最適化、大規模言語モデルのためのトランスフォーマーのダイナミクスのモデリングなど、両方のアプローチがアプリケーションにどのように現れるかを説明する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 11:25:32 GMT)
Training-Free Policy Violation Detection via Activation-Space Whitening in LLMs [21.6] 本稿では,政策違反検出をアウト・オブ・ディストリビューション検出問題として扱う,トレーニングフリーで効率的な手法を提案する。
ホワイトニング技術にインスパイアされた線形変換を用いて、モデルの隠れたアクティベーションをデコレーションし、平均と単位の分散をゼロに標準化する。
挑戦的な政策ベンチマークでは、既存のガードレールと微調整された推論モデルの両方を超越して、最先端の結果が得られる。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 19:50:32 GMT)
Patronus: Identifying and Mitigating Transferable Backdoors in Pre-trained Language Models [20.7] トランスファー可能なバックドアは、プレトレーニング言語モデル(PLM)サプライチェーンに深刻な脅威をもたらす。
本稿では,パラメータシフトに対するトリガの入力側不変性を利用した新しいフレームワークPatronusを提案する。
Patronusは、バックドア検出リコールを$geq98.7%で達成し、クリーンな設定で攻撃成功率を下げている。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 15:51:56 GMT)
MIND-V: Hierarchical Video Generation for Long-Horizon Robotic Manipulation with RL-based Physical Alignment [20.5] 我々は,長距離ロボット操作の論理的コヒーレントなビデオの合成を目的とした階層型フレームワークであるMIND-Vを紹介する。
認知科学にインスパイアされたMIND-Vは、高レベルの推論とピクセルレベルの合成を橋渡しする。
MIND-Vは、長距離ロボット操作ビデオ生成における最先端の性能を実証する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 02:28:06 GMT)
RAVE: Rate-Adaptive Visual Encoding for 3D Gaussian Splatting [17.2] 本稿では,予め定義された境界間の任意の速度で3DGSを圧縮するフレキシブル圧縮手法を提案する。
本手法は計算量的に軽量であり,任意の速度で再学習する必要がなく,幅広い操作点にまたがるレンダリング品質を保っている。
実験により、このアプローチは動的レート制御を提供しながら効率的で高品質な圧縮を実現し、没入型アプリケーションにおける実用的なデプロイに適していることが示された。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 23:59:46 GMT)
SoK: Trust-Authorization Mismatch in LLM Agent Interactions [16.6] 大規模言語モデル(LLM)は、外の世界と対話できる自律エージェントへと急速に進化している。
本稿ではエージェント・インタラクション・セキュリティのための統一型フォーマルレンズを提供する。
本稿では,信頼と権限のギャップに着目した新たなリスク分析モデルを提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 16:41:02 GMT)
Learning Conditional Independence Differential Graphs From Time-Dependent Data [16.5] 我々は、2つの時系列ガウス図形モデル(TSGGM)の条件独立性(CIG)の違いを推定する。
本稿では,2つの時間依存データの条件変化を特徴付けるために,2つのIPSDの差分を推定する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 18:45:04 GMT)
Neuro-Vesicles: Neuromodulation Should Be a Dynamical System, Not a Tensor Decoration [16.1] 従来のニューラルネットワークに欠ける計算層を拡張したフレームワークであるNeuro-Vesiclesを紹介する。
ベシクルは移動性で離散的なベシクルであり、テンソルの内部ではなくネットワークに沿って生活する。
私たちは、排出、マイグレーション、ドッキング、解放、崩壊、学習への結合など、フレームワークの完全な数学的仕様を提供します。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 19:19:12 GMT)
Fault-Tolerant Information Processing with Quantum Weak Measurement [15.1] 量子弱測定によるフォールトトレラント情報処理手法を提案する。
保護される信号は、ノイズチャネルを介して送信された後、最小限の歪みで取り出すことができる。
提案手法は、長距離量子通信、高感度量子センシング、高精度量子計算におけるノイズ効果を抑制するソリューションを提供する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 01:39:22 GMT)
Robust Optimization-based Autonomous Dynamic Soaring with a Fixed-Wing UAV [15.0] 固定翼無人航空機による自律的動的舞踏の枠組みを提案する。
このフレームワークは、風場の明示的な表現と、UAVの誘導と制御のための古典的なアプローチを利用する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 01:02:46 GMT)
Enhancing Interpretability of AR-SSVEP-Based Motor Intention Recognition via CNN-BiLSTM and SHAP Analysis on EEG Data [14.9] 本研究では,患者のイニシアチブの欠如とセラピストの作業負荷に対処するために,AR-SSVEP(AR-SSVEP)システムを提案する。
我々はHoloLens 2ベースの4つの脳波クラスを設計し、7人の健常者から脳波データを収集して分析する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 08:52:45 GMT)
Spurious Strange Correlators in Symmetry-Protected Topological Phases [14.1] ストレンジ・コレレータは、対称性が保護された位相位相を検出するために広く用いられる強力なツールである。
本報告では,SPT相において不規則な参照状態が突発的な長距離奇数相関を誘導する可能性があることを報告する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 06:54:45 GMT)
Multi-Scale Protein Structure Modelling with Geometric Graph U-Nets [14.0] Geometric Graph U-Netsは、タンパク質グラフの粗大化と精細化により、マルチスケール表現を学習する新しいモデルのクラスである。
実証的に、タンパク質の折りたたみ分類のタスクにおいて、幾何学的U-ネットは不変および同変基底線を著しく上回る。
我々の研究は、生体分子のマルチスケール構造を学習できる幾何学的深層学習アーキテクチャを設計するための原則的な基盤を提供する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:31:34 GMT)
GradientSpace: Unsupervised Data Clustering for Improved Instruction Tuning [13.6] GradientSpaceは、全次元勾配空間でサンプルを直接クラスタするフレームワークである。
オンラインSVDベースのアルゴリズムをLoRA勾配上で動作させ,全てのサンプル勾配を格納するコストを伴わずに潜伏スキルを識別する。
単一で適切な専門家へのルーティングは、事前作業で使用する専門家のアンサンブルよりも優れ、推論遅延を著しく低減することを示す。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 06:35:04 GMT)
Prediction with Expert Advice under Local Differential Privacy [13.2] ローカルディファレンシャルプライバシ(LDP)の制約下におけるエキスパートアドバイスによる予測の古典的問題について検討する。
まず,従来のアルゴリズムが自然に LDP を満たすことを示し,RW-AdaBatch と RW-Meta という2つの新しいアルゴリズムを設計する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 19:31:35 GMT)
STDD:Spatio-Temporal Dynamics-Driven Token Refinement in Diffusion Language Models [12.2] 拡散言語モデル(DLM)は、すべてのトークン位置を並列に反復的に記述することでテキストを生成する。
本稿では,各トークンの時間変動と空間偏差を動的に検出する新しいリマキング手法を提案する。
我々のアプローチは、主要なデータセット間でのDLMの運用効率を大幅に改善し、最大8.9倍のスピードアップを実現します。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 12:53:48 GMT)
Experimental demonstration of scalable quantum cryptographic conferencing [11.8] 量子暗号会議は、セキュアなマルチユーザ通信を実現するためのセキュアな鍵を確立するための重要なソリューションである。
既存のQCC実装は、マルチユーザ同時検出の低い確率で制限されている。
一致検出の必要性を排除したQCCの実験的実現を報告する。
我々は,331.5kmの市販繊維(0.2dB/km)に対応する66.3dBのチャネル損失に対してQCC実験を行い,キーレート5.4bit/sを実現した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 05:18:54 GMT)
Optimal Analysis for Bandit Learning in Matching Markets with Serial Dictatorship [11.7] 本稿では,市場がシリアル独裁を満足する場合に,$Oleft( fracNlog(T)2 + fracKlog(T) right)$ regret bound を求めるマルチレベル連続選択アルゴリズムを提案する。
我々の知る限りでは、市場と盗賊をマッチングする問題の下位境界に一致するアルゴリズムを最初に提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:45:31 GMT)
LLM4SFC: Sequential Function Chart Generation via Large Language Models [11.2] LLM4SFCは産業関数の自然言語記述を受け取り、実行可能なSFCを提供する最初のフレームワークである。
我々は,LLM4SFCを,オープンソースとプロプライエタリの両方を用いて,自動製造プロジェクトから実世界のSFCのデータセット上で評価する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 11:02:45 GMT)
Parameter-Efficient Fine-Tuning with Differential Privacy for Robust Instruction Adaptation in Large Language Models [11.1] 本研究では,大規模言語モデルの微調整におけるプライバシ保護と効率性の問題に対処する。
協調最適化フレームワークにおいて、差分プライバシノイズアロケーションと勾配クリッピングを統合したパラメータ効率の手法を提案する。
本手法は, 精度, プライバシ予算, パラメータ効率においてベースラインモデルを上回る性能を示し, 多様な不確実なデータ条件下での安定した性能を維持する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 08:01:01 GMT)
XM-ALIGN: Unified Cross-Modal Embedding Alignment for Face-Voice Association [11.0] XM-ALIGN (Unified Cross-Modal Embedding Alignment Framework) はICASSP 2026でFAMEチャレンジを提案した。
我々のフレームワークは明示的なアライメント機構と暗黙的なアライメント機構を組み合わせることで、"ハイド"言語と"アンハイド"言語の両方において、クロスモーダルな検証性能を大幅に向上させる。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:41:48 GMT)
ArchPower: Dataset for Architecture-Level Power Modeling of Modern CPU Design [10.9] ArchPowerはアーキテクチャレベルのプロセッサパワーモデリングのための最初のオープンソースデータセットである。
ArchPowerには200のCPUデータサンプルが含まれており、8つの異なるワークロードを実行する際に25の異なるCPU構成から収集される。
各データサンプルには、ハードウェアとイベントパラメータの両方を含む100以上のアーキテクチャ機能がある。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 14:12:06 GMT)
SceneMixer: Exploring Convolutional Mixing Networks for Remote Sensing Scene Classification [10.7] 本稿では,畳み込みミキサーのパラダイムに基づく軽量アーキテクチャを提案する。
AIDおよびEuroSATベンチマークで実験を行った。
提案したモデルでは、AIDデータセットでは74.7%、74.57%、73.79、EuroSATでは93.90%、93.93%、93.22の総合精度が達成された。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 15:07:57 GMT)
Transformation of Biological Networks into Images via Semantic Cartography for Visual Interpretation and Scalable Deep Analysis [10.4] 大規模生物ネットワークを2次元画像の集合に変換するフレームワークであるGraph2Imageを提案する。
この変換はノードをイメージとして分離し、グローバルな受容フィールドとマルチスケールピラミッドを備えた畳み込みニューラルネットワーク(CNN)の使用を可能にする。
大規模な生物学的ネットワークデータセットに適用すると、Graph2Imageは既存の手法よりも67.2%の分類精度を向上した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 23:17:18 GMT)
Configuration Defects in Kubernetes [9.7] オープンソースリポジトリを用いて,2,260のコンフィギュレーションスクリプトから抽出した719の構成欠陥について検討した。
15の欠陥カテゴリのうち8つを検出できる8つの公開静的解析ツールを見つけました。
我々は、深刻な結果をもたらす欠陥の2つのカテゴリを検出するため、どの研究ツールも検出できません。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 00:45:34 GMT)
Progress Ratio Embeddings: An Impatience Signal for Robust Length Control in Neural Text Generation [9.6] 三角波インピーダンス信号に結合した連続的な埋め込みとしてプログレッシブ比埋め込み(PRE)を導入する。
Preは標準のTransformerアーキテクチャにシームレスに統合され、テキストの精度を低下させることなく、安定した長さの忠実度を提供する。
広く使われている2つのニュース要約ベンチマークの実験は、これらの結果を検証する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 17:43:18 GMT)
Rethinking Robustness: A New Approach to Evaluating Feature Attribution Methods [9.2] 本稿では,モデル出力の違いを無視する帰属的堅牢性の概念に挑戦する。
本稿では, 類似入力の新たな定義, 新たなロバスト性指標, 生成的敵ネットワークに基づく新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 05:29:38 GMT)
Graph Convolutional Long Short-Term Memory Attention Network for Post-Stroke Compensatory Movement Detection Based on Skeleton Data [8.9] 脳卒中後の補償運動を検出するために骨格データに基づくグラフ畳み込み長短期記憶注意ネットワーク(GCN-LSTM-ATT)を提案する。
その結果,GCN-LSTM-ATTモデルの検出精度は0.8580に達した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:00:45 GMT)
Quantum Temporal Convolutional Neural Networks for Cross-Sectional Equity Return Prediction: A Comparative Benchmark Study [8.8] QTCNN(Quantum Temporal Convolutional Neural Network)は、古典的時間的エンコーダとパラメータ効率の高い量子畳み込み回路を結合して、断面的等価リターン予測を行う。
QTCNNはシャープ比0.538を達成し、古典的ベースラインを約72%上回っている。
これらの結果は、量子化予測モデルであるQTCNNの量的ファイナンスにおける堅牢な意思決定における実用可能性を強調している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 02:34:24 GMT)
An Analysis of Large Language Models for Simulating User Responses in Surveys [8.6] ユーザ意見をシミュレートするためにLarge Language Modelsを使用することが注目されている。
LLMは、支配的な視点に対する偏見を示すことで知られており、多様な人口統計学的、文化的背景からユーザーを表現する能力に対する懸念を提起している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 15:03:09 GMT)
Quantum Mpemba effect in long-ranged U(1)-symmetric random circuits [8.6] 長距離U(1)対称ランダムユニタリ回路における量子Mpemba効果について検討する。
ムペンバ効果はあらゆる相互作用範囲における傾き強磁性状態に対して存在するが、傾き反強磁性状態には存在しない。
その結果、Mpemba効果は、長距離カオス系における相互作用範囲と初期状態電荷バイアスの相互作用によってどのように支配されるかが明らかとなった。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 10:28:04 GMT)
Overcoming Small Data Limitations in Video-Based Infant Respiration Estimation [7.7] 400本のビデオ(AIR-400)の注釈付き乳児呼吸データセットを導入し,10名の採用被験者から275本の注釈付き動画を公開コーパスに投稿した。
乳児特異的領域検出と時間的ニューラル処理に基づく乳幼児呼吸推定のための最初の再現可能なパイプラインを開発した。
我々は、包括的実験を通じて、視覚に基づく幼児呼吸推定における最先端の再現可能な最初のベンチマークを確立する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 15:25:17 GMT)
BabelCoder: Agentic Code Translation with Specification Alignment [7.6] 本稿では,BabelCoderについて紹介する。BabelCoderは,タスクを特殊なエージェントに分解して,翻訳,テスト,洗練を行うためのエージェントフレームワークである。
BabelCoderは94%のケースで既存のメソッドを0.5%-13.5%上回り、平均精度は94.16%である。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 15:57:54 GMT)
ProAgent: Harnessing On-Demand Sensory Contexts for Proactive LLM Agent Systems [7.6] ProAgentは、大量の感覚コンテキストとLCM推論を利用してプロアクティブアシストを提供するエンドツーエンドのプロアクティブエージェントシステムである。
ProAgent on Augmented Reality (AR) メガネをエッジサーバで実装し,実世界のテストベッド,パブリックデータセット,ユーザスタディを通じて広範囲に評価する。
その結果,ProAgentは最大33.4%,ツールコールF1スコア16.8%,ユーザの満足度が向上した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 08:21:07 GMT)
EfficientECG: Cross-Attention with Feature Fusion for Efficient Electrocardiogram Classification [7.5] 本稿では,ECGデータを効果的に管理・分析するための新しいディープラーニング技術について検討する。
私たちのディープラーニングアプローチは、エンドツーエンドのトレーニングを通じて、ECGデータの特徴を自動的に抽出することができます。
ECGデータセットの評価は、高精度、多機能融合、軽量化の観点から、最先端の作業に対して我々のモデルを検証している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 06:10:14 GMT)
Decoding Motor Behavior Using Deep Learning and Reservoir Computing [7.5] 本稿では,非侵襲的脳機械インタフェース(BMI)の脳波デコードに対する新しいアプローチを提案する。
この制限に対処するため、私たちは、貯水池コンピューティングの卓越したパラダイムであるEcho State Network(ESN)をデコードパイプラインに統合しました。
ESNNetは83.2%のオブジェクト内で、51.3%のLOSOアキュラシーを達成し、広く使われているCNNベースのベースラインを超えています。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 08:29:43 GMT)
Can We Go Beyond Visual Features? Neural Tissue Relation Modeling for Relational Graph Analysis in Non-Melanoma Skin Histology [7.2] 皮膚癌診断における組織像の分類には病理組織像の分画が不可欠である。
現在の畳み込みニューラルネットワーク(CNN)ベースのアプローチは、主に視覚的なテクスチャで動作する。
組織関係モデリング(NTRM)は,組織間の空間的および機能的関係をモデル化する,組織レベルのグラフニューラルネットワークでCNNを拡張する新しいフレームワークである。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 18:04:29 GMT)
Ideal Attribution and Faithful Watermarks for Language Models [7.0] 我々は,文字列に対する帰属決定を推論するための形式的抽象化である理想的な帰属機構を導入する。
我々は,透かし方式の設計目標を理想帰属機構の忠実な表現とみなす。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 23:05:20 GMT)
TextMamba: Scene Text Detector with Mamba [7.0] 本稿では,Mambaをベースとした新しいシーンテキスト検出手法を提案する。
我々はTop_kアルゴリズムを採用し、キー情報を明示的に選択し、Mambaモデリングにおける無関係情報の干渉を低減する。
提案手法は,様々なベンチマークにおいて,最先端または競争性能を実現する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 05:06:19 GMT)
Know your Trajectory -- Trustworthy Reinforcement Learning deployment through Importance-Based Trajectory Analysis [6.8] 我々は、新しい状態重要度を定義・集約することで、軌道全体のランク付けを行う新しい枠組みを導入する。
本研究では,エージェント体験の異種集合から最適軌跡の同定に成功していることを示す。
標準のOpenAI Gym環境における実験により,提案する重要度指標が最適行動の同定に有効であることが検証された。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 16:52:08 GMT)
Symmetric Aggregation of Conformity Scores for Efficient Uncertainty Sets [6.7] 複数の予測器から非整合性スコアを集約する新しい手法であるSACP(Symmetric Aggregated Conformal Prediction)を提案する。
SACP はこれらのスコアを e-値に変換し、任意の対称アグリゲーション関数を用いてそれらを結合する。
我々はSACPが効率を継続的に改善し、しばしば最先端のモデルアグリゲーションベースラインを上回っていることを示す。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 17:54:07 GMT)
LLM-Driven Composite Neural Architecture Search for Multi-Source RL State Encoding [6.6] 複数の情報ソースによる強化学習のための状態エンコーダの設計は未検討であり、しばしば手動設計を必要とする。
我々は、複数のソース固有のモジュールと融合モジュールを共同で最適化する複合ニューラルネットワーク探索(NAS)の課題として、この課題を定式化する。
言語モデルと中間出力信号を利用して,高性能な複合状態エンコーダの探索を誘導するLLM駆動型NASパイプラインを提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 20:25:07 GMT)
The Art of Storytelling in Authoritarian Regimes: Crafting State Narratives on Chinese Social Media [6.6] 本稿では、権威主義体制が、政治的に連続した出来事に関する国家の物語をいかに構築するかを考察する。
そこで我々は,物語構築を形作る2つの次元,正当性含意と市民の検証能力を提案する。
以上の結果から,物語形成における事象形成体制の取り組みの正当性や,物語に強調される信念が示唆された。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 14:30:27 GMT)
CKG-LLM: LLM-Assisted Detection of Smart Contract Access Control Vulnerabilities Based on Knowledge Graphs [5.9] 本稿では,スマートコントラクトにおけるアクセス制御脆弱性を検出するフレームワークであるCKG-LLMを提案する。
CKG-LLMは、自然言語の脆弱性パターンをコントラクト知識グラフ上の実行可能なクエリに変換して、脆弱性のあるコード要素を自動的に特定する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 13:58:37 GMT)
Estimating Black Carbon Concentration from Urban Traffic Using Vision-Based Machine Learning [5.7] 都市部におけるブラックカーボン(BC)の排出は主に交通によるものであり、主要道路に近いホットスポットは地域社会に不均等に影響を与えている。
地元の交通機関からのBCのデータはほとんどなく、地元の要因を狙った政策介入を知らせる助けになる。
本稿では,交通映像から視覚情報を抽出して車両の挙動や状況を把握する機械学習システムを提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 04:14:28 GMT)
Look Twice before You Leap: A Rational Agent Framework for Localized Adversarial Anonymization [5.3] 我々はRLAA(Ralional Localized Adversarial Anonymization)を提案する。
RLAAは、Attacker-Arbitrator-Anonymizerアーキテクチャを特徴とする、完全にローカライズされたトレーニング不要のフレームワークである。
私たちのコードとデータセットは受け入れ次第リリースされます。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 08:03:43 GMT)
A Novel Deep Neural Network Architecture for Real-Time Water Demand Forecasting [5.2] 短期給水予測(StWDF)は、給水システムの最適制御計画の導出の基礎石である。
ディープラーニング(DL)アプローチは、この目的のために最も正確なソリューションを提供する。
極端点における高い予測誤差に加えて、膨大な数のパラメータが原因で複雑な問題に悩まされる。
本研究では,これらの点における誤差を緩和する有効な手法を提案し,実際のデータに仮想データを挿入することでデータを拡張し,その周囲の非線形性を緩和する手法を提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 08:08:49 GMT)
Joint Learning of Feasibility-Aware Signal Temporal Logic and BarrierNet for Robust and Correct Control [5.2] 制御バリア関数(CBF)は、最適化ベースのコントローラの安全性を高める強力なツールとして登場した。
CBFを微分可能二次プログラム(dQP)に組み込む実現可能性を考慮した学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 19:52:27 GMT)
Learning Relative Gene Expression Trends from Pathology Images in Spatial Transcriptomics [5.1] 病理画像からの遺伝子発現推定はRNAシークエンシングコストを低減する可能性がある。
ポイントワイズ損失関数は、予測された遺伝子発現値と絶対的な遺伝子発現値との差を最小限にするために広く用いられている。
本稿では,絶対レベルではなく,相対的な表現パターンを学習する新たな目的を提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 01:05:57 GMT)
Geometry-Induced Vacuum Polarization and Mode Shifts in Maxwell-Klein-Gordon Theory [5.0] 真空工学のための調整可能なノブとして空間曲率が有効であることを示す。」
「我々は空間曲率が真空工学の調整可能なノブとして機能することを示唆している。」
論文参考訳(メタデータ) (Sun, 07 Dec 2025 00:32:21 GMT)
Controllable Emergence of Multiple Topological Anderson Insulator Phases in Photonic Su-Schrieffer-Heeger Lattices [5.0] 1次元Su-Schrieffer-Heeger導波路格子における多重位相絶縁体(TAI)相の出現と制御について検討する。
TAI相の数と幅を正確に設計できることが示される。
この研究は、調整された障害によって駆動される、カスタマイズ可能な位相特性を持つ量子およびフォトニック材料を設計するための汎用的な枠組みを確立する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 14:05:32 GMT)
Phase-multiplexed optical computing: Reconfiguring a multi-task diffractive optical processor using illumination phase diversity [4.8] T相鍵で最適化された共通の微分光学ネットワークは、入力を符号化し、T個の異なる線形変換のいずれかをその出力で正確に実行する。
位相多重化アーキテクチャは変換エラーを大幅に低減し、より大規模な光学変換をモノクロプロセッサで実現する可能性がある。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 05:07:57 GMT)
Hierarchical Image-Guided 3D Point Cloud Segmentation in Industrial Scenes via Multi-View Bayesian Fusion [4.7] 3Dセグメンテーションは、高密度なレイアウトとマルチスケールオブジェクトを持つ複雑なシーンを理解するために重要である。
既存の3Dポイントベースの手法はコストのかかるアノテーションを必要とするが、画像誘導方式はビュー間のセマンティックな不整合に悩まされることが多い。
本稿では,階層的な画像誘導型3次元セグメンテーションフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 15:15:52 GMT)
An Automated Framework for Large-Scale Graph-Based Cerebrovascular Analysis [4.6] CaravelMetricsは自動脳血管分析のための計算フレームワークである。
アトラスに基づく地域パーセレーション、中心線抽出、グラフ構築を統合し、15の形状、トポロジカル、フラクタル、幾何学的特徴を計算する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 14:06:33 GMT)
Financial Fraud Identification and Interpretability Study for Listed Companies Based on Convolutional Neural Network [4.5] 本稿では、畳み込みニューラルネットワーク(CNN)に基づく中国のAシェア上場企業を対象とした金融不正検出フレームワークを提案する。
実験の結果、CNNはロジスティック回帰とLightGBMの精度、堅牢性、早期警戒性能に優れていた。
環境指標は, 主に高汚染産業において重要であり, 可溶性, 比構造, 統治構造, 内部統制が詐欺の一般的な予測要因であることがわかった。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 04:14:16 GMT)
Angular Regularization for Positive-Unlabeled Learning on the Hypersphere [4.5] Positive-Unlabeled (PU)学習は、正の例のサブセットのみをラベル付けした分類問題に対処する。
本稿では,コサイン類似性と角マージンを用いたユニットハイパースフィアで動作する新しいPUフレームワークであるAngularPUを提案する。
我々は、角決定規則のベイズ最適性、学習したプロトタイプの整合性、およびラベルのない分布に対する正規化器の効果に関する理論的保証を提供する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 10:59:35 GMT)
Adaptive Test-Time Training for Predicting Need for Invasive Mechanical Ventilation in Multi-Center Cohorts [4.3] テストタイムトレーニング(TTT)は、このようなシフトを緩和するための有望なアプローチとして登場した。
In orderive Test-Time Training (AdaTTT) は、ITU設定におけるEMHベースのMV予測に適した拡張TTフレームワークである。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 04:27:40 GMT)
Leveraging LLMs to support co-evolution between definitions and instances of textual DSLs [4.0] 本研究では,Large Language Model (LLM) を用いた文法とインスタンス共進化の実現の可能性について検討する。
Claude-3.5 と GPT-4o の2つの先進言語モデルを適用し、7つのケース言語で実験を行い、本手法の有効性と限界を評価した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 13:17:37 GMT)
Statistical structural properties of many-body chaotic eigenfunctions and applications [3.9] 系のエネルギー固有基底の直積と環境に基づいて, EF の平均形状と統計ゆらぎを導出する。
この結果は, (i) 固有状態における中心系の密度行列の減少特性と (ii) 固有状態熱化仮説の枠組みにおける対角圏外滑らか関数の構造の2つの基本的問題に適用する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 21:31:16 GMT)
DAUNet: A Lightweight UNet Variant with Deformable Convolutions and Parameter-Free Attention for Medical Image Segmentation [3.9] Deformable V2 Convolutions と Ultra-Free Attention (SimAM) を統合した新しい軽量 UNet バリアント DAUNet を提案する。
DAUNetのコンテキストや低コントラスト領域に対する堅牢性は、リアルタイムおよびリソース制約のある臨床環境への展開に適していることを証明している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 23:57:00 GMT)
Boosting Unsupervised Video Instance Segmentation with Automatic Quality-Guided Self-Training [3.6] ビデオインスタンス(VIS)は、ピクセルレベルのマスクと時間的一貫性ラベルの二重要求のため、重要なアノテーションの課題に直面している。
我々は、高品質な自己学習を通じてこのギャップを橋渡しする、新しい教師なしのフレームワークであるAutoQ-VISを紹介する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 14:37:12 GMT)
KV-CAR: KV Cache Compression using Autoencoders and KV Reuse in Large Language Models [3.5] KVキャッシュはシーケンス長と埋め込み次元で成長し、しばしばモデル自体のメモリフットプリントを超える。
KV CARは,モデル忠実性を維持しつつ,KVキャッシュストレージを大幅に削減する,統一的で非依存なアーキテクチャフレームワークである。
Wikitext、C4、PIQA、WinograndeデータセットにわたるGPT 2とTinyLLaMAモデルの評価は、KV CARが最大47.85パーセントのKVキャッシュメモリ削減を達成したことを示している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 08:40:52 GMT)
Optimizing video analytics inference pipelines: a case study [3.4] 本稿では,養鶏福祉モニタリングシステムの最適化に関する包括的ケーススタディを提案する。
我々は、マルチレベル並列化、GPUアクセラレーションコードによるCPUコード置換による最適化、ベクトル化クラスタリング、メモリ効率の高い後処理など、一連の最適化を導入する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 21:17:53 GMT)
FedSCAl: Leveraging Server and Client Alignment for Unsupervised Federated Source-Free Domain Adaptation [3.4] 私たちはFedSCAlというFLフレームワークを紹介します。これは、提案したサーバクライアントアライメント(SCAl)メカニズムを利用して、クライアントとサーバモデルの予測を調整することで、クライアントの更新を規則化します。
SCAl機構がクライアントのドリフトを軽減するのに役立ち、クライアントの擬似ラベルの精度が向上するのを観察する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:04:12 GMT)
Selective Masking based Self-Supervised Learning for Image Semantic Segmentation [3.2] 提案手法は従来のランダムマスキング法よりも優れており,下流のセグメンテーション精度に基づいてImageNetを事前訓練する。
提案する選択的マスキング画像再構成法は,エンドツーエンドのセマンティックセマンティックセグメンテーションを改善するために,効果的かつ実用的なソリューションを提供する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 20:21:26 GMT)
Always Keep Your Promises: DynamicLRP, A Model-Agnostic Solution To Layer-Wise Relevance Propagation [3.2] 本稿では,モデルに依存しない LRP フレームワークである DynamicLRP について述べる。
グラフ内の個々の操作に対する属性を分解することにより、遅延活性化分解のための新しいメカニズムを導入する。
この設計はバックプロパゲーションとは独立に動作し、モデル修正なしで任意の計算グラフの操作を可能にする。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 21:19:04 GMT)
RGE-GCN: Recursive Gene Elimination with Graph Convolutional Networks for RNA-seq based Early Cancer Detection [3.2] RGE-GCN(Recursive Gene Elimination with Graph Convolutional Networks)は,単一パイプラインにおける特徴選択と分類を組み合わせたフレームワークである。
提案手法は, 遺伝子発現プロファイルからグラフを構築し, グラフ畳み込みネットワークを用いてがんと正常なサンプルを分類し, 組込み勾配を用いて最も情報性の高い遺伝子をハイライトする。
RGE-GCNは, 肺, 腎臓, 頸部がんのRNA-seqコホートと同様に, 合成データに基づいて評価した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 16:37:34 GMT)
A Hetero-Associative Sequential Memory Model Utilizing Neuromorphic Signals: Validated on a Mobile Manipulator [3.1] 本稿では,移動マニピュレータのためのヘテロ連想型シーケンシャルメモリシステムを提案する。
ロボットの関節状態と触覚観察の間のコンパクトでニューロモルフィックな結合を学習する。
結果は、連想的リコールによって実行されるシングルジョイントとフルアームの動作を示す。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 22:50:01 GMT)
Latent Nonlinear Denoising Score Matching for Enhanced Learning of Structured Distributions [3.1] 遅延非線形 denoising score matching (LNDSM) を提案する。
LNDSMは、非線形フォワードダイナミクスとVAEベースの潜在SGMフレームワークを統合するスコアベース生成モデルの新たなトレーニング目標である。
MNISTデータセットの変種に関する実験により、提案手法は自然に構造化された分布のより高速な合成と学習を実現することを示した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 01:17:14 GMT)
A Unifying Human-Centered AI Fairness Framework [2.9] 8つの異なる公平度指標をカバーする、統一された人間中心の公正度フレームワークを導入する。
このフレームワークは、単一の公正の概念を特権化するのではなく、利害関係者が複数の公正目標に対して重みを割り当てることを可能にする。
重みを調整することで、異なる公平度指標間の微妙なトレードオフが明らかになる。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 17:52:38 GMT)
Ground Compliance Improves Retention of Visual Feedback-Based Propulsion Training for Gait Rehabilitation [2.9] 10人の健康な参加者がカスタムスプリットベルトトレッドミルを歩いた。
全参加者は、地上反応力からリアルタイムで視覚フィードバックを受けた。
あるグループは地上コンプライアンスの変更を経験し、あるグループは視覚的フィードバックのみを受け取りました。
推進型地中反応力(POF)の意図的増加が達成され, 持続した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 15:48:42 GMT)
Physics-Guided Diffusion Priors for Multi-Slice Reconstruction in Scientific Imaging [2.9] 本稿では,分割拡散前の制約と物理に基づく制約を統合するフレームワークを提案する。
これにより、高い再構成品質を維持しながら、GPU当たりのメモリ使用量を大幅に削減できる。
提案手法は,分布内精度を向上し,分布外データセットへの強い一般化を実現する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 20:07:12 GMT)
Towards Small Language Models for Security Query Generation in SOC Workflows [2.8] セキュリティ運用センターのアナリストは、Kusto Query Language(KQL)を使用して、大規模なテレメトリストリームを定期的にクエリする。
適切なKQLを書くには特別な専門知識が必要です。
本稿では,Small Language Models (SLM) が企業セキュリティのために,正確で費用対効果の高い自然言語-KQL翻訳を可能にするかどうかを検討する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 05:18:27 GMT)
From Description to Score: Can LLMs Quantify Vulnerabilities? [2.8] 本研究では,脆弱性評価プロセスを自動化する汎用大規模言語モデル(LLM)の可能性について検討する。
分析の結果、LLMは同一のCVEの多くを誤分類する傾向にあり、アンサンブルベースのメタ分類器は性能を極端に向上させるだけであることがわかった。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 10:47:00 GMT)
CADE: Continual Weakly-supervised Video Anomaly Detection with Ensembles [2.7] ビデオ異常検出(VAD)は、長い間、公共の安全と犯罪防止において重要な問題として研究されてきた。
CADE(Continuous Anomaly Detection with Ensembles)と呼ばれる新しい手法を提案する。
CADEはDual-Generator(DG)を使用して、WVADにおけるデータの不均衡とラベルの不確実性に対処する。
また,過去のシーンで忘れられた異常を捉えるマルチ・ディスクリミネータ(MD)のアンサンブルも提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 13:26:12 GMT)
Do Persona-Infused LLMs Affect Performance in a Strategic Reasoning Game? [2.6] 本研究では,世界支配ボードゲームPERILにおけるペルソナの戦略的パフォーマンスへの影響について検討する。
戦略的思考に関連する特定のペルソナはゲーム性能を向上させるが、仲介者がペルソナを値に変換する際にのみ使用される。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 14:42:29 GMT)
Pseudo Anomalies Are All You Need: Diffusion-Based Generation for Weakly-Supervised Video Anomaly Detection [2.5] 実ビデオと組み合わせた合成擬似異常ビデオから検出器を学習する,世代駆動型アプローチであるPA-VADを導入する。
合成のために,CLIPを用いたクラス関連初期画像を選択し,視覚言語モデルでプロンプトを洗練し,忠実度とシーンの一貫性を向上させる。
トレーニングでは、ドメイン整列正則化モジュールによる合成異常の過度なビデオサイズを緩和する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 13:43:19 GMT)
Reformulate, Retrieve, Localize: Agents for Repository-Level Bug Localization [2.4] 大規模なソフトウェアリポジトリでは、バグのローカライゼーションは依然として重要な課題ですが、時間がかかります。
大規模言語モデル(LLM)の最近の進歩は、クエリのリフォームによってバグのローカライゼーションを改善している。
本研究では,LLMを利用したエージェントが,軽量なクエリ再構成と要約によってファイルレベルのバグローカライズを改善する方法について検討する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 22:25:11 GMT)
Witnessing Spin-Orbital Entanglement using Resonant Inelastic X-Ray Scattering [2.3] エンタングルメントは量子技術において中心的な役割を果たすが、材料の特徴と制御は依然として困難である。
近年のスペクトルベースの絡み合い目撃者の発展により、マクロ材料における多体の絡み合いを定量化するための新しい戦略が実現されている。
我々は、実験到達性共鳴非弾性X線散乱(RIXS)を用いたスピン軌道絡み検出プロトコルを開発した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 08:12:16 GMT)
A Novel Multimodal RUL Framework for Remaining Useful Life Estimation with Layer-wise Explanations [2.3] 転がり要素軸受は機械故障の最も頻発する原因の一つである。
転がり要素軸受は機械故障の最も頻発する原因の一つである。
既存のアプローチは、しばしば、一般化の貧弱、堅牢性の欠如、高いデータ要求、限定的な解釈可能性に悩まされる。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 07:38:36 GMT)
CMV-Fuse: Cross Modal-View Fusion of AMR, Syntax, and Knowledge Representations for Aspect Based Sentiment Analysis [2.3] CMV-Fuseは、人間の言語処理をエミュレートするクロスモーダルビュー融合フレームワークである。
我々のアプローチは4つの言語的視点を体系的に編成する。
CMV-Fuseは、きめ細かい構造パターンと広いコンテキスト理解の両方をキャプチャする。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 06:35:46 GMT)
Control of Powered Ankle-Foot Prostheses on Compliant Terrain: A Quantitative Approach to Stability Enhancement [2.2] 本研究は, 動力補綴物の準剛性を調整し, 歩行安定性を向上するアプタンスベースの制御戦略を実験的に検証する。
その結果, 現実環境における転倒リスクを低減するため, 適応的, 安定性に配慮した補綴制御の可能性が示された。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 15:46:26 GMT)
A Fast and Effective Solution to the Problem of Look-ahead Bias in LLMs [2.1] 提案手法は,大規模ベースモデルのロジットを調整することにより,推論時の生成をガイドする。
本手法は,動詞と意味的知識の両方を効果的に除去し,バイアスを補正し,先行手法より優れていることを示す。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 00:51:31 GMT)
JOCA: Task-Driven Joint Optimisation of Camera Hardware and Adaptive Camera Control Algorithms [2.1] 本稿では,下流視覚タスクを用いたカメラハードウェアと適応カメラ制御アルゴリズムを併用して最適化する手法を提案する。
本稿では、勾配法と微分自由法を統合し、連続パラメータと離散パラメータの両方をサポートする統合フレームワークを提案する。
実験の結果,本手法は静的パラメータと動的パラメータを個別に最適化するベースラインよりも優れていた。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:56:15 GMT)
Partial Inverse Design of High-Performance Concrete Using Cooperative Neural Networks for Constraint-Aware Mix Generation [2.1] 高性能コンクリートは優れた強度と耐久性を提供するが、多くの相互依存変数と実用的な制約を含む複雑な混合設計を必要とする。
本研究では,高性能コンクリートの部分的逆設計のための協調型ニューラルネットワークフレームワークを提案する。
提案モデルは,0.87-0.92の安定かつ高いR二乗値を実現し,オートエンコーダベースラインと比較して平均二乗誤差を50%低減する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 12:14:56 GMT)
SSLfmm: An R Package for Semi-Supervised Learning with a Mixed-Missingness Mechanism in Finite Mixture Models [2.0] 半教師付き学習(SSL)は、観測のサブセットのみをラベル付けしたデータセットから分類器を構築する。
観察が損なわれない可能性は、その特徴ベクトルのあいまいさに依存する可能性があるため、不足過程は有益なものとなる。
このパッケージにはモデリングの実用的なツールが含まれており、シミュレートされた例を通してそのパフォーマンスを説明している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 22:56:45 GMT)
MATEX: A Multi-Agent Framework for Explaining Ethereum Transactions [2.0] マルチホップトークンフロー、ネストされたコントラクト呼び出し、不透明な実行パスによって、ユーザはブラインド署名に陥る。
我々は、トランザクション理解を協調的な調査と組み合わせた素早い仮説生成、動的オフチェーン知識検索、エビデンス・アウェア・シンセサイザー、そして忠実な説明を生み出すための敵対的検証としてモデル化する認知的マルチエージェントフレームワークである(matex)を紹介した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 17:23:55 GMT)
Parametric Design of a Cable-Driven Coaxial Spherical Parallel Mechanism for Ultrasound Scans [1.9] 触覚インターフェースは、外科医がリアルな力と動きのフィードバックを通じて遠隔環境と対話できるようにすることによって、医療的遠隔操作において重要な役割を担っている。
本稿では,これらの課題に対処するために開発されたCable-Driven Coaxial Spherical Parallel Mechanism (CDC-SPM)の設計方法論と解析について述べる。
提案するケーブル駆動インタフェースの設計により,ロボットアームのエンドエフェクタに装着した重量を低減し,慣性負荷を最小限に抑え,剛性を高め,動的応答性を向上させることができる。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 20:58:41 GMT)
Prompting-in-a-Series: Psychology-Informed Contents and Embeddings for Personality Recognition With Decoder-Only Models [1.8] 本研究は,PICEPRと呼ばれる新アルゴリズム「Prompting-in-a-Series」を紹介する。
PICEPRアルゴリズムは、パーソナリティ認識のための最新のパフォーマンスを5~15%改善した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 20:52:00 GMT)
Automated PRO-CTCAE Symptom Selection based on Prior Adverse Event Profiles [1.8] 本稿では,過去の安全データに基づいて,最小限かつ包括的なProto-CTCAEサブセットを自動選択する手法を提案する。
有害事象PTの履歴リストに関連のある候補POP項目をそれぞれスコアし,関連性と頻度を実用機能に組み合わせた。
このアプローチは、MedDRAのセマンティクスと履歴データを活用することにより、Proto-CTCAE設計を合理化することができる。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 16:56:27 GMT)
Pathway to $O(\sqrt{d})$ Complexity bound under Wasserstein metric of flow-based models [1.7] We provide tools to estimates the error of flow-based generative model under the Wasserstein metric。
この誤差は、次元と独立にスケールする後方流のプッシュフォワード写像のリプシッツ性という2つの部分によって明示的に制御できることを示す。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 07:26:39 GMT)
Enhanced Single-Photon Detector: A framework for Superconducting-Level Performance without cryogenic cooling [1.6] 高性能単光子検出器(SPD)は、幅広い量子光学応用に必須である。
高性能SPDを実現するための新しいパラダイムであるESPD(Enhanced Single-Photon Detector)フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 12:32:30 GMT)
Energy-Efficient Navigation for Surface Vehicles in Vortical Flow Fields [1.5] カラシは海流を巧みに利用し 最小限の努力で 広大な海を航行した
渦流場におけるエネルギー効率の高い表面車両ナビゲーションのための学習に基づくアプローチを提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 16:36:31 GMT)
Physics Informed Human Posture Estimation Based on 3D Landmarks from Monocular RGB-Videos [1.3] BlazePoseのような最先端モデルは、リアルタイムのポーズトラッキングに優れていますが、解剖学的制約の欠如は、物理的な知識を含めることで、改善の可能性を示しています。
本稿では、重み付け最適化を用いたBlazePose 3Dと2D推定の長所を生かしたリアルタイム後処理アルゴリズムを提案する。
Physio2.2Mデータセットによる評価では、3D MPJPEが10.2%減少し、BlazePoseの3D推定に比べて16.6%減少している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 10:54:09 GMT)
It's About Time: The Temporal and Modal Dynamics of Copilot Usage [1.1] 私たちは2025年1月から9月にかけて、MicrosoftのCopilotと375万の会話を分析しました。
AIの使い方は、コンテキストやデバイスの種類によって異なります。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 21:45:20 GMT)
Cognitive Control Architecture (CCA): A Lifecycle Supervision Framework for Robustly Aligned AI Agents [1.0] LLMエージェントはIPI(Indirect Prompt Injection)攻撃に対して脆弱である。
IPIは外部情報ソースを汚染することでハイジャックエージェントの動作を攻撃している。
本稿では,全ライフサイクルの認知管理を実現するための総合的な枠組みである認知制御アーキテクチャ(CCA)を提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 08:11:19 GMT)
A Physics-Aware Attention LSTM Autoencoder for Early Fault Diagnosis of Battery Systems [0.8] 物理認識型LSTMオートエンコーダ(PA-ALSTM-AE)を提案する。
このフレームワークは、多段階融合機構を通じて、バッテリー老化法則(マイル)をディープラーニングパイプラインに明示的に統合する。
大規模なVloong実世界のデータセットの実験では、提案手法が最先端のベースラインを大幅に上回ることを示した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 11:58:09 GMT)
One Word Is Not Enough: Simple Prompts Improve Word Embeddings [0.8] 埋め込み前の単語に対して単に意味的なプロンプトを予測すれば、単語の類似性相関が大幅に改善されることを示す。
また,SimLex-999では,「意味:単語」や「意味概念:単語」などのプロンプトによって,スピアマン相関が+0.29まで改善されることがわかった。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:17:10 GMT)
Stochasticity in Agentic Evaluations: Quantifying Inconsistency with Intraclass Correlation [0.7] クラス内相関係数(ICC)は、測定科学から分散を特徴づける指標である。
ICCは観測されたばらつきを、問合せ間分散(タスク困難)と問合せ内分散(エージェント不整合)に分解する
我々は、ICCが構造化タスクのn=8-16と複雑な推論のn>=32で収束し、実践者がエビデンスベースの再サンプリング予算を設定することを実証した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 07:58:13 GMT)
A Patient-Doctor-NLP-System to contest inequality for less privileged [0.7] この研究は、視覚障害者やヒンディー語のような低リソース言語話者が利用できる限られたサポートに対処する。
本稿では, モデル蒸留, 周波数領域変調, アンサンブル学習, ランダム化アクティベーションパターンを統合した小型トランスフォーマーアーキテクチャであるPDFTEMRAを提案する。
その結果, PDFTEMRA は計算性能が著しく低く, 高い性能を示した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 08:59:15 GMT)
Academic journals' AI policies fail to curb the surge in AI-assisted academic writing [0.7] 我々は5,114のジャーナルと520万以上の論文を分析し、AI利用ガイドラインの現実的な影響を評価する。
論文の70%がAIポリシーを採用しているにもかかわらず、研究者のAI記述ツールの使用は、分野によって劇的に増加していることを示す。
我々の発見は、現在のポリシーが透明性を促進したり、AIの採用を抑えられなかったことを示唆している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 07:30:53 GMT)
FlatFormer: A Flat Transformer Knowledge Tracing Model Based on Cognitive Bias Injection [0.6] 知識追跡モデルは重要なパフォーマンス-複雑トラップ」に直面している
構造的積み重ねによる情報注入の新たな設計パラダイムに基づく合理化アーキテクチャであるFlatFormerを提案する。
4つの大規模なデータセットに対する実験は、FlatFormerが最先端のパフォーマンスを達成することを示している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 02:32:10 GMT)
METRION: A Framework for Accurate Software Energy Measurement [0.5] 情報通信技術部門は2020年の温室効果ガス排出量の1.4%を占めている。
この環境影響を低減するため、ITインフラやアプリケーションレベルでのエネルギー消費を減らすために最適化戦略が採用されている。
スレッドレベルでのCPUおよびDRAM上のアプリケーションのエネルギー消費を定量化するエネルギー属性モデルを提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 11:45:16 GMT)
Single Flux Quantum Circuit Operation at Millikelvin Temperatures [0.5] 単一磁束量子(SFQ)回路は、リモート、バルク、パワーハングリーの室温エレクトロニクスに代わる有望な代替手段を提供する。
SFQ回路はミリケルビン温度での量子プロセッサの動作に適応しなければならない。
SEEQCのSFQuClassデジタル量子マネージメントアプローチは、エネルギー効率の良いSFQ回路とキュービットをマルチチップモジュールに配置する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 15:41:38 GMT)
On possible extensions of quantum mechanics [0.5] 量子力学は、自由に選択された測定値に予測力を改良した拡張は不可能であるとの主張がなされた。
量子力学と代替理論の予測力の結論に影響を及ぼすことなく、測定仮定をさらに緩和できることを示す。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 19:04:50 GMT)
Physics Informed Generative Machine Learning for Accelerated Quantum-centric Supercomputing [0.5] PIGen-SQDは、生成機械学習(ML)の機能を利用する、効率的に設計された量子スーパーコンピュータ(QCSC)ワークフローである。
PIGen-SQDはQCSCアルゴリズムの堅牢性とスケーラビリティを向上し、実用規模の量子ハードウェア上での化学的に信頼性の高い量子シミュレーションへの有望な経路を提供する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 14:27:12 GMT)
Interplay between Standard Quantum Detailed Balance and Thermodynamically Consistent Entropy Production [0.3] 量子マルコフ半群が標準的な量子詳細バランス条件を満たすならば、その生成元は消滅するエントロピー生成率をもたらす特別な表現を許容する。
逆に、生成元が熱力学的整合性の条件に固執し、消滅するエントロピー生成率につながる特別な表現を認めた場合、対応する量子マルコフ半群は標準量子詳細バランス条件を満たす必要がある。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 07:37:35 GMT)
Arc Gradient Descent: A Mathematically Derived Reformulation of Gradient Descent with Phase-Aware, User-Controlled Step Dynamics [0.3] 本稿ではライオンオプティマイザの定式化と評価について述べる。
評価はまず、不適合な実装機能とベンチマークで実施される。
注目すべきは、AdamとAdamWは5,000で強力な初期イテレーションを見せたが、AdamGDは早期に停止することなく改善を続けたことである。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:03:45 GMT)
Large Language Model-Based Generation of Discharge Summaries [0.2] 退院サマリー(英: discharge summaries)とは、医療専門家が、患者の医療施設への訪問を詳述した文書である。
オープンソースモデル(Mistral, Llama 2)からプロプライエタリシステム(GPT-3, GPT-4, Gemini 1.5 Pro)まで,5つの大規模言語モデルの利用について検討する。
以上の結果から,プロプライエタリモデル,特にワンショットプロンプト付きジェミニは,他のモデルよりも優れており,ゴールド標準モデルと最も類似したサマリーが得られた。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 12:14:41 GMT)
Transferring Clinical Knowledge into ECGs Representation [0.2] 本稿では,マルチモーダル臨床データから強力なECGエンコーダへ知識を伝達する新しい3段階トレーニングパラダイムを提案する。
我々は、文脈的臨床情報に富んだ心電図表現を作成するために、自己監督型、共同埋め込み型プレトレーニングステージを用いている。
モデルの出力を説明する間接的な方法として、ECG埋め込みから直接、関連する実験室の異常を予測できるように訓練する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 22:19:24 GMT)
Comparing BFGS and OGR for Second-Order Optimization [0.2] 一般的なBFGS法で使用されている古典的なシャーマン・モリソンの更新を比較した。
BFGSとは異なり、OGR は一般(必ずしも正ではない)ヘッセン反転を推定できる。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 19:26:26 GMT)
PARIS: Pruning Algorithm via the Representer theorem for Imbalanced Scenarios [0.1] textbfPARISはトレーニングセット自体を固定することで不均衡を緩和する原則付きフレームワーク
この結果から,表現誘導型データセットプルーニングは,レアイベント回帰に対する強力な,解釈可能な,計算的に効率的なアプローチであることが示唆された。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 18:05:20 GMT)
Efficient graph-diagonal characterization of noisy states distributed over quantum networks via Bell sampling [0.1] グラフ状態は、量子ネットワークにおける分散情報処理と通信の鍵となる、絡み合った状態の重要なクラスである。
本稿では,Bellサンプリングサブルーチンを用いて,ネットワークに分散したノイズグラフ状態のグラフベースにおける対角要素を特徴付けるプロトコルを提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 04:19:09 GMT)
The Impact of Data Characteristics on GNN Evaluation for Detecting Fake News [0.0] グラフニューラルネットワーク(GNN)は、ソーシャルメディア上のニュース記事の内容と伝播構造をモデル化することにより、偽ニュースの検出に広く利用されている。
GossipCop と PolitiFact の2つの最もよく使われているベンチマークデータセットは、伝播構造を使用するモデルの実用性を評価するのにはあまり適していない。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 03:00:38 GMT)
Hidden Leaks in Time Series Forecasting: How Data Leakage Affects LSTM Evaluation Across Configurations and Validation Strategies [0.0] 本研究では,データ漏洩が性能に与える影響について検討する。
これは、バリデーション設計が漏洩感度をどのように仲介するかに焦点を当てている。
これらの知見は、構成対応、リーク耐性評価パイプラインの必要性を浮き彫りにした。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 17:21:27 GMT)
Evaluating the Sensitivity of BiLSTM Forecasting Models to Sequence Length and Input Noise [0.0] Bidirectional Long Short-Term Memory (BiLSTM)アーキテクチャは、複雑な時間的依存関係のキャプチャに特に有効である。
本研究では,入力シーケンス長と付加雑音の2つの重要なデータ中心因子について,系統的な実験的検討を行った。
実世界の3つのデータセットを用いて制御実験を行い、異なる入力条件下でのBiLSTM性能を評価する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 17:10:06 GMT)
Virtual Qudits for Simon's Problem: Dimension-Lifted Algorithms on Qubit Hardware [0.0] この研究は、量子ビットハードウェア上でSimonのアルゴリズムのquditバージョンをシミュレートするための一般的な構成を導入する。
我々は次元dの隠れシフトを符号化した次元持ち上げオラクルを構築し、キュービットゲートのみを用いてその動作を実現する方法を示す。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:39:50 GMT)
Utilizing Multi-Agent Reinforcement Learning with Encoder-Decoder Architecture Agents to Identify Optimal Resection Location in Glioblastoma Multiforme Patients [0.0] Glioblastoma Multiforme (GBM) は5年生存率5.1%で世界でもっとも死亡率の高いヒト癌である。
このプロジェクトは、診断と治療計画の両方で医師を支援することで、唯一のエンドツーエンドソリューションを提供するAIシステムを開発する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 20:51:59 GMT)
Uniqueness ratio as a predictor of a privacy leakage [0.0] 個々のデータセットが個別に匿名化されている場合でも、独立データベースが結合されたときにアイデンティティリークが発生する可能性がある。
本研究では,再同定リスクの早期予測因子として,候補結合属性の特異性比について検討した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 20:04:26 GMT)
Traversability Aware Autonomous Navigation for Multi-Modal Mobility Morphobot (M4) [0.0] この論文は、M4ロボットプラットフォームのためのトラバーサビリティ対応ナビゲーションフレームワークを提示する。
CNNベースのモデルが標高マップを処理し、走行可能性スコアを推定し、経路計画のためのナビゲーションコストに変換する。
カスタムのA*プランナーは、これらのコストを幾何学的距離とエネルギー消費と組み合わせて、貿易の適度な距離が増加する経路を見つける。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 17:28:34 GMT)
TopiCLEAR: Topic extraction by CLustering Embeddings with Adaptive dimensional Reduction [0.0] TopiCLEAR: 適応次元還元による埋め込みのクラスタリングによるトピック抽出について述べる。
我々は、20News、AgNewsTitle、Reddit、TweetTopicの4つの多様なデータセットに対するアプローチを評価した。
本手法はより解釈可能なトピックを生成し,ソーシャルメディアデータやWebコンテンツ分析への応用の可能性を強調した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 07:01:28 GMT)
The uncharted space of non-Hermitian solutions to the Hartree-Fock and Kohn-Sham equations [0.0] 物理化学における問題は、環境に結合したシステムである。
環境に結合していない系であっても、単一の電子が残りの電子の浴に結合していることが示される。
対応する自己整合状態は、Hartree-Fock (HF) 方程式とKohn-Sham (KS) 方程式に対する新しい未チャートな解空間を表す。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 23:47:52 GMT)
The Principle of Proportional Duty: A Knowledge-Duty Framework for Ethical Equilibrium in Human and Artificial Systems [0.0] 本稿では,倫理的責任がエージェントのてんかん状態とどのようにスケールするかをモデル化する新しい枠組みであるProportional Duty(PPD)について紹介する。
不確実性の増加に伴い、Action Duty(決定的に行動する義務)は、補修デューティ(不確実性を確認し、調査し、解決する活動的義務)に比例的に変換される。
本稿では,臨床倫理,受取権法,経済ガバナンス,人工知能の4分野にまたがる枠組みを適用し,学際的妥当性を実証する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 02:37:07 GMT)
The Online Discourse of Virtual Reality and Anxiety [0.0] 本研究の目的は,バーチャルリアリティと不安に関するオンライン議論に光を当てた単語と単語ネットワークを識別するために,コーパス言語方法論を用いたことである。
この研究の結果は、イングリッシュトレンド・コーパスに基づいて、VR、Oculus、ヘッドセットをVRおよび不安サブコーパスの中で最も頻繁に議論されるものとして特定した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 05:06:09 GMT)
The Meta-Learning Gap: Combining Hydra and Quant for Large-Scale Time Series Classification [0.0] 時系列分類は精度と計算効率の基本的なトレードオフに直面している。
2つの効率的なアルゴリズムの組み合わせがアンサンブルの利点を捉えることができるかどうかを検討する。
10個の大規模なMONSTERデータセットの性能評価を行った。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 05:37:40 GMT)
The Fine-Structure Constant as a Scaled Quantity [0.0] 約1/137の微細構造定数アルファは、伝統的に基本的な次元を持たないパラメータと見なされている。
代わりに、アルファは古典的電磁論(e)、量子力学(h-bar)、特殊相対性理論(c)によって生じる構造的スケールのみが生じるスケールの量であると主張する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 22:41:47 GMT)
The Evolution of Agentic AI in Cybersecurity: From Single LLM Reasoners to Multi-Agent Systems and Autonomous Pipelines [0.0] サイバーセキュリティはエージェントAIのアーリーアダプターの1つになった。
この調査は、サイバーセキュリティにおけるエージェントAIの5世代分類を提示する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 05:10:16 GMT)
Task adaptation of Vision-Language-Action model: 1st Place Solution for the 2025 BEHAVIOR Challenge [0.0] 我々は,2025年のBehavior Challengeで優勝したビジョンアクション政策を提示する。
BEHAVIOR Challengeは、写真リアリスティックなシミュレーションで50種類の多種多様な家庭用タスクを特徴とする大規模なベンチマークである。
このアプローチは、パブリックとプライベートの両方のリーダボード上の50のタスクすべてに対して、26%のqスコアを実現しています。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 18:08:45 GMT)
Suppressing Fast Dipolar Noise in Solid-State Spin Qubits [0.0] ハイブリッドLGはバス内双極子相互作用を抑制し、スピン量子ビットに作用する高速ノイズを発生させる。
我々は、最も広く利用されている固体量子プラットフォームの一つを調査する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 18:00:51 GMT)
Space efficient implementation of hypergraph dualization in the D-basis algorithm [0.0] 我々は,Small Spaceと呼ばれる$D$-basisアルゴリズムの新たな実装を提案する。
新しいバージョンでは、唯一の出力は、$D$-basisからの影響の先行する属性の頻度である。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 20:47:36 GMT)
Small-Gain Nash: Certified Contraction to Nash Equilibria in Differentiable Games [0.0] 我々は,ブロック重み付き幾何学において,ブロック小利得条件であるスモールゲインナッシュ(SGN)を導入する。
SGNは局所曲率とクロスプレイヤのリプシッツ結合境界をトラクタブルな収縮証明書に変換する。
ユークリッドの単調性解析が収束の予測に失敗する二次ゲーム上で、この枠組みを検証する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 11:11:36 GMT)
Significant Other AI: Identity, Memory, and Emotional Regulation as Long-Term Relational Intelligence [0.0] この原稿は、リレーショナルAIの新しいドメインとして、意味のある他の人工知能(SO-AI)を紹介している。
心理学的・社会学的理論を合成してSO関数を定義し、SO-AIの要件を導出する。
人為的インタフェース,関係認知層,ガバナンス層からなる概念的アーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 02:33:36 GMT)
Real-Time Dynamics in Two Dimensions with Tensor Network States via Time-Dependent Variational Monte Carlo [0.0] 2次元量子力学のための安定かつ効率的な時間依存型モンテカルロフレームワークを開発する。
PEPS-tVMC は T = 12 まで高い精度で自由フェルミオン力学と一致する。
その結果、PEPS-tVMCは2次元のリアルタイム量子力学の実用的で汎用的なツールとして確立された。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 10:02:30 GMT)
Quantum catalysis-enhanced extract energy in qubit quantum battery [0.0] 本研究では、外場駆動の量子ビットQBと高調波発振器触媒を結合した量子ビットQBについて検討し、鍵となる熱力学機構を明らかにした。
この逆流は、劣化する損失に積極的に対処し、クビットを急速に非パッシブ状態に押し込み、抽出可能な作業の劇的な増強をもたらす。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 13:35:04 GMT)
Quantum Correlation Assisted Cooling of Microwave Cavities Below the Ambient Temperature [0.0] 内部相関した2レベル系のポアソン流を用いたマイクロ波空洞モードの冷却に関する理論的枠組みを開発した。
2つの超伝導量子ビットを3次元キャビティ内で繰り返し準備し,結合し,リセットした実験実装について概説した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 21:03:20 GMT)
PrivLLMSwarm: Privacy-Preserving LLM-Driven UAV Swarms for Secure IoT Surveillance [0.0] この研究は、UAVスワム調整のためのセキュアなLLM推論を実行するプライバシー保護フレームワークであるPrivLLMSを紹介している。
強化学習によって強化された細調整のGPTベースのコマンドジェネレータは、機密性を保ちながら信頼性の高い命令を提供する。
PrivLLMSwarmは、プライバシに敏感なIoTアプリケーションにおいて、セキュアでLLM対応のUAVスワムの実践的な基盤を確立する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:20:14 GMT)
Predictive Modeling of I/O Performance for Machine Learning Training Pipelines: A Data-Driven Approach to Storage Optimization [0.0] 現代の機械学習トレーニングは、計算よりもデータI/Oによってますますボトルネックになっている。
本稿では,機械学習によるI/O性能の予測と,MLトレーニングパイプラインのための最適なストレージ構成を提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 07:25:08 GMT)
POLARIS: Is Multi-Agentic Reasoning the Next Wave in Engineering Self-Adaptive Systems? [0.0] POLARISは3層多層自己適応フレームワークである。
不確実性に対処し、過去の行動から学び、その戦略を進化させる。
SWIMとSWITCHの2つの自己適応型指数に対する予備評価は、POLARISが一貫して最先端のベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 08:54:00 GMT)
Optimal Transport of a Free Quantum Particle and its Shape Space Interpretation [0.0] 自由シュルディンガー方程式の解は最適輸送によって研究される。
最終的にこの解は、いわゆる形状空間における曲線として自然に解釈できることが示されている。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 17:47:49 GMT)
On Memory: A comparison of memory mechanisms in world models [0.0] 本稿では,複数のメモリ拡張機構の解析により,トランスフォーマーを用いた世界モデルの有効メモリスパンについて検討する。
メモリエンコーディングとメモリインジェクションのメカニズムを区別する分類法を導入し、世界モデルのメモリ拡張におけるそれらの役割を動機づける。
本研究は,記憶機構が視覚変換器の有効メモリ幅を向上し,世界モデルの想像力内でループ閉鎖を完了するための経路を提供することを示す。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 20:29:20 GMT)
Model-Less Feedback Control of Space-based Continuum Manipulators using Backbone Tension Optimization [0.0] 連続マニピュレータは、閉じ込められた、障害物の多い環境でのナビゲーションのディクスタリティと安全なコンプライアンスを提供する。
無限次元のバックボーン変形、非モデル化内部摩擦、構成に依存した剛性は、モデルベースキネマティックな定式化の信頼性を制限する。
この研究は、微分凸更新を通じてオンラインに改良された経験的に固有のヤコビアンを用いて、キネマティックモデリングをバイパスする完全なモデルレス制御フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:34:28 GMT)
Memory Power Asymmetry in Human-AI Relationships: Preserving Mutual Forgetting in the Digital Age [0.0] メモリパワー非対称性(英: Memory Power Asymmetric、MPA)は、あるAI対応企業が、関係の共有履歴を記録し、保持し、取得し、統合する能力にかなり優れているときに発生する。
MPAは、ある関係のパートナーが、関係の共有履歴を記録し、保持し、取得し、統合する能力を持つときに生じる構造的パワーの不均衡である。
我々の分析では、MPAを情報非対称性、プライバシー、監視、顧客関係管理に関する別な構成として位置づけている。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 01:34:19 GMT)
Mechanistic Interpretability of GPT-2: Lexical and Contextual Layers in Sentiment Analysis [0.0] 我々は,早期語彙検出と中層文脈統合を含む仮説化された2段階感情アーキテクチャを検証した。
実験により、初期層(0-3)が語彙的感情検知器として機能し、文脈に依存しない安定した位置特異的極性信号を符号化した。
中層特殊化の代わりに, 否定, 皮肉, ドメインシフトなどの文脈現象が, 統合された非モジュラー機構によって, 主に後期層(8-11)に集積されることが判明した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 06:36:35 GMT)
Measuring Over-smoothing beyond Dirichlet energy [0.0] 本稿では,高次特徴関数のエネルギーに基づくノード類似度尺度のファミリーを提案する。
提案手法を用いて評価すると,注目に基づくグラフニューラルネットワーク(GNN)が過度なスムース化に悩まされることが分かる。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 10:53:22 GMT)
Maximum Independent Set via Probabilistic and Quantum Cellular Automata [0.0] まず、動的にシステムを最大独立集合の多様体に向けて駆動する同期PCAを紹介する。
この振る舞いを動機として、純散逸相と制約保存ユニタリ進化を組み合わせたQCAを構築する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 10:33:52 GMT)
Mathematics of natural intelligence [0.0] 本稿では,心の認知構造に関する数学的モデルを提案する。
認知細胞は機能系と細胞アンサンブルの2つのタイプの相互結合したCOG(神経細胞の認知グループ)から構成される。
本稿は、P.K. Anokhinによる「自然」分類理論、E. Rocheによる分類理論、Bob Rehterによる因果モデル理論、G. Tononiによる統合情報としての意識理論を提示する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 10:15:00 GMT)
Masked Autoencoder Pretraining on Strong-Lensing Images for Joint Dark-Matter Model Classification and Super-Resolution [0.0] DeepLense ML4SCIベンチマークによる高輝度画像のMasked Autoencoder(MAE)事前学習戦略
我々は、マスク画像モデリングの目的を用いてビジョントランスフォーマーエンコーダを事前訓練し、各タスクごとに個別に微調整する。
超高解像度(16x16から64x64)では、PSNR 33 dBとSSIM 0.961で画像を再構成し、スクラッチトレーニングよりもわずかに改善した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 03:25:19 GMT)
Managed TLS Under Migration: Authentication Authority Across CDN and Hosting Transitions [0.0] 本研究では、管理されたTLSプラットフォームが、当初発行・保管されていたプラットフォームからドメインが移動された際にどのように振る舞うかを検討する。
DNSリゾルバが新たなインフラストラクチャにトラフィックを誘導した後でも,プラットフォームは同じ証明書を期限切れまで提供し続けることが,測定によって確認されている。
認証機関は、委任期間に発行された証明書の生涯にわたって、以前のプラットフォームに留まっていることを示している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 22:52:52 GMT)
Learning to Hedge Swaptions [0.0] 本稿では,スワクションの動的ヘッジのための強化学習(RL)に基づくディープヘッジフレームワークについて検討する。
我々は、代替リスクの選好を捉えるために、3つの異なる目的関数の下でエージェントを設計する。
以上の結果より,2つのスワップをヘッジ楽器として使用する場合,ほぼ最適ヘッジ効果が得られた。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 03:00:52 GMT)
Large Language Models and Forensic Linguistics: Navigating Opportunities and Threats in the Age of Generative AI [0.0] 大規模言語モデル(LLM)は、スケーラブルなコーパス分析と埋め込みベースのオーサシップ属性を実現する強力な分析ツールとして機能する。
近年のスタイリスティックな研究は、LLMが表面のスタイリスティックな特徴を近似できるが、ヒトのライターとの違いが検出可能であることを示唆している。
この論文は、法医学的言語学は科学的に信頼性があり法的に許容されるように、方法論的な再構成を必要とすると結論付けている。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 17:05:31 GMT)
High-harmonic generation driven by temporal-mode quantum states of light [0.0] 我々は、電磁場の時間モード展開に基づく光の量子状態によって駆動される高調波発生の理論的枠組みを開発する。
光の量子状態によって駆動される自由空間HHGは、平均的な半古典計算によって正確に記述されることを示す。
極小モード体積のナノフォトニック環境を,光子強磁場過程が真に量子的シグネチャを示す可能性のあるプラットフォームとして論じる。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 00:04:46 GMT)
Hierarchical Deep Learning for Diatom Image Classification: A Multi-Level Taxonomic Approach [0.0] 分類,順,系統,属,種を共同で予測する5つのカスケード頭部を有する階層的畳み込みネットワークを導入する。
82種を対象とする1,456個の珪藻画像のフィルタリングデータセットを用いて,同一条件下での階層モデルと平坦モデルを比較した。
階層モデルは種レベルでの平坦な基準線(69.4%の精度)と一致し、上位の分類学レベルでは優れる。
92.5%の誤分類種が正確に属レベルで予測され、67.2%は平坦な基準線である。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 01:06:13 GMT)
From Quantum Chaos to Classical Chaos via Gain-Induced Measurement Dynamics in a Photon Gas [0.0] 量子力学から古典的なカオスがどのように現れるかは、依然として中心的な疑問である。
重要な洞察は、この量子古典的リンクが測定プロセスによって提供されることである。
このメカニズムが自然に古典的なカオス行動を引き起こすことを示す。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 23:44:56 GMT)
Formal that "Floats" High: Formal Verification of Floating Point Arithmetic [0.0] 本稿では,金の基準モデルに対する直接RTL-RTLモデルによる浮動小数点演算の検証方法を提案する。
この方法論はエージェントAIベースの形式的プロパティ生成によって拡張され、大規模言語モデル(LLM)駆動の自動化とHuman-in-the-Loop(HITL)の洗練を統合する。
その結果, RTL-to-RTLモデルの直接チェックは, 適用効率が向上し, スタンドアロンの検証よりもアサーションが少なくなることがわかった。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 14:03:44 GMT)
FVA-RAG: Falsification-Verification Alignment for Mitigating Sycophantic Hallucinations [0.0] Falsification-Verification Alignment RAG(FVA-RAG)は、検索パラダイムをインダクティブ・検証(探索支援)からデダクティブ・ファルシフィケーション(耐障害性を参照)へ移行するフレームワークである。
この「アンチ・コンテクスト」に対する草案回答を明示的に重み付けする二重検証機構を導入する。
一般的な誤解のデータセットに関する予備実験では、FVA-RAGは標準的なRAGベースラインと比較して、幻覚に対する堅牢性を大幅に向上することが示された。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 21:28:42 GMT)
Exploring electron spin dynamics in spin chains using defects as a quantum probe [0.0] 電子スピン共鳴による二量体鎖のトポロジカル欠陥(エッジ状態)の量子力学について検討する。
我々の研究は、電子スピン格子緩和がフォノン・ボトルネック法によって最低温度で制御されていることを明らかにした。
両端状態間有効双極体は鎖内交換結合により減少することを示す。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 08:26:45 GMT)
Enhancing ground-state interaction strength of neutral atoms via Floquet stroboscopic dynamics [0.0] 中性原子系は量子シミュレーションと計算のための有望なプラットフォームである。
本質的に弱い基底状態相互作用は、スケーラブルな量子シミュレーションと計算の進歩に大きな限界をもたらす。
本稿では,リドベルク原子アンサンブルのフロケ変調による中性原子の基底状態相互作用強度の向上手法を提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 09:50:11 GMT)
Enhancing Admission Inquiry Responses with Fine-Tuned Models and Retrieval-Augmented Generation [0.0] 本稿では、微調整言語モデルとRetrieval-Augmented Generation(RAG)を組み合わせたAIシステムを提案する。
RAGは、大規模なデータセットから関連する情報を取得するが、大学入試のような狭い複雑な領域のパフォーマンスは、適応なしに制限することができる。
我々は、入力プロセスに特有のキュレートされたデータセット上でモデルを微調整し、RAGが提供するデータを正確に解釈し、ドメイン関連出力を生成する能力を向上した。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 18:14:16 GMT)
Deep Reinforcement Learning for Phishing Detection with Transformer-Based Semantic Features [0.0] フィッシング(英: Phishing)とは、個人が個人情報を明らかにすることを欺くサイバー犯罪である。
本研究では,RoBERTaセマンティック埋め込みを手作り語彙特徴と統合したQuantile Deep Q-Network (QR-DQN)アプローチを提案する。
PhishTank、OpenPhish、Cloudflare、その他のソースから105,000のURLのさまざまなデータセットが収集された。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 17:08:12 GMT)
CoGraM: Context-sensitive granular optimization method with rollback for robust model fusion [0.0] リトレーニングなしのニューラルネットワークのマージは、フェデレーションと分散学習の中心である。
重量平均化やフィッシャーマージのような一般的な方法は、しばしば正確さを失い、種子間で不安定である。
CoGraMは、レイヤ、ニューロン、および重量レベルの多段階、文脈依存、損失ベース、反復的な最適化手法である。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 18:24:28 GMT)
Bohmian Trajectories Within Hilbert Space Based Quantum Mechanics. Solution of the Measurement Problem [0.0] dBBTは、量子粒子をよく定義された(ボヘミア)軌道に沿って移動する点オブジェクトとして扱う。
スピン、相対性、ヒルベルト空間に基づくフレームワークとの適切な統合の欠如に関連する問題がある。
従来の状態観測可能なフレームワークを dBBT の望ましい特徴と統合した一貫した形式主義を提案する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 21:16:14 GMT)
Benchmarking Deep Neural Networks for Modern Recommendation Systems [0.0] 本稿では,Retail E-Commerce,Amazon Products,Netflix Prizeという,7つの異なるニューラルネットワークアーキテクチャを3つのデータセットに展開する方法について検討する。
正確性、リコール、F1スコア、レコメンデーションの多様性などを通じて、その効果を評価する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 21:06:24 GMT)
BIONIX: A Wireless, Low-Cost Prosthetic Arm with Dual-Signal EEG and EMG Control [0.0] 本研究は脳波(EEG)と筋電図(EMG)を併用した低コストでデュアルモード神経筋制御システムを提案する。
EEG信号はNeuroSky MindWave Mobile 2を使用して取得され、ThinkGear Bluetoothパケットを介してESP32マイクロコントローラに送信される。
機能プロトタイプは低コストの材料で製造され、ほとんどの費用は商用のEEGヘッドセットによるものだった。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 05:39:13 GMT)
AquaFusionNet: Lightweight VisionSensor Fusion Framework for Real-Time Pathogen Detection and Water Quality Anomaly Prediction on Edge Devices [0.0] 本研究では,AquaFusionNetを紹介した。AquaFusionNetは軽量なクロスモーダルフレームワークで,単一エッジのデプロイ可能なモデル内で情報ソースを統一する。
このフレームワークは、飲料水コンテキスト用の注釈付き1000マイクログラフ12,846枚からなる新しいデータセットであるAquaMicro12Kでトレーニングされている。
このシステムは184万フレームを処理し、94.8% mAP@0.5と96.3%の異常予測精度で汚染事象を継続的に検出し、ジェットソン・ナノでは4.8Wで動作する。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 14:03:26 GMT)
Adaptive Normalization Mamba with Multi Scale Trend Decomposition and Patch MoE Encoding [0.0] AdaMambaは適応正規化、マルチスケールトレンド抽出、コンテキストシーケンスモデリングを統合した統合予測アーキテクチャである。
AdaMambaの適応正規化と専門拡張文脈モデリングの組み合わせは、従来のトランスフォーマーベースラインよりも安定性と精度が一貫した改善をもたらす。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 17:14:32 GMT)
AQUILA: A QUIC-Based Link Architecture for Resilient Long-Range UAV Communication [0.0] AQUILAは、これらの課題に対処するためにQUIC上に構築された層間通信アーキテクチャである。
AQUILAは、C2レイテンシ、ビデオ品質、リンクレジリエンスにおいて、TCPおよびUDPベースのアプローチよりも大幅に優れています。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 15:30:01 GMT)
AI-Assisted Game Management Decisions: A Fuzzy Logic Approach to Real-Time Soccer Substitutions [0.0] 本稿では,ファジィ論理に基づく意思決定支援システム(DSS)について述べる。
本稿では,PlayeRankメトリックをロールアウェア正規化による累積平均に変換する手法を提案する。
ブラジルとベルギーの2018 FIFAワールドカップのケーススタディによる検証は、システムの生態学的妥当性を示している。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 19:55:28 GMT)
A Comprehensive Study of Supervised Machine Learning Models for Zero-Day Attack Detection: Analyzing Performance on Imbalanced Data [0.0] この研究は、高度に不均衡なデータセットを適用し、テストフェーズ中に分類器をゼロデイアタックにのみ公開する。
以上の結果から,ランダムフォレスト (RF) はオーバーサンプリングと非オーバーサンプリングの両条件で最適であることがわかった。
XG Boost(XGB)は、ゼロデイ攻撃を検出する高速で高精度な性能のため、トップモデルである。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 22:42:37 GMT)
"The Dentist is an involved parent, the bartender is not": Revealing Implicit Biases in QA with Implicit BBQ [0.0] ImplicitBBQは、Bias Benchmark for QA (BBQ)を拡張したベンチマークである。
ImplicitBBQ における GPT-4o の評価は,明示的な BBQ プロンプトとの不一致を示す。
論文参考訳(メタデータ) (Sun, 07 Dec 2025 08:57:27 GMT)