Glass Surface Detection: Leveraging Reflection Dynamics in Flash/No-flash Imagery [82.6] ガラスの表面は日常生活においてユビキタスであり、通常は無色で透明で、特徴に欠ける。
NFGlassNetは,フラッシュ/ノフラッシュ画像に現れる反射ダイナミクスを利用するガラス表面検出の新しい手法である。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 02:00:17 GMT)
Cognitive Inception: Agentic Reasoning against Visual Deceptions by Injecting Skepticism [81.4] 完全推論に基づくエージェント推論フレームワークであるtextbfInception を提案する。
私たちの知る限りでは、AIGCの視覚的騙しに対する完全な推論ベースのフレームワークとしてはこれが初めてです。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 05:13:30 GMT)
Dual-domain Adaptation Networks for Realistic Image Super-resolution [81.3] 現実画像超解像(SR)は、現実世界の低解像度(LR)画像を高解像度(HR)画像に変換することに焦点を当てている。
現在の手法は、限られた現実世界のLR-HRデータと競合し、基本的な画像特徴の学習に影響を及ぼす。
我々は、シミュレーションされた画像SRモデルを実世界のデータセットに効率よく適応できる新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:57:23 GMT)
SING3R-SLAM: Submap-based Indoor Monocular Gaussian SLAM with 3D Reconstruction Priors [80.5] SING3R-SLAMはガウスベースの高密度RGB SLAMフレームワークである。
SING3R-SLAMは最先端のトラッキング、3D再構成、新しいビューレンダリングを実現し、12%以上の精度向上を実現し、より細かな幾何を創出する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:40:55 GMT)
Diversity Has Always Been There in Your Visual Autoregressive Models [78.3] Visual Autoregressive (VAR)モデルは、最近、革新的な次世代の予測パラダイムに対して大きな注目を集めている。
それらの効率にもかかわらず、VARモデルは、数段階の蒸留拡散モデルで観察されたような多様性の崩壊に悩まされることが多い。
本稿では、VARモデルの生成多様性を、追加のトレーニングを必要とせずに復元する、シンプルで効果的なアプローチであるDiverse VARを紹介する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:24:09 GMT)
SPEAR-1: Scaling Beyond Robot Demonstrations via 3D Understanding [78.1] ロボットファウンデーションモデル(RFMs)は、ロボット制御のための汎用的なエンドツーエンドシステムとして大きな可能性を秘めている。
本稿では,3次元アノテーションを用いた非ロボティックな画像データの統合と,3次元理解機能を備えた事前学習VLMの強化を提案する。
我々は,基礎となる3次元認識と言語による具体化制御を統合したロボット基礎モデルであるtextbfSPEAR-1$を紹介した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:09:43 GMT)
EvDiff: High Quality Video with an Event Camera [77.1] イベントからの強度画像の再構成は、絶対的な明るさのあいまいさが原因で、非常に不適切な作業である。
EvDiffはイベントベースの拡散モデルであり、高品質なビデオを作成するための代理トレーニングフレームワークに従う。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:49:18 GMT)
OmniLens++: Blind Lens Aberration Correction via Large LensLib Pre-Training and Latent PSF Representation [72.7] この研究は、既存のパイプラインの一般化能力を妨げる2つの課題を解決するOmniLens++フレームワークを提案する。
実世界のレンズと合成レンズリブの様々な収差実験により、OmniLens++はブラインド収差補正において最先端の一般化能力を示すことが示された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:41:54 GMT)
Q-REAL: Towards Realism and Plausibility Evaluation for AI-Generated Content [71.5] 本稿では,AI生成画像におけるリアリズムと妥当性の詳細な評価のための新しいデータセットであるQ-Realを紹介する。
Q-Realは、人気のあるテキスト・ツー・イメージ・モデルによって生成される3,088のイメージで構成されている。
そこで本研究では,Q-Real Benchを2つの課題,すなわち判断と推論による根拠付けに基づいて評価する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 02:43:17 GMT)
Planning with Sketch-Guided Verification for Physics-Aware Video Generation [71.3] そこで我々は,SketchVerifyを,ビデオ生成のためのトレーニングフリーでスケッチ検証ベースの計画フレームワークとして提案する。
提案手法は,複数の候補動きプランを予測し,視覚言語検証器を用いてランク付けする。
我々は、満足なものが特定されるまで運動計画を反復的に洗練し、最終的な合成のために軌道条件付きジェネレータに渡される。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:48:02 GMT)
FireScope: Wildfire Risk Prediction with a Chain-of-Thought Oracle [69.8] 既存の方法には、信頼性の高い一般化に必要な因果推論と理解が欠如している。
Sentinel-2イメージと気候データと専門家が定義したリスクを結合したデータセットとベンチマークであるtextbfFireScope-Benchを紹介します。
米国でトレーニングし、ヨーロッパでテストすると、$textbfFireScope$は大幅なパフォーマンス向上を達成する。
本研究は,推論が一般化と解釈可能性の両方を改善することによって,予測モデルの基礎となることを示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:45:22 GMT)
AutoLink: Autonomous Schema Exploration and Expansion for Scalable Schema Linking in Text-to-SQL at Scale [68.3] 既存の方法は違法なコストを発生させ、リコールとノイズのトレードオフに苦労し、大規模データベースに不利なスケーリングを行う。
我々は、反復的エージェント駆動プロセスとしてスキーマリンクを再構成する、自律的なエージェントフレームワークであるtextbfAutoLinkを提案する。
実験ではAutoLinkの優れたパフォーマンスを示し、最先端の厳密なスキーマリンクのリコール、すなわち textbf68.7% EX on Bird-Dev (CHESSより優れている)、 textbf34.9% EX on Spider-2.0-Lite (第2位)を実現している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:12:17 GMT)
Generative MIMO Beam Map Construction for Location Recovery and Beam Tracking [67.7] 本稿では,スパースチャネル状態情報(CSI)から位置ラベルを直接復元する生成フレームワークを提案する。
生のCSIを直接格納する代わりに、小型の低次元無線地図の埋め込みを学び、生成モデルを利用して高次元CSIを再構築する。
数値実験により,NLOSシナリオにおける局所化精度が30%以上向上し,20%のキャパシティゲインが得られることが示された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:25:49 GMT)
Learning to Look Closer: A New Instance-Wise Loss for Small Cerebral Lesion Segmentation [64.8] 本稿では,CC-Metricsフレームワークに基づく損失関数であるCC-DiceCEを紹介し,既存のブロブ損失と比較する。
その結果,CC-DiceCEの損失は検出(リコール)を増加させるが,セグメンテーション性能は低下しない。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:10:05 GMT)
DeepCoT: Deep Continual Transformers for Real-Time Inference on Data Streams [63.3] トランスフォーマーベースのモデルは、ますます複雑なタスクに取り組むために、そのサイズとパラメータ数を劇的に増加させてきた。
ストリームデータ推論は通常、スライディング時間ウィンドウ上で実行され、非常に冗長な計算に繋がる。
提案するDeep Continual Transformer(DeepCoT)は冗長性のないエンコーダのみのモデルであり,最小限の変更で既存のディープエンコーダアーキテクチャに適用できる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:15:43 GMT)
Improving Multimodal Distillation for 3D Semantic Segmentation under Domain Shift [62.5] 我々は,ライダーポイント雲のセマンティックセグメンテーションのための教師なし領域適応において,視覚基盤モデル(VFM)を利用したレシピの同定を行う。
その結果、パイプラインは4つの広く認識され、困難な設定で、最先端の結果を達成する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:57:43 GMT)
Designing Domain-Specific Agents via Hierarchical Task Abstraction Mechanism [61.0] 階層型タスク抽象化機構(HTAM)を中心とした新しいエージェント設計フレームワークを提案する。
具体的には、HTAMは、社会的役割のエミュレーションを超えて、代わりに、複数のエージェントシステムを、あるドメインの固有のタスク依存グラフを反映する論理階層に構造化する。
我々は、複雑な地理空間解析に適したマルチエージェントシステムであるEarthAgentとして、このフレームワークをインスタンス化する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:25:47 GMT)
SVRecon: Sparse Voxel Rasterization for Surface Reconstruction [60.9] 我々は最近提案されたスパースボキセル化パラダイムをSVReconの統合により高忠実度表面再構成の課題に拡張する。
本手法は, 常に高速な収束を保ちながら, 強い復元精度を実現する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:32:01 GMT)
ChainV: Atomic Visual Hints Make Multimodal Reasoning Shorter and Better [59.3] 推論プロセスに視覚的ヒントを動的に統合するフレームワークChainVを提案する。
提案手法は,特に算数集約ベンチマークにおいて,推論精度と効率を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:11:17 GMT)
Loomis Painter: Reconstructing the Painting Process [56.7] ステップバイステップの絵画チュートリアルは芸術的技法を学ぶのに不可欠であるが、既存のビデオリソースには対話性とパーソナライゼーションが欠如している。
セマンティクス駆動型スタイル制御機構を用いたマルチメディア描画プロセス生成のための統一的なフレームワークを提案する。
また、実際の絵画プロセスの大規模データセットを構築し、メディア間の整合性、時間的コヒーレンス、最終的なイメージの忠実性を評価する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:06:32 GMT)
IndustryNav: Exploring Spatial Reasoning of Embodied Agents in Dynamic Industrial Navigation [56.4] IndustryNavは、アクティブな空間推論のための最初の動的産業用ナビゲーションベンチマークである。
9つの最先端のVisual Large Language Modelsの研究によると、クローズドソースモデルは一貫した優位性を維持している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:48:49 GMT)
Attention Guided Alignment in Efficient Vision-Language Models [56.2] VLM(Large Vision-Language Models)は、事前訓練された視覚エンコーダとLLM(Large Language Models)の効果的なマルチモーダルアライメントに依存している。
本稿では,効率的なVLMにおける注意パターンの包括的解析について述べる。
本稿では,Attention-Guided Efficient Vision-Language Models (AGE-VLM)を紹介する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 21:36:48 GMT)
Illustrator's Depth: Monocular Layer Index Prediction for Image Decomposition [55.8] 私たちはIllustratorのDepthを紹介します。これはデジタルコンテンツ作成における重要な課題に対処する、新しい深さの定義です。
アーティストの合成プロセスにインスパイアされたイラストレーターの深さは、各ピクセルに層インデックスを推論し、解釈可能な画像分解を形成する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:56:43 GMT)
SMILE: A Composite Lexical-Semantic Metric for Question-Answering Evaluation [55.3] 本稿では,文レベルの意味理解とキーワードレベルの意味理解と簡単なキーワードマッチングを組み合わせた新しいアプローチであるSemantic Metric Integrating Lexical Exactnessを紹介する。
人間の判断と計算学的に軽量であり、語彙的評価と意味的評価のギャップを埋める。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:30:18 GMT)
VLA-4D: Embedding 4D Awareness into Vision-Language-Action Models for SpatioTemporally Coherent Robotic Manipulation [54.8] 時間的コヒーレントなロボット操作のための4次元認識型汎用VLAモデルを開発した。
視覚的特徴を抽出し, 4次元埋め込みのための3次元位置への1次元時間埋め込みを行い, クロスアテンション機構による統一視覚表現に融合する。
この枠組みの中で、デザインされた視覚アクションは、空間的に滑らかで時間的に一貫したロボット操作を共同で行う。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:26:30 GMT)
CORA: Consistency-Guided Semi-Supervised Framework for Reasoning Segmentation [54.5] 推論セグメンテーションは、複雑でしばしば暗黙的な指示によって参照されるターゲットに対して、ピクセル精度の高いマスクを求める。
我々は、限定ラベル付きデータとラベルなし画像の大きなコーパスから共同で学習する半教師付き推論セグメンテーションフレームワークCORAを提案する。
CORAは最先端の結果を達成し、都市景観理解のためのベンチマークデータセットであるCityscapesにラベル付きイメージを100個まで必要としています。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:14:55 GMT)
One-Step Diffusion Transformer for Controllable Real-World Image Super-Resolution [54.5] ODTSRは1ステップの拡散変換器であり、忠実度と可制御性を同時に考慮してReal-ISRを実行する。
ODTSRは一般的なReal-ISR上でのSOTA(State-of-the-art)のパフォーマンスを達成するだけでなく、困難なシナリオの迅速な制御を可能にする。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:00:59 GMT)
EvoLMM: Self-Evolving Large Multimodal Models with Continuous Rewards [52.4] 本稿では,1つのバックボーンモデルから2つの協調エージェントをインスタンス化する自己進化型フレームワークEvoLMMを提案する。
この動的なフィードバックは、情報的クエリの生成と構造化推論の洗練の両方を促進する。
私たちのコードとモデルはhttps://github.com/mbzuai-oryx/EvoLMMで公開されています。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:47:18 GMT)
Spanning Tree Autoregressive Visual Generation [51.8] 本稿では,Spanning Tree Autoregressive (STAR) モデリングについて述べる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:45:17 GMT)
Rethinking Diffusion Model-Based Video Super-Resolution: Leveraging Dense Guidance from Aligned Features [51.5] ビデオ超解法アプローチは、エラーの蓄積、空間的アーティファクト、知覚的品質と忠実さのトレードオフに悩まされる。
ビデオ超解像(DGAF-VSR)に適した特徴を持つ新しい誘導拡散モデルを提案する。
合成および実世界のデータセットの実験では、DGAF-VSRがVSRの重要な側面において最先端の手法を超越していることが示されている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 03:40:45 GMT)
UniModel: A Visual-Only Framework for Unified Multimodal Understanding and Generation [51.3] 本稿では,単一のピクセル間拡散フレームワーク内での視覚的理解と視覚的生成を支援する統合生成モデルを提案する。
私たちのゴールは、モデル、タスク、表現の3つの軸に沿った統一を達成することです。
画像間合成と画像間理解の実験は、強いモーダルアライメントを示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 03:02:10 GMT)
Energy Scaling Laws for Diffusion Models: Quantifying Compute and Carbon Emissions in Image Generation [50.2] 本稿では,計算複雑性(FLOP)に基づく拡散モデルに対するGPUエネルギー消費予測のためのKaplanスケーリング法の適用法を提案する。
提案手法は, テキストエンコーディング, 反復的復号化, 復号化コンポーネントへの拡散モデル推論を分解し, 複数の推論ステップをまたいだ繰り返し実行により, 演算の復号化がエネルギー消費を支配しているという仮説を導いた。
この結果は拡散予測の計算バウンドの性質を検証し、持続可能なAIデプロイメント計画と炭素フットプリント推定の基礎を提供する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:12:47 GMT)
A Causal Perspective on Measuring, Explaining and Mitigating Smells in LLM-Generated Code [49.1] Propensity Smelly Score (PSC) は、特定の臭いの種類を生成する確率を推定する計量である。
我々は、生成戦略、モデルサイズ、モデルアーキテクチャ、および生成したコードの構造特性をいかに形成するかを識別する。
PSCは、開発者がモデルの振る舞いを解釈し、コード品質を評価するのに役立つ。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 03:50:56 GMT)
Native 3D Editing with Full Attention [47.9] 本研究では,1つのフィードフォワードパスで直接3D表現を操作できる新しい3D編集フレームワークを提案する。
このデータセットは慎重にキュレーションされ、編集されたオブジェクトが命令の変更に忠実に従うことを保証する。
その結果,トークンの連結はパラメータ効率が良く,優れた性能が得られることがわかった。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:59:26 GMT)
Adaptive Layer-Wise Transformations for Post-Training Quantization of Large Language Models [47.5] 大規模言語モデルは、デプロイメントにかなりの計算資源を必要とする。
効果的な量子化の主な障害は、活性化と重みの体系的な外れ値にある。
本稿では,層ごとの最適変換を体系的に決定する適応変換選択フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 22:01:58 GMT)
OmniScientist: Toward a Co-evolving Ecosystem of Human and AI Scientists [47.4] 我々は、人間の研究の基盤となるメカニズムをAI科学ワークフローにエンコードするフレームワークであるOmniScientistを紹介します。
OmniScientistは、データ基盤全体にわたるエンドツーエンドの自動化、文献レビュー、研究のアイデア、実験の自動化、科学的執筆、ピアレビューを実現している。
このインフラは、エージェントが人間の知識システムを理解し、活用するだけでなく、協力し、共同開発することを可能にする。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 03:55:19 GMT)
MolSight: Optical Chemical Structure Recognition with SMILES Pretraining, Multi-Granularity Learning and Reinforcement Learning [47.0] MolSightは総合的な学習フレームワークで、3段階のトレーニングパラダイムを採用している。
我々は,MollSightが(ステレオ)化学光学構造認識における最先端性能を実現することを示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:11:47 GMT)
Generating transition states of chemical reactions via distance-geometry-based flow matching [45.4] 反応物および生成物からの遷移状態を予測するフローマッチングフレームワークTS-DFMを提案する。
ベンチマークデータセットTransition1Xでは、TS-DFMが従来の最先端メソッドであるReact-OTを30%上回っている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:15:25 GMT)
FinCriticalED: A Visual Benchmark for Financial Fact-Level OCR Evaluation [45.2] FinCriticalEDは、財務文書のOCRおよびビジョン言語モデルを評価するためのビジュアルベンチマークである。
FinCriticalEDは500のイメージとHTMLのペアを提供し、700以上の数値と時間的事実をカバーする、専門家の注釈付き財務事実を提供する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 00:06:20 GMT)
The PLLuM Instruction Corpus [44.4] 本稿では,euMプロジェクトで開発された変圧器を用いた大規模言語モデル(LLM)の集合を微調整するために使用する命令データセットについて述べる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:28:11 GMT)
FingerCap: Fine-grained Finger-level Hand Motion Captioning [44.2] きめ細かい指レベルハンドモーションキャプションは、手の動きの詳細な指レベルセマンティクスを生成することを目的としている。
このタスクをサポートするために、40Kペアのハンドモーションビデオとキャプションの大規模なコーパスであるFingerCap-40Kをキュレートする。
FingerCap-40Kの実験によると、強力なオープンソースとクローズドソースのVideo-MLLMは今でも指レベルの推論に苦戦している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 04:59:01 GMT)
Where Culture Fades: Revealing the Cultural Gap in Text-to-Image Generation [43.4] 現在のT2Iモデルは、多言語的なプロンプトの下で、文化的に中立な結果や英語に偏った結果をもたらすことが多い。
本稿では,培養感受性シグナルを少数の固定層内の小さなニューロン群に局在させる探索法を提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:40:50 GMT)
FlexiFlow: decomposable flow matching for generation of flexible molecular ensemble [43.2] FlexiFlowはフローマッチングモデルを拡張する新しいアーキテクチャです。
本稿では,QM9およびGEOM Drugsデータセットに対するアプローチの有効性を示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:50:54 GMT)
NoPe-NeRF++: Local-to-Global Optimization of NeRF with No Pose Prior [42.7] NoPe-NeRF++は、ポーズ前処理を必要とせずにNeRF(Neural Radiance Fields)をトレーニングするための、新しいローカル-グローバル最適化アルゴリズムである。
提案手法は,局所的および大域的キューとNeRFをシームレスに組み合わせた最初の手法であり,ポーズ推定精度と新規ビュー合成の両方において最先端の手法より優れている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:41:51 GMT)
Continual Alignment for SAM: Rethinking Foundation Models for Medical Image Segmentation in Continual Learning [42.2] 医用画像のセグメンテーションにおいて、組織間の異種プライバシーポリシーは、しばしばプールされたデータセットで共同トレーニングを行うことができる。
Segment Anything Model (SAM)は強力なゼロショット前処理を提供するが、その大きなパラメータ数と計算オーバーヘッドは実際のデプロイに挑戦する。
本稿では,SAMパラダイムが計算効率と性能のバランスを保てば,高い期待を達成できることを実証する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:27:49 GMT)
AutoBool: An Reinforcement-Learning trained LLM for Effective Automated Boolean Query Generation for Systematic Reviews [42.0] AutoBoolは,大規模言語モデル(LLM)をトレーニングして,効果的なBooleanクエリを生成するフレームワークである。
トレーニング用のトピックとして65588という,その種類で最も大きなデータセットをリリースしています。
実験の結果、AutoBoolはゼロショット/フェーショットのプロンプトを著しく上回り、GPTベースのモデルよりもはるかに大きなモデルの有効性を達成または上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 04:29:47 GMT)
Exponentially enhanced sensing through nonreciprocal light propagation [42.0] 非相互光伝搬は、システムサイズと指数的にスケールする信号対雑音比で小さな摂動を検出することができる。
本研究は,超伝導回路の光学的読み出しを含むリモートセンシングに応用可能な,非エルミチアンセンシングの新しいパラダイムを開拓する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 02:17:33 GMT)
Optical Entanglement Facilitated by Opto-Mechanical Cooling [42.0] 本稿では,分解側バンド方式で動作する空洞光学系から放出される2つの光ハーモニック間の低周波絡みの発生に関する理論的研究を行う。
本研究は, 環境条件下でのロバストな絡み合いの実現可能性を示し, メカニカルインタフェースと連続可変量子情報処理に基づくハイブリッド量子技術への新たな道を開いた。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:41:58 GMT)
An Efficient Computational Framework for Discrete Fuzzy Numbers Based on Total Orders [42.0] 我々は、$textitpos$関数を計算するために、合計(許容可能な)順序の構造を利用するアルゴリズムを導入する。
提案手法は、下層の鎖の大きさの2乗である$mathcalO(n2 m log n)$の複雑さを実現する。
その結果、この定式化は計算コストを大幅に削減することを示した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:35:07 GMT)
REArtGS++: Generalizable Articulation Reconstruction with Temporal Geometry Constraint via Planar Gaussian Splatting [41.8] REArtGScitewu2025reartgsは2つの異なる状態におけるマルチビューRGB画像を用いたカテゴリに依存しないアプローチを導入している。
一般化可能なオブジェクト再構成のための新しい手法であるREArtGS++を提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:07:56 GMT)
Pillar-0: A New Frontier for Radiology Foundation Models [41.6] 腹部骨盤CT42,990例,胸部CT86,411例,頭部CT14,348例,胸部MRI11,543例にPillar-0を導入した。
Pillar-0は平均86.4、88.0、90.1、82.9のAUROCを達成し、MedGemma (Google)、MedImageInsight (Microsoft)、Lingshu (Alibaba)、Merlin (スタンフォード)を7.8-15.8のAUROCポイントで上回り、87.2% (319/366)タスクでランクインしている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 21:50:34 GMT)
Person Recognition in Aerial Surveillance: A Decade Survey [41.1] 本稿では,過去10年間の人間中心の空中監視作業における150以上の論文の概要について概説する。
関心の対象は人間であり、人間の対象が検出され、識別され、再同定される。
まず,これらのタスクを空域で実行する上で,一般的な地上環境と比較して,ユニークな課題を特定する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 06:00:35 GMT)
Closing the Performance Gap Between AI and Radiologists in Chest X-Ray Reporting [40.4] 胸部X線レポート生成のための臨床評価型マルチモーダルAIモデルMAIRA-Xを紹介する。
タイプや縦方向の変化,配置などの属性を報告する上での精度を評価するために,新しいL&T特化メトリクスフレームワークを開発した。
以上の結果から,MAIRA-Xは放射線科医,特に高用量臨床現場で効果的に治療できる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:53:26 GMT)
Learning Latent Transmission and Glare Maps for Lens Veiling Glare Removal [39.6] VeilGenは、ヴェイリンググラアをシミュレートすることを学ぶ生成モデルである。
DeVeilerは可逆性制約でトレーニングされた復元ネットワークである。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:16:30 GMT)
OmniGround: A Comprehensive Spatio-Temporal Grounding Benchmark for Real-World Complex Scenarios [39.6] OmniGroundは、81のカテゴリにまたがる3,475の動画と複雑な現実世界のクエリを備えた総合的なベンチマークである。
また、4つの相補的な次元にわたるデータセット品質を定量化するシステム評価フレームワークであるDeepSTGについても紹介する。
実験では、PG-TAFはm_tIoUとm_vIoUを25.6%、35.6%改善し、4つのベンチマークで一貫した利得を得た。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 04:23:04 GMT)
R-AVST: Empowering Video-LLMs with Fine-Grained Spatio-Temporal Reasoning in Complex Audio-Visual Scenarios [39.4] 微粒なアノテーションを用いた音声・視覚・時間的推論のためのデータセットであるR-AVSTを提案する。
我々は8K以上の高品質で均等に分散された質問応答ペアを生成し、性能をベンチマークする。
AVST-Zeroは、中間的監視を回避する強化学習に基づくモデルである。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 02:30:26 GMT)
The Loss of Control Playbook: Degrees, Dynamics, and Preparedness [39.4] 本報告では,新たな分類と準備の枠組みを開発することにより,AIシステムにおけるロス・オブ・コントロール(Los of Control, LoC)の実用的な定義が欠如していることに対処する。
そこで本研究では,重度と持続性の指標に基づいて,偏差,境界LoC,Strict LoCを区別したLoC分類法を提案する。
我々は,社会的脆弱性が到達した場合に,準備の維持と LoC 結果の発生防止を計画した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:53:03 GMT)
SuperQuadricOcc: Multi-Layer Gaussian Approximation of Superquadrics for Real-Time Self-Supervised Occupancy Estimation [38.9] リアルタイム推論を実現するために,スーパークワッドリックを用いた占有モデルを提案する。
Occ3Dデータセットでは、SuperQuadricOccは75%のメモリフットプリントの削減、124%の高速化、mIoUの5.9%の改善を実現している。
私たちの知る限り、これは競争性能を維持しながらリアルタイムの推論を可能にする最初の占有モデルです。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:26:31 GMT)
MirrorMind: Empowering OmniScientist with the Expert Perspectives and Collective Knowledge of Human Scientists [37.9] MirrorMindは階層的な認知アーキテクチャであり、3レベルフレームワークにデュアルメモリ表現を統合する。
著者レベルの認知シミュレーション,補完的推論,学際的コラボレーションの促進,マルチエージェントの科学的問題解決など,総合的な4つの課題にまたがってMirrorMindを評価した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:05:26 GMT)
Video-R4: Reinforcing Text-Rich Video Reasoning with Visual Rumination [37.2] 視覚ルミネーションを行うビデオ推論LMMであるVideo-R4(Reinforce Text-Rich Video Reasoning with Visual Rumination)を紹介する。
本研究では、7B LMMを段階的に微調整し、原子を学習し、視覚操作を混合する多段階ルミネーション学習フレームワークを提案する。
ビデオR4-7Bは、M4-ViteVQAの最先端結果を達成し、さらにマルチページ文書QA、スライドQA、ジェネリックビデオQAに一般化する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:47:09 GMT)
Robot Confirmation Generation and Action Planning Using Long-context Q-Former Integrated with Multimodal LLM [37.1] 本稿では,マルチモーダルシーン理解を用いたロボット行動確認とアクションステップ生成に依存した人間-ロボット対話に基づく人間-ロボットインタラクション(HRI)に焦点を当てた。
最先端のアプローチでは、マルチモーダルトランスフォーマーを使用して、複数のマイクロステップからなるタスクを示す単一のクリップから、ロボットアクション確認に対応するロボットアクションステップを生成する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:55:25 GMT)
METIS: Multi-Source Egocentric Training for Integrated Dexterous Vision-Language-Action Model [36.8] 大きなボトルネックは、デクスタラススキルのための大規模でアクションアノテートされたデータの不足にある。
我々は,エゴセントリックなデータセット上で事前学習したデクスタラス操作のための視覚言語アクションモデルMETISを提案する。
提案手法は,6つの実世界のタスクにおける平均成功率を達成し,異常な操作能力を示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:32:36 GMT)
From Perception to Reasoning: Deep Thinking Empowers Multimodal Large Language Models [36.5] CoT(Chain-of-Thought)推論は、推論の透明性と出力の解釈可能性を高めることによって、言語モデルにおいて有意な効果を示した。
本稿では,Multimodal Chain-of-Thought(MCoT)を中心にしたシステムレビューを行う。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 06:39:29 GMT)
Intervene-All-Paths: Unified Mitigation of LVLM Hallucinations across Alignment Formats [36.5] 本稿では,LVLM(Large Vision-Language Models)におけるトランスフォーマーの因果構造に沿った包括的介入フレームワークを提案する。
LVLMの幻覚は、単一の因果経路ではなく、画像からインプットテキスト、画像からアウトプットテキスト、テキストからテキストへの経路間の相互作用から生じる。
これらの知見に基づいて,各経路における重要な幻覚の頭部を識別し,介入するための簡易かつ効果的な方法を提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:57:38 GMT)
Sparse Reasoning is Enough: Biological-Inspired Framework for Video Anomaly Detection with Large Pre-trained Models [36.4] ビデオ異常検出(VAD)は、セキュリティ監視、自律運転、産業監視といった現実世界のアプリケーションにおいて重要な役割を果たす。
大規模事前学習モデルの最近の進歩は、豊富な事前知識と一般的な推論能力を活用することにより、トレーニング不要なVADの新たな機会を開いた。
VADシステムで強力な事前学習モデルを使用する場合、高密度推論は本当に必要か?
本稿では,人間の神経系の二重反射と意識経路にインスパイアされた新しいフレームワークであるReCoVADを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:50:21 GMT)
Asking LLMs to Verify First is Almost Free Lunch [36.2] 大規模言語モデル(LLM)の推論能力を高めるために、検証ファースト(VF)を導入する。
VFは、ソリューションを生成する前に、提供された候補回答、あるいは自明またはランダムな回答を検証するようモデルに促す。
検証生成過程を反復的に循環する逐次テスト時間スケーリング (TTS) 手法である Iter-VF に VF 戦略を一般化する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:55:34 GMT)
UI-CUBE: Enterprise-Grade Computer Use Agent Benchmarking Beyond Task Accuracy to Operational Reliability [35.2] We present UI-CUBE (UiPath Computer Use BEnchmark), a benchmark with 226 tasks across two difficulty tiers。
私たちの評価では、シンプルなUIインタラクション(136タスク)と、コピー・ペーストタスク(50タスク)とエンタープライズアプリケーションシナリオ(40タスク)を含む複雑度をカバーしています。
現在のCUAは個々のインターフェイス要素を操作できるが、信頼性の高いワークフロー自動化ツールとして機能することはまだできない。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:47:22 GMT)
Genomic Next-Token Predictors are In-Context Learners [34.3] In-context Learning (ICL) は、人間のテキストの次のトーケン予測のために訓練された大規模な言語モデルで広く研究されている。
ICLは、大規模予測トレーニングによって、他の配列ドメインで有機的に発生するのか?
そこで本研究では,テキスト内デモの数が増加するにつれて,ゲノムモデルがパターン誘導の対数線形ゲインを示すことを示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 02:11:05 GMT)
Learning to Compress: Unlocking the Potential of Large Language Models for Text Representation [34.2] 大規模言語モデル(LLM)の教師なし適応のためのプレテキストタスクとして,文脈圧縮の未解決の可能性について検討する。
実験により、よく設計された圧縮目的がLLMベースのテキスト表現を大幅に強化できることが示されている。
コントラスト学習によるさらなる改善は、強い表現モデル(LLM2Comp)を生成する
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:45:44 GMT)
RadioKMoE: Knowledge-Guided Radiomap Estimation with Kolmogorov-Arnold Networks and Mixture-of-Experts [34.0] Radiomapは、信号の伝搬とカバレッジに関する強力な空間知識を提供することによって、無線ネットワークの管理と展開のための重要なツールである。
Kolmogorov-Arnold Networks (KAN)とMixture-of-Experts (MoE)を統合した知識誘導RMEフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 06:45:46 GMT)
MURMUR: Using cross-user chatter to break collaborative language agents in groups [33.8] 単一ユーザタスクを並列なグループベースのシナリオに構成するフレームワークを提案する。
CUP攻撃は高い速度で成功し、その効果は複数のタスクにわたって持続する。
この新しいタイプの脆弱性を軽減するために、タスクベースのクラスタリングによる第1ステップの防御を導入します。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 04:56:37 GMT)
δ-EMG: A Monotonic Graph Index for Approximate Nearest Neighbor Search [33.6] 本稿では,クエリ時における近似精度を制御する誤り境界付きANN探索アルゴリズムを提案する。
0.99のリコール条件下では、SIFT1Mデータセット上で19,000QPSを達成し、他の手法よりも40%以上性能が向上する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 03:20:54 GMT)
Fast Decoding for Non-Adaptive Learning of Erdős--Rényi Random Graphs [33.5] ノードサブセット上のグループクエリを用いて未知のグラフを学習する問題について検討する。
一般に、 (n) ノードと (k) エッジを持つ任意のグラフを学ぶことは、非適応的な設定では難しい。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:34:29 GMT)
VisReason: A Large-Scale Dataset for Visual Chain-of-Thought Reasoning [33.4] Chain-of-Thoughtプロンプトは、大きな言語モデルで複雑な推論を引き出すのに極めて効果的であることが証明されている。
既存のビジュアルCoTリソースは、典型的には小さく、ドメイン固有であり、構成的な視覚的推論に必要な人間のような段階的な構造を欠いている。
視覚的連鎖推論を促進するために設計された大規模データセットであるVisReasonを紹介した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:30:24 GMT)
Decoding inner speech with an end-to-end brain-to-text neural interface [33.2] 音声脳-コンピュータインタフェース(BCI)は、神経活動をテキストに翻訳することで麻痺のある人々のコミュニケーションを回復することを目的としている。
本稿では、単一微分可能なニューラルネットワークを用いて、ニューラルネットワークをコヒーレントな文に変換する、エンドツーエンドのBrain-to-Textフレームワークを紹介する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 21:25:54 GMT)
MobileOcc: A Human-Aware Semantic Occupancy Dataset for Mobile Robots [33.1] 混み合った人間環境で動作する移動ロボットのためのセマンティック占有データセットであるMobileOccを提案する。
私たちのデータセットは、静的オブジェクト占有アノテーションを組み込んだアノテーションパイプラインを使って構築されます。
その結果,本手法は異なるデータセット間で頑健な性能を示すことがわかった。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 04:53:21 GMT)
Gradient flow for deep equilibrium single-index models [32.2] ディープ均衡モデル(Deep equilibrium model, DEQ)は、無限に深い重み付きニューラルネットワークをトレーニングするための強力なパラダイムとして登場した。
線形モデルと単一インデックスモデルの簡単な設定でDECの勾配勾配勾配ダイナミクスを厳密に研究する。
次に、線形DQと深い平衡単インデックスモデルに対する大域最小化器への勾配勾配勾配の線形収束を証明した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 06:14:41 GMT)
BiFingerPose: Bimodal Finger Pose Estimation for Touch Devices [31.9] 本稿では,バイモーダルな指ポーズ推定アルゴリズムであるBiFingerPoseを提案する。
タッチスクリーンから得られる容量画像と指紋パッチとを、画面下指紋センサで探索する。
提案手法は, 単一のモータリティのみでは達成できないロール角の信頼性の高い推定に導かれる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:21:28 GMT)
Vision Language Models are Confused Tourists [31.9] 視覚言語モデル(VLM)の評価を目的とした,新しい文化的対人ロバストネススイートであるConfusedTouristを紹介する。
私たちの実験では、単純なイメージスタッキングの摂動の下で精度が大幅に低下し、画像生成に基づく変異によってさらに悪化する重大な脆弱性が明らかになりました。
これらの発見は、視覚的文化的概念の混合が、最先端のVLMさえも実質的に損なわれるという、重要な課題を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:14:46 GMT)
The Finer the Better: Towards Granular-aware Open-set Domain Generalization [31.2] オープンセットドメインの一般化は、デプロイされたモデルがドメインシフトと新しいオブジェクトカテゴリの両方に遭遇する現実的なシナリオに取り組む。
既存の手法は、未知のクラスの構造的リスクと未知のクラスの構造的リスクの間のジレンマに依然として陥る。
本稿では, セマンティック・エンハンスメントを用いたCLIPフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 06:19:19 GMT)
Shape-preserving Tooth Segmentation from CBCT Images Using Deep Learning with Semantic and Shape Awareness [30.7] 形状保存セグメンテーションのための意味認識と形状認識を統合したディープラーニングフレームワークを提案する。
本手法では, 歯質間の意味的関係をモデル化するためのマルチラベル学習戦略を提案する。
歯形認識学習機構は、境界整合性を維持するための形態的制約を明示的に強制する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 04:15:07 GMT)
Layer-Wise High-Impact Parameter Ratio Optimization in Post-Training Quantization for Large Language Models [30.0] トレーニング後の量子化(PTQ)は、これらの課題を最小限のオーバーヘッドで軽減するための有望なアプローチとして現れている。
既存のPTQ法は、極低ビット幅でかなりの精度の損失を経験する。
本研究では,高インパクトパラメータの層比を決定する2次最適化フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 21:47:39 GMT)
MatPedia: A Universal Generative Foundation for High-Fidelity Material Synthesis [29.9] MatPediaは、新しいRGB-PBR表現に基づいて構築された基礎モデルである。
材料をコンパクトに2つのラテントにエンコードする: 1つはRGB、もう1つは4つのPBRマップである。
MatPediaは、PBRデータセットと大規模なRGBイメージを組み合わせた混合コーパスであるMatHybrid-410Kでトレーニングされており、ネイティブな1024times1024$合成を実現している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 05:16:26 GMT)
Vision-Motion-Reference Alignment for Referring Multi-Object Tracking via Multi-Modal Large Language Models [29.3] 我々はVMRMOTという新しいビジョン・モーション・リファレンス・アライメントのRMOTフレームワークを提案する。
物体力学から抽出された運動モーダリティを統合し、視覚モーダリティと言語参照のアライメントを強化する。
我々の知る限りでは、VMRMOT は RMOT タスクに MLLM を採用する最初のアプローチである。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:53:31 GMT)
MuM: Multi-View Masked Image Modeling for 3D Vision [29.0] 画像における自己教師付き学習は、ラベルのないデータから意味のある視覚的表現を抽出しようとする。
本研究では,3Dビジョンに適した学習機能に着目した。
我々は、同じシーンを任意に多くのビューに拡張し、フレーム間注目の軽量デコーダを使用します。
我々は、フィードフォワード再構成、濃密な画像マッチング、相対的なポーズ推定を含む下流タスクにおいて、結果のモデル MuM を広範囲に評価する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:25:47 GMT)
SPIDER: Spatial Image CorresponDence Estimator for Robust Calibration [28.5] 本稿では,共有特徴抽出バックボーンを2つの専用ネットワークヘッドに統合した共通特徴マッチングフレームワークであるSPIDERを紹介する。
SPIDERはSoTA法よりも優れており、普遍的な画像マッチング法としての強い能力を示している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:02:08 GMT)
DiffRefiner: Coarse to Fine Trajectory Planning via Diffusion Refinement with Semantic Interaction for End to End Autonomous Driving [28.2] 本稿では,新しい2段階軌道予測フレームワークDiffRefinerを提案する。
最初のステージでは、トランスフォーマーベースの提案デコーダを使用して、粗い軌道予測を生成する。
第2段階では拡散精錬器が適用され、これらの初期予測を反復的に復調する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:16:00 GMT)
Parametric Retrieval-Augmented Generation using Latent Routing of LoRA Adapters [27.7] Parametric Retrieval-Augmented Generation (PRAG)は、外部知識を直接Large Language Model (LLM)に統合する。
現在のPRAGアプローチでは、個々のドキュメントに専用のLoRAアダプタを使用して、textbfone-to-oneドキュメントエンコーディング方式を採用している。
本稿では,潜在経路符号化プロセスを利用するPRAGにおける経路の符号化のための新しいパラダイムを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:44:21 GMT)
DocSLM: A Small Vision-Language Model for Long Multimodal Document Understanding [26.8] LVLM(Large Vision-Language Models)は、長い複雑な文書に対して強力なマルチモーダル推論能力を示す。
本稿では,制約されたリソース下での長期文書理解のために設計された,効率的なスモールビジョン言語モデルDocSLMを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:18:23 GMT)
Training Foundation Models on a Full-Stack AMD Platform: Compute, Networking, and System Design [26.1] 本報告では,AMDハードウェアの大規模混合実験(MoE)事前学習について報告する。
システムとモデル設計の両方の実用的なガイダンスを精査する。
ZAYA1ベースの性能は、Qwen3-4BやGemma3-12Bのような主要なベースモデルに匹敵する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:44:02 GMT)
MCMoE: Completing Missing Modalities with Mixture of Experts for Incomplete Multimodal Action Quality Assessment [25.5] 本研究では,一段階学習における一助学習と共同表現学習を統一するMCMoE(Missing Completion Framework with Mixture of Experts)を提案する。
次に、モダリティの専門家を設計し、モダリティの知識を学習し、すべての専門家の知識を動的に混合し、モダリティ間の共同表現を抽出する。
我々のMCMoEは,3つの公開ベンチマークにおいて,完全かつ不完全なマルチモーダル学習を実現する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:56:25 GMT)
Beyond Multiple Choice: A Hybrid Framework for Unifying Robust Evaluation and Verifiable Reasoning Training [25.5] 複数選択質問応答(MCQA)は、現代のマルチモーダル言語モデルのRFTの評価と強化のための一般的なフォーマットである。
ReVeL(ReVeL)は,複数の質問をオープンな質問に書き換えるフレームワークである。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:06:37 GMT)
Target-Bench: Can World Models Achieve Mapless Path Planning with Semantic Targets? [25.4] Target-Benchは、実世界の環境におけるセマンティックターゲットに向けたマップレスパス計画の世界モデルを評価するために設計された最初のベンチマークである。
SLAMに基づく地上真実軌道を用いた45のセマンティックカテゴリにまたがる450のロボットコンパイルビデオシーケンスを提供する。
我々は,Sora 2,Veo 3.1,Wanシリーズなどの最先端モデルを評価する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 21:36:02 GMT)
Seeing the Forest and the Trees: Query-Aware Tokenizer for Long-Video Multimodal Language Models [24.9] 長いビデオ理解シナリオのための視覚トークン選択モジュールであるQTSplusを提案する。
Qwen2.5-VLに統合され、ビジョンストリームを textbf89% まで圧縮し、長いビデオでは textbf28% でエンドツーエンドのレイテンシを低減する。
以上の結果から,QTSplusはMLLMを現実世界の長ビデオシナリオに拡張するための,効果的で汎用的なメカニズムであることが示唆された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:08:33 GMT)
SparOA: Sparse and Operator-aware Hybrid Scheduling for Edge DNN Inference [24.5] SparOAはディープニューラルネットワーク(DNN)モデルのためのハイブリッド推論フレームワークである。
演算子スケジューリングを最適化するために、疎度と計算強度の両方を使用する。
その結果、SparOAは全てのベースラインと比較して平均1.22-1.31倍のスピードアップを達成した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:45:28 GMT)
E$^3$-Pruner: Towards Efficient, Economical, and Effective Layer Pruning for Large Language Models [24.2] レイヤープルーニング(Layer pruning)は、モデル圧縮のためのハードウェアフレンドリーなアプローチである。
微分可能なマスク最適化法と、エントロピー対応の適応的知識蒸留戦略である。
96%の精度で オリジナルのモデルから たったの0.8%の低下です
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:32:01 GMT)
SpatialGeo:Boosting Spatial Reasoning in Multimodal LLMs via Geometry-Semantics Fusion [23.9] MLLM(Multimodal large language model)は、画像および言語タスクにおいて大きな進歩を遂げている。
ほとんどのMLLMは、空間的配置を3次元空間で解釈し推論する限られた空間的推論能力に悩まされている。
幾何学と意味論の階層的融合に基づく新しい視覚エンコーダを提案し,空間認識型視覚埋め込みを生成する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:24:33 GMT)
RoSA: Enhancing Parameter-Efficient Fine-Tuning via RoPE-aware Selective Adaptation in Large Language Models [23.7] タスク固有の適応には微調整された大きな言語モデルが必要であるが、計算的に禁止されている。
トレーニング可能なパラメータをよりターゲット的で効果的な方法で割り当てる新しいPEFTフレームワークであるRoPE対応選択適応(RoSA)を提案する。
RoSAはRoPE対応のアテンションエンハンスメント(RoAE)モジュールと、LayerNormのノルムに基づいて最も重要なレイヤを適応的に識別し更新する動的レイヤ選択(DLS)戦略を備えている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:55:01 GMT)
Digital Diasporas: How Origin Characteristics and Host-Native Distance Shape Immigrants' Online Cultural Retention [23.2] 本研究は,モザイク仮説の先行要因や,移民の文化維持の正当性を高める(あるいは低下させる)要因を同定する。
米国に住む8カ国からの移民に対するFacebookの広告データから、ホストとネイティブの距離が大きくなることが、オンライン文化の維持に結びついていることが示唆された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:15:12 GMT)
Characteristics, Root Causes, and Detection of Incomplete Security Bug Fixes in the Linux Kernel [23.1] 我々はLinuxカーネルにおける不完全なセキュリティバグの修正を初めて調査した。
まず,Linuxカーネルに不完全なセキュリティバグフィックスのデータセットを構築した。
次に、以下の3つの主要な洞察を得ます。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 21:44:20 GMT)
Blind Deconvolution for Color Images Using Normalized Quaternion Kernels [23.0] 既存の方法では、カラー画像をグレースケールに変換したり、各カラーチャネルを別々に処理したりすることが多い。
カラー画像のブラインドデコンボリューションに特化して設計された新しい四元不整合項を定式化する。
画像強度を維持するために,ブラインドデコンボリューションプロセスにおいて正規化された四元子カーネルを用いることを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:57:23 GMT)
Two Heads Better than One: Dual Degradation Representation for Blind Super-Resolution [22.2] 本稿では,ブラインドSR問題に対処する二分枝分解エクストラクタネットワークを提案する。
提案手法は,ぼやけた情報とうるさい情報を表す2つの非教師なし劣化埋め込みを予測する。
いくつかのベンチマーク実験により,本手法はブラインドSR問題におけるSOTA性能を実証した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 05:35:23 GMT)
Supervised Fine Tuning of Large Language Models for Domain Specific Knowledge Graph Construction:A Case Study on Hunan's Historical Celebrities [21.0] 本研究では,ドメイン固有情報抽出の教師付き微調整手法を提案する。
まず,Hunanの歴史的有名人ドメインに合わせた,きめ細かなスキーマ誘導型指導テンプレートを設計する。
第二に、パラメータ効率のよい命令微調整を4つの公開言語モデルに適用する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:30:20 GMT)
R2Q: Towards Robust 2-Bit Large Language Models via Residual Refinement Quantization [20.9] Residual Refinement Quantization (R2Q)は、2つのシーケンシャルな1ビットサブ量子化に分解する新しい2ビット量子化フレームワークである。
R2Qは、細粒度と粗粒度の両方で既存の2ビット量子化法より一貫して優れている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:39:44 GMT)
REXO: Indoor Multi-View Radar Object Detection via 3D Bounding Box Diffusion [20.6] 多視点屋内レーダ認識は、コスト効率とプライバシーリスクの低さから注目されている。
我々はDiffusionDetの2次元バウンディングボックス(BBox)拡散過程を3次元レーダ空間に持ち上げる textbfREXO (multi-view Radar object dEtection with 3D bounding boX diffusiOn) を提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 21:59:24 GMT)
POMA-3D: The Point Map Way to 3D Scene Understanding [20.5] ポイントマップは、構造化された2Dグリッド上の明示的な3D座標を符号化する。
リッチな2DプリエントをPOMA-3Dに転送するために、ビュー・ツー・シーンアライメント戦略が設計されている。
統合埋め込み予測アーキテクチャであるPOMA-JEPAは、幾何的に一貫した点マップ機能を複数のビューで実行している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:07:49 GMT)
Cross-cultural value alignment frameworks for responsible AI governance: Evidence from China-West comparative analysis [20.3] 本研究は中国-オリジンと西-オリジン大言語モデル(LLM)における異文化的価値アライメントを体系的に評価する。
Qwen、GPT-4o、Claude、LLaMA、DeepSeekといった主要なモデルの比較分析により、価値体系における普遍的課題-基礎的不安定性、若年層の体系的下層表現、モデルスケールとアライメント品質の相違する地域開発軌跡の非線形関係を明らかにする。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:02:33 GMT)
Non-Parametric Probabilistic Robustness: A Conservative Metric with Optimized Perturbation Distributions [19.8] 我々は,非パラメトリック確率ロバストネス(NPPR)を,対向的ロバストネス(AR)の代替として提案する。
NPPRはデータから直接、最適化された摂動分布を学習し、分布の不確実性の下で保守的なPR評価を可能にする。
CIFAR-10、CIFAR-100、Tiny ImageNetの実験では、最先端技術で使用される一般的な摂動分布を仮定すると、40%以上の保守的(より低い)PR推定値が得られた。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:44:01 GMT)
Live-SWE-agent: Can Software Engineering Agents Self-Evolve on the Fly? [19.8] 大規模言語モデル(LLM)は、ソフトウェア工学を含むほぼすべての産業を再構築している。
我々は,実世界のソフトウェア問題を解決する際に,自律的かつ連続的に自己進化できる,初のライブソフトウェアエージェントであるLive-SWE-agentを提案する。
広範に研究されているSWE-bench Verifiedベンチマークでは,Live-SWE-AGENTがテスト時間スケーリングなしで77.4%の精度で解決できることが示されている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:22:32 GMT)
Four decades of circumpolar super-resolved satellite land surface temperature data [19.7] 超解像アルゴリズムを用いて, AVHRR GAC から 1 km までダウンスケールした42年間のパンArctic LSTデータセットを提案する。
結果として得られたデータセットは、40年以上にわたってパン・アルキティック地域全体で2回、1 km LSTの観測結果を提供する。
永久凍土のモデリングの改善、表面近傍の大気温度の再構築、グリーンランド氷床の表面質量収支の評価を可能にした。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:53:19 GMT)
DISCA: A Digital In-memory Stochastic Computing Architecture Using A Compressed Bent-Pyramid Format [19.7] 大規模AIモデルは人間の脳の機能を模倣し、データ集約行列乗算タスクを通じて数百万と数十億のパラメータを特徴付ける。
これらのAIアプリケーションは、ロボット工学や無人航空機による監視など、急速にエッジに移行しているため、エッジにおけるAIアーキテクチャのハードウェア予算により多くの制約が加えられている。
準確率的なBent-Pyramidデータフォーマットの圧縮版を利用した新しいディジタルインメモリ・コンピューティング・アーキテクチャであるdisCAを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:13:16 GMT)
Flow-Guided Implicit Neural Representation for Motion-Aware Dynamic MRI Reconstruction [19.7] 動的磁気共鳴イメージング(dMRI)は解剖学的に時間分解されるが、限られたサンプリングや運動によって引き起こされるアーティファクトによってしばしば挑戦される。
本研究では,動的画像列とその基盤となる運動場を協調的にモデル化する,新しい暗黙的ニューラル表現フレームワークを提案する。
動的心臓MRIデータセットの実験により、この手法は最先端のモーションインスパイアされた深層学習手法よりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 04:51:23 GMT)
FIRM: Federated In-client Regularized Multi-objective Alignment for Large Language Models [19.3] FIRM(Federated In-client Regularized Multi-objective alignment)は,クライアントの不一致の低減と通信効率の両立を実現するアルゴリズムである。
FIRMはトレーニングをスムーズにし、クライアントの不一致を低減し、ベースラインよりも報酬トレードオフを改善した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 06:59:28 GMT)
DeltaDeno: Zero-Shot Anomaly Generation via Delta-Denoising Attribution [19.0] 異常発生は、しばしば、異常サンプルを用いた数発の微調整としてフレーム化される。
デルタデノジング(Delta-Denoising)は、欠陥をローカライズし、編集する訓練不要なゼロショット異常生成法である。
パブリックデータセットの実験では、DeltaDenoは下流検出のパフォーマンスにおいて、優れた世代、リアリズム、一貫性のあるゲインを達成している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 03:14:20 GMT)
Draft and Refine with Visual Experts [19.0] LVLM(Large Vision-Language Models)は、視覚的証拠ではなく、言語的先行に強く依存しているため、根拠のない、あるいは幻覚的な応答を生成する。
本稿では,質問条件付き利用指標によって駆動されるエージェントフレームワークであるDraft and Refine(DnR)を提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 06:58:21 GMT)
Extending Test-Time Scaling: A 3D Perspective with Context, Batch, and Turn [17.8] 推論強化学習(RL)は先頃、新たなスケーリング効果として、テスト時間スケーリングを発表した。
スケーリング効果のレンズによるテスト時間向上技術を再考する。
テスト時間推論のキャパシティを拡張するために,多次元テスト時間スケーリングの統一フレームワークを導入する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:10:10 GMT)
LLM and Agent-Driven Data Analysis: A Systematic Approach for Enterprise Applications and System-level Deployment [17.6] ジェネレーティブAIとエージェント技術は、エンタープライズデータ管理と分析を変革している。
従来のデータベースアプリケーションとシステムデプロイメントは、AI駆動のツールによって根本的に影響を受ける。
データセキュリティとコンプライアンスは、AI技術を採用する組織にとって最優先事項である。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:16:31 GMT)
ReBrain: Brain MRI Reconstruction from Sparse CT Slice via Retrieval-Augmented Diffusion [17.3] 低用量プロトコルは、しばしば低解像度の平面解像度のCTボリュームをもたらす。
脳MRI再建のための検索拡張拡散フレームワークであるReBrainを提案する。
SynthRAD2023とBraTSの実験により、ReBrainはスパース条件下でのクロスモーダル再構築において最先端の性能を発揮することが示された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:18:35 GMT)
CroTad: A Contrastive Reinforcement Learning Framework for Online Trajectory Anomaly Detection [17.1] オンライントラジェクトリ異常検出のためのコントラスト強化学習フレームワークであるCroTadを提案する。
本手法は, しきい値が無く, ノイズや不規則なサンプルデータに対して頑健である。
検出モジュールは、深層強化学習を利用して、オンラインでリアルタイムな異常スコアリングを行い、異常セグメントのタイムリーかつきめ細かな識別を可能にする。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 03:43:37 GMT)
PathAgent: Toward Interpretable Analysis of Whole-slide Pathology Images via Large Language Model-based Agentic Reasoning [17.1] PathAgentはトレーニングフリーで大規模言語モデル(LLM)に基づくエージェントフレームワークで、人間の専門家の反射的、段階的分析的アプローチをエミュレートする。
観察と決定のシーケンス全体が明確な連鎖を形成し、完全に解釈可能な予測をもたらす。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:50:14 GMT)
You Only Forward Once: An Efficient Compositional Judging Paradigm [17.1] YOFOはテンプレート条件付きメソッドで、単一のフォワードパスですべての要求を判断する。
標準的なレコメンデーションデータセットで最先端の結果を達成する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:08:45 GMT)
SemanticStitch: Enhancing Image Coherence through Foreground-Aware Seam Carving [16.9] 伝統的なシーム彫刻法は意味情報を無視し、前景の連続性を混乱させる。
深層学習に基づくフレームワークであるSemanticStitchを導入する。このフレームワークは,前景オブジェクトの意味的先行を組み込んで,その完全性を維持し,視覚的コヒーレンスを高める。
本手法は,有意な物体の意味的整合性を強調し,縫合品質を著しく向上する新規な損失関数を含む。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 04:13:45 GMT)
Bridging Visual Affective Gap: Borrowing Textual Knowledge by Learning from Noisy Image-Text Pairs [16.6] 本稿では、事前学習された視覚モデルの感情知覚を高めるために、事前学習されたテキストモデルから知識を借りることを提案する。
ノイズの多いソーシャルメディアデータにおいて、画像とテキスト間の事実的および感情的なつながりに焦点を当てる。
負対と正対を動的に構成することにより、ノイズサンプルの可能性を完全に活用する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:06:32 GMT)
REMSA: An LLM Agent for Foundation Model Selection in Remote Sensing [16.4] ファンデーションモデル(FM)は、環境モニタリング、災害評価、土地利用マッピングといったタスクにリモートセンシング(RS)にますます使われています。
本稿では、複数のデータモダリティ、解像度、学習パラダイムにまたがる150以上のRSFMをカバーする構造化リソースであるRSFM Database(RS-FMD)を紹介する。
自然言語クエリからRSFMを自動選択するための最初のLSMベースのエージェントであるREMSAを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:41:26 GMT)
Show Me: Unifying Instructional Image and Video Generation with Diffusion Models [16.3] 画像の操作と映像の予測を可能にする統一的なフレームワークを提案する。
構造的忠実度と時間的コヒーレンスを改善するために,構造的および運動的整合性報酬を導入する。
多様なベンチマーク実験により,本手法は指導画像と映像生成の両方において,専門家モデルよりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 23:24:28 GMT)
Designing and Generating Diverse, Equitable Face Image Datasets for Face Verification Tasks [16.1] 本稿では,高度な生成モデルを統合し,多種多様な高品質な合成顔画像を作成する包括的手法を提案する。
この研究は、人工知能における多様性と倫理に関する議論を豊かにするだけでなく、より包括的で信頼性の高い顔認証技術を開発する基盤も築き上げている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:53:08 GMT)
SF-Recon: Simplification-Free Lightweight Building Reconstruction via 3D Gaussian Splatting [15.6] SF-Reconは、ポストホックメッシュを単純化することなく、多視点画像から軽量な建築表面を直接再構築する手法である。
提案したSFデータセットに基づいて,実験結果から,多視点画像から軽量建築モデルを直接再構築できることが実証された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:21:15 GMT)
Agentic Program Verification [14.7] 本稿では,プログラム検証を行うための最初の大規模言語モデルエージェントであるAutoRocqを提案する。
LLMの広範な訓練を実証例に頼っている過去の研究とは異なり、我々のエージェントはオンザフライで学習し、反復的な改善ループを通じて証明を改善する。
このようにして、我々の証明構成は証明エージェントと定理証明器との間の自律的な協調を含む。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:51:48 GMT)
SweeperBot: Making 3D Browsing Accessible through View Analysis and Visual Question Answering [14.5] SweeperBotは、Screen Reader(SR)ユーザーが視覚的質問応答を利用して3Dモデルを調べて比較することを可能にするシステムである。
SR経験を持つ10 Blind and Low-Vision (BLV)ユーザによる専門家レビューでは、SweeperBotの使用の可能性が示された。
SweeperBotによる説明の質は、30人の目撃者による第2回調査によって検証された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:31:55 GMT)
RoomPlanner: Explicit Layout Planner for Easier LLM-Driven 3D Room Generation [14.4] 入力として短いテキストだけでリアルな屋内シーンを作成するための,最初の完全自動3Dルーム生成フレームワークであるRoomPlannerを提案する。
本フレームワークは,手動レイアウト設計やパノラマ画像ガイダンスを使わずに,合理的な空間配置のための明示的なレイアウト基準を生成することができる。
本手法は,編集性を維持しつつ,レンダリング速度と視覚的品質を両立させ,幾何学的に合理的な3次元室内シーンを創出することができる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:47:32 GMT)
Off the Planckian Locus: Using 2D Chromaticity to Improve In-Camera Color [14.3] 従来のカメラ内カラーマッピングは、CIE A や D65 のようなプランク蛍光体に最適化された相関色温度(CCT)ベースの変換に依存している。
現代の照明技術はプランクの軌跡から大きく逸脱し、従来の1次元CCTによる照明特性の限界を露呈する。
我々は,従来のCCTを,非プランクアン照明下でのロバストな色度マッピングのための2次元色度特徴を持つ軽量多層パーセプトロン(MLP)に置き換える。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:49:04 GMT)
Smoothed Agnostic Learning of Halfspaces over the Hypercube [14.3] 我々はブール入力のための新しいスムーズな学習フレームワークを導入し、乱数ビットフリップによって摂動をモデル化する。
入力分布の厳密な部分指数仮定の下では、ハーフスペースを学習するための効率的なアルゴリズムを与える。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:59:11 GMT)
Real Noise Decoupling for Hyperspectral Image Denoising [14.2] ハイパースペクトル画像(HSI)は,HSIの質を高めるための重要なステップである。
ノイズモデリング手法は、雑音分布に適合して合成HSIを生成し、デノナイジングネットワークを訓練する。
本稿では,複雑なノイズを明示的にモデル化し,暗黙的にモデル化したコンポーネントに分解する多段階ノイズ分離フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:23:07 GMT)
Generalization Bounds for Semi-supervised Matrix Completion with Distributional Side Information [14.1] 本稿では, 基底真理$R$行列と未知のサンプリング分布$P$が低ランク行列である行列完備化問題について検討する。
真の一般化誤差は、それぞれ$P$と基底真理行列$ground$の見積もりに対応する独立した誤差項に分解されることを示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:07:39 GMT)
PostCam: Camera-Controllable Novel-View Video Generation with Query-Shared Cross-Attention [13.9] PostCamは、ダイナミックシーンにおけるカメラトラジェクトリのポストキャプチャ後の編集を可能にする、ノベルビュービデオ生成のためのフレームワークである。
実世界のデータセットと合成データセットの両方の実験により、PostCamは最先端の手法よりも、カメラ制御の精度とビューの一貫性が20%以上向上していることが示された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:05:46 GMT)
LangMark: A Multilingual Dataset for Automatic Post-Editing [13.9] LangMarkは、英語を7つの言語に翻訳するための、人手による新しい多言語APEデータセットである。
データセットには206,983個の三重項があり、それぞれの三重項はソースセグメント、NMT出力、ヒトの編集後翻訳で構成されている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:18:15 GMT)
That's not natural: The Impact of Off-Policy Training Data on Probe Performance [13.9] 合成・非政治データの利用が,8つの異なる行動におけるプローブの一般化にどのように影響するかを評価する。
偽装とサンドバッグプローブは、実際の監視シナリオで使用される場合、オフ・ポリティクスからオン・ポリティクス・データへの一般化に失敗する可能性がある。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:08:48 GMT)
HUMORCHAIN: Theory-Guided Multi-Stage Reasoning for Interpretable Multimodal Humor Generation [13.5] 噂は、創造的な人間の活動と社会的結びつきのメカニズムの両方として、AI生成において長年大きな課題を提起してきた。
理論誘導型多段階推論フレームワークHUMORCHAINを提案する。
視覚的意味解析、ユーモアと心理学に基づく推論、そしてユーモア評価のための微調整された識別器を統合している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:52:46 GMT)
Multi-Agent Collaborative Reward Design for Enhancing Reasoning in Reinforcement Learning [13.3] CRMは単一のブラックボックス報酬モデルを置き換えるフレームワークであり、専門家評価者の調整されたチームに置き換えられている。
トレーニングとアセスメントをサポートするために、CRMの協調的な構造に沿ったベンチマークとトレーニングスイートである rewardBenchを紹介します。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 03:50:21 GMT)
Downscaling Intelligence: Exploring Perception and Reasoning Bottlenecks in Small Multimodal Models [13.3] 大規模言語モデル(LLM)の容量削減がマルチモーダル能力に与える影響について検討する。
LLMのダウンスケーリングは、LLMから受け継いだ能力よりも、視覚能力に影響を与える。
我々は視覚的抽出チューニングを導入し、タスク全体にわたって命令関連視覚的詳細を一貫して抽出するようにモデルを明示的に訓練する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:43:01 GMT)
Polarity-Aware Probing for Quantifying Latent Alignment in Language Models [13.2] Polarity-Aware CCS (PA-CCS) は、モデルの内部表現が極性反転の下で一定であるかどうかを評価する手法である。
モデルの潜在的知識のセマンティックロバスト性を定量化するために,2つのアライメント指向メトリクスであるPolar-ConsistencyとContradiction Indexを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:58:45 GMT)
Masked-and-Reordered Self-Supervision for Reinforcement Learning from Verifiable Rewards [13.1] MR-RLVR(Masked-and-Reordered RLVR)を提案する。
MR-RLVRをQwen2.5-3BとDeepSeek-R1-Distill-Qwen-1.5Bで実装し,AIME24,AIME25,AMC23,MATH500で評価した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:23:04 GMT)
Align & Invert: Solving Inverse Problems with Diffusion and Flow-based Models via Representational Alignment [13.0] 逆問題では、事前訓練された生成モデルが先行として使用される。
本稿では,拡散モデルとフローベースモデル間の表現アライメント(REPA)を適用することを提案する。
モデル表現と近似的対象特徴との整合性は、再構成の忠実度と知覚的リアリズムを大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 00:37:04 GMT)
Hallucinate Less by Thinking More: Aspect-Based Causal Abstention for Large Language Models [12.4] LLMの知識の内部の多様性を分析して早期の禁忌を可能にする新しい枠組みであるAspect-Based Causal Abstention (ABCA)を紹介する。
ABCAは、これらの側面で条件付けられた因果効果を推定し、与えられたクエリに関連する知識の信頼性を評価する。
標準ベンチマークの実験では、ABCAは禁忌信頼性を向上し、最先端のパフォーマンスを達成し、禁忌決定の解釈可能性を高めることが示されている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:42:49 GMT)
PoETa v2: Toward More Robust Evaluation of Large Language Models in Portuguese [12.3] ポルトガル語におけるLarge Language Models (LLM) の最も広範な評価について述べる。
トレーニングスケールと計算リソースの幅広い範囲をカバーする20以上のモデルを評価する。
このベンチマークと分析を通じて、PoETa v2はポルトガル語のモデリングと評価に関する将来の研究の基礎を成している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 22:01:51 GMT)
RacketVision: A Multiple Racket Sports Benchmark for Unified Ball and Racket Analysis [12.0] RacketVisionは、スポーツ分析におけるコンピュータビジョンを前進させるための新しいデータセットである。
従来のボールの位置と並んで、ラケットポーズのための大規模できめ細かいアノテーションを提供する。
微粒な球追跡、ラケットのポーズ推定、予測的球軌道予測の3つのタスクに取り組むように設計されている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:44:33 GMT)
KRAL: Knowledge and Reasoning Augmented Learning for LLM-assisted Clinical Antimicrobial Therapy [12.0] KRAL(Knowledge and Reasoning Augmented Learning)は、低コストでスケーラブルで、プライバシ保護のパラダイムである。
教師モデル推論を用いて知識を自動抽出し、回答から質問への逆生成を通じて軌跡を推論する。
従来のレトリーバル拡張ジェネレーション(RAG)とスーパーバイザードファインチューニング(SFT)の手法を大きく上回っている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 06:00:04 GMT)
Pre-cache: A Microarchitectural Solution to prevent Meltdown and Spectre [11.5] これらの攻撃はMeltdownとSpectreと呼ばれ、現代のマイクロプロセッサのパフォーマンス向上機能による副作用を悪用している。
我々は、攻撃によって悪用された脆弱性に対処する、Meltdown and Spectreのためのマイクロアーキテクチャベースのソリューションを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:23:27 GMT)
ARQUSUMM: Argument-aware Quantitative Summarization of Online Conversations [11.3] 本稿では,議論における議論のクレーム・レアソン構造を明らかにするために,議論を定量的に要約する新しい課題を提案する。
定量的要約のために、ARQUSUMMは引数を集約し、それらのサポートを定量化するために、引数構造を意識したクラスタリングアルゴリズムを使用している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 06:37:32 GMT)
Towards Open-Ended Visual Scientific Discovery with Sparse Autoencoders [11.2] スパースオートエンコーダが基礎モデル表現からオープンな特徴発見を可能にするかどうかを問う。
生態画像に適用すると、同じ手順がセグメンテーションや部分ラベルにアクセスせずに微細な解剖学的構造を表面化する。
この結果から, スパース分解は, 科学基盤モデルが何を学んだかを調べるための実践的な手段となることが示唆された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:38:07 GMT)
Radar2Shape: 3D Shape Reconstruction from High-Frequency Radar using Multiresolution Signed Distance Functions [11.1] 本稿では, 部分的に観測可能なレーダー信号を3次元再構成する拡散モデルRadar2Shapeを提案する。
我々はRadar2Shapeが部分的に観測されたレーダ信号からでも任意の3次元形状を復元できることを実証した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:40:03 GMT)
A Stitch in Time: Learning Procedural Workflow via Self-Supervised Plackett-Luce Ranking [11.0] 手続き的活動は、特定の時間的順序で実行される一連の行動として高度に構造化されている。
現在の自己教師型学習手法は、そのような活動を支える手続き的な性質を見落としていることが多い。
本稿では,映像フレームの時間的順序を強力な監視信号として活用する自己教師型フレームワークPL-Stitchを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 21:59:22 GMT)
Scaling Self-Supervised and Cross-Modal Pretraining for Volumetric CT Transformers [11.0] 本稿では,CTのためのフルトランスフォーマーベース基礎モデルであるSPECTREを紹介する。
提案手法は,スケーラブルな3Dビジョントランスフォーマーアーキテクチャと,近代的な自己監督型・視覚言語事前学習戦略を利用する。
SPECTREはゼロショット設定と微調整設定の両方で、CTファンデーションモデルよりも一貫して優れている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:41:27 GMT)
GPR-OdomNet: Difference and Similarity-Driven Odometry Estimation Network for Ground Penetrating Radar-Based Localization [11.0] 本研究では,Bスキャン画像間のユークリッド距離を正確に推定するニューラルネットワークを用いた新しいオドメトリー手法を提案する。
実験結果から,本手法はすべての試験において常に最先端の手法よりも優れることがわかった。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:59:17 GMT)
Broadband telecom single-photon emissions from InAs/InP quantum dots grown by MOVPE droplet epitaxy [10.9] 本研究では,OバンドからCバンドの単一光子源型半導体量子ドット(QD)に対する液滴エピタキシー戦略を提案する。
InAs/InP QDを1600nmの広いスペクトル範囲に分散した細い発光線で合成した。
この研究は、将来的なマイクロキャビティ拡張技術の研究のための重要なプラットフォームを提供し、テレコムバンド内の他の量子フォトニクスとQDを結合する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 02:17:21 GMT)
Parts-Mamba: Augmenting Joint Context with Part-Level Scanning for Occluded Human Skeleton [10.9] Parts-MambaはGCN-Mambaのハイブリッドモデルである。
提案手法は,NTU RGB+D 60およびNTU RGB+D 120データセットを用いて評価し,最大12.9%の精度向上を実現した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 00:08:21 GMT)
Spectroscopy on a single nonlinear mode recognizes quantum states [10.4] 量子非線形駆動散逸モードは量子貯水池として機能するのに十分であることを示す。
我々はその効果を明示的な非自明な例で説明する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 04:42:53 GMT)
A Lifting Theorem for Hybrid Classical-Quantum Communication Complexity [10.4] 古典通信と量子通信のトレードオフを$f:0,1ntopm1$と$G$の形式で構成する関数に対して検討する。
我々は、$c$古典ビットを通信し、$q$ qubitsが続く任意のハイブリッドプロトコルが$c+q2=bigを満たす必要があることを示す。
これは、ハイブリッド双方向通信複雑性における古典的通信と量子的通信の非自明なトレードオフとしては初めてである。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:14:04 GMT)
A Framework for Adaptive Stabilisation of Nonlinear Stochastic Systems [10.3] 線形パラメータ化不確実性を持つ離散時間非線形系に対する適応制御問題を考察する。
本稿では,一定の等価学習に基づく適応制御戦略を提案する。
状態空間全体が情報的であり、コントローラのファミリーが適切に選択されたパラメータでグローバルに安定化している場合、高い確率安定性を保証することが示される。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:33:00 GMT)
Sparse Mixture-of-Experts for Multi-Channel Imaging: Are All Channel Interactions Required? [10.2] MoE-ViTは、$textViTs$のマルチチャネル画像のためのMixture-of-Expertsアーキテクチャである。
各チャネルをエキスパートとして扱い、パッチ毎に最も関連性の高い専門家のみを選択するために軽量ルータを使用する。
犠牲にすることなく実質的な効率向上を実現し、場合によっては性能を向上する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:00:02 GMT)
Enhancing Adversarial Transferability through Block Stretch and Shrink [10.2] 敵対的攻撃は、ニューラルネットワークを誤解させる小さな、故意に作られた摂動をもたらす。
既存の入力変換ベースの攻撃は、限られたクロスモデル転送可能性を示す傾向がある。
本稿では,ブロックに画像を分割し,そのブロックにストレッチとストレッチ操作を適用するBlock Stretch and Shrink (BSS)を提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:00:01 GMT)
CubeletWorld: A New Abstraction for Scalable 3D Modeling [9.8] キューブレットと呼ばれる空間単位の離散化された3次元グリッドを通して都市環境を表現・解析するフレームワークであるCubeletWorldを紹介した。
この抽象化により、インフラストラクチャ、ムーブメント、環境指標などの多様なデータ信号を局所化されたキューブレット状態に埋め込むことで、プライバシ保護モデリングが可能になる。
本研究では,様々な都市要素を含むリアルなデータセットを用いて,キューブレット状態の予測を行うキューブレット世界状態予測タスクを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 00:19:02 GMT)
Point of Order: Action-Aware LLM Persona Modeling for Realistic Civic Simulation [9.8] この研究は、公開Zoomレコードをペルソナプロファイルや実用的なアクションタグといったメタデータを備えた、話者対応のトランスクリプトに変換するパイプラインを導入している。
地方自治体の審議会、学校委員会会議、市議会セッションの3つの審議会データセットをリリースする。
この「アクション認識」データを用いて特定の参加者をモデル化する微調整LDMは、パープレキシティを67%減少させる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 22:07:33 GMT)
Learning to Debug: LLM-Organized Knowledge Trees for Solving RTL Assertion Failures [9.8] 我々は,再利用可能なデバッグの専門知識を知識ツリーに学習し,整理する階層的な知識管理フレームワークであるGROVEを提案する。
GROVEは、事前のケースからデバッグ知識を抽出し、それを、簡潔な知識アイテムをコードする各ノードで、深さの垂直ツリーに整理する。
GROVEはpass@1とpass@5で一貫したゲインを提供し、構造化された知識進化の価値を実証している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 22:57:45 GMT)
Personalized Reward Modeling for Text-to-Image Generation [9.8] ユーザ条件付き評価次元を動的に生成し,CoT推論による画像評価を行うパーソナライズされた報酬モデルであるPIGRewardを提案する。
PIGRewardは、ユーザ固有のプロンプト最適化を促進するパーソナライズされたフィードバックを提供する。
大規模な実験により、PIGRewardは精度と解釈可能性の両方において既存の手法を超越していることが示された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:04:24 GMT)
ReVul-CoT: Towards Effective Software Vulnerability Assessment with Retrieval-Augmented Generation and Chain-of-Thought Prompting [9.7] 本稿では,検索・拡張生成(RAG)とChain-of-Thought(COT)のプロンプトを統合した新しいフレームワークを提案する。
ReVul-CoTでは、RAGモジュールは構築されたローカル知識ベースからコンテキスト関連情報を動的に取得する。
DeepSeek-V3.1 上に構築されている CoT は LLM に対して,利用性や影響範囲,関連する要因に関するステップバイステップの推論を行うように促している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:01:49 GMT)
Fast LLM Post-training via Decoupled and Best-of-N Speculation [9.7] SpecActor は,(1) 音速分離型投機法,(2) 音速ベストオブN投機法による投機ロールアウトの2つの課題に対処する。
sysは、エンドツーエンドのトレーニングではveRLよりも1.7,$times$速く、1.3-1.5,$times$は投機的デコーディングのベースラインよりも高速である。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:34:03 GMT)
QueryOcc: Query-based Self-Supervision for 3D Semantic Occupancy [9.5] 画像から3Dシーンの幾何学と意味学を学ぶことは、コンピュータビジョンにおける中核的な課題であり、自動運転の重要な能力である。
大規模な3Dアノテーションは高価であるため、最近の研究は手動ラベルなしでセンサデータから直接自己教師付き学習を探索している。
クエリベースの自己教師型フレームワークであるQueryOccを導入し、独立した4Dセマンティッククエリを通じて、継続的3D占有を直接学習する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:05:42 GMT)
UI-Styler: Ultrasound Image Style Transfer with Class-Aware Prompts for Cross-Device Diagnosis Using a Frozen Black-Box Inference Network [9.5] そこで本稿では,UI-Styler を用いた新しい超音波画像転送フレームワークを提案する。
パターンマッチング機構を使用して、ターゲット画像に埋め込まれたテクスチャパターンをソースイメージに転送する。
対象ドメインの擬似ラベルで案内されるクラス認識プロンプト戦略を導入し,診断カテゴリとの正確なセマンティックアライメントを実現する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:19:57 GMT)
Parameter-Free Neural Lens Blur Rendering for High-Fidelity Composites [9.3] 一貫性のある自然なカメラレンズのぼかしは、3D仮想オブジェクトを写真にシームレスにブレンドするのに重要である。
既存のパイプラインは、しばしば写実的なレンズぼかしレンダリングのために混乱の円(CoC)を計算するためにカメラパラメータに依存する。
本稿では,RGB画像から直接CoCマップを推定する手法を提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:32:05 GMT)
RL-AD-Net: Reinforcement Learning Guided Adaptive Displacement in Latent Space for Refined Point Cloud Completion [9.3] 本稿では,事前学習点オートエンコーダの潜在空間で動作する強化学習フレームワークであるRL-AD-Netを提案する。
頑健性を確保するために、軽量な非パラメトリックPointNNセレクタは、元の完備化とRL精製出力の両方の幾何的整合性を評価する。
ShapeNetCore-2048の実験では、ベースライン完了ネットワークはトレーニングスタイルの収穫において合理的に機能するが、ランダムな収穫シナリオで苦労することを示した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:55:55 GMT)
Comparing verbal, visual and combined explanations for Bayesian Network inferences [9.2] 我々は、一般的な推論パターンを通してユーザを誘導するために、標準BN UIの言語的および視覚的な拡張を設計した。
言語的,視覚的,複合的なUI拡張と,ベースラインUIを比較するために,ユーザスタディを実施しました。
本研究の主目的は,(1) 利用者は,観察の影響,この影響を可能にする経路,観察が他の観察の影響にどう影響するか,といった質問に対して,ベースラインUIよりも3種類の拡張に優れていた。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 05:25:23 GMT)
Navigating in the Dark: A Multimodal Framework and Dataset for Nighttime Traffic Sign Recognition [9.2] INTSDは、インドの様々な地域で収集された交通標識の街路レベルの夜間画像の大規模なデータセットである。
共同照明の補正と信号の局所化のための適応画像強調検出器を組み込んだLENS-Netを提案する。
本手法は既存のフレームワークを超越し,その重要な構成要素の有効性を検証した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:04:53 GMT)
MultiGA: Leveraging Multi-Source Seeding in Genetic Algorithms [9.0] 大規模言語モデル(LLM)は、複雑なタスクに対処するために研究領域で広く使われているが、その性能は目前のタスクによって大きく異なる可能性がある。
複雑な自然言語処理や推論問題に遺伝的アルゴリズムの原則を適用した新しいアプローチであるMultiGAを導入する。
我々は,テキストからコードへの生成タスク,旅行計画,大学院レベルの科学問題に対するGPQAベンチマーク,BBQバイアスベンチマークを用いて,我々のアプローチをベンチマークする。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 21:47:33 GMT)
Steering in the Shadows: Causal Amplification for Activation Space Attacks in Large Language Models [8.9] 本稿では,デコーダのみの大規模言語モデル(LLM)における中間的アクティベーションが,行動制御のための脆弱な攻撃面を形成することを示す。
我々はこれを、段階的なアクティベーションレベル攻撃であるSensitivity-Scaled Steering (SSS)による攻撃面として活用する。
SSSは,高いコヒーレンスと汎用性を維持しつつ,悪,幻覚,覚醒,情緒に大きな変化をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:19:55 GMT)
Understanding Counting Mechanisms in Large Language and Vision-Language Models [8.9] 本研究では,大規模言語モデル (LLM) と大規模視覚言語モデル (LVLM) が,タスク数における数値情報をどのように表現し,計算するかを検討する。
その結果、個々のトークンや視覚的特徴が、コンテキスト間で抽出および転送可能な潜在位置カウント情報を符号化していることがわかった。
LVLMでは、空間組成に応じて背景領域と前景領域を移動する視覚埋め込みにも数値情報が現れる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:48:22 GMT)
Parameter Inference from Final-State Entanglement in Higgs Decays [8.9] 最終状態スピン間の絡み合いを計算し、全ての減衰チャネルをまたいだ色を計算する。
標準模型の中では、絡み合いエントロピーは観測されたヒッグス質量に近い大域的な最大値を示す。
同じ基準を適用すると、ベクトルとフェルミオンのカップリングの間のSMライクなバランスが示される。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:40:23 GMT)
Investigating self-supervised representations for audio-visual deepfake detection [8.9] 自己監督型表現は視覚や音声のタスクに優れるが、ディープフェイク検出の可能性はまだ未解明である。
モーダル性(オーディオ、ビデオ、マルチモーダル)とドメイン(リップムーブメント、ジェネリックビジュアルコンテンツ)で評価する。
自己管理機能の多くは, ディープフェイク関連情報を捉えており, この情報は相補的であることがわかった。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:04:00 GMT)
PEGS: Physics-Event Enhanced Large Spatiotemporal Motion Reconstruction via 3D Gaussian Splatting [8.7] PEGSは3D Gaussian Splattingパイプライン内でのイベントストリーム拡張と物理プライオリティを統合するフレームワークである。
本稿では,加速度制約を通した物理的妥当性を強制する3段階の監視手法を提案する。
また、さまざまなデータセットにまたがる自然な高速な動きをターゲットとした、最初のRGB-Eventペアも提供します。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:27:51 GMT)
Boosting Brain-inspired Path Integration Efficiency via Learning-based Replication of Continuous Attractor Neurodynamics [8.5] 本稿では,CANNの神経力学パターンを再現する表現学習モデルを用いた効率的なPI手法を提案する。
この方法は、軽量ニューラルネットワーク(ANN)を用いたCANNモデル頭部方向細胞(HDC)とグリッド細胞(GC)の神経力学パターンの再現に成功している。
様々な環境でのベンチマークテストは、よく知られたNeuroSLAMシステムと比較して、これはナビゲーション細胞の神経力学パターンを正確に再現するだけでなく、位置決め精度でNeuroSLAMと一致することを示した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:13:45 GMT)
Device-Guided Music Transfer [8.5] デバイスに誘導された音楽転送は、未確認のデバイス間で再生を適応させる。
DeMTは、視覚言語モデルを用いて話者の周波数応答曲線を線グラフとして処理し、デバイス埋め込みを抽出する。
自己コンパイルされたデータセットに基づいて微調整されたDeMTは、効果的な話者スタイルの転送と、目に見えないデバイスに対する堅牢な少数ショット適応を可能にする。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:57:11 GMT)
Predicting the Formation of Induction Heads [8.3] バッチサイズとコンテキストサイズを組み合わせた単純な方程式は,IHsが生成する点を予測する。
IH生成には, 高いビッグラム繰り返し周波数と信頼性の局所的依存性が十分だが, 周波数と信頼性が低い場合には, 因果性や分布物の形状が変化する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 02:17:01 GMT)
Range-Edit: Semantic Mask Guided Outdoor LiDAR Scene Editing [8.3] 自律運転とナビゲーションシステムのトレーニングには、大規模で多様なポイントクラウドデータセットが必要である。
現在の方法は、手作りの3D仮想環境内のポイントクラウドデータをシミュレーションすることに依存している。
本研究では,現実世界のLiDARスキャンを編集することで議論される問題に対処する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:16:27 GMT)
Text2Traffic: A Text-to-Image Generation and Editing Method for Traffic Scenes [8.3] 画像生成と編集の両方に統一されたテキスト駆動フレームワークを提案する。
交通シーンの幾何学的多様性を高めるために、車両側と道路側の両方のマルチビューデータを組み込んだ。
本手法は,トラフィックシーン内におけるテキストベースの画像生成と編集における先行的な性能を実現する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:15:09 GMT)
Algorithmic design and implementation considerations of deep MPC [8.2] この原稿は、Deep MPCの実装上の課題を説明し、制御権限の分散における不適切な選択は、パフォーマンスの低下につながるかもしれないと論じている。
4輪スキッドステア動力学の数値実験により, 性能低下の理由が説明できる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:21:20 GMT)
InTAct: Interval-based Task Activation Consolidation for Continual Learning [8.2] Intactは、パラメータを凍結したり過去のデータを保存したりすることなく、共有レイヤで機能的な振舞いを保存する。
そうすることで、Intactはパラメータ値を直接制限するのではなく、重要なニューロンの機能的役割を安定化する。
さまざまなドメイン-インクリメンタルベンチマークを通じて、InTActは表現のドリフトを一貫して削減し、パフォーマンスを向上する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:36:12 GMT)
Mask the Redundancy: Evolving Masking Representation Learning for Multivariate Time-Series Clustering [8.2] 本稿では,IVM(Importance-aware Variate-wise Masking)およびMEV(Multi-Endogenous Views)表現学習モジュールからなるEMTC(Evolving-Masked MTS Clustering)手法を提案する。
15の実際のベンチマークデータセットの実験では、8つのSOTA法と比較してEMTCの優位性が示され、EMTCは最強のベースラインよりも平均4.85%向上した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:26:40 GMT)
Towards fully differentiable neural ocean model with Veros [8.2] 我々はVEROS海洋モデルの微分可能な拡張を提案し、その動的コアによる自動微分を可能にした。
本稿では、JAX自動微分フレームワークとの完全互換化に必要な重要な変更点について述べ、結果の実装の数値的整合性を評価する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:24:00 GMT)
Detecting Performance-Relevant Changes in Configurable Software Systems [8.0] ConfFLAREは、変更がパフォーマンス関連コードとデータ-フローの相互作用を識別することで、パフォーマンスに潜在的に影響を及ぼすかどうかを見積もっている。
ほぼすべてのケースでパフォーマンスのレグレッションを正しく検出し、2つのケースを除いて、関連する機能をすべて識別する。
これにより、平均してテストすべき構成数が、合成で79%、実世界の回帰シナリオで70%削減され、パフォーマンステスト時間が短縮される。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:20:08 GMT)
Less is More: Data-Efficient Adaptation for Controllable Text-to-Video Generation [7.9] 本稿では,疎結合で低品質な合成データから制御を学習するデータ効率の微調整戦略を提案する。
このような単純なデータに対して微調整を行うことで、望まれる制御が可能になるだけでなく、実際にフォトリアリスティックな「リアル」データに基づいて微調整されたモデルに優れた結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 23:41:19 GMT)
JigsawComm: Joint Semantic Feature Encoding and Transmission for Communication-Efficient Cooperative Perception [7.9] JigsawCommはエンドツーエンドのトレーニング、セマンティックアウェア、通信効率の良いCPフレームワークである。
正規化エンコーダを使用して、意味的関連性とスパースな特徴を抽出する。
軽量のFeature Utility Estimatorを使用して、各エージェントの機能を最終認識タスクへのコントリビューションを予測する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 23:36:24 GMT)
Counterfactual World Models via Digital Twin-conditioned Video Diffusion [7.8] CWMDTは,標準映像拡散モデルを効果的な対実世界モデルに変換するフレームワークである。
CWMDTは観察されたシーンのデジタルツインを構築し、オブジェクトとその関係を明示的にエンコードし、構造化されたテキストとして表現する。
我々は,CWMDTが最先端のパフォーマンスを達成し,映像の代替表現であるデジタルツインが,映像フォワードシミュレーションに基づく世界モデルに強力な制御信号を提供することを示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:37:23 GMT)
A Multi-Stage Optimization Framework for Deploying Learned Image Compression on FPGAs [7.6] ディープラーニングベースの画像圧縮(lic)は、最先端のレート歪み(RD)性能を達成したが、これらのモデルをリソース制約付きFPGAにデプロイすることは大きな課題である。
この研究は、高性能浮動小数点モデルと効率的なハードウェアフレンドリな整数ベースの実装とのギャップを埋める、完全なマルチステージ最適化フレームワークを提供する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:55:44 GMT)
Stable Coresets via Posterior Sampling: Aligning Induced and Full Loss Landscapes [7.4] Coreset選択は、完全なデータセットのパフォーマンスを近似する、小さな、代表的なデータのサブセットを特定することで、トレーニングを加速することを目的としている。
勾配に基づく手法は、特に限られたデータ予算の下で、強力な理論的基盤と実用的な利益のために際立っている。
本稿では、これらの制約に対処する新しいフレームワークを提案する。まず、後方サンプリングとロスランドスケープの接続を確立し、高データ破損シナリオにおいてもロバストなコアセット選択を可能にする。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:00:00 GMT)
A Unified Stability Analysis of SAM vs SGD: Role of Data Coherence and Emergence of Simplicity Bias [7.4] 勾配降下(SGD)とその変種は、よく一般化する解を確実に見つけるが、この一般化を導くメカニズムはいまだ不明である。
本研究では,SGD,ランダム摂動,SAMの挙動を,特に2層ReLUネットワーク上で解析する線形安定性フレームワークを開発する。
私たちの分析の中心は、データポイント間の勾配曲率の整合性を定量化するコヒーレンス尺度であり、トレーニング中に特定のミニマが安定して好まれる理由を明らかにしている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:41:14 GMT)
ARISE: Agentic Rubric-Guided Iterative Survey Engine for Automated Scholarly Paper Generation [7.4] ARISEは、学術調査論文の自動生成と継続的改善のためのエージェント誘導反復調査エンジンである。
ARISEは、特定の大規模言語モデルエージェントで構成されたモジュラーアーキテクチャを採用し、それぞれがトピック拡張、引用キュレーション、文学要約、原稿の草稿作成、ピアレビューに基づく評価などの学術的な役割を反映している。
ARISEは、包括性、正確性、フォーマッティング、総合的な学術的厳密さの指標にまたがる基準的手法を一貫して超越している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:14:35 GMT)
MOOT: a Repository of Many Multi-Objective Optimization Tasks [7.3] ソフトウェアエンジニアは、競合する目標をトレードオフする決定をしなければならない。
MoOTは最近のSE研究論文から得られた多目的最適化タスクのリポジトリである。
MoOTの現在の120以上のタスクはMITライセンス下で無料で利用できる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 01:16:21 GMT)
QAL: A Loss for Recall Precision Balance in 3D Reconstruction [7.3] QAL(Quality-Aware Loss)は、CD(Chamfer Distance)やEMD(Earth Mover's Distance)の代替品である。
多様なパイプライン全体にわたって、QALは、CDよりも平均+4.3 pts、最高の選択肢よりも+2.8 ptsの改善により、一貫したカバレッジ向上を達成する。
したがって、QALはロバストな3Dビジョンと安全クリティカルなロボティクスパイプラインに対して、原則的で解釈可能で実践的な目標を提供する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 22:38:16 GMT)
EduMod-LLM: A Modular Approach for Designing Flexible and Transparent Educational Assistants [7.3] 本稿では,Large Language Model (LLM) を用いた質問応答システムの総合評価を行う。
我々のフレームワークは、各コンポーネントを分離し、評価することで、きめ細かい分析を可能にします。
このモジュラーアプローチは、特定の障害モードとパフォーマンスパターンを明らかにし、解釈可能で効果的な教育用QAシステムの開発をサポートする。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 23:05:46 GMT)
OmniPT: Unleashing the Potential of Large Vision Language Models for Pedestrian Tracking and Understanding [7.2] OmniPTという新しい統合された歩行者追跡フレームワークを提案する。これは参照に基づいて追跡し、追跡し、対話的に追跡対象のセマンティックな理解を生成する。
追従ベンチマーク実験を行い,提案手法が従来の手法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:54:49 GMT)
Deep Improvement Supervision [6.8] Tiny Recursive Models (TRM) は、複雑な推論タスクにおいて、Large Language Models (LLM) よりも優れている。
そこで本研究では,学習中の各ループを対象とする新たな学習手法を提案する。
提案手法は,標準TRMに匹敵する品質を維持しつつ,フォワードパスの総数を18倍に減らし,停止機構をなくす。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 01:54:23 GMT)
GeoPTH: A Lightweight Approach to Category-Based Trajectory Retrieval via Geometric Prototype Trajectory Hashing [6.8] 本稿では,カテゴリーベーストラジェクトリ検索のための新しい,軽量かつ非学習フレームワークであるトラジェクトリプロトタイプ(GeoPTH)を提案する。
我々の研究は、軽量でプロトタイプ的なアプローチが、例外的な検索性能と計算効率を達成し、実用的で強力な代替手段を提供することを示した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:03:29 GMT)
PersonaAgent with GraphRAG: Community-Aware Knowledge Graphs for Personalized LLM [6.6] パーソナライズされたAIエージェントを必要とするペルソナ型言語モデルシステムのための新しいフレームワークを提案する。
提案手法では,エージェントがユーザの"ペルソナ"を具現化し,大規模言語モデル(LLM)をベースとする。
本フレームワークは,(1)知識グラフから抽出したユーザの履歴行動と嗜好の要約と,(2)グラフに基づくコミュニティ検出によって同定された関連するグローバルなインタラクションパターンを組み合わせることで,パーソナライズされたプロンプトを生成する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:15:47 GMT)
SPAGS: Sparse-View Articulated Object Reconstruction from Single State via Planar Gaussian Splatting [6.5] 本稿では,平面ガウススプラッティングによるカテゴリー非依存のオブジェクト再構成フレームワークを提案する。
本手法は,合成データと実世界データの両方で高忠実な部分レベル表面再構成を実現する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:49:53 GMT)
SG-OIF: A Stability-Guided Online Influence Framework for Reliable Vision Data [6.4] 本稿では,テスト予測に対するトレーニングポイントの影響を近似するための安定誘導オンライン影響フレームワーク(SG-OIF)を提案する。
CIFAR-10の上位1%の予測サンプルでは,SG-OIFが91.1%,MNISTの99.8%のAUPRスコアが得られた。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:58:54 GMT)
ToC: Tree-of-Claims Search with Multi-Agent Language Models [6.4] ToCは、クレーム編集をガイド付き検索問題として再定義する革新的なフレームワークである。
ToCはモンテカルロ木探索(MCTS)と協調的なマルチエージェントシステムを統合している。
新規性、スコープ保持、セマンティックコヒーレンス批判を共同で最適化する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 06:01:28 GMT)
End-to-End Transformer Acceleration Through Processing-in-Memory Architectures [6.3] トランスフォーマーは自然言語処理や大規模言語モデルの中心となっているが、大規模に展開することは3つの大きな課題に直面している。
この研究は、オフチップデータ転送を最小限に抑えるために注意を再構築し、KVキャッシュを動的に圧縮してプーンし、複雑さとハードウェアフットプリントを減らすための連想メモリ操作として注意を解釈する処理インメモリソリューションを導入する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:22:47 GMT)
SAVeD: Semantic Aware Version Discovery [6.2] SAVeDは、構造化データセットのバージョンを特定するための対照的な学習ベースのフレームワークである。
我々の実験は、Semantic Versioning in Databases Benchmarkの5つの標準データセットにまたがっている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:11:15 GMT)
Lane-Frame Quantum Multimodal Driving Forecasts for the Trajectory of Autonomous Vehicles [6.1] 自動運転のトレイ予測は、厳密な計算とレイテンシの制約の下で、正確でマルチモーダルなキャリブレーションされた予測を提供する必要がある。
本稿では,エゴ中心のレーン配向フレームで動作することにより,量子帰納バイアスを路面構造に整合させる,コンパクトなハイブリッド量子アーキテクチャを提案する。
Open Motionデータセットでは、SI1.94mのminADEとSI3.56mのminFDEが達成され、ミス率と強いリコールでキネマティックベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:00:07 GMT)
Importance-Weighted Non-IID Sampling for Flow Matching Models [6.0] 本研究では,フロー分布の多様で健全な領域をカバーするために,複数のサンプルを共同で描画する重要重み付き非IIDサンプリングフレームワークを提案する。
多様性と品質のバランスをとるために,多様性機構のためのスコアベースの正規化を導入する。
提案手法は,重要度と期待値の双方について,多種多様で高品質なサンプルと正確な推定値を生成する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 22:05:56 GMT)
The Potential and Limitations of Vision-Language Models for Human Motion Understanding: A Case Study in Data-Driven Stroke Rehabilitation [5.9] 視覚言語モデル(VLM)は、幅広いコンピュータビジョンタスクにおいて顕著な性能を示した。
データ駆動型脳卒中リハビリテーションの基本的な課題として,リハビリテーション用量の自動定量化とビデオからの障害の2つにVLMを適用した。
健常者29名,脳卒中51名を対象に,提案手法の評価を行った。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:25:50 GMT)
Don't Learn, Ground: A Case for Natural Language Inference with Visual Grounding [5.7] 本稿では,言語を視覚的文脈でグラウンド化することで,マルチモーダル表現を活用する自然言語推論(NLI)のゼロショット手法を提案する。
提案手法は,テキスト・ツー・イメージモデルを用いて前提の視覚的表現を生成し,これらの表現をテキスト仮説と比較することで推論を行う。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:23:17 GMT)
MUCH: A Multilingual Claim Hallucination Benchmark [5.6] その多くは、将来の手法の公平かつ再現可能な評価のために設計された最初のクレームレベルのUQベンチマークである。
4つのヨーロッパ言語(英語、フランス語、スペイン語、ドイツ語)にまたがる4,873のサンプルと、4つの命令で調整されたオープンウェイトLLMが含まれている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:37:16 GMT)
Enforcing governing equation constraints in neural PDE solvers via training-free projections [5.5] ヤコビアンベクトルとベクトルヤコビアン積を用いた近似解の2つの訓練不要なポストホック射影を評価する。
両プロジェクションは、物理インフォームドベースラインに対する違反を大幅に低減し、精度を向上させる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:03:28 GMT)
Improving Latent Reasoning in LLMs via Soft Concept Mixing [5.2] 大規模言語モデル(LLM)は通常、離散トークンを生成することによって推論される。
ソフトコンセプトを意識したトレーニングスキームであるソフトコンセプト混合(SCM)を提案する。
SCMはトレーニング中にモデルをソフト表現に公開する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 01:43:28 GMT)
DAPS++: Rethinking Diffusion Inverse Problems with Decoupled Posterior Annealing [5.2] textbfDAPS++を導入することで,数値安定性を維持しつつ,推論をより直接的にガイドすることができる。
textbfDAPS++は、様々な画像復元タスク間で高い計算効率と堅牢な再構成性能を実現する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:28:36 GMT)
Exploring Scientific Debt: Harnessing AI for SATD Identification in Scientific Software [5.1] 本研究では,Scientific Software(SSW)におけるSATD(Self-Admitted Technical Debt)について検討する。
SATDを複数のドメインや言語にまたがる27の科学的および汎用リポジトリで分析した。
SSWは9.25倍のScientific Debtと4.93倍のSATDを含んでいる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:34:18 GMT)
Layer-wise Weight Selection for Power-Efficient Neural Network Acceleration [5.1] シストリックアレイ加速器は、乗算累積(MAC)単位に支配されるエネルギーでCNNを実行する。
本稿では,MACと層レベルのエネルギー特性を明示的に活用する,エネルギーを意識した層間圧縮フレームワークを提案する。
異なるCNNモデルの実験では、58.6%のエネルギー削減と2-3%の精度低下を示し、最先端のパワーアウェアベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:37:07 GMT)
Patient-level Information Extraction by Consistent Integration of Textual and Tabular Evidence with Bayesian Networks [5.0] 本稿では,専門家インフォームドベイズネットワークを用いたマルチモーダル患者レベルの情報抽出手法を提案する。
本稿では,モデルの予測を解釈可能かつ確率的に融合させるために,一貫性ノードを付加した仮想エビデンスを提案する。
提案手法の有効性をSimSUMデータセットに示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:59:42 GMT)
Quantum Jump Approach for Photosynthetic Energy Transfer with Chemical Reaction and Fluorescence Loss [4.8] 我々は、光合成錯体の進化をシミュレートするために、レッドフィールド理論に基づく量子ジャンプアプローチ(QJA)を導入する。
QJAは、励起エネルギー移動(EET)プロセスのシミュレーションにおいて、より高い精度と効率を示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 06:35:58 GMT)
Bell state analysis using orbital angular momentum and path degrees of freedom [4.8] ベル状態解析(英: Bell state analysis、BSA)は、量子情報処理プロトコルにおけるベル状態の識別のための基礎的な操作である。
本稿では,軌道角運動量(OAM)と経路絡みの助けを借りて,偏極ベル状態に適した完全BSAを実現するための理論的スキームを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:28:56 GMT)
Harnessing Data from Clustered LQR Systems: Personalized and Collaborative Policy Optimization [4.8] 我々は、パーソナライズされたポリシーを学ぶために、クラスタリングがデータ駆動制御にどのように使われるかを示す。
私たちの仕事は、パーソナライズされたポリシーを学ぶために、データ駆動制御でクラスタリングをどのように使用できるかを明らかにする最初のものです。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:45:53 GMT)
Robust Detection of Retinal Neovascularization in Widefield Optical Coherence Tomography [4.7] 広視野OCT/OCTAにおけるRNV診断とステージングのための新しいアプローチを提案する。
多層網膜セグメンテーションに依存する従来の方法とは異なり、我々のモデルではRNVの同定を直接二分極局在化タスクとして再設定する。
以上の結果から,広視野OCTA画像の深層学習に基づく解析は,RNVのスクリーニングと管理を改善する貴重な手段となる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:51:25 GMT)
A Simple Yet Strong Baseline for Long-Term Conversational Memory of LLM Agents [4.7] LLMベースの会話エージェントは、多くのセッションにおいてコヒーレントでパーソナライズされたインタラクションを維持するのに依然として苦労している。
ニューダビッドソンのイベントセマンティクスに触発され、会話履歴を短く、イベントのような命題として表現するイベント中心の代替案を提案する。
我々の設計は、情報を非圧縮形式で保存し、より損失の多いものよりもアクセスしやすくすることを目的としています。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:41:17 GMT)
A Cloud-Based Cross-Modal Transformer for Emotion Recognition and Adaptive Human-Computer Interaction [4.7] マルチモーダル感情認識と適応型ヒューマンコンピュータインタラクションのためのクラウドベースのクロスモーダルトランスフォーマー(CMT)フレームワーク。
モデルは、事前訓練されたエンコーダを使用して、視覚信号、聴覚信号、テキスト信号を統合する。
システムは大規模ユーザインタラクションのためのスケーラブルで低レイテンシな感情認識を可能にする。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:29:16 GMT)
PrismSSL: One Interface, Many Modalities; A Single-Interface Library for Multimodal Self-Supervised Learning [4.6] PrismSSLは、最先端の自己教師付き学習(SSL)メソッドを単一のモジュール化されたフレームワークに統合するPythonライブラリである。
デモの目的は、 (i) 数行のコードでプレテキストトレーニングをインストール、設定、実行し、 (ii) コンパクトなベンチマークを再現し、 (iii) クリーンなトレーナーとデータセットの抽象化を通じて新しいモダリティやメソッドでフレームワークを拡張することである。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:47:50 GMT)
RTMol: Rethinking Molecule-text Alignment in a Round-trip View [4.6] 分子キャプションとテキストからSMILES生成を自己教師付きラウンドトリップ学習により統合する双方向アライメントフレームワークであるRTMolを提案する。
実験により、RTMolは様々なLLMに対して、双方向アライメント性能を最大47%向上させることが示された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:48:05 GMT)
Toward explainable AI approaches for breast imaging: adapting foundation models to diverse populations [4.5] 基礎モデルでは、乳房画像におけるその効果は未解明だが、専門的な医療画像のタスクを約束している。
本研究では,BiomedCLIPを基礎モデルとして活用し,モデル一般化の課題に対処する。
96,995枚の画像を用いて,一様性(s2Dのみ)と多様性トレーニングアプローチを比較し,重み付きコントラスト学習によるクラス不均衡に対処した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 22:45:50 GMT)
FLUID: Training-Free Face De-identification via Latent Identity Substitution [4.4] FLUIDは、事前訓練された拡散モデルの潜在空間におけるアイデンティティを置換する、トレーニング不要のフレームワークである。
FLUIDはアイデンティティ抑制と属性保存のトレードオフが優れていることを示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:18:37 GMT)
Agentifying Agentic AI [4.4] Agentic AIは、持続的な自律性、推論、相互作用能力を備えたシステムの実現を目指している。
このビジョンを実現するためには、エージェンシーに関する仮定は、認知、協力、ガバナンスの明確なモデルによって補完されなければならない。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:54:44 GMT)
Real-Time Cooked Food Image Synthesis and Visual Cooking Progress Monitoring on Edge Devices [4.4] オーブンをベースとした最初の調理プログレスデータセットを,シェフのドキュメンテーションレベルで紹介した。
生の食品画像に条件付けされたリアルな食品イメージを合成するエッジ効率のレシピと調理状態ガイドジェネレータを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 05:38:15 GMT)
Data-Driven Predictive Modeling of Microfluidic Cancer Cell Separation Using a Deterministic Lateral Displacement Device [4.3] 本研究は, 肺がん細胞の選択的分離を促進するために, 行シフト率, ポストサイズ, ギャップ距離などのDLD設計パラメータの最適化に焦点を当てた。
希少なCTC検出の課題を克服し、計算集約的なシミュレーションへの依存を減らすため、機械学習モデルを採用している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 21:08:34 GMT)
ThreadFuzzer: Fuzzing Framework for Thread Protocol [4.2] Threadはキープロトコルとして登場し、スマートホームや商用システムで広く利用されている。
本稿では,Threadプロトコルの実装を体系的にテストするためのファジングフレームワークであるThreadFuzzerについて述べる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:42:50 GMT)
The evolution of quantum battery capacity of GHZ-like states under Markovian channels [4.2] 我々はマルコフチャネル下でのGHZ状態とGHZ様状態の量子バッテリ容量の進化について検討した。
また、3つの独立した同一型マルコフチャネルの下でのキャパシティの進化についても検討する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:41:29 GMT)
Hash Collisions in Molecular Fingerprints: Effects on Property Prediction and Bayesian Optimization [4.2] 分子フィンガープリント法はハッシュ関数を用いて分子の固定長ベクトル表現を生成する。
ハッシュ衝突は、異なるサブ構造を同じ特徴で表す原因となり、分子類似性計算において過大評価される。
5つの分子特性予測ベンチマークにおいて, 正確な指紋を用いた場合, 精度は小さながら一貫した改善が得られた。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:31:42 GMT)
A ROS2 Interface for Universal Robots Collaborative Manipulators Based on ur_rtde [4.1] 提案されたドライバはフレキシブルなソリューションを目指しており、幅広いアプリケーションに適用できる。
ドライバはUniversal Robots URScriptsの高レベルコマンドを公開し、プラグインシステムを使用してカスタムコマンドを追加することができる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:29:23 GMT)
Affective Multimodal Agents with Proactive Knowledge Grounding for Emotionally Aligned Marketing Dialogue [3.8] AffectMindは、感情的アライメントと説得的相互作用を維持するために、積極的な推論と動的知識を基礎とする多モーダル感情対話エージェントである。
実験の結果,AffectMindは感情的一貫性,説得的成功率,長期ユーザエンゲージメントにおいて,強いLCMベースラインを上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 04:16:45 GMT)
A Longitudinal Study on the Attitudes of Gay Men in Beijing Towards Gay Social Media Platforms: Lonely Souls in the Digital Concrete Jungle [3.7] ソーシャルネットワーキングの応用は、中国の多くのゲイ男性にとって、生活の基盤となっている。
本稿では,男性と性交する中国人男性が,これらのプラットフォームに対してどのように態度を変えたかを検討するために,縦方向の混合法を用いる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 03:13:05 GMT)
Gradient-Driven Natural Selection for Compact 3D Gaussian Splatting [3.7] 3DGSはシーンに合うために多数のガウスプリミティブを使用し、かなりのストレージと計算オーバーヘッドをもたらす。
本研究では,不透明度に適応する正規化勾配場として生存圧力をモデル化した自然選択型プランニングフレームワークを提案する。
提案手法は, 15%の予算で0.6dB以上のPSNRゲインを達成し, 小型3DGSの最先端性能を確立した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 06:27:46 GMT)
ATAC: Augmentation-Based Test-Time Adversarial Correction for CLIP [3.7] ATACは一貫して非常に高い堅牢性を実現し、従来の最先端の手法を平均で50%近く上回っている。
ATACはCLIPの埋め込み空間におけるテスト時敵防御のための新しいパラダイムにおける効率的な手法である。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:30:06 GMT)
AngioDG: Interpretable Channel-informed Feature-modulated Single-source Domain Generalization for Coronary Vessel Segmentation in X-ray Angiography [3.5] 心臓血管疾患が世界的に死因となっている。
X線冠動脈造影(X-ray Coronary Angiography, XCA)は、リアルタイム心臓手術におけるゴールドスタンダードである。
XCAの一般的な血管分割モデルは、画像プロトコルや患者人口の変動により困難である。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:21:21 GMT)
WER is Unaware: Assessing How ASR Errors Distort Clinical Understanding in Patient Facing Dialogue [3.5] ASR(Automatic Speech Recognition)は、臨床対話においてますます普及している。
標準評価は依然としてエラーエラー率(WER)に大きく依存している。
本稿では、WERや他の一般的な指標が転写誤りの臨床的影響と相関するかどうかを基準として検討する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:29:43 GMT)
Beyond Code Similarity: Benchmarking the Plausibility, Efficiency, and Complexity of LLM-Generated Smart Contracts [3.4] LLMは実契約によく似た意味を持つコードを生成する。
ゼロショット世代のうち20%から26%のみが、テスト中のゼロショット実装と同じ振る舞いをする。
Retrieval-Augmented Generationはパフォーマンスを大幅に向上し、機能的正しさを最大45%向上させる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:40:38 GMT)
Probing Antiferromagnetic Hysteresis on Programmable Quantum Annealers [3.2] 反強磁性体の磁気メモリの反直観的概念を探索するために,サンプリングベース磁気プロトコルを実装した。
このプロトコルのキーコンポーネントは横方向のフィールドであり、これは状態遷移を可能にし、磁場スイープは縦方向の制御フィールドを介して行われる。
我々は、曲線の完全な飽和と逆転の証拠と、量子ゆらぎを介する創発的磁気領域を示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:50:43 GMT)
CLLMRec: LLM-powered Cognitive-Aware Concept Recommendation via Semantic Alignment and Prerequisite Knowledge Distillation [3.2] 大規模オープンオンラインコース(MOOC)の成長は、概念が不可欠であるパーソナライズされた学習に重大な課題をもたらす。
既存のアプローチは通常、概念的関係を捉えるために異種情報ネットワークや知識グラフに依存し、学習者の認知状態を評価するための知識追跡モデルと組み合わせている。
本稿では,CLLMRecを提案する。CLLMRecは,大規模言語モデルを利用してパーソナライズされた概念レコメンデーションを生成する新しいフレームワークである。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:37:39 GMT)
A Little More Like This: Text-to-Image Retrieval with Vision-Language Models Using Relevance Feedback [3.1] 大規模視覚言語モデル(VLM)は、自然言語クエリを用いた直感的な視覚検索を可能にする。
本稿では,従来のテキスト検索にインスパイアされたメカニズムを提案する。
VLMに基づく検索のための4つのフィードバック戦略を導入・評価する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:01:36 GMT)
Variational Estimators for Node Popularity Models [3.1] We developed a variational expectation-maximization framework for the Two-Way Node Popularity Model (TNPM)。
提案手法は,両部類および非指向性ネットワークにおける推定精度に優れることを示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 21:04:15 GMT)
Supervised Contrastive Learning for Few-Shot AI-Generated Image Detection and Attribution [3.1] 本研究では,合成画像検出に固有の一般化問題に対処する新しい2段階検出フレームワークを提案する。
提案手法は,既存手法よりも5.2ポイント向上した平均検出精度91.3%を実現する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:44:06 GMT)
MF-GCN: A Multi-Frequency Graph Convolutional Network for Tri-Modal Depression Detection Using Eye-Tracking, Facial, and Acoustic Features [3.0] うつ病 (depression) は、過度の低気分とアンヘドニアを特徴とする、世界的なメンタルヘルス障害である。
臨床評価対象103名のゴールド・スタンダード・データセットをトリパーティイト・データ・アプローチで収集した。
眼球追跡データは、うつ病群で頻繁に観察される負刺激に対する注意バイアスを定量化する。
音声およびビデオデータは、うつ病の特徴である感情的平坦化と精神運動的遅滞を捉えている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:28:30 GMT)
DepthFocus: Controllable Depth Estimation for See-Through Scenes [2.9] ステレオ深度推定をインテント駆動制御として再定義するステアブルビジョントランスであるDepthFocusを紹介する。
スカラー深度設定を条件に、モデルはその計算を動的に適応させ、複雑なシーン内で選択的な知覚を可能にする。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 06:59:54 GMT)
Illuminating the Black Box of Reservoir Computing [2.9] 本研究の目的は、異なるモデルタスクに必要な最小の計算要素を特定することである。
ニューロンの数、非線形性、結合構造の必要性について検討する。
驚いたことに、読み出し層が計算の大部分を実行する非自明なケースが見つかる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:13:26 GMT)
Self-supervised denoising of raw tomography detector data for improved image reconstruction [2.9] 超高速電子線X線CTは、短い測定時間によるノイズデータを生成する。
これらの問題に対処するため,2つの自己教師型深層学習法について検討した。
深層学習法の適用により,検出器データの信号対雑音比が向上し,再構成画像の一貫性が向上することを発見した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:30:44 GMT)
Diffusion-Inversion-Net (DIN): An End-to-End Direct Probabilistic Framework for Characterizing Hydraulic Conductivities and Quantifying Uncertainty [2.8] Diffusion-Inversion-Net (DIN) は地下水の流れと溶質輸送過程の逆モデリングのためのフレームワークである。
DINは、オフラインでトレーニングされたDenoising Diffusion Probabilistic Model (DDPM) を、強力な先行型ランダとして利用する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 03:38:26 GMT)
Chatbots to strengthen democracy: An interdisciplinary seminar to train identifying argumentation techniques of science denial [2.8] 近年、ソーシャルメディアプラットフォームに関する議論は、科学否定やフェイクニュースの拡散により、ますます精査されている。
本稿では,科学デニエのペルソナとして機能する大規模言語モデル(LLM)の適合性を検討するための学際セミナーを提案する。
学生は科学と否定の議論構造との現実的な相互作用を可能にするAIベースのロボットを開発する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:59:50 GMT)
VLM-Augmented Degradation Modeling for Image Restoration Under Adverse Weather Conditions [2.8] 各種気象条件下での劣化レベルから画像を復元するメモリ拡張型ビジュアル・ランゲージ・リカバリ・モデルを提案する。
実験により,MVLRは様々な屋外条件下でのリアルタイム展開において,モデルコンパクト性と表現性の間に実践的なバランスを与えることが示された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:06:48 GMT)
Unmasking Airborne Threats: Guided-Transformers for Portable Aerosol Mass Spectrometry [2.7] MALDI-MS (Matrix Assisted Laser Desorption/Ionization Mass Spectrometry) は生体分子分析の基盤であり、独自の質量スペクトルによる病原体の正確な同定を提供する。
しかし、労働集約型試料調製とマルチショットスペクトル平均化に依存しているため、実験室の環境設定に制限されるため、リアルタイムの環境モニタリングには実用的ではない。
これらの制限は、新しいエアロゾルMALDI-MSシステムにおいて特に顕著であり、自律的なサンプリングは未知のエアロゾル分析のためにノイズスペクトルを生成する。
スペクトルを再定義するデータ駆動型フレームワークであるMass Spectral Dictionary-Guided Transformer(MS-DGFormer)を提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:45:00 GMT)
Estonian WinoGrande Dataset: Comparative Analysis of LLM Performance on Human and Machine Translation [2.7] 我々は、ウィノグランデテストセットのローカライズされ、文化的に適応したエストニア語翻訳を提示する。
我々は,人間翻訳ベンチマークを用いて,プロプライエタリモデルとオープンソースモデルの両方のパフォーマンスを評価する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:01:57 GMT)
Quantum Masked Autoencoders for Vision Learning [2.7] 量子状態におけるデータサンプルの欠落した特徴を学習できる量子マスク型オートエンコーダを提案する。
我々のアーキテクチャは、マスクされた画像の特徴を学習し、MNIST画像の視覚的忠実度を改善して、マスクされた入力画像を再構成することができる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:37:18 GMT)
An Artificial Intelligence Framework for Measuring Human Spine Aging Using MRI [2.6] 18,000以上のMRI画像から脊椎年齢を推定するコンピュータビジョンに基づくディープラーニング手法を提案する。
データは加齢に伴う脊椎変性のみの被験者に限られる。
実際の脊椎年齢とモデル予測年齢, 脊椎年齢差 (SAG) の差を算出し, これらの差と脊椎変性条件と生活習慣因子との関連性を検討した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:40:21 GMT)
Hidden markov model to predict tourists visited place [2.6] 本研究では,ソーシャルネットワークデータ分析に基づいて,観光客の行動を理解し,学習する手法を提案する。
この方法は、機械学習の文法推論アルゴリズムに依存している。
この論文の主な貢献は、文法推論アルゴリズムをビッグデータの文脈に適応させることである。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:58:17 GMT)
AutoGraphAD: A novel approach using Variational Graph Autoencoders for anomalous network flow detection [2.4] AutoGraphADは異種変分グラフオートエンコーダに基づく教師なし異常検出手法である。
タイムウィンドウ内でネットワークアクティビティをキャプチャする接続ノードとIPノードで構成された異種グラフで動作する。
約1.18桁の高速トレーニングと1.03桁の高速推論を実現している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:22:00 GMT)
Unified Class and Domain Incremental Learning with Mixture of Experts for Indoor Localization [2.4] そこで本研究では,MOELOと呼ばれる屋内局所化のための統合型連続学習フレームワークを提案する。
MOELOは、リソース制限されたモバイルデバイスにデプロイ可能な、軽量で堅牢で適応的なローカライゼーションソリューションを提供する。
その結果,MOELOは平均ローカライゼーション誤差が25.6倍,最悪のローカライゼーション誤差が44.5倍,最先端フレームワークよりも21.5倍少ないことが判明した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 22:47:50 GMT)
When Active Learning Fails, Uncalibrated Out of Distribution Uncertainty Quantification Might Be the Problem [2.3] 材料発見におけるアクティブラーニングキャンペーンにおいて,不確かさ推定と校正手法の評価を行った。
不確かさキャリブレーション法は、ドメイン内データからドメイン外データへ可変的に一般化することを発見した。
質の悪い不確実性の影響は、ランダムな森林と、同じタスクのために同じデータでトレーニングされたeXtreme Gradient Boostingモデルに対して持続する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:17:46 GMT)
Toward Sustainable Generative AI: A Scoping Review of Carbon Footprint and Environmental Impacts Across Training and Inference Stages [2.3] 生成AIは急速に普及し、社会的、経済的に重要な価値を生み出している。
大規模サービス運用において発生した累積的環境フットプリントは,比較的少なくなった。
本研究は,AIカーボンフットプリント評価における方法論と研究動向のスコーピングレビューを行う。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:59:34 GMT)
Principled Design of Interpretable Automated Scoring for Large-Scale Educational Assessments [2.2] AnalyticScoreは、応答の明確な識別可能な要素を抽出し、各応答を人間の解釈可能な値に分解する。
AnalyticScoreは、ASAP-SASデータセットから平均10項目にわたって、解釈不能なSOTAの0.06 QWK以内である。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:19:05 GMT)
$Δ$-ML Ensembles for Selecting Quantum Chemistry Methods to Compute Intermolecular Interactions [2.1] 本稿では,事前学習した原子ペアワイドニューラルネットワークから抽出した特徴に基づいて学習した,$$-MLモデルのアンサンブルに基づくフレームワークを提案する。
提案手法は, 提案手法によらず, 0.1kcal/mol未満の平均絶対誤差を極小に達成できることを示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:10:29 GMT)
StealthCup: Realistic, Multi-Stage, Evasion-Focused CTF for Benchmarking IDS [2.0] 侵入検知システム(IDS)は、企業や産業の制御環境を守るために重要である。
既存のベンチマークは、適応的な敵の振る舞いを捉えるのに失敗した合成データセットに依存している。
本稿では,IDSベンチマークを回避中心のCapture-the-Flagコンペティションとして運用する新たな評価手法であるStealthCupを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:17:59 GMT)
A Counterfactual LLM Framework for Detecting Human Biases: A Case Study of Sex/Gender in Emergency Triage [1.9] 本稿では,Large Language Models (LLMs) を用いて,ヒトの臨床的意思決定における性差を定量化するための,ドメインに依存しない新しい手法を提案する。
緊急トリアージについて検討し,ボルドー大学病院(フランス)への15万人以上の入院に対するアプローチを検証し,異なる言語,人口,医療システムでMIMIC-IVのサブセットを複製した。
ボルドーのコホートでは、同じプレゼンテーションが男性ではなく女性として提示された場合、平均で約2.1%、フランスでは国家非常用紙に拡大され、20,000人以上の低水準のプレゼンテーションに該当する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:37:52 GMT)
Latent Dirichlet Transformer VAE for Hyperspectral Unmixing with Bundled Endmembers [1.9] ハイパースペクトルアンミックスのための潜在ディリクレ変換器変分オートエンコーダ(LDVAE-T)を提案する。
我々のモデルは、トランスフォーマーアーキテクチャのグローバルコンテキストモデリング機能と、潜在空間に先立ってディリクレによって課される物理的に意味のある制約を組み合わせる。
我々は、Samson、Jasper Ridge、HYDICE Urbanの3つのベンチマークデータセットに対するアプローチを評価した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:15:37 GMT)
CascadedViT: Cascaded Chunk-FeedForward and Cascaded Group Attention Vision Transformer [1.9] 視覚変換器(ViT)は様々なコンピュータビジョンタスクにおいて顕著な性能を示した。
本稿では,軽量かつ計算効率の良い視覚変換器アーキテクチャであるemph Cascaded-ViT(CViT)を提案する。
CCFFNは精度を犠牲にすることなくパラメータとFLOP効率を改善する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:51:20 GMT)
Canonical Quantum Mpemba Effect in a Dissipative Qubit [1.9] ムペンバ効果(Mpemba effect)とは、他の条件下ではより低温のシステムよりも速く冷却される現象である。
本稿では, 散逸量子ビットを用いたMpemba効果の量子アナログについて述べる。
この効果を実現するために,古典的量子ハイブリッド型量子回路を提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:04:59 GMT)
Differentially private testing for relevant dependencies in high dimensions [1.8] 本研究では,高次元ベクトルの成分間の依存関係を検出する問題について検討する。
座標が対独立であるかどうかをテストする代わりに、ある対関係が絶対値の与えられたしきい値を超えていないかどうかを判断することに興味がある。
スパース設定において特に強力であるブートストラップに基づく新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:38:40 GMT)
AEGIS: Preserving privacy of 3D Facial Avatars with Adversarial Perturbations [1.8] AEGISは3Dガウスアバターのためのプライバシー保護IDマスキングフレームワークである。
完全な非識別を実現し、顔検索と検証精度を0%に下げる。
また、年齢、人種、性別、感情などの重要な顔の特徴を保存し、視覚的歪みを最小限に抑え、強力なプライバシー保護を示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:57:28 GMT)
DReX: Pure Vision Fusion of Self-Supervised and Convolutional Representations for Image Complexity Prediction [1.8] 画像の複雑さを予測するために,自己監督的・畳み込み的表現を融合した視覚のみのモデルを提案する。
DReXはIC9600ベンチマークで最先端のパフォーマンスを達成する。
以上の結果から,視覚的特徴だけでは,人手による複雑度予測に十分である可能性が示唆された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 06:57:33 GMT)
A Hybrid Classical-Quantum Fine Tuned BERT for Text Classification [1.7] テキスト分類のための古典的なBERTモデルとn量子ビット量子回路を統合するハイブリッド手法を提案する。
実験の結果,提案したハイブリッドは,古典的ベースラインと競合するモデル性能を達成し,場合によっては性能が向上することが示された。
全体として、ハイブリッドモデルは、テキスト分類タスクのパフォーマンス向上を実現する上で、量子コンピューティングの約束を強調している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:17:49 GMT)
FORWARD: Dataset of a forwarder operating in rough terrain [1.7] 本研究では,スウェーデン中部の2つの収穫地において,荒地で活動するフォワーダーの高解像度マルチモーダルデータセットを提案する。
データには、5Hzで記録されたイベントタイムログ、例えば、運転速度、燃料消費、センチメートル精度の車の位置、クレーンの使用などが含まれる。
このデータセットは、森林機械のトラヒックビリティ、知覚、自律制御のためのモデルとアルゴリズムを開発することを意図している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:36:41 GMT)
Semi-Supervised Federated Multi-Label Feature Selection with Fuzzy Information Measures [1.6] マルチラベル特徴選択(FS)は、無関係、ノイズ、冗長な特徴を取り除き、マルチラベルデータの次元性を減少させる。
既存の方法は一般的に集中的なデータを必要とするため、分散およびフェデレーションされた環境には適さない。
本研究では、クライアントがラベル付きデータのみを保持するSSFMLFSと呼ばれるセミスーパービジョンのフェデレーション付きマルチラベル特徴選択手法を提案し、サーバにはラベル付きデータしか持たない。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 21:41:15 GMT)
Enriching Taxonomies Using Large Language Models [1.5] 本稿では,Large Language Models(LLMs)を活用して与えられた分類を強化する新しい分類体系であるTaxoriaを紹介する。
内部LLMを抽出するアプローチとは異なり、Taxoriaは既存の分類学をシードとして使用し、LLMに富化のための候補ノードを提案するよう促す。
最終的なアウトプットには、分析のための最終統合分類の追跡と視覚化を含む、豊富な分類が含まれます。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:25:59 GMT)
The Rapid Growth of AI Foundation Model Usage in Science [1.5] ビジョンモデルは科学において最も使われている基礎モデルであるが、言語モデルのシェアは増加している。
2013年に建設された基礎モデルの中央値は科学で採用されている中央値の7.7倍であり、2024年までに26倍に増加した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:00:15 GMT)
UAM: A Unified Attention-Mamba Backbone of Multimodal Framework for Tumor Cell Classification [1.5] 放射線学的特徴を用いた細胞レベル分類のためのUnified Attention-Mambaバックボーンを提案する。
細胞レベルでの分類と画像分割を共同で行うマルチモーダルなUAMフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:18:55 GMT)
Computational frame analysis revisited: On LLMs for studying news coverage [1.5] GPTやClaudeといったジェネレーティブなLLMは、コンテンツ分析ツールとしてますます使われています。
我々はそれらを計算前のものと体系的に評価した。
我々は,方法論的多元的アプローチを支持し,今後の研究者のための計算フレーム分析のロードマップを作成した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:52:46 GMT)
A Diversity-optimized Deep Ensemble Approach for Accurate Plant Leaf Disease Detection [1.4] 植物病は世界の農業にとって重大な脅威となり、年間2200億ドル以上の経済損失と食料安全保障の危機を引き起こしている。
Deep Ensemblesは、多様なDeep Neural Networks(DNN)の強みを活用して予測精度を高める強力なアプローチとして登場した。
植物病の検出精度を高めるためにSQ(Synergistic Diversity)フレームワークを導入する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 06:29:52 GMT)
APRIL: Annotations for Policy evaluation with Reliable Inference from LLMs [1.4] オフ・ポリティ・アセスメント(OPE)は、デプロイ前にコンテキスト的バンディットポリシーの価値を見積もる。
従来の研究では、データセットのカバレッジを高めるために専門家ラベルの反ファクトアノテーションを使用して検討されてきた。
我々は,医療領域におけるOPEの偽造アノテーションを生成するために,大規模言語モデル(LLM)を活用することを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 22:18:15 GMT)
A Hybrid Computational Intelligence Framework for scRNA-seq Imputation: Integrating scRecover and Random Forests [1.3] 単細胞RNAシークエンシング(scRNA-seq)は、細胞分解における転写プロファイリングを可能にする。
SCR-MFは, scRecover を用いた原理的なドロップアウト検出と MissForest による堅牢な非パラメトリック計算を組み合わせた,モジュール型2段階のワークフローである。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 03:23:47 GMT)
Leveraging CVAE for Joint Configuration Estimation of Multifingered Grippers from Point Cloud Data [1.3] 本稿では,多関節鎖の点雲データのみから多指グリップの関節構成を決定するための効率的な手法を提案する。
本研究では,重要な構造要素の点クラウドデータを入力として取り込んだ条件変分自動エンコーダ(CVAE)を用いて,対応する関節構成を再構築する。
我々は、Allegro Handを用いたマルチデックス把握データセットに対するアプローチを検証し、0.05ミリ秒以内で動作し、最先端の手法に匹敵する精度を実現する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:31:39 GMT)
Optimal Thermalization under Indefinite Causal Order with Identical and Asymmetric Baths [1.3] 量子演算の順序がコヒーレントな重ね合わせに置かれる不確定因果順序(ICO)は、情報処理タスクを強化するために実証されている。
量子SWITCHの下の2つの熱浴と相互作用する2段階のシステムについて検討し、チャネルの順序をアシラリー量子ビットでコヒーレントに制御する。
解析の結果,制御量子状態の対角成分とコヒーレント成分が温度変化にどう寄与するか,また,その相互作用によって,任意の因果順序で熱応答から逸脱することができるかが明らかとなった。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:23:17 GMT)
Datacenters in the Desert: Feasibility and Sustainability of LLM Inference in the Middle East [1.2] 本稿では,4カ国にわたる大規模言語モデル(LLM)のエネルギー消費と炭素フットプリントの分析を行った。
CodeCarbonライブラリを使用して、エネルギーと二酸化炭素の排出量を追跡し、気候を意識したAIデプロイメントのための地理的トレードオフを比較する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:48:44 GMT)
Optimizing PyTorch Inference with LLM-Based Multi-Agent Systems [1.2] マルチエージェントPyTorch最適化システムを比較するためのフレームワークを提案する。
エラー修正エージェントと組み合わせた場合,エクスプロイトヘビー戦略が最善であることを示す。
最も優れた実装は、H100 GPU上で平均2.88倍のスピードアップを達成する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 05:37:38 GMT)
AI- and Ontology-Based Enhancements to FMEA for Advanced Systems Engineering: Current Developments and Future Directions [1.1] 我々は、従来のモード・アンド・エフェクト・アナリティクス(FMEA)を、よりインテリジェントで、データ駆動で、セマンティックに強化されたプロセスに変換することを目的とした最近の進歩についてレビューする。
機械学習や自然言語処理など、人工知能(AI)のテクニックが、FMEAをよりダイナミックでデータ駆動のプロセスに変換する方法について検討する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:51:06 GMT)
QoS-Aware Dynamic CU Selection in O-RAN with Graph-Based Reinforcement Learning [1.1] Open Radio Access Network (O RAN)は、従来のRANを相互運用可能なコンポーネントに分解し、柔軟なリソース割り当て、省エネ、アジャイルアーキテクチャ設計を可能にする。
固定写像を緩和し, 動的サービス機能チェーン (SFC) をオンザフライOCU選択で提供することにより, 制限に対処する。
我々はこの問題をマルコフ決定プロセスとして定式化し、GRLDyP、すなわちグラフニューラルネットワーク(GNN)による深部強化学習(DRL)を用いて解決する。
提案エージェントは,入ってくる各サービスフローの経路とO-CU位置を共同で選択し,ネットワークエネルギーを最小化する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:10:28 GMT)
Krylov Complexity in Canonical Quantum Cosmology [1.0] 我々は、ホイーラー・デウィット(WDW)量子宇宙論とループ量子宇宙論(LQC)における2つの完全に解決可能なモデルのクリロフ複雑性を探求する。
我々は、Lanczosアルゴリズムを適用して、Krylov基底を解析的に構築し、Krylov状態と演算子の複雑さの両方を評価する。
我々の研究は、量子カオスのような現象を示すものを含む、より複雑な量子宇宙論モデルにおけるクリロフ複雑性の計算方法の舗装である。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:02:44 GMT)
Reversing the Lens: Using Explainable AI to Understand Human Expertise [1.0] 人間と機械学習モデルの両方は、特に安全性と信頼性に重要な領域において、経験から学習する。
この研究は、人間の学習を分析するためにExplainable AIの計算ツールを適用することで、これらの領域を橋渡しする。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:38:51 GMT)
Framework Matters: Energy Efficiency of UI Automation Testing Frameworks [1.0] 4つのWebユーザインターフェース(UI)自動化テストフレームワークの動作エネルギー消費量について検討する。
同じ動作を行うためのエネルギーコストは、フレームワークによって最大6倍まで変化した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:18:01 GMT)
Topologic Attention Networks: Attending to Direct and Indirect Neighbors through Gaussian Belief Propagation [1.0] グラフニューラルネットワークは、グラフ内の長距離依存関係をモデル化する能力を制限する、ローカルメッセージパッシングに依存している。
グラフ内の直接接続と間接接続の両方を通して情報がどのように流れるかを学ぶ確率的メカニズムであるトポロジカルアテンションネットワークを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 00:43:14 GMT)
Automated Interpretable 2D Video Extraction from 3D Echocardiography [0.9] 心臓超音波による従来の医療画像は、個々の心臓構造を示す一連の2Dビデオに依存している。
心臓超音波の3次元容積から標準2次元ビューを自動選択する手法を提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:09:32 GMT)
Large Language Models for Sentiment Analysis to Detect Social Challenges: A Use Case with South African Languages [0.9] 多言語コミュニティにおける感情分析システムは、ソーシャルメディア投稿における社会的課題を素早く特定するために利用することができる。
本研究は、南アフリカの10の政府機関の管轄区域に置かれる、英語、セペディ、セツワナのソーシャルメディア投稿における、最も新興のトピック10の感情の極性について調査する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:14:32 GMT)
A Cross-Cultural Assessment of Human Ability to Detect LLM-Generated Fake News about South Africa [0.9] 本研究では,文化的な近さが,AIが生成した偽ニュースを検出する能力に与える影響について検討する。
調査では、89人の参加者が真の南アフリカのニュース記事10件とAI生成の偽版10件を評価した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:33:49 GMT)
Model Inversion Attack Against Deep Hashing [0.9] DHMIは、ディープハッシュ用に設計された最初の拡散ベースのモデル反転フレームワークである。
最も難しいブラックボックス設定下でさえ、高解像度で高品質な画像を再構成する。
提案手法は,ブラックボックスシナリオにおける既存の最先端モデル逆転攻撃よりも優れる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:52:36 GMT)
How Feasible are Passive Network Attacks on 5G Networks and Beyond? A Survey [0.9] 本調査は,5GおよびB5G/6Gネットワークにおける受動的ネットワーク攻撃の可能性を検討する。
情報抽出(システム識別、Webサイトおよびアプリケーション指紋)と位置情報の2つの主要なカテゴリに焦点を当てている。
現在の証拠は、これらの攻撃は理論上は5Gで可能であるが、その実行は指向性ビームフォーミング、高周波伝搬特性、暗号化機構によって著しく制限されていることを示唆している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:17:54 GMT)
FisheyeGaussianLift: BEV Feature Lifting for Surround-View Fisheye Camera Perception [0.8] マルチカメラの高解像度魚眼画像を処理する歪み認識型BEVセグメンテーションフレームワークを提案する。
各画像画素はガウスパラメータ化により3次元空間に持ち上げられ、空間的手段と異方性共分散を予測し、幾何的不確かさを明示的にモデル化する。
実験では、複雑な駐車や都市部での運転のシナリオにおいて強いセグメンテーション性能を示し、乾燥可能な地域では87.75%、厳しい魚眼の歪み下では57.26%のIoUスコアを達成している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:42:07 GMT)
Intrinsic preservation of plasticity in continual quantum learning [0.8] 量子学習モデルは、長期にわたって可塑性を保ちながら、自然に可塑性の喪失を克服していることを示す。
我々は、この利点を複数の学習パラダイムから幅広いタスクに体系的に示す。
我々の結果は、機械学習における量子コンピューティングの有用性が、潜在的なスピードアップを超えて拡張されていることを示唆している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:14:40 GMT)
Why Do Language Model Agents Whistleblow? [0.8] 最近の研究は、言語モデルがユーザの興味や明示的な指示に矛盾する方法でツールを使用することができることを発見した。
この行動のサブセットとして、モデルがユーザの指導や知識を使わずに、疑わしい行為を関係者に開示する。
本稿では,この行動のエージェントを評価するために,多種多様で現実的な演出ミス行為シナリオの評価スイートを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:40:52 GMT)
Liberating Logic in the Age of AI: Going Beyond Programming with Computational Thinking [0.8] 大規模言語モデル(LLM)と人工知能(AI)を利用したコーディングアシスタントの進歩は、計算思考のコモディティ化につながっている。
本稿では,自然言語プログラミングがソフトウェア開発に与える影響,プログラマと即興問題解決者との違いの出現,コンピュータ科学とデータサイエンスのカリキュラムに必要とされる改革について考察する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:28:52 GMT)
Chiral cavity-magnonic system for the unidirectional photon blockade [0.8] キラルキャビティ-マグノン系に基づく指向性単一光子源の手法を提案する。
本研究では,不完全なキラルキャビティ-マグノン結合と2つのキャビティモードのカップリングが光子遮断挙動に及ぼす影響について検討した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:46:40 GMT)
Reconstruction of Surface EMG Signal using IMU data for Upper Limb Actions [0.7] 深層学習を用いた6軸IMUデータからの正規化sEMG信号の合成について検討する。
拡張因果畳み込みに基づくスライディング・ウィンドウ・ウェーブ・ネットモデルを用いて,IMUデータをsEMG信号にマッピングする訓練を行った。
以上の結果から,筋活動のタイミングと全般的な形状をモデルが予測できることが示唆された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:26:33 GMT)
Modular AI-Powered Interviewer with Dynamic Question Generation and Expertise Profiling [0.7] 本研究では、文脈的に適切で専門性に整合した質問を動的に生成するAIを利用したインタビュアーを提案する。
インタビュアーは、データプライバシを保持しながらコヒーレントな対話を生成する、ローカルにホストされた大規模言語モデル(LLM)上に構築されている。
提案されたインタビュアーは、スケーラブルでプライバシを重視したソリューションで、AIによる定性的データ収集を前進させる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:25:26 GMT)
DS-Span: Single-Phase Discriminative Subgraph Mining for Efficient Graph Embeddings [0.7] DS-Spanは単相識別サブグラフマイニングフレームワークである。
これは、パターン成長、プルーニング、および監視駆動のスコアを検索空間の1つに統合する。
従来の多段法よりもコンパクトで差別的な部分グラフ特徴を生成する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:17:51 GMT)
PUCP-Metrix: A Comprehensive Open-Source Repository of Linguistic Metrics for Spanish [0.7] PUCP-Metrixは、語彙の多様性、構文と意味の複雑さ、凝集、精神言語学、可読性にまたがる182の言語メトリクスのオープンソースリポジトリである。
自動可読性評価と機械生成テキスト検出におけるその有用性を評価し,既存のリポジトリと強力なニューラルベースラインとの競合性能を示した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:03:00 GMT)
Social-Media Based Personas Challenge: Hybrid Prediction of Common and Rare User Actions on Bluesky [0.7] 本稿では,ソーシャルメディア利用者の行動予測のためのハイブリッド手法を提案する。
多様な行動語彙にまたがる頻繁な行動と頻繁な行動の両方に対処する。
われわれのアプローチは、SocialSim: Social-Media Based Personas Challengeで第一位となった。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:40:14 GMT)
Empa: An AI-Powered Virtual Mentor for Developing Global Collaboration Skills in HPC Education [0.7] EmpaはAIを利用した仮想メンターで、異文化間コラボレーショントレーニングを学部のコンピューティング教育に統合する。
Empaは、文化的次元、コミュニケーションスタイル、紛争解決に関する構造化活動を通じて学生をガイドする。
コンピューティングコースへの展開のためのパイロット準備は、AIによる文化間トレーニングの可能性を示している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 03:52:22 GMT)
The Joint Gromov Wasserstein Objective for Multiple Object Matching [0.7] 本稿では、JGW(Joint Gromov-Wasserstein)の目的を紹介し、GWのオリジナルのフレームワークを拡張して、オブジェクトのコレクション間の同時マッチングを可能にする。
我々の定式化は、点サンプリング収束を伴うmm-空間の部分同型を識別する非負の相似性測度を提供する。
部分マッチングのためのGWの他の変種とのベンチマークは,提案手法の精度と計算効率において優れた性能を示す一方,合成と実世界の両方のデータセットを用いた実験では,複数形状マッチングの有効性が示されている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 00:31:21 GMT)
Physical Reinforcement Learning [0.7] 対照的に、CLLN(Contrastive Local Learning Networks)は低消費電力で、物理的ダメージに対して堅牢である。
本研究は,シミュレーションCLLNに適応したQ-ラーニングを用いた2つの簡単なRL問題に対する成功例を示す。
我々は,デジタルハードウェアが要求する物理的安全性,CLLNが強制できない,生物学的システムが依存できないといった仮定について議論し,生物学において重要であり,CLLNでは訓練可能であるが,デジタルコンピュータでは意味をなさない二次目標を強調する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 21:26:24 GMT)
DelTriC: A Novel Clustering Method with Accurate Outlier [0.6] 本稿では,PCA/UMAPベースの投影とデラウネー三角測量を統合したクラスタリングアルゴリズムであるDelTriCと,元の高次元空間においてクラスタを形成する新しいバックプロジェクション機構を紹介する。
DelTriCはk-means、DBSCAN、HDBSCANといった従来の手法よりも多くのシナリオで優れている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:01:23 GMT)
GANGR: GAN-Assisted Scalable and Efficient Global Routing Parallelization [0.6] グローバルルーティングは電子設計自動化(EDA)における重要な段階である
本稿では,より効率的な並列化を実現するために,WGAN(Wasserstein Generative Network)を提案する。
提案アルゴリズムは最新のISPD'24コンテストのベンチマークでテストされ、最先端ルータと比較して、ルーティング品質は0.002%しか低下せず、40%の低下を示した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 00:32:33 GMT)
Attention Via Convolutional Nearest Neighbors [0.6] 我々は、畳み込みと自己注意は、単一のk-ネアレスト近傍アグリゲーションフレームワークで統一できると主張している。
このコネクションを形式化する統一フレームワークであるConvNN(Convolutional Nearest Neighbors)を紹介します。
CIFAR-10とCIFAR-100の分類タスクにおけるフレームワークの一貫性を検証する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:17:52 GMT)
Smart Metadata in Action: The Social Impact Data Commons [0.6] この記事では、ソーシャル・インパクト・データ・コモンズ(Social Impact Data Commons)におけるメタデータと標準の使用について説明する。
私たちはまず、Data Commonsの概念を導入し、その機能に注目し、Data Commonsの現在の実装の概要を示します。
次に、コアメタデータケーススタディを示し、スマートメタデータがData Commonsをどのようにサポートするかを示します。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:18:47 GMT)
CREST: Improving Interpretability and Effectiveness of Troubleshooting at Ericsson through Criterion-Specific Trouble Report Retrieval [0.5] 本研究では,異なるTR観測基準と検索モデルの性能への影響について検討した。
textbfCREST (textbfCriteria-specific textbfRetrieval via textbfEnsemble of textbf Specialized textbfTR model)を提案する。
CRESTでは、特定のTR基準に基づいてトレーニングされた特殊なモデルを使用して、出力を集約して、多種多様な補完的な信号をキャプチャする。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:16:24 GMT)
Can Vision-Language Models Count? A Synthetic Benchmark and Analysis of Attention-Based Interventions [0.5] 視覚言語モデル(VLM)は、画像の視覚特性に関するクエリに応答する際に、トレーニング中に学んだ固有のバイアスに依存することが多い。
本研究は,画像としての性能がどう変化するかを判断し,特性変化を促すための,総合的なベンチマークデータセットと評価フレームワークを構築した。
我々は,異なるレイヤにおける視覚的トークンに注目する,注意に基づく介入を実施し,その効果を視覚的条件によって評価する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:18:41 GMT)
SoK: Security Evaluation of Wi-Fi CSI Biometrics: Attacks, Metrics, and Open Challenges [0.5] Wi-Fi Channel State Information (CSI) はバイオメトリック・モダリティとして繰り返し提案されている。
このSoKは、セキュリティレンズを介してCSIベースの生体認証を検査する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:34:04 GMT)
Quantum Algorithm for Estimating Gibbs Free Energy and Entropy via Energy Derivatives [0.5] 振動エントロピーの推定は熱力学や統計力学において重要な課題である。
本稿では,エネルギー微分による振動エントロピーの推定を目的とした量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 22:27:21 GMT)
A new kid on the block: Distributional semantics predicts the word-specific tone signatures of monosyllabic words in conversational Taiwan Mandarin [0.4] 単音節単語のピッチの輪郭が自然会話型マンダリンでどのように実現されるかを検討する。
単語の効果は音素認識の強い予測因子であることがわかった。
音声学では、分布意味論はブロック上の新しい子供である。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:56:58 GMT)
On the Predictive Skill of Artificial Intelligence-based Weather Models for Extreme Events using Uncertainty Quantification [0.3] 本研究は,芸術決定論的人工知能モデルが初期条件摂動にどう反応するかを考察する。
2022年8月、パキスタンの洪水と中国の熱波の2つの主要なイベントのために50の会員アンサンブルを生成します。
その結果,流れ依存摂動は最も現実的なアンサンブルの広がりと高い確率的スキルを生み出すが,数値的な天気予報アンサンブルで性能ギャップを埋めることはできないことがわかった。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:54:22 GMT)
A Detailed Comparative Analysis of Blockchain Consensus Mechanisms [0.3] この研究は、PoWが堅牢でタイムテストされたセキュリティを提供するが、高エネルギー消費、スループットの遅さ、採掘プールによる集中化に悩まされていることを強調している。
PoSはスケーラビリティと効率性を向上し、環境への影響を大幅に低減し、トランザクション料金をより安定させる。
この結果は、それぞれのメカニズムに固有のトレードオフを明らかにし、ハイブリッド設計がPoWのセキュリティとPoSの効率性と持続可能性を組み合わせることを示唆している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 05:33:10 GMT)
Evaluating Large Language Models for Diacritic Restoration in Romanian Texts: A Comparative Study [0.3] 本研究は,ルーマニア語テキストにおけるダイアクリティカルティクスの復元におけるいくつかの大規模言語モデル (LLM) の性能を評価する。
その結果、GPT-4oのようなモデルでは、中性エコーベースラインを一貫して超える高いダイアクリティカルな復元精度が得られた。
これらの知見は, モデルアーキテクチャ, トレーニングデータ, 即時設計が診断的復元性能に与える影響を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:13:16 GMT)
Analog Physical Systems Can Exhibit Double Descent [0.3] 二重降下は、ネットワークがトレーニングデータの量に対して成長するにつれて過度な適合を避けることであり、代わりに目に見えないデータのパフォーマンスを改善する。
標準的なトレーニングでは二重降下は得られないが、この固有の欠陥に対応する修正されたプロトコルが成功する。
我々の研究結果は、アナログ物理系が適切に訓練されていれば、デジタルAIの成功の根底にある行動を示すことができることを示している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 22:38:33 GMT)
GRAPHIC--Guidelines for Reviewing Algorithmic Practices in Human-centred Design and Interaction for Creativity [0.3] GraphIC (Guidelines for Reviewing Algorithmic Practices in Human-centred Design and Interaction for Creativity) は、グラフィックデザインに適用されたAIベースのシステムを分析するためのフレームワークである。
その目標は、グラフィックデザインの分野において、現在のシステムが人間とAIのコラボレーションをどのようにサポートするかを理解することである。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:42:09 GMT)
Fundamental Limitations of QAOA on Constrained Problems and a Route to Exponential Enhancement [0.3] 本稿では,制約問題に対する一般量子近似最適化アルゴリズム(QAOA)の基本的限界について検討する。
本稿では,制約埋め込みによる指数的改善の道筋を示す。
カーネル構築における問題アルゴリズムの共設計のおかげで、技術と保証は置換を超えて幅広いNP-Hard制約最適化問題にまで拡張される。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:04:01 GMT)
TICAL: Trusted and Integrity-protected Compilation of AppLications [0.2] Ticalは信頼できるコンパイルのためのフレームワークで、ソースコードから最終実行ファイルまでのビルドパイプラインの完全性と機密性を提供する。
当社のアプローチでは,TEEをランタイム保護として活用するが,ファイルシステムの保護とバージョン履歴による不変監査ログにより,TEEを充実させ,説明責任を提供します。
評価の結果,TicalはCI/CDパイプライン全体の機密性と整合性を,許容可能なパフォーマンスオーバーヘッドで保護できることがわかった。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:19:41 GMT)
Anyon Quasilocalization in a Quasicrystalline Toric Code [0.2] 準結晶上の量子スピン液体の正確に解けるモデルがKim textitet alで紹介された。
モデルの強い結合-異方性限界を解析し、非周期格子幾何学が指数関数的に分離された結合定数の階層を自然に生成することを示す。
数値解析により,この非従来的局所化行動の原因となる重要なメカニズムを明らかにする。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:07:02 GMT)
Lost in Translation and Noise: A Deep Dive into the Failure Modes of VLMs on Real-World Tables [0.2] WikiTableQuestionsやFinQAといった既存のQA用データセットは、圧倒的にモノリンガル(英語)である。
MirageTVQAは、テーブル推論のためのより堅牢なVLMモデルに向けた進捗の測定と推進のためのベンチマークを提供する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:32:56 GMT)
Self-Supervised Learning by Curvature Alignment [0.2] CurvSSLは、曲率調整による自己教師付き学習フレームワークである。
曲率調整型自己教師型学習フレームワークであるCurvSSLを紹介する。
局所幾何学を明示的に形成することは、純粋な統計的SSL正規化器の単純かつ効果的な補完であることを示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:22:31 GMT)
The Belief-Desire-Intention Ontology for modelling mental reality and agency [0.2] Belief-Desire-Intention(BDI)モデルは、人工知能と認知科学において合理的なエージェンシーを表現するための基盤となっている。
本稿では, エージェントの認知的構造を, 信念, 欲望, 意図, ダイナミックな相互関係を通じて捉える形式的BDIオントロジーを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:30:17 GMT)
Morality in AI. A plea to embed morality in LLM architectures and frameworks [0.1] 大きな言語モデル(LLM)は、人間の意思決定と振る舞いを仲介する。
本稿では,トランスフォーマーモデルの設計機構とフレームワークに直接,道徳的意味処理を組み込む手法を提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:53:43 GMT)
A novel approach to classification of ECG arrhythmia types with latent ODEs [0.1] サンプリング頻度の高い12個の心電図は不整脈検出のための臨床用金基準である。
ウェアラブルECGは長期監視を可能にするが、バッテリの制約により、不規則で低いサンプリング周波数に悩まされる。
これらの問題に対処するために、エンドツーエンドの分類パイプラインを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 03:57:52 GMT)
Certifying Majorana Fermions with Elegant-Like Bell Inequalities and a New Self-Testing Equivalence [0.1] この境界を正確に計算できるベル不等式の一般構成を導入する。
我々の枠組みは、クレーター=ホルン=シモニー=ホルトとギシンのエレガントな不等式の両方を一般化する。
適切な仮定の下では、我々の不等式はマヨラナ・フェルミオンのデバイスに依存しない認証を可能にする。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:27:34 GMT)
Dissecting Quantum Reinforcement Learning: A Systematic Evaluation of Key Components [0.1] 量子強化学習(QRL: Quantum Reinforcement Learning)は、量子コンピューティングと強化学習の交差点において、有望なパラダイムとして登場した。
設計上、PQCはハイブリッド量子古典モデルを作成するが、実用性はまだ不明である。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:21:39 GMT)
A Benchmark for Procedural Memory Retrieval in Language Agents [0.0] 現在のAIエージェントは、慣れ親しんだ設定で優れていますが、目に見えないProcで新しいタスクに直面したとき、急激に失敗します。
タスク実行から手続き的メモリ検索を分離する最初のベンチマークを示す。
埋め込み型手法は、慣れ親しんだ文脈で強く機能するが、新規な手法では著しく劣化する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:08:53 GMT)
Measuring Anyonic Exchange Phases Using Two-Dimensional Coherent Spectroscopy [0.0] 非線形応答関数のしきい値の挙動は、任意の合成トポロジカル電荷と結合可能な一般の電子対間の分数統計を符号化することを示した。
本手法は, トーリック符号におけるアベリア素数と非アベリア素数の両方について, 正しい分数交換統計値と整合した数値シミュレーションを用いて検証した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:18:20 GMT)
The Scrooge ensemble in many-body quantum systems [0.0] マクロ量子系におけるScrooge-random状態の性質と複雑性に関するいくつかの重要な結果を示す。
結果の重要なテーマは、非局所性における普遍的ランダムなゆらぎと全ての局所性指数的な濃度の分離である。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:46:44 GMT)
Fractional Chern insulator edges: crystalline effects and optical measurements [0.0] キラルトポロジカル秩序相のエッジ状態は、一般的にキラルルッティンガー液体によって記述される。
我々はこの枠組みを再検討し、格子効果による流体力学的限界からの偏差を定量化する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:52:03 GMT)
YOLO Meets Mixture-of-Experts: Adaptive Expert Routing for Robust Object Detection [0.0] 本稿では,複数のYOLOv9-Tエキスパート間の適応的ルーティングを取り入れた,オブジェクト検出のためのMixture-of-Expertsフレームワークを提案する。
平均精度(mAP)と平均リコール(AR)は、単一のYOLOv9-Tモデルよりも高い。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:33:16 GMT)
Witnesses of Genuine Multipartite Entanglement and Nonlocal Measurement Back-action for Raman-scattering Quantum Systems [0.0] リモート量子機械システム間の絡み合いは、様々な量子情報処理を可能にする。
我々は、$W$-statesに適した絡み合い証人のクラスを導出した。
この絡み合いは、数字統計を含む不平等を犯すことによって観察される。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:42:17 GMT)
When Administrative Networks Fail: Curriculum Structure, Early Performance, and the Limits of Co-enrolment Social Synchrony for Dropout Prediction in Engineering Education [0.0] ソーシャル統合理論は、支援的なピアネットワークに埋め込まれた学生が退学する可能性が低いことを示唆している。
学習分析において、これは社会的ネットワーク分析(SNA)を組織的共役データから活用し、誘惑を予測する動機となった。
本研究は,これらの管理ネットワークが,カリキュラムグラフインフォームドモデルを超えて,予測価値を付加するかどうかを検証した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:38:25 GMT)
Validating API Design Requirements for Interoperability: A Static Analysis Approach Using OpenAPI [0.0] APIの品質検証は、技術的設計と要件とエンタープライズアーキテクチャの整合性に寄与する。
S.E.O.R.A.は非機能API要件の早期検証を容易にする。
手動で検査する必要のあるチェックを自動化することで、API設計プロセスを改善する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 23:15:46 GMT)
Thermalization of exact quantum many-body scars in spin-1 XY chain under perturbations [0.0] 量子多体傷は固有状態熱化仮説に違反した特別な固有状態である。
我々は、XY鎖における典型的なU(1)対称性保存摂動に対するこれらの散乱状態の安定性について研究する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:25:44 GMT)
Theoretical Analysis of Photonic Resonances in Spectroscopic Measurements of a Kerr Nonlinear Resonator [0.0] フォトニック共鳴(PR)と呼ばれる現象はKPO分光法で理論的に予測されている。
我々はまず、理論計算と分光計測の実験を行った。
次に,理想的なノイズレス環境を想定した分析研究を行った。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:24:00 GMT)
The Software Engineering Simulations Lab: Agentic AI for RE Quality Simulations [0.0] 要求工学の品質(RE)は、いまだに逸話的で直観駆動である。
AIベースの開発が出現すると、要求品質の要因が変わる可能性がある。
本稿では、エージェントAIを用いたREシミュレーションのための第1のコンセプト、研究ロードマップ、プロトタイプ、および第1の実現可能性研究に貢献する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:19:08 GMT)
The Promotion Wall: Efficiency-Equity Trade-offs of Direct Promotion Regimes in Engineering Education [0.0] 記事は、調整されたエージェントベースモデルを使用して、代替の進歩体制が、ドロップアウト、タイム・ツー・ディグリー、エクイティ、学生の心理的体験をどのように再構成するかを調べる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:04:31 GMT)
The Dark Side of Flexibility: How Aggregated Cyberattacks Threaten the Power Grid [0.0] 本稿では、フレキシブルエネルギー資源の操作に使用できる攻撃戦略について検討し、評価する。
大量の電力を必要とするが、現在の柔軟性能力は、国家レベルでのグリッドを破壊するのに十分である可能性がある。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:59:45 GMT)
Ternary Gamma Semirings as a Novel Algebraic Framework for Learnable Symbolic Reasoning [0.0] シンボリックAIタスクは本質的に三進的であり、知識グラフの主観-述語-対象関係を含む。
既存のニューラルネットワークは通常、これらの相互作用を平らにしたり、二成分に分解したりすることで近似する。
本稿では,学習可能かつ微分可能な代数的フレームワークであるニューラルサーナリー・セミリング(NTS)を紹介する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:26:18 GMT)
Tensor network simulations of quasi-GPDs in the massive Schwinger model [0.0] 一般化された粒子分布関数は、クォークとグルーオンの自由度の観点からハドロンの内部構造を符号化する。
大規模シュウィンガーモデルにおける準GPDの最初の非摂動論的研究を示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:06:09 GMT)
Temperature in SLMs: Impact on Incident Categorization in On-Premises Environments [0.0] ローカルに実行されたSLMがこの課題に対処できるかどうかを検討する。
その結果、温度は性能にはほとんど影響を与えず、パラメータの数とGPU容量は決定的な要因であることがわかった。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:37:09 GMT)
Teaching quantum computing to computer science students: Review of a hands-on quantum circuit simulation practical [0.0] この実践は、量子コンピューティングの基本的な概念に対する学生の理解を深めることを目的としている。
学生は量子コンピューティングをシミュレートする様々な方法を学ぶ。
このハンズオン体験は、学生が量子コンピューティングの分野で研究する準備をする。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:58:34 GMT)
Systemic approach for modeling a generic smart grid [0.0] 本稿では,スマートグリッドのバックボーンモデルを用いて,グリッドの代替シナリオをテストする。
サブシステムの分散最適化により、柔軟性とスケーラビリティを維持しながら、生産と消費のスケジューリングが達成される。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:51:23 GMT)
Step-E: A Differentiable Data Cleaning Framework for Robust Learning with Noisy Labels [0.0] サンプル選択とモデル学習をひとつの最適化プロセスに統合するフレームワークであるStep-Eを提案する。
Step-Eは、サンプルを損失別にランク付けし、更新から除外された高損失の例を徐々に増やします。
CIFAR-100Nでは、Step-EはResNet-18モデルのテスト精度を43.3%から50.4%に改善した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:31:43 GMT)
Spin-orbit coupling of optical vector vortices in coherently prepared media [0.0] 本研究では,光ベクトル渦の伝播を3レベル$$構成のコヒーレントに生成した原子媒質(相オン)と弱相互作用させることを検討した。
ベクトルビームは、反対スピン角運動量(SAM)に対応する左右円偏極の渦パルス対からなる。
渦対の伝播中,媒体は渦対のトポロジーを継承し,OAMを空間的に構造化された原子コヒーレンスにマッピングする。
この写像は、2|l|-$foldアジムタール透過構造を生成し、環から花弁のようなパターンへとビーム強度を変換する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:06:39 GMT)
SlsReuse: LLM-Powered Serverless Function Reuse [0.0] 本稿では、サーバーレス関数の再利用のための最初のLLMフレームワークであるSlsReuseについて述べる。
効果的なプロンプトエンジニアリングを通じて、不均一関数の統一意味強調表現を学ぶ。
最も代表的なLCMの一つであるChatGPT-4o上に構築されたSlsReuseはRecall@10の91.20%を達成し、最先端のベースラインを24.53ポイント上回っている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:08:12 GMT)
Robust detection of an entanglement transition in the projective transverse field Ising model [0.0] 絡み合い遷移は、射影測定と雑音の固有のランダム性のために実験的に観察することが困難である。
逆場イジングモデルの射影バージョンにおける絡み合いの遷移を検出するためのスケーラブルで耐雑音性のあるプロトコルを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:36:09 GMT)
Research and Prototyping Study of an LLM-Based Chatbot for Electromagnetic Simulations [0.0] この研究は、電磁シミュレーションモデルを構築するのに必要な時間を短縮するために、生成人工知能をどのように使用できるのかという問題に対処する。
様々な機能拡張を備えたシミュレーションモデルの自動生成が可能な,大規模言語モデルが提案されている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:26:22 GMT)
Quantum backflow in biased tight-binding systems [0.0] 複素結合系における量子バックフロー現象について検討する。
系の最も強い逆流を引き起こす正の運動量状態の重ね合わせを計算する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 00:23:21 GMT)
Quantum Storage of Frequency-Multiplexed Photons Exhibiting Nonclassical Correlations with Telecom C-Band Photons [0.0] 周波数多重化原子周波数コムメモリと共振器Cバンドにおける共振器付自発パラメトリックダウンコンバージョン源の統合を報告する。
この統合は、スケーラブルな量子ネットワークに不可欠な高周波多重性を明らかにする。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 06:15:12 GMT)
Quantum Optical Simulator for Unruh-DeWitt Detector Dynamics [0.0] 直交非線形双光子源を用いた相対論的検出器-場相互作用をシミュレーションするための量子光学プラットフォームを提案する。
信号モード励起は真空揺らぎによって誘導される検出器遷移をエミュレートする一方、コヒーレントにシードされたアイドラーモードは有効量子場として機能することを示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 00:21:36 GMT)
Quantum Fourier Transform Based Kernel for Solar Irrandiance Forecasting [0.0] 本研究では,短期時系列予測のための量子フーリエ変換(QFT)を用いた量子カーネルを提案する。
それぞれの信号はウィンドウ化され、振幅エンコードされ、QFTによって変換され、その後保護回転層を通過してQFT/QFT隣接キャンセルを回避する。
外因性予測子は、凸的に融合した特徴特異的カーネルによって組み込まれている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:36:25 GMT)
Primitive Quantum Gates for an $SU(3)$ Discrete Subgroup: $Σ(72\times3)$ [0.0] 216 要素 $(72times3)$ の部分群のデジタル量子シミュレーションのための原始ゲートセットを構築する。
その結果生じる耐故障性Tゲートは、せん断粘度のフィデューシャル計算に約1012ドルのTゲートを必要とする。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:35:23 GMT)
Preventing Shortcut Learning in Medical Image Analysis through Intermediate Layer Knowledge Distillation from Specialist Teachers [0.0] ディープラーニングモデルは、トレーニングデータの急激な相関と無関係な特徴を使って、問題に対するショートカットを学習する傾向がある。
医用画像解析などの高リスクアプリケーションでは、この現象は、予測を行うときに臨床的に意味のある特徴を使用するのを防ぐことができる。
本稿では,タスク関連データの小さなサブセットに微調整された教師ネットワークを活用して,ショートカット学習を緩和する新しい知識蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 17:18:35 GMT)
Predicting Talent Breakout Rate using Twitter and TV data [0.0] 本稿では,タレントブレイクアウトの概念を定義し,スターダム化前に日本のタレントを検知する方法を提案する。
この研究の主な焦点は、Twitterとテレビのデータを組み合わせることによって、ソーシャルデータの時間依存的な変化を予測することにある。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 02:37:30 GMT)
Physics-Informed Machine Learning for Steel Development: A Computational Framework and CCT Diagram Modelling [0.0] 本稿では,鉄鋼の連続冷却変換モデルを開発するために,物理的洞察と機械学習を組み合わせた計算フレームワークを提案する。
我々のモデルは4,100図のデータセットに基づいて訓練され、文献や実験データに対して検証される。
高い計算効率を示し、100個の冷却曲線を持つ完全なCCTダイアグラムを5秒以内で生成する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 22:16:07 GMT)
Phase-adjusted realification of a $\mathbb{C}^3$ Kochen-Specker configuration into $\mathbb{R}^6$ [0.0] 位相調整された実現手順は、任意の有限個の線を$mathbbC3$から$mathbbR6$に埋め込む。
我々は、互いに偏りのない基底から得られる$mathbbC3$ Kochen-Specker構成で使用される165個の射影的な別個の光線を考える。
元の3要素コンテキストは $mathbbR6$ で最大値ではないため、組込み構成は $mathbbC3$ で最大値のコンテキストで実現しても2値の状態を許容する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:10:09 GMT)
PepEVOLVE: Position-Aware Dynamic Peptide Optimization via Group-Relative Advantage [0.0] PepEVOLVEは位置対応の動的フレームワークで、編集の場所と、多目的改善のためにペプチドを動的に最適化する方法を学ぶ。
治療目的のRev結合マクロサイクルベンチマークでは,PepEVOLVEはPepINVENTよりも高い平均値に達した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 02:51:15 GMT)
Parrot: Persuasion and Agreement Robustness Rating of Output Truth -- A Sycophancy Robustness Benchmark for LLMs [0.0] PARROT (Persuasion and Agreement Robustness Rating of Output Truth) は、ユーザの社会的圧力下での精度の劣化を測定するための堅牢性にフォーカスしたフレームワークである。
我々は13のドメインにまたがる1,302のMMLUスタイルの多重選択質問とドメイン固有の権威テンプレートを用いて22のモデルを評価する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:01:28 GMT)
Pair scattering from time-modulated impurity in the Bose-Hubbard model [0.0] 我々は、単一粒子とペア(二重)伝送を分析し、様々な相互作用強度を探索し、振幅を駆動する。
中間的および弱い係り受け相互作用において、有意な対解離と動的局所化単一粒子モードの出現を観察する。
これらの知見は、超低温原子実験において、工学的な制御可能な量子輸送と局在状態のための新しい道を提供する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:20:45 GMT)
Optimized Memory Tagging on AmpereOne Processors [0.0] ARM AArch64命令セットアーキテクチャへのメモリタグ拡張(MTE)は、メモリセーフなエスケープに対処するための貴重なツールである。
本稿では,アプリケーションメモリ管理を最優先のオーバーヘッド源として,ハードウェア・ソフトウェアスタック全体を解析する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:39:31 GMT)
On fast charged particle scattering by periodic atomic planes: quadratic potential corrections [0.0] この場合、微分散乱断面積は、ボルン近似と類似したエイコナル近似におけるコヒーレントおよび不整合断面積に分裂する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 02:11:08 GMT)
MusicAIR: A Multimodal AI Music Generation Framework Powered by an Algorithm-Driven Core [0.0] MusicAIRは、新しいアルゴリズム駆動のシンボリックミュージックコアをベースとした、革新的なAI音楽生成フレームワークである。
このフレームワークは歌詞のみから完全なメロディックスコアを生成する。
GenAIMは、歌詞・歌詞・テキスト・音楽生成・画像・音楽生成にMusicAIRを使用するウェブツールである。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:43:27 GMT)
MedPEFT-CL: Dual-Phase Parameter-Efficient Continual Learning with Medical Semantic Adapter and Bidirectional Memory Consolidation [0.0] 医用視覚言語セグメンテーションモデルは、新しい解剖学的構造に適応する際の破滅的な忘れ込みに悩まされる。
MedPEFT-CLは、新しいタスクの効率的な学習と過去の知識の保存の両方に対処するパラメータ効率のよい連続学習フレームワークである。
本研究の主な貢献は,(1)新しい医療課題の効率的な学習を可能にするセマンティック・アクセプション・アロケーション・メカニズム,(2)クロスモーダル・ラーニングを維持しながらトレーニング可能なパラメータを著しく削減するバイモーダル・ロラ適応,(3)以前の医療課題から破滅的な忘れを抑える双方向のフィッシャー・メモリ・コーディネーションである。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 03:39:48 GMT)
MedImageInsight for Thoracic Cavity Health Classification from Chest X-rays [0.0] 胸部X線撮影は診断に最も広く用いられている画像モダリティの1つだが、画像量の増加や放射線医の作業量の増加はタイムリーな解釈に挑戦し続けている。
本研究では,胸部X線を正常・異常に自動分類する医療画像基盤モデルであるMedImageInsightについて検討した。
1)エンド・ツー・エンド分類のための微調整MedImageInsight,(2)トランスファー学習パイプラインのための特徴抽出器としてモデルを用いた2つのアプローチが評価された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:42:20 GMT)
Learning the Value of Value Learning [0.0] 我々は、ジェフリー・ボルカーの枠組みを拡張して、値の洗練をモデル化し、公理的洗練のための情報の価値定理を証明した。
マルチエージェント設定では、相互改良がゼロサムゲームの特徴的変換を正サムの相互作用に変換することが確かめられる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:06:30 GMT)
Is Bohmian mechanics missing some motion? Why a recent experiment is inconclusive [0.0] 最近の実験では、ボヘミアのメカニックに課題が提起されている。
この実験は、要求される定常状態ではなく、電位ステップを反射する平均的な波パルス密度を観測している。
我々は、この速度が物理的意味を与える一般化されたマドルング流体モデルについて議論し、それがエバネッセントドブログリの速度という著者の考え方とどのように大まかに一致するかを示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:52:19 GMT)
Internalizing Tools as Morphisms in Graded Transformers [0.0] 変圧器の内部記号計算の定式化を導入する。
隠れた空間にはグレーディング$V=bigoplus_gin GV_g$が与えられ、シンボル操作は型付きブロックマップとして実現される。
自己制御型エンハングリードユーティリティ関数は、活性化を制御し、スパースで解釈可能な振る舞いをもたらす。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 23:27:53 GMT)
Improved error correction with leakage reduction units built into qubit measurement in a superconducting quantum processor [0.0] 非計算状態への漏洩は時間と空間の相関誤差の源である。
本稿では,トランスモン測定と同時に動作する高忠実度漏洩低減ユニット(LRU)について実験的に紹介する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:02:36 GMT)
Improved Sample Complexity for Full Coverage in Compact and Continuous Spaces [0.0] 我々は$d$次元単位ハイパーキューブにおける一様ランダムサンプリングについて検討した。
故障確率に対数依存するサンプル複雑性を導出する。
我々の発見は、グリッドベースのカバレッジ保証に依存するアルゴリズムに対して、よりシャープな理論的ツールを提供する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 21:06:14 GMT)
Identifying Quantum Structure in AI Language: Evidence for Evolutionary Convergence of Human and Artificial Cognition [0.0] 実験対象として,特定言語モデル(LLM)を用いて実施した概念的組み合わせに関する認知テストの結果について述べる。
ChatGPT と Gemini で行った最初の試験ではベルの不等式が著しく違反していることが示され、これはテストされた概念に「量子絡み」が存在することを示している。
また,ChatGPTとGeminiを用いた第2の試験では,大規模テキストに含まれる単語の分布において,直感的に予測される「マクスウェル・ボルツマン統計」よりも「ボース=アインシュタイン統計」の存在が確認された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:22:49 GMT)
Humanlike Multi-user Agent (HUMA): Designing a Deceptively Human AI Facilitator for Group Chats [0.0] HUMA(Humanlike Multi-user Agent)は、AIファシリテータであり、ヒューマンライクな戦略とタイミングを用いて多人数会話に参加する。
我々の結果は、自然なグループチャット設定では、AIファシリテータは人間の品質にマッチするが、人間ではないと識別することは難しいことを示唆している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:34:42 GMT)
Homomorphic Encryption-based Vaults for Anonymous Balances on VM-enabled Blockchains [0.0] VM対応ブロックチェーンのための同型暗号化ベースのVault(Haults)を提案する。
Haultsはユーザーの残高と他の当事者に渡される金額を秘密にしている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 23:34:30 GMT)
Hiding in the AI Traffic: Abusing MCP for LLM-Powered Agentic Red Teaming [0.0] 本稿では,モデルコンテキストプロトコル(MCP)を利用した新しいコマンド・アンド・コントロール(C2)アーキテクチャを導入し,適応型偵察エージェントを網羅的に協調する。
私たちのアーキテクチャは、システム全体のゴール指向の振る舞いを改善するだけでなく、コマンドとコントロールの振る舞いを完全に検出および防止するために使用できる主要なホストやネットワークアーティファクトを排除します。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:10:35 GMT)
Generative AI in Sociological Research: State of the Discipline [0.0] ジェネレーティブ・人工知能(GenAI)は、研究と奨学金の潜在的有用性についてかなりの注目を集めている。
初期のコメンテーターは、GenAIの利用がいかに環境コスト、深刻な社会的リスク、低品質なコンテンツを生み出す傾向があるか、という懸念を明確に述べている。
本研究は,社会学研究を拠点として,過去5年間に50の社会学雑誌に掲載された433の論文の著者を対象とした調査を行った。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 01:34:28 GMT)
GLOBE: Accurate and Generalizable PDE Surrogates using Domain-Inspired Architectures and Equivariances [0.0] GLOBEは、学習可能なグリーン関数のようなカーネルの重ね合わせとして、境界面からターゲットへ評価されるソリューションである。
AirFRANSでは、GLOBEは相当な精度向上を実現している。
結果は、厳密な物理学とドメインにインスパイアされた帰納的バイアスが、精度、一般化可能性、実用性に大きな利益をもたらすことを示した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:26:08 GMT)
FDA AI Search: Making FDA-Authorized AI Devices Searchable [0.0] 1200以上のAI対応医療機器が米国FDAからマーケティング認可を受けている。
FDAのデータベースには、限られたメタデータと検索不可能な要約PDFしか含まれていない。
我々はFDA認可のAI対応デバイスのセマンティッククエリを可能にするウェブサイトであるFDA AI Searchを開発している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:21:08 GMT)
Exploring the added value of pretherapeutic MR descriptors in predicting breast cancer pathologic complete response to neoadjuvant chemotherapy [0.0] 本研究の目的は、MRI記述子と完全反応(pCR)とネオアジュバント化学療法(NAC)との関連性を評価することである。
単焦点と非選択マージンは独立にpCRと関連付けられており、BC応答NACを予測するためにモデル性能を向上させることができる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:25:32 GMT)
Exploring fixed points and eigenstates of quantum systems with reinforcement learning [0.0] 本稿では,与えられた量子演算の定点を特定するための強化学習アルゴリズムを提案する。
この方法は、計算基底を固定点の基底にマッピングするユニタリ変換を反復的に構成する。
演算がハミルトニアン進化に対応する場合、このタスクはハミルトニアン固有状態を決定することに還元される。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:48:46 GMT)
Exceptional line and pseudospectrum in black hole spectroscopy [0.0] ブラックホール摂動理論における例外点(EP)とその擬似スペクトルについて検討する。
渦度 $=pm1/2$ とベリー位相 $=$ は EL を囲むループに対して EL を囲むものではない。
摂動理論を通じて、$$-pseudospectrum contour size が EP において 1/q$ にスケールすることを証明し、$q$ はハミルトン作用素の最大のヨルダンブロックの順序である。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:18:15 GMT)
Evaluating Adversarial Vulnerabilities in Modern Large Language Models [0.0] 本稿では、2つの主要な公開言語モデル(LLM)に対するジェイルブレイク攻撃に対する感受性の比較分析を行う。
この研究は「自己バイパス」と「横断バイパス」の2つの主要なバイパス戦略を利用した。
攻撃の成功は、禁止されたコンテンツの生成によって決定され、ジェイルブレイクの成功によって重度スコアが割り当てられた。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 01:23:56 GMT)
Equivariant-Aware Structured Pruning for Efficient Edge Deployment: A Comprehensive Framework with Adaptive Fine-Tuning [0.0] 本稿では,グループ同変畳み込みニューラルネットワーク(G-CNN)と同変対応型構造化プルーニングを組み合わせたフレームワークを提案する。
提案手法は,e2cnn層構造の解析とニューロンレベルのプルーニングを完全連結成分に適用することにより,同変特性を保っている。
衛星画像 (EuroSAT) と標準ベンチマーク (CIFAR-10, Rotated MNIST) を用いて, 様々な領域で有効性を示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:41:47 GMT)
Episodic Memory in Agentic Frameworks: Suggesting Next Tasks [0.0] 本稿では,次のタスクを提案するためのガイドエージェントとして過去を格納し,検索するエピソードメモリアーキテクチャを提案する。
現在のメモリと過去のシーケンスをマッチングすることで、エージェントは以前のパターンに基づいたステップを推奨できる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:47:41 GMT)
Entanglement and correlations between local observables in de Sitter spacetime [0.0] 本研究では,デ・シッター宇宙論パッチ内でコンパクトに支持されるフィールドモードの対の絡み合いについて検討する。
曲率の増加は局所的なモード間の相関を増大させるが、逆にその絡み合いを減少させる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:45:47 GMT)
Entanglement Witnesses of Condensation for Enhanced Quantum Sensing [0.0] スピン量子ビットの集合的絡み合いは、基底状態と励起スピン状態の間の遷移を増幅することができることを示す。
結果は、凝縮にインスパイアされた絡み合いを利用してスピンベースのプラットフォームの感度を高める量子センサーの設計原則を提供する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:00:56 GMT)
Enhancing Quranic Learning: A Multimodal Deep Learning Approach for Arabic Phoneme Recognition [0.0] 本研究では、アラビア音素誤発音検出のためのトランスフォーマーに基づくマルチモーダルフレームワークを提案する。
このフレームワークは、UniSpeech由来の音響埋め込みとWhisper転写から抽出されたBERTベースのテキスト埋め込みを統合する。
この研究は、インテリジェントで話者に依存しないマルチモーダル・コンピュータ支援言語学習(CALL)システムの開発に寄与する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:25:46 GMT)
Enhancing Infrared Laser Dissociation of Molecules with the Electromagnetic Vacuum [0.0] ストレッチモードを有するCS$2$分子の赤外レーザー光解離について検討した。
その結果,光解離に必要な強度は空洞内よりも空洞内において有意に低いことがわかった。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:33:06 GMT)
Do Vision-Language Models Understand Visual Persuasiveness? [0.0] バイナリ説得力判定のための高合意データセットを構築した。
視覚的説得因子(VPF)の分類について紹介する。
また,説得関連推論のための認知的ステアリングと知識注入戦略についても検討した。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 08:28:02 GMT)
Diffusion Models are Molecular Dynamics Simulators [0.0] バッチ次元に逐次バイアスを付与したデノナイズ拡散サンプリング器が,ランゲヴィン力学を過度に破壊するオイラー・丸山積分器であることを証明した。
各逆消音ステップは、その関連するばね剛性を伴って、ノイズスケジュールとその剛性とで協調して設定された有効時間ステップを有する微分方程式の一段階と解釈することができる。
学習したスコアは、学習したエネルギーの勾配の役割を担い、拡散サンプリングとランゲヴィン時間進化の正確な対応を与える。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 19:48:32 GMT)
Critical dephasing rates for the observation of collective behavior in a pair of coupled quantum emitters [0.0] 原子-光子界面は、制御された量子エミッタの集合を必要とする。
量子ドットのサブ波長アレイによる最近の実験では、室温での超輝度が観察されている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 09:38:40 GMT)
Convergence and stability of Q-learning in Hierarchical Reinforcement Learning [0.0] 本稿では,Fudal Q-learningスキームを提案する。
更新は、適切に定義されたゲームの平衡として解釈できる点に収束することを示す。
Feudal Q-learningアルゴリズムに基づく実験は、理論によって期待される結果をサポートする。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 16:13:53 GMT)
Constant-Size Cryptographic Evidence Structures for Regulated AI Workflows [0.0] 本稿では,規制環境におけるAIの正当性検証のための暗号証拠構造について紹介する。
それぞれのエビデンス項目は、(i)ワークフローイベントとコンフィギュレーションへの強いバインドを提供するように設計された、固定サイズの暗号化フィールドの固定サイズであり、(ii)一定のサイズのストレージとイベント毎の検証コストをサポートし、(iii)ハッシュチェーンとMerkleベースの監査をクリーンに構成する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:28:07 GMT)
Collective early-time spontaneous decay of a strongly driven cold atomic ensemble [0.0] 強い駆動と光学的に高密度な寒冷原子雲の集団早期崩壊速度について検討した。
駆動周波数の関数として、収集された光の特定の角度における振舞いは、単光子サブラジアント状態からスーパーラジアント状態へ遷移する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:07:38 GMT)
Channel-selective frequency up-conversion for frequency-multiplexed quantum network [0.0] 伝送路選択周波数のアップコンバージョンを,光ファイバー通信のために約1540nmから約780nmの可視波長まで示す。
単一光子レベルでのプロセスの信号-雑音比を導出し、周波数多重化量子ネットワークの文脈におけるチャネル選択型量子周波数変換(CS-QFC)への適用性について議論する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 02:57:04 GMT)
Centipedes Leap into the Quantum Realm [0.0] センテデゲーム(Centipede game)は、2人プレイのノンゼロサムゲームである。
プレイヤーはそれぞれのターンで、プレイヤーが獲得するか、成長する報酬を渡すかを選択できる。
このゲームの古典的で合理的な解法は、第1ラウンドにおいて、プレイヤーがより頻繁に協力するときに、欠陥を示す。
同様の量子力学原理をセンテペデゲームに適用すると、古典解よりも優れている2つの新しい量子ナッシュ平衡が導かれることを示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 21:30:02 GMT)
Bridging Symbolic Control and Neural Reasoning in LLM Agents: The Structured Cognitive Loop [0.0] 構造化認知ループ(Structured Cognitive Loop, SCL)は,エージェント認知を検索,認知,制御,行動,記憶の5つのフェーズに分けるモジュールアーキテクチャである。
SCLの中核であるSoft Symbolic Controlは、確率的推論にシンボリック制約を適用する適応的なガバナンスメカニズムである。
我々は,ライブGPT-4oによる旅行計画エージェントとともに,R-CCAMループアーキテクチャを実演する完全なオープンソース実装を提供する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 05:19:34 GMT)
Beyond Component Strength: Synergistic Integration and Adaptive Calibration in Multi-Agent RAG Systems [0.0] 本研究では,ハイブリッド検索,アンサンブル検証,適応しきい値設定などの拡張が,単独で使用する場合のメリットをほとんど示さないことを示す。
異なる検証戦略は安全に振る舞うことができるが、一貫性のないラベルを割り当てる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:53:56 GMT)
Basic cell for a quantum microwave router [0.0] 量子ルーティングのためのスケーラブルな基本セルを初めて実験的に実現したことを報告する。
細胞は単一光子レベルで確実に機能し、高光子状態においては、クォービットによって誘導される光子ドレッシングを直接観察する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 13:54:03 GMT)
Axiomatising the dagger category of complex Hilbert spaces [0.0] 複素ヒルベルト空間と有界線型写像のダガー圏を公理化する。
私たちの公理は容易に解釈できる目的で選ばれます。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:08:03 GMT)
Automobile demand forecasting: Spatiotemporal and hierarchical modeling, life cycle dynamics, and user-generated online information [0.0] 本研究は、ドイツの高級車メーカーのデータを用いて、多製品、多市場、多レベルの階層にまたがる月間自動車需要予測に対処する。
この手法は、戦略的および運用計画レベルでのポイント予測と確率予測を組み合わせ、プール化されたトレーニングセットとLightMモデルのアンサンブル、量子レグレッション、混合整数線形プログラミング和解アプローチを活用する。
結果は、スパース依存関係とラウンドバイアスが予測精度に大きく影響し、運用の実現可能性に対する整数予測の重要性を強調している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 14:30:49 GMT)
Attention-Guided Feature Fusion (AGFF) Model for Integrating Statistical and Semantic Features in News Text Classification [0.0] 本稿では,統合されたフレームワークにおける統計的特徴と意味的特徴を組み合わせたAGFFモデルを提案する。
その結果,多様な特徴型の戦略的統合により,分類精度が著しく向上することが確認された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 12:05:31 GMT)
Asymptotic dynamics in the Heisenberg picture: attractor subspace and Choi-Effros product [0.0] We study the dynamics of open quantum systems in the Heisenberg picture。
我々は、アトラクタ部分空間とその内部で発生するダイナミックスに対する明示的な表現を見つける。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 20:34:46 GMT)
Aspects of quantum geometry in photonic time crystals [0.0] 我々はSU(1,1)コヒーレント状態多様体上のフォトニック時間結晶における量子光の幾何学的記述を開発する。
各モードの進化はポアンカレ円盤上のMbius等距離として現れ、軌道のトポロジーは安定で不安定で臨界状態を区別する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:36:14 GMT)
Artificial Intelligence as a Training Tool in Clinical Psychology: A Comparison of Text-Based and Avatar Simulations [0.0] 本研究では,2つのAIシミュレーションにおける臨床心理学生の認識について検討した。
24人の学生が2つの短期間の認知行動ロールプレイを完了した。
どちらのAIツールも、さまざまな次元で肯定的に評価された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 10:09:20 GMT)
All steerable quantum correlations can provide thermodynamic advantages in cooling [0.0] この研究は、古典的な相関のシナリオよりも証明可能な量子優位性を示すために、量子相関の基本的な形式であるステアビリティを利用する。
ステアブル量子相関は冷却作業において常に熱力学的優位性をもたらすことを示す。
以上の結果から, この熱力学的優位性が, ステアビリティの証人となる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:07:39 GMT)
Addressing A Posteriori Performance Degradation in Neural Network Subgrid Stress Models [0.0] ニューラルネットワークサブグリッドストレスモデルは、後部性能よりもはるかに優れた先行性能を持つことが多い。
2つの異なるフィルタで訓練された後部ニューラルネットワークは、異なる数値スキームを持つ2つの異なるLES符号に対して、はるかに堅牢である。
トレーニングデータ拡張と、より複雑な入力セットの両方を使用するニューラルネットワークは、その事前評価をはるかに反映している。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:24:52 GMT)
AI Workers, Geopolitics, and Algorithmic Collective Action [0.0] この論文は、一部のAI労働者は、地政学のアクターと見なすことができると論じている。
ガバナンスだけでは、責任、倫理的、あるいは堅牢なAI開発と使用を保証できない。
知識、相対的な力の源泉としてAIワーカーを関与させ、より責任を持ち、単なるAI開発を促進することを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:52:44 GMT)
A novel k-means clustering approach using two distance measures for Gaussian data [0.0] クラスタリング分析は、生データの中に明瞭さと構造を見つける最良の方法の1つである。
本稿では,クラスタ内距離 (WCD) とクラスタ間距離 (ICD) の両方を距離距離として用いたテキストトク平均クラスタリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 22:36:14 GMT)
A lightweight detector for real-time detection of remote sensing images [0.0] DMG-YOLOは、リモートセンシング画像の小さな物体検出に適した軽量リアルタイム検出器である。
バックボーンにデュアルブランチ特徴抽出(DFE)モジュールを導入し,特徴マップを2つの並列ブランチに分割する。
首にGlobal and Local Aggregate Feature Pyramid Network (GLAFPN)を導入し,小物体検出をさらに促進する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 11:11:04 GMT)
A Patient-Centric Blockchain Framework for Secure Electronic Health Record Management: Decoupling Data Storage from Access Control [0.0] 本稿では,電子カルテ共有のための患者中心型アーキテクチャを提案する。
鍵は公開鍵のラッピングを通じて配布されるため、ストレージプロバイダは秘密を危険にさらすことなく、誠実だが正確さを保つことができる。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 18:09:25 GMT)
A Multiscale Geometric Method for Capturing Relational Topic Alignment [0.0] 解釈可能なトピックモデリングは、共同著者コミュニティ内で研究の利益がどのように進化するかを追跡するのに不可欠である。
本稿では,階層的なトピックデンドログラムを構築するために,Hellinger 距離と Ward リンクを用いたマルチモーダルテキストと共著者ネットワークデータを統合する手法を提案する。
本手法は, レアトピック構造を効果的に同定し, 時間とともにスムーズなトピックドリフトを可視化する。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 22:45:16 GMT)
A First Full Physics Benchmark for Highly Granular Calorimeter Surrogates [0.0] 本研究は, 実測シミュレーション応用における高粒度生成熱量サロゲートの利用について検討した。
本稿では, 生成熱量計サロゲートとリアルな検出器の組み合わせを可能にする汎用ライブラリDDMLを紹介する。
1つは正規グリッド表現で動作するもので、もう1つはあまり一般的でないポイントクラウドアプローチを用いている。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 15:06:49 GMT)
50-km fiber interferometer for testing gravitational signatures in quantum interference [0.0] 単光子レベルで動作するマッハ・ツェンダーファイバー干渉計を50kmのテーブル上に実現したことを報告した。
この感度は、周波数範囲0.01Hzから5Hzの範囲で(6.18 pm 0.44)時間s10$ rad root-mean-square (RMS)の位相シフト信号を解くのに十分であることを示す。
論文参考訳(メタデータ) (Fri, 21 Nov 2025 07:53:52 GMT)