Object-X: Learning to Reconstruct Multi-Modal 3D Object Representations [114.6] Object-Xは多目的なマルチモーダル3D表現フレームワークである。
リッチなオブジェクトの埋め込みをエンコードして、幾何学的および視覚的再構成に復号することができる。
シーンアライメント、シングルイメージの3Dオブジェクト再構成、ローカライゼーションなど、さまざまなダウンストリームタスクをサポートする。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 12:06:58 GMT)
How Do AI Agents Do Human Work? Comparing AI and Human Workflows Across Diverse Occupations [112.6] エージェントが人間とエージェントの労働者の直接比較を初めて提示することで、エージェントがどのように人間の仕事をするかを考察する。
結果が88.3%速く、コストが90.4-96.2%低いことが判明した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 18:10:22 GMT)
PARTONOMY: Large Multimodal Models with Part-Level Visual Understanding [106.7] 画素レベルの部分接地のために設計された LMM ベンチマークである PartONOMY を紹介する。
我々はいくつかの部分中心LMMをトレーニングし、セグメント化トークンの代わりにスパンタグを使用する新しいセグメント化LMMであるPLUMを提案する。
我々の研究は、LMMにおけるきめ細かい基礎的な視覚的理解を実現するための新たな道を開く。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 21:52:55 GMT)
Why Do Multi-Agent LLM Systems Fail? [87.9] MAST-Dataは7つの人気のあるMASフレームワークで収集された1600以上の注釈付きトレースの包括的なデータセットである。
我々はMAST(Multi-Agent System Failure Taxonomy)を初めて構築する。
MASTとMAST-Dataを利用して、モデル(GPT4、Claude 3、Qwen2.5、CodeLlama)とタスク(コーディング、数学、汎用エージェント)の障害パターンを分析します。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 23:25:18 GMT)
Open Multimodal Retrieval-Augmented Factual Image Generation [86.3] Factual Image Generation(FIG)のためのエージェント型オープンマルチモーダル検索拡張フレームワークORIGを紹介する。
ORIGは、Webから反復的にマルチモーダルなエビデンスを検索してフィルタリングし、洗練された知識をリッチなプロンプトにインクリメンタルに統合し、生成をガイドする。
実験により、ORIGは強いベースラインよりも事実整合性と全体的な画像品質を大幅に改善することが示された。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:13:31 GMT)
IGGT: Instance-Grounded Geometry Transformer for Semantic 3D Reconstruction [82.5] 人間は自然に3次元世界の幾何学的構造と意味的内容を中間次元として知覚する。
本稿では,空間再構成とインスタンスレベルの文脈理解の両面での知識を統合するために,IGGT (InstanceGrounded Geometry Transformer) を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 14:57:44 GMT)
S-Chain: Structured Visual Chain-of-Thought For Medicine [82.0] S-Chainは,有界ボックスと構造化ビジュアルCoT(SV-CoT)を備えた,12,000のエキスパートアノテートされた医用画像の最初の大規模データセットである。
データセットはさらに16言語をサポートし、幅広い多言語適用性のための合計700万VQAペアをサポートする。
S-Chainは、根拠のある医療推論のための新しいベンチマークを確立し、より信頼性が高く説明可能な医療ビジョン言語モデルへの道を開く。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 15:57:14 GMT)
Unbiased Scene Graph Generation from Biased Training [76.4] 因果推論に基づく新しいSGGフレームワークを提案するが、従来の可能性ではない。
トレーニングされたグラフから反ファクト因果関係を抽出し、悪バイアスから影響を推測する。
特に,無バイアスSGGに対する最終述語スコアとしてTotal Direct Effect(TDE)を用いる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 11:07:57 GMT)
ME: Trigger Element Combination Backdoor Attack on Copyright Infringement [76.0] SilentBadDiffusion(SBD)は、テキスト・ツー・イメージタスクにおけるSD攻撃において優れた性能を示す手法である。
本稿では,SBDのような攻撃の研究に利用できる新しいデータセットを作成し,SBDに基づくマルチ要素攻撃法を提案する。
著作権侵害率 (CIR) / First Attack Epoch (FAE) の2つの新しいデータセットは16.78% / 39.50と51.20% / 23.60で、それぞれPokemonとMijourneyのベンチマークに近いか、あるいは劣っている。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 03:13:19 GMT)
Transformers from Compressed Representations [74.5] TEMPEST (TransformErs froM comPressed rEpreSenTations) は、圧縮されたファイルのバイトストリーム構造を利用して効果的なトークン化と符号化戦略を設計する手法である。
本提案では,意味分類に必要なトークン数を大幅に削減し,計算複雑性とメモリ使用量の両方を削減する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:48:03 GMT)
MMPersuade: A Dataset and Evaluation Framework for Multimodal Persuasion [74.0] LVLM(Large Vision-Language Models)は、ショッピング、健康、ニュースなどの分野に展開されている。
MMPersuadeはLVLMにおけるマルチモーダルパーサージョンダイナミクスを体系的に研究するための統一的なフレームワークを提供する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 17:39:21 GMT)
Structural-Spectral Graph Convolution with Evidential Edge Learning for Hyperspectral Image Clustering [73.0] ハイパースペクトル画像(HSI)クラスタリングは、ラベル付きデータを持たないクラスタにピクセルをグループ化する。
ほとんどの手法はスーパーピクセルセグメンテーションに依存し、グラフニューラルネットワーク(GNN)に基づくスーパーピクセルレベルのクラスタリングを実行する。
グラフ構造化HSIスーパーピクセルに適した構造スペクトルグラフ畳み込み演算子(SSGCO)を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 16:16:19 GMT)
Visual Thoughts: A Unified Perspective of Understanding Multimodal Chain-of-Thought [72.3] 大規模視覚言語モデル(LVLM)の性能と解釈性を改善するマルチモーダル・チェーン・オブ・シント(MCoT)
我々は,MCoTフォーマットによらず,画像情報を推論プロセスに伝達する視覚的思考を取り入れることで,MCoTがLVLMを促進することを示す。
また、視覚的思考の内部的な性質を探求し、視覚的思考が入力画像と深いトランスフォーマー層への推論の間の仲介として機能することを発見した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 06:24:15 GMT)
UCB-type Algorithm for Budget-Constrained Expert Learning [71.7] algnameM-LCBはUCBスタイルのメタアルゴリズムであり、幻想的後悔の保証を提供する
我々は、AlgnameM-LCBが、限られたリソースの下で、ステートフルで自己学習の専門家をコーディネートする、より現実的なシナリオまで、古典的な帯域幅パラダイムをどのように拡張しているかを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 12:36:17 GMT)
ChemVLM: Exploring the Power of Multimodal Large Language Models in Chemistry Area [70.7] textbfChemVLMは、化学応用のためのオープンソースの化学マルチモーダル大規模言語モデルである。
ChemVLMは、テキストと視覚の化学情報の両方を理解する能力を高めるために、慎重にキュレートされたバイリンガルデータセットで訓練されている。
我々はChemVLMを、様々なタスクにおいて、オープンソースおよびプロプライエタリな多モーダルな大規模言語モデルに対してベンチマークする。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:55:28 GMT)
VideoHallu: Evaluating and Mitigating Multi-modal Hallucinations on Synthetic Video Understanding [70.0] 物理的な世界と対話するAIシステムには、真の視覚的理解が不可欠である。
現在の評価では、主にトレーニングデータと同様の実際のビデオを使用する。
物理的に不可能または論理的に矛盾する事象を描写するビデオを用いた負制御テストを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:54:22 GMT)
Edge Collaborative Gaussian Splatting with Integrated Rendering and Communication [69.2] エッジ協調(ECO-GS)では,各ユーザが小さなGSモデルに切り替えて忠実さを保証し,遠隔大GSモデルで忠実さを保証できる。
低コストのレンダリングステータスとエッジパワー割り当てを協調的に最適化する統合通信(IRAC)を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 15:33:29 GMT)
Boost Post-Training Quantization via Null Space Optimization for Large Language Models [66.7] 既存の大規模言語モデル(LLM)の学習後量子化手法は驚くべき成功を収めている。
余分な性能向上は、既存の量子化戦略がより圧縮されたモデルの開発を支援するには不十分であることを示唆している。
我々は、量子化後の重みを入力アクティベーションのヌル空間内に配置することで、量子化誤差を効果的に緩和することができると論じる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:46:34 GMT)
AttentionPredictor: Temporal Patterns Matter for KV Cache Compression [64.8] 我々は,KVキャッシュ圧縮とクリティカルトークン識別のための注意パターンを直接予測する,学習に基づく最初の手法であるAttentionPredictorを提案する。
AttentionPredictorは、注意スコアを正確に予測し、無視可能なメモリを消費する統一予測モデルを共有する。
注意情報の大半を保持することで、AttentionPredictorは、キャッシュオフロードシナリオで13$times$KVキャッシュ圧縮と5.6$times$スピードアップを達成する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:25:10 GMT)
Long-Tailed Classification by Keeping the Good and Removing the Bad Momentum Causal Effect [64.4] 長い尾の分類は、大規模なディープラーニングの鍵である。
既存の手法は主に、基本的な理論を欠いた再重み付け/再サンプリングに基づいている。
本稿では,従来の手法の理由を解明するだけでなく,新たな原理的解を導出する因果推論の枠組みを確立する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 11:09:24 GMT)
Progressive Multi-Source Domain Adaptation for Personalized Facial Expression Recognition [64.4] パーソナライズされた表情認識(FER)では、ラベル付きソースとラベルなしターゲットドメインのサンプルを使用して機械学習モデルを適用する。
本稿では,対象者との類似性に基づいて,段階的なMSDA手法を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:01:32 GMT)
DAMap: Distance-aware MapNet for High Quality HD Map Construction [64.4] 現在の手法は、固有のタスクのミスアライメントにより、高品質な予測が不十分である。
DAMapと呼ばれる新しいHDマップ構築手法を開発し,これらの問題に対処する。
DAMapは3つのコンポーネントで構成されている: 距離対応のFocal Loss (DAFL), Hybrid Loss Scheme (HLS), Task Modulated Deformable Attention (TMDA)。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:29:26 GMT)
Are Pixel-Wise Metrics Reliable for Sparse-View Computed Tomography Reconstruction? [61.5] 解剖学的構造全体にわたる構造的完全性を評価するために,解剖学的評価尺度の組を提案する。
CAREは、重要な構造物の解剖学的保存を促進するために、訓練中に構造的罰則を取り入れている。
CAREはCT再建における構造的完全性を大幅に改善し、大臓器では+32%、小臓器では+22%、小腸では+40%、血管では+36%となる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 19:46:57 GMT)
Deterministic single-photon source with on-chip 5.6 GHz acoustic clock [59.4] 数GHzの周波数で誘導される動的パーセル効果を用いた量子ドット(QD)単一光子放射のトリガを音響ひずみにより実証する。
InAs QDは光子-フォノンパターンのハイブリッドマイクロキャビティに統合される。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:43:00 GMT)
SRSR: Enhancing Semantic Accuracy in Real-World Image Super-Resolution with Spatially Re-Focused Text-Conditioning [59.0] 本稿では,空間的に再焦点を絞ったテキストコンディショニングを推論時に洗練する超解像フレームワークを提案する。
第二に,非接地画素に対するテキストの影響を選択的に回避し,幻覚を防ぐ空間的自由誘導機構を導入する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:03:55 GMT)
MagicMotion: Controllable Video Generation with Dense-to-Sparse Trajectory Guidance [58.7] トラジェクティブ制御可能なビデオ生成のための画像からビデオ生成フレームワークであるMagicMotionを紹介する。
MagicMotionは、オブジェクトの一貫性と視覚的品質を維持しながら、定義された軌道に沿ってオブジェクトを認識できる。
我々は、大規模なトラジェクトリ制御ビデオデータセットであるMagicDataと、アノテーションとフィルタリングのための自動パイプラインを提示する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 22:58:59 GMT)
CPRet: A Dataset, Benchmark, and Model for Retrieval in Competitive Programming [58.5] 競合プログラミングのための検索指向ベンチマークスイートであるCPRetを紹介する。
私たちのコントリビューションには、高品質なトレーニングデータと、信頼性評価のための時間的に分離されたテストセットの両方が含まれています。
問題コードアライメントのための新しいGroup-InfoNCE損失で訓練されたCPRetriever-Codeと、問題レベルの類似性を特定するための微調整されたCPRetriever-Probの2つのタスク専用レトリバーを開発する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 03:34:29 GMT)
Nes2Net: A Lightweight Nested Architecture for Foundation Model Driven Speech Anti-spoofing [58.0] Nested Res2Net (Nes2Net) は、DRレイヤなしで高次元機能を直接処理できる軽量バックエンドアーキテクチャである。
本稿では,22%の性能向上と87%のバックエンド計算コスト削減を報告した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 11:39:29 GMT)
NVS-SQA: Exploring Self-Supervised Quality Representation Learning for Neurally Synthesized Scenes without References [57.0] 我々は,NVS-SQAを提案する。NVS-SQAは,自己スーパービジョンを通じて,非参照品質表現を学習するための品質評価手法である。
従来の自己教師型学習は、主に"same instance, similar representation"仮定と広範なデータセットに依存している。
我々は、学習の効率と効率を改善するために、フォトリアリスティックな手がかりと品質スコアを学習目的として採用する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 10:20:24 GMT)
RealCustom++: Representing Images as Real Textual Word for Real-Time Customization [56.3] テキストと特定の主題の画像が与えられた場合、テキスト・ツー・イメージのカスタマイズは、テキストと被写体の両方の外観に合わせた新しい画像を生成することを目的としている。
既存の作品は擬似語パラダイムに従っており、それは対象を存在しない擬似語として表現し、他のテキストと組み合わせて画像を生成する。
提案するRealCustom++は,非コンフリクトな実単語で対象を表現し,まずコヒーレントなガイダンス画像とそれに対応する主題マスクを生成する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:14:10 GMT)
Diversification as Risk Minimization [55.5] 分散化アルゴリズムは、単純な非分散化アルゴリズムほど堅牢ではないことを示す。
クエリにおいて、最小限の意図によって直面する期待されるリスクを計測するVRiskを導入する。
次に、証明可能な近似保証を備えた高速グリーディリランカであるVRiskerを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:51:45 GMT)
Identification of Causal Direction under an Arbitrary Number of Latent Confounders [54.8] 実世界のシナリオでは、観測された変数は複数の潜伏変数によって同時に影響を受けることがある。
我々は,特定の方法で構築された観測変数の高次累積行列を併用する。
これらの高次累積行列の階数不足特性から,2つの観測変数間の因果非対称性が直接観察可能であることを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 15:10:00 GMT)
Rethinking the Text-Vision Reasoning Imbalance in MLLMs through the Lens of Training Recipes [54.4] MLLM(Multimodal large language model)は、視覚・言語タスクにおいて強力な機能を示す。
近年の研究では、視覚的・テキスト的モダリティ間の推論能力の不均衡が指摘されている。
我々は、この現象を、テキスト中心と視覚中心の入力のパフォーマンス格差として定義される、テクティモダリティギャップと呼ぶ。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 21:06:13 GMT)
Transitive RL: Value Learning via Divide and Conquer [54.2] Transive Reinforcement Learning (TRL) は、分割・分散パラダイムに基づく新しい価値学習アルゴリズムである。
モンテカルロ法とは異なり、TRLは動的プログラミングを実行するため、高分散に苦しむ。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 03:32:31 GMT)
Evolving LLMs' Self-Refinement Capability via Synergistic Training-Inference Optimization [53.9] 自己精製(Self-Refinement)とは、モデルが自身のレスポンスを改訂し、改善された出力を生成する能力を指す。
EVOLVEは、反復的なトレーニングを通じて自己精製の進化を導き、追跡するためのフレームワークである。
固有モデル能力のより広範な自己改善を実現するために自己改善を活用する可能性を実証する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 16:21:53 GMT)
Theoretically Grounded Framework for LLM Watermarking: A Distribution-Adaptive Approach [53.3] 大規模言語モデル(LLM)の透かしのための新しい統一的理論フレームワークを導入する。
本研究の目的は,最悪の偽陽性率(FPR)の制御とテキスト品質の歪みを維持しつつ,検出性能を最大化することである。
モデル非依存と効率性に代えて代理モデルを利用する歪みのない分散適応型透かしアルゴリズム(DAWA)を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 07:02:02 GMT)
DeepfakeBench-MM: A Comprehensive Benchmark for Multimodal Deepfake Detection [52.1] 先進的な生成AIモデルの誤用は、偽化データの拡散をもたらした。
Mega-MMDFはマルチモーダルディープフェイク検出のための大規模で多種多様で高品質なデータセットである。
DeepfakeBench-MMは、マルチモーダルディープフェイク検出のための最初の統一ベンチマークである。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 10:40:52 GMT)
A Framework for Quantifying How Pre-Training and Context Benefit In-Context Learning [52.1] 現実的な設定のクラスにおいて,ICLの性能を解析するための新しいフレームワークを提案する。
我々は、ICL性能と文脈長、および事前訓練と問合せタスク分布のKL分散の正確な関係を導出する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 09:21:29 GMT)
Semi-Supervised Learning under General Causal Models [51.9] 半教師付き学習(SSL)は、ラベル付きデータと非ラベル付きデータの両方を使用して機械学習モデルをトレーニングすることを目的としている。
本稿では、変数が柔軟な因果関係を持つ一般的な因果関係モデルで動作するフレームワークを提案する。
学習した因果生成モデルは、より正確な予測モデルをトレーニングするための合成ラベル付きデータを生成することができる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 07:46:38 GMT)
LLM-based Fusion of Multi-modal Features for Commercial Memorability Prediction [51.6] 本稿では,MediaEval 2025ワークショップにおける「記憶可能性:映画と商業の記憶可能性」の課題の一環として,商業的(ブランド的)記憶可能性の予測について述べる。
本稿では,マルチモーダルプロジェクションにより事前計算された視覚的(ViT)とテキスト的(E5)機能を統合したGemma-3 LLMバックボーンを用いたマルチモーダル融合システムを提案する。
その結果, LLM ベースシステムでは, ベースラインと比較して, 最終テストセット上での強靭性と一般化性能が向上していることがわかった。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:51:52 GMT)
Diffusion Beats Autoregressive in Data-Constrained Settings [50.6] 自己回帰(AR)モデルは長い間、大きな言語モデルのランドスケープを支配してきた。
近年,ARモデルよりもアドバンテージが低いものの,拡散型言語モデルが将来性のある選択肢として浮上している。
本研究では,限られたデータ上で繰り返し学習を行うデータ制約付き環境で,マスク拡散モデルについて系統的に研究する。
我々の結果は、データが計算ではなくボトルネックである場合、拡散モデルは標準的なARパラダイムに代わる魅力的な代替手段となることを示唆している。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 22:38:20 GMT)
MIBP-Cert: Certified Training against Data Perturbations with Mixed-Integer Bilinear Programs [50.4] トレーニング中のデータエラー、汚職、中毒攻撃は、現代のAIシステムの信頼性に大きな脅威をもたらす。
混合整数双線形プログラミング(MIBP)に基づく新しい認証手法MIBP-Certを紹介する。
摂動データや操作データを通じて到達可能なパラメータの集合を計算することで、可能なすべての結果を予測することができ、堅牢性を保証することができる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 11:06:59 GMT)
MAGIC-Talk: Motion-aware Audio-Driven Talking Face Generation with Customizable Identity Control [48.9] MAGIC-Talkは、カスタマイズ可能な会話顔生成のためのワンショット拡散ベースのフレームワークである。
ReferenceNetはIDを保存し、テキストプロンプトによるきめ細かい顔の編集を可能にする。
AnimateNetは構造化された動き前処理を用いて動きコヒーレンスを向上させる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 19:49:31 GMT)
Training-Free Safe Denoisers for Safe Use of Diffusion Models [48.7] 強力な拡散モデル(DM)は、安全でない作業用コンテンツ(NSFW)を生成したり、忘れられたい個人の著作権のある資料やデータを生成するためにしばしば誤用される。
我々は,データ分布の否定領域を回避しつつ,高品質なサンプルを生成する実用的なアルゴリズムを開発した。
これらの結果は、DMをより安全に使用するための、トレーニング不要の安全なデノイザーの大きな可能性を示唆している。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:20:04 GMT)
EchoMind: An Interrelated Multi-level Benchmark for Evaluating Empathetic Speech Language Models [47.4] 音声言語モデル(SLM)は、音声言語理解において大きな進歩を遂げている。
SLMが非語彙的声道を完全に知覚できるかどうかは不明であるが、感情的・文脈的要因の双方に合致する共感に反応する。
共感的対話の認知過程をシミュレートする最初の相互関連型マルチレベルベンチマークであるEchoMindを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 17:15:56 GMT)
Variational Learning Finds Flatter Solutions at the Edge of Stability [47.3] 変分学習(VL)の暗黙的な正規化を安定性のエッジ(EoS)フレームワークを用いて解析する。
この結果は、トレーニング中に使用する後肢の形状だけでなく、後肢の形状を制御することで得られる。
本研究では,ResNet や ViT など多種多様な大規模ネットワーク上でこれらの結果を検証し,理論的結果が経験的結果と密接に一致していることを確認する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 03:59:44 GMT)
Cross-View UAV Geo-Localization with Precision-Focused Efficient Design: A Hierarchical Distillation Approach with Multi-view Refinement [47.2] クロスビュージオローカライゼーション(CVGL)により、航空画像とジオタグ付き衛星データベースとのマッチングによるUAVローカライゼーションが可能となる。
既存の方法は、リソース集約的なきめ細かい特徴抽出とアライメントに依存している。
階層的な知識伝達と多視点表現の洗練を組み合わせた資源効率の高いフレームワークであるPFED(Precision-Focused Efficient Design)を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:47:20 GMT)
Regularized Langevin Dynamics for Combinatorial Optimization [47.1] 正規化ランゲヴィンダイナミクス(英: Regularized Langevin Dynamics、RLD)は、効率的な勾配誘導型生成パラダイムである。
RLDはサンプリングされた溶液と現在の溶液の間に期待される距離を強制し、局所的なミニマを効果的に避ける。
シミュレーションアニーリング(SA)とニューラルネットワーク(NN)に基づく2つのCOソルバを開発した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 16:16:42 GMT)
Scalable Oversight via Partitioned Human Supervision [47.0] 優れた人間の専門家でさえ、単一の狭い領域でしか知識がない。
人間は弱い信号、すなわち、誤ったオプションを示す補完的なラベルを提供することができる。
我々は,フロンティアAIシステムを評価するためのスケーラブルな監視フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 02:42:03 GMT)
SARCLIP: A Vision Language Foundation Model for Semantic Understanding and Target Recognition in SAR Imagery [46.9] SARCLIPは、SARドメインに適した最初のビジョン言語基盤モデルである。
SARCLIPは、ドメイン転送戦略によって対照的な視覚言語学習アプローチを用いて訓練される。
画像テキスト検索とゼロショット分類タスクの実験は、SARCLIPの優れた性能を示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:04:50 GMT)
Towards Hierarchical Multi-Step Reward Models for Enhanced Reasoning in Large Language Models [46.8] 階層的リワードモデルと呼ばれる新しい報酬モデル手法を提案する。
個々の推論ステップと連続推論ステップを、きめ細かいレベルと粗いレベルの両方で評価する。
これは多段階推論コヒーレンスの評価に優れており、特に欠陥のあるステップが後に自己回帰によって修正される場合である。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 06:47:24 GMT)
Understanding What Is Not Said:Referring Remote Sensing Image Segmentation with Scarce Expressions [45.0] Referring Remote Sensing Imageは、リモートセンシングイメージのインスタンスを参照式に従ってセグメントすることを目的としている。
本稿では,RRSISのためのWREL(Weakly Referring Expression Learning)という新たな学習パラダイムを提案する。
混合参照学習は、完全注釈付き参照表現を用いたトレーニングと比較して、性能ギャップに証明可能な上限をもたらすことを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 17:18:48 GMT)
torchgfn: A PyTorch GFlowNet library [44.9] 我々は、このニーズに対処することを目的としたPyTorchライブラリであるTorchgfnを紹介します。
その中核的な貢献は、環境、ニューラルネットワークモジュールを扱い、目標を交換可能なコンポーネントとしてトレーニングするモジュールで分離されたアーキテクチャである。
これによってユーザは、高速なプロトタイピングと新しい研究を容易にする、シンプルだが強力なAPIをユーザに提供する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 19:56:42 GMT)
Far from the Shallow: Brain-Predictive Reasoning Embedding through Residual Disentanglement [44.0] 現代の大規模言語モデル(LLM)は、言語に対する神経反応をモデル化するためにますます使われている。
彼らの内部表現は極めて「絡み合っている」ものであり、語彙、構文、意味、推論に関する情報を混ぜている。
この絡み合いは、言語学的に浅い特徴に対する従来の脳のコード解析に偏っている。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 22:46:26 GMT)
Ming-UniAudio: Speech LLM for Joint Understanding, Generation and Editing with Unified Representation [43.3] 本稿では,音声理解,生成,編集を統一する新しいフレームワークを提案する。
統合されたモデルの中核は、意味的および音響的特徴を効果的に統合する最初の連続的トークン化ツールであるMingTok-Audioである。
この統合された連続音声トークン化手法に基づいて,生成能力と理解能力のバランスをとる言語モデルMing-UniAudioを開発した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 17:55:34 GMT)
GS-ProCams: Gaussian Splatting-based Projector-Camera Systems [43.1] プロジェクタカメラシステム(ProCams)のための最初のガウススプラッティングベースのフレームワークであるGS-ProCamsを紹介する。
GS-ProCamsはビューに依存しないが、プロジェクションマッピング(PM)の効率を大幅に向上させる
また、トレーニングにはGPUメモリの1/10しか使用せず、推論速度の900倍高速である。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:03:24 GMT)
OFFSIDE: Benchmarking Unlearning Misinformation in Multimodal Large Language Models [42.3] MLLMにおける誤情報アンラーニングを評価するための新しいベンチマークであるOFFSIDEを紹介する。
このデータセットは80人のプレイヤーのための15.68Kレコードを含み、忘れることの有効性、一般化、実用性、堅牢性を評価するための4つのテストセットを備えた包括的なフレームワークを提供する。
Offsideは、選択的アンラーニングや修正的再ラーニングといった高度な設定をサポートしており、重要なのは、一助的アンラーニングだ。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:05:30 GMT)
FAPO: Flawed-Aware Policy Optimization for Efficient and Reliable Reasoning [42.2] 検証可能な報酬付き強化学習(RLVR)は、大規模言語モデル(LLM)の推論能力を高めるための有望なパラダイムとして登場した。
欠陥陽性のロールアウトに対して,パラメータフリーの報酬ペナルティを示すFlawed-Aware Policy Optimization (FAPO)を提案する。
FAPOは広い領域で有効であり、トークン予算を増やすことなく、結果の正しさ、プロセスの信頼性、トレーニング安定性を向上させる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:49:38 GMT)
Rethinking and Exploring String-Based Malware Family Classification in the Era of LLMs and RAG [41.0] Family-Specific String (FSS) 機能は、ファミリー分類を容易にするために、Retrieval-Augmented Generation (RAG) と同様の方法で利用できる。
本研究では,67のマルウェア群から4,347件のサンプルを対象とし,2500万以上の文字列を抽出,解析し,異なる設計選択の影響を評価するための詳細なアブレーション研究を行う。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 15:01:13 GMT)
WaveCastNet: Rapid Wavefield Forecasting for Earthquake Early Warning via Deep Sequence to Sequence Learning [39.9] WaveCastNetは、畳み込み長表現型メモリアーキテクチャをシーケンスからシーケンスへの予測フレームワークに統合する。
空間次元と時間次元の重みを共有することで、WaveCastNetはトランスフォーマーのようなリソース集約モデルよりもパラメータを著しく少なくする。
サンフランシスコ・ベイエリアのシミュレーションデータを用いて, 破壊的な地盤運動の強度とタイミングをリアルタイムで予測する能力を示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 18:54:43 GMT)
Reasoning is Periodicity? Improving Large Language Models Through Effective Periodicity Modeling [39.7] 本稿では、FANformerを導入し、FAN(Fourier Analysis Network)をアテンション機構に適応させ、効率的な周期性モデリングを実現する。
モデルサイズのスケールアップやトークンのトレーニングでは,FANformerがTransformerより一貫して優れています。
トレーニング済みのFANformer-1Bは、同様のモデルパラメータやトレーニングトークンを持つオープンソースのLLMと比較して、ダウンストリームタスクが大幅に改善されている。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 19:43:00 GMT)
$\text{E}^2\text{Rank}$: Your Text Embedding can Also be an Effective and Efficient Listwise Reranker [39.6] 本稿では,単一のテキスト埋め込みモデルを拡張して,高品質な検索とリストワイズを両立させるシンプルな統合フレームワークである$textE2textRank$を提案する。
この結果から,単一の埋め込みモデルにより検索と再ランクを効果的に統一し,計算効率と競合ランキングの精度を両立させることができることが示唆された。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 16:04:48 GMT)
Contextual Tokenization for Graph Inverted Indices [38.6] CORGIIは、効率的な逆リストへの離散トークンマッピングを用いた高密度グラフ表現のインデクサである。
私たちは、グラフ上のトークン'の古典的で固定されたインパクトウェイトを、データ駆動でトレーニング可能なインパクトウェイトで置き換えます。
我々の知る限り、CORGIIは効率的な逆リストへの離散トークンマッピングを用いた高密度グラフ表現の最初のインデクサである。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 01:38:16 GMT)
Inductive Transfer Learning for Graph-Based Recommenders [38.4] グラフに基づく推薦モデルであるNBF-Recを提案する。
本手法は,映画,音楽,eコマース,位置情報チェックインを対象とする実世界の7つのデータセットに対して評価する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 19:07:41 GMT)
Visionary-R1: Mitigating Shortcuts in Visual Reasoning with Reinforcement Learning [37.2] 我々は視覚言語モデル(VLM)を訓練し、強化学習と視覚質問応答ペアを通して画像データに基づく推論を行う。
我々のモデルであるVisionary-R1は、複数の視覚的推論ベンチマークにおいて、強力なマルチモーダルモデルよりも優れています。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:33:58 GMT)
Curious Causality-Seeking Agents Learn Meta Causal World [37.2] textbfMeta-Causal Graphを世界モデルとして紹介する。
単一のMeta-Causal Graphは複数の因果部分グラフで構成され、それぞれがメタ状態によってトリガーされる。
本手法は因果ダイナミクスのシフトを頑健に捉え,前例のない文脈に効果的に一般化する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 03:16:17 GMT)
AutoVLA: A Vision-Language-Action Model for End-to-End Autonomous Driving with Adaptive Reasoning and Reinforcement Fine-Tuning [37.2] Vision-Language-Action(VLA)モデルは、エンドツーエンドの自動運転を約束している。
現在のVLAモデルは、物理的に実現不可能なアクション出力、複雑なモデル構造、あるいは不要に長い推論に苦しむ。
本稿では,単一自己回帰生成モデル内での推論と行動生成を統一する新しいVLAモデルであるAutoVLAを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:23:58 GMT)
UltraVoice: Scaling Fine-Grained Style-Controlled Speech Conversations for Spoken Dialogue Models [37.1] 我々は,複数のきめ細かい音声スタイル制御のために開発された,最初の大規模音声対話データセットであるUltraVoiceを紹介する。
SLAM-OmniやVocalNet on UltraVoiceのような微調整型の先行モデルは、その微調整性を大幅に向上させる。
URO-Benchベンチマークでは、微調整されたモデルでは、コア理解、推論、会話能力が大幅に向上した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 09:06:55 GMT)
Tools are under-documented: Simple Document Expansion Boosts Tool Retrieval [36.9] 大規模言語モデル(LLM)は、最近、ツールの使用において強力な能力を示しているが、ツール検索の進歩は、不完全で異質なツールドキュメントによって妨げられている。
我々は、より効果的なツール検索を可能にするために、構造化されたフィールドでツールドキュメントを体系的に強化する新しいベンチマークとフレームワークであるTool-DEを紹介する。
ツール検索に適した2つのモデルを開発する。ツールエンベッド(Tool-Embed)とツールランク(Tool-Rank)である。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:17:01 GMT)
Sub-microsecond Transformers for Jet Tagging on FPGAs [36.4] 本稿では,最新の高エネルギー物理ベンチマークの競合性能を実現するFPGA上でのサブマイクロ秒変圧器の実装について述べる。
トランスフォーマーは、CERN Large Hadron Collider (LHC)でのジェットタグ付けを含む、現代の機械学習アプリケーションにおける複数のタスクにおいて、例外的なパフォーマンスを示している。
この研究は、高輝度LHCの次世代トリガーシステムを進歩させ、高エネルギー物理学などにおけるリアルタイム応用にトランスフォーマーを使用することを可能にした。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 23:13:00 GMT)
Breaking Agent Backbones: Evaluating the Security of Backbone LLMs in AI Agents [36.2] 大規模言語モデル(LLM)を利用したAIエージェントが大規模にデプロイされているが、バックボーンLLMの選択がエージェントのセキュリティに与える影響について、体系的な理解が欠如している。
脅威スナップショット: 脆弱性が現れるエージェントの実行フロー内の特定の状態を分離するフレームワーク。
194331のユニークなクラウドソース攻撃に基づくセキュリティベンチマークである$operatornameb3$ベンチマークを構築するために,このフレームワークを適用した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 10:36:42 GMT)
Mitigating Distribution Shift in Model-based Offline RL via Shifts-aware Reward Learning [36.0] 本稿では,問題をモデルバイアスとポリシーシフトという2つの基本要素に分解する包括的分析を行う。
我々の理論的および実証的研究は、これらの要因がどのように価値推定と政策最適化を歪めているかを明らかにする。
我々は、バニラ報酬を改良し、価値学習を洗練させ、政策訓練を促進する統一確率的推論フレームワークを通じて、新しいシフトアウェア報酬を導出する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 15:12:05 GMT)
Through the River: Understanding the Benefit of Schedule-Free Methods for Language Model Training [35.8] 本研究では, 損失景観の「川」構造を, 崩壊相や補助平均化を伴わず, 効果的にナビゲート可能であることを示す。
本研究では,大きなバッチサイズにおいて,運動量の向上と性能向上を図ったSFの改良版を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 17:29:54 GMT)
EuroSpeech: A Multilingual Speech Corpus [35.8] 議会記録から音声データセットを構築するためのスケーラブルなパイプラインを提案する。
このパイプラインを22の欧州議会の録音に適用し、61万時間以上の一致した音声セグメントを抽出します。
データセット上で既存のASRモデルを微調整した場合,平均41.8%の単語誤り率をベースラインで削減する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 18:50:17 GMT)
Learning Without Augmenting: Unsupervised Time Series Representation Learning via Frame Projections [35.7] ラベル付きデータなしで表現を学習するための強力なパラダイムとして、自己教師型学習が登場した。
ほとんどのSSLアプローチは、表現学習のための多様なビューを生成するために、強力で確立された手作りのデータ拡張に依存している。
正規のベースとオーバーコンプリートフレームを用いてビューを生成することにより、拡張を置き換える教師なし表現学習手法を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 12:36:29 GMT)
LooGLE v2: Are LLMs Ready for Real World Long Dependency Challenges? [35.4] LooGLE v2は、大規模言語モデルの現実世界のアプリケーションやシナリオにおける長期コンテキスト能力を評価するために設計された、新しいベンチマークである。
私たちのベンチマークは、16kから2Mのトークンから、法律、ファイナンス、ゲーム、コードの領域まで、自動的に収集された現実世界の長文で構成されています。
評価結果から,ベストパフォーマンスモデルでさえ,ベンチマークの総合スコアは59.2%に過ぎなかった。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 06:14:19 GMT)
Measurement-induced Lévy flights of quantum information [35.3] 隣接地におけるフラストレーションのある局所測定対象の1次元自由フェルミオンモデルについて検討する。
最大配向については、測定誘起準粒子崩壊速度の消滅により超拡散挙動が生じる。
本研究は, 地域のハミルトン人を対象に, 複雑なフラクタルスケーリングの絡み合わせをいかに生み出すかを示すものである。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 07:00:38 GMT)
SAO-Instruct: Free-form Audio Editing using Natural Language Instructions [34.4] 本稿では,任意の自然言語命令を用いて音声クリップを編集できるモデルSAO-Instructを紹介する。
本モデルでは,実機内での音声クリップや未表示の編集指示をうまく一般化する。
我々は,SAO-Instructが客観的な測定値の競合性能を達成し,主観的聴取実験において他の音声編集手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 18:57:16 GMT)
DynamicVL: Benchmarking Multimodal Large Language Models for Dynamic City Understanding [33.9] DVL-Suiteはリモートセンシング画像による長期都市動態解析のための総合的なフレームワークである。
このスイートは、2005年から2023年まで、米国の42の主要都市にまたがる14,871の高解像度(1.0m)のマルチ時間画像で構成されています。
DVL-Benchには、基本的な変化検出(ピクセルレベル)から定量的分析(地域レベル)、総合的な都市物語(シーンレベル)までの6つの都市理解タスクが含まれている。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:05:47 GMT)
Frustratingly Easy Task-aware Pruning for Large Language Models [33.8] 大規模言語モデル(LLM)に対する単純かつ効果的なプルーニング手法を提案する。
本フレームワークは,汎用校正データとタスク固有の校正データの両方を用いて,重要度を算出している。
広く使われているベンチマークの実験は、我々のアプローチが効果的であり、一貫してベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 02:09:22 GMT)
Variational Polya Tree [32.7] 本稿では,後方分布の計算に変分推論を用いる変分ポリアツリー(VPT)モデルを提案する。
実データと画像の両方でモデル性能を評価し,他の最先端の深部密度推定手法との競合性を実証した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 12:23:22 GMT)
RoboSVG: A Unified Framework for Interactive SVG Generation with Multi-modal Guidance [32.6] RoboSVGは、テキスト、ビジュアル、数値信号でガイドされる対話的なSVGを生成するための統一されたフレームワークである。
このフレームワークをサポートするために、100万のサンプルからなる大規模データセットであるRoboDrawを構築した。
RoboSVGはタスク間のクエリコンプライアンスと視覚的忠実性を向上し、汎用SVG生成における新しい最先端技術を確立する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:57:08 GMT)
Self-Calibrated Consistency can Fight Back for Adversarial Robustness in Vision-Language Models [31.9] 自己キャリブレーション・コンシスタンシー(Self-Calibrated Consistency)は、敵の攻撃に対する効果的なテストタイム防衛である。
SCCは精度を維持しながら、CLIPのゼロショットロバスト性を一貫して改善する。
これらの知見は、CLIPから逆向きに堅牢なパラダイムを確立する大きな可能性を浮き彫りにした。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 18:37:12 GMT)
JiuTian Chuanliu: A Large Spatiotemporal Model for General-purpose Dynamic Urban Sensing [31.5] 本稿では,都市センシングのためのGDHME(General-purpose and Dynamic Human Mobility Embedding)というフレームワークを紹介する。
ステージ1では、GDHMEは人や地域を動的グラフ内のノードとして扱う。
自己回帰型自己教師型タスクは、汎用ノード埋め込みの学習をガイドするために特別に設計されている。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 10:04:28 GMT)
Iteratively Refined Early Interaction Alignment for Subgraph Matching based Graph Retrieval [30.7] 我々は、いくつかの技術革新に基づく早期相互作用グラフニューラルネットワーク(GNN)であるIsoNet++を紹介する。
まず、2つの入力グラフ内および横断するメッセージを渡すことで、すべてのノードの埋め込みを計算する。
次に、このアライメントを複数のラウンドで遅延的に更新します。
第3に、IsoNet++はノード対パートナーインタラクションという新しい概念を取り入れている。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:24:10 GMT)
Which LLM Multi-Agent Protocol to Choose? [30.2] タスク成功、エンドツーエンドのレイテンシ、メッセージまたはバイトのオーバーヘッド、障害時の4つの測定可能な軸に沿ってエージェントプロトコルを比較するベンチマークであるProtocolBenchを紹介します。
ProtocolBenchでは、プロトコルの選択がシステムの振る舞いに大きく影響します。
プロトコルコンプリート(Protocol completion)は、要求と実行時信号からシナリオ毎のプロトコルを選択する、学習可能なプロトコルルータである。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:33:41 GMT)
PhysGym: Benchmarking LLMs in Interactive Physics Discovery with Controlled Priors [30.0] textscPhysGymは、LSMベースの科学的推論を厳格に評価するための、新しいベンチマークスイートとシミュレーションプラットフォームである。
textscPhysGymの主な貢献は、エージェントに提供された事前知識のレベルを高度に制御することにある。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 07:14:27 GMT)
ChromFound: Towards A Universal Foundation Model for Single-Cell Chromatin Accessibility Data [29.9] シークエンシング(scATAC-eq)を用いたトランスポラーゼ-クロマチンの単細胞測定法
ChromFound は scATAC-eq 用に設計された基礎モデルである。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 14:29:28 GMT)
Spurious-Aware Prototype Refinement for Reliable Out-of-Distribution Detection [29.6] 現実世界のアプリケーションにおける機械学習モデルの信頼性と安全性を確保するためには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
SPRODは,未知の急激な相関関係によって生じる課題に明示的に対処する,プロトタイプベースのOOD検出手法である。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 12:57:19 GMT)
Jarvis: Towards Personalized AI Assistant via Personal KV-Cache Retrieval [29.6] Jarvisは、パーソナルなKVキャッシュ検索を通じてパーソナライズされたAIアシスタントのための革新的なフレームワークである。
我々は、同じ画像パッチマイニングパイプラインで構築されたきめ細かいベンチマークを導入する。
Jarvis氏は、複数のデータセットにまたがる視覚的質問応答とテキストのみのタスクにおいて、最先端の結果を達成する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 17:28:05 GMT)
Multi-Modal Masked Autoencoders for Learning Image-Spectrum Associations for Galaxy Evolution and Cosmology [29.1] 我々は134,533個の銀河画像(HSC-PDR2)とスペクトル(DESI-DR1)のデータセットを構築した。
マルチモーダルマスク付きオートエンコーダを用いて、画像とスペクトルの両方を共有表現に埋め込む。
このモデルを用いて、重くマスキングされたデータからのスペクトルと画像再構成と、画像のみからの赤方偏移の3つのアプリケーションをテストする。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:29:13 GMT)
Conjugate Relation Modeling for Few-Shot Knowledge Graph Completion [29.0] 知識グラフ補完は、限られたサポートサンプルから欠落したトリプルを推測する。
共役関係モデリングのための新しいフレームワーク(CR-FKGC)を提案する。
3つのベンチマーク実験により,本手法は最先端手法よりも優れた性能を示した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 12:38:23 GMT)
Data Matters Most: Auditing Social Bias in Contrastive Vision Language Models [28.9] CLIPとOpenCLIPを比較することで、モデルサイズ、トレーニングデータスケール、トレーニングデータソースの3つの設計要素を分離します。
また、Bias Prompts、Prompt Array、SANERの3つのポストホック、テストタイムのデバイアス戦略を評価します。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:51:41 GMT)
Breaking Language Barriers or Reinforcing Bias? A Study of Gender and Racial Disparities in Multilingual Contrastive Vision Language Models [28.9] M-CLIP, NLLB-CLIP, CAPIVARA-CLIP, and the debiased SigLIP-2。
人種と性別の偏見を定量化し、ステレオタイプ増幅を測定する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 21:27:28 GMT)
LyapLock: Bounded Knowledge Preservation in Sequential Large Language Model Editing [28.9] 現在の位置情報編集アプローチは、逐次編集中に徐々にパフォーマンスが低下している。
textbfLyapLockは、長期制約付きプログラミングを、効率的な解法のために、段階的に抽出可能なサブプロブレムに分解するために提案されている。
実験結果から,本フレームワークは汎用性を安定させ,SOTAベースラインよりも平均編集効率を11.89%向上させるとともに,1万回以上の編集能力に拡張可能であることがわかった。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:46:25 GMT)
Imbalanced Gradients in RL Post-Training of Multi-Task LLMs [28.8] 大規模言語モデルのマルチタスク後トレーニングは、通常、異なるタスクからデータセットを混合し、それらを共同で最適化することで実行される。
本稿では,この仮定がRL後の学習において失敗することを示す。
大規模な段階的なタスクは、小規模段階のタスクと同じような、あるいははるかに低い学習ゲインを達成することができる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 15:22:58 GMT)
ATLAS: Actor-Critic Task-Completion with Look-ahead Action Simulation [28.5] ATLASは、認知空間におけるこれらの行動の結果をシミュレートすることで、環境のモデルに基づく計画を作成するメモリ拡張エージェントである。
WebArena-Liteベンチマークでは、これまで公表された最先端技術の53.9%の成功率と比較して63%の成功率を達成した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 16:03:39 GMT)
STATUS Bench: A Rigorous Benchmark for Evaluating Object State Understanding in Vision-Language Models [28.4] 対象状態の微妙な変化を理解するための視覚言語モデルの有効性を厳格に評価する最初のベンチマークであるSTATUS Benchを紹介する。
STATUS Benchは、オブジェクト状態識別(OSI)、画像検索(IR)、状態変化識別(SCI)の3つのタスクを同時に実行するためにVLMを必要とする。
さらに,1300万の半自動記述からなる大規模トレーニングデータセットSTATUS Trainを導入する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:04:28 GMT)
If You Want to Be Robust, Be Wary of Initialization [28.2] グラフニューラルネットワーク(GNN)は、グラフ関連タスクのスペクトルにわたって顕著なパフォーマンスを示している。
しかし、敵の摂動に対する脆弱性については懸念が続いている。
本稿では,初期化戦略と敵の摂動に対するネットワークのレジリエンスの関連性を橋渡しする理論的枠組みを提案する。
分析の結果,初期重み,トレーニングエポック数,モデルの脆弱性の直接的な関係が明らかになった。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 12:28:12 GMT)
SceneWeaver: All-in-One 3D Scene Synthesis with an Extensible and Self-Reflective Agent [28.1] SceneWeaverは、ツールベースの反復改善を通じて多様なシーン合成パラダイムを統合するフレームワークである。
セマンティックな矛盾を特定し、ターゲットとするツールを呼び出し、連続したイテレーションで環境を更新できる。
多様な指示で複雑なシーンを効果的に一般化し、汎用的な3D環境生成への一歩を踏み出した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:10:24 GMT)
Semantic Surgery: Zero-Shot Concept Erasure in Diffusion Models [27.7] 拡散プロセスの前にテキスト埋め込みを直接操作する,概念消去のための新しいトレーニングフリーゼロショットフレームワークを提案する。
我々は、局所性と画質を保ちながら、優れた完全性と堅牢性を達成する。
この堅牢性により、我々のフレームワークは脅威検出システムとして機能し、より安全なテキスト・画像生成のための実用的なソリューションを提供する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 22:04:17 GMT)
FaithUn: Toward Faithful Forgetting in Language Models by Investigating the Interconnectedness of Knowledge [27.6] 本研究では,非学習手法が相互接続した知識の消去に失敗する現象を指す「表面的非学習」という概念を新たに定義する。
この定義に基づいて、実世界の知識QA設定における未学習の忠実度を分析し評価する新しいベンチマーク、FaithUnを導入する。
我々は,知識関連ニューロンのみを更新し,忠実な未学習を実現する新しい未学習手法KLUEを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 23:55:34 GMT)
Beyond Pipelines: A Survey of the Paradigm Shift toward Model-Native Agentic AI [27.2] エージェントAIの急速な進化は、人工知能の新しいフェーズを象徴している。
この調査はエージェントAI構築におけるパラダイムシフトをトレースする。
それぞれの能力が外部スクリプトモジュールからエンドツーエンドの学習行動へとどのように進化したかを調べる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 09:00:38 GMT)
Encoder-Decoder Diffusion Language Models for Efficient Training and Inference [27.0] 本稿では,特殊なトレーニングアルゴリズムとサンプリングアルゴリズムを備えたアーキテクチャからなる,効率的な拡散デコーダ(E2D2)のフレームワークを提案する。
E2D2は、生成品質と、要約、翻訳、数学的推論タスクにおける推論との間の優れたトレードオフを実現する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 22:05:22 GMT)
Mitigating Attention Sinks and Massive Activations in Audio-Visual Speech Recognition with LLMS [27.0] 大型言語モデル(LLM)における注意シンクと大規模アクティベーションに関する研究
我々は,BOSと他のトークンとのコサイン類似性を低減し,中間シンクと大規模な活性化を効果的に緩和する単純なデコリレーション損失を導入する。
提案手法は,低サンプリングレートで安定に保ちながら,高い音声・視覚特性下での単語誤り率(WER)を向上する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 09:44:20 GMT)
Adaptive Testing for LLM Evaluation: A Psychometric Alternative to Static Benchmarks [26.9] ATLASは大規模言語モデルの適応テストフレームワークである。
フィッシャー情報誘導項目選択によるモデル能力の推定を行う。
測定精度を維持しながら90%の項目削減を実現している。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 03:54:12 GMT)
On the Convergence of Moral Self-Correction in Large Language Models [26.7] 大きな言語モデル(LLM)は、そのように指示されたときの応答を改善することができる。
LLMは、内在的な自己補正と呼ばれるプロセスである応答品質を改善するために、内部知識に頼らなければならない。
我々は,多ラウンド相互作用による性能収束という,本質的な自己補正のキーとなる特徴を明らかにする。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 19:28:05 GMT)
Gated Integration of Low-Rank Adaptation for Continual Learning of Large Language Models [26.6] 大規模言語モデル(LLM)には継続学習(CL)が不可欠である
低ランク適応のゲート統合(GainLoRA)と呼ばれる新しい手法を提案する。
GainLoRAは新しいタスクごとに新しいLoRAブランチを拡張し、新しい古いLoRAブランチを統合するためのゲーティングモジュールを導入した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 02:08:11 GMT)
From Contextual Combinatorial Semi-Bandits to Bandit List Classification: Improved Sample Complexity with Sparse Rewards [26.1] 我々は、入力コンテキストを、可能なアクションの集合の$m$のサブセットにマッピングするコンテキスト半帯域の問題を研究する。
文脈的包帯の原型的応用により、我々は$s$スパース体制に焦点をあてる。
本フレームワークは,二項報酬ベクトルの特別な場合として,帯域フィードバックを用いたリスト多クラス分類問題を一般化する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 12:38:06 GMT)
Hopfield-Fenchel-Young Networks: A Unified Framework for Associative Memory Retrieval [25.7] ホップフィールドネットワークのような連想記憶モデルは、メモリ容量の進歩とトランスフォーマーにおける自己注意とのつながりにより、新たな関心を集めている。
本研究では,これらのモデルをより広範なエネルギー関数群に一般化する統合フレームワークであるHopfield-Fenchel-Youngネットワークを導入する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:02:18 GMT)
Scaling Down, Serving Fast: Compressing and Deploying Efficient LLMs for Recommendation Systems [25.7] 小型言語モデル(SLM)の学習と展開のための総合的な洞察セットを提示する。
我々は、構造化プルーニングと量子化による知識蒸留とモデル圧縮の2つの重要な技術に焦点を当てる。
大規模なプロフェッショナルなソーシャルネットワークプラットフォームにおけるさまざまなユースケースに対するこれらのテクニックの影響を詳述し、デプロイメントのレッスンを共有します。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 23:07:43 GMT)
PIP-LLM: Integrating PDDL-Integer Programming with LLMs for Coordinating Multi-Robot Teams Using Natural Language [25.5] PIP-LLMはPDDLベースのチームレベルの計画計画(IP)ベースのロボットレベルの計画からなる言語ベースの調整フレームワークである。
PIP-LLMは計画成功率を向上し、最大および平均旅行コストを削減し、最先端のベースラインに比べてロードバランシングが向上することを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 18:37:00 GMT)
CHOIR: Collaborative Harmonization fOr Inference Robustness [25.5] パーソナライズされた大規模言語モデル(LLM)は、パーソナライズされたコンテキスト認識推論を可能にする様々な役割を採用できる。
単純な代名詞変化のようなペルソナの小さな人口変動は、推論の軌跡を変えることができ、正しい答えの発散につながる。
我々は、複数のペルソナ条件の推論信号を統一的な予測に調和させるテストタイムフレームワークであるCHOIRを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 01:20:24 GMT)
Prediction-Powered Semi-Supervised Learning with Online Power Tuning [25.2] 予測パワー推論(英: Prediction-Powered Inference, PPI)は、最近提案されたパラメータ推定のための統計的推論手法である。
本研究は、モデルトレーニングのための半教師付き学習(SSL)にコアアイデアを拡張し、新しい非バイアス勾配推定器を導入する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 09:01:02 GMT)
A Simple but Effective Elaborative Query Reformulation Approach for Natural Language Recommendation [24.9] 自然言語(NL)推奨システムは,自由形式のユーザクエリや項目記述から関連する項目を検索することを目的としている。
既存のシステムは、広範または間接的なユーザ意図を表す難しいクエリを解釈するのに苦労する、高密度検索(DR)に依存していることが多い。
EQR(Elaborative Subtopic Query Reformulation)は,広さと深さを組み合わせた大規模言語モデルに基づくQR手法である。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 21:25:59 GMT)
FairJudge: MLLM Judging for Social Attributes and Prompt Image Alignment [24.7] 命令追従型マルチモーダル LLM をフェアジャッジとして扱う軽量プロトコルである FairJudge を提案する。
これは[-1, 1]にマップされた説明指向のルーリックとアライメントし、判定をクローズドなラベル集合に制約する。
我々は、FairFace、PaTA、FairCoTで性別、人種、年齢を評価し、宗教、文化、障害者に拡張し、IdenProf、FairCoT-Professions、そして新しいDIVERSIFY-Professionsで職業の正当性と整合性を評価する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:43:48 GMT)
Last Iterate Convergence in Monotone Mean Field Games [24.5] 平均場ゲーム(MFG)は、無限個のエージェント間の相互作用をモデル化する。
既存のアルゴリズムは厳密な単調性を必要とするか、平均的な反復の収束を保証するだけである。
本稿では,少数のMDステップによるPP更新を概ね実装した近似プロキシ・ポイント(mathtAPP$)アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 09:53:30 GMT)
Unlabeled Data vs. Pre-trained Knowledge: Rethinking SSL in the Era of Large Models [24.3] 半教師付き学習(SSL)は、ラベルのないデータを活用することにより、データラベリングプロセスのコストを軽減する。
事前トレーニングされたモデルを活用することは、下流タスクのラベル不足に対処するための有望な方法になる。
ラベル付きデータが制限されている場合、ラベルなしのデータや事前訓練済みのモデルに頼るべきか?
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:49:40 GMT)
Retraining-Free Merging of Sparse MoE via Hierarchical Clustering [24.3] 本稿では, 疎活性化型エキスパート混合(HC-SMoE)のための階層クラスタリングについて紹介する。
HC-SMoEは、パラメータ還元のためのタスクに依存しないエキスパートマージフレームワークである。
我々は、QwenやMixtralを含む最先端モデルにおけるHC-SMoEの有効性を示すために、複数のゼロショット言語タスクの理論的解析と評価を行う。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:04:09 GMT)
Improving the Distributional Alignment of LLMs using Supervision [24.2] 本研究は, 言語モデルアライメントの簡易化により, 言語モデルアライメントが向上し, 多様な集団群との整合性が向上することを示す。
多様な集団によるLSMの分布的アライメントに関する知見を提供する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 23:38:24 GMT)
TianQuan-S2S: A Subseasonal-to-Seasonal Global Weather Model via Incorporate Climatology State [23.9] 正確なサブシーズン・ツー・シーソン(S2S)予測は農業、エネルギー生産、緊急管理において決定に不可欠である。
近年のデータ駆動型研究は有望な結果を示しているが、その性能は気候状態の不十分な取り込みとモデル劣化傾向によって制限されている。
本研究では,気象予報モデルであるTianQuan-S2Sを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 11:45:48 GMT)
OEUVRE: OnlinE Unbiased Variance-Reduced loss Estimation [23.8] 我々は,現在および過去の時間ステップで学習した関数に対して,各入力サンプルを評価する推定器であるOEUVREを紹介する。
アルゴリズムの安定性は、多くのオンライン学習者が満足する特性であり、最適な更新、一貫性の証明、収束率、そして推定器の集中バウンドである。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 16:41:17 GMT)
MECD+: Unlocking Event-Level Causal Graph Discovery for Video Reasoning [23.3] 新しいタスクとデータセットであるMulti-Event Causal Discovery (MECD)を導入する。
時系列的に長いビデオに分散したイベント間の因果関係を明らかにすることを目的としている。
我々は,効率的なマスクベースの事象予測モデルを用いて,Granger Causality法にインスパイアされた新しいフレームワークを考案した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:45:17 GMT)
Bag-of-Word-Groups (BoWG): A Robust and Efficient Loop Closure Detection Method Under Perceptual Aliasing [23.1] Bag-of-Word-Groups (BoWG) は、精度、堅牢性、計算効率を向上する新しいループクロージャ検出法である。
本稿では,視覚的単語の空間的共起と近接を捉え,オンライン辞書を構築するための単語群を提案する。
また,Bicocca25bデータセットの17,565画像に対して,平均処理時間は16ミリ秒である。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:31:01 GMT)
A Comprehensive Dataset for Human vs. AI Generated Text Detection [23.0] ニューヨーク・タイムズ紙の記事から58,000件以上のテキストサンプルからなる包括的データセットを提案する。
このデータセットは、オリジナルの記事をプロンプトとして抽象化し、完全な人間による物語を提供する。
AI生成テキストと人書きテキストを区別し、AIテキストを8.92%の精度で生成モデルに関連付けるという2つの重要なタスクのベースライン結果を確立します。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 23:50:52 GMT)
Beyond Ten Turns: Unlocking Long-Horizon Agentic Search with Large-Scale Asynchronous RL [22.8] ASearcherは、検索エージェントの大規模RLトレーニングのためのオープンソースプロジェクトである。
ASearcher-Web-QwQは、xBenchで51.1、GAIAで58.7のAvg@4スコアを獲得し、既存のオープンソース32Bエージェントを上回っている。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 07:06:02 GMT)
Differentiable Structure Learning and Causal Discovery for General Binary Data [22.6] 離散変数間の任意の依存関係をキャプチャ可能な、微分可能な構造学習フレームワークを提案する。
学習問題を最も一般的な形式で1つの微分可能な最適化タスクとして定式化する。
実験結果から,本手法は離散データの複雑な関係を効果的に捉えていることが示された。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:28:42 GMT)
A Free Probabilistic Framework for Denoising Diffusion Models: Entropy, Transport, and Reverse Processes [22.6] 自由確率の設定において拡散に基づく生成モデリングのための厳密な枠組みを開発する。
古典的微分拡散確率モデルを自由拡散過程に拡張する。
我々は,演算子値や高次元構造データを用いた生成モデリングの数学的基礎を確立する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 18:03:54 GMT)
Alias-Free ViT: Fractional Shift Invariance via Linear Attention [22.2] ビジョントランスフォーマー(ViT)はトランスフォーメーション不変ではなく、標準のコンブネットよりも小さな画像変換に敏感である。
本モデルは,画像分類における競合性能を維持し,対向翻訳に対する堅牢性の観点から,類似サイズのモデルより優れる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:28:28 GMT)
GateFuseNet: An Adaptive 3D Multimodal Neuroimaging Fusion Network for Parkinson's Disease Diagnosis [22.0] GateFuseNetは、パーキンソン病の診断のためにQSMとT1wの画像を統合した適応型3Dマルチモーダル核融合ネットワークである。
実験の結果,本手法は既存の3つの手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 03:11:26 GMT)
VADTree: Explainable Training-Free Video Anomaly Detection via Hierarchical Granularity-Aware Tree [21.7] ビデオ異常検出(VAD)は、ビデオ内の異常を特定することに焦点を当てている。
本稿では,階層的粒度木構造を利用したVADTreeを提案する。
VADTreeは、サンプルビデオセグメントの数を劇的に減らしながら、トレーニング不要な環境で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 14:36:15 GMT)
LVD-GS: Gaussian Splatting SLAM for Dynamic Scenes via Hierarchical Explicit-Implicit Representation Collaboration Rendering [21.6] 3次元ガウス散乱SLAMは空間知能における高忠実度マッピングの手法として広く用いられている。
既存の手法は、大規模でダイナミックな屋外シーンでの性能を制限する単一の表現方式に依存していることが多い。
我々は,新しいLiDAR-Visual 3D Gaussian Splatting SLAMシステムである textbfLVD-GS を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:16:39 GMT)
Single-Teacher View Augmentation: Boosting Knowledge Distillation via Angular Diversity [20.5] 知識蒸留(KD)は、大容量の高能力教師から知識を伝達することで、軽量な学生モデルを訓練することを目的としている。
近年の研究では,多様な教師の視点を活用することで,蒸留性能が著しく向上することが示されている。
そこで本研究では,教師1人に複数のブランチをアタッチすることで,多様なマルチビューを生成するKDのための,コスト効率の高い知識向上手法を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 01:41:08 GMT)
On Vanishing Gradients, Over-Smoothing, and Over-Squashing in GNNs: Bridging Recurrent and Graph Learning [20.3] グラフニューラルネットワーク(GNN)は、グラフ構造を利用してノード間で情報を伝達するモデルである。
GNNの単純な状態空間の定式化は、余分な訓練可能なパラメータコストを伴わずに、過度な平滑化と過度なスキャッシングを効果的に軽減できることを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:27:40 GMT)
Random Search Neural Networks for Efficient and Expressive Graph Learning [20.3] ランダムウォークニューラルネットワーク(RWNN)は、グラフ表現学習の有望なアプローチとして登場した。
本稿では,ランダムな検索を行ない,ノードの完全カバレッジを保証したテキストテトラノム探索ニューラルネットワーク(RSNN)を提案する。
我々の研究は、ランダムウォークに基づくアプローチの理論的および実践的な進歩を橋渡しし、スパースグラフを学習するための効率的かつ表現力のあるフレームワークを提供する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:03:54 GMT)
Toward Robust Signed Graph Learning through Joint Input-Target Denoising [20.2] 符号付きグラフニューラルネットワーク(SGNN)は、符号付きグラフと負のリンクの両方で複雑なパターンを解析するために広く採用されている。
本稿では,ロバストグラフ学習のための新しいフレームワーク RIDGE を提案する。
提案手法を4つの有意な符号付きグラフデータセット上で広範囲に検証した結果,RIDGEは各種ノイズレベル下での一般的なSGNNモデルのロバスト性を明確に向上することが示された。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 03:34:40 GMT)
Fine-Grained Preference Optimization Improves Spatial Reasoning in VLMs [19.9] 現在の視覚言語モデルは、きめ細かい空間的推論に苦慮している。
本稿では,これらの制約に対処する視覚言語推論モデルであるSpatialReasoner-R1を紹介する。
その結果,fDPOは空間品質タスクにおいて標準DPOよりも平均4.1%向上し,空間量タスクでは9.0%向上した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 22:18:43 GMT)
Once Upon an Input: Reasoning via Per-Instance Program Synthesis [19.9] PIPS(Per-Instance Program Synthesis)は、構造的フィードバックを用いて、インスタンスレベルでプログラムを生成し、洗練する手法である。
パフォーマンスをさらに向上するため、PIPSは直接推論とプログラム合成を動的に選択する信頼度基準をインスタンス毎に組み込んでいる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 21:58:33 GMT)
Windsock is Dancing: Adaptive Multimodal Retrieval-Augmented Generation [19.5] マルチモーダル大規模言語モデル(MLLM)の現実的かつ最新の応答を生成するための有望な手法として,MRAG(Multimodal Retrieval-Augmented Generation)が登場した。
既存のMRAGアプローチは、静的検索戦略、非フレキシブルなモダリティ選択、および検索された情報の準最適利用に悩まされている。
我々は、検索の必要性とモダリティの選択を判断するクエリ依存モジュールであるWindsockを導入し、計算オーバーヘッドを効果的に削減し、応答品質を向上させる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 14:36:16 GMT)
Scideator: Human-LLM Scientific Idea Generation Grounded in Research-Paper Facet Recombination [19.3] Scideatorは、ファセットベースの科学的思考のための最初の人間-LLMインタフェースである。
ユーザーが発行した科学論文から、目的、メカニズム、評価のキーフェイスを抽出する。
また、重複する文献を検索することで、アイデアの独創性を評価するのにも役立ちます。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 23:19:16 GMT)
Self-Attention Decomposition For Training Free Diffusion Editing [18.8] 制御可能性への重要なステップは、モデルの潜在表現における解釈可能な方向を特定することである。
本研究では,拡散モデルの事前学習パラメータから直接意味的編集方向を導出する解析手法を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 12:22:56 GMT)
Optimize the Unseen - Fast NeRF Cleanup with Free Space Prior [18.6] フローター」は、特にトレーニングカメラで見えない地域では、新しいビュークオリティを低下させる。
高速でポストホックなNeRFクリーニング手法として,自由空間優先を強制することで,そのようなアーティファクトを除去する手法を提案する。
提案手法は既存のNeRFクリーンアップモデルに匹敵するが, 推定時間では2.5倍高速である。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 10:48:34 GMT)
Provable Sample-Efficient Transfer Learning Conditional Diffusion Models via Representation Learning [18.5] 我々は,表現学習のレンズを通して,伝達学習条件拡散モデルのサンプル効率を理解するための第一歩を踏み出した。
本分析は,ソースタスクからの表現を十分に学習することにより,対象タスクのサンプル複雑度を大幅に低減できることを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 07:43:25 GMT)
MOSAIC: Modeling Social AI for Content Dissemination and Regulation in Multi-Agent Simulations [18.5] 生成言語エージェントがユーザの行動を予測できる新しいオープンソースのソーシャルネットワークシミュレーションフレームワークMOSAICを提案する。
このシミュレーションは、LCMエージェントと有向なソーシャルグラフを組み合わせることで、創発的偽装行動を分析し、ユーザがオンラインソーシャルコンテンツの正確性をどのように判断するかをよりよく理解する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 06:27:44 GMT)
BLaST: High Performance Inference and Pretraining using BLock Sparse Transformers [18.5] Bl)ock (a)nd (S)parse (T)ransformers (BLaST)を紹介する。
BLaST は行列乗算における最大95%の間隔と無視可能な精度損失を達成できる。
推論メモリフットプリントを4.45倍削減した16GPUのLlama 3.2の2.2倍の推論速度を示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 10:28:01 GMT)
Projection Embedded Diffusion Bridge for CT Reconstruction from Incomplete Data [18.2] 拡散ブリッジモデルは、最近、対応するフィルタバックプロジェクション(FBP)再構成からのクリーンなイメージの復元を約束している。
本稿では, 再構成された画像と観測された投影データとを整合させて, 再構成精度を向上させるために, プロジェクション埋め込み拡散ブリッジ(PEDB)を提案する。
PEDBは、スパースビュー、リミテッドアングル、切り離された投影を含む3種類の不完全データからCT再構成において高い性能を達成する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 10:00:27 GMT)
CLEANet: Robust and Efficient Anomaly Detection in Contaminated Multivariate Time Series [18.0] CLEANetは汚染時系列における堅牢で効率的な異常検出フレームワークである。
CleanetがCRTF(Contamination-Resilient Training Framework)を導入
cleanetは10の最先端ベースラインと比較して、より高いF1と81.28%低いランタイムを緩和する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 10:34:19 GMT)
Ground-Compose-Reinforce: Grounding Language in Agentic Behaviours using Limited Data [17.6] 認識と行動における接地言語は、人間や他のエージェントと対話できる位置にあるエージェントを構築する上で、言語を介して重要な課題である。
高レベルタスク仕様から直接RLエージェントを訓練するためのエンドツーエンドのニューロシンボリックフレームワークであるGround-Compose-Reinforceを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 19:50:20 GMT)
DynaCausal: Dynamic Causality-Aware Root Cause Analysis for Distributed Microservices [17.1] DynaCausalは、分散マイクロサービスシステムにおける原因分析のための動的因果認識フレームワークである。
我々は、DynaCausalが最先端の手法を一貫して超え、平均AC@1が0.63で、絶対利得が0.25から0.46であることを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 10:13:18 GMT)
Towards General Modality Translation with Contrastive and Predictive Latent Diffusion Bridge [17.0] Latent Denoising Diffusion Bridge Model (LDDBM)は、モーダル翻訳のための汎用フレームワークである。
共用ラテント空間で演算することにより、任意のモード間のブリッジを、整列次元を必要とせずに学習する。
提案手法は任意のモダリティペアをサポートし,マルチビューから3次元形状生成,画像超解像,マルチビューシーン合成など,多様なMTタスクに強く依存する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 09:13:56 GMT)
Copresheaf Topological Neural Networks: A Generalized Deep Learning Framework [16.9] 共振器トポロジカルニューラルネットワーク(CTNN)を導入する
CTNNは、幅広いディープラーニングアーキテクチャをカプセル化する強力な統一フレームワークである。
我々は,CTNNが階層的あるいは局所的な感度を必要とするタスクにおいて,従来のベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 18:59:55 GMT)
Efficient Randomized Experiments Using Foundation Models [16.8] 本稿では,複数の基礎モデルからの予測を,統計的に妥当な推測を保ちながら統合する手法を提案する。
我々の推定器は、実験データのみに基づく標準推定器と同じ精度のサンプルサイズを最大20%削減する、かなり精度の高いゲインを提供する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 17:31:47 GMT)
REVISION:Reflective Intent Mining and Online Reasoning Auxiliary for E-commerce Visual Search System Optimization [16.5] Taobaoのeコマースビジュアルサーチでは、ユーザの行動分析によって、クリック不要なリクエストのかなりの割合が明らかになった。
ユーザの暗黙的意図表現とシステム応答のこのミスマッチは、User-SearchSys Intent Discrepancyを定義します。
オフライン推論マイニングとオンライン意思決定と実行を統合した新しいフレームワークREVISIONを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 16:15:50 GMT)
Distributed Multi-Agent Bandits Over Erdős-Rényi Random Networks [16.4] ランダム通信グラフ上の不均一報酬を用いた分散マルチエージェントマルチアームバンディット問題について検討する。
本稿では,腕の除去戦略をランダムなゴシップアルゴリズムと統合する完全分散アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 19:53:52 GMT)
Diversified and Adaptive Negative Sampling on Knowledge Graphs [16.1] 本稿では,知識グラフ上での多変量および適応負値サンプリングDANS(Diversified and Adaptive Negative Smpling DANS)手法を提案する。
DANSは2つの経路を通じてより多様な負の三重項を生成する双方向ジェネレータと、よりきめ細かい例を生成する適応機構を備えている。
一方,2方向ジェネレータはより多様な負の例で全体の情報量を増加させる一方,適応機構はよりきめ細かなサンプリングによって個々の情報量を増加させる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 01:30:38 GMT)
Robust Atypical Mitosis Classification with DenseNet121: Stain-Aware Augmentation and Hybrid Loss for Domain Generalization [16.0] 筆者らはMIDOG 2025 (Track 2) 設定における非定型有糸分裂分類に適した DenseNet-121 ベースのフレームワークを提案する。
本手法は, クラス重み付き二元交叉エントロピーと焦点損失を併用したハイブリッド目的を用いて, ステンドアウェア拡張(マッケンコ), 幾何および強度変換, および重み付きサンプリングによる不均衡認識学習を統合する。
AdamWでエンドツーエンドにトレーニングされ、複数の独立したドメインで評価され、スキャナと染色シフトの下で強力な一般化が示され、バランスの取れた精度85.0%、AUROC 0.927、感度89.2%、そして公式テストセットの80.9%が達成された。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 11:24:55 GMT)
Pedagogy-driven Evaluation of Generative AI-powered Intelligent Tutoring Systems [16.0] ジェネレーティブAI(GenAI)モデルは,大規模言語モデル(LLM)を利用したインテリジェントチューニングシステム(ITS)の開発を加速した
しかしながら、これらのシステムの進歩と影響は、信頼性があり、広く受け入れられ、教育主導の評価フレームワークやベンチマークが欠如しているため、ほとんど追跡できないままである。
既存の教育対話に基づくIT評価の多くは、主観的プロトコルと非標準ベンチマークに依存しており、矛盾と限定的な一般化性につながっている。
この研究は、AIED研究の注意とケアから現実のケーススタディを通じて、関連する課題を強調する、総合的な最先端の評価プラクティスを提供する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:44:21 GMT)
Segment then Splat: Unified 3D Open-Vocabulary Segmentation via Gaussian Splatting [15.8] 3D空間でのオープンボキャブラリクエリは、ロボット工学、自律システム、拡張現実といったアプリケーションにおいて、よりインテリジェントな認識を可能にするために不可欠である。
既存のほとんどの手法は2Dピクセルレベルの解析に依存しており、多視点の不整合と3Dオブジェクトの検索が貧弱になる。
そこで我々は,ガウススプラッティングに基づく静的・動的シーンの3次元オープン語彙セグメンテーション手法であるセグメンテーションを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:37:17 GMT)
Beyond Normality: Reliable A/B Testing with Non-Gaussian Data [15.6] 我々は、スキューで長い尾の長いデータと不等割当歪みの誤差率を定量化し、$t$-testが有効であるのに必要な最小サンプルサイズについて明示的な公式を導出する。
多くのオンラインフィードバックメトリクスは、信頼できるA/Bテストを保証するのに、何億ものサンプルが必要です。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 14:44:19 GMT)
Infinite-Width Limit of a Single Attention Layer: Analysis via Tensor Programs [15.6] 本稿では,現実的なアーキテクチャ次元の下で,単一注意層内の変数の無限幅極限分布を同定する。
この極限法則の正確な形を無限ヘッド近似や調整されたスケーリングに頼ることなく導き出す。
我々の研究成果は、無限幅政権における深層トランスフォーマーアーキテクチャの統一理論開発の基礎となるものである。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 06:38:29 GMT)
Navigating the Accuracy-Size Trade-Off with Flexible Model Merging [15.5] 我々は、新しいデータフリーモデルマージフレームワークFlexMergeを提案する。
異なる大きさのマージモデルを柔軟に生成し、単一のマージモデルから完全なスペクトルにまたがり、すべての微調整モデルを保持する。
FlexMergeを使って、異なるアルゴリズムの精度と大きさのトレードオフを体系的に特徴づける。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 14:22:42 GMT)
MobilityGPT: Enhanced Human Mobility Modeling with a GPT model [15.2] 我々は, 自動回帰生成タスクとして, 生成事前学習型トランスフォーマアーキテクチャを活用して, 人間のモビリティモデリングを再構築する。
本稿では,ジオスパティカル・アウェア・ジェネレーティブ・モデルであるモビリティGPTを提案する。
実世界のデータセットの実験では、モビリティGPTは最先端の手法よりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:21:08 GMT)
Learning Local Stackelberg Equilibria from Repeated Interactions with a Learning Agent [15.0] そこで我々は,エプシロン近似局所スタックルバーグ平衡を求めるアルゴリズムを提案する。
特に、アルゴリズムのランタイムはエージェントのアクション空間のサイズであるが、1/epsilonでは指数関数的である。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 01:09:15 GMT)
Towards Minimizing Feature Drift in Model Merging: Layer-wise Task Vector Fusion for Adaptive Knowledge Integration [14.5] マルチタスクモデルマージは、複数のタスク固有のエキスパートからの知識を統一モデルに統合することを目的としている。
既存の手法では、タスク固有の専門家と統一モデルの違いを最小限に抑える。
本稿では,タスク固有の専門家と統一モデルとの間の機能ドリフトを明示的に最小化する手法であるレイヤワイズ・タスクベクトル・マージを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 00:53:57 GMT)
Attention Pruning: Automated Fairness Repair of Language Models via Surrogate Simulated Annealing [14.4] 本稿では,大規模言語モデル (LLM) におけるアテンションヘッドに対するアテンション・プルーニング(Attention Pruning) を提案する。
我々の実験は、注意喚起によって最大40%の性別バイアスが減少し、最先端のバイアス緩和戦略よりも優れることを示した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:24:45 GMT)
FastKV: KV Cache Compression for Fast Long-Context Processing with Token-Selective Propagation [14.3] 大規模言語モデル(LLM)は、かなりのプリフィル計算とキー値(KV)キャッシュを必要とする。
KVキャッシュをプレフィルアクセラレーションで圧縮する最近の作業は、このコストを低減しているが、誤ってプリフィル計算の削減をデコードKV予算に結び付ける。
FastKVはKVキャッシュ圧縮フレームワークで、プリフィルとデコードの両方の遅延を減らし、後のレイヤでのトークンの重要性の安定化を活用する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 12:06:24 GMT)
Leveraging Large Language Models to Identify Conversation Threads in Collaborative Learning [14.3] スレッディング(スレッディング)とは、会話が自然に、時間とともに進化する、織り交わされた話題のストランドに組織化される方法である。
本稿では,同期マルチパーティ・トランスクリプト中のスレッドを識別するための体系的なガイドブックを提供する。
次に、スレッディングが会話分析フレームワークの下流コーディングにどのように影響するかをテストする。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 21:25:23 GMT)
Backward-Friendly Optimization: Training Large Language Models with Approximate Gradients under Memory Constraints [14.2] LLM(Large Language Models)の完全な微調整は、メモリ集約性で悪名高い。
GradLiteは、正確な勾配の要求を緩和する後方フレンドリーなソリューションである。
我々はGradLiteが有界な分散を伴う不偏推定を維持し、Adamに匹敵する収束率を保証することを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 00:50:12 GMT)
FastVLM: Self-Speculative Decoding for Fast Vision-Language Model Inference [14.0] 我々はこれらの制限に対処するために、FastVLMという模倣学習に基づく自己投機的デコーディングフレームワークを導入する。
当社のアプローチでは,トークン生成のための軽量なドラフトモデルを自己回帰的に採用し,完全なモデルでこれらのトークンを非自己回帰的に検証する。
提案手法は, 性能の低下を最小限に抑えた最終層と比較して, 1.55-1.85倍の推算処理を高速化する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 11:49:20 GMT)
Tahakom LLM Guidelines and Recipes: From Pre-training Data to an Arabic LLM [14.0] 大規模言語モデル(LLM)は自然言語処理の分野を著しく進歩させてきた。
しかし、アラビア語用LLMの開発には固有の課題がある。
本稿では,データキュレーション,トークン化設計,評価などの重要な側面に注目し,これらの課題について考察する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:05:20 GMT)
Beyond Fertility: Analyzing STRR as a Metric for Multilingual Tokenization Evaluation [13.8] 7つの言語と2つのドメインにまたがる6つの広く使われているトークンを解析する。
単一トークンとして保存される単語の割合を計測する単一トークン保持率(STRR)を提案する。
以上の結果から,STRRは不妊を補完し,より平等な多言語トークン化器の設計のための実践的ガイダンスを提供することがわかった。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 01:32:06 GMT)
Agent-GSPO: Communication-Efficient Multi-Agent Systems via Group Sequence Policy Optimization [13.6] シーケンスレベルの強化学習を用いてトークン経済を直接最適化するフレームワークである textbfAgent-GSPO を紹介する。
Agent-GSPOは、新しい最先端のパフォーマンスを達成するだけでなく、既存のメソッドのトークン消費のごく一部で実現している。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 01:27:13 GMT)
Pindrop it! Audio and Visual Deepfake Countermeasures for Robust Detection and Fine Grained-Localization [13.4] 本稿では,ディープフェイク映像分類とローカライゼーションの問題に対する解決策を提案する。
この手法はACM 1M Deepfakes Detection Challengeに提案された。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 01:03:16 GMT)
Self-correction is Not An Innate Capability in Large Language Models: A Case Study of Moral Self-correction [13.3] 道徳的自己補正はLLMの本質的な能力か?」という根本的な疑問に対処することで道徳的自己補正の基盤となるメカニズムを考察する。
道徳的自己補正は、道徳的に敏感でもなく、自己補正プロセス中に外部からのフィードバックを効果的に取り入れることができないため、LLMの本質的な能力ではないことを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 00:20:34 GMT)
Centralized Reward Agent for Knowledge Sharing and Transfer in Multi-Task Reinforcement Learning [13.3] 本稿では,中央報酬エージェント(CRA)と分散政策エージェントを統合したマルチタスク強化学習フレームワークを提案する。
CRAは知識プールとして機能し、様々なタスクから知識を抽出し、学習効率を向上させるために個別の政策エージェントに配布することを目的としている。
提案手法をMeta-Worldベンチマークを含む離散領域と連続領域の両方で検証する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 07:57:06 GMT)
Learning Event-guided Exposure-agnostic Video Frame Interpolation via Adaptive Feature Blending [13.2] 露出に依存しないビデオフレーム(VFI)のための新しいイベント誘導フレームワークを提案する。
我々のフレームワークは、Target-Adaptive Event Smpling (TES)とTarget-Adaptive Importance Mapping (TIM)を使っている。
合成と実世界の両方のデータセットの実験は、露光に依存しないVFIシナリオにおける我々のアプローチの有効性を実証している。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 07:44:26 GMT)
Rule-Based Explanations for Retrieval-Augmented LLM Systems [13.2] 大規模言語モデル(LLM)の新たなクラスを検索強化世代(RAG)で説明するためのルールを適用するための最初の提案を提案する。
このようなルールを生成するために、ブルートフォースアプローチは全てのソースの組み合わせでLCMを探索し、任意のソースの有無が同じ出力につながるかどうかを確認する。
本稿では,アプリオリ型プルーニングにヒントを得たルール生成を高速化する最適化を提案するが,新しい問題の範囲内で再定義する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 14:22:07 GMT)
Guardian: Decoupling Exploration from Safety in Reinforcement Learning [13.0] ハイブリッドオフラインオンライン強化学習(O2O RL)は、サンプル効率と堅牢な探索の両方を約束するが、オフラインデータとオンラインデータの分散シフトによって不安定に陥る。
安全対策から政策最適化を分離するフレームワーク RLPD-GX を紹介する。
Atari-100k上での最先端性能を実証的に示し, 安全性と安定性が向上し, 正常化平均スコア3.02(+45%)を達成した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 22:25:47 GMT)
A Cycle Ride to HDR: Semantics Aware Self-Supervised Framework for Unpaired LDR-to-HDR Image Reconstruction [12.9] 低ダイナミックレンジ(LDR)画像からの高ダイナミックレンジの再構成は重要なコンピュータビジョンタスクである。
サイクルは、自己管理されたセットアップでLDR-再構成タスクに対して意味的および文脈的認識を使用する最初の方法である。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 03:39:20 GMT)
From Pixels to Views: Learning Angular-Aware and Physics-Consistent Representations for Light Field Microscopy [12.9] 光電場顕微鏡における学習に基づく3次元再構成への3つの重要な貢献を紹介する。
まず,XLFM再構成のための大規模データセットと評価スイートであるXLFM-Zebrafishベンチマークを構築した。
第2に,光場に対するマスケッドビューモデリング(MVN-LF, Masked View Modeling for Light Fields)を提案する。
第3に、予測ボリュームとPSFベースの前方投影とのアライメントを強制する微分可能なレンダリング制約である光レンダリング一貫性損失(ORC Loss)を定式化する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:28:05 GMT)
Accelerating Materials Design via LLM-Guided Evolutionary Search [12.9] LLM-Guided Evolution for Materials Design (LLEMA) について述べる。
大規模言語モデルに埋め込まれた科学的知識と、化学インフォームド進化規則とメモリベースの洗練とを結びつける。
電子、エネルギー、コーティング、光学、航空宇宙にまたがる14の現実的なタスクを 評価しました
論文参考訳(メタデータ) (Sun, 26 Oct 2025 02:47:15 GMT)
An Analytic Theory of Quantum Imaginary Time Evolution [12.8] 量子想像時間進化アルゴリズム(Quantum imaginary Time Evolution, QITE)は、最も有望な変分量子アルゴリズムの1つである。
ここでは、QITEは量子自然勾配 Descent (QNGD) で訓練された一般的なVQAの形式として解釈できることを示す。
我々は、QITEは常にGDベースのVQAよりも早く収束することが証明されるが、この利点はヒルベルト空間次元の指数的成長によって抑制される。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 01:43:55 GMT)
RaCoT: Plug-and-Play Contrastive Example Generation Mechanism for Enhanced LLM Reasoning Reliability [12.7] 本稿では,RaCoT(Retrieval-aware Contrastive-of-Thought)を提案する。
RaCoTは、解答の発散を決定する重要な詳細に積極的に焦点を合わせるようモデルに誘導する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 15:06:44 GMT)
A Neuroscience-Inspired Dual-Process Model of Compositional Generalization [12.5] ニューラルインスパイアされたデュアルプロセスモデルであるtextscMirageを提案する。
高速で直感的なSystem1'(メタトレーニングされたトランスフォーマー)と、意図的にルールベースのSystem2'(エンジン)を組み合わせる。
Mirageはタスクに依存しない設定でSCANベンチマークのすべての分割に対して$99%の精度を達成する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 00:57:08 GMT)
Cross-view Localization and Synthesis - Datasets, Challenges and Opportunities [12.4] クロスビューの局所化と合成は、クロスビューの視覚的理解における2つの基本的なタスクである。
これらのタスクは、自律ナビゲーション、都市計画、拡張現実に広く応用されているため、注目を集めている。
近年、大規模なデータセットと新しいアプローチが利用可能になったことにより、急速な進歩が見られた。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 16:09:53 GMT)
DMol: A Schedule-Driven Diffusion Model for Highly Efficient and Versatile Molecule Generation [12.4] DMolと呼ばれる小分子生成のための新しいグラフ拡散モデルを提案する。
最先端のDiGressモデルよりも、すべてのベンチマークデータセットで約1.5%向上している。
拡散ステップの数を少なくとも10倍に減らし、走行時間を約半分に短縮する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:18:01 GMT)
Learning "Partner-Aware" Collaborators in Multi-Party Collaboration [12.3] 大規模言語モデル(LLM)は,人間との共同作業を行うエージェント設定にデプロイされることが増えている。
本稿では、協調行動に関する新たな理論的洞察を提供するために、AIアライメントと安全な割り込み可能性文献に基づく。
CG-最適協調者を訓練するための新しいパートナー認識学習アルゴリズムであるInterruptible Collaborative Roleplayer (ICR)を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 00:05:48 GMT)
Optimize Any Topology: A Foundation Model for Shape- and Resolution-Free Structural Topology Optimization [12.0] 本稿では,任意のアスペクト比,解像度,ボリューム率,負荷,フィクスチャの最小コンプライアンスレイアウトを直接予測する基盤モデルフレームワークを提案する。
OATは、解像度と形状に依存しないオートエンコーダと暗黙のニューラルフィールドデコーダとOpenTOでトレーニングされた条件付き潜在拡散モデルを組み合わせる。
OATは、最高の先行モデルと比較して90%のコンプライアンスを低くし、64 x 64から256 x 256までの解像度と10:1までのアスペクト比で、単一のGPUでサブ-1秒の推論を提供する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 15:11:54 GMT)
Uncertainty-Aware Autonomous Vehicles: Predicting the Road Ahead [11.9] 本研究は,自律走行車に「不確かさを知る能力」を持たせることを目的とする。
予測の不確実性を明確に定量化するために、ランダムセットニューラルネットワーク(RS-NN)を利用する。
結果は、より安全で堅牢な自律運転のための実用的なソリューションとして、不確実性を認識したニューラルネットワークの可能性を示している。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:49:38 GMT)
Clustering by Denoising: Latent plug-and-play diffusion for single-cell data [10.8] 観測空間と聴覚空間を分離する潜在的なプラグアンドプレイ拡散フレームワークを導入する。
この分離は、新しいギブスサンプリング手順によって行われる。
合成と実の単細胞ゲノミクスデータによるロバスト性の評価を行った。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 21:03:56 GMT)
CannyEdit: Selective Canny Control and Dual-Prompt Guidance for Training-Free Image Editing [10.5] CannyEditは、地域画像編集のための新しいトレーニング不要のフレームワークである。
Canny ControlNetから未編集領域のみに構造的なガイダンスを適用し、元のイメージの詳細を保存する。
CannyEditは例外的な柔軟性を提供しており、粗いマスクや、追加タスクのシングルポイントヒントで効果的に動作する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 07:19:20 GMT)
FastJAM: a Fast Joint Alignment Model for Images [10.5] 画像の結合アライメントは、画像の集合を、対応する空間的位置において意味的に類似した特徴が現れるように、統一された座標フレームに整列することを目的としている。
我々は,関節アライメントタスクの計算量を大幅に削減する高速グラフベース手法であるFastJAMを紹介する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 21:21:27 GMT)
Seeing the Unseen: Towards Zero-Shot Inspection for Wind Turbine Blades using Knowledge-Augmented Vision Language Models [10.2] 本稿では,ゼロショット指向の検査フレームワークを提案し,視覚言語モデルとRetrieval-Augmented Generationを統合した。
技術ドキュメント、代表参照画像、ドメイン固有のガイドラインを含むマルチモーダル知識ベースを構築する。
各種損傷カテゴリをカバーする30のラベル付きブレード画像上での枠組みの評価を行った。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 23:19:28 GMT)
SAC Flow: Sample-Efficient Reinforcement Learning of Flow-Based Policies via Velocity-Reparameterized Sequential Modeling [9.9] 多段階アクションサンプリングプロセスの勾配が原因で,非政治強化学習による表現型フローベース政策の訓練が不安定であることが知られている。
フローロールアウトはリカレント計算に代数的に等価であり、RNNと同様の消滅や爆発的な勾配に影響を受けやすい。
我々は,これらのポリシーのエンドツーエンドのトレーニングを容易にする,ノイズ強化ロールアウトによって実現された実用的なSACベースのアルゴリズムを開発した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:37:16 GMT)
Exact Coset Sampling for Quantum Lattice Algorithms [9.9] 複雑なガウス窓を持つ最近のウィンドウ付きQFT格子アルゴリズムのステップ9において、競合する「ドメイン拡張」を簡易に置き換える。
我々の新しいサブルーチンは、未知のオフセットを正確にキャンセルするペアシフト差分によってドメイン拡張を置き換える。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 19:21:26 GMT)
Agentic Meta-Orchestrator for Multi-task Copilots [9.3] Microsoft Copilotスイートは、重要なタスクの処理に熟練したさまざまなエージェントの共通エントリポイントとして機能する。
本稿では,複数のタスクやスケーラブルなエージェントを扱うためのAMO(Agentic Meta-Orchestrator)を提案する。
Microsoft 365 (M365) の E-Commerce Copilot と Code compliance copilot である。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 18:13:04 GMT)
MELDAE: A Framework for Micro-Expression Spotting, Detection, and Automatic Evaluation in In-the-Wild Conversational Scenes [9.1] 最初のマイクロ・エクスプレッション・データセットは会話・イン・ザ・ワイルドのシナリオに焦点を当てた。
エンドツーエンドのローカライゼーションと検出フレームワーク、MELDAE。
新たな境界認識損失関数は、オンセットとオフセットのエラーをペナル化することで時間精度を向上させる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:18:16 GMT)
Learning Heuristics for Transit Network Design and Improvement with Deep Reinforcement Learning [9.0] 我々は強化学習を使ってグラフニューラルネットワークを訓練し、好みとして振る舞う。
新しいニューラルネットワークは、70ノード以上のベンチマーク合成都市で結果を改善し、最先端の結果を得る。
また、カナダのラヴァル市における実際の交通ネットワークのシミュレーションを改善し、最大19%のコスト削減を実現している。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 16:44:43 GMT)
LUQ: Layerwise Ultra-Low Bit Quantization for Multimodal Large Language Models [8.9] マルチモーダルLLMの超低ビット(4ビット)量子化に関する最初の研究について述べる。
解析の結果,多モードトークンと中間層アクティベーションは,テキストトークンと比較して,統計的分散とエントロピーが著しく高いことがわかった。
我々はMLLM量子化の新しい戦略であるLUQ:Layerwise Ultra-Low Bit Quantizationを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 06:17:42 GMT)
Approximate Gradient Coding for Distributed Learning with Heterogeneous Stragglers [8.9] 分散学習におけるストラグラー問題を軽減するため,最適に構造化された勾配符号化方式を提案する。
提案手法はストラグラーの影響を著しく低減し,既存の手法と比較して収束を加速する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:32:18 GMT)
Beyond the Average: Distributional Causal Inference under Imperfect Compliance [8.8] 不完全なコンプライアンスを伴うランダム化実験における分布的処理効果の推定について検討した。
我々は,Neyman-orthogonal モーメント条件を持つ分布回帰フレームワークに基づく回帰調整型推定器を提案する。
オレゴン健康保険実験への適用事例として,本手法の実践的妥当性を示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 09:19:06 GMT)
Feasibility-Aware Decision-Focused Learning for Predicting Parameters in the Constraints [8.4] 決定にフォーカスした学習は、予測パラメータを使用して決定する品質を最適化するために、機械学習(ML)モデルをトレーニングすることで、第1段階を実装する。
最大推定値に基づいて2つの新しい損失関数を導出する。
このパラメータを調整することで、意思決定者がこのトレードオフを制御できることを実験的に実証する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:52:55 GMT)
Experimental Proposal on Scalable Radio-Frequency Magnetometer with Trapped Ions [8.3] 混合動的デカップリング法を利用したスケーラブルな捕捉イオン磁気センサを提案する。
周波数場に対する13$rmfT/sqrtrmHz$の感度を達成できることを実証した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 03:47:25 GMT)
Toward Agents That Reason About Their Computation [8.2] 75%のゲームにおいて,計算処理の理由となるエージェントの性能が向上していることが示される。
個々のゲームを分析し、エージェントがどの効率を得るかを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 21:01:30 GMT)
FlowCritic: Bridging Value Estimation with Flow Matching in Reinforcement Learning [8.2] 既存の研究は、多批判アンサンブルと分布RLによる値関数推定の信頼性を向上させる。
生成モデルにおけるフローマッチングの成功に触発されて,FlowCriticと呼ばれる値推定のための生成パラダイムを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 14:12:32 GMT)
Reconstruction and Prediction of Volterra Integral Equations Driven by Gaussian Noise [8.1] 本研究は、ガウス雑音によって駆動されるボルテラ積分方程式におけるパラメータ同定問題、あるいは方程式再構成問題に対処する。
本稿では,これらの方程式のドリフト項における未知パラメータを推定するための改良されたディープニューラルネットワークフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:26:40 GMT)
SA-UNetv2: Rethinking Spatial Attention U-Net for Retinal Vessel Segmentation [8.1] マルチスケール機能融合を強化するために,全スキップ接続に空間的空間的関心を注入する軽量モデルSA-UNetv2を提案する。
パブリックDRIVEとSTAREデータセットでは、SA-UNetv2は1.2MBのメモリと0.26Mのパラメータで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 15:47:25 GMT)
Mutual Information guided Visual Contrastive Learning [8.1] 本研究では,実世界の分布から計算した相互情報に基づいて,学習データを選択する可能性を検討する。
提案手法は,複数の最先端表現学習フレームワークにまたがって,複数のベンチマークに対して提案した相互情報インフォームドデータ拡張手法を評価する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:43:29 GMT)
Optimal Anytime Algorithms for Online Convex Optimization with Adversarial Constraints [7.8] 本稿では,対向凸コスト関数の列を学習する問題に対して,任意のオンラインアルゴリズムを提案する。
提案アルゴリズムは,標準的な倍数化手法を使わずに最適な性能バウンダリを実現する。
我々のアルゴリズムは、$O(sqrtt)$ regret と $tildeO(sqrtt)$ cumulative constraint violation bounds for any $tgeq 1$。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:35:37 GMT)
Zero-Shot Trajectory Planning for Signal Temporal Logic Tasks [7.4] Signal Temporal Logic (STL) は、連続信号の複雑な時間的挙動を記述するための強力な仕様言語である。
STLタスクの実行可能なSTLプランの生成は、タスク仕様とシステムダイナミクスの結合を考慮する必要があるため、難しい。
オフライントレーニングにおいてタスク非依存の軌道データのみを活用することで、新しいSTLタスクへのゼロショット一般化を可能にする階層的計画フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 02:13:53 GMT)
Finding the Needle in the Crash Stack: Industrial-Scale Crash Root Cause Localization with AutoCrashFL [7.4] 本稿では,プログラムアンダーテスト(PUT)からのクラッシュダンプと対応するソースコードのリポジトリへのアクセスのみを必要とするクラッシュのローカライズのためのエージェントであるAutoCrashFLを提案する。
我々は,3500万行以上のコードからなる産業用ソフトウェアプロジェクトであるSAPの実際のクラッシュに対してAutoCrashFLを評価した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:43:33 GMT)
Convergence Analysis of SGD under Expected Smoothness [7.3] 勾配降下(SGD)は大規模学習の成果であるが、古典的な分析は強すぎる(有界な分散)か粗い(一様雑音)のどちらかの仮定に依存している。
期待滑らか性(ES)条件は、目標値と全勾配に勾配の第2モーメントを結びつけるフレキシブルな代替手段として現れている。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 02:53:43 GMT)
Universal decay of (conditional) mutual information in gapped pure- and mixed-state quantum matter [7.2] 我々は、相互情報と条件付き相互情報のスーパーポリノミアル崩壊挙動が、ギャップ付き純粋相と混合相の普遍的性質であることを示す。
副産物として、混合状態相の概念を研ぎ澄ます。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 23:17:16 GMT)
Generalized EXTRA stochastic gradient Langevin dynamics [6.9] ランゲヴィンアルゴリズムは、ベイズ学習のためのマルコフ・チェイン・モンテカルロ法(Markov Chain Monte Carlo method)として人気がある。
Langevin dynamics (SGLD)のような彼らのバージョンは、ランダムにサンプリングされたミニバッチに基づいた反復学習を可能にする。
通信とプライバシーの制約を受けるエージェントのネットワークでデータが分散化されると、標準のSGLDアルゴリズムは適用できない。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:47:21 GMT)
The Limits of Data Scaling: Sub-token Utilization and Acoustic Saturation in Multilingual ASR [6.6] 49言語にわたる推論においてWhisperの復号動作を分析する。
モデルのサブトークン空間の利用パターンについて検討する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 02:13:26 GMT)
Distributionally Robust Optimization via Diffusion Ambiguity Modeling [6.6] 分散ロバスト最適化(DRO)のための効果的なあいまいさは、名目分布と整合した分布を伴わなければならない。
本稿では,拡散に基づくあいまい性集合の設計を提案する。
次に、内部パラメータ拡散モデル空間を解くためのトラクタブルDROアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 17:11:50 GMT)
On the Freshness of Pinned Dependencies in Maven [6.5] 人気の高いMavenライブラリの利用者の60%以上が、依存関係に固定されたピンを持っていることを示しています。
我々はPin-Freshenerというアプローチをプロトタイプし、ピアプロジェクトのクラウドソーステストを活用することで、開発者がピンを更新できるようにします。
Mavenの人気のあるライブラリのトップ500に対する実世界のピンに関する我々の評価は、Pin-Freshenerが少なくとも5つのクラウドソーステストスイートをパスする余分な信号を提供できることを示している。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:02:49 GMT)
Block Coordinate Descent for Neural Networks Provably Finds Global Minima [6.4] 我々は、ディープニューラルネットワークのトレーニングのためのブロック座標降下(BCD)アルゴリズムを検討する。
我々は、厳密に単調に増加する活性化関数の下で、新しいグローバル収束保証を提供する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:06:19 GMT)
Batch Speculative Decoding Done Right [6.4] 投機的復号化は、小さなドラフトモデルを用いてLLM推論を高速化し、ターゲットモデルが並列に検証する複数のトークンを提案する。
同じバッチ内のシーケンスは、異なる数のドラフトトークンを受け取り、右アライメントを破り、位置IDを破損させ、アテンションマスク、KV-cache状態となる。
いくつかの既存のバッチ実装が出力等価性に反していることが示され、投機的復号化は標準的な自己回帰生成と同一のトークンシーケンスを生成する必要があるという基本的な要件が示される。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 23:59:23 GMT)
A Sociophonetic Analysis of Racial Bias in Commercial ASR Systems Using the Pacific Northwest English Corpus [6.4] 本稿では,4大商用自動音声認識(ASR)システムにおける人種バイアスの体系的評価について述べる。
我々は,4つの民族的背景(アフリカ系アメリカ人,コーカサス系アメリカ人,チカンX,ヤカマ)から話者間での転写精度を分析し,社会音の変動がシステム性能に与える影響について検討した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 02:19:40 GMT)
Probing the Representational Geometry of Color Qualia: Dissociating Pure Perception from Task Demands in Brains and AI Models [6.2] 我々は、最先端のAIモデルと人間の脳とのカラークエーリアの表現幾何学の厳密な比較を行う。
我々の研究は、Brain-Score互換フォーマットでパッケージされた、フィールドに色準位を付与するための新しいベンチマークタスクに貢献する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 19:13:16 GMT)
Efficiently Learning Synthetic Control Models for High-dimensional Disaggregated Data [6.1] 合成制御法は因果効果を推定するための貴重なツールとなっている。
最近、複数の処理単位を持つ高次元非凝集状態における応用を見出した。
本稿では,多変数平方根ラッソ法を合成制御フレームワークに統合する新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:43:52 GMT)
Beyond sparse denoising in frames: minimax estimation with a scattering transform [6.0] 散乱係数の異なる部分集合の$ell1$ノルムを最小化し、最大化する。
信号からの雑音を抑圧し、幾何学関数の正則性を指定するために、異なる調和解析アプローチを提供する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:46:44 GMT)
Multi-Scale Finite Expression Method for PDEs with Oscillatory Solutions on Complex Domains [5.8] 高周波振動と複雑なジオメトリーは、従来の数値法では違法に高価な表現をもたらす。
精度,解釈可能性,計算効率を向上し,これらの課題に対処する拡張有限式法(FEX)を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 02:26:49 GMT)
Look and Tell: A Dataset for Multimodal Grounding Across Egocentric and Exocentric Views [5.7] 我々は、エゴセントリックな視点とエゴセントリックな視点をまたいだ参照コミュニケーションを研究するためのマルチモーダルデータセットであるLook and Tellを紹介した。
Meta Project Ariaスマートグラスと静止カメラを使って、25人の参加者がキッチンの材料を特定するようパートナーに指示した、同期した視線、スピーチ、ビデオを記録しました。
データセットには3.67時間の録音が含まれており、その中には2,707の注釈付き参照表現が含まれている。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:27:59 GMT)
WaveMAE: Wavelet decomposition Masked Auto-Encoder for Remote Sensing [5.7] WaveMAEはマルチスペクトル衛星画像に適したマスク付き自動符号化フレームワークである。
評価の公平性を確保するため、全ての手法が同じデータセット上で事前訓練される(fMoW-S2)。
WaveMAEは従来の最先端アプローチよりも一貫した改善を実現している。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 14:45:30 GMT)
DynaPose4D: High-Quality 4D Dynamic Content Generation via Pose Alignment Loss [5.6] DynaPose4Dは、単一の静的画像から高品質な4D動的コンテンツを生成するフレームワークである。
その結果,DynaPose4Dは動的運動生成において優れたコヒーレンス,一貫性,流動性が得られた。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 01:11:13 GMT)
Worse than Zero-shot? A Fact-Checking Dataset for Evaluating the Robustness of RAG Against Misleading Retrievals [5.6] RAGuardは、不正検索に対するRAGシステムの堅牢性を評価する最初のベンチマークである。
合成ノイズに依存する以前のベンチマークとは異なり、ファクトチェックデータセットは自然に発生する誤報をキャプチャする。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 06:07:13 GMT)
Centrum: Model-based Database Auto-tuning with Minimal Distributional Assumptions [5.5] GP-BOの基本的な仮定は、モデリングや性能最適化において広く違反している。
既存のツリーアンサンブルBOはオートチューニングのさらなる進歩を制限している。
本稿では,新しいモデルベースオートチューニングシステムCentrumを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 16:08:15 GMT)
Neural-HAR: A Dimension-Gated CNN Accelerator for Real-Time Radar Human Activity Recognition [5.4] 本稿では,資源制約のあるプラットフォーム上でのリアルタイムレーダHARに適した次元ゲート型CNNアクセラレータを提案する。
GateCNNの精度は86.4%で、パラメータは2.7kで、推論あたり0.28M FLOPはCNN-BiGRUに匹敵する。
Xilinx Zynq-7000 Z-7007SのFPGAプロトタイプは、LUTベースのROMと分散RAMのみを使用した107.5$mu$sレイテンシと15mWのダイナミックパワーを実現しました。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 17:42:28 GMT)
Semi-supervised Vertex Hunting, with Applications in Network and Text Analysis [5.3] そこで我々は,データポイントの偏心座標の形で部分情報を利用できる,新たな変種半教師付きハンティング(SSVH)を提案する。
我々は,SSVHを,半教師付きネットワーク混合メンバーシップ推定と半教師付きトピックモデリングの2つの実践的な設定に適用し,効率よくスケーラブルなアルゴリズムを実現する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:26:26 GMT)
A Closed-Loop Personalized Learning Agent Integrating Neural Cognitive Diagnosis, Bounded-Ability Adaptive Testing, and LLM-Driven Feedback [5.2] 本稿では,ニューラル認知診断モデル(NCD),境界能力コンピュータ適応テスト戦略(BECAT),大規模言語モデル(LLM)を統合するエンド・ツー・エンドの個別学習エージェントを提案する。
ASSISTmentsデータセットの実験では、NCDモジュールは解釈可能なマスタリーアセスメントを出力しながら応答予測において高い性能を達成する。
全体としては,提案した設計は効果的かつ実用的に展開可能であることを示唆している。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 07:32:31 GMT)
RoGER-SLAM: A Robust Gaussian Splatting SLAM System for Noisy and Low-light Environment Resilience [4.9] RoGER-SLAMは3DGSのSLAMシステムで、ノイズと低照度のレジリエンスに特化している。
また,RoGER-SLAMは,他の3DGS-SLAMシステムと比較してトラジェクトリ精度と再構成品質を一貫して向上することを示した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 09:32:43 GMT)
Does In-IDE Calibration of Large Language Models work at Scale? [4.7] 内部モデル信頼性のポストホック校正は、確率を許容可能性尺度に合わせることを目的としている。
オープンソースのモデルのキャリブレーション重み付けに使用できる,スケーラブルで柔軟なキャリブレーションフレームワークを開発した。
2400万人以上の現実世界の開発者インタラクションを大規模に分析した結果、プラッツスケーリングに基づく一般的なポストホックキャリブレーションモデルでは、平均してモデル信頼性信号の信頼性が向上しないことがわかった。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 10:15:03 GMT)
Beyond Semantics: How Temporal Biases Shape Retrieval in Transformer and State-Space Models [4.7] 文脈内学習は時間的関係と意味的関係の両方によって支配される。
この研究は、様々な事前訓練された大規模言語モデル(LLM)が、時間的に分離されたイベントを識別し、検索する能力について調査する。
本研究は、文脈内学習における時間的偏見の理解を深め、これらの偏見が時間的分離と韻律的検索をいかに可能かを示すものである。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 17:01:41 GMT)
SwiftSolve: A Self-Iterative, Complexity-Aware Multi-Agent Framework for Competitive Programming [4.6] 我々は、複雑性を意識した競合プログラミングのためのマルチエージェントシステムSwiftを提案する。
プロファイリングと複雑誘導型リプランニングは精度を保ちながら非効率性を低下させることを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 11:05:27 GMT)
AesCrop: Aesthetic-driven Cropping Guided by Composition [4.4] AesCropは、VMambaイメージエンコーダを統合し、新しいMambaコンポジションアテンションバイアス(MCAB)を付加した合成対応ハイブリッド画像カッピングモデルである。
MCABは、コンポジションキューをアテンション機構にエンコードし、AesCropに最も構成的に健全な領域にフォーカスするよう指示する。
大規模な実験は、AesCropが現在の最先端の手法より優れており、優れた量的指標を提供し、質的により喜ばしい作物を提供することを示した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:30:02 GMT)
Lyapunov Function-guided Reinforcement Learning for Flight Control [4.3] 動作のスムーズさに配慮して,ケースケードオンライン学習飛行制御システムを開発した。
Lyapunov関数候補の増大を特徴とする制御系の収束性能について検討する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 21:18:34 GMT)
Agentsway -- Software Development Methodology for AI Agents-based Teams [4.2] Agentswayは、AIエージェントが一流の協力者として機能するエコシステム向けに設計された、新しいソフトウェア開発フレームワークである。
このフレームワークは、計画、プロンプト、コーディング、テスト、微調整エージェントの異なる役割を定義している。
Agentswayは、次世代のAIネイティブで自己改善型のソフトウェア開発方法論に向けた基本的なステップである。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 11:58:42 GMT)
Exploration of Summarization by Generative Language Models for Automated Scoring of Long Essays [4.2] 本研究では,要約とプロンプトによる長いエッセイの自動採点のための生成言語モデルについて検討する。
その結果,QWKによる評価精度は,学習機関自動評価2.0データセットでは0.822から0.8878に向上した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:59:22 GMT)
LAMP: Data-Efficient Linear Affine Weight-Space Models for Parameter-Controlled 3D Shape Generation and Extrapolation [4.2] 制御可能かつ解釈可能な3D生成のためのフレームワークであるLAMPを紹介する。
LAMPをDrivAerNet++とBlendedNetの2つの3次元パラメトリック幾何ベンチマークで評価した。
以上の結果から,LAMPは制御可能で,データ効率が高く,安全な3D生成が可能であることが示唆された。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 02:12:20 GMT)
TLSQKT: A Question-Aware Dual-Channel Transformer for Literacy Tracing from Learning Sequences [4.1] 知識追跡は、学生の知識状態が時間とともにどのように進化するかをモデル化することによって、パーソナライズされた学習を支援する。
我々は、このパラダイムをトランスフォーマーベースモデルTLSQKT(質問認識知識トレースを用いた学習シーケンス変換器)でインスタンス化する。
TLSQKTは、学生の反応とアイテムのセマンティクスを共同で符号化するデュアルチャネル設計を採用し、質問認識インタラクションと自己注意は学習者の進化する状態における長距離依存関係をキャプチャする。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 02:07:45 GMT)
Iterative Layer Pruning for Efficient Translation Inference [3.8] 機械翻訳学会(WMT 2025)におけるモデル圧縮トラックへの提出について紹介する。
実験では, 層重み解析によって導かれる反復層プルーニングについて検討した。
提案手法は,ベースラインモデルの翻訳品質を維持しつつ,モデルサイズと推論時間を大幅に短縮する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 17:26:14 GMT)
Federated Structured Sparse PCA for Anomaly Detection in IoT Networks [3.7] 本稿では,IoTネットワークにおける新しいフェデレーション型異常最小化手法を提案する。
提案したモデルは,$ell_2, sparse$で管理される行単位の空間性を統合する。
実験により、構造的疎結合が両方のモデルの解釈可能性を高めることが証明された。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:08:02 GMT)
A Temporal Difference Method for Stochastic Continuous Dynamics [3.7] 我々は,HJBに基づく強化学習の本質的な限界に対処する。
HJB方程式を対象とするモデルフリーアプローチを提案し,対応する時間差分法を提案する。
提案した定式化は,ブリッジング制御とモデルフリー強化学習への道を開くものである。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:50:28 GMT)
A roadmap for curvature-based geometric data analysis and learning [3.6] 本稿では,既存の離散曲率モデルの包括的レビューを行い,その数学的基礎,計算定式化,およびデータ解析と学習における実践的応用について述べる。
最後に、教師なし学習と教師なし学習の両方における曲率の最先端応用について概説する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 09:31:41 GMT)
Aligning Diffusion Language Models via Unpaired Preference Optimization [3.5] 拡散言語モデル(dLLMs)は、自己回帰(AR)ジェネレータに代わる新たな選択肢である。
ELBO-KTOは,拡散対数類似度に対するELBOサロゲートと,予測理論的,未選択の選好目的を組み合わせて導入する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 03:02:39 GMT)
qc-kmeans: A Quantum Compressive K-Means Algorithm for NISQ Devices [3.4] NISQハードウェア上のクラスタリングは、データローディングと限定キュービットによって制限される。
提案するqc-kmeansは,QAOA回路が浅いグループごとのQUBOを解くことで,一定のサイズのフーリエ特徴スケッチでデータセットを要約し,セントロイドを選択するハイブリッドな$k$-meansである。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:44:17 GMT)
Efficient Semi-Supervised Adversarial Training via Latent Clustering-Based Data Reduction [3.4] 近年の研究では,外部ラベル付き・合成データを用いた半教師付き対人訓練(SSAT)手法が提案されている。
SSATは、高い堅牢性を達成するためにかなりのデータを必要とするため、トレーニング時間が長くなり、メモリ使用量が増加する。
SSATの効率を改善するためのラベルなしデータ削減戦略を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 18:22:06 GMT)
Toward Krylov-based holography in double-scaled SYK [3.4] 二重スケールSachdev-Ye-Kitaevモデル(DSSYK)のクリロフ部分空間における量に対する正確なホログラフ辞書を開発する。
クリャロフ状態の複雑さの成長速度はワームホール速度と一致し,そのコヒーレント状態における期待値がバルク再構成によるファイアウォール状構造物の境界診断に有効であることを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 12:40:14 GMT)
DQS: A Low-Budget Query Strategy for Enhancing Unsupervised Data-driven Anomaly Detection Approaches [3.3] 本研究は,既存の教師なし異常検出手法とアクティブラーニングを統合した。
我々は、DQS(dissimilarity-based query strategy)と呼ばれる新しいクエリ戦略を導入する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 17:21:20 GMT)
Atlas Urban Index: A VLM-Based Approach for Spatially and Temporally Calibrated Urban Development Monitoring [3.3] 我々は,Sentinel-2衛星画像を用いた都市開発評価指標であるEm Atlas Urban Index(AUI)を紹介する。
既存のアプローチ、例えばEm Normalized Different Build-up Index (NDBI)は、大気ノイズ、季節変動、雲の覆いなどの要因により、都市開発を正確に捉えるのに苦労することが多い。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 14:53:36 GMT)
Entity-Augmented Neuroscience Knowledge Retrieval Using Ontology and Semantic Understanding Capability of LLM [2.8] 知識グラフ(KG)は複数の情報源からの知識を統合しリンクすることができる。
神経科学における既存のKGの構築方法は、しばしばラベル付きデータに依存し、ドメインの専門知識を必要とする。
本研究は、未ラベルの大規模神経科学研究コーパスからKGを構築する新しい方法を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:07:38 GMT)
Bell sampling in Quantum Monte Carlo simulations [2.7] 量子モンテカルロ法(QMC)は大規模量子多体系の数値研究に不可欠である。
本稿では,ベルサンプリングを利用した新しいQMCフレームワークであるBell-QMCを紹介する。
我々は,ベルQMCが観測可能なクラスの両方を効率よく,偏りのない推定を可能にすることを実証した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 14:16:59 GMT)
Enabling Shortwave-QKD in Short-Reach Networks: Impact of a Composite ODN Native to Telecom Applications [2.6] ショートウェーブQKDを社内/データベースアーキテクチャにデプロイする。
わずかなモード伝播とスペックル選択損失はQKD性能に大きな影響を及ぼす。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 10:25:20 GMT)
A Scalable Global Optimization Algorithm For Constrained Clustering [2.4] 制約付きクラスタリングは、クラスタリングのパフォーマンスと解釈可能性を改善するために、ペアワイズなマスタリンクと結び付きのない制約を使用する。
既存の混合整数最適化手法は小規模なデータセットに限られており、実用性は制限されている。
本稿では,必要結合されたサンプルをセントロイドベースの擬似サンプルに分解し,プルーネは幾何学的規則でリンクできない,分解可能な分岐結合フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:01:07 GMT)
Deflanderization for Game Dialogue: Balancing Character Authenticity with Task Execution in LLM-based NPCs [2.3] 本稿では,Commonsense Persona-Grounded Dialogue Challenge (CPDC) 2025 Round 2への参加について報告する。
i) 過剰なロールプレイの抑制とタスクの忠実度向上のためのデフランダライズプロンプト手法を含むAPIトラックの軽量なプロンプト手法と,(ii) Qwen3-14Bと教師付きファインタニング(SFT)とローランド適応(LoRA)を併用したGPUトラックの微調整大型モデルを組み合わせる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 14:03:51 GMT)
On Developers' Self-Declaration of AI-Generated Code: An Analysis of Practices [2.2] この研究は、開発者がAI生成コードの自己宣言に使用する方法を理解することを目的としている。
第1フェーズでは、GitHubからAI生成コードスニペットの613のインスタンスを収集しました。
第2フェーズでは,フォローアップ実践者の調査を行い,有効回答は111件であった。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 00:38:42 GMT)
EEGReXferNet: A Lightweight Gen-AI Framework for EEG Subspace Reconstruction via Cross-Subject Transfer Learning and Channel-Aware Embedding [2.1] 本稿では,クロスオブジェクトAI転送学習によるEEGサブスペース再構築のための軽量フレームワークであるEEGReXferNetを紹介する。
EEGReXferNetは、近隣チャネル間のボリューム伝導、バンド固有の畳み込み符号化、スライディングウィンドウによる動的潜在特徴抽出を採用している。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 02:15:25 GMT)
RejSCore: Rejection Sampling Core for Multivariate-based Public key Cryptography [1.9] RejSCoreは、量子後暗号におけるリジェクションサンプリングのためのハードウェアアクセラレータである。
このアーキテクチャは、AES-CTR-128ベースの擬似乱数生成器を含む。
Artix-7と65nm CMOSでは、RejSCoreは2042スライス、464,866$mu m2$で動作周波数は222MHzと565MHzである。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 12:53:15 GMT)
Position Paper: If Innovation in AI Systematically Violates Fundamental Rights, Is It Innovation at All? [1.9] この立場の論文は、規制とイノベーションは逆である、という確固たる信念に挑戦する。
十分に設計された規制が欠如していることは、既に測定不可能な損害をもたらしている。
規制は思慮深く適応的であり、イノベーションのブレーキではない。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 12:45:53 GMT)
Identifiability of Deep Polynomial Neural Networks [1.8] 多項式ニューラルネットワーク (Polynomial Neural Networks, PNN) は代数的および幾何学的構造を持つ。
彼らの識別可能性 -- 解釈可能性を保証するための重要な特性 -- は、いまだに理解されていない。
本稿では,深部PNNの識別可能性に関する包括的分析を行う。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 21:05:33 GMT)
Culturally Grounded Physical Commonsense Reasoning in Italian and English: A Submission to the MRL 2025 Shared Task [1.7] FormaMentisは、イタリア語と文化に根ざした、物理的な常識推論のための新しいベンチマークである。
FormaMentisのデータサンプルは、イタリアのネイティブスピーカーであり、地元の習慣や規範に精通しているエキスパートアノテータによって作成されます。
サンプルはイタリア語の文脈に特有の文化的要素を保存しながら、英語に翻訳される。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 11:25:03 GMT)
Beyond QA Pairs: Assessing Parameter-Efficient Fine-Tuning for Fact Embedding in LLMs [1.7] 本稿では,質問応答対をFactualクラスとConceptualクラスに分類することで,微調整プロセスの改善に焦点をあてる。
2つの異なるLlama-2モデルはこれらの分類に基づいて微調整され、GPT-3.5 TurboやGeminiのような大型モデルを用いて評価される。
以上の結果から,概念データセットでトレーニングされたモデルは,実データセットでトレーニングしたモデルよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 23:53:26 GMT)
Critical Insights into Leading Conversational AI Models [1.7] Google、High-Flyer、Anthropic、OpenAI、Metaといった企業は、より優れたBig Language Modelを作っている。
今回の調査では、GoogleのGemini、High-FlyerのDeepSeek、ArthropicのClaude、OpenAIのGPTモデル、MetaのLLaMAの5つのトップLLMを比較した。
クロードは道徳的推論に優れており、ジェミニはマルチモーダル能力に優れ、強力な倫理的枠組みを持っている。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 15:57:27 GMT)
DeepVigor+: Scalable and Accurate Semi-Analytical Fault Resilience Analysis for Deep Neural Network [1.6] 我々は,CNNにおける信頼性測定の効率的な代替手段として,スケーラブルで高速かつ高精度な半解析手法であるDeepVigor+を紹介した。
結果は、DeepVigor+がCNNモデルのVFを1%以下の誤差で取得していることを示している。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 14:51:51 GMT)
Graph Neural Network Assisted Genetic Algorithm for Structural Dynamic Response and Parameter Optimization [1.5] 質量(m)、剛性(k)、減衰係数(c)などの構造パラメータの最適化は、効率的で弾力性があり安定した構造を設計するのに重要である。
本研究では,グラフニューラルネットワーク(GNN)サロゲートモデルと遺伝的アルゴリズム(GA)を統合し,これらの課題を克服するハイブリッドデータ駆動フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 21:14:59 GMT)
Structure-preserving contrastive learning for spatial time series [1.5] 空間時系列のコントラスト学習のための構造保存型正規化器を2つ導入する。
1つの正規化器はインスタンス間の類似性を保持し、もう1つは空間次元と時間次元をまたいだ類似性のグラフ幾何学を保存する。
以上の結果から,潜在空間における保存状態の良い類似性構造は,より情報的かつ有用な表現であることが示唆された。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 15:17:05 GMT)
What Work is AI Actually Doing? Uncovering the Drivers of Generative AI Adoption [1.5] 本研究は,本質的なタスク特性が,AIシステムに業務を委譲するユーザの判断を促すかを検討する。
本研究は,実世界の生成AI利用を,本質的なタスク特性の包括的多次元フレームワークに結びつける最初の体系的証拠を提供する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 19:13:37 GMT)
Scalable Neural Decoders for Practical Real-Time Quantum Error Correction [1.5] 我々は,$mathcalO(d2)$の複雑な状態空間モデルであるtextitMambaベースのデコーダを導入,評価する。
Mambaデコーダはスピードと精度のバランスを保ち、スケーラブルでリアルタイムな量子エラー修正のための有望なアーキテクチャである。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 15:49:46 GMT)
Cross-Lingual Stability and Bias in Instruction-Tuned Language Models for Humanitarian NLP [1.4] コストのかかる商用APIに投資するか、多言語人権監視のための無償のオープンウェイトモデルに依存している。
本稿では,商業的およびオープンウェイトな大規模言語モデル (LLM) を,7言語にわたる人権侵害検出のために初めて体系的に比較した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:32:25 GMT)
MedXplain-VQA: Multi-Component Explainable Medical Visual Question Answering [1.4] MedXplain-VQAは、5つの説明可能なAIコンポーネントを統合し、解釈可能な医療画像分析を提供する包括的フレームワークである。
このフレームワークは、細調整されたBLIP-2バックボーン、医療クエリの修正、Grad-CAMの注意の強化、正確な領域抽出、マルチモーダル言語モデルによる構造的連鎖推論を活用する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 19:23:20 GMT)
The Chameleon Nature of LLMs: Quantifying Multi-Turn Stance Instability in Search-Enabled Language Models [1.4] 本稿では,大規模言語モデルにおける「カメレオン行動」に関する最初の体系的研究について述べる。
我々は最先端のシステムに根本的な欠陥を露呈する。
情報源の再使用率と信頼性の相関は統計的に有意である。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 23:59:21 GMT)
Policies over Poses: Reinforcement Learning based Distributed Pose-Graph Optimization for Multi-Robot SLAM [1.4] 多ボットローカライゼーションにおける逐次分散ポーズグラフ最適化(PGO)について検討する。
我々は,PGOをマルコフニューラルネットワーク(GNN)上で定義された部分観測可能なゲームとみなし,各アクションが単一エッジのポーズ推定を洗練させる。
学習者の平均軌道は37.5%減少し,効率は少なくとも6倍向上した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 16:21:24 GMT)
A Multi-faceted Analysis of Cognitive Abilities: Evaluating Prompt Methods with Large Language Models on the CONSORT Checklist [1.2] 本研究では,専門家検証データセットを用いた行動・メタ認知分析手法を適用した。
メトリクスを用いた認知適応と校正誤差の分析:予測誤差(ECE)とベースライン正規化相対誤差(RCE)
以上の結果より, 両モデルとも, 特に臨床ロールプレイング条件下では, 誤診や過信感が顕著であった。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 01:38:30 GMT)
LRW-Persian: Lip-reading in the Wild Dataset for Persian Language [1.2] LRW-ペルシアン(LRW-Persian)は、ペルシア語の単語レベルの読解データセットである。
話者の不一致のトレーニングとテストの分割、広い地域と方言のカバレッジ、リッチなクリック毎のメタデータを提供する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 15:21:42 GMT)
Feature-Guided SAE Steering for Refusal-Rate Control using Contrasting Prompts [1.2] LLM(Large Language Model)デプロイメントでは、LLMが安全でないプロンプトを認識し、安全でないプロンプトに応答しないように指示する必要がある。
これを実現するには、他の高価な手順とともにモデルの重みを調整する必要がある。
我々は,スパースオートエンコーダ(SAE)を用いて,異なるステアリング機能とステアリング強度を用いてソリューションを提供する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:54:30 GMT)
Chitchat with AI: Understand the supply chain carbon disclosure of companies worldwide through Large Language Model [1.0] Carbon Disclosure Project (CDP) は、世界最大規模の気候関連調査のデータセットをホストしている。
本稿では,大規模言語モデル(LLM)を活用して大規模企業における気候開示品質を評価する,新たな意思決定支援フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 01:06:18 GMT)
ATOM: AdapTive and OptiMized dynamic temporal knowledge graph construction using LLMs [1.0] ATOMは、構造化されていないテキストからTKG(Temporal Knowledge Graphs)をビルドし、継続的に更新する。
ATOMは、ベースライン法に比べて18%高い排気率、17%の安定性、90%以上の遅延低減を実現している。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 09:10:26 GMT)
Blockchain Signatures to Ensure Information Integrity and Non-Repudiation in the Digital Era: A comprehensive study [0.8] これはトランザクションオーサシップの否定を防ぎ、記録されたデータの整合性をサポートする。
この研究は、ブロックチェーンプラットフォームで使用されるデジタルシグネチャスキームを調査し、非監査の実施方法を分析する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 07:39:55 GMT)
Combining Deep Learning and Explainable AI for Toxicity Prediction of Chemical Compounds [0.8] 本研究では,化学構造の2次元グラフィカル表現を処理するDenseNet121に基づく新しい画像ベースパイプラインを提案する。
我々は、モデル予測を解釈し、毒性分類に寄与する分子領域を強調するために、説明可能なAI技術であるGrad-CAM視覚化を用いる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:05:11 GMT)
Cohort-attention Evaluation Metric against Tied Data: Studying Performance of Classification Models in Cancer Detection [0.7] 本稿では,これらの課題に対処するコホート・アテンション評価指標(CAT)フレームワークを提案する。
CATは患者レベルの評価、エントロピーに基づく分布重み付け、コホート重み付けの感度と特異性を導入している。
このアプローチは予測信頼性、公正性、解釈可能性を高め、AI駆動型医療スクリーニングモデルの堅牢な評価方法を提供する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 03:34:12 GMT)
SpoofTrackBench: Interpretable AI for Spoof-Aware UAV Tracking and Benchmarking [0.7] SpoofTrackBenchは、リアルタイムローカライゼーションとトラッキング(RTLS)システムにおける対向的ロバスト性を評価するためのモジュラーベンチマークである。
我々は, ドリフト, ゴースト, ミラー型スプーフィング攻撃をシミュレートし, JPDA (Joint Probabilistic Data Association) とGNN (Global Nearest Neighbor) アーキテクチャを用いてトラッカー性能を評価する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 15:54:16 GMT)
Cross-Species Transfer Learning in Agricultural AI: Evaluating ZebraPose Adaptation for Dairy Cattle Pose Estimation [0.7] 本研究は,異種間移動学習の可能性と限界を評価する。
本研究では,シマウマの実環境下での乳牛の27キーポイント検出のために,人工ゼブラ画像に基づいて訓練された視覚トランスフォーマーモデルを適用した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 10:31:22 GMT)
A Review of End-to-End Precipitation Prediction Using Remote Sensing Data: from Divination to Machine Learning [0.7] 降水予測は、占いと観測に根ざした初期の象徴的・経験的な方法から、大気物理学と人工知能に基づく近代技術へと、大きな変化を遂げた。
このレビューは、古代の慣行、気象学の基礎、数値天気予報(NWP)の台頭、機械学習(ML)モデルとディープラーニング(DL)モデルの出現にまたがる降水予測技術の歴史的・技術的進化を辿る。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 22:14:07 GMT)
Human-Centred Evaluation of Text-to-Image Generation Models for Self-expression of Mental Distress: A Dataset Based on GPT-4o [0.7] 心的苦痛の自己表現を支援するためのAI生成画像の有効性を評価する。
英国大学で勉強している20人の中国人留学生が、精神的な苦痛に関する個人的な経験を説明するために招待された。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:30:52 GMT)
Estimation of Fireproof Structure Class and Construction Year for Disaster Risk Assessment [0.7] 建設年や構造タイプといった重要な建築メタデータは、しばしば欠落または時代遅れである。
本研究では,これらの属性をファサード画像から予測するマルチタスク学習モデルを提案する。
本研究では,日本の住宅画像の大規模データセットを用いてモデルを訓練し,評価した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:54:41 GMT)
Painless Federated Learning: An Interplay of Line-Search and Extrapolation [0.6] フェデレートラインサーチ(FedSLS)アルゴリズムを導入し、予測における決定論的レートを達成することを示す。
FedSLSは、部分的なクライアント参加であっても目的に対して線形収束を提供する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 06:43:20 GMT)
Quantum matched filtering: breaking time-energy separability by 12 orders of magnitude [0.6] 時間エネルギーの絡み合った光子は、最小限の時間差と周波数和で同時に相関することができる。
我々は、極端に時間エネルギーの絡み合った双光子を作成し、12等級の古典的分離性に反する時間差と周波数の相対的不確かさを測定する。
我々の実験と支持理論は、量子照明(レーダー)のような量子センシング応用の道を開く。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 03:58:26 GMT)
UCINet0: A Machine Learning based Receiver for 5G NR PUCCH Format 0 [0.6] The Uplink Control Information (UCI) on the Physical Uplink Control Channel (PUCCH) is essential to enable 5G wireless links。
本稿では,PUCCH Format 0に対するAI/MLベースの受信機設計について検討する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 15:11:18 GMT)
Integrating Linguistics and AI: Morphological Analysis and Corpus development of Endangered Toto Language of West Bengal [0.6] 本稿では,トリンガル(トト・バングラ・英語)言語学習アプリケーションの開発を目的としたプロジェクトの一部である。
インド・西ベンガルの絶滅危惧言語であるトト語をデジタルでアーカイブし、推進することを目的としている。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 11:22:46 GMT)
A Critical Study on Tea Leaf Disease Detection using Deep Learning Techniques [0.5] 提案手法は,3種類の茶葉疾患を分類できるディープラーニング技術である。
レッド・ラスト(Red Rust)、ヘロペルティス(Helopeltis)、レッド・スパイダー・マイト(Red Spider mite)である。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 12:18:15 GMT)
FAARM: Firmware Attestation and Authentication Framework for Mali GPUs [0.5] 最近の研究で、GPU Trusted Execution Environments(TEEs)に侵入する最初の実用的な攻撃であるMOLEが明らかにされた。
本稿では,MOLEスタイルのファームウェアのサブバージョンを防止する軽量で暗号的なフレームワークであるFAARMを提案する。
FAARMは悪意のあるファームウェアインジェクションを確実に検出し、ブロックし、使用前に改ざんされたイメージを拒否し、検査後の試行を拒否する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 07:46:27 GMT)
When Intelligence Fails: An Empirical Study on Why LLMs Struggle with Password Cracking [0.4] 本研究では,事前学習した大規模言語モデルによるパスワードクラッキングの有効性を,合成ユーザプロファイルを用いて実証的に検証する。
我々は,構造化されたユーザ属性に基づいて,有意なパスワードを生成するように促すことで,最先端のオープンソースLCMの性能を評価する。
Hit@1、Hit@5、Hit@10の測定結果から、すべてのモデルがHit@10で1.5%未満の精度で、一貫してパフォーマンスが低下していることが分かりました。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 07:40:35 GMT)
From Flows to Words: Can Zero-/Few-Shot LLMs Detect Network Intrusions? A Grammar-Constrained, Calibrated Evaluation on UNSW-NB15 [0.4] 大規模言語モデル(LLM)は自然言語入力を推論できるが、微調整なしでの侵入検出におけるそれらの役割は未だ不明である。
本研究では、各ネットワークフローをコンパクトなテキストレコードに変換し、軽量でドメインにインスパイアされたフラグで拡張することで、プロンプトオンリーなアプローチを評価する。
ゼロショット,命令誘導,スプリットショットを比較して,同一のスプリット下での強い神経ベースライン,精度,精度,リコール,F1,マクロスコアを比較した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 07:42:39 GMT)
Performance and Generalizability Impacts of Incorporating Location Encoders into Deep Learning for Dynamic PM2.5 Estimation [0.4] 動的・空間的不均一な応用のための深層学習における位置情報の効果について検討する。
日表面PM2.5を衛星観測と地上観測により推定した。
以上の結果から,空間一般化の支援により,原座標は領域内の性能を向上させることができるが,領域間の一般化性は低下することが示された。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:14:45 GMT)
Sentra-Guard: A Multilingual Human-AI Framework for Real-Time Defense Against Adversarial LLM Jailbreaks [0.3] Sentra-Guardは、大規模言語モデル(LLM)のためのリアルタイムモジュールディフェンスシステムである。
このフレームワークは、FAISSにインデックスされたSBERT埋め込み表現とハイブリッドアーキテクチャを使用して、プロンプトの意味をキャプチャする。
直接攻撃ベクトルと難解攻撃ベクトルの両方において、敵のプロンプトを識別する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 11:19:47 GMT)
CLIN-LLM: A Safety-Constrained Hybrid Framework for Clinical Diagnosis and Treatment Generation [0.3] LLM(Large Language Model)ベースのシステムは、しばしば医学的な根拠がなく、不確実性を定量化できない。
CLIN-LLMは,マルチモーダル患者エンコーディング,不確実性校正疾患分類,検索・拡張治療生成を統合した安全拘束型ハイブリッドパイプラインである。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 10:11:53 GMT)
Semantic-Preserving Cross-Style Visual Reasoning for Robust Multi-Modal Understanding in Large Vision-Language Models [0.3] Semantic-Preserving Cross-Style Visual Reasoner (SP-CSVR)は、安定なセマンティック理解と適応的なクロススタイル視覚推論のための新しいフレームワークである。
SP-CSVRは、スタイル内容の不整合のためのCSFE(Cross-Style Feature)、効率的な小ショットスタイル適応のためのSAICD(Semantic-Aligned In-Context Decoder)、クロススタイルのセマンティック不変性を実装するための適応セマンティック一貫性モジュール(Adaptive Semantic Consistency Module)を統合する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 21:11:46 GMT)
SWAN: Self-supervised Wavelet Neural Network for Hyperspectral Image Unmixing [0.3] 本稿では,3段階の自己教師型ウェーブレットニューラルネットワークSWANについて紹介する。
この考え方は、自己教師付き学習パラダイムを用いて得られた不変かつ共変な特徴から潜在対称性を利用する。
信号対雑音比の異なる2つのベンチマーク合成データセットと3つの実ベンチマークハイパースペクトルデータセットで実験を行った。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 10:05:48 GMT)
Benchmarking ResNet for Short-Term Hypoglycemia Classification with DiaData [0.3] 本研究では,2510名の被験者からT1Dのグルコース値を含む15種類のデータセットを統合することで,DiaDataのデータ品質を向上する。
品質改善データを使用しながら、より多くのデータによるトレーニングによってパフォーマンスが7%向上し、生データに比べて2~3%向上する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 18:29:16 GMT)
ConMatFormer: A Multi-attention and Transformer Integrated ConvNext based Deep Learning Model for Enhanced Diabetic Foot Ulcer Classification [0.2] ConMatFormerは,ConvNeXtブロック,マルチアテンション機構,トランスフォーマーモジュールを組み合わせた,新しいハイブリッドディープラーニングアーキテクチャである。
テストの結果、ConMatFormerは精度、信頼性、柔軟性の観点から、最先端(SOTA)畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)モデルを上回った。
DFU分類のための新しいベンチマークを設定し,医用画像解析のためのハイブリット・アテンション・トランスフォーマー・フレームワークを提供する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 16:34:43 GMT)
Dynamic financial processes identification using sparse regressive reservoir computers [0.2] 本稿では,構造行列近似理論における重要な知見と動的金融プロセスの回帰表現への応用について述べる。
これらのアルゴリズムは、原型的動的金融・経済プロセスの近似的同定と予測シミュレーションに応用して実証される。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:04:40 GMT)
Towards Piece-by-Piece Explanations for Chess Positions with SHAP [0.2] 我々はSHAP(SHapley Additive exPlanations)に適応し、チェスエンジンの評価をボード上の特定の部品に割り当てる。
部品を特徴として扱い、それらを体系的に非難することにより、エンジンの出力を説明する追加的、部品ごとのコントリビューションを計算する。
この手法は古典的なチェスの教育からインスピレーションを得ており、プレイヤーは駒を精神的に取り除くことで位置を評価する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 09:07:21 GMT)
AI & Data Competencies: Scaffolding holistic AI literacy in Higher Education [0.1] この章では、フレームワークの開発プロセス、構造、実装のための実践的戦略について概説している。
このフレームワークは、学生の総合的なAIリテラシーを開発するためのロードマップを提供することで、学習者が学術的および専門的な文脈において生成的なAI能力を活用できるように準備する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 22:56:08 GMT)
Low-Resource Dialect Adaptation of Large Language Models: A French Dialect Case-Study [0.0] タイトなデータと計算予算に基づく方言学習における継続事前学習(CPT)の利用について検討した。
我々は、非常に小さなデータセットを使用してQu'ebecフランス語方言に3つの大きな言語モデルを適用し、それらをCOLEスイートでベンチマークする。
実験では, モデルパラメータの1%以下を更新した名声言語ベンチマークにおいて, 最小回帰によるマイノリティ弁証法の改良を実証した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 16:49:06 GMT)
ZK Coprocessor Bridge: Replay-Safe Private Execution from Solana to Aztec via Wormhole [0.0] 我々は、SolanaプログラムがAztec L2上でプライベートな実行を要求することができるクロスドメイン「ZKコプロセッサブリッジ」を形式化する。
我々は、状態マシン、メッセージフォーマット、リプレイセーフティ、オリジン認証、ファイナリティアライメント、パラメータバインディング、プライバシ、イデオロジェンス、ライブネスのための証明スケッチを提示する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:06:56 GMT)
Women upskilling or reskilling to an ICT career: A systematic review of drivers and barriers [0.0] このレビューは、女性が技術に焦点を絞ったSTEMキャリアにスキルをアップまたはリスキルする可能性に焦点を当てる。
発見は、最初のキャリアにおける不満と、職場でのポジティブなコンピューティング経験の組み合わせが、コンピューティングに対する関心を損なう可能性があることを示している。
女性のコンピュータに対する関心を生かして、技術系労働者の増員と多様化が可能である。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 03:13:11 GMT)
Will Humanity Be Rendered Obsolete by AI? [0.0] 本稿では、人工知能(AI)が人間にもたらす存在リスクを分析し、現在のAIから超知能への軌道を辿る。
機械の指数関数的に増大する認知力と仮説IQを考えると、人類をはるかに超越した知能の倫理的および実在的な含意に対処する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:02:04 GMT)
Wearable Sensor-Based IoT XAI Framework for Predicting Freezing of Gait in Parkinsons Disease [0.0] この研究は、Cataboost、XGBoost、Extra Treesといった機械学習(ML)アルゴリズムを用いて、臨床データに基づく正確なFOG分類を研究する。
開発されたセンサーベースの技術は、医療とバイオメディカルテクノロジーの強化の分野で現実世界の問題解決に大きな可能性を秘めている。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:30:09 GMT)
Unsupervised Document and Template Clustering using Multimodal Embeddings [0.0] 本研究では,凍結したマルチモーダルエンコーダと古典的クラスタリングアルゴリズムを用いて,文書のカテゴリとテンプレートレベルの両方における教師なしクラスタリングについて検討する。
テキストのみ,レイアウト対応,ビジョン対応,ビジョン対応の8つのエンコーダを$k$-Means,DBSCAN,HDBSCAN + $k$-NN,BIRCHで評価し,クリーンな合成請求書を5つのコーパスに分けた。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:20:07 GMT)
The Thermodynamics of the Gravity from Entropy Theory: from the Hamiltonian to applications in Cosmology [0.0] エントロピーからの重力(GfE)の作用は、重力の基本的な性質が自由度のメートル法で符号化された情報であると仮定する。
ここでは、この理論と関連するハミルトニアンを導出するために熱力学的な視点を取り入れる。
単位体積の総 GQRE は相対エントロピーの性質と一致しているが、フリードマン宇宙の総エントロピーは時間とともに減少しない。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:52:15 GMT)
The Impact of Artificial Intelligence on Strategic Technology Management: A Mixed-Methods Analysis of Resources, Capabilities, and Human-AI Collaboration [0.0] この研究はAIベースの戦略的技術管理(AIbSTM)の概念フレームワークを紹介している。
自律的なAIリーダーシップのビジョンとは対照的に、この研究は最も有効な軌道は人間中心の増強であることを示した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 17:34:08 GMT)
The Gravitational Aspect of Information: The Physical Reality of Asymmetric "Distance" [0.0] ブラウン橋が物理的に正準に制約されているとき、その時間発展はガウス分布の統計多様体上の m-測地線と同一となることを示す。
この発見は、自由粒子が測地線に従う一般相対性理論と同様に、情報の幾何学によって定義される「純粋にランダムな過程も直線に従う」という強い証拠を与える。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:02:07 GMT)
Text to Trust: Evaluating Fine-Tuning and LoRA Trade-offs in Language Models for Unfair Terms of Service Detection [0.0] 大規模言語モデル (LLM) はテキスト理解に変化をもたらしたが、専門の法域への適応は、完全な微調整のコストによって制限されている。
本研究は、サービス規約(ToS)文書において、微調整、パラメータ効率適応(LoRA、QLoRA)、不公平な節検出のためのゼロショットプロンプト戦略を体系的に評価する。
CLAUDETTE-ToSベンチマークとMultilingual Scraper Corpusの実験では、完全な微調整が最大の精度のリコールバランスを達成する一方、LoRAベースのモデルは最大3倍のメモリコストで競合リコールを提供する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:46:06 GMT)
Tailoring Chatbots for Higher Education: Some Insights and Experiences [0.0] 本報告ではスイスの特定の技術大学であるチューリッヒ工科大学(ETH Zurich)の知見と経験について述べる。
大規模言語モデルとは、高等教育機関の実践的な用語で何を意味するかを記述する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:58:22 GMT)
TABL-ABM: A Hybrid Framework for Synthetic LOB Generation [0.0] 近年、深層学習モデルの金融取引への応用により、高忠実度金融時系列データの必要性が高まっている。
生成的アプリケーションのための最先端のモデルは、しばしば大量の歴史的データと大規模で複雑なモデルに依存している。
エージェントベースのリミットオーダーブックダイナミクスのモデリングアプローチもまた、トレーディングアクティビティを再現することができる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 14:04:49 GMT)
Statistical mechanical mapping and maximum-likelihood thresholds for the surface code under generic single-qubit coherent errors [0.0] 曲面符号における単一量子コヒーレント誤差、すなわち任意に選択できる軸に関する角度$alpha$による回転を考える。
回転軸の部分空間をグラフ化し、対応する最大値の閾値を$alpha_mathrmth$と見積もる。
誤差補正フェーズである $alphaalpha_mathrmth$ は、ギャップ付き1次元量子ハミルトニアンへの遷移行列空間に対応することが示されている。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 11:11:46 GMT)
Sparsity and Superposition in Mixture of Experts [0.0] 我々は,MoEモデルを同一のレンズでメカニカルに説明できないことを示す。
特徴の疎さも特徴の重要さも相変わらずの相違の原因にはならない。
本稿では,負荷分散ではなく,単意味的特徴表現に基づく専門家専門化の新たな定義を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 22:44:35 GMT)
Sink equilibria and the attractors of learning in games [0.0] 1$1の予想は偽であることを示す。
制限行動の特徴付けはゲーム理論における最も基本的なオープンな問題の一つである。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 21:18:47 GMT)
Single-photon superradiance and subradiance in helical collectives of quantum emitters [0.0] 2レベル系(TLS)の分布からの光の集合放出は、1954年にロバート・ディック(Robert Dicke)によって初めて予測された。
我々は、単一光子とTLSの連続分布との相互作用に対する集団崩壊率とラムシフトに関する新しい解析式を導出した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 00:52:17 GMT)
Sensitive detection of the Rydberg transition in trapped electrons on liquid helium using radio-frequency reflectometry [0.0] 我々は、液体ヘリウム上に閉じ込められた電子の量子化された運動状態(ライドバーグ)の励起を検出するために、高周波反射法を用いている。
その結果、ライドバーグ共鳴に対する観測された反応はマイクロ波励起電子の側方運動によるものでなければならないことが示唆された。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 10:18:35 GMT)
SPIRAL: Self-Play Incremental Racing Algorithm for Learning in Multi-Drone Competitions [0.0] 本稿では,マルチエージェントレースにおける自律ドローンのトレーニング手法であるSPIRALを紹介する。
SPIRALは、複雑なレースの振る舞いを漸進的に培養するセルフプレイ機構を特有に採用している。
本手法は汎用性のために設計されており,最先端のDeep Reinforcement Learning (DRL)アルゴリズムと統合可能である。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 07:59:44 GMT)
Reducing Ion Heating in Quantum Computing: A Novel 3D-Printed Micro Ion Trap with Skeleton Structure [0.0] 電界誘起イオン加熱は、スケーラブルなトラップイオン量子コンピューティングにおいて大きな障害となる。
イオン近傍の表面積を最小化することで加熱を最小化するスケルトン電極構造を有する新しい3Dプリントイオントラップを提案する。
閉包パラメータが同一の従来のブレードトラップと比較して,スケルトントラップは総加熱速度を50%以上低減する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 15:53:27 GMT)
RAMAN: Resource-efficient ApproxiMate Posit Processing for Algorithm-Hardware Co-desigN [0.0] この研究は、リソース効率が高く近似的なposit(8,2)ベースのMultiply-Accumulate (MAC)アーキテクチャであるRAMANを提示する。
提案するREAP MACエンジンはRAMANのコアであり,ポジット乗算器の近似を用いて,大幅な面積と消費電力削減を実現する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 11:09:06 GMT)
Quanvolutional Neural Networks for Pneumonia Detection: An Efficient Quantum-Assisted Feature Extraction Paradigm [0.0] 肺炎は、正確でタイムリーな診断を必要とする、重要な世界的な健康問題を引き起こす。
深層学習、特に畳み込みニューラルネットワーク(CNN)は、肺炎検出のための医療画像解析において有望であることを示している。
CNNは高い計算コスト、特徴表現の制限、より小さなデータセットから一般化する際の課題に悩まされることが多い。
本稿では,肺炎検出のためのPneumoniaMNISTデータセットを用いた新しいハイブリッド量子古典モデルを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:01:34 GMT)
Quantum Machine Learning for Image Classification: A Hybrid Model of Residual Network with Quantum Support Vector Machine [0.0] 本研究では,特徴抽出にResNet-50,ポテト病検出にQuantum Support Vector Machines(QSVM)を用いたハイブリッド手法を提案する。
本研究では,ResNet-50を用いて,ポテト病のRGB画像から深い特徴表現を抽出し,主成分分析(PCA)を用いて次元化を図った。
実験の結果、Z-Feature MapベースのQSVMは古典的なモデルよりも優れており、99.23パーセントの精度でSVMとRFモデルを上回っていることがわかった。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 07:52:53 GMT)
Quantum Information Meets High-Energy Physics: Probing Neutrinos and Beyond [0.0] レビューでは、デコヒーレンス効果や非伝統的なニュートリノ振動パターンが、ディラックやマヨラナのニュートリノの性質や潜在的なCPT違反などの基本的な性質を如何に明らかにするかを強調している。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 10:59:34 GMT)
Quantum Bit Threads and the Entropohedron [0.0] ホログラフィックエンタングルメントエントロピーのための新しい量子ビットスレッド処方則を導出する。
我々の新しい処方は、ベクトル場に基づくものや、バルク曲線の測度に基づくものなど、多種多様である。
我々はまた、絡み合った島や赤ちゃんの宇宙の存在下で、ビットスレッドがどのように振る舞うかを探求する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 09:34:24 GMT)
Qlustering: Harnessing Network-Based Quantum Transport for Data Clustering [0.0] 我々は、ネットワークベースの量子トランスポートを利用してデータクラスタリングを行う、教師なし学習のための量子インスピレーション付きアルゴリズムであるQlusteringを紹介する。
データはリンドブラッド方程式によって支配される定常結合ハミルトン電流の入力状態として符号化される。
我々はQlusteringを、合成データセット、ローカライゼーション問題、実世界の化学データに基づいてベンチマークする。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 15:55:01 GMT)
Pulsar Detection with Deep Learning [0.0] この論文は、アレイによる特徴と画像診断を融合させる無線パルサー候補選択のためのディープラーニングパイプラインを構築する。
約500GBのGMRTデータから、原電圧はフィルタバンクに変換され、その後分散試験によって分散され、折り畳まれる。
各候補は、4つの診断プロファイル、時間対位相、サブバンド対位相、DM曲線を配列と画像として表現する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:12:45 GMT)
Pulling Back the Curtain: Unsupervised Adversarial Detection via Contrastive Auxiliary Networks [0.0] 本稿では,補助的特徴表現内での敵対行動を明らかにするために,補助的コントラストネットワーク(U-CAN)による教師なし敵検出を提案する。
本手法は、既存の非教師付き対向検出手法を超越し、4つの異なる攻撃方法に対して優れたF1スコアを達成している。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 09:49:49 GMT)
Physical origins and limitations of canonical quantum measurement behavior [0.0] 正準量子計測行動の物理的起源と限界に関する私の研究をレビューし、強化します。
私の分析は、実験によって支持される創発的で近似的なボルン則につながり、非常に小さな確率密度で分解する可能性がある。
同様の図は、ガイガーカウンタ、スターン・ゲルラッハの実験、超伝導量子ビットなど、他の測定シナリオにも当てはまると私は主張する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 12:54:50 GMT)
Personal Care Utility (PCU): Building the Health Infrastructure for Everyday Insight and Guidance [0.0] 生涯健康指導のためのサイバーネティックシステムとして,PCU(Personal Care Utility)を提案する。
PCUは環境に適応したコンパニオンとして機能し、日々の生活の中で健康を観察し、解釈し、指導する。
この新たなパラダイムのアーキテクチャ、設計原則、実装上の課題について説明する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 09:43:33 GMT)
PerCoR: Evaluating Commonsense Reasoning in Persian via Multiple-Choice Sentence Completion [0.0] PerCoRは、コモンセンス推論のための最初の大規模なペルシア語のベンチマークである。
PerCoRには、40以上のニュース、文化、その他のWebソースから引き出された106Kの多重選択文補完問題が含まれている。
本稿では,コヒーレントな文補完ペアを生成するための協調型セグメンテーション手法を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 10:25:02 GMT)
PT symmetry and the square well potential: Antilinear symmetry rather than Hermiticity in scattering processes [0.0] 実ポテンシャルを持つハミルトニアンは、有界な状態で動作するときにエルミート作用素として作用する。
散乱状態は二乗可積分ではなく デルタ関数の正規化です
実ポテンシャルを持つ非相対論的平方井問題は、有界領域と散乱領域の両方においてPT$対称性を持つことを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:11:59 GMT)
Open harmonic chain without secular approximation [0.0] オープン量子系における粒子輸送とエネルギー輸送について検討する。
開鎖の正確なダイナミクスと、そのいわゆる局所的および大域的マルコフ近似を考える。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 09:26:48 GMT)
On the Structure of Floating-Point Noise in Batch-Invariant GPU Matrix Multiplication [0.0] 浮動小数点非連想性は、行列乗法(本質的に非決定論的)のような基本的な深層学習操作を生成する。
一般的な作業上の仮定は、これらの誤差は独立かつ同一に分散されたガウスノイズとして振る舞うことである。
本稿では,この仮定を実証的に検証し,実際のGPU動作を記述できないことを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:18:49 GMT)
Multi-Modal Fact-Verification Framework for Reducing Hallucinations in Large Language Models [0.0] 大規模言語モデルは、妥当に聞こえる偽情報を生成する。
この幻覚問題は、これらのモデルを現実世界のアプリケーションにデプロイする上で大きな障壁となっている。
我々は,これらのエラーをリアルタイムでキャッチし,修正する事実検証フレームワークを開発した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 16:58:54 GMT)
Multi-Agent Regime-Conditioned Diffusion (MARCD) for CVaR-Constrained Portfolio Decisions [0.0] 本稿では, (i) 潜伏状態を予測するガウスHMM, (ii) 条件付きシナリオを生成する拡散生成器, (iii) 混合, 縮小モーメントによる信号抽出, (iv) 制御されたCVaRエピグラフプログラムについて述べる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 17:01:31 GMT)
Measuring and Analyzing Intelligence via Contextual Uncertainty in Large Language Models using Information-Theoretic Metrics [0.0] 本稿では,任意のモデルに対して定量的な認知プロファイルを構築するタスク非依存手法を提案する。
このプロファイルはエントロピー・ディケー・カーブ(Entropy Decay Curve)を中心に構築されている。
また,情報ゲイン・スパン (IGS) を1つの指標として提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 00:32:31 GMT)
MIN-Merging: Merge the Important Neurons for Model Merging [0.0] MIN-Mergingはルータベースのフレームワークで、これらの衝突を減らすために最も重要なニューロンを選択的にマージする。
我々は、MIN-Mergingがドメイン内タスクにおいて一貫したゲインを達成し、ドメイン外タスク上で事前訓練されたモデルの一般化能力を維持していることを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 11:00:04 GMT)
MI9: An Integrated Runtime Governance Framework for Agentic AI [0.0] エージェントAIシステムの安全性とアライメントのための、最初の完全に統合されたランタイムガバナンスフレームワークであるMI9を紹介します。
MI9は、エージェントリスクインデックス、エージェントセマンティックテレメトリキャプチャー、継続的な認可監視、FSM(Finite-State-Machine)ベースのコンフォーマンスエンジン、目標条件ドリフト検出、および段階的封じ込め戦略の6つの統合コンポーネントを通じてリアルタイム制御を導入している。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 01:22:58 GMT)
Long-Term PM2.5 Forecasting Using a DTW-Enhanced CNN-GRU Model [0.0] PM2.5濃度の長期予測は、公衆衛生早期警戒システムにとって重要である。
既存のディープラーニングアプローチは、48時間を超えて予測安定性を維持するのに苦労している。
本稿では,知的ステーション類似度選択のためのDTWとCNN-GRUアーキテクチャを組み合わせたフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 23:04:10 GMT)
Logical GANs: Adversarial Learning through Ehrenfeucht Fraisse Games [0.0] GANは区別不能を約束する、とロジックは説明する。
textbfLOGAN (LOGical GANs)は、識別器をdeep-k$Ehrenfeucht--Fra"iss'e (EF) emphOpponentとしてキャストする
EFプローブシミュレータとMSOスタイルのグラフチェッカーである最小限のツールキットと、PyTorchによる実際の神経GANトレーニングを含む4つの実験を出荷しています。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:34:00 GMT)
LLM Agents for Generating Microservice-based Applications: how complex is your specification? [0.0] マイクロサービスベースのアプリケーションのためのコード合成について検討する。
仕様の難易度を評価するための指標を提案する。
スコアが高くなればなるほど、仕様のためのコードを生成するのが難しくなります。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 14:39:52 GMT)
Krylov Complexity and Mixed-State Phase Transition [0.0] 我々はデコヒーレンスと量子複雑性を結合する統一的な枠組みを確立する。
密度行列を二重ヒルベルト空間の純粋な状態にベクトル化することにより、デコヒーレンス過程は虚時間発展にマッピングされる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 05:46:34 GMT)
Koopman Eigenfunction-Based Identification and Optimal Nonlinear Control of Turbojet Engine [0.0] ガスタービンエンジンは複雑で非線形な力学系である。
物理ベースのモデルを導出するのは、必ずしも利用できないパフォーマンス特性を必要とするため、難しい場合があります。
本稿では,コンポーネントレベルおよび局所線形パラメータ変動モデルの導出に用いる従来の実験手法の限界について論じる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 12:19:00 GMT)
Interpreting and Mitigating Unwanted Uncertainty in LLMs [0.0] 大規模言語モデル(LLM)は、前もって正しい回答を間違ったものに変更する。
この行動は信頼を損なうものであり、高い領域で深刻なリスクを引き起こす。
Needle-in-a-Haystack検索フレームワークに適応し、Flipスタイルの再評価プロンプトを統合して、現実的な回答フリッピングシナリオをシミュレートする。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 23:16:59 GMT)
Hopf Exceptional Points [0.0] ホップ不変量によって保護されるホップ例外点のクラスを導入する。
球面の高次ホモトピー群に基づいて、非エルミート位相を持つ多重折りたたみ HEP と対称性保護 HEP の存在を予測する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:23:16 GMT)
HRM-Agent: Training a recurrent reasoning model in dynamic environments using reinforcement learning [0.0] 我々は,HRMが動的かつ不確実な迷路環境において,目標への移動を学べることを示す。
近年の研究では、HRMの推論能力はその再帰的推論プロセスに由来することが示唆されている。
本研究では, 再帰的推論プロセスのダイナミクスを探求し, 初期の環境時間ステップから計算を再利用していることを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 21:01:04 GMT)
Generation and Detection of Hyperentangled Bell States at an Ultra-High Flux [0.0] 広帯域双光子を用いた超高密度偏光ベル状態の生成と検出を実証する。
偏光のベル状態は2状態の絡み合いの最も基本的な形態を具現化し、通信とセンシングの量子プロトコルの重要な構成要素である。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:33:26 GMT)
Exactly solvable dissipative dynamics and one-form strong-to-weak spontaneous symmetry breaking in interacting two-dimensional spin systems [0.0] マルコフ環境に結合した相互作用するガンマ行列のスピンモデルの散逸ダイナミクスについて検討する。
定常状態と緩和ダイナミクスは、基礎となるグラフの選択から定性的に独立であることを示す。
我々の研究は、物質の非平衡量子相を探索する分析的に抽出可能な枠組みを確立する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 23:14:38 GMT)
Energy-Based Coarse-Graining in Molecular Dynamics: A Flow-Based Framework without Data [0.0] 粗粒モデル(CG)は分子シミュレーションの複雑さを減らす効果的な経路を提供する。
本稿では,全原子ボルツマン分布を直接対象とするCGのための完全データフリーな生成フレームワークを提案する。
本手法はボルツマン分布のすべてのモードを捕捉し、原子配置を再構成し、自動的に物理的に意味のあるCG表現を学習することを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:00:52 GMT)
Emergent Mixed States for Baby Universes and Black Holes [0.0] 我々は、大質量双対が赤ちゃんの宇宙やブラックホールを含む場合、AdS/CFT双対性に大きな$N$制限の状態列を研究する。
我々は、$N$以上の適切な平均値が混合状態への収束につながることを発見した。
関連環は非自明な可換体を持ち、ベビー宇宙の作用素と解釈できる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:50:40 GMT)
Do Stop Me Now: Detecting Boilerplate Responses with a Single Iteration [0.0] 大規模言語モデル(LLM)は、しばしばボイラープレート応答を生成する重要な計算資源を消費する。
本稿では,単一生成段階の後に応答を検出するための簡易かつ高効率な手法を提案する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 13:43:56 GMT)
Dirac Equation and Representation Dependent Scattering Phenomena [0.0] スピンフリップ確率はスカラーポテンシャルの相対論的状態において出現し、標準ディラック表現には存在しないことを示す。
我々は、伝達 T と反射 R 係数がクリフォード代数の選択された表現に依存することを示した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 23:37:45 GMT)
Curriculum-Based Iterative Self-Play for Scalable Multi-Drone Racing [0.0] CRUISEはマルチドローンレースのための強化学習フレームワークである。
プログレッシブな難易度カリキュラムと効率的なセルフプレイ機構を組み合わせることで、堅牢な競争行動を促進する。
プランナーの平均レース速度を2倍近く達成し、高い成功率を維持し、エージェント密度が増加するにつれて堅牢なスケーラビリティを示す。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:03:06 GMT)
Control of Valence Electron Motion in Xe Cation Using Stimulated Raman Adiabatic Passage Technique [0.0] いわゆる分数的STIRAP(f-STIRAP)の一般化を提案する。
ウェーブパケット中の量子状態の混合比を正確に制御する。
我々は、クセノン陽イオンのスピン軌道分割基底電子状態における超高速電荷移動を制御するために、開発技術を適用した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 23:57:18 GMT)
Comparing regularisation paths of (conjugate) gradient estimators in ridge regression [0.0] 線形回帰において,勾配勾配,勾配流,共役勾配をペナル化リッジ基準を最小化するための反復アルゴリズムとして検討する。
明示的な非標準誤差分解により、共役勾配の予測誤差を、変換された指標における勾配流の対応する予測誤差によって制限することができる。
このように、共役勾配反復の正則化経路全体に沿ったリスクは、勾配流やリッジ回帰のような標準線形メソッドの正則化経路と比較することができる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 08:59:07 GMT)
Collaborative LLM Agents for C4 Software Architecture Design Automation [0.0] 本研究は,ソフトウェアアーキテクチャの自動設計とその評価手法に寄与する。
我々は,C4ソフトウェアアーキテクチャモデルを自動生成するLLMベースのマルチエージェントシステムを提案する。
5つの標準的なシステムブリーフでテストされたこのワークフローは、高速なC4モデル生成、高いコンパイル成功の維持、セマンティック忠実性の提供を実証する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 18:43:59 GMT)
Civic Ground Truth in News Recommenders: A Method for Public Value Scoring [0.0] 本稿では,ニュースレコメンデーションシステムに市民価値を埋め込む手法を提案する。
提案する市民的真実のアプローチは,全国的に代表される調査を通じて,価値に基づくラベルを作成することを目的としている。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 23:16:51 GMT)
Barriers to Integrating Low-Power IoT in Engineering Education: A Survey of the Literature [0.0] 低消費電力IoT(Internet of Things)技術は、学生が理論を実際のアプリケーションに接続するのを助けるツールとして、工学教育においてますます重要になっている。
本稿では,これらの障壁を理解するための最近の研究をレビューし,これらを技術・組織・教育・教育の3つのグループに分類する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:14:45 GMT)
Analog Hawking radiation emitted by a perfectly reflecting mirror [0.0] アインシュタインの鏡に基づく反射周波数と運動量の研究は、波動方程式の標準的な解法の代わりに行われる。
ホーキング光子収量は、Nsimeq 16$/laser shotと推定される。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 11:43:19 GMT)
An Empirical Study of Bitwise Operators Intuitiveness through Performance Metrics [0.0] 本研究は,様々なプログラミング背景を持つ人々がビットワイズ演算子をどのように理解しているかを評価するために,実験対象内設計を用いる。
OR, NOT, left Shiftなどの演算子は,他の演算子と比較してタスク完了時間において統計的に有意であった。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 04:37:45 GMT)
Air Quality Prediction Using LOESS-ARIMA and Multi-Scale CNN-BiLSTM with Residual-Gated Attention [0.0] 本稿では,LOESS分解,ARIMAモデリング,および残差対応型アテンション機構を備えたマルチスケールCNN-BiLSTMネットワークを統合したハイブリッド予測フレームワークを提案する。
中央公害管理委員会による2021-2023 AQIデータセットの実験は,提案手法が統計的,深層学習,ハイブリッドベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 20:18:30 GMT)
Accelerating Quantum Monte Carlo Calculations with Set-Equivariant Architectures and Transfer Learning [0.0] そのステップを劇的に加速したり、バイパスしたりするために、set-transformerアーキテクチャをどのように利用できるかを示します。
本稿では,古典的イジングモデルから長距離相互作用を持つ量子システムまで,複雑さの増大を示す一連の例を紹介する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 18:12:43 GMT)
AI-Driven Carbon Monitoring: Transformer-Based Reconstruction of Atmospheric CO2 in Canadian Poultry Regions [0.0] カナダ南部のOCO-2から連続的で不確実なXCO2フィールドを再構築する枠組みを提案する。
このモデルはウェーブレットの時間周波数表現を、気象学、植生指標、地形、土地被覆に対するトランスフォーマーの注意と融合させる。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 10:41:12 GMT)
AI for Water Sustainability: Global Water Quality Assessment and Prediction with Explainable AI with LLM Chatbot for Insights [0.0] 本稿では,カナダ,中国,イギリス,アメリカ,アイルランドの複数の水質パラメータを用いたCCMEデータセットに基づくハイブリッドディープラーニングモデルを提案する。
CatBoost, XGBoost, Extra Trees Regressorは平均RMSE1.2、R2乗スコア0.99で水質指数(WQI)を予測した。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 16:01:09 GMT)
A machine learning framework integrating seed traits and plasma parameters for predicting germination uplift in crops [0.0] 本研究は,DBDプラズマ下でのダイズ,オオムギ,ヒマワリ,ラディッシュ,トマトの発芽促進を予測するための最初の機械学習フレームワークを紹介する。
7kVまたは200sの無視可能な効果、7-15kVの最大発芽、200-500sの最大発芽、20kV以上の発芽または長時間曝露の減少。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 01:25:24 GMT)
A Theory of the Mechanics of Information: Generalization Through Measurement of Uncertainty (Learning is Measuring) [0.0] 本研究では,情報理論の不確実性(informationtheoretic uncertainty)を用いたモデルフリーフレームワークを導入し,生データからの推論を解析・実行した。
分散モデリングを排除し、バイアスを低減し、トレーニングデータの直接編集や削除を含む効率的な更新を可能にする。
トレーサビリティ、解釈可能性、データ駆動による意思決定を強調し、マシンラーニングのための統一された人間理解可能なフレームワークを提供する。
論文参考訳(メタデータ) (Sun, 26 Oct 2025 19:45:25 GMT)