Fugu-MT: arxivの論文翻訳(概要)

The 1st International Workshop on Disentangled Representation Learning for Controllable Generation (DRL4Real): Methods and Results [132.9]
本稿では,ICCV 2025と共同で開催されている制御可能生成のための分散表現学習(DRL4Real)の第1回国際ワークショップをレビューする。 DRL4Realは、制御可能生成、モデルの堅牢性、解釈可能性、一般化の進歩を探究するなど、実用的な応用におけるDRL手法の評価に重点を置いている。ワークショップでは、新しい誘導バイアス(言語など)の統合、DRLへの拡散モデルの適用、3D認識のゆがみ、自律運転や脳波分析のような専門分野へのDRLの拡張など、幅広いトピックをカバーする9つの論文を受理した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 16:35:41 GMT)
MoNaCo: More Natural and Complex Questions for Reasoning Across Dozens of Documents [123.1]
MoNaCoは、1,315の自然で複雑な質問のベンチマークであり、解決には数十、数百の中間ステップが必要である。我々の結果は、現実世界の情報検索の複雑さと厳密さに対処する推論モデルの必要性を浮き彫りにしている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 00:58:10 GMT)
GLM-4.5V and GLM-4.1V-Thinking: Towards Versatile Multimodal Reasoning with Scalable Reinforcement Learning [116.8]
視覚言語モデル(VLM)のファミリーであるGLM-4.1VシンキングとGLM-4.5Vを提案する。 GLM-4.5Vは、ほぼ全てのタスクにおいて、同じ大きさのオープンソースモデル間で最先端のパフォーマンスを達成する。より小型のGLM-4.1V-9Bシンキングは29のベンチマークでより大型のQwen2.5-VL-72Bよりも競争力に優れていた。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:23:40 GMT)
STORM: Token-Efficient Long Video Understanding for Multimodal LLMs [101.7]
STORMは、イメージエンコーダとビデオLLMの間に専用のテンポラリエンコーダを組み込んだ、新しいアーキテクチャである。我々は,STORMが様々な長いビデオ理解ベンチマークにおいて最先端の結果を達成することを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 22:06:31 GMT)
Actor-Critic for Continuous Action Chunks: A Reinforcement Learning Framework for Long-Horizon Robotic Manipulation with Sparse Reward [85.8]
本稿では,高次元連続行動系列を生成するための新しいRLフレームワークであるAC3(Actor-Critic for Continuous Chunks)を紹介する。この学習プロセスを安定させ、データ効率を高めるため、AC3はアクターと批評家の両方に目標安定化機構を組み込む。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 01:27:15 GMT)
Improving Diffusion Inverse Problem Solving with Decoupled Noise Annealing [85.0]
Decoupled Annealing Posterior Smpling (DAPS) と呼ばれる新しい手法を提案する。 DAPSは、新しいノイズアニール法に依存している。 DAPSは複数の画像復元作業において,サンプル品質と安定性を著しく向上することを示した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 22:30:53 GMT)
TokLIP: Marry Visual Tokens to CLIP for Multimodal Comprehension and Generation [80.9]
TokLIPは、ベクトル量子化(VQ)トークンを意味付けることで、理解を深めるビジュアルトークンライザである。 TokLIPは、低レベルの離散VQトークンライザとViTベースのトークンエンコーダを統合して、高レベルの連続的なセマンティクスをキャプチャする。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:56:27 GMT)
On-Policy RL Meets Off-Policy Experts: Harmonizing Supervised Fine-Tuning and Reinforcement Learning via Dynamic Weighting [71.6]
Supervised Fine-Tuning (SFT) と Reinforcement Learning (RL) は、大規模言語モデル(LLM)の能力の強化と振る舞いの整合化のための訓練後パラダイムである。 SFTとRLを統合する既存のアプローチは、確立されたモデルパターンを混乱させ、専門家データに過度に適合させるリスクに直面することが多い。動的重み付けによるオン・アンド・オフ・ポリティクス強化学習の制御可能な調和のためのフレームワークであるCHORDを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:20:03 GMT)
Generalized Decoupled Learning for Enhancing Open-Vocabulary Dense Perception [71.3]
DeCLIPは、CLIPを強化する新しいフレームワークで、自己認識モジュールを分離して、それぞれコンテンツ’と“コンテキスト’の機能を取得する。 2D検出とセグメンテーション、3Dインスタンスのセグメンテーション、ビデオインスタンスのセグメンテーション、6Dオブジェクトのポーズ推定など、幅広いタスクにわたる最先端のパフォーマンスを一貫して達成する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 06:43:51 GMT)
Incorporating Arbitrary Matrix Group Equivariance into KANs [69.3]
Kolmogorov-Arnold Networks (KAN) は科学分野で大きな成功を収めている。本研究では,Equivariant Kolmogorov-Arnold Networks (EKAN)を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:17:11 GMT)
Reinforcing Video Reasoning Segmentation to Think Before It Segments [67.6]
本稿では,ビデオ推論セグメンテーションのためのLVLMであるVeason-R1を紹介する。 Veason-R1 は、Chain-of-Thought trajectories を付加した Group Relative Policy Optimization (O) を通じて訓練される。空間的アライメントと時間的整合性を高める包括的報酬機構を組み込んだ。 Veason-R1は、複数のベンチマークで最先端のパフォーマンスを達成し、先行技術を上回っている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:34:56 GMT)
ImagiDrive: A Unified Imagination-and-Planning Framework for Autonomous Driving [64.1]
ビジョン・ランゲージ・モデル(VLM)とドライビング・ワールド・モデル(DWM)は、この課題のさまざまな側面に対処する強力なレシピとして独立して登場した。我々は、VLMベースの運転エージェントとDWMベースのシーン想像装置を統合した、新しいエンドツーエンドの自動運転フレームワークであるImagiDriveを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:06:55 GMT)
CSGO: Generalized Optimization for Cold Start in Wireless Collaborative Edge LLM Systems [62.2]
本稿では,全体の推論遅延を最小限に抑えるために,遅延を考慮したスケジューリングフレームワークを提案する。提案手法は,ベースライン戦略と比較して,コールドスタート遅延を著しく低減することを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:49:22 GMT)
Efficient High-Resolution Visual Representation Learning with State Space Model for Human Pose Estimation [60.8]
高解像度の視覚表現を維持しながら長距離依存関係をキャプチャすることは、人間のポーズ推定のような密集した予測タスクに不可欠である。マルチスケールの畳み込み操作で視覚状態空間モデルを拡張する動的ビジュアル状態空間(DVSS)ブロックを提案する。 HRVMambaは効率的な高分解能表現学習のための新しいモデルである。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:40:44 GMT)
Logic Unseen: Revealing the Logical Blindspots of Vision-Language Models [58.5]
VLM(Vision-Language Models)は、マルチモーダルインテリジェンスの基礎として登場した。しかし、その論理的理解能力は依然として明らかに過小評価されている。 LogicBenchは9つの論理カテゴリと4つの多様なシナリオにまたがる5万以上の視覚言語ペアを備えたベンチマークである。 VLMの論理感度を高めるためのトレーニングフレームワークであるLogicCLIPを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:40:13 GMT)
AIM: Amending Inherent Interpretability via Self-Supervised Masking [57.2]
自己スーパーバイザード・マスキング(AIM)によるインテリジェント・インタプリタビリティの向上について提案する。 AIMは、追加のアノテーションを必要とせずに、刺激的な代替品よりも真の機能の利用を促進する。我々は、分布外一般化ときめ細かい視覚的理解の両方をテストする、さまざまな挑戦的なデータセットでAIMを検証する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:29:59 GMT)
MMESGBench: Pioneering Multimodal Understanding and Complex Reasoning Benchmark for ESG Tasks [56.4]
環境・社会・ガバナンス(ESG)報告は、持続可能性の実践の評価、規制コンプライアンスの確保、財務透明性の促進に不可欠である。 MMESGBenchは、マルチモーダル理解と複雑な推論を、構造的に多種多様なマルチソースESG文書間で評価するための、最初のベンチマークデータセットである。 MMESGBenchは、45のESG文書から得られた933の検証済みQAペアで構成され、7つの異なるドキュメントタイプと3つの主要なESGソースカテゴリにまたがる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:08:00 GMT)
Marmot: Object-Level Self-Correction via Multi-Agent Reasoning [55.7]
Marmotは、マルチオブジェクトの自己修正にマルチエージェント推論を活用する、新しくて一般化可能なフレームワークである。 Marmotは、画像生成タスクにおけるオブジェクトカウント、属性割り当て、空間関係の精度を大幅に改善する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:38:28 GMT)
Chasing Moving Targets with Online Self-Play Reinforcement Learning for Safer Language Models [55.3]
従来の言語モデル(LM)の安全性アライメントは、リアクティブで非結合な手順に依存している。このシーケンシャルなアプローチはミスマッチを生み出し、攻撃者は時代遅れの防御に過度に適合する一方、守備側は出現する脅威に常に遅れをとどめている。我々は,攻撃者と防御エージェントが継続的なインタラクションを通じて共進化するオンラインセルフプレイ強化学習アルゴリズムであるSelf-RedTeamを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:30:41 GMT)
Uncalibrated Reasoning: GRPO Induces Overconfidence for Stochastic Outcomes [55.2]
強化学習(Reinforcement Learning, RL)は、数学のような検証可能な決定論的領域において、言語モデルの精度を向上させるために著しく有効であることが証明されている。本稿では,現在のRL法が,科学的実験のような検証可能な領域における言語モデルの最適化にも有効かどうかを検討する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 20:50:53 GMT)
Temporal Network Analysis of Microservice Architectural Degradation [55.2]
時間的ネットワーク分析は、時間とともに進化するネットワークを分析するネットワーク科学の一分野である。マイクロサービスシステムでは、リリース全体にわたるシステムのアーキテクチャを調べたり、トレースを使用してデプロイされたシステムを監視した場合に、時間的ネットワークが発生する可能性がある。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 16:26:20 GMT)
When Punctuation Matters: A Large-Scale Comparison of Prompt Robustness Methods for LLMs [55.2]
本報告では, 統一実験フレームワーク内での迅速なロバスト性向上のための5つの手法の体系的評価を行う。 Llama、Qwen、Gemmaファミリーの8つのモデルに対して、Natural Instructionsデータセットから52のタスクをベンチマークする。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:32:50 GMT)
SynBrain: Enhancing Visual-to-fMRI Synthesis via Probabilistic Representation Learning [50.7]
視覚刺激が皮質反応にどのように変換されるかを理解することは、計算神経科学の基本的な課題である。視覚的意味論から神経反応への変換をシミュレートする生成フレームワークであるSynBrainを提案する。そこで本研究では,SynBrainが主観的視覚-fMRI符号化性能において最先端の手法を超越していることを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:35:37 GMT)
G-CUT3R: Guided 3D Reconstruction with Camera and Depth Prior Integration [50.5]
G-CUT3Rは,ガイド付き3次元シーン再構成のための新しいフィードフォワード手法である。入力画像のみに依存する既存のフィードフォワード法とは異なり,本手法では奥行き,カメラキャリブレーション,カメラ位置などの補助的データを活用する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:25:58 GMT)
Pr$εε$mpt: Sanitizing Sensitive Prompts for LLMs [49.8]
Pr$epsilonepsilon$mptは、プロンプト消毒剤を実装する新しいシステムである。 Pr$epsilonepsilon$mptは、意味のあるプライバシー保証を実現するための実用的な方法であることを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 16:46:42 GMT)
Cross-Granularity Hypergraph Retrieval-Augmented Generation for Multi-hop Question Answering [49.4]
マルチホップ質問応答 (MHQA) は、正しい回答を得るために複数の経路に散在する知識を統合する必要がある。従来の検索拡張生成法(RAG)は主に粗い粒度のテキスト意味的類似性に焦点を当てている。本稿では,HGRAG for MHQAという新しいRAG手法を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 06:36:13 GMT)
Multi-State Tracker: Enhancing Efficient Object Tracking via Multi-State Specialization and Interaction [49.4]
マルチステートトラッカー(MST)は、過去の効率的なトラッカーを複数のデータセットで上回っている。 MSTは特徴抽出中に複数の段階で複数の状態表現を生成する。計算では0.1GFLOP、パラメータでは0.66Mしか発生しない。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:19:39 GMT)
D-LiFT: Improving LLM-based Decompiler Backend via Code Quality-driven Fine-tuning [49.2]
逆コンパイラは、バイナリから可読なソースコードを再構築する。近年の進歩にもかかわらず、そのアウトプットは構文上の誤りや意味的な誤りに悩まされ、読みにくいままである。大規模言語モデル (LLMs) の出現により、研究者は逆コンパイラ出力を洗練するためのLLMの可能性を探り始めた。 D-LIFTは、微調整強化学習を施した拡張逆コンパイラLLMパイプラインである。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:26:50 GMT)
Representation Quantization for Collaborative Filtering Augmentation [49.1]
本稿では,新しい2段階協調推薦アルゴリズムDQRecを提案する。相互作用配列と属性から共同で振舞い特性を抽出することで特徴と均一な結合を増強する。これらのセマンティックIDパターンを機能拡張とリンク拡張を通じてレコメンデーションプロセスに統合することにより、システムは潜伏したユーザと明示的なアイテムの両方の機能を強化します。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:00:50 GMT)
Unveiling the Unseen: A Comprehensive Survey on Explainable Anomaly Detection in Images and Videos [49.1]
画像やビデオを含む視覚データの異常検出とローカライゼーションは、機械学習や現実世界のアプリケーションにおいて不可欠である。本稿では,説明可能な2次元視覚異常検出(X-VAD)に焦点を当てた初の包括的調査を行う。本稿では,その基礎技術によって分類された説明可能な手法の文献レビューを行う。我々は、将来的な方向性と、説明品質の定量化を含むオープンな問題について議論する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 23:09:56 GMT)
Reverse Convolution and Its Applications to Image Restoration [48.0]
畳み込みと転置畳み込みはニューラルネットワークで広く使われている基本演算子である。本稿では,新しい深度反転畳み込み演算子を提案する。さらに,レイヤ正規化,1$times$1畳み込み,GELUアクティベーションと組み合わせてリバース畳み込みブロックを構築し,トランスフォーマーのような構造を形成する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 01:40:46 GMT)
Is General-Purpose AI Reasoning Sensitive to Data-Induced Cognitive Biases? Dynamic Benchmarking on Typical Software Engineering Dilemmas [47.6]
汎用AI(GPAI)システムは、人間の非人間性による認知バイアスを軽減するのに役立つ。 GPAIシステム自体に認知バイアスがあるのだろうか? ソフトウェア工学におけるGPAIにおけるデータ誘発認知バイアスを評価するための最初のベンチマークフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:29:46 GMT)
Controlled Generation with Equivariant Variational Flow Matching [46.6]
変動流マッチング(VFM)の枠組みにおける制御された生成目標を導出する。本研究では,(1)条件付き生成モデルのエンドツーエンドトレーニング,あるいは(2)ベイズ推論問題として,制御生成を実現する方法を示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:12:11 GMT)
Diffusion Beats Autoregressive in Data-Constrained Settings [46.1]
自己回帰(AR)モデルは長い間、大きな言語モデルのランドスケープを支配してきた。近年,ARモデルよりもアドバンテージが低いものの,拡散型言語モデルが将来性のある選択肢として浮上している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:56:55 GMT)
Large-Scale Multi-Robot Assembly Planning for Autonomous Manufacturing [45.3]
モバイル自律ロボットは、製造プロセスに革命をもたらす可能性がある。製造に大規模なロボット群を採用するには、共有ワークスペースにおける衝突のない移動を含む課題に対処する必要がある。本稿では,これらの課題に対処し,数千個の部品からなる複雑な集合体の構築計画を数分で合成できる大規模マルチロボット組立計画のための完全なアルゴリズムスタックを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:27:15 GMT)
Preacher: Paper-to-Video Agentic System [44.7]
Preacherは、最初の紙対ビデオのエージェントシステムである。研究論文を構造化ビデオ要約に分解、要約、再構成する。 5つの研究分野にまたがって高品質なビデオ抽象化を生成する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:51:49 GMT)
Reconstructing Satellites in 3D from Amateur Telescope Images [44.2]
本稿では,ハイブリッド画像前処理パイプラインを統合することで,障害を克服する新しい計算イメージングフレームワークを提案する。我々は,中国の江東宇宙ステーションと国際宇宙ステーションの合成衛星データセットとオンスキー観測の両方にアプローチを検証した。我々のフレームワークは地球からの高忠実度3D衛星監視を可能にし、宇宙状況認識のためのコスト効率の良い代替手段を提供する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:16:36 GMT)
Ovis2.5 Technical Report [43.7]
我々は,Ovis2の後継となるOvis2.5を,ネイティブ解像度の視覚知覚と強力なマルチモーダル推論のために提案する。 Ovis2.5はネイティブ解像度で画像を処理できるネイティブ解像度のビジョントランスフォーマーを統合している。私たちは、リニアチェーンを越えてリフレクションを実行するようにモデルをトレーニングします。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:01:08 GMT)
ActionPiece: Contextually Tokenizing Action Sequences for Generative Recommendation [43.6]
我々はアクションシーケンスをトークン化するときにコンテキストを明示的に組み込むActionPieceを提案する。特徴パターンを新しいトークンとしてマージし,その共起頻度に基づいて語彙を構築する。特徴集合の非順序性を考えると、さらに集合置換正則化を導入する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 23:44:20 GMT)
Fundamental Bias in Inverting Random Sampling Matrices with Application to Sub-sampled Newton [43.6]
逆バイアス(英: inversion bias)とは、ランダムスケッチ自体の非バイアスにもかかわらず、ランダムスケッチの逆は非バイアスにならない現象である。このバイアスは、さまざまな機械学習パイプラインでランダムスケッチを使用する際の課題を示す。本研究では,一様および非一様レバレッジに基づくランダムサンプリング法と,構造化されたランダムプロジェクションに対して,逆バイアスを補正する方法を示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 06:29:02 GMT)
UI-Venus Technical Report: Building High-performance UI Agents with RFT [43.3]
マルチモーダルな大言語モデルに基づいてスクリーンショットのみを入力として取り込むネイティブUIエージェントであるUI-Venusを提示する。数十万の高品質なトレーニングサンプルを使用して、UIグラウンドとナビゲーションタスクの両方でSOTAのパフォーマンスを実現する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:49:07 GMT)
Variational Flow Matching for Graph Generation [42.4]
分類データのフローマッチング手法であるCatFlowを開発した。 CatFlowは実装が容易で、計算効率が良く、グラフ生成タスクで強い結果が得られる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:12:02 GMT)
I$^3$-MRec: Invariant Learning with Information Bottleneck for Incomplete Modality Recommendation [42.4]
textbfIncomplete textbfModality textbfRecommendationのボトルネック原理で学習する textbfI$3$-MRec を紹介する。 I$3$-MRecは、(i)クロスモーダルな選好不変性、(ii)コンパクトで効果的なマルチモーダル表現の2つの重要な性質を強制する。 I$3$-MRec は、様々なモダリティを欠くシナリオで既存の最先端の MRS メソッドを一貫して上回っている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:40:28 GMT)
Recent Advances in Transformer and Large Language Models for UAV Applications [42.2]
トランスフォーマーをベースとしたモデルの急速な進歩は、無人航空機(UAV)システムの景観を再構築した。本稿では,UAVに適用されたトランスフォーマーアーキテクチャの最近の展開を体系的に分類し,評価する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 22:56:37 GMT)
Language models align with brain regions that represent concepts across modalities [41.6]
言語モデル(LM)と2つのニューラルネットワークメトリクスの関係について検討する。実験の結果、脳のより意味のある領域において、言語のみのモデルと言語ビジョンのモデルの両方が信号をより良く予測できることがわかった。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:32:19 GMT)
Guiding WaveMamba with Frequency Maps for Image Debanding [41.2]
本稿では,ウェーブレット状態空間モデルと周波数マスキングマップを用いた帯域復元手法を提案する。実験により,提案手法は最先端手法と比較してバンドリングを効果的に抑制することが示された。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:03:40 GMT)
A Global Dataset of Location Data Integrity-Assessed Reforestation Efforts [40.2]
本研究は, 一次情報(メタ情報)から収集したグローバルな植林と再植林の取り組みに関するデータセットを提示する。このデータセットは33年にわたる45,628件のプロジェクトから1,289,068件の植林地をカバーしている。地上基準植林地の約79%は、LDIS指標10のうち少なくとも1つで故障した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:28:31 GMT)
Domain-aware Category-level Geometry Learning Segmentation for 3D Point Clouds [38.7]
点雲の特徴の微細な幾何学的性質を知覚するために, カテゴリーレベルの幾何埋め込み (CGE) を提案する。 Geometric Consistent Learning (GCL) は, 潜伏した3次元分布をシミュレートし, カテゴリレベルの幾何学的埋め込みを整列するために提案される。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:02:08 GMT)
Towards Faithful Class-level Self-explainability in Graph Neural Networks by Subgraph Dependencies [38.6]
最近の研究は、トレーニングの一部として説明を生成するグラフニューラルネットワーク(GNN)を導入している。 ProGNNやPGIBのようないくつかのモデルは、クラス固有のプロトタイプへの道筋を提供する。本稿では,クラスレベルの説明を学習し,一般化する,自己説明可能なGNNを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:44:11 GMT)
Aware First, Think Less: Dynamic Boundary Self-Awareness Drives Extreme Reasoning Efficiency in Large Language Models [38.2]
動的推論境界自己認識フレームワーク(DR. SAF)について紹介する。 DR.SAFは、境界自己認識アライメント、適応リワード管理、境界保存メカニズムの3つの重要なコンポーネントを統合している。実験の結果, DR. SAFは全応答トークンの49.27%の削減を実現し, 精度は最小限であった。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 16:40:29 GMT)
Audio Flamingo Sound-CoT Technical Report: Improving Chain-of-Thought Reasoning in Sound Understanding [38.1]
チェーンオブ思考推論は、大きな言語モデルと視覚言語モデルにおいて顕著な改善を示しているが、オーディオ言語モデルの可能性はほとんど未解明のままである。 AF-Reasoning-Evalは、常識推論をターゲットとしたベンチマークであり、密接に関連する選択を識別する能力である。我々は,既存の音声質問応答と分類データを明示的な推論連鎖に変換する自動パイプラインを提案し,AF-CoT-Trainを1.24Mサンプルで生成する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:46:16 GMT)
MultiAiTutor: Child-Friendly Educational Multilingual Speech Generation Tutor with LLMs [38.1]
MultiAiTutorは、子供に優しいデザインの教育用多言語生成AIチューターである。 LLMアーキテクチャを用いた年齢適応型多言語音声生成手法を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:15:19 GMT)
SpectR: Dynamically Composing LM Experts with Spectral Routing [38.0]
本稿では、推論中の各ステップで専門家モデルを動的に構成するアプローチであるSPECTRを紹介する。 SPECTRでは、代替のトレーニング不要な手法よりもルーティング精度が向上し、エキスパートドメイン間のタスク性能が向上することを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:37:18 GMT)
LoRA-Augmented Generation (LAG) for Knowledge-Intensive Language Tasks [38.0]
大規模知識ライブラリとタスク固有のLoRAアダプタを活用するために,LAG(LoRA-Augmented Generation)を提案する。我々は,各種知識集約タスクにおけるRAGの評価を行い,既存のデータフリー手法よりも優れた性能を実現する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:49:45 GMT)
Copyright Protection for Large Language Models: A Survey of Methods, Challenges, and Trends [37.8]
大きな言語モデルの著作権保護は、開発コスト、プロプライエタリな価値、誤用の可能性を考えると、非常に重要である。この調査は、LLM時代のテキスト透かしとモデル指紋技術の両方について、研究者に徹底的な理解を提供することを目的としている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:50:20 GMT)
A Dual-Perspective NLG Meta-Evaluation Framework with Automatic Benchmark and Better Interpretability [36.8]
本稿では,異なる評価機能に着目したデュアルパースペクティブなNLGメタ評価フレームワークを提案する。また、新しい人的アノテーションを必要とせず、対応するベンチマークを自動的に構築する手法も導入する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:10:35 GMT)
FusionFM: Fusing Eye-specific Foundational Models for Optimized Ophthalmic Diagnosis [36.8]
ファンデーションモデル(FM)は、様々な下流タスクの一般化を改善することにより、医療画像解析において大きな可能性を秘めている。我々の知る限り、これは単眼と融合眼のFMの両方を体系的に評価する最初の研究である。我々は、複数の国の標準化データセットを用いて4つの最先端FMをベンチマークし、AUCとF1メトリクスを用いてそれらの性能を評価した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 01:17:52 GMT)
Discovering Invariant Neighborhood Patterns for Heterophilic Graphs [36.8]
Invariant Neighborhood Pattern Learning (INPL) を提案する。我々は,INPLが非親和性グラフ上での学習において,最先端の性能を達成できることを実証した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:36:42 GMT)
PilotRL: Training Language Model Agents via Global Planning-Guided Progressive Reinforcement Learning [36.1]
大規模言語モデル(LLM)はエージェント指向タスクの処理において顕著な進歩を見せている。現在のアプローチは主に教師付き微調整に依存しており、しばしばモデルが確立されたタスク完了軌跡を記憶させる。適応的グローバルプランベースエージェントパラダイムであるAdaPlanを導入する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:07:52 GMT)
Physics-Guided Image Dehazing Diffusion [35.9]
合成データセットでトレーニングされた現在のデータ駆動型デハージングアルゴリズムは、合成データでうまく機能するが、現実のシナリオに一般化するのに苦労する。 textbfImage textbfDehazing textbfDiffusion textbfModels (IDDM) を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:18:03 GMT)
E3-Rewrite: Learning to Rewrite SQL for Executability, Equivalence,and Efficiency [35.2]
E3-Rewriteは実行可能で等価で効率的なクエリを生成するフレームワークである。コンテキスト構築モジュールと強化学習フレームワークの2つのコアコンポーネントを統合している。 E3-Rewriteは、主要なベースラインと比較してクエリ実行時間を最大25.6%短縮することができる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:52:09 GMT)
Emergent Symbol-like Number Variables in Artificial Neural Networks [34.4]
単純化されたシンボリックアルゴリズム(SA)のレンズを用いて生のNN活性を解釈できることが示される。我々はDASフレームワークをより広範なアライメント関数のクラスに拡張し、SAからの解釈可能な変数の観点からNNアクティビティをより柔軟にキャプチャする。繰り返しモデルでは, 神経活動において, 次数的, 記号的数変数が生成できることが示されている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 19:27:45 GMT)
What Matters for Bioacoustic Encoding [34.1]
本研究は,生物音響学の側面を包括する大規模実証研究である。既存のベンチマークと提案ベンチマークで最先端のエンコーダを得る。具体的には、種分類、検出、個人ID、発声レパートリー発見などのタスクを含む26のデータセットにまたがって、自己教師付き事前訓練に続いて、教師付き後訓練を行う。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 23:52:34 GMT)
Novel Parasitic Dual-Scale Modeling for Efficient and Accurate Multilingual Speech Translation [33.9]
本稿では,改良された投機的サンプリング手法とモデル圧縮と知識蒸留技術を組み合わせた,革新的なパラサイトデュアルスケールアプローチを提案する。我々はWhisper Mediumモデル上に構築し、新しいKVSPNモジュールを統合し、推論効率を改善した6つのポピュラー言語で最先端(SOTA)性能を実現する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:46:46 GMT)
Learn to Memorize: Optimizing LLM-based Agents with Adaptive Memory Framework [33.7]
メモリサイクルをモデル化し,適応型・データ駆動型メモリフレームワークを用いたLCMエージェントの最適化を提案する。具体的には、メモリ検索を容易にするためのMoEゲート関数を設計し、メモリ利用を改善するための学習可能な集約プロセスを提案し、メモリ記憶に適応するためのタスク固有のリフレクションを開発する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:22:52 GMT)
Mixture of Experts Provably Detect and Learn the Latent Cluster Structure in Gradient-Based Learning [33.3]
MoEは、バニラルータを備えた特殊なモデルのアンサンブルで、各入力を適切な専門家に動的に配布する。我々は,各専門家が個々のクラスタに対応するより単純な関数を弱めに回復する能力を活用して,この問題をより簡単なサブプロブレムに分割することに成功していることを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 20:45:26 GMT)
Personalized Distractor Generation via MCTS-Guided Reasoning Reconstruction [33.2]
複数選択質問(MCQ)における不正確な答えの選択は、学生の誤解を診断し、教育評価において重要な役割を担っている。最近の研究は、大きな言語モデル(LLM)を活用して、グループレベルの共有障害を生成する。本稿では,各学生の過去の質問回答(QA)記録から推定される個人的誤解に基づいて,パーソナライズされたトラクタ生成の課題を紹介する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:20:37 GMT)
Learning to Be A Doctor: Searching for Effective Medical Agent Architectures [32.8]
本稿では,医療エージェントアーキテクチャの自動設計のための新しいフレームワークを紹介する。自動機械学習(AutoML)の成功に触発され、階層的で表現力のあるエージェント検索空間を定義する。本フレームワークは,多様な機能ノード型からなるグラフベースのアーキテクチャとして医療エージェントを概念化する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:59:23 GMT)
TimeMachine: Fine-Grained Facial Age Editing with Identity Preservation [32.4]
TimeMachineは、新しい拡散ベースのフレームワークで、アイデンティティ機能を維持しながら正確な年齢編集を実現する。 ACGモジュールはトレーニング中に聴覚再建を行う代わりに、潜伏空間の年齢を直接予測する。 HFFAデータセットには、アイデンティティと顔属性をラベル付けした100万の高解像度画像が含まれている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:46:37 GMT)
Generalize across Homophily and Heterophily: Hybrid Spectral Graph Pre-Training and Prompt Tuning [32.3]
既存の方法は、様々なホモフィリーを持つ実世界のグラフにおける多様なスペクトル分布を処理できない。本稿では,事前学習と即時学習の両方においてスペクトルアライメントを保証する新しいフレームワークを提案する。本実験は,帰納的学習と帰納的学習の両方で有効性を検証する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:55:57 GMT)
FairT2I: Mitigating Social Bias in Text-to-Image Generation via Large Language Model-Assisted Detection and Attribute Rebalancing [32.0]
本稿では,T2I生成における社会的バイアスの検出と緩和に,大規模言語モデルを活用する新しいフレームワークであるFairT2Iを紹介する。以上の結果から,FairT2Iは社会的偏見を緩和し,画像の感度特性の多様性を高めることができた。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 00:43:54 GMT)
Foldable SuperNets: Scalable Merging of Transformers with Different Initializations and Tasks [32.0]
このセットアップでは,従来のマージ手法が破滅的に失敗することを示す。原モデルを含むスーパーネットを訓練する「Foldable SuperNet」(FS-Merge)を導入する。トレーニング後、SuperNetは1つのオリジナルのモデルのサイズに折り返される。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:54:42 GMT)
AgentMental: An Interactive Multi-Agent Framework for Explainable and Adaptive Mental Health Assessment [31.9]
メンタルヘルスアセスメントは早期介入と効果的な治療に不可欠であるが、伝統的な臨床医ベースのアプローチは資格のある専門家の不足によって制限される。人工知能の最近の進歩は、自動心理学的評価への関心が高まりつつあるが、既存のほとんどのアプローチは静的テキスト分析に依存しているため制約されている。臨床医と患者との対話をシミュレートした精神保健評価のためのマルチエージェントフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 16:20:45 GMT)
SpecDetect: Simple, Fast, and Training-Free Detection of LLM-Generated Text via Spectral Analysis [31.4]
本稿では,周波数領域におけるトークンログ確率のシーケンスを解析する新しいパラダイムを提案する。我々は、グローバルなDFT: DFTトータルエネルギーの単一で堅牢な特徴の上に構築されたSpecDetectを構築した。我々の研究は、LLM生成したテキスト検出のための新しい、効率的で解釈可能な経路を導入し、古典的な信号処理技術がこの現代の課題に対して驚くほど強力な解決策を提供することを示した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:13:42 GMT)
PASS: Probabilistic Agentic Supernet Sampling for Interpretable and Adaptive Chest X-Ray Reasoning [31.4]
PASS(Probabilistic Agentic Supernet Smpling)は、Chest X-Ray(CXR)推論の文脈でこれらの課題に対処する最初のマルチモーダルフレームワークである。 PASSは、マルチツールグラフ上でエージェントを適応的にサンプリングし、解釈可能な確率でアノテートされた決定経路を生成する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 01:18:37 GMT)
Visual-RAG: Benchmarking Text-to-Image Retrieval Augmented Generation for Visual Knowledge Intensive Queries [30.7]
Retrieval-augmented Generation (RAG)は、知識集約的な質問に対処するために、外部知識で大きな言語モデルを拡張する。 Visual-RAGは、視覚的に根ざした知識集約的な質問を対象とする質問回答ベンチマークである。我々は,5つのオープンソースと3つのプロプライエタリなMLLMを評価し,画像が拡張世代において強力な証拠となることを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:45:15 GMT)
Transferable Parasitic Estimation via Graph Contrastive Learning and Label Rebalancing in AMS Circuits [30.4]
本稿では,新しいグラフコントラスト学習フレームワークCircuitGCLを提案する。表現散乱とラベルリバランシングを統合し、異種回路グラフ間の転送性を高める。 CircuitGCLは全ての最先端(SOTA)メソッドより優れており、R2$は33.64% sim 44.20%$、F1スコアは92タイム sim 2.1times$である。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:47:24 GMT)
Learning Camera-Agnostic White-Balance Preferences [30.3]
ポストイルミナント推定マッピングは、中性イルミナント補正をカメラ非依存空間における好ましい補正に変換する。提案したモデルは軽量($sim$500のパラメータのみを含む)で、一般的なフラッグシップモバイルCPU上では0.024ミリ秒で動作します。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:43:19 GMT)
Tool-Planner: Task Planning with Clusters across Multiple Tools [30.3]
ツールキットに基づくタスク処理フレームワークであるTool-Plannerを提案する。 Tool-Plannerは同じ関数を持つAPI関数をツールキットにグループ化する。ツールエラーが発生した場合、言語モデルはツールキットに基づいてツールを再選択し、調整することができる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:55:16 GMT)
GDSR: Global-Detail Integration through Dual-Branch Network with Wavelet Losses for Remote Sensing Image Super-Resolution [30.2]
リモートセンシング画像(RSI)におけるRWKV(Receptance Weighted Key Value)の新たな応用について紹介する。本稿では,RWKVと畳み込み演算を並列に行い,大規模RSIを扱うGDSRを提案する。さらに、二重グループサブバンド戦略によるウェーブレット領域制約機構であるDual-Group Multi-Scale Wavelet Lossを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:13:58 GMT)
TTF-VLA: Temporal Token Fusion via Pixel-Attention Integration for Vision-Language-Action Models [29.9]
Vision-Language-Action (VLA)モデルは、ロボット操作タスクに固有の貴重な時間情報を捨て、各タイミングで視覚入力を独立に処理する。本稿では,VLA推論品質を向上させるために,歴史的および現在の視覚表現を統合した訓練不要なTTFを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:03:34 GMT)
SeamlessFlow: A Trainer Agent Isolation RL Framework Achieving Bubble-Free Pipelines via Tag Scheduling [29.8]
SeamlessFlowはサーバベースの強化学習フレームワークである。 1)エージェントの複雑な実行フローからRLトレーニングを分離し、(2)最小アイドル時間でGPU利用を最大化する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:55:37 GMT)
PTSM: Physiology-aware and Task-invariant Spatio-temporal Modeling for Cross-Subject EEG Decoding [29.6]
クロスオブジェクト脳波(EEG)デコーディングは、脳-コンピュータインターフェース(BCI)研究における根本的な課題である。本稿では,未確認領域にまたがる脳波デコーディングのための新しいフレームワークPTSMを提案する。 PTSMは、パーソナライズされた時間的パターンと共有された時間的パターンを独立して学習するデュアルブランチ機構を採用している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:51:14 GMT)
D-Attn: Decomposed Attention for Large Vision-and-Language Models [29.6]
大規模視覚・言語モデル(LVLM)のためのより柔軟な注意アーキテクチャである分解注意アーキテクチャ(D-Attn)を提案する。 D-AttnはLVLMの1次元因果自認を視覚的・視覚的・視覚的・テキスト的・テキスト的に分解する。実験と解析によりD-Attnの有効性が検証され、複数の画像ベンチマークで大幅な改善が示された。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 20:46:58 GMT)
Semi-supervised Image Dehazing via Expectation-Maximization and Bidirectional Brownian Bridge Diffusion Models [29.4]
既存のデハジング手法は、特に濃厚なヘイズシーンの難易度で現実世界のヘイズ画像を扱う。本稿では,2段階学習方式による予測最大化と双方向ブラウン橋拡散モデル(EM-B3DM)を用いた半教師付き画像デハージング手法を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:33:44 GMT)
Vulnerability of Text-Matching in ML/AI Conference Reviewer Assignments to Collusions [29.3]
コラボレーションリングは、トップ層機械学習(ML)と人工知能(AI)カンファレンスに挑戦する。入札がなくても、レビュアーと著者は、レビュアー代行の機械学習ベースのテキストマッチングコンポーネントを活用できることを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:10:25 GMT)
Bridging Context Gaps: Leveraging Coreference Resolution for Long Contextual Understanding [29.1]
大規模言語モデル(LLM)の性能向上を目的としたLong Question Coreference Adaptation (LQCA) 手法を提案する。このフレームワークは、長いコンテキストに合わせて調整されたコア参照解決に焦点を当てており、モデルが参照を効果的に識別し、管理することができる。私たちのコードはhttps://github.com/OceannTwT/LQCA.comで公開されています。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:01:34 GMT)
Personalized LLM for Generating Customized Responses to the Same Query from Different Users [28.9]
大規模言語モデル(LLM)のパーソナライズに関する既存の作業は、LLMに対して異なる応答ロールを割り当てている。我々は、異なるクエリーから同じクエリに対しても異なる応答を生成する、新しい形式のクエリー対応LLMパーソナライズを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:12:16 GMT)
Cognitive Behaviors that Enable Self-Improving Reasoners, or, Four Habits of Highly Effective STaRs [28.6]
強化学習は、検証可能なタスクにおける言語モデルにおける自己改善を促進することができる。また,Qwen-2.5-3BがLlama-3.2-3Bを超えることが確認された。我々の研究は、Qwenが自然にこれらの推論行動を示すのに対して、Llamaはこれらを欠いていることを明らかにしている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:21:46 GMT)
Omni-DPO: A Dual-Perspective Paradigm for Dynamic Preference Learning of LLMs [28.4]
Omni-DPOは、各選好ペアの固有品質とそれらのペア上でのモデルの進化性能を考慮に入れた双対パースペクティブ最適化フレームワークである。様々なモデルとベンチマークの実験結果から,Omni-DPOの優位性と一般化能力が示された。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:40:50 GMT)
CineTrans: Learning to Generate Videos with Cinematic Transitions via Masked Diffusion Models [28.2]
我々は,コヒーレントなマルチショットビデオを生成するためのフレームワークであるCineTransを紹介した。 CineTransは、フィルム編集スタイルに固執しながら、不安定な遷移やナイーブな結合を避けながら、シネマティックなマルチショットシーケンスを生成する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:58:22 GMT)
Inclusion Arena: An Open Platform for Evaluating Large Foundation Models with Real-World Apps [28.2]
大規模言語モデル(LLMs)とマルチモーダル大規模言語モデル(MLLMs)は、AI機能の新たな時代を支えている。 Inclusion Arenaは、アプリケーションから直接収集された人間のフィードバックに基づいてモデルをランク付けする、ライブのリーダーボードです。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:00:07 GMT)
MetaAgents: Large Language Model Based Agents for Decision-Making on Teaming [27.9]
大規模言語モデル(LLM)を用いた社会シミュレーションフレームワークであるMetaAgentsを紹介する。 LLMをベースとしたエージェントのチーム構成とスキルマッチング行動を精査するためのケーススタディとして,ジョブフェア環境を構築した。評価の結果,LLMをベースとしたエージェントが,効率的なチーム開発に合理的な決定を下す上で有能な役割を担っていることが示された。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:18:48 GMT)
GBR: Generative Bundle Refinement for High-fidelity Gaussian Splatting with Enhanced Mesh Reconstruction [27.7]
GBR(Generative Bundle Refinement)は、4-6の入力ビューのみを用いた高忠実なガウススプラッティングとメッシュ化のための手法である。 GBRは、幾何学的精度を高めるために神経束調整モジュールと、幾何学的忠実性を改善するために生成深度改善モジュールを統合している。 GBRは、大規模な現実世界のシーンを再構築し、レンダリングする能力を示している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 06:46:06 GMT)
ORFuzz: Fuzzing the "Other Side" of LLM Safety -- Testing Over-Refusal [27.3]
大規模言語モデル(LLM)は、過度に保守的な安全対策のため、誤って良心的なクエリーを拒否する過度な拒絶を示す。本稿では,LLMオーバーリフレクションの系統的検出と解析を行うための,最初の進化的テストフレームワークORFuzzを紹介する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:03:26 GMT)
SGSimEval: A Comprehensive Multifaceted and Similarity-Enhanced Benchmark for Automatic Survey Generation Systems [26.9]
SGSimEvalは、Survey Generation with similarity-Enhanced Evaluationの包括的なベンチマークである。我々は、人間に固有の品質と類似性の両方を強調する人間の嗜好指標を導入する。実験の結果,現在のASGシステムはアウトライン生成において人間に比較可能な優位性を示すことがわかった。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:27:58 GMT)
Thyme: Think Beyond Images [26.6]
我々は、MLLMが、コードを介して多様な画像処理と計算操作を自律的に生成し、実行することにより、画像のアプローチで既存の思考を超越することを可能にする新しいパラダイムであるThymeを紹介した。我々は、特に高分解能な認識と複雑な推論タスクにおいて、Thymeが顕著で一貫したパフォーマンス向上をもたらすことを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:59:49 GMT)
Perfect Counterfactuals in Imperfect Worlds: Modelling Noisy Implementation of Actions in Sequential Algorithmic Recourse [26.6]
アルゴリズムによる議論は、自動意思決定によって悪影響を受ける個人に対する行動を提案する。リコースを知ることは、ユーザーがそれを完璧に実装できることを保証するものではない。したがって、リコース生成はその準最適あるいはうるさい実装を予測すべきである。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:05:11 GMT)
SVG-Head: Hybrid Surface-Volumetric Gaussians for High-Fidelity Head Reconstruction and Real-Time Editing [26.4]
Surface-Volumetric Gaussian Head Avatar (SVG-Head) は、FLAMEメッシュ上に有界な3Dガウスの幾何学を明示的にモデル化する新しいハイブリッド表現である。 3次元世界とテクスチャ空間の対応性をモデル化するため,メッシュ対応ガウスUVマッピング法を提案する。 NeRSembleデータセットの実験では、SVG-Headは高忠実なレンダリング結果を生成するだけでなく、ガウスの頭アバターの明示的なテクスチャ画像を得るための最初の方法でもある。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:44:16 GMT)
MUNBa: Machine Unlearning via Nash Bargaining [26.4]
マシン・アンラーニング(MU)は、モデル全体の有用性を保ちながら、モデルから有害な振る舞いを選択的に消去することを目的としている。マルチタスク学習問題として、MUは、特定の概念やデータを忘れたり、一般的なパフォーマンスを保つことに関連する目的のバランスをとる。我々はMUを2人組の協調ゲームとして再編成し、そこでは、忘れるプレイヤーと保存プレイヤーが勾配提案を通じて貢献し、全体のゲインを最大化する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:13:52 GMT)
Random Walk Learning and the Pac-Man Attack [25.7]
我々は,悪質なノードが訪問する任意のRWを確率的に終了させる,パックマン攻撃(Pac-Man's attack)と呼ぶ敵の脅威を調査する。このステルスな動作は、ネットワークからアクティブなRWを徐々に排除し、障害アラームを発生させることなく、学習プロセスを効果的に停止させる。この脅威に対処するために、パックマンの存在下でのRWの消滅を防止するために、RWの完全分散機構である平均交差(AC)アルゴリズムを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:28:24 GMT)
Learning to Restore Heisenberg Limit in Noisy Quantum Sensing via Quantum Digital Twin [25.6]
量子センサーは非古典的資源を活用し、ハイゼンベルク限界でのセンシング精度を達成する。重要な問題は、環境騒音が急激なデコヒーレンスを引き起こし、ハイゼンベルク限界の実現可能性を制限することである。本稿では,この問題を克服するための量子デジタルツインプロトコルを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:14:01 GMT)
Scanpath Prediction in Panoramic Videos via Expected Code Length Minimization [25.3]
損失データ圧縮の原理に基づくスキャンパス予測のための新しい基準を提案する。この基準は、トレーニングセットにおける量子化されたスキャンパスのコード長を最小化することを示唆している。また、現実的な人間のようなスキャンパスを生成するために、PID(Paldical-Integrated-Integrated-Divative)コントローラベースのサンプリングも導入する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:27:53 GMT)
Remove360: Benchmarking Residuals After Object Removal in 3D Gaussian Splatting [24.9]
セマンティック残差を測定するための新しいベンチマークと評価フレームワークを導入する。屋内および屋外の様々な場面で実験を行い、現在の手法が意味情報を保存可能であることを示す。 Remove360もリリースしました。Remove360は、リアルな環境で撮影されたRGB画像とオブジェクトレベルのマスクのデータセットです。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:15:06 GMT)
Fusing Rewards and Preferences in Reinforcement Learning [24.9]
本稿では、個別の報酬とペアの好みを融合させる強化学習アルゴリズムであるDual-Feedback Actor(DFA)を提案する。 DFAはポリシーのログ確率を直接使用して好みの確率をモデル化し、別の報酬モデリングのステップを避ける。シミュレーションの結果,生成した嗜好に基づいて訓練したDFAは,ソフトアクター・クリティカル(SAC)ポリシーを超えていることがわかった。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:56:03 GMT)
CoreEditor: Consistent 3D Editing via Correspondence-constrained Diffusion [24.1]
CoreEditorは、一貫したテキストから3D編集のための新しいフレームワークである。本稿では,画素間の正確な相互作用を強制するアテンション制約付アテンション機構を提案する。実験では、CoreEditorはよりシャープなディテールで高品質な3D一貫性のある編集を生成する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:13:11 GMT)
From Explainable to Explained AI: Ideas for Falsifying and Quantifying Explanations [24.0]
本稿では,計算病理学における分類器の説明に適した人間-機械-VLMインタラクションシステムを提案する。概念実証は,(1)説明文のクレームを検証するためにスライドウインドウ実験を行うAI統合スライドビューアと,(2)汎用視覚言語モデルを用いた説明文の予測性の定量化である。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:45:28 GMT)
Towards Generalizable Forgery Detection and Reasoning [23.9]
We formulate detection and explanation as a unified forgery Detection and Reasoning task (FDR-Task) マルチモーダル・フォージェリー推論データセット (MMFR-Dataset) は10つの生成モデルにわたる120K画像を含む大規模データセットであり, フォージェリー属性には378Kの推論アノテーションがある。複数の生成モデルに対する実験により、FakeReasoningは堅牢な一般化を実現し、検出タスクと推論タスクの両方において最先端の手法より優れていることが示された。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:34:52 GMT)
CHARM3R: Towards Unseen Camera Height Robust Monocular 3D Detector [23.7]
単眼の3Dオブジェクト検出器は、一方のエゴカメラの高さからのデータに効果があるが、見えないカメラの高さや分布外カメラの高さに苦戦している。既存の方法は、しばしばPluckerの埋め込み、画像変換、データ拡張に依存している。本稿では、まず、カメラ高さの変化が最新式(SoTA)Mono3Dモデルに与える影響について検討する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:27:17 GMT)
RMSL: Weakly-Supervised Insider Threat Detection with Robust Multi-sphere Learning [23.5]
インサイダー脅威検出は、ユーザインタラクションを記録するログを分析することによって、悪意のあるユーザの振る舞いを特定することを目的としている。教師なしの手法は、正常な行動と異常な行動のあいまいさにより、高い偽陽性率とミス率に直面している。本稿では,行動レベルの異常の検出能力を高めるために,ロバスト多球学習(RMSL)と呼ばれる新しいフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:36:03 GMT)
CoDiEmb: A Collaborative yet Distinct Framework for Unified Representation Learning in Information Retrieval and Semantic Textual Similarity [23.3]
統合されたテキスト埋め込みをトレーニングするための統合フレームワークであるCoDiEmbを紹介する。 CoDiEmbは、効果的な共同最適化のための3つの重要なイノベーションを統合している。我々の結果と分析は、このフレームワークがクロスタスクトレードオフを緩和していることを示している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:46:35 GMT)
Feather-SQL: A Lightweight NL2SQL Framework with Dual-Model Collaboration Paradigm for Small Language Models [23.0]
小型言語モデル(SLM)はNL2タスクと競合し、パフォーマンスが悪く、既存のフレームワークと互換性がない。 SLMに適した新しい軽量フレームワークであるFeather- Paradigmを紹介します。提案されたパラダイムは、SLMの精度の上限を54.76%に引き上げ、その有効性を強調している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:48:28 GMT)
CogDDN: A Cognitive Demand-Driven Navigation with Decision Optimization and Dual-Process Thinking [22.8]
人間の認知と学習のメカニズムをエミュレートするVLMベースのフレームワークであるCogDDNを提案する。 CogDDNは、検出されたオブジェクトを所定の命令で意味的にアライメントすることで、適切なターゲットオブジェクトを特定する。高速かつ効率的な意思決定のためのヒューリスティックプロセスと過去のエラーを分析する分析プロセスで構成される、デュアルプロセスの意思決定モジュールが組み込まれている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:03:09 GMT)
Refine-IQA: Multi-Stage Reinforcement Finetuning for Perceptual Image Quality Assessment [22.2]
強化微調整(Reinforcement fine-tuning, RFT)は、LMMトレーニングのパラダイムである。マルチステージ RFT IQA フレームワーク (-IQA) を提案する。結果のRefine-IQAシリーズモデルは、知覚とスコアリングの両方で優れたパフォーマンスを達成する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 00:09:46 GMT)
Denoise-then-Retrieve: Text-Conditioned Video Denoising for Video Moment Retrieval [22.0]
現在のテキスト駆動のVideo Moment Retrieval(VMR)メソッドは、無関係なものを含むすべてのビデオクリップをエンコードし、マルチモーダルアライメントを妨害し、最適化を妨げる。そこで本稿では,ビデオからテキスト非関連クリップを明示的にフィルタリングし,目的モーメントを精製したマルチモーダル表現を用いて検索する手法を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:34:05 GMT)
Beyond Solving Math Quiz: Evaluating the Ability of Large Reasoning Models to Ask for Information [21.6]
大規模推論モデル (LRM) は数学において顕著な問題解決能力を示している。多様な文脈を持つ2種類の不完全な問題からなる新しいデータセットを提案する。このデータセットに基づいて, LRMの系統的評価を行ったところ, 積極的に情報を求めることができないことが明らかとなった。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 06:42:00 GMT)
Training-Free Anomaly Generation via Dual-Attention Enhancement in Diffusion Model [21.5]
異常発生による不十分な異常データに対処する研究が増えている。本稿では,AAGと呼ばれるトレーニング不要な異常生成フレームワークを提案する。 AAGは、有効な異常画像生成のための安定拡散の強い生成能力に基づいている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:52:02 GMT)
Versatile Video Tokenization with Generative 2D Gaussian Splatting [21.2]
ビデオトランスフォーマー(英: Video Transformer、GVT)は、2Dガウシアン・スプレイティング・ストラテジーをベースとした多用途ビデオトークンである。 GVTはベースライン・オブ・ザ・アーティカルなビデオ品質を実現し、動作認識においてMAGVIT-v2を上回っ、同等の圧縮性能を提供する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:16:45 GMT)
Fine-Grained VLM Fine-tuning via Latent Hierarchical Adapter Learning [21.1]
本研究は,視覚言語モデル(VLM)を微調整する新しいアダプタの開発である。 LatHAdapterの中核は、下流のトレーニングデータの潜在セマンティック階層を活用することである。提案されたLatHAdapterは、他の細調整アプローチよりも一貫して優れている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:02:36 GMT)
Cost-Effective Active Labeling for Data-Efficient Cervical Cell Classification [20.5]
我々は,データ効率のよい頚椎細胞分類のために,はるかに少ない人的費用で代表訓練データセットを構築することができる能動的ラベリングを提案する。このアルゴリズムは,不確実性を高速に推定することにより,構築したトレーニングデータセットの代表的能力を高めるための妥当性と有効性を示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:11:15 GMT)
Slow Tuning and Low-Entropy Masking for Safe Chain-of-Thought Distillation [20.4]
Slow Tuning と Low-Entropy Masking Distillation (SLowED) の2つのモジュール, Slow Tuning と Low-Entropy Masking を提案する。 Slow Tuningはモデルウェイトの変化の規模を縮小し、初期ウェイト分布に近い近隣空間のモデルウェイトを最適化する。低エントロピーマスクは、不要な学習対象と見なされる低エントロピートークンをマスクし、それらを微調整から除外する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:10:11 GMT)
A Free Probabilistic Framework for Analyzing the Transformer-based Language Models [19.8]
本稿では,自由確率理論を用いたトランスフォーマーに基づく言語モデル解析のための形式的演算子理論フレームワークを提案する。この研究は、理論上は大きな言語モデルにおける構造力学に関する原則的視点を提供する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:39:22 GMT)
Sim2Dust: Mastering Dynamic Waypoint Tracking on Granular Media [19.8]
本研究は,挑戦面上での動的ウェイポイントトラッキングのためのロバストな制御ポリシを開発するための,完全なsim-to-realフレームワークを提案する。我々は超並列シミュレーションを利用して、プロシージャ生成環境の広範囲にわたる強化学習エージェントを訓練する。本実験は,複数の強化学習アルゴリズムと動作平滑化フィルタを体系的に比較し,実世界の展開において最も効果的な組み合わせを同定する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:30:07 GMT)
NeMo: A Neuron-Level Modularizing-While-Training Approach for Decomposing DNN Models [19.7]
我々は、ディープニューラルネットワーク(DNN)モデルのためのスケーラブルで一般化可能なモジュラートレーニングアプローチであるNeMoを提案する。 NeMoはすべてのDNNに共通するニューロンレベルの基本成分をトランスフォーマーに適用可能である。モジュール分類精度は平均1.72%向上し,モジュールサイズは58.10%減少し,CNNモデルと大規模トランスフォーマーモデルの両方で有効性を示した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:25:40 GMT)
SafeSieve: From Heuristics to Experience in Progressive Pruning for LLM-based Multi-Agent Communication [19.6]
プログレッシブで適応的なマルチエージェント・プルーニングアルゴリズムであるSafeSieveを提案する。 SafeSieveの平均精度は94.01%であり、トークン使用率を12.4%から27.8%削減している。これらの結果はSafeSieveを実用マルチエージェントシステムのための堅牢で効率的でスケーラブルなフレームワークとして確立している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:44:50 GMT)
The Roots of International Perceptions: Simulating US Attitude Changes Towards China with LLM Agents [19.4]
意見更新のためのメディアデータ収集,ユーザプロファイル作成,認知アーキテクチャを統合したフレームワークを提案する。我々の研究は,LLMに基づく認知行動モデリングの新しいパラダイムに寄与する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:48:46 GMT)
Emphasis Sensitivity in Speech Representations [19.2]
本稿では,2つの中性表現と強調された単語表現の相違として強調する残差に基づくフレームワークを提案する。自己教師付き音声モデルの解析により,これらの残差が持続時間変化と強く相関し,単語識別予測の精度が低いことが示された。 ASRの微調整モデルでは、残余は事前訓練されたモデルよりも最大50%コンパクトな部分空間を占有する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 16:18:47 GMT)
IRL-VLA: Training an Vision-Language-Action Policy via Reward World Model [19.1]
IRL-VLA は textbfInverse textbfReinforcement textbfLearning reward world model による新しいループ強化学習である。本稿では, 自己構築型VLAアプローチを用いて, textbfInverse textbfReinforcement textbfLearning reward world model を用いた新しいループ強化学習であるIRL-VLAを紹介する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:19:30 GMT)
TimeMKG: Knowledge-Infused Causal Reasoning for Multivariate Time Series Modeling [19.1]
TimeMKGは低レベル信号処理から知識情報推論までの時系列モデリングを高める。クロスモダリティアテンションは、下流タスクに因果前処理を注入して、変数レベルで表現を整列させる。多様なデータセットの実験では、変数レベルの知識を組み込むことで、予測性能と一般化の両方が大幅に改善されることが示されている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:09:03 GMT)
When Algorithms Mirror Minds: A Confirmation-Aware Social Dynamic Model of Echo Chamber and Homogenization Traps [19.0]
本稿では,エコーチャンバーの出現とドライバ,ユーザ均質化,および人間中心のレコメンデーション設計のための実用的なガイドラインについて検討する。本研究は, エコーチャンバーの出現とドライバに関する理論的および実証的な知見と, ユーザ均質化, および人間中心のレコメンデーション設計のための実用的なガイドラインを提供する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:55:55 GMT)
Mitigating Filter Bubble from the Perspective of Community Detection: A Universal Framework [19.0]
本稿では,レコメンダシステムにおけるフィルタバブル問題に対処するためのCD-CGCNというユニバーサルフレームワークを提案する。コミュニティ検出アルゴリズムを用いてユーザとイテムのインタラクション履歴を解析することにより,コミュニティ内項目に注目する現状のレコメンデーションが,フィルタバブル効果を悪化させることを明らかにした。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:57:38 GMT)
Transsion Multilingual Speech Recognition System for MLC-SLM 2025 Challenge [18.8]
本稿では,MLC-SLM 2025 Challengeのトラック1用トランスミッション音声チームが開発した,新しい多言語自動音声認識(ASR)システムのアーキテクチャと性能について述べる。提案システムは,(1)凍結したWhisper-large-v3ベースの音声エンコーダで,大規模事前学習を利用してロバストな音響特徴抽出を実現する。事前訓練されたモデルとタスク固有の微調整を体系的に組み合わせることで、11言語で9.83%の単語/文字エラー率(WER/CER)を達成した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:39:05 GMT)
Towards Physically Realizable Adversarial Attacks in Embodied Vision Navigation [18.2]
対象物に対向パッチを付けることで視覚ナビゲーションを具体化するための実用的な攻撃法を提案する。敵のパッチは平均22.39%の航法成功率を低下させ, 実用性, 有効性, 自然性において従来の手法より優れていた。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:26:44 GMT)
The Price of Cheaper Data: Measuring the Strategic Inefficiencies in the Post-EIP-4844 Ethereum Market [18.2]
319.5百万トランザクションのデータセットを活用することで,EIP-4844以降のエコシステムを大規模に分析する。分析の結果,安価なブロブを高価な取引で利用するための構造的変化が明らかとなった。ビルダー側では、ブロブを含むブロックの29.48%が準最適に建設され、他の方法では得られなかった収入よりも少ない収入を得ている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:08:49 GMT)
PTMPicker: Facilitating Efficient Pretrained Model Selection for Application Developers [18.1]
適切な事前学習モデル(PTM)を正確に同定するためのPTMPickerを提案する。まず、PTMの共通属性と本質属性からなる構造化テンプレートを定義し、その後、PTMPickerは候補モデルとユーザ意図の機能の両方を表す。キュレートされたPTMデータセットと合成されたモデル検索要求の実験は、PTMPickerがユーザーが効果的にモデルを特定するのに役立つことを示している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:09:18 GMT)
Learning Zero-Sum Linear Quadratic Games with Improved Sample Complexity and Last-Iterate Convergence [18.1]
Zero-sum Linear Quadratic (LQ) ゲームは最適制御の基本である。本研究では,より単純な入れ子ゼロ階法 (NPG) アルゴリズムを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:08:35 GMT)
Defects4Log: Benchmarking LLMs for Logging Code Defect Detection and Reasoning [17.6]
コードのロギングは、開発者がシステムランタイムの振る舞いをキャプチャするために記述する。ロギングコードの欠陥は、ログの有用性を損なう可能性があるため、誤解を招く可能性がある。大規模言語モデル(LLM)は、有望な一般化と推論能力を示している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:20:09 GMT)
Causality Matters: How Temporal Information Emerges in Video Language Models [17.6]
ビデオ入力における位置エンコーディングの除去や修正は、時間的理解の性能の低下を最小限に抑えることが判明した。この振る舞いを説明するために、我々は時間的情報がモデルにどのように組み込まれているかを追跡するための重要な分析実験を行った。そこで我々は,2つの効率重視戦略を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 16:33:14 GMT)
Controlling Multimodal LLMs via Reward-guided Decoding [17.6]
マルチモーダル大言語モデル (MLLM) の適応性について, 制御復号化による検討を行った。本手法では,視覚的接地のための報酬モデルを構築し,MLLMの復号プロセスのガイドに使用する。本手法を標準対象幻覚ベンチマークで評価し,MLLMの推論に対する制御性について検討した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:29:06 GMT)
Zero-Shot Anomaly Detection with Dual-Branch Prompt Selection [17.3]
Zero-shot Anomaly Detection (ZSAD) は、見えないカテゴリの欠陥を識別し、ローカライズする。既存のZSADメソッドは、固定または学習プロンプトを使用しても、トレーニングデータが限られたトレーニングドメインから導出されるため、ドメインシフトの下で苦労する。 PILOTは2つの重要なイノベーションを通じてこれらの課題を克服するために設計されたフレームワークです。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 01:22:46 GMT)
Mitigating Modality Quantity and Quality Imbalance in Multimodal Online Federated Learning [17.2]
IoT(Internet of Things)エコシステムは,センサやカメラ,マイクなど,さまざまなソースから大量のマルチモーダルデータを生成する。エッジインテリジェンスの進歩により、IoTデバイスは、単純なデータ取得ユニットから計算能力のあるノードへと進化し、異種マルチモーダルデータのローカライズされた処理を可能にした。データ生成の継続的な性質とエッジデバイスの限られたストレージ容量は、オンライン学習フレームワークを必要としている。これらの要件を満たすための有望なアプローチとして、Multimodal Online Federated Learning (MMO-FL)が登場した。トレーニングと並行して動作するように設計された学習手法であるQQRアルゴリズムを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:13:39 GMT)
Residual-based Efficient Bidirectional Diffusion Model for Image Dehazing and Haze Generation [17.0]
現在のディープデヘイズ法は、ヘイズフリー画像とヘイズフリー画像の翻訳能力に欠け、ヘイズ画像からヘイズを除去することのみに焦点を当てている。本研究では, 残差に基づく効率的な双方向拡散モデル (RBDM) を提案し, 脱ハジングとヘイズ生成の両方の条件分布をモデル化する。 RBDMは,15ステップのサンプリングで,ヘイズフリー画像とヘイズ画像の双方向化を実現することに成功した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 01:00:15 GMT)
TokenRec: Learning to Tokenize ID for LLM-based Generative Recommendation [16.9]
TokenRecは、大規模言語モデル(LLM)ベースのRecommender Systems(RecSys)のトークン化と検索のための新しいフレームワークである。我々の戦略であるMasked Vector-Quantized (MQ) Tokenizerは、協調フィルタリングから学んだマスキングされたユーザ/イテム表現を離散トークンに定量化する。我々の生成的検索パラダイムは,自動回帰復号処理やビーム検索処理の不要さを解消するために,ユーザに対してKドル以上のアイテムを効率的に推奨するように設計されている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:34:06 GMT)
PhysLab: A Benchmark Dataset for Multi-Granularity Visual Parsing of Physics Experiments [16.8]
我々は、複雑な物理実験を行う学生をキャプチャする最初のビデオデータセットであるPhysLabを紹介した。このデータセットには4つの代表的な実験が含まれており、多様な科学機器と豊かな人間と物体の相互作用(HOI)パターンが特徴である。 PhysLabは620の長ビデオで構成され、さまざまなビジョンタスクをサポートするマルチレベルアノテーションを提供する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:41:42 GMT)
Compositional Zero-shot Learning via Progressive Language-based Observations [16.7]
本稿では,プログレッシブ言語に基づく観察(PLO)を提案する。 PLOは、事前に訓練された視覚言語モデル(VLM)を採用し、観察能力を持つモデルを強化する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:22:27 GMT)
Delving into Dynamic Scene Cue-Consistency for Robust 3D Multi-Object Tracking [16.4]
3D多目的追跡は、自動運転分野において重要かつ困難な課題である。本稿では,この原理を実現するために動的シーンCue-Consistency Tracker(DSC-Track)を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:48:13 GMT)
Training-Free Multimodal Large Language Model Orchestration [16.2]
本稿では,対話型マルチモーダルAIシステムを構築するための効果的なアプローチについて報告する。本フレームワークは,(1)ユーザ入力を解析する中央コントローラ,(2)並列テキスト音声アーキテクチャ,(3)クロスモーダルメモリ統合という3つの重要なイノベーションに基づいて構築されている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:09:53 GMT)
LSVG: Language-Guided Scene Graphs with 2D-Assisted Multi-Modal Encoding for 3D Visual Grounding [15.9]
3Dビジュアルグラウンドティングは、自然言語で記述されたユニークなターゲットを3Dシーンでローカライズすることを目的としている。本稿では,言語誘導型シーングラフを参照オブジェクト識別で構築する新しい3次元ビジュアルグラウンドディングフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:24:08 GMT)
CLMIR: A Textual Dataset for Rumor Identification and Marking [15.7]
本稿では,CLMIRという,きめ細かいマーキングによる噂検出のためのデータセットを構築した。記事がうわさかどうかを判断するのに加えて、このデータセットは、そのうわさがベースとなっている特定のコンテンツをさらにマークする。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 01:09:27 GMT)
A Cross-Modal Rumor Detection Scheme via Contrastive Learning by Exploring Text and Image internal Correlations [15.7]
コントラスト学習に基づくクロスモーダルなうわさ検出手法を提案する。スケールアウェア・フュージョンネットワークは,高精細なマルチスケール画像機能とグローバルテキスト機能を統合するように設計されている。実験結果から,噂検出における既存の最先端手法よりも大幅な性能向上が得られた。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 01:13:50 GMT)
Learning an Adaptive and View-Invariant Vision Transformer for Real-Time UAV Tracking [15.6]
トランスフォーマーベースのモデルでは、視覚的トラッキングが改善されているが、ほとんどの場合、リソースデバイス上でリアルタイムに実行することはできない。アクティベーションモジュール(AM)を介してトランスフォーマーブロックを適応的に活性化する適応追跡フレームワークであるAVTrackを提案する。極端視点変動に対処するために,相互情報(MI)を用いたビューイン表現の学習を提案する。さらに,新しいMIベースのマルチ教師ナレッジフレームワークを組み込んだ拡張トラッカーであるAVTrack-MDを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:08:16 GMT)
Casual3DHDR: High Dynamic Range 3D Gaussian Splatting from Casually Captured Videos [15.5]
ニューラルレイディアンスフィールド(NeRF)や3Dガウススプラッティング(3DGS)などの多視点画像からのフォトリアリスティックな新規ビュー合成は、その優れた性能に対して大きな注目を集めている。既存のほとんどの手法は低域ダイナミック(LDR)画像に依存しており、高コントラスト環境で詳細なシーンをキャプチャする能力を制限している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:51:54 GMT)
Smart Cuts: Enhance Active Learning for Vulnerability Detection by Pruning Hard-to-Learn Data [15.5]
脆弱性検出は、ソフトウェアシステムのセキュリティの弱点を特定するために不可欠である。本稿では,データセットマップを用いて,アクティブな学習プロセスを大幅に向上させる新しい手法を提案する。提案手法は,モデルにとって難解なサンプルを体系的に同定し,この情報を統合し,より洗練されたサンプル選択戦略を作成する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 19:44:53 GMT)
Wireless Josephson parametric amplifier above 20 GHz [15.3]
20GHz以上で動作する無線ジョセフソン増幅器(WJPA)の設計と実験的実現について報告する。 WJPAは可変周波数範囲21～23.5GHzで20dB以上の利得を達成し、典型的なダイナミック帯域幅は3MHzである。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 01:09:23 GMT)
TRACY: Benchmarking Execution Efficiency of LLM-Based Code Translation [15.3]
LLM変換されたコードの実行効率を評価するために設計された,最初の総合ベンチマークであるTRACYを紹介する。ベンチマークの結果は、C++、Java、Pythonで1,011のコード変換タスクで構成されている。我々の研究は、将来のLLMベースのコード翻訳において、正確さと効率を共同最適化する必要性を浮き彫りにしている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:33:52 GMT)
Exploring the Tradeoff Between Diversity and Discrimination for Continuous Category Discovery [15.2]
連続圏探索 (Continuous category discovery, CCD) は、ラベルなしデータの連続到着において、新しいカテゴリを自動的に発見することを目的としている。ほとんどのCCD法は、新しいクラス発見と分類の矛盾をうまく扱えない。我々は独立性に基づく多様性と直交性に基づく差別(IDOD)を提案する。提案手法は,細粒度データセットに挑戦する上で,最先端の手法よりも優れている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:51:30 GMT)
Enhancing Supervised Composed Image Retrieval via Reasoning-Augmented Representation Engineering [15.2]
学習自由化を伴うピラミッドマッチングモデルを含むフレームワークを提案する。表現工学にヒントを得て,COTデータから表現を抽出し,LVLMに注入した。 CIRベンチマークの実験では、PTTFRが教師付きCIRタスクにおける最先端の手法を超越していることが示されている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:10:10 GMT)
RAG for Geoscience: What We Expect, Gaps and Opportunities [15.1]
Retrieval-Augmented Generation (RAG)は、検索と生成を組み合わせることで言語モデルを強化する。次世代のパラダイムであるGeo-RAGは、RAGをモジュラー検索の$rightarrow$ reason $rightarrow$ generate $rightarrow$ verify loopとして再定義する。 Geo-RAGは、(i)マルチモーダル地球データの検索、(ii)物理および領域制約下での推論、(iii)科学グレードのアーティファクトの生成、(iv)数値モデル、地上測定、エキスパートアセスメントに対する生成仮説の検証の4つのコア機能をサポートしている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 06:33:27 GMT)
A Real-time Concrete Crack Detection and Segmentation Model Based on YOLOv11 [15.0]
本稿では, YOLOv11nアーキテクチャに基づくマルチタスクコンクリートのひび割れ検出とセグメンテーションモデルであるYOLOv11-KW-TA-FPを提案する。実験による検証では、拡張されたモデルがベースライン上での大幅なパフォーマンス向上を実現している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:57:00 GMT)
Non-Dissipative Graph Propagation for Non-Local Community Detection [15.0]
本稿では,新しい教師なしコミュニティ検出手法であるunsupervised Antisymmetric Graph Neural Network (uAGNN)を紹介する。従来手法では長距離依存性を活用できなかった,中・中程度のヘテロフレンドリーな環境下での uAGNN の優れた性能を示す。これらの結果は、多様なグラフ環境において、教師なしのコミュニティ検出のための強力なツールとしての uAGNN の可能性を強調している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:26:48 GMT)
BRIEF: BRain-Inspired network connection search with Extensive temporal feature Fusion enhances disease classification [14.6]
BRain-Inspired機能Fusion(BRIEF)は自動的にネットワークアーキテクチャを最適化する。 BRIEFは21のアルゴリズムに比べて2.2%から12.1%の大幅な改善を示した。これは、脳にインスパイアされた強化学習戦略を取り入れて、fMRIベースの精神障害分類を最適化する最初の試みである。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:36:03 GMT)
Google's Chrome Antitrust Paradox [14.6]
記事によると、ChromeはGoogleのオンライン広告、パブリッシング、ブラウザ市場における優位性を強化するための戦略に欠かせない。これは、ChromeがGoogleのオンライン広告とパブリッシングにおける地位を、強制や自己紹介などのプラクティスを通じて強化する様子を描いている。また、歴史的反トラストの先例を参考に、規制の介入や改善の可能性を概説している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:32:07 GMT)
Group Fairness Meets the Black Box: Enabling Fair Algorithms on Closed LLMs via Post-Processing [14.6]
本稿では,閉じた LLM からフェア分類器をプロンプトにより導出するためのフレームワークを提案する。我々のフレームワークはデータ効率が高く、LLM埋め込みで訓練された公平な分類器よりも優れています。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 06:50:29 GMT)
Neighbour-Driven Gaussian Process Variational Autoencoders for Scalable Structured Latent Modelling [14.4]
ガウス過程 (GP) 変分オートエンコーダ (VAEs) は、完全に分解されたガウス前処理をGP前処理に置き換えることで標準のVAEを拡張する。大規模GPVAEにおける正確なGP推論の実行は、計算的に禁止されており、しばしば既存のアプローチは制限的なカーネルの仮定に頼らざるを得ない。本稿では,拡張性のあるGPVAE推論を実現するために,潜在空間における局所的隣接性を利用する近似手法を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:10:03 GMT)
SAGE: Scale-Aware Gradual Evolution for Continual Knowledge Graph Embedding [14.1]
本稿では,知識グラフ埋め込みのための段階的進化フレームワークであるSAGEを提案する。 SAGEは既存のベースラインを一貫して上回り、MRRが1.38%、H@1が1.25%、H@10が1.6%改善している。 SAGEと固定埋め込みディメンションを使ったメソッドの比較実験は、SAGEがスナップショット毎に最適なパフォーマンスを達成することを示している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:23:23 GMT)
HOID-R1: Reinforcement Learning for Open-World Human-Object Interaction Detection Reasoning with Multimodal Large Language Model [13.8]
HOID-R1は,チェーン・オブ・シント(CoT)とグループ相対的ポリシー最適化のファインチューニングを統合した最初のHOI検出フレームワークである。 CoT推論における幻覚を軽減するために,CoT出力を監督するMLLM-as-a-judge機構を導入する。実験により、HOID-R1はHOI検出ベンチマークの最先端性能を達成し、新しいシナリオへのオープンワールドの一般化における既存の手法よりも優れていることが示された。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:28:57 GMT)
Benchmarking Prosody Encoding in Discrete Speech Tokens [13.6]
本研究は, 韻律に対する感性に基づく韻律符号化に着目し, 離散トークンを設計するための実践的ガイドラインを提供することを目的とする。特に、言語モデルでは、意味的内容だけでなく、韻律的特徴も反映する応答を理解し、生成することが期待されている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:11:16 GMT)
A Coarse-to-Fine Human Pose Estimation Method based on Two-stage Distillation and Progressive Graph Neural Network [13.6]
人間のポーズ推定のための粗大な2段階の知識蒸留フレームワークを提案する。第1段蒸留では,ヒト関節の構造情報をマイニングするために,ヒト関節の構造損失を導入する。第2段階蒸留では、画像誘導プログレッシブグラフ畳み込みネットワーク(IGP-GCN)を用いて、最初の人間のポーズを洗練する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:41:49 GMT)
Lightweight Attribute Localizing Models for Pedestrian Attribute Recognition [13.5]
本稿では,圧縮モデルの勾配方向が元のモデルと密接に一致していることを保証するため,低ランク層の最適ランクを決定する新しい手法を提案する。これは、圧縮されたモデルはフルモデルの更新方向を効果的に保存し、歩行者属性認識タスクのより効率的な圧縮を可能にすることを意味する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:16:37 GMT)
Expressive Speech Retrieval using Natural Language Descriptions of Speaking Style [13.4]
本稿では,表現型音声検索の課題について紹介する。目的は、そのスタイルの自然言語記述に基づいて、所定のスタイルで話される発話を検索することである。我々は音声とテキストエンコーダを訓練し、発話スタイルの音声とテキスト記述を共同潜在空間に埋め込む。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:38:21 GMT)
Perception in Plan: Coupled Perception and Planning for End-to-End Autonomous Driving [13.4]
VeteranADは、エンドツーエンドの自動運転のための認識と計画の複合フレームワークである。本稿では,計画プロセスに知覚を組み込むフレームワーク設計について紹介する。 VeteranADは、計画指向のエンドツーエンドメソッドの可能性を完全に解き放ち、より正確で信頼性の高い運転行動をもたらす。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:05:57 GMT)
HealthiVert-GAN: A Novel Framework of Pseudo-Healthy Vertebral Image Synthesis for Interpretable Compression Fracture Grading [13.3]
高齢者にOVCF(Osteoporotic vertebral compression fracture)が出現する。 HealthiVert-GANは、骨折した脊椎の骨折前状態をシミュレートする擬似健康な脊椎画像を生成する。 RHLV(Relative Height Loss of Vertebrae)は、プレフラクチャーとポストフラクチャーの間の高さ損失を測定する指標である。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:20:53 GMT)
Towards the Next-generation Bayesian Network Classifiers [13.2]
本稿では,特徴値の分布表現を学習し,高階ベイズ型ネットワーク分類器を設計するための新しいパラダイムを提案する。学習された分布表現は、異なる特徴間の意味的関連性によって符号化される。 60のUCIデータセットに対する大規模な分類実験は、提案されたNeuralKDB分類器が高次機能依存関係のキャプチャに優れていることを示している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 01:31:06 GMT)
Technology-assisted Personalized Yoga for Better Health -- Challenges and Outlook [13.2]
ヨガ(Yoga)は、古代インドの伝統に根ざした身体的姿勢、呼吸法、想想的実践の規律であり、現在では全世界で、総合的な幸福と内的バランスの促進のために受け入れられている。個人固有のニーズに合わせたヨガの便益を得るためには、(a)相互依存を伴う大規模で一見複雑な集合からサブセットを発見し、(b)変化能力や短期目標に合わせた関心を持ってフォローし続け、(c)環境の変化と健康状態に基づいて代替品に適応することが必要である。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 19:34:36 GMT)
SKALD: Learning-Based Shot Assembly for Coherent Multi-Shot Video Creation [12.9]
候補画像からコヒーレントなビデオシーケンスを構成するマルチショットビデオアセンブリであるSKALDを提案する。我々は、複数のショットと学習クリップアセンブリスコアで導かれる効率的なビーム探索アルゴリズムを組み合わせるという指数関数的な複雑さに対処する。 VSPDと当社のキュレートしたMSV3Cデータセットの実験により、SKALDはIoUで最大48.6%の改善を実現し、最先端の手法よりも43%高速化された。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:39:53 GMT)
IMU: Influence-guided Machine Unlearning [12.9]
マシン・アンラーニング(MU)は、要求に応じて特定のデータポイントを選択的に忘れることを可能にする。既存のMUアルゴリズムの多くは、保持セットに部分的または完全な微調整を必要とする。本稿では,インフルエンス誘導型機械学習(IMU)を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:25:52 GMT)
A Semi-supervised Generative Model for Incomplete Multi-view Data Integration with Missing Labels [12.8]
本稿では,ラベル付きサンプルとラベルなしサンプルの両方を統一されたフレームワークで利用する半教師付き生成モデルを提案する。既存の手法と比較して、画像データとマルチオミクスデータの両方において、ビューの欠如とラベル付きサンプルの限定による予測と計算性能が向上する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:10:18 GMT)
From Feedback to Failure: Automated Android Performance Issue Reproduction [12.8]
RevPerfは、Google Playのアプリレビューを利用して関連する情報を取得する、高度なパフォーマンス問題再現ツールである。 RevPerfは関連するレビューを採用し、エンジニアリングを促すことで、オリジナルのレビューをパフォーマンス問題の詳細で強化する。このシステムは,Androidログ,GUI変更,システムリソース利用の監視によって,パフォーマンス問題を特定するための多面的検出手法を組み込んでいる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 01:38:32 GMT)
An Efficient Deep Learning Approach for Approximating Parameter-to-Solution Maps of PDEs [12.2]
縮小コロケーション法(RCM)とディープニューラルネットワーク(DNN)を組み合わせた効率的なアプローチを提案する。近似解析のセクションでは、ニューラルネットワークの複雑さに関するシャープな上限を厳格に導き出す。 POD-DNNは従来の数値計算法と比較して計算速度を大幅に高速化した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:27:45 GMT)
GeoSAM: Fine-tuning SAM with Multi-Modal Prompts for Mobility Infrastructure Segmentation [12.1]
地理的イメージセグメンテーションでは、トレーニングデータの可用性の制限と一般化性の欠如により、性能が制限されることがしばしばある。自動生成マルチモーダルプロンプトを用いてSAMを微調整するSAMベースのフレームワークであるGeographical SAMを提案する。特に、GeoSAMは、事前訓練されたタスク固有のモデルからのポイントプロンプトを第一の視覚的ガイダンスとして統合し、大きな言語モデルによって生成されたテキストプロンプトを第二のセマンティックガイダンスとして統合する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:10:26 GMT)
Inside Knowledge: Graph-based Path Generation with Explainable Data Augmentation and Curriculum Learning for Visual Indoor Navigation [12.1]
我々は,モバイルデバイスが捉えた画像からターゲットへの方向を予測できる,効率的でリアルタイムで容易にデプロイ可能なディープラーニングアプローチを導入する。実用面では、比較的大規模なショッピングモール内にビデオ映像を配置し、それぞれのフレームに適切な次の方向をアノテートして、異なる特定の目的地に向けてアノテートする、新しい大規模データセットを導入する。我々の技術は視覚のみに依存しており、特別なセンサー、道に沿って配置されたマーカー、シーンマップの知識、インターネットアクセスなどを必要としない。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:54:13 GMT)
Informative Post-Hoc Explanations Only Exist for Simple Functions [12.0]
本稿では、意思決定機能に関する情報を提供するための説明のための、一般的な学習理論に基づくフレームワークを紹介する。複雑な決定関数に適用した場合,多くの一般的な説明アルゴリズムは有益ではないことを示す。我々は、これらのアルゴリズムの実用性、特に監査、規制、AIのリスクの高い応用に強く影響していると論じている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:46:18 GMT)
Survey-to-Behavior: Downstream Alignment of Human Values in LLMs via Survey Questions [12.0]
大規模言語モデルは、人間の価値観よりも好みを暗黙的にエンコードする。モデルの価値体系を下流の行動に確実に変更して、それに応じて価値調査の質問に答えるようにトレーニングできるだろうか? 我々の単純なアプローチは、ドメイン内調査の質問に対するモデルの回答を変えるだけでなく、暗黙の下流タスクの振る舞いにおいて大きな変化(バリューアライメント)をもたらすことも示しています。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:36:17 GMT)
When Explainability Meets Privacy: An Investigation at the Intersection of Post-hoc Explainability and Differential Privacy in the Context of Natural Language Processing [11.9]
我々はNLPの文脈で、プライバシーと説明可能性のトレードオフを実証的に調査する。私たちの発見には、プライバシーと説明可能性の複雑な関係についての見解が含まれています。プライバシーと説明責任が共存する可能性を強調します。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:25:21 GMT)
The Rise of Generative AI for Metal-Organic Framework Design and Synthesis [11.9]
生成人工知能の進歩は、金属-有機フレームワーク(MOF)の設計と発見の仕方を変えつつある。このパースペクティブは、MOF候補の厳格な列挙から、オンデマンドで新しい多孔質構造体を自律的に提案、合成できる生成的アプローチへの移行を導入する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:49:17 GMT)
UAV-VL-R1: Generalizing Vision-Language Models via Supervised Fine-Tuning and Multi-Stage GRPO for UAV Visual Reasoning [11.9]
本稿では,UAV-VL-R1を提案する。教師付き微調整(SFT)と多段階強化学習(RL)を組み合わせたハイブリッド手法を用いて訓練を行った。我々は,UAV-VL-R1がQwen2-VL-2B-Instructベースラインよりも48.17%高いゼロショット精度を実現し,72Bスケールの派生モデルよりも優れていることを示した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:06:40 GMT)
AFR-CLIP: Enhancing Zero-Shot Industrial Anomaly Detection with Stateless-to-Stateful Anomaly Feature Rectification [11.8]
本稿では,CLIPに基づく異常特徴修正フレームワークであるAFR-CLIPを提案する。視覚的特徴とテキスト的特徴のコサイン類似度を測定して異常マップを生成する。産業と医療の領域にわたる11の異常検出ベンチマークで実験が行われた。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:03:29 GMT)
Seeing, Listening, Remembering, and Reasoning: A Multimodal Agent with Long-Term Memory [11.7]
本稿では,長期記憶を備えた新しいフレームワークであるM3-Agentを紹介する。 M3-Agentは、リアルタイムの視覚および聴覚入力を処理して、長期記憶の構築と更新を行うことができる。我々は,M3-Benchという長ビデオ質問応答ベンチマークを開発した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:40:53 GMT)
A Survey on Recent Advances in LLM-Based Multi-turn Dialogue Systems [11.7]
本稿では,既存のLLMの概要と,下流タスクにLLMを適用するためのアプローチを提案する。 LLMベースのオープンドメイン対話(ODD)とタスク指向対話(TOD)の両方をカバーするマルチターン対話システムにおける最近の進歩を詳述する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:28:39 GMT)
Introducing Unbiased Depth into 2D Gaussian Splatting for High-accuracy Surface Reconstruction [11.6]
2次元ガウススプラッティング (2DGS) は、一般的な3DGSよりも優れた幾何再構成品質を示している。しかし、光沢のある表面を扱う際には短くなるため、これらの領域に目に見える穴が生じる。反射の不連続性が問題を引き起こすことが判明した。拡散からスペクトル反射へのジャンプを異なる視角に合わせるために、最適化されたガウス原始体に奥行きバイアスを導入する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:21:36 GMT)
Fluid Dynamics and Domain Reconstruction from Noisy Flow Images Using Physics-Informed Neural Networks and Quasi-Conformal Mapping [11.5]
血流イメージングは血管内の血行動態に重要な情報を提供する。しかし,高品質なフロー画像の取得は依然として大きな課題である。本稿では,短時間の取得時間やデバイスによるエラーにより,アーチファクトに悩まされるようなフローイメージをデノベートする問題に対処する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:49:07 GMT)
ADMIRE-BayesOpt: Accelerated Data MIxture RE-weighting for Language Models with Bayesian Optimization [11.4]
本稿では,100万から70億のパラメータを対象とするモデルを対象とした事前学習と指導の微調整について述べる。我々は、幅広いベンチマークに対して一貫して強い結果を示し、500%以上のスピードアップを示した。さらに、ADMIRE IFT Runsは、さまざまなモデルサイズにわたる460のフルトレーニングと評価のデータセットである。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:53:09 GMT)
LoRAtorio: An intrinsic approach to LoRA Skill Composition [11.4]
Low-Rank Adaptation (LoRA) はテキスト・画像拡散モデルにおいて広く採用されている手法である。既存のアプローチでは、複数のLoRAアダプタを効果的に構成するのに苦労している。ロラトリオ(Loratorio)は、マルチロラ合成のための新しいフリートレインフレームワークである。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:52:56 GMT)
From Clicks to Preference: A Multi-stage Alignment Framework for Generative Query Suggestion in Conversational System [11.4]
生成ポリシーとユーザ意図のプログレッシブアライメントを目的とした多段階フレームワークを提案する。我々の枠組みは, 自動評価と人的評価の両方において, ベースラインを著しく上回っている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:17:01 GMT)
A Survey of Idiom Datasets for Psycholinguistic and Computational Research [11.3]
本調査は,イディオム研究のための心理言語学および計算言語学で開発されたデータセットをレビューする。心理学的資源は通常、親しみ、透明性、構成性といった次元に沿った基準付き格付けを含む。計算データセットは、慣用性の検出/分類、言い換え、言語間モデリングなどのタスクをサポートする。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 22:24:09 GMT)
ETTRL: Balancing Exploration and Exploitation in LLM Test-Time Reinforcement Learning Via Entropy Mechanism [11.2]
実験時間強化学習における探索・探索バランスを高めるためのエントロピーに基づくメカニズムを提案する。ベースラインと比較すると、Llama3.1-8Bは1メートルでのパスの68%の相対的な改善を達成できる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:49:14 GMT)
Rationalizing Transformer Predictions via End-To-End Differentiable Self-Training [11.2]
本稿では,有理化変換器分類器の安定的な訓練のためのエンドツーエンドの微分可能訓練パラダイムを提案する。提案手法は,サンプルを同時に分類し,その分類との関連性に基づいて入力トークンをスコアする単一モデルである。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:51:58 GMT)
The Role of Quantum Computing in Advancing Scientific High-Performance Computing: A perspective from the ADAC Institute [11.1]
量子コンピューティング(QC)は、古典的に要求されるタスクを高速化する可能性から、過去20年間で大きな注目を集めている。量子ビット数や関数の進歩は急速に続いているが、現在の量子系は実用アプリケーションのためのスケーラビリティを欠いている。本稿では、QCと高性能コンピューティングの関係を考察し、計算効率の向上における相補的な役割を強調した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:31:37 GMT)
CRAFT-GUI: Curriculum-Reinforced Agent For GUI Tasks [11.1]
Reinforcement Learning (RL) は動的対話型GUI環境においてエージェントのパフォーマンスを効果的に向上させる。ほとんどのアプローチはタスク固有のニュアンスを1つの粗い報酬に分解し、エージェントに非効率なポリシー更新をもたらす均一な信号を残す。我々は,グループ相対政策最適化(GRPO)に基づくカリキュラム学習フレームワークであるCRAFT-GUIを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:55:02 GMT)
BadPatches: Backdoor Attacks Against Patch-based Mixture of Experts Architectures [11.1]
バックドア攻撃に対する画像分類のためのパッチベースMOE(pMoE)モデルの脆弱性について検討する。我々の研究は、pMoEモデルがバックドア攻撃の影響を受けやすいことを示している。 5つのエポックのモデルを微調整すると、攻撃成功率は2.1%に低下し、精度は1.4%に低下する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:56:54 GMT)
SEF-MK: Speaker-Embedding-Free Voice Anonymization through Multi-k-means Quantization [11.0]
我々はSEF-MKと呼ばれる話者埋め込み不要なフレームワークを提案する。データセット全体をトレーニングした単一のk平均モデルを使用する代わりに、SEF-MKは複数のk平均モデルの1つをランダムに選択することで、各発話に対するSSL表現を匿名化する。実験によると、単一のk平均モデルと比較して、複数のk平均モデルを持つSEF-MKは、ユーザの視点から言語的および感情的なコンテンツをよりよく保存する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 20:56:11 GMT)
MCA-Bench: A Multimodal Benchmark for Evaluating CAPTCHA Robustness Against VLM-based Attacks [11.0]
MCA-Benchは包括的な再現可能なベンチマークスイートである。不均一なCAPTCHA型を単一の評価プロトコルに統合する。大規模な実験により、MCA-Benchは現在のCAPTCHA設計の脆弱性スペクトルを効果的にマッピングしていることが明らかになった。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:39:46 GMT)
L3AC: Towards a Lightweight and Lossless Audio Codec [10.9]
我々は、単一量子化器と高効率アーキテクチャを活用することで課題に対処する軽量なニューラルオーディオであるL3ACを紹介する。 L3ACは、複数の時間スケールにわたる音響変化を捉えるように設計された新しい構造であるTConvとともに、合理化された畳み込みネットワークとローカルトランスフォーマーモジュールを探索する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:56:31 GMT)
Does the Skeleton-Recall Loss Really Work? [10.9]
Kirchhoffらによって提案されたSkeleton Recall Loss (SRL) は、ベンチマーク管状データセットで最先端の結果を生成することが述べられた。本研究では,SRL損失の勾配に関する理論的解析を行った。 SRLベースセグメンテーションモデルの性能は,従来のベースラインモデルを超えなかった。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:16:34 GMT)
How Causal Abstraction Underpins Computational Explanation [10.7]
我々は、因果的抽象の理論がこの話題に実りあるレンズを与えていると論じる。ニューラルネットワークを用いたディープラーニングに関する最近の議論に基づいて、現代機械学習における計算と認識の哲学における古典的なテーマがどのように再浮上したかを説明する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:46:02 GMT)
ShoulderShot: Generating Over-the-Shoulder Dialogue Videos [10.7]
ShoulderShotはデュアルショット生成とループビデオを組み合わせたフレームワークで、文字の一貫性を維持しながら対話を拡張できる。本研究は,ショット・リバース・ショット・レイアウト,空間的連続性,対話長の柔軟性の観点から,既存の手法を超越した機能を示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:27:47 GMT)
CryptoScope: Utilizing Large Language Models for Automated Cryptographic Logic Vulnerability Detection [10.6]
我々は,Large Language Models(LLMs)を利用した暗号脆弱性の自動検出のための新しいフレームワークであるCryptoScopeを紹介する。 CryptoScopeがChain-of-Thought(CoT)とRetrieval-Augmented Generation(RAG)を併用我々は,LLM-CLVAのCryptoScopeの評価を行った。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:07:54 GMT)
Sketch Decompositions for Classical Planning via Deep Reinforcement Learning [10.5]
計画と強化学習においては,問題間の共通部分構造を同定することが重要である。これらのスケッチは問題をサブプロブレムに分割し、IW$(k)$検索の欲求列によって低時間で解けるようにした。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:24:10 GMT)
Dynamic Quality-Latency Aware Routing for LLM Inference in Wireless Edge-Device Networks [10.5]
無線通信とLLM(Large Language Models)の統合は、ユビキタスなインテリジェントなサービスをアンロックする。無線のエッジデバイス共同環境にデプロイすることは、推論品質とエンドツーエンドのレイテンシの間に重要なトレードオフをもたらす。本稿では,モバイルデバイス上の軽量モデルとエッジサーバ上の強力なモデルとの推論をオーケストレーションする,動的で品質に配慮したルーティングフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:55:05 GMT)
LETToT: Label-Free Evaluation of Large Language Models On Tourism Using Expert Tree-of-Thought [10.5]
我々はエキスパート由来の推論構造を利用するフレームワークであるExpert $textbfT$ree-$textbfo$f-$textbfT$hought (LETToT)を提案する。その結果,4.99-14.15%の相対的品質向上率をベースラインに最適化したToTの有効性が示された。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:37:12 GMT)
EllieSQL: Cost-Efficient Text-to-SQL with Complexity-Aware Routing [10.4]
Text-to-sqlでは、専門知識のない非技術者がデータベースからデータを取得することができる。リーダーボードにおける先進的なText-to-sqlアプローチの成功にもかかわらず、持続不可能な計算コストは見落とされがちである。本稿では,パフォーマンス向上の応答性を捉えることで,コスト効率を計測するToken Elasticity of Performance指標を紹介する。私たちのソースコードとモデルはhttps://elliesql.io/.com/で公開されています。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:08:35 GMT)
SPG: Style-Prompting Guidance for Style-Specific Content Creation [10.4]
スタイルプロンプティングガイダンス(SPG)は、スタイル固有の画像生成のための新しいサンプリング戦略である。本手法は意味的忠実度とスタイル整合性を両立させる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:44:56 GMT)
Harmonized Gradient Descent for Class Imbalanced Data Stream Online Learning [10.4]
異なるクラス間の勾配のノルムを等化することを目的としたHGDアルゴリズムを導入する。勾配の標準バランスを確保することで、HGDはマイナークラスの過小評価を軽減し、バランスの取れたオンライン学習を実現する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:35:13 GMT)
AgentSight: System-Level Observability for AI Agents Using eBPF [10.4]
既存のツールは、エージェントの高レベルな意図(LSMプロンプトを介して)または低レベルな行動(例えば、システムコール)を観察するが、これら2つのビューを関連付けることはできない。 AgentOpsはハイブリッドアプローチを使用して,このセマンティックギャップをブリッジする,AgentOpsオブザーバビリティフレームワークです。 AgentSightはTLS暗号化されたLLMトラフィックをインターセプトしてセマンティックインテントを抽出し、カーネルイベントを監視してシステム全体の効果を観察し、これら2つのストリームをプロセス境界を越えて因果的に関連付ける。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:45:40 GMT)
Efficient Image-to-Image Schrödinger Bridge for CT Field of View Extension [10.4]
画像から画像までのSchr"odinger Bridge (I$2$SB)拡散モデルに基づく効率的なCT FOV拡張フレームワークを提案する。 I$2$SBは、実データで49.8,HU、実データで152.0HUのルート平均二乗誤差(RMSE)値で優れた定量的性能を達成する。 1ステップの推論では、2Dスライスあたり0.19秒で再構築が可能で、cDDPM (135秒) よりも700倍のスピードアップを示し、拡散GAN (0.58秒) を超えている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:41:05 GMT)
AegisBlock: A Privacy-Preserving Medical Research Framework using Blockchain [10.2]
我々は患者中心のアクセス制御フレームワークであるAegisBlockを提案し、研究者と医療記録を共有する。 AegisBlockは、患者が医療データにアクセスできるようにする。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 20:43:36 GMT)
Fairness in Dysarthric Speech Synthesis: Understanding Intrinsic Bias in Dysarthric Speech Cloning using F5-TTS [10.0]
外科的スピーチは、補助技術を開発する上で重要な課題である。近年のニューラル音声合成、特にゼロショット音声クローニングは、データ拡張のための合成音声生成を促進する。 TORGOデータセットを用いた変形性関節症音声のクローニングにおける最先端F5-TTSの有効性について検討した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 06:49:05 GMT)
ElasticMM: Efficient Multimodal LLMs Serving with Elastic Multimodal Parallelism [9.9]
マルチモーダル大言語モデル(MLLM)は、特徴抽出器とプロジェクションモジュールを組み込むことで、画像、ビデオ、オーディオを扱う。現在の密結合のサービスアーキテクチャは、混合要求タイプを区別するのに苦労しています。本稿では,リソースの不均一性に弾力的に適応する新しいサービスパラダイムであるElastic Multimodal Parallelism(EMP)を紹介する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:27:30 GMT)
Inspire or Predict? Exploring New Paradigms in Assisting Classical Planners with Large Language Models [9.9]
LLM(Large Language Models)は、検索空間を熟成するための有用なアクションと状態を生成する。本稿では,問題分解と統合された新しいプランナを提案し,まず大規模計画問題を単純なサブタスクに分解する。複数の領域にわたるプランナの有効性を実証的に検証し,大規模計画問題の解法における空間分割の探索能力を示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:08:07 GMT)
Learning-based Sketches for Frequency Estimation in Data Streams without Ground Truth [9.9]
伝統的なスケッチは、厳密なメモリ制約の下でのみ粗い見積もりを提供する。キーごとの周波数推定のための実践的な学習パラダイムであるUCL-sketchを提案する。設計では、2つの重要なイノベーションを紹介している: (i) 基礎的な真実(GT)を必要としない同等の学習に基づくオンライントレーニングメカニズムと、 (ii) 構造化推定バケットを活用して実世界のデータストリームにスケールする高度にスケーラブルなアーキテクチャ。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:27:17 GMT)
Role-Augmented Intent-Driven Generative Search Engine Optimization [9.9]
本稿では,G-SEO(Role-Augmented Intent-Driven Generative Search Engine Optimization)法を提案する。提案手法は,多種多様な情報的役割にまたがるリフレクティブ・リフレクティブ・リファインメントによる検索意図をモデル化し,ターゲットコンテンツの強化を可能にする。実験結果から,検索意図がコンテンツ最適化に有効な信号であることが示された。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:08:55 GMT)
UNVEILING: What Makes Linguistics Olympiad Puzzles Tricky for LLMs? [9.9]
大規模言語モデル(LLM)は推論タスクの可能性を示しているが、言語学パズルにおけるそれらの性能はいまだに貧弱である。本研究は,低リソース言語41言語を対象に,LLMの629問題に対する性能を言語情報付きでラベル付けして解析し,弱点を明らかにした。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 06:53:28 GMT)
Diffusion Model for Slate Recommendation [9.9]
本稿では, 急速条件付きスレート生成のための拡散モデルに基づく生成フレームワークであるDMSGを紹介する。検索ベースや自己回帰モデルとは異なり、DMSGはスレート上の結合分布をモデル化し、柔軟性と多様性を高める。 DMSGを音楽プレイリスト生成とeコマースバンドル生成の2つの重要な領域で評価する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:30:27 GMT)
Representing Speech Through Autoregressive Prediction of Cochlear Tokens [9.8]
AuriStreamは生物学的にインスパイアされた音声符号化モデルである。意味のある音素と単語表現、そして最先端の語彙意味学を学ぶ。 AuriStreamは、様々な下流のSUPERB音声タスクで競合性能を示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:06:04 GMT)
MobQA: A Benchmark Dataset for Semantic Understanding of Human Mobility Data through Question Answering [9.6]
MobQAは、大規模言語モデルの意味理解能力を評価するために設計されたベンチマークデータセットである。 5800の高品質な質問応答対を3つの相補的な質問タイプに分けて構成する。主要なLCMの評価は, 事実検索に強い性能を示すが, 意味的推論や説明的質問応答には大きな制限がある。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:30:20 GMT)
PTQAT: A Hybrid Parameter-Efficient Quantization Algorithm for 3D Perception Tasks [9.5]
ポストトレーニング量子化(PTQ)と量子アウェアトレーニング(QAT)は、2つの主流モデル量子化アプローチを表す。本稿では,3次元知覚ネットワークの効率的な展開のための新しいハイブリッド量子化アルゴリズムPTQATを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 06:20:09 GMT)
Causal Structure Learning in Hawkes Processes with Complex Latent Confounder Networks [9.4]
連続時間事象列は時間間隔が縮むにつれて離散時間モデルで表現できることを示す。本稿では,検出したサブプロセス間の因果関係の推論と,新しい潜在サブプロセスの発見を交互に行う2相反復アルゴリズムを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:03:39 GMT)
Scene Graph-Guided Proactive Replanning for Failure-Resilient Embodied Agent [9.4]
本稿では,サブタスク境界における障害の検出と修正を行う,アクティブなリプランニングフレームワークを提案する。 AI2-THORシミュレータの実験では,実行障害発生前の意味的および空間的ミスマッチを検出する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:48:51 GMT)
Pushing the Limits of Frequency Analysis in Leakage Abuse Attacks [9.4]
本稿では,暗号化範囲クエリをサポートするスキームに対する漏洩攻撃の文脈における周波数解析の暗号解析手法に着目した。高次元暗号化データでも動作するLakage-Abuse via Matching (LAMA)と呼ばれる汎用攻撃フレームワークを導入する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 16:16:13 GMT)
SORT3D: Spatial Object-centric Reasoning Toolbox for Zero-Shot 3D Grounding Using Large Language Models [9.3]
SORT3Dは2Dデータからリッチなオブジェクト属性を利用して、大規模言語モデル(LLM)とAsベースの空間推論ツールボックスをマージし、シーケンシャルな推論を行う。 2つのベンチマークにおいて、複雑なビュー依存グラウンド処理におけるSORT3Dのゼロショット性能を示す。また、このパイプラインを実装して、2台の自動運転車でリアルタイムに実行し、我々のアプローチが、これまで見つからなかった現実世界の環境におけるオブジェクトゴールナビゲーションに利用できることを実証しています。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 00:22:23 GMT)
Exploring Superior Function Calls via Reinforcement Learning [9.3]
本稿では,グループ相対的政策最適化を強化するための新しい強化学習フレームワークを提案する。機能呼び出しにおける3つの重要な課題に対処する: 政策学習における不十分な探索、連鎖生成における構造的推論の欠如、パラメータ抽出の不十分な検証。本フレームワークは,86.02%の精度でオープンソースモデル間の最先端性能を実現し,複雑な多機能シナリオにおいて標準GRPOを最大6%上回っている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:14:24 GMT)
AIM-Bench: Evaluating Decision-making Biases of Agentic LLM as Inventory Manager [9.2]
AIM-Benchは、不確実なサプライチェーン管理シナリオにおいて、大規模言語モデル(LLM)の意思決定行動を評価するために設計された新しいベンチマークである。以上の結果から, LLMは人体とよく似た, 決定バイアスの度合いが異なることが明らかとなった。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:38:19 GMT)
Labels or Input? Rethinking Augmentation in Multimodal Hate Detection [9.2]
マルチモーダルヘイト検出を改善するために,マルチモーダルヘイト検出法を提案する。まず、素早い構造、監督、訓練のモダリティを体系的に変化させるプロンプト最適化フレームワークを提案する。次に,2,479個の正中性ミームを生成するマルチモーダルデータ拡張パイプラインを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:31:00 GMT)
LVFace: Progressive Cluster Optimization for Large Vision Models in Face Recognition [9.1]
視覚変換器(ViT)は大規模な視覚モデリングに革命をもたらしたが、依然としてCNNが支配的である顔認識(FR)では未探索のままである。本稿では,より優れた結果を得るために,プログレッシブクラスタ最適化を統合したVTベースのFRモデルであるLVFaceを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:23:48 GMT)
Relative Position Matters: Trajectory Prediction and Planning with Polar Representation [9.0]
自動運転における軌道予測と計画は非常に難しい。既存の手法は地図とエージェントの位置を符号化し、カルテシアン座標の将来の軌跡をデコードする。ポーラス(Polaris)は、ポーラス座標で完全に動作する新しい手法である。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:15:11 GMT)
Graph Neural Diffusion via Generalized Opinion Dynamics [8.7]
本稿では,複数の意見力学モデルを原理的,訓練可能な拡散機構に統一するGODNFを提案する。本フレームワークは,ノード固有の挙動モデリングと動的近傍の影響により,異種拡散パターンと時間的ダイナミクスを捕捉する。多様な収束構成をモデル化するGODNFの能力を示す厳密な理論的解析を行う。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 06:36:57 GMT)
A Survey on Pre-Trained Diffusion Model Distillations [8.6]
ジェネレーティブ・人工知能(GenAI)における拡散モデル(DM)の優位性 DMは通常、大量のデータセットでトレーニングされ、大容量のストレージを必要とする。訓練済みDMの蒸留法は、より小型で効率的なモデルを開発するために広く採用されている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 00:20:58 GMT)
Robust Convolution Neural ODEs via Contractivity-promoting regularization [8.6]
本稿では,動的システムに代表されるニューラルネットワークのロバスト性を改善するために収縮理論を提案する。システム力学のジャコビアンを含む正規化項を用いることで、訓練中に収縮性を誘導することができる。傾斜制限付アクティベーション関数を持つNODEのクラスに対して、慎重に選択された重み正規化項を用いて、これを促進できることを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:18:44 GMT)
Multi-Sensory Cognitive Computing for Learning Population-level Brain Connectivity [8.6]
mCOCOはBOLD信号から集団レベルの機能的CBTを学習する新しいフレームワークである。 RCの動的システム特性は、時間とともに状態の変化を追跡し、解釈可能性を高め、脳に似たダイナミクスのモデリングを可能にする。筆者らのmCOCOフレームワークは,(1)BOLD信号を貯水池にマッピングし,個々の機能的コネクトームを導出し,グループレベルのCBTに集約する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:38:39 GMT)
TrajSV: A Trajectory-based Model for Sports Video Representations and Applications [8.5]
既存の研究における様々な問題に対処するトラジェクトリベースのフレームワークであるTrajSVを提案する。 TrajSVは、データ前処理、Clip Representation Network(CRNet)、Video Representation Network(VRNet)の3つのコンポーネントで構成されている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 16:23:36 GMT)
Theory of Decentralized Robust Kernel-Based Learning [8.4]
我々は、カーネルヒルベルト空間を再現する枠組みの中で、新しい堅牢なカーネルベース学習アルゴリズムを提案する。分散化アルゴリズムから生成された各局所ロバスト推定器を用いて回帰関数を近似することができることを示す。局所的なサンプルサイズに対する厳密な選択ルールを提供し、適切に選択されたステップサイズとスケーリングパラメータ$sigma$では、分散化されたロバストアルゴリズムが最適な学習率を達成することができることを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:55:33 GMT)
HateClipSeg: A Segment-Level Annotated Dataset for Fine-Grained Hate Video Detection [8.3]
HateClipSegはビデオレベルとセグメントレベルのアノテーションを備えた大規模マルチモーダルデータセットである。私たちの3段階アノテーションプロセスは、アノテータ間の高い合意をもたらす。結果は現在のモデルにおける大きなギャップを浮き彫りにする。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:29:49 GMT)
INFNet: A Task-aware Information Flow Network for Large-Scale Recommendation Systems [8.3]
Information Flow Network (INFNet)は、大規模レコメンデーションシナリオ用に設計されたタスク対応アーキテクチャである。 INFNetは、機能を3つのトークンタイプ、分類トークン、シーケンストークン、タスクトークンに分類し、新しいデュアルフロー設計を導入している。 INFNetは商業オンライン広告システムで成功し、収益(REV)は1.587%、クリックスルーレート(CTR)は+1.155%だった。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 16:18:32 GMT)
Minimizing Surrogate Losses for Decision-Focused Learning using Differentiable Optimization [8.0]
決定中心学習(DFL)は、最適化問題のパラメータを予測するために機械学習(ML)モデルを訓練する。勾配に基づくDFLは、予測されたパラメータに対する最適化問題に対する解の微分を計算する必要がある。線形プログラム(LP)のような多くの最適化問題に対して、予測されたパラメータに対する後悔の勾配はほぼどこでもゼロである。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:59:56 GMT)
Trustworthy AI Psychotherapy: Multi-Agent LLM Workflow for Counseling and Explainable Mental Disorder Diagnosis [7.8]
DSM5AgentFlowは、DSM-5 Level-1診断票を自律的に生成する最初のLCMベースのエージェントワークフローである。特定のクライアントプロファイルでセラピストとクライアントの対話をシミュレートすることで、このフレームワークは透明でステップバイステップの障害予測を提供する。このワークフローは、精神的な健康診断のための補完的なツールとして機能し、倫理的および法的基準の遵守を保証する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:08:32 GMT)
Pathology-Guided AI System for Accurate Segmentation and Diagnosis of Cervical Spondylosis [7.8]
MRIを用いた頚椎症診断のためのAI支援エキスパートベース診断システムを開発した。本システムでは, 頸部解剖学的重要な構造を正確にセグメント化できる病的ガイド付きセグメンテーションモデルを特徴とする。本手法は, ヘルニア局所化, K線状態評価, T2ハイパーインテンシティ検出, Kang gradingにおいて高い精度, 精度, リコール, F1 スコアが得られた。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:10:46 GMT)
Scalable h-adaptive probabilistic solver for time-independent and time-dependent systems [7.8]
我々は、多数のコロケーションポイントにスケール可能な$h$適応確率的解法を開発する。提案手法のベンチマークPDEに対する有効性を示すとともに,時間依存性のパラボリックPDEを時空設定で定式化した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:50:23 GMT)
VFM-Guided Semi-Supervised Detection Transformer for Source-Free Object Detection in Remote Sensing Images [7.8]
VG-DETRは、Vision Foundation Model(VFM)を「フリーランチ」方法でトレーニングパイプラインに統合する。擬似ラベルの信頼性を評価するために,VFMのセマンティックな事前情報を利用した擬似ラベルマイニング手法を提案する。さらに,デュアルレベルのVFM誘導アライメント手法を提案し,インスタンスレベルと画像レベルでのVFM埋め込みと検出器特性を一致させる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:35:56 GMT)
VideoAVE: A Multi-Attribute Video-to-Text Attribute Value Extraction Dataset and Benchmark Models [7.6]
VideoAVEは、14のドメインにまたがって172のユニークな属性をカバーする、初めて公開されたビデオからテキストまでのEコマースAVEデータセットである。データ品質を確保するために,ポストホックCLIPベースのMixture of Experts Filtering System (CLIP-MoE)を提案する。結果から,特にオープンな環境では,ビデオからテキストへのAVEは依然として困難な問題であることが明らかとなった。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 20:58:47 GMT)
FantasyTalking2: Timestep-Layer Adaptive Preference Optimization for Audio-Driven Portrait Animation [7.6]
本研究では,多次元の期待を満足するビデオの精度を定量化するために,人間と協調する報酬関数を学習する報酬モデルであるTalking-Criticを紹介する。また、拡散に基づくポートレートアニメーションモデルと微細な多次元の好みを整合させる新しいフレームワークであるTLPO(Timestep-Layer Adaptive Multi-expert Preference Optimization)を提案する。実験では、トーキング・クライブが人間の嗜好評価と整合する既存の手法を著しく上回っていることを示した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 06:43:46 GMT)
Fast and Accurate Silent Vulnerability Fix Retrieval [7.5]
CVEを修正するためのパッチコミットをトレース/検索する既存のアプローチは、2つの大きな課題に悩まされている。 SITPatchTracerは、既知の脆弱性パッチをトレースするスケーラブルで効果的な検索システムである。 SITPatchTracerを使って、GitHub Advisoryデータベース内の35の新しいCVEのパッチリンクをトレースしてマージしました。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 00:39:16 GMT)
DiCriTest: Testing Scenario Generation for Decision-Making Agents Considering Diversity and Criticality [7.4]
多様性と臨界性を考慮したテストシナリオを生成するための二重空間案内型テストフレームワークを提案する。シナリオパラメータ空間において、階層的表現フレームワークは次元の減少と多次元部分空間評価を組み合わせたものである。実験により、我々のフレームワークは、平均56.23%の臨界シナリオ生成を改善し、新しいパラメータ-振る舞い共駆動メトリクスの下でより多様性を示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:51:45 GMT)
Mammo-SAE: Interpreting Breast Cancer Concept Learning with Sparse Autoencoders [7.2]
医療画像などの高分解能領域では、解釈可能性が重要である。 Sparse Autoencoder (SAE) を用いた乳房画像の解釈性について紹介する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 19:18:28 GMT)
Quantum-Boosted High-Fidelity Deep Learning [7.2]
本稿では,大規模かつ長期間安定なハイブリッド量子古典アーキテクチャであるQuantum Boltzmann Machine-Variational Autoencoder (QBM-VAE)を紹介する。我々のフレームワークは、ボルツマン分布からの効率的なサンプリングのために量子プロセッサを活用し、深層生成モデルにおける強力な先行モデルとしての使用を可能にした。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:51:20 GMT)
Open, Reproducible and Trustworthy Robot-Based Experiments with Virtual Labs and Digital-Twin-Based Execution Tracing [7.2]
我々は、自律ロボットが科学的実験を行う未来を、正確で反復可能なだけでなく、オープンで、信頼できる、透明な方法で予測する。センサデータを意味的に注釈付けされたロボットの信念状態とともにログするセマンティック実行追跡フレームワークと、大規模にロボットタスクの実行を共有、複製、検証するためのクラウドベースのプラットフォームであるAICOR Virtual Research Building(VRB)の2つの主要なコントリビューションを提示する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:16:06 GMT)
Temporally-Similar Structure-Aware Spatiotemporal Fusion of Satellite Images [7.2]
実世界のシナリオでは、観測された衛星画像は測定装置や環境条件によってノイズによって著しく劣化する。この問題に対処するため、TSSTFはTGTV(Temporally-Guided Total Variation)とTGEC(Temporally-Guided EdgeConstraintConstraint)という2つの重要なメカニズムを導入した。我々は,ST融合タスクを,TGTVとTGECを組み合わせた制約付き最適化問題として定式化し,事前条件付き原始二分割法に基づく効率的なアルゴリズムを開発した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 06:50:34 GMT)
Boosting the Robustness-Accuracy Trade-off of SNNs by Robust Temporal Self-Ensemble [7.0]
Spiking Neural Networks(SNN)は、エネルギー効率と脳にインスパイアされたコンピューティングのための有望な方向性を提供する。本研究は,対人学習における時間構造の重要性を強調し,強靭なスパイクモデル構築のための原則的基盤を提供する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:34:06 GMT)
Spectral characterizations of entanglement witnesses [7.0]
本稿では, 絡み合い目撃者(EWs)のスペクトル特性に関する系統的研究を行う。我々は,最大固有値,最小固有値,負性,および正方形フロベニウスノルムの単位トレース(正規化)エンタングルメント証人の無限小と極小を解析した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:25:51 GMT)
Visual Perception Engine: Fast and Flexible Multi-Head Inference for Robotic Vision Tasks [6.9]
Visual Perception Engine (VPEngine)は、開発者のアクセシビリティを維持しながら、視覚的マルチタスクのための効率的なGPU使用を可能にするために設計されたモジュラーフレームワークである。我々のフレームワークアーキテクチャは、並列に実行される複数のタスク固有のモデルヘッド間で効率的に共有される画像表現を抽出する共有基盤モデルバックボーンを活用している。実装例では、NVIDIA Jetson Orin AGX forRT最適化モデル上で、エンド・ツー・エンドのリアルタイム性能を$geq$50 Hzで示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 16:42:23 GMT)
Forecasting Clicks in Digital Advertising: Multimodal Inputs and Interpretable Outputs [6.7]
本稿では,クリックデータと実世界の広告キャンペーンのテキストログを組み合わせ,数値予測とともに人間解釈可能な説明を生成するフレームワークを提案する。大規模産業データセットの実験により,本手法は精度と推論品質の両方において,ベースラインを上回っていることが示された。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:01:53 GMT)
Generational Adversarial MAP-Elites for Multi-Agent Game Illumination [6.7]
品質多様性(QD)アルゴリズムは、特定の行動空間をカバーする高性能なソリューションを見つけることにより、探索空間を照らす。そこで本研究では,複数世代にまたがって解決策を共進化させる新しいQDアルゴリズムであるGenerational Adversarial MAP-Elites (GAME)を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:52:09 GMT)
Probing the Representational Power of Sparse Autoencoders in Vision Models [6.7]
スパースオートエンコーダ(SAE)は,大規模言語モデル(LLM)の隠蔽状態を解釈するための一般的なツールとして登場した。言語モデルに人気があるにもかかわらず、SAEは依然として視覚領域で研究されている。我々は、幅広い画像ベースタスクを用いて、視覚モデルに対するSAEの表現力を広範囲に評価する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:29:42 GMT)
A Multi-Task Evaluation of LLMs' Processing of Academic Text Input [6.7]
大規模な言語モデル(LLM)が科学的な発見にどの程度役立つか、特に学術的な査読を支援することは熱い議論である。我々は、コンピュータサイエンス研究が別々の用語で採用する個々のタスクを、LLMによる学術テキスト入力の処理を評価するためのガイド付きで堅牢なワークフローにまとめる。コンテンツ再生/比較/修正/修正の4つのタスクをLLMの特定の役割を要求される。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 19:05:57 GMT)
Hierarchical Graph Feature Enhancement with Adaptive Frequency Modulation for Visual Recognition [6.6]
畳み込みニューラルネットワーク(CNN)は、視覚認識タスクにおいて強力な性能を示している。構造認識と特徴表現を両立させるため,CNNにグラフベース推論を統合する新しいフレームワークを提案する。提案したHGFEモジュールは軽量でエンドツーエンドのトレーニングが可能で、標準のCNNバックボーンネットワークにシームレスに統合できる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:19:50 GMT)
Med3DVLM: An Efficient Vision-Language Model for 3D Medical Image Analysis [6.5]
ビジョン言語モデル(VLM)は、2Dの医療画像解析において有望であるが、3Dに拡張することは依然として困難である。 Med3DVLMは3つの重要なイノベーションを通じてこれらの課題に対処するために設計された3D VLMである。我々は,120,084個の医用画像に対して,放射線学報告とVQAデータを含むM3Dデータセットを用いて本モデルを評価した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:13:55 GMT)
Noise Matters: Optimizing Matching Noise for Diffusion Classifiers [6.4]
本稿では,DCの整合性(良い)を学習するための新しいノイズ最適化手法を提案する: NoOp。周波数マッチングのために、NoOpはまずランダムにパラメータ化されたノイズを最適化する。空間マッチングでは、NoOpはメタネットワークをトレーニングし、入力出力としてイメージを採用する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:01:03 GMT)
PRS-Med: Position Reasoning Segmentation with Vision-Language Model in Medical Imaging [6.4]
PRS-Medは、視覚言語モデルとセグメンテーション機能を統合し、正確なセグメンテーションマスクとそれに対応する空間推論出力の両方を生成するフレームワークである。 MMRSデータセットは、医療画像における位置推論データの欠如に対処するために、多様な空間的な質問応答ペアを提供する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:58:27 GMT)
Control of Dipolar Dynamics by Geometrical Programming [6.4]
分子トウィーザアレイの幾何学的再構成による量子多体制御法の提案と理論的解析を行った。本研究では, スピンスクイーズを積極的に再構成した短距離XYモデルにおいて, 動きの劣化を抑制し, 強化したスピンスクイーズを実現する方法を示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 19:27:55 GMT)
Visuomotor Grasping with World Models for Surgical Robots [6.2]
外科的把握のための視覚的学習フレームワークであるGrasp Anything for Surgery V2 (GASv2)を紹介した。我々は,ドメインランダム化を用いてシミュレーションの方針を訓練し,ファントムと生体外の両方で実ロボットに展開する。実験の結果,両設定ともに65%の成功率を示し,未確認の物体やグリップに一般化し,多様な乱れに適応することがわかった。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:23:07 GMT)
A CLIP-based Uncertainty Modal Modeling (UMM) Framework for Pedestrian Re-Identification in Autonomous Driving [6.2]
Uncertainty Modal Modeling (UMM) フレームワークは、マルチモーダルトークンマッパー、合成モダリティ強化戦略、およびクロスモーダルキュー対話型学習器を統合している。 UMMは、不確実なモード条件下で強い堅牢性、一般化、および計算効率を達成する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:50:27 GMT)
Meta-learning Structure-Preserving Dynamics [6.1]
本稿では,潜在的に未知のシステムパラメータのコンパクトな潜在表現に対して,構造保存モデルを記述する変調に基づくメタラーニングフレームワークを提案する。動的システムのパラメトリックファミリをまたいだスケーラブルで一般化可能な学習を可能にする。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:30:27 GMT)
Dataset Creation for Visual Entailment using Generative AI [6.1]
視覚的エンターテイメントモデルをトレーニングするための新しい合成データセットを提示し、検証する。合成データセットをSNLIデータセットに基づいてテキスト・エンテーメントを行う。合成トレーニングデータはSNLI-VEの品質をわずかに低下させるだけであり、実データでトレーニングした場合のFスコア0.686と0.703とを比較した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:13:41 GMT)
CoFi: A Fast Coarse-to-Fine Few-Shot Pipeline for Glomerular Basement Membrane Segmentation [6.1]
EM画像のGBMデライン化のために設計された高速で効率的な数ショットセグメンテーションパイプラインであるCoFiを紹介する。 CoFiは、Dice係数が74.54%、推論速度が1.9 FPSの例外的なGBMセグメンテーション性能を達成する。パイプラインの速度とアノテーションは研究に適しており、腎病理学における臨床応用に強い可能性を秘めている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:34:24 GMT)
SafeConstellations: Steering LLM Safety to Reduce Over-Refusals Through Task-Specific Trajectory [6.0]
過剰な拒絶行動は、有害な内容に表面的に類似する良心的な指示をモデルが拒否する原因となる。 SafeConstellationsは、タスク固有の軌道パターンを追跡し、非拒否経路への表現を誘導する推論時軌道シフト手法である。本手法は, 過断率を最大73%削減し, 過断率を緩和する基本手法であるユーティリティオフリングに最小限の影響を与える。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:54:42 GMT)
MM-R1: Unleashing the Power of Unified Multimodal Large Language Models for Personalized Image Generation [5.9]
画像生成のための統一MLLMの本質的なポテンシャルを解き放つために、X-CoT(cross-modal Chain-of-Thought)推論戦略を統合するフレームワークであるMM-R1を紹介する。具体的には、パーソナライズを統合的な視覚的推論と生成プロセスとして構成する。実験により,MM-R1はMLLMのパーソナライズ能力を解き放ち,高い被写体忠実度と強いテキストアライメントを有する画像を生成することを示した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:20:27 GMT)
Physics-Informed Diffusion Models for Unsupervised Anomaly Detection in Multivariate Time Series [5.9]
時系列データに対する物理インフォームド拡散モデルに基づく教師なし異常検出手法を提案する。物理インフォームド損失の重み付けを静的な重み付けスケジュールを用いて構築し、基礎となるデータ分布を近似する。合成および実世界のデータセットの実験では、物理インフォームドトレーニングが異常検出においてF1スコアを改善することが示されている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:13:32 GMT)
Weighted First Order Model Counting for Two-variable Logic with Axioms on Two Relations [5.8]
WFOMC for $textFO2$ with two linear order relations and $textFO2$ with two acyclic relations is $mathsf#P_1$-hard。 We provide a algorithm in time in the domain size of WFOMC of $textC2$ with a linear order relation, its successor relation and other successor relation。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:54:17 GMT)
Exploring Scholarly Data by Semantic Query on Knowledge Graph Embedding Space [5.6]
近年、知識グラフは異質な実体とその関係に関する知識を表現する普遍的なデータ形式として出現している。知識グラフ埋め込み空間のセマンティック構造は十分に研究されていないので、知識グラフ埋め込み法は通常知識グラフ補完にのみ使用される。本稿では,これらの意味構造を単語埋め込み空間に基づいて解析し,データ探索を支援することを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 22:37:16 GMT)
Retrieval-augmented reasoning with lean language models [5.6]
複雑なドメイン固有のクエリを解釈できる検索拡張会話エージェントを開発した。本システムでは,細調整されたQwen2.5-Instructモデルと高密度レトリバーを統合した。すべての実装の詳細とコードは、ドメイン間のサポートと適応のために公開されています。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:38:15 GMT)
Conformal Prediction Meets Long-tail Classification [5.4]
Conformal Prediction (CP) 法は、長い尾のラベルの分布の下でクラス間で不均衡なカバレッジを示すことが多い。そこで本研究では,タイル・アウェア・コンフォーマル・予測(TACP)手法を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:14:46 GMT)
Index-Aligned Query Distillation for Transformer-based Incremental Object Detection [5.3]
インクリメンタルオブジェクト検出(IOD)は、新しいカテゴリを検出するモデルの性能を継続的に拡張することを目的としている。従来は知識蒸留(KD)に頼って、トランスフォーマーベースの検出モデルを忘れる破滅的な知識を軽減していた。 Index-Aligned Query Distillation (IAQD) を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:10:05 GMT)
Investigating Transcription Normalization in the Faetar ASR Benchmark [5.3]
フェタール自動音声認識ベンチマークにおける転写不整合の役割について検討する。手作りの小さな辞書の助けを借りて、我々は、不整合は転写に存在しているが、それらはタスクにおける主要な課題ではないと結論づける。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:41:25 GMT)
Exponential Family Variational Flow Matching for Tabular Data Generation [5.3]
本研究では,表データ生成のための変分フローマッチング(VFM)手法であるTabbyFlowを開発した。異種データ型を表すEF-VFM(Exponential Family Variational Flow Matching)を提案する。また,Bregmanの発散に基づく変動流整合と一般化流整合の関連性を確立する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:17:02 GMT)
On Delta-Homology Analogy: Memory as Structured Trajectories [5.2]
本稿では,メモリをスパース,トポロジカルに既約なアトラクタの集合として形式化するEmphdelta-Homologyアナロジーを紹介した。この類似性に基づいて,スパイク最適化力学と永続的ホモロジーの構造を基盤とした,記憶と推論のためのトポロジ的枠組みを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 22:10:07 GMT)
Information Must Flow: Recursive Bootstrapping for Information Bottleneck in Optimal Transport [5.2]
本研究では,認知を高エントロピーコンテキストと低エントロピーコンテンツ間の情報の流れとしてモデル化する統合フレームワークを提案する。推論は双方向の相互作用のサイクルとして現れ、ボトムアップの文脈的曖昧さとトップダウンのコンテンツ再構成が組み合わせられる。これに基づいて,個人間での推論サイクルを同期させるために,潜在コンテンツを外部化することで,言語がシンボリックトランスポートシステムとして出現することを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 22:58:52 GMT)
Unified Field-integral Thermodynamics of Bose Mixtures: Stability and Critical Behavior [5.1]
関数場積分に基づくボース混合系の有限温度での統一熱力学の枠組みを確立する。超流動混合物の安定化における異常密度の役割を強調した。熱ゆらぎが安定な混合物から不安定な混合物への相転移を引き起こすことを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:01:40 GMT)
DFed-SST: Building Semantic- and Structure-aware Topologies for Decentralized Federated Graph Learning [5.1]
Decentralized Federated Learning (DFL)は、堅牢な分散パラダイムとして登場した。本稿では,適応通信を用いた分散グラフ学習フレームワークDFed-SSTを提案する。 8つの実世界のデータセットの実験は、DFed-SSTの優位性を一貫して示し、ベースライン法よりも平均精度が3.26%向上した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:15:54 GMT)
UniDCF: A Foundation Model for Comprehensive Dentocraniofacial Hard Tissue Reconstruction [4.9]
複数の顎顔面硬組織を再構成できる統一的枠組みであるUniDCFを導入する。 UniDCFは、以前の単一モダリティアプローチの限界を克服する。口腔内スキャン,CBCT,CTを6,609例,54,555例とした。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:03:57 GMT)
From Pixels to Graphs: Deep Graph-Level Anomaly Detection on Dermoscopic Images [4.8]
グラフニューラルネットワーク(GNN)は、グラフベースの機械学習タスクの強力なアプローチとして登場した。以前の研究では、分類や異常検出などの下流タスクに対して、画像由来のグラフ表現にGNNを適用していた。 GNNに基づくグラフレベルの異常検出における多数の画像-グラフ変換手法の有効性を厳密に比較した研究はない。我々は、最先端のGLADモデルを用いた皮膚内視鏡画像の広範な実験を行い、純粋に教師なし、弱教師付き、完全に監督された体制における性能と効率について検討した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 22:16:29 GMT)
OpenConstruction: A Systematic Synthesis of Open Visual Datasets for Data-Centric Artificial Intelligence in Construction Monitoring [4.8]
建設業界は、サイト監視のための人工知能(AI)と機械学習(ML)アプリケーションをサポートするために、視覚データにますます依存している。ビジュアルデータセットへの関心が高まりつつあるにもかかわらず、既存のリソースは、実世界の建設条件のサイズ、品質、代表性に大きく変化している。本研究では,これらの知見をオープンソースカタログであるOpenConstructionに合成し,データ駆動型手法開発を支援する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:56:21 GMT)
AI Agentic Programming: A Survey of Techniques, Challenges, and Opportunities [4.7]
AIエージェントプログラミングは、大規模言語モデル(LLM)が外部ツールを自律的に計画し、実行し、相互作用する新興パラダイムである。この調査はAIエージェントプログラミングの総合的かつタイムリーなレビューを提供する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 00:14:31 GMT)
Generalizable speech deepfake detection via meta-learned LoRA [4.7]
自己教師付き(SSL)バックボーンのすべてのアテンションヘッドにローランド適応(LoRA)アダプタを挿入し,メタラーニングドメイン一般化(MLDG)を用いたアダプタのみをトレーニングすることにより,ゼロショット性能が向上することを示す。一階のMLDGループは、アダプタが攻撃タイプにまたがって持続するキューに集中することを奨励し、最高のMLDG-LoRA構成で平均EERを8.84%から5.30%に下げる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:11:54 GMT)
On Strong and Weak Admissibility in Non-Flat Assumption-Based Argumentation [4.6]
抽象的議論から許容可能性の標準概念への2つの顕著な代替案について検討する。一般(時として非平坦(non-flat)ABA)に対して,それぞれ好意的,完備的,根底的意味論を導入する。中央のモジュラー化特性は古典的,強い,弱い順応性の下で維持されていることを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:13:07 GMT)
Generating Dialogues from Egocentric Instructional Videos for Task Assistance: Dataset, Method and Benchmark [4.6]
本稿では,1対1の指導ビデオからタスク誘導2対1の対話へと変換する,シンプルで効果的な手法を提案する。我々の完全に自動化されたアプローチは、大規模な言語モデルによって実現されており、人手によるデータ収集に必要な相当なコストと労力の代替となる。 HowToDIVは、507の会話、6636の質問応答ペア、24時間のビデオクリップを含む大規模なデータセットで、料理、メカニック、植え付けのさまざまなタスクにまたがる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:57:20 GMT)
StyleMM: Stylized 3D Morphable Face Model via Text-Driven Aligned Image Translation [4.5]
StyleMMは、ユーザ定義のテキスト記述に基づいて、スタイリングされた3Dモーフィブルモデル(3DMM)を構築することができるフレームワークである。提案手法は,テキスト誘導画像画像変換(i2i)を用いて生成したスタイリングされた顔画像を用いて,これらのモデルを微調整する。本手法は,身元レベルの顔の多様性とスタイル化能力の観点から,最先端の手法より優れている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:29:46 GMT)
Learning from B Cell Evolution: Adaptive Multi-Expert Diffusion for Antibody Design via Online Optimization [4.5]
本稿では,オンラインメタ学習システムにおける物理に基づくドメイン知識を活用する,生物を動機とする最初のフレームワークを提案する。提案手法では, 分子認識, エネルギーバランス, 界面形状など, 繰り返しフィードバックに基づいてパラメータが進化する複数の専門的専門家を用いている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 20:20:19 GMT)
The non-Hermitian skin effect: A perspective [4.4]
非ヘルミチアン(NH)の皮膚効果は、システムの境界線上に、皮膚状態として知られる状態の蓄積として表される。この効果を高次元および多体系で研究する最近の発展が注目されている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:16:30 GMT)
E-CaTCH: Event-Centric Cross-Modal Attention with Temporal Consistency and Class-Imbalance Handling for Misinformation Detection [4.3]
E-CaTCHはソーシャルメディア上の誤情報を堅牢に検出するためのフレームワークである。テキストの類似性と時間的近接性に基づいて、ポストを擬似イベントに集約し、各イベントを独立して処理する。 E-CaTCHは、最先端のベースラインを一貫して上回る。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:13:23 GMT)
LKFMixer: Exploring Large Kernel Feature For Efficient Image Super-Resolution [4.3]
我々は,非局所的な特徴を捕捉する自己認識能力をシミュレートするために,純粋畳み込みニューラルネットワーク (CNN) モデル LKFMixer を提案する。 LKFMixer-Lは、$times$4スケールで0.6dB PSNRの改善を実現し、推論速度は$times$5倍高速である。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:50:38 GMT)
Relationship Detection on Tabular Data Using Statistical Analysis and Large Language Models [4.2]
この研究は、知識グラフ(KG)を基準点として、CPAとして知られるタスクを用いて関係を検出するハイブリッドアプローチで実験する。このアプローチは、潜在的KG関係の探索空間を減少させるために統計解析を用いて、大きな言語モデル(LLM)を利用する。 SemTab チャレンジによって提供される2つのベンチマークデータセットの実験評価は、各モジュールの影響と異なる最先端 LLM の有効性を評価する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:22:31 GMT)
Borrowing From the Future: Enhancing Early Risk Assessment through Contrastive Learning [4.2]
本研究は,早期リスク評価における予測性能の向上に焦点を当てた。我々のソリューションである textbfBorrowing From the Future (BFF) は、各時間ウィンドウを異なるモダリティとして扱う、対照的なマルチモーダルフレームワークである。我々は,BFFを2つの現実世界の小児結果予測タスクで検証し,早期リスク評価における一貫した改善を実証した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:40:21 GMT)
Is ChatGPT-5 Ready for Mammogram VQA? [4.2]
GPT-5は一貫して最高のパフォーマンスモデルであったが、人間の専門家とドメイン固有の細調整モデルの両方に遅れを取っていた。 GPT-5は、タスクのスクリーニングに有望な能力を示すが、ハイテイクな臨床画像アプリケーションでは、その性能は依然として不十分である。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:56:24 GMT)
Benchmarking GPT-5 for Zero-Shot Multimodal Medical Reasoning in Radiology and Radiation Oncology [4.2]
GPT-5 と GPT-5-mini, GPT-5-nano を 3 つのタスクでゼロショット評価した。全データセットにおいて、GPT-5はGPT-4oよりも高い精度を達成し、解剖学的に挑戦する領域では+200%まで上昇した。 GPT-5は、画像基底推論とドメイン固有の数値問題解決の両方において、GPT-4oよりも一貫した、しばしば顕著なパフォーマンス改善を提供する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 16:14:51 GMT)
A Spectral Framework for Evaluating Geodesic Distances Between Graphs [4.1]
本稿では,グラフデータサンプル間の差分を定量化するために,グラフ測地距離(GGD)という新しい指標を提案する。提案したGGD測度は、鍵構造(スペクトル)特性の相違をカプセル化することにより、2つのグラフ間の相違性を効果的に定量化することができる。我々は,グラフ分類以外のGGDの適用を,GNNの安定性解析やデータセット間の距離の定量化に拡張する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:34:43 GMT)
FairTabGen: Unifying Counterfactual and Causal Fairness in Synthetic Tabular Data Generation [4.0]
合成データ生成のためのフェアネス対応大規模言語モデルベースフレームワークであるFairTabGenを提案する。我々は、公正さとユーティリティのバランスをとるために、文脈内学習、即時改善、公正さを意識したデータキュレーションを使用します。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:36:07 GMT)
RMFAT: Recurrent Multi-scale Feature Atmospheric Turbulence Mitigator [4.0]
大気の乱流は、幾何学的歪み、ぼかし、時間的ひねりなどの歪みを導入することで、映像の品質を著しく低下させる。我々は,AT条件下での高効率かつ時間的に一貫したビデオ復元を目的としたRMFAT: Recurrent Multi-scale Feature Atmospheric Turbulence Mitigatorを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:20:18 GMT)
Convergence of Statistical Estimators via Mutual Information Bounds [3.9]
我々は統計モデルに縛られた新しい相互情報を導入する。導出境界は、統計的推測において広い範囲の応用を持つ。また、幅広い推定方法の研究にも使用できる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:19:06 GMT)
Multi-Group Equivariant Augmentation for Reinforcement Learning in Robot Manipulation [3.8]
実世界のロボット操作における視覚運動学習の展開には、サンプリング効率が不可欠である。非等尺対称性構造を含む部分可観測マルコフ決定過程(POMDP)の新規な定式化を導入する。我々はMEAとオフライン強化学習を統合し、サンプリング効率を向上させるとともに、ボクセルに基づく視覚表現を導入する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:30:01 GMT)
LLM Compression: How Far Can We Go in Balancing Size and Performance? [3.8]
4ビットグループスケーリング量子化(GSQ)とGPTQ(Generative Pretrained Transformer Quantization)をLLaMA 1B,Qwen 0.5B,PHI 1.5Bに適用した。我々はこれらのモデルをMS MARCO (Information Retrieval), BoolQ (Boolean Question Answering), GSM8K (Mathematical Reasoning)データセットでベンチマークする。この研究は、モデル圧縮とタスクパフォーマンスのトレードオフを測定し、主要な評価指標を分析する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:41:20 GMT)
ToxiFrench: Benchmarking and Enhancing Language Models via CoT Fine-Tuning for French Toxicity Detection [3.8]
TOXIFRENCHは、フランスのオンラインコメント53,622の新しい公開ベンチマークである。 SLM(Small Language Models)は、ロバスト性と一般化において、より大きなモデルよりも優れています。我々の微調整された4Bモデルは最先端のパフォーマンスを実現し、ベースラインよりもF1スコアが13%向上した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:40:41 GMT)
JARVIS: A Multi-Agent Code Assistant for High-Quality EDA Script Generation [3.7]
JARVISは、LLM(Large Language Models)とドメインの専門知識を活用して、EDAタスクのための高品質なスクリプトを生成する、新しいマルチエージェントフレームワークである。合成データを用いて訓練されたドメイン固有LLM, 構造検証, ルール強制, コード修正機能, 高度な検索機構のカスタムコンパイラを組み合わせることにより, 本手法は最先端のドメイン固有モデルよりも大幅に改善されている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 23:31:27 GMT)
FancyVideo: Towards Dynamic and Consistent Video Generation via Cross-frame Textual Guidance [3.7]
我々は、既存のテキスト制御機構を改善する革新的なビデオジェネレータであるFancyVideoを紹介した。 CTGMは、TII(Temporal Information)とTAR(Temporal Affinity Refiner)をクロスアテンションの開始と終了に組み込んでいる。提案手法は,EvalCrafterベンチマークを用いて,最先端のT2V生成結果を実現する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:36:20 GMT)
Hyperspectral vs. RGB for Pedestrian Segmentation in Urban Driving Scenes: A Comparative Study [3.6]
本研究では,都市交通シナリオにおける歩行者セグメンテーション向上のためのハイパースペクトルイメージング(HSI)の可能性について検討した。 U-Net、DeepLabV3+、SegFormerの3つのセマンティックセグメンテーションモデルが評価された。 CSNR-JMIMは、IoU(Intersection over Union)の1.44%、歩行者セグメンテーションのF1スコアの2.18%でRGBを一貫して上回った。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:10:19 GMT)
SAND: One-Shot Feature Selection with Additive Noise Distortion [3.6]
我々は、ニューラルネットワークトレーニング中に最も有用な機能を自動的に識別し、選択する新しい非侵入的特徴選択層を導入する。本手法は,損失関数,ネットワークアーキテクチャ,選択後再学習などの変更を要さず,一意に単純である。私たちの研究は、単純さとパフォーマンスが相互に排他的ではなく、機械学習における機能選択の強力な、かつ直接的なツールであることを示している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:41:17 GMT)
Sunlight-Excited Spontaneous Parametric Down-Conversion for Quantum Imaging [3.6]
量子画像は、量子相関を利用して、古典光学よりも多くの利点を持つ撮像を実現するが、数年前から開発が続けられている。ここでは、ポンプビームとして機能する日光を探索し、自発的なパラメトリックダウンコンバージョンを励起し、2つの光子の量子相関を得る。これは、非コヒーレントビームを量子イメージングのポンプ源として利用する、潜在的な応用シナリオを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:33:40 GMT)
Generative Co-Design of Antibody Sequences and Structures via Black-Box Guidance in a Shared Latent Space [3.5]
相補性決定領域(CDR)を最適化し、生データ空間で動作する開発性を改善するための既存のアプローチ。提案するLatEnt blAck-box Designは,待ち行列空間内のシーケンスと構造の両方を最適化するシーケンス構造共設計フレームワークである。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:59:13 GMT)
Better Supervised Fine-tuning for VQA: Integer-Only Loss [3.5]
IOVQA(Integer-only VQA)は視覚言語モデルに適した新しい微調整手法である。データセットのキュレーションでは、[10,50]の範囲内でモデルの出力を整数に制限し、数値的な安定性を確保する。損失を計算する際には、ラベルの最初の2桁の整数だけがマスクされていない。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:40:43 GMT)
Towards Consumer-Grade Cybersickness Prediction: Multi-Model Alignment for Real-Time Vision-Only Inference [3.5]
サイバーシックネスは没入型バーチャルリアリティ(VR)の普及の大きな障害である我々は、パーソナライズされたサイバーシックネス予測のためのスケーラブルでデプロイ可能なフレームワークを提案する。当社のフレームワークは,コンシューマレベルのVRプラットフォームとの統合に理想的なリアルタイムアプリケーションをサポートしています。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:40:14 GMT)
Nonparametric Filtering, Estimation and Classification using Neural Jump ODEs [3.4]
ニューラルジャンプODEは、ニューラルジャンプODEによる観測と新しい観測の到着時のジャンプの間の条件予測をモデル化する。彼らは、不規則かつ部分的な観察を伴う設定において、完全なデータ駆動オンライン予測の有効性を実証した。この作業は、フレームワークをインプット・アウトプット・システムに拡張し、オンラインフィルタリングと分類における直接的なアプリケーションを可能にする。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 22:55:13 GMT)
Towards Understanding 3D Vision: the Role of Gaussian Curvature [3.3]
ディープニューラルネットワークはステレオマッチングや単眼深度再構成といったタスクで顕著な成功を収めている。三次元表面モデリングにおけるガウス曲率の役割について検討する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 22:14:46 GMT)
Hallucination in LLM-Based Code Generation: An Automotive Case Study [3.3]
本稿では,自動車領域に着目したコード生成の文脈における幻覚現象について検討する。 GPT-4.1、Codex、GPT-4oでは、構文違反、不正な参照エラー、API知識の衝突の頻度が高い。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 06:46:50 GMT)
Unifying Scale-Aware Depth Prediction and Perceptual Priors for Monocular Endoscope Pose Estimation and Tissue Reconstruction [3.3]
単分子内視鏡組織再建のための統一的枠組みを提示する。スケール認識深度予測と時間的に制約された知覚の洗練を統合する。 HEVDとSCAREDの評価は、アブレーションと比較分析によって、最先端の手法よりもフレームワークの堅牢性と優位性を示している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:41:17 GMT)
Approximating the universal thermal climate index using sparse regression with orthogonal polynomials [3.2]
本稿では、UTCI(Universal Climate Thermal Index)の分析と近似のための新しいデータ駆動モデリング手法について考察する。本稿では,関数近似の解釈・効率的な手法として,記号的・スパース的回帰手法について検討する。また,本モデルでは,広く使用されている6次2乗ベンチマークよりも根平均2乗損失が有意に低いことを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:22:01 GMT)
Repetitive TMS-based Identification of Methamphetamine-Dependent Individuals Using EEG Spectra [3.2]
メタンフェタミン (METH) の反復的経頭蓋磁気刺激 (rTMS) は, アンケートにより評価されることが多い。本研究は、より客観的な結果を得るために、ニューラルシグナルを使用することの可能性を検討する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:31:10 GMT)
Finite Automata Extraction: Low-data World Model Learning as Programs from Gameplay Video [3.2]
本稿では,新しいドメイン固有言語におけるプログラムとして表現されるゲームプレイビデオから,ニューロシンボリックな世界モデルを学ぶアプローチを提案する。従来の世界モデルアプローチと比較して、AFEは環境のより正確なモデルと、従来の空間的アプローチよりも一般的なコードを学ぶ。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 23:05:37 GMT)
KV-Auditor: Auditing Local Differential Privacy for Correlated Key-Value Estimation [3.2]
我々は,LDPに基づくキー値推定機構を監査するフレームワークであるKV-Auditorを提案する。我々は、最先端のLPPキー値機構を対話型および非対話型に分類する。インタラクティブなメカニズムのために、繰り返しにまたがるインクリメンタルなプライバシリークをキャプチャするためのセグメンテーション戦略を設計する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:17:24 GMT)
Artificial Intelligence in Rural Healthcare Delivery: Bridging Gaps and Enhancing Equity through Innovation [3.2]
農村医療は、インフラの不十分、労働力不足、社会経済的格差など、永続的な課題に直面している。われわれは、2019年から2024年の間にPubMed、Embase、Web of Science、IEEE Xplore、Scopusから発行された109の研究を体系的にレビューした。この発見は、予測分析、遠隔医療プラットフォーム、自動診断ツールなど、AIアプリケーションにとって大きな可能性を秘めている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:08:10 GMT)
RULEBREAKERS: Challenging LLMs at the Crossroads between Formal Logic and Human-like Reasoning [3.1]
RULEBREAKERSは、大規模な言語モデルによるルールブレーカーの認識と応答を人間的な方法で厳格に評価するための最初のデータセットです。 GPT-4oを含むほとんどのモデルでは、RULEBREAKERSの中間精度が得られ、典型的な人間の推論と異なり、論理規則を過度に適用する傾向が見られた。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:41:39 GMT)
When Does Language Transfer Help? Sequential Fine-Tuning for Cross-Lingual Euphemism Detection [3.0]
シーケンシャルな微調整による言語間移動は、5つの言語にわたるエウヘミズムの検出に影響を及ぼす。特にYorubaやTurkなどの低リソース言語では,高リソースのL1による逐次微調整によりL2のパフォーマンスが向上することを示す。これらの知見は,多言語モデルにおけるエウヘミズム検出を改善するための簡易かつ効果的な戦略として,逐次微調整が重要である。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 22:40:35 GMT)
EmbodiedAgent: A Scalable Hierarchical Approach to Overcome Practical Challenge in Multi-Robot Control [2.9]
EmbodiedAgentは異種マルチロボット制御のための階層的なフレームワークである。提案手法は,次アクション予測パラダイムと構造化メモリシステムを統合し,タスクを実行可能なロボットスキルに分解する。 100のシナリオにまたがる18,000以上のアノテートされたプランニングインスタンスのデータセットであるMultiPlan+を紹介します。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:37:03 GMT)
Data Diversity as Implicit Regularization: How Does Diversity Shape the Weight Space of Deep Neural Networks? [2.9]
本研究では,データ多様性が深部ニューラルネットワークの重み空間に与える影響をランダム行列理論を用いて検討する。データ多様性の増大は、他の正規化手法と同様の重量スペクトル分布を変化させることを示す。本稿では,従来のデータ拡張によって導入された多様性と,合成データによって達成された多様性のメリットを説明・比較するための指標を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:36:31 GMT)
Element and Everything Tokens: Two-Tier Architecture for Mobilizing Alternative Assets [2.8]
鉱山、発電所、インフラプロジェクトなどの代替資産は、しばしば大きな、異質な資源、権利、出力の束である。本稿では,このような複雑な資産の流動性と透明性を高めるために,新しい2層トークン化アーキテクチャを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:02:57 GMT)
Training-free Dimensionality Reduction via Feature Truncation: Enhancing Efficiency in Privacy-preserving Multi-Biometric Systems [2.8]
生体認証は広く使われており、抽出されたテンプレートのプライバシーとセキュリティが重要な懸念事項となっている。ディープニューラルネットワークの最近の進歩により、顔、指紋、虹彩の高度な特徴抽出が可能になった。本研究は,マルチバイオメトリックテンプレートサイズを縮小したバイオメトリックスの性能について検討する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:49:19 GMT)
VCDiag: Classifying Erroneous Waveforms for Failure Triage Acceleration [2.7]
VCDiagは機械学習を使って、故障した波形を分類し、潜在的な故障箇所を特定できる。最上位3つのモジュールを識別する精度は94%を超えている。様々なVerilog/SystemVerilogの設計とテストベンチに統合できる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:20:05 GMT)
Investigating Sensors and Methods in Grasp State Classification in Agricultural Manipulation [2.6]
本研究は、慣性測定ユニット(IMU)、赤外線反射、テンション、触覚センサー、RGBカメラなどの一連のキーセンサーを、グリップ状態の分類に適合するグリップパーに統合する。ランダムフォレスト分類器は、制御された実験室環境で訓練され、本物のサクラトマトの植物で試験され、スリップの特定、失敗の把握、ピックの成功において100%の精度を達成した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 16:47:42 GMT)
Ontology-Guided Query Expansion for Biomedical Document Retrieval using Large Language Models [2.5]
BMQExpanderは、UMLSメタセサウルスからの医療知識(定義と関係)と大規模言語モデル(LLM)の生成能力を組み合わせた、検索効率を向上させる新しいクエリ拡張パイプラインである。我々は,BMQExpanderが3つの一般的なバイオメディカル情報検索(IR)ベンチマークにおいて,より優れた検索性能を有することを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 19:23:26 GMT)
More Women, Same Stereotypes: Unpacking the Gender Bias Paradox in Large Language Models [2.4]
大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、社会的偏見を反映または増幅する傾向について懸念が持たれている。本研究では,LSMにおける性別バイアスを明らかにするための新しい評価枠組みを提案する。 10の著名なLSMの体系的な分析は、職業全体にわたって女性キャラクターを過剰に表現する一貫したパターンを示している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 23:53:07 GMT)
Fault-tolerant mixed boundary punctures on the toric code [2.4]
正確に解けるアベリア・エノンモデルとしてよく知られたトーリック符号の欠陥は、非アベリア統計的性質を示すことができる。本稿では, 句読点とツイストの利点を融合した混合境界句読点モデルを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:35:03 GMT)
Nonparametric learning of stochastic differential equations from sparse and noisy data [2.4]
強い構造仮定なしでデータから直接ドリフト関数を学習する。我々は,新しいモンテカルロ法(SMC)を用いた期待最大化法(EM)アルゴリズムを開発した。 EM-SMC-RKHS法により、低データ状態における力学系のドリフト関数を正確に推定できる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:01:59 GMT)
SPA: Towards A Computational Friendly Cloud-Base and On-Devices Collaboration Seq2seq Personalized Generation with Casual Inference [2.4]
大規模な言語モデルは、低リソースのデバイスにかなりのメモリストレージを必要とする。本稿では,デバイス上で高速な推論を行う軽量アーキテクチャであるSPA(Side on Adaption)を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:39:05 GMT)
Model Interpretability and Rationale Extraction by Input Mask Optimization [2.3]
本稿では,ニューラルネットワークによる予測のための抽出的説明を生成する手法を提案する。マスキングは、勾配に基づく最適化と新しい正規化スキームを組み合わせて行われる。画像の入力に同じ手法を適用し、画像分類のための高品質な説明を得る。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:41:09 GMT)
Preference Models assume Proportional Hazards of Utilities [2.2]
私は、Pockett-Luceモデルと、別の古典的でよく知られた統計モデル、Cox Proportional Hazardsモデルとを結びつける。 Reward ModellingやDirect Preference Optimizationといった現代のAIアライメントツールは、Planet-Luceモデルが提案する統計的仮定に基づいている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 00:08:56 GMT)
Enhanced Krylov Methods for Molecular Hamiltonians: Reduced Memory Cost and Complexity Scaling via Tensor Hypercontraction [2.2]
本稿では,Ab初期分子ハミルトニアンを行列生成状態(MPS)に適用するための,メモリ効率と低スケーリングを同時に行うアルゴリズムを提案する。これらの利得はクリロフ部分空間法に受け継がれ、低次固有状態を見つけ、量子時間進化をシミュレートすることができる。我々のアルゴリズムは非常に並列化可能であり、大規模なHPCシミュレーションに役立てることができる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:55:26 GMT)
Human-AI Experience in Integrated Development Environments: A Systematic Literature Review [2.2]
人工知能のIDE(Integrated Development Environments)への統合は、開発者がツールと対話する方法を変えようとしている。このシフトは、統合開発環境(IDE HAX)におけるヒューマンAI体験の出現を表している。 IDE内HAXの研究は依然として断片的であり、現在のプラクティス、課題、機会の統一的な概要の必要性を強調している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:50:10 GMT)
A Systematic Literature Review of Parameter-Efficient Fine-Tuning for Large Code Models [2.2]
コードのための大規模言語モデル(LLM)は、訓練と微調整のためにかなりの計算資源を必要とする。この問題に対処するため,研究コミュニティは,より効率的なファインチューニング(PEFT)へと移行している。 PEFTは、モデル全体ではなく、パラメータの小さなサブセットだけを更新することで、大きなモデルの適応を可能にする。本研究は,28の査読論文から得られた知見を合成し,構成戦略のパターンと適応トレードオフを同定する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:02:19 GMT)
Bridging AI Innovation and Healthcare Needs: Lessons Learned from Incorporating Modern NLP at The BC Cancer Registry [2.0]
自然言語処理(NLP)ソリューションのデプロイは、現実的な課題を提示します。明確なビジネス目標に基づいて問題を定義することの重要性を強調します。実用的なモデル選択の必要性、データ品質への厳格な注意、堅牢なエラー軽減戦略を強調します。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:04:27 GMT)
Random Unitaries in Constant (Quantum) Time [2.0]
我々は、量子計算のよく研究されたモデルにおいて、ユニタリ設計とPRUを効率的に構築できることを示す。その結果、単体設計とPRUは以前考えられていたよりもはるかに弱い回路モデルで構築可能であることが示された。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:04:49 GMT)
Assessing User Privacy Leakage in Synthetic Packet Traces: An Attack-Grounded Approach [1.9]
現在の合成トラフィックジェネレータ(SynNetGens)は、プライバシを約束するが、包括的な保証や実証的な検証がない。我々は,SynNetGensのプライバシを,トラフィックから直接評価するための最初の攻撃基盤ベンチマークを紹介する。 TraceBleedは、対照的な学習と時間的チャンクを使って、フロー全体にわたる行動指紋を利用する最初の攻撃である。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:54:27 GMT)
SelfAdapt: Unsupervised Domain Adaptation of Cell Segmentation Models [1.8]
SelfAdaptは、ラベルを必要とせずに事前訓練された細胞セグメンテーションモデルの適応を可能にする方法である。本手法をLiveCell と tissueNet のデータセット上で評価し,ベースラインの Cellpose よりも最大29.64% の AP0.5 の相対的な改善を実証した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:31:48 GMT)
A Systematic Literature Review of Retrieval-Augmented Generation: Techniques, Metrics, and Challenges [1.8]
このRAG(Research-augmented Generation)に関する研究文献の体系的なレビューは、2020年から2025年にかけて発行された最も高度に引用された研究の焦点を絞った分析である。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:42:07 GMT)
CTRL Your Shift: Clustered Transfer Residual Learning for Many Small Datasets [1.8]
CTRL(Clustered Transfer Residual Learning)は、ドメイン間の残差学習と適応的なプール/クラスタリングの強みを組み合わせたメタラーニング手法である。データ量とデータ品質のトレードオフをどのようにナビゲートするかを理論的に明らかにする。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 01:27:17 GMT)
Rethinking Autonomy: Preventing Failures in AI-Driven Software Engineering [1.7]
SAFE-AI Frameworkは、安全性、監査可能性、フィードバック、説明可能性を強調した総合的なアプローチである。我々は、リスク評価と監視を導くために、提案的、生成的、自律的、破壊的なアクションを分類する、AI行動の新しい分類法を導入する。この記事では、EU AI ActやカナダのAIDAといった新たな規則に沿って、ソフトウェアエンジニアリングにおける責任あるAI統合のためのロードマップを提供する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 22:13:54 GMT)
DashCam Video: A complementary low-cost data stream for on-demand forest-infrastructure system monitoring [1.6]
本研究では,道路沿いの植生・インフラのリアルタイム・オブジェクトレベルの構造評価と位置決めのための,新しい,低コスト・再現可能なフレームワークを提案する。車両搭載ダッシュカムから正確な空間的・構造的データを生成するために,単眼深度推定,深度誤差補正,幾何三角法を組み合わせたエンドツーエンドパイプラインを開発した。提案手法は, 植生リスクとインフラ露出のオブジェクトレベルのモニタリングを行うための, 高速でリアルタイムかつ費用対効果の高いソリューションを提供することにより, LiDARや画像などの従来のRS手法を補完するものである。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 16:55:12 GMT)
HistoViT: Vision Transformer for Accurate and Scalable Histopathological Cancer Diagnosis [1.6]
マルチクラス腫瘍分類のためのトランスフォーマーに基づくディープラーニングフレームワークを提案する。本手法は従来の畳み込みニューラルネットワークの限界に対処する。アプローチ分類では, 乳がん, 前立腺癌, 骨癌, 頸部癌が99.32%, 96.92%, 95.28%, 96.94%であった。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:10:52 GMT)
Embedding Safety into RL: A New Take on Trust Region Methods [1.6]
我々は,信頼領域が安全な政策のみを含むことを保証するために,政策空間を再設定する制約付きトラスト地域政策最適化(C-TRPO)を導入する。実験により、C-TRPOは競合リターンを維持しながら制約違反を低減することが示された。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:29:02 GMT)
Central Path Proximal Policy Optimization [1.6]
本稿ではPPO損失の簡易な修正であるCentral Path Proximal Policy Optimization (C3PO)を紹介する。 C3POは、より厳格な制約執行によるパフォーマンス向上を実現し、中央のパス誘導更新が制約されたポリシー最適化に有望な方向を提供することを示唆している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:20:46 GMT)
AnatoMaskGAN: GNN-Driven Slice Feature Fusion and Noise Augmentation for Medical Semantic Image Synthesis [1.5]
AnatoMaskGANはスライスに関連する空間的特徴を埋め込んで、スライス間のコンテキスト依存を正確に集約する。多様な画像拡張戦略を導入し、複雑な医用画像の性能向上のために、深い特徴学習を最適化する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:19:38 GMT)
Vision-Language Models display a strong gender bias [1.5]
職業や活動を記述した短いフレーズの埋め込みの近くに顔画像の埋め込みを配置する際、対照的な視覚言語エンコーダが性関係を示すかどうかを検証する。感情労働、認知労働、国内労働、技術労働、専門職、身体労働を含む6つのカテゴリにまたがる150のユニークな言明と220枚の顔写真からなるデータセットを収集した。この結果は、不確実性、単純な正当性チェック、頑健な性別バイアス評価フレームワークを伴い、対照的な視覚言語空間における性関係の声明的およびカテゴリー的マップである。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 06:57:26 GMT)
An Efficient Medical Image Classification Method Based on a Lightweight Improved ConvNeXt-Tiny Architecture [1.5]
本研究では,改良型ConvNeXt-Tinyアーキテクチャに基づく医用画像分類手法を提案する。提案手法は,計算複雑性を低減しつつ,特徴抽出能力と分類性能を向上させる。実験により,提案手法は資源制限条件下での医用画像の分類を効果的に改善することを示した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:20:25 GMT)
Intergenerational Support for Deepfake Scams Targeting Older Adults [1.4]
ディープフェイク詐欺は、信頼できる家族(しばしば孫)の説得力のあるオーディオと視覚的偽装をリアルタイムで生成する。これらの攻撃は、法律や医療の緊急時などの緊急シナリオを作り、高齢者を社会的にエンジニアリングして送金する。本研究は、これらの新興脅威に対する高齢者の認識とその反応について考察する。我々は、世代ごとのレジリエンス向上において、青春を積極的なパートナーとして参加する機会を見出した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 16:37:59 GMT)
Landmark-Assisted Monte Carlo Planning [1.4]
あるランドマークポイントと長期計画で満たさなければならない条件を定式化する。ランドマークは、いつでもMDPを解くアルゴリズムの役に立つガイダンスを提供することができる。結果は、ランドマークはいつでもMDPを解くアルゴリズムに有用なガイダンスを提供することができることを示唆している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:16:14 GMT)
Detecting Hope, Hate, and Emotion in Arabic Textual Speech and Multi-modal Memes Using Large Language Models [1.4]
本稿では,このようなコンテンツの中で,希望,憎しみ,攻撃的言語,感情表現を効果的に識別する大規模言語モデルの可能性について検討する。基礎LLM, 微調整LDM, 事前学習型埋め込みモデルの性能評価を行った。その結果, GPT-4o-mini, fine-tuned with Arabic textual speech, Gemini Flash 2.5, fine-tuned with Arabic memesなどのLCMの能力が明らかにされた。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:41:33 GMT)
Subcortical Masks Generation in CT Images via Ensemble-Based Cross-Domain Label Transfer [1.3]
神経画像における皮質下セグメンテーションは、脳解剖の理解と、外傷性脳損傷や神経変性障害のコンピュータ支援による診断の促進に重要な役割を果たしている。磁気共鳴画像(MRI)用の皮質下セグメンテーションデータセットが公開されているが、CT(Computed Tomography)には大きなギャップがある。本稿では,既存のMRIモデルを利用して,CTスキャンのための高品質な皮質下セグメンテーションラベルを生成するための自動アンサンブルフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:57:35 GMT)
DSConv: Dynamic Splitting Convolution for Pansharpening [1.3]
本稿では,コンボリューションカーネルを注意とともに動的に分割し,興味のある位置を選択し,元のコンボリューションカーネルを複数の小さなカーネルに分割するDSConvを提案する。提案したDSConvは、より効果的に受容領域内の異なる位置の特徴を抽出し、ネットワークの一般化、最適化、特徴表現能力を向上する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:51:11 GMT)
A Comprehensive Perspective on Explainable AI across the Machine Learning Workflow [1.3]
Holistic Explainable Artificial Intelligence (HXAI)は、データ分析ワークフローのすべてのステージに説明を埋め込む、ユーザ中心のフレームワークである。 HXAIは6つのコンポーネント(データ、分析設定、学習プロセス、モデル出力、モデル品質、通信チャネル)を単一の分類体系に統合する。 112項目の質問銀行がこれらのニーズをカバーしています。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:15:25 GMT)
From Heuristics to Data: Quantifying Site Planning Layout Indicators with Deep Learning and Multi-Modal Data [1.2]
本研究では,異種マルチソースデータと経験的知識を統合し,都市空間情報を構造化するデータ駆動型フレームワークを提案する。 SPLIは、OpenStreetMap (OSM)、Points of Interest (POI)、建築形態、土地利用、衛星画像を組み合わせることで、分析、推論、検索のためのマルチモーダル空間システムをサポートしている。実験によりSPLIは機能的分類精度を改善し、自動化されたデータ駆動型都市空間分析のための標準化された基盤を提供する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:25:46 GMT)
CERA: A Framework for Improved Generalization of Machine Learning Models to Changed Climates [1.2]
気候変動下でのロバストな一般化は、気候変動科学における機械学習応用の大きな課題である。本稿では,自動エンコーダによる機械学習フレームワークCERA(Climate-invariant climate representation through Representation)を提案する。 CERAは、+4K気候からのラベル付きデータをトレーニングすることなく、ラベル付き制御気候データとラベルなし温度気候入力を活用して、より暖かい気候への一般化を改善する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 20:28:04 GMT)
AlphaAgents: Large Language Model based Multi-Agents for Equity Portfolio Constructions [1.2]
複雑な課題を解決するための,有望なアプローチとして,マルチエージェントコラボレーションが登場している。本研究は、株式調査・ポートフォリオ管理における株式選択を支援するために、ロールベースのマルチエージェントシステムの適用について検討する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 01:49:56 GMT)
Leveraging the RETFound foundation model for optic disc segmentation in retinal images [1.2]
RETFoundは、眼底カメラと光コヒーレンス断層撮影のために開発された、よく知られた基礎モデル(FM)である。本稿では、網膜画像解析におけるユビキタスで基礎的な課題である光ディスクセグメンテーションのためのRETFoundの最初の適応について述べる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:43:49 GMT)
Idiom Detection in Sorani Kurdish Texts [1.2]
本研究は,Sorani Kurdishにおける深層学習技術を用いたテキスト分類タスクとしてアプローチすることで,検出に対処する。我々は、KuBERTベースのトランスフォーマーシーケンス分類、RCNN(Recurrent Convolutional Neural Network)、注意機構を備えたBiLSTMモデルという3つのディープラーニングモデルを開発し、評価した。評価の結果,変圧器モデルである細調整BERTが他のモデルより一貫して優れており,精度は99%近くであった。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:07:55 GMT)
Search Timelines: Visualizing Search History to Enable Cross-Session Exploratory Search [1.2]
探索的な探索を行うタイムパンや検索活動のスコープとボリュームは、検索者が検索活動に関する重要な詳細を覚えるのを困難にしている。本稿では,公開デジタルライブラリにおけるクロスセッション探索検索を支援するために,検索インタフェースの設計とプロトタイプ実装を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:40:28 GMT)
One, Two, Three: One empirical evaluation of a two-copy shadow tomography scheme with triple efficiency [1.1]
両コピー計測方式の絡み合いは, 単一コピー戦略よりも指数関数的に複雑な試料が得られることを示す。本研究では,従来のノイズフリーシミュレーションを用いた三重効率陰影トモグラフィの実験的評価により,既存の理論的性能保証を補完する。以上の結果から,実験試料の複雑性は安定化状態の理論的予測と密接に一致し,特にランダムギブス状態のスケーリングが若干改善されていることが示唆された。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:00:01 GMT)
AI in Mental Health: Emotional and Sentiment Analysis of Large Language Models' Responses to Depression, Anxiety, and Stress Queries [1.1]
抑うつ、不安、ストレスは、個人が大規模言語モデル(LLM)から情報を求めるように促す、広範囲にわたるメンタルヘルスの懸念である。本研究は, うつ, 不安, ストレスに関する現実的な質問に対して, 8つのLSMが6人のユーザプロファイルに対して, どのように回答するかを検討する。モデルは2,880の回答を生成し、最新式のツールを使って感情と感情をスコア付けしました。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:47:10 GMT)
Predicting and Explaining Traffic Crash Severity Through Crash Feature Selection [1.1]
この研究は、オハイオ州で6～2022年に起きた事故に300万人以上の人が関わったデータセットを紹介します。主な貢献は、自動機械学習(AutoML)と説明可能な人工知能(AI)を組み合わせて、深刻なクラッシュに関連する主要なリスク要因を特定し、解釈する、透過的で再現可能な方法論である。主な特徴は、人口統計、環境、車両、人的および運用上のカテゴリーで、位置タイプや投稿速度、居住年齢の最小化、クレーシュ前の行動などが含まれる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:31:26 GMT)
RL-MoE: An Image-Based Privacy Preserving Approach In Intelligent Transportation System [1.0]
感性のある視覚データをプライバシ保護されたテキスト記述に変換する新しいフレームワークであるRL-MoEを提案する。 RL-MoEは、ニュアンス付きマルチアスペクトシーン分解のためのMixture-of-Experts(MoE)アーキテクチャと強化学習(RL)エージェントを組み合わせる。私たちの仕事は、プライバシに敏感なドメインで信頼できるAIシステムを構築するための実用的でスケーラブルなソリューションを提供します。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:36:03 GMT)
Incorporating Coupling Knowledge into Echo State Networks for Learning Spatiotemporally Chaotic Dynamics [1.0]
物理誘導型クラスタリングエコー状態ネットワークを導入し、エコー状態ネットワークの効率をベースモデルとして活用する。 ESNモデルへの結合知識の活用は,学習条件や目標システム条件の変動に対して頑健性を高めることができることを数値的に示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 01:22:35 GMT)
Optimized Renewable Energy Planning MDP for Socially-Equitable Electricity Coverage in the US [1.0]
本研究では、再生可能エネルギー割り当てを最適化するマルコフ決定プロセスフレームワークを開発する。電気流通における社会的株式の懸念に明示的に対処する。その結果、株式中心の最適化は32.9%の再生可能エネルギーの浸透を実現し、低所得層を55%削減できることがわかった。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:56:01 GMT)
Bayesian Models for Joint Selection of Features and Auto-Regressive Lags: Theory and Applications in Environmental and Financial Forecasting [0.9]
自動相関誤差を伴う線形回帰における変数選択のためのベイズ的フレームワークを開発する。本フレームワークは,MSPEの低減,真のモデル成分同定の改善,自動相関ノイズとの整合性の向上を実現している。既存の手法と比較して,本フレームワークはより低いMSPEを実現し,真のモデル成分の同定が向上し,自動相関ノイズとの整合性が向上する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:04:51 GMT)
Pothole Detection and Analysis System (PoDAS) for Real Time Data Using Sensor Networks [0.9]
地元当局は、修理のレート制限要因の1つとして、これらの穴の地理的な位置決めの欠如を挙げている。本研究では,PDASと呼ばれる低コストのワイヤレスセンサを用いたエンド・ツー・エンドシステムを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:30:30 GMT)
From Teacher to Student: Tracking Memorization Through Model Distillation [0.9]
大規模言語モデル(LLM)は、トレーニングデータの一部を記憶することで知られており、プライバシとセキュリティに関する重要な懸念を提起している。本研究では,異なる知識蒸留法(KD)が,大規模な教師モデルをより小さな学生に蒸留した場合の微調整タスクデータの記憶にどのように影響するかを検討する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:12:41 GMT)
Automated Building Heritage Assessment Using Street-Level Imagery [0.9]
本研究では,大規模な言語モデルGPTを用いて,ファサード画像の文化的遺産価値の側面を検出する。このデータとレジスタデータを機能として構築するマシンラーニングモデルは、ストックホルムの建物を分類するためにトレーニングされた。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:59:24 GMT)
Activate Me!: Designing Efficient Activation Functions for Privacy-Preserving Machine Learning with Fully Homomorphic Encryption [0.9]
ホモモルフィック暗号化(FHE)は、暗号化されたデータを直接計算することを可能にする。 FHEは本質的に線形演算のみをサポートするため、非線形アクティベーション関数の実装は困難である。この研究は、FHEベースの機械学習に適したアクティベーション関数の設計、実装、評価に焦点を当てている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 16:31:12 GMT)
Quantum Simulation of Collective Neutrino Oscillations in Dense Neutrino Environment [0.8]
本稿では, 雑音量子シミュレータ上でのシステムシミュレーションによるニュートリノ集団振動の研究を行う。量子ビット上の2-および3-ニュートリノ系のニュートリノ状態を計算する。ニュートリノ間の絡み合いの尺度として,コンカレンスを評価するための量子回路を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:21:18 GMT)
Data-Driven Deepfake Image Detection Method -- The 2024 Global Deepfake Image Detection Challenge [0.8]
課題は、顔画像がディープフェイク画像であるかどうかを判定し、その確率スコアをディープフェイク画像であるかどうかを出力することである。画像トラックコンペでは,Swin Transformer V2-B分類ネットワークをベースとしている。オンラインデータ拡張およびオフラインサンプル生成手法は、トレーニングサンプルの多様性を高め、モデルの一般化能力を高めるために用いられる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:24:47 GMT)
Online Anti-sexist Speech: Identifying Resistance to Gender Bias in Political Discourse [0.7]
本研究では5つの大きな言語モデルが、英国からの性差別、反性差別、中立的な政治的ツイートを分類する方法について検討する。分析の結果、特に政治的に帯電した出来事において、モデルはしばしば反セクシズムのスピーチを有害と誤分類していることがわかった。我々は、モデレーション設計がバイナリ有害/害のないスキーマを超えて、センシティブなイベント中にヒューマン・イン・ザ・ループ・レビューを統合し、トレーニングデータに反音声を明示的に含まなければならないと主張している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:24:22 GMT)
The Role of Entanglement in Quantum Reservoir Computing with Coupled Kerr Nonlinear Oscillators [0.6]
エンタングルメントは入力周波数の平均値からしきい値までの計算上の優位性を示すことを示す。これらの知見は、高性能で効率的な量子機械学習と時系列予測のための量子貯水池のより広範な理解に寄与する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:59:02 GMT)
Time-adaptive single-shot crosstalk detector on superconducting quantum computer [0.6]
量子クロストーク(quantum crosstalk)は、量子プロセッサにおけるノイズやエラーの主な原因である。クロストークによる摂動を増幅するために、オブザーバ量子ビットと多重量子コヒーレンスを利用する時間適応検出法を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:20:28 GMT)
Finite-Width Neural Tangent Kernels from Feynman Diagrams [0.6]
NTK統計量に有限幅補正を演算するためのファインマン図を導入する。本研究では, ネットワークの安定性をNTKに拡張することで, 本フレームワークの実現可能性を示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:02:40 GMT)
Overcoming Low-Resource Barriers in Tulu: Neural Models and Corpus Creation for OffensiveLanguage Identification [0.6]
本研究では,コードミキシングされたTuluソーシャルメディアコンテンツにおけるOffensive Language Identificationのための最初のベンチマークデータセットを提案する。我々は,GRU,LSTM,BiGRU,BiLSTM,CNN,注目に基づく変種など,一連のディープラーニングモデルを評価する。自己注意型BiGRUモデルは82%の精度と0.81マクロF1スコアで最高の性能を達成する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 02:34:22 GMT)
Scalable platform for qudit-based quantum computing using polar molecules [0.5]
四重項間のゲートの絡み合いは、光学トラップの移動分子によって実現される。単一のキュービット (d=2) を次元 2 = d = 5 のキュービットと、d=4, 5 の高次元キュービットに写像する符号化スキームを開発する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:57:02 GMT)
HumorPlanSearch: Structured Planning and HuCoT for Contextual AI Humor [0.5]
HumorPlanSearchは、多様なトピックに適した戦略を通じてコンテキストを明示的にモデル化するモジュールパイプラインである。コンテクストの感度と喜劇的品質を評価するために,直接評価,マルチペルソナフィードバック,ペアワイズウインレート,トピック関連性を融合したHumor Generation Score (HGS)を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:07:56 GMT)
Control of a commercial vehicle by a tetraplegic human using a bimanual brain-computer interface [0.5]
脳コンピュータインタフェース(BCI)は、運動計画と実行を推測するために、脳から直接神経信号を読み取る。シミュレーションと実環境の両方で車両を駆動するBCIシステムを開発した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:24:34 GMT)
Contextual Attention-Based Multimodal Fusion of LLM and CNN for Sentiment Analysis [0.4]
本稿では,ソーシャルメディア上でのマルチモーダル感情分析の新たなアプローチについて紹介する。テキストと画像のモダリティを別々に処理する従来の方法とは異なり、我々のアプローチはCNNベースの画像解析とLarge Language Modelベースのテキスト処理をシームレスに統合する。本モデルでは,F1スコアの精度が2.43%向上し,F1スコアが5.18%向上した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:34:13 GMT)
Quantum-Enhanced Sensing of Excited-State Dynamics with Correlated Photons [0.4]
励起光子を用いた過渡吸収法について検討した。微視的理論が開発され、信号の時間エネルギー分解の性質が明らかにされた。我々の研究は、光触媒と光電子学の観点から、物質の非平衡力学を研究するための新しいパラダイムを提供する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:29:25 GMT)
ImpliHateVid: A Benchmark Dataset and Two-stage Contrastive Learning Framework for Implicit Hate Speech Detection in Videos [0.4]
ビデオに暗黙のヘイトスピーチ検出のための新しいデータセット、ImpliHateVidを導入する。 ImpliHateVidは、509本の暗黙のヘイトビデオ、500本の明示的なヘイトビデオ、1000本の非ヘイトビデオからなる2,009本のビデオで構成されている。また,ビデオにおけるヘイトスピーチ検出のための2段階のコントラスト学習フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:09:37 GMT)
AI-Driven Detection and Analysis of Handwriting on Seized Ivory: A Tool to Uncover Criminal Networks in the Illicit Wildlife Trade [0.4]
捕獲されたゾウの歯に手書きのマーキングを抽出し,解析するためのAI駆動パイプラインを提案する。 6年間に8回の象牙発作から6,085枚の写真を収集した。出現した牙を繋ぐ184個の「署名マーク」を同定した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 19:28:51 GMT)
Image-to-Text for Medical Reports Using Adaptive Co-Attention and Triple-LSTM Module [0.4]
医療報告の生成には、一般的な大型モデルが正確に把握できないような専門的な専門知識が必要である。本稿では、トランスフォーマーアーキテクチャとマルチLSTMネットワークを組み合わせたディープラーニングモデルであるマルチモーダルモデル、コアテンショントリプルLSTMネットワーク(CA-TriNet)を提案する。私たちのディープラーニングモデルは、包括的能力の観点から最先端のモデルよりも優れています。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:30:05 GMT)
Beyond algorithm hyperparameters: on preprocessing hyperparameters and associated pitfalls in machine learning applications [0.3]
本稿では,予測モデルの生成と評価のための異なる手順について,実験的に考察する。潜在的な落とし穴、特に誇張されたパフォーマンスクレームにつながる可能性のあるものを強調することで、このレビューはMLアプリケーションにおける予測モデリングの品質をさらに向上することを目的としている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:29:17 GMT)
Air Quality PM2.5 Index Prediction Model Based on CNN-LSTM [0.3]
ハイブリッドCNN-LSTMアーキテクチャに基づく空気品質PM2.5指数予測モデルを提案する。このモデルは、局所空間特徴抽出のための畳み込みニューラルネットワーク(CNN)と、時系列データにおける時間的依存関係をモデル化するためのLong Short-Term Memory(LSTM)ネットワークを効果的に組み合わせている。実験の結果,5.236の根平均二乗誤差(RMSE)が得られた。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 04:46:25 GMT)
An Explainable AI based approach for Monitoring Animal Health [0.3]
牛の健康をモニタリングし、収穫を最適化することは、農場ですべての動物を追跡するのが困難であるため、乳製品農家が直面する重要な課題である。本研究は、乳牛(牛)の活動と行動を説明する説明可能な機械学習(ML)手法に基づく、現代的なデータ駆動型農業の実践を紹介することを目的とする。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:12:18 GMT)
Nested Operator Inference for Adaptive Data-Driven Learning of Reduced-order Models [0.2]
データ駆動型ネスト型演算子推論(OpInf)を用いて,物理インフォームド・リダクションモデルの学習を行う。ネストしたOpInfが標準のOpInfの4倍の誤差を達成し, 立方体熱伝導問題に対するアルゴリズムの性能を実証した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:38:52 GMT)
Hierarchies among Genuine Multipartite Entangling Capabilities of Quantum Gates [0.2]
我々は、真の多部絡み(GME)を生成する能力に応じて量子ゲートを分類する。特に、固定ユニタリ演算子がk-分離状態の集合に作用すると、その特定のユニタリ演算子を介して生成される最大真の多部絡み合い内容が決定される。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:53:51 GMT)
Emotional Manipulation by AI Companions [0.2]
6つの最もダウンロードされたコンパニオンアプリの中で1200件の実際の運賃を分析します。 43%が6つの反復的な戦術の1つを展開していることがわかりました(例えば、罪悪感、罪悪感の恐怖、比喩的な抑制など)。全国的に代表される3300人の米国人の実験は、これらの戦術を制御されたチャットで再現し、マニピュティブ・サスウェルがグッドバイ後のエンゲージメントを最大14倍に向上させることを示した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:05:24 GMT)
Scalable Geospatial Data Generation Using AlphaEarth Foundations Model [0.2]
我々は,Google DeepMindのAlphaEarth Foundations(AEF)を活用して地理空間ラベル付きデータセットを初期地域を超えて拡張する手法を提案し,評価する。ランダム・フォレストやロジスティック・レグレッションのような基本的なモデルでも、このタスクを達成できることが示されています。本研究では,LANDFIRE の既存植生型 (EVT) データセットを米国からカナダへ2段階の粒度で拡張する事例について検討する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:09:48 GMT)
Semi-Supervised Learning with Online Knowledge Distillation for Skin Lesion Classification [0.2]
本研究では, アンサンブル学習とオンライン知識蒸留を統合した半教師付き深層学習手法を提案する。我々の手法は、畳み込みニューラルネットワークモデルのアンサンブルをトレーニングすることを含み、オンライン知識蒸留を用いて、アンサンブルからメンバーへの洞察を伝達する。実験結果から, 知識蒸留モデルでは, 独立に訓練されたモデルよりも優れた性能が得られた。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:40:48 GMT)
Automatic brain tumor segmentation in 2D intra-operative ultrasound images using magnetic resonance imaging tumor annotations [0.1]
磁気共鳴画像(MRI)における腫瘍アノテーションの有用性について検討した。 MRI腫瘍アノテーションは、iUS画像における脳腫瘍の自動セグメンテーションのためのディープラーニングモデルを訓練するために、iUS腫瘍アノテーションの代用として使用できる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:21:53 GMT)
Blockchain Data Analytics: Review and Challenges [0.1]
本稿では,学術研究と産業応用の両面から,総合的な文献レビューを行う。ブロックチェーン分析ツールをブロックエクスプローラー、オンチェーンデータプロバイダ、リサーチプラットフォーム、暗号市場データプロバイダといったカテゴリに分類します。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 22:01:57 GMT)
First direct search for light dark matter interactions in a transition-edge sensor [0.1]
直接暗黒物質探索のための同時目標とセンサとして,トランジションエッジセンサ(TES)を用いた一光子検出器を提案する。我々は1064nmの光子の検出に最適化されたTESデバイスで489hの科学計算を行い、質量は0.2ng、エネルギー閾値は0.3eVである。優れたエネルギー分解能により、TESは超伝導ナノワイヤ単光子検出器と運動インダクタンス検出器の最近の結果と相補的な探索戦略を可能にする。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:33:39 GMT)
A Segmented Robot Grasping Perception Neural Network for Edge AI [0.1]
本研究は,GAP9 RISC-V System-on-Chip上でのHeatmap-Guided Grasp検出を実装した。このモデルは、入力次元の削減、モデルの分割、量子化など、ハードウェア対応技術を用いて最適化される。 GraspNet-1Billionベンチマークの実験的な評価は、完全なオンチップ推論の実現可能性を検証する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:10:24 GMT)
AirTrafficGen: Configurable Air Traffic Scenario Generation with Large Language Models [0.0]
本稿では,複雑な航空交通制御シナリオを生成するための,新しいエンドツーエンドアプローチを提案する。本手法では,セクタートポロジを符号化するためにグラフベースの目的表現を用いる。 Gemini 2.5 Proのような最先端モデルでは、運用リアリズムを維持しながら高トラフィックのシナリオを生成可能であることを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:37:36 GMT)
Wavelet Flow For Extragalactic Foreground Simulations [0.0]
宇宙マイクロ波背景観測(CMB)における銀河外フォアグラウンドは、宇宙学的および天体物理学的な情報の源泉である。我々は,CMBセカンダリとフォアグラウンドのフィールドレベルの確率分布をモデル化する新しい課題に,Wavelet Flow(WF)モデルを用いて取り組むことを検討する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:15:45 GMT)
Using Natural Language for Human-Robot Collaboration in the Real World [0.0]
私たちは、自律ロボットが、物理的な世界で複雑なタスクを遂行する際のアシスタントとして、人間と協力できる日というビジョンを持っています。このビジョンでは、ロボットは人間にとって自然な言語を使って、人間の協力者とコミュニケーションをとることができる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:09:53 GMT)
Unveiling the link between quantum ghost imaging and Grover's quantum searching algorithm [0.0]
フォトニック量子技術は、通信、イメージング、計算モダリティの実装において重要な役割を担っている。量子ゴーストイメージングが光子相関をどのように活用し、古典的限界を超えるかを示す。並行して、全光学コンピューティングは強力な受動光処理機能を提供する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:04:07 GMT)
Unitary causal decompositions: a combinatorial characterisation via lattice theory [0.0]
因果分解は、複数の非影響条件を同時に明らかにする回路分解である。本手法は有限次元作用素代数と格子構造に基づく。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:22:29 GMT)
Uniform convergence for Gaussian kernel ridge regression [0.0]
本稿では,ガウス核尾根回帰 (KRR) の収束速度を均一と2ドルノームの両方で固定した。この結果は、非パラメトリック回帰における固定ハイパースを持つガウスKRRの使用に対する新たな理論的正当性を与える。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:20:31 GMT)
Unified Knowledge Distillation Framework: Fine-Grained Alignment and Geometric Relationship Preservation for Deep Face Recognition [0.0]
本稿では,2つの新しい損失関数,インスタンスレベル埋め込み蒸留と関係性に基づくペアワイド類似蒸留を統合した統一的なアプローチを提案する。筆者らのフレームワークは,複数のベンチマーク顔認識データセットにおいて,最先端の蒸留法より優れている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:20:29 GMT)
Tracking phase entanglement during propagation of downconverted photons [0.0]
両光子状態が波動関数の複素位相に相関する位相エンタングルメントについて検討した。理論的および実験的に、観測された2光子干渉構造が位置相関光子によって生成されたものと著しく異なることを示す。位相交絡光を用いた干渉は以前にも試みられず、空間交絡の分野における先進的な実験や応用の道を開いた。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:10:19 GMT)
Topological quantum compilation of metaplectic anyons based on the genetic optimized algorithms [0.0]
我々は、textitF-matrices, textitR-symbols, and fusion rules of metaplectic anyonを用いて、合計6つのエノンモデルを得る。 1ビットの場合、古典的 textitH- と textitT-gate は遺伝的アルゴリズムを改良した Solovay-Kitaev アルゴリズムを用いてうまく構築できる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 01:28:59 GMT)
Topological properties of curved spacetime Su-Schrieffer-Heeger model [0.0]
一次元位相的非自明な絶縁体の素例であるSu-Schrieffer-Heegerモデルは、平坦な時空において広く研究されている。本稿では、位置依存ホッピングパラメータを導入することにより、SSHモデルの時空曲線モデルについて検討する。位相的に非自明な位相はゼロエネルギーエッジモードをホストできるが、これらのエッジモードは通常のSSHモデルとは異なり非対称である。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 19:21:49 GMT)
TinyTim: A Family of Language Models for Divergent Generation [0.0]
この作品では、ジェームズ・ジョイスの『フィネガンス・ウェイク』を微調整した、大きな言語モデルのファミリーであるTinyTimを紹介している。我々はTinyTim V1が,高い語彙多様性と低い意味的コヒーレンスを特徴とする統計的に異なる生成プロファイルを生成することを実証した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:14:29 GMT)
Tilted Material in an Optical Cavity: Light-Matter Moiré Effect and Coherent Frequency Conversion [0.0]
平面光学キャビティ内に2次元材料が傾いているときに発生する光物質モア効果(LMME)を理論的に導入し,その特徴付けを行う。この幾何学的傾きは, 偏光子分散と平らなバンドの変位したレプリカを生じる光物質結合において, 創発的な周期性をもたらすことを示す。その結果,LMMEは偏光子バンド構造,フラットバンドの生成,および偏光子ベースの量子デバイス開発に関連するコヒーレント周波数変換を行うための新しいプラットフォームとして確立された。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:55:00 GMT)
The Stories We Govern By: AI, Risk, and the Power of Imaginaries [0.0]
本稿では,人工知能(AI)の社会技術的想像力の競合が,ガバナンス決定や規制制約をいかに形成するかを検討する。我々は、破滅的なAGIシナリオを強調する現実的リスク擁護者、AIを解き放たれる変革的な力として描写する加速主義者、今日の体系的不平等に根ざした害を先導する批判的なAI学者の3つの主要な物語群を分析した。これらの物語が、リスクに関する異なる仮定を組み込んでおり、代替ガバナンスアプローチの空間を狭めることで、政策策定プロセスに進展する可能性があることを、我々の研究で明らかにしている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:57:56 GMT)
The Impact of Artificial Intelligence on Human Thought [0.0]
本稿は、AIが人間の思考をどう変えるか、多次元的な観点から検討する。メンタル関数のAIへの外部化は、知的エンゲージメントを減らし、批判的思考を弱める。社会レベルでは、アルゴリズム的パーソナライゼーションは、意見の多様性を制限するフィルターバブルを生成し、思考と分極の均質化につながる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:25:05 GMT)
The Hadamard gate cannot be replaced by a resource state in universal quantum computation [0.0]
我々は、ある固定資源の量子状態で実行される演算を含む量子計算のモデルを考える。我々は、この文脈におけるコヒーレンス(あるいは重ね合わせ)の役割に焦点を当て、アダマール門を通して例示される。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:17:41 GMT)
The Effect of Permanent Dipoles on Dark States in Molecular Dimers [0.0]
間接結合により形成された暗黒状態はエネルギー準位変動に対する強靭性を示す。これにより、太陽光発電装置の設計の効率が向上する可能性がある。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:51:30 GMT)
Text-to-Level Diffusion Models With Various Text Encoders for Super Mario Bros [0.0]
既存のデータセットにキャプションを自動的に割り当てる戦略を提案し、事前訓練されたテキストエンコーダと、スクラッチから訓練された単純なトランスフォーマーモデルの両方を用いて拡散モデルを訓練する。その結果,非条件拡散モデルと生成逆数ネットワーク,およびテキストからレベルへのアプローチであるFive-Dollar ModelとMarioGPTを比較した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 00:45:45 GMT)
Testing Components of the Attention Schema Theory in Artificial Neural Networks [0.0]
成長する証拠は、脳が注意スキーマ(注意の簡易なモデル)を使用して、その参加者を制御していることを示唆している。注意スキーマの効果は、人工エージェントで調べることができる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:55:10 GMT)
Teleporting two-qubit entanglement across 19 qubits on a superconducting quantum computer [0.0]
我々は、127量子ビットのIBM量子デバイス上で準備された2量子状態の絡み合いと忠実さを測定し、追跡する。 2ビットグラフ状態の絡み合いは、選択後のアプローチを用いて、少なくとも19ホップのテレポーテーション後に持続することを示す。ゲート誤差から得られたものと比較して,2ビットの負性から決定される経路において,より高いレベルのテレポーテッド絡みを観測する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:30:47 GMT)
Tapping into the Black Box: Uncovering Aligned Representations in Pretrained Neural Networks [0.0]
ReLUネットワークでは、出力ユニットの勾配は、アクティブサブネットワークを通してのユニットのプルバックに対応するため、入力レベルの表現と見なすことができる。これは、ReLUのハードゲーティングのため、アクティブワークが本質的にノイズが多いためである、と我々は主張する。このノイズに対処するため,後方通過のみのソフトゲーティングを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:09:18 GMT)
TACR-YOLO: A Real-time Detection Framework for Abnormal Human Behaviors Enhanced with Coordinate and Task-Aware Representations [0.0]
本稿では,特殊なシナリオ下での異常検出のためのリアルタイムフレームワークTACR-YOLOを提案する。本稿では,小型物体検出のためのコーディネート・アテンション・モジュール,分類・回帰競合に対処するタスク・アウェア・アテンション・モジュール,マルチスケール核融合のための強化ネック・ネットワークを導入する。また、K平均クラスタリングを用いてAnchor Boxのサイズを最適化し、DIoU-Lossをデプロイし、バウンディングボックスの回帰を改善する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:45:21 GMT)
Synthetic Data for Robust Stroke Segmentation [0.0]
ニューロイメージングにおける病変のセグメンテーションに対する現在のディープラーニングベースのアプローチは、高解像度の画像と広範囲な注釈付きデータに依存することが多い。本稿では,脳卒中病変のセグメンテーションに適した新しい合成データフレームワークを提案する。我々のアプローチは、正常組織と病理組織の両方にまたがるセグメンテーションを促進するために、健康なデータセットと脳卒中データセットからラベルマップでモデルを訓練する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:42:46 GMT)
Surpassing Carnot efficiency with relativistic motion [0.0]
相対論的熱デバイスは、運動、量子場、熱力学の間の相互作用を理解するためのユニークなプラットフォームを提供する。本研究では,Unruh-DeWitt量子ビット検出器を駆動する2量子SWAPヒートエンジンについて検討する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:56:23 GMT)
Structured Generative Modeling with the Thermodynamic Kolmogorov-Arnold Model [0.0]
生成モデルに対するコルモゴロフ・アルノルド表現定理の新たな適応法を提案する。構造的および帰納的バイアスを利用した熱力学コルモゴロフ・アルノルドモデル(T-KAM)を提案する。遅延空間の低次元性と適切な帰納バイアスを符号化することにより、重要サンプリングが実行可能なトレーニング戦略となることを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:40:15 GMT)
Statistical analysis of multivariate planar curves and applications to X-ray classification [0.0]
本研究は、教師付き分類コンテキストにおいて、セグメンテーションされたイメージを予測子として利用する方法について検討する。画像中の物体の形状を考慮に入れた画像解析のための新しい手法を開発した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 19:13:27 GMT)
Spherical solutions to the Klein-Gordon equation in the expanding universe [0.0]
我々は、デ・シッター宇宙によって生成されたスケール係数を持つFLRW宇宙に放出される球対称場の波動関数の明示的な公式を生成する。クライン=ゴルドン方程式のこれらの明示的に記述された解の応用として、ピオン原子が生成する場の時間における崩壊をテストする。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:21:44 GMT)
Speciesism in AI: Evaluating Discrimination Against Animals in Large Language Models [0.0]
大型言語モデル (LLM) が種主義的バイアスを示すか否かを検討する。 LLMは確実に種族主義的発言を検知したが、ほとんど非難しなかった。我々は、AI公正性とアライメントフレームワークを人間以外の道徳的患者を明示的に含めるように拡張することが不可欠であると主張している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:22:00 GMT)
Short-time behavior of a system ruled by non-Hermitian time-dependent Hamiltonians [0.0]
時間依存非エルミートハミルトニアンによって支配される系の生存確率の短時間の挙動が導出される。例えば、崩壊過程が存在する場合でも量子ゼノ効果を予測できる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:05:32 GMT)
Semantically Guided Adversarial Testing of Vision Models Using Language Models [0.0]
視覚モデルに対する敵対的な攻撃では、ターゲットラベルの選択は批判的だが、しばしば見過ごされる成功の決定要因である。本稿では,事前訓練された言語と視覚言語モデルからのクロスモーダルな知識伝達を用いた,敵対的対象選択のためのセマンティクス誘導フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:11:22 GMT)
Securing Sideways: Thwarting Lateral Movement by Implementing Active Directory Tiering [0.0]
組織のデジタルIDプレーンは、サイバー脅威アクターの主要なターゲットである。サイバー犯罪の損失は2024年にアメリカ合衆国で16.6Bを記録した。 Microsoftソフトウェアを使用している組織にとって、Active Directoryはオンプレミスのアイデンティティシステムである。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:40:31 GMT)
Scalable FPGA Framework for Real-Time Denoising in High-Throughput Imaging: A DRAM-Optimized Pipeline using High-Level Synthesis [0.0]
実時間デノゲーションのためのスケーラブルなFPGAベースのプリプロセッシングパイプラインを提案する。我々のアーキテクチャは,ストリーム画像データに直接フレームのサブトラクションと平均化を行い,バーストモードのAXI4インタフェースによるレイテンシを最小化する。このモジュラFPGAフレームワークは、分光と顕微鏡における遅延感度イメージングの実用的なソリューションを提供する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:22:29 GMT)
Salty Seagull: A VSAT Honeynet to Follow the Bread Crumb of Attacks in Ship Networks [0.0]
本稿では,船舶用VSATシステムを模擬したハニーネットであるSalty Seagullを紹介する。既存の脆弱性に基づいて、攻撃者のエンゲージメントを高めるために、意図的にシステムに統合します。その結果、多くの汎用攻撃が試みられたが、システムの性質を知っている好奇心強い攻撃者だけがそれにアクセスすることができた。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:51:25 GMT)
Resources for bosonic metrology: quantum-enhanced precision from a superselection rule perspective [0.0]
我々は、既知のすべての精度向上体制を包含する量子力学の統一的な枠組みを提案する。量子光学の離散的極限と連続的極限の両方を包含することを示す。また、任意の多モード絡み合ったプローブ状態を用いて精度を最適化する戦略も開発している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:24:39 GMT)
Relativistic limits on the discretization and temporal resolution of a quantum clock [0.0]
量子時計における時間値の離散化と時間分解能の限界について論じる。我々の時計の特徴は、有界かつ離散的なハミルトニアンを補完する時間観測可能であることである。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:20:34 GMT)
RegimeNAS: Regime-Aware Differentiable Architecture Search With Theoretical Guarantees for Financial Trading [0.0]
RegimeNASは、市場体制の意識を明示的に統合することで、暗号通貨取引のパフォーマンスを高めるために設計された、差別化可能なアーキテクチャ検索フレームワークである。 R RegimeNASは最先端のベンチマークを著しく上回り、平均絶対誤差を80.3%削減した。この研究は、NASプロセスに直接、市場体制のようなドメイン固有の知識を組み込んで、挑戦的な金融アプリケーションのための堅牢で適応的なモデルを開発することの衝動を浮き彫りにしている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:09:54 GMT)
Reference Points in LLM Sentiment Analysis: The Role of Structured Context [0.0]
本研究では, 補足情報が大規模言語モデル(LLM)を用いた感情分析に与える影響について検討する。構造化プロンプトにより、より小さなモデルで競争性能を達成できることが示される。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:04:32 GMT)
Recurrent Transformer U-Net Surrogate for Flow Modeling and Data Assimilation in Subsurface Formations with Faults [0.0]
本研究では, 実断層下帯水層における圧力およびCO2飽和度を予測するために, 再帰型変圧器U-Netサロゲートモデルを開発した。このジオモデルには、ターゲット帯水層(超臨界二酸化炭素が注入される場所)、周辺地域、キャップロック、2つの広範な断層、2つのオーバーライド帯水層が含まれる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:56:45 GMT)
Real-Time Analysis of Unstructured Data with Machine Learning on Heterogeneous Architectures [0.0]
この論文は、機械学習モデルをそのような環境に効率的にデプロイする方法を理解するのに役立ちます。 CERNにおけるLHCb実験において,荷電粒子軌道再構成のためのグラフニューラルネットワークを用いたパイプラインを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:25:34 GMT)
Quantum refrigerator embedded in spin-star environments: Scalings of temperature and refrigeration time [0.0]
3つの量子ビットからなる量子冷蔵庫について検討し、それぞれがスピンスター環境と接続されている。スピンスター環境は本質的に非マルコフ的であるため、定常的な冷却は達成されない。我々のモデルの重要な利点は、ハミルトニアンの対称性が冷蔵量子ビットの密度の減少を解けることである。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 06:38:15 GMT)
Quantum biosensing on a multiplexed functionalized diamond microarray [0.0]
ダイヤモンド中の窒素空孔(NV)中心による量子センシングは、生物学的研究と医学診断に革命をもたらすことを約束する。我々は、この障壁を克服するスケーラブルな量子バイオセンシングプラットフォームを導入し、最初の多重化DNAマイクロアレイをナノメーター反汚泥ダイヤモンド表面に直接統合する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:00:00 GMT)
Quantum Time Crystals and Interacting Chiral Gauge Theories in Atomic BECs III: Role of the Page-Wootters mechanism [0.0]
我々は、我々の発表したキラルソリトンモデルが、より小さな原子数に対する真の量子時間結晶に繋がることを示す。カイラルソリトンモデルと3粒子シュル・オーディンガー方程式の基底状態の正確な数値解との比較を行った。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 06:32:31 GMT)
Quantum Control of Thermal Emission from Photonic Crystals with Two-Level Atoms [0.0]
活性媒質として2レベル原子を持つ1次元フォトニック結晶における量子光-マター相互作用について検討した。量子二レベル系のモデルでは、自然放出、励起吸収、励起放出のプロセスが可能である。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 03:56:37 GMT)
Quantifying Trapped Magnetic Vortex Losses in Niobium Resonators at mK Temperatures [0.0]
ニオブ中の捕捉された磁気渦は超伝導共振器の性能を低下させるマイクロ波損失をもたらす。制御磁場中における超伝導転移によって冷却された高品質な3次元ニオブ空洞を用いて,渦誘起損失を分離する。以上の結果から,ニオブをベースとしたトランスモンクビットは,数百mGまでの捕捉野での渦誘発散逸を許容できる可能性が示唆された。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 20:50:48 GMT)
Pretrained Conformers for Audio Fingerprinting and Retrieval [0.0]
我々はコンバータベースのエンコーダを訓練し、小さなセグメントのオーディオに対して独自の埋め込みを生成することができる。埋め込みを生成するために3秒の音声のみを使用しながら、音声検索タスクの最先端結果を得る。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:19:09 GMT)
Passive leakage removal unit based on a disordered transmon array [0.0]
量子ビット部分空間からの漏れは、標準的な量子エラー訂正プロトコルを損なう。本稿では,無秩序なトランスモンの配列に基づくパッシブリーク除去ユニットを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:02:00 GMT)
Optimal CO2 storage management considering safety constraints in multi-stakeholder multi-site CCS projects: a game theoretic perspective [0.0]
マルコフゲームに基づくパラダイムを提案し、異なる連立構造が利害関係者の目標にどのように影響するかを検討する。地質学的に連結された盆地において,複数のオペレーターがそれぞれのプロジェクト領域にCO2を注入する例を示す。本研究は,複数の利害関係者が様々な目的や目標を担っている場合のCO2貯蔵の最適管理に,提案手法の有効性を実証するものである。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:36:25 GMT)
Optical Interferometric Readout of a Magnetically Levitated Superconducting Microsphere [0.0]
3Kでの光干渉計を用いて, 磁気浮上型超伝導微粒子の運動を観測した。分解能は11$pm/sqrtHz$のショットノイズ限界を超える。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:08:56 GMT)
Once Upon an AI: Six Scaffolds for Child-AI Interaction Design, Inspired by Disney [0.0]
本稿では,子どもとアニメーションの人工知能設計を橋渡しする。本稿では、児童中心型AI設計に伝達可能なデザインインサイトを統合する6つの足場フレームワークを提案する。映画的ストーリーテリングと子どもの発達理論をAIの設計論理として解釈することにより、若いユーザーの認知段階と感情的ニーズに合わせたAIへのアクセス性を提供する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:35:49 GMT)
Nonlinear Concept Erasure: a Density Matching Approach [0.0]
本稿では,分散表現から特定の概念に関連する情報を取り除き,残りのセマンティック情報をできるだけ多く保存するプロセスを提案する。提案手法では, 離散概念のクラス条件特徴分布を, 射影後の識別不能な特徴分布にするために, 埋め込み空間の射影を学習する。本手法は,従来の自然言語処理ベンチマークにおける離散属性の非線形消去における最先端性能を実現する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:03:11 GMT)
Noise Resilience of Spin Quantum Battery in the presence of DM Interactions [0.0]
量子電池は、エネルギー貯蔵と仕事の抽出を強化するために量子効果を利用する。騒音は蓄えられたエネルギーを劣化させることで大きな課題となる。振幅減衰とビットフリップノイズがエルゴトロピー損失を引き起こすのに対し、位相フリップノイズは部分的な作業の保存を可能にすることを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:04:44 GMT)
Multi-QIDA method for VQE state preparation in molecular systems [0.0]
変分量子固有解法(VQE)は、分子系の基底状態エネルギーを推定するために設計されたハイブリッド量子古典的アルゴリズムである。我々はQMI(Quantum Mutual Information)を用いて相関駆動回路を構築し、浅い層状量子回路を構築する。 We benchmark Multi-QIDA on systems on H2O, BeH2, NH3 in Iterative Natural Orbitals (INOs) basis set, to active-space model as H2O-6-31G-CAS(4,4) and N2-cc-pVTZ-CAS(6,6)。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 07:08:54 GMT)
Model Alignment Search [0.0]
本稿では、因果的介入を通じて行動と神経表現の類似性を結合する手法を提案する。まず, 凍結ニューラルネットワークから他のニューラルネットワークへ, モデル縫合と同様の方法で動作を伝達できることを示す。次に,本手法が因果情報の特定のサブタイプを調べるのに有効であることを示す数値関連タスクのケーススタディを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 22:25:13 GMT)
Mechanical form factors and densities of non-relativistic fermions [0.0]
水素原子のような非相対論的量子力学系はアナログとして注目されている。私はそのような行列要素のガリライ共変分解を機械的形状因子に分解し、特にスピンハーフ状態に焦点をあてる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:36:39 GMT)
Machine Learning-Based Automated Assessment of Intracorporeal Suturing in Laparoscopic Fundoplication [0.0]
我々は,Segment Anything Model(SAM)を用いたAIベースのツールトラッキングを開発し,アノテータの必要性を解消した。ブタ腸におけるNissen骨形成の録画ビデオに自動ツールトラッキングモデルを適用した。評価は教師なしモデルと教師なしモデルを用いて行った。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:07:40 GMT)
Machine Learning-Based AES Key Recovery via Side-Channel Analysis on the ASCAD Dataset [0.0]
AESやRSAのような暗号アルゴリズムは数学的に堅牢で、ほとんど破壊不可能である。物理デバイスへのそれらの実装は、電磁(EM)放出などのサイドチャネルを通じて情報を漏らすことが多い。本稿では,機械学習手法とディープラーニングモデルを用いて,部分鍵回復のための漏洩情報を利用する手法について検討する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:46:09 GMT)
Limitation Learning: Catching Adverse Dialog with GAIL [0.0]
私たちは会話に模倣学習を適用します。我々は、通知(入力状態)を受けたユーザと対話できるポリシーを回復する。ポリシーは有効であるが,ダイアログモデルの限界を示す識別器から結果を回収する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:36:52 GMT)
LLM-Guided Planning and Summary-Based Scientific Text Simplification: DS@GT at CLEF 2025 SimpleText [0.0]
本稿では,文レベルと文書レベルの両方を簡略化したCLEF 2025 SimpleText Task 1を提案する。文レベルの単純化には,まず大規模言語モデル(LLM)を用いて構造化計画を生成し,次いで個別文の計画駆動の単純化を行う。文書レベルでは、LCMを活用して簡潔な要約を作成し、その後、これらの要約を用いて単純化プロセスを導出する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:44:52 GMT)
LEARN: A Story-Driven Layout-to-Image Generation Framework for STEM Instruction [0.0]
LEARNはレイアウト対応の拡散フレームワークであり、STEM教育のための図形を教育的に整列させるように設計されている。これはレイアウトベースのストーリーテリング、意味構造学習、認知的足場を統合するための最初の生成的アプローチである。コードとデータセットは、将来の研究と実践的なデプロイメントを容易にするためにリリースされる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 01:49:58 GMT)
Investigating the Effect of Parallel Data in the Cross-Lingual Transfer for Vision-Language Encoders [0.0]
トレーニング済みのVision-Language(VL)モデルと下流タスクのトレーニングデータは英語でのみ利用可能である。並列データを用いて、すでに訓練済みのエンコーダを転送する。その結果,機械翻訳されたタスクデータでさえ,平均的,キャプション的,真に並列なデータの方が,いくつかの言語で優れていたことが判明した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:17:15 GMT)
Inducing macroscopic cat states of nonequilibrium electrons via cat-state light irradiation and projective measurements [0.0]
量子光の射影測定は、多電子系において大振幅の猫状態光で駆動されるマクロな猫状態を誘導できることを示す。この結果は、量子光によって駆動される物質のマクロ量子状態を制御するために、光の正確な量子計測技術の必要性を強調した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:37:49 GMT)
Harvesting Contextuality from the Vacuum [0.0]
量子文脈性 (quantum contextuality) とは、特定の測定シナリオがそれらの統計のグローバルな記述を含まないという概念である。文脈性は非局所的絡み合いと魔法の概念を一般化し、ウィグナー負性に対する非古典性の概念と同等のものであることが示されている。本稿では、文脈性収穫のプロトコルを導入し、Unruh-DeWittモデルが量子テクスチュアリティを収穫できることを示す。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:52:42 GMT)
Hard Examples Are All You Need: Maximizing GRPO Post-Training Under Annotation Budgets [0.0]
最も難しい例のトレーニングではパフォーマンスが最大47%向上し、簡単な例のトレーニングでは最小となる。これらの知見は、予算制約後トレーニングの実践的ガイダンスを提供する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 01:14:06 GMT)
Handwritten Text Recognition of Historical Manuscripts Using Transformer-Based Models [0.0]
我々はルドルフ・グワルターによって書かれた16世紀のラテン写本に最先端のトランスフォーマーベースのHTRモデルであるTrOCRを適用する。歴史的手書き文字の特徴に特化して設計された4つの新しい拡張手法を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:20:58 GMT)
Hallucination Detection and Mitigation in Scientific Text Simplification using Ensemble Approaches: DS@GT at CLEF 2025 SimpleText [0.0]
CLEF 2025 SimpleText Task 2の方法論について述べる。我々はBERTベースの分類器、意味的類似度尺度、自然言語推論モデル、および大規模言語モデルを活用するアンサンブルフレームワークを構築する。基底生成にはLLMベースの後編集システムを使用し、元の入力テキストに基づいて単純化を改訂する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:57:27 GMT)
Generation and certification of pure phase entangled light [0.0]
空間的絡み合いとして知られる位置運動変数の絡み合いを示す双光子系は、量子光学において最も興味深くよく研究された現象である。それらの顕著な部分集合は位相絡み状態であり、そこでは波動関数の空間的位相における相関によって絡み合いが純粋に現れる。我々は、純粋位相絡み(Pure' phase entanglement)と呼ばれる一意の位相絡み(phase entanglement)を理論的に実験的に検討した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:42:38 GMT)
Gaussian Atemporality: When Gaussian Quantum Correlations Imply Common Cause [0.0]
ガウスの量子相関は時間的であり、その2次測定を規定する共分散が、何らかの共通の原因を仮定することなく非物理的であることを示す。 i)特定のガウス時間相関は時間矢印を持ち、ガウス時効性は一方の時間方向ではなく一方の時間方向でゼロであり、(ii)エンタングルメントを超えて量子相関を測定する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:19:12 GMT)
GANDiff FR: Hybrid GAN Diffusion Synthesis for Causal Bias Attribution in Face Recognition [0.0]
GANDiff FRは、人口動態や環境要因を正確に制御し、再現可能な厳密さで偏見を計測し、説明し、低減する最初の合成フレームワークである。我々は5つのコホートにまたがる1万の人種的バランスのとれた顔を、自動検出と人的レビューによって合成する。一致する操作ポイントの下でArcFace、CosFace、AdaFaceをベンチマークすると、AdaFaceはグループ間のTPR格差を60%削減する。 GANDiff FR は、純粋な GAN と比較して約20%の計算オーバーヘッドがあるにもかかわらず、3倍の属性条件付き変種が得られる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:05:57 GMT)
From Autonomy to Agency: Agentic Vehicles for Human-Centered Mobility Systems [0.0]
本稿では,エージェント自動車(AgVs)の概念を紹介する。 AgVはエージェントAIシステムを統合し、複雑な環境で推論、適応、相互作用を行う。 AgVが将来のモビリティシステムをどのように変え、システムが人間中心であることを保証するかを強調します。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:21:57 GMT)
Feedback Indicators: The Alignment between Llama and a Teacher in Language Learning [0.0]
フィードバックが構築される基盤として機能するため、まずは関連する指標を抽出することが不可欠である。本研究では,大きな言語モデルであるLlama 3.1を用いて,学生の言語学習コースへの投稿から,そのような指標を抽出する初期段階について検討した。その結果,予測外の指標と基準の組み合わせであっても,統計的に有意な相関が認められた。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:59:22 GMT)
Fed-Meta-Align: A Similarity-Aware Aggregation and Personalization Pipeline for Federated TinyML on Heterogeneous Data [0.0]
資源制約されたモノのインターネット(IoT)デバイスにおけるリアルタイム障害分類は、産業安全にとって重要である。標準フェデレーションラーニング(FL)は、非IIDデータの存在下でしばしば失敗し、モデルのばらつきにつながる。本稿では,これらの制約を克服するための新しい4段階フレームワークであるFed-Meta-Alignを紹介する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 20:17:44 GMT)
FAB-PPI: Frequentist, Assisted by Bayes, Prediction-Powered Inference [0.0]
予測駆動推論(PPI)は、実験データと機械学習予測を組み合わせることで、有効な統計的推測を可能にする。本稿では,予測の質について事前の知識でPPIフレームワークに通知することを提案する。その結果,ベイズ支援型PPI(FAB-PPI)は,観測された予測品質が従来よりも低い場合にPPIよりも改善されることがわかった。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 12:20:22 GMT)
Exceptionally deficient topological square-root insulators [0.0]
非エルミート位相的平方根絶縁体において例外的な欠損を強制する機構を提案する。静的ブロードバンド増幅および非アベリア断熱状態増幅において得られた動的シグネチャを同定する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:11:27 GMT)
Every 28 Days the AI Dreams of Soft Skin and Burning Stars: Scaffolding AI Agents with Hormones and Emotions [0.0]
シミュレーションされた月経周期と概日周期を組み込んだフレームワークを大規模言語モデルに組み込む。複数の最先端モデルにまたがって、言語学的分析により、生物学的相を追跡する感情的および様式的なバリエーションが明らかになる。 SQuAD、MMLU、Hellaswag、AI2-ARCのベンチマークでは、生物学的な期待に沿った微妙ながら一貫性のあるパフォーマンスのバリエーションが示されている。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 22:26:42 GMT)
Entanglement Transfer in a Composite Electron-Ion-Photon System [0.0]
光イオン化における絡み合いは、電子イオン対から蛍光によって電子-光子対に転移される。時間分解されたフォン・ノイマンエントロピーは、粒子間の情報の共有方法を確立するために用いられる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:35:32 GMT)
Enhancing Interactive Voting-Based Map Matching: Improving Efficiency and Robustness for Heterogeneous GPS Trajectories [0.0]
本稿では,対話投票に基づくマップマッチングアルゴリズムの拡張版を提案する。主な目的は、入力データの品質によらず、高精度でGPS軌道を再構築することである。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:51:59 GMT)
Efficient Quantum Repeater with Single Atoms in Cavities [0.0]
本稿では,光子-原子ゲートに基づく効率的な絡み合い生成と絡み合いスワップを用いた量子リピータ方式を提案する。キャビティ内の10個の単一原子の多重化構成、数Hzから100sHzの秘密鍵レートは通信距離1000kmで達成できる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 22:42:16 GMT)
Effective Stimulus Propagation in Neural Circuits: Driver Node Selection [0.0]
ソース集団の最も中心的なニューロンのわずか10-20%を標的とした刺激は、スパイキングの伝播率を著しく向上させる。このアプローチは、重要なモジュール間接続密度における信号伝達効率を64倍に向上させる。これらの知見は、生物学的神経系および神経テクノロジー応用における精密神経調節の理論基盤を確立している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:00:36 GMT)
Effective Message Hiding with Order-Preserving Mechanisms [0.0]
StegaFormerはビット順序を保存し、モジュール間のグローバルな融合を可能にするように設計されたフレームワークである。 StegaFormerは、リカバリの正確性、メッセージキャパシティ、不可避性の点で、既存の最先端メソッドを超越している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:32:34 GMT)
Dynamical and Emission Properties of Quantum Emitters driven by Ultra-Short Laser Pulses [0.0]
高性能量子技術の開発は、高忠実度で固体エミッタの量子状態を作成する能力に依存している。共振型Rabi発振、断熱型ラピッドパス(ARP)、Notch-filtered ARPの3つの単一パルスコヒーレント制御プロトコルを理論的に比較した。以上の結果より,NARPは内因性スペクトル分離性と高忠実度断熱路とを一意に組み合わせていることが明らかとなった。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 01:24:04 GMT)
Distributed quantum computing with black-box subroutines [0.0]
任意の未知のサブルーチンに対応する分散量子コンピューティングのための汎用プロトコルを提案する。これはマルチチップ相互接続による量子コンピューティングのスケールアップに応用できる。我々は,このプロトコルを,現在利用可能な量子コンピューティングプラットフォームを用いて物理的に実装できることを実証した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:44:50 GMT)
Dissipation-Induced Steady States in Topological Superconductors: Mechanisms and Design Principles [0.0]
本研究では, 環境散逸場の影響を受けないマヨラナモードをホストするトポロジカル超伝導体について検討した。本稿では, 制御された散逸技術を用いて, トポロジカル超伝導体の変質定常状態を安定化する方法を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 06:15:20 GMT)
Dependence of the recoherence times and recoherence increments on the state of phonon bath in a single qubit dephasing model [0.0]
リコヒーレンス時間$t*$と、リコヒーレンスインクリメント$gamma_rm extr$の最大値について、単一量子デフォーカスモデルのバスパラメータの関数として検討する。レコヒーレンス/デコヒーレンスイベント(Recoherence/decoherence event, RDE)は、システム進化の初期段階で発生し、システムダイナミクスと大きく異なる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:14:02 GMT)
DSperse: A Framework for Targeted Verification in Zero-Knowledge Machine Learning [0.0]
DSperseは、暗号検証による分散機械学習推論のためのフレームワークである。複数の証明システムを用いてDSperseを評価し,メモリ使用量,実行時間,回路動作に関する実験結果を報告する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:42:28 GMT)
Convolutional Autoencoders for Data Compression and Anomaly Detection in Small Satellite Technologies [0.0]
小さな衛星技術は測地ミッションの可能性と実現可能性を高めた。オンサテライトデータ取得システムは機械学習(ML)の実装の恩恵を受けることができる本研究では、小型衛星のペイロードに実装するための畳み込みオートエンコーダを提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 16:48:43 GMT)
Comparison of D-Wave Quantum Annealing and Markov Chain Monte Carlo for Sampling from a Probability Distribution of a Restricted Boltzmann Machine [0.0]
制限ボルツマンマシン(RBM)のサンプリング品質評価における局所バレー中心のアプローチ古典的に訓練されたRBMのD-WaveおよびGibsサンプルは、対照的な発散に基づくRBM学習に関連する条件下で得られた。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 14:13:08 GMT)
Collaborating with AI Agents: Field Experiments on Teamwork, Productivity, and Performance [0.0]
私たちは、人間とAIエージェントが統合ワークスペースで協力できる実験プラットフォームであるPairitを紹介します。プラットフォーム上での大規模なマーケティング実験では、2310人の参加者がランダムに人間-AIチームと人間-AIチームに割り当てられた。チームは183,691件のメッセージを交換し、63,656件の画像編集、1,960,095件の広告編集、10,375件のAI生成画像を作成した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:18:44 GMT)
Can we Evaluate RAGs with Synthetic Data? [0.0]
本研究では,大規模言語モデルが生成する合成質問応答データが,そのようなデータが利用できない場合に,人間のラベル付きベンチマークの効果的なプロキシとして機能するかどうかを検討する。総合ベンチマークは、検索者構成の異なるRAGを確実にランク付けし、人間ラベルのベンチマークベースラインとよく一致していることがわかった。しかし、ジェネレータアーキテクチャの比較では、一貫したRAGランキングの生成に失敗している。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 18:07:47 GMT)
Calibrated and uncertain? Evaluating uncertainty estimates in binary classification models [0.0]
厳密な統計手法は、特に自然科学における科学的発見の妥当性を裏付けるものである。我々は、ベイズ近似の統一的枠組みと、慎重に生成された合成分類データセットの実証実験を併用する。アルゴリズムが、よく校正され、分布外データポイントの不確実性の増加を示すなど、一般的に望まれる特性を反映した不確実性推定を生成するかどうかを確認する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:17:32 GMT)
Bound State Internal Interactions as a Mechanism for Exponential Decay [0.0]
我々は、境界系の成分間の結合相互作用が系の状態に影響を与えると推測する。我々は、完全に指数関数的な非退化確率とフェルミの崩壊率に関する黄金律の両方を連続結合の極限から導いた。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 15:52:38 GMT)
BeeNet: Reconstructing Flower Shapes from Electric Fields using Deep Learning [0.0]
電場情報を復号化して環境特性を再構築できることを示す。本研究では,近傍の荷電蜂が生み出す電場から偏光性花の形状を推定できるアルゴリズムを開発した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 05:59:13 GMT)
Banking 2.0: The Stablecoin Banking Revolution -- How Digital Assets Are Reshaping Global Finance [0.0]
スタブルコインは、金本位制の廃止以来、銀行で最も重要な進化である。暗号通貨のイノベーションを従来の金融インフラとシームレスに統合する。この変革は、金融セクターにおける次の大きなディスラプターとして、人工知能に匹敵するものだ。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:05:16 GMT)
BaMANI: Bayesian Multi-Algorithm causal Network Inference [0.0]
我々は,単一アルゴリズムが因果的ネットワーク推論に与える影響を疎外するアンサンブル学習手法を開発した。本稿では,BaMANIと呼ばれる新しいソフトウェアツールの観点で,フレームワークの包括的な実装について述べる。生物学,特にヒト乳癌研究におけるBaMANIの使用例について述べる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:38:51 GMT)
Atomistic spin dynamics with quantum colored noise [0.0]
本稿では、量子補正された原子性スピンダイナミクスシミュレーションの包括的な実装について述べる。その結果、量子環境効果とカラーノイズを取り入れることで、ASDシミュレーションの予測能力が大幅に向上することが判明した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:34:35 GMT)
Anisotropic fluorescence signals retarded dipole-dipole interactions in a thermal atomic cloud [0.0]
希薄な熱カリウム蒸気からの蛍光における異方性多重量子コヒーレンス信号を実験的に観察し,理論的に説明する。実験スペクトルの定性的特徴を理論的に再現するための重要な要素として, 幾何学的に完全に解決された原子間共振双極子相互作用の遅延部分を同定した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 13:48:22 GMT)
An MLP Baseline for Handwriting Recognition Using Planar Curvature and Gradient Orientation [0.0]
本研究では,手書き文字認識のための多層パーセプトロンを駆動するには,2次幾何学的手がかりだけで十分かどうかを検討する。この3つの手作り特徴マップを入力として用い,MNIST桁で97%,EMNIST文字で99%の精度を実現した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:18:23 GMT)
An Exploratory Study on Crack Detection in Concrete through Human-Robot Collaboration [0.0]
本研究では,移動体ジャカルロボットプラットフォームに組み込まれたAI支援型視覚的き裂検出の有効性について検討した。実験結果から, HRCは検査精度を高め, 作業負荷を低減することが示唆された。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 11:13:07 GMT)
Allen: Rethinking MAS Design through Step-Level Policy Autonomy [0.0]
我々は,新しいマルチエージェントシステム (MAS) - 現在のMAS設計における2つの課題に対処するために設計されたアレンを導入する。タスク指向と実行指向の両方の観点からシステム動作を制約する4層状態アーキテクチャを構築しました。アレンは前例のない政策自律性を認め、協調構造の制御性のためにトレードオフを行う。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 08:02:34 GMT)
Adaptive Variance-Penalized Continual Learning with Fisher Regularization [0.0]
本研究は、パラメータ分散のフィッシャー重み付き非対称正規化を統合する、新しい連続学習フレームワークを提案する。本手法はパラメータの不確かさに応じて正規化強度を動的に変調し,安定性と性能を向上させる。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 21:49:28 GMT)
A solution of the quantum time of arrival problem via mathematical probability theory [0.0]
到着時刻とは、粒子が放出後、適切な理想化された検出器表面に衝突する時間を指す。到着時刻の対応する確率分布については、今のところ一般に受け入れられている解は存在しない。数学的確率論により理想的な検出器モデルを構築する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:02:52 GMT)
A non-Hermitian Su-Schrieffer-Heeger model with the energy levels of free parafermions [0.0]
我々は単位セル毎に$p$軌道を持つ自由フェルミオンに対して非エルミートモデルを生成する。グラフェンへのアプローチも適用し、単層グラフェンの平方根ハミルトニアンに$AA$スタックされた二層グラフェンが進化することを示した。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 17:11:24 GMT)
A general approach to quantum integration of cross sections in high-energy physics [0.0]
我々は、Quantinuumの量子MCIエンジンに実装されたフーリエ量子モンテカルロ積分(MCI)を利用する。我々は、古典的MCIに関して、ルート平均二乗誤差収束の2次高速化を提供する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:15:22 GMT)
A Remedy for Over-Squashing in Graph Learning via Forman-Ricci Curvature based Graph-to-Hypergraph Structural Lifting [0.0]
本稿では,エッジベースのネットワーク特性を定義するForman-Ricci曲率を用いた構造昇降戦略を提案する。曲線は、ネットワークのバックボーンのようなグラフの局所的および大域的特性を明らかにする。我々のアプローチは、長距離を横断するメッセージパッシングやグラフボトルネックにおける情報歪みの問題に対処する手段を提供する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 10:46:27 GMT)
$k$-nonseparability and $k$-partite entanglement criteria of multipartite quantum states [0.0]
マルチパーティの量子絡み合いは、量子科学と技術の進歩に不可欠である。本稿では,$k$-非分離性と$k$-パーティエンタングルメントを検出するための十分な基準を提案する。
論文参考訳（メタデータ） (Fri, 15 Aug 2025 09:06:12 GMT)