Fugu-MT: arxivの論文翻訳(概要)

Collaborative Temporal Consistency Learning for Point-supervised Natural Language Video Localization [129.4]
我々は,ビデオ言語アライメントを強化するために,新しいコラボラティブ・テンポラル・コンポジション・ラーニング(COTEL)フレームワークを提案する。具体的には、まずフレームとセグメントレベルの時間一貫性学習(TCL)モジュールを設計し、フレームサリエンシと文-モーメントペア間のセマンティックアライメントをモデル化する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 05:04:12 GMT)
SwinTextSpotter v2: Towards Better Synergy for Scene Text Spotting [121.4]
我々はSwinTextSpotter v2と呼ばれる新しいエンドツーエンドのシーンテキストスポッティングフレームワークを提案する。我々は,新しい認識変換モジュールと認識アライメントモジュールを用いて,2つのタスク間の関係を強化する。 SwinTextSpotter v2は、様々な多言語(英語、中国語、ベトナム語)のベンチマークで最先端のパフォーマンスを達成した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:20:49 GMT)
LoRA-Pro: Are Low-Rank Adapters Properly Optimized? [121.1]
LoRAとしても知られる低ランク適応は、基礎モデルのパラメータ効率の細かい調整のための顕著な手法として登場した。計算効率にもかかわらず、LoRAは完全な微調整に比べて性能が劣っている。低ランク行列の勾配を戦略的に調整することでLoRAの性能を向上させる手法であるLoRA-Proを導入する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 09:29:15 GMT)
Fractal-IR: A Unified Framework for Efficient and Scalable Image Restoration [108.8]
Fractal-IRを提案する。Fractal-IRはフラクタルベースの設計で、局所情報を広範囲に繰り返し拡張することで、劣化した画像を徐々に洗練する。このフラクタルアーキテクチャは、早期の局所的な詳細を自然に捉え、より深いフラクタル段階のグローバルな文脈へシームレスに遷移する。また,Fractal-IRは,高分解能,デノナイジング,JPEGアーティファクト除去,悪天候条件のIR,動きの鈍化,デフォーカスの鈍化,復調といった7つの一般的な画像修復作業において,最先端の性能を実現していることを示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 17:43:27 GMT)
NavCoT: Boosting LLM-Based Vision-and-Language Navigation via Learning Disentangled Reasoning [97.9]
Embodied AIの重要な研究課題であるVision-and-Language Navigation (VLN)は、自然言語の指示に従って複雑な3D環境をナビゲートするために、エンボディエージェントを必要とする。近年の研究では、ナビゲーションの推論精度と解釈可能性を改善することにより、VLNにおける大きな言語モデル(LLM)の有望な能力を強調している。本稿では,自己誘導型ナビゲーション決定を実現するために,パラメータ効率の高いドメイン内トレーニングを実現する,Navigational Chain-of-Thought (NavCoT) という新しい戦略を提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 11:04:36 GMT)
Algorithms for Weighted Pushdown Automata [96.3]
重み付きプッシュダウンオートマトン(WPDA)は多くの自然言語処理タスクの中核にある。 WPDA上で直接動作する新しいアルゴリズムを開発した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 14:02:33 GMT)
Multimodal 3D Reasoning Segmentation with Complex Scenes [92.9]
シーン内の複数のオブジェクトに対する3次元推論セグメンテーションタスクを提案することで,研究ギャップを埋める。 ReasonSeg3Dは3次元分割マスクと3次元空間関係と生成した質問応答対を統合したベンチマークである。さらに,複数のオブジェクトのクエリを扱う新しい3D推論ネットワークMORE3Dを設計する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 08:50:00 GMT)
Joint Transmit and Pinching Beamforming for Pinching Antenna Systems (PASS): Optimization-Based or Learning-Based? [89.1]
MISO (Multiple-input Single-output) フレームワークを提案する。それは複数の導波路で構成されており、多数の低コストアンテナ(PA)を備えている。 PAの位置は、大規模パスと空間の両方にまたがるように再構成することができる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 16:27:16 GMT)
Referring Camouflaged Object Detection [88.6]
Ref-COD は、特定のカモフラージュされたオブジェクトを、サルエントターゲットオブジェクトによる参照画像の小さなセットに基づいて分割することを目的としている。 R2C7Kと呼ばれる大規模なデータセットは、実世界のシナリオで64のオブジェクトカテゴリをカバーする7Kイメージで構成されています。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 14:12:57 GMT)
Don't Get Lost in the Trees: Streamlining LLM Reasoning by Overcoming Tree Search Exploration Pitfalls [83.9]
検証者による木探索アルゴリズムの最近の進歩は、大規模言語モデル(LLM)の推論能力を大幅に向上させた。検証者による木探索アルゴリズムの最近の進歩は、大規模言語モデル(LLM)の推論能力を大幅に向上させた。意味論的に等価なコンテンツを持つ冗長な状態による$textitover-Exploration$と、検証器のスコアリングにおける高いばらつきに起因する$textitunder-Exploration$である。各種木探索アルゴリズムに適合するフレキシブルなプラグアンドプレイシステムであるFETCHを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 09:25:06 GMT)
4D-Bench: Benchmarking Multi-modal Large Language Models for 4D Object Understanding [83.4]
4Dオブジェクトを理解する上でのMLLMの能力を評価するために、一般に標準化されたベンチマークは存在しない。 4Dオブジェクト理解におけるMLLMの能力を評価する最初のベンチマークである4D-Benchを紹介する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 17:55:53 GMT)
DiffusionRenderer: Neural Inverse and Forward Rendering with Video Diffusion Models [83.3]
逆レンダリングとフォワードレンダリングの二重問題に対処するニューラルアプローチであるDiffusionRendererを導入する。本モデルは,リライティング,素材編集,現実的なオブジェクト挿入など,単一のビデオ入力から現実的な応用を可能にする。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 20:49:08 GMT)
Set-Encoder: Permutation-Invariant Inter-Passage Attention for Listwise Passage Re-Ranking with Cross-Encoders [79.4]
クロスエンコーダモデルは、ポイントワイド、ペアワイド、リストワイドに分類される。本稿では,新たなクロスエンコーダアーキテクチャを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 09:54:45 GMT)
Rank-DistiLLM: Closing the Effectiveness Gap Between Cross-Encoders and LLMs for Passage Re-Ranking [79.4]
大規模言語モデル (LLM) から蒸留したクロスエンコーダは、手動でラベル付けされたデータに微調整されたクロスエンコーダよりも効果的であることが多い。このギャップを埋めるために、新しいデータセットである Rank-DistiLLM を作成します。 Rank-DistiLLMでトレーニングされたクロスエンコーダは、最大173倍高速で24倍のメモリ効率を実現している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 09:53:21 GMT)
VD3D: Taming Large Video Diffusion Transformers for 3D Camera Control [74.5]
制御ネットライクなコンディショニング機構を用いて3次元カメラ制御のためのトランスフォーマー映像の改ざん方法を示す。我々の研究は、トランスフォーマーに基づくビデオ拡散モデルのカメラ制御を可能にする最初のものである。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 15:40:42 GMT)
SeedVR: Seeding Infinity in Diffusion Transformer Towards Generic Video Restoration [73.7]
SeedVRは、任意の長さと解像度で現実世界のビデオ再生を処理するために設計された拡散トランスフォーマーである。合成ベンチマークと実世界のベンチマーク、AI生成ビデオで高い競争力を発揮する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 07:44:02 GMT)
MagicQuill: An Intelligent Interactive Image Editing System [73.5]
本稿では,創造的アイデアの迅速な実現を可能にする統合画像編集システムMagicQuillを紹介する。本システムでは,編集操作の明瞭化を図りつつ,機能的に堅牢なインタフェースを特徴とする。実験結果から,高画質画像編集におけるMagicQuillの有効性が示された。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 10:03:38 GMT)
ComfyGPT: A Self-Optimizing Multi-Agent System for Comprehensive ComfyUI Workflow Generation [71.3]
タスク記述に基づいてComfyUIを生成するように設計された,最初の自己最適化型マルチエージェントシステムであるComfyGPTを紹介する。 ComfyGPTは、ReformatAgent、FlowAgent、RefineAgent、ExecuteAgentの4つの特殊エージェントで構成されている。 FlowDatasetは、13,571のワークフロー記述ペアを含む大規模なデータセットであり、FlowBenchはワークフロー生成システムを評価するためのベンチマークである。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 06:48:50 GMT)
Deciphering Oracle Bone Language with Diffusion Models [70.7]
Oracle Bone Script (OBS) は約3,000年前の中国の上海王朝に由来する。本稿では,Oracle Bone Script Decipher(OBSD)の開発を通じて,画像生成技術を採用した新しいアプローチを提案する。 OBSDは、古代の言語のAI支援分析の新しいコースをグラフ化して、解読のための重要な手がかりを生成する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 03:03:33 GMT)
On the Minimax Regret of Sequential Probability Assignment via Square-Root Entropy [70.1]
側情報がない場合のミニマックス後悔は、逐次二乗根エントロピーの観点から上界化可能であることを示す。側情報を用いた逐次確率割当問題では,上記のエントロピーに基づいて上界と下界の両方を発達させる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 17:26:34 GMT)
Towards Invisible Backdoor Attack on Text-to-Image Diffusion Model [70.0]
テキストと画像の拡散モデルをターゲットにしたバックドア攻撃が急速に進んでいる。現在のバックドアサンプルは良性サンプルと比較して2つの重要な異常を示すことが多い。 Invisible Backdoor Attack (IBA) を提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 10:41:46 GMT)
Can LLMs Automate Fact-Checking Article Writing? [69.9]
我々は、一般的なファクトチェックパイプラインを拡張し、フルファクトチェック記事の自動生成の必要性を論じる。我々は,人間のファクトチェッカーの筆記ワークフローを模倣した LLM ベースのエージェントフレームワーク QRAFT を開発した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 07:56:50 GMT)
AC3D: Analyzing and Improving 3D Camera Control in Video Diffusion Transformers [66.3]
カメラの動きを第一原理の観点から分析し、正確な3Dカメラ操作を可能にする洞察を明らかにする。これらの知見を合成して、高度な3Dカメラ制御(AC3D)アーキテクチャを設計する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 15:32:50 GMT)
Bridging Continuous and Discrete Tokens for Autoregressive Visual Generation [63.9]
本稿では,離散トークンのモデリングをシンプルに保ちながら,連続トークンの強力な表現能力を維持するTokenBridgeを提案する。本稿では,各特徴次元を独立に離散化し,軽量な自己回帰予測機構と組み合わせた次元ワイド量子化戦略を提案する。提案手法は,標準的なカテゴリー予測を用いて,連続的手法と同等に再現および生成品質を実現する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 03:13:22 GMT)
Think Before Refusal : Triggering Safety Reflection in LLMs to Mitigate False Refusal Behavior [59.2]
本研究は, 応答発生前の安全反射の促進により, 虚偽の拒絶行動が軽減されることを実証する。 15種類の事前訓練モデルを対象としたアブレーション実験において, 安全性を考慮した微調整モデルでは, 誤検知の挙動が著しく低下することがわかった。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 23:35:49 GMT)
Omni-RGPT: Unifying Image and Video Region-level Understanding via Token Marks [59.1]
我々は、画像とビデオの両方の領域レベルの理解を容易にするために設計された大規模な言語モデルであるOmni-RGPTを提案する。視覚的特徴空間内の対象領域をハイライトするトークンセットであるToken Markを紹介した。また、大規模領域レベルのビデオインストラクションデータセット(VID-300k)も導入する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 09:03:54 GMT)
Where are we in audio deepfake detection? A systematic analysis over generative and detection models [59.1]
SONARはAI-Audio Detection FrameworkとBenchmarkの合成である。最先端のAI合成聴覚コンテンツを識別するための総合的な評価を提供する。従来のモデルベース検出システムと基礎モデルベース検出システムの両方で、AIオーディオ検出を均一にベンチマークする最初のフレームワークである。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 01:10:56 GMT)
DCEvo: Discriminative Cross-Dimensional Evolutionary Learning for Infrared and Visible Image Fusion [58.4]
赤外線および可視画像融合は、異なるスペクトルバンドからの情報を統合して画質を向上させる。既存のアプローチでは、画像融合とそれに続くハイレベルなタスクを別プロセスとして扱う。本稿では、視覚的品質と知覚精度を同時に向上させるDCEvoと呼ばれる識別的クロス次元進化学習フレームワークを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 07:01:58 GMT)
Understanding Inverse Reinforcement Learning under Overparameterization: Non-Asymptotic Analysis and Global Optimality [52.9]
我々のアルゴリズムは,特定のニューラルネットワーク構造の下で,最適報酬とポリシーを識別できることが示される。これは、国際的最適性を確実に達成する非漸近収束保証を持つ最初のIRLアルゴリズムである。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 21:16:08 GMT)
CODA: Repurposing Continuous VAEs for Discrete Tokenization [52.6]
textbfCODA(textbfCOntinuous-to-textbfDiscrete textbfAdaptation)は、圧縮と離散化を分離するフレームワークである。提案手法は,ImageNet 256$times$256ベンチマークにおいて,$mathbf0.43$と$mathbf1.34$を8倍,$16倍の圧縮で,100%のコードブック利用と注目すべき再構成FID(rFID)を実現している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:59:00 GMT)
GDRNPP: A Geometry-guided and Fully Learning-based Object Pose Estimator [51.9]
剛体物体の6次元ポーズ推定はコンピュータビジョンにおける長年の課題である。近年、ディープラーニングの出現は、信頼できる6Dポーズを予測するための畳み込みニューラルネットワーク(CNN)の可能性を明らかにしている。本稿では,完全学習型オブジェクトポーズ推定器を提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 08:50:38 GMT)
Dynamic Noise Preference Optimization for LLM Self-Improvement via Synthetic Data [51.6]
我々は、イテレーション間で一貫した改善を保証するために、動的ノイズ優先最適化(DNPO)を導入します。 Zephyr-7Bでの実験では、DNPOは既存の手法を一貫して上回り、平均性能は2.6%向上した。 DNPOは、GPT-4評価のベースラインに比べて29.4%のウィンロス率差で、モデル生成データの品質が大幅に向上したことを示している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 18:11:26 GMT)
Towards Transformer-Based Aligned Generation with Self-Coherence Guidance [51.4]
トランスフォーマーを用いたテキストガイド拡散モデル(TGDM)におけるアライメント向上のためのトレーニング不要アプローチを提案する。既存のTGDMは、特に複雑なテキストプロンプトやマルチコンセプト属性バインディングの問題を扱う場合、意味的に整合した画像を生成するのに苦労することが多い。本手法は,生成過程において,相互注意マップを直接最適化することにより,これらの課題に対処する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 07:03:57 GMT)
ReCap: Better Gaussian Relighting with Cross-Environment Captures [51.3]
ReCapは、目に見えない環境で正確な3Dオブジェクトのリライトを行うマルチタスクシステムである。具体的には、ReCapは共通の属性のセットを共有する複数の照明表現を共同で最適化する。これにより、相互の材料属性を囲むコヒーレントな照明表現の集合が自然に調和し、様々な物体の外観の共通点と相違点を利用する。合理化されたシェーディング機能と効果的な後処理とともに、ReCapは、拡張されたリライトベンチマークにおいて、主要な競合企業すべてを上回っている。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 17:51:51 GMT)
MTGS: Multi-Traversal Gaussian Splatting [51.2]
マルチトラバースデータは、道路ブロック内のシーン再構築のための複数の視点を提供する。任意に収集したマルチトラバーサルデータから高品質な運転シーンを再構成する新しい手法であるマルチトラバーサル・ガウス・スプラッティング(MTGS)を提案する。その結果、MTGSはLPIPSを23.5%改善し、幾何学的精度は46.3%向上した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 07:22:52 GMT)
Meta-Representational Predictive Coding: Biomimetic Self-Supervised Learning [51.2]
メタ表現予測符号化(MPC)と呼ばれる新しい予測符号化方式を提案する。 MPCは、並列ストリームにまたがる感覚入力の表現を予測することを学ぶことによって、感覚入力の生成モデルを学ぶ必要性を助長する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 22:13:14 GMT)
Aligning Foundation Model Priors and Diffusion-Based Hand Interactions for Occlusion-Resistant Two-Hand Reconstruction [51.0]
単眼画像からの両手再建は、複雑でダイナミックな手の位置や閉塞が原因で、永続的な課題に直面している。既存のアプローチはそのようなアライメントの問題に悩まされ、しばしば不整合と侵入の成果物をもたらす。本研究では,基礎モデルに基づく2次元先行モデルと拡散に基づく相互作用改善を組み込むことにより,手振りとインタラクションを正確に整合させる新しいフレームワークを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 14:42:27 GMT)
BackMix: Regularizing Open Set Recognition by Removing Underlying Fore-Background Priors [50.1]
オープンセット認識(OSR)は、実世界のアプリケーションのための未知のサンプルを検出しながら、既知のサンプルを分類するモデルを必要とする。既存の研究では、OSRモデルを正規化するために補助データセットから未知のサンプルを使用することで、驚くべき進歩が見られるが、それらは既知の外れ値を選択することに敏感であることが証明されている。本研究では,画像の前景と背景の異なる背景を混合し,背景の背景を除去する新しい手法であるBackMixを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 10:23:11 GMT)
ChatReID: Open-ended Interactive Person Retrieval via Hierarchical Progressive Tuning for Vision Language Models [49.1]
人物の再識別はコンピュータビジョンにおいて重要な課題であり、重複しないカメラビューを通して個人を認識することを目的としている。本稿では,テキストを優先した検索パラダイムに焦点を移し,フレキシブルかつインタラクティブな再識別を可能にする新しいフレームワークChatReIDを提案する。本稿では,人物属性の理解からきめ細かい画像検索,マルチモーダルタスク推論に至るまで,3段階のチューニングを通じてRe-ID能力を実現する階層的プログレッシブチューニング戦略を提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 11:13:15 GMT)
Sentinel: Multi-Patch Transformer with Temporal and Channel Attention for Time Series Forecasting [48.5]
トランスフォーマーに基づく時系列予測は、シーケンシャルデータをモデル化するトランスフォーマーの能力により、近年、強い関心を集めている。チャネル次元からコンテキスト情報を抽出できるエンコーダで構成されるトランスフォーマーベースのアーキテクチャであるSentinelを提案する。マルチパッチアテンション機構を導入し、パッチ処理を利用して入力シーケンスをトランスフォーマーアーキテクチャに自然に組み込むことができるように構成する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 06:01:50 GMT)
Large Deviation Upper Bounds and Improved MSE Rates of Nonlinear SGD: Heavy-tailed Noise and Power of Symmetry [47.7]
重み付き雑音の存在下での最適凸勾配法の枠組みを提供する。ステップサイズ・テールの非線形性,ノイズ,問題パラメータの選択に明示的に依存することを示す。 MSE $widetmathcalO(t-1)$ を最適な $mathcalO(t-1)$ に近づけることができる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 03:59:25 GMT)
LayerAnimate: Layer-level Control for Animation [46.7]
既存のアニメ生成ビデオ手法は、アニメーションを実際のビデオとは異なるデータ領域として扱い、層レベルでのきめ細かい制御を欠いている。本稿では,レイヤレベルの制御によるレイヤ操作を支援するレイヤ対応アーキテクチャを備えた,新しいビデオ拡散フレームワークであるLayerAnimateを紹介する。このフレームワークは、レイヤーレベルのアニメーションアプリケーションとクリエイティブな柔軟性の新しい可能性を開く。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 14:09:40 GMT)
RefCut: Interactive Segmentation with Reference Guidance [44.9]
RefCutは参照ベースのインタラクティブセグメンテーションフレームワークで、部分のあいまいさとオブジェクトのあいまいさに対処する。私たちのコードは公開され、デモビデオはhttps://www.lin-zheng.com/refcut.comで公開されます。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 17:14:20 GMT)
EXPLICATE: Enhancing Phishing Detection through Explainable AI and LLM-Powered Interpretability [44.3]
EXPLICATEは、三成分アーキテクチャによるフィッシング検出を強化するフレームワークである。既存のディープラーニング技術と同等ですが、説明性が向上しています。自動AIとフィッシング検出システムにおけるユーザ信頼の重大な隔たりに対処する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 23:37:35 GMT)
Every Sample Matters: Leveraging Mixture-of-Experts and High-Quality Data for Efficient and Accurate Code LLM [43.8]
Ling-Coder-Liteは、包括的なパフォーマンスと究極の効率を備えた、コード大言語モデルである。我々は、高品質なデータキュレーション手法とともに、効率的なMixture-of-Experts(MoE)アーキテクチャを活用する。 Ling-Coder-Liteは、同じサイズの最先端モデルと比較して、12の代表的なコーディングベンチマークでオンパーパフォーマンスを示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 15:00:18 GMT)
Deep learning framework for action prediction reveals multi-timescale locomotor control [42.0]
アーキテクチャに依存した試行を組み込んだ深層学習に基づく行動予測フレームワークを開発した。 GRUやTransformerのようなフレキシブルな入力履歴依存性を持つニューラルネットワークアーキテクチャは、全体的なパフォーマンスが良くなっています。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 20:22:39 GMT)
Multi-modality Anomaly Segmentation on the Road [40.0]
現在の一様異常セグメンテーションフレームワークは、画像中の非異常領域に対して高い異常スコアを生成する傾向にある。我々は自律運転システムのためのマルチモーダルな不確実性に基づく異常セグメンテーションフレームワークMMRAS+を開発した。実際、MMRAS+は自律運転のための最初のマルチモーダルな異常セグメンテーションソリューションである。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 09:55:42 GMT)
Detecting and Mitigating DDoS Attacks with AI: A Survey [39.5]
DDoS攻撃は、サイバーセキュリティ研究の活発な問題を表している。最近の研究は、静的なルールベースの防御からAIベースの検出と緩和へと移行した。手動の専門家階層とAI生成デンドログラムに基づく詳細な分類法が提供される。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 21:54:23 GMT)
Accelerating and enhancing thermodynamic simulations of electrochemical interfaces [37.0]
従来の表面Pourbaix図は専門家の知識に依存する傾向があるため、安定な表面構造を予測することは依然として困難である。機械学習(ML)ポテンシャルは静的モデリングを加速することができるが、しばしば動的表面変換を見落としている。ここでは, 電気化学的条件下でモデル化された表面再構成を自律的に試料化するために, 仮想表面サイト緩和法(Virtual Surface Site Relaxation-Mathrm3$(001)法を拡張した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 22:33:19 GMT)
MultiScale Contextual Bandits for Long Term Objectives [36.9]
マルチスケール政策学習のフレームワークを導入し、AIシステムが複数の時間スケールでフィードバックを実行し、最適化する必要があることを文脈的に理解する。我々は,MultiScale Off-Policy Bandit Learning (MSBL)を用いてフレームワークをインスタンス化し,レコメンダシステムとテキスト生成に関する3つのタスクにおいて,その有効性を示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 07:03:45 GMT)
On The Sample Complexity Bounds In Bilevel Reinforcement Learning [36.2]
二段階強化学習(BRL)は、生成的AIアライメントを研究するための強力な数学的枠組みとして登場した。 BRL に対する最初のサンプル複雑性結果を示し,エプシロン-4$ の限界を達成した。この結果は、標準的な二段階最適化問題にまで拡張され、実際的な意味に関する興味深い理論的な貢献をもたらす。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 04:22:04 GMT)
A Comprehensive Survey on Self-Interpretable Neural Networks [36.1]
自己解釈型ニューラルネットワークは、本質的にモデル構造を通して予測合理的性を明らかにする。まず、自己解釈型ニューラルネットワークに関する既存の研究を収集、レビューし、その方法論を構造化した概要を提供する。また、モデル説明の具体的、可視化された例を示し、その適用性について様々なシナリオで論じる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 03:32:46 GMT)
FundusGAN: A Hierarchical Feature-Aware Generative Framework for High-Fidelity Fundus Image Generation [35.5]
FundusGANは、高忠実度ファンドス画像合成用に特別に設計された新しい階層的特徴認識生成フレームワークである。我々は、FundusGANが複数のメトリクスにわたって最先端のメソッドを一貫して上回っていることを示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 18:08:07 GMT)
MOVIS: Enhancing Multi-Object Novel View Synthesis for Indoor Scenes [35.2]
MOVISは、多目的NVSのためのビュー条件拡散モデルの構造的認識を高めることを目的としている。本稿では,新しいビューオブジェクトマスクを同時に予測するためにモデルを必要とする補助タスクを提案する。提案手法は強力な一般化能力を示し,一貫した新規なビュー合成を生成する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:34:37 GMT)
On Zero-Initialized Attention: Optimal Prompt and Gating Factor Estimation [35.2]
LLaMA-Adapterは、学習の安定化と性能向上のためにゼロ次元の注意を生かし、LLaMAモデルの効率的な微調整技術として登場した。我々は厳密な理論解析を行い、ゼロ次元の注意とエキスパートの混合モデルとの接続を確立する。我々は、線形および非線形のプロンプトとゲーティング関数が最適に推定できることを証明し、非線形プロンプトは将来のアプリケーションにより大きな柔軟性を提供する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 06:05:33 GMT)
Photoluminescent colour centres on a mainstream silicon photonic foundry platform [34.8]
商用CMOS互換ファウントリーにおけるシリコンフォトニクス部品の製造は、通信の進歩、量子コンピューティング、人工知能に対するシリコンフォトニクスの影響に革命をもたらした。シリコンの間接バンドギャップは、基本的な課題をもたらすため、メインストリームのシリコンオン絶縁体プラットフォームは、効率的な光源を持っていない。近年、SOIの発光色中心は、チップ上の古典的および量子的光源を効率的に開発するための有望なアプローチとして現れている。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 01:58:12 GMT)
Simpler Diffusion (SiD2): 1.5 FID on ImageNet512 with pixel-space diffusion [34.7]
画素空間モデルは、品質と効率の両方において、潜在モデルと非常に競合することを示す。エンド・ツー・エンドのピクセル空間拡散モデルを高分解能に拡張するための簡単なレシピを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 19:42:20 GMT)
Safe RLHF-V: Safe Reinforcement Learning from Human Feedback in Multimodal Large Language Models [34.7]
汎用AIアシスタントの開発にはMLLM(Multimodal large language model)が不可欠である。差別、誤報、倫理基準違反などの望ましくない行動を防止するために、MLLMが安全に整列されていることをどうやって保証できるのか。安全性と安全性を共同で最適化する,初のマルチモーダル安全アライメントフレームワークであるSafe RLHF-Vを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 07:40:20 GMT)
DreamRelation: Bridging Customization and Relation Generation [34.2]
我々はDreamRelationを紹介した。DreamRelationは、慎重にキュレートされたデータセットを使用して、アイデンティティと関係学習をアンハングリングするフレームワークである。トレーニングデータには,関係固有画像,アイデンティティ情報を含む独立オブジェクト画像,関係生成をガイドするテキストプロンプトが含まれている。まず,関係に密接に結びついたオブジェクトのポーズを調整する際に,効果的にモデルを導くキーポイントマッチング損失を導入する。第二に、画像の局所的な特徴を取り入れることで、オブジェクトの区別をより良くし、重複するケースの混同を防止する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 01:52:56 GMT)
Breaking the SSL-AL Barrier: A Synergistic Semi-Supervised Active Learning Framework for 3D Object Detection [34.0]
従来のアクティブな学習アプローチは、データ選択の初期モデルをトレーニングするために、少量のラベル付きデータに依存しています。本稿では,S-SSALと呼ばれるSynergistic Semi-Supervised Active Learningフレームワークを提案する。 S-SSALは全データセットでトレーニングされたモデルに匹敵する性能が得られることを示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 13:53:31 GMT)
GS-LTS: 3D Gaussian Splatting-Based Adaptive Modeling for Long-Term Service Robots [33.2]
3D Gaussian Splatting (3DGS)は、ロボット工学において、鮮明で高忠実なシーン表現のために大きな注目を集めている。室内ロボットによる動的環境における多様なタスクの時間的管理を可能にする3DGSベースのシステムであるGS-LTSを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 11:26:47 GMT)
Be More Diverse than the Most Diverse: Optimal Mixtures of Generative Models via Mixture-UCB Bandit Algorithms [33.0]
ベンチマーク画像データセット上の生成モデルの混合は、実際により良い評価スコアを得ることができることを数値的に示す。そこで我々は,Mixture-UCBアルゴリズムを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 10:45:56 GMT)
StreamGS: Online Generalizable Gaussian Splatting Reconstruction for Unposed Image Streams [32.9]
本稿では,非ポーズ画像ストリームのための3DGS再構成手法であるStreamGSを提案する。 StreamGSは、画像ストリームを3Dガウスストリームに変換する。多様なデータセットの実験では、StreamGSは最適化ベースのアプローチと同等の品質を実現しているが、150倍高速であることが示された。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 09:27:02 GMT)
Efficient Self-supervised Vision Pretraining with Local Masked Reconstruction [32.7]
Local masked reconstruction (LoMaR) は、単純な Transformer エンコーダ上の 7$times$7 パッチの小さなウィンドウ内でマスク付き再構築を行う、シンプルだが効果的なアプローチである。 LoMaRはImageNet-1K分類で84.1%の精度に達し、MAEを0.5%上回った。 LoMaRは特に高解像度画像の事前訓練において効率が良く、例えば、MAEよりも3.1$times$速く、448$times$448画像の分類精度は0.2%高い。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 21:25:12 GMT)
A Temporal Modeling Framework for Video Pre-Training on Video Instance Segmentation [32.7]
我々は、VISモデルを強化するための新しいビデオ事前学習手法を提案する。私たちのイノベーションは、事前学習と微調整の段階の違いを減らすことに焦点を当てています。提案手法は,OVISデータセットの平均精度を4.0%向上させる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 07:01:25 GMT)
DVG-Diffusion: Dual-View Guided Diffusion Model for CT Reconstruction from X-Rays [32.6]
新しいビュー合成を取り入れた複雑な2次元X線画像から3次元CTマッピングを容易にし、ビュー誘導機能アライメントによる学習難度を低減する。具体的には,DVG拡散モデル (DVG-Diffusion) を提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 16:03:18 GMT)
Video Diffusion Transformers are In-Context Learners [31.7]
本稿では,ビデオ拡散変換器のコンテキスト内機能を実現するためのソリューションについて検討する。本稿では,テキスト内生成を利用するための簡単なパイプラインを提案する: (textbfii$) ビデオは,空間的あるいは時間的次元に沿って行われる。当社のフレームワークは,研究コミュニティにとって貴重なツールであり,製品レベルの制御可能なビデオ生成システムを進化させる上で重要な洞察を提供する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 08:53:33 GMT)
Smart Routing: Cost-Effective Multi-LLM Serving in AIOS [31.6]
既存のスケジューリングフレームワークは主にレイテンシの最適化をターゲットとしている。本稿では,マルチLLMサービスのための高効率能率協調スケジューリングフレームワークECCOSを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 20:12:27 GMT)
Towards Seamless Hierarchical Federated Learning under Intermittent Client Participation: A Stagewise Decision-Making Methodology [31.6]
Hierarchical Federated Learning (HFL)は、クライアントを複数のクラスタにまとめ、中間モデルアグリゲーションにエッジノードを使用する。 HFLに関する現在の研究は主に、安定した固定されたクライアントセットを持つシナリオにおけるモデル精度、レイテンシ、エネルギー消費の向上に焦点を当てている。本研究は, 断続的クライアント参加下でのHFLにおけるクライアント選択とクライアント間アソシエーションの最適化について検討する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 13:48:11 GMT)
ROCODE: Integrating Backtracking Mechanism and Program Analysis in Large Language Models for Code Generation [31.4]
大規模言語モデル(LLM)は、コード生成において素晴らしいパフォーマンスを達成した。 LLMはコード生成時にエラーの蓄積に影響を受けやすい。コード生成のためのLLMにバックトラック機構とプログラム解析を統合したROCODEを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 13:56:52 GMT)
LightLoc: Learning Outdoor LiDAR Localization at Light Speed [31.2]
シーン座標回帰は、屋外LiDARの局所化において印象的な結果を得るが、何日もトレーニングを必要とする。長いトレーニング時間によって、これらの方法は自律運転、ドローン、ロボット工学など、時間に敏感なアプリケーションには実用的ではない。光速で新たなシーンのローカライズを効率的に学習できる最初の方法であるLightLocを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 16:33:41 GMT)
RDTF: Resource-efficient Dual-mask Training Framework for Multi-frame Animated Sticker Generation [29.3]
制約のあるリソースの下では、より小さなビデオ生成モデルをスクラッチからトレーニングすることで、ダウンストリームアプリケーションでより大きなモデル上でパラメータ効率のチューニングより優れている。サンプルエントロピーを静的かつ適応的なコンポーネントに分解する難易度適応型カリキュラム学習法を提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 11:28:25 GMT)
Serial Low-rank Adaptation of Vision Transformer [29.3]
ローランク適応(ローランク適応、LoRA)は、この領域で確立された技術である。注目機構を組み込んだ共有低ランク行列直列合成を導入した新しいLoRA変種であるSerial LoRAを提案する。本研究では,トランス構造を用いた視覚基礎モデルの広範囲な実験を行い,その一貫した優位性を確認した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:20:02 GMT)
Building Resource-Constrained Language Agents: A Korean Case Study on Chemical Toxicity Information [28.6]
本稿では,これらの制限下で考案された韓国の化学毒性情報エージェントであるTox-chatについて述べる。本稿では,階層的な部分探索によるトークン消費を低減する文脈効率アーキテクチャと,シナリオベースの対話生成手法を提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:34:15 GMT)
How To Think About End-To-End Encryption and AI: Training, Processing, Disclosure, and Consent [28.5]
エンドツーエンド暗号化(E2EE)は、通信を保護するための金の標準となり、世界中の数十億のユーザに対して強力な機密性とプライバシ保証をもたらしている。 E2EEシステムを含む人工知能(AI)モデルの広範な統合に向けた動きは、深刻なセキュリティ上の懸念を提起している。この研究は、AIモデルとE2EEアプリケーションの互換性について批判的な検証を行います。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 18:40:59 GMT)
A Causal Adjustment Module for Debiasing Scene Graph Generation [28.4]
我々は、歪んだ分布間の因果関係をモデル化するために因果推論技術を用いる。提案手法により,ゼロショット関係の合成が可能となり,そのような関係を認識できるモデルの性能が向上する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 20:44:01 GMT)
A quantum gradient descent algorithm for optimizing Gaussian Process models [28.2]
ガウス過程モデルを最適化するための量子勾配降下アルゴリズムを提案する。本アルゴリズムは,ログ限界確率の勾配の計算において指数的高速化を実現する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 14:14:31 GMT)
InstructVEdit: A Holistic Approach for Instructional Video Editing [28.1]
InstructVEditは、信頼できるデータセットキュレーションワークフローを確立するフルサイクルのインストラクショナルビデオ編集アプローチである。時間的一貫性を維持しながら、編集品質を向上させるために、2つのモデルアーキテクチャの改善が組み込まれている。また、実世界のデータを活用して、一般化を強化し、列車とテストの相違を最小限に抑える反復的な改善戦略を提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 04:12:20 GMT)
The Federation Strikes Back: A Survey of Federated Learning Privacy Attacks, Defenses, Applications, and Policy Landscape [27.9]
フェデレートラーニング(FL)における異なるプライバシ攻撃と防御手法の文献レビューを行う。これらの攻撃の現在の制限を特定し、FLクライアントのプライバシが壊れる可能性のある設定を強調します。 FLは、参加者のプライバシーを維持しつつ、正確なモデルを生成するという大きな目標に向かっている。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 04:46:17 GMT)
DILA: Dictionary Label Attention for Mechanistic Interpretability in High-dimensional Multi-label Medical Coding Prediction [27.8]
医用符号化などの高次元・極端なマルチラベルの予測には、精度と解釈性の両方が必要である。本稿では,非解釈不能な密埋め込みをスパース埋め込み空間に切り離す機械的解釈可能性モジュールを提案する。当社のスパース埋め込みは、その密度の高い埋め込みよりも、少なくとも50%は人間に理解できることが示されています。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 20:42:20 GMT)
Beyond Label Attention: Transparency in Language Models for Automated Medical Coding via Dictionary Learning [27.8]
辞書の特徴は, モデル行動の把握や, 医学的に無関係なトークンの90%以上の隠された意味の解明に有効であり, 人間の解釈が可能であることを示す。辞書の特徴は, モデル行動の把握や, 医学的に無関係なトークンの90%以上の隠された意味の解明に有効であり, 人間の解釈が可能であることを示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 20:20:38 GMT)
Occlusion-aware Text-Image-Point Cloud Pretraining for Open-World 3D Object Recognition [27.7]
ゼロショット3Dオブジェクト認識を実現するためのテキストイメージポイントクラウド事前学習手法を提案する。点雲に適した2ストリーム線形状態空間モデルであるDuoMambaについても紹介する。私たちのフレームワークで事前トレーニングを行うと、DuoMambaは現在の最先端メソッドを超え、レイテンシとFLOPを削減します。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 06:09:33 GMT)
Odd-One-Out: Anomaly Detection by Comparing with Neighbors [27.5]
本稿では,シーン内の奇妙な物体を,現在ある物体と比較することによって識別することを目的とした,新たな異常検出(AD)問題を提案する。固定された異常基準を持つ従来のADベンチマークとは異なり、本タスクは通常のオブジェクトの参照グループを推定することにより、各シーン固有の異常を検出する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 08:52:52 GMT)
Reducing Class-wise Confusion for Incremental Learning with Disentangled Manifolds [27.4]
クラスインクリメンタルラーニング(CIL)は、モデルが古いクラスを忘れずに、新しいクラスを継続的に学習できるようにすることを目的としている。本研究では,CIL 用 Confusion-Reduced AuTo-Encoder 分類器 (CREATE) を開発した。提案手法は軽量なオートエンコーダモジュールを用いて,潜在部分空間の各クラスに対してコンパクトな多様体を学習する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 07:07:15 GMT)
Data Reconstruction Attacks and Defenses: A Systematic Evaluation [27.3]
再構築攻撃と防御は、機械学習におけるデータ漏洩問題を理解する上で不可欠である。本稿では,この問題を逆問題とみなし,理論的かつ体系的にデータ再構成攻撃を評価することを提案する。本報告では, 従来の防衛手法の強みに対する理解を深める上で有効な, 強力な再建攻撃を提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 03:29:27 GMT)
Samudra: An AI Global Ocean Emulator for Climate [27.2]
我々は、最先端の気候モデルにおける海洋成分のグローバルエミュレータを構築した。マルチディープスレベルの海洋データに基づいてトレーニングされた改良型ConvNeXt UNetアーキテクチャを使用する。海洋エミュレータ - Samudra は, 海洋変数の深さ構造と年次変動を再現できることを示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 00:03:21 GMT)
Hierarchy-Aware and Channel-Adaptive Semantic Communication for Bandwidth-Limited Data Fusion [27.0]
本稿では,帯域幅制限データ融合のための階層認識とチャネル適応型セマンティック通信手法を提案する。超解像に必要な画像の全体構造情報と詳細の両方を保持するために階層的相関モジュールを提案する。深い特徴と浅い特徴を動的に統合し,伝達するために,Transformerに基づくチャネル適応型アテンション機構を提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 14:02:52 GMT)
Hamiltonian Monte Carlo Inference of Marginalized Linear Mixed-Effects Models [26.5]
本研究では,線形混合効果モデルにおいて,ランダム効果を容易に除去するアルゴリズムを開発した。ナイーブアプローチは、ハミルトンモンテカルロ(HMC)のような推論アルゴリズムにおける立方的時間演算を導入する適用可能な場合の限界化は常に有益であることを示し、様々なモデルの改善を強調します。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 03:06:20 GMT)
GenDeg: Diffusion-based Degradation Synthesis for Generalizable All-In-One Image Restoration [26.4]
我々は,クリーンな画像上で多様な劣化パターンを生成できる条件拡散モデルGenDegを紹介する。我々は,550万点以上の試料を,ヘイズ,雨,雪,動きのぼやけ,低照度,雨滴の6種類に分けて合成した。実験の結果,GenDSデータセットでトレーニングした画像復元モデルは,アウト・オブ・ディストリビューション性能の大幅な向上を示した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 18:40:40 GMT)
Revisiting Outage for Edge Inference Systems [26.2]
本稿では,E2E推定精度が目標閾値を下回る確率を定量化する,推論停止(InfOut)確率を特徴付ける理論的枠組みを提案する。実験により,従来のコミュニケーション中心のアプローチよりも提案設計の方が優れていることが示された。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 13:10:27 GMT)
Free-Space Twin-Field Quantum Key Distribution [25.4]
本稿では,14.2km以上の大都市における自由空間TF-QKDの実証実験について報告する。繰り返し容量制限を超える秘密鍵レートを達成する。この研究は、衛星ベースのグローバル量子ネットワークへの重要な進歩を表している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:05:07 GMT)
MaIR: A Locality- and Continuity-Preserving Mamba for Image Restoration [24.7]
我々は,新しいマンバ画像復元モデル(MaIR)を提案する。 MAIRはNested S-shaped Scanning Strategy (NSS)とSequence Shuffle Attention Block (SSA)で構成されている。 NSSとSSAのおかげで、MaIRは14の挑戦的なデータセットにまたがって40のベースラインを越えた。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 09:30:06 GMT)
Erasing Conceptual Knowledge from Language Models [24.6]
言語記憶の消去(英語: Erasure of Language Memory, ELM)とは、イントロスペクティブな分類器によって定義された分布をマッチングする原理に基づいて構築された概念レベルのアンラーニングのアプローチである。 ELMはこのフレームワークを適用して、コンセプト固有のコンテンツの生成確率を低下させるローランクな更新をターゲットとする。 ELMのバイオセキュリティ、サイバーセキュリティ、および文学ドメイン消去タスクに対する効果を実証する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 04:42:36 GMT)
Diffusion-Aided Joint Source Channel Coding For High Realism Wireless Image Transmission [24.4]
DiffJSCCは条件拡散復調法により高現実性画像を生成する新しいフレームワークである。 768x512ピクセルのコダック画像を3072のシンボルで再現できる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 00:52:41 GMT)
LLMs as Planning Modelers: A Survey for Leveraging Large Language Models to Construct Automated Planning Models [24.2]
大規模言語モデル(LLM)は様々な自然言語処理に優れるが、長い水平計画問題に悩まされることが多い。この制限は、自動計画(AP)と自然言語処理(NLP)コミュニティにニューロシンボリックアプローチを統合することに関心を寄せている。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 03:35:44 GMT)
PTDiffusion: Free Lunch for Generating Optical Illusion Hidden Pictures with Phase-Transferred Diffusion Model [23.5]
隠れアート合成のための新しいトレーニングフリーなテキスト誘導画像変換フレームワークである textbfPhase-textbfTransferred textbfDiffusion Model (PTDiffusion) を提案する。 PTDiffusionは、入力参照画像をテキストプロンプトによって記述された任意のシーンに埋め込み、参照画像の隠れビジュアルキューを表示する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 03:56:42 GMT)
Generating Realistic, Diverse, and Fault-Revealing Inputs with Latent Space Interpolation for Testing Deep Neural Networks [23.0]
ARGUSは、現実的で多種多様でフォールトレベリングなテスト入力を生成するブラックボックス方式である。 ARGUSは、ターゲットデータセットに対する現実的で多様な敵のサンプルを生成するのに優れています。モデル再トレーニングに対向サンプルを使用することで、モデルの分類精度が向上する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 03:19:55 GMT)
Feather-SQL: A Lightweight NL2SQL Framework with Dual-Model Collaboration Paradigm for Small Language Models [23.0]
小型言語モデル(SLM)はNL2タスクと競合し、パフォーマンスが悪く、既存のフレームワークと互換性がない。 SLMに適した新しい軽量フレームワークであるFeather- Paradigmを紹介します。提案されたパラダイムは、SLMの精度の上限を54.76%に引き上げ、その有効性を強調している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 16:22:53 GMT)
GUI-Xplore: Empowering Generalizable GUI Agents with One Exploration [22.8]
GUI-Xploreは、クロスアプリケーションとクロスタスクの一般化を強化するために細心の注意を払って設計されたデータセットである。 GUI-Xploreのユニークな機能をフル活用するために,Action-aware GUI ModelingとGraph-Guided Environment Reasoningを組み合わせたGUIエージェントフレームワークであるXplore-Agentを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 09:30:37 GMT)
MotionDiff: Training-free Zero-shot Interactive Motion Editing via Flow-assisted Multi-view Diffusion [21.4]
MotionDiffは、複雑な多視点モーション編集に光フローを利用する、トレーニング不要なゼロショット拡散法である。これは、高品質な多視点一貫した運動結果を達成するために、他の物理学ベースの生成運動編集法よりも優れている。 MotionDiffは再トレーニングを必要としないので、ユーザは様々なダウンストリームタスクに便利に適応できる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 08:32:56 GMT)
Exploring Prosocial Irrationality for LLM Agents: A Social Cognition View [21.3]
大規模言語モデル(LLM)は、人間のバイアスを頻繁に含んでいるデータのために幻覚に直面することが示されている。幻覚特性を利用してLLMエージェントのソーシャルインテリジェンスを評価し,強化するオープンエンドマルチLLMエージェントフレームワークであるCogMirを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 14:15:47 GMT)
CountLLM: Towards Generalizable Repetitive Action Counting via Large Language Model [21.2]
繰り返しのアクションカウントは、フィットネス監視などのビデオ分析アプリケーションに有用である。我々は,ビデオデータと周期的テキストプロンプトを入力として取り出し,所望のカウント値を出力する,LLMに基づく最初の大規模言語モデルであるCountLLMを提案する。本研究では,周期性の特徴を記述し,整合性を確保するために標準化された応答形式を実装した命令のための周期性ベースの構造化テンプレートを開発する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 08:20:31 GMT)
OMR-Diffusion:Optimizing Multi-Round Enhanced Training in Diffusion Models for Improved Intent Understanding [21.1]
ループ内フィードバックを組み込んだビジュアルコ適応フレームワークを提案する。このフレームワークは拡散モデルを洗練するために複数の報酬関数(多様性、一貫性、嗜好フィードバックなど)を適用している。実験では、DALL-E 3(463勝)など、人間の評価において508勝を達成した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 06:10:57 GMT)
Linear Attention Modeling for Learned Image Compression [20.7]
実験により,VTM-9.1を15.26%,-15.41%,-17.63%,Kodak,CLIC,TecnickのBDレートで上回り,競合RD性能を実現した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 17:16:31 GMT)
Visual Variational Autoencoder Prompt Tuning [20.4]
本稿では,動的に入力に依存したプロンプトを生成する新しいフレームワークであるV$2$APT(Visual Variational Autoencoder Prompt Tuning)を紹介する。 FGVC, HTA, VTAB-1kベンチマークの実験により, 提案手法は最先端PEFT法より一貫して優れていることが示された。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 04:59:51 GMT)
Improving Preference Extraction In LLMs By Identifying Latent Knowledge Through Classifying Probes [20.2]
大規模言語モデル(LLM)は、しばしばテキストを評価するために自動判断器として使用される。本稿では,2つのプロンプト間の差異を利用して学習した線形分類プローブを用いて,潜在知識にアクセスし,より正確な選好を抽出する手法を提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:35:25 GMT)
BiMarker: Enhancing Text Watermark Detection for Large Language Models with Bipolar Watermarks [19.7]
既存の透かし技術は、低い透かし強度と厳しい偽陽性要件に苦しむ。ツールは生成されたテキストを正極と負極に分割し、追加の計算リソースを必要とせずに検出を強化する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 07:18:40 GMT)
VisEscape: A Benchmark for Evaluating Exploration-driven Decision-making in Virtual Escape Rooms [19.6]
私たちは、挑戦的な条件下でAIモデルを評価するために特別に設計された20の仮想エスケープルームのベンチマークであるVisEscapeを紹介します。 VisEscapeでは、最先端のマルチモーダルモデルでさえ一般的に部屋から逃れられず、進行と軌道のレベルにかなりの変化が見られる。本稿では,メモリ,フィードバック,ReActモジュールを効果的に統合したVisEscaperを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 05:06:18 GMT)
Enhancing Job Salary Prediction with Disentangled Composition Effect Modeling: A Neural Prototyping Approach [19.5]
雇用スキルが給与にどのような影響を及ぼすかを理解することは競争力のある給与制度による採用の促進と給与期待の調整に不可欠ですそこで本稿では,bftextLGDESetNet という,新しい説明可能なセットベースニューラルプロトタイピング手法を提案する。本手法は,給与予測における現状ベースラインよりも優れた性能を実現するとともに,給与影響パターンに関する説明可能な洞察を提供する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 03:28:19 GMT)
Towards Dynamic Trend Filtering through Trend Point Detection with Reinforcement Learning [19.5]
我々はマルコフ決定過程(MDP)として定式化されたトレンドポイント検出を提案する。我々はこれらの重要な点を動的トレンドポイント(DTP)と呼び、それらを補間することでトレンドを抽出する。 DTF-netは、他のトレンドフィルタリングアルゴリズムと比較して、急激な変化を捉えるのに優れていることを示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 02:52:18 GMT)
TDRI: Two-Phase Dialogue Refinement and Co-Adaptation for Interactive Image Generation [19.2]
I.I. (Two-Phase Dialogue Refinement and Co-Adaptation) は,反復的ユーザインタラクションによる画像生成の強化による課題に対処する。ユーザプロンプトに基づいてベースイメージを生成する初期生成フェーズと、3つの主要なモジュールを通じてユーザフィードバックを統合するインタラクティブリファインメントフェーズの2つのフェーズで構成されている。 I.I.は、クリエイティブおよび産業分野における幅広い応用の強い可能性を示している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 06:40:21 GMT)
1000 Layer Networks for Self-Supervised RL: Scaling Depth Can Enable New Goal-Reaching Capabilities [19.0]
自己教師付き学習のスケールアップは言語とビジョンのブレークスルーを加速させたが、強化学習(RL)では同等の進歩がいまだに残されている。本稿では,ネットワーク深度が重要な要素となる自己教師型RLの構築ブロックについて検討する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 22:24:37 GMT)
VectorPainter: Advanced Stylized Vector Graphics Synthesis Using Stroke-Style Priors [18.5]
本稿では,VectorPainterについて紹介する。提案手法は,まず参照画像の画素を一連のベクトルストロークに変換し,入力されたテキスト記述に基づいてベクトルグラフを生成する。生成過程を通してストロークのスタイルを保存するために,スタイル保存損失関数を導入する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 18:32:42 GMT)
Score matching through the roof: linear, nonlinear, and latent variables causal discovery [18.5]
観測データからの因果発見は、非常に有望である。既存の手法は根底にある因果構造に関する強い仮定に依存している。本稿では線形・非線形・潜在変数モデルにおける因果探索に適したフレキシブルアルゴリズムを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 11:26:14 GMT)
Threshold Adaptation in Spiking Networks Enables Shortest Path Finding and Place Disambiguation [18.0]
本研究は、任意の一方向スパイキングニューロングラフにおける活動バックトレースのメカニズムを提案する。スパイクタイミング依存性閾値適応(STDTA)により、スパイク階層時間記憶(S-HTM)の既存の再生機構を拡張した。また、あいまいさの少ない環境における場所を特定するためのあいまいさ依存しきい値適応(ADTA)を提案し、エージェントの局所化推定値を高める。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 03:18:44 GMT)
MUST: The First Dataset and Unified Framework for Multispectral UAV Single Object Tracking [18.0]
第1回大規模マルチスペクトルUAVシングルオブジェクト追跡データセット(MUST)について紹介する。 MUSTには、様々な環境と課題にまたがる250のビデオシーケンスが含まれている。また,スペクトルプロンプトからのスペクトル,空間,時間的特徴をエンコードする新しい追跡フレームワークUNTrackを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 08:47:28 GMT)
BOPO: Neural Combinatorial Optimization via Best-anchored and Objective-guided Preference Optimization [17.7]
Preference Optimization for Combinatorial Optimization (POCO) は、目的値を介してソリューションの選好を利用する訓練パラダイムである。 POCOはアーキテクチャに依存しないため、既存のNCOモデルとの統合を可能にし、最適化の原則として好みの最適化を確立する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 08:59:25 GMT)
On the Global Convergence of Risk-Averse Policy Gradient Methods with Expected Conditional Risk Measures [17.7]
リスクに敏感な強化学習(RL)は、不確実な結果のリスクを制御する一般的なツールとなっている。政策グラディエント(PG)法がリスクニュートラルな場合と同じグローバル収束を保証するかどうかは不明だ。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 19:54:15 GMT)
Bimodal Connection Attention Fusion for Speech Emotion Recognition [17.6]
効果的なバイモーダル音声感情認識システムを構築するために,バイモーダル接続注意融合法(BCAF)を提案する。 BCAFには、対話型接続ネットワーク、バイモーダルアテンションネットワーク、相関アテンションネットワークの3つの主要なモジュールが含まれている。 MELDとIEMOCAPデータセットの実験は、提案されたBCAFメソッドが既存の最先端ベースラインより優れていることを示した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 11:48:18 GMT)
Beyond Flat Text: Dual Self-inherited Guidance for Visual Text Generation [17.6]
現実のイメージでは、斜めまたは湾曲したテキスト、特に缶、バナー、バッジは、芸術的なデザインやレイアウトの制約により、平らなテキストのように頻繁に現れる。難易度の高いシナリオで視覚テキストを正確に生成する新しいトレーニングフリーフレームワークSTGenを導入する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 14:01:54 GMT)
Consistent Validation for Predictive Methods in Spatial Settings [17.4]
我々は、検証データが任意に密になるにつれて、検証が任意に正確になる検証方法を定式化する。本稿では,共変量シフト文学における既存の概念から構築する手法を提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 21:39:04 GMT)
MaskSAM: Towards Auto-prompt SAM with Mask Classification for Volumetric Medical Image Segmentation [17.3]
医用画像セグメンテーションのためのマスク分類プロンプトフリーフレームワークであるMaskSAMを提案する。本手法は,AMOS2022,90.52%のDice上での最先端性能を実現し,nnUNetに比べて2.7%向上した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 17:02:53 GMT)
V2P-Bench: Evaluating Video-Language Understanding with Visual Prompts for Better Human-Model Interaction [17.0]
LVLM(Large Vision-Language Models)は近年,映像理解の分野で大きな進歩を遂げている。現在のベンチマークはテキストに一様に依存しており、複雑な参照言語を必要とすることが多い。マルチモーダルなヒューマンモデルインタラクションシナリオにおけるLVLMの映像理解能力を評価するためのベンチマークであるVideo Visual Prompt Benchmark(V2P-Bench)を提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 11:30:46 GMT)
Normalized Matching Transformer [17.0]
画像のペア間の疎鍵点マッチングのための新しい手法を提案する。提案手法は,Sinkhornアルゴリズムとともにキーポイント対応を復号する正規化トランスフォーマデコーダと,特徴処理のためのSplineCNNグラフニューラルネットワークを組み合わせた完全深層学習に基づくアプローチからなる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 10:09:11 GMT)
Socially Beneficial Metaverse: Framework, Technologies, Applications, and Challenges [16.8]
メタバースの開発はまだ初期段階であり、これまではほとんど研究が行われていない。現実世界とは無関係の仮想世界として、メタバースはユーザーに様々な仮想活動を提供し、社会に大きな便宜をもたらす。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 20:01:28 GMT)
EfficientViM: Efficient Vision Mamba with Hidden State Mixer based State Space Duality [16.6]
隠れ状態ミキサーに基づく状態空間双対性(HSM-SSD)に基づく新しいアーキテクチャであるEfficient Vision Mambaを紹介する。隠れ状態の表現力を強化するために,多段隠れ状態融合を提案し,メモリバウンド操作によるボトルネックを軽減する設計を提案する。その結果、EfficientViMファミリはImageNet-1k上で新しい最先端のスピード精度トレードオフを実現し、より高速な第2世代モデルSHViTよりも最大で0.7%の性能向上を実現した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 02:46:19 GMT)
ULTra: Unveiling Latent Token Interpretability in Transformer-Based Understanding and Segmentation [14.8]
ULTraはトランスフォーマーの埋め込みを解釈し、意味のある意味的パターンを明らかにするためのフレームワークである。モデルを変更することなく外部変換行列を学習し,セグメンテーション性能を向上する自己教師型トレーニング手法を提案する。我々は、オブジェクト選択や解釈可能なテキスト要約を含む、合成シナリオと実世界のシナリオの両方において、モデル解釈のためのULTraを検証する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 19:54:49 GMT)
Lifelong Evolution of Swarms [14.8]
以前の知識を忘れずにタスクの変更に適応することは、インテリジェントシステムにとって重要なスキルである。本研究では,Swarmコントローラの個体群が動的環境下で進化する,生涯にわたるSwarmの進化的枠組みを紹介する。人口は過去の課題に関する情報を本質的に保存しており、それを再利用して適応を促進し、忘れを和らげることができる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 13:08:31 GMT)
FairFlow: Mitigating Dataset Biases through Undecided Learning [14.8]
言語モデルは、データ内のショートカットやスプリアス相関として知られる、データセットバイアスの傾向にある。 FairFlow'と呼ばれる新しいデバイアスフレームワークは、予測で未決定であることを学習することで、データセットのバイアスを軽減する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 03:35:51 GMT)
EqualizeIR: Mitigating Linguistic Biases in Retrieval Models [14.8]
既存の情報検索(IR)モデルでは、入力クエリの言語的複雑さに基づいた大きなバイアスが示される。我々は、IRモデルの言語バイアスを軽減するためのフレームワークであるEqualizeIRを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 03:24:34 GMT)
Co-op: Correspondence-based Novel Object Pose Estimation [14.6]
Co-opは、単一のRGB画像からトレーニング中に見えない物体の6DoFポーズを正確かつ堅牢に推定する新しい方法である。本手法では,対象オブジェクトのCADモデルのみを必要としており,追加の微調整を伴わずにそのポーズを正確に推定することができる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 11:24:19 GMT)
ShadowMaskFormer: Mask Augmented Patch Embeddings for Shadow Removal [14.0]
シャドウ除去に適した新しいパッチ埋め込みを備えたトランスフォーマーベースのフレームワークを提案する。本稿では,シャドウ情報の統合と,シャドウ領域の知識獲得を重視したモデルの構築を目的とした,シンプルで効果的なマスク拡張パッチ埋め込みを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:24:41 GMT)
RustMap: Towards Project-Scale C-to-Rust Migration via Program Analysis and LLM [13.6]
Rustは、Cのパフォーマンスを維持しながら、優れたメモリ安全性を提供する。 C2Rustのような既存の自動翻訳ツールは、構文的、テンプレートベースの翻訳に依存しすぎている可能性がある。本稿では,新しい依存誘導型大規模言語モデル (LLM) をベースとしたC-to-Rust変換手法であるRustMapを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 11:57:45 GMT)
Removing Structured Noise with Diffusion Models [13.5]
拡散モデルによる後方サンプリングの強力なパラダイムは、リッチで構造化されたノイズモデルを含むように拡張可能であることを示す。構成雑音による様々な逆問題に対して高い性能向上を示し、競争的ベースラインよりも優れた性能を示す。これにより、非ガウス測度モデルの文脈における逆問題に対する拡散モデリングの新しい機会と関連する実践的応用が開かれる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 21:39:08 GMT)
SynMorph: Generating Synthetic Face Morphing Dataset with Mated Samples [13.2]
そこで本研究では,2450のアイデンティティと100k以上の形態を持つ合成顔形態データセットを新たに生成する手法を提案する。提案する合成顔変形データセットは, 高品質なサンプル, 異種変態アルゴリズム, 単変態攻撃検出アルゴリズム, 差動変態攻撃検出アルゴリズムの一般化に特有である。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 17:21:22 GMT)
Implicit Image-to-Image Schrodinger Bridge for Image Restoration [13.1]
我々は,Imlicit Image-to-Image Schr"odinger Bridge (I$3$SB)を導入し,I$2$SBの生成過程をさらに加速する。 I$3$SB は生成過程を生成過程に初期劣化した画像を各生成段階に組み込むことで非マルコフフレームワークに再構成する。 I$2$SBと比較すると、I$3$SBはより少ない生成ステップで同じ知覚品質を達成しつつ、根本真実への忠実さを維持したり改善したりすることができる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 03:07:11 GMT)
mmCooper: A Multi-agent Multi-stage Communication-efficient and Collaboration-robust Cooperative Perception Framework [12.9]
mmCooperは、新しいマルチエージェント、マルチステージ、コミュニケーション効率、コラボロバストな協調認識フレームワークである。本フレームワークはエージェント間の情報共有のための中間段階と後期段階の情報をバランスさせ,コミュニケーション効率を維持しつつ知覚性能を向上させる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 07:42:31 GMT)
Non-Hermitian non-Abelian topological transition in the S=1 electron spin system of a nitrogen vacancy centre in diamond [12.9]
ダイヤモンド中の窒素空孔中心を用いた非エルミート非アーベリアトポロジカル遷移の原子スケールでの観測を報告する。我々はこの遷移の興味深い結果を実験的に明らかにし、これは3階の例外点の創出である。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 00:54:28 GMT)
SpecEval: Evaluating Code Comprehension in Large Language Models via Program Specifications [12.7]
プログラム仕様を用いて,大規模言語モデルにおけるコード理解を評価するためのSpecEvalを提案する。 4つの仕様関連タスクは、基本的なレベルから高度なレベルまでLLMの能力を評価するために慎重に設計されている。特に、4つの仕様関連タスクは、基本的なレベルから高度なレベルまでLLMの能力を評価するために慎重に設計されている。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 08:20:02 GMT)
ChatBench: From Static Benchmarks to Human-AI Evaluation [12.6]
我々は,MMLU質問をユーザAI会話に変換するためのユーザスタディを設計し,実施する。 AIのみの精度は、ユーザAIの精度を予測するのに失敗する。ユーザ-AIの会話を分析し、AI-aloneベンチマークからどのように分岐するかを洞察する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 01:21:40 GMT)
MEPNet: Medical Entity-balanced Prompting Network for Brain CT Report Generation [12.4]
医用エンティティバランス型プロンプトネットワーク(MEPNet)を提案する。 MEPNetは、大きな言語モデル(LLM)を利用して、様々なエンティティを適切に解釈し、正確な脳CTレポートを生成する。我々は2つの脳CTレポート生成ベンチマーク実験を行い、臨床精度とテキストコヒーレンスの有効性を示した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 14:31:30 GMT)
OmniScience: A Domain-Specialized LLM for Scientific Reasoning and Discovery [12.3]
一般科学のための専門的な大規模推論モデルであるOmniScienceを紹介する。我々は、分子を潜在的電解質溶媒または添加剤として効率よくランク付けする電池剤を開発した。我々は,ドメイン適応型事前学習と推論に基づく知識蒸留が性能レベルを達成するために重要であることをアブレーション実験で実証した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 01:18:59 GMT)
GPBench: A Comprehensive and Fine-Grained Benchmark for Evaluating Large Language Models as General Practitioners [12.2]
一般開業医(GP)は、継続的かつ包括的な医療サービスを提供することで、一次医療システムの基盤として機能する。実践のコミュニティ指向性、トレーニングの不均一さ、リソースギャップのため、GP間の臨床習熟度は地域や医療環境によって大きく異なる可能性がある。大言語モデル(LLM)は臨床および医学応用において大きな可能性を示しており、一般的な実践を支援するための有望なツールとなっている。 GPの日常業務においてLLMがいかに効果的に意思決定できるかを評価するため,GPBenchを設計した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 01:02:44 GMT)
Leveraging Audio Representations for Vibration-Based Crowd Monitoring in Stadiums [11.9]
ラベル付きクロスモダリティデータによる事前学習によりラベル付きデータへの依存性を低減する振動に基づくViLAを提案する。公開されているオーディオデータセットを活用することで、ViLAはオーディオから波動の振る舞いを学び、その表現を振動に適応させ、ドメイン固有の振動データへの依存を減らす。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 04:27:30 GMT)
RankByGene: Gene-Guided Histopathology Representation Learning Through Cross-Modal Ranking Consistency [11.8]
ランク付けに基づくアライメント損失を用いて、遺伝子と画像の特徴を整列する新しいフレームワークを提案する。そこで我々は,教師と学生のネットワークアーキテクチャを用いた自己指導型知識蒸留を用いて,アライメントの安定性をさらに向上させる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 06:41:14 GMT)
A Qualitative Study of User Perception of M365 AI Copilot [11.7]
2024年に当社で実施したM365 Copilotの6ヶ月の試験結果について報告する。この研究は、M365 Copilotの有効性、生産性への影響、期待の進化、倫理的懸念、全体的な満足度に対するユーザーの認識を調査した。 M365 コパイロットは特定の運用領域の価値を示したが、その広範な影響はユーザビリティの制限と人間の監視の必要性によって制限されたままであった。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 06:11:10 GMT)
Promoting Segment Anything Model towards Highly Accurate Dichotomous Image Segmentation [11.1]
Segment Anything Model (SAM)は、コンピュータビジョンの基礎モデルにおけるブレークスルーを表している。 SAMのゼロショット性能にもかかわらず、セグメンテーションマスクは細かな詳細を欠いている。本研究では,高精度なオブジェクトセグメンテーションに向けてSAMを前進させるDisdis-SAMを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 10:25:21 GMT)
Debunking the CUDA Myth Towards GPU-based AI Systems [10.7]
AIシステム設計におけるデファクトスタンダードであるNVIDIA A100とIntel Gaudi-2を比較した。 Gaudi-2はA100に匹敵するエネルギー効率を達成するが、ソフトウェア成熟度の観点からは注目すべき分野がある。ハイレベルなAIフレームワークへの効果的な統合によって、Gaudi NPUは、AIサーバ市場におけるNVIDIA GPUの優位性に挑戦する可能性がある、と私たちは結論付けています。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 02:32:17 GMT)
Enhancing Arabic Automated Essay Scoring with Synthetic Data and Error Injection [10.2]
AES(Automated Essay Scoring)は,言語学習者の文章の質評価,作業負荷の低減,リアルタイムフィードバックなどにおいて重要な役割を担っている。本稿では,Large Language Models (LLMs) と Transformer を利用して,AES のための合成アラビア語エッセイデータセットを生成する新しいフレームワークを提案する。提案手法は,3,040個の注釈付きエッセイのデータセットを提供する,リアルな人間のようなエッセイを生成する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 11:54:10 GMT)
good4cir: Generating Detailed Synthetic Captions for Composed Image Retrieval [10.2]
コンポジション画像検索(CIR)により、ユーザーは参照画像とテキスト修正を組み合わせることで画像を検索できる。高品質な合成アノテーションを生成するために視覚言語モデルを活用した構造化パイプラインである good4cir を導入する。その結果,パイプライン生成データセットに基づいてトレーニングしたCIRモデルの検索精度が向上した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 22:33:56 GMT)
RSNet: A Light Framework for The Detection of Multi-scale Remote Sensing Targets [10.1]
RSNetは、SAR画像における船舶検出を強化する軽量フレームワークである。 Waveletpool-ContextGuided (WCG)は、グローバルなコンテキスト理解を導くバックボーンである。ウェーブレットプール・スターフュージョン (WSF) は、残っているウェーブレット要素の乗算構造を用いてネックとして導入された。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 05:12:05 GMT)
BAMDP Shaping: a Unified Framework for Intrinsic Motivation and Reward Shaping [10.1]
擬似逆流付加による内因的動機づけと報酬形成誘導強化学習(RL)剤これらの振る舞いを予測し、有害な影響を限定できる幅広い基準を提供する理論モデルを提供する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 02:05:56 GMT)
Gaussian Splatting for Efficient Satellite Image Photogrammetry [10.0]
標準ガウススプラッティングフレームワークがリモートセンシングにどのように適応できるかを示す。これにより、最先端のパフォーマンスを数分で達成できます。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 13:05:56 GMT)
HiLoTs: High-Low Temporal Sensitive Representation Learning for Semi-Supervised LiDAR Segmentation in Autonomous Driving [9.9]
連続LiDARフレームから高時間感度および低時間感度表現を学習するHiLoTを提案する。その結果,提案したHiLoTsは最先端の半教師付き手法よりも優れていた。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:29:15 GMT)
Transferable Latent-to-Latent Locomotion Policy for Efficient and Versatile Motion Control of Diverse Legged Robots [9.8]
Pretrain-and-finetuneパラダイムは、新しいロボットエンティティやタスクに効率的に適応するための、有望なアプローチを提供する。本稿では,タスク固有の観察エンコーダやアクションデコーダとともに,移動可能な潜時移動ポリシーを事前訓練する潜時学習フレームワークを提案する。提案手法は広範囲なシミュレーションと実世界の実験により検証され、事前学習された潜伏移動政策が、効率を向上した新しいロボットエンティティやタスクに効果的に一般化できることが実証された。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 03:01:25 GMT)
Enhancing Fourier Neural Operators with Local Spatial Features [9.8]
入力データから直接局所空間特徴(LSF)を抽出する畳み込みニューラルネットワーク(CNN)プリプロセッサを導入する。本研究は,FNOの表現能力を向上し,PDEベンチマークの性能を著しく向上することを示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 15:11:56 GMT)
Poisson-Process Topic Model for Integrating Knowledge from Pre-trained Language Models [9.5]
事前学習したLLMを用いて、各文書を単語埋め込みのシーケンスに変換する。この列はポアソン点過程としてモデル化され、その強度測度は、それぞれトピックに対応する$K$基底測度の凸結合として表される。本稿では,従来のトピックモデリング手法を統合したフレキシブルアルゴリズムを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 16:19:04 GMT)
Enhancing Retrieval Systems with Inference-Time Logical Reasoning [9.5]
本稿では,論理的推論を検索プロセスに明示的に組み込む新しい推論時間論理的推論フレームワークを提案する。提案手法は,自然言語クエリから論理的推論構造を抽出し,個々のコサイン類似度スコアを合成して最終文書スコアを定式化する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 20:40:18 GMT)
Process Optimization and Deployment for Sensor-Based Human Activity Recognition Based on Deep Learning [9.4]
本稿では,マルチアテンションインタラクションを中心とした包括的な最適化プロセスを提案する。我々は、アブレーション研究、関連する作業の比較、組み込みデプロイメントを含む3つの公開データセットで広範なテストを行います。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 16:48:16 GMT)
Infighting in the Dark: Multi-Label Backdoor Attack in Federated Learning [9.4]
プライバシ保護のための分散機械学習フレームワークであるFederated Learning(FL)は、バックドア攻撃に対して脆弱であることが示されている。我々は、攻撃者が効果的で永続的なバックドアをグローバルモデルに注入できる、FLで初の非協調的MBA戦略であるMirageを提案する。 Mirageは様々な最先端の攻撃に優れ、既存の防衛をバイパスし、平均的なASRを97%以上達成し、900ラウンドの後に90%以上を維持している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 05:51:50 GMT)
LLM+KG@VLDB'24 Workshop Summary [9.3]
大規模言語モデル(LLM)と知識グラフ(KG)がホットトピックとして浮上している。 LLM+KG'24ワークショップは、中国広州で行われたVLDB 2024と共同で開催され、重要なデータ管理の課題と機会について検討した。本報告では,ワークショップでさまざまな講演者が提示した主な方向性とアプローチについて概説する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 20:58:34 GMT)
Topology preserving Image segmentation using the iterative convolution-thresholding method [9.3]
本稿では, 反復的畳み込み保持法(ICTM)にトポロジ保存制約を導入する。実験により,対象物体のトポロジ特性を明示的に保存することにより,精度とロバスト性を向上することを示した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 14:59:15 GMT)
A Physics-informed Machine Learning-based Control Method for Nonlinear Dynamic Systems with Highly Noisy Measurements [9.2]
本研究では, 非線形力学系に対する物理インフォームド機械学習に基づく制御手法を提案する。提案手法は, モデル精度と制御性能の両面から, 最先端のベンチマークよりも優れていた。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 21:47:19 GMT)
Efficiency is Not Enough: A Critical Perspective of Environmentally Sustainable AI [9.1]
我々は、MLをより環境に持続可能なものにするために、効率性を超えて目を向けるべき時だと論じている。本稿では,MLの効率と環境持続可能性に影響を及ぼす変数の相違点を3つ提示する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 10:02:59 GMT)
Relation Extraction with Instance-Adapted Predicate Descriptions [9.0]
関係抽出は、知識発見や質問応答といった下流の応用において重要な役割を果たしている。本稿では, コントラストとクロスエントロピーの損失を伴う新しいデュアルエンコーダアーキテクチャを用いて, このような小型モデルを微調整する。提案手法は, 単純だがエレガントな定式化を施した最先端手法に対して, 1%から2%のスコア改善を実現した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 15:36:41 GMT)
We're Calling an Intervention: Exploring Fundamental Hurdles in Adapting Language Models to Nonstandard Text [9.0]
非標準テキストへの言語モデル適応の根底にある課題を理解するための一連の実験を提示する。我々は、ユーザ生成テキストの中核的な特徴と、既存の言語モデルのバイアスとの相互作用を近似する介入を設計する。非標準テキスト変種への言語モデル適応における介入の適用により、そのような適応がいつ成功したかについて重要な洞察を得る。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 21:08:23 GMT)
Guidance Free Image Editing via Explicit Conditioning [8.8]
これを実現するために入力モード上の雑音分布の明示的条件付け(EC)を行う。画像編集タスクの評価を行い,EC が CFG より優れていることを示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 00:44:23 GMT)
Linear Partial Gromov-Wasserstein Embedding [8.2]
Gromov-Wasserstein(GW)問題は、機械学習とデータサイエンスコミュニティへの関心が高まっている。 PGW問題に対する線形化埋め込み手法であるGromov-Wasserstein埋め込みを提案する。古典的 OT 問題に対する線形化手法と同様に、LPGW が計量測度空間の有効な計量を定義することを証明している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 19:53:49 GMT)
LEMIX: Enabling Testing of Embedded Applications as Linux Applications [8.1]
LEMIXは、ハードウェア依存から切り離されたx86 Linuxアプリケーションとして再ホストすることで、組み込みアプリケーションの動的解析を可能にするフレームワークである。組込みアプリケーションをLinuxアプリケーションに変換する際の課題に対処する様々な技術を開発した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 00:14:47 GMT)
GOAL: Global-local Object Alignment Learning [7.9]
CLIPのようなビジョン言語モデルは、画像とテキストを整列する素晴らしい機能を示している。短いキャプションと簡潔なキャプションに焦点が当てられているため、長い詳細な文章の記述に苦しむことが多い。本稿では,CLIPの長文処理能力を高める新しい微調整手法であるGOALを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 14:27:32 GMT)
Enhancing Persona Consistency for LLMs' Role-Playing using Persona-Aware Contrastive Learning [7.8]
モデルロールプレイング行動を調整するために,textbfunderlinePersona-Aware textbfunderlineContrastive textbfunderlineLearning (PCL) という新しいフレームワークを提案する。自動評価法と人手による評価では,PCLはバニラLLMよりも有意に優れていた。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 06:12:34 GMT)
Progressive Prompt Detailing for Improved Alignment in Text-to-Image Generative Models [7.7]
SCoPE (Scheduled of Coarse-to-fine Prompt Embeddings) を提案する。詳細な入力プロンプトが与えられたら、まずそれを複数のサブプロンプトに分解し、広いシーンレイアウトの記述から高度に複雑な詳細へと進化させる。推論中、これらのサブプロンプト間を補間し、生成した画像によりきめ細かな詳細を徐々に導入する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 15:05:21 GMT)
X2I: Seamless Integration of Multimodal Understanding into Diffusion Transformer via Attention Distillation [7.6]
本稿では,Diffusion Transformer (DiT) モデルに様々なモダリティを理解する能力を備えた X2I フレームワークを提案する。 X2Iは,マルチモーダル理解能力を有しながら,1%未満の性能低下を示した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 07:28:50 GMT)
Fingerprinting Implementations of Cryptographic Primitives and Protocols that Use Post-Quantum Algorithms [7.4]
我々はキー交換とデジタル署名プリミティブを解析し,フィンガープリント後量子(PQ)アルゴリズムの実現可能性を評価する。プロトコルレベルの分析では、PQキー交換の存在とタイプを検出することができる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 18:00:21 GMT)
Not All LLM-Generated Data Are Equal: Rethinking Data Weighting in Text Classification [7.4]
本研究では,合成データと実世界の分布を協調する効率的な重み付け手法を提案する。複数のテキスト分類タスクにおいて,提案手法の有効性を実証的に評価した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 17:19:57 GMT)
NaFM: Pre-training a Foundation Model for Small-Molecule Natural Products [7.1]
微生物、動物、植物からの代謝物などの天然物は多様な生物活性を示す。既存の製品研究のためのディープラーニング手法は、特定の下流タスク用に設計された教師付き学習アプローチに依存している。我々は,その特質に基づいた天然物の基盤モデルを事前学習した。本フレームワークは, 天然物採掘や薬物発見に関連する下流業務において, 最先端のSOTA(State-of-the-art)を実現する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 05:32:03 GMT)
Eye Gaze as a Signal for Conveying User Attention in Contextual AI Systems [6.9]
マルチモーダルAIシステムは、ユーザーとシステムの間の明示的な通信チャネルに依存している。エージェントにユーザーの注意を伝達するウェアラブルアイトラッキングの可能性を探る。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 17:21:56 GMT)
Multi-Modality Representation Learning for Antibody-Antigen Interactions Prediction [6.7]
グラフアテンションネットワークを利用してグラフレベルの構造特徴を照らし、正規化適応グラフ畳み込みネットワークを用いて抗体間の配列関係を捕捉するAAI予測フレームワークであるMuLAAIPを提案する。以上の結果から, MuLAAIP は現在の最先端手法よりも予測性能に優れていたことが示唆された。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 06:23:51 GMT)
Learning-based 3D Reconstruction in Autonomous Driving: A Comprehensive Survey [6.7]
学習に基づく3D再構成は、自律運転におけるトランスフォーメーション技術として登場した。我々は近年の進歩を多視点で詳細に分析する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 02:26:04 GMT)
OvercookedV2: Rethinking Overcooked for Zero-Shot Coordination [6.6]
オーバークッキングにおけるZSC課題の起源について検討する。我々は、未知のパートナーとペアを組む際に遭遇する可能性のある状態を、トレーニングディストリビューションに混合する状態拡張機構を導入する。本アルゴリズムは,Overcookedにおいて,独立に訓練されたエージェントが正常に動作することを示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 17:14:24 GMT)
Near-Polynomially Competitive Active Logistic Regression [6.6]
能動的学習は受動的学習と比較して指数関数的に少ないラベルクエリを必要とすることはよく知られている。入力毎に最適なアルゴリズムと競合する最初のアルゴリズムを示す。我々のアルゴリズムは効率的なサンプリングに基づいており、より一般的な関数のクラスを学習できるように拡張することができる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 23:43:20 GMT)
Robust Blind Channel Estimation for Bursty Impulsive Noise with a Constrained EM Approach [6.3]
電源装置によって発生するインパルスノイズ(IN)は、無線受信機の性能を著しく低下させる。本稿では,バーストINの影響を考慮した予測最大化(EM)アルゴリズムに基づくブラインドチャネル推定手法について検討する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 07:39:21 GMT)
EMPLACE: Self-Supervised Urban Scene Change Detection [6.3]
都市景観変化検出(Urban Scene Change Detection, USCD)は、コンピュータビジョンによる街路景観の変化を捉えることを目的としている。我々は、視覚変換器を訓練する自己監督方法EMPLACEとともに、1.1M以上の画像で最大のUSCDデータセットであるAC-1Mを紹介した。アムステルダムのケーススタディでは、市内の小さな変化と大きな変化の両方を検知でき、EMPLACEによって発見された変化は、サイズによって住宅価格と相関していることを示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 10:20:43 GMT)
Momentum-Resolved Probing of Lorentz-Violating Dispersion Relations via Unruh-DeWitt Detector [6.0]
修正分散関係$omega_|textbfk|$を用いてローレンツ対称性違反を探索する。分散関係に対するエネルギー依存的な修正を探索するために、Unruh-DeWitt検出器を用いる。この解析により、線形分散関係からの偏差がウンルー効果の熱特性を阻害する一方、摂動変化は低エネルギーで熱性を保っていることが明らかとなった。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:43:49 GMT)
Efficient Diffusion Training through Parallelization with Truncated Karhunen-Loève Expansion [5.8]
拡散認知モデルは、トレーニング中に緩やかな収束に苦しむ。本稿では,トレーニングとサンプリングのための新しい前向きプロセスを提案する。本手法はベースライン拡散モデルより有意に優れている。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 05:34:02 GMT)
GaussianFocus: Constrained Attention Focus for 3D Gaussian Splatting [5.8]
3D Gaussian Splatting技術は、最高レベルのレンダリング品質と効率を提供する。しかし、この手法はあらゆる訓練の観点で過度に過度にノイズを発生させる傾向がある。我々はGaussianFocusを紹介した。GaussianFocusは、パッチアテンションアルゴリズムを取り入れてレンダリング品質を改良する革新的なアプローチである。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 15:18:23 GMT)
The Limits of Assumption-free Tests for Algorithm Performance [5.7]
与えられたモデリングタスクにおいてアルゴリズムはどの程度うまく機能し、どのアルゴリズムが最善を尽くすか? 一方、特定のトレーニングデータセットに対して$A$を実行して生成された特定の適合モデルが$n$であるのか?
論文参考訳（メタデータ） (Sat, 22 Mar 2025 21:51:23 GMT)
Privacy-Preserving Federated Learning with Differentially Private Hyperdimensional Computing [5.7]
プライバシー保護型フェデレーションハイパー次元コンピューティング(FedHDPrivacy)を提案する。 FedHDPrivacyは、学習ラウンド全体で累積ノイズを監視し、プライバシー制約を満たすために必要な追加ノイズのみを追加する。 FedHDPrivacyは、製造プロセスの監視のための現実世界のアプリケーションであり、標準的なFLフレームワークを超越しながら高性能を維持している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 04:10:19 GMT)
Satisfactory Medical Consultation based on Terminology-Enhanced Information Retrieval and Emotional In-Context Learning [5.7]
本稿では,TEIR と EICL の2つの主要なモジュールからなる,医療相談のための新しい枠組みを提案する。 TEIRは、公開データベースにおける制限されたドメイン知識の制限を克服し、帰納的知識とキー検索用語の利用による暗黙の推論を保証する。 EICLモジュールは、意味と属性情報をラベルのないコーパスから記憶することで、属性関連性の高い文を生成するのに役立つ。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 23:01:07 GMT)
ClaraVid: A Holistic Scene Reconstruction Benchmark From Aerial Perspective With Delentropy-Based Complexity Profiling [5.6]
既存のデータセットの制限を克服するために特別に設計された合成空中データセットであるClaraVidを紹介する。 4032x3024で撮影された16,917枚の高解像度画像と、さまざまな風景の様々な視点から合成されたクララヴィッドは、密集した深度マップ、汎視的セグメンテーション、スパースポイント雲、動的物体マスクを提供する。神経再建をさらに進めるために,DSP(Delentropic Scene Profile)を導入する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 20:26:20 GMT)
LAYOUTDREAMER: Physics-guided Layout for Text-to-3D Compositional Scene Generation [5.4]
テキストによる高品質で物理的に一貫した構成シーン生成を容易にするために,3Dガウススプラッティング(3DGS)を利用するフレームワークを提案する。具体的には、テキストプロンプトが与えられた場合、シーングラフに変換し、初期構成型3Dガウスの密度とレイアウトを適応的に調整する。シーングラフから指示された依存関係を抽出することにより、現実性と柔軟性の両方を確保するために、物理的およびレイアウトエネルギーを調整します。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:12:36 GMT)
Unraveling Pedestrian Fatality Patterns: A Comparative Study with Explainable AI [5.2]
この研究は、歩行者の死亡に寄与する重要な要因を特定するために、説明可能な人工知能(XAI)を用いている。以上の結果から, 年齢, アルコール, 薬物使用量, 場所, 環境条件が歩行者死亡率の予測因子であることを示唆した。発見によると、中ブロックの場所や視界の悪い地域では歩行者の死亡が一般的であり、高齢者や物質不足の人はリスクが高い。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 02:44:41 GMT)
Decentralized Federated Dataset Dictionary Learning for Multi-Source Domain Adaptation [5.0]
分散マルチソースドメイン適応(DMSDA)は難しい課題です。私たちの仕事は、完全に分散化されたフェデレーションアプローチによってDMSDAに取り組みます。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 07:48:48 GMT)
Open Models, Closed Minds? On Agents Capabilities in Mimicking Human Personalities through Open Large Language Models [4.7]
この研究は、オープンLLMのレンズを通して、NLPと人間の心理学の密接な関係を理解するための一歩である。提案手法は,オープンLLMエージェントの本質的な性格特性を評価し,これらのエージェントが人格を模倣する程度を判断する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 22:45:12 GMT)
Deriving the non-perturbative gravitational dual of quantum Liouville theory from BCFT operator algebra [4.7]
我々は,Louville CFTの経路積分を,適切な境界条件を満たす三次元経路積分として表現できることを示す。これは、既知の不合理 CFT を正確な量子重力解釈で再現する、正確なホログラフィックテンソルネットワークの最初の例である。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 18:33:31 GMT)
Planning and Learning in Average Risk-aware MDPs [4.7]
我々はリスクニュートラルアルゴリズムを拡張し、より一般的なリスク対策のクラスに対応する。 RVIアルゴリズムとQラーニングアルゴリズムの両方が最適性に収束することが証明されている。弊社のアプローチは、エージェントの複雑なリスク認識に微調整されたポリシーの特定を可能にする。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 03:18:09 GMT)
Causality-oriented robustness: exploiting general noise interventions [4.6]
本稿では因果性指向のロバスト性に着目し,不変勾配(DRIG)を用いた分布ロバスト性を提案する。 DRIGはトレーニングデータにおける一般的なノイズ介入を利用して、目に見えない介入に対する堅牢な予測を行う。我々のフレームワークには特別なケースとしてアンカー回帰が含まれており、より多様な摂動から保護される予測モデルが得られることを示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 15:37:46 GMT)
NVBleed: Covert and Side-Channel Attacks on NVIDIA Multi-GPU Interconnect [4.6]
このようなシステムの相互接続が新たなリーク源となり,新たな種類の隠蔽攻撃やサイドチャネル攻撃を可能にするかどうかを考察する。我々はBlender内でアプリケーションフィンガープリントと3Dグラフィックキャラクタ識別を含む2つのエンドツーエンドのクロスGPUサイドチャネル攻撃を開発した。また、Google Cloud Platform上の仮想マシン間で、突然リークが発生することもわかりました。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 19:52:02 GMT)
Active management of battery degradation in wireless sensor network using deep reinforcement learning for group battery replacement [4.5]
無線センサネットワーク(WSN)は、構造健康モニタリング(SHM)のための有望なソリューションとなっているバッテリー駆動のWSNは有線システムに対して様々な利点があるが、バッテリー寿命の制限は常にWSNの実用化における最大の障害の1つだ。本研究では,WSNのデューティサイクルをシステムレベルで最適化することにより,アクティブな電池劣化管理のための深層強化学習(DRL)手法について検討する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 20:21:34 GMT)
Polymer: Development Workflows as Software [4.3]
ソフトウェア開発をソフトウェア(高分子)として書くことで、開発の初期段階をさらに自動化できることを示す。ボルボでポリマーを採用することで、開発と展開に2ヶ月のコストで2--3 FTEを節約した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 07:18:44 GMT)
MAMAT: 3D Mamba-Based Atmospheric Turbulence Removal and its Object Detection Capability [4.2]
我々は,新しいマンバ型3次元マンバ型大気乱流除去法(MAMAT)を導入する。第1モジュールは変形可能な3D畳み込みを利用して非剛体登録を行い、空間シフトを最小限に抑え、第2モジュールはコントラストとディテールを高める。実験では、MAMATは最先端の学習ベースの手法より優れており、視覚的品質が最大3%向上し、物体検出が15%向上している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 08:48:53 GMT)
Leveraging Multi-modal Representations to Predict Protein Melting Temperatures [4.1]
我々はESM-2、ESM-3、AlphaFoldなどの強力なタンパク質言語モデルに基づくモデルを開発する。我々は、s571テストデータセット上で新しい最先端性能を求め、ピアソン相関係数(PCC)0.50を得る。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 23:01:55 GMT)
Bias Evaluation and Mitigation in Retrieval-Augmented Medical Question-Answering Systems [4.0]
本研究は、複数のQAベンチマークで医療用RAGパイプライン内の人口統計バイアスを系統的に評価する。我々は、思考の推論の連鎖、対実的フィルタリング、適応的即興改善、多数決の集約など、特定バイアスに対処するために、いくつかのバイアス緩和戦略を実装し、比較する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 17:02:01 GMT)
Efficient implementation of randomized quantum algorithms with dynamic circuits [4.0]
静的回路を用いた従来の手法と比較して, 実行時間の14,000倍加速が観察された。この作業は、実際の量子ハードウェア上でのランダム化アルゴリズムの実行を大幅に単純化する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 18:22:42 GMT)
Automated diagnosis of lung diseases using vision transformer: a comparative study on chest x-ray classification [4.0]
世界的には、肺関連疾患は毎年多くの生命を主張しており、早期かつ正確な診断が不可欠である。本研究では,メンデレーデータから得られた3,475個の胸部X線画像からなるデータセットを用いた。我々は、CNN、ResNet50、DenseNet、CheXNet、U-Netを含む5つの事前訓練されたディープラーニングモデルと、ViT(Vision Transformer)やShifted Window(Swin)といった2つのトランスファー学習アルゴリズムを適用し、これらの画像を分類した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 04:35:17 GMT)
Digital Simulation of Non-Abelian Parafermions in Superconducting Circuits [4.0]
パラフェルミオンは深い非アベリア統計を示し、トポロジカルに順序づけられたシステムで現れる。この研究は、以前の量子シミュレーションを拡張し、SC量子ビットのツイスト欠陥をキューディット系へ拡張した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 11:35:20 GMT)
Quantum Logic Spectroscopy of an Electron and Positron for Precise Tests of the Standard Model [3.9]
分光トラップ中の電子または陽電子は、ワイヤを介してリモート論理電子または陽電子に結合され、運動絡みを実現する。 2つのトラップを分離することにより、磁場、マイクロ波特性、検出感度を大幅に改善することができる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 11:56:27 GMT)
Slide2Text: Leveraging LLMs for Personalized Textbook Generation from PowerPoint Presentations [3.9]
本稿ではPowerPointのプレゼンテーションをカスタマイズした教科書に変換するシステムであるSlide2Textを紹介する。 OCRを用いてスライドコンテンツを抽出し、コヒーレントな構造に整理し、説明、エクササイズ、参照などの調整された資料を生成することにより、Slide2Textは教科書作成プロセスを合理化する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 09:42:03 GMT)
Proactive and Reactive Constraint Programming for Stochastic Project Scheduling with Maximal Time-Lags [3.7]
本研究では,最大時間ラグ(SRCPSP/max)を用いた資源制約型プロジェクトスケジューリング問題のスケジューリング戦略について検討する。制約プログラミング(CP)とテンポラルネットワークの最近の進歩は、様々なプロアクティブかつリアクティブなスケジューリング手法の利点と欠点を評価することへの関心を再燃させた。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 21:20:27 GMT)
ConSol: Sequential Probability Ratio Testing to Find Consistent LLM Reasoning Paths Efficiently [3.6]
小言語モデル(LLM)は、回答を提供する前に中間推論ステップを生成することで複雑なタスクを解決する。広く使われている自己整合性法は、精度を向上させるために複数の推論経路を集約することにより、これらのコストをさらに高める。十分な整合性が達成できればサンプリングを動的に停止するために,逐次確率比検定(SPRT)を活用することを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 00:07:28 GMT)
DynASyn: Multi-Subject Personalization Enabling Dynamic Action Synthesis [3.6]
単一参照画像からの効果的な多目的パーソナライズであるDynASynを提案する。 DynASynは、概念に基づく先行と主題の出現と行動とを整合させることにより、パーソナライズプロセスにおける主題のアイデンティティを保存する。さらに,アイデンティティの保存と行動多様性のトレードオフを高めるために,概念に基づくプロンプト・アンド・イメージの強化を提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 10:56:35 GMT)
Adapt, Agree, Aggregate: Semi-Supervised Ensemble Labeling for Graph Convolutional Networks [3.6]
本稿では,アンサンブル学習と拡張グラフ構造を組み合わせた新しいフレームワークを提案する。このアプローチは、ノイズの多いグラフ構造によって生じる課題を緩和する"多様な群衆の知恵"を活用する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 19:10:54 GMT)
Dynamical quantum phase transitions in a spinor Bose-Einstein condensate and criticality enhanced quantum sensing [3.4]
量子相転移は、量子多体系の基底と励起状態に普遍的に存在する。スピノル凝縮体中の基底状態と励起状態の量子相転移が動的相転移と診断できることは明らかである。この研究は、幅広い数モード量子系に即座に適用できるスキームを通じて励起状態量子相転移の探索を進める。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 06:33:41 GMT)
A Modular Dataset to Demonstrate LLM Abstraction Capability [3.1]
大きな言語モデル(LLM)は印象的な能力を示すが、幻覚や論理の欠陥による推論エラーに苦慮している。 ArrangementPuzzleは、構造化されたソリューションと段階的正当性の自動検証を備えた、新しいパズルデータセットである。このデータセット上で, LLMアクティベーションに関する分類器モデルを訓練した結果, 推論精度の予測において80%以上の精度が得られた。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 04:25:30 GMT)
Moiré Superradiance in Cavity Quantum Electrodynamics with Quantum Atom Gas [3.0]
本研究では, 1次元冷間原子空洞結合系におけるモーア効果を示す手法を提案する。我々は空洞場スペクトルを導出し、動的構造因子に結合し、制御された原子拡散を示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 08:37:20 GMT)
Do ImageNet-trained models learn shortcuts? The impact of frequency shortcuts on generalization [2.8]
周波数ショートカットは、モデルが正しい分類に強く依存する特定の周波数パターンを指す。以前の研究では、小さな画像データセットでトレーニングされたモデルは、しばしばそのようなショートカットを利用することが示されている。本稿では,周波数ショートカットをより効率的に大規模に解析する手法を提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 14:58:05 GMT)
PT-PINNs: A Parametric Engineering Turbulence Solver based on Physics-Informed Neural Networks [2.7]
本研究では,PINNがデータセットを訓練せずにパラメトリック乱流を解く能力を高める枠組みを提案する。パラメトリックBFS乱流モデルを構築するのに必要な時間は39時間であり、従来の数値法で必要とされる時間の1/6である。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 09:10:53 GMT)
Neural-MCRL: Neural Multimodal Contrastive Representation Learning for EEG-based Visual Decoding [2.6]
脳波(EEG)を用いた脳活動からの神経視覚表現のデコードは、脳-機械界面(BMI)の進行に不可欠である既存の手法は、しばしばモダリティ内の意味的一貫性と完全性を見落とし、モダリティ間の効果的なセマンティックアライメントを欠いている。本稿では,セマンティックブリッジとクロスアテンション機構によるマルチモーダルアライメントを実現する新しいフレームワークであるNeural-MCRLを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 06:52:48 GMT)
A novel gradient-based method for decision trees optimizing arbitrary differential loss functions [2.5]
本研究では、任意の微分可微分損失関数を最適化する勾配に基づく決定木を構築する新しい手法を提案する。本手法の分類・回帰・生存分析への適用性を示す。この方法の実装は公開されており、研究者や実践者に実用的なツールを提供している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 20:25:30 GMT)
DoYouTrustAI: A Tool to Teach Students About AI Misinformation and Prompt Engineering [2.3]
DoYouTrustAIは、学生が主要な歴史人物に関するLLM応答で誤解を招く情報を識別することで批判的思考を強化するウェブベースのアプリケーションである。このツールは、ユーザーがテストに慣れ親しんだ個人を選び、ランダムな推測を減らし、既知の事実と共に誤情報を提示し、信頼性を維持する。また、AI応答に異なるプロンプトがどのように影響するかを示すために、事前に設定されたプロンプト命令も提供する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 19:11:57 GMT)
To Google or To ChatGPT? A Comparison of CS2 Students' Information Gathering Approaches and Outcomes [2.1]
ChatGPTは、プログラミングと関連概念を学習するためのツールとして、高等教育の学生に広く採用されている。 LLMを用いた学習において,学生がどれほど効果的か,どのような戦略が用いられているのかは明らかになっていない。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 18:17:31 GMT)
MIRAM: Masked Image Reconstruction Across Multiple Scales for Breast Lesion Risk Prediction [2.0]
Masked Image Modeling (MIM) はより強力なSSL技術として登場した。本稿では,より困難なプリテキストタスクを中心に,スケーラブルで実用的なSSLアプローチを提案する。我々の仮説は、高解像度画像の再構成により、より微細な空間的詳細に対応することができるというものである。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 08:01:49 GMT)
Plurals: A System for Guiding LLMs Via Simulated Social Ensembles [1.9]
本稿では,多言語AIのためのシステムとPythonライブラリであるPluralsを紹介する。複数は、カスタマイズ可能な構造内で意図的にエージェントで構成され、モデレーターは熟考を監督する。 6つのケーススタディは、理論的構成と有効性に対する忠実さを示している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 20:30:18 GMT)
A General Approach for Determining Applicability Domain of Machine Learning Models [1.9]
機械学習モデルの適用可能性のドメインに関する知識は、正確で信頼性の高いモデル予測を保証するために不可欠である。我々は,カーネル密度推定を用いたモデル領域の評価手法を開発した。化学知識に基づく無関係と判断された化学物質群は,本測定値と有意な相違が認められた。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 19:31:26 GMT)
AI-Based Screening for Depression and Social Anxiety Through Eye Tracking: An Exploratory Study [1.7]
幸福感の低下はうつ病や不安障害と関連していることが多い。本稿では、視覚的注意走査経路の分析により、感情障害のAIによるスクリーニングに新たなアプローチを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 02:53:02 GMT)
3D Modeling: Camera Movement Estimation and path Correction for SFM Model using the Combination of Modified A-SIFT and Stereo System [1.7]
効率的なカメラパス生成は、正確で効率的な3Dモデルを作成する際の問題を解決するのに役立つ。 ASIFT (Affine Scale-Invariant Feature Transform) の修正版が提案され,計算オーバーヘッドの低減を図った。 2カメラベースの回転補正モデルを導入し,小さな回転誤差を軽減した。 3次元空間におけるカメラの動きを決定するために,ステレオカメラによる翻訳推定と補正モデルを実装した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 06:37:54 GMT)
ParsiPy: NLP Toolkit for Historical Persian Texts in Python [1.6]
この研究は、音声の書き起こしを処理し、古代のテキストを分析するためのNLPツールキットであるParsiPyを導入している。 ParsiPyは、トークン化、補題化、音声タグ付け、音素から音素への変換、単語の埋め込みのためのモジュールを提供する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 16:21:29 GMT)
Enhancing Martian Terrain Recognition with Deep Constrained Clustering [1.5]
Deep Constrained Clustering with Metric Learning (DCCML)は、クラスタリングプロセスのガイドに複数の制約型を活用する新しいアルゴリズムである。 DCCMLは同種クラスタを16.7%増加させ、Davies-Bouldin Indexを3.86から1.82に減らした。この改良により、火星の地質学的特徴をより正確に分類し、惑星の地形を分析し、理解する能力を向上させることができる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 03:38:16 GMT)
Closing the Intent-to-Behavior Gap via Fulfillment Priority Logic [1.5]
本稿では,FPL(Fulfillment Priority Logic)を構築する目的達成の概念について述べる。われわれの新しいバランスポリシー勾配アルゴリズムは、FPL仕様を利用して、ソフトアクター批評家と比較して最大500%のサンプル効率を達成する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 04:22:47 GMT)
Privacy-Preserving Hamming Distance Computation with Property-Preserving Hashing [1.4]
プロパティ保存ハッシュ(PPH)の下でハミング距離を亜線形時間で近似する問題について検討する。以上の結果から, 高い暗号保証, ブリッジ効率, 類似度推定におけるセキュリティの下で, 近似距離の回復が可能であることが示唆された。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 19:35:59 GMT)
Studying Workarounds in Software Forms: An Experimental Protocol [1.3]
本稿では,ユーザが入力したいデータとソフトウェア形式の制約が一致しない場合の回避策を検討する実験手法を提案する。この手法を用いてユーザ研究を行うことで,ワークアラウンドがシステム設計やデータの整合性にどのように影響するかを解析できる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 02:46:50 GMT)
IceBench: A Benchmark for Deep Learning based Sea Ice Type Classification [1.2]
海水型分類のための総合的なベンチマークフレームワークであるIceBenchを紹介する。 IceBenchはオープンソースであり、他の海氷型の分類手法の便利な統合と評価を可能にする。代表モデルに関する詳細な比較研究を行い,その強度と限界を評価する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 23:14:50 GMT)
A Generative Caching System for Large Language Models [1.2]
キャッシングは、大きな言語モデル(LLM)にアクセスする上で、大きなメリットをもたらす可能性がある。本稿では,LLMを用いたユーザエクスペリエンス向上のための新しいキャッシングシステムを提案する。生成キャッシングでは、複数のキャッシュされたレスポンスを合成して、これまで見たことのないクエリに対する回答を提供することができます。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 01:17:56 GMT)
Efficient Strategies for Reducing Sampling Error in Quantum Krylov Subspace Diagonalization [1.2]
この研究は、射影ハミルトニアンにおける行列要素の測定中のサンプリング誤差の定量化に焦点をあてる。シフト技術と係数分割の2つの測定方法を提案する。小分子の電子構造を用いた数値実験は、これらの戦略の有効性を実証している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:37:14 GMT)
Incompatibility of rank-one POVMs and quantum uncertainty relations [1.2]
em $s$-order incompatibility of measured to rank-one POVMs。我々は,複数のPOVMの不整合性とその不確実性をサポートするための関連性について検討する。これらの結果は量子暗号、量子状態再構成、量子圧縮センシングに応用できる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 06:45:49 GMT)
Klein Tunneling in Uniaxial Strained Graphene under Super-Periodic Potential [1.2]
局所周期および超周期静電電位下でのグラフェンの電子散乱に及ぼす一軸ひずみの影響を解析的に検討した。正のマージパラメータ(delta > 0$)は、マージ点にエネルギーギャップを開いて送信確率を減少させる。負の融合パラメータ(デルタ0$)は、ディラック円錐を接近させることで透過性を高め、特定の角度での電子輸送を促進する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 11:27:20 GMT)
Bandwidth Reservation for Time-Critical Vehicular Applications: A Multi-Operator Environment [1.2]
帯域予約要求は価格変動や公平性の問題といった課題に直面します本研究は,複数のMNOの最適価格を求めることにより,資源コストを最小化することを目的とする。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:36:23 GMT)
Unit-density SU(3) Fermi-Hubbard Model with Spin Flavor Imbalance [1.2]
平均場位相図は、2つのフレーバー密度の集合における単位密度 SU(3) フェルミ・ハバードモデルに対して示される。両密度の適度な相互作用強度で新しい相を同定し, 風味の不均衡の存在下での強靭性について検討した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 13:59:42 GMT)
Neural Network Operator-Based Fractal Approximation: Smoothness Preservation and Convergence Analysis [1.1]
本稿では,ニューラルネットワーク演算子を用いた$alpha$-fractal関数(FIF)の構築手法を提案する。我々は,ノードや分割点における元の関数の値のみを利用するフラクタル関数を開発した。適切な条件下でこれらの$alpha$-fractalsの元の関数への収束を分析する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 07:12:57 GMT)
Graphical Transformation Models [1.0]
複雑な境界構造と複素依存構造を持つ多変量データを非パラメトリックで効果的にモデル化する新しい手法を提案する。対の条件付き不整合に対して,ラッソペナルティを用いてGTMを概略正則化する方法を示す。モデルの堅牢性と有効性はシミュレーションを通じて検証され、パラメトリックなブドウのコプラを正確に学習する能力を示している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 19:41:15 GMT)
Reasoning with LLMs for Zero-Shot Vulnerability Detection [0.9]
textbfVulnSageは,多種多様な大規模オープンソースソフトウェアプロジェクトから収集した,総合的な評価フレームワークである。このフレームワークは、関数レベル、ファイルレベル、関数間の複数の粒度解析をサポートする。 Baseline、Chain-of-context、Think、Think & verifyの4つの異なるゼロショットプロンプト戦略を採用している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 23:59:17 GMT)
Energy-Aware LLMs: A step towards sustainable AI for downstream applications [0.9]
LLM(Advanced Large Language Models)は、コミュニケーションネットワークを含む様々な分野に革命をもたらした。 LLMは通常、膨大な計算資源を必要とするため、非常に高いエネルギー消費をもたらす。本研究では,エネルギー効率とモデル性能のトレードオフを調査するエンドツーエンドパイプラインを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 14:28:29 GMT)
Approximate Quantum Error Correction with 1D Log-Depth Circuits [0.8]
本研究では,2層回路構造を持つ1次元対数深さランダムクリフォード符号化回路に基づいて,量子誤り訂正符号を構築する。誤差補正の不正確さは回路深度とともに指数関数的に低下し,これらの対数深度回路の誤りは無視できることを示した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:54:04 GMT)
Benchmark Dataset for Pore-Scale CO2-Water Interaction [0.7]
データセットは624個の2Dサンプルで構成され、それぞれサイズは512x512で解像度は35mで、一定のCO2注入速度で100の時間ステップをカバーしている。このデータセットは、機械学習モデルのベンチマークに不可欠な高解像度の時間的および空間的情報を提供する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 00:42:42 GMT)
A Survey on Mathematical Reasoning and Optimization with Large Language Models [0.5]
大規模言語モデル(LLM)の最近の進歩は、AIによる数学的推論、定理証明、最適化技術を大幅に改善している。この調査は、AIにおける数学的問題解決の進化を、初期の統計的学習アプローチから近代的なディープラーニングやトランスフォーマーに基づく方法論まで調査する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 10:49:32 GMT)
On the Hopf-Cole Transform for Control-affine Schrödinger Bridge [0.5]
ホップ・コール変換が汎用制御-アフィン・シュル・オーディンガー橋問題に対する最適条件に適用されたことを示す。結果のPDEを非線形逆流拡散-拡散-反応方程式として解釈する方法を説明する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 04:08:10 GMT)
CardioTabNet: A Novel Hybrid Transformer Model for Heart Disease Prediction using Tabular Medical Data [0.5]
本研究は,1190の症例と11の特徴を有する心臓病予測のためのオープンソースデータセットを用いている。 10種類の機械学習モデルを用いて心疾患の予測を行った。トップダウンストリームモデル(ハイパーチューニングされたエクストラトレー)の平均精度は94.1%、エリアアンダーカーブ(AUC)の平均精度は95.0%に達した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 06:17:08 GMT)
Aportes para el cumplimiento del Reglamento (UE) 2024/1689 en robótica y sistemas autónomos [0.5]
この研究は、高度なロボットシステムに適用可能なサイバーセキュリティツールを分析する。これらのシステムのセキュリティ、完全性、レジリエンスを保証するため、基本的なツールのリストが提案されている。 10つの評価基準は、規制の遵守を確実にし、人間とロボットの相互作用のリスクを低減するために定義される。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 11:04:42 GMT)
Renewable Energy Transition in South America: Predictive Analysis of Generation Capacity by 2050 [0.4]
この研究は、太陽、風、水力、地熱、バイオマス、その他の南米諸国の再生可能エネルギーの将来の発電能力を予測するために、勾配の上昇レグレッションと預言時系列予測を採用している。その結果、南米は2050年までに再生可能エネルギーの発生が3倍近く増加すると予想され、ブラジルとチリは地域開発を先導している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 13:41:00 GMT)
Learning Optimal Filters Using Variational Inference [0.4]
フィルタリングシステムのためのパラメータ化分析マップを学習するためのフレームワークを提案する。原理的には、これはフィルタリング分布の近似をより良くし、従ってバイアスを小さくする。この手法は、線形および非線形力学系をフィルタリングするアフィン解析マップにおいてゲイン行列の学習に利用できることを示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 23:54:29 GMT)
PI-HMR: Towards Robust In-bed Temporal Human Shape Reconstruction with Contact Pressure Sensing [0.3]
圧力を感知するベッドシートは、リアルタイムのモーションリコンストラクションに有望なソリューションを提供する。本稿では,トップビューシナリオにおける奥行きの曖昧さを克服する最適化手法SMPLify-IBを紹介する。圧力列からメッシュを回帰する時間的人体形状推定器PI-HMRを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 10:01:54 GMT)
Quantum Merlin-Arthur proof systems for synthesizing quantum states [0.3]
本研究では, ある量子状態の生成に係わるクラスNPQP(状態QMA)について検討する。我々の主な結果は、指数的に小さなギャップや有界空間を持つこのクラスとその変種を誤りに減らすことである。我々は、国家QMA封じ込めの最も自然な候補の1つであるUQMA証人の家族が、州QMAにあることを確証する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 09:01:51 GMT)
A Roadmap Towards Improving Multi-Agent Reinforcement Learning With Causal Discovery And Inference [0.2]
因果推論は、学習プロセスを改善するために強化学習(Reinforcement Learning, RL)においてますます用いられる。しかし、MARL(Multi-Agent RL)に対する因果推論の応用は、いまだに未解明である。我々は、MARLにおける因果推論の適用の機会と課題を調査する第一歩を踏み出す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 15:49:13 GMT)
Assessing workflow impact and clinical utility of AI-assisted brain aneurysm detection: a multi-reader study [0.1]
私たちは、アルゴリズムのトレーニング/検証に360の被験者を使用し、読み出しセッションには見当たらないテストセットとして100を使用します。その結果,中高生でも中高生でも感度は有意に上昇しないことがわかった。読者が報告した自信は2つの設定で変化せず、AIアシストが診断の確実性に影響を与えないことを示している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 14:32:35 GMT)
Unsupervised Structural-Counterfactual Generation under Domain Shift [0.0]
本稿では,ソース領域からの事実観測に基づいて,対象領域における対実サンプルの生成という,新たな生成モデル課題を提案する。本フレームワークは, 対象領域からの影響-内在変数の後方分布と, 対象領域からの領域-内在変数の事前分布とを組み合わせて, 所望の反事実を合成する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:42:42 GMT)
Unsupervised Foundation Model-Agnostic Slide-Level Representation Learning [0.0]
自己教師付き学習は、パッチ埋め込み生成のための組織モデル(FM)の訓練に成功している。本稿では,有用なスライド表現を生成する単一モダリティSSL方式を提案する。対照的な事前学習戦略はCOBRAと呼ばれ、複数のFMとMamba-2に基づくアーキテクチャを採用している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 19:20:19 GMT)
Thermal properties of a non-Hermitian system interacting with oscillator [0.0]
熱水浴に接触した2レベル$Psigma_z$擬エルミート系の熱力学特性について検討した。量子系は、非エルミート結合が特定の臨界値を超えるとき、各不変部分空間において$Psigma_z$相転移を行う。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 10:38:12 GMT)
The Effect of Explainable AI-based Decision Support on Human Task Performance: A Meta-Analysis [0.0]
我々はメタ分析を行い、XAIが分類タスクにおける人間のパフォーマンスにどのように影響するかを探索する。この結果から,XAIによる意思決定支援によるタスクパフォーマンスの向上が示唆された。この分析によると、研究のバイアスリスクはAIにおける説明の影響を和らげる一方、説明のタイプは無視できる役割だけを担っている。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 10:38:43 GMT)
Synthetic media and computational capitalism: towards a critical theory of artificial intelligence [0.0]
私は、AIシステムの技術的特異性と、計算資本主義の下での生命の再構築におけるそれらの役割に対処できる新しいクリティカルな方法が必要であると論じます。この論文は、命題が仮定されることなくアルゴリズムの状態と関わり合うためには、臨界反射性が必要であることを示唆して締めくくっている。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 22:59:28 GMT)
Staying Alive: Online Neural Network Maintenance and Systemic Drift [0.0]
本稿では,トレーニング済みモデルの重み付けをオンラインで更新する手法として,SEKF(Subset Extended Kalman Filter)を提案する。オンラインモデルメンテナンスにおけるファインタニングとSEKFを比較し,システムドリフトの存在下での比較を行った。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 07:38:44 GMT)
Stabilizer codes of less than two dimensions have constant distance [0.0]
曲面コードはパラメータが $[[n,1,Theta(sqrtn)]]$ の2次元安定化器コードである。現在まで、距離が大きくなるスタビライザ符号は2次元未満で存在することが分かっていない。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 05:30:08 GMT)
Quantum Computation based on Open Quantum Walks [0.0]
オープン量子ウォーク(英語: Open Quantum Walks、OQW)は、システムと環境との相互作用によって制御される量子ウォークの一種である。このモデルでは、デフォーカスやデポーラ化といったランダムなユニタリ量子チャネルをどのように表現できるかを示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 00:26:50 GMT)
Oscillatory Signatures of Parkinson's Disease: Central and Parietal EEG Alterations Across Multiple Frequency Bands [0.0]
本研究は,脳波記録に深層学習技術を適用することにより,脳波を早期バイオマーカーとしての可能性について検討する。中心電極 (C3, Cz, C4) とフルスペクトル 0.4-62.4 Hz を用いて高い分類精度 (76%) を示した。両側側頭頂部はテタバンド(4.0-7.79 Hz)で強い性能(67%)を示し、複数の領域ではアルファバンド(7.8-15.59 Hz)である程度の感度(65%)を示した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 13:06:50 GMT)
On the (im)possibility of sustainable artificial intelligence. Why it does not make sense to move faster when heading the wrong way [0.0]
この記事では、クリティカルデータとアルゴリズム研究、STS、トランスフォーメーションサステナビリティ科学、クリティカルコンピュータ科学、パブリック関心理論の知見を引用する。確かにAIには持続可能性に関連するユースケースがたくさんあるが、利益よりも全体的な欠点がある可能性が高い、と私は主張する。あらゆる物質において、その影響は特に世界の南部では壊滅的であり、世界の北部では恩恵を受けている。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 09:01:15 GMT)
On Chord Dynamics and Complexity Growth in Double-Scaled SYK [0.0]
両面の弦ハミルトニアンが支配する時間進化について, ダブルスケールSYKモデルを用いて検討した。半古典的極限における特定のエネルギー領域に局在させることによって、区別された半古典的挙動がどのように現れるかを示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 00:11:00 GMT)
Neural Network Approach to Stochastic Dynamics for Smooth Multimodal Density Estimation [0.0]
我々は、事前条件行列の固有性をランダム行列としてモデル化することで、メトロポリス調整ランゲヴィン拡散アルゴリズムを適用できる。提案手法は, 統計モデルの局所構造の幾何を活用・適応するために, 提案密度を調整するための完全適応機構を提供する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 16:17:12 GMT)
Mpemba effect and super-accelerated thermalization in the damped quantum harmonic oscillator [0.0]
ムペンバ効果は、非平衡状態が平衡からさらに離れるとより速く緩和できることを意味する。量子系における緩和とMpemba様効果の研究への最近の関心超加速緩和効果は、消滅しないコヒーレンスを持つ幅広い初期状態でも持続することが示されている。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 13:31:09 GMT)
Metacognition in Content-Centric Computational Cognitive C4 Modeling [0.0]
我々は、次世代AIエージェントのためのコンテンツ中心の計算認知(C4)モデリングを導入する。ニューロシンボリック処理モデルを用いて開発された認知ロボットアプリケーションに、LEIAの認知能力を拡張するための現在の研究について論じる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 17:23:27 GMT)
Measuring Vogue in American Sociology (2011-2020) [0.0]
本研究では、犯罪や健康などの応用研究トピックが、分野内のトレンドの出現と拡散の原動力となることを示す。この研究は、知識生産を支配する制度的なメカニズムに光を当て、社会学の知的景観がエリート機関からの単純なトップダウン拡散によって規定されないことを示した。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 19:29:12 GMT)
Machine Learning - Driven Materials Discovery: Unlocking Next-Generation Functional Materials - A minireview [0.0]
機械学習(ML)によるアプローチは、材料発見、プロパティ予測、マテリアルデザインに革命をもたらしている。このレビューでは、材料の機械的、熱的、電気的、光学的特性を予測するML駆動方式の現実的な応用を強調した。最終的に、AI、自動実験、および計算モデリングの相乗効果は、材料の検出、最適化、設計の方法を変える。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 15:24:38 GMT)
Inverse Superconductor-Insulator Transition in Weakly Monitored Josephson Junction Arrays [0.0]
オープン量子系における測定と浴槽工学による量子状態の制御と操作は、多体物理学における新しいパラダイムとして登場した。連続的な弱い測定とフィードバックによる繰り返しモニタリングによって、これらのシステムの絶縁状態が超伝導体に変換され、その逆も可能であることを示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:15:06 GMT)
Intelligence Sequencing and the Path-Dependence of Intelligence Evolution: AGI-First vs. DCI-First as Irreversible Attractors [0.0]
本稿では,インテリジェンスシークエンシングの概念を紹介する。知性は経路に依存し、不可逆的な軌道に従うと論じている。発見は、インテリジェンスシーシークエンシングが文明的な転換点であることを示している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 08:09:04 GMT)
Instrumental distortions in quantum optimal control [0.0]
RAW-GRAPEは応答対応勾配上昇パルス工学フレームワークである。 GRAPEループ内の微分可能な歪みのカスケードを考慮に入れている。ユーザが指定した歪みカスケードに耐性のある制御シーケンスを生成する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 14:05:04 GMT)
Explainable identification of similarities between entities for discovery in large text [0.0]
本研究では,文書の自動比較と説明可能な類似性を明らかにするため,n-gram解析フレームワークを開発した。評価式を適用して各n-gramを重み付けし、n-gramが両方の文書でより頻度が高いときに重みを高くする。ワードクラウドのような可視化ツールは、これらのパターンの表現を強化し、より明確な洞察を提供する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 01:20:43 GMT)
Enhancing Startup Success Predictions in Venture Capital: A GraphRAG Augmented Multivariate Time Series Method [0.0]
本稿では,GraphRAG拡張時系列モデルを用いた新しい手法を提案する。 GraphRAGでは、分析フレームワークに重要な関係を統合することで、時系列予測手法が強化される。実験の結果,我々のモデルは,スタートアップの成功予測において,過去のモデルよりも大幅に優れていたことがわかった。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:47:44 GMT)
Enhancing Layer Attention Efficiency through Pruning Redundant Retrievals [0.0]
隣接層間のKL(Kulback-Leibler)のばらつきを利用して冗長性を定量化する手法を提案する。また、冗長層を正確に識別し、スキップする拡張ベータ量子マッピング(EBQM)手法も導入する。提案したELAアーキテクチャは,トレーニング効率と全体的なパフォーマンスを両立させ,トレーニング時間の30%削減を実現している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:05:30 GMT)
Electromagnetically Induced Transparency Effect Improves Quantum Battery Lifetime [0.0]
量子バッテリ(Quantum Battery, QB)は、量子力学の応用であり、量子効果を用いてエネルギーを貯蔵・伝達する。本稿では、電磁誘導透過(EIT)と境界状態を利用して、QBのエネルギー貯蔵過程における環境散逸を抑制することを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 12:59:05 GMT)
Dual axis atomic magnetometer and gyroscope enabled by nuclear spin perturbation [0.0]
本研究では,1つの希ガス種とアルカリ種とのコマグネトメトリー法を提案する。自己補償を用いたよく知られた装置と似ているが、我々は高貴なガスを制御できる磁気パルスを導入する。これらの応用パルスは、磁気ノイズの影響を単に抑制するのではなく、我々のスキームを計測することができる。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 01:05:26 GMT)
Don't Kill the Baby: The Case for AI in Arbitration [0.0]
連邦航空局(FAA)は、従来の予約にもかかわらず、当事者がAIによる仲裁を契約的に選択することを許可していると論じている。仲裁におけるAIの使用を提唱することで、契約上の自律性を尊重することの重要性を強調している。最終的には、仲裁におけるAIに対するバランスの取れたオープンなアプローチを求め、紛争解決の効率性、公平性、柔軟性を高める可能性を認識している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 17:00:00 GMT)
Differentiable Optimization for Deep Learning-Enhanced DC Approximation of AC Optimal Power Flow [0.0]
本稿では,AC-OPFの動作をより正確に模倣するために,DC-OPFを強化したネットワーク等価性のための新しいディープラーニングベースのフレームワークを提案する。このアプローチは、調整された結節シャントコンダクタンスと分岐感受性を予測するためにトレーニングされたニューラルネットワークを組み込んだ、微分可能な最適化の最近の進歩を活用している。結果は、予測精度を大幅に向上し、より信頼性が高く効率的な電力システムを実現するためのフレームワークの能力を示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 20:53:53 GMT)
Device-independent, megabit-rate quantum random number generator with beam-splitter-free architecture and live Bell test certification [0.0]
デバイス非依存の量子乱数生成器(DI-QRNG)は情報処理に不可欠である。本稿では,ベル試験による実効量子性認証付き高ビットレートDI-QRNGを提案する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 11:05:52 GMT)
Design and implementation of a novel cryptographically secure pseudorandom number generator [0.0]
暗号的にセキュアな擬似乱数生成器(PRNG)の新たな設計法を提案する。提案手法は,Feistel 様のボックスを応用したモジュール式指数列を用いることで,これらの目的を達成する。また,提案アルゴリズムで生成した約240ビットの大きさの配列に関する広範囲な統計的試験の結果も示す。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 13:15:00 GMT)
Demo-Craft: Using In-Context Learning to Improve Code Generation in Large Language Models [0.0]
テキスト内学習と実演選択を活用してコード生成を向上させるDemoCraftを提案する。潜在概念学習は、タスク固有の知識をキャプチャするトレーニング可能な埋め込みである、追加の概念トークンを導入している。実験の結果,提案方式はpass@kの2倍の精度向上を実現していることがわかった。我々の実証研究は、我々のシステムがこれらの指標の約3倍の改善を達成したことを示唆している。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 05:52:26 GMT)
Controlled Gates in the Clifford Hierarchy [0.0]
クビットクリフォード階層における任意の制御ゲートによって満たされなければならない条件の集合を証明する。我々は証明をある種のユニタリの直和からなるゲートに拡張する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 18:58:04 GMT)
Connectedness: a dimension of security bug severity assessment for measuring uncertainty [0.0]
CVSS(Common Vulnerability Scoring System)のようなセキュリティバグの深刻度を評価するための現在のフレームワークは、影響に対するエクスプロイラビリティの比率を優先している。本稿では, 上記の手法が「既知の未知」を計測するが, 「未知」を不十分に扱うことを示唆する。本稿では,セキュリティバグがさまざまなエンティティといかに強く結びついているかを測定する,接続性の概念を紹介する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 16:25:08 GMT)
Coarse Set Theory for AI Ethics and Decision-Making: A Mathematical Framework for Granular Evaluations [0.0]
粗い倫理 (CE) は、文字のグレードや警告ラベルなどの粗い評価を、認知的および文脈的制約の下で倫理的に適切であるものとして正当化する理論的な枠組みである。本稿では、完全順序構造と粗い分割を用いた粗粒度決定をモデル化する新しい数学的枠組みである粗粒度集合論(CST)を紹介する。 CSTは集合間の階層的関係を定義し、Kulback-Leibler Divergenceのような情報理論ツールを使用して、単純化と情報損失の間のトレードオフを定量化する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 00:30:11 GMT)
Cavity QED with degenerate atomic levels and polarization-degenerate field mode [0.0]
励起原子によりキャビティに放出される光子の偏光特性は、原子レベルの任意の角モータに対する緩和過程を考慮に入れて研究される。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 09:22:55 GMT)
Bose-Einstein condensation on axially-symmetric surfaces [0.0]
革命の軸対称面に閉じ込められた理想ボゾン気体におけるボース・アインシュタイン凝縮現象について検討した。一般革命曲面に対して単粒子シュル「オーディンガー方程式を定式化することにより、対応するエネルギースペクトルを導出する。系の量子統計的性質に対する曲率の影響を解析する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 18:31:14 GMT)
Are Pseudo-Hermiticity and Generalized $\mathcal{P}\mathcal{T}$-Symmetry Equivalent at Exceptional Points? [0.0]
対角化可能な線型作用素 $H:mathscrHtomathscrH$ に対して、$H$ の擬ハーモニティ性はその一般化 $mathcalPmathcalT$-対称性と同値であることを示す。また、有限次元ヒルベルト空間で作用する任意の線型作用素に対して擬ハーミティティーの同値性を確立し、$mathcalPmathcalT$-対称性を一般化する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 08:08:16 GMT)
A Survey on Structured State Space Sequence (S4) Models [0.0]
シーケンスモデリングの最近の進歩は、構造化状態空間モデル(Structured State Space Models, SSMs)の出現につながっている。 SSMは構造的再帰と状態空間表現を利用して、線形またはニア線形複雑度で優れたロングシーケンス処理を実現する。この調査は、AIとディープラーニングにおけるSSMベースのアーキテクチャの進歩、トレードオフ、今後の方向性を詳述した、研究者や実践者の構造化ガイドとして機能する。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 01:55:32 GMT)
A Study on the Improvement of Code Generation Quality Using Large Language Models Leveraging Product Documentation [0.0]
本研究では,製品ドキュメントからE2Eテストコードを自動的に生成する手法を提案する。製品ドキュメントから生成されたテストは、高いコンパイル成功と機能カバレッジを持ち、要求仕様とユーザストーリに基づいたテストよりも優れています。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 18:42:05 GMT)
A Privacy Model for Classical & Learned Bloom Filters [0.0]
古典ブルームフィルタ (CBF) は確率データ構造 (PDS) のクラスである。 Learned Bloom Filter (LBF) は古典的ブルームフィルタと学習モデルを組み合わせた PDS のクラスである。本稿では,ブルームフィルタの厳密な差分プライバシーに基づく分析を行う。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 22:11:55 GMT)
A Distributed Blockchain-based Access Control for the Internet of Things [0.0]
IoT(Internet of Things)環境は、悪意のあるユーザがIoTユーザのセキュリティとプライバシを壊すために、ますます肥大化している。分散IoT環境に対処するため、ブロックチェーンは有望なデータ管理技術であると見なされている。我々は、分散アクセス制御と属性ベースのIoT用アクセス制御モデル(DBC-ABAC)を提案する。概念実証の実装はHyperledger Fabricを使って提示される。
論文参考訳（メタデータ） (Sat, 22 Mar 2025 22:36:02 GMT)