Fugu-MT: arxivの論文翻訳(概要)

Mitigating Group-Level Fairness Disparities in Federated Visual Language Models [115.2]
本稿では、FLと公正なプロンプトチューニング技術を組み合わせた新しいフレームワークであるFVL-FPを紹介する。モデル性能を維持しながら、人口統計バイアスを軽減することに注力する。本手法は,標準FL法に比べて平均45%の人口格差を減少させる。
論文参考訳（メタデータ） (Sat, 03 May 2025 16:09:52 GMT)
Focal-SAM: Focal Sharpness-Aware Minimization for Long-Tailed Classification [113.7]
実世界のデータセットは長い尾の分布に従うことが多く、尾のクラスへの一般化は困難である。近年,ロスランドスケープを平坦化して一般化を改善するため,シャープネス・アウェア最小化法 (SAM) の長尾変種を利用した手法が提案されている。クラスごとに異なる罰則を割り当てるFocal-SAMを導入し、余分なバックプロパゲーションを伴わずにきめ細かい制御を実現する。
論文参考訳（メタデータ） (Sat, 03 May 2025 03:01:28 GMT)
GDSG: Graph Diffusion-based Solution Generator for Optimization Problems in MEC Networks [109.2]
グラフ拡散型ソリューション生成(GDSG)法を提案する。このアプローチは、おそらく最適な解に収束しながら、最適以下のデータセットを扱うように設計されている。グラフニューラルネットワーク(GNN)を用いたマルチタスク拡散モデルとしてGDSGを構築し,高品質な解の分布を求める。
論文参考訳（メタデータ） (Sat, 03 May 2025 07:09:58 GMT)
RoBridge: A Hierarchical Architecture Bridging Cognition and Execution for General Robotic Manipulation [90.8]
RoBridgeは、一般的なロボット操作のための階層的なインテリジェントアーキテクチャである。大規模事前学習型視覚言語モデル(VLM)に基づくハイレベル認知プランナー(HCP)で構成されている。強化学習の手続き的スキルを解き放ち、認知と実行のギャップを効果的に埋める。
論文参考訳（メタデータ） (Sat, 03 May 2025 06:17:18 GMT)
Cannot See the Forest for the Trees: Invoking Heuristics and Biases to Elicit Irrational Choices of LLMs [83.1]
本研究では,人間の認知における認知的分解と偏見に触発された新しいジェイルブレイク攻撃フレームワークを提案する。我々は、悪意のあるプロンプトの複雑さと関連バイアスを減らし、認知的分解を用いて、プロンプトを再編成する。また、従来の二分的成功または失敗のパラダイムを超越したランキングベースの有害度評価指標も導入する。
論文参考訳（メタデータ） (Sat, 03 May 2025 05:28:11 GMT)
PoseX: AI Defeats Physics Approaches on Protein-Ligand Cross Docking [74.8]
我々は、セルフドッキングとクロスドッキングに焦点を当てたオープンソースのベンチマークであるPoseXを提案する。自己ドッキング用718項目とクロスドッキング用1,312項目の新たな評価データセットをキュレートする。従来の物理手法やAIドッキング手法を含む,3つの方法論カテゴリに22のドッキング手法を組み込んだ。
論文参考訳（メタデータ） (Sat, 03 May 2025 05:35:37 GMT)
Probabilistic Interactive 3D Segmentation with Hierarchical Neural Processes [71.3]
本稿では,これらの課題に対処するためのニューラル・プロセス(NP)に基づく新しい確率的フレームワークNPISeg3Dを提案する。 NPISeg3Dは、シーン固有およびオブジェクト固有の潜在変数を持つ階層的な潜在変数構造を導入し、少数ショットの一般化を強化している。我々は,オブジェクト固有の潜伏変数を用いたクリックプロトタイプを適応的に変調するプロトタイプモジュレータを設計し,オブジェクト認識コンテキストをキャプチャするモデルの能力を向上させる。
論文参考訳（メタデータ） (Sat, 03 May 2025 07:43:23 GMT)
Towards Artificial Intelligence Research Assistant for Expert-Involved Learning [64.7]
大規模言語モデル (LLMs) と大規模多モードモデル (LMMs) は科学研究における変革的ツールとして登場している。 textbfExpert-involved textbfLearning (ARIEL)のためのtextbfARtificial textbfIntelligence Research Assistantを提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 14:21:48 GMT)
MFCLIP: Multi-modal Fine-grained CLIP for Generalizable Diffusion Face Forgery Detection [64.3]
フォトリアリスティック・フェイスジェネレーション手法の急速な発展は、社会やアカデミックにおいて大きな関心を集めている。既存のアプローチは主に画像モダリティを用いて顔の偽造パターンをキャプチャするが、きめ細かいノイズやテキストのような他のモダリティは完全には探索されていない。そこで本研究では,画像ノイズの多点にわたる包括的かつきめ細かなフォージェリートレースをマイニングする,MFCLIP(MF-modal Fine-fine-fine-fine-fine-fine CLIP)モデルを提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 02:34:08 GMT)
Cobra: Efficient Line Art COlorization with BRoAder References [62.5]
漫画のページは多彩なキャラクター、オブジェクト、背景を含むことが多く、色付け過程を複雑にしている。画像生成のための拡散モデルの発展にもかかわらず、ラインアートのカラー化への応用は限定的である。カラーヒントをサポートし,200以上の参照画像を利用する,効率的で汎用的な手法であるCobraを紹介する。
論文参考訳（メタデータ） (Sat, 03 May 2025 06:55:56 GMT)
On the Vulnerability of Text Sanitization [60.6]
テキストの衛生化を目的とした理論的に最適な再構築攻撃を提案する。衛生性能を評価するためのベンチマークとして, ASR のバウンダリを導出する。我々の攻撃の1つは、最先端のベースラインよりもASRが46.4%向上したことである。
論文参考訳（メタデータ） (Sat, 03 May 2025 15:15:02 GMT)
Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey [59.5]
エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代のインテリジェントアプリケーションの計算要求に対処するための重要なパラダイムとして登場した。 AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきた。この調査は、基本的なアーキテクチャ、技術の実現、新しいアプリケーションに関する構造化されたチュートリアルを提供する。
論文参考訳（メタデータ） (Sat, 03 May 2025 13:55:38 GMT)
Accelerating Large Language Model Reasoning via Speculative Search [59.5]
本稿では,大規模言語モデル(LLM)推論を著しく高速化する新しいSpec Searchフレームワークを提案する。具体的には、SpecSearchは小さなモデルを使用して、思考とトークンのレベルで大きなモデルと戦略的に協力する。 SpecSearchの主要な柱は、大きなモデルの出力よりも品質が低い考えを効果的にフィルタリングする、新しい品質保存の拒絶メカニズムである。
論文参考訳（メタデータ） (Sat, 03 May 2025 12:14:08 GMT)
Massive Values in Self-Attention Modules are the Key to Contextual Knowledge Understanding [58.4]
注目クエリの特定の領域において、集中した巨大な値が一貫して現れることを示す。これらの膨大な価値は文脈知識の解釈において重要な役割を担っている。大量の値の出現を辿り、そのような濃度は回転位置によって引き起こされる。
論文参考訳（メタデータ） (Sat, 03 May 2025 01:40:50 GMT)
Learning Multi-frame and Monocular Prior for Estimating Geometry in Dynamic Scenes [56.9]
我々は,MMPと呼ばれる新しいモデルを提案し,その形状をフィードフォワード方式で推定する。近年のシームズアーキテクチャに基づいて,新しい軌道符号化モジュールを導入する。 MMPはフィードフォワードのポイントマップ予測において最先端の品質を実現することができる。
論文参考訳（メタデータ） (Sat, 03 May 2025 08:28:15 GMT)
Tex4D: Zero-shot 4D Scene Texturing with Video Diffusion Models [54.4]
3Dメッシュはコンピュータビジョンとグラフィックスにおいて、アニメーションの効率と映画、ゲーム、AR、VRにおける最小限のメモリ使用のために広く利用されている。しかし、メッシュのための時間的一貫性と現実的なテクスチャを作成することは、プロのアーティストにとって労働集約的だ。本稿では、メッシュ配列から固有の幾何学とビデオ拡散モデルを統合することで、一貫したテクスチャを生成する3Dテクスチャシーケンスを提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 12:19:08 GMT)
Analytic Energy-Guided Policy Optimization for Offline Reinforcement Learning [54.1]
拡散モデルによる条件決定生成は強化学習(RL)において強力な競争力を示す。近年の研究では、エネルギー-関数-誘導拡散モデルと制約付きRL問題との関係が明らかにされている。主な課題は中間エネルギーを推定することであり、これは生成過程における対数予測の定式化によって引き起こされる。
論文参考訳（メタデータ） (Sat, 03 May 2025 14:00:25 GMT)
World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks [54.0]
本稿では,車載ネットワークにおけるパケット完全性認識情報(CAoI)の年齢を最小化するために,新しい世界モデルに基づく学習フレームワークを提案する。 mmWave V2X環境の動的モデルを共同で学習し、リンクスケジューリングの方法を学ぶための軌跡を想像するために使用する世界モデルフレームワークを提案する。特に、長期的な政策は環境相互作用の代わりに、異なる想像軌道で学習される。
論文参考訳（メタデータ） (Sat, 03 May 2025 06:23:18 GMT)
Rethinking Score Distilling Sampling for 3D Editing and Generation [50.5]
Unified Distillation Sampling (UDS)は、3Dアセットの生成と編集をシームレスに統合する手法である。 UDSは、より詳細な3Dアセットの生成において、ベースラインメソッドよりも優れているだけでなく、編集タスクも優れているため、3D生成と編集のギャップを埋める。
論文参考訳（メタデータ） (Sat, 03 May 2025 18:40:39 GMT)
Surrogate to Poincaré inequalities on manifolds for dimension reduction in nonlinear feature spaces [49.2]
連続微分可能な関数 $u:mathbbRd rightarrow mathbbRm$ を $g:mathbbRd rightarrow mathbbRm$, $mleq d$, $f : mathbbRm rightarrow mathbbRR$ という関数の合成によって近似することを目指している。固定された$g$に対して、評価を含む古典回帰法を用いて$f$を構築する。
論文参考訳（メタデータ） (Sat, 03 May 2025 12:37:27 GMT)
Continuous Filtered Backprojection by Learnable Interpolation Network [48.5]
本研究では,Leanable-Interpolation-based FBP (LInFBP) と呼ばれる新しいディープラーニングモデルを提案する。提案した LInFBP では,選択した基底関数の線形結合として,離散シングラムデータの潜伏連続関数の局所部分をすべて定式化する。次に、学習した潜伏連続関数をバックプロジェクションステップに利用し、FBPの深層学習を初めて活用する。
論文参考訳（メタデータ） (Sat, 03 May 2025 09:50:27 GMT)
Can't Hide Behind the API: Stealing Black-Box Commercial Embedding Models [47.1]
テキストの高密度ベクトル表現を生成する埋め込みモデルは広く使われ、重要な商業価値を持っている。 OpenAIとCohereは、有料APIを通じて独自の埋め込みモデルを提供するが、APIの背後に隠れているにもかかわらず、これらのモデルは盗難から保護されていない。私たちは,これらのモデルを,APIから得られたテキスト埋め込みペア上で,泥棒モデルを訓練することで,検索のために"スティル"する最初の試みを,私たちの知識に提示する。
論文参考訳（メタデータ） (Sat, 03 May 2025 17:09:12 GMT)
Adaptively Point-weighting Curriculum Learning [46.8]
カリキュラム学習(CL)は、まず簡単なサンプルを学習し、次にハードサンプルに適合させるトレーニング戦略である。適応的な点重み付け(APW)カリキュラム学習アルゴリズムを開発し,各トレーニングサンプルに適応的に重み付けを行う。本稿では, トレーニングの有効性, トレーニング実現可能性, トレーニング安定性, 一般化性能などのAPWの特性に関する理論的解析を行った。
論文参考訳（メタデータ） (Sat, 03 May 2025 03:27:22 GMT)
Vision Mamba in Remote Sensing: A Comprehensive Survey of Techniques, Applications and Outlook [46.7]
状態空間モデル(SSM)は、線形計算スケーリングとグローバルコンテキストモデリングを組み合わせたパラダイムシフトソリューションとして登場した。本調査では,約120個のマンバを用いたリモートセンシング研究を体系的に分析し,マンバをベースとしたリモートセンシング手法の総合的なレビューを行った。 i)ビジョン・マンバのアーキテクチャの基礎原理、(ii)適応スキャン戦略やハイブリッドSSMの定式化のようなマイクロアーキテクチャの進歩、(iii)CNN-Transformer-Mambaハイブリッドや周波数領域適応、(iv)状態に対する厳密なベンチマークなど、マクロアーキテクチャの統合。
論文参考訳（メタデータ） (Sat, 03 May 2025 09:38:12 GMT)
Multimodal Graph Representation Learning for Robust Surgical Workflow Recognition with Adversarial Feature Disentanglement [45.7]
本稿では,精度と信頼性を高めるために,視覚と運動データを統合するグラフベースの手法を提案する。ヴィジュアルデータはダイナミックな手術シーンをキャプチャし、キネマティックデータは正確な運動情報を提供する。本研究の目的は, 外科手術に固有の複雑度とダイナミズムに対処し, 自動的なワークフロー認識を向上することである。
論文参考訳（メタデータ） (Sat, 03 May 2025 09:43:30 GMT)
Knowledge-Augmented Language Models Interpreting Structured Chest X-Ray Findings [45.0]
本稿では,胸部X線解釈に強力なテキスト中心言語モデルを利用する新しいフレームワークであるCXR-TextInterを紹介する。我々は,このLCM中心のアプローチを統合医療知識モジュールで強化し,臨床推論を強化する。我々の研究は医療画像AIの代替パラダイムを検証し、高度なLLM機能を活用する可能性を示している。
論文参考訳（メタデータ） (Sat, 03 May 2025 06:18:12 GMT)
PIN-WM: Learning Physics-INformed World Models for Non-Prehensile Manipulation [44.4]
非包括的操作に関わる3次元剛体力学の世界モデルを学ぶ。 PIN-WMは、わずかなショットとタスクに依存しない物理的相互作用軌跡でのみ学習することができる。学習したPIN-WMを、物理を意識したランダム化によって、デジタルクーシンのグループに変換する。
論文参考訳（メタデータ） (Sat, 03 May 2025 12:21:40 GMT)
Co$^{3}$Gesture: Towards Coherent Concurrent Co-speech 3D Gesture Generation with Interactive Diffusion [42.4]
Co$3$Gestureは、コヒーレントな同時音声ジェスチャー合成を可能にする新しいフレームワークである。本稿では、2つの話者のジェスチャーシーケンス間の時間的関連表現をモデル化するための時間的相互作用モジュール(TIM)を提案する。本手法は,新たに収集したGES-Interデータセットの最先端モデルよりも優れている。
論文参考訳（メタデータ） (Sat, 03 May 2025 08:51:19 GMT)
VIST-GPT: Ushering in the Era of Visual Storytelling with LLMs? [42.4]
本稿では,視覚的ストーリーテリングタスクにおけるマルチモーダルモデルの最近の進歩を活用する新しいアプローチを提案する。我々は,視覚的接地,コヒーレンス,非冗長性に着目し,視覚的ストーリーテリングを評価するための新しい基準フリーメトリクスであるRoViSTとGROOVISTを利用する。
論文参考訳（メタデータ） (Sat, 03 May 2025 08:32:16 GMT)
LookAlike: Consistent Distractor Generation in Math MCQs [42.2]
そこで我々はLookAlikeを提案する。LookAlikeは優先最適化によるエラー・ディトラクタの整合性を改善する手法である。主なイノベーションは、(a)モデル不整合から合成選好ペアをマイニングすること、(b)教師付き微調整の交互化である。 LookAlike は LLM-as-a-judge 評価の下で、イントラクタ生成の精度51.6%、エラー生成の精度57.2% を達成する。
論文参考訳（メタデータ） (Sat, 03 May 2025 19:18:06 GMT)
Vision and Intention Boost Large Language Model in Long-Term Action Anticipation [39.7]
長期的な行動予測は、長期にわたる将来の行動を予測することを目的としている。近年の研究では、大きな言語モデル(LLM)を利用して、深刻な情報損失を被るテキストベースの入力を活用している。本研究では,視覚データのリッチなセマンティック情報を完全に活用する,新しいインテンシブ・コンディション・ビジョン・ランゲージ(ICVL)モデルを提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 06:33:54 GMT)
MVHumanNet++: A Large-scale Dataset of Multi-view Daily Dressing Human Captures with Richer Annotations for 3D Human Digitization [36.5]
MVHumanNet++は4,500人の人物の多視点的行動系列からなるデータセットである。私たちのデータセットには、9000の日用品、6万のモーションシーケンスと6億5500万のフレームが含まれています。
論文参考訳（メタデータ） (Sat, 03 May 2025 15:02:34 GMT)
Memory-Efficient LLM Training by Various-Grained Low-Rank Projection of Gradients [36.3]
低ランク勾配投影(LoRP)は、メモリ効率の良い微調整のための有望な解である。既存のLoRP法では、勾配行列の各行をデフォルトの射影単位として扱い、射影の粒度の役割は未解明のままである。本稿では、メモリ効率と性能のトレードオフを制御するための追加の自由度を導入することで、低ランク勾配予測を拡張する新しいフレームワークVLoRPを提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 08:50:14 GMT)
Outlier Gradient Analysis: Efficiently Identifying Detrimental Training Samples for Deep Learning Models [36.1]
本稿では,影響関数と外乱勾配検出による有害トレーニングサンプルの同定とを橋渡しする。まず, 合成データセットにおける外乱勾配解析手法の仮説を検証した。次に、視覚モデルにおける誤ラベルサンプルの検出と、自然言語処理トランスフォーマーモデルの性能向上のためのデータサンプル選択の有効性を示す。
論文参考訳（メタデータ） (Sat, 03 May 2025 14:54:17 GMT)
Context-Aware Online Conformal Anomaly Detection with Prediction-Powered Data Acquisition [35.6]
文脈認識型共形オンライン異常検出(C-PP-COAD)を導入する。本フレームワークは,データ不足を軽減するために合成キャリブレーションデータを戦略的に活用し,コンテキストに基づく実データの統合を適応的に行う。 C-PP-COADは、偽発見率(FDR)を保証せずに、実際のキャリブレーションデータへの依存を著しく低減することを示した。
論文参考訳（メタデータ） (Sat, 03 May 2025 10:58:05 GMT)
A Logical Fallacy-Informed Framework for Argument Generation [34.4]
FIPOは、大規模言語モデルを論理的に健全な議論に導いてくれる、誤用インフォームドフレームワークである。議論データセットの結果から,提案手法は誤り率を最大17.5%削減することを示した。私たちのコードは alucamouchel.com/lucamouchel/Logical-Fallacies で利用可能です。
論文参考訳（メタデータ） (Sat, 03 May 2025 18:52:04 GMT)
LensNet: An End-to-End Learning Framework for Empirical Point Spread Function Modeling and Lensless Imaging Reconstruction [32.9]
レンズレスイメージングは、従来のレンズベースのシステムに代わる有望な選択肢である。従来のレンズレス技術は、しばしば明示的な校正と広範な前処理を必要とする。本研究では,空間領域と周波数領域の表現を統合したエンドツーエンドのディープラーニングフレームワークであるLensNetを提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 09:11:52 GMT)
Physics-informed Deep Diffusion MRI Reconstruction with Synthetic Data: Break Training Data Bottleneck in Artificial Intelligence [31.3]
拡散磁気共鳴イメージング(MRI)は、非侵襲的な水分子の動き検出のための唯一の画像モダリティである。マルチショット技術で取得したDWI MRIは,高分解能,信号対雑音比,幾何歪みの低減を実現している。これらのアーティファクトは将来的に除去できないため、アーティファクトフリーのトレーニングラベルが欠落する。高品質なペアリング学習データを合成する物理インフォームド深部DWI再構成法を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 08:18:04 GMT)
Pretraining Large Brain Language Model for Active BCI: Silent Speech [31.1]
本稿では,脳-コンピュータインタフェース(BCI)システムにおけるサイレント音声デコーディングについて検討する。 12名の被験者から120時間以上の脳波記録を収集した。能動BCIのための無声音声を復号化するためのLBLM(Large Brain Language Model)を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 07:53:27 GMT)
Toward Onboard AI-Enabled Solutions to Space Object Detection for Space Sustainability [29.8]
本稿では,空間物体検出のための視覚センサの実現可能性と有効性について検討する。 Squeeze-and-Excitation (SE) 層, Vision Transformer (ViT) および Generalized Efficient Layer Aggregation Network (GELAN) に基づくモデルを導入する。実験の結果, 提案モデルでは, 結合閾値0.5(mAP50)の交点平均精度が0.751, 結合閾値0.5から0.95(mAP50:95)の交点平均精度が0.280に達することがわかった。
論文参考訳（メタデータ） (Sat, 03 May 2025 01:56:52 GMT)
Efficient Shapley Value-based Non-Uniform Pruning of Large Language Models [28.0]
大規模言語モデル(LLM)のプルーニングは、性能を保ちながら、モデルのサイズと計算の複雑さを減らすための有望なソリューションである。従来の層ワイドプルーニング法は、全ての層に均一なスパーシティアプローチを採用することが多く、最適以下の性能をもたらす。本稿では,LLM に対する underlineShapley underlineValue-based underlineNon-underlineUniform underlinePruning (methodname) 法を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 07:57:02 GMT)
Unified Steganography via Implicit Neural Representation [27.8]
Inlicit Neural Representation (INR) を用いた新しいステガノグラフィー法であるU-INRを提案する。このアイデアを達成するために、秘密鍵はデータ送信者と受信者の間で共有される。そのような秘密鍵はINRネットワーク内の秘密データの位置を決定するために使用できる。画像、ビデオ、オーディオ、SDFおよびNeRFを含む複数のデータタイプにわたる総合的な実験は、U-INRの一般化可能性と有効性を示している。
論文参考訳（メタデータ） (Sat, 03 May 2025 08:57:06 GMT)
UP-dROM : Uncertainty-Aware and Parametrised dynamic Reduced-Order Model, application to unsteady flows [27.5]
還元次数モデル(ROM)は、低コストな予測を提供することによって流体力学において重要な役割を果たす。 ROMが広く適用されるためには、異なる体制にまたがってうまく一般化するだけでなく、その予測に対する信頼度も測らなければならない。過渡流に特化して設計された非線形還元戦略を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 10:20:59 GMT)
Rogue Cell: Adversarial Attack and Defense in Untrusted O-RAN Setup Exploiting the Traffic Steering xApp [24.9]
Open Radio Access Network (O-RAN)アーキテクチャは、オープンでマルチベンダの設計とAIによる管理によって、携帯電話ネットワークに革命をもたらしている。これまでの研究では、O-RANの知的コンポーネントから生じる脆弱性を主に調査してきた。本稿では,単一演算子からマルチ演算型RANアーキテクチャへ移行した際のセキュリティ問題と脆弱性に着目する。
論文参考訳（メタデータ） (Sat, 03 May 2025 13:19:44 GMT)
Dynamic Parametric Retrieval Augmented Generation for Test-time Knowledge Enhancement [22.4]
Retrieval-augmented Generation (RAG)は、関連するドキュメントを外部ソースから取得し、コンテキストに組み込むことで、大きな言語モデル(LLM)を強化する。文書をパラメトリックな知識に効率的に変換する軽量パラメータトランスレータモデルを活用する新しいフレームワークであるDynamic Parametric RAG(DyPRAG)を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 08:23:39 GMT)
Easz: An Agile Transformer-based Image Compression Framework for Resource-constrained IoTs [22.1]
我々はEaszと呼ばれる新しいトランスフォーマーベースのエッジコンピュートフリー画像符号化フレームワークを提案する。 Easzは計算オーバーヘッドをサーバにシフトするため、エッジ上の重いエンコーディングとモデル切り替えのオーバーヘッドを回避する。受信機上での計算オーバーヘッドをさらに軽減するため、受信側での再構成負荷を低減するために、軽量なトランスフォーマーベースの再構成構造を導入する。
論文参考訳（メタデータ） (Sat, 03 May 2025 08:39:19 GMT)
SimAug: Enhancing Recommendation with Pretrained Language Models for Dense and Balanced Data Augmentation [21.6]
ディープニューラルネットワーク(DNN)は、協調フィルタリングに広く使われている。これらのシステムは、ユーザとアイテムの埋め込みを学ぶために、インタラクションデータに依存する。事前学習言語モデル(PLM)を用いて、テキスト情報との相互作用データを強化し、より密でバランスの取れたデータセットを生み出す。 9つのデータセットを対象とした実験では,SimAugが生成した拡張データによるトレーニングにおいて,実用性と公正性の両方の改善が一貫して示されている。
論文参考訳（メタデータ） (Sat, 03 May 2025 04:59:12 GMT)
3DWG: 3D Weakly Supervised Visual Grounding via Category and Instance-Level Alignment [21.1]
この3D弱教師付きビジュアルグラウンドタスクは、自然言語記述に基づいて、ポイントクラウドに指向する3Dボックスをローカライズすることを目的としている。この設定は、カテゴリレベルの曖昧さとインスタンスレベルの複雑さの2つの主な課題を提示します。提案手法は,Nr3D,Sr3D,ScanRefの3つのベンチマークに対して,最先端の性能を実現する。
論文参考訳（メタデータ） (Sat, 03 May 2025 12:45:00 GMT)
FireANTs: Adaptive Riemannian Optimization for Multi-Scale Diffeomorphic Matching [20.3]
本稿では,高次微分同相画像マッチングのためのマルチスケール適応リーマン最適化アルゴリズムであるFireANTsを提案する。マウスのアイソコルテックス体積を自然分解能で微分同相マッチングし,25分以内で25mmの脳アトラスを発生させた。
論文参考訳（メタデータ） (Sat, 03 May 2025 17:00:29 GMT)
Deep Implicit Optimization enables Robust Learnable Features for Deformable Image Registration [20.3]
既存のDLIR(Deep Learning in Image Registration)メソッドは、最適化をディープネットワークの層として明示的に組み込むものではない。提案手法は,ディープネットワークの層として最適化を明示的に取り入れることで,統計的学習と最適化のギャップを埋めることを示す。我々のフレームワークは、ドメイン内のデータセットで優れたパフォーマンスを示し、ドメインシフトに依存しない。
論文参考訳（メタデータ） (Sat, 03 May 2025 17:35:18 GMT)
MISE: Meta-knowledge Inheritance for Social Media-Based Stressor Estimation [20.3]
本研究では,ソーシャルメディア上でのユーザの投稿を通じて,より具体的なストレスを推定することを目的とした新しいタスクを提案する。メタ知識継承機構によって強化された,メタ学習に基づく新しいストレス要因推定フレームワークを提案する。我々は、人間の幸福を促進するために人工知能モデルを訓練するのに役立つソーシャルメディアベースのストレスクレーサ推定データセットを構築した。
論文参考訳（メタデータ） (Sat, 03 May 2025 18:12:36 GMT)
OT-Talk: Animating 3D Talking Head with Optimal Transportation [20.0]
OT-Talkは、音声ヘッドアニメーションの学習モデルを最適化するために最適なトランスポートを利用する最初のアプローチである。既存の学習フレームワークに基づいて,事前学習したHubertモデルを用いて音声特徴を抽出し,変換器モデルを用いて時間的シーケンスを処理する。 2つの公開オーディオ・メシュ・データセットに対する実験により,本手法が最先端技術より優れていることを示す。
論文参考訳（メタデータ） (Sat, 03 May 2025 21:49:23 GMT)
Rate-Limited Closed-Loop Distributed ISAC Systems: An Autoencoder Approach [19.8]
クローズドループ分散マルチセンサ統合センシング・通信(ISAC)システムでは、速度制限ネットワーク上での高次元センサ観測の伝達に性能が影響することがしばしばある。まず、レート制限された閉ループ分散ISACシステムのための一般的なフレームワークを提案し、次に、制限された伝送容量によって課される制約を克服するオートエンコーダに基づく観測圧縮手法を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 10:52:39 GMT)
MolQAE: Quantum Autoencoder for Molecular Representation Learning [19.6]
本稿では、量子コンピューティングと分子表現学習を統合する新しいアプローチである量子分子オートエンコーダを紹介する。本稿では、SMILES分子表現を量子状態空間にマッピングする量子回路ベースのオートエンコーダアーキテクチャを提案する。実験の結果、量子オートエンコーダは分子構造や化学的性質を効果的に捉えていることが示された。
論文参考訳（メタデータ） (Sat, 03 May 2025 17:36:47 GMT)
From Gradient Clipping to Normalization for Heavy Tailed SGD [19.4]
最近の実証的な証拠は、機械学習の応用が重尾ノイズを伴い、実際に有界分散の標準的な仮定に挑戦していることを示している。本稿では, 勾配依存型雑音収束問題において, テール雑音下での厳密性を実現することができることを示す。
論文参考訳（メタデータ） (Sat, 03 May 2025 01:23:32 GMT)
Unlocking Transfer Learning for Open-World Few-Shot Recognition [19.3]
Few-Shot Open-Set Recognition (FSOSR) は、入力を既知のカテゴリに分類することを目的としている。オープンセットなメタ学習とオープンセットのフリートランスファー学習を組み合わせた2段階の手法を提案する。提案手法は,2つの広く認識されているベンチマークである miniImageNet と tieredImageNet の最先端性能を実現し,トレーニング作業は 1.5% しか増加しない。
論文参考訳（メタデータ） (Sat, 03 May 2025 16:09:23 GMT)
Revisiting Euclidean Alignment for Transfer Learning in EEG-Based Brain-Computer Interfaces [18.9]
伝達学習(TL)は脳波ベースの脳-コンピュータインタフェースの校正を高速化するために広く用いられている。この課題に対処するため、2020年にエレクトロニックアライメント(EA)が提案された。本稿ではEAを再考し、その手順と正しい使用法を説明し、応用と拡張を導入し、新たな研究の方向性を指摘する。
論文参考訳（メタデータ） (Sat, 03 May 2025 14:58:21 GMT)
Weakly-supervised Audio Temporal Forgery Localization via Progressive Audio-language Co-learning Network [17.9]
既存のATFL手法は、細かいアノテーションを使って効率的なネットワークを訓練することに依存している。そこで本稿では,ローカライズ性能を高めるために,協調学習と自己超越的手法を取り入れたプログレッシブ・オーディオ・コラーニング・ネットワーク(LOCO)を提案する。提案したLOCOは3つの公開ベンチマークでSOTA性能を達成する。
論文参考訳（メタデータ） (Sat, 03 May 2025 17:57:57 GMT)
The Loop Game: Quality Assessment and Optimization for Low-Light Image Enhancement [17.9]
低照度画像強調手法の設計と最適化は知覚品質によって完全に駆動される必要があるという認識がますます高まっている。本稿では,低照度画像の高画質化が視覚的品質の向上にどのように最適化されるかを示すループ拡張フレームワークを提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 06:24:29 GMT)
PeSANet: Physics-encoded Spectral Attention Network for Simulating PDE-Governed Complex Systems [17.8]
本研究では,物理符号化されたスペクトル注意ネットワーク(PeSANet)を提案する。このモデルは、2つの重要な構成要素から構成される: 制限されたデータから局所微分作用素を近似するためにハード制約を使用する物理符号化ブロックと、長距離グローバル依存関係をキャプチャするスペクトル拡張ブロックである。
論文参考訳（メタデータ） (Sat, 03 May 2025 08:25:30 GMT)
AMO Sampler: Enhancing Text Rendering with Overshooting [17.1]
本稿では,テキストのレンダリング品質を大幅に向上させる,最小限の計算オーバーヘッドのトレーニング不要な手法を提案する。 AMOはSD3とFluxのテキストレンダリング精度を32.3%と35.9%改善した。
論文参考訳（メタデータ） (Sat, 03 May 2025 00:42:46 GMT)
ResearchCodeAgent: An LLM Multi-Agent System for Automated Codification of Research Methodologies [16.9]
本研究では,研究方法論の体系化を自動化する新しいマルチエージェントシステムであるResearchCodeAgentを紹介する。このシステムは、ハイレベルな研究概念と実践的な実装のギャップを埋める。 ResearchCodeAgentは、研究実施プロセスに向けた重要なステップであり、機械学習研究のペースを加速する可能性がある。
論文参考訳（メタデータ） (Sat, 03 May 2025 16:45:38 GMT)
CoordField: Coordination Field for Agentic UAV Task Allocation In Low-altitude Urban Scenarios [16.7]
本稿では,複雑な都市環境下での不均一なUAV群をコーディネートするためのコーディネートフィールドエージェントシステムを提案する。 UAV動作とタスク選択を誘導するコーディネーションフィールド機構を提案し,創発的タスクの分散および適応的アロケーションを可能にする。実験結果から, 動的変化に対するタスクカバレッジ, 応答時間, 適応性の観点から, より優れた性能が得られた。
論文参考訳（メタデータ） (Sat, 03 May 2025 16:45:20 GMT)
Inducing Robustness in a 2 Dimensional Direct Preference Optimization Paradigm [16.7]
DPO(Direct PreferenceOptimization)は、大規模言語モデルと人間の嗜好を整合させる強力な手法として登場した。オープンソースの選好データセットを用いたDPOの性能について検討する。 2D-DPOアルゴリズムにセグメントレベルスコアノイズロバスト性を組み込む手法を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 05:59:13 GMT)
Interpretable graph-based models on multimodal biomedical data integration: A technical review and benchmarking [16.4]
本稿は,2019年1月から2024年1月までに発行された26の研究を対象とする,多モードバイオメディカルデータに対する解釈可能なグラフベースモデルの最初の調査である。ほとんどの対象疾患分類、特に癌は単純な類似性尺度からの静的グラフに依存し、グラフネイティブな説明器は稀である。既存のアプローチを4つの解釈可能なファミリーに分類し、グラフイングラフ階層、知識グラフエッジ、動的トポロジー学習などのトレンドを概説し、実用的なベンチマークを行う。
論文参考訳（メタデータ） (Sat, 03 May 2025 05:00:38 GMT)
Soft-Masked Semi-Dual Optimal Transport for Partial Domain Adaptation [16.2]
部分的ドメイン適応 (partial domain adapt, PDA) は、ターゲットラベル空間がソースのサブセットである一般的で実用的なシナリオである。 PDA の課題は、ドメインシフトだけでなく、ドメインの非IDラベル空間にも起因している。本稿では,PDA問題に対処するために,ソフトマスク型半二重最適輸送法(SSOT)を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 03:20:17 GMT)
HybridGS: High-Efficiency Gaussian Splatting Data Compression using Dual-Channel Sparse Representation and Point Cloud Encoder [15.8]
本稿では,HybridGSと呼ばれる新しい3DGS圧縮フレームワークを提案する。コンパクトな生成と標準化されたポイントクラウドデータエンコーディングの両方を活用する。実験結果から,現状の手法に匹敵する再現性能が得られることがわかった。
論文参考訳（メタデータ） (Sat, 03 May 2025 22:21:06 GMT)
Fully Integrated Vacuum-based Quantum Random Number Generator [15.8]
量子乱数生成器は、真の乱数を生成することによって、高要求の情報コンテキストを確保する上で重要な役割を果たす。本稿では,異なるフォトニック統合プラットフォームの利点をフル活用するチップシステムを提案する。光干渉路とフォトダイオードは標準シリコンプロセスに統合され、レーザー源オンチップはIII-Vプラットフォーム上で実現される。
論文参考訳（メタデータ） (Sat, 03 May 2025 05:39:52 GMT)
Multi-Scale Graph Learning for Anti-Sparse Downscaling [15.4]
細かな空間解像度での河川水温の正確な予測は、水質を維持し水生生物を保護するための正確な介入を可能にする。そこで本研究では,Multi-Scale Graph Learning(MSGL)法を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 23:52:08 GMT)
Exploring the Role of Diversity in Example Selection for In-Context Learning [15.1]
In-Context Learning (ICL) は、広範囲なトレーニングデータを必要とすることなくタスクを実行する能力と、ノイズの多いラベルに対する堅牢性によって、注目を集めている。類似性に基づいた選択にのみ依存すると、検索されたコンテキストにトピックのバイアスが発生する可能性がある。トピックの多様性を高めるために検索したコンテキストを再配置することは、ダウンストリームタスクのパフォーマンスを向上させることができると仮定する。
論文参考訳（メタデータ） (Sat, 03 May 2025 15:13:58 GMT)
Blessing of Dimensionality for Approximating Sobolev Classes on Manifolds [14.2]
有限な統計的複雑性の関数を持つ最適一様近似を考える。特に、コンパクト多様体上の有界ソボレフ函数の類を近似するのに要する統計複雑性が下から有界であることを示す。
論文参考訳（メタデータ） (Sat, 03 May 2025 08:47:41 GMT)
Visual enhancement and 3D representation for underwater scenes: a review [13.8]
水中視覚強調(UVE)と水中3D再構成は、コンピュータビジョンとAIベースのタスクにおいて大きな課題となる。これらの分野での研究を進めるために,我々は多面的な視点から詳細をレビューする。
論文参考訳（メタデータ） (Sat, 03 May 2025 17:20:24 GMT)
SMARTe-VR: Student Monitoring and Adaptive Response Technology for e-Learning in Virtual Reality [13.6]
本研究は,オンライン教育用に設計された没入型仮想現実環境における学生監視プラットフォームSMARTe-VRを紹介する。このプラットフォームでは、インストラクターがビデオ講義でカスタマイズされた学習セッションを作成することができる。われわれは,VRベースのTOEICセッションで10ユーザからのデータを用いた5つの研究課題を含むデータセットをリリースした。
論文参考訳（メタデータ） (Sat, 03 May 2025 20:56:47 GMT)
On the Robustness of the Successive Projection Algorithm [13.6]
我々は,SPAの雑音に対する頑健さとその変種について再考する。特に,SPAにおける既存の誤差境界の厳密性を証明する。我々は、まずデータポイントをシフトして持ち上げる、より堅牢なSPAの亜種を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 05:05:10 GMT)
BOOM: Benchmarking Out-Of-distribution Molecular Property Predictions of Machine Learning Models [12.9]
BOOM, $boldsymbolb$enchmarks for $boldsymbolo$f-distribution $boldsymbolm$olecular property predictions。我々は、OOD性能に関するディープラーニングモデルをベンチマークするために、140以上のモデルの組み合わせとプロパティ予測タスクを評価した。全体として、すべてのタスクにまたがる強力なOOD一般化を実現する既存のモデルは見つからない。
論文参考訳（メタデータ） (Sat, 03 May 2025 19:51:23 GMT)
Component-Based Fairness in Face Attribute Classification with Bayesian Network-informed Meta Learning [12.9]
生体顔の特徴によって定義される公平性の概念である顔成分の公平性に注目した。我々はtextbfBayesian textbfNetwork-informed textbfMeta textbfReweighting (BNMR)を提案する。 BNMRはベイズネットワークキャリブレータを内蔵し、適応的なメタラーニングに基づくサンプル再重み付けプロセスを導く。
論文参考訳（メタデータ） (Sat, 03 May 2025 05:26:29 GMT)
Scalable Speed-ups for the SMS-EMOA from a Simple Aging Strategy [12.7]
本研究では,ある年齢未満の個人を除去可能な年齢から除外する,老化に基づく異なる非エリート選択機構を提案する。目的数に関係なく、$max1,Theta(k)k-1$ の係数でスピードアップを証明します。
論文参考訳（メタデータ） (Sat, 03 May 2025 01:34:51 GMT)
Efficient 3D Full-Body Motion Generation from Sparse Tracking Inputs with Temporal Windows [12.4]
計算コストとメモリオーバヘッドのバランスを保ちながら全体の性能を向上し,効率的な3次元フルボディ生成を実現する,MLP(Multi-Layer Perceptron)に基づく新しい手法を提案する。このNN機構による手法の生成精度は, 現状の手法に比べて有意に向上していることを示す。
論文参考訳（メタデータ） (Sat, 03 May 2025 12:17:47 GMT)
Dynamic Scene Understanding from Vision-Language Representations [11.8]
本稿では,現代の凍結した視覚言語表現からの知識を活用することにより,動的シーン理解タスクのためのフレームワークを提案する。既存のアプローチと比較して、最小限のトレーニング可能なパラメータを使用しながら、最先端の結果を得る。
論文参考訳（メタデータ） (Sat, 03 May 2025 18:39:13 GMT)
A Survey on Inference Engines for Large Language Models: Perspectives on Optimization and Efficiency [11.8]
本稿では,25個のオープンソースおよび商用推論エンジンの総合評価を行う。本稿では,各推論エンジンについて,スループットとレイテンシを考慮した計算における使いやすさ,使いやすさ,汎用サポート,スケーラビリティ,適合性の観点から検討する。
論文参考訳（メタデータ） (Sat, 03 May 2025 02:47:43 GMT)
Robust Transfer Learning with Unreliable Source Data [11.8]
対象関数とソース回帰関数との差を測定する「あいまい度レベル」と呼ばれる新しい量を導入する。本稿では, 簡単な伝達学習手法を提案し, この新しい量が学習の伝達可能性にどのように関係しているかを示す一般的な定理を確立する。
論文参考訳（メタデータ） (Sat, 03 May 2025 09:32:41 GMT)
Multi-Scale Target-Aware Representation Learning for Fundus Image Enhancement [11.7]
高品質の眼底画像は、臨床検診や眼科疾患の診断に欠かせない解剖学的情報を提供する。近年は、眼底画像の強化が有望な進展をみせている。本稿では,効率的なファンドス画像強調のためのMTRL-FIE(Multi-scale target-aware representation learning framework)を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 14:25:48 GMT)
Enhancing Black-Litterman Portfolio via Hybrid Forecasting Model Combining Multivariate Decomposition and Noise Reduction [11.6]
本稿では,SSA,MA-EMD,TNを組み合わせたハイブリッドディープラーニングモデルを提案する。我々は、NASDAQ100指数から20の代表株を用いて投資ポートフォリオを構築する。ハイブリッド予測モデルとブラック・リッターマンモデルを組み合わせることで、生成された投資ポートフォリオは、より良いリターンとリスクコントロール能力を示す。
論文参考訳（メタデータ） (Sat, 03 May 2025 10:52:57 GMT)
CLR-Wire: Towards Continuous Latent Representations for 3D Curve Wireframe Generation [11.4]
CLR ContinuousWireは曲線をパラメトリック曲線としてエンコードし、パラメトリック曲線を連続的で固定された潜在空間に変換する。この統一されたアプローチは幾何学と位相の両方を生成する。
論文参考訳（メタデータ） (Sat, 03 May 2025 07:24:20 GMT)
RESAnything: Attribute Prompting for Arbitrary Referring Segmentation [11.2]
任意の参照表現セグメンテーション(RES)のためのオープン語彙とゼロショット法を提案する。私たちのモデルはRESAnythingと呼ばれ、Chain-of-Thoughts (CoT)推論を利用しています。我々は、パートレベルの任意のRESソリューションを評価するために、3Kを慎重にキュレートしたRESインスタンスを提供するために、新しいベンチマークデータセットをコントリビュートします。
論文参考訳（メタデータ） (Sat, 03 May 2025 15:19:20 GMT)
Backdoor Attacks Against Patch-based Mixture of Experts [11.1]
バックドア攻撃に対する画像分類のためのパッチベースMOE(pMoE)モデルの脆弱性について検討する。我々の研究は、pMoEモデルがバックドア攻撃の影響を受けやすいことを示している。 5つのエポックのモデルを微調整すると、攻撃成功率は2.1%に低下し、精度は1.4%に低下する。
論文参考訳（メタデータ） (Sat, 03 May 2025 12:48:04 GMT)
ABE: A Unified Framework for Robust and Faithful Attribution-Based Explainability [11.0]
InterpretDLやOmniXAIといった既存のフレームワークは、複数の属性メソッドを統合するが、スケーラビリティの制限、高い結合性、理論的制約、ユーザフレンドリな実装の欠如に悩まされている。本稿では,Attribution-based Explainability (ABE)を提案する。これは,基本的なAttribution Methodsを形式化し,最先端のAttributionアルゴリズムを統合する統合フレームワークである。
論文参考訳（メタデータ） (Sat, 03 May 2025 12:00:59 GMT)
A Dual-Task Synergy-Driven Generalization Framework for Pancreatic Cancer Segmentation in CT Scans [10.6]
膵癌は、その顕著な有病率と死亡率によって特徴づけられ、正確な病変の脱線を要求される。本稿では, ピクセルレベルの分類と回帰処理を相乗化して, 病変を正確に記述する一般化フレームワークを提案する。膵癌分節タスクの難易度を9.51%改善した。
論文参考訳（メタデータ） (Sat, 03 May 2025 00:54:00 GMT)
Accelerating Volumetric Medical Image Annotation via Short-Long Memory SAM 2 [10.3]
ショートロングメモリSAM 2 (SLM-SAM 2) は、セグメント化精度を向上させるために、異なる短期記憶バンクと長期記憶バンクを統合する新しいアーキテクチャである。臓器, 骨, 筋肉の3つの公開データセットからSLM-SAM 2をMRIおよびCTで評価した。
論文参考訳（メタデータ） (Sat, 03 May 2025 16:16:24 GMT)
PosePilot: Steering Camera Pose for Generative World Models with Self-supervised Depth [9.7]
生成的世界モデルにおけるカメラポーズ制御性を著しく向上する軽量かつ強力なフレームワークであるPosePilotを紹介する。具体的には、自己教師付き深度と読み出しのポーズを組み、ビデオシーケンスから直接深度と相対カメラの動きを推測する。自律運転と一般ドメインのビデオデータセットの実験は、PosePilotが構造的理解とモーション推論を大幅に強化することを示した。
論文参考訳（メタデータ） (Sat, 03 May 2025 07:51:46 GMT)
Pseudo-Boolean Proof Logging for Optimal Classical Planning [9.7]
擬似ブール制約に基づく下界証明書を生成するための一般的なフレームワークについて述べる。 A*$アルゴリズムを改良して,過度なオーバーヘッドで最適性の証明を生成する方法を示す。
論文参考訳（メタデータ） (Sat, 03 May 2025 00:44:16 GMT)
Parallel Split Learning with Global Sampling [9.6]
クライアント側バッチサイズを動的に調整することで,グローバルバッチサイズを一定に保つサーバ駆動サンプリング戦略を導入する。これにより、参加するデバイスの数から有効なバッチサイズを分離し、グローバルなバッチが全体のデータ分散をよりよく反映できるようにする。ベンチマークデータセットにおける実験結果から,提案手法はモデルの精度,訓練効率,収束安定性を向上することを確認した。
論文参考訳（メタデータ） (Sat, 03 May 2025 18:37:58 GMT)
Causally Fair Node Classification on Non-IID Graph Data [9.4]
本稿では,フェアネスを考慮したMLアルゴリズムにおける課題について述べる。非IID、グラフベースの設定の見落としている領域に取り組みます。因果推論のためのメッセージパッシング変分オートエンコーダを開発した。
論文参考訳（メタデータ） (Sat, 03 May 2025 02:05:51 GMT)
A Generalised and Adaptable Reinforcement Learning Stopping Method [9.3]
本稿では、強化学習(RL)に基づく技術支援レビュー(TAR)停止手法を提案する。以前のアプローチでは、リコールやコストの最大化のために、ターゲットリコールとトレードオフの修正など、動作の停止を限定的に制御していた。これらの制限は、単一のモデルを複数のターゲットリコールに適用できる新しいRL環境であるGRLStopを導入することで克服される。
論文参考訳（メタデータ） (Sat, 03 May 2025 19:24:40 GMT)
RAGAR: Retrieval Augment Personalized Image Generation Guided by Recommendation [9.3]
我々は、レコメンデーション(RAGAR)でガイドされた検索機能拡張パーソナライズされた画像ジェネレーションを提案する。提案手法では,参照項目との類似性に応じて,異なる重み付けを過去の項目に割り当てるための検索機構を用いる。 RAGARは、パーソナライゼーションとセマンティックメトリクスの両方において、5つのベースラインに比べて大幅に改善されている。
論文参考訳（メタデータ） (Sat, 03 May 2025 02:20:30 GMT)
CoDe: Blockwise Control for Denoising Diffusion Models [9.2]
下流タスクへの拡散モデルをアライメントするには、しばしば推論時に新しいモデルや勾配に基づくガイダンスを微調整する必要がある。本研究では,制御デノイング(CoDe)と呼ばれる単純な推論時間勾配自由誘導手法について検討する。 CoDeは中間復調段階に適用されるブロックワイズサンプリング手法であり、下流の報酬とアライメントすることができる。
論文参考訳（メタデータ） (Sat, 03 May 2025 14:56:26 GMT)
DualDiff: Dual-branch Diffusion Model for Autonomous Driving with Semantic Fusion [9.2]
マルチビュー駆動シーン生成のための2分岐条件拡散モデルであるDualDiffを提案する。 Occupancy Ray Sampling (ORS) という意味豊かな3次元表現を数値駆動シーン表現とともに導入する。モーダル間の情報統合を改善するために,モーダル間の特徴の整合・融合を行うセマンティック・フュージョン・アテンション(SFA)機構を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 16:20:01 GMT)
Semantic Intelligence: Integrating GPT-4 with A Planning in Low-Cost Robotics [8.9]
本稿では,ROS2 Humbleで動作する低コストロボットプラットフォーム上で,GPT-4のセマンティック推論をA*と統合するフレームワークを提案する。本稿では,まず資源目標へのナビゲートを行い,次に最終目的地に安全に到達するなど,シーケンシャルなタスクの多段階推論を実証する。その結果、A* は基本経路生成や障害物回避においてより高速で精度が高いが、GPT-4 統合システムは純粋幾何学的プランナーでは不可能なセマンティックタスクにおいて高い成功率 (96-100%) を達成することがわかった。
論文参考訳（メタデータ） (Sat, 03 May 2025 21:49:14 GMT)
Faster logconcave sampling from a cold start in high dimension [8.7]
評価オラクルによって指定された任意の対数凹密度をサンプリングするウォームスタートを高速に生成するアルゴリズムを提案する。それまでの長い作業のラインは、少なくとも1次元の線形の温かいスタートのペナルティを招き、立方体の障壁を打った。
論文参考訳（メタデータ） (Sat, 03 May 2025 22:14:04 GMT)
LogDB: Multivariate Log-based Failure Diagnosis for Distributed Databases (Extended from MultiLog) [8.2]
分散データベースに特化して設計されたログベースの故障診断手法であるLogDBを提案する。 LogDBは各データベースノードでログ機能を抽出して圧縮し、マスタノードでこれらの機能を集約して、クラスタ全体の異常を診断する。
論文参考訳（メタデータ） (Sat, 03 May 2025 03:56:40 GMT)
RiskLabs: Predicting Financial Risk Using Large Language Model based on Multimodal and Multi-Sources Data [7.8]
RiskLabsは、大規模言語モデル(LLM)を活用して、財務リスクを分析し予測する新しいフレームワークです。マーケットのボラティリティと分散の両方を予測する上で,リスクラボの有効性が実証された。
論文参考訳（メタデータ） (Sat, 03 May 2025 01:01:19 GMT)
An LLM-Empowered Low-Resolution Vision System for On-Device Human Behavior Understanding [7.6]
低解像度HBUをサポートするために設計された新しい省力化システムLlambdaを提案する。中心となる考え方は、限られたラベル付きデータと大量のラベルなしデータを活用して、情報キャプションを生成するためにLLMをガイドすることである。 Llambdaは、Bert-Scoreの平均で40.03%まで、最先端のLVLMシステムを上回っている。
論文参考訳（メタデータ） (Sat, 03 May 2025 08:46:04 GMT)
LipidBERT: A Lipid Language Model Pre-trained on METiS de novo Lipid Library [7.4]
我々はMETiSのin-house de novolip generationアルゴリズムを用いて1000万個の仮想脂質のデータベースを作成し,維持する。これらの仮想脂質は、事前訓練、脂質表現学習、下流タスク知識伝達のためのコーパスとして機能する。本稿では,Masked Language Model (MLM) と各種二次タスクを事前学習した BERT ライクなモデルである LipidBERT を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 13:06:16 GMT)
Towards Trustworthy Federated Learning with Untrusted Participants [7.3]
本稿では,各作業員が未知のランダムなシードを共有することにより,仮定が大幅に弱まることを示す。悪質な労働者が信頼できないサーバと衝突する可能性のある環境では、ロバスト勾配集約と相関ノイズ注入を統合するアルゴリズムであるCafCorを提案する。我々は,CafCorが強力なプライバシ・ユーティリティ・トレードオフを実現し,信頼を前提としないローカル・ディファレンシャル・プライバシ(DP)手法を著しく上回っていることを証明した。
論文参考訳（メタデータ） (Sat, 03 May 2025 17:35:47 GMT)
Enhancing End Stage Renal Disease Outcome Prediction: A Multi-Sourced Data-Driven Approach [7.2]
10,326人のCKD患者のデータを利用して,2009年から2018年までの臨床とクレーム情報を組み合わせた。 24ヶ月の観測窓は早期検出と予測精度のバランスをとるのに最適であると同定された。 2021年のeGFR方程式は予測精度を改善し、特にアフリカ系アメリカ人の偏見を低減した。
論文参考訳（メタデータ） (Sat, 03 May 2025 03:34:49 GMT)
Bayesian learning of the optimal action-value function in a Markov decision process [7.2]
私たちは、モデリングから推論、意思決定まで、完全なベイズ的なフレームワークを提供しています。推論のために,緩やかな後部分布の列をサンプリングし,調整するために,適応的な連続モンテカルロアルゴリズムを提案する。一般的に行われているが、マルチアームバンディット問題からのトンプソンサンプリングの一般化であることを示す新しい洞察を提供する。
論文参考訳（メタデータ） (Sat, 03 May 2025 16:37:14 GMT)
From Attack to Protection: Leveraging Watermarking Attack Network for Advanced Add-on Watermarking [7.1]
マルチビット透かし(MW)は、透かし攻撃に対する耐性を高めるように設計されている。ベンチマークツールは透かし画像への模擬攻撃によってこの堅牢性を評価するために存在する我々は,MWシステム内の脆弱性を悪用するように設計された,完全トレーニング可能な透かしベンチマークツールである透かし攻撃ネットワーク(WAN)を導入する。
論文参考訳（メタデータ） (Sat, 03 May 2025 21:52:43 GMT)
CFCPalsy: Facial Image Synthesis with Cross-Fusion Cycle Diffusion Model for Facial Paralysis Individuals [7.0]
本研究の目的は、このギャップに対処するために、高品質な顔面麻痺データセットを合成することである。拡散モデルに基づく新しいクロスフュージョンサイクルPalsy式生成モデル(PalsyCFC)を提案する。顔面麻痺の一般的な臨床データセットについて, 定性的, 定量的に検討した。
論文参考訳（メタデータ） (Sat, 03 May 2025 07:07:33 GMT)
Conformal Transformations for Symmetric Power Transformers [6.9]
線形注意を持つ変圧器はソフトマックスベースの変圧器よりも計算上の優位性があるが、しばしば劣化性能に悩まされる。本稿では,データ依存型乗算ゲーティングを用いてキャパシティを解放し,データ依存型回転埋め込みを用いて情報を適応的に記憶する共形シンポウ変換器を提案する。 LongCrawl64データセットの予備実験では、共形シンポウはシンポウトランスフォーマーの限界を克服し、スケールしたトレーニングと評価コンテキストにわたって堅牢なパフォーマンスを実現する。
論文参考訳（メタデータ） (Sat, 03 May 2025 05:24:08 GMT)
Runtime Anomaly Detection for Drones: An Integrated Rule-Mining and Unsupervised-Learning Approach [6.9]
UAVは複数のセンサー入力に依存しており、物理的不安定性と深刻な安全上の懸念を引き起こす可能性がある。 LSTMニューラルネットワークに基づく最近の異常検出手法は有望な結果を示しているが、3つの課題が続いている。これらの課題に触発された本研究では、ドローンの異常検出に対する統合的なアプローチであるRADDを紹介する。
論文参考訳（メタデータ） (Sat, 03 May 2025 23:48:50 GMT)
M2PDE: Compositional Generative Multiphysics and Multi-component PDE Simulation [6.8]
拡散モデルを用いた多成分PDEシミュレーション(M2PDE)を提案する。拡散に基づくトレーニング中、M2PDEは、他のプロセス/コンポーネントで条件付けられた1つの物理プロセス/コンポーネントの条件確率をモデル化したエネルギー関数を学ぶ。推測において、M2PDEは、結合確率分布からサンプリングすることで、結合した多物理および多成分解を生成する。
論文参考訳（メタデータ） (Sat, 03 May 2025 08:27:18 GMT)
Enhancing the Learning Experience: Using Vision-Language Models to Generate Questions for Educational Videos [6.7]
教育ビデオの学習指向質問生成における視覚言語モデルの有用性について検討する。本研究は,現状の視覚言語モデルの有効性を概説し,課題の微調整と解決の必要性を浮き彫りにした。
論文参考訳（メタデータ） (Sat, 03 May 2025 11:37:31 GMT)
Quantum Many-body Simulations from a Reinforcement-Learned Exponential Ansatz [6.6]
多体波動関数の解法は、古典デバイスと量子デバイスの両方において重要な課題である。波動関数に対する完全で普遍的な2体指数アンサッツは、シュル・オーディンガー方程式(CSE)の解から生成されることが示されている。ここでは、CSEの解法と強化学習(RL)と呼ばれる人工知能の形式を組み合わせて、高度にコンパクトな回路を生成する。
論文参考訳（メタデータ） (Sat, 03 May 2025 22:07:21 GMT)
Same evaluation, more tokens: On the effect of input length for machine translation evaluation using Large Language Models [6.5]
大規模言語モデル(LLM)は、MQMエラースパンアノテーションを介して、信頼性が高く解釈可能な文レベルの翻訳評価器として機能する。評価はテキスト長に不変であることを示し、入力の粒度に関わらず一貫した誤差スパンを生成する。我々は、粒度整合プロンプト、FSP(Focus Sentence Prompting)、LCMと評価タスクの整合性を改善するための微調整アプローチなど、いくつかの戦略を評価する。
論文参考訳（メタデータ） (Sat, 03 May 2025 09:30:26 GMT)
Attention to Detail: Fine-Scale Feature Preservation-Oriented Geometric Pre-training for AI-Driven Surrogate Modeling [6.3]
AI駆動サロゲートモデリングは、3D設計、分析、製造のための物理ベースのシミュレーションの代替として、ますます効果的になっている。本研究は,非パラメトリック3次元モデルから微細な幾何学的特徴を捉えるための自己教師付き幾何学的表現学習手法を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 12:01:02 GMT)
A brain-inspired generative model for EEG-based cognitive state identification [6.2]
本稿では、インパルスアテンションニューラルネットワークと変分オートエンコーダを融合した脳誘発生成モデルを提案する。勾配に基づく学習とヘテロ連想記憶を統合することによってモデルを訓練するためのハイブリッド学習法を提案する。 2つのパブリックEEGデータセットの実験結果は、BIGモデルが89%以上の分類精度を達成することを示した。
論文参考訳（メタデータ） (Sat, 03 May 2025 04:29:27 GMT)
Infinite Width Limits of Self Supervised Neural Networks [6.2]
NTKと自己教師型学習のギャップを埋め、Barlow Twinsの損失下で訓練された2層ニューラルネットワークに焦点を当てる。ネットワークの幅が無限大に近づくと、バーロウ・ツインズのNTKは確かに一定となる。
論文参考訳（メタデータ） (Sat, 03 May 2025 16:04:27 GMT)
$\textit{New News}$: System-2 Fine-tuning for Robust Integration of New Knowledge [6.1]
我々は,複数のドメインにまたがる仮説的かつ妥当なニュースからなるデータセットである$textitNew News$を紹介した。我々は,文脈を伴わないモデルから知識を抽出し,文脈を伴わないモデルの重みに組み込むための,セルフプレイデータ生成プロトコルのスイートを探索する。以上の結果から,Sys2-FTの自己QAプロトコルは,モデルによるニュースの重み付け学習を大幅に改善することが示された。
論文参考訳（メタデータ） (Sat, 03 May 2025 12:49:35 GMT)
SMUTF: Schema Matching Using Generative Tags and Hybrid Features [6.0]
大規模データスキーママッチング(SM)のためのユニークなアプローチであるSMUTFを紹介する。教師あり学習は、オープンドメインタスクのパフォーマンスに影響を及ぼさないと仮定する。人道交換言語にインスパイアされた革新的な適応では、各データ列に「生成タグ」を配置します。
論文参考訳（メタデータ） (Sat, 03 May 2025 07:53:12 GMT)
Morello: Compiling Fast Neural Networks with Dynamic Programming and Spatial Compression [6.0]
本稿では,大規模なプログラム仕様をより小さな仕様に分解することで,検索空間をより深く探求するための動的プログラミングに基づくアプローチを提案する。メモリ要求を減らすために,Z_geq 0$の座標で仕様をインデックス化し,同一の隣接解を圧縮する,新しいメモ表表現を用いる。
論文参考訳（メタデータ） (Sat, 03 May 2025 00:14:31 GMT)
DRSLF: Double Regularized Second-Order Low-Rank Representation for Web Service QoS Prediction [6.0]
QoS(Quality-of-Service)データは、クラウドサービスの選択において重要な役割を果たす。ユーザはすべてのサービスにアクセスすることができないので、高次元かつ不完全な(HDI)行列で表すことができる。本稿では,2つの鍵となるアイデアを持つ二重正則化2次潜在因子(DRSLF)モデルを提案する。 2つの実世界の応答時間データセットの実験結果から、DRSLFは2つのベースラインよりも低ランク表現能力が高いことが示された。
論文参考訳（メタデータ） (Sat, 03 May 2025 02:25:05 GMT)
Fair Clustering with Clusterlets [5.8]
小さくて公平なクラスタセットが与えられた場合、自明なセントロイドベースのクラスタリングアルゴリズムは、公正なクラスタリングをもたらす。適切な開始クラスタリングを見つけるのは計算コストがかかるが、複雑か任意かのどちらかである。本稿では,単一クラスタにマッチし,公平なクラスタリングを最適化する,単純なEmphclusterletベースのファジィクラスタリングアルゴリズムを提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 17:00:54 GMT)
Towards a Value-Complemented Framework for Enabling Human Monitoring in Cyber-Physical Systems [5.8]
この研究プレビューは、システム設計中にプライバシ、セキュリティ、セルフダイレクトを組み込むことの重要性に焦点を当てている。目標は、機能的および非機能的な監視要件を人間の値に結び付けて、値、要求、アクター間のトレーサビリティを確立することです。
論文参考訳（メタデータ） (Sat, 03 May 2025 10:19:36 GMT)
GauS-SLAM: Dense RGB-D SLAM with Gaussian Surfels [5.7]
GauS-SLAMは2次元ガウス波を利用した高密度RGB-D SLAMシステムである。 GauS-SLAMは同等の手法より優れており、追跡精度とレンダリング精度が優れている。
論文参考訳（メタデータ） (Sat, 03 May 2025 22:02:20 GMT)
Seeing Heat with Color -- RGB-Only Wildfire Temperature Inference from SAM-Guided Multimodal Distillation using Radiometric Ground Truth [5.3]
本稿では,RGB入力のみを用いた画素レベルの山火事温度予測とセグメンテーションのための新しいフレームワークSAM-TIFFを紹介する。対のRGB-サーマル画像とラジオメトリックのTIFF地上真実を訓練したマルチモーダル教師ネットワークは、知識を単調なRGB学生ネットワークに蒸留し、熱センサレス推論を可能にする。提案手法は,RGB UAVデータから画素あたりの温度レグレッションを初めて行い,最近のFLAME 3データセットに強い一般化を示すものである。
論文参考訳（メタデータ） (Sat, 03 May 2025 00:23:11 GMT)
Improving Phishing Email Detection Performance of Small Large Language Models [5.2]
大規模言語モデル(LLM)は多くの自然言語処理(NLP)タスクにおいて顕著な性能を示した。しかし、性能の良いLLMは典型的には数十億または数千億のパラメータを含み、膨大な計算資源を必要とする。
論文参考訳（メタデータ） (Sat, 03 May 2025 13:08:45 GMT)
T-REX: Vision-Based System for Autonomous Leaf Detection and Grasp Estimation [5.1]
T-Rexは、温室環境における葉の自律的局在化、選択、把握のために開発されたガントリーベースのロボットシステムである。このシステムは6自由度マニピュレータとステレオビジョンパイプラインを統合して、ターゲットの葉を識別し、相互作用する。
論文参考訳（メタデータ） (Sat, 03 May 2025 02:17:45 GMT)
AI-Driven Healthcare: A Review on Ensuring Fairness and Mitigating Bias [4.9]
本稿では、医療におけるAIの統合について検討し、バイアスに関連する重要な課題と緩和戦略について述べる。公平な医療提供を確保するためには、多様なデータセット、公平性に配慮したアルゴリズム、規制フレームワークの必要性を強調します。論文は、今後の研究への推奨、学際的アプローチの提唱、AI意思決定における透明性、革新的で包括的なAIアプリケーションの開発で締めくくっている。
論文参考訳（メタデータ） (Sat, 03 May 2025 15:15:12 GMT)
In-situ and Non-contact Etch Depth Prediction in Plasma Etching via Machine Learning (ANN & BNN) and Digital Image Colorimetry [4.9]
本研究では機械学習(ML)技術に基づく非接触・その場エッチング深度予測フレームワークを提案する。最初のシナリオでは、プロセスパラメータから平均エッチング深さを予測するために、人工知能ニューラルネットワーク(ANN)が訓練される。第2のシナリオでは、エッチング深度予測の入力としてデジタル画像色度測定(DIC)からRGBデータを使用することの可能性を示す。
論文参考訳（メタデータ） (Sat, 03 May 2025 14:43:19 GMT)
Intelligently Augmented Contrastive Tensor Factorization: Empowering Multi-dimensional Time Series Classification in Low-Data Environments [4.8]
我々は、多機能でデータ効率のよいフレームワークITA-CTF(Intelligently Augmented Contrastive Factorization)を提案する。 ITA-CTFモジュールは多次元時系列から効率的な表現を学習する。類似性学習とクラス認識に対する新しい対照的な損失最適化が組み込まれている。標準およびいくつかのDLベンチマークと比較して、注目すべきパフォーマンス改善は18.7%に達した。
論文参考訳（メタデータ） (Sat, 03 May 2025 11:28:13 GMT)
The Memory Paradox: Why Our Brains Need Knowledge in an Age of AI [4.5]
本稿では、神経科学と認知心理学に基づいて、AIシステムへの重度依存が、宣言的記憶と手続き的記憶の融合を損なう可能性について検討する。我々は、"グロキング"のような深層学習現象と過度学習と直観の神経科学との顕著な類似点を強調した。本稿は、大規模言語モデルの時代における教育と労働訓練の政策的意味を結論付けている。
論文参考訳（メタデータ） (Sat, 03 May 2025 03:41:33 GMT)
Embedding based retrieval for long tail search queries in ecommerce [4.2]
我々はBest Buyでセマンティックプロダクト検索を実装するための一連の最適化を提案する。最初の最適化は、変換信号の空間性を改善するために、大きな言語モデルを使用することである。 2つめの最適化は、Best Buyカタログデータに基づいて、既製のトランスフォーマーベースのモデルを事前学習することである。
論文参考訳（メタデータ） (Sat, 03 May 2025 23:47:15 GMT)
AquaGS: Fast Underwater Scene Reconstruction with SfM-Free Gaussian Splatting [4.0]
本研究では,SeaThruアルゴリズムに基づくSfMのない水中シーン再構築モデルであるAquaGSを紹介する。本モデルでは,画像入力をわずか3秒で30秒で高精度に再現できる。
論文参考訳（メタデータ） (Sat, 03 May 2025 12:05:57 GMT)
CAMOUFLAGE: Exploiting Misinformation Detection Systems Through LLM-driven Adversarial Claim Transformation [4.0]
既存のブラックボックステキストベースの敵攻撃は、証拠に基づく誤情報検出システムには不適である。本稿では,2エージェントシステムを用いた反復的LCM駆動型アプローチであるCAMOUFLAGEについて述べる。最近の2つの学術システムと2つの実世界のAPIを含む4つのシステムでCAMOUFLAGEを評価し、平均的な攻撃成功率は46.92%である。
論文参考訳（メタデータ） (Sat, 03 May 2025 19:14:24 GMT)
CVVNet: A Cross-Vertical-View Network for Gait Recognition [3.9]
本稿では,頑健な縦方向歩行認識のための周波数アグリゲーションアーキテクチャCVVNetを提案する。 CVVNetは最先端のパフォーマンスを達成し、DroneGaitは8.6%、Gait3Dは2%だった。
論文参考訳（メタデータ） (Sat, 03 May 2025 14:53:20 GMT)
Leveraging Unlabeled Data Sharing through Kernel Function Approximation in Offline Reinforcement Learning [3.9]
オフライン強化学習(RL)は、固定データセットからポリシーを学ぶが、しばしば大量のデータを必要とする。本稿では,カーネル関数近似を用いたオフラインRL法において,ラベルなしデータを利用するアルゴリズムを提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 07:34:23 GMT)
Quantum Speedup for Hypergraph Sparsification [3.5]
Apers and de Wolf(FOCS'20)によるオープン問題に対処する,ハイパーグラフスカラー化のための最初の量子アルゴリズムを提案する。 n$頂点、$m$ハイパーエッジ、およびランク$r$の重み付きハイパーグラフに対して、我々のアルゴリズムは、時間$widetilde O(rsqrtmn/varepsilon)$で、ほぼ直線サイズの$varepsilon$-spectral sparsifierを出力する。このアルゴリズムは定数$r$の量子ローバウンドと一致し、状態と比較した場合の量子スピードアップを示す。
論文参考訳（メタデータ） (Sat, 03 May 2025 09:33:46 GMT)
Automated Sentiment Classification and Topic Discovery in Large-Scale Social Media Streams [3.5]
本稿では,Twitterの言論の大規模感情分析とトピック分析のためのフレームワークを提案する。私たちのパイプラインは、コンフリクト固有のキーワードを使用して、ターゲットデータ収集から始まります。タイムスタンプ,位置情報,語彙内容などの情緒的特徴と文脈的特徴の関係について検討した。
論文参考訳（メタデータ） (Sat, 03 May 2025 18:04:57 GMT)
CLOG-CD: Curriculum Learning based on Oscillating Granularity of Class Decomposed Medical Image Classification [3.4]
クラス分解アプローチは、データセットのクラス内の境界を学習することで、問題の解決に有望な結果を示している。 CLOG-CDと呼ばれるカリキュラム学習戦略とクラス分解アプローチに基づく新しいCNNトレーニング手法を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 08:36:41 GMT)
On the quantum dynamics of long-ranged Bose-Hubbard Hamiltonians [3.3]
ボース=ハバード・ハミルトニアンによって生じる量子力学を、長距離(電力法則)項で研究する。長距離・非有界な項を扱うため,最近の研究で導入されたマルチスケールASTLO法をさらに発展させる。
論文参考訳（メタデータ） (Sat, 03 May 2025 11:07:23 GMT)
Rank-One Modified Value Iteration [3.0]
マルコフ決定過程の計画と学習問題を解決するための新しいアルゴリズムを提案する。提案アルゴリズムは、計画と学習の両問題に対して、一階アルゴリズムとそれらの高速化バージョンを一貫して上回っていることを示す。
論文参考訳（メタデータ） (Sat, 03 May 2025 14:06:50 GMT)
Third-party compliance reviews for frontier AI safety frameworks [3.0]
本稿では、サードパーティのコンプライアンスレビューという潜在的な解決策を探求する。独立した外部当事者は、フロンティアAI会社がその安全フレームワークに準拠しているかどうかを評価する。
論文参考訳（メタデータ） (Sat, 03 May 2025 00:53:55 GMT)
M-ary Precomputation-Based Accelerated Scalar Multiplication Algorithms for Enhanced Elliptic Curve Cryptography [2.9]
本稿では,M-aryプレ計算に基づくスカラー乗算アルゴリズムを提案し,計算効率とメモリ使用量の両方を最適化することを目的とした。 ElGamal暗号化とNS3ベースの通信シミュレーションの実験は、その有効性を検証する。バイナリ最適化された変種は、secp384r1で通信時間を22.1%削減し、secp521r1でシミュレーション時間を25.4%短縮する。
論文参考訳（メタデータ） (Sat, 03 May 2025 15:18:54 GMT)
Solving Copyright Infringement on Short Video Platforms: Novel Datasets and an Audio Restoration Deep Learning Pipeline [2.8]
YouTube ShortsやTikTokのようなショートビデオプラットフォームは、著作権の遵守という大きな課題に直面している。侵害者は、しばしば任意のバックグラウンド音楽(BGM)を、不明瞭なオリジナルサウンドトラック(OST)に埋め込む。音楽音源分離(MSS)と相互モーダルビデオ音楽検索(CMVMR)を統合した新しいパイプラインを提案する。提案手法は、任意のBGMを元のOSTから効果的に分離し、真のビデオオーディオトラックの復元を可能にする。
論文参考訳（メタデータ） (Sat, 03 May 2025 12:54:39 GMT)
A Novel WaveInst-based Network for Tree Trunk Structure Extraction and Pattern Analysis in Forest Inventory [2.8]
本研究では、離散ウェーブレット変換を含む新しいWaveInstインスタンスセグメンテーションフレームワークを提案し、ツリー構造抽出を改善する。提案モデルの実験結果から,SynthTree43k,CaneTree100,Urban Street,PoplarDatasetの性能が向上した。提案手法は, 成熟樹と若葉樹の構造抽出における平均精度を49.6および24.3とし, 既存手法を9.9倍に上回った。
論文参考訳（メタデータ） (Sat, 03 May 2025 02:19:55 GMT)
OODTE: A Differential Testing Engine for the ONNX Optimizer [2.7]
OODTEは単純で効果的な差分テストと評価のアプローチに従う。我々は15の問題を検知した。そのうち14は以前にも知られていなかったもので、クラッシュと精度の偏差に関連していた。
論文参考訳（メタデータ） (Sat, 03 May 2025 18:54:30 GMT)
Wasserstein Distributionally Robust Estimation in High Dimensions: Performance Analysis and Optimal Hyperparameter Tuning [2.5]
分散ロバスト最適化(DRO)は不確実性の下での見積もりの強力なフレームワークとなっている。本稿では,DROに基づく線形回帰法を提案し,その中心的問題,すなわちロバストネス半径を最適に選択する方法を提案する。本手法はクロスバリデーションと同じ効果を示すが,計算コストのごく一部で実現可能であることを示す。
論文参考訳（メタデータ） (Sat, 03 May 2025 03:39:56 GMT)
CMAWRNet: Multiple Adverse Weather Removal via a Unified Quaternion Neural Architecture [2.2]
画像やビデオ検索、屋外監視、自動運転といった現実世界のアプリケーションで使用される画像は、悪天候に悩まされている。この研究は、CMAWRNetと呼ばれる統合四元数ニューラルネットワークを用いて、複数の悪天候除去のための効率的なソリューションを開発することに焦点を当てている。これは、新しいテクスチャ構造分解ブロック、新しい軽量エンコーダ・デコーダ四元変圧器アーキテクチャ、低光補正の減衰融合ブロックに基づいている。
論文参考訳（メタデータ） (Sat, 03 May 2025 18:02:19 GMT)
Discrete Spatial Diffusion: Intensity-Preserving Diffusion Modeling [2.2]
本研究では,離散空間領域で直接動作する連続時間離散状態ジャンププロセスに基づくフレームワークを提案する。空間拡散を用いて空間保存を行い、離散的な定式化によって自然に導入する。画像合成,クラスコンディショニング,画像インパインティングを,画像強度の条件付け機能を備えた広く使用されている画像ベンチマークで行うことで,DSDの表現的柔軟性を実証する。
論文参考訳（メタデータ） (Sat, 03 May 2025 20:37:39 GMT)
Adversarial Robustness of Deep Learning Models for Inland Water Body Segmentation from SAR Images [2.1]
SAR(Synthetic Aperture Radar)画像からの内陸水域のセグメンテーションは,洪水マッピングなどのいくつかのアプリケーションに必要な重要な課題である。本研究では,U-Netモデルに対する逆攻撃の形で手動エラーをシミュレートし,アノテーションによる人間の誤りに対するモデルの堅牢性について検討する。以上の結果から,U-Netはパフォーマンスが著しく低下する前にある程度の汚職を許容できることが示唆された。
論文参考訳（メタデータ） (Sat, 03 May 2025 18:18:59 GMT)
One Documentation Does Not Fit All: Case Study of TensorFlow Documentation [2.1]
本研究では,これらのアーティファクトを分析し,質問のタイプや背景を理解するために,チュートリアルやアーティファクトの傾向を検討した。その結果,質問内容や内容に有意な差は認められなかった。結果から,問題のうち24.9%はエラーや例外に関係しており,64.3%は文書の不十分な例と非汎用的な例に関係していることがわかった。
論文参考訳（メタデータ） (Sat, 03 May 2025 22:22:00 GMT)
ImageR: Enhancing Bug Report Clarity by Screenshots [2.1]
私たちは、スクリーンショットを含む潜在的なメリットを評価するために、イシューレポートを分析するAIモデルとツールであるImageRを紹介します。 ImageRは、関連したビジュアルを積極的に提案することで、イシューレポートをより明確で、より情報的で、時間効率の高いものにすることを目指している。我々は、6,235のBugzillaイシューからなるデータセットをキュレートし、公開し、それぞれに画像アタッチメントの種類を慎重にラベル付けした。
論文参考訳（メタデータ） (Sat, 03 May 2025 21:31:40 GMT)
Optimal Quantum Purity Amplification [2.1]
一般量子システムと大域雑音に対する最適QPAプロトコルを提案する。一般化された量子位相推定に基づくプロトコルの効率的な実装を提供する。数値シミュレーションはハミルトン進化の量子シミュレーションに適用したプロトコルの有効性を実証する。
論文参考訳（メタデータ） (Sat, 03 May 2025 02:55:06 GMT)
Unemployment Dynamics Forecasting with Machine Learning Regression Models [2.0]
本稿では、月次失業率データに回帰と機械学習の手法を適用し、タイムリーな予測を行う方法について検討した。私は、線形回帰、SGDRegressor、ランダムフォレスト、XGBoost、CatBoost、サポートベクター回帰、LSTMネットワークの7つのモデルを比較した。我々の研究は、現代の機械学習技術がリアルタイムの失業予測を強化し、経済学者や政策立案者が労働市場の動向についてより深い洞察を提供する方法を示している。
論文参考訳（メタデータ） (Sat, 03 May 2025 21:55:28 GMT)
VideoLLM Benchmarks and Evaluation: A Survey [1.9]
ビデオ理解ベンチマークの現況を考察し,その特徴,評価プロトコル,限界について考察する。これらのベンチマークにおいて,最新のビデオLLMの性能動向を強調し,現在の評価フレームワークにおける重要な課題を明らかにする。本調査は,ビデオLLMを効果的に評価する方法の構造化された理解と,大規模言語モデルによる映像理解の分野を前進させるための有望な道の特定を目的とした。
論文参考訳（メタデータ） (Sat, 03 May 2025 20:56:09 GMT)
PASCAL: Precise and Efficient ANN- SNN Conversion using Spike Accumulation and Adaptive Layerwise Activation [1.8]
Spiking Neural Networks(SNN)は、ニューラルネットワーク(ANN)に代わるエネルギー効率の高い代替手段として提案されている。 ANN-SNN変換は、ANNに匹敵する精度でディープSNNを実現するために広く使われている手法である。本研究では,ANN-SNN変換を行うPASCALを提案し,結果のSNNがQCFSアクティベーションを持つANNと数学的に等価であることを示す。
論文参考訳（メタデータ） (Sat, 03 May 2025 07:55:29 GMT)
Learning stochastic dynamics from snapshots through regularized unbalanced optimal transport [1.7]
少ない時間分解スナップショットからのサンプルを使用して動的に再構築することは、自然科学と機械学習の両方において重要な問題である。本稿では、正規化された不均衡な最適輸送(RUOT)を解き、観察されたスナップショットから連続的な不均衡なダイナミクスを推定するための新しいディープラーニング手法を提案する。本手法は,RUOT形式に基づいて,成長・死過程の事前知識や追加情報を必要とせず,これらのダイナミクスをモデル化する。
論文参考訳（メタデータ） (Sat, 03 May 2025 02:27:00 GMT)
An Analysis of Safety Guarantees in Multi-Task Bayesian Optimization [1.5]
本稿では,ベイズ最適化フレームワークへの追加情報ソースの統合について述べる。これらの情報ソース間の相互依存性は未知の相関行列を用いてモデル化される。最適化プロセス全体を通して制約満足度を維持するために、一様誤差境界をどのように調整する必要があるかを検討する。
論文参考訳（メタデータ） (Sat, 03 May 2025 07:50:39 GMT)
Positional Attention for Efficient BERT-Based Named Entity Recognition [1.2]
自然言語処理(NLP)における変換器(BERT)モデルからの双方向表現を利用した名前付きエンティティ認識(NER)フレームワークを提案する。本稿では、位置認識機構をエンティティ認識プロセスに統合し、事前学習パラメータを用いた効率的なカスタマイズを可能にするコスト効率の高いアプローチを提案する。この研究は、BERTベースのNERシステムのトレーニングコストを低減し、高精度を維持しつつ、実用的なソリューションを提供することによって、この分野に貢献する。
論文参考訳（メタデータ） (Sat, 03 May 2025 17:17:05 GMT)
PhytoSynth: Leveraging Multi-modal Generative Models for Crop Disease Data Generation with Novel Benchmarking and Prompt Engineering Approach [1.2]
既存の研究はGAN(Generative Adversarial Networks)ベースの画像と画像の翻訳に依存している。本研究では,合成作物病画像を生成するためのマルチモーダルテキスト・ツー・イメージ手法について検討する。
論文参考訳（メタデータ） (Sat, 03 May 2025 14:03:42 GMT)
Not Every Tree Is a Forest: Benchmarking Forest Types from Satellite Remote Sensing [1.2]
この研究は、多時間衛星データを用いたグローバルスケールのForest TYpesマッピングのベンチマークであるForTyを紹介する。ベンチマークは20万の時系列の画像パッチで構成され、それぞれがSentinel-2、Sentinel-1、気候、標高データで構成されている。コンボリューションニューラルネットワークやトランスフォーマーベースモデルなど,いくつかのベースラインモデルを用いて森林型データセットを評価する。
論文参考訳（メタデータ） (Sat, 03 May 2025 12:20:50 GMT)
Coherent State Assisted Entanglement Generation Between Quantum Memories [1.2]
本稿では,反射キャビティに基づく量子メモリ間の絡み合いをほぼ決定的に生成する弱いコヒーレント状態支援プロトコルを提案する。我々は、GHZ状態の一連のメモリを絡み合わせるためにプロトコルを拡張し、以前の単一光子ベースのプロトコルと比較して指数的なスピードアップをもたらすことを推測する。
論文参考訳（メタデータ） (Sat, 03 May 2025 18:34:08 GMT)
Balancing Interpretability and Flexibility in Modeling Diagnostic Trajectories with an Embedded Neural Hawkes Process Model [1.2]
ホークス過程(HP)は、イベントシーケンスを自己強化ダイナミクスでモデル化するのに一般的に用いられる。本稿では、イベント埋め込み空間において、ニューラルネットワークとしてインスタンス化されたフレキシブルなインパクトカーネルを定義することで、インパクト関数をモデル化する新しいHPを提案する。このアプローチは従来のHPよりも柔軟だが、他のニューラルネットワークアプローチよりも解釈可能である。
論文参考訳（メタデータ） (Sat, 03 May 2025 19:17:50 GMT)
Noise Augmented Fine Tuning for Mitigating Hallucinations in Large Language Models [1.1]
大規模言語モデル(LLM)は、しばしば不正確な、または誤解を招くコンテンツ・ハロシンを生成する。 noise-Augmented Fine-Tuning (NoiseFiT) は適応ノイズ注入を利用してモデルロバスト性を高める新しいフレームワークである。 NoiseFiTは、動的にスケールしたガウス雑音を用いて、高SNR(より堅牢)または低SNR(潜在的に過正規化)と同定された層を選択的に摂動する。
論文参考訳（メタデータ） (Sat, 03 May 2025 07:26:02 GMT)
Automated ARAT Scoring Using Multimodal Video Analysis, Multi-View Fusion, and Hierarchical Bayesian Models: A Clinician Study [1.0]
脳卒中リハビリテーションにおける上肢評価のための行動研究アームテスト(ARAT)のマニュアルスコアリングは時間集約的かつ変動的である。マルチモーダルビデオ解析をSlowFast, I3D, Transformerベースのモデルと統合した自動ARATスコアリングシステムを提案する。この研究は、クリニカルバリデーションを備えたスケーラブルで解釈可能なソリューションを提供することで、自動リハビリテーションを進める。
論文参考訳（メタデータ） (Sat, 03 May 2025 04:00:51 GMT)
An Affective-Taxis Hypothesis for Alignment and Interpretability [0.9]
AIアライメントは、エージェントが常に人間のオペレーターの目標と価値に沿って振る舞うようにすることを目的としている。本稿では,アライメント問題に対する感情主義的アプローチを提案する。我々は,AIアライメントにおける情緒的なタクシーの役割について論じる。
論文参考訳（メタデータ） (Sat, 03 May 2025 04:49:01 GMT)
Neural Orchestration for Multi-Agent Systems: A Deep Learning Framework for Optimal Agent Selection in Multi-Domain Task Environments [0.8]
マルチドメインタスク環境における最適なエージェント選択のためのニューラルネットワークフレームワークであるMetaOrchを提案する。ファジィ評価モジュールは、完全性、妥当性、信頼度に沿ってエージェント応答をスコアし、オーケストレータを訓練するためのソフトインスペクタラベルを生成する。異種剤を用いた模擬環境実験により, 提案手法が86.3%の選択精度を達成できた。
論文参考訳（メタデータ） (Sat, 03 May 2025 02:58:25 GMT)
Energy-Efficient NTT Sampler for Kyber Benchmarked on FPGA [0.8]
Kyberは、NIST Post-Quantum Cryptography (PQC)プロジェクトによって標準化のために選択された格子ベースの鍵カプセル化機構である。キーバーの鍵生成過程の重要な構成要素は、環 Rq 上の一様分布から行列要素のサンプリングである。このサンプリングに対する既存のアプローチは、リジェクションサンプリングに依存している。本稿では,SHAKE-128からRqの要素を生成するために必要な平均ビット数を実質的に生成するModified SampleNTTを提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 10:54:01 GMT)
Memory Assisted LLM for Personalized Recommendation System [0.7]
メモリアシストパーソナライズされたLLMは、ユーザのインタラクションを通じてユーザの好みをキャプチャする。推薦中、類似性に基づいて関連する記憶を抽出する。ユーザ履歴が大きくなるにつれて、MAPの利点は両方のシナリオで増大する。
論文参考訳（メタデータ） (Sat, 03 May 2025 06:24:18 GMT)
Certus: A domain specific language for confidence assessment in assurance cases [0.6]
本稿では,量的信頼度評価のためのドメイン固有言語であるCertusを紹介する。ユーザーはファジィセットで自信を記述し、曖昧だが言語的に意味のある用語を使って判断を表現できる。言語の概念を実証するために、Certusは自動車分野の作業例に適用される。
論文参考訳（メタデータ） (Sat, 03 May 2025 19:08:00 GMT)
Explainability by design: an experimental analysis of the legal coding process [0.6]
本稿では,断片化から始まり,Deontic Defeasible Logic ルールのセットに展開する,テクトitlegal code の方法論を提案する。様々な規範的背景を符号化する人間による一連の実験結果と、コーディングプロセスにおける取り組みを計測した対応する事例について示す。我々は、法律ドメインの知識、コーディングプロセスの知識、テキストの長さ、および法律参照のパスの長さを参照するテキスト深さの尺度などの要因に依存する、コーディングに必要な時間を予測する技術を提供する。
論文参考訳（メタデータ） (Sat, 03 May 2025 23:18:05 GMT)
OG-HFYOLO :Orientation gradient guidance and heterogeneous feature fusion for deformation table cell instance segmentation [0.6]
OG-HFYOLOモデルを提案し、グラディエント・オリエンテーション・アウェア・エクストラクタによるエッジ応答を向上させる。また,細粒度テーブルセル空間座標定位のためのデータセットのギャップを埋めるデータ生成器を提案する。実験により,本モデルが主流のインスタンスセグメンテーションモデルに対して優れたセグメンテーション精度を示すことが示された。
論文参考訳（メタデータ） (Sat, 03 May 2025 13:15:33 GMT)
Understanding University Students' Use of Generative AI: The Roles of Demographics and Personality Traits [0.6]
高等教育の学生は、伝統的な資源よりも生成的AI(GAI)を使う傾向が強い。アジアの学生は、より高いGAI使用率を報告し、より学術的な利益を認識し、より強い嗜好を表現している。黒人学生は、GAIが学業成績によりポジティブな影響を及ぼすと報告している。高い知能/想像力を持つ学生は伝統的な資源を好む傾向にある。
論文参考訳（メタデータ） (Sat, 03 May 2025 06:58:29 GMT)
Conformal Prediction for Indoor Positioning with Correctness Coverage Guarantees [0.5]
本稿では,深層学習に基づく屋内位置推定に共形予測(CP)を適用した。 CPはモデルの不確実性を非整合スコアに変換し、正確性を保証するために予測セットを構築し、統計的保証を提供する。このモデルは、トレーニングデータセットで約100%、テストデータセットで85%の精度を達成し、そのパフォーマンスと一般化能力を効果的に実証した。
論文参考訳（メタデータ） (Sat, 03 May 2025 12:45:08 GMT)
Problem-informed Graphical Quantum Generative Learning [0.4]
確率変数の共役確率分布を学習するための問題インフォームド量子回路Born Machine Ansatzを提案する。モデルの性能を従来の設計と比較し,問題に依存しない回路よりも優れていることを示す。
論文参考訳（メタデータ） (Sat, 03 May 2025 20:15:51 GMT)
High-Fidelity Pseudo-label Generation by Large Language Models for Training Robust Radiology Report Classifiers [0.2]
DeBERTa-RADは、最先端のLLM擬似ラベル付けのパワーと、DeBERTaに基づく効率的な知識蒸留を組み合わせた、高精度で高速な胸部X線レポートラベリングのための新しいフレームワークである。専門家によるMIMIC-500ベンチマークで、DeBERTa-RADは最先端のマクロF1スコア0.9120を達成している。
論文参考訳（メタデータ） (Sat, 03 May 2025 04:50:55 GMT)
Engineering Dark Spin-Free Diamond Interfaces [0.2]
ダイヤモンド中の窒素空孔(NV)中心は、ナノスケールの磁場を撮像するための量子センサーとして広く利用されている。本研究では、これらのいわゆるダーク電子スピンの不要な信号を除去する表面改質法を開発する。我々の発見は、ナノスケールの固体量子ビットや超伝導量子ビットなど、他の量子プラットフォームに直接転送可能である。
論文参考訳（メタデータ） (Sat, 03 May 2025 22:42:37 GMT)
Quadrature-Dependent Lattice Dynamics of Dissipative Microcombs [0.2]
Kerrマイクロコームとして知られる非線形マイクロ共振器の最近の進歩により、マイクロチップ上でのブロードバンド高繰り返しパルスの生成と制御が可能になった。パラメトリック増幅真空揺らぎの多重モード状態が自然発生するフォトニックチップを設計する。
論文参考訳（メタデータ） (Sat, 03 May 2025 06:38:55 GMT)
Tensor Factorized Hamiltonian Downfolding To Optimize The Scaling Complexity Of The Electronic Correlations Problem on Classical and Quantum Computers [0.2]
本稿では,高コストシミュレーションのための最適化スケーリングを伴う,ハートリー・フォック・ハミルトンのダウンフォールディングに基づく量子化学法を新たに提案する。古典計算機と量子コンピュータの両方で高価な量子化学アルゴリズムの超クアッドレート高速化を実証する。
論文参考訳（メタデータ） (Sat, 03 May 2025 05:30:06 GMT)
Transformadores: Fundamentos teoricos y Aplicaciones [0.1]
Transformersは、元々自然言語処理用に開発されたニューラルネットワークアーキテクチャである。この論文はスペイン語で書かれており、この科学的知識をスペイン語圏のコミュニティでより理解しやすいものにしている。
論文参考訳（メタデータ） (Sat, 03 May 2025 21:28:13 GMT)
Intra-Layer Recurrence in Transformers for Language Modeling [0.0]
ILR(Intra-Layer Recurrence)は、単一のフォワードパス内の個々の層に選択的に反復するアプローチである。実験により、より多くのイテレーションを以前のレイヤに割り当てると、最適な結果が得られます。
論文参考訳（メタデータ） (Sat, 03 May 2025 16:16:55 GMT)
You Don't Have to Live Next to Me: Towards Demobilizing Individualistic Bias in Computational Approaches to Urban Segregation [0.0]
社会的不平等の世界的な増加は、我々の時代で最も差し迫った問題の一つだ。都市規模における社会的不平等の表現は、都市分離を引き起こす。ビッグデータと計算モデルの人気が高まり、多くの計算研究に影響を与えた。
論文参考訳（メタデータ） (Sat, 03 May 2025 14:15:27 GMT)
What to Do When Privacy Is Gone [0.0]
このエッセイは、プライバシーがなくなった後に生きるための2つの戦略を探求する。まず、全体的な露出はプライバシーの低下を受け入れ、そして透明性のあるプロセスに貢献します。その結果生まれた倫理は、Robert Nozick氏のExperience Machine Think Experimentのビッグデータバージョンを通じて調査される。
論文参考訳（メタデータ） (Sat, 03 May 2025 17:51:36 GMT)
Visual Adaptive Prompting for Compositional Zero-Shot Learning [0.0]
VLM(Vision-Language Models)は、視覚およびテキストデータの共同表現を学習する際、印象的な能力を示す。 CZSLは、トレーニング中に明示的に遭遇しなかった属性やオブジェクトのような新しい視覚的プリミティブの組み合わせに一般化するモデルを必要とする。意味的特徴と視覚的特徴のギャップを埋める視覚適応型プロンプトシステム(VAPS)を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 01:45:21 GMT)
Unraveling Media Perspectives: A Comprehensive Methodology Combining Large Language Models, Topic Modeling, Sentiment Analysis, and Ontology Learning to Analyse Media Bias [0.0]
本研究では、政治ニュースにおけるメディアバイアスのスケーラブルで最小限のバイアス分析のための新しい手法を提案する。提案手法は,ニュースソース間のイベント選択,ラベル付け,単語選択,コミッショニングと省略バイアスについて検討する。
論文参考訳（メタデータ） (Sat, 03 May 2025 09:09:34 GMT)
Unification of stochastic matrices and quantum operations for N-level systems [0.0]
量子演算に対する完全正の可除性(CP-可除性)がチャップマン・コルモゴロフ方程式の自然な拡張であることが証明されている。 CP-可分性は、量子過程をマルコビアンとして特定するのに必要だが不十分な条件であることが示されている。
論文参考訳（メタデータ） (Sat, 03 May 2025 13:33:58 GMT)
UK Finfluencers: Exploring Content, Reach, and Responsibility [0.0]
本研究では,TikTokにおけるイギリスにおけるフィンフルエンサーのパターンと行動について検討した。その目的は、共通のエンゲージメントパターンを特定し、金融上の害から国民を守るためのガイドラインを提案することである。
論文参考訳（メタデータ） (Sat, 03 May 2025 22:28:36 GMT)
Topology-Aware CLIP Few-Shot Learning [0.0]
本稿では,Representation Topology DivergenceをTask Residualフレームワークに統合したトポロジ対応チューニング手法を提案する。 RTDとクロスエントロピー損失を組み合わせた視覚・テキスト表現のトポロジ的構造を明示的に整合させることにより,本手法は撮影性能を向上する。
論文参考訳（メタデータ） (Sat, 03 May 2025 04:58:29 GMT)
Thermal Noise as a Window into the Quantum Vacuum: Spatial Patterns Revealed by Simple Experiments [0.0]
高周波の熱雑音を用いて電磁真空変動の空間構造を間接的に観察できることを示す。これは、高度な光学や低温を必要とせず、量子真空挙動のアクセス可能で実験的な証拠を提供する。
論文参考訳（メタデータ） (Sat, 03 May 2025 02:43:17 GMT)
The effect of curvature on local observables in quantum field theory [0.0]
時空の局所化領域における曲率による実場の2乗場振幅の期待値に対する先行順序補正を計算する。次に、粒子検出器モデルに適用し、局所場プローブにおける時空曲率の影響を定量化する。
論文参考訳（メタデータ） (Sat, 03 May 2025 14:22:47 GMT)
The construction of a universal quantum gate set for the SU(2)k anyon models via a numerical method [0.0]
我々は、SU(2)kアノンモデルを用いて、位相量子計算のための普遍的な量子ゲートセットを構築するための数値計算法を体系的に研究する。遺伝的アルゴリズムを用いたSolovay-Kitaevアルゴリズム(GA-enhanced SKA)による1量子ゲートの合成 2量子ゲートは、CNOTゲートの局所同値類を近似するために、ブルートフォースサーチまたはGA最適化によって構築された。
論文参考訳（メタデータ） (Sat, 03 May 2025 10:15:16 GMT)
Tailored Design of Audio-Visual Speech Recognition Models using Branchformers [0.0]
本稿では,パラメータ効率の高い音声認識システムの設計のための新しいフレームワークを提案する。より正確に言うと、提案するフレームワークは、まず、音声のみのシステムとビデオのみのシステムを推定し、次に、カスタマイズされたオーディオ視覚統合エンコーダを設計する。我々のモデルは、英語で約2.5%の競争力のある単語誤り率(WER)を達成し、スペイン語で既存のアプローチを上回ります。
論文参考訳（メタデータ） (Sat, 03 May 2025 14:38:50 GMT)
TV-SurvCaus: Dynamic Representation Balancing for Causal Survival Analysis [0.0]
TV-SurvCausは、表現バランス技術を拡張した新しいフレームワークである。我々は,(1)不均一効果推定における時間変化精度の一般化境界,(2)シーケンシャルバランスウェイトによる分散制御,(3)動的治療体制の整合性,(5)治療共同研究者のフィードバックによるバイアスの形式的境界などを通じて理論的保証を行う。
論文参考訳（メタデータ） (Sat, 03 May 2025 11:04:52 GMT)
T-JEPA: Augmentation-Free Self-Supervised Learning for Tabular Data [0.0]
自己教師付き学習(SSL)は一般的に同じサンプルの異なるビューを生成するため、データ拡張が必要である。本研究では,構造化データに対する拡張不要なSSL方式を提案する。我々のアプローチであるT-JEPAは、JEPA(Joint Embedding Predictive Architecture)に依存しており、潜伏した空間における再構築のマスクに似ている。
論文参考訳（メタデータ） (Sat, 03 May 2025 06:48:53 GMT)
Structured Prompting and Feedback-Guided Reasoning with LLMs for Data Interpretation [0.0]
大規模言語モデル(LLM)は、自然言語の理解とタスクの一般化において顕著な能力を示した。本稿では、構造化されたプロンプトおよびフィードバック駆動型変換ロジック生成手法であるSTROT Frameworkを紹介する。
論文参考訳（メタデータ） (Sat, 03 May 2025 00:05:01 GMT)
State learning from pairs of states [0.0]
各キュービットの追加コピーが供給された場合、一つのキュービットではなく、同じ状態のキュービットのペアを受け取ることが示される。量子ビット対の列の対称的,情報的に完備な測定を数値的にシミュレートする。数千の量子ビット対を検出するのに十分であることがわかった。
論文参考訳（メタデータ） (Sat, 03 May 2025 12:48:41 GMT)
Site Reliability Engineering (SRE) and Observations on SRE Process to Make Tasks Easier [0.0]
Site Reliability Engineering (SRE)は、スケーラブルで信頼性の高いソフトウェアシステムを維持するための現代的なアプローチである。本稿では, 構造化SREプロセスの運用効率の向上, システムダウンタイムの低減, メンテナンスの簡易化について述べる。
論文参考訳（メタデータ） (Sat, 03 May 2025 21:39:05 GMT)
Sentiment-Aware Recommendation Systems in E-Commerce: A Review from a Natural Language Processing Perspective [0.0]
本稿では、自然言語処理の観点から、感情認識レコメンデーションシステムについて包括的にレビューする。感情分析をeコマースレコメンデータに統合することで、予測精度と説明可能性を高めるメリットを強調している。主な課題は、ノイズや皮肉なテキストの扱い、動的なユーザの好み、バイアス軽減である。
論文参考訳（メタデータ） (Sat, 03 May 2025 19:36:27 GMT)
Security Analysis of the Open Banking Account and Transaction API Protocol [0.0]
本稿では,英国オープンバンキング標準APIの形式的モデリングとセキュリティ解析について述べる。提案手法では,プロトコルの形式モデルを作成するために拡張Alice と Bob 表記法 (AnBx) を用いる。検証済みのセキュリティ目標を実証するために,形式解析といくつかの必要な条件の実用的セキュリティテストを統合する。
論文参考訳（メタデータ） (Sat, 03 May 2025 09:39:11 GMT)
Quantum network-entanglement measures [0.0]
本稿では、量子資源理論の一般的な枠組みの中で明確に定義された量子ネットワーク絡みの測度を紹介する。また,ネットワークの絡み合いの新たな目撃者を導入することで,これらの指標を推定する方法を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 04:05:41 GMT)
Quantum Energy Teleportation across Multi-Qubit Systems using W-State Entanglement [0.0]
量子エネルギーテレポーテーション(QET)は2ビットプラットフォームでしか実現されていない。我々は、ロバストなW状態多部絡みを用いた最初のマルチキュービットQETプロトコルを設計、実験的に実証した。
論文参考訳（メタデータ） (Sat, 03 May 2025 16:50:46 GMT)
Privacy Preserving Machine Learning Model Personalization through Federated Personalized Learning [0.0]
データプライバシを維持しながら、分散データサイロ上で機械学習(ML)モデルをトレーニングするための主要なパラダイムであるフェデレートラーニング(FL)への関心が揺れている。本研究では,プライバシ保護機械学習によって達成されたプライバシを保護しながら,MLモデルをパーソナライズするための最先端アプローチの総合的なパフォーマンス解析を行う。我々の分析によると、適応的パーソナライズ・クロスサイロ・フェデレーション・ラーニング・アダプティブプライバシ(APPLE+DP)は効率的な実行を提供するのに対し、アダプティブ・パーソナライズ・クロスサイロ・フェデレーション・ラーニング・アダプティブ・エン暗号化(APPLE+HE)アルゴリズムは、プライバシ保存機械学習タスクに強く利用されている。
論文参考訳（メタデータ） (Sat, 03 May 2025 11:31:38 GMT)
PhysNav-DG: A Novel Adaptive Framework for Robust VLM-Sensor Fusion in Navigation Applications [0.0]
PhysNav-DGは、古典的なセンサー融合と視覚言語モデルのセマンティックパワーを統合する新しいフレームワークである。我々のデュアルブランチアーキテクチャは、マルチセンサー入力からナビゲーション動作を予測し、同時に詳細なチェーン・オブ・シークレットの説明を生成する。
論文参考訳（メタデータ） (Sat, 03 May 2025 17:59:26 GMT)
PQS-BFL: A Post-Quantum Secure Blockchain-based Federated Learning Framework [0.0]
フェデレートラーニング(FL)は、データのプライバシを維持しながら協調的なモデルトレーニングを可能にするが、古典的な暗号基盤は量子攻撃に対して脆弱である。本稿では,量子暗号とブロックチェーン検証を統合して,量子敵に対するFLを確保するフレームワークであるPQS-BFLを紹介する。
論文参考訳（メタデータ） (Sat, 03 May 2025 17:11:03 GMT)
Nonresonant Casimir-Polder repulsion with a monolayer topological insulator [0.0]
2レベル原子系の準安定偏極状態に作用する非共鳴カシミール・ポルダー力の挙動について検討する。円偏光単色レーザー光によって照射されたスタテンを考慮し, 導電率テンソルの周波数分散が力挙動に及ぼす影響について検討した。
論文参考訳（メタデータ） (Sat, 03 May 2025 00:31:14 GMT)
Monitoring the generation of photonic linear cluster states with partial measurements [0.0]
多くの絡み合った光子を持つ量子状態は、フォトニック量子コンピューティングと量子通信の鍵となる資源である。我々は、量子メモリとして機能するファイバ遅延ループを埋め込んだ線形光回路に基づく、資源効率の高い生成方式を利用する。本稿では,部分選択後測定に基づく絡み合い生成のリアルタイム制御手法を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 21:45:22 GMT)
Model-Based Offline Reinforcement Learning with Reliability-Guaranteed Sequence Modeling [0.0]
モデルベースオフライン強化学習(MORL)は、既存のデータセットから派生した動的モデルを利用してポリシーを学習することを目的としている。信頼性の低いトラジェクトリを除去できる新しいMORLアルゴリズム textbfReliability-guaranteed textbfTransformer (RT) を提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 07:43:43 GMT)
Matrix systems, algebras, and open maps [0.0]
M_n$ のすべての *-部分代数に対する制限は開であることを示す。これは行列理論と量子情報理論における位相問題を簡単にする。
論文参考訳（メタデータ） (Sat, 03 May 2025 22:02:59 GMT)
Interference in complex canonical variables is not quantum [0.0]
我々は、マッハ・ツェンダー干渉計の光子によって具現化された1量子ビットの量子干渉を表す。単一の量子ビット上の全ての演算は形式的に表現できるが、結果として得られるシステムは依然として適切な量子ビットではないことを示す。
論文参考訳（メタデータ） (Sat, 03 May 2025 20:55:20 GMT)
Identifying Doppelganger Active Galactic Nuclei across redshifts from spectroscopic surveys [0.0]
活動銀河核(英: Active Galactic Nuclei、AGN)は、宇宙で最も明るい天体である。本研究は、低赤方偏移(近傍)のAGNが高赤方偏移(距離)のプロキシとして機能するかどうかを検討する。
論文参考訳（メタデータ） (Sat, 03 May 2025 00:53:09 GMT)
Humans can learn to detect AI-generated texts, or at least learn when they can't [0.0]
本研究では、即時フィードバックが得られた場合に、個人が人書きテキストとAI生成テキストの正確な識別を学べるかどうかを検討する。我々はGPT-4oを用いて、様々なジャンルやテキストタイプに数百のテキストを生成しました。チェコ語母語話者255人にランダム化されたテキストペアを提示した。
論文参考訳（メタデータ） (Sat, 03 May 2025 17:42:49 GMT)
Human-AI Governance (HAIG): A Trust-Utility Approach [0.0]
本稿では,人間とAIの関係が進化する中で,信頼のダイナミクスを分析するためのHAIGフレームワークを紹介する。我々の分析は、自己監督、推論権限、分散意思決定の技術的進歩が、不均一な信頼の進化をいかに引き起こすかを明らかにする。
論文参考訳（メタデータ） (Sat, 03 May 2025 01:57:08 GMT)
GenSync: A Generalized Talking Head Framework for Audio-driven Multi-Subject Lip-Sync using 3D Gaussian Splatting [0.0]
GenSyncは、マルチアイデンティティのリップ同期ビデオ合成のための新しいフレームワークである。複数の話者のためのリップシンク動画を合成する統合ネットワークを学習する。
論文参考訳（メタデータ） (Sat, 03 May 2025 21:44:59 GMT)
From Players to Champions: A Generalizable Machine Learning Approach for Match Outcome Prediction with Insights from the FIFA World Cup [0.0]
本稿では,FIFAワールドカップの優勝者予測に特化して設計された機械学習フレームワークを提案する。チームレベルの履歴データと、ゴール、アシスト、正確性、タックルといったプレイヤー固有のパフォーマンスメトリクスを統合することで、従来の集約モデルで見過ごされる微妙なインタラクションをキャプチャします。 FIFA2022ワールドカップのデータによる実験結果は,ベースライン法よりも精度が優れていることを示している。
論文参考訳（メタデータ） (Sat, 03 May 2025 19:17:20 GMT)
Fast Likelihood-Free Parameter Estimation for Lévy Processes [0.0]
L'evyパラメータ推定のためのシミュレーションに基づく確率自由な手法を提案する。 NBEは従来のメソッドよりも精度と実行時の両方で優れていることを示す。われわれは10年近くにわたってBitcoinの高頻度リターンを調査し、パラメーターを見積もるのに1分もかからない。
論文参考訳（メタデータ） (Sat, 03 May 2025 00:37:58 GMT)
FPGA-based Toeplitz Strong Extractor for Quantum Random Number Generators [0.0]
本研究は,FPGA上でのToeplitz Strong Extractorの最先端実装について述べる。 FPGA上でのポストプロセッシングの詳細な実装フローと、異なるランダム性抽出比で得られる実行速度とが提供される。出力はNIST STS 2.1.2統計ランダムネステストスイートを用いて検証される。
論文参考訳（メタデータ） (Sat, 03 May 2025 18:25:30 GMT)
Explicit Construction of Quantum Quasi-Cyclic Low-Density Parity-Check Codes with Column Weight 2 and Girth 12 [0.0]
本研究では, 量子準循環型低密度パリティチェック符号に対して, 12進数で明示的な構成法を提案する。代数的手法を用いることで、短いサイクルを排除し、誤り訂正性能を向上させる。本研究により,ランダム探索を必要とせず,高速な量子誤り訂正符号の設計が可能となった。
論文参考訳（メタデータ） (Sat, 03 May 2025 17:12:30 GMT)
Emergence of $X$ states in a quantum impurity model [0.0]
局所摂動多体量子不純物モデルの長時間応答における$X$状態の出現を実証する。驚くべきことに、量子情報理論の特徴づけを実行した後、これらの状態が真の量子相関を示すことを示す。
論文参考訳（メタデータ） (Sat, 03 May 2025 19:14:03 GMT)
Efficient Multi Subject Visual Reconstruction from fMRI Using Aligned Representations [0.0]
被験者の脳信号は、トレーニング中にこの共通空間に整列して、意味的に整列した共通脳を形成することができることを示す。これは、対象固有の軽量モジュールを参照対象に合わせることが、従来のエンドツーエンドのトレーニング方法よりもはるかに効率的であることを示すのに有効である。
論文参考訳（メタデータ） (Sat, 03 May 2025 03:35:49 GMT)
ELECTRA and GPT-4o: Cost-Effective Partners for Sentiment Analysis [0.0]
本稿では,3方向感情分類のためのELECTRAとGPT-4oの協調的アプローチについて検討する。我々はStanford Sentiment Treebank(SST)とDynaSentのレビューを組み合わせて、4つのモデルを微調整した。この結果から,微調整エンコーダの予測による拡張プロンプトが性能向上に有効であることが示唆された。
論文参考訳（メタデータ） (Sat, 03 May 2025 23:36:30 GMT)
Dynamics in an emergent quantum-like state space generated by a nonlinear classical network [0.0]
この作業は、グラフが古典的なシステムと私たちが量子ライク(QL)と呼ぶ状態空間を接続するのに役立つフレームワークを活用する。グラフを介してQL状態空間にマップする,大規模でダイナミックな古典システムの具体例について検討する。我々は、非閉定理(すなわち、QLビットの状態はコピーできない)が、QL状態だけでなく、基礎となる古典システムにも適用されることを示す。
論文参考訳（メタデータ） (Sat, 03 May 2025 23:50:06 GMT)
Distinguishing AI-Generated and Human-Written Text Through Psycholinguistic Analysis [0.0]
本研究は, 語彙検索, 談話計画, 認知負荷管理, メタ認知的自己監視などの認知過程に, 31の異なる形態的特徴をマッピングする。このフレームワークは、生成AIの時代における学術的整合性を維持することを目的とした信頼性の高いツールの開発に寄与する。
論文参考訳（メタデータ） (Sat, 03 May 2025 12:06:53 GMT)
Deterministic Mechanical Wigner Negativity via Nonlinear Cavity Quantum Optomechanics in the Unresolved-Sideband Regime [0.0]
ウィグナー負性を示す機械運動の非ガウス量子状態は、量子技術と基礎物理学のテストに有望な能力を提供する。我々は, 非線形性, 非古典的駆動, 条件付き測定を伴わず, 未解決のサイドバンド系において, ウィグナー負性性は決定的に生成可能であることを示した。
論文参考訳（メタデータ） (Sat, 03 May 2025 22:46:45 GMT)
Detecting Musical Deepfakes [0.0]
本研究では,FakeMusicCapsデータセットを用いたAI生成楽曲の検出について検討した。実世界の逆境条件をシミュレートするため, テンポストレッチとピッチシフトをデータセットに適用した。メルスペクトログラムは、修正されたオーディオから生成され、その後、畳み込みニューラルネットワークのトレーニングと評価に使用された。
論文参考訳（メタデータ） (Sat, 03 May 2025 21:45:13 GMT)
Deep learning model for ECG reconstruction reveals the information content of ECG leads [0.0]
本研究は心電図(ECG)の欠損した鉛を再構成するためのU-netアーキテクチャに基づくディープラーニングモデルを提案する。このモデルは、公開データセットを使用して、リード構成の削減から12リードのECGデータを再構築するように訓練された。
論文参考訳（メタデータ） (Sat, 03 May 2025 20:32:33 GMT)
Celestial Quantum Error Correction II: From Qudits to Celestial CFT [0.0]
我々は、CFT双対上の補正可能なゆらぎとして真空縮退とIR発散をエンコードする。このフレームワークは、いわゆるクライン時空にキューディットの連鎖を埋め込むことによって物理的に動機づけられる。
論文参考訳（メタデータ） (Sat, 03 May 2025 02:25:19 GMT)
Beyond Recognition: Evaluating Visual Perspective Taking in Vision Language Models [0.0]
本研究では,視覚言語モデルによる視覚的視点の把握能力について検討する。提案手法では、1つのヒューマノイドのミニフィギュアを1つの物体とペアリングするシーンを慎重に制御する。解析により,複雑な視覚タスクに必要な表面レベルの物体認識と深部空間的・視点的推論とのギャップが示唆された。
論文参考訳（メタデータ） (Sat, 03 May 2025 00:10:41 GMT)
Analysis of quantum mechanics with real-valued Schrödinger equation,single-event quantum-path dynamics, Mauprtuis path in parameter space, and branching paths beyond semiclassics [0.0]
我々はシュル・オーディンガー力学とシュル・オーディンガー関数(またはいわゆる波動関数)を解析する。シュル・オーディンガー方程式は、ニュートン力学や光学に言及することなく、実場のスクラッチから再構成される。
論文参考訳（メタデータ） (Sat, 03 May 2025 23:28:23 GMT)
An LSTM-PINN Hybrid Method to the specific problem of population forecasting [0.0]
2024年から2054年までの人口増加をシミュレートするために、政策対応の肥育関数を輸送反応偏微分方程式に組み込む。標準のPINNモデルは、コロケーションベースのトレーニングを通じて、支配方程式と境界条件を強制する。 LSTM-PINNフレームワークはシーケンシャルメモリ機構を統合し、時間領域における長距離依存関係を効果的にキャプチャする。
論文参考訳（メタデータ） (Sat, 03 May 2025 13:50:53 GMT)
An Approach for Handling Missing Attribute Values in Attribute-Based Access Control Policy Mining [0.0]
Attribute-Based Access Control (ABAC) は、幅広いコンテキスト属性を考慮し、高い表現力と柔軟なアクセス決定を可能にする。レガシーアクセス制御システムからABACポリシーをマイニングするアルゴリズムは、ABACへの移行に伴うコストを大幅に削減することができる。本稿では,欠落した属性を予測あるいは推測することで,政策マイニングのプロセスを強化するアプローチを提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 17:34:46 GMT)
Adaptive Token Boundaries: Integrating Human Chunking Mechanisms into Multimodal LLMs [0.0]
本研究は,ヒトのクロスモーダルチャンキング機構とトークン表現手法の並列性について,系統的研究を行った。本稿では,適応的境界,階層的表現,認知科学の原理に基づくアライメント機構を取り入れた動的クロスモーダルトークン化フレームワークを提案する。
論文参考訳（メタデータ） (Sat, 03 May 2025 09:14:24 GMT)
Adaptive Informed Deep Neural Networks for Power Flow Analysis [0.0]
本研究では,PF解析のためのエンドツーエンドディープラーニングアーキテクチャであるPINN4PFを紹介する。その結果、PINN4PFは全てのテストシステムで両方のベースラインを上回ります。
論文参考訳（メタデータ） (Sat, 03 May 2025 19:28:39 GMT)
A dynamic view of the double descent [0.0]
過度にパラメータ化されたニューラルネットワークは二重降下現象を示す。時間領域におけるこの現象の1つが、エポックな訓練の文脈で注目されている。このノートは、2つの時間スケール近似と特異微分方程式の理論を用いて、妥当な説明を示す。
論文参考訳（メタデータ） (Sat, 03 May 2025 09:01:10 GMT)
A Multimodal Framework for Explainable Evaluation of Soft Skills in Educational Environments [0.0]
本稿では,大学生のソフトスキルを評価するために,多モーダル分析と統合されたファジィ論理モデルを用いたファジィ論理手法を提案する。大学生を対象に,意思決定,コミュニケーション,創造性などのソフトスキルを評価するツールを開発した。
論文参考訳（メタデータ） (Sat, 03 May 2025 11:54:35 GMT)
A Matrix Product State Representation of Boolean Functions [0.0]
本稿では、二項行列の積の観点でブール関数の新たな正規形式表現を導入し、以下、二項行列積(BMP)表現と呼ぶ。 BMPは、それぞれ応用数学や量子多体物理学で使用される発明されたTrains(TT)とMatrix Product States(MPS)に類似している。本稿では,BMPをBDD(Bibinary Decision Diagram)へ直接的かつ自然な翻訳を行い,BMPを操作・結合するための基本的な操作セットを導出する。
論文参考訳（メタデータ） (Sat, 03 May 2025 21:48:39 GMT)