Wolf: Dense Video Captioning with a World Summarization Framework [184.4] Wolfは、Mix-of-expertsアプローチを採用した自動キャプションフレームワークである。
我々のフレームワークは様々なレベルの情報を取り込み、それらを効率的に要約する。
Wolfは最先端のアプローチに比べてキャプション性能が優れていることを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:56:05 GMT)
On the Challenges and Opportunities in Generative AI [158.0] 私たちは、現在の大規模な生成AIモデルは、ドメイン間で広く採用されるのを妨げるいくつかの根本的な欠点を示しています。
我々は、研究者に実りある研究の方向性を探るための洞察を提供することを目標とし、より堅牢でアクセスしやすい生成AIソリューションの開発を促進する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:07:27 GMT)
EMOVA: Empowering Language Models to See, Hear and Speak with Vivid Emotions [152.4] EMOVA (EMotionally Omni-present Voice Assistant) を提案する。
セマンティック・アコースティック・ディコンタングルド・音声トークンーザでは、オムニモーダルアライメントが視覚言語や音声能力をさらに向上させることに驚く。
EMOVAは、視覚言語と音声のベンチマークの両方で最先端のパフォーマンスを初めて達成した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:47:39 GMT)
A Comprehensive Survey on Long Context Language Modeling [118.6] Long Context Language Models (LCLM) は、広範囲な入力を効果的かつ効率的に処理し、分析する。
本調査は, LCLMの有効かつ効率的な利用方法, LCLMを効率的に訓練・展開する方法, LCLMを総合的に評価・分析する方法の3つの重要な側面から構成されている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:06:28 GMT)
Multi-subject Open-set Personalization in Video Generation [110.0] 我々は、マルチオブジェクトでオープンなパーソナライズ機能を備えたビデオモデルとして、Video Alchemist $-$を提示する。
本モデルは,各条件付き参照画像と対応する主観レベルテキストプロンプトを融合するDiffusion Transformerモジュール上に構築されている。
本手法は,定量評価と定性評価の両方において,既存のパーソナライズ手法を著しく上回っている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:59:56 GMT)
SynCity: Training-Free Generation of 3D Worlds [107.7] テキスト記述から3次元世界を生成するためのトレーニング不要かつ最適化不要なアプローチであるSynCityを提案する。
3Dと2Dのジェネレータが組み合わさって、拡大するシーンを生成する方法を示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:59:40 GMT)
Immune: Improving Safety Against Jailbreaks in Multi-modal LLMs via Inference-Time Alignment [97.4] 訓練時安全アライメントにもかかわらず、Multimodal Large Language Models (MLLM) はジェイルブレイク攻撃に対して脆弱である。
我々は,ジェイルブレイク攻撃に対する防御のために,制御復号化による安全な報酬モデルを活用する推論時防御フレームワークImmuneを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:07:09 GMT)
EDEN: Enhanced Diffusion for High-quality Large-motion Video Frame Interpolation [95.6] 高品質な大動vidEoフレームiNterpolationのための拡張拡散であるEDENを紹介する。
提案手法はまずトランスを用いたトークン化器を用いて,拡散モデルのための中間フレームの洗練された潜在表現を生成する。
次に,プロセス全体にわたって時間的注意を払って拡散トランスフォーマーを強化し,動的運動の発生を導くために,初期フレーム差の埋め込みを組み込む。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:54:52 GMT)
WritingBench: A Comprehensive Benchmark for Generative Writing [87.5] writeBenchは、6つのコア書き込みドメインと100の技術的記述を含む大規模言語モデル(LLM)を評価するために設計されたベンチマークである。
本稿では、LCMがインスタンス固有の評価基準を動的に生成することを可能にするクエリ依存評価フレームワークを提案する。
このフレームワークは、基準対応スコアリングのための微調整された批評家モデルによって補完され、スタイル、フォーマット、長さの評価を可能にする。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:13:53 GMT)
Unifying 2D and 3D Vision-Language Understanding [85.8] 2次元および3次元視覚言語学習のための統一アーキテクチャUniVLGを紹介する。
UniVLGは、既存の2D中心モデルと、エンボディシステムで利用可能なリッチな3Dセンサーデータのギャップを埋める。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:24:10 GMT)
Local models and Bell inequalities for the minimal triangle network [84.7] 非局所的な相関は、量子情報や量子基底における驚くべき現象を引き起こす。
最も単純なシナリオの一つとして、最小三角形ネットワークにおけるパーティの置換の下での分布不変性について検討する。
連立結果を持つ三角形ネットワークにおける古典量子ギャップの存在に関する新たな知見を提供する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:11:06 GMT)
SERL: A Software Suite for Sample-Efficient Robotic Reinforcement Learning [82.5] 筆者らは,報酬の計算と環境のリセットを行う手法とともに,効率的なオフ・ポリティクス・ディープ・RL法を含むライブラリを開発した。
我々は,PCBボードアセンブリ,ケーブルルーティング,オブジェクトの移動に関するポリシを,非常に効率的な学習を実現することができることを発見した。
これらの政策は完全な成功率またはほぼ完全な成功率、摂動下でさえ極端な堅牢性を実現し、突発的な堅牢性回復と修正行動を示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:13:10 GMT)
Jointly Understand Your Command and Intention:Reciprocal Co-Evolution between Scene-Aware 3D Human Motion Synthesis and Analysis [80.5] シーン認識型テキスト対人間合成は、同じテキスト記述から多様な屋内動作サンプルを生成する。
そこで本研究では,テキスト駆動型シーン特異的なヒューマンモーション生成を3段階に分解するケースドジェネレーション戦略を提案する。
我々は3次元シーンにおけるリアルな人間の動き合成と頑健な人間の動き解析を共同で改善する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:20:09 GMT)
BadToken: Token-level Backdoor Attacks to Multi-modal Large Language Models [79.4] マルチモーダル大言語モデル(MLLM)はマルチモーダル情報を処理し、画像テキスト入力に対する応答を生成する。
MLLMは、細調整なしでプラグイン・アンド・プレイを通じて、自律運転や診断などの多様なマルチモーダルアプリケーションに組み込まれている。
MLLMに対する最初のトークンレベルのバックドア攻撃であるBadTokenを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:39:51 GMT)
Allostatic Control of Persistent States in Spiking Neural Networks for perception and computation [79.2] 本稿では,アロスタシスの概念を内部表現の制御に拡張することにより,環境に対する知覚的信念を更新するための新しいモデルを提案する。
本稿では,アトラクタネットワークにおける活動の急増を空間的数値表現として利用する数値認識の応用に焦点を当てる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:28:08 GMT)
LazyDiT: Lazy Learning for the Acceleration of Diffusion Transformers [79.1] 拡散変換器は、様々な生成タスクの優越的なモデルとして登場してきた。
各拡散段階におけるモデル全体の実行は不要であることを示し、いくつかの計算は以前のステップの結果を遅延的に再利用することでスキップできることを示した。
遅延学習フレームワークを提案する。このフレームワークは,初期ステップからキャッシュされた結果を効率よく活用し,冗長な計算を省略する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:55:18 GMT)
TriTex: Learning Texture from a Single Mesh via Triplane Semantic Features [78.1] 本研究では,1つのテクスチャメッシュから体積テクスチャ場を学習し,セマンティックな特徴を対象色にマッピングする手法を提案する。
本手法は,ゲーム開発などのアプリケーションにおいて,3次元モデル間で優れたテクスチャ品質を実現する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:35:03 GMT)
OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models [76.6] コードのための大規模言語モデル(LLM)は、コード生成、推論タスク、エージェントシステムなど、さまざまな領域で必須になっている。
オープンアクセスのコード LLM はプロプライエタリなモデルの性能レベルに近づきつつあるが、高品質なコード LLM は依然として限られている。
トップクラスのコードLLMであるOpenCoderは、主要なモデルに匹敵するパフォーマンスを達成するだけでなく、研究コミュニティの"オープンクックブック"としても機能します。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:28:56 GMT)
Towards Agentic Recommender Systems in the Era of Multimodal Large Language Models [75.5] 大規模言語モデル(LLM)の最近のブレークスルーは、エージェントAIシステムの出現につながっている。
LLMベースのAgentic RS(LLM-ARS)は、よりインタラクティブで、コンテキストを認識し、プロアクティブなレコメンデーションを提供する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 22:37:15 GMT)
Unified Convergence Analysis for Adaptive Optimization with Moving Average Estimator [75.1] 1次モーメントに対する大きな運動量パラメータの増大は適応的スケーリングに十分であることを示す。
また,段階的に減少するステップサイズに応じて,段階的に運動量を増加させるための洞察を与える。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 01:10:15 GMT)
Structured-Noise Masked Modeling for Video, Audio and Beyond [74.7] 本稿では,映像・音声データの空間的特性,時間的特性,スペクトル特性と自然に一致させる,構造的ノイズに基づくマスキングを提案する。
提案手法は,計算オーバーヘッドを伴わずに,マスク付きビデオ・オーディオ・モデリング・フレームワークの性能を向上させる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:34:14 GMT)
SemHiTok: A Unified Image Tokenizer via Semantic-Guided Hierarchical Codebook for Multimodal Understanding and Generation [74.0] SemHiTokは、Semantic-Guided Hierarchical Codebookを介して統合された画像トークンである。
SemHiTokは、他の統一トークン化器と比較して256X256解像度で優れたrFIDスコアが得られることを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:13:32 GMT)
GraphXForm: Graph transformer for computer-aided molecular design [73.2] 既存の化合物を事前訓練したデコーダのみのグラフトランスフォーマアーキテクチャであるGraphXFormを提案する。
種々の薬物設計タスクで評価し、最先端の分子設計手法と比較して優れた客観的スコアを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:01:38 GMT)
Why is AI not a Panacea for Data Workers? An Interview Study on Human-AI Collaboration in Data Storytelling [73.1] 業界と学界の18人のデータワーカーにインタビューして、AIとのコラボレーションの場所と方法を聞いた。
驚いたことに、参加者はAIとのコラボレーションに興奮を見せたが、彼らの多くは反感を表明し、曖昧な理由を指摘した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:50:10 GMT)
On Domain-Specific Post-Training for Multimodal Large Language Models [72.7] 本稿では,MLLMのドメイン適応をポストトレーニングにより体系的に検討する。
データ合成、トレーニングパイプライン、タスク評価に重点を置いています。
バイオメディシン、食品、リモートセンシングなどの高インパクト領域で実験を行う。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:35:22 GMT)
Animating the Uncaptured: Humanoid Mesh Animation with Video Diffusion Models [71.8] ヒューマノイド文字のアニメーションは、様々なグラフィックス応用において不可欠である。
入力された静的な3次元ヒューマノイドメッシュの4次元アニメーションシーケンスを合成する手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:00:22 GMT)
VideoGen-of-Thought: Step-by-step generating multi-shot video with minimal manual intervention [70.6] 現在のビデオ生成モデルは短いクリップで優れているが、解離した視覚力学と破折したストーリーラインのため、凝集性のある複数ショットの物語を生成できない。
一つの文から複数ショットのビデオ合成を自動化する,ステップバイステップのフレームワークであるVideoGen-of-Thought (VGoT)を紹介した。
VGoTは、ショット内の顔の一貫性が20.4%、スタイルの一貫性が17.4%向上するマルチショットビデオを生成する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:00:45 GMT)
VideoGen-of-Thought: Step-by-step generating multi-shot video with minimal manual intervention [70.6] 現在のビデオ生成モデルは短いクリップで優れているが、解離した視覚力学と破折したストーリーラインのため、凝集性のある複数ショットの物語を生成できない。
一つの文から複数ショットのビデオ合成を自動化する,ステップバイステップのフレームワークであるVideoGen-of-Thought (VGoT)を紹介した。
VGoTは、ショット内の顔の一貫性が20.4%、スタイルの一貫性が17.4%向上するマルチショットビデオを生成する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:25:43 GMT)
Whenever, Wherever: Towards Orchestrating Crowd Simulations with Spatio-Temporal Spawn Dynamics [65.7] ニューラル・テンポラル・ポイント・プロセスを用いて生成時間生成ダイナミクスをモデル化するnTPP-GMMを提案する。
我々は,nTPP-GMMを用いた3つの実世界のデータセットのシミュレーションによるアプローチの評価を行った。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:46:41 GMT)
Moto: Latent Motion Token as the Bridging Language for Learning Robot Manipulation from Videos [64.5] 我々はMotoを紹介する。Motoは、映像コンテンツをラテントモーションTokenizerでラテントモーションTokenシーケンスに変換する。
我々は、モーショントークンによるMoto-GPTの事前学習を行い、多様な視覚的動きの知識を捉えることができる。
実際のロボット動作に先立って学習した動きを転送するために、潜伏した動きのトークン予測と実際のロボット制御をシームレスにブリッジするコファインチューニング戦略を実装した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:50:55 GMT)
ReLearn: Unlearning via Learning for Large Language Models [64.3] 本研究では、効果的なアンラーニングのためのデータ拡張および微調整パイプラインであるReLearnを提案する。
このフレームワークでは、知識レベルの保存を測定するために、知識獲得率(KFR)と知識保持率(KRR)を導入している。
実験の結果,ReLearnは高品質な出力を保ちながら,目標とするリセットを実現することができた。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:20:55 GMT)
Can one size fit all?: Measuring Failure in Multi-Document Summarization Domain Transfer [64.0] マルチドキュメント要約(MDS)は、複数の文書で自動的に情報を要約するタスクである。
我々は、トレーニングアプローチ、ドメイン、次元にわたるMDSモデルを評価する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 00:57:38 GMT)
Bridging Continuous and Discrete Tokens for Autoregressive Visual Generation [63.9] 本稿では,離散トークンのモデリングをシンプルに保ちながら,連続トークンの強力な表現能力を維持するTokenBridgeを提案する。
本稿では,各特徴次元を独立に離散化し,軽量な自己回帰予測機構と組み合わせた次元ワイド量子化戦略を提案する。
提案手法は,標準的なカテゴリー予測を用いて,連続的手法と同等に再現および生成品質を実現する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:59:59 GMT)
Sample Efficient Preference Alignment in LLMs via Active Exploration [63.8] 良い政策を最も効率的に特定するために、人間のフィードバックを得るコンテキストをしばしば選択できるという事実を活用します。
本稿では,データを効率的に選択する能動的探索アルゴリズムを提案する。
提案手法は,複数の言語モデルと4つの実世界のデータセットに対する人間の嗜好の限られたサンプルを用いて,ベースラインよりも優れる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:23:17 GMT)
Mixture of Lookup Experts [63.8] Mixture-of-Experts (MoE)は、推論中に専門家のサブセットだけを起動する。
MoLEは通信とVRAMの両方で効率的な新しいMoEアーキテクチャである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:31:57 GMT)
Aligning Text-to-Music Evaluation with Human Preferences [63.1] 本稿では,TTM(生成音響テキスト・ツー・ミュージック)モデルの評価のための基準ベース分散指標の設計空間について検討する。
私たちは、合成データと人間の嗜好データの両方に標準のFAD設定が矛盾しているだけでなく、既存の指標のほとんどすべてがデシデラタを効果的に捉えていないことに気付きました。
我々は,自己教師型音声埋め込みモデルから表現に基づいて計算したMAUVE Audio Divergence(MAD)を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:31:04 GMT)
Ultra-Resolution Adaptation with Ease [62.6] 我々は,EmphURAEと呼ばれる超高分解能適応のための重要なガイドラインのセットを提案する。
重み行列の小さな成分のチューニングは、合成データが利用できない場合に広く使用される低ランクアダプタよりも優れていることを示す。
URAEは、FLUX1.1[Pro] Ultraのような最先端のクローズドソースモデルに匹敵する2K世代の性能を達成している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:44:43 GMT)
How Robust Are Router-LLMs? Analysis of the Fragility of LLM Routing Capabilities [62.5] 大規模言語モデル(LLM)ルーティングは,計算コストと性能のバランスをとる上で重要な戦略である。
DSCベンチマークを提案する: Diverse, Simple, and Categorizedは、幅広いクエリタイプでルータのパフォーマンスを分類する評価フレームワークである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:52:30 GMT)
UniK3D: Universal Camera Monocular 3D Estimation [62.1] カメラをモデル化可能なモノクル3D推定法として,UniK3Dを提案する。
本手法では, 球面3次元表現を導入し, カメラとシーンの形状をよりよく切り離すことができる。
13の多様なデータセットに対する包括的なゼロショット評価は、3D、ディープ、カメラメトリクスにわたるUniK3Dの最先端のパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:49:23 GMT)
Synthetic Prior for Few-Shot Drivable Head Avatar Inversion [61.5] そこで本研究では,合成前駆体に基づく乾燥可能な頭部アバターの少数ショット逆転法であるSynShotを提案する。
合成データのみに基づいて訓練された機械学習モデルに着想を得て,合成頭部の大きなデータセットから先行モデルを学習する手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:18:44 GMT)
DnLUT: Ultra-Efficient Color Image Denoising via Channel-Aware Lookup Tables [61.0] DnLUTは、リソース消費を最小限に抑えながら高品質なカラーイメージを実現する、超効率的なルックアップテーブルベースのフレームワークである。
Pairwise Channel Mixer(PCM)は、チャネル間の相関関係と空間的依存関係を並列に効果的にキャプチャし、L字型畳み込み設計により受容界のカバレッジを最大化する。
これらのコンポーネントをトレーニング後に最適化されたルックアップテーブルに変換することで、DnLUTは、CNNの競合であるDnCNNと比較して500KBのストレージと0.1%のエネルギー消費しか必要とせず、20倍高速な推論を実現している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:15:29 GMT)
1000+ FPS 4D Gaussian Splatting for Dynamic Scene Rendering [60.7] 最新のシーンGPU上で1000FPS以上で動作する textbf4DGS-1K を提案する。
Q1では,短寿命ガウスを効果的に除去する新しいプルーニング基準である空間時間変動スコアを導入する。
Q2では、連続するフレーム間でアクティブなガウスのマスクを格納し、レンダリングにおける冗長な計算を著しく削減する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:59:44 GMT)
Automatic Curriculum Expert Iteration for Reliable LLM Reasoning [60.6] 幻覚(すなわち、可塑性だが不正確な内容を生成する)と怠慢(すなわち過剰な拒絶や「私は知らない」のデフォルト)は、LLM推論における主要な課題として残る。
幻覚を減らそうとする現在の取り組みは、主に知識に基づくタスクにおける事実的誤りに焦点を当てており、しばしば欠陥推論に関連する幻覚を無視している。
本稿では,LLM推論を強化し,モデルの能力に応答する自動カリキュラムエキスパートイテレーション(Auto-CEI)を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:08:24 GMT)
A Label-Free Heterophily-Guided Approach for Unsupervised Graph Fraud Detection [60.1] 本稿では,非教師付きGFDのための非教師付きグラフ不正検出手法(HUGE)を提案する。
推定モジュールでは、GFD の臨界グラフ特性をキャプチャする HALO と呼ばれる新しいラベルフリーなヘテロフィリー計量を設計する。
アライメントに基づく不正検出モジュールにおいて、ランキング損失と非対称アライメント損失を有する合同GNNアーキテクチャを開発する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:59:44 GMT)
REVAL: A Comprehension Evaluation on Reliability and Values of Large Vision-Language Models [59.4] REVALは、Large Vision-Language Modelsの textbfREliability と textbfVALue を評価するために設計された包括的なベンチマークである。
REVALには144K以上の画像テキストビジュアル質問回答(VQA)サンプルが含まれており、信頼性と価値の2つの主要なセクションで構成されている。
主流のオープンソースLVLMや,GPT-4oやGemini-1.5-Proといった著名なクローズドソースモデルを含む26のモデルを評価した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:54:35 GMT)
Cross-Modal and Uncertainty-Aware Agglomeration for Open-Vocabulary 3D Scene Understanding [58.4] CUA-O3Dと呼ばれるオープン語彙3次元シーン理解のためのクロスモーダル・不確実性認識アグリゲーションを提案する。
提案手法は,(1)空間認識型視覚基盤モデルの幾何学的知識とともに,VLMのセマンティックな先入観を取り入れること,(2)モデル固有の不確かさを捉えるために,新しい決定論的不確実性推定を用いること,の2つの課題に対処する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 20:58:48 GMT)
CREMA: Generalizable and Efficient Video-Language Reasoning via Multimodal Modular Fusion [58.2] CREMAは、ビデオ推論のための一般化可能、高効率、モジュラリティ融合フレームワークである。
本稿では,軽量核融合モジュールとモーダリティ・シークエンシャル・トレーニング・ストラテジーによって支援された,新しいプログレッシブ・マルチモーダル・フュージョン設計を提案する。
ビデオQA や Video-Audio/3D/Touch/Thermal QA を含む7つのビデオ言語推論タスクについて検証を行った。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:27:50 GMT)
Fourier Neural Operator based surrogates for $CO_2$ storage in realistic geologies [57.2] 我々は,$CO$ plume マイグレーションのリアルタイム・高分解能シミュレーションのためのニューラル演算子(FNO)モデルを開発した。
このモデルは、現実的な地下パラメータから生成された包括的なデータセットに基づいて訓練される。
本稿では,実際の地質学的位置を評価する上で重要なモデルから予測の信頼性を向上させるための様々な戦略を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:44:45 GMT)
On the Cone Effect in the Learning Dynamics [57.0] 実世界の環境でのニューラルネットワークの学習力学を実証的に研究する。
第一相ではeNTKが著しく進化し、第二相ではeNTKが、第二相ではeNTKは進化し続けるが、狭い空間では制約される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:38:25 GMT)
Dynamic Point Maps: A Versatile Representation for Dynamic 3D Reconstruction [56.3] 本研究では,ダイナミックポイントマップ(DPM)を導入し,モーションセグメンテーション,シーンフロー推定,3次元物体追跡,2次元対応などの4次元タスクをサポートする標準点マップを拡張した。
我々は,合成データと実データを組み合わせたDPM予測器を訓練し,映像深度予測,ダイナミックポイントクラウド再構成,3次元シーンフロー,オブジェクトポーズ追跡,最先端性能の達成など,様々なベンチマークで評価する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:41:50 GMT)
Data Mixing Laws: Optimizing Data Mixtures by Predicting Language Modeling Performance [55.9] 本研究では,関数形式の混合比に関するモデル性能の予測可能性について検討する。
トレーニングステップのスケーリング法則,モデルサイズ,データ混合法則のネスト利用を提案する。
提案手法は,RedPajamaにおける100Bトークンをトレーニングした1Bモデルのトレーニング混合物を効果的に最適化する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:31:27 GMT)
Cost-Efficient Continual Learning with Sufficient Exemplar Memory [55.8] 連続学習(CL)研究は通常、非常に制約のあるメモリ資源を前提としている。
本研究では,メモリが豊富である新しい環境におけるCLについて検討する。
提案手法は,計算コストを既存手法の4/3に削減しつつ,最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 20:55:12 GMT)
QuartDepth: Post-Training Quantization for Real-Time Depth Estimation on the Edge [55.8] ASIC のハードウェアアクセラレーションによる MDE モデルの定量化を後学習量子化に応用した QuartDepth を提案する。
提案手法では,重みとアクティベーションの両方を4ビット精度で定量化し,モデルサイズと計算コストを削減する。
我々は、カーネル融合とカスタマイズされた命令プログラム性をサポートすることにより、フレキシブルでプログラム可能なハードウェアアクセラレータを設計する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 21:03:10 GMT)
Jasmine: Harnessing Diffusion Prior for Self-supervised Depth Estimation [55.5] ジャスミン(Jasmine)は、単分子深度推定のための安定拡散に基づく自己教師型フレームワークである。
SDの視覚的先行性を利用して、教師なし予測のシャープネスと一般化を強化する。
KITTIベンチマークでSoTAのパフォーマンスを達成し、複数のデータセットにまたがる優れたゼロショット一般化を示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:15:49 GMT)
LiMoE: Mixture of LiDAR Representation Learners from Automotive Scenes [55.3] LiMoEは、Mixture of Experts(MoE)パラダイムをLiDARデータ表現学習に統合するフレームワークである。
我々のアプローチは3つの段階からなる: Image-to-LiDAR Pretraining, Contrastive Mixture Learning (CML), Semantic Mixture Supervision (SMS)。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:53:48 GMT)
Differentially Private Steering for Large Language Model Alignment [55.3] 本稿では,大規模言語モデルとプライベートデータセットの整合性に関する最初の研究について述べる。
本研究は,プライバシ保証付きアクティベーションを編集するPSA(Private Steering for LLM Alignment)アルゴリズムを提案する。
以上の結果から,PSAはLPMアライメントのDP保証を実現し,性能の低下を最小限に抑えることができた。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:58:49 GMT)
MambaIC: State Space Models for High-Performance Learned Image Compression [54.0] 多数のフィールドをまたいだリアルタイム情報伝送には,高性能な画像圧縮アルゴリズムが不可欠である。
状態空間モデル(SSM)の長距離依存性の捕捉効果に着想を得て,SSMを利用して既存手法の計算不効率に対処する。
そこで本稿では,MambaICと呼ばれる洗練されたコンテキストモデリングによる画像圧縮手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:27:03 GMT)
Project-Probe-Aggregate: Efficient Fine-Tuning for Group Robustness [54.0] 画像テキスト基礎モデルのパラメータ効率向上のための3段階のアプローチを提案する。
本手法は, マイノリティ標本同定とロバストトレーニングアルゴリズムの2つの重要な要素を改良する。
我々の理論分析は,PPAが少数群の識別を向上し,バランスの取れたグループエラーを最小限に抑えるためにベイズが最適であることを示している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:58:40 GMT)
Don't Fight Hallucinations, Use Them: Estimating Image Realism using NLI over Atomic Facts [53.9] LVLM(Large Vision-Language Models)と自然言語推論(NLI)を用いた画像リアリズム評価手法を提案する。
我々のアプローチは、LVLMが常識に反するイメージに直面すると幻覚を引き起こすという前提に基づいている。
WHOOPS!データセットのゼロショットモードでは,新たな最先端性能を実現しています。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:44:10 GMT)
Towards Automatic Evaluation for Image Transcreation [52.7] 本稿では,機械翻訳(MT)メトリクスにインスパイアされた自動評価指標群を提案する。
画像トランスクリエーションの3つの重要な側面として,文化的関連性,意味的等価性,視覚的類似性を挙げる。
この結果から,視覚エンコーダの表現は視覚的類似度を測定するのに有効であるのに対し,プロプライエタリなVLMは文化的関連性と意味的等価性を最もよく認識していることがわかった。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 21:00:43 GMT)
Doing More With Less: Mismatch-Based Risk-Limiting Audits [52.3] リスク制限監査(RLA)に対する1つのアプローチは、ランダムに選択された投票記録(CVR)と、人間の監査官が読み取った投票を比較することである。
CVRの完全セットにおけるミスマッチの総数は、報告結果の誤りに必要なCVRエラーの最小数を超えているかどうかを検討する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:47:54 GMT)
Bokehlicious: Photorealistic Bokeh Rendering with Controllable Apertures [51.9] ボケのレンダリング手法は、プロの写真に見られる視覚的に魅力的で、ソフトにぼやけた背景を作り出す上で重要な役割を果たしている。
本稿では,Aperture-Aware Attention 機構を用いて,ボケの強度を直感的に制御する高効率ネットワークであるBokehliciousを提案する。
プロの写真家が撮影した23,000の高解像度(24-MP)の画像を含む新しいデータセットであるRealBokehを提示する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:00:45 GMT)
Reversal Blessing: Thinking Backward May Outpace Thinking Forward in Multi-choice Questions [51.6] 言語モデルは、通常左から右へ(L2R)自己回帰因子化を使用する。
いくつかのタスクにおいて,テキスト分布の代替因数分解が有用かどうかを検討する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:25:21 GMT)
ARKit LabelMaker: A New Scale for Indoor 3D Scene Understanding [51.5] 我々は,高密度なセマンティックアノテーションを備えた大規模実世界の3DデータセットであるARKit LabelMakerを紹介する。
具体的には、拡張されたLabelMakerパイプラインを使用して、自動的に生成された高密度な3DラベルでARKitScenesを拡張する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:16:27 GMT)
LOCAL: Learning with Orientation Matrix to Infer Causal Structure from Time Series Data [51.5] LOCALは動的因果構造を復元するための効率的で実装が容易で制約のない手法である。
Asymptotic Causal Learning Mask (ACML) と Dynamic Graph Learning (DGPL)
合成および実世界のデータセットの実験では、LOCALが既存の手法よりも大幅に優れていることが示されている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:32:03 GMT)
Stop Overthinking: A Survey on Efficient Reasoning for Large Language Models [51.3] 大規模言語モデル(LLM)は複雑なタスクにおいて顕著な機能を示した。
OpenAI o1とDeepSeek-R1の最近の進歩は、System-2推論ドメインのパフォーマンスをさらに改善した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:59:38 GMT)
OmniGeo: Towards a Multimodal Large Language Models for Geospatial Artificial Intelligence [51.0] マルチモーダル大言語モデル(LLM)が人工知能の新しいフロンティアをオープンした。
地理空間応用に適したMLLM(OmniGeo)を提案する。
自然言語理解の長所と空間的推論の長所を組み合わせることで,GeoAIシステムの指示追従能力と精度を高めることができる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:45:48 GMT)
Pareto Control Barrier Function for Inner Safe Set Maximization Under Input Constraints [50.9] 入力制約下での動的システムの内部安全集合を最大化するPCBFアルゴリズムを提案する。
逆振り子に対するハミルトン・ヤコビの到達性との比較と,12次元四元数系のシミュレーションにより,その有効性を検証する。
その結果,PCBFは既存の手法を一貫して上回り,入力制約下での安全性を確保した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:05:28 GMT)
FedAWA: Adaptive Optimization of Aggregation Weights in Federated Learning Using Client Vectors [50.1] Federated Learning (FL)は、分散機械学習のための有望なフレームワークとして登場した。
ユーザの行動、好み、デバイス特性の相違から生じるデータの異質性は、連合学習にとって重要な課題である。
本稿では,学習過程におけるクライアントベクトルに基づくアダプティブ重み付けを適応的に調整する手法であるAdaptive Weight Aggregation (FedAWA)を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:49:40 GMT)
iFlame: Interleaving Full and Linear Attention for Efficient Mesh Generation [49.8] iFlameはメッシュ生成のためのトランスフォーマーベースの新しいネットワークアーキテクチャである。
本稿では,線形アテンションの効率とフルアテンション機構の表現力を組み合わせたインターリービング自己回帰メッシュ生成フレームワークを提案する。
提案するインターリービングフレームワークは,計算効率と生成性能を効果的にバランスさせることが示唆された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:10:37 GMT)
The Lighthouse of Language: Enhancing LLM Agents via Critique-Guided Improvement [49.7] 大規模言語モデル(LLM)は、最近、テキストベースのアシスタントから、計画、推論、反復的な行動改善が可能な自律エージェントへと変化した。
本研究では,環境を探索するアクターモデルと,詳細な自然言語フィードバックを生成する批評家モデルからなる,新しい2人プレイヤフレームワークであるCGIを紹介する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:42:33 GMT)
The Devil is in the Spurious Correlations: Boosting Moment Retrieval with Dynamic Learning [49.4] 本稿では,モーメント検索のための動的学習手法を提案する。
まず、クエリーモーメントの動的コンテキストを構築するための新しいビデオ合成手法を提案する。
第2に、背景との過度な関連を緩和するために、テキストと力学の相互作用を組み込むことで、時間的に表現を強化する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:22:27 GMT)
Socratic Reasoning Improves Positive Text Rewriting [49.3] 否定的思考を肯定的思考に反映することは、精神保健や心理療法に対するいくつかの認知的アプローチの欠如である。
我々は、思考の書き直しプロセスを合理化するために、textscSocraticReframeと呼ばれる新しいフレームワークを開発した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:43:29 GMT)
Acc3D: Accelerating Single Image to 3D Diffusion Models via Edge Consistency Guided Score Distillation [49.2] 本稿では,単一画像から3次元モデルを生成する拡散過程の高速化に取り組むために,Acc3Dを提案する。
数段階の推論によって高品質な再構成を導出するため,ランダムノイズ状態におけるスコア関数の学習を規則化する上で重要な課題を強調した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:18:10 GMT)
VP-NTK: Exploring the Benefits of Visual Prompting in Differentially Private Data Synthesis [48.8] 微分プライベート(DP)合成データは、機密データを公開するためのデファクトスタンダードとなっている。
パラメータ効率細調整(PEFT)における新しい手法の1つは、視覚的プロンプト(VP)である。
本研究では, DP生成モデルのトレーニングにおいて, ニューラルタンジェントカーネル(NTK)のパワーを利用するDPジェネレータであるDP-NTKと組み合わせたVPが, 大幅な性能向上を実現していることを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:42:11 GMT)
MathFusion: Enhancing Mathematic Problem-solving of LLM through Instruction Fusion [48.4] MathFusionはクロスプロブレム命令合成による数学的推論を強化する新しいフレームワークである。
MathFusionは、高いデータ効率を維持しながら、数学的推論を大幅に改善する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:00:41 GMT)
STOP: Integrated Spatial-Temporal Dynamic Prompting for Video Understanding [48.1] 本稿では,STOP(Spatial-Temporal dynamic Prompting)モデルを提案する。
2つの相補的なモジュールで構成され、フレーム内の空間的プロンプトとフレーム間の時間的プロンプトである。
STOPは、最先端のメソッドに対して一貫して優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:16:20 GMT)
CodeScientist: End-to-End Semi-Automated Scientific Discovery with Code-based Experimentation [48.1] CodeScientistは、遺伝的検索の形式として、アイデアと実験を共同で行う新しいASDシステムである。
我々はこのパラダイムを用いて、エージェントと仮想環境の領域において、機械生成のアイデアを幅広く数百もの自動実験する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 22:37:17 GMT)
MIA-Bench: Towards Better Instruction Following Evaluation of Multimodal LLMs [47.9] MIA-Benchは、マルチモーダルな大規模言語モデル(MLLM)を、複雑な命令に厳密に準拠する能力に基づいて評価するために設計されたベンチマークである。
私たちのベンチマークでは、400のイメージプロンプトペアで構成されており、それぞれが階層化された命令に対するモデルのコンプライアンスに挑戦するために作られています。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:49:09 GMT)
Multi-Output Distributional Fairness via Post-Processing [47.9] 本稿では,タスクに依存しない公平度尺度である分散パリティを高めるために,マルチ出力モデルに対する後処理手法を提案する。
分布パリティを達成するための既存の方法は、モデルの出力の(逆)累積密度関数に依存する。
正確なバリセンタの計算の複雑さを低減するために近似手法を適用した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:42:22 GMT)
Precise and Dexterous Robotic Manipulation via Human-in-the-Loop Reinforcement Learning [47.8] 本稿では,多種多様な操作タスクに対して印象的な性能を示す,ループ内視覚に基づくRLシステムを提案する。
提案手法では,実証と人間の修正,効率的なRLアルゴリズム,その他のシステムレベルの設計選択を統合してポリシを学習する。
提案手法は,再現学習のベースラインと先行RLアプローチを著しく上回り,成功率の平均2倍,実行速度1.8倍に向上した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:16:05 GMT)
Aligning Text to Image in Diffusion Models is Easier Than You Think [47.6] ソフトテキストトークンを用いたSoftREPAと呼ばれる軽量なコントラスト微調整方式を導入する。
本手法は,テキストと画像表現間の相互情報を明示的に増大させ,意味的一貫性を向上させる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:35:44 GMT)
Scaling Up Single Image Dehazing Algorithm by Cross-Data Vision Alignment for Richer Representation Learning and Beyond [47.4] 本稿では,よりリッチな表現学習のためのクロスデータビジョンアライメント手法を提案する。
データの外部アライメントを使用することで、データセットは、しっかりと整列された異なるドメインからのサンプルを継承する。
提案手法は, 実際のヘイズフリー画像に最も近いデハズド画像のデハズ化やデハズド画像の生成において, 他の先進的手法よりも著しく優れている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:22:58 GMT)
MarkushGrapher: Joint Visual and Textual Recognition of Markush Structures [47.4] MarkushGrapherは、ドキュメント内のMarkush構造を認識するためのマルチモーダルアプローチである。
本稿では,多種多様な現実的なマルコシュ構造を生成する合成データ生成パイプラインを提案する。
M2Sは、実世界のMarkush構造の最初の注釈付きベンチマークである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:40:38 GMT)
RePanda: Pandas-powered Tabular Verification and Reasoning [47.4] RePandaは、クレームを実行可能なパンダクエリに変換する構造化された事実検証手法である。
RePandaをトレーニングするために、TabFactから派生した構造化データセットであるPanTabFactを構築した。
そこで我々はPanWikiを紹介した。PanWikiはWikiTableQuestionsをパンダのクエリにマッピングするデータセットである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:10:27 GMT)
ContextGNN goes to Elliot: Towards Benchmarking Relational Deep Learning for Static Link Prediction (aka Personalized Item Recommendation) [47.3] 3つの標準レコメンデーションデータセットと、6つの最先端のGNNベースのレコメンデーションシステムに対して実験を行う。
Amazon Bookの従来の静的リンク予測タスクに対する予備的なテストは、ContextGNNがまだ改善の余地があることを実証した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:17:09 GMT)
emg2qwerty: A Large Dataset with Baselines for Touch Typing using Surface Electromyography [47.2] emg2qwertyは、QWERTYキーボードでタッチ入力しながら手首に記録された非侵襲的筋電図信号の大規模なデータセットである。
1,135のセッションが108ユーザと346時間の録画にまたがっており、これまでで最大の公開データセットである。
sEMG信号のみを用いたキープレッシャの予測において,高いベースライン性能を示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:51:46 GMT)
MagicMotion: Controllable Video Generation with Dense-to-Sparse Trajectory Guidance [46.9] トラジェクティブ制御可能なビデオ生成のための画像からビデオ生成フレームワークであるMagicMotionを紹介する。
MagicMotionは、オブジェクトの一貫性と視覚的品質を維持しながら、定義された軌道に沿ってオブジェクトを認識できる。
我々は、大規模なトラジェクトリ制御ビデオデータセットであるMagicDataと、アノテーションとフィルタリングのための自動パイプラインを提示する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:59:42 GMT)
SSTP: Efficient Sample Selection for Trajectory Prediction [46.9] 大規模データセット上での高度な軌道予測モデルのトレーニングは、時間と計算コストがかかる。
本稿では,軌道予測のためのコンパクトでバランスの取れたデータセットを構築する,軌道予測のためのサンプル選択フレームワークを提案する。
SSTPは強力な一般化と堅牢性を示し、選択されたサブセットはモデルに依存しず、広く適用可能なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:32:59 GMT)
Diffusion Model as a Noise-Aware Latent Reward Model for Step-Level Preference Optimization [46.9] 拡散モデルの優先度最適化は、画像を人間の好みに合わせることを目的としている。
従来の方法では、ビジョンランゲージモデル(VLM)を画素レベルの報酬モデルとして活用し、人間の好みを近似する。
本研究では,拡散モデルが潜伏空間におけるステップレベルの報酬モデリングに本質的に適していることを示す。
本稿では,遅延空間において,ステップレベルの優先度最適化を直接的に行う手法であるLatent Preference Optimization (LPO)を紹介する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:36:28 GMT)
From Chaos to Order: The Atomic Reasoner Framework for Fine-grained Reasoning in Large Language Models [46.0] 我々は,微粒な推論を可能にする認知推論戦略であるtextbfAtomic Reasoner(textbfAR)を提案する。
ARは推論プロセスを原子認知単位に分解し、認知的ルーティング機構を使用する。
結果より, 完全解探索の計算負担を伴わないARの優れた推論能力を示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:34:53 GMT)
Do you know what q-means? [45.8] Kerenidis, Landman, Luongo, Prakash (NeurIPS')によって提案された量子アルゴリズムの改良版を提案する。
我々のアルゴリズムは、先行研究の量子線型代数プリミティブに頼るのではなく、QRAMを用いて単純な状態を作成する。
また、$varepsilon$-$k$-meansに対して、$Obigで実行される"dequantized"アルゴリズムも提示する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:47:44 GMT)
Causal Deciphering and Inpainting in Spatio-Temporal Dynamics via Diffusion Model [45.5] CaPaintは2段階のプロセスで因果推論能力を備えたデータとエンドウモデルの因果領域を特定することを目的としている。
微調整未条件拡散確率モデル(DDPM)を生成前として, 環境成分として定義されたマスクを埋め込む。
5つの実世界のSTベンチマークで実施された実験は、CaPaintの概念の統合により、モデルが4.3%から77.3%の改善を達成できることを示した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:40:42 GMT)
Rethinking Robustness in Machine Learning: A Posterior Agreement Approach [45.3] モデル検証の後方合意(PA)理論は、ロバストネス評価のための原則的な枠組みを提供する。
本稿では,PA尺度が学習アルゴリズムの脆弱性を,ほとんど観測されていない場合でも,合理的かつ一貫した分析を提供することを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:03:39 GMT)
4D Gaussian Splatting SLAM [44.7] 本稿では,カメラのポーズを漸進的に追跡し,未知のシナリオで4次元ガウス放射場を確立する,効率的なアーキテクチャを提案する。
実験結果から,提案手法は実環境におけるロバストなトラッキングと高品質なビュー性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 21:08:08 GMT)
Style-Friendly SNR Sampler for Style-Driven Generation [44.5] スタイル駆動生成では、ユーザーは典型的には、所望のスタイルを示す参照イメージと、所望のスタイル属性を指定するテキストプロンプトを提供する。
従来のアプローチは微調整に頼っていたが、適応せずに事前訓練から目的や騒音レベルの分布を盲目的に利用することが多い。
そこで我々は,SNRの信号対雑音比(SNR)分布を,スタイリスティックな特徴が出現する雑音レベルに焦点を合わせるために,微調整時に高雑音レベルに積極的にシフトするスタイルフレンドリーなSNRサンプリング手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:25:16 GMT)
TablePilot: Recommending Human-Preferred Tabular Data Analysis with Large Language Models [44.4] 大規模言語モデルを活用する先駆的なデータ分析フレームワークであるTablePilotを,包括的で優れた分析結果を自律的に生成する。
このフレームワークは、分析準備と分析最適化に重要な設計を取り入れ、精度を向上する。
また,レコメンデーション品質を向上し,ヒトの嗜好に適合する新しい手法であるRec-Alignを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:42:08 GMT)
SpeCache: Speculative Key-Value Caching for Efficient Generation of LLMs [44.4] 我々は,完全なKVキャッシュをオフロードし,各デコードステップでKVペアを動的にフェッチするSpeCacheを提案する。
LongBenchとNeedle-in-a-Haystackベンチマークの実験では、SpeCacheがVRAMの使用を効果的に削減していることが確認されている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:01:56 GMT)
Improving Discriminator Guidance in Diffusion Models [43.9] クロスエントロピー損失を用いた判別器の訓練は、一般的に行われるように、モデルと対象分布間のクルバック・リーブラーのばらつきを増大させることができることを示す。
KLの発散を適切に最小化する識別器誘導のための理論的に健全な学習目標を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:04:43 GMT)
V2X-R: Cooperative LiDAR-4D Radar Fusion for 3D Object Detection with Denoising Diffusion [43.6] 我々は、LiDAR、カメラ、および4Dレーダを取り入れた初のシミュレーションV2XデータセットであるV2X-Rを提案する。
V2X-Rには12,079のシナリオがあり、LiDARと4Dレーダーポイント雲の37,727フレーム、150,908の画像、170,859の注釈付き3D車両バウンディングボックスがある。
本稿では,3次元物体検出のための新しいコラボレーティブLiDAR-4Dレーダ融合パイプラインを提案し,様々な融合戦略を用いて実装する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:55:02 GMT)
Re-Imagining Multimodal Instruction Tuning: A Representation View [43.3] マルチモーダル・インストラクション・チューニングはゼロショットの一般化を実現するための効果的な戦略であることが証明されている。
LMMの規模が拡大するにつれて、これらのモデルを完全に微調整し、パラメーター集約化が進んでいる。
意味的にリッチなマルチモーダル表現を直接編集することに焦点を当てた新しいアプローチであるMultimodal Representation Tuning(MRT)を導入する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 21:26:06 GMT)
UNIP: Rethinking Pre-trained Attention Patterns for Infrared Semantic Segmentation [43.2] 我々は、事前学習モデルの性能を高めるために、統一赤外線事前学習フレームワークUNIPを提案する。
UNIPは,3つの赤外線セグメンテーションタスクにおいて,平均mIoUの13.5%の事前学習方法よりも優れることを示す。
UNIP-Sは、計算コストの1/10しか必要とせず、MAE-Lと同等の性能を達成する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:55:08 GMT)
Generative Human Geometry Distribution [42.7] 本稿では,人間の幾何学分布の分布をモデル化する新しい3次元人体生成フレームワークを提案する。
筆者らのフレームワークは,まず人体形状分布の生成と,この分布から抽出した高忠実度人間の2段階で動作する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:48:44 GMT)
Through the LLM Looking Glass: A Socratic Self-Assessment of Donkeys, Elephants, and Markets [42.6] この研究は、外部解釈に頼るのではなく、モデルのバイアスを直接測定することを目的としている。
我々の結果は、あらゆるモデルで共和党の立場よりも民主党を一貫して好んでいることを示している。
偏見は西洋のLLMによって異なるが、中国で開発されたものは社会主義に強く依存している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:40:40 GMT)
Learning to Efficiently Adapt Foundation Models for Self-Supervised Endoscopic 3D Scene Reconstruction from Any Cameras [42.0] 本稿では,内視鏡的シーン再構築のための統合フレームワークであるEndo3DACを紹介する。
我々は、深度マップ、相対ポーズ、カメラ固有のパラメータを同時に推定できる統合ネットワークを設計する。
4つの内視鏡的データセットに対する実験により、Endo3DACは他の最先端の手法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:49:04 GMT)
Nonlinear action prediction models reveal multi-timescale locomotor control [42.0] 実験室で制約された環境で圧倒的に検証された既存のモデルとその仮定が現実世界に一般化されるかどうかは不明である。
我々は非線形足位予測モデルを開発し、GRUやTransformerのようなフレキシブルな入力履歴依存性を持つニューラルネットワークアーキテクチャが最適であることを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:57:15 GMT)
Enhancing Zero-Shot Image Recognition in Vision-Language Models through Human-like Concept Guidance [41.7] ゼロショット画像認識タスクでは、人間は目に見えないカテゴリを分類する際、顕著な柔軟性を示す。
既存の視覚言語モデルは、しばしば準最適プロンプトエンジニアリングのため、現実世界のアプリケーションでは性能が劣る。
これらの問題に対処するために,概念誘導型人間ライクなベイズ推論フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:20:13 GMT)
GAEA: A Geolocation Aware Conversational Model [41.6] 本稿では,画像の位置に関する情報を提供する対話モデルGAEAを提案する。
そのようなモデルのトレーニングを可能にする大規模なデータセットは存在しない。
GAEAは、最高のオープンソースモデルであるLLaVA-OneVisionを25.69%、最高のプロプライエタリモデルであるGPT-4oを8.28%上回っている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:59:47 GMT)
SaMam: Style-aware State Space Model for Arbitrary Image Style Transfer [41.1] 私たちはSaMamと呼ばれるMambaベースのスタイル転送フレームワークを開発した。
具体的には、コンテンツやスタイル情報を効率的に抽出するマンバエンコーダを設計する。
既存のSSMの局所的画素分割やチャネル冗長性,空間的不連続性といった問題に対処するために,局所的拡張とジグザグスキャンを導入する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:18:27 GMT)
Frequency Enhancement for Image Demosaicking [40.8] 本稿では,RGB画像の分割・復号化を行うデュアルパス周波数拡張ネットワーク(DFENet)を提案する。
1つの経路は、空間領域の細かな精細化を通じて行方不明の情報を生成することに焦点を当て、もう1つは望ましくない周波数を抑えることを目的としている。
これらの設計により、提案されたDFENetは、異なるデータセット上で、他の最先端アルゴリズムよりも優れている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:37:10 GMT)
Temporal Score Analysis for Understanding and Correcting Diffusion Artifacts [40.5] 現在の解決策は管制検出器に依存しているが、そもそもなぜこれらの人工物が生じるのかは理解されていない。
本研究では,拡散過程における異常スコアのダイナミクスを監視して,人工物を検出するASCED(Abnormal Score Correction for Enhancing Diffusion)を提案する。
ポストホック補正を適用する既存の方法とは異なり、我々の緩和戦略は既存の拡散過程内でシームレスに機能する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:11:56 GMT)
AutoRedTeamer: Autonomous Red Teaming with Lifelong Attack Integration [40.4] 本稿では,大規模言語モデル(LLM)に対する完全自動化とエンドツーエンドのレッドコラボレーションのための新しいフレームワークであるAutoRedTeamerを紹介する。
AutoRedTeamerはマルチエージェントアーキテクチャとメモリ誘導型攻撃選択機構を組み合わせることで、新たな攻撃ベクトルの継続的な発見と統合を可能にする。
我々は、さまざまな評価設定でAutoRedTeamerの有効性を示し、HarmBenchのLlama-3.1-70Bに対する攻撃成功率を20%向上させた。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 00:13:04 GMT)
Single Image Iterative Subject-driven Generation and Editing [40.3] SISOは、トレーニングなしで単一の画像から画像の生成と編集をパーソナライズするための、トレーニング不要なアプローチである。
SISOは、与えられた被写体画像との類似性の喪失に基づいて、画像を反復的に生成し、モデルを最適化する。
画像品質, 被写体忠実度, 背景保存における既存手法の大幅な改善を示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:45:04 GMT)
Parameters vs. Context: Fine-Grained Control of Knowledge Reliance in Language Models [39.7] Retrieval-Augmented Generation (RAG)は、外部知識を統合することで、大規模言語モデル(LLM)における幻覚を緩和する。
パラメトリック知識と検索コンテキストの対立は、RAGに課題をもたらす。
パラメトリックおよび文脈知識へのRAGの依存度を制御するためのプラグイン・アンド・プレイ方式である*CK-PLUG*を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:26:28 GMT)
Tracking Everything in Robotic-Assisted Surgery [39.6] そこで我々は,手術シナリオに対するベンチマーク追跡のための注釈付き手術追跡データセットを提案する。
我々は,このデータセット上で最先端(SOTA)のTAPベースのアルゴリズムを評価し,その限界を明らかにする。
本稿では,新たなトラッキング手法であるSurgMotionを提案し,その課題の解決とトラッキング性能の向上を図る。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:50:04 GMT)
Revealing Key Details to See Differences: A Novel Prototypical Perspective for Skeleton-based Action Recognition [39.4] 骨格に基づく行動認識において、重要な課題は関節の類似した軌跡を持つ行動の区別である。
グラフ畳み込みネットワーク(GCN)ベースのモデルであるProtoGCNを導入する。
プロトタイプの再構築とは対照的に、ProtoGCNは類似したアクションの識別的表現を効果的に識別し、強化することができる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:57:02 GMT)
Blend the Separated: Mixture of Synergistic Experts for Data-Scarcity Drug-Target Interaction Prediction [39.4] 薬物と標的の相互作用予測(DTI)は、薬物発見や臨床応用を含む様々な用途において不可欠である。
DTIの予測で広く使われている入力データには2つの視点がある: 内因性データは薬物や標的の作り方を表し、外因性データは薬物や標的が他の生物学的実体とどのように関連しているかを表す。
入力データおよび/またはラベル不足下でのDTI予測に最初に取り組む手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:27:16 GMT)
Gene42: Long-Range Genomic Foundation Model With Dense Attention [39.2] ゲノム基盤モデル(GFM)の新規ファミリーであるGene42を紹介する。
Gene42モデルはデコーダのみのアーキテクチャ(LLaMAスタイル)と密集した自己認識機構を使用している。
Gene42は、ゲノム学においてこのような長いコンテキスト長を扱うことができる最初の高密度アテンションモデルである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:10:04 GMT)
BlockDance: Reuse Structurally Similar Spatio-Temporal Features to Accelerate Diffusion Transformers [39.1] DiT(Diffusion Transformer)は、低推論速度に関連する課題に直面し続けている。
我々は、DiTを加速するために、隣接する時間ステップにおける特徴的類似性を探求する、トレーニング不要のアプローチであるBlockDanceを提案する。
インスタンス固有のアクセラレーションに適した軽量な意思決定ネットワークであるBlockDance-Adaについても紹介する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:07:31 GMT)
Digitally Prototype Your Eye Tracker: Simulating Hardware Performance using 3D Synthetic Data [38.6] 本稿では,ハードウェア変更が機械学習によるETパフォーマンスに与える影響をエンドツーエンドで評価する手法を提案する。
我々は,ニューラルレイディアンス場(NeRF)を用いた光ドームデータから再構成した実眼のデータセットを用いて,新しい視点から捕獲された眼を合成する。
また、眼のオン軸直視からフレームの周辺視まで、ETカメラの位置を変動させる第1種分析も提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 23:09:15 GMT)
Time After Time: Deep-Q Effect Estimation for Interventions on When and What to do [37.3] 我々は、Earl Most Disagreement Q-Evaluation(EDQ)と呼ばれる、いつ、何をすべきかを推定する新しいディープQアルゴリズムを提案する。
生存時間と腫瘍成長タスクに関する実験を通じて,本手法の有効性を検証した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:27:35 GMT)
Optimal Complexity in Byzantine-Robust Distributed Stochastic Optimization with Data Heterogeneity [37.1] 本稿では,Byzantine-robust分散一階最適化手法の厳密な下限を確立する。
このギャップを埋めるために、Nesterovの高速化手法を活用して、新しいビザンチン・ロバスト分散最適化法を開発した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:56:06 GMT)
Beyond Role-Based Surgical Domain Modeling: Generalizable Re-Identification in the Operating Room [36.7] 本稿では,各チームメンバーの独特の動きパターンと身体的特徴を特徴付ける,スタッフ中心のモデリング手法を提案する。
我々は3次元点雲の列を符号化して形状と各個人固有の動きパターンを抽出する一般化可能な再同定フレームワークを開発した。
本手法は, 現実的な臨床データに対して86.19%の精度を達成し, 異なる環境間での移動時の75.27%の精度を維持した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:08:07 GMT)
AI Agents in Cryptoland: Practical Attacks and No Silver Bullet [36.5] 本稿では,ブロックチェーンベースの金融エコシステムにおけるAIエージェントの脆弱性を,現実のシナリオにおける敵対的脅威に曝露した場合に検討する。
保護されていないコンテキストサーフェスを利用する包括的攻撃ベクトルであるコンテキスト操作の概念を導入する。
この結果から,悪意のある入力がエージェントの記憶されたコンテキストを損なう可能性があるため,プロンプトベースの防御は不十分であることが示唆された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:44:31 GMT)
Hybrid-Level Instruction Injection for Video Token Compression in Multi-modal Large Language Models [36.2] MLLM(HICom)における条件付きトーケン圧縮のためのハイブリッドレベルのインストラクションインジェクション戦略を提案する。
ローカルレベルとグローバルレベルの両方から圧縮を誘導する条件として,この命令を使用する。
実験の結果、HIComは少ないトークンで優れた映像理解能力を得ることができることがわかった。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:09:18 GMT)
LongVALE: Vision-Audio-Language-Event Benchmark Towards Time-Aware Omni-Modal Perception of Long Videos [35.8] リアルワールドビデオは、密集したストーリーラインを形成する一連のイベントを含む、オムニ・モーダル情報(ビジョン、オーディオ、スピーチ)を含んでいる。
微粒なイベントアノテーションによるマルチモーダルビデオデータの欠如と、手動ラベリングの高コストは、全方位ビデオ知覚において大きな障害となる。
正確な時間境界を持つ105Kのオムニモーダルイベントからなる視覚・聴覚・言語イベント理解ベンチマークであるLongVALEを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:55:30 GMT)
A Scalable Crawling Algorithm Utilizing Noisy Change-Indicating Signals [35.5] 提案手法は, (i) 雑音側情報を軽度な仮定で最適に利用するスケーラブルなクローリングアルゴリズム, (ii) 重心集中型計算を使わずにデプロイできる, (iii) 任意の時間間隔で全帯域使用量をスパイクすることなくWebページを一定の総レートでクロールできる,という手法である。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 21:49:15 GMT)
Beyond Local Selection: Global Cut Selection for Enhanced Mixed-Integer Programming [35.5] 混合整数計画法(MIP)では、分枝・分枝・分枝(B&C)アルゴリズムには切断平面が不可欠である。
本稿では,二部グラフを用いて探索木を表現し,グラフニューラルネットワークと強化学習を組み合わせてカット選択戦略を開発するGCSを提案する。
実験により、GCSは従来の学習手法と比較して、合成および大規模現実世界のMIPの解法効率を著しく改善することが示された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:59:18 GMT)
OccluGaussian: Occlusion-Aware Gaussian Splatting for Large Scene Reconstruction and Rendering [35.5] 大規模なシーン再構築では、シーンを複数の小さな領域に分割して個別に再構築することが一般的である。
本稿では,カメラの位置と視認性に基づいてカメラをクラスタリングし,複数の領域を抽出するOcclusion-aware scene division戦略を提案する。
また,大画面レンダリングを高速化する領域ベースのレンダリング手法を提案し,視点のある領域にガウス人が見えないようにした。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:18:52 GMT)
Towards Agentic AI Networking in 6G: A Generative Foundation Model-as-Agent Approach [35.1] 本稿では,AIエージェント間のインタラクション,協調学習,知識伝達を支援する新しいフレームワークであるAgentNetを提案する。
本稿では,デジタルツイン方式の産業自動化とメタバース方式のインフォテインメントシステムという,2つの応用シナリオについて考察する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 00:48:44 GMT)
MedAgentsBench: Benchmarking Thinking Models and Agent Frameworks for Complex Medical Reasoning [34.9] LLM(Large Language Models)は、既存の医学的質問応答ベンチマークで素晴らしいパフォーマンスを示している。
MedAgentsBenchは、多段階の臨床推論、診断の定式化、および治療計画シナリオを必要とする医学的問題に焦点を当てたベンチマークである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 01:30:56 GMT)
EmojiPrompt: Generative Prompt Obfuscation for Privacy-Preserving Communication with Cloud-based LLMs [34.8] EmojiPromptは生成変換を行い、言語的および非言語的要素を持つプロンプト内でプライベートデータを難読化する。
さまざまなドメインから8つのデータセットにまたがるEmojiPromptの性能を評価した。
EmojiPromptの原子レベルの難読化により、クラウドベースのLCMでのみ機能する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 20:15:22 GMT)
Beyond Next-Token: Next-X Prediction for Autoregressive Visual Generation [34.1] 自己回帰(AR)モデリングは、最先端の言語と視覚的生成モデルを支える。
伝統的に、トークン'' は最小の予測単位として扱われ、しばしば言語における離散的なシンボルまたは視覚における量子化されたパッチとして扱われる。
トークンの概念をエンティティXに拡張するフレームワークであるxARを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:15:30 GMT)
CAARMA: Class Augmentation with Adversarial Mixup Regularization [34.0] CAARMAは話者認証のためのクラス拡張フレームワークである。
組込み空間におけるデータ混合を通じて合成クラスを導入し、トレーニングクラス数を拡大する。
我々は、複数の話者検証タスクにおけるCAARMAと、他の代表的ゼロショット比較に基づく音声分析タスクについて評価する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 21:41:16 GMT)
KDSelector: A Knowledge-Enhanced and Data-Efficient Model Selector Learning Framework for Time Series Anomaly Detection [33.7] 現実世界のアプリケーションでは、高度に異質な時系列に対して最高のTSADモデルは存在しない。
KDSセレクタを内部としたTSADモデル選択システムを開発し、ユーザがセレクタの精度とトレーニング速度をどのように向上するかを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:06:28 GMT)
ChatGPT and U(X): A Rapid Review on Measuring the User Experience [33.4] 研究者や実践者がChatGPTや同様のLCMベースのシステムとのユーザインタラクションを最適化する上で,ChatGPT UXの領域を拡大することを目指しています。
私は、操作した独立変数(IVs)、測定した依存変数(DVs)、測定に用いる方法に焦点を当てた。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:51:11 GMT)
Expert Race: A Flexible Routing Strategy for Scaling Diffusion Transformer with Mixture of Experts [33.4] 我々は、フレキシブルなルーティング戦略を持つ拡散変圧器のための新しいMoEモデルであるRace-DiT、Expert Raceを紹介する。
トークンとエキスパートが競争し、上位候補を選択することによって、モデルはエキスパートをクリティカルトークンに動的に割り当てることを学ぶ。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:45:08 GMT)
Multi-Reward as Condition for Instruction-based Image Editing [32.8] インストラクションベースの画像編集には、高品質なトレーニング三脚(インストラクション、オリジナル画像、編集画像)が不可欠である。
これらのデータセットは、指示の不正確さ、詳細保存の貧弱さ、生成アーティファクトに悩まされている。
そこで本研究では,地味画像の品質を改良する代わりに,多視点報酬データを用いたトレーニングデータ品質問題に対処することを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 00:04:47 GMT)
MKG-Rank: Enhancing Large Language Models with Knowledge Graph for Multilingual Medical Question Answering [32.6] 多言語医療質問応答のための多言語知識グラフに基づく検索ランク付け(MKG-Rank)を提案する。
単語レベルの翻訳機構により、我々のフレームワークはLLM推論に包括的英語中心の医療知識グラフを効率的に統合する。
中国語、日本語、韓国語、スワヒリ語にまたがる多言語医療QAベンチマークの大規模な評価は、MKG-RankがゼロショットLLMを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:25:03 GMT)
Spatiotemporal Multi-Camera Calibration using Freely Moving People [32.3] マルチビュー動画における移動自由度を用いたマルチカメラキャリブレーション手法を提案する。
我々は、時間外時空間の棚から得られた3D人間のポーズを用いて、それらを単位球上の3Dポイントに変換する。
我々は、時間データの整合と対応の確立という両問題を共同で解決する確率論的アプローチを採用する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:38:11 GMT)
Multi-Modal Foundation Models for Computational Pathology: A Survey [32.3] 基礎モデルは、計算病理学(CPath)の強力なパラダイムとして登場した。
我々は、32の最先端マルチモーダル基盤モデルを、視覚言語、視覚知識グラフ、視覚生成表現の3つの主要なパラダイムに分類する。
病理学に適した28の利用可能なマルチモーダルデータセットを分析し、画像テキストペア、命令データセット、画像以外のモダリティペアにグループ化する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:43:54 GMT)
Mobile Edge Intelligence for Large Language Models: A Contemporary Survey [32.2] デバイス上の大規模言語モデル(LLM)は、クラウドパラダイムと比較してコスト効率、レイテンシ効率、プライバシ保護がよい。
モバイルエッジインテリジェンス(MEI)は、モバイルネットワークのエッジにAI機能を提供することで、実行可能なソリューションを提供する。
本稿では,LLMのMEI活用に関する現代の調査を紹介する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:23:42 GMT)
UniCrossAdapter: Multimodal Adaptation of CLIP for Radiology Report Generation [31.7] 画像とテキスト間のクロスモーダルセマンティクスをよりよく捉えるために,大規模な事前学習型視覚言語モデルであるCLIPから表現を転送することを提案する。
効率的な適応を実現するために、CLIPに組み込まれ、ターゲットタスクに微調整される軽量アダプタモジュールであるUniCrossAdapterを導入する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:28:53 GMT)
ScalingNoise: Scaling Inference-Time Search for Generating Infinite Videos [31.6] ビデオ拡散モデル(VDM)は高品質のビデオの生成を容易にする。
近年,映像の質を高める「金音」の存在が報告されている。
本研究では,拡散サンプリングプロセスにおける黄金の初期雑音を識別する,プラグアンドプレイの推論時間探索手法であるScalingNoiseを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:54:37 GMT)
ECKGBench: Benchmarking Large Language Models in E-commerce Leveraging Knowledge Graph [31.2] 大規模言語モデル(LLM)は、様々なNLPタスクでその能力を実証している。
プラットフォーム検索、パーソナライズされたレコメンデーション、カスタマーサービスといった実践的な実装によって証明されている。
LLMの事実性を評価するためのいくつかの手法が提案されているが、信頼性の欠如、高消費、ドメインの専門知識の欠如などの問題は、電子商取引における効果的な評価のギャップを残している。
電子商取引におけるLLMの能力を評価するためのデータセットであるECKGBenchを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:49:15 GMT)
FreeFlux: Understanding and Exploiting Layer-Specific Roles in RoPE-Based MMDiT for Versatile Image Editing [31.0] MMDiT(Multimodal Diffusion Transformer)におけるロータリー位置埋め込み(RoPE)の統合により,テキスト・画像生成の品質が大幅に向上した。
本稿では,RoPEに基づくMMDiTモデルの最初の力学解析を行い,位置情報とコンテンツ依存関係をアンハングリングする自動探索手法を提案する。
編集タスクを、位置依存編集(オブジェクトの追加など)、コンテンツ類似性依存編集(非剛性編集など)、地域保存編集(例)の3種類に分類する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:55:12 GMT)
What can Off-the-Shelves Large Multi-Modal Models do for Dynamic Scene Graph Generation? [30.7] ビデオ用の動的シーングラフ生成(DSGG)はコンピュータビジョンにおいて難しい課題である。
予測されたシーングラフを概観し、既存のDSGG法における3つの重要な問題を発見する。
単純なデコーダのみの構造を持つLMMは、ステート・オブ・ザ・アート・シーングラフ生成器に変換可能であることを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:58:53 GMT)
CausalCLIPSeg: Unlocking CLIP's Potential in Referring Medical Image Segmentation with Causal Intervention [30.5] 本稿では医療画像セグメンテーションのためのエンドツーエンドフレームワークCausalCLIPSegを提案する。
医療データのトレーニングを受けていないにもかかわらず、医療領域にCLIPの豊富な意味空間を強制する。
CausalCLIPSegは、モデルが急激な相関関係を学習する可能性がある境界バイアスを軽減するために、因果介入モジュールを導入している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:46:24 GMT)
Zero-Shot Head Swapping in Real-World Scenarios [30.5] 本稿では,頭部と上半身を含む画像に対して頑健な新しい頭部交換法HIDを提案する。
マスクの自動生成には,頭部と身体のシームレスなブレンドを可能にするIOMaskを導入する。
本研究では,提案手法がヘッドスワップにおける最先端性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:38:17 GMT)
Repurposing 2D Diffusion Models with Gaussian Atlas for 3D Generation [30.4] 本研究では,高密度な2次元格子を用いた新しい表現を導入し,2次元拡散モデルの微調整により3次元ガウスモデルを生成する。
実験結果から,テキスト・画像拡散モデルが3次元コンテンツ生成に効果的に適応できることが示唆された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:59:41 GMT)
PC-Talk: Precise Facial Animation Control for Audio-Driven Talking Face Generation [30.4] 唇音のアライメント制御は話し方や唇の動きのスケールといった要素に焦点を当てるが、感情制御は現実的な感情表現の生成に重点を置いている。
暗黙的なキーポイント変形による唇音のアライメントと感情制御を可能にする新しいフレームワークPC-Talkを提案する。
本手法は,HDTFとMEADの両方のデータセット上で,優れた制御能力を示し,最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:27:54 GMT)
Summaries, Highlights, and Action items: Design, implementation and evaluation of an LLM-powered meeting recap system [30.4] 我々は認知科学と談話理論を使って、重要なハイライトと構造化された階層的な数分のビューという、2つの再キャップデザインを概念化する。
我々はこれらの表現を対話要約を用いて高忠実度プロトタイプに運用する。
以上の結果から,recap型とrecap型は異なる文脈で有用であり,議論とコンセンサス構築によるコラボレーションを可能にする。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:06:18 GMT)
Sonata: Self-Supervised Learning of Reliable Point Representations [29.9] 既存の3次元自己教師型学習手法は,線形探索による表現品質評価では不十分であることがわかった。
この課題は3D特有のものであり、ポイントクラウドデータのスパースな性質から生じます。
空間情報の隠蔽と,入力機能への依存度の向上という,2つの重要な戦略を通じて対処する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:59:59 GMT)
SpiLiFormer: Enhancing Spiking Transformers with Lateral Inhibition [29.7] トランスフォーマーに基づくスパイクニューラルネットワーク(SNN)は、優れた性能と高エネルギー効率のために大きな注目を集めている。
横型抑制インスピレーションスパイキングトランス(SpiLiFormer)を提案する。
これは、脳の側方抑制機構をエミュレートし、無関係なトークンへの注意を抑えながら、関連するトークンへの注意を高めるようモデルに誘導する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:36:31 GMT)
The global convergence time of stochastic gradient descent in non-convex landscapes: Sharp estimates via large deviations [29.6] 一般の非ニューラル損失関数のグローバル最小値に到達するのに、降下勾配に要する時間について検討する。
深層ネットワークへの応用により、浅部局所ミニマを用いた損失関数解析の一連の拡張を提供する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:54:04 GMT)
Measuring memorization in language models via probabilistic extraction [29.4] 大規模言語モデル(LLM)は、トレーニングデータを記憶する可能性がある。
発見可能な抽出は、この問題を測定する最も一般的な方法である。
確率的探索可能な抽出を導入し、追加コストなしで複数のクエリを考慮し、発見可能な抽出を緩和する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:35:56 GMT)
Seq-VCR: Preventing Collapse in Intermediate Transformer Representations for Enhanced Reasoning [29.4] 我々は,モデル中間層における表現の崩壊を,その推論能力を制限する重要な要因として認識する。
本稿では、中間表現のエントロピーを高め、崩壊を防止するシークエンシャル変数共分散正規化(Seq-VCR)を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:37:44 GMT)
Evaluating Test-Time Scaling LLMs for Legal Reasoning: OpenAI o1, DeepSeek-R1, and Beyond [29.0] テスト時間スケーリング 大規模言語モデル(LLM)は、様々なドメインやタスク、特に推論において、例外的な機能を示している。
各種法シナリオにおけるLCMの予備的評価について,中国語と英語の両方の法的課題について述べる。
以上の結果から,DeepSeek-R1 と OpenAI o1 が最強モデルであるにもかかわらず,法的理由付け能力は依然として不足していることが示唆された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:14:39 GMT)
Survey on Evaluation of LLM-based Agents [28.9] LLMベースのエージェントの出現は、AIのパラダイムシフトを表している。
本稿では,これらのエージェントに対する評価手法に関する総合的な調査を初めて実施する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:59:23 GMT)
Gaussian Eigen Models for Human Heads [28.5] 現在のパーソナライズされたニューラルヘッドアバターはトレードオフに直面している。軽量モデルは詳細とリアリズムを欠いているが、高品質でアニマタブルなアバターは計算資源がかなり必要である。
本稿では,高品質で軽量で制御しやすい頭部アバターを提供するガウス固有モデル(GEM)を紹介する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:07:15 GMT)
A Recipe for Generating 3D Worlds From a Single Image [28.4] 一つの画像から没入型3D世界を生成するためのレシピを提案する。
このアプローチは最小限のトレーニングを必要とし、既存の生成モデルを使用する。
合成画像と実画像の両方でテストした結果,VRディスプレイに適した高品質な3D環境が得られた。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:06:12 GMT)
Plug-and-Play 1.x-Bit KV Cache Quantization for Video Large Language Models [28.4] ビデオ大言語モデル(VideoLLM)は、より長いビデオ入力を処理し、複雑な推論と分析を可能にする能力を実証している。
ビデオフレームからの数千のビジュアルトークンのため、キー値(KV)キャッシュはメモリ要求を大幅に増加させることができる。
本稿では,KVキャッシュを2ビット未満に圧縮するKVキャッシュ量子化手法であるVidKVを紹介する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:52:43 GMT)
CLIMB: Data Foundations for Large Scale Multimodal Clinical Foundation Models [27.7] 大規模統合型マルチモーダルベンチマーク(CLIMB)について紹介する。
CLIMBは、画像、言語、時間、グラフのモダリティにまたがる多様な臨床データを統一する包括的なベンチマークである。
CLIMBの事前訓練は、モデルの新たなタスクへの一般化能力を効果的に改善し、タスクに適した融合戦略と組み合わせた場合、強力な単モーダルエンコーダ性能はマルチモーダルパフォーマンスによく変換される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:05:56 GMT)
Controlling Avatar Diffusion with Learnable Gaussian Embedding [27.7] 我々は、最適化可能で、密度が高く、表現可能で、3次元一貫した新しい制御信号表現を導入する。
複数のポーズとアイデンティティを持つ大規模データセットを合成する。
我々のモデルは、現実主義、表現性、および3次元整合性の観点から、既存の手法よりも優れています。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:52:01 GMT)
Text2Earth: Unlocking Text-driven Remote Sensing Image Generation with a Global-Scale Dataset and a Foundation Model [27.6] 本稿では,Git-10MデータセットとText2Earthファウンデーションモデルという,2つの重要なコントリビューションを示す。
Git-10Mは、1050万のイメージテキストペアからなるグローバルスケールの画像テキストデータセットである。
我々は,グローバルなリモートセンシングシーンをモデル化するための拡散フレームワークに基づく13億のパラメータ生成基盤モデルであるText2Earthを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:03:26 GMT)
SPINE: Online Semantic Planning for Missions with Incomplete Natural Language Specifications in Unstructured Environments [27.5] spineは、自然言語で提供される不完全なミッション仕様を持つミッションのためのオンラインプランナーです。
提案手法は,時間と距離の面で2倍以上の効率で,ユーザインタラクションを少なくし,フルマップを必要としない。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:43:39 GMT)
Odd-One-Out: Anomaly Detection by Comparing with Neighbors [27.5] 本稿では,シーン内の奇妙な物体を,現在ある物体と比較することによって識別することを目的とした,新たな異常検出(AD)問題を提案する。
固定された異常基準を持つ従来のADベンチマークとは異なり、本タスクは通常のオブジェクトの参照グループを推定することにより、各シーン固有の異常を検出する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:26:35 GMT)
RoboFactory: Exploring Embodied Agent Collaboration with Compositional Constraints [27.5] 埋め込み型マルチエージェントシステムに対する構成制約の概念を提案する。
異なるタイプの制約に合わせたインターフェースを設計し、物理的世界とのシームレスな対話を可能にします。
マルチエージェント操作のための最初のベンチマークであるRoboFactoryを紹介した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:58:38 GMT)
Tuning LLMs by RAG Principles: Towards LLM-native Memory [27.2] メモリを生成プロセスに組み込む2つの主要なソリューションは、長文LLMと検索拡張生成(RAG)である。
本稿では,3つの更新/更新データセットに対して,これらの2種類の解を系統的に比較する。
本稿では,RAG法則に従って生成されたデータを用いて,相対的に小さい (例えば7B) LLM を微調整するRAG-Tuned-LLMを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:04:40 GMT)
Diffusion-Driven Semantic Communication for Generative Models with Bandwidth Constraints [27.0] 本稿では,帯域制限付き生成モデルのための,高度なVAEベースの圧縮を用いた拡散駆動型セマンティック通信フレームワークを提案する。
実験の結果,ピーク信号対雑音比 (PSNR) などの画素レベルの指標と,LPIPS (Learning Perceptual Image patch similarity) のような意味的指標が大幅に改善された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:34:54 GMT)
LLM Braces: Straightening Out LLM Predictions with Relevant Sub-Updates [27.0] LLMBRACESは,FFN層内の値ベクトルに関連付けられた関連値を求める手法である。
サブアップデートのコントリビューションを最適化することで、LLMBRACESは予測プロセスを洗練し、より正確で信頼性の高いアウトプットを実現する。
LLMBRACESは感情制御による生成と毒性の低減に優れており、アプリケーション間で柔軟に制御されたテキスト生成の可能性を強調している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:55:26 GMT)
Scale-wise Distillation of Diffusion Models [26.4] SwDは拡散モデルのためのスケールワイズ蒸留フレームワークである。
拡散に基づく数ステップジェネレータに、次世代の予測アイデアを効果的に活用する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:54:02 GMT)
Preserve or Modify? Context-Aware Evaluation for Balancing Preservation and Modification in Text-Guided Image Editing [26.1] テキスト誘導画像編集は、対象のテキストに基づいて修正を実装しながら、ソース画像の中核要素の保存を求める。
既存のメトリクスは、全く異なるソースイメージとターゲットテキストのペアに対して、同じ評価基準を無差別に適用する、文脈の盲点問題を持つ。
保存・修正の側面を適応的にコーディネートする文脈対応メトリックであるAugCLIPを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:36:52 GMT)
A Survey on fMRI-based Brain Decoding for Reconstructing Multimodal Stimuli [26.1] 脳信号を復号して刺激を再構築することで、AI、疾患治療、脳とコンピュータのインターフェースの進歩を加速させる。
ニューロイメージングおよび画像生成モデルの最近の進歩は、fMRIに基づくデコードを大幅に改善した。
本研究は、受動的脳信号からの刺激再構成に焦点を当て、fMRIに基づく脳のデコーディングの最近の進歩を体系的にレビューする。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:23:07 GMT)
MiLA: Multi-view Intensive-fidelity Long-term Video Generation World Model for Autonomous Driving [26.0] 最大1分間の高精細長ビデオを生成するためのフレームワークであるMiLAを提案する。
MiLAは、ビデオ生成の安定化と動的オブジェクトの歪みの補正に、Coarse-to-Re(fine)アプローチを用いる。
nuScenesデータセットの実験は、MiLAがビデオ生成の品質で最先端のパフォーマンスを達成することを示している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:58:32 GMT)
Generalized Few-shot 3D Point Cloud Segmentation with Vision-Language Model [25.7] 汎用的な小ショットの3Dポイントクラウドセグメンテーション(GFS-PCS)は、ベースクラスセグメンテーションを維持しながら、サポートサンプルがほとんどない新しいクラスにモデルを適応させる。
GFS-PCS フレームワークを導入し,高密度だがノイズの多い擬似ラベルを高精度かつスパースなサンプルで合成し,両者の強度を最大化する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:10:33 GMT)
DynamicVis: An Efficient and General Visual Foundation Model for Remote Sensing Image Understanding [25.3] DynamicVisはリモートセンシング画像のための動的視覚認識基盤モデルである。
選択状態空間モデルに基づく新しい動的領域知覚バックボーンを統合する。
97msのレイテンシ(ViTの6%)と833MBのGPUメモリ(ViTの3%)を備えた処理(2048x2048)ピクセルのマルチレベルの特徴モデリングを実現している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:59:54 GMT)
A Single-Loop Smoothed Gradient Descent-Ascent Algorithm for Nonconvex-Concave Min-Max Problems [25.3] 非con-max問題は、このロバストな問題を解決するために、ポイントワイズな非函数の集合を最小化するなど、多くのアプリケーションで発生する。
A.A.アルゴリズムは、有限個の非函数の集合に対して$(/A-O-)の$(/A-O-)を達成できる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:46:13 GMT)
GraspCoT: Integrating Physical Property Reasoning for 6-DoF Grasping under Flexible Language Instructions [24.9] 物理特性を指向したChain-of-Thought(CoT)推論機構を統合した6-DoFグリップ検出フレームワークを提案する。
IntentGraspは、多目的把握検出のための公共データセットのギャップを、多言語および間接的なコマンドで埋める大規模なベンチマークである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:32:38 GMT)
Optimal Nonlinear Online Learning under Sequential Price Competition via s-Concavity [24.6] われわれは、複数の売り手の間での価格競争をT$の期間で検討している。
売り手は価格を同時に提供し、それぞれの需要を競合相手に見つからないように監視する。
すべての売り手が当社の政策を採用すると、その価格がナッシュ均衡価格に対して$O(T-1/7)のレートで収束し、もし売り手が十分に情報を得たらリーチできることが示される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 22:51:03 GMT)
ROCKET-1: Mastering Open-World Interaction with Visual-Temporal Context Prompting [24.6] 視覚言語モデル(VLM)は、マルチモーダルなタスクに優れていますが、オープンワールド環境における意思決定の具体化にそれらを適用することは、課題を示します。
1つの重要な問題は、低レベルの観測における個別の実体と効果的な計画に必要な抽象概念のギャップを埋めることである。
VLMとポリシーモデルの間の新しい通信プロトコルである視覚的時間的コンテキストを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:55:54 GMT)
M3: 3D-Spatial MultiModal Memory [24.2] 中規模の静的シーンに関する情報を保持するために設計されたマルチモーダルメモリシステムである3次元空間マルチモーダルメモリ(M3)を提案する。
3D Gaussian Splatting技術と基礎モデルを統合することで、M3は粒度にまたがる特徴表現をレンダリングできるマルチモーダルメモリを構築する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:59:12 GMT)
SceneMI: Motion In-betweening for Modeling Human-Scene Interactions [23.8] いくつかの実用アプリケーションをサポートするフレームワークであるSceneMIを紹介する。
本稿では,シーン認識におけるSceneMIの有効性と実世界のGIMOデータセットへの一般化について述べる。
また,モノクロビデオからのHSI再構成におけるSceneMIの適用性についても紹介する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:15:16 GMT)
SeniorTalk: A Chinese Conversation Dataset with Rich Annotations for Super-Aged Seniors [23.8] SeniorTalkは、注意深い注釈付き中国語音声対話データセットである。
このデータセットには、202人の参加者を含む101人の自然な会話から55.53時間のスピーチが含まれている。
話者検証,話者ダイアリゼーション,音声認識,音声編集タスクについて実験を行った。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:31:47 GMT)
Karyotype AI for Precision Oncology [23.8] 血液がんの原因となる染色体異常を正確に検出できる機械学習手法を提案する。
パイプラインは一連の微調整されたVision Transformer上に構築されている。
臨床的に有意な del(5q) と t(9;22) 異常に対して, 94% AUC の高精度リコールスコアが得られた。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:19:33 GMT)
DreamTexture: Shape from Virtual Texture with Analysis by Augmentation [23.5] DreamFusionは、生成モデルと微分レンダリングの進歩を組み合わせることで、仮想ビューから教師なしの3D再構築のための新しいパラダイムを確立した。
本研究では,モノクロ深度を応用して3Dオブジェクトを再構成する新しい形状-仮想-テクスチャ手法DreamTextureを提案する。
提案手法は, 仮想テクスチャを入力中の実深度キューと整列させることにより, 入力画像のテクスチャをテクスチャ化し, 近代拡散モデルで符号化された単分子形状の固有理解を活用する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:59:12 GMT)
Assessment of Spatio-Temporal Predictors in the Presence of Missing and Heterogeneous Data [23.3] ディープラーニングアプローチは、複雑さとスケールの増大にもかかわらず、現代的なデータのモデリングにおいて、卓越した予測性能を達成する。
予測モデルの品質を評価することは、従来の統計的仮定がもはや持たないため、より困難になる。
本稿では,時間的・時間的予測型ニューラルモデルの最適性を評価するための残差分析フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:44:19 GMT)
Deconstructing Long Chain-of-Thought: A Structured Reasoning Optimization Framework for Long CoT Distillation [22.9] R1蒸留スキームは、推論能力の強化した費用対効果モデルの訓練に有望なアプローチとして登場した。
本研究では, 蒸留データの普遍性を検証し, 長鎖推論能力の効率的な伝達を可能にする重要な成分を同定する。
蒸留データ強化フレームワークであるDLCoT(Deconstructing Long Chain-of-Thought)を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:46:38 GMT)
Machine Learning-Based Genomic Linguistic Analysis (Gene Sequence Feature Learning): A Case Study on Predicting Heavy Metal Response Genes in Rice [22.8] 遺伝子配列から意味のある特徴を抽出し学習するハイブリッドモデルを開発した。
Hg0に曝露したイネ葉のRNA-seqおよびqRT-PCR実験により、重金属反応に関連する遺伝子の差分発現が明らかとなった。
共発現ネットワーク解析により103の関連遺伝子が同定され、文献レビューによりこれらの遺伝子が重金属関連生物学的プロセスに関与している可能性が示唆された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:41:31 GMT)
SelfReplay: Adapting Self-Supervised Sensory Models via Adaptive Meta-Task Replay [22.6] 自己教師付き学習は、事前学習モデルに大量のラベルのないデータを活用する方法として登場した。
自己教師型モデルがヘテロジニアス領域で微調整された場合に発生する性能劣化について検討する。
自己教師付きモデルをパーソナライズするためのドメイン適応フレームワークであるSelfReplayを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:56:18 GMT)
Segmentation Guided Sparse Transformer for Under-Display Camera Image Restoration [22.6] Under-Display Camera(UDC)は、ディスプレイパネルの下にカメラを隠してフルスクリーン表示を実現する新興技術である。
本稿では,UDC 画像復元に Vision Transformer を用いることで,大量の冗長情報やノイズを大域的注目度で検出する。
UDC劣化画像から高品質な画像を復元するためのガイドスパース変換器(SGSFormer)を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:49:18 GMT)
MemorySAM: Memorize Modalities and Semantics with Segment Anything Model 2 for Multi-modal Semantic Segmentation [22.5] 大型ビジョンモデルであるAnythingCube Model 2 (SAM2)は、画像とビデオの両方でゼロショットセグメンテーション性能が強い。
ビデオにおけるクロスフレーム相関に着想を得て,同一シーンを表すフレームの列としてマルチモーダルデータを扱うことを提案する。
私たちのキーとなるアイデアは、モダリティに依存しない情報を「記憶」し、ターゲットのシーンに関連する意味を「記憶」することです。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:36:20 GMT)
The MASK Benchmark: Disentangling Honesty From Accuracy in AI Systems [22.5] 正直性を直接測定する大規模人選データセットを提案する。
より大規模なモデルは我々のベンチマークで高い精度を得るが、より正直になることはない。
表現工学的介入のような単純な手法は、誠実さを向上させることができる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 23:06:17 GMT)
Diffusion Attribution Score: Evaluating Training Data Influence in Diffusion Model [22.4] 拡散モデルに対する既存のデータ帰属法は、典型的にはトレーニングサンプルの寄与を定量化する。
拡散損失の直接的利用は,拡散損失の計算により,そのような貢献を正確に表すことはできない。
本研究では,予測分布と属性スコアとの直接比較を行うために拡散属性スコア(textitDAS)を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:55:44 GMT)
Using Contextually Aligned Online Reviews to Measure LLMs' Performance Disparities Across Language Varieties [22.3] 本稿では,言語品種間でのベンチマークモデル性能に対する,新規で費用対効果の高いアプローチを提案する。
Booking.comのような国際的なオンラインレビュープラットフォームは効果的なデータソースとして機能する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:01:11 GMT)
D&M: Enriching E-commerce Videos with Sound Effects by Key Moment Detection and SFX Matching [22.1] 本稿では,SFXマッチングを同時に行うために,キーモーメント検出とモーメントを同時に行う統一手法を提案する。
新しいVDSFXタスクのために、Eコマースプラットフォームから大規模なデータセットSFX-Momentを構築します。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:05:15 GMT)
3D-GRAND: A Million-Scale Dataset for 3D-LLMs with Better Grounding and Less Hallucination [22.0] 3D-GRANDは、40,087の世帯シーンと6.2百万の密集したシーン言語命令を組み合わせた、先駆的な大規模データセットである。
この結果から, 3D-GRANDによる指導指導はグラウンド化能力を大幅に向上させ, 3D-LLMの幻覚を低減させることがわかった。
コントリビューションの一環として、3D-LLMの幻覚を体系的に評価するための総合的なベンチマーク3D-POPEを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 23:06:14 GMT)
Bézier Splatting for Fast and Differentiable Vector Graphics [21.8] 微分ベクトルグラフィックス(VG)は画像ベクトル化やベクトル合成に広く用いられている。
この研究は、高忠実度VG化を可能にするB'ezier splattingと呼ばれる新しい微分可能なVG表現を導入している。
B'ezier splatting は、DiffVG と比較して、前方および後方の曲線に対して、20倍から150倍の速さで達成される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:59:50 GMT)
Deferring Concept Bottleneck Models: Learning to Defer Interventions to Inaccurate Experts [21.8] Concept Bottleneck Models (CBM) は、解釈性を改善する機械学習モデルである。
CBMは、介入する必要性を識別し、常に正しい介入を提供する人間の存在を前提としている。
我々は、CBMが介入が必要なときに学習できる新しいフレームワークであるDeferring CBM(DCBM)を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:45:55 GMT)
A Gentle Introduction and Tutorial on Deep Generative Models in Transportation Research [21.7] 近年、DGM(Deep Generative Models)は急速に進歩し、様々な分野において重要なツールとなっている。
本稿では,DGMの総合的な紹介とチュートリアルについて紹介する。
これは生成モデルの概要から始まり、続いて基本モデルの詳細な説明、文献の体系的なレビュー、実装を支援するための実践的なチュートリアルコードなどが続く。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:32:05 GMT)
Enhancing Close-up Novel View Synthesis via Pseudo-labeling [21.5] ニューラルレージアン場(NeRF)や3次元ガウススプラッティング(3DGS)のような手法は、新規なビュー合成において顕著な機能を示した。
トレーニング中に見られるような視点で高品質な画像を作成することに成功したにもかかわらず、トレーニングセットから著しく逸脱した視点から詳細な画像を生成するのに苦労している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:27:46 GMT)
A Vision Centric Remote Sensing Benchmark [21.5] リモートセンシングタスクにおけるCLIPに基づくMLLMの限界について検討した。
リモートセンシングマルチモーダル視覚パターン(RSMMVP)ベンチマークを導入する。
CLIP-blindペアを識別することで、RSタスクのMLLMを評価するように設計されている。
我々は最先端MLLMの性能を解析し、RS特化表現学習における重要な制限を明らかにした。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:03:46 GMT)
NeuroLM: A Universal Multi-task Foundation Model for Bridging the Gap between Language and EEG Signals [21.4] 我々は,脳波を外国語として扱うことで,Large Language Models (LLMs) の機能を活用する,最初のマルチタスク基盤モデルであるNeuroLMを提案する。
我々のアプローチは、脳波信号を離散的な神経トークンにエンコードするベクトル量子化された時間周波数予測を通じて、テキスト整列型ニューラルトークンを学習することから始まります。
我々は、LLMを具体化することによって、NeuroLMは命令チューニングによって単一のモデル内で多様な脳波タスクを統合できることを初めて実証した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:26:21 GMT)
TruthLens: Explainable DeepFake Detection for Face Manipulated and Fully Synthetic Data [21.3] 本稿では,DeepFake検出のための新しいフレームワークであるTruthLensを提案する。
TruthLensは、顔操作のDeepFakesと完全なAI生成コンテンツの両方を扱う。
予測のための詳細なテキスト推論を提供する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:40:42 GMT)
Issue2Test: Generating Reproducing Test Cases from Issue Reports [21.3] 問題を解決するための重要なステップは、問題を正確に再現するテストケースを作成することです。
本稿では,所与の課題報告に対する再生テストケースを自動生成するLLMベースの手法である Issue2Test を提案する。
SWT-bench-lite データセット上での Issue2Test の評価を行い,30.4 の問題を再現した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:44:00 GMT)
Bridging Technology and Humanities: Evaluating the Impact of Large Language Models on Social Sciences Research with DeepSeek-R1 [21.1] 人文科学と社会科学の研究において、LLM(Large Language Models)は大規模テキストデータを解析し、推論することができる。
本稿では, 大規模言語モデルであるDeepSeek-R1を, 低リソース言語翻訳, 教育質問応答, 高等教育における生徒の書き方の改善, 論理的推論, 教育計測と心理測定, 公衆衛生政策分析, 美術教育の7つの側面から分析する。
DeepSeek-R1は人文科学や社会科学でよく働き、ほとんどの質問に正しく論理的に答え、適切な分析プロセスと説明を与える。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:25:24 GMT)
Landmarks Are Alike Yet Distinct: Harnessing Similarity and Individuality for One-Shot Medical Landmark Detection [21.1] 複数のランドマークを同時に検出するためのトレーニングモデルは、しばしば「シーソー現象」に遭遇する
我々は「ランドマークは別物」という信念に基づく新しいアプローチを提案する。
モデルパラメータを効率的に共有するために,共有重みとランドマーク固有の重みを組み合わせたアダプタベース融合モデルを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:46:29 GMT)
LegalCore: A Dataset for Event Coreference Resolution in Legal Documents [21.1] われわれは、法的ドメインであるLegalCoreの最初のデータセットを、包括的なイベントとイベントコア情報で注釈付けした形で提示する。
このデータセットにアノテートした法律上の契約文書は、ニュース記事の何倍も長く、1ドキュメントあたりの平均トークン数は25万である。
このデータセットでは、イベント検出とイベントコア参照解決の両方のタスクに対して、主流のLarge Language Modelsをベンチマークします。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:45:57 GMT)
Can a MISL Fly? Analysis and Ingredients for Mutual Information Skill Learning [21.0] 自己教師型学習は、今日の強化学習におけるいくつかの重要な課題を取り上げる可能性を秘めている。
最近の研究(METRA)は、相互情報から離れ、代わりに特定のワッサーシュタイン距離を最適化することが、優れたパフォーマンスのために重要であると効果的に主張している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 01:53:24 GMT)
Fùxì: A Benchmark for Evaluating Language Models on Ancient Chinese Text Understanding and Generation [20.9] 我々は21種類のタスクに対する理解と生成の両方の能力を評価する総合的なベンチマークであるFuxiを紹介する。
我々は,理解タスクと生成タスクの間に大きなパフォーマンスギャップを生じさせ,モデルが有望な結果を得るためには理解が難しいが,生成タスクではかなり苦労する。
本研究は,古代中国のテキスト処理における現状の限界に注目し,今後のモデル開発への洞察を提供するものである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:26:40 GMT)
Uni-3DAR: Unified 3D Generation and Understanding via Autoregression on Compressed Spatial Tokens [20.7] 自動回帰予測により3次元GUタスクをシームレスに統合する統合フレームワークUni-3DARを紹介する。
Uni-3DARの中核となるのは、オクツリーを用いて3次元空間を圧縮する新しい階層的トークン化である。
これらの戦略を組み合わせることで、Uni-3DARは単一の自動回帰フレームワーク内で多様な3D GUタスクを統一することに成功した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:07:04 GMT)
SePer: Measure Retrieval Utility Through The Lens Of Semantic Perplexity Reduction [20.7] 本稿では、RAGフレームワーク内の情報ゲインのレンズを通して、検索品質を測定する自動評価手法を提案する。
検索の利便性を,検索後の意味的難易度を低減する程度で定量化する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:28:41 GMT)
BigO(Bench) -- Can LLMs Generate Code with Controlled Time and Space Complexity? [20.6] BigO(Bench)は、特定の時間と空間の複雑さでコードを理解し、生成する言語モデルの能力を評価するために設計された、新しいコーディングベンチマークである。
BigO(Bench)には、プロファイリング測定から任意のPython関数のアルゴリズム上の複雑さを推測するツールが含まれている。
このベンチマークで、複数の最先端言語モデルを評価し、複雑さの要求に対処する際の長所と短所を強調した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:58:17 GMT)
Human Choice Prediction in Language-based Persuasion Games: Simulation-based Off-Policy Evaluation [20.5] 我々は,言語に基づく説得ゲームに焦点を合わせ,専門家が言論的なメッセージを通じて意思決定者に影響を与えることを目標としている。
OPEフレームワークでは,1組の専門家エージェントとの遭遇から収集した人間のインタラクションデータに基づいて,予測モデルを訓練する。
専用アプリケーションを用いて,人間による87Kの意思決定データセットを収集した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:27:22 GMT)
FreeCloth: Free-form Generation Enhances Challenging Clothed Human Modeling [20.3] FreeClothは、挑戦的な人間をモデル化するための新しいハイブリッドフレームワークである。
私たちは人体を3つのカテゴリに分類します。
FreeClothは、より優れた視覚的忠実さとリアリズムで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:24:19 GMT)
VideoRFSplat: Direct Scene-Level Text-to-3D Gaussian Splatting Generation with Flexible Pose and Multi-View Joint Modeling [20.3] 本稿では,映像生成モデルを利用した実世界シーンのリアルな3Dガウススティング(3DGS)を生成するためのテキスト・ツー・3DモデルであるVideoRFSplatを提案する。
VideoRFSplatは、スコア蒸留サンプリングによるポストホック精製に大きく依存する既存のテキスト・ツー・3Dダイレクト・ジェネレーション法より優れている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:26:09 GMT)
Energy-Efficient Federated Learning and Migration in Digital Twin Edge Networks [20.3] 本稿では,デジタル双対関係の問題と,DITEN内における連合学習課題の履歴データアロケーションについて紹介する。
我々の目的は、デジタルツインパワーFLタスクのデータユーティリティと、長期DITEN保守によるエネルギーコストを協調的に最適化することである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:14:23 GMT)
InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity [19.9] InfUは、アイデンティティの類似性の不足、テキストイメージのアライメントの低下、世代品質と美学の低下など、既存の手法の問題に対処する。
事前トレーニングと教師付き微調整を含む多段階のトレーニング戦略は、テキストイメージアライメントを改善し、画質を改善し、顔の複写を緩和する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:59:34 GMT)
Efficient Training of Neural Fractional-Order Differential Equation via Adjoint Backpropagation [19.3] 分数次微分方程式(FDE)は、整数から実数への微分作用素の順序を拡張することで、伝統的な微分方程式を強化する。
FDEとディープラーニングの交差点における最近の進歩は、革新的なモデルの新たな波を引き起こした。
本稿では、拡張FDEを時間内に遡って解くことにより、ニューラルネットワークFDEをトレーニングするためのスケーラブルな随伴バックプロパゲーション法を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:26:54 GMT)
JARVIS-VLA: Post-Training Large-Scale Vision Language Models to Play Visual Games with Keyboards and Mouse [19.2] 本稿では,視覚的言語モデル(VLM)を視覚的および言語的指導によって自己指導的に洗練する,視覚言語後訓練のActを紹介する。
この強化により、オープンワールド環境における世界の知識、視覚的認識、空間的接地におけるモデルの能力が向上する。
Minecraftの最初のVLAモデルは、1万以上の異なる原子タスクで人間の指示に従うことができる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:21:58 GMT)
SA-Occ: Satellite-Assisted 3D Occupancy Prediction in Real World [19.2] 衛星支援型3次元占有予測モデルSA-Occを提案する。
歴史的だが容易に利用できる衛星画像とリアルタイムの応用を統合している。
最先端のパフォーマンス、特に単一フレームのメソッドで実現します。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:54:29 GMT)
Scalable Oversight for Superhuman AI via Recursive Self-Critiquing [19.1] 批判そのものよりも批判の方が容易であることを示す。
また, 直接評価が不可能な場合, 高次評価を行うことにより, よりトラクタブルな監視経路が提供されることも示唆した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:52:15 GMT)
UVGS: Reimagining Unstructured 3D Gaussian Splatting using UV Mapping [19.0] 3D Gaussian Splatting (3DGS)は3Dオブジェクトやシーンのモデリングにおいて優れた品質を示している。
しかし、3DGSの生成は、その離散的、非構造的、置換不変の性質のため、依然として困難である。
球面マッピングを用いて3DGSをUVGSと呼ばれる構造化された2次元表現に変換する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 23:24:31 GMT)
Physically Parameterized Differentiable MUSIC for DoA Estimation with Uncalibrated Arrays [18.7] 到着方向推定(DoA)は、レーダー、ソナー、オーディオ、無線通信システムにおいて一般的な検知問題である。
本研究は,モデルに基づくアプローチに従って,共同でDoA推定とハードウェア障害学習手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:20:09 GMT)
ALLMod: Exploring $\underline{\mathbf{A}}$rea-Efficiency of $\underline{\mathbf{L}}$UT-based $\underline{\mathbf{L}}$arge Number $\underline{\mathbf{Mod}}$ular Reduction via Hybrid Workloads [18.6] 高ビット幅の操作は、セキュリティの強化に不可欠である。
計算量が多いのは、多くのモジュラー演算が必要なためである。
AllModは、LUTベースの大規模モジュラーリダクションの面積効率を改善する新しいアプローチである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:47:34 GMT)
ATOM: A Framework of Detecting Query-Based Model Extraction Attacks for Graph Neural Networks [18.5] グラフニューラルネットワーク(GNN)は、グラフベースの機械学習・アズ・ア・サービス(GML)プラットフォームで注目を集めているが、グラフベースのモデル抽出攻撃(MEAs)に弱いままである。
GNNに適した新しいリアルタイムMEA検出フレームワークであるATOMを提案する。
ATOMはシーケンシャルモデリングと強化学習を統合して、進化する攻撃パターンを動的に検出し、$k$coreの埋め込みを利用して構造特性をキャプチャし、検出精度を向上させる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 20:25:32 GMT)
PromptMobile: Efficient Promptus for Low Bandwidth Mobile Video Streaming [18.3] 本稿では、デバイス上でのPromptusに適した効率的なアクセラレーションフレームワークであるPromptMobileを提案する。
本稿では,計算コストを8.1倍に削減する2段階の効率的な生成フレームワークを提案する。
他のストリーミング手法と比較して、PromptMobileは平均LPIPSの改善を0.016(H.265と比較)し、重く歪んだフレームの60%(VQGANと比較)を削減した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:00:36 GMT)
Panoptic-CUDAL Technical Report: Rural Australia Point Cloud Dataset in Rainy Conditions [18.2] 雨天地におけるパノプティカルセグメンテーションを目的とした新しいデータセットであるPanoptic-CUDALデータセットについて紹介する。
高解像度のLiDAR、カメラ、ポーズデータを記録することで、Panoptic-CUDALは、挑戦的なシナリオにおいて、多種多様な情報豊富なデータセットを提供する。
本稿では、記録データの解析を行い、LiDAR点雲上でのパノプティクスおよびセマンティックセグメンテーション手法のベースライン結果を提供する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:41:16 GMT)
The Emperor's New Clothes in Benchmarking? A Rigorous Examination of Mitigation Strategies for LLM Benchmark Data Contamination [18.1] ベンチマークデータ汚染(BDC)-トレーニングセットにベンチマークテストサンプルを含めることで、LLM(Large Language Model)評価における懸念が高まった。
これを解決するために、研究者は既存のベンチマークを更新するための様々な緩和戦略を提案している。
従来の評価手法、例えば精度低下や精度のマッチングは、集計精度のみに焦点を合わせ、しばしば不完全あるいは誤解を招く結論に至る。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:55:04 GMT)
Polynomial Composition Activations: Unleashing the Dynamics of Large Language Models [18.0] トランスフォーマーは、強力なフィッティング能力のために、様々な領域にまたがる広範囲のアプリケーションを見つけてきた。
本稿では, 変圧器の動的特性を最適化するために, アクティベーションの新たなカテゴリ (PolyCom) を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:46:11 GMT)
Using Language Models to Decipher the Motivation Behind Human Behaviors [17.9] 大規模な言語モデルへの様々なプロンプトによって、人間の行動を完全に引き出すことができることを示す。
そして、どの行動を引き出すのにどのプロンプトが必要なのかを分析することで、人間の行動の背後にあるモチベーションを推測することができる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 00:07:06 GMT)
Near Exact Privacy Amplification for Matrix Mechanisms [17.8] より低い非負の$textbfC$に対して、ほぼ正確なプライバシーパラメータを計算するためのフレームワークを提供する。
実証的な結果として,従来のSOTA (State-of-the-art) よりも小さな RMSE をプレフィックス和で実現できることを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 21:59:19 GMT)
Puzzle: Distillation-Based NAS for Inference-Optimized LLMs [17.7] 大きな言語モデル(LLM)は優れた能力を提供するが、高い推論コストは広く採用を制限する。
本稿では,LLMの推論を高速化するハードウェア対応フレームワークであるPuzzleについて述べる。
Llama-3.1-Nemotron-51B-Instruct (Nemotron-51B) はLlama-3.1-70B-Instructから派生した一般公開モデルである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:50:04 GMT)
UMIT: Unifying Medical Imaging Tasks via Vision-Language Models [17.7] UMITは医療画像処理に特化したマルチモーダル・マルチタスクVLMである。
視覚的質問応答、疾患検出、医療報告生成など、さまざまな課題を解決できる。
英語と中国語の両方をサポートし、その適用範囲を全世界で拡大している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:43:36 GMT)
Fin-R1: A Large Language Model for Financial Reasoning through Reinforcement Learning [17.6] 我々は金融セクター向けに特別に設計された大規模言語モデルであるFin-R1を紹介する。
Fin-R1は2段階アーキテクチャを使用して構築され、DeepSeek-R1に基づいて蒸留および処理された金銭的推論データセットを活用する。
これはDeepSeek-R1に近いパフォーマンスを示し、パラメータサイズは70億で、さまざまな金銭的推論タスクにまたがっている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:46:18 GMT)
LLM-SR: Scientific Equation Discovery via Programming with Large Language Models [17.6] 現在の方程式発見法は、典型的には記号回帰と呼ばれ、主にデータのみから方程式を抽出することに焦点を当てている。
LLM-SRは,大規模言語モデルの科学的知識とロバストなコード生成能力を活用する新しいアプローチである。
また, LLM-SRは, 最先端の記号的回帰ベースラインを著しく上回る物理精度の方程式を発見した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:37:17 GMT)
Learning 3D Scene Analogies with Neural Contextual Scene Maps [17.5] 本稿では,3次元空間における関係共通点を特定するための教材を提案する。
ポイントワイドやオブジェクトワイドの表現に焦点をあてるのではなく、3Dシーンのアナロジーを導入する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:49:33 GMT)
Dynamic Bi-Elman Attention Networks (DBEAN): Dual-Directional Context-Aware Representation Learning for Enhanced Text Classification [17.3] 伝統的な手法は複雑な言語構造と意味的依存関係に苦しんだ。
深層学習は、ニュアンス付き特徴抽出と文脈認識予測を可能にすることにより、分野を著しく進歩させてきた。
本稿では,動的双方向エルマン・アテンション・ネットワーク(DBEAN)を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:09:43 GMT)
When Text Embedding Meets Large Language Model: A Comprehensive Survey [17.3] この調査は、大きな言語モデル(LLM)とテキスト埋め込みの相互作用に焦点を当てている。
様々な研究および応用分野からの貢献の、新しく体系的な概要を提供する。
この分析に基づいて,テキスト埋め込みの進化に向けた今後の方向性を概説する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:15:29 GMT)
Chain of Functions: A Programmatic Pipeline for Fine-Grained Chart Reasoning Data [17.2] 既存の手法では(M)LLMをデータ生成に利用しているが、直接的プロンプトによって精度と多様性が制限されることが多い。
我々は,自由探索された推論経路を監督として利用する新しいプログラム推論データ生成パイプラインであるtextitChain of Function (CoF)を提案する。
textitCoFは複数の利点を提供している: 1) 精度: 関数支配生成は、フリーフォーム生成と比較して幻覚を減少させる; 2) 多様性: 関数鎖を列挙するということは、様々な質問を可能にする; 3) 説明可能性: 関数鎖は、組込みの合理性として機能し、全体的な正確性を超えたきめ細かい評価を可能にする; 4) 実践性: 信頼の排除
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:56:04 GMT)
Towards Lossless Implicit Neural Representation via Bit Plane Decomposition [17.2] 暗黙的ニューラル表現(INR)モデルのサイズの上限をデジタル視点から定量化する。
本稿では,INRがビット平面を予測するビット平面分解法を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:50:43 GMT)
Iterative Optimal Attention and Local Model for Single Image Rain Streak Removal [17.2] 本研究では,単一画像雨量除去のための期待最大化変換器 (EMResformer) を提案する。
EMR変換器は、特徴集約のための重要な自己アテンション値を保持し、より優れた画像再構成を実現するために局所的特徴を増強する。
提案するEMResformerは,合成データセットと実世界のデータセットの両方において,現在最先端の単一画像雨量除去手法を超越している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:06:53 GMT)
Tokenize Image as a Set [17.1] 本稿では,局所的意味複雑性に基づく符号化能力の動的割り当てを行うために,非順序付きトークン集合表現を導入する。
離散集合をモデル化することの課題に対処するために、集合を固定長整数列に変換する双対変換機構を考案する。
提案手法のセマンティック・アウェア表現と生成品質における優位性を示す実験を行った。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:59:51 GMT)
PoseTraj: Pose-Aware Trajectory Control in Video Diffusion [17.0] 本稿では,2次元軌跡から3次元アライメントを生成できるポーズ対応ビデオドラギングモデルPoseTrajを紹介する。
提案手法は,新しい2段階のポーズアウェア事前学習フレームワークを採用し,多様な軌跡の3次元理解を改善した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:01:43 GMT)
Fed-NDIF: A Noise-Embedded Federated Diffusion Model For Low-Count Whole-Body PET Denoising [16.9] LCPET (low-count positron emission tomography) は、患者の放射線曝露を減少させるが、画像ノイズの増加と病変検出性の低下に悩まされることが多い。
拡散モデルでは、劣化した画像の品質を回復するLCPET復調が期待できる。
本稿では,これらの課題に対処するために,新しいノイズ埋め込み型フェデレート学習拡散モデル(Fed-NDIF)を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:37:46 GMT)
Efficient Policy Evaluation with Safety Constraint for Reinforcement Learning [16.7] 安全制約下での最適分散最小化行動ポリシーを提案する。
本手法は, 実質的分散低減と安全制約満足度を両立させる唯一の方法である。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:10:58 GMT)
Doubly Optimal Policy Evaluation for Reinforcement Learning [16.7] 政策評価は、しばしば大きなばらつきに悩まされ、望ましい精度を達成するために大量のデータを必要とする。
本研究では,データ収集ポリシーとデータ処理ベースラインの最適組み合わせを設計する。
理論的には、我々の二重最適政策評価法は偏りがなく、従来よりも分散度が低いことが保証されている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:00:23 GMT)
Exact Recovery Guarantees for Parameterized Nonlinear System Identification Problem under Sparse Disturbances or Semi-Oblivious Attacks [16.7] 本研究では,非線形力学系を基底関数を用いてパラメータ化することで,非線形力学系を学習する問題について検討する。
p$ が 1 に近づくときでさえ、有限時間正確な回復は高い確率で達成されることを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:48:54 GMT)
Unleashing Vecset Diffusion Model for Fast Shape Generation [16.7] FlashVDMはVecset Diffusion Model (VDM)におけるVAEとDiTの両方を高速化するためのフレームワークである
DiTでは、FlashVDMは5つの推論ステップと同等の品質でフレキシブルな拡散サンプリングを可能にする。
VAEでは,適応型KV選択,階層型ボリュームデコーディング,効率的なネットワーク設計を備えた稲妻ベクセットデコーダを導入する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:23:44 GMT)
From Head to Tail: Efficient Black-box Model Inversion Attack via Long-tailed Learning [16.6] Model Inversion Attacks (MIA) は、プライベートトレーニングデータをモデルから再構築することを目的としており、プライバシーの漏洩につながる。
ブラックボックス設定のための高解像度指向・クエリ効率MIAであるSMILE(Surrogate Model-based Inversion with Long-tailed Enhancement)を導入する。
実験の結果,SMILEはクエリオーバヘッドの5%しか必要とせず,既存の最先端のブラックボックスMIAよりも優れていることがわかった。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:58:33 GMT)
SAUCE: Selective Concept Unlearning in Vision-Language Models with Sparse Autoencoders [16.6] 本稿では,視覚言語モデルにおいて,より微細で選択的な概念学習のための新しい手法であるSAUCEを紹介する。
まずSAEを訓練し、高次元、意味的に豊かなスパースの特徴を捉えます。
次に、未学習のターゲット概念に最も関連する機能を特定する。
推論中は、これらの特徴を選択的に修正し、関係のない情報を保存しながら特定の概念を抑圧する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:47:10 GMT)
Do Visual Imaginations Improve Vision-and-Language Navigation Agents? [16.5] VLN(Vision-and-Language Navigation)エージェントは、自然言語命令を使って見えない環境をナビゲートする。
本研究は,これらの指示によって示されるサブゴールの視覚的表現がナビゲーションの手がかりとなり,ナビゲーション性能が向上するかどうかを考察する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:53:12 GMT)
DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms [16.4] 我々は,ドンバピクトグラフのセマンティック理解と抽出のための最初のマルチモーダルデータセットである textbfDongbaMIE を提案する。
DongbaMIEには23,530の文レベルと2,539の段落レベルのイメージが含まれており、対象、行動、関係、属性の4つの意味的次元をカバーしている。
実験結果から,GPT-4oとGeminiのプロプライエタリモデルのF1スコアは,それぞれ3.16と3.11のみであることがわかった。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:16:23 GMT)
Subgradient Method for System Identification with Non-Smooth Objectives [16.3] 本稿では,非平滑な目的を持つ線形時間不変系のシステム同定問題を解くための段階的アルゴリズムについて検討する。
これは、非滑らかな目的を持つシステム識別のための段階的なアルゴリズムを解析する最初の試みである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:39:47 GMT)
CMMLoc: Advancing Text-to-PointCloud Localization with Cauchy-Mixture-Model Based Framework [16.2] ポイントクラウドのローカライゼーションの目的は、大都市環境におけるテキスト記述を用いた3次元位置の同定である。
我々は、不確実性を意識した$textbfC$auchy-$textbfM$ixture-$textbfM$odelである$textbfCMMLocを提案する。
CMMLocは既存の手法より優れており、KITTI360Poseデータセット上で最先端の結果が得られる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 00:06:14 GMT)
Natural Language Generation [16.0] 自然言語生成(英: Natural Language Generation)とは、自然言語を通じて何らかの形態の情報を言語化するシステムの研究を指す用語である。
自然言語処理のサブフィールドとして、NLGは機械翻訳(MT)やダイアログシステムといった他のサブ分野と密接に関連している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 22:12:08 GMT)
Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis [15.9] Swittiは、テキスト・ツー・イメージ生成のためのスケールワイズ・トランスフォーマーである。
我々は、既存の次世代予測自動回帰(AR)アーキテクチャをT2I世代に適用する。
本稿では,サンプリングを21%高速化し,メモリ使用量の削減を図る非因果的手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:59:49 GMT)
Multimodal Industrial Anomaly Detection by Crossmodal Reverse Distillation [15.9] マルチブランチ設計に基づくクロスモーダル逆蒸留(CRD)を提案する。
独立分岐を各モードに割り当てることで、各モード内の異常をより細かく検出することができる。
本手法は,マルチモーダル異常検出および局所化における最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:17:32 GMT)
OSLoPrompt: Bridging Low-Supervision Challenges and Open-Set Domain Generalization in CLIP [15.8] 低ショットオープンセット領域一般化(LSOSDG)は、オープンセットドメイン一般化(ODG)と低ショット学習を統合する新しいパラダイムである。
提案するOSLOPROMPTは,CLIPのための先進的なプロンプトラーニングフレームワークである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:51:19 GMT)
Robust LLM safeguarding via refusal feature adversarial training [15.8] 大規模言語モデル(LLM)は、有害な応答を誘発する敵攻撃に対して脆弱である。
本稿では,敵対的訓練を効率的に行う新しいアルゴリズムReFATを提案する。
実験結果から, ReFATは, 広範囲な敵攻撃に対する3つのLLMのロバスト性を大幅に向上させることが示された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:28:18 GMT)
RLOMM: An Efficient and Robust Online Map Matching Framework with Reinforcement Learning [15.6] 本稿では,多様なシナリオを扱う際の堅牢性を確保しつつ,高精度かつ効率的なマッチングを実現する新しいフレームワークを提案する。
本研究は,オンライン地図マッチング問題をオンラインマルコフ決定プロセス(OMDP)として,その特性に基づいてモデル化することから始める。
次に、動的に変化する環境からのリアルタイムデータのロバスト処理を可能にする強化学習手法を設計する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:07:59 GMT)
Entropy-based Exploration Conduction for Multi-step Reasoning [15.6] 大規模言語モデル(LLM)の推論では、多段階プロセスは複雑なタスクを解くのに効果的であることが証明されている。
奥行きを自動的に判断する既存の手法は、しばしば高いコストと柔軟性の欠如をもたらす。
本研究では,探査深度を動的に調整するエントロピーに基づく探査深度伝導法(エントロダクション)を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:03:26 GMT)
MAD-AD: Masked Diffusion for Unsupervised Brain Anomaly Detection [15.6] 脳画像における教師なし異常検出は、ラベルにアクセスせずに損傷や病理を識別するために重要である。
本研究では,拡散モデルにマスキングを組み込んだ新しい手法を提案し,その生成能力を活用して正常脳解剖学の堅牢な表現を学習する。
提案手法は,既存の教師なし異常検出手法を超越し,高精度な正常な異常発生と局所的異常発生に優れた性能を示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 21:42:00 GMT)
Network-wide Freeway Traffic Estimation Using Sparse Sensor Data: A Dirichlet Graph Auto-Encoder Approach [15.5] ネットワークワイドトラフィック状態推定(TSE)は、わずかに配置されたセンサを用いて、ネットワークトラフィック状態の完全なイメージを推測することを目的としている。
DEFP for Directed graph (DEFP4D)は、DEFP4D(DEFP4D)の理論的導出によるこれらの課題に対処する。
3つのトラフィックデータセットの実験により、DGAEは既存のSOTA法より優れ、都市間転送性が強いことを示した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:58:50 GMT)
Dynamic Backtracking in GFlowNets: Enhancing Decision Steps with Reward-Dependent Adjustment Mechanisms [15.2] 本稿では,新規なGFN, Dynamic Backtracking GFN(DB-GFN)を提案する。
DB-GFNは、現在の状態の報酬値に応じて、ネットワーク構築プロセス中のバックトラックを可能にする。
LS-GFNやGTBなどのGFNモデルよりも、サンプル品質、サンプル探索量、トレーニング収束速度が優れている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:16:40 GMT)
GenEFT: Understanding Statics and Dynamics of Model Generalization via Effective Theory [15.0] ニューラルネットワークの一般化の静的性と動的性に光を遮る効果的な理論フレームワークを提案する。
我々はデコーダが弱すぎても強すぎないGoldilocksゾーンの一般化を見出した。
次に、潜在空間表現を相互作用粒子(応答)としてモデル化する表現学習のダイナミクスに関する効果的な理論を導入する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:31:41 GMT)
A Comprehensive Survey on Process-Oriented Automatic Text Summarization with Exploration of LLM-Based Methods [14.7] 自動テキスト要約(ATS)は、簡潔で正確な要約を作成することを目的としている。
ATSは学術界と産業界の両方に大きな関心を集めている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:02:55 GMT)
Progressive Test Time Energy Adaptation for Medical Image Segmentation [14.7] 医用画像セグメンテーションのためのモデルに依存しない,プログレッシブなテスト時間エネルギー適応手法を提案する。
本手法では,ソースデータに基づいて学習した形状エネルギーモデルを用いて,パッチレベルでのエネルギースコアをセグメント化マップに割り当てる。
テスト時にこのエネルギースコアを最小化することにより、セグメント化モデルを洗練し、ターゲット分布と整合する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:15:50 GMT)
Unreal-MAP: Unreal-Engine-Based General Platform for Multi-Agent Reinforcement Learning [14.5] Unreal Multi-Agent Playground (Unreal-MAP)は、Unreal-Engine (UE)をベースにしたMARL汎用プラットフォームである。
Unreal-MAPは、UEコミュニティで利用可能な膨大な視覚的および物理的リソースを使用して、ユーザが自由にマルチエージェントタスクを作成することができる。
我々は,ルールベースから学習ベースまで,サードパーティ製フレームワークが提供するアルゴリズムと互換性のある実験的なフレームワークを開発する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:40:41 GMT)
Selective Complementary Feature Fusion and Modal Feature Compression Interaction for Brain Tumor Segmentation [14.5] マルチモーダル特徴情報の相補的融合と圧縮相互作用を実現するための補完的特徴圧縮相互作用ネットワーク(CFCI-Net)を提案する。
CFCI-Netは最先端モデルよりも優れた結果が得られる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:52:51 GMT)
Perturb-and-Revise: Flexible 3D Editing with Generative Trajectories [14.4] 我々は、様々なNeRF編集を可能にするPerturb-and-Reviseを提案する。
まず、ランダム初期化でNeRFパラメータを摂動する。
摂動のレベルは、局所的なロスランドスケープの分析によって自動的に決定される。
生成過程と組み合わさって、編集したNeRFを改良するためにアイデンティティ保存勾配を課す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:36:39 GMT)
Quantum Chebyshev Probabilistic Models for Fragmentation Functions [14.4] 電子陽電子の単一包摂ハドロン消滅による荷電ピオンとカオンのフラグメンテーション関数(FFs)について検討した。
この結果は,高エネルギー物理学における科学的発見とデータ解析の進展に対処するための量子生成モデリングの可能性の増大を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:09:44 GMT)
Advancing Mobile GUI Agents: A Verifier-Driven Approach to Practical Deployment [14.3] V-Droidは、Large Language Modelsをバリデーションとして使用するモバイルタスク自動化エージェントである。
V-Droidは、いくつかの公開モバイルタスク自動化ベンチマークにまたがって、最先端のタスク成功率を設定する。
V-Droidは1ステップあたり0.7秒という驚くほど低レイテンシを実現している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:25:00 GMT)
Mirror Descent and Novel Exponentiated Gradient Algorithms Using Trace-Form Entropies and Deformed Logarithms [14.3] 本稿では,ミラー・ディフレッシュ・アップデート (MD) とそれに関連する新しい一般化指数勾配 (GEG) アルゴリズムの提案と検討を行う。
提案アルゴリズムはエントロピーMDの拡張と乗算更新の一般化とみなすことができる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:40:17 GMT)
Multilabel Prototype Generation for Data Reduction in k-Nearest Neighbour classification [14.2] PG(Prototype Generation)メソッドは通常、$k$-Nearest Neighbour ($k$NN)分類器の効率を改善するために検討される。
本研究は,4種類のPG戦略の新規な適応を多ラベルケースに適用するものである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:34:11 GMT)
STEP: Simultaneous Tracking and Estimation of Pose for Animals and Humans [14.1] 本稿では,トランスフォーマーに基づく識別予測モデルを用いて,多様な動物種と人間のポーズの同時追跡と推定を行う新しいフレームワークSTEPを紹介する。
当社のアプローチでは,トラッキング機能のため,フレーム単位のターゲット検出には依存していません。
実験では,既存手法と比較して優れた結果が得られ,様々な応用への扉が開けられた。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:11:27 GMT)
Attention Pruning: Automated Fairness Repair of Language Models via Surrogate Simulated Annealing [14.1] 本稿では,大規模言語モデル (LLM) におけるアテンションヘッドに対するアテンション・プルーニング(Attention Pruning) を提案する。
我々の実験は、注意喚起によって最大40%の性別バイアスが減少し、最先端のバイアス緩和戦略よりも優れることを示した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:02:32 GMT)
DroidTTP: Mapping Android Applications with TTP for Cyber Threat Intelligence [14.0] DroidTTPは、Androidのマルウェアの振る舞いを戦術、テクニック、手順(TTP)にマッピングするフレームワークである。
私たちのデータセットは、MITRE TTPをAndroidアプリケーションに明示的に関連付けています。
問題変換アプローチ(PTA)と大規模言語モデル(LLM)を利用した自動解法を開発した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:38:24 GMT)
Extract, Match, and Score: An Evaluation Paradigm for Long Question-context-answer Triplets in Financial Analysis [13.9] 大規模言語モデル(LLM)は多様なアプリケーションで広く採用されている。
従来の評価基準は、長文回答の品質を評価する際に低下する。
これは特に、拡張された質問、広範囲なコンテキスト、ロングフォームな回答を含む現実世界のシナリオにおいて重要である。
本稿では,LLMの出力の複雑さに合わせて,効率的な抽出,マッチング,スコア(EMS)評価手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:38:44 GMT)
Two-stage Incomplete Utterance Rewriting on Editing Operation [13.8] IURのためのTEO(emphTwo-stage approach on Editing Operation)という新しいフレームワークを提案する。
第1段は編集操作を生成し、第2段は生成した編集操作と対話コンテキストとを利用して不完全な発話を書き換える。
3つのIURデータセットによる実験結果から,TEOはSOTAモデルよりも有意に優れていた。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:56:14 GMT)
Incomplete Utterance Rewriting with Editing Operation Guidance and Utterance Augmentation [13.8] マルチタスク学習フレームワークEO-IUR (Editing Operation-guided Incomplete Utterance Rewriting) を提案し,コヒーレントな発話を生成する。
また,操作に基づく不完全発話の編集とLLMに基づく歴史的発話の編集という2次元的発話増強戦略を提案する。
3つのデータセットに対する実験結果から、我々のEO-IURは、オープンドメインとタスク指向の対話の両方において、従来の最先端(SOTA)ベースラインよりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:26:46 GMT)
Large positive magnetoconductance in carbon nanoscrolls [13.8] カーボンナノスクロールが複数のテスラの軸方向磁場を受けると、ナノスクロールの低キャリア密度での弾道コンダクタンスは約200%増加することを示す。
我々は、磁場誘起ゼロエネルギーモードの出現によって正の磁気伝導が生じることを証明した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:50:09 GMT)
Rationalization Models for Text-to-SQL [13.8] 本稿では,テキスト・ツー・シークレット・モデルの微調整を強化するために,CoT(Chain-of-Thought)論理を生成するフレームワークを提案する。
プロセスは、手動でサンプルの小さなセットをアノテートすることから始まり、その後、大きな言語モデルを促すために使用される。
その後、検証されたクエリに基づいて合理化モデルをトレーニングし、広範な合成CoTアノテーションを可能にする。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:46:48 GMT)
Palatable Conceptions of Disembodied Being: Terra Incognita in the Space of Possible Minds [13.7] そのような概念に適合する存在に対して、主観的時間と自尊心はどのように現れるのか?
究極的には、この試みは、仏教的な意味では空虚性のようなものを生み出し、主観性と自己形成に対する我々の双対的傾向を損なうのに役立ちます。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:05:16 GMT)
Text-Driven Diffusion Model for Sign Language Production [13.7] 我々は,SLRTP Sign Production Challengeに対して,hfut-lmcチームのソリューションを紹介した。
この課題は、テキスト入力から意味的に整列された手話ポーズ列を生成することである。
我々の解はBLEU-1のスコアを20.17で達成し、挑戦の2位となった。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:45:27 GMT)
Near-Optimal Sample Complexity for Iterated CVaR Reinforcement Learning with a Generative Model [13.6] リスクに敏感な強化学習(RL)のサンプル複雑性問題を生成モデルを用いて検討する。
この問題に対するサンプルの複雑さに基づいて,上界と下界をほぼ一致するように開発する。
また、最小限の累積報酬を最大化することを目的とした、Worst-Path RLと呼ばれるリスクレベル$tau$の制限ケースについても検討する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 20:52:18 GMT)
DELIFT: Data Efficient Language model Instruction Fine Tuning [13.5] 本稿では,3段階の微調整におけるデータ選択を体系的に最適化する新しいアルゴリズムであるDELIFTを紹介する。
さまざまなタスクやモデルスケールにわたる実験により、DELIFTはパフォーマンスを損なうことなく、微調整データサイズを最大70%削減できることが示された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:52:47 GMT)
DocVideoQA: Towards Comprehensive Understanding of Document-Centric Videos through Question Answering [13.5] DocVideoQAタスクとデータセットを初めて紹介し、23のカテゴリにわたる1454のビデオを約828時間に分けた。
データセットには、手動およびGPTを介して154kの質問応答ペアがアノテートされ、モデルの理解、時間的認識、モダリティ統合機能を評価する。
提案手法は,多種多様な指導指導データを用いて一助的特徴抽出を強化し,モダリティ統合を強化するためにコントラスト学習を利用する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:21:25 GMT)
LeanTTA: A Backpropagation-Free and Stateless Approach to Quantized Test-Time Adaptation on Edge Devices [13.4] 本稿では、エッジデバイスに適した量子化テスト時間適応のための、バックプロパゲーションフリーでステートレスな新しいフレームワークであるLeanTTAを紹介する。
バックプロパゲーションなしで正規化統計を動的に更新することで計算コストを最小化する。
我々は,センサのモダリティにまたがる枠組みを検証し,最先端のTTA手法よりも大幅に改善したことを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:27:09 GMT)
A Black Swan Hypothesis: The Role of Human Irrationality in AI Safety [13.3] 黒い白鳥の出来事は、非常に高いリスクをもたらす統計的に稀な出来事である。
まず,黒白鳥イベントを慎重に分類し,空間的な黒白鳥イベントに着目し,数学的に黒白鳥イベントの定義を定式化する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:18:24 GMT)
An Efficient Permutation-Based Kernel Two-Sample Test [13.2] 2サンプル仮説テストは統計学と機械学習の基本的な問題である。
本研究では,最大平均誤差(MMD)のNystr "om approxation"を用いて,計算効率よく実用的なテストアルゴリズムを設計する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:09:08 GMT)
Lyra: An Efficient and Expressive Subquadratic Architecture for Modeling Biological Sequences [12.6] 本稿では, エピスタシスの生物学的枠組みを基盤として, シークエンス・モデリングのためのサブクワッド・アーキテクチャであるLyraを紹介する。
我々は、Lyraが100以上の幅広い生物学的タスクにまたがって性能を発揮し、多くの重要な領域において最先端(SOTA)性能を達成することを実証した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:09:18 GMT)
Transformer-based Wireless Symbol Detection Over Fading Channels [12.5] トランスフォーマーベースの無線受信機は、パイロットデータが豊富である場合に高い検出精度を示す。
本稿では,新しい無線受信機設計としてDEFINED(Decision Feedback IncontExt Detection)ソリューションを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:57:01 GMT)
Grammar and Gameplay-aligned RL for Game Description Generation with LLMs [12.3] ゲーム記述生成(GDG)は、自然言語テキストからゲーム記述言語(GDL)で記述されたゲーム記述を生成するタスクである。
GDG(RLGDG)のためのLarge Language Models(LLM)の強化学習に基づく微調整を提案する。
学習方法は,文法報酬と概念報酬の両方を導入することにより,ゲームコンセプトに対する文法的正しさと忠実さを同時に向上させる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 01:47:33 GMT)
NuiScene: Exploring Efficient Generation of Unbounded Outdoor Scenes [12.3] 本稿では,城郭から高層住宅まで幅広い屋外シーンを創出する作業について検討する。
本研究では,シーンチャンクを一様ベクトル集合としてエンコードする効率的な手法を提案する。
この作業を容易にするために,共同トレーニング用に前処理した,小型ながら高品質なシーンセットであるNuiScene43をキュレートする。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:37:43 GMT)
Gaussian Graph Network: Learning Efficient and Generalizable Gaussian Representations from Multi-view Images [12.3] 3D Gaussian Splatting (3DGS) は印象的なビュー合成性能を示した。
本稿ではガウスグラフネットワーク(GGN)を提案し,効率よく一般化可能なガウスグラフを生成する。
我々は大規模なRealEstate10KとACIDデータセットの実験を行い、本手法の効率性と一般化を実証した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:56:13 GMT)
JuDGE: Benchmarking Judgment Document Generation for Chinese Legal System [12.3] JuDGE(Judgment Document Generation Evaluation)は、中国の法体系における判定文書生成の性能を評価するための新しいベンチマークである。
本研究では,実訴訟の事実記述からなる包括的データセットを構築し,対応する全判決文書と組み合わせた。
法律専門家と共同で,生成した判定文書の品質を評価するための総合的な自動評価フレームワークを構築した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:09:51 GMT)
No Thing, Nothing: Highlighting Safety-Critical Classes for Robust LiDAR Semantic Segmentation in Adverse Weather [12.2] 典型的な運転シーンでは、"物"カテゴリーは動的であり、衝突のリスクが高いため、安全なナビゲーションと計画に不可欠である。
悪天候は意味レベルの特徴の劣化と局所的特徴の悪化を招き,「もの」を「足」と誤認する原因となることを観察した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:40:24 GMT)
Pathways on the Image Manifold: Image Editing via Video Generation [11.9] 我々は、事前訓練されたビデオモデルを用いて、画像編集を時間的プロセスとして再構成し、元の画像から所望の編集へのスムーズな遷移を生成する。
提案手法は,テキストベースの画像編集における最先端の成果を達成し,編集精度と画像保存の両面で有意な改善を示した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:02:30 GMT)
Tiny models from tiny data: Textual and null-text inversion for few-shot distillation [11.8] ごく少数のトレーニング例を用いて、画像分類などの問題に対処する例は少ない。
近年の視覚基礎モデルでは、数発の転送能力は優れているが、推論では大きくて遅い。
本稿では,テキスト逆変換の多様性とNull-text逆変換の特異性を組み合わせた新しい拡散モデル逆変換法(TINT)を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:04:41 GMT)
A General Adaptive Dual-level Weighting Mechanism for Remote Sensing Pansharpening [11.8] リモートセンシングの深層学習法は 急速に進歩しています
多くの既存手法は特徴の不均一性と冗長性を完全に活用するのに苦労している。
これらの課題に対処するために、一般適応二重レベル重み付け機構(ADWM)を導入する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:38:17 GMT)
Uncertainty Quantification and Confidence Calibration in Large Language Models: A Survey [11.7] LLM(Large Language Models)は、医療、法律、交通といった高度な分野において、テキスト生成、推論、意思決定に優れる。
不確実性定量化(UQ)は、アウトプットの信頼度を推定することで信頼性を高め、リスク軽減と選択的予測を可能にする。
計算効率と不確実性次元に基づいてUQ手法を分類する新しい分類法を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:04:29 GMT)
Unifying EEG and Speech for Emotion Recognition: A Two-Step Joint Learning Framework for Handling Missing EEG Data During Inference [11.6] 音声はAERにとって最も直接的で直感的なモダリティであるが、人間によって意図的に偽造されるため信頼できない。
脳波のような生理学的モダリティはより信頼性が高く、偽造することは不可能である。
本稿では,2段階のジョイントマルチモーダル学習手法 (JMML) を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:26:49 GMT)
A note on lower bounds of concurrence for arbitrary dimensional bipartite quantum states [11.5] 両部量子状態の相関行列に基づいて,コンカレンスと2-コンカレンスの両方について解析的下界を示す。
他の関連する下界と比較して、我々の手法は、特に大きな純度を持つ状態に対して、絡み合いをよりよく推定する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:15:21 GMT)
AIMI: Leveraging Future Knowledge and Personalization in Sparse Event Forecasting for Treatment Adherence [11.4] 慢性疾患の患者は、費用がかかるか悪い健康結果を避けるために、所定の治療への順守が不可欠である。
我々はAIMI(Adherence Forecasting and Intervention with Machine Intelligence)を提案する。
AIMIはスマートフォンのセンサーと以前の薬歴を使って、所定の薬を服用することを忘れる可能性を見積もっている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:32:35 GMT)
EDiT: Efficient Diffusion Transformers with Linear Compressed Attention [11.4] DiTの注意の2次スケーリング特性は、高解像度の画像生成や限られたリソースを持つデバイスを妨げます。
これらの効率ボトルネックを軽減するために,効率的な拡散変換器(EDiT)を導入する。
PixArt-Sigma(Conventional DiT)とStable Diffusion 3.5-Medium(MM-DiT)に統合することで,EDiTおよびMM-EDiTアーキテクチャの有効性を示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 21:58:45 GMT)
MobiFuse: Learning Universal Human Mobility Patterns through Cross-domain Data Fusion [11.3] 本研究では,異なる性質と時間分解能のデータを統合したクロスドメインデータ融合フレームワークを提案する。
この枠組みはロサンゼルス(LA)とエジプトの2つのケーススタディを通じて実証されている。
生成した合成需要に基づくロサンゼルス郡の大規模交通シミュレーションは、観測された交通量とよく一致している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 01:41:28 GMT)
MG-SLAM: Structure Gaussian Splatting SLAM with Manhattan World Hypothesis [11.3] 幾何学的精度と完全性を向上させるRGB-DシステムであるManhattan Gaussian SLAMを提案する。
構成されたシーンから抽出された融合線分をシームレスに統合することにより,テクスチャレス屋内領域におけるロバストなトラッキングを実現する。
合成シーンと実世界のシーンの両方で行われた実験は、これらの進歩により、我々の手法が最先端のパフォーマンスを達成できることを実証している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:27:28 GMT)
Fast Homomorphic Linear Algebra with BLAS [11.3] ホモモルフィック暗号化は、プライバシ保護データ操作、特にAIに幅広いアプリケーションを開く。
これらの応用の多くは、重要な線型代数計算(行列 x ベクトル積、行列 x 行列積)を必要とする。
線型代数計算のこの中心的な役割は、準同型代数をはるかに超え、科学計算のほとんどの分野に適用できる。
CKKSをベースとした暗号化正方行列乗算と倍精度浮動小数点行列乗算との効率損失は、正確な状況に応じて4-12因子であることを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:19:47 GMT)
SSHNet: Unsupervised Cross-modal Homography Estimation via Problem Reformulation and Split Optimization [11.2] SSHNetは、教師なしクロスモーダルホモグラフィー推定を2つの教師付きサブプロブレムに再構成する。
本稿では,各サブプロブレム内で各ネットワークを個別に訓練するための効果的な分割最適化手法を提案する。
モデルパラメータの削減とクロスドメイン一般化能力の向上を目的として, 簡易かつ効果的な蒸留訓練手法を用いた。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:31:10 GMT)
Accurate Scene Text Recognition with Efficient Model Scaling and Cloze Self-Distillation [11.2] 我々はデコーダのスケーリングが、エンコーダのスケーリング単独で達成した以上の大きなパフォーマンス向上をもたらすことを示す。
また,ラベルノイズがシーンテキスト認識,特に実世界のデータにおいて重要な課題であることも確認した。
提案手法は,実データのみを用いて,11ベンチマーク中10ベンチマークにおいて,パラメータサイズと計算コストを大幅に削減する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:35:46 GMT)
Truthful Elicitation of Imprecise Forecasts [11.2] 我々は,信頼の集合として与えられる不正確な予測を評価するための枠組みを提案する。
集約手順上でランダム化される適切なスコアリングルールを用いて,不正確予測の真正推論が達成可能であることを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:53:35 GMT)
Enhancing the Scalability and Applicability of Kohn-Sham Hamiltonians for Molecular Systems [11.1] 我々は、物理精度で密度汎関数理論計算のためのスケーラブルなモデルを作成する。
その結果, 総エネルギー予測誤差を1347倍, SCF計算速度を18%削減できることがわかった。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:54:16 GMT)
The Morphology-Control Trade-Off: Insights into Soft Robotic Efficiency [11.0] 本研究では,形態的・制御的複雑度間の相互作用とタスク性能に対する集団的影響について検討する。
その結果, 最適性能は形態と制御の整合性に依存することがわかった。
本研究は,現実シナリオにおけるソフトロボティクスの実用化に寄与する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:19:54 GMT)
Federated Learning for Traffic Flow Prediction with Synthetic Data Augmentation [10.8] この研究はFedTPSと呼ばれるFLフレームワークを導入し、FLを介して軌道生成モデルをトレーニングすることで、各クライアントのローカルデータセットを増大させる合成データを生成する。
提案手法は,様々なFL手法と交通流予測モデルを用いて,大規模現実のライドシェアリングデータセットを用いて評価する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:29:36 GMT)
Bring Remote Sensing Object Detect Into Nature Language Model: Using SFT Method [10.7] 大規模言語モデル(LLM)と視覚言語モデル(VLM)は大きな成功を収めた。
リモートセンシング画像と従来の光学画像とは大きく異なるため、これらのモデルは理解の難しさに直面している。
リモートセンシング画像におけるオブジェクト検出へのVLMの適用について検討する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:21:00 GMT)
BELLA: Black box model Explanations by Local Linear Approximations [10.7] BELLAは回帰ブラックボックスモデルの個々の予測を説明するための決定論的モデルに依存しないポストホックアプローチである。
BELLAは事実と反事実の両方を説明することができる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:59:24 GMT)
Label-efficient multi-organ segmentation with a diffusion model [10.5] 我々は,CT多臓器分割のための事前学習拡散モデルから知識伝達を用いたラベル効率の高いフレームワークを提案する。
ファインチューニングでは、線形分類と微調整デコーダという2つの微調整戦略を用いてセグメンテーション性能を向上させる。
マルチオーガナイズのための最先端手法と比較して,本手法はFLARE 2022データセット上での競合性能を実現する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:42:26 GMT)
U-Motion: Learned Point Cloud Video Compression with U-Structured Temporal Context Generation [10.4] ポイントクラウドビデオ(PCV)は、動的シーンと新興アプリケーションを組み合わせた汎用的な3D表現である。
本稿では,PCV形状と属性の両方を学習ベースで圧縮するU-Motionを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 00:37:20 GMT)
Big Help or Big Brother? Auditing Tracking, Profiling, and Personalization in Generative AI Assistants [10.4] Generative AI(GenAI)ブラウザアシスタントは、WebブラウザにGenAIの強力な機能を統合することで、質問応答、コンテンツ要約、エージェントナビゲーションなどのリッチなエクスペリエンスを提供する。
現在ブラウザ拡張機能として利用可能なこれらのアシスタントは、検索やクリックデータなどの詳細なブラウジングアクティビティを追跡するだけでなく、フォームを埋めたり、プライバシー上の懸念を生じさせるようなタスクを自律的に行うこともできる。
本研究では,ユーザの属性や興味に基づいて,ユーザをプロファイルし,回答をパーソナライズする能力について検討する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:21:47 GMT)
DeepPsy-Agent: A Stage-Aware and Deep-Thinking Emotional Support Agent System [10.3] DeepPsy-Agentは、心理学における3段階の援助理論とディープラーニング技術を組み合わせた革新的な心理学的支援システムである。
リアルな3万の心理的ホットラインの会話に基づいて、AIシミュレーション対話と専門家による再注釈戦略を用いて、高品質なマルチターン対話データセットを構築します。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:59:29 GMT)
A Retrospective Systematic Study on Hierarchical Sparse Query Transformer-assisted Ultrasound Screening for Early Hepatocellular Carcinoma [10.2] HCCは世界で3番目に多いがん関連死亡原因である。
AI技術の最近の進歩は、このギャップを埋めるための有望なソリューションを提供する。
HSQformerは、CNNのローカル特徴抽出とVision Transformerのグローバルコンテキスト認識を相乗化する、新しいハイブリッドアーキテクチャである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:38:41 GMT)
IRef-VLA: A Benchmark for Interactive Referential Grounding with Imperfect Language in 3D Scenes [10.1] IRef-VLAは、11.5K以上のスキャンされた3D部屋からなる参照グラウンドタスクのための、世界で最大のデータセットである。
我々は,ロバストでインタラクティブなナビゲーションシステムの開発を支援する3Dシーン理解のためのリソースの提供を目指している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:16:10 GMT)
HS-FPN: High Frequency and Spatial Perception FPN for Tiny Object Detection [10.1] 我々は新しい高周波空間知覚特徴ピラミッドネットワーク(HS-FPN)を提案する。
HS-FPNは、小さな物体の特徴を豊かに強調するために、ハイパスフィルタを通じて高周波応答を生成する。
第2に、FPNが欠落している空間依存を捉えるための空間依存認識モジュール(SDP)を開発した。
実験により, HS-FPNに基づく検出器は, 微小物体検出のためのAI-TODデータセット上での最先端モデルに対して, 競争上の優位性を示すことが示された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:09:25 GMT)
CodeReviewQA: The Code Review Comprehension Assessment for Large Language Models [10.1] 最先端の大規模言語モデル(LLM)は、印象的なコード生成機能を示しているが、実際のソフトウェアエンジニアリングタスクに苦労している。
コードレビューのコメントは暗黙的であり、曖昧で、口語であり、モデルがコードと人間の意図の両方を理解する必要がある。
この課題は、大きな言語モデルが技術的コンテキストと会話的コンテキストの両方を橋渡しする能力を評価することである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:07:31 GMT)
These Magic Moments: Differentiable Uncertainty Quantification of Radiance Field Models [10.0] 本稿では, レンダリング方程式の高次モーメントを利用して, 放射場に対する不確実性定量化手法を提案する。
本研究では,レンダリングの確率的性質により,高次モーメントの効率よく,かつ微分可能な計算が可能であることを実証する。
提案手法は, 処理後処理を必要とせずに, より直接的で, 計算効率が高く, 微分可能な定式化を提供しながら, 既存の放射界不確実性推定手法より優れている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:50:53 GMT)
Exploring the Reliability of Self-explanation and its Relationship with Classification in Language Model-driven Financial Analysis [9.8] 言語モデル(LM)は、推論や詳細な財務分析において、非常に多様である。
LMによる自己説明を定量的に評価し,その事実と因果性に着目した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:33:59 GMT)
Computation-Efficient and Recognition-Friendly 3D Point Cloud Privacy Protection [9.4] 3Dポイントクラウドは、自動運転車、ロボティクス、CADモデルなどのアプリケーションで広く利用されている。
私たちの知る限りでは、これらのアプリケーションは3Dポイントクラウドにおけるプライバシー漏洩の問題を提起しています。
私たちは3Dポイントのクラウドプライバシ問題を定義し、PointFlowGMMという名前の効率的なプライバシ保存フレームワークを提案しました。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:09:44 GMT)
Distributionally Robust Learning for Multi-source Unsupervised Domain Adaptation [9.4] 対象ドメインの分布がソースドメインの分布と異なる場合、経験的リスクはよく機能しない。
我々は、複数のソースドメインからのラベル付きデータと対象ドメインからのラベルなしデータを活用する、教師なしのドメイン適応アプローチを開発する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:48:37 GMT)
NeuroSep-CP-LCB: A Deep Learning-based Contextual Multi-armed Bandit Algorithm with Uncertainty Quantification for Early Sepsis Prediction [9.3] 患者固有の報酬関数をコンテキスト型マルチアームバンディット設定でモデル化することを目的としている。
目標は、患者固有の臨床的特徴を活用して、不確実性のある意思決定を最適化することである。
本稿では,ニューロセプCP-LCBを提案する。ニューロセプCP-LCBは,ニューロセプCP-LCBは,ニューラルネットワークと文脈的包帯との新たな統合であり,早期のセプシス検出に適したコンフォメーション予測である。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 21:02:49 GMT)
Shining Yourself: High-Fidelity Ornaments Virtual Try-on with Diffusion Model [9.3] 本稿では,装飾品の仮想試行作業について提案し,装飾品の仮想試行作業の保存性を向上させる方法を提案する。
具体的には,装飾品と模型のアライメントを改善するために,正確に着用マスクを推定する。
実験により,提案手法は対象モデルに参照画像からの装飾を施し,同一性を保ちながらスケールとポーズの実質的な差異を処理し,現実的な視覚効果を達成できることを示した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:57:32 GMT)
A Deep Dive Into Large Language Model Code Generation Mistakes: What and Why? [9.2] 大規模な言語モデルは、仕様から逸脱する欠陥コードを生成することができる。
広範囲な手動分析により, ノンシンタクティックな誤りの7つのカテゴリーが同定された。
評価の結果,LPMの誤りの原因を特定すると,ReActプロンプト技術を用いたGPT-4が最大0.65のF1スコアを達成できることがわかった。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:21:07 GMT)
Human or LLM? A Comparative Study on Accessible Code Generation Capability [9.0] GPT-4o と Qwen2.5-Coder-32B-Instruct-AWQ による Web コードのアクセシビリティの比較を行った。
結果から、LCMは色コントラストや代替テキストといった基本的な機能に対して、よりアクセスしやすいコードを生成することが多いことが分かる。
フィードバック駆動型ReActベースのアプローチであるFeedA11yを導入する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:14:26 GMT)
Towards Automatic Continual Learning: A Self-Adaptive Framework for Continual Instruction Tuning [9.0] 連続的な命令チューニングにより、大きな言語モデルは、過去の知識を維持しながら漸進的に学習することができる。
我々のフレームワークは受信したデータを動的にフィルタリングし、連続した更新間で冗長なデータを識別し、削減する。
計算コストを66.7%削減し、モデル性能を改善し、自律的な更新を実現した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:00:41 GMT)
Accelerating Antibiotic Discovery with Large Language Models and Knowledge Graphs [8.8] そこで本研究では,LLMをベースとしたアラームシステムを構築し,抗生物質活性の先行的証拠を検知し,コストのかかる再発見を防止するパイプラインを提案する。
このシステムは生物と化学の文献を知識グラフ(KG)に統合し、分類学的解決、同義語処理、多段階の証拠分類を確実にする。
結果は、エビデンスをレビューし、偽陰性を減らし、意思決定を加速するためのパイプラインの有効性を強調した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:12:32 GMT)
Closer to Ground Truth: Realistic Shape and Appearance Labeled Data Generation for Unsupervised Underwater Image Segmentation [8.5] 人間のアノテーションを必要としない2段階の非教師付きセグメンテーション手法を導入し、人工的に作成された実画像と実画像を組み合わせる。
本手法は,仮想魚を現実世界の水中環境に配置することにより,難易度の高い合成訓練データを生成する。
水中ビデオにおけるサーモンセグメンテーションの特定の事例にその効果を示し,本研究で最大のデータセットであるDeepSalmon(30GB)を紹介した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:34:45 GMT)
From Monocular Vision to Autonomous Action: Guiding Tumor Resection via 3D Reconstruction [8.5] 本稿では,RGB画像のみを用いた3次元マッピングパイプラインを提案する。
術後組織モデル評価を含むいくつかの指標では、我々のパイプラインはRGB-Dカメラと互換性がある。
本研究は,手術ロボットの完全自律化に向けた一歩である。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:57:18 GMT)
BARD-GS: Blur-Aware Reconstruction of Dynamic Scenes via Gaussian Splatting [8.5] BARD-GSは、ぼやけた入力や不正確なカメラポーズを効果的に処理する、ロバストな動的シーン再構築のための新しいアプローチである。
動きのぼかしをカメラの動きのぼかしや物体の動きのぼかしに明示的に分解することにより、動的領域におけるレンダリング結果を大幅に改善する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:23:52 GMT)
Paint by Inpaint: Learning to Add Image Objects by Removing Them First [8.4] 我々は、画像にオブジェクトを効果的に付加して、塗布過程を逆転させる拡散モデルを訓練する。
その結果,トレーニングされたモデルは,オブジェクトの追加タスクと一般的な編集タスクの両方において,既存のモデルを上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:59:54 GMT)
MASH-VLM: Mitigating Action-Scene Hallucination in Video-LLMs through Disentangled Spatial-Temporal Representations [8.4] アクションシーン幻覚は、ビデオモデルが観察されたアクションに基づいてシーンコンテキストやシーンに基づいてアクションを誤って予測する場合に発生する。
ビデオLLMにおけるMASH-VLM(Multigating Action-Scene Hallucination in Video-LLMs)を紹介する。
MASH-VLMはUNSCENEベンチマークや既存のビデオ理解ベンチマークで最先端の結果を達成する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:48:59 GMT)
I2AM: Interpreting Image-to-Image Latent Diffusion Models via Bi-Attribution Maps [8.2] イメージ・ツー・イメージ(I2I)モデルにおけるクロスアテンション機構について検討する。
本稿では,I2Iモデルの解釈可能性を高める手法である画像から画像への属性マップ(I2AM)を提案する。
I2AMは、時間ステップ、アテンションヘッド、レイヤの横断的アテンションスコアを集計し、画像間で重要な機能が転送される方法に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:27:10 GMT)
An Adaptive Orthogonal Convolution Scheme for Efficient and Flexible CNN Architectures [8.1] 我々は直交畳み込みを構築するスケーラブルな方法であるAOC(Adaptative Orthogonal Convolution)を紹介する。
実験を通して,本手法がスケールするにつれて効率が向上する表現モデルを生成することを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:31:58 GMT)
Variance-Reduced Fast Krasnoselkii-Mann Methods for Finite-Sum Root-Finding Problems [8.0] 有限和共役方程式 $Gx = 0$ を解くために, 分散還元を伴う高速クラスクラスKrasnoselkii-Mann 法を提案する。
我々のアルゴリズムは単一ループであり、より広範なルートフィンディングアルゴリズムのために特別に設計された、偏りのない分散還元推定器の新たなファミリーを利用する。
数値実験は我々のアルゴリズムを検証し、最先端の手法と比較して有望な性能を示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 01:57:17 GMT)
Quantum Hamiltonian Descent for Non-smooth Optimization [7.8] 古典的アルゴリズムの限界を克服するために量子力学をどのように活用するかを検討する。
本稿では,非平滑なグローバルコンバージェンス問題に対して,新しい設計によるグローバルコンバージェンス率を提案する。
さらに,新しいLynov関数を用いて離散時間QHDを完全デジタル化する手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:02:33 GMT)
Knowledge-guided machine learning model with soil moisture for corn yield prediction under drought conditions [7.8] リモートセンシング(RS)技術はトウモロコシの収量予測に有用なツールとなっている。
従来のプロセスベース(PB)モデルは、固定された入力機能によって制限され、大量のRSデータを組み込むのに苦労する。
機械学習(ML)モデルは、限定的な解釈可能性を持つ「ブラックボックス」であるとしばしば批判される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:52:25 GMT)
Ordered Topological Deep Learning: a Network Modeling Case Study [7.4] RouteNetの洗練された設計を再考し、トポロジカルディープラーニング(TDL)への隠れた接続を明らかにする。
本稿では,任意の離散位相空間において順序付き近傍の概念を導入する新しいTDLフレームワークOrdGCCNを提案する。
私たちの知る限りでは、これは最先端のTDL原則を現実に応用した最初の成功例です。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 23:15:12 GMT)
SAGE: Semantic-Driven Adaptive Gaussian Splatting in Extended Reality [7.3] セマンティックセグメンテーションによって識別される異なる3DGSオブジェクトのレベル・オブ・ディーテール(LOD)を動的に適応させることにより、ユーザエクスペリエンスを向上させるために設計された新しいフレームワークであるSAGEを紹介する。
実験により、SAGEは目的の視覚的品質を維持しながら、メモリと計算オーバーヘッドを効果的に削減し、インタラクティブなXRアプリケーションに強力な最適化を提供することを示した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 23:29:24 GMT)
OffsetOPT: Explicit Surface Reconstruction without Normals [7.3] ここでは,3次元点雲から直接表面を再構成するOffsetOPTを提案する。
小型の形状や大規模開口面など,一般的なベンチマークでその精度を実証する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 00:47:27 GMT)
Estimating Causal Effects of Text Interventions Leveraging LLMs [7.3] CausalDANNは、大規模言語モデル(LLM)によって促進されるテキスト変換を用いて因果効果を推定する新しいアプローチである。
既存の手法とは異なり、本手法は任意のテキスト介入に対応し、ドメイン適応能力を持つテキストレベル分類器を用いて、ドメインシフトに対するロバストな効果推定を生成する。
この多様なテキスト介入を扱う柔軟性は、テキストデータの因果推定において重要な進歩であり、人間の振る舞いをよりよく理解し、社会システム内で効果的な介入を開発する機会を提供する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 23:59:00 GMT)
Entity-aware Cross-lingual Claim Detection for Automated Fact-checking [7.2] Ex-Claimは,任意の言語で記述されたクレームの処理をうまく一般化する,エンティティ対応の言語間クレーム検出モデルである。
提案手法は,27言語にまたがるベースラインを著しく上回り,限られた学習データであっても,最も高い知識伝達率を達成する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:33:29 GMT)
Image is All You Need to Empower Large-scale Diffusion Models for In-Domain Generation [7.2] ドメイン内生成は、unconditional generation、text-to-image、画像編集、3D生成など、特定のドメイン内でさまざまなタスクを実行することを目的としている。
初期の研究は通常、特定のタスクとドメインごとに特別なジェネレータを訓練する必要があり、しばしば完全にラベル付けされたデータに依存していた。
強力な生成能力と拡散モデルの幅広い応用により、私たちは、これらのモデルをドメイン内生成に活用するためにラベルのないデータを活用することを模索しています。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:15:45 GMT)
UniSync: A Unified Framework for Audio-Visual Synchronization [7.1] We present UniSync, a novel approach for a audio-visual sync using embedded similarities。
我々は、差分に基づく損失成分と、話者間非同期ペアによる対照的な学習フレームワークを強化する。
UniSyncは、標準データセットの既存のメソッドよりも優れています。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:16:03 GMT)
UniHDSA: A Unified Relation Prediction Approach for Hierarchical Document Structure Analysis [7.1] 我々は、UniHDSAと呼ばれるHDSAの統一的な関係予測手法を提案する。
UniHDSAは、様々なHDSAサブタスクを関係予測問題として扱い、関係予測ラベルを統一ラベル空間に統合する。
これにより、ページレベルでもドキュメントレベルでも、単一の関係予測モジュールが複数のタスクを同時に処理できる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:44:47 GMT)
Revisiting DRAM Read Disturbance: Identifying Inconsistencies Between Experimental Characterization and Device-Level Studies [7.0] 本研究では,RowHammerとRowPressのキービットフリップ特性をデバイスレベルのエラー機構から同定し,抽出する。
我々はRowHammerとRowPressのビットフリップ方向の基本的な矛盾と、実験結果とデバイスレベルのエラー機構のアクセスパターン依存性を見出した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 23:40:33 GMT)
SPACER: A Parallel Dataset of Speech Production And Comprehension of Error Repairs [7.0] 本稿では,話者とコンプレッシャーの双方による自然な発話誤りの修正方法を示す並列データセットを提案する。
話者は、より意味的および音韻的なずれをもたらす誤りを修復する傾向があり、一方、コンプリエンダーは、より妥当な代替品と音韻的に類似した誤りを訂正する傾向にある。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 23:12:00 GMT)
Label Unbalance in High-frequency Trading [7.0] 金融取引において、リターン予測は取引システムの成功の基盤の1つである。
本稿では,包括的ラベル不均衡調整手法を用いた厳密なエンドツーエンドディープラーニングフレームワークを採用する。
われわれは将来の中国市場での高頻度リターンの予測に成功している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:40:48 GMT)
Enhancing LLM Code Generation with Ensembles: A Similarity-Based Selection Approach [6.9] コード生成における大規模言語モデル(LLM)のアンサンブル手法を提案する。
投票には,CodeBLEUと行動等価性を用いて構文的・意味的類似性を計算する。
実験により,我々のアンサンブルアプローチはスタンドアローンLLMよりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:38:56 GMT)
Fine-Grained Open-Vocabulary Object Detection with Fined-Grained Prompts: Task, Dataset and Benchmark [6.9] 3F-OVDは、教師付ききめ細かい物体検出をオープン語彙設定に拡張する新しいタスクである。
両方の設定で、データセット上で最先端のオブジェクト検出器をベンチマークします。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:44:21 GMT)
Accelerating Transformer Inference and Training with 2:4 Activation Sparsity [6.9] 我々は,Squared-ReLUアクティベーションの固有間隔を利用して,精度を損なうことなく,このアクティベーションを実現する。
この研究は、大規模な言語モデルのトレーニングと推論を加速する上で、スパーシリティが重要な役割を果たす可能性を強調している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:37:12 GMT)
Agentic Keyframe Search for Video Question Answering [6.8] VideoQAは、自然言語によるインタラクションを通じて、ビデオからキー情報を抽出し、理解することを可能にする。
本稿では,ビデオQAタスク中のEgoを識別する強力なアルゴリズムであるエージェント鍵探索(AKeyS)を提案する。
AKeySは計算効率が最も高い従来の手法よりも優れていたことを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:58:12 GMT)
GC-Fed: Gradient Centralized Federated Learning with Partial Client Participation [6.8] グラディエントラーニング(FL)は、プライバシ保護のためのマルチソース情報融合(MSIF)を可能にする
既存のドリフト緩和戦略の多くは参照ベースの技術に依存している。
GC-Fedは、ハイパープレーンを歴史的に独立した基準点として使用し、局所的なトレーニングをガイドし、サイクル間のアライメントを強化する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:41:33 GMT)
DeDe: Detecting Backdoor Samples for SSL Encoders via Decoders [6.7] 自己教師付き学習(SSL)は、大量のラベルのないデータで高品質な上流エンコーダのトレーニングに広く利用されている。
Victim encodersは、インプットとターゲットの埋め込みを関連付け、インプットがアクティブになったときに下流のタスクが意図しない動作を継承する。
本稿では,被害者エンコーダの入力によって引き起こされるバックドアマッピングの活性化を検出する新しい検出機構であるDeDeを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:05:27 GMT)
FutureGen: LLM-RAG Approach to Generate the Future Work of Scientific Article [6.7] 本研究は,関連論文とともに,学術論文の重要部分から今後の研究提案を生成する。
様々な大規模言語モデル (LLM) とRAG(Retrieval-Augmented Generation) を統合して, 生成プロセスを改善する実験を行った。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:14:02 GMT)
A policy gradient approach for Finite Horizon Constrained Markov Decision Processes [6.7] 固定時間(有限時間)後に地平線が終了する有限水平設定における制約付きRLのアルゴリズムを提案する。
我々の知る限り、制約付き有限地平線設定のための最初のポリシー勾配アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:04:47 GMT)
Empirical Analysis of Privacy-Fairness-Accuracy Trade-offs in Federated Learning: A Step Towards Responsible AI [6.7] フェデレートラーニング(FL)は、データのプライバシを維持しながら機械学習を可能にするが、プライバシ保護(PP)と公正性のバランスをとるのに苦労する。
DPはプライバシーを向上するが、計算オーバーヘッドを犠牲にしてHEとSMCの公平性を懸念する一方で、不足しているグループに不均等に影響を及ぼす可能性がある。
我々の発見は、文脈に依存したトレードオフを強調し、責任あるAI原則を守り、公正性、プライバシー、公平な現実世界のアプリケーションを保証するFLシステムを設計するためのガイドラインを提供する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:31:01 GMT)
PromptHash: Affinity-Prompted Collaborative Cross-Modal Learning for Adaptive Hashing Retrieval [6.6] クロスモーダルハッシュは効率的なデータ検索とストレージ最適化のための有望なアプローチである。
PromptHashはアフィニティ・プロンプト・アウェア・コラボレーティブ・ラーニングを活用した,適応型クロスモーダルハッシュのための革新的なフレームワークである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:56:27 GMT)
RESFL: An Uncertainty-Aware Framework for Responsible Federated Learning by Balancing Privacy, Fairness and Utility in Autonomous Vehicles [6.3] 既存のFLフレームワークは、プライバシ、公平性、堅牢性のバランスをとるのに苦労しているため、人口統計グループ間でのパフォーマンス格差が生じる。
この研究は、AVのためのFLベースのオブジェクト検出におけるプライバシと公正性のトレードオフについて検討し、両者を最適化する統合ソリューションであるRESFLを紹介した。
RESFLは、敵のプライバシーのゆがみと不確実性誘導された公正なアグリゲーションを取り入れている。
FACETデータセットとCARLAシミュレータ上でRESFLを評価し、様々な条件下で精度、公正性、プライバシーのレジリエンス、堅牢性を評価する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:46:03 GMT)
Efficient Symbolic Execution of Software under Fault Attacks [6.3] フォールトアタックは物理的に注入されたハードウェアの障害を利用して、ソフトウェアプログラムの安全性を損なう。
ソフトウェアに対する欠陥の影響を分析する既存の手法は、不正確な故障モデリングと非効率的な解析アルゴリズムに悩まされている。
本稿では,プログラム変換を利用してプログラムにシンボル変数を付加し,プログラムの動作を正確にモデル化するフォールトモデリング手法を提案する。
第2に,経路の爆発を緩和するために,最弱のプレコンディションと故障飽和を利用した冗長プルーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:19:48 GMT)
Complexity in Complexity: Understanding Visual Complexity Through Structure, Color, and Surprise [6.3] 人間がどのように視覚の複雑さを知覚するかを理解することは、視覚認知において重要な研究領域である。
複雑性を正確にモデル化することは、これまで考えられていたほど単純ではなく、データセットのバイアスに対処するために、知覚的および意味的な要素を追加する必要がある。
我々のモデルは、解釈可能性を維持しながら予測性能を改善し、視覚的複雑さの認識と評価についてより深い洞察を提供する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:06:51 GMT)
Depth Matters: Multimodal RGB-D Perception for Robust Autonomous Agents [6.3] 本研究では,深度情報によるRGB入力の増大がエージェントの操舵コマンドの予測能力を大幅に向上させることを示す。
我々は,RGB-Dの融合機能を利用して逐次意思決定を行う軽量リカレントコントローラのベンチマークを行った。
以上の結果から,早期に深度データを融合させることで,フレームドロップやノイズレベルが増大しても,極めて堅牢な制御が可能であることが判明した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 21:08:25 GMT)
Linguistic Landscape of Generative AI Perception: A Global Twitter Analysis Across 14 Languages [6.3] 我々の研究結果は、生成型AIツールの認識のグローバルな傾向を明らかにした。
これらのツールに対する感情は言語によって大きく異なるが、イメージツールに対する肯定的な傾向があり、Chatツールに対する否定的な傾向がある。
我々の研究は、生成型AIツールを取り巻く社会的ダイナミクスのさらなる探求のための堅牢な基盤を提供する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 23:09:39 GMT)
Automatically Generating Chinese Homophone Words to Probe Machine Translation Estimation Systems [6.2] そこで我々は,感情に関連する中国語のホモホン語に挑戦する情報理論に触発された新しい手法を提案する。
本手法は,感情保存における翻訳誤りの原因となるホモフォンを生成し,機械翻訳システムにおける脆弱性を明らかにする。
提案手法の有効性を人体評価を用いて評価し,既存のものと比較した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:56:15 GMT)
Generalized Decision Focused Learning under Imprecise Uncertainty--Theoretical Study [6.1] 決定にフォーカスした学習は、機械学習と下流の最適化を統合するための重要なパラダイムとして登場した。
既存の方法論は主に確率的モデルに依存し、タスクの目的に限定する。
本稿では、革新的なフレームワークを導入することで、これらのギャップを埋める。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:02:58 GMT)
Model-based learning for multi-antenna multi-frequency location-to-channel mapping [6.1] Inlicit Neural Representationの文献によると、古典的ニューラルネットワークアーキテクチャは低周波の内容の学習に偏っている。
本稿では、モデルに基づく機械学習パラダイムを利用して、伝搬チャネルモデルから問題固有のニューラルアーキテクチャを導出する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:21:43 GMT)
HR-Bandit: Human-AI Collaborated Linear Recourse Bandit [6.0] 本稿では,探索と利用のバランスをとることで,行動選択と特徴修正の両方を最適化するRecourse Linear UCB(textsfRLinUCB$)アルゴリズムを提案する。
我々はこれをHuman-AI Linear Recourse Bandit(textsfHR-Bandit$)に拡張する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:32:22 GMT)
ULTRA: Unleash LLMs' Potential for Event Argument Extraction through Hierarchical Modeling and Pair-wise Self-Refinement [6.0] イベント引数抽出(EAE)は、あるイベントのロール固有のテキストスパン(例えば、引数)を特定するタスクである。
本稿では,イベントの議論をよりコスト効率よく抽出する階層的枠組みを提案する。
議論の正確な境界を求める際に, LLM が直面する課題に対処するために LEAFER を導入する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:34:29 GMT)
Constant-Depth Quantum Circuits for Arbitrary Quantum State Preparation via Measurement and Feedback [6.0] 本研究は,本質的な量子タスクの恒常的な実装を実現するためのフレームワークを開発する。
これには、測定とフィードバックを通じて、一定の深さの回路で任意の量子状態を作成することが含まれる。
この結果は、測定とフィードバックを用いた一般的な量子回路圧縮の道を開くものである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:55:04 GMT)
Variance-Aware Noisy Training: Hardening DNNs against Unstable Analog Computations [6.0] 雑音訓練は強靭性を高める最も効果的な手法の1つだが、実環境では性能が低下する。
本稿では,推論中に発生する騒音条件をエミュレートするノイズスケジュールを取り入れた新しい手法として,分散認識ノイズ訓練を提案する。
従来の雑音訓練では72.3%、CIFAR-10では97.3%、Tiny ImageNetでは38.5%から89.9%と、ロバスト性は著しく向上した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:34:03 GMT)
Large Language Models for Water Distribution Systems Modeling and Decision-Making [6.0] 配水システム(WDS)の設計、運用、管理には複雑な数学的モデルが含まれる。
近年のLarge Language Models (LLM) の進歩は、人間-モデル相互作用の新しい段階への扉を開く。
本研究では, LLM-EPANETアーキテクチャに基づく水理モデルと水質モデルとのプレーン言語相互作用の枠組みを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:39:11 GMT)
Automated Harmfulness Testing for Code Large Language Models [5.8] LLM(Large Language Models)を利用した生成AIシステムは、通常、有害なコンテンツの拡散を防ぐためにコンテンツモデレーションを使用する。
ソフトウェアアーティファクトの有害なコンテンツへの露出は、開発者のメンタルヘルスに悪影響を及ぼす可能性がある。
本稿では,多様な変換と有害キーワードをプログラムに注入してプロンプトを生成する,カバレッジ誘導型有害性試験フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 23:06:06 GMT)
Distilling 3D distinctive local descriptors for 6D pose estimation [5.8] 本稿では,GeDi教師からローカル記述子を回帰するために,効率的な学生モデルを訓練する知識蒸留フレームワークを提案する。
提案手法を5つのBOPベンチマークデータセットで検証し,推論時間を大幅に短縮することを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:27:13 GMT)
Diffusion-augmented Graph Contrastive Learning for Collaborative Filter [5.7] グラフベースの協調フィルタリングはレコメンデーションシステムにおいて顕著なアプローチとして確立されている。
グラフコントラスト学習の最近の進歩は、データの分散問題を緩和する有望な可能性を示している。
本稿では,DGCL(Diffusion-augmented Contrastive Learning)による協調フィルタリング手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:15:20 GMT)
Achievable Rate Regions for Multi-terminal Quantum Channels via Coset Codes [5.6] 古典情報をQIC(QIC)とQBC(QBC)で通信する問題について検討する。
3ドル/3ドル/3ドル/3ドル/3ドル/3ドルのQBCの古典量子容量領域に新たな内部結合を導出する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:36:09 GMT)
Complete $k$-partite entanglement measure [5.6] k$-partiteの絡み合いは、大域系の粒子がどれだけ絡み合っているかに焦点を当てるが、他の粒子とは分離可能である。
a 110, 012405 (2024) に完全$k$絡み合い尺度の理論が確立されている
ここでは、$k$-partiteの絡み合いのクラスを2つ提示し、それらの完全性を図解として論じる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:22:41 GMT)
VerbDiff: Text-Only Diffusion Models with Enhanced Interaction Awareness [5.5] VerbDiffは、インタラクションワードとオブジェクト間のバイアスを弱める新しいテキスト・画像生成モデルである。
提案手法により,人間と物体の相互作用を正確に理解し,高品質な画像を生成する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:56:20 GMT)
Active Learning For Repairable Hardware Systems With Partial Coverage [5.5] 本稿では,診断カバレッジ(DC),魚情報行列(FIM),診断試験予算を組み込んだMISDP(Mised Semidefinite Program)を提案する。
文献(エントロピー)において最も広く使われているAL AFに対する提案手法の評価を行った。
提案するAFは, 6,000の実験構成において, 代替AFの中では, 平均で最多であった。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:38:16 GMT)
Exploring the Hidden Reasoning Process of Large Language Models by Misleading Them [5.5] 大規模言語モデル (LLM) とビジョン言語モデル (VLM) は様々な推論タスクを実行できる。
我々は,LLM/VLMが抽象的推論を行うかどうかを調べるために,新しい実験手法であるMisleading Fine-Tuning(MisFT)を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:54:42 GMT)
Sample-Efficient Bayesian Transfer Learning for Online Machine Parameter Optimization [5.5] この研究は、acBOアルゴリズムを用いてシステム自体のマシンパラメータを最適化する手法を導入する。
既存のマシンデータを活用することで、最小限のイテレーションで最適点を特定するために、転送学習アプローチを使用する。
実世界における金属板の切削用レーザ機へのアプローチを検証した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:08:17 GMT)
Lower Bounds for Chain-of-Thought Reasoning in Hard-Attention Transformers [5.5] 整合推論とスクラッチパッドは、変換器の計算能力を高める重要なツールとして登場した。
本研究では,異なるアルゴリズム問題にまたがるCoTステップ数に対する体系的下界の研究を開始する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:52:20 GMT)
GAIR: Improving Multimodal Geo-Foundation Model with Geo-Aligned Implicit Representations [5.4] マルチモーダルなGeoFM開発における主要な課題は、モダリティ間の地理空間関係を明示的にモデル化することである。
オーバヘッドRSデータ,ストリートビュー画像,それらの位置情報メタデータを統合した,新しいマルチモーダルなGeoFMアーキテクチャであるGAIRを提案する。
GAIRは、RS画像ベース、SV画像ベース、位置埋め込みベースベンチマークにまたがる10の空間的タスクにまたがって評価される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:59:39 GMT)
Visualizing Privacy-Relevant Data Flows in Android Applications [5.4] SliceVizは、バックエンドのソースコードで検出されたすべてのプライバシ関連データソースをスライスすることで、Androidアプリを分析するツールである。
SliceVizは,Androidアプリのプライバシ関連プロパティを効果的に識別する上で有効であることを示す12人の参加者を対象に,ユーザスタディを実施した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:47:02 GMT)
Unify and Triumph: Polyglot, Diverse, and Self-Consistent Generation of Unit Tests with LLMs [5.4] PolyTestは、ポリグロットと温度制御の多様性を活用することによって、テスト生成を強化する新しいアプローチである。
PolyTestは、テストセットを統一し、自己整合を育み、全体的なテスト品質を改善することで、一貫性を緩和する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:47:06 GMT)
Logic Explanation of AI Classifiers by Categorical Explaining Functors [5.3] 本稿では,抽出された説明のコヒーレンスと忠実性を確保するための理論的基礎的アプローチを提案する。
概念実証として,合成ベンチマークを用いて提案した理論構造を検証した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:50:06 GMT)
Deterministic Reservoir Computing for Chaotic Time Series Prediction [5.3] そこで我々は,高次元マッピングであるTCRC-LMとTCRC-CMに代えて決定論的手法を提案する。
時系列予測のタスクにおける予測能力をさらに強化するために,ロバチョフスキー関数を非線形活性化関数として新規に活用することを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:46:37 GMT)
A Survey of the Self Supervised Learning Mechanisms for Vision Transformers [5.2] 視覚タスクにおける自己教師あり学習(SSL)の適用は注目されている。
SSL手法を体系的に分類する包括的分類法を開発した。
SSLの背後にあるモチベーションについて議論し、人気のある事前トレーニングタスクをレビューし、この分野の課題と進歩を強調します。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:10:51 GMT)
Self-Learning-Based Optimization for Free-form Pipe Routing in Aeroengine with Dynamic Design Environment [5.1] 本研究では,航空工学における自由形パイプルーティングを最適化するための自己学習方式(SLPR)を提案する。
SLPR内のエージェントは、パイプルーティングを反復的に洗練し、環境との相互作用を通じて設計知識を蓄積する。
静的設計環境と動的設計環境の両方において、SLPRはパイプ長の削減、レイアウト規則の順守、経路の複雑さ、計算効率の点で3つの代表的ベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:45:13 GMT)
Multi-View Pose-Agnostic Change Localization with Zero Labels [5.0] 複数の視点から情報を統合したラベルのないポーズに依存しない変化検出手法を提案する。
ポストチェンジシーンの5つの画像で、我々のアプローチは3DGSで追加の変更チャンネルを学習できる。
変更対応の3Dシーン表現により、見当たらない視点の正確な変更マスクの生成が可能となる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:35:49 GMT)
Probabilistic Prompt Distribution Learning for Animal Pose Estimation [5.0] 多種の動物のポーズ推定は、視覚的な多様性と不確実性によって妨げられ、難しいが重要な課題として現れてきた。
本稿では,ビジョン・ランゲージ事前学習モデル(例えばCLIP)を効率的に学習することで,これらの課題に対処する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:06:26 GMT)
The Text Classification Pipeline: Starting Shallow going Deeper [5.0] 過去10年間、ディープラーニングはテキスト分類に革命をもたらした。
英語は、アラビア語、中国語、ヒンディー語などを含む研究にもかかわらず、主要言語である。
この研究は、伝統的および現代のテキストマイニング方法論を統合し、テキスト分類の全体的理解を促進する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:18:07 GMT)
JPEG Inspired Deep Learning [5.0] 精巧なJPEG圧縮は、ディープラーニング(DL)の性能を実際に向上させる
トレーニング可能なJPEG圧縮層で基盤となるDNNアーキテクチャをプリペイドする新しいDLフレームワークであるJPEG-DLを提案する。
私たちのコードはhttps://github.com/AhmedHussKhalifa/Inspired-DL.gitで利用可能です。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 22:43:27 GMT)
Do image and video quality metrics model low-level human vision? [5.0] 低レベルの人間の視力のいくつかの側面をモデル化する能力について検討する。
私たちはテストを使って、33の既存の画像およびビデオ品質メトリクスを分析し、その長所と短所を見つけます。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:57:25 GMT)
Improving Autoregressive Image Generation through Coarse-to-Fine Token Prediction [4.9] 自己回帰モデリングをより困難にすることなく、大規模なコードブックのメリットを享受する方法を示す。
本フレームワークは,(1)各トークンの粗いラベルを逐次予測する自己回帰モデル,(2)粗いラベルに条件付けられた全てのトークンの細粒度ラベルを同時に予測する補助モデル,の2段階からなる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:41:29 GMT)
InCo-DPO: Balancing Distribution Shift and Data Quality for Enhanced Preference Optimization [4.9] InCo-DPOを提案する。これは、オン・ポリティクスとオフ・ポリティクス・データを統合することにより、選好データを効率的に合成する方法である。
InCo-DPOは、オフポリティデータにおける分散シフトの制限と、オンポリティデータの品質制約を克服する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:05:36 GMT)
Only a Little to the Left: A Theory-grounded Measure of Political Bias in Large Language Models [4.9] プロンプトベースの言語モデルにおける政治的バイアスは、パフォーマンスに影響を与える可能性がある。
我々は、インプットプロンプトを多種多様にテストし、迅速な感度を考慮しつつ、サーベイ設計原則に基づいて構築する。
政治的偏見のプロファイルを様々な急激なバリエーションで計算し、政治的偏見の尺度が不安定であることに気付く。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:51:06 GMT)
Feature selection strategies for optimized heart disease diagnosis using ML and DL models [4.9] 本研究では,様々な機械学習(ML)モデルとディープラーニング(DL)モデルの予測性能に及ぼす特徴選択手法の影響を評価する。
11種類のML/DLモデルを精度,リコール,AUCスコア,F1スコア,精度などの指標を用いて評価した。
結果は、特にニューラルネットワークのような高度なモデルにおいて、MIが他の手法よりも優れていたことを示している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:59:01 GMT)
Manifold learning in metric spaces [4.8] Laplacian-based method is popular for dimensionality reduction of data lying in $mathbbRN$。
グラフラプラシアンの点収束に対して、計量が十分条件を満たすとき、多様体学習の問題を計量空間に一般化する枠組みを提供する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:37:40 GMT)
Communication Efficient Federated Learning with Linear Convergence on Heterogeneous Data [4.8] 我々はFedCETと呼ばれるフェデレーション学習アルゴリズムを提案し、不均一なデータ分布下での正確な収束を保証する。
適切な学習率で、FedCETは正確な解に線形収束を保証できることを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:43:02 GMT)
Neural Networks Trained by Weight Permutation are Universal Approximators [4.6] 本研究では,一次元連続関数の近似にReLUネットワークを誘導する置換に基づく学習手法を提案する。
重み調整中の顕著な観察は、置換訓練がネットワーク学習行動を記述する革新的なツールとなることを示唆している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:05:26 GMT)
Deep Q-Learning with Gradient Target Tracking [4.5] 本稿では,勾配目標追跡を用いたQ-ラーニングを提案する。
従来のハードアップデートパラダイムの代替として、学習した継続的ターゲット更新メカニズムを提供する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 20:46:25 GMT)
Active management of battery degradation in wireless sensor network using deep reinforcement learning for group battery replacement [4.5] 無線センサネットワーク(WSN)は、構造健康モニタリング(SHM)のための有望なソリューションとなっている
バッテリー駆動のWSNは有線システムに対して様々な利点があるが、バッテリー寿命の制限は常にWSNの実用化における最大の障害の1つだ。
本研究では,WSNのデューティサイクルをシステムレベルで最適化することにより,アクティブな電池劣化管理のための深層強化学習(DRL)手法について検討する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:36:33 GMT)
Sequential Spatial-Temporal Network for Interpretable Automatic Ultrasonic Assessment of Fetal Head during labor [4.5] ISUOGが確立した部内超音波ガイドは、胎児の頭部下降を評価するための重要な指標として、進行角(AoP)と頭部生理距離(HSD)を強調している。
SSTN(Sequential Spatial-Temporal Network)は,パートム内超音波解析の映像に特化して設計された最初の解釈可能なモデルである。
SSTNはまず超音波平面を識別し、その後、パビック症状や胎児の頭部などの解剖学的構造を分類し、最後にHSDとAoPの正確な測定のための重要なランドマークを検出する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:33:59 GMT)
Meta-Learning Neural Mechanisms rather than Bayesian Priors [4.5] フォーマルな言語のメタラーニングについて検討し、従来の主張に反してメタトレーニングモデルは単純さに基づく事前学習をしていないことを発見した。
メタトレーニングが、下流タスクにおけるネットワークの認知的プリミティブのように機能するニューラルメカニズムをモデルにインプリントする証拠を見つける。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:33:59 GMT)
AirRoom: Objects Matter in Room Reidentification [4.4] AirRoomは、多レベルオブジェクト指向情報を統合するオブジェクト認識パイプラインである。
AirRoomは、ほぼすべての評価指標で最先端(SOTA)モデルを上回っている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 01:13:23 GMT)
Rapid patient-specific neural networks for intraoperative X-ray to volume registration [4.3] 2D/3D登録のための患者固有のニューラルネットワークをトレーニングするための、完全に自動化されたフレームワークであるxvrを提案する。
xvrは、物理に基づくシミュレーションを使用して、患者の術前のボリューム画像から豊富な高品質なトレーニングデータを生成する。
実X線データに対する2D/3D登録アルゴリズムの最大評価を行い、xvrが多種多様なデータセットにわたって頑健に一般化されることを見出した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:33:45 GMT)
Adaptive Group Policy Optimization: Towards Stable Training and Token-Efficient Reasoning [4.3] 本稿では,2つの単純かつ効果的な修正を含む適応グループ政策最適化(AGPO)を提案する。
実験により,本手法は推論ステップにおいてトークンを著しく少なく,より安定したトレーニングと同等あるいは優れたパフォーマンスを実現することが実証された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:48:57 GMT)
Adaptive variational quantum dynamics simulations with compressed circuits and fewer measurements [4.3] AVQDS(T)と呼ばれる適応変分量子力学シミュレーション(AVQDS)法の改良版を示す。
このアルゴリズムは、変分力学の精度の尺度であるマクラクラン距離を一定しきい値以下に保つために、アンザッツ回路に不連結なユニタリゲートの層を適応的に加算する。
また、雑音耐性を増強した変動パラメータに対する線形運動方程式を解くために、固有値トランケーションに基づく手法を示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:30:17 GMT)
Exponentially Consistent Nonparametric Linkage-Based Clustering of Data Sequences [4.3] 我々は、未知の分布から生成されたM$独立かつ同一の(d.d.)データ列の非パラメトリッククラスタリングを考える。
M$のデータシーケンスの分布は、基礎となる分散クラスタの$K$に属する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:31:53 GMT)
Securing Satellite Communications: Real-Time Video Encryption Scheme on Satellite Payloads [4.3] 本研究では,2つの1次元カオスマップを用いてビデオの暗号化を行う手法を提案する。
衛星実験により、我々の計画が複雑な衛星環境に適していることが確認された。
Raspberry Pi 4Bの実験では、異常なリアルタイム性能と低消費電力が示されている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:14:14 GMT)
Turning Up the Heat: Min-p Sampling for Creative and Coherent LLM Outputs [4.1] 大規模言語モデル(LLM)は、各復号ステップにおける語彙上の確率分布から次のトークンをサンプリングしてテキストを生成する。
本稿では,トップトークンの確率をスケーリング係数として利用して,モデルの信頼度に基づいてサンプリングしきい値を調整する動的トランケーション手法であるmin-pサンプリングを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:39:39 GMT)
Advancing Problem-Based Learning in Biomedical Engineering in the Era of Generative AI [4.1] 問題ベースラーニング(PBL)は2000年代初頭に導入されて以来、バイオメディカルエンジニアリング(BME)教育に大きな影響を与えてきた。
2024年のノーベル賞によるAIの認定を含む最近の進歩は、バイオメディカルAIにおいて学生を包括的に訓練することの重要性を強調している。
バイオメディカルAI教育に特化した高度なフレームワークの実装を目的として,3年間のケーススタディを行った。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 00:52:02 GMT)
Automated Requirements Relation Extraction [4.1] 本章は、自然言語に基づく関係抽出の分野における理論的・実践的基礎について、明確な視点を提供することを目的とする。
まず、最も一般的な要求関係型を含む分野における最も関連性の高い文献に基づいて、要求関係の基礎について述べる。
章の中核は、(i)均衡関係の識別と分類のための自然言語技術(syntactic vs. semantic techniques)と(ii)関係抽出作業のための情報抽出方法の2つのセクションから構成される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:30:25 GMT)
Neurosymbolic Architectural Reasoning: Towards Formal Analysis through Neural Software Architecture Inference [4.0] これらのアーキテクチャに対する後続のシンボリック推論のために、形式的アーキテクチャ定義を持つという問題を解決するために、ニューラルアーキテクチャ推論の概要を述べる。
本稿では,本手法が一般にどのように機能するかを論じ,対処すべき6つの総合的な研究課題を概説する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:56:54 GMT)
The Cooperative Network Architecture: Learning Structured Networks as Representation of Sensory Patterns [4.0] 協調ネットワークアーキテクチャ(Cooperative Network Architecture, CNA)は,ニューロンの構造的, 繰り返し接続されたネットワークを用いて, 知覚信号を表すモデルである。
我々は、ネットフラグメントを監督なしに学習し、フレキシブルに組み換えることで、新しいパターンをエンコードし、フィギュア補完とノイズに対するレジリエンスを可能にすることを実証した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 20:44:23 GMT)
TAET: Two-Stage Adversarial Equalization Training on Long-Tailed Distributions [4.0] 現実のアプリケーションにディープニューラルネットワークをデプロイする上で、敵の堅牢性は重要な課題である。
本稿では,初期安定化フェーズと階層化された逆トレーニングフェーズを統合した新しいトレーニングフレームワークTAETを提案する。
提案手法は既存の先進防衛を超越し,メモリと計算効率の両面で大幅な改善を実現している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:49:42 GMT)
Utilizing Reinforcement Learning for Bottom-Up part-wise Reconstruction of 2D Wire-Frame Projections [3.9] この作業は、画像平面に投影された任意の3Dワイヤフレームモデルのすべてのエッジを再構築する作業に、それ自体が関係している。
本稿では,RLエージェントが行う2次元多部オブジェクトの分割と再構成のためのボトムアップ部分処理について検討する。
各ステップにおいて、エージェントは、4次元のアクション空間内で再構成ラインを変換したり、特定の終了アクションを用いてエピソードを終了することができる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:34:57 GMT)
ChatGPT as a Solver and Grader of Programming Exams written in Spanish [3.9] 我々はChatGPTの能力を評価し、実際のプログラミング試験を解き、評価する。
我々の研究結果は、このAIモデルは単純なコーディングタスクを解くのにのみ有効であることを示唆している。
複雑な問題に対処する能力や、他の人によって書かれたソリューションを評価する能力は、決して効果的ではない。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:11:30 GMT)
DNA Bench: When Silence is Smarter -- Benchmarking Over-Reasoning in Reasoning LLMs [3.9] Don't Answer Bench (DNA Bench)は、大規模言語モデル(LLM)を評価するための新しいベンチマークである。
DNAベンチは150個の逆向きに設計されたプロンプトから構成されており、人間が理解し、反応しやすくなっている。
我々の実験により、RTMは必要以上に最大70倍のトークンを生成し、より単純な非推論モデルがより高精度で効率的に処理するタスクに失敗することが判明した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:19:14 GMT)
Video-VoT-R1: An efficient video inference model integrating image packing and AoE architecture [3.9] 本稿では,KunLunBaize-VoT-R1ビデオ推論モデルを提案する。
実験により、このモデルは複数のテストにおいて卓越した性能を示し、ビデオ言語理解のための新しいソリューションを提供する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:50:57 GMT)
How accurate is mechanobiology? A statistical test of cell force [3.8] マイクロスケールの力はしばしば、トラクションフォース顕微鏡のような逆問題を用いて間接的に測定される。
生物学や物理学の実験的性質とは対照的に、これらの測定には誤差バーや信頼領域、p値は含まれない。
このことは、一見抽象的な実験的質問の仮説検証の扉を開くことを示します。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:53:20 GMT)
Synthetic half-integer magnetic monopole and single-vortex dynamics in spherical Bose-Einstein condensates [3.8] ボースガス中の半整数型モノポールをシミュレートし,球面上の渦ダイナミクスについて検討した。
剛性単極渦構造を仮定して,外部磁場中の渦軌道を解析的に予測する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 01:50:25 GMT)
Event Soliton Formation in Mixed Energy-Momentum Gaps of Nonlinear Spacetime Crystals [3.7] 非線形フォトニック時空結晶におけるイベントソリトンと呼ばれる新しいソリトンの形成について報告する。
非線形性の下では、事象ソリトンは時空エネルギー領域とモメンタム領域の両方において完全に局所化された実体として現れる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:00:56 GMT)
Stochastic tensor space feature theory with applications to robust machine learning [3.7] テンソル空間に基づくマルチレベル直交部分空間(MOS)カーフン・ローブ特徴量理論を開発する。
私たちのキーとなる観察は、個別の機械学習クラスは、主に異なる部分空間に存在することができるということです。
血漿データセット(アルツハイマー病神経画像イニシアチブ)の検査では、精度が劇的に向上した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:32:40 GMT)
SenseExpo: Efficient Autonomous Exploration with Prediction Information from Lightweight Neural Networks [3.6] SenseExpoは、軽量な予測ネットワークに基づく効率的な自律探査フレームワークである。
我々の最小モデルでは、U-netやLaMaよりもKTHデータセットの性能が向上している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:07:51 GMT)
Conjuring Positive Pairs for Efficient Unification of Representation Learning and Image Synthesis [3.6] Unified Self-Supervised Learning (SSL)メソッドは、表現学習と生成モデリングのギャップを埋める。
最近のUnified SSLメソッドは、トレーニング中に外部トークン化器を必要とするセマンティックトークン再構成のみに依存している。
本稿では,新しい統合SSLフレームワークであるSorcenについて紹介する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:09:59 GMT)
KunlunBaize: LLM with Multi-Scale Convolution and Multi-Token Prediction Under TransformerX Framework [3.6] 大規模言語モデルは、計算効率の低下、勾配の消失、複雑な特徴の相互作用を捉えることの難しさといった課題に直面している。
このフレームワークは、学習可能な残留スキップ接続機構、TransformerXモジュール、マルチスケールの畳み込みと適応アクティベーション機能を統合したトランスフォーマーベースのコンポーネント、マルチトークン予測相互作用モジュールを備えている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:04:01 GMT)
Navigating Demand Uncertainty in Container Shipping: Deep Reinforcement Learning for Enabling Adaptive and Feasible Master Stowage Planning [3.6] 強化学習(RL)は様々な最適化問題を解く上で有望である。
本研究では,コンテナの出荷におけるRLの利用に焦点を合わせ,マスタ・ストージ・プランニングにおける重要な課題に対処する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:18:36 GMT)
Nonparametric Bellman Mappings for Value Iteration in Distributed Reinforcement Learning [3.5] 本稿では,分散強化学習(DRL)における値反復(VI)のためのベルマン写像(B-Maps)を提案する。
B-マップは核ヒルベルト空間で表されるQ-函数で作用し、非パラメトリックな定式化を可能にする。
2つのよく知られた制御問題に関する数値実験は、提案した非パラメトリックB-マップの優れた性能を示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:39:21 GMT)
Control Pneumatic Soft Bending Actuator with Online Learning Pneumatic Physical Reservoir Computing [3.5] Reservoir Computing (RC) は, ソフトアクチュエータなどの非線形システムを制御するオンライン学習システムにおいて, 有効性を示した。
本稿では,空気圧軟屈曲アクチュエータの動作を制御するPRCベースのオンライン学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:09:46 GMT)
Efficient ANN-Guided Distillation: Aligning Rate-based Features of Spiking Neural Networks through Hybrid Block-wise Replacement [3.5] スパイキングニューラルネットワーク(SNN)は、ニューラルネットワーク(ANN)の代替としてかなりの注目を集めている。
最近の研究は、大規模データセットにおけるSNNの可能性を強調している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:04:38 GMT)
Beyond the Visible: Multispectral Vision-Language Learning for Earth Observation [3.5] Llama3-MS-CLIPは、大規模なマルチスペクトルデータセット上で、コントラスト学習で事前訓練された最初の視覚言語モデルである。
我々は,100万個のSentinel-2サンプルからなるマルチスペクトルデータに対して,これまでで最大の画像キャプチャーデータセットを提案する。
Llama3-MS-CLIPを多スペクトルゼロショット画像分類と3つの複雑さのデータセットを用いた検索で評価した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:13:31 GMT)
Cultural Alignment in Large Language Models Using Soft Prompt Tuning [3.4] 大規模言語モデル(LLM)のアライメントは、従来は教師付き微調整や強化学習に基づくアライメントフレームワークに依存していた。
入力プロンプトの埋め込みを変更しながらモデルパラメータを凍結するソフトプロンプトチューニングと差分進化(DE)を組み合わせたパラメータ効率的な手法を提案する。
本手法は, LLama-3-8B-Instructの文化的次元において, 複数の領域にわたる顕著な改善を示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:34:01 GMT)
Federated Quantum-Train Long Short-Term Memory for Gravitational Wave Signal [3.4] 本稿では,QT(Quantum-Train)方法論とLong Short-Term Memory(LSTM)ネットワークを組み合わせた新しいフレームワークであるFederated QT-LSTMについて述べる。
トレーニング中に量子ニューラルネットワーク(QNN)を利用して古典的なLSTMモデルパラメータを生成することで、このフレームワークはモデル圧縮、スケーラビリティ、計算効率の課題を効果的に解決する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:34:13 GMT)
Rapid quantum ground state preparation via dissipative dynamics [3.3] 散逸は量子系の低エネルギー状態を作るための有望なアプローチとなっている。
しかし、散逸的プロトコルのポテンシャルは、通勤するハミルトニアン以外には明らかでない。
この研究は、非可換ハミルトニアンの基底状態を作成するための散逸の力に関する重要な分析的および数値的な洞察を提供する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:27:52 GMT)
Hydrodynamics as the effective field theory of strong-to-weak spontaneous symmetry breaking [3.3] 大域的U(1)対称性における自発対称性の破れに対する有効場理論を構築する。
我々は、流体力学は破壊された強い対称性の「超流動性」の理論として理解することができると結論付けた。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:07:40 GMT)
Constraint Phase Space Formulations for Finite-State Quantum Systems: The Relation between Commutator Variables and Complex Stiefel Manifolds [3.3] 我々は最近,有限状態量子系に対するテキスト制約座標-モメンタムテクトフェーズ空間(CPS)の定式化を開発した。
CPSは、スピン/ボソン/フェルミオンの非断熱遷移力学と多体量子力学の両方のシミュレーションに影響を及ぼす。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:52:38 GMT)
GauRast: Enhancing GPU Triangle Rasterizers to Accelerate 3D Gaussian Splatting [3.3] 3D Gaussian Splatting (3DGS)は高品質な3Dレンダリング手法である。
3DGSを加速するためのこれまでの取り組みは、相当な統合オーバーヘッドとハードウェアコストを必要とする専用のアクセラレータに依存していた。
本研究では、3DGSパイプラインと高度に最適化された従来のグラフィックスパイプラインの類似性を活用する加速度戦略を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:54:05 GMT)
Enhanced quantum sensing in time-modulated non-Hermitian systems [3.3] 本稿では, 時間変調型NHシステムにおいて, 量子センシングの高度化を実現するための2つの理論スキームを提案する。
固有値に基づく量子センサは、従来のヘルミタンセンサに比べて9.21倍改善されている。
固有状態に基づく量子センサでは、拡張は従来のヘルミタンセンサーの最大50倍に達する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:11:03 GMT)
SALT: Singular Value Adaptation with Low-Rank Transformation [3.2] 大きな基礎モデルはかなりの柔軟性を提供するが、これらのモデルを微調整するコストは依然として大きな障壁である。
トレーニング可能なスケールとシフトパラメータを用いて,最も影響力のある特異値を選択的に適応するSALTを提案する。
このハイブリッドアプローチはLoRAとSVDの両方の利点を活用し、モデルのサイズや深さを増すことなく効果的な適応を可能にする。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:42:41 GMT)
Chem42: a Family of chemical Language Models for Target-aware Ligand Generation [3.2] Chem42は、生成化学言語モデルの最先端のファミリーである。
分子構造、相互作用、結合パターンの洗練されたクロスモーダル表現を実現する。
有効な薬物候補の探索スペースを減らすことで、Chem42は薬物発見パイプラインを加速することができる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:07:30 GMT)
Distributed Learning over Arbitrary Topology: Linear Speed-Up with Polynomial Transient Time [3.2] ピアツーピア通信によるローカルコスト関数の和を協調的に行う分散学習問題について検討する。
本稿では、一般的な通信グラフから抽出した2本の木を用いて、モデルパラメータとパラメータの両方を分散するSpanning Tree Push-Pull(STPP)を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:11:44 GMT)
PSA-MIL: A Probabilistic Spatial Attention-Based Multiple Instance Learning for Whole Slide Image Classification [3.1] Whole Slide Images (WSI) は医療診断に広く用いられている高解像度デジタルスキャンである。
本稿では,空間コンテキストをアテンション機構に統合する新しいアテンションベースMILフレームワークであるPSA-MILを提案する。
我々は、文脈ベースラインと文脈ベースラインの両方で最先端のパフォーマンスを実現し、計算コストを大幅に削減した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:12:42 GMT)
Theoretical Insights into Line Graph Transformation on Graph Learning [3.1] 線グラフ変換はグラフ理論において広く研究されており、線グラフの各ノードは元のグラフのエッジに対応する。
これは、変換された線グラフに適用された一連のグラフニューラルネットワーク(GNN)にインスピレーションを与え、様々なグラフ表現学習タスクに有効であることが証明された。
本研究では,Weisfeiler-Leman (WL) テストに挑戦することが知られている2種類のグラフ,Cai-F"urer-Immerman (CFI) グラフと強い正則グラフに着目した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:28:31 GMT)
GraPLUS: Graph-based Placement Using Semantics for Image Composition [3.0] 本稿では,画像中のプラプティブルなオブジェクト配置のための新しいフレームワークであるGraPLUS(Graph-based Placement Using Semantics)を提案する。
本手法は,文脈的に適切な対象位置を決定するために,グラフ構造化シーン表現と意味理解を一意に結合する。
GraPLUSの配置精度は92.1%、FIDスコアは28.83であり、競合する視覚的品質を維持しつつ、最先端の手法を8.1%上回っている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 00:43:29 GMT)
Unimodal Distributions for Ordinal Regression [3.0] 予測モデルに一助分布の選好を組み込むための2つの新しいアプローチを提案する。
確率的単純性における一様分布の集合を解析し、基本的性質を確立する。
次に、一様分布を課す新しいアーキテクチャと、一様性を促進する集合における射影の概念に依存する新しい損失項を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 01:06:45 GMT)
Disentangling Uncertainties by Learning Compressed Data Representation [3.0] 本稿では、データ分布のニューラルネットワーク符号化を学習し、出力分布からの直接サンプリングを可能にするフレームワークを提案する。
提案手法では,ランジュバンの動的サンプリングに基づく新しい推論手法を導入し,任意の出力分布をCDRMで予測する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:37:48 GMT)
Input-Triggered Hardware Trojan Attack on Spiking Neural Networks [3.0] ニューロモルフィックコンピューティングのための新しい入力トリガーハードウェアトロイの木馬攻撃を提案する。
この攻撃は、ニューロモルフィックコミュニティで人気のある3つのベンチマークのシミュレーションによって説明されている。
また、アナログスパイクニューロンとデジタルSNNアクセラレータのハードウェア実装を提案し、HTには無視可能な領域と電力フットプリントがあることを実証した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:24:30 GMT)
Continuous-time quantum optimisation without the adiabatic principle [2.9] 最適化問題に対する連続時間量子アルゴリズムは、これまで断熱原理によって動機付けられてきた。
我々はプランクの原理を、連続時間量子アルゴリズムの基盤となる物理的動機として捉えている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:32:24 GMT)
AUV Acceleration Prediction Using DVL and Deep Learning [2.9] 本稿では,過去のDVL速度測定に基づいて,AUV加速ベクトルを推定するエンド・ツー・エンドのディープラーニング手法を提案する。
海洋実験から得られたデータをもとに,提案手法は加速ベクトル推定を65%以上改善することを示した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:33:47 GMT)
GAN-enhanced Simulation-driven DNN Testing in Absence of Ground Truth [2.9] シミュレーションによる合成入力の生成は、安全クリティカルシステムのためのディープニューラルネットワーク(DNN)コンポーネントの費用対効果テストに不可欠である。
多くのアプリケーションにおいて、シミュレーターは自動テストオラクルに必要な地平線データを生成することができない。
本稿では,計算機ビジョンのDNNに対して,シミュレータの忠実性を確保するために生成ネットワークを統合した入力生成手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:49:10 GMT)
Coupling deep and handcrafted features to assess smile genuineness [2.9] 本稿では,長期記憶ネットワークが学習した特徴と,顔の動作単位のダイナミクスを捉えるために手作りした特徴を組み合わせることを提案する。
実験の結果,提案手法はベースライン手法よりも有効であることが示唆された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:24:02 GMT)
Data Spatial Programming [2.8] オブジェクト指向プログラミング(OOP)のセマンティクスを拡張する新しいプログラミングモデルであるデータ空間プログラミングを導入する。
空間におけるデータ要素間の関係を形式化することにより、我々のアプローチは複雑なシステムのより直感的なモデリングを可能にする。
このパラダイムは、動的に進化するネットワーク、エージェントベースのシステム、その他の空間指向の計算問題を表現する際に、従来のOOPの制限に対処する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:55:40 GMT)
Code Evolution Graphs: Understanding Large Language Model Driven Design of Algorithms [2.8] 大規模言語モデル(LLM)はコード生成において大きな可能性を証明しています。
3つのベンチマーク問題クラスの結果を示し、新しい知見を示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:30:22 GMT)
Beam Spliter and Localization Induced by Controlled Perturbations after Time Boundary [2.8] 時間境界における屈折・反射現象の最近の研究は、かなりの学術的関心を集めている。
我々は、特別に調整された駆動力によって外部制御が可能な時間境界効果を導出した。
次に、格子のホッピングパラメータを経時的に摂動させることによって誘起される時間屈折と反射のビーム分裂現象を明らかにする。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:43:37 GMT)
DIPLI: Deep Image Prior Lucky Imaging for Blind Astronomical Image Restoration [2.8] アストロフォトグラフィーは、訓練データに制限があるため、ディープラーニングに固有の課題を提示する。
この研究は、ブラインドトレーニングを促進するが過度に適合する可能性のあるDeep Image Prior(DIP)モデルのようなハイブリッド戦略を探求する。
本稿では,DIPモデルのベースライン性能を改良する手法を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:33:16 GMT)
Out-of-Distribution Recovery with Object-Centric Keypoint Inverse Policy for Visuomotor Imitation Learning [2.7] 本稿では,自覚的政策学習におけるOCR(object-centric recovery)フレームワークを提案し,アウト・オブ・ディストリビューション(OOD)シナリオの課題に対処する。
連続学習のためのデモンストレーションを自律的に収集するOCRの能力を示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:03:15 GMT)
2DSig-Detect: a semi-supervised framework for anomaly detection on image data using 2D-signatures [2.7] 本稿では,2DSig-Detectと呼ばれる画像における異常検出のための新しい手法を提案する。
画像中の対向摂動の存在を検出するために,優れた性能と時間の短縮が示される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:03:39 GMT)
Universal approximation property of neural stochastic differential equations [2.6] 局所的に一様に固定された大域的線形成長制約を受ける連続関数を近似できるニューラルネットワークの様々なクラスを同定する。
そのようなニューラルネットワークに対して、関連するニューラルネットワーク微分方程式は、伊藤拡散型の一般微分方程式を任意に近似することができる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 20:34:23 GMT)
Binary-Integer-Programming Based Algorithm for Expert Load Balancing in Mixture-of-Experts Models [2.6] 2進整数プログラミング(BIP)に基づく負荷分散アルゴリズムであるBIPに基づくバランシングを提案する。
16-expert (0.3B) と 64-expert (1.1B) の2つのMoE言語モデルにアルゴリズムを実装した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:10:27 GMT)
Uncovering Latent Chain of Thought Vectors in Language Models [2.6] 言語モデル(LM)の活性化空間における標的摂動は複雑な推論パターンを符号化できることを示す。
我々は,LMの活性化から導かれる操舵ベクトルを推定時間中にLMに注入し,これらのベクトルが自然言語のプロンプトを必要とせずに,LMのChain-of-Thought(CoT)推論を誘導できるかどうかを検討する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 20:41:32 GMT)
Generalized Clausius inequalities and entanglement production in holographic two-dimensional CFTs [2.6] 量子零エネルギー条件 (QNEC) を用いて, クエンチの非可逆エントロピー生成における下界と上界の両方を得ることができることを示す。
また,任意の初期温度および最終温度および運動量密度に対するエンタングルメントエントロピーの成長と熱化について検討した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:23:56 GMT)
Non-Markovian Relaxation Spectroscopy of Fluxonium Qubits [2.6] 超伝導量子ビットにおける寄生二層系(TLS)は、量子ビット自体よりも緩和時間が長い。
本稿では,キュービットと環境緩和を同時に効率的に探究する手法である2時間緩和法を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:43:56 GMT)
Self-supervised New Activity Detection in Sensor-based Smart Environments [2.5] 我々は、新しいアクティビティ検出のための多様なデータ拡張を伴うコントラスト学習を利用するモデルであるCLANを紹介する。
CLANは時間領域と周波数領域の両方を組み込んでおり、多面的識別表現の学習を可能にしている。
CLANは、最高のパフォーマンスのベースラインモデルと比較して、AUROCの9.24%の改善を実現している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:01:44 GMT)
Carbyne: An Ultra-Lightweight DoS-Resilient Mempool for Bitcoin [2.5] ブルームフィルタの変種を利用したトランザクションプールの新しい最適化であるNeonpoolを提案する。
ネオンプールは最大200MB(例えば400MBから2MB)のメモリ消費を劇的に削減し、99.99%のトランザクション処理精度を維持している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:03:13 GMT)
Probabilistic Quantum SVM Training on Ising Machine [2.4] 我々はコヒーレントイジングマシン(CIM)に適した確率論的量子SVMトレーニングフレームワークを提案する。
我々はバッチ処理とマルチバッチアンサンブル戦略を採用し、小規模の量子デバイスがより大きなデータセット上でSVMをトレーニングできるようにする。
本手法は,バイナリおよびマルチクラスデータセットのシミュレーションおよび実機実験により検証する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:20:26 GMT)
HiQ-Lip: The First Quantum-Classical Hierarchical Method for Global Lipschitz Constant Estimation of ReLU Networks [2.4] ニューラルネットワークのグローバルリプシッツ定数の推定は、その堅牢性と一般化能力の理解と改善に不可欠である。
我々は,コヒーレントイジングマシン(CIM)を利用したハイブリッド量子古典的階層法である textbfHiQ-Lip を提案し,大域リプシッツ定数を推定する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:58:40 GMT)
From Structured Prompts to Open Narratives: Measuring Gender Bias in LLMs Through Open-Ended Storytelling [2.4] 大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、社会的偏見を反映または増幅する傾向について懸念が持たれている。
本研究では, LLMにおけるジェンダーバイアスを明らかにするための新たな評価枠組みを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:15:45 GMT)
Weakly Supervised Contrastive Adversarial Training for Learning Robust Features from Semi-supervised Data [2.4] 既存の敵の訓練方法は、しばしば摂動に悩まされる。
Weakly Supervised Contrastive Adversarial Training (WSCAT)を提案する。
WSCATは、ロバストでない特徴とラベルの相関を乱すことにより、堅牢な特徴の学習を改善するための完全な摂動を保証する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:17:56 GMT)
Who Relies More on World Knowledge and Bias for Syntactic Ambiguity Resolution: Humans or LLMs? [2.4] 本研究では,近年の大型言語モデル (LLM) が,6つの類型的多様言語において,相対的節のアタッチメントのあいまいさをナビゲートする方法について検討する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:35:30 GMT)
Search-based DNN Testing and Retraining with GAN-enhanced Simulations [2.4] 安全クリティカルなシステムでは、ディープニューラルネットワーク(DNN)がコンピュータビジョンタスクの重要なコンポーネントになりつつある。
本稿では,シミュレータを用いて入力空間を探索するメタヒューリスティック検索と,シミュレータが生成したデータをリアルな入力画像に変換するGAN(Generative Adversarial Networks)を組み合わせることを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:43:54 GMT)
Shedding Light in Task Decomposition in Program Synthesis: The Driving Force of the Synthesizer Model [2.4] タスク分解はプログラム合成の基本的なメカニズムであり、複雑な問題を管理可能なサブタスクに分解することができる。
本研究では,ExeDecの適応であるREGISMを開発し,分解誘導を除去し,反復的な実行駆動合成にのみ依存する。
以上の結果から,ExeDecは,その明示的な分解戦略により,長さ一般化や概念構成タスクにおいて有意な優位性を示すことが示唆された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:23:40 GMT)
Isoperimetric Inequalities in Quantum Geometry [2.3] 波動関数のヒルベルト空間における閉経路に対して、量子距離とベリー位相という2つの基本的なマクロ的量子幾何量に関する強い弱不等式を明らかにする。
様々な量子問題における量子幾何学の役割を振り返り、我々の発見が重要な物理量に新しい境界を置くことを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:00:01 GMT)
Privacy-preserving Blockchain-enabled Parametric Insurance via Remote Sensing and IoT [2.3] 簡潔なゼロ知識証明(zk-SNARK)に基づくプライバシー保護パラメトリック保険フレームワークを提案する。
我々は、最近のzk-SNARKを拡張し、複数の異種データソースに対する堅牢なプライバシー保護をサポートする。
概念実証として、現実世界のブロックチェーンプラットフォーム上でパラメトリックブッシュファイア保険の動作プロトタイプを実装しました。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 01:52:35 GMT)
SDF-TopoNet: A Two-Stage Framework for Tubular Structure Segmentation via SDF Pre-training and Topology-Aware Fine-Tuning [2.3] 主な課題は、計算効率を維持しながら位相的正しさを確保することである。
改良されたトポロジ対応セグメンテーションフレームワークである textbfSDF-TopoNet を提案する。
SDF-TopoNetは, 位相的精度と定量的セグメンテーションの指標の両方において, 既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 01:43:59 GMT)
Software Testing for Extended Reality Applications: A Systematic Mapping Study [2.3] 拡張現実性(XR)は、多様なアプリケーションドメインにまたがる新興技術であり、没入的なユーザエクスペリエンスを提供する。
本稿では,XRアプリケーションのソフトウェアテストに関する最初の体系的マッピング研究について述べる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:11:30 GMT)
InhibiDistilbert: Knowledge Distillation for a ReLU and Addition-based Transformer [2.3] インヒビターアテンションは、従来のスケールされたドット積アテンションの行列乗算とソフトマックスアクティベーションの代わりにマンハッタン距離とReLUアクティベーションを採用する。
本研究では,インヒビター機構のトレーニング効率の向上とDistilBERTアーキテクチャの性能評価のためのさらなる調整を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:30:35 GMT)
Learn to Bid as a Price-Maker Wind Power Producer [2.2] 短期的な電力市場に参加する風力発電会社(WPP)は、非散布可能で変動的な生産のため、かなりの不均衡なコストに直面している。
価格設定におけるWPP入札の最適化に文脈情報を活用するオンライン学習アルゴリズムを提案する。
このアルゴリズムの性能は、ドイツの日頭市場とリアルタイム市場の数値シミュレーションを用いて、様々なベンチマーク戦略に対して評価される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:51:37 GMT)
When Less is Enough: Adaptive Token Reduction for Efficient Image Representation [2.2] より価値の低い特徴を、より価値の高いものから再構築できるという考えに基づいて、特徴ユーティリティを決定する新しい方法を提案する。
我々は、オートエンコーダとGumbel-Softmax選択機構を統合することで、この概念を実装した。
本結果は,適応的かつ効率的なマルチモーダルプルーニングに向けた有望な方向を示すものである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:17:08 GMT)
Prediction of Permissioned Blockchain Performance for Resource Scaling Configurations [2.2] スケーリング構成に基づいて,ネットワークの信頼性とスループットを予測する機械学習モデルを提案する。
評価では,予測誤差は1.9%であり,精度が高く,実世界でも適用可能である。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 01:03:54 GMT)
Development of a graph neural network surrogate for travel demand modelling [2.2] 本稿では,グラフニューラルネットワーク(GNN)アーキテクチャを代理モデルとして導入することにより,旅行需要モデリングの分野を推し進める。
GATv3はGCN(Graph Attention Network)の変種で、残余接続による過度なスムーシングを緩和する。
本稿では,回帰に匹敵する数値精度を達成しつつ,予測安定性を向上させる微粒な分類フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:47:07 GMT)
3-D Image-to-Image Fusion in Lightsheet Microscopy by Two-Step Adversarial Network: Contribution to the FuseMyCells Challenge [2.2] マルチビュー光シート顕微鏡は、複数のビューを組み合わせることで3次元解像度を改善するが、同時に複雑さと光子予算を増大させる。
2段階の手順に基づくFuseMyCellsチャレンジへのコントリビューションを提案する。
実験により,本手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:12:01 GMT)
Uncertainty Meets Diversity: A Comprehensive Active Learning Framework for Indoor 3D Object Detection [2.1] 本稿では,室内3次元物体検出のためのアクティブラーニングに関する最初の研究を行い,本課題に適した新しい枠組みを提案する。
提案手法は,不確実性と多様性という2つの重要な基準を取り入れて,アノテーションのための最も曖昧で情報に富んだサンプルを積極的に選択する。
我々は,SUN RGB-D と ScanNetV2 の手法を評価したところ,基準値が大幅に向上し,アノテーション予算の 10% に留まらず,全監督性能の 85% 以上を達成できた。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:12:39 GMT)
Echoes of Power: Investigating Geopolitical Bias in US and China Large Language Models [2.1] 米国と中国の大規模言語モデル(LLM)における地政学的バイアスについて検討する。
両モデルに顕著なバイアスがみられ,イデオロギー的な視点と文化的影響が反映された。
この研究は、LLMが公的な談話を形成する可能性を強調し、AI生成コンテンツを批判的に評価することの重要性を強調している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:53:10 GMT)
A two-stage model leveraging friendship network for community evolution prediction in interactive networks [2.1] 地域社会の発展のタイプと範囲を予測する2段階モデルを提案する。
本モデルでは,進化型と回帰型の多クラス分類を一つのフレームワーク内で統合する。
3つのデータセットに対する実験結果から,提案モデルが他のモデルよりも有意な優位性を示した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:05:36 GMT)
MobilePlantViT: A Mobile-friendly Hybrid ViT for Generalized Plant Disease Image Classification [2.1] 植物病は世界の食料安全保障を著しく脅かす。
深層学習モデルは植物病の同定において顕著な性能を示した。
これらのモデルをモバイルおよびエッジデバイスにデプロイすることは、高い計算要求とリソース制約のため、依然として困難である。
植物病の一般的な分類のために設計された新しいハイブリッドビジョントランスフォーマー(ViT)アーキテクチャであるMobilePlantViTを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:34:02 GMT)
General reproducing properties in RKHS with application to derivative and integral operators [2.0] 最小条件下で合成作用素の組合せのクラスを閉包する再生特性を確立する。
応用として、デリバティブ演算子に保持する再生特性に対する既存の条件を改善する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:58:09 GMT)
Exploring Deep Learning Models for EEG Neural Decoding [2.0] THINGSイニシアチブは46人の被験者による大規模な脳波データセットを提供する。
近年のディープラーニングモデルを用いて,高レベルのオブジェクト特徴を復号化するための本手法の有効性を検証した。
線形モデルでは復号処理が解けず,ディープラーニングモデルはほぼすべて成功していることを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:02:09 GMT)
Efficiently Vectorized MCMC on Modern Accelerators [2.0] 有限状態マシン(FSM)のフレームワークを用いて、$textttvmap$のようなツールでベクトル化する場合の同期オーバーヘッドを回避する方法として、シングルチェーンMCMCアルゴリズムを設計する方法を示す。
我々は、Slice Smpling、HMC-NUTS、Delayed Rejectionなど、FSMとしていくつかの一般的なMCMCアルゴリズムを実装し、最大1桁のスピードアップを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:07:14 GMT)
Redefining Toxicity: An Objective and Context-Aware Approach for Stress-Level-Based Detection [1.9] 本研究は, 毒性検出のための新しい, 客観的, コンテキスト認識の枠組みを紹介する。
我々は、フレームワークの一部として、新しい定義、メートル法、トレーニングアプローチを提案し、その有効性を実証する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:09:01 GMT)
Hierarchical Spatio-Temporal State-Space Modeling for fMRI Analysis [1.9] 実験結果から,脳の分類と回帰作業におけるFST-Mambaモデルの有効性が示唆された。
我々の研究は、脳発見における注意のないシーケンスモデリングの可能性を明らかにしている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:15:02 GMT)
IPO: Your Language Model is Secretly a Preference Classifier [1.9] 人からのフィードバックから強化学習(RLHF)が,大規模言語モデルと人間の嗜好を整合させる主要な手法として登場した。
本稿では、生成言語モデルを選好分類器として活用する代替手法として、Implicit Preference Optimization (IPO)を提案する。
この結果から、IPOを通じてトレーニングされたモデルは、最先端の報酬モデルを使って好みを得られるモデルに匹敵するパフォーマンスを達成できることがわかった。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:52:45 GMT)
Explainable Graph-theoretical Machine Learning: with Application to Alzheimer's Disease Prediction [1.9] アルツハイマー病(AD)は世界中で5000万人に影響を及ぼし、2050年までに1億5200万人を圧倒すると予想されている。
本稿では、個々の代謝脳グラフを構築するために、説明可能なグラフ理論機械学習(XGML)を紹介する。
XGMLは代謝脳グラフを構築し、新しい被験者の8つのAD関連認知スコアを予測するサブグラフを明らかにする。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:13:09 GMT)
Enhancing variational quantum algorithms by balancing training on classical and quantum hardware [1.8] 変分量子アルゴリズム(VQA)は、量子ユーティリティや利点への短期的なルートを提供する可能性がある。
VQAは、基底状態推定のような様々なタスクに対して提案されている。
量子ハードウェアのトレーサビリティとリソースコストには、依然として大きな課題がある。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:17:58 GMT)
Information-Preserved Blending Method for Forward-Looking Sonar Mosaicing in Non-Ideal System Configuration [1.8] 疑わしい情報を含む明確なFLSモザイクは、専門家が膨大な知覚データを扱うのを助けるために要求されている。
以前の作業では、FLSが理想的なシステム構成で機能しているとしか考えていなかった。
興味のある情報を保存できる新たなFLSモザイクブレンディング法を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:33:45 GMT)
Quantum Algorithms for the Pathwise Lasso [1.8] 古典的LARS(Least Angle Regression)パスワイズアルゴリズムに基づく新しい量子高次元線形回帰アルゴリズムを提案する。
我々の量子アルゴリズムは、ペナルティ項が変化するにつれて、完全な正規化パスを提供するが、特定の条件下では、イテレーション毎に2次的に高速である。
我々は、KKT条件の近似バージョンと双対性ギャップにより、LARSアルゴリズムがエラーに対して堅牢であることを証明した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:05:31 GMT)
Towards Automated Semantic Interpretability in Reinforcement Learning via Vision-Language Models [1.8] 視覚言語モデルを用いた意味論的解釈型強化学習(SILVA)について紹介する。
SILVAは、事前学習された視覚言語モデル(VLM)を意味的特徴抽出やポリシー最適化のためのツリーベースモデルに活用する自動化フレームワークである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 21:53:19 GMT)
SoMeR: Multi-View User Representation Learning for Social Media [1.8] ソーシャルメディアのユーザ表現学習は、低次元ベクトル表現におけるユーザの好み、興味、振る舞いを捉えることを目的としている。
本稿では,時間的活動,テキストの内容,プロファイル情報,ネットワークインタラクションを組み込んで総合的なユーザ肖像画を学習するフレームワークであるSoMeRを提案する。
1) 情報操作ドライバアカウントの特定,2) 主要なイベント後のオンライン偏光の測定,3) Reddit のヘイトコミュニティにおける将来のユーザ参加予測の3つのアプリケーションを通じて,SoMeR の汎用性を実証した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 23:54:17 GMT)
Advances in Protein Representation Learning: Methods, Applications, and Future Directions [1.7] タンパク質は複雑な生体分子であり、様々な生物学的過程において中心的な役割を果たす。
タンパク質表現学習(PRL)は、タンパク質データから有意義な計算表現を抽出できる変換的アプローチとして登場した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:16:54 GMT)
WaveFM: A High-Fidelity and Efficient Vocoder Based on Flow Matching [1.6] WaveFMはメル-スペクトログラム条件付き音声合成のためのフローマッチングモデルである。
本モデルは,従来の拡散ボコーダと比較して,品質と効率の両面で優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 20:17:17 GMT)
Limits of trust in medical AI [1.6] AIシステムは信頼でき、信頼性があり、信頼できない。
患者は医療的意思決定のためにAIシステムに頼る必要があるため、臨床実践における関係性への信頼の欠如を生み出す可能性がある。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 20:22:38 GMT)
Towards Lighter and Robust Evaluation for Retrieval Augmented Generation [1.6] 本稿では,RAG幻覚評価のためのオープンウェイトモデルの興味を示す研究を提案する。
我々は、より小さく、量子化されたLCMを用いて、アクセス可能で解釈可能な計量を提供する軽量なアプローチを開発する。
このスコアは、意思決定の信頼性に疑問を呈し、新しいAUCメトリクスを開発するためのしきい値を探ることを可能にする。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:58:32 GMT)
Neuromorphic Cameras in Astronomy: Unveiling the Future of Celestial Imaging Beyond Conventional Limits [1.6] 非同期画素演算と対数光電流変換を利用したニューロモルフィックカメラの高速化とダイナミックレンジの向上
我々は1300mmの地上望遠鏡を用いて、暗く明るい天体源を同時に捉えるニューロモルフィックカメラの能力を実証している。
我々の調査には、月や地球付近を通過する隕石の検出や、極端に高時間分解能の衛星や人為的な破片の検出も含まれています。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:11:29 GMT)
Dialogic Learning in Child-Robot Interaction: A Hybrid Approach to Personalized Educational Content Generation [1.6] 対話学習は、目的と構造化された対話を通じて、教育に対する動機づけと深い理解を促進する。
基礎的なモデルは、子供とロボットのインタラクションに変革をもたらす可能性を提供し、パーソナライズされ、エンゲージメントされ、スケーラブルなインタラクションの設計を可能にする。
子どもとロボットの対話における個人化された教育対話を設計するためのハイブリッドアプローチを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 00:46:10 GMT)
Advancing Time Series Wildfire Spread Prediction: Modeling Improvements and the WSTS+ Benchmark [1.5] 我々は,1日および複数日の入力シナリオに対して,最先端(SOTA)の精度を実現するための様々なモデリング改善を提案する。
先行研究と一致して,時系列入力を用いたモデルが最も精度が高いことが判明した。
当社のベンチマークは、歴史データの年数を2倍にし、地理的範囲を拡大し、我々の知る限り、時系列ベースの山火事拡散予測のための最大の公開ベンチマークである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:36:41 GMT)
GSplatLoc: Grounding Keypoint Descriptors into 3D Gaussian Splatting for Improved Visual Localization [1.4] 軽量なXFeat特徴抽出器から高密度かつ堅牢なキーポイント記述器を3DGSに統合する2段階の手順を提案する。
第2段階では、レンダリングベースの光度ワープ損失を最小限に抑え、初期ポーズ推定を洗練させる。
広く使われている屋内および屋外データセットのベンチマークは、最近のニューラルレンダリングベースのローカライゼーション手法よりも改善されていることを示している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:57:03 GMT)
Early Prediction of Alzheimer's and Related Dementias: A Machine Learning Approach Utilizing Social Determinants of Health Data [1.4] アルツハイマー病と関連する認知症(AD/ADRD)は、600万人以上のアメリカ人に影響を及ぼす医療危機の進行を示している。
社会的健康決定因子(SDOH)は認知機能のリスクと進行の両方に大きな影響を及ぼす。
本報告は、これらの社会的、環境的、構造的要因が認知的健康軌道に与える影響について考察する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 03:16:02 GMT)
Low-overhead magic state distillation with color codes [1.4] 非クリフォードゲートのフォールトトレラント実装は、普遍的なフォールトトレラント量子コンピューティングを実現する上で大きな課題である。
本研究では,15-to-1蒸留回路と格子手術に基づく2種類の蒸留方式を提案する。
与えられた目標不確実性に到達するためには、我々のスキームは、カラーコードに対する以前の最高のマジック状態蒸留スキームよりも、およそ2桁少ないリソースを必要とする。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 23:24:38 GMT)
Flight Testing an Optionally Piloted Aircraft: a Case Study on Trust Dynamics in Human-Autonomy Teaming [1.4] 基本要因の変化が信頼の変動、信頼のしきい値、人間の行動に与える影響について論じる。
2021年から2023年にかけての複数年間の飛行試験で収集された200時間以上の飛行試験データをレビューした。
この結果は,人間-自律型チームにおける信頼のダイナミクスと信頼のための設計に関する今後の研究に有望な方向性をもたらす。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:22:39 GMT)
Training Large Neural Networks With Low-Dimensional Error Feedback [1.4] ディープニューラルネットワークのトレーニングは通常、高次元エラー信号のバックプロパゲーションに依存している。
本稿では,低次元誤り信号が効果的な学習に十分であることを示す。
タスク次元の順序における最小誤差次元でさえ、従来のバックプロパゲーションと同等の性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:00:14 GMT)
AutoDrive-QA- Automated Generation of Multiple-Choice Questions for Autonomous Driving Datasets Using Large Vision-Language Models [1.4] 既存の駆動型QAデータセットを構造化多重質問(MCQ)フォーマットに変換する自動パイプラインであるAutoDrive-QAを紹介する。
このベンチマークは、認識、予測、計画タスクを体系的に評価し、標準化された客観的評価フレームワークを提供する。
我々は、このベンチマークを3つの公開データセットでテストし、目に見えないデータセットでゼロショット実験を行う。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 01:32:00 GMT)
Distributed LLMs and Multimodal Large Language Models: A Survey on Advances, Challenges, and Future Directions [1.4] 言語モデル (LM) は、テキストなどの大規模データセットに基づいて単語列の確率を推定することにより、言語パターンを予測する機械学習モデルである。
より大きなデータセットは一般的にLM性能を高めるが、計算能力とリソースの制約のためスケーラビリティは依然として課題である。
近年の研究では、分散トレーニングと推論を可能にする分散型技術の開発に焦点が当てられている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:18:25 GMT)
A Scalable and Robust Compilation Framework for Emitter-Photonic Graph State [1.4] 決定論的スキームの文脈におけるGraphState-to-Circuitコンパイル問題について検討する。
本稿では,対象のグラフ状態をサブグラフに分割し,個別にコンパイルし,その後回路を結合してエミッタ資源利用を最大化する,新たなコンパイルフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:01:33 GMT)
Is Long Context All You Need? Leveraging LLM's Extended Context for NL2SQL [1.2] 大きな言語モデル(LLM)は、さまざまな自然言語処理タスクにまたがる印象的な機能を示している。
この意味的曖昧な問題に対する一つのアプローチは、より十分な文脈情報を提供することである。
長いコンテキストLLMは堅牢であり、拡張されたコンテキスト情報では失われないことを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:39:13 GMT)
Words in Motion: Extracting Interpretable Control Vectors for Motion Transformers [1.2] トランスフォーマーベースのモデルは、解釈が難しい隠された状態を生成する。
隠れた状態を解析し、推論で修正し、動き予測に焦点をあてる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:06:17 GMT)
BicliqueEncoder: An Efficient Method for Link Prediction in Bipartite Networks using Formal Concept Analysis and Transformer Encoder [1.0] 本稿では,テキスト形式概念解析(FCA)とトランスフォーマーエンコーダを用いたバイパートイトネットワークにおけるリンク予測手法を提案する。
バイパーティイトネットワークにおけるリンク予測は、オンライン販売における製品推奨や、医学における化学物質と化学物質の相互作用の予測など、様々な分野における実践的な応用を見出す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:31:27 GMT)
DevOps Automation Pipeline Deployment with IaC (Infrastructure as Code) [1.0] 本稿では,現在のソフトウェア開発とデプロイメントプロセスを,継続的インテグレーションと継続的デリバリ(CI/CD)パイプラインとして合理化することを目的とする。
論文のさらなる目的は、DevOps Infrastructure as Code(IaC)とPipelineをコードとして実装する戦略を実証することである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:12:54 GMT)
Ensemble Survival Analysis for Preclinical Cognitive Decline Prediction in Alzheimer's Disease Using Longitudinal Biomarkers [1.0] 従来の生存モデルは、病気の進行に伴う複雑な縦長のバイオマーカーパターンを捉えることができない。
臨床経過の早期予測を改善するために,複数の生存モデルを統合するアンサンブルサバイバル分析フレームワークを提案する。
ベースライン後の1回の訪問は予測精度を大幅に改善した(48.1%のCインデックス、48.2%のAUCゲイン)。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:56:32 GMT)
Hoare meets Heisenberg: A Lightweight Logic for Quantum Programs [0.9] We show that Gottesman's semantics for Clifford circuits based on the Heisenberg representations gives up to a lightweight Hoare-like logic。
我々の応用には、(i)補助量子ビットを安全に配置できるかどうかを認証すること、(ii)所定の安定化器符号に対するゲートの正当性をチェックすること、(iv)計算後状態を含む。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:17:35 GMT)
OpenMIBOOD: Open Medical Imaging Benchmarks for Out-Of-Distribution Detection [0.9] 本稿では,OpenMIBOOD(Open Medical Imaging Benchmarks for Out-Of-Distribution Detection)を紹介する。
OpenMIBOODには、さまざまな医療領域からの3つのベンチマークが含まれており、14のデータセットを、共分散内配布、近OOD、遠OODカテゴリに分割している。
その結果, 自然画像領域におけるOODベンチマークの結果は医学的応用には変換されないことが明らかとなった。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:43:14 GMT)
A Quantum Algorithm for Assessing Node Importance in the st-Connectivity Attack [0.9] この研究は、ターゲット接続を維持するノードの重要性を近似するための量子的アプローチを記述する。
近似法は、st結合性およびシャプリー値の近似に量子サブルーチンに依存する。
悪意あるアクターがノードのサブセットを乱してシステム機能を乱す、st接続攻撃シナリオを考察する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:16:27 GMT)
ICLR Points: How Many ICLR Publications Is One Paper in Each Area? [0.9] ICLRポイントの概念を導入し、トップレベルの機械学習カンファレンスで1つの出版物を作成するのに必要な平均的な労力として定義します。
我々は,27のコンピュータサイエンス分野における平均出版活動量を定量的に測定し,比較した。
本分析では, 平均的な出版活動に有意な差が見られ, 逸話的認識の妥当性が検証された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:23:35 GMT)
A Diagnosis and Treatment of Liver Diseases: Integrating Batch Processing, Rule-Based Event Detection and Explainable Artificial Intelligence [0.9] 肝疾患は、多くの個人に影響を与え、経済的、社会的に重大な影響をもたらす。
本研究の目的は,BFO,PCDオントロジー,決定木アルゴリズムによる検出規則を用いた肝疾患の診断・治療モデルを開発することである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:42:28 GMT)
No Practical Quantum Broadcasting: Even Virtually [0.9] 線形過程が標本効率、ユニタリ共分散、置換不変性、古典的一貫性を維持できないことを証明する。
我々はSchur-Weyl双対性を用いて、標準仮想放送マップの特異性を大幅に単純化した導出を行う。
提案手法は,仮想放送の特異性を1対Nのケースに自然に拡張し,その構成を提供する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:43:20 GMT)
A Statistical Analysis for Per-Instance Evaluation of Stochastic Optimizers: How Many Repeats Are Enough? [0.9] 本稿では,共通指標の統計的分析を行い,実験設計のガイドラインを策定する。
メトリクスの所定の精度を達成するために、リピート数に対する低いバウンダリを導出します。
そこで本稿では,評価基準の精度を確保するために必要となるリピート数を適応的に調整するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:38:50 GMT)
Quantum Metrology of Newton's Constant with Levitated Mechanical Systems [0.8] 浮上した機械システムは、センサーに期待できる応用に注目が集まっている。
我々の計画では、現在の標準を数桁上回ると約束している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:08:04 GMT)
SoK: Trusted Execution in SoC-FPGAs [0.8] Trusted Execution Environments (TEE) はエッジコンピューティングの最前線に現れ、システムコンポーネント間の信頼の欠如に対処している。
FPGAはエッジコンピュータとして一般的に使用されるが、セキュリティを第一に考慮して作られたものではない。
FPGAベースのTEEのアプリケーションと機能を体系化するために,既存の文献を分析した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:07:44 GMT)
From Paramagnet to Dipolar Topological Order via Duality and Dipolar SPT [0.8] 双極性トポロジカル状態(dTS)は、翻訳対称性に富んだトポロジカル相の例である。
2次元対称性保護トポロジカル状態(SPT)として、調製過程で出現する中間回路状態が同定される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:19:46 GMT)
RL4Med-DDPO: Reinforcement Learning for Controlled Guidance Towards Diverse Medical Image Generation using Vision-Language Foundation Models [0.7] VLFM(Vision-Language Foundation Models)は、高解像度でフォトリアリスティックな自然画像を生成するという点で、大幅な性能向上を示している。
本稿では,事前学習したVLFMがカーソリー意味理解を提供するマルチステージアーキテクチャを提案する。
本手法の有効性を医用撮像皮膚データセットに示し, 生成した画像から生成品質が向上し, 微調整された安定拡散に対するプロンプトとの整合性が向上することを示した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 01:51:05 GMT)
QCPINN: Quantum Classical Physics-Informed Neural Networks for Solving PDEs [0.7] ハイブリッド量子古典ニューラルネットワークは、計算課題を解決するための新しいアプローチである。
従来のPINNと同等の精度で学習可能なパラメータを最大89%削減する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:52:26 GMT)
Optimizing realistic continuous-variable quantum teleportation with non-Gaussian resources [0.7] 現実的な環境下での連続可変量子テレポーテーションにおける非ガウス的絡み合った資源の性能について検討する。
本稿では,3つの異なる絡み合った資源の特性,2モードの真空状態,2モードの光子減圧状態,および2モードの光子減圧状態について述べる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:30:53 GMT)
FedSAF: A Federated Learning Framework for Enhanced Gastric Cancer Detection and Privacy Preservation [0.7] 胃癌は最も一般的に診断されるがんの1つであり、死亡率が高い。
医療資源が限られているため、胃癌認識のための機械学習モデルの開発は、医療機関にとって効率的な解決策となる。
このようなモデルは通常、トレーニングとテストのために大きなサンプルサイズを必要とするため、患者のプライバシに挑戦する可能性がある。
フェデレートラーニングは、センシティブな患者データを共有することなく、複数の機関でモデルトレーニングを行うことによって、効果的な代替手段を提供する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:48:48 GMT)
Allocation Multiplicity: Evaluating the Promises of the Rashomon Set [0.7] ラショモンのモデルは差別的アルゴリズムを減らし、結果の均質化を減らし、公平な決定を約束する。
割り当て多重性の観点から、これらの約束は満たされないかもしれないと論じる。
医療割当のケーススタディで示すように、この等実用割当の空間は、羅生門セットに忠実に反映されないかもしれない。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:21:55 GMT)
ammBoost: State Growth Control for AMMs [0.6] 自動市場メーカ(AMM)は、Web 3.0アプリケーションの主要な例である。
AmmBoostは、オンチェーントランザクションの量を削減し、スループットを向上し、ブロックチェーンのプルーニングをサポートする。
実験の結果,AmmBoostはガスコストを96.05%削減し,少なくとも93.42%削減した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:55:47 GMT)
Exploratory Study into Relations between Cognitive Distortions and Emotional Appraisals [0.6] 本研究は,認知的歪みと感情的評価次元の関係について検討する。
認知的歪みと評価次元の統計的に有意な関係のパターンは、歪みのカテゴリーによって異なることを示す。
また,認知的再構成が評価次元に与える影響を分析し,認知的再構成の感情制御の側面を実証した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:23:35 GMT)
Interpreting the Curse of Dimensionality from Distance Concentration and Manifold Effect [0.6] まず、高次元データを操作する際の潜在的な課題を要約し、回帰、分類、クラスタリングタスクの失敗の原因を説明する。
次に、理論的および経験的分析を行うことにより、次元性、距離集中、多様体効果の呪いの2つの主要な原因を掘り下げる。
その結果、次元が増加するにつれて、ミンコフスキー距離、チェビシェフ距離、コサイン距離の3つの古典的距離測定を用いた近接探索(NNS)が無意味になることが示された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:08:31 GMT)
Software development projects as a way for multidisciplinary soft and future skills education [0.6] 本論文は,短期的かつ集中的な共同プロジェクトにおいて,ソフトと将来的なスキルの教育の可能性を示す。
プロジェクトでは、問題ベースの学習、アクティブラーニング、グループワークの方法論を使用します。
その結果,提案手法はコミュニケーション,協力,デジタルスキル,自己反射において,参加者のソフトスキルを高めた。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:42:53 GMT)
Multivariate Time Series Anomaly Detection in Industry 5.0 [0.6] 製造ラインのセンサ化は、プロセスを観測しやすくする一方で、膨大な時系列データを継続的に分析するという課題も生んでいる。
有望なアプローチは、埋め込みモデルと他の機械学習アルゴリズムを組み合わせることで、異常を検出する全体的なパフォーマンスを高めることである。
ボニフィリオーリ工場から収集したデータを用いて,本ソリューションを実産業利用事例で検証した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:38:58 GMT)
WeirdFlows: Anomaly Detection in Financial Transaction Flows [0.5] WeirdFlowsは、不正なトランザクションや非コンプライアンスエージェントを検出するためのトップダウン検索パイプラインである。
Intesa Sanpaolo(ISP)銀行のデータセットからWerdFlowsを評価する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:49:33 GMT)
Patch-based learning of adaptive Total Variation parameter maps for blind image denoising [0.4] ノイズがガウシアンかポアソンかのいずれかでありうる状況について考察し、ノイズ分布が不明な状況について検証する。
我々は,各画像画素に対して,テレビの正規化と対応するデータの忠実度を最適に重み付けするパッチベースのアプローチを定義する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:24:14 GMT)
Stabilizing open photon condensates by ghost-attractor dynamics [0.4] 染料充填マイクロキャビティにおける開光子ボース-アインシュタイン凝縮体 (BEC) の時間的, 駆動散逸ダイナミクスについて検討した。
ゆらぎは、BECが常に十分に長い時間ゼロに分解するという力学を根本的に変える。
ゴースト・トラクターは、物理的にアクセス可能な構成空間の外側にあるが、力学を惹きつけ、BECのプラトーのような安定化を指数的に長期に及ぼす。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 20:30:28 GMT)
Crowd-PrefRL: Preference-Based Reward Learning from Crowds [0.4] クラウドソーシング技術と嗜好に基づく強化学習アプローチを統合する概念的フレームワークであるCrowd-PrefRLを導入する。
予備的な結果は,未知の専門知識と信頼性を持つ群衆が提供した嗜好フィードバックから,報酬関数とエージェントポリシーを学習できることを示唆している。
提案手法は, 群衆内における少数視点の存在を, 教師なしの方法で識別できることが示唆された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:18:18 GMT)
Entanglement Rényi Negativity of Interacting Fermions from Quantum Monte Carlo Simulations [0.4] 相互作用するフェルミオン系における負性率を用いた混合状態量子絡み合いについて検討する。
半充填ハバードモデルとスピンレス$t$-$V$モデルのランク2のR'enyi負性性を計算する。
我々の研究は絡み合いの計算に寄与し、様々なフェルミオン多体混合状態における量子絡み合いの将来の研究の舞台となる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:11:13 GMT)
Classification of User Reports for Detection of Faulty Computer Components using NLP Models: A Case Study [0.4] 本稿では,NLPモデルを用いてユーザレポートを分類し,欠陥のあるコンピュータコンポーネントを検出する革新的な手法を提案する。
多くの情報源から得られた341のユーザレポートのデータセットを構築した。
私たちのアプローチはデータセットで79%の精度を実現しました。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:11:26 GMT)
Reducing T Gates with Unitary Synthesis [0.4] 本研究は、任意の単一ビットのユニタリを直接合成する新しいFT合成アルゴリズムを提案する。
テンソルネットワークを用いた探索により,ネイティブな$U3$合成が可能となり,$T$カウント,Cliffordゲートカウント,近似誤差が低減される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 04:53:54 GMT)
Expected Information Gain Estimation via Density Approximations: Sample Allocation and Dimension Reduction [0.4] 一般非線形/非ガウス的設定におけるEIG推定のためのフレキシブルトランスポートに基づくスキームを定式化する。
この最適サンプル割り当てにより、得られたEIG推定器のMSEは標準ネストされたモンテカルロスキームよりも高速に収束することを示す。
次に、パラメータを投影し、低次元部分空間に観測することで失われる相互情報の勾配に基づく上界を導出することにより、高次元でのEIGの推定に対処する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:54:35 GMT)
A multi-model approach using XAI and anomaly detection to predict asteroid hazards [0.4] この研究は、機械学習、ディープラーニング、説明可能なAI(XAI)、異常検出を組み合わせることで、危険を正確に予測する洗練された方法を提供する。
ハイブリッドアルゴリズムは、いくつかの最先端モデルを組み合わせることで予測精度を向上させる。
タイムリな緩和は、世界中の監視局に通知するリアルタイムアラームシステムによって実現される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:00:01 GMT)
Semantic Web -- A Forgotten Wave of Artificial Intelligence? [0.4] セマンティックウェブの台頭は知識表現、論理、推論に基づいている。
ChatGPTは、ディープラーニングと高度なニューラルモデルに基づいて構築されたAI熱意を再燃させた。
Semantic Webは、World Wide WebをAIが推論し、理解し、行動できるエコシステムに変えることを目的としています。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:55:48 GMT)
Langevin Monte-Carlo Provably Learns Depth Two Neural Nets at Any Size and Data [0.3] 我々は,Langevin Monte-Carloアルゴリズムが任意のサイズおよび任意のデータに対してディープ2ニューラルネットを学習できることを確立する。
総変分距離とq-Renyiの発散により、ランゲヴィン・モンテカルロの反復体は、これらのネットのいずれかに対して正規化された損失のギブス分布に収束することを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:57:34 GMT)
Big data comparison of quantum invariants [0.3] 探索およびトポロジカルデータ解析を含むビッグデータ技術を用いて量子不変量の調査を行う。
より正確には、Jonesは構造的特性と4つの主要な拡張法の下での挙動を対比する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:52:08 GMT)
Leveraging Large Language Models for Explainable Activity Recognition in Smart Homes: A Critical Evaluation [0.3] XAIは、スマートホームにおけるセンサによる日常生活活動(ADL)認識に適用されている。
本稿では,XAIとLarge Language Models(LLM)を組み合わせたセンサを用いたADL認識の可能性について検討する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:23:03 GMT)
Large Language Models are Zero-Shot Recognizers for Activities of Daily Living [0.3] LLMに基づく新しいADL認識システムであるADL-LLMを提案する。
ADL-LLMは、生センサデータをLLMによって処理されたテキスト表現に変換し、ゼロショットADL認識を行う。
ADL-LLMを2つの公開データセット上で評価し,その有効性を示した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 20:43:37 GMT)
ContextGPT: Infusing LLMs Knowledge into Neuro-Symbolic Activity Recognition Models [0.3] 本研究では,人間活動に関する常識知識から抽出する新しいプロンプトエンジニアリング手法であるContextGPTを提案する。
2つの公開データセットで行った評価は、ContextGPTから常識知識を注入することで得られるNeSyモデルがデータ不足のシナリオにどのように有効であるかを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:38:58 GMT)
Are We There Yet? A Study of Decentralized Identity Applications [0.3] 分散アイデンティティ (DI) と自己主権アイデンティティ (SSI) は近年顕著な成長を遂げている。
分散IDモデルを広く採用する上での障壁を理解するために、既存の調査では、現実世界のデプロイメントを徹底的に分析していない。
本稿では,学術文学とグレー文学の両分野を探求し,商業・政府のイニシアチブを検討することで,そのギャップを解消する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:05:16 GMT)
Narrowing Class-Wise Robustness Gaps in Adversarial Training [0.2] 本稿では,対人訓練が総合的およびクラス固有のパフォーマンスに与える影響について考察する。
トレーニング中のラベリングの強化は、対人ロバスト性を53.50%向上させ、クラス不均衡を5.73%軽減する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:24:01 GMT)
Investigating Retrieval-Augmented Generation in Quranic Studies: A Study of 13 Open-Source Large Language Models [0.2] 汎用大規模言語モデル(LLM)は、しばしば幻覚に苦しむ。
この課題は、応答の正確さ、妥当性、忠実さを維持しながらドメイン固有の知識を統合するシステムの必要性を強調している。
本研究は,114サラーの意味,歴史的文脈,質など,クラーニック・サラーの記述的データセットを利用する。
モデルは、文脈関連性、回答忠実性、回答関連性という、人間の評価者によって設定された3つの重要な指標を用いて評価される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:26:30 GMT)
The classical limit of Quantum Max-Cut [0.2] 我々は、大きな量子スピンの極限$S$は半古典的極限として理解されるべきであることを示した。
半定値プログラムの出力をブロッホコヒーレント状態の積に丸め、$mathrmQMaxCut_S$に対する古典近似アルゴリズムの2つのファミリを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 21:46:33 GMT)
SuperARC: A Test for General and Super Intelligence Based on First Principles of Recursion Theory and Algorithmic Probability [0.1] ベンチマークの汚染を避けるためにアルゴリズムの確率で実験を行った。
テストの課題は、基本的な性質の知性に関する側面である。
定義されたインテリジェンスレベルへの収束の明確な証拠はない。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 23:11:30 GMT)
UAS Visual Navigation in Large and Unseen Environments via a Meta Agent [0.1] 本研究では,大規模都市環境下でのナビゲーションを効率的に学習するためのメタカリキュラムトレーニング手法を提案する。
トレーニングカリキュラムを階層的に整理し,エージェントを粗い状態から目標タスクへ誘導する。
特定のタスクに対するポリシーの獲得に焦点を当てた従来の強化学習(RL)とは対照的に、MRLは、新しいタスクへの高速転送能力を持つポリシーを学習することを目的としている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 01:44:59 GMT)
Hyperspectral Imaging for Identifying Foreign Objects on Pork Belly [0.1] ハイパスペクトルイメージング(HSI)を用いた豚腹肉の異物自動検出法について検討した。
近赤外(NIR)スペクトル(900-1700nm)における様々な帯域のデータを撮像するためにハイパースペクトルカメラが使用された
提案手法は前処理技術と軽量ビジョントランス (ViT) に基づくセグメンテーション手法を組み合わせて, 汚染物質を肉, 脂肪, コンベアベルト材料と区別する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:28:31 GMT)
HiAER-Spike: Hardware-Software Co-Design for Large-Scale Reconfigurable Event-Driven Neuromorphic Computing [0.1] HiAER-Spikeは、再構成可能でイベント駆動型ニューロモルフィックコンピューティングプラットフォームである。
最大1億6000万のニューロンと400億のシナプスを持つ大きなスパイクニューラルネットワークを実行するように設計されている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 23:54:33 GMT)
ATTENTION2D: Communication Efficient Distributed Self-Attention Mechanism [0.1] ATTENTION2Dは,クエリとキー/値という2次元の並列性を利用する手法である。
この方法は、複数のデバイスにまたがる計算の効率的かつ並列化を可能にする。
Ring Attentionと比較すると,GPT-3-likeモデルでは5倍の性能向上がみられた。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 00:25:44 GMT)
Quantum Dissipative Continuous Time Crystals [0.1] 平均場理論では説明できない2つの異なる時間-結晶相が見つかる。
そのうちの1つは、量子揺らぎの存在下でのみ現れる。
提案モデルは、中性原子配列における相互作用するリドバーグ状態のレーザー駆動力学に直接適用される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:42:34 GMT)
Making the unmodulated pyramid wavefront sensor smart II. First on-sky demonstration of extreme adaptive optics with deep learning [0.1] ピラミッド波面センサ(PWFS)は、現在および将来の極端適応光学(XAO)システムにおいて好まれる選択である。
ほぼ全ての機器は、有限線型性範囲を緩和するために、PWFSを変調形式で使用する。
我々は、変調されていないPWFSを用いたXAOの最初のオンスキーデモンストレーションを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 20:17:30 GMT)
Benchmarking Large Language Models for Handwritten Text Recognition [0.1] MLLM(Multimodal Large Language Models)は、モデル固有のトレーニングを必要とせずに、さまざまな手書きスタイルを認識するための一般的なアプローチを提供する。
この研究は、トランスクリバスモデルに対する様々なプロプライエタリでオープンソースのLCMをベンチマークし、英語、フランス語、ドイツ語、イタリア語で書かれた近代的および歴史的データセットのパフォーマンスを評価した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:49:10 GMT)
Financial Twin Chain, a Platform to Support Financial Sustainability in Supply Chains [0.0] ジェネリックサプライチェーンの金融持続性は複雑な問題である。
我々は、AI、ブロックチェーン、ナレッジグラフなど、重要な実現可能な技術を活用するソフトウェアプラットフォームを提案する。
このプラットフォームは、利害関係者やサプライチェーン全体の金融サステナビリティ問題の解決を支援する外部エンティティの関与を可能にする。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:24:18 GMT)
Zero-1-to-A: Zero-Shot One Image to Animatable Head Avatars Using Video Diffusion [0.0] 我々は、4次元アバター再構成のための空間的・時間的整合性データセットを合成する頑健なZero-1-to-Aを提案する。
実験により、Zero-1-to-Aは既存の拡散法と比較して忠実さ、アニメーション品質、レンダリング速度を改善することが示された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:07:46 GMT)
World Knowledge from AI Image Generation for Robot Control [0.0] 人間はしばしば、世界と対話する際のギャップを埋めるために知識と経験に頼っている。
現代の生成システムは、現実世界の可視画像を生成することができ、ロボットが動作している環境に調和させることができる。
本稿では,現実世界の説得力のある画像を生成し,未特定課題を解決する能力によって得られる,現代の生成型AIシステムの世界に関する暗黙の知識を利用することについて検討する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:25:36 GMT)
Workflow for Safe-AI [0.0] 機能的安全性が重要な関心事であるアプリケーションにおいて、安全で信頼性の高いAIモデルの開発とデプロイが不可欠である。
この作業では、信頼性と質的可能性の両方を強調した、透明で、完全で、柔軟で、軽量なワークフローを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:32:39 GMT)
Vision-Language Models for Acute Tuberculosis Diagnosis: A Multimodal Approach Combining Imaging and Clinical Data [0.0] 本研究では,SIGLIPとGemma-3bアーキテクチャを併用したVLM(Vision-Language Model)を提案する。
VLMは胸部X線からの視覚データを臨床コンテキストと組み合わせて、詳細なコンテキスト認識診断レポートを生成する。
結石,空洞,結節などの急性TBの病態は,高い精度とリコールで検出された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:20:22 GMT)
Vision-Language Models Generate More Homogeneous Stories for Phenotypically Black Individuals [0.0] 本研究では,人種的特徴が視覚言語モデルのアウトプットに与える影響について検討した。
まず、VLMは、表現特異性が高い黒人について、より均質なストーリーを生成する。
第二に、黒人女性に関する話は、すべてのモデルでテストされた黒人男性に関する話よりもずっと均一である。
第3に、この均質性バイアスは、主に黒人女性のコンテンツ変化に顕著に影響を及ぼすが、黒人男性にはほとんど影響を与えない、顕著な相互作用によって引き起こされる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:50:45 GMT)
Using Data Redundancy Techniques to Detect and Correct Errors in Logical Data [0.0] 本稿では,ディスクアレイを用いたRAID方式について検討し,論理データに適用する。
我々は,少数の冗長データのみを用いて,大規模なアーカイブファイルの任意の障害を復元する上で,堅牢な性能を示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:07:13 GMT)
Uncertain research country rankings. Should we continue producing uncertain rankings? [0.0] サイテーションに基づく各国の研究能力の評価は、しばしば、画期的な進歩を達成する能力が誤って表現される。
本研究は、ブレークスルー研究の指標として、トップパーセンタイル引用指標の有効性を評価する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:41:55 GMT)
Transformation trees -- documentation of multimodal image registration [0.0] マルチモーダル画像登録は、デジタル患者モデルの作成において重要な役割を果たす。
本稿では,変換木を構造化記録および変換管理の手法として用いることを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:43:48 GMT)
Towards Non-linear Cultural Production and systems of machinic agency: in the case of TikTok value generation [0.0] プラットフォームに対する評価を促進するために消費される方法で、人間と機械の貢献を区別することはもはや不可能である、と私は論じます。
ここでは,TikTokの技術的アレンジメントとユーザとの関係から,プラットフォーム文化生産の非線形モードを育成することを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:36:22 GMT)
To impute or not to impute: How machine learning modelers treat missing data [0.0] 我々は、データ処理方法の欠如について、70人の機械学習研究者とエンジニアを対象に調査を行った。
その結果、ほとんどの参加者は、データ処理の欠如について情報的な判断をしていないことが明らかとなった。
私たちは、欠落データに関するより良い教育、標準化された欠落データレポート、欠落データ分析ツールを提唱します。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:55:37 GMT)
Thermodynamics and Protection of Discrete-Time Crystals [0.0] 熱浴に結合した1次元スピン-1/2鎖における離散時間結晶(DTC)の詳細な熱力学解析を行った。
以上の結果から,DTC符号は環境騒音の存在下で必然的に崩壊することが明らかとなった。
周期的な測定手法によりデコヒーレンスの影響を緩和し, DTCの低調波振動を長期にわたって安定化させることができることを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:15:03 GMT)
Thermodynamic Constraints on Information Transmission in Quantum Ensembles [0.0] 量子力学は、情報の符号化と復号化の限界と可能性を規定する2つの主要な要因を含む。
第1の要因は、非閉定理によって支配されるように、あるシステムから別のシステムにコピーできる情報の量に制約を課す。
第二に、非直交量子状態の不明瞭さにより物理系で符号化された情報のアクセシビリティが制限される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:58:13 GMT)
Theory of Two-level Tunneling Systems in Superconductors [0.0] 超伝導に対する2レベルトンネルシステムの影響の予測について述べる。
従来のs波超伝導体における非磁性TLS不純物は、ペアブレーキングまたはペアエンハンシング欠陥として機能する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 05:34:08 GMT)
The Möbius Game: A Quantum-Inspired Test of General Relativity [0.0] その不等式に対する一般相対論的違反は曲率の変化を証明している。
ベルの不等式に対する量子力学的違反は絡み合いの源を証明している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:06:26 GMT)
TextBite: A Historical Czech Document Dataset for Logical Page Segmentation [0.0] 従来のアプローチは論理的セグメンテーションを定義するためにOCRや正確な幾何学に依存していた。
OCRの必要性を避けるため、我々はタスクを画像領域のセグメンテーションとして純粋に定義する。
我々は18世紀から20世紀にかけてのチェコの歴史文書のデータセットであるTextBiteを紹介した。
データセットは、8,449のページイメージと78,863の注釈付きテキストと、論理的および数学的にコヒーレントなテキストからなる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:19:12 GMT)
Temporal-Spatial Attention Network (TSAN) for DoS Attack Detection in Network Traffic [0.0] 本稿では、ネットワークトラフィックにおけるDoS攻撃を検出するための、新しい時間空間注意ネットワーク(TSAN)アーキテクチャを提案する。
ネットワークトラフィックの時間的特徴と空間的特徴を両立させることで,従来の手法が見逃すような複雑なトラフィックパターンや異常を捉える。
NSL-KDDデータセットの実験結果は、TSANが最先端モデルより優れていることを示している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:31:45 GMT)
TVineSynth: A Truncated C-Vine Copula Generator of Synthetic Tabular Data to Balance Privacy and Utility [0.0] TVine Synthは、プライバシとユーティリティのバランスをとるために設計された合成データジェネレータである。
推定データ生成分布の制御近似を実行する。
TVine Synthは競合モデルと比較して、プライバシーとユーティリティのバランスが優れている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:16:02 GMT)
Storage Buffer of Polarization Quantum States Based on a Poled-Fiber Phase Modulator [0.0] 偏光量子状態を、偏光ファイバー変調器で制御可能なファイバーループに格納できる調整可能なバッファを提案する。
本稿では,光偏光量子状態を光ファイバー変調器で制御可能なファイバーループに格納する方法を示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:55:29 GMT)
Statistical modeling of categorical trajectories with multivariate functional principal components [0.0] 分類過程の統計的モデリングの問題を機能データ解析問題に変換する。
本研究では,時間的チェック・アズ・ア・ア・ア・ア・ア・ア・プリーなどの実験を解析するためにどのように拡張するかを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:41:18 GMT)
Spontaneous symmetry emergence in a Hermitian system of coupled oscillators without symmetry [0.0] 系状態がハミルトニアン系に固有の対称性を得られることを示す。
対称性の出現は系力学の変化として現れ、対称性に欠けるエルミート系の相転移と解釈できる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:24:40 GMT)
Speeding up design and making to reduce time-to-project and time-to-market: an AI-Enhanced approach in engineering education [0.0] 本稿では、組み込みシステムのためのソフトウェアアーキテクチャコースにおいて、ChatGPTやGitHub CopilotといったAIツールの統合について検討する。
その結果、AIが強化されるが、人間の意思決定に取って代わるものではないため、問題解決、より高速な開発、より高度な成果が実証された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:32:13 GMT)
Sparking Curiosity in Digital System Design Lectures with Take Home Labs [0.0] 電子工学のカリキュラムでは、デジタルシステム設計の講義が必須である。
低コストのFPGAボードの出現に伴い、テイクホームラボの利用が増加している。
従来のラボセッションには制限があり、学習の柔軟性とエンゲージメントを高めるため、テイクホームラボキットの探索を促す。
本研究は,Tang Nano 9K FPGAボードとSaleae Logic Analyzerからなる低コストテイクホームラボキットの有効性を評価することを目的とする。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:30:32 GMT)
Slow approach to adiabaticity in many-body non-Hermitian systems: the Hatano-Nelson Model [0.0] 非エルミート量子多体系における近接断熱力学を探索する。
我々の研究は、断熱と非エルミート多体物理学の複雑な相互作用を強調している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 21:13:36 GMT)
Robust quantum metrology with random Majorana constellations [0.0] 多くの物理系は、球面上の点のマヨラナ座によって記述できる。
もしこれらの点がランダムに選択されたら、結果として得られる状態は平均してどれだけ量子になるのか?
この単純な概念的な問題を詳細に探求し、結果のランダム状態の量子的性質について検討する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:08:16 GMT)
Reinforcement Learning for Reasoning in Small LLMs: What Works and What Doesn't [0.0] 小型言語モデル(LLM)における強化学習による推論改善の可能性について検討した。
24時間以内に4つのNVIDIA A40 GPU(それぞれ48GB VRAM)をトレーニングした結果、素早い推論が向上した。
これらの結果から, 小型LLMに対するRLを用いた微調整の有効性が明らかとなり, 大規模アプローチに対する費用対効果が示唆された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:13:23 GMT)
Reduced density matrix approach to one-dimensional ultracold bosonic systems [0.0] 2ボソン還元密度行列の変分決定は、接触相互作用を介して相互作用する調和に閉じ込められたボソンの1次元系について記述する。
基底状態エネルギーを計算し、フィールドの既存の方法と比較する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:54:22 GMT)
Realization of versatile and effective quantum metrology using a single bosonic mode [0.0] 決定論的パラメータ推定のための多目的かつオンデマンドなプロトコルを提案する。
低平均光子数は1.76までしかなく、ハイゼンベルクスケーリングに近づく量子強調精度を達成する。
入力状態を調整することにより、ハエの利得や感度範囲をさらに高めることができることを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:29:40 GMT)
Qutrit and Qubit Circuits for Three-Flavor Collective Neutrino Oscillations [0.0] 我々は、高密度ニュートリノ系のフレーバーダイナミクスをシミュレートするためのクォートとキュービットの有用性を探求する。
量子ビット型および量子ビット型プラットフォーム上での3フレーバーニュートリノ系をシミュレーションするための新しい量子回路を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:06:21 GMT)
Quantum metrology of a structured reservoir [0.0] 構造された貯水池の特性を正確に特徴づけることは量子システムにおいて重要な課題である。
熱水浴としてモデル化されたアンシラキュービットとマルコフ環境からなる構造型貯水池に結合した2レベルシステム(キュービット)をプローブとして使用した。
本稿では、量子フィッシャー情報(QFI)を用いてパラメータ推定の精度を定量化し、過渡状態と定常状態の両方で系の力学を解析する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:56:28 GMT)
Quantum geometry and bounds on dissipation in slowly driven quantum systems [0.0] 低温におけるゆっくり駆動されたマルコフ量子系のエネルギー散逸は、駆動プロトコルの幾何学と関連していることを示す。
トポロジカル周波数変換に使用されるような2音プロトコルにおける散逸率の低い境界を確立する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:37:16 GMT)
Quantum Key Distribution with Basis-Dependent Detection Probability [0.0] セキュリティ証明における一般的な仮定は、受信機における検出確率は、与えられた入力状態に対して、測定基準とは独立であるということである。
本稿では,上記の仮定に依存しないQKDプロトコルのセキュリティ証明を提案する。
我々は,シミュレーションにより,大規模な検出確率ミスマッチに弱い設定に対して,正の鍵レートを抽出できることを実証した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:13:55 GMT)
Quantum Characterization, Verification, and Validation [0.0] 量子キャラクタリゼーション、検証、検証(QCVV)は、量子ビット(量子ビット)の振る舞いを探索、記述、評価するための一連の技術である。
QCVVプロトコルは不要なデコヒーレンスの効果を探索し記述し、除去または緩和することができる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:45:03 GMT)
Qualitative differences in the robust controllability of model two-qubit systems [0.0] 連続パラメータを持つ2つのモデルハミルトニアンを考えるが、これは部分的には未知である。
このパラメータの不確実性に対するロバストな制御性を,既存の理論フレームワークを用いて評価する。
我々は、制御パルスを最適化し、パラメータ変動の影響に対する堅牢性を高めるために、不確実性関数にペナルティ項を導入する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:23:00 GMT)
Procrustes Wasserstein Metric: A Modified Benamou-Brenier Approach with Applications to Latent Gaussian Distributions [0.0] ワッサーシュタイン型距離に導かれる改良ベナモ・ブレニエ型アプローチを導入する。
この距離は、その軌道の方向や速度を変えない粒子の無コストな動きで作用をペナル化することによって定義される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:34:22 GMT)
Probing classical and quantum violations of the equivalence of active and passive gravitational mass [0.0] アクティブかつパッシブな重力質量(EAP)の等価性は、重力の最も基本的な原理の1つである。
実験室をベースとした実験で量子重力を探索する方法を示す。
本研究は, 高精度実験室実験における重力の基礎実験の新たな機会を開くものである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:45:24 GMT)
Predictive Maintenance of Electric Motors Using Supervised Learning Models: A Comparative Analysis [0.0] 本研究では,電動機の状態を診断するための教師あり学習モデルについて検討した。
様々な機械学習アルゴリズムを訓練するために、モーター操作の重要な特徴が採用された。
その結果, モデル間での精度の顕著な違いがみられた。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:36:53 GMT)
Practical Acoustic Eavesdropping On Typed Passphrases [0.0] 本稿では,教師なし学習を用いて,キーボードの音響エマニュエーションを利用して,型付き自然言語パスフレーズを推論する。
また、エラーのマージンがはるかに大きい機密メールなど、長いメッセージにも適用できる。
相関オーディオ前処理は、キーストローククラスタリングにおけるメル周波数-ケプストラム係数や高速フーリエ変換などの手法より優れている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 21:42:30 GMT)
Pauli web of the $|Y\rangle$ state surface code injection [0.0] ZX-calculus と Pauli web を使って、回転した曲面コードに対する$|Yrangle$状態注入を理解します。
ZX-calculus と Pauli web を使って、回転した曲面コードに対する$|Yrangle$状態注入を理解します。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:42:45 GMT)
Open Science and Artificial Intelligence for supporting the sustainability of the SRC Network: The espSRC case [0.0] SKA地域センター(SR-CNet)のグローバルネットワークは、科学分析と科学支援に必要なインフラ、ツール、計算能力を提供する。
スペインSRC(espSRC)は、環境への影響を減らすことで、このネットワークの持続可能性を確保することに焦点を当てている。
本稿では,SRCのエネルギー消費削減に向けてチームが行っている研究・開発活動の一部を論じ,要約する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:29:00 GMT)
On the Limits of Applying Graph Transformers for Brain Connectome Classification [0.0] 脳コネクトームは脳内の神経接続の詳細な地図を提供する。
近年の研究では、新しいコネクトームグラフデータセットを提案し、グラフ深層学習を用いてコネクトーム分類の改善を試みた。
この研究は、新しいNeuroGraphベンチマークデータセットと、確率論的にエッジを除去してノイズデータをシミュレートする合成変種について、そのパフォーマンスについて調査する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:03:13 GMT)
On the Effectiveness of the 'Follow-the-Sun' Strategy in Mitigating the Carbon Footprint of AI in Cloud Instances [0.0] FtS(Follow-the-Sun)は、コンピュータワークロードの炭素フットプリントを最小化する理論計算モデルである。
本稿では, この研究ギャップに対処するため, 部分合成シナリオで実施した実験結果について述べる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:27:29 GMT)
NeuralFoil: An Airfoil Aerodynamics Analysis Tool Using Physics-Informed Machine Learning [0.0] NeuralFoilは、翼の高速空気力学解析のためのオープンソースのツールである。
広義の入力空間上で、大域的および局所的な量を計算する。
結果はXFoilと密接に一致している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:44:53 GMT)
Neural Networks: According to the Principles of Grassmann Algebra [0.0] 我々は、量子等化体の代数と、リー代数に付随するグラスマン代数に等しいヒルベルト空間をもたらすフェルミオンの量子化を探索する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:21:23 GMT)
Multiparticle quantum walks for distinguishing hard graphs [0.0] 特に、多粒子量子ウォークとよく知られた古典的なWLテストを比較する方法について考察する。
我々は、入力重畳状態を持つ k-QW が k-CFI グラフを区別することを示す理論的証明と実験結果を提供する。
さらに、局所的な入力状態を持つ k-1 QW が k-CFI グラフを区別することを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:20:27 GMT)
Multimode Qubit-Conditional Operations via Generalized Cross-Resonance [0.0] 我々は、クロス共振駆動を一般化されたマルチモードスキームに拡張することにより、シングルモードおよびマルチモードキュービット条件演算を生成する。
これには、単モード条件変位と、1光と2光のクロス共振駆動によって引き起こされるスクイーズを含む。
マルチモード設定では、マルチモードキュービット条件ビームスプリッタと2モードスキューズ演算を導出する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:29:48 GMT)
Modular transport in two-dimensional conformal field theory [0.0] 有限密度の2次元共形場理論において,バイパルタイト絡みによって生じる量子輸送について検討する。
有限密度表現における関連する電流の平均値とその量子揺らぎについて検討する。
ジョンソン-ニキスト法則のモジュラー類似とゆらぎ-散逸関係を見いだす。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:25:19 GMT)
Mixed-Reality Digital Twins: Leveraging the Physical and Virtual Worlds for Hybrid Sim2Real Transition of Multi-Agent Reinforcement Learning Policies [0.0] サイバー物理車両システムのためのマルチエージェント強化学習(MARL)は通常、非常に長い訓練時間を必要とする。
この研究は、オンデマンドで並列化されたワークロードを選択的にスケーリングできる混合現実のデジタルツインフレームワークを提案する。
i) エージェントと環境並列化が訓練時間に及ぼす影響, (ii) ドメインランダム化がゼロショットsim2real転送に与える影響について検討した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 01:11:52 GMT)
Masked Mixers for Language Generation and Retrieval [0.0] 我々は、トランスにおける入力表現精度の低下と、マスクミキサーと呼ばれるものにおけるより正確な表現を観察する。
小型のマスクミキサーは、最先端のトランスフォーマーベース検索モデルよりも優れていた。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:39:10 GMT)
Mapping Global Floods with 10 Years of Satellite Radar Data [0.0] 本研究では,Sentinel-1 Synthetic Aperture Radar (SAR)衛星画像の雲透過性を利用した新しい深層学習洪水検出モデルを提案する。
我々は、クラウドカバレッジの影響を受けない予測を備えた、ユニークな、縦断的なグローバルな洪水範囲データセットを作成します。
我々は,エチオピアの歴史的洪水発生地域を特定し,2024年5月のケニアの洪水時のリアルタイム災害対応能力を示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 00:26:25 GMT)
Many exact area-law scar eigenstates in the nonintegrable PXP and related models [0.0] 1次元(1D)PXPとその関連モデルの非自明な非自明な完全ゼロエネルギー固有状態を示す。
本結果は, 運動的制約付きモデルにおける指数関数的に大きなヌル空間の, 未認識構造の特徴を明らかにするものである。
一般的な熱化現象学におけるこれらの創発的正確な固有状態の重要な意味は、この研究で導入された状態の1つによって実証される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:52:11 GMT)
Machine learning identifies nullclines in oscillatory dynamical systems [0.0] 我々は,時系列データからヌルクラインの隠れ構造を明らかにするニューラルネットワークに基づくCLINEを紹介する。
複数の時間スケールや強い非線形性といった課題を克服し、解釈可能な結果をシンボリック微分方程式に変換する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:37:39 GMT)
Local Compositional Complexity: How to Detect a Human-readable Messsage [0.0] 我々は、データがメッセージを伝えるのに役立つ方法で構造化されている場合、高い特定の複雑さの感覚に焦点を当てます。
本稿では、データの最も短い記述を構造化された部分と非構造化された部分に分割して、データの複雑さを測定するための一般的なフレームワークについて述べる。
我々は、局所的な構成性を適切な特定の構造として提案することにより、人間のコミュニケーションを指向したより正確で計算可能な定義を導出する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:03:49 GMT)
Line Space Clustering (LSC): Feature-Based Clustering using K-medians and Dynamic Time Warping for Versatility [0.0] 行空間クラスタリング(Line Space Clustering、LSC)は、データポイントを新たに定義された特徴空間内の行に変換する表現である。
LSCはEuclideanとDynamic Time Warping(DTW)距離をパラメータαで重み付けした組み合わせ距離メートル法を採用している。
実験は、合成および実世界のデータセットに対するLCCの有効性を実証する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 01:27:10 GMT)
Line Search Strategy for Navigating through Barren Plateaus in Quantum Circuit Training [0.0] 変分量子アルゴリズムは、短期デバイスにおける量子優位性を示すための有望な候補と見なされている。
本研究は, サーキットトレーニングにおけるバレンプラトー問題の悪影響を軽減するために, 新たな最適化手法を提案する。
修正されたアルゴリズムは量子ゲート合成の応用に成功している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:02:43 GMT)
Leveraging OpenFlamingo for Multimodal Embedding Analysis of C2C Car Parts Data [0.0] われわれは2つのプラットフォーム、OfferUpとCraigslistからデータを収集した。
OpenFlamingoモデルは、各投稿のテキストと画像の埋め込みを抽出するために使用された。
ほとんどのクラスタにはパターンが含まれていることが分かりましたが、いくつかのクラスタは内部パターンを示していません。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:35:15 GMT)
LaPIG: Cross-Modal Generation of Paired Thermal and Visible Facial Images [0.0] 本稿では,Large Language Models (LLM) が生成するキャプションを用いて,高品質な可視画像と熱画像の合成を可能にするLaPIGというフレームワークを提案する。
提案手法は,多視点の可視画像と熱画像を生成し,データの多様性を高めるだけでなく,識別情報を保持しながら高品質なペアデータを生成する。
提案手法を既存の手法と比較し,LaPIGの優位性を実証した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:39:06 GMT)
Kolmogorovian Censorship, Predictive Incompleteness, and the locality loophole in Bell experiments [0.0] 前回の記事では、距離における影響と超決定論の両方が、ループホールフリーベル試験の結果を説明するのに許容できないと判断された場合、第三の方法が利用可能であると主張した。
予測不完全性」とは、測定コンテキストが特定されていない限り、通常の量子状態$psi$が不完全であることを意味する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:01:23 GMT)
Investigating The Implications of Cyberattacks Against Precision Agricultural Equipment [0.0] 本稿では,CANバス技術を利用した農業機器のサイバー攻撃に伴うサイバーセキュリティリスクの定量化を試みる。
実世界のデータを用いて、CANバス駆動の肥料施用装置にサイバー攻撃が与える影響について、仮説的なケーススタディを提示する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:10:35 GMT)
Interpretable Neural Causal Models with TRAM-DAGs [0.0] TRAM-DAGを用いた因果モデリングにおける解釈可能性と柔軟性のギャップを橋渡しする。
我々は,TRAM-DAGは解釈可能であるが,因果階層において$L_3$から$L_1$までのクエリで同等あるいは優れた性能が得られることを示す。
連続的な場合、TRAM-DAGは、観測不能なコンバウンディングを含む3つの一般的な因果構造に対する反ファクト的クエリを可能にする。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:51:04 GMT)
Intelligent Agricultural Greenhouse Control System Based on Internet of Things and Machine Learning [0.0] 本研究は,モノのインターネット(IoT)と機械学習の融合に根ざした,高度な農業用温室制御システムを概念化し,実行しようとする試みである。
その結果、作物の生育効率と収量が向上し、資源の浪費が減少する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:27:08 GMT)
Integrating Notch Filtering and Statistical Methods for Improved Cardiac Diagnostics Using MATLAB [0.0] 切欠きフィルタは狭帯域ノイズを除去するためにECG信号処理に不可欠である。
この干渉は重要なECG信号の特徴と重なり、下流の分類タスクの精度に影響を与える。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:35:39 GMT)
Informative Path Planning to Explore and Map Unknown Planetary Surfaces with Gaussian Processes [0.0] 本研究ではスカラー変数分布のマッピングのための情報経路計画アルゴリズムを評価する。
従来のオープンループカバレッジ手法と情報理論のアプローチを比較した。
アルゴリズムのパフォーマンスは、パラボラ、タウンゼンド関数、月のクレーターの水和マップの3つの面でテストされている。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:10:13 GMT)
Information maximization for a broad variety of multi-armed bandit games [0.0] 情報と自由エネルギー探索の原則は、エージェントが特定の目標とポリシーに従ってアクションを最適化する一般的なルールを提供する。
本稿では、より複雑で構造化されたバンディット問題に対する物理学に基づくアプローチの広範な拡張について考察する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:59:25 GMT)
Infinite series involving special functions obtained using simple one-dimensional quantum mechanical problems [0.0] 本稿では、特殊関数を含む無限和のあるクラスを解析的に評価する。
L_nu2n+1-nuleft(fracnu+22;frac32;frac12right)$ is generalized hypergeometric function, $L_nu2n+1-nuleft(fracnu+22;frac32;frac12right)$は整数$nu$に対して計算される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:14:47 GMT)
ISP-AD: A Large-Scale Real-World Dataset for Advancing Industrial Anomaly Detection with Synthetic and Real Defects [0.0] 産業用スクリーン印刷異常検出データセット(ISP-AD)
ISP-ADは、ファクトリフロアから直接収集された合成欠陥と実際の欠陥を含む、これまでで最大のパブリックな産業データセットである。
合成および実際の欠陥を取り入れた複合教師あり訓練手法の実験を行った。
研究結果は, 偽陽性率の低い, 高いリコールなどの産業検査要求を満たすことによって, 合成的, 蓄積的両欠陥による監督が相互に補完できることを示唆している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:40:35 GMT)
High-dimensional entanglement witnessed by correlations in arbitrary bases [0.0] 量子技術の発展において、認証の絡み合いは重要なステップである。
特に、相互バイアスのないベース(MUB)は、よく理解され、常に絡み合った認証のために使用されるパラダイム的な例である。
ここでは、MUBの相関関係から任意のベースへの絡み込み認証ツールボックスを拡張する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:28:57 GMT)
GreenIQ: A Deep Search Platform for Comprehensive Carbon Market Analysis and Automated Report Generation [0.0] GreenIQは、炭素市場のインテリジェンスに革命をもたらすために設計された、AIによるディープ検索プラットフォームである。
システムは構造化情報と非構造化情報のシームレスな統合とAIによる引用検証を実現する。
新たなAIペルソナベースの評価フレームワークは、その優れた断定的分析能力を強調している。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:19:43 GMT)
Graph of Effort: Quantifying Risk of AI Usage for Vulnerability Assessment [0.0] 非AI資産を攻撃するために使用されるAIは、攻撃的AIと呼ばれる。
高度な自動化や複雑なパターン認識など、その能力を利用するリスクは大幅に増大する可能性がある。
本稿では,攻撃的AIを敵による脆弱性攻撃に使用するために必要な労力を分析するための,直感的でフレキシブルで効果的な脅威モデリング手法であるGraph of Effortを紹介する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:52:42 GMT)
GazeSCRNN: Event-based Near-eye Gaze Tracking using a Spiking Neural Network [0.0] この研究は、イベントベースの近目視追跡用に設計された新しい畳み込みリカレントニューラルネットワークであるGazeSCRNNを紹介する。
モデル処理は、Adaptive Leaky-Integrate-and-Fire(ALIF)ニューロンと、時間データのためのハイブリッドアーキテクチャを使用して、DVSカメラからのイベントストリームを処理する。
最も正確なモデルは6.034degdegの平均角誤差(MAE)と2.094mmの平均角誤差(MPE)である。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:32:15 GMT)
Gadgets for simulating a non-native $XX$ interaction in quantum annealing [0.0] これらのガジェットは、$XX$インタラクションの実装と利用のための新しい経路を確立する。
我々は、このワンホットガジェットが、おもちゃの問題に対する摂動的交差を緩和できるかどうかを数値的に検証する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:17:51 GMT)
GRE^2-MDCL: Graph Representation Embedding Enhanced via Multidimensional Contrastive Learning [0.0] グラフ表現学習は、ノードをベクトル表現にマッピングする際にグラフトポロジを保存する強力なツールとして登場した。
現在のグラフニューラルネットワークモデルは、広範なラベル付きデータを必要とするという課題に直面している。
多次元コントラスト学習によるグラフ表現埋め込みを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:10:52 GMT)
From Stars to Molecules: AI Guided Device-Agnostic Super-Resolution Imaging [0.0] 超高解像度イメージングは、分子構造から遠い銀河までの研究に革命をもたらした。
既存の超解像法では、各撮像装置のキャリブレーションと再訓練が必要であり、実際の展開を制限している。
本稿では,光学系パラメータの校正データや明示的な知識を不要とする,点状エミッタの超高分解能イメージングのためのデバイス非依存のディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:15:36 GMT)
Fast, accurate, and error-resilient variational quantum noise spectroscopy [0.0] 本稿では、一般に実行される動的デカップリングに基づくコヒーレンス測定を処理する方法を提案する。
ダイヤモンド中の窒素空孔センサのノイズスペクトルを再構成するために,本手法を用いた。
提案手法のノイズスペクトル再構成により,従来考えられていなかった構造が明らかとなり,前例のない精度が得られた。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:41:43 GMT)
Excitonic Enhancement of Squeezed Light in Quantum-Optical High-Harmonic Generation From a Mott Insulator [0.0] モット絶縁系における励起子からの非古典応答について検討した。
その結果,エキシトンは非古典的応答において重要な役割を担い,エキシトンエネルギーでスクイーズを発生させることがわかった。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:15:33 GMT)
Exceptional stationary state in a dephasing many-body open quantum system [0.0] 我々は、無限温度状態と別の静止状態とを同時にホストする多体オープン量子システムについて研究する。
本稿では,2つの状態間の相互作用の運命に着目したモデルの定常性へのアプローチについて論じる。
オープンシステムフレームワークにおける量子多体傷として、これらの例外定常状態を考える理由を指摘する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:55:39 GMT)
Entanglement transitions in a boundary-driven open quantum many-body system [0.0] 本稿では,非平衡な量子多体系の大規模シミュレーションを可能にする数値的枠組みを提案する。
設計上、密度演算子陽性を保護し、絡み合いモノトンへの直接アクセスを提供する。
本稿では,境界駆動型XXZスピンチェーンというパラダイム的オープンシステム問題について検討する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 11:35:36 GMT)
Enhancing Software Quality Assurance with an Adaptive Differential Evolution based Quantum Variational Autoencoder-Transformer Model [0.0] 我々は適応微分進化に基づく量子変分オートエンコーダ変換モデル(ADE-QVAET)を開発した。
ADE-QVAETは、QVAET(Quantum Variational Autoencoder-Transformer)を組み合わせることで、高次元の潜伏特性を取得し、コンテキスト関係とともにシーケンシャルな依存関係を維持する。
提案されたADE-QVAETモデルは、トレーニングパーセンテージ(TP)90の98.08%、92.45%、94.67%、98.12%の精度、精度、リコール、f1スコアを達成する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:55:38 GMT)
Emission photon statistics in collectively interacting dipole atom arrays in the low-intensity limit [0.0] 低強度系におけるダイポールの相互作用系から放出される光の光子統計について検討する。
二重励起多様体の固有状態を分析することにより、アクセス可能な単励起固有モードとの接続を確立する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:29:56 GMT)
Efficient use of quantum computers for collider physics [0.0] 粒子衝突器の観測可能なほとんどのものは、様々な距離スケールの物理学を含む。
強い相互作用の自由のため、短距離での物理学は摂動法を用いて確実に計算できる。
長距離物理学は自然界では非摂動的である。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 18:00:01 GMT)
Effects of driven atomic ensemble on the output spectrum and entanglement of optomechanical system [0.0] 本稿では, 共振周波数で古典レーザー場によって駆動される2レベル原子の大きなアンサンブルを左空洞壁が構成する空洞QED系の間接駆動モデルについて考察する。
原子アンサンブルが出力強度スケズスペクトルおよび光学モードと機械モードの絡み合いに及ぼす影響について検討した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:24:48 GMT)
EarlyStopping: Implicit Regularization for Iterative Learning Procedures in Python [0.0] EarlyStopping-packageは、よく知られた反復推定手順のために、シーケンシャルな早期停止ルールのツールボックスを提供する。
パッケージの中心的な特徴の1つは、アルゴリズムが真のデータ生成プロセスの仕様を許容していることである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 23:53:01 GMT)
EPAM-Net: An Efficient Pose-driven Attention-guided Multimodal Network for Video Action Recognition [0.0] ポーズ駆動型注意誘導型マルチモーダルネットワーク(EPAM-Net)をビデオの認識のために提案する。
提案されたEPA-MNetは、浮動小数点演算(FLOP)の最大72.8倍、ネットワークパラメータの最大48.6倍の削減を提供する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:21:00 GMT)
Distributed Quantum Dense Coding Enhanced With Non-classical Routing [0.0] 我々は,コヒーレントに制御された符号化とルーティングによる高密度符号化が,標準の高密度符号化プロトコルよりも優れていることを発見した。
我々はプロトコルを任意の数の受信機に拡張し、その性能をグローバルデコード戦略の下で解析する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:11:32 GMT)
Disentangled and Interpretable Multimodal Attention Fusion for Cancer Survival Prediction [0.0] 癌生存予測を改善するために,Distangled and Interpretable Multimodal Attention Fusion (DIMAF)を提案する。
DIMAFは、注意に基づく融合機構の中で、モダリティ内およびモダリティ間相互作用を分離し、異なるモダリティ固有およびモダリティ共有表現を学習する。
4つの公立がん生存データセットでDIMAFを評価し,約1.85%の成績,23.7%の解離率の相対的な改善を達成した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 12:02:10 GMT)
DirectMultiStep: Direct Route Generation for Multistep Retrosynthesis [0.0] 本稿では,多段階合成経路を単一文字列として直接生成するために,専門家のアプローチを併用したトランスフォーマーモデルを提案する。
DMSエクスプローラーXLモデルは、PaRoutesデータセットの最先端メソッドよりも1.9倍、Top-1精度が3.1倍向上した。
我々のモデルは、トレーニングデータに含まれていないFDA承認薬物のルートを予測し、強力な一般化能力を示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 01:58:12 GMT)
Digital Asset Data Lakehouse. The concept based on a blockchain research center [0.0] 本稿では、堅牢でスケーラブルでセキュアなデータ管理プラットフォームへの需要を満たすために設計された、新しいソフトウェアアーキテクチャを紹介する。
我々は、そのコンポーネントやインタラクションを含むアーキテクチャ設計の詳細を説明し、ブロックチェーンデータとデジタル資産の管理における一般的な課題にどのように対処するかを議論する。
この結果から,提案アーキテクチャは分散データ管理の効率性とスケーラビリティを向上するだけでなく,研究領域におけるイノベーションの新たな道を開くことが示唆された。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 09:12:39 GMT)
Design and Implementation of an FPGA-Based Tiled Matrix Multiplication Accelerator for Transformer Self-Attention on the Xilinx KV260 SoM [0.0] トランスフォーマーベースのLLMは、計算の大部分を注意層とフィードフォワード層のための大きな行列乗算に費やしている。
本稿では,Xilinx KV260搭載FPGA上での処理に最適化されたタイル行列乗算アクセラレータを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 22:15:42 GMT)
Decoherence of solid-state spin qubits: a computational perspective [0.0] 第一原理シミュレーションは、異なる種類の固体電子スピンに対するスピンダイナミクスを予測する方法について論じる。
検証されたクラスタ手法が最近の実験結果の解釈にどのように役立つかを強調した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:55:32 GMT)
Deceptive Humor: A Synthetic Multilingual Benchmark Dataset for Bridging Fabricated Claims with Humorous Content [0.0] Deceptive Humor データセット (DHD) は、偽造されたクレームと誤情報から派生したユーモアを研究するための新しいリソースである。
DHDは、偽の物語から生成されたユーモアを注入したコメントで構成され、偽造されたクレームと操作された情報を取り入れている。
データセットは、英語、Telugu、Hindi、Kannada、Tamil、およびそれらのコード混合変種(Te-En、Hi-En、Ka-En、Ta-En)を含む複数の言語にまたがる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:58:02 GMT)
Cultivating Cybersecurity: Designing a Cybersecurity Curriculum for the Food and Agriculture Sector [0.0] 多くの農家や食品生産者は、業界に影響を与える脅威やリスクの増大を識別し緩和するために必要となるサイバーセキュリティ教育を欠いている。
本稿では、農業・農業社会における様々な人口を教育するサイバーセキュリティイニシアチブについて、現在進行中の研究成果について述べる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:17:11 GMT)
Corrective In-Context Learning: Evaluating Self-Correction in Large Language Models [0.0] In-context Learning (ICL) は、大規模言語モデル (LLM) をNLPタスクに用いた。
有効性にもかかわらず、ICLは特に挑戦的な例でエラーを起こしやすい。
提案手法は,モデルの不正確な予測と地上の真偽の補正を併用する手法であるCICL(Corative In-Context Learning)を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:39:39 GMT)
Comparative Analysis of Deep Learning Models for Real-World ISP Network Traffic Forecasting [0.0] この研究は、最近発表された総合的な実世界のネットワークトラフィックデータセットであるCESNET-TimeSeries24上で、最先端のディープラーニングモデルを評価する。
その結果,予測精度と計算効率のバランスは,ネットワークの粒度によって異なることがわかった。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 21:04:20 GMT)
Bichromatic microwave manipulation of the NV center nuclear spin using transition not detectable via optically detected magnetic resonance [0.0] コヒーレント集団トラップによる核スピンのコヒーレント操作は、同位体的に純粋なダイヤモンドでうまく実証されている。
この発見は、自然発生の炭素13を持つダイヤモンドプレートにおいても、コヒーレント核スピン制御が実現可能であることを確認する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 07:26:48 GMT)
Ballistic Entanglement Cloud after a Boundary Quench [0.0] 絡み合いは強く相関した多体系の構造を特徴づけるために広く用いられている。
強く相関した多体系における絡み合いの空間的・時間的分析について考察する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 21:41:43 GMT)
Autonomous AI imitators increase diversity in homogeneous information ecosystems [0.0] 本稿では,ニュースにおけるAIによる模倣を調べるための大規模シミュレーションフレームワークを提案する。
我々は、AI生成した記事がコンテンツを均一に均質化しないことを示す。
その代わり、AIの影響は強い文脈依存である。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:37:29 GMT)
Automating 3D Dataset Generation with Neural Radiance Fields [0.0] パフォーマンス検出モデルのトレーニングには、多様な、正確に注釈付けされた、大規模なデータセットが必要である。
任意のオブジェクトに対する3Dデータセットの自動生成のためのパイプラインを提案する。
私たちのパイプラインは速く、使いやすく、高度な自動化があります。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 10:01:32 GMT)
Automated Selfish Mining Analysis for DAG-based PoW Consensus Protocols [0.0] 利己的なマイニングは、仕事の証明プロトコルにおける報酬を最大化するための戦略的なルール破りである。
本稿では,Proof-of-Work,GhostDAG,Parallel Proof-Workなど,幅広いプロトコルをカバーする汎用攻撃モデルを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 21:53:54 GMT)
Asymptotic non-linear shrinkage and eigenvector overlap for weighted sample covariance [0.0] 我々は、Ledoit と P'ech'e の精神における非線形収縮公式を計算する。
非線形収縮推定器の性能を示し、それらの式を数値計算するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:52:32 GMT)
Are AI Agents interacting with Online Ads? [0.0] 本研究では、異なるAIエージェントがオンライン広告とどのように相互作用するか、広告を意思決定プロセスに組み込むか、どの広告フォーマットが最も効果的かを検討する。
我々は,OpenAI GPT-4o, Anthropic Claude, Google Gemini 2.0 Flashなどのマルチモーダル言語モデルを用いた実験を通じて,インタラクションパターン,クリック行動,意思決定戦略を分析した。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 08:38:57 GMT)
Applications of Large Language Model Reasoning in Feature Generation [0.0] 大規模言語モデル(LLM)は、その技術推論能力を通じて自然言語処理に革命をもたらした。
本稿では,LLM推論手法の収束と,機械学習タスクの機能生成について考察する。
本論文は、金融、医療、テキスト分析など、さまざまな分野にまたがるLLMベースの特徴生成手法を分類する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 02:18:33 GMT)
Anti Kibble-Zurek behavior in the quantum XY spin-1/2 chain driven by correlated noisy magnetic field and anisotropy [0.0] 量子相転移の非断熱力学において、キブル・ズレークのパラダイムは、トポロジカルな欠陥の平均数は、クエンチ時間スケールを持つ普遍的なパワー則として抑制されていることを記述している。
ここでは、相関(色)ノイズの存在下での駆動横場/異方性量子$XY$モデルにおける欠陥発生について検討する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:56:41 GMT)
Anomalous dependence of sensitivity on observation time caused by memory retention in the time crystal [0.0] 本研究では,リング共振器と相互作用する複合原子空洞系について考察する。
系の摂動に対する感度の2次的な観測時間依存性は、結晶状態において起こることを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 06:47:41 GMT)
An experimental investigation of quantum frequency correlations resilience against white and colored noise [0.0] 量子ゴースト分光器における白色と色の雑音の影響について検討する。
白色雑音に対して常に頑健であるのに対して,カラーノイズはプロセスに大きな影響を与える。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:36:01 GMT)
Affective Polarization Amongst Swedish Politicians [0.0] 本研究では,2021年から2023年までのスウェーデンの政治家のTwitter上での感情分極について検討した。
グループ内が党レベルで定義されると、否定的な党派が圧倒的に支配的になる。
否定的な党派は、オンラインの可視性にとって戦略的選択であることを証明し、3.18以上のお気に入りと1.69以上のリツイートを惹きつける。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:40:48 GMT)
Advanced Prediction of Hypersonic Missile Trajectories with CNN-LSTM-GRU Architectures [0.0] 本稿では,畳み込みニューラルネットワーク(CNN),Long Short-Term Memory(LSTM)ネットワーク,Gated Recurrent Units(GRU)を統合した新しいハイブリッドディープラーニング手法を提案する。
これらのアーキテクチャの強みを活用することにより、提案手法は高音速ミサイルの複雑な軌道を高精度に予測することに成功した。
本研究は、防衛システムの予測能力を高めるための高度な機械学習技術の可能性を実証する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:31:41 GMT)
A trilinear quantum dot architecture for semiconductor spin qubits [0.0] 本稿では,各量子ドットへの個別の配線を可能としながら,物理配置において簡便なトリ線形量子ドットアレイを提案する。
電子シャットリングにより、トリリニアアーキテクチャは2次元の正方格子と同等かそれ以上の量子ビット接続を提供する。
また、量子ビットチップを低消費電力スイッチベースのCryoCMOS回路と3D統合して並列量子ビット演算を行うスケーラブルな制御方式を提案する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 16:49:26 GMT)
A theory of quasiballistic spin transport [0.0] 準弾道スピン輸送(Quasiballistic spin transport)は、磁化密度の長寿命かつ過渡的に弾道モードである。
このような準球論的なスピン輸送の解析理論を開発する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 00:18:33 GMT)
A preliminary data fusion study to assess the feasibility of Foundation Process-Property Models in Laser Powder Bed Fusion [0.0] 基礎プロセスプロパティモデルの構築を妨げる大きな課題は、データの不足である。
レーザー粉末層融合(LPBF)における17-4 PHおよび316Lステンレス鋼(SS)から実験データセットを生成する。
次に、ガウス過程(GP)を様々な構成のプロセス固有性モデリングに利用し、ある物質系や性質に関する知識を活用できるかどうかを検証し、他の物質系や特性のためのより正確な機械学習モデルを構築する。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 19:29:38 GMT)
A foundational derivation of quantum weak values and time-dependent density functional theory [0.0] 時間依存密度汎関数論の方程式は、リングポリマー量子論から量子弱値の式を通して導かれる。
有限温度力学の式も平衡方程式の極限を用いて導出される。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 17:58:57 GMT)
A discrete Fourier transform based quantum circuit for modular multiplication in Shor's algorithm [0.0] モジュラー指数化のための量子回路を提案する。
我々の提案のゲート複雑度は$O(L3)$であり、ここで L は分解される数を保存するのに必要なビット数である。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 14:31:05 GMT)
A Sufficient Criterion for Divisibility of Quantum Channels [0.0] 我々は、ある量子チャネル$Phi$が割り切れることを保証する、単純で次元に依存しない基準を示す。
まず "elementary" チャネル $Phi$ を定義し、次に $PhiPhi$-1$ が完全に正であるかどうかを分析する。
この方法で得られる十分条件は、$Phi$ の明示的な分解さえも得るが、$langle xperp|mathcal K_Phimathcal K_Phiperp|x のようなベクトルを見つける必要があることである。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 15:11:36 GMT)
A Non-Hermitian State-to-State Analysis of Transport in Aggregates with Multiple Endpoints [0.0] 本稿では,特定のトラップに特有の創発的時間スケールと抽出量の計算に,数値的に正確なアプローチを提案する。
この手法は、オープン量子系における輸送経路の理解と解明に重要なリンクとなる。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:02:54 GMT)
A Monte Carlo Tree Search approach to QAOA: finding a needle in the haystack [0.0] 変分量子アルゴリズム(VQA)は、短期量子ハードウェアの限られた能力に対応するために設計された、ハイブリッド量子古典法の一種である。
本稿では,正規パラメータパターンの活用が決定木構造に深く影響し,フレキシブルかつノイズ耐性のある最適化戦略を可能にすることを示す。
論文参考訳(メタデータ) (Thu, 20 Mar 2025 13:39:54 GMT)