Cosmos World Foundation Model Platform for Physical AI [136.1] 私たちは、開発者が物理AIセットアップのためにカスタマイズされた世界モデルを構築するのを助けるために、Cosmos World Foundation Model Platformを紹介します。
我々のプラットフォームは、ビデオキュレーションパイプライン、事前訓練された世界ファンデーションモデル、事前訓練された世界ファンデーションモデルのポストトレーニング例、ビデオトークン化ツールをカバーしています。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:59:07 GMT)
Data Selection via Optimal Control for Language Models [134.7] 本研究は,大規模コーパスから高品質な事前学習データを選択することにより,下流利用におけるLMの能力を向上させることを目的とする。
PMP条件を解くことで最適なデータ選択を近似するフレームワークであるPMPベースのデータ選択(PDS)を導入する。
PDSの利点は、スケーリング法則に従ってテスト損失曲線の外挿によって証明されたように、10Tトークンでトレーニングされた400Bモデルにまで拡張される。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 23:52:27 GMT)
GR00T N1: An Open Foundation Model for Generalist Humanoid Robots [134.0] 汎用ロボットには多目的体と知的な心が必要だ。
近年のヒューマノイドロボットの進歩は、汎用的な自律性を構築するためのハードウェアプラットフォームとして大きな可能性を秘めている。
我々はヒューマノイドロボットのオープン基盤モデルであるGR00T N1を紹介する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 21:06:21 GMT)
VISCO: Benchmarking Fine-Grained Critique and Correction Towards Self-Improvement in Visual Reasoning [112.4] 我々は,LVLMの細粒度評価と補正能力を広範囲に解析する最初のベンチマークであるVISCOを提案する。
VISCOは密度が高くきめ細かな批判を特徴とし、LVLMは各ステップの正しさを評価する必要がある。
LookBackは、批評と修正のパフォーマンスを最大13.5%改善する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:02:22 GMT)
Curriculum Direct Preference Optimization for Diffusion and Consistency Models [110.1] テキスト・ツー・イメージ・ジェネレーションのためのカリキュラム学習に基づくDPOの新しい拡張版を提案する。
我々のアプローチであるCurriculum DPOは、9つのベンチマークにおける最先端の微調整アプローチと比較される。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:03:48 GMT)
DAGSM: Disentangled Avatar Generation with GS-enhanced Mesh [102.8] DAGSMは、与えられたテキストプロンプトから歪んだ人体と衣服を生成する新しいパイプラインである。
まず着ていない体を作り、次に体に基づいて個々の布を生成します。
実験では、DAGSMは高品質なアンタングルアバターを生成し、衣服の交換とリアルなアニメーションをサポートし、視覚的品質においてベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:14:15 GMT)
Cosmos-Transfer1: Conditional World Generation with Adaptive Multimodal Control [98.2] 複数の空間制御入力に基づいて世界シミュレーションを生成する条件付き世界生成モデルであるCosmos-Transferを導入する。
提案したモデルを解析し,ロボット2Realや自律走行車データ豊かさを含む物理AIへの応用を実証するために評価を行う。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:57:54 GMT)
Multi-view Reconstruction via SfM-guided Monocular Depth Estimation [92.9] マルチビュー幾何再構成のための新しい手法を提案する。
深度推定プロセスに、より強力なマルチビューであるSfM情報を組み込む。
本手法は, 従来の単分子深度推定法と比較して, 深度推定の精度を著しく向上させる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:54:06 GMT)
Don't lie to your friends: Learning what you know from collaborative self-play [90.4] 我々は、AIエージェントが知っていることを教えるために、根本的に新しいアプローチを提案する。
我々は,集団が正解に到達して報奨を受けるマルチエージェントコラボレーションを構築した。
望ましいメタ知識は、相互作用の構造に組み込まれたインセンティブから生まれる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:53:20 GMT)
R1-Searcher: Incentivizing the Search Capability in LLMs via Reinforcement Learning [87.3] textbfR1-Searcherは、大規模言語モデルの検索能力を高めるために設計された、2段階の結果に基づく新しいRLアプローチである。
本フレームワークは, コールドスタート時に, プロセス報酬や蒸留を必要とせず, RLのみに依存している。
提案手法は, クローズドソースGPT-4o-miniと比較して, 従来の強力なRAG法よりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:32:24 GMT)
DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers [86.6] DiffMoEはバッチレベルのグローバルトークンプールで、トレーニング中に専門家がグローバルトークンの配布にアクセスできるようにする。
ImageNetベンチマークの拡散モデル間での最先端のパフォーマンスを実現する。
このアプローチの有効性は、クラス条件生成を超えて、テキスト・ツー・イメージ生成のようなより困難なタスクにも及んでいる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:57:07 GMT)
Towards Self-Improving Systematic Cognition for Next-Generation Foundation MLLMs [86.2] MLLM(Multimodal Large Language Models)は、微粒な認識と複雑な推論を伴う課題に直面する。
主流のマルチモーダル事前学習アプローチは、高品質な画像キャプションのトレーニングによる知覚の向上に焦点を当てている。
本稿では,次世代MLLMを構築するための自己学習フレームワークである自己改善認知(SIcog)を紹介する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:42:31 GMT)
Rethinking End-to-End 2D to 3D Scene Segmentation in Gaussian Splatting [86.2] We design an new end-to-end object-aware lifting approach, called Unified-Lift。
コントラスト損失を用いて学習したガウスレベルの機能を各ガウス点に拡張し、インスタンス情報をエンコードする。
LERF-Masked、Replica、Messy Roomsの3つのベンチマークで実験を行った。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:42:23 GMT)
SketchFusion: Learning Universal Sketch Features through Fusing Foundation Models [80.9] 体系的な分析に基づいて、スケッチ理解のための基礎モデルの2つの基本的な限界を明らかにする。
SDとCLIPを戦略的に組み合わせることで,これらの制約に対処する。
CLIPの機能をSDのデノナイズプロセスに動的に注入し,セマンティックレベルでの機能を適応的に集約することにより,スケッチ検索における最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:47:46 GMT)
Validation of Human Pose Estimation and Human Mesh Recovery for Extracting Clinically Relevant Motion Data from Videos [79.6] 人間のポーズ推定を用いたマーカーレスモーションキャプチャは、IMUとMoCapのキネマティクスの結果とインラインで結果を生成する。
生成するデータの品質に関してはまだ改善の余地がありますが、この妥協はエラーの部屋にあると考えています。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 22:18:33 GMT)
Bolt3D: Generating 3D Scenes in Seconds [77.6] 1つ以上の画像が与えられた場合、Bolt3Dは1つのGPU上で7秒以内で直接3Dシーン表現をサンプリングします。
3次元再構成のためのシーンごとの最適化を必要とする従来のマルチビュー生成モデルと比較して、Bolt3Dは推論コストを最大300倍に削減する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:24:19 GMT)
Cosmos-Reason1: From Physical Common Sense To Embodied Reasoning [77.3] 物理的なAIシステムは、物理的な世界で複雑な行動を知覚し、理解し、実行する必要がある。
物理世界を理解するためのモデルを提案する。
私たちは、空間、時間、物理学に関する基本的な知識を捉える階層的オントロジーを使用します。
具体的推論では、異なる物理的実施形態をまたいで一般化する2次元オントロジーに依存している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 22:06:58 GMT)
Tracking Meets Large Multimodal Models for Driving Scenario Understanding [76.7] 大規模マルチモーダルモデル(LMM)は、最近自動運転研究で注目されている。
本稿では3次元の空間的・時間的詳細を復元するための追加入力として追跡情報を統合することを提案する。
本稿では,この追跡情報をLMMに埋め込んで,運転シナリオの理解を深めるための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:59:12 GMT)
EnvBench: A Benchmark for Automated Environment Setup [76.0] 大規模言語モデルにより、研究者はソフトウェア工学領域における実用的なリポジトリレベルのタスクに集中できるようになった。
環境設定に関する既存の研究は革新的なエージェント戦略を導入しているが、その評価は小さなデータセットに基づいていることが多い。
このギャップに対処するため、包括的環境設定ベンチマークEnvBenchを紹介します。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:19:12 GMT)
TFG-Flow: Training-free Guidance in Multimodal Generative Flow [73.9] 本稿では,マルチモーダルな生成フローのためのトレーニング不要指導法TFG-Flowを紹介する。
TFG-Flowは、離散変数の導出において、非バイアスサンプリングの特性を維持しながら、次元の呪いに対処する。
TFG-Flowは, 所望の特性を持つ分子を生成することにより, 薬物設計において大きな可能性を秘めている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:30:25 GMT)
UniGoal: Towards Universal Zero-shot Goal-oriented Navigation [68.5] 汎用的なゼロショットゴール指向ナビゲーションのための一般的なフレームワークを提案する。
本稿では,オブジェクトカテゴリ,インスタンスイメージ,テキスト記述など,異なる目標を統一する一様グラフ表現を提案する。
我々のUniGoalは、3つの研究されたナビゲーションタスクに対して1つのモデルで最先端のゼロショット性能を実現する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:07:07 GMT)
Stable Virtual Camera: Generative View Synthesis with Diffusion Models [67.3] 本稿では,シーンの新たなビューを生成する汎用拡散モデルであるスタブルバーチャルカメラ(Seva)を紹介する。
このアプローチは、シンプルなモデル設計、最適化されたトレーニングレシピ、柔軟なサンプリング戦略によってこれらの制限を克服する。
提案手法では,シームレスなループ閉鎖により,最大半分間の高品質なビデオを生成することができる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:57:22 GMT)
VEGGIE: Instructional Editing and Reasoning Video Concepts with Grounded Generation [67.3] 本稿では,VEGGIEを紹介する。VEGGIEは,多様なユーザインストラクションに基づいて,ビデオコンセプトの編集,グラウンド化,推論を統一する,シンプルなエンドツーエンドフレームワークである。
VEGGIEは、異なる編集スキルを持つ指導ビデオ編集において高い性能を示し、汎用モデルとして最高の指導ベースラインを達成している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:31:12 GMT)
Unlocking State-Tracking in Linear RNNs Through Negative Eigenvalues [65.4] Mamba、RWKV、GLA、mLSTM、DeltaNetは、長いシーケンスでTransformerの効率的な代替手段として登場した。
しかし、TransformerとLRNNはどちらも状態追跡に苦労しており、コード評価などのタスクではパフォーマンスを損なう可能性がある。
本研究では,Mamba と DeltaNet の固有値範囲を負の値を含むように拡張することで,状態追跡タスクの性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:13:18 GMT)
UniMamba: Unified Spatial-Channel Representation Learning with Group-Efficient Mamba for LiDAR-based 3D Object Detection [64.7] LiDAR 3D検出の最近の進歩は、ポイントクラウド空間からグローバルな依存関係をキャプチャするTransformerベースのフレームワークの有効性を示している。
トランスフォーマーのかなりの数の3Dボクセルと二次的な複雑さのため、トランスフォーマーに供給する前に複数のシーケンスがグループ化され、受容野が制限される。
2次元視覚タスクの分野で達成された状態空間モデル(SSM)の印象的な性能に触発されて、我々は新しい統一マンバ(UniMamba)を提案する。
特に、UniMambaブロックは、主にローカリティモデリング、Zオーダーシリアライゼーション、局所グローバルシーケンシャルアグリゲータで構成されている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:27:50 GMT)
RepoGraph: Enhancing AI Software Engineering with Repository-level Code Graph [63.9] RepoGraphは、現代のAIソフトウェアエンジニアリングソリューションのためのリポジトリレベルの構造を管理するプラグインモジュールである。
RepoGraphはすべてのシステムのパフォーマンスを大幅に向上させ、オープンソースフレームワークの間で新たな最先端技術を生み出している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:26:58 GMT)
Dual Conditional Diffusion Models for Sequential Recommendation [63.8] シーケンスレコメンデーションのための二重条件拡散モデル(DCRec)を提案する。
DCRecは2つの条件を前と逆の拡散プロセスに埋め込むことで暗黙的および明示的な情報を統合する。
これによってモデルは、明示的なユーザ-イテムインタラクションを活用してレコメンデーションプロセスをガイドしながら、価値あるシーケンシャルおよびコンテキスト情報を保持することができる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:42:54 GMT)
HA-VLN: A Benchmark for Human-Aware Navigation in Discrete-Continuous Environments with Dynamic Multi-Human Interactions, Real-World Validation, and an Open Leaderboard [63.5] VLN(Vision-and-Language Navigation)システムは、離散(パノラマ)または連続(フリーモーション)のパラダイムのみに焦点を当てることが多い。
我々は、これらのパラダイムを明示的な社会的認識制約の下でマージする統合されたヒューマン・アウェアVLNベンチマークを導入する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:05:55 GMT)
Towards Neural Scaling Laws for Time Series Foundation Models [63.5] 我々は、エンコーダオンリーとデコーダオンリーのトランスフォーマーの2つの一般的なTSFMアーキテクチャについて検討し、IDおよびOODデータのスケーリング挙動について検討する。
実験の結果,TSFMのログライクな損失はOODとID設定の両方で同様のスケーリング挙動を示すことがわかった。
モデル機能を強化した大規模TSFMの設計とスケーリングのための実用的なガイドラインを提供する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:54:45 GMT)
DAPO: An Open-Source LLM Reinforcement Learning System at Scale [63.2] 我々は,Qwen2.5-32Bベースモデルを用いて,AIME 2024上で50ポイントを達成できる最先端の大規模RLシステムをオープンソース化した。
さらに,verlフレームワーク上に構築されたトレーニングコードと,慎重にキュレートされた,処理されたデータセットもオープンソースとして公開しています。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:49:06 GMT)
Aligning Multimodal LLM with Human Preference: A Survey [62.9] 大規模言語モデル(LLM)は、タスク固有のトレーニングを必要とせずに、単純なプロンプトで幅広い汎用タスクを処理できる。
MLLM(Multimodal Large Language Models)は、視覚的、聴覚的、テキスト的データを含む複雑なタスクに対処する大きな可能性を実証している。
しかし、真理性、安全性、o1のような推論、および人間の嗜好との整合性に関する重要な問題は未解決のままである。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:59:56 GMT)
DIFFVSGG: Diffusion-Driven Online Video Scene Graph Generation [61.6] DIFFVSGGはオンラインのVSGGソリューションで、このタスクを反復的なシーングラフ更新問題とみなしている。
オブジェクト分類の復号化、境界ボックス回帰、グラフ生成の3つのタスクを1つの共有特徴埋め込みを用いて統合する。
DIFFVSGGはさらに、後続のフレームの予測が過去のフレームの結果をLCMの条件入力として活用する継続的時間的推論を促進する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:49:51 GMT)
DeepPerception: Advancing R1-like Cognitive Visual Perception in MLLMs for Knowledge-Intensive Visual Grounding [61.3] 人間の専門家は、ドメイン知識を活用して知覚的特徴を洗練することによって、きめ細かい視覚的識別に長けている。
現在のMLLM(Multimodal Large Language Models)は、推論を視覚的知覚に統合するのに苦労している。
本稿では,認知的視覚能力を強化したMLLMであるDeepPerceptionを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:06:22 GMT)
One-for-More: Continual Diffusion Model for Anomaly Detection [61.1] 異常検出法は拡散モデルを用いて任意の異常画像が与えられたときの正常サンプルの生成または再構成を行う。
われわれは,拡散モデルが「重度忠実幻覚」と「破滅的な忘れ」に悩まされていることを発見した。
本研究では,安定な連続学習を実現するために勾配予測を用いた連続拡散モデルを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:32:47 GMT)
Towards Practical Real-Time Neural Video Compression [60.4] 我々は,高圧縮比,低レイテンシ,広範汎用性を実現するために設計された実用的リアルタイムニューラルビデオ(NVC)を紹介する。
実験により,提案したDCVC-RTは1080pビデオに対して125.2/112.8フレーム(毎秒125.2/112.8フレーム)の高速符号化を実現し,H.266/VTMと比較して21%のfpsを節約できた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:39:00 GMT)
Prosody-Enhanced Acoustic Pre-training and Acoustic-Disentangled Prosody Adapting for Movie Dubbing [60.4] 高精度な韻律アライメントで高品質なダビング生成を実現するために,音響プロソディディスト2段法を提案する。
我々は、異なる映画における視覚領域シフトの影響を低減するために、ドメイン内感情分析モジュールを組み込んだ。
提案手法は,2つのベンチマークにおける最先端モデルに対して良好に機能する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:51:00 GMT)
BG-Triangle: Bézier Gaussian Triangle for 3D Vectorization and Rendering [60.2] 微分レンダリングは、レンダリングプロセスを通じて勾配を計算できるようにすることで、効率的な最適化を可能にする。
既存の解は、滑らかで確率的プロキシを使って従来のレンダリング操作を近似または再定式化する。
本稿では,B'ezier三角形に基づくベクトルグラフィックスプリミティブとガウス確率モデルを組み合わせたハイブリッド表現を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:53:52 GMT)
DreamRunner: Fine-Grained Compositional Story-to-Video Generation with Retrieval-Augmented Motion Adaptation [60.1] 本研究では,新しいストーリー・ツー・ビデオ生成手法であるDreamRunnerを提案する。
大規模言語モデル(LLM)を用いて入力スクリプトを構築し、粗粒度シーン計画と細粒度オブジェクトレベルのレイアウトと動き計画の両方を容易にする。
DreamRunnerは、検索拡張されたテストタイムアダプションで、各シーンのオブジェクトのターゲットモーションをキャプチャし、検索されたビデオに基づいたさまざまなモーションカスタマイズをサポートする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:19:15 GMT)
Limitations of the decoding-to-LPN reduction via code smoothing [59.9] 研究者は、ノイズ問題を伴う学習パリティのアルゴリズム的難しさを実証しようと試みている。
復号化問題とプリミティブ問題のパラメータの観点から,削減の効率を特徴付ける。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:42:23 GMT)
Creation-MMBench: Assessing Context-Aware Creative Intelligence in MLLM [59.9] Creation-MMBenchはマルチモーダル大言語モデルの創造性を評価するために設計されたベンチマークである。
ベンチマークは、51のきめ細かいタスクにまたがる765のテストケースで構成されている。
実験結果から,オープンソースのMLLMは,クリエイティブタスクにおけるプロプライエタリなモデルに比べて著しく性能が劣っていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:51:34 GMT)
TCSinger: Zero-Shot Singing Voice Synthesis with Style Transfer and Multi-Level Style Control [59.0] スタイル転送とスタイル制御を備えたゼロショット歌唱音声合成(SVS)は、目に見えない音色とスタイルで高品質な歌唱音声を生成することを目的としている。
言語間音声および歌唱スタイル間のスタイル伝達のための,最初のゼロショットSVSモデルであるTCSingerを紹介する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:03:25 GMT)
SpaceVLLM: Endowing Multimodal Large Language Model with Spatio-Temporal Video Grounding Capability [58.5] 大規模言語モデル (LMLM) は時間的あるいは空間的局所化において顕著な進歩を遂げた。
しかし、彼らは時間的なビデオグラウンドの実行に苦慮している。
時間的ビデオグラウンドティングを具備したMLLMであるSpaceLMを紹介する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:40:36 GMT)
Free-Lunch Color-Texture Disentanglement for Stylized Image Generation [58.4] 本稿では,タイマライズされたT2I生成において,フリーランチなカラーテクスチャ・ディコンタングルを実現するための,最初のチューニング自由アプローチを提案する。
生成した画像の色パレットが色基準と密接に一致していることを確認するため、白と彩色変換を適用する。
WikiArtとStyleDropのデータセットの画像に対する実験は、SADisがDisIGタスクの最先端化方法を上回ることを実証している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:10:43 GMT)
ChatBEV: A Visual Language Model that Understands BEV Maps [58.3] 我々は137k以上の質問を含む新しいBEV VQAベンチマークであるChatBEV-QAを紹介する。
このベンチマークは、BEVマップ用のスケーラブルで情報性の高いVQAデータを生成する、新しいデータ収集パイプラインを使用して構築されている。
本稿では,ChatBEVが地図理解とテキスト対応ナビゲーションを支援する言語駆動の交通シーン生成パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:12:38 GMT)
RBFIM: Perceptual Quality Assessment for Compressed Point Clouds Using Radial Basis Function Interpolation [58.0] ポイントクラウド圧縮(PCC)の主な課題の1つは、知覚的品質にRBを最適化できるように、認識された歪みを評価する方法である。
本稿では、放射基底関数(RBF)を用いて離散点特徴を歪み点雲の連続特徴関数に変換する新しい評価法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:25:55 GMT)
Bayesian Circular Regression with von Mises Quasi-Processes [57.9] 本研究では、円値ランダム関数上の表現的および解釈可能な分布の族を探索する。
後部推論のために,高速ギブズサンプリングに寄与するストラトノビッチ様拡張法を導入する。
本研究では,このモデルを用いて風向予測と走行歩行周期のパーセンテージを関節角度の関数として適用する実験を行った。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 21:27:01 GMT)
BurTorch: Revisiting Training from First Principles by Coupling Autodiff, Math Optimization, and Systems [56.2] BurTorchは、単一ノードワークステーション上でのディープラーニング(DL)トレーニングを最適化するために設計された、コンパクトな高性能フレームワークである。
BurTorchは最小限の設計を採用し、これらの状況下では、古典的なコンパイルされたプログラミング言語がDL研究において重要な役割を果たすことを証明している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 00:52:12 GMT)
Timestep Embedding Tells: It's Time to Cache for Video Diffusion Model [55.6] Timestep Embedding Aware Cache (TeaCache)は、タイムステップ間のモデルアウトプットの変動を推定し、活用する、トレーニング不要なキャッシュアプローチである。
TeaCacheはOpen-Sora-Plan上で最大4.41倍の高速化を実現している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:49:23 GMT)
SCM: Enhancing Large Language Model with Self-Controlled Memory Framework [54.3] 大きな言語モデル(LLM)は、長い入力を処理できないため、重要な歴史的情報が失われる。
本稿では,LLMが長期記憶を維持し,関連する情報をリコールする能力を高めるための自己制御メモリ(SCM)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:16:56 GMT)
Decision Tree Induction Through LLMs via Semantically-Aware Evolution [53.0] 遺伝的プログラミング(GP)に基づく決定木誘導のための進化的最適化手法を提案する。
私たちの重要なイノベーションは、セマンティックな事前情報と、検索空間に関するドメイン固有の知識をアルゴリズムに統合することです。
これは、構造化された自然言語プロンプトを扱う新しい遺伝子操作子によって操作される。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:52:03 GMT)
CTSR: Controllable Fidelity-Realness Trade-off Distillation for Real-World Image Super Resolution [52.9] 実世界の画像超解像は、2つの重要な評価基準が元の画像への忠実さと生成された結果の視覚的現実性である、重要な画像処理タスクである。
本稿では,複数の教師モデルの性能上の利点とともに,忠実度と現実性の両方を幾何学的に分解する蒸留方式を提案する。
いくつかの実世界の画像超解像ベンチマークで行った実験により,本手法が既存の最先端手法を超越していることが証明された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:06:39 GMT)
Evolution-based Region Adversarial Prompt Learning for Robustness Enhancement in Vision-Language Models [52.9] 本稿では,ER-APTと呼ばれる進化型領域逆アプティブチューニング手法を提案する。
各トレーニングイテレーションでは、まず従来の勾配法を用いてAEを生成する。
次に、AEsを最適化するために、選択、突然変異、交差を含む遺伝的進化機構を適用する。
最終進化型AEは、従来の単点対向的な高速チューニングの代わりに、地域ベースの対向最適化を実現するために用いられる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:58:59 GMT)
Learning on LLM Output Signatures for gray-box LLM Behavior Analysis [52.8] 大きな言語モデル(LLM)は広く採用されていますが、その振る舞いに対する私たちの理解は限定的です。
我々は,既存の手法の近似を理論的に保証するプロセスに対して,トランスフォーマーに基づくアプローチを開発する。
提案手法は,グレーボックス設定における幻覚およびデータ汚染検出における優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:04:37 GMT)
Multi-Modal Self-Supervised Semantic Communication [52.8] 本稿では,マルチモーダルな自己教師型学習を活用し,タスク非依存の特徴抽出を強化するマルチモーダルセマンティックコミュニケーションシステムを提案する。
提案手法は,訓練関連通信オーバーヘッドを最小限に抑えつつ,モダリティの不変性とモダリティ特有の特徴の両方を効果的に捉えている。
この結果は、セマンティックコミュニケーションにおけるマルチモーダルな自己教師型学習の利点を浮き彫りにし、より効率的でスケーラブルなエッジ推論システムへの道を開いた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:13:02 GMT)
Calibrating Verbal Uncertainty as a Linear Feature to Reduce Hallucinations [51.9] LLMの表現空間における1つの線形特徴によって「動詞の不確実性」が支配されることがわかった。
これはモデルの実際の意味的不確実性と適度な相関しか持たないことを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:51:04 GMT)
RFMI: Estimating Mutual Information on Rectified Flow for Text-to-Image Alignment [51.9] フローマッチングフレームワークでトレーニングされたRectified Flow (RF)モデルは、Text-to-Image (T2I)条件生成における最先端のパフォーマンスを達成した。
しかし、複数のベンチマークでは、合成画像はプロンプトとの整合性に乏しいことが示されている。
RFMI(Mutual Information (MI) 推定器) を導入し,MI推定に事前学習モデル自体を用いる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:41:45 GMT)
Stitch-a-Recipe: Video Demonstration from Multistep Descriptions [51.3] マルチステップ記述からビデオデモを組み立てる新しい検索手法であるStitch-a-Recipeを提案する。
得られたビデオには、すべてのステップ記述を正確に反映したクリップが含まれており、視覚的に一貫性がある。
Stitch-a-Recipeは最先端のパフォーマンスを実現し、人間の嗜好調査では24%まで上昇し、劇的な勝利となった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:57:48 GMT)
SPEQ: Offline Stabilization Phases for Efficient Q-Learning in High Update-To-Data Ratio Reinforcement Learning [51.1] 強化学習(RL)における高アップデート・トゥ・データ(UTD)比のアルゴリズムは、サンプル効率を改善するが、高い計算コストを伴い、現実世界のスケーラビリティを制限している。
我々は、低UTDオンライントレーニングと周期的オフライン安定化フェーズを組み合わせたRLアルゴリズムである、効率的なQ-Learningのためのオフライン安定化フェーズ(SPEQ)を提案する。
これらのフェーズでは、Q-関数は固定されたリプレイバッファ上で高いUTD比で微調整され、サブ最適データの冗長な更新が削減される。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:54:07 GMT)
Is JPEG AI going to change image forensics? [50.9] ニューラル画像圧縮に基づく新しいJPEGAI標準の反法医学的効果について検討する。
その結果,JPEG AIで処理したコンテンツの解析において,先行する法医学的検知器の性能が低下していることが示唆された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:34:40 GMT)
Generative AI in Transportation Planning: A Survey [50.9] 我々は、交通計画においてGenAIを活用するための最初の包括的枠組みを提示する。
交通計画の観点から, 記述的, 予測的, 生成的, シミュレーション, 説明可能なタスクの自動化におけるGenAIの役割を検討する。
データ不足、説明可能性、バイアス軽減、ドメイン固有の評価フレームワークの開発など、重要な課題に対処する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:03:23 GMT)
Causal Discovery from Data Assisted by Large Language Models [50.2] 知識駆動発見のために、実験データと事前のドメイン知識を統合することが不可欠である。
本稿では、高分解能走査透過電子顕微鏡(STEM)データと大規模言語モデル(LLM)からの洞察を組み合わせることで、このアプローチを実証する。
SmドープBiFeO3(SmBFO)におけるChatGPTをドメイン固有文献に微調整することにより、構造的、化学的、分極的自由度の間の因果関係をマッピングするDAG(Directed Acyclic Graphs)の隣接行列を構築する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:14:49 GMT)
Uncertainty-Aware Hybrid Inference with On-Device Small and Remote Large Language Models [49.5] ハイブリッド言語モデル(HLM)アーキテクチャは、モバイル端末で動作する小さな言語モデル(SLM)と、無線ネットワークの基地局(BS)にホストされる大きな言語モデル(LLM)を統合する。
HLMトークン生成プロセスは、投機的推論の原則に従っている: SLMの語彙分布はLSMにアップロードされ、LPMによって再サンプリングされる。
本研究では,不確実性を考慮したHLM (Uncertainty-aware opportunistic HLM) という新しいHLM構造を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:50:58 GMT)
Semi-Supervised Semantic Segmentation Based on Pseudo-Labels: A Survey [49.5] 本総説は, 半教師付きセマンティックセグメンテーション分野における擬似ラベル手法に関する最新の研究成果について, 包括的かつ組織的に概観することを目的としている。
さらに,医用およびリモートセンシング画像のセグメンテーションにおける擬似ラベル技術の適用について検討する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:27:02 GMT)
Signed graphs in data sciences via communicability geometry [49.2] 署名付きグラフの通信可能性の概念を提案し,その数学的性質を探求する。
負の辺が存在する場合でも、距離の公理を満たす指標を導出する。
次に、これらのメトリクスを適用して、統一されたフレームワーク内の署名付きグラフのデータ解析におけるいくつかの問題を解決する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:37:08 GMT)
Reddit is all you need: Authorship profiling for Romanian [49.2] 著者プロファイリング(英: Authorship profiling)とは、著者の著作に基づいて著者の特徴を特定する過程である。
本稿では,ルーマニア語における短いテキストのコーパスについて紹介する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:48:28 GMT)
E-Values Expand the Scope of Conformal Prediction [49.2] コンフォーマル予測は、分布のない不確実性定量化のための強力なフレームワークである。
本稿では,共形e-predictionと呼ばれる電子値に基づく代替手法について検討する。
E値は、p値では達成できない重要な利点を提供し、新しい理論的および実用的能力を実現する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:51:46 GMT)
Approximation of diffeomorphisms for quantum state transfers [49.2] 制御理論における2つの新たな視点を組み合わそうとしている。
トーラスに作用する双線形Schr"odinger PDEにおける状態遷移を駆動する制御則を数値的に発見する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:28:59 GMT)
Towards Harmless Multimodal Assistants with Blind Preference Optimization [49.0] MLLM(Multimodal Large Language Models)は、マルチモーダル理解、推論、相互作用において印象的な能力を示す。
MLLMと人間の嗜好の整合における選好最適化の有効性から,MLLMの安全関連選好データが必要である。
我々は、無害なマルチモーダルアシスタントに対してMMSafe-PO選好データセットを構築し、マルチモーダル命令、会話形式、人間のフィードバックからのランク付けされたペア応答を特徴付ける。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:02:38 GMT)
Reinforcement learning-based motion imitation for physiologically plausible musculoskeletal motor control [47.4] 筋運動制御の理解を深めるために,モデルフリー運動模倣フレームワーク(KINESIS)を提案する。
我々は,KINESISが1.9時間のモーションキャプチャデータに対して強い模倣性能を達成できることを実証した。
キネシスはヒトの筋活動とよく相関する筋活動パターンを生成する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:37:49 GMT)
A Comprehensive Survey on Cross-Domain Recommendation: Taxonomy, Progress, and Prospects [47.4] クロスドメインレコメンデーション(CDR)は近年広く研究されている。
我々は、CDRの主な手順に基づいて、進捗状況と今後の展望を要約する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:27:14 GMT)
MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQL [47.1] 最近のText-to-Yourselfメソッドは通常、"巨大な"データベース上での大幅なパフォーマンス劣化に悩まされる。
我々は,新しいテキスト・ツー・ユー・セルフ LLM ベースのマルチエージェント協調フレームワーク MAC を紹介する。
我々のフレームワークでは、GPT-4を全てのエージェントタスクの強力なバックボーンとして利用し、フレームワークの上限を決定する。
次に、Code 7Bを活用することで、オープンソースの命令フォローモデルであるsql-Llamaを微調整し、GPT-4のように全てのタスクを達成します。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:12:21 GMT)
IV-tuning: Parameter-Efficient Transfer Learning for Infrared-Visible Tasks [47.1] IV-tuning」は、パラメータ効率の良いPVMを赤外可視タスクに活用するための、新規で汎用的な微調整手法である。
IVチューニングは、トレーニング済みの可視性PVMを凍結し、赤外線フローをアダプタと対話するためのモーダルプロンプトに統合する。
約3%のバックボーンパラメータを微調整することで、IVチューニングは完全な微調整および従来の最先端の手法よりも優れる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:52:24 GMT)
Unique Hard Attention: A Tale of Two Sides [46.8] 左端と右端に注意を向けた有限精度変換器は線形時間論理(LTL)と同値であることが示されている
左端に注意を払っているモデルは、Emphsoftの注意と等価であることを示し、実世界のトランスフォーマーを右アテンションモデルより近似した方がよいことを示唆している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:12:09 GMT)
LipShiFT: A Certifiably Robust Shift-based Vision Transformer [46.7] リプシッツに基づくマージントレーニングは、モデルの連続層における重みを制限しながら、強い正則化器として機能する。
一般的な画像分類における$l$ノルムを用いて、このモデルのリプシッツ定数の上限推定を行う。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 21:38:18 GMT)
SCJD: Sparse Correlation and Joint Distillation for Efficient 3D Human Pose Estimation [46.1] 既存の3Dヒューマンポース推定法(HPE)は高い精度を達成しているが、計算オーバーヘッドと遅い推測に悩まされている。
3次元HPEの効率と精度のバランスをとる新しいフレームワークであるスパース相関・ジョイント蒸留(SCJD)を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:14:49 GMT)
YOLO-LLTS: Real-Time Low-Light Traffic Sign Detection via Prior-Guided Enhancement and Multi-Branch Feature Interaction [45.8] YOLO-LLTSは、低照度環境向けに設計されたエンドツーエンドのリアルタイム信号検出アルゴリズムである。
我々は、低照度シナリオにおける不特定小物体の特徴に対処するために、HRFM-TOD(High-Resolution Feature Map for Small Object Detection)モジュールを導入する。
次に,マルチブランチ・フィーチャーインタラクション・アテンション(MFIA)モジュールを開発した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:28:05 GMT)
Beyond Generation: Unlocking Universal Editing via Self-Supervised Fine-Tuning [45.6] UES(Universal Editing via Self-Supervision)は、世代モデルを統一世代編集システムに変換する軽量な自己監督型微調整戦略である。
提案手法は、オリジナルビデオテキストペアが視覚とテキストのセマンティクスを共同で提供するデュアルコンディショニング機構を確立する。
オムニベンチ99(OmniBench-99)は、人間や動物、環境、オブジェクトを対象とする99の動画を網羅した総合的なベンチマークである。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:51:59 GMT)
Modeling Future Conversation Turns to Teach LLMs to Ask Clarifying Questions [45.0] 大規模言語モデル(LLM)は、しばしば非常にあいまいなユーザー要求に応答しなければならない。
既存のLLMは、そのような曖昧な要求の単一解釈を前提とすることで、異なる解釈を意図したユーザーをいらいらさせる。
今後,期待する結果をシミュレーションして選好ラベルを提案する。
これによってLLMは、将来の順番で各ユーザの解釈に合わせた応答を生成することができるのか、明確な質問を学べるようになる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:17:47 GMT)
Dipole-dipole interactions mediated by a photonic flat band [45.0] 平面バンド(FB)のフォトニックアナログに分散結合したエミッタ間の光子-双極子相互作用について検討する。
このような光子を媒介とする相互作用の強度は、特徴的な局在長を持つ距離で指数関数的に崩壊する。
1Dと2Dの両方の大規模なFBに対して解析的に導かれる普遍的スケーリング法則により, 局所化長はCLS間の重なりで増大することがわかった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:33:14 GMT)
Device-independent secure correlations in sequential quantum scenarios [45.0] デバイスに依存しない量子情報は、特に情報セキュリティにおけるその応用において、大きな注目を集めている。
本稿では,デバイスに依存しないセキュリティを実現するために,シーケンシャルな量子プロトコルを設計するための体系的なアプローチを提案する。
この体系的な構成により、結果の理想的な相関は、他の相関の統計的混合として再現できないという意味で、安全であることが解析的に証明される。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:45:20 GMT)
Set Features for Anomaly Detection [44.8] 本稿では,各サンプルの要素分布をモデル化する集合の特徴について述べる。
簡単な密度推定法を用いて各試料の異常スコアを算出する。
本手法は,画像レベルの論理異常検出とシーケンスレベルの時系列異常検出において,従来の最先端技術よりも優れていた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 21:10:14 GMT)
AdaST: Dynamically Adapting Encoder States in the Decoder for End-to-End Speech-to-Text Translation [44.8] 復号器隠蔽状態に応じて様々な音響状態の利点を示す。
本稿では,デコーダの音響状態を動的に適応できる適応型音声テキスト翻訳モデルを提案する。
広範に使用されている2つのデータセットの実験結果から,提案手法は最先端のニューラル音声翻訳モデルを大きく上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:59:27 GMT)
MANTRA: Enhancing Automated Method-Level Refactoring with Contextual RAG and Multi-Agent LLM Collaboration [44.8] 本稿では,包括的Large Language ModelsエージェントベースのフレームワークであるMANTRAを紹介する。
ManTRAは、コンテキスト対応検索強化生成、協調型マルチエージェントコラボレーション、および言語強化学習を統合している。
MANTRA はベースライン LLM モデルを大幅に上回ることを示す実験結果が得られた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:16:51 GMT)
TablePilot: Recommending Human-Preferred Tabular Data Analysis with Large Language Models [44.4] 大規模言語モデルを活用する先駆的なデータ分析フレームワークであるTablePilotを,包括的で優れた分析結果を自律的に生成する。
このフレームワークは、分析準備と分析最適化に重要な設計を取り入れ、精度を向上する。
また,レコメンデーション品質を向上し,ヒトの嗜好に適合する新しい手法であるRec-Alignを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:41:59 GMT)
SPIN-Bench: How Well Do LLMs Plan Strategically and Reason Socially? [44.3] 戦略計画・インタラクション・ネゴシエーション(SPIN-Bench)について
SPIN-Benchは、戦略的計画と社会的推論の知性を測定するために設計された、新しいマルチドメイン評価である。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:34:17 GMT)
Max-Rank: Efficient Multiple Testing for Conformal Prediction [43.6] 多重仮説テスト(MHT)は科学的な調査で頻繁に発生し、複数の仮説の同時テストはタイプIエラーや偽陽性のリスクを膨らませる。
本稿では、予測不確実性定量化のための柔軟なフレームワークである共形予測の文脈において、MHTに対処する。
我々は、ファミリーワイズエラー率を効率的に制御しながら依存関係を利用する新しい補正である$textttmax-rank$を紹介した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:39:34 GMT)
Towards Aligning Language Models with Textual Feedback [43.6] ALT(Alignment with Textual feedback)は、言語モデルとユーザの好みをテキストで表わすアプローチである。
本稿では, 有害度低減, 要約, 対話応答生成など, さまざまなタスクにおけるテキストフィードバックの有効性と効率について検討する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:34:14 GMT)
A Simple Combination of Diffusion Models for Better Quality Trade-Offs in Image Denoising [43.4] 本稿では,事前学習した拡散モデルを活用するための直感的な手法を提案する。
次に,提案する線形結合拡散デノイザについて紹介する。
LCDDは最先端のパフォーマンスを達成し、制御され、よく機能するトレードオフを提供する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:02:19 GMT)
Learning Shape-Independent Transformation via Spherical Representations for Category-Level Object Pose Estimation [42.5] カテゴリーレベルのオブジェクトポーズ推定は、特定のカテゴリにおける新しいオブジェクトのポーズとサイズを決定することを目的としている。
既存の対応に基づくアプローチは、通常、原始的な観測点と正規化されたオブジェクト座標の間の対応を確立するために点ベースの表現を採用する。
SpherePoseと呼ばれる新しいアーキテクチャを導入し、3つのコア設計を通して正確な対応予測を行う。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:43:42 GMT)
3D-LMVIC: Learning-based Multi-View Image Coding with 3D Gaussian Geometric Priors [42.3] 本稿では,新しい学習型マルチビュー画像圧縮フレームワークである3D-LMVICを提案する。
3D-LMVICは従来の手法と学習法の両方と比較して優れた性能を示す。
既存の2視点アプローチに比べて、差分推定精度が大幅に向上する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:54:41 GMT)
The Power of Context: How Multimodality Improves Image Super-Resolution [42.2] シングルイメージ超解像(SISR)は、低解像度入力から微細な細部を復元することが本質的に困難であるため、依然として困難である。
本稿では、複数のモードで利用可能なリッチな文脈情報を活用して、SISRの強力な生成前処理を学習する手法を提案する。
我々のモデルは最先端のSISR法を超越し、優れた視覚的品質と忠実さを実現している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:59:54 GMT)
Marten: Visual Question Answering with Mask Generation for Multi-modal Document Understanding [42.2] MLLM(Multi-modal Large Language Models)は、視覚的理解能力を備えた大規模言語モデルを提供する。
文書レベルのMLLMにおける視覚的・言語的モダリティをブリッジするに適した画像テキスト事前学習タスクを設計するには,まだ未検討である。
本稿では,マスク生成による視覚質問応答(VQAMask)タスクとして重要な課題を提示する新しい視覚言語アライメント手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:07:14 GMT)
RNA-FrameFlow: Flow Matching for de novo 3D RNA Backbone Design [41.8] 本稿では3次元RNAバックボーン設計のための最初の生成モデルであるRNA-FrameFlowを紹介する。
我々は、剛体フレームと関連する損失関数の集合としてRNA構造を定式化する。
3次元RNAデータセットの多様性の欠如に対処するため、構造的クラスタリングと収穫増強によるトレーニングについて検討する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:25:10 GMT)
PaCoST: Paired Confidence Significance Testing for Benchmark Contamination Detection in Large Language Models [41.8] 大規模言語モデル(LLM)は膨大な量のデータに基づいて訓練されることが知られており、意図的または故意によく使われるベンチマークのデータを含むことがある。
このインクルージョンは、モデルリーダーボードの不正な高いスコアにつながるが、現実のアプリケーションではパフォーマンスに失望する。
LLMのベンチマーク汚染を効果的に検出するPaired Confidence Significance TestingであるPaCoSTを紹介する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:57:39 GMT)
Revisiting Image Fusion for Multi-Illuminant White-Balance Correction [41.7] 複数の照度を持つシーンにおけるホワイトバランスの補正は、コンピュータビジョンにおける永続的な課題である。
最近の方法では、ニューラルネットワークが入力画像の複数のsRGBバージョンを線形にブレンドする、融合ベースのアプローチが検討されている。
本稿では,SRGBのWBプリセット間で空間依存性をキャプチャするトランスフォーマーモデルを提案する。
提案手法は,新たなマルチイルミナント画像融合データセットにおいて,既存の技術よりも最大100%向上する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 23:01:22 GMT)
3D-MolT5: Leveraging Discrete Structural Information for Molecule-Text Modeling [41.1] 分子を配列空間と3次元構造空間の両方でモデル化する統合フレームワークである textbf3D-MolT5 を提案する。
このアプローチの鍵となる革新は、きめ細かい3Dサブ構造表現を特別な3Dトークン語彙にマッピングすることである。
当社のアプローチは、これまでの作業における重要な課題に対処しながら、モーダル間相互作用とアライメントを大幅に改善します。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:03:45 GMT)
MDocAgent: A Multi-Modal Multi-Agent Framework for Document Understanding [40.5] MDocAgentは、テキストとイメージの両方を活用する新しいRAGおよびマルチエージェントフレームワークである。
本システムでは, 汎用エージェント, クリティカルエージェント, テキストエージェント, 画像エージェント, 要約エージェントの5種類の特殊エージェントを用いる。
5つのベンチマークの予備実験では、MDocAgentの有効性が示され、平均12.1%の改善が達成された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:57:21 GMT)
Semantic Visual Simultaneous Localization and Mapping: A Survey [40.4] 本稿ではまず, セマンティックvSLAMの開発について概観し, その強みと相違点に着目する。
次に、意味情報の抽出と関連付け、意味情報の応用、意味vSLAMの利点の3つについて検討する。
最後に,セマンティックvSLAMの今後の発展に向けた青写真を提供する今後の方向性について論じる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:34:43 GMT)
Striving for Simplicity: Simple Yet Effective Prior-Aware Pseudo-Labeling for Semi-Supervised Ultrasound Image Segmentation [40.1] 医用超音波画像はユビキタスだが、手動による解析はペースを維持するのに苦労している。
ラベル付きデータと制限付きデータの両方を活用する半教師付き学習は、有望なアプローチである。
そこで本研究では,正則化に先立って,逆学習した形状の簡単な擬似ラベル方式を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:44:09 GMT)
HySurvPred: Multimodal Hyperbolic Embedding with Angle-Aware Hierarchical Contrastive Learning and Uncertainty Constraints for Survival Prediction [39.7] がん生存予測のための新しいフレームワークであるHySurvPredを提案する。
マルチモーダル・ハイパーボリックマッピング、アングルを意識したランク付けに基づくコントラスト・ロス(Contrastive Loss)、センサ・コンディション・不確実性制約(Censor-Conditioned Uncertainty Constraint)という3つの重要なモジュールを統合している。
提案手法は,5つのベンチマークデータセット上で最先端の手法より優れている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:26:22 GMT)
Lower Bounds and Accelerated Algorithms in Distributed Stochastic Optimization with Communication Compression [39.7] 通信圧縮は通信オーバーヘッドを軽減するための重要な戦略である。
軽度条件下での圧縮のほぼ最適アルゴリズムであるNEOLITHICを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:16:09 GMT)
Intra and Inter Parser-Prompted Transformers for Effective Image Restoration [39.1] 画像復元のための視覚基盤モデルから有用な特徴を探索するイントラ・イントラ・プロンプテッド・トランスフォーマー(PPTformer)を提案する。
PPTformerは、画像デラリニング、デフォーカスデフォーカス、デフォーカス、低照度化における最先端の性能を達成する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:56:02 GMT)
RoGSplat: Learning Robust Generalizable Human Gaussian Splatting from Sparse Multi-View Images [39.0] RoGSplatは、スパースマルチビュー画像から見えない人間の高忠実な新しいビューを合成するための新しいアプローチである。
提案手法は,新しいビュー合成とクロスデータセットの一般化において,最先端の手法よりも優れている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:18:34 GMT)
Robust Weight Imprinting: Insights from Neural Collapse and Proxy-Based Aggregation [38.4] 本稿では, 生成, 正規化, 集約という3つの主要コンポーネントを同定し, インプリントするためのフレームワークを提案する。
生成段階において、複数のプロキシで新しいデータを表現できることの利点を明らかにし、適切な正規化の重要性を示す。
私たちはこれを、神経崩壊現象によって動機付けています -- 初めて描くことができる重要なつながりです。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:27:45 GMT)
Utilization of Neighbor Information for Image Classification with Different Levels of Supervision [38.4] 本稿では,GCD (Generalized category discovery) と画像クラスタリングの両方に有効であるフレキシブルな手法を提案する。
本手法は,クラスタリング(+3% ImageNet-100, Imagenet200)とGCD(+0.8% ImageNet-100, +5% CUB, +2% SCars, +4% Aircraft)の両方に対して,最先端の結果が得られる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:59:41 GMT)
Condensing Action Segmentation Datasets via Generative Network Inversion [37.8] 本研究は、時間的アクションセグメンテーションに使用される手続き的ビデオデータセットに対する最初の凝縮アプローチを示す。
本稿では,データセットとネットワークのインバージョンから得られた生成的事前学習を利用して,データをコンパクトな潜在コードに変換する凝縮フレームワークを提案する。
標準ベンチマークによる評価は,TASデータセットの凝縮と競合性能の達成に一貫した有効性を示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:29:47 GMT)
Can LLMs Enable Verification in Mainstream Programming? [37.7] LLMが3つの検証言語で検証コードを生成する能力について検討する。
そのために、最先端のPythonベンチマークであるHumanEvalから派生した、手動でキュレートされたデータセットを使用します。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:58:00 GMT)
MedAlpaca -- An Open-Source Collection of Medical Conversational AI Models and Training Data [37.6] 大規模言語モデル(LLM)は、医療、診断、患者医療、教育を改善するためのかなりの約束を持っている。
しかし、患者のプライバシを保護するために、オンプレミスでデプロイできるオープンソースモデルが緊急に必要である。
本稿では、160,000以上のエントリからなる革新的なデータセットについて紹介する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 21:31:51 GMT)
Crowdsource, Crawl, or Generate? Creating SEA-VL, a Multicultural Vision-Language Dataset for Southeast Asia [37.4] 東南アジア言語のための高品質で文化的に関連のあるデータを開発するためのオープンソースイニシアチブであるSEA-VLについて紹介する。
SEA諸国からのコントリビュータを巻き込むことで、SEA-VLはより優れた文化的妥当性と多様性を確保することを目指している。
我々は、既存のデータセットの50倍以上の文化関連画像128万枚を集めている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:34:03 GMT)
Temporal Consistency for LLM Reasoning Process Error Identification [37.3] 本手法は, 自己回帰動作の連続的な一貫性を活用し, 精度を向上する。
多様なベンチマークによる実証的な評価は、一貫したパフォーマンス改善を示している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:58:28 GMT)
The KoLMogorov Test: Compression by Code Generation [37.0] 我々は、LLMを生成するための圧縮・アズ・インテリジェンステストであるKoLMogorov-Test(KT)を紹介する。
モデルは、推論時にデータのシーケンスを提示し、そのシーケンスを生成する最も短いプログラムを生成するように要求する。
現在のモデルを評価するには、音声、テキスト、DNAデータ、およびランダムな合成プログラムによって生成されるシーケンスを使用する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:52:04 GMT)
Image Captioning Evaluation in the Age of Multimodal LLMs: Challenges and Future Perspectives [37.0] 機械生成画像キャプションの評価は複雑で進化する課題である。
MLLM(Multimodal Large Language Models)の出現に伴い、画像キャプションがコアタスクとなっている。
本調査では,画像キャプション評価の進歩について概観する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:03:56 GMT)
Growing a Twig to Accelerate Large Vision-Language Models [37.0] 本稿では,基本VLMの初期層上に軽量な小枝を成長させることにより,シンプルで汎用的なアーキテクチャであるTwigVLMを紹介する。
視覚トークンプルーニングに基づく既存のほとんどのVLMアクセラレーション手法と比較して、我々のTwigVLMは精度を向上するだけでなく、精度の維持も達成している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:52:45 GMT)
Towards the Pedagogical Steering of Large Language Models for Tutoring: A Case Study with Modeling Productive Failure [36.8] 1対1の授業は、最も効果的な教育方法の1つである。
我々は、LSMプロンプトを最適化し、遷移グラフとして表される事前定義されたマルチターンチューリング計画に従うアルゴリズムであるStratLを開発した。
ケーススタディとして,先進的で効果的な学習設計であるProductive Failure (PF) に続く,高校数学のプロトタイプチューターを作成する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:44:51 GMT)
Benchmarking community drug response prediction models: datasets, models, tools, and metrics for cross-dataset generalization analysis [36.7] 本稿では,ディープラーニング(DL)モデルと機械学習(ML)モデルにおけるデータセット間予測の一般化を評価するためのベンチマークフレームワークを提案する。
絶対的なパフォーマンス(データセット間での予測精度など)と相対的なパフォーマンス(例えば、データセット内の結果と比較してパフォーマンス低下)の両方を定量化します。
本結果は,厳密な一般化評価の重要性を浮き彫りにして,未知のデータセット上でモデルをテストする場合の大幅な性能低下を明らかにした。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:40:18 GMT)
Multimodal Mamba: Decoder-only Multimodal State Space Model via Quadratic to Linear Distillation [36.4] mmMambaは、線形複雑でネイティブなマルチモーダル状態空間モデルを開発するためのフレームワークである。
提案手法は,訓練されたデコーダのみのMLLMを線形複雑度アーキテクチャへ直接変換することを可能にする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:02:33 GMT)
HumanEvo: An Evolution-aware Benchmark for More Realistic Evaluation of Repository-level Code Generation [36.2] 我々は,大規模言語モデルのコード生成性能を,ソフトウェア開発の進化的性質を反映した設定内で理解するための実証的研究を行う。
我々は、自動実行ベースの評価ツールを備えた進化型リポジトリレベルのコード生成データセットであるHumanEvoを使用します。
従来の進化を無視した評価手法は, 10.0%から61.1%の範囲で, LLMの膨張性能が向上することがわかった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:58:23 GMT)
A Convex Relaxation Approach to Generalization Analysis for Parallel Positively Homogeneous Networks [35.9] 入力出力マップが等質写像の和であるニューラルネットワークのクラスを研究する。
このようなネットワークに対する線形境界に対する一般的なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 21:12:45 GMT)
Bridging Social Psychology and LLM Reasoning: Conflict-Aware Meta-Review Generation via Cognitive Alignment [35.8] 大規模言語モデル(LLM)は、原稿批評の自動化において有望であることを示す。
既存の方法は、異なる意見の中で矛盾する視点を扱うのに失敗する。
本稿では,LLMを適応的な科学的調停器に変換する2プロセスアーキテクチャであるCognitive Alignment Framework(CAF)を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:13:11 GMT)
IGDrivSim: A Benchmark for the Imitation Gap in Autonomous Driving [35.6] 本研究では,人間専門家による実証実験から自律運転政策を学習する際の模倣ギャップの影響について検討する。
実験の結果,この認識ギャップは安全かつ効果的な運転行動の学習を妨げることが示された。
本研究は,模倣と強化学習を組み合わせることで,禁止行為に対する簡単な報奨を生かし,これらの失敗を効果的に軽減することを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:39:31 GMT)
Where do Large Vision-Language Models Look at when Answering Questions? [35.4] LVLM(Large Vision-Language Models)は、視覚言語理解と推論タスクにおいて有望な性能を示す。
我々は既存のヒートマップ可視化手法を拡張し、オープンな視覚的質問応答のためのLVLMをサポートする。
我々は,視覚情報を必要とするベンチマークにおいて,最先端のLVLMを包括的に分析する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:34:43 GMT)
PULASki: Learning inter-rater variability using statistical distances to improve probabilistic segmentation [35.3] 本研究は,バイオメディカルイメージセグメンテーションのための計算効率の良い生成ツールとしてのPULASki法を提案する。
専門家のアノテーションでは、小さなデータセットであっても、変数をキャプチャする。
また,3次元パッチと従来の2次元スライスを用いた複雑なジオメトリーの計算可能セグメンテーションについて比較検討した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:50:49 GMT)
VideoOrion: Tokenizing Object Dynamics in Videos [35.0] ビデオ内のキーセマンティック情報を明示的にキャプチャするビデオ大言語モデル(Video Large Language Model: Video-LLM)を提案する。
VideoOrionでは、専門的なビジョンモデルを使用して、検出-セグメンション-トラックパイプラインを通じてオブジェクトのダイナミクスを抽出する。
本手法は,高次元映像データをセマンティックトークンに効率よく圧縮するビデオLLMにおける永続的課題に対処する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:15:28 GMT)
Fast Autoregressive Video Generation with Diagonal Decoding [34.9] DiagD (Diagonal Decoding) は、自己回帰事前学習モデルのためのトレーニング不要な推論高速化アルゴリズムである。
本手法は,空間的時間的トークングリッド内の対角経路に沿ってトークンを生成し,各フレーム内で並列デコードを可能にする。
DiagDは、単純でシーケンシャルなデコーディングに比べて最大10倍のスピードアップを達成すると同時に、同等の視覚的忠実さを維持している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:42:55 GMT)
A Revisit to the Decoder for Camouflaged Object Detection [34.9] カモフラージュされたオブジェクト検出(COD)は、背景に隠されたカモフラージュされたオブジェクトのきめ細かいセグメンテーションマップを作成することを目的としている。
本稿では,CODにおける一般的なデコード戦略をエンリッチ・デコーダとリタッチ・デコーダで拡張する新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:51:50 GMT)
PENCIL: Long Thoughts with Short Memory [34.9] 自己回帰生成プロセスに還元機構を組み込んだPENCILを提案する。
PENCILは生成に必要な最大コンテキスト長を著しく削減する。
我々は,難解なアインシュタインのパズルに対して,PENCILが97%の精度を達成したことを実証する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:14:14 GMT)
Emerging Synergies in Causality and Deep Generative Models: A Survey [34.5] 深部生成モデル (DGM) は複雑なデータ分布を捉えるのに適することが証明されているが、一般化と解釈可能性に欠けることが多い。
因果性は、データ生成を駆動するメカニズムを理解するための構造化レンズを提供し、これらのプロセスに固有の因果効果のダイナミクスを強調する。
我々は、DGMにおける因果原理の統合を解明し、DGMを用いた因果同定を調査し、大規模生成モデルにおける因果関係の新たな研究フロンティアを探索する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:39:18 GMT)
ImViD: Immersive Volumetric Videos for Enhanced VR Engagement [34.5] VR/AR技術の次のフロンティアは、完全なシーンキャプチャー、大きな6-DoFインタラクションスペース、マルチモーダルフィードバック、高解像度とフレームレートのコンテンツを備えた没入型ボリュームビデオである。
完全空間指向データキャプチャと様々な屋内/屋外シナリオを備えたマルチビューマルチモーダルデータセットであるImViDを紹介する。
我々のキャプチャリグは、移動中のマルチビュービデオオーディオキャプチャをサポートし、データの完全性、柔軟性、効率を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:42:22 GMT)
An Efficient Post-hoc Framework for Reducing Task Discrepancy of Text Encoders for Composed Image Retrieval [34.1] Composed Image Retrieval (CIR) は、参照画像と条件付きテキストに基づいてターゲット画像を取得することを目的としており、制御可能な画像検索を可能にする。
従来のZero-Shot (ZS) CIRメソッドは、画像埋め込みをテキストトークン埋め込み空間に投影することで、高価なトレーニング用CIRトリプルの必要性を回避している。
本稿では,プロジェクションベースのCIR手法を補完する効率的なテキストのみのフレームワークであるReduceing Taskrepancy of Texts (RTD)を紹介する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:06:55 GMT)
Improving LLM Video Understanding with 16 Frames Per Second [33.7] 既存の手法では、フレーム毎秒(FPS)$leqslant$2の固定低フレームレートでサンプリングされた画像から抽出された静的な特徴に頼っている。
F-16は,高速ビデオ理解のために設計された最初のマルチモーダル大言語モデル(LLM)である。
F-16は、キーセマンティック情報を保存しながら、動的視覚特徴を効率的にキャプチャする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:48:08 GMT)
TableBench: A Comprehensive and Complex Benchmark for Table Question Answering [33.6] 本稿では,産業シナリオにおける大規模言語モデル(LLM)の適用について検討する。
本稿では,テーブル質問応答機能(TableQA)の4大カテゴリに18のフィールドを含む,包括的で複雑なベンチマークTableBenchを提案する。
TableBenchで実施された大規模な実験は、オープンソースのLLMとプロプライエタリなLLMの両方に、現実世界の要求を満たすための大きな改善の余地があることを示唆している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:13:18 GMT)
MV-MATH: Evaluating Multimodal Math Reasoning in Multi-Visual Contexts [33.6] MV-MATHは,2,009の高次数問題からなる厳密にキュレートされたデータセットである。
それぞれの問題は、K-12シナリオから派生したテキストでインターリーブされた複数の画像を統合し、詳細なアノテーションで富む。
MV-MATHには、複数の選択、自由形式、多段階の質問が含まれており、3つの困難レベルにわたる11の主題領域をカバーしている。
我々は,マルチ視覚数学におけるMLLMの課題が,MV-MATH上での人間の能力に比較してかなりの性能差があることを観察した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:02:51 GMT)
State Space Model Meets Transformer: A New Paradigm for 3D Object Detection [33.5] インタラクティブなSTate空間モデル(DEST)を用いた新しい3次元オブジェクト検出パラダイムを提案する。
対話型SSMでは,3次元屋内検出タスクにおいて,システム状態が効率的にクエリとして機能する新しい状態依存型SSMパラメータ化法を設計する。
ScanNet V2 と SUN RGB-D データセットの AP50 で GroupFree のベースラインを改善する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:58:03 GMT)
Iffy-Or-Not: Extending the Web to Support the Critical Evaluation of Fallacious Texts [33.5] Iffy-Or-Not (ION)は、テキストを読むときに批判的な思考を呼び起こそうとするブラウザ拡張である。
議論理論によってガイドされた3つの機能により、IONは誤ったコンテンツを強調し、それらを調査するための多様なクエリを提案し、他の人と検討し、チャットするためのより深い質問を提供する。
ユーザスタディ (N=18) から, ION はユーザのコンテンツに対する注意を喚起し, 自分に合った, あるいは好ましくないクエリを提案し, 思考を誘発する質問を提起し, 視点を広げる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:50:20 GMT)
Unified Analysis of Decentralized Gradient Descent: a Contraction Mapping Framework [33.4] 分散勾配降下(DGD)と拡散は、分散機械学習におけるワークホースである。
本稿では,DGDの解析と拡散のための基本的フレームワークを提案する。
これらのツールの使用は、ノイズフリーとノイズフリーの両体制において、厳密な収束境界をもたらす。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:36:36 GMT)
Lux Post Facto: Learning Portrait Performance Relighting with Conditional Video Diffusion and a Hybrid Dataset [33.4] 我々はLux Post Factoを紹介した。これは光リアリスティックと時間的に一貫した照明効果を両立させる新しいポートレートビデオライティング手法である。
提案手法では,静的表現OLATデータと画像内パフォーマンスビデオを組み合わせたハイブリッドデータセットを用いて,ライティングと時間的モデリングを共同で学習する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:55:22 GMT)
MEGA: Masked Generative Autoencoder for Human Mesh Recovery [33.3] 単一のRGB画像からのヒューマンメッシュの回復は、非常にあいまいな問題である。
ほとんどのHMR手法はこの問題を見逃し、曖昧さを考慮せずに単一の予測を行う。
本研究は,マスク生成モデルに基づく新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:34:42 GMT)
Empowering GraphRAG with Knowledge Filtering and Integration [33.2] グラフ検索強化生成(GraphRAG)は、外部グラフから構造化知識を統合することにより、大規模言語モデルの推論を強化する。
筆者らは,1)ノイズや無関係な情報を取得することは,性能を低下させる可能性があり,(2)外部知識への過剰依存は本質的な推論を抑制する。
本稿では,GraphRAG-Filtering と GraphRAG-Integration を組み合わせた GraphRAG-FI (Filtering and Integration) を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:29:55 GMT)
Command R7B Arabic: A Small, Enterprise Focused, Multilingual, and Culturally Aware Arabic LLM [33.0] エンタプライズアラビアアプリケーションのための高品質な大規模言語モデル(LLM)の構築は、デジタルアラビアデータの利用が限られているため、依然として困難である。
本稿では, この問題を解決するために, 合成データ生成とヒューマン・イン・ザ・ループアノテーションを活用したデータ合成・改良戦略を提案する。
この取り組みの成果は、小規模で7Bのオープンウェイトモデルのリリースであり、同様に、頭と頭の比較やアラビアのベンチマークにおいて、同等の大きさのピアを上回っている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:03:49 GMT)
DefectFill: Realistic Defect Generation with Inpainting Diffusion Model for Visual Inspection [32.8] DefectFillは、いくつかの参照欠陥画像のみを必要とする、現実的な欠陥生成のための新しい方法である。
詳細でローカライズされた欠陥機能の正確なキャプチャと、欠陥のないオブジェクトへのシームレスな統合を可能にする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:42:11 GMT)
Multi-user Wireless Image Semantic Transmission over MIMO Multiple Access Channels [31.7] CSIをサイド情報として、セマンティックエンコーダとデコーダの両方に組み込んで、適切なフィーチャーマスクマップを生成する。
MU-LCFSCはPSNRでは3dB以上のDepJSCC-NOMAに比べて優れている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:41:38 GMT)
Ingredients: Blending Custom Photos with Video Diffusion Transformers [31.7] Ingredientsは、複数の特定ID(ID)写真を含むビデオ作成をカスタマイズするフレームワークである。
i) グローバルとローカルの両方の観点から、ヒトのIDごとに多目的かつ正確な顔の特徴をキャプチャする顔抽出器、(ii) 映像拡散変換器における画像クエリのコンテキスト空間に顔埋め込みをマッピングするマルチスケールプロジェクター、(iii) 対応する時空領域に複数のID埋め込みを動的に結合し割り当てるIDルータからなる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:47:27 GMT)
TarPro: Targeted Protection against Malicious Image Editing [31.3] TarProは、悪意のある編集を防止し、良心的な修正を継続するターゲット保護フレームワークである。
この結果から,TarProは画像編集をセキュアかつ制御する実用的なソリューションとして注目された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:54:44 GMT)
Diffusion-based Facial Aesthetics Enhancement with 3D Structure Guidance [31.1] 顔画像の構造と外観を調整することにより、顔の魅力を高めることを目的としている。
既存のほとんどの手法では、FAEを行うための生成モデルに対して、深い特徴ベースまたはスコアベースのガイダンスが採用されている。
本研究では,2次元顔画像に3次元構造ガイダンスを付加した拡散型FAE法であるDiffusion (NNSG-Diffusion) に基づく最近傍構造誘導法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:42:02 GMT)
One VLM to Keep it Learning: Generation and Balancing for Data-free Continual Visual Question Answering [31.0] VLM(Vision-Language Models)は、Webスケールのマルチモーダルデータセットを活用することで、VQA(Visual Question Answering)タスクにおいて大きな可能性を秘めている。
これらのモデルは、新しいタスクに適応する際に破滅的な忘れ物のために、継続的な学習に苦しむことが多い。
本稿では,外部モデルに頼るのではなく,VLMの言語生成能力を活用した最初のデータフリー手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:50:15 GMT)
From Head to Tail: Towards Balanced Representation in Large Vision-Language Models through Adaptive Data Calibration [30.8] LVLM(Large Vision-Language Models)は、視覚的理解と言語生成の融合において大きな進歩を遂げている。
この成功にもかかわらず、LVLMのトレーニングデータは、データ分布が極めて不均衡であるLong-Tail (LT)問題に悩まされている。
DSの段階では,Denoising Diffusion Probabilistic Models(DDPM)と不足した画像を利用して,表現不足の部分を補う。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:02:39 GMT)
Fundamental Limits of Matrix Sensing: Exact Asymptotics, Universality, and Applications [30.7] 複数のサンプルからベイズ最適学習性能を特徴付ける厳密な方程式を提案する。
我々は統計物理学から非厳密な手法を用いて得られた予測を数学的に確立する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:36:30 GMT)
Navigating Rifts in Human-LLM Grounding: Study and Benchmark [30.6] 我々は、WildChat、MultiWOZ、Bing Chatという3つの人間支援データセットのログを分析した。
ヒトとヒトのLLMグラウンドリングでは有意な差が認められた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:24:05 GMT)
PC-Talk: Precise Facial Animation Control for Audio-Driven Talking Face Generation [30.4] 唇音のアライメント制御は話し方や唇の動きのスケールといった要素に焦点を当てるが、感情制御は現実的な感情表現の生成に重点を置いている。
暗黙的なキーポイント変形による唇音のアライメントと感情制御を可能にする新しいフレームワークPC-Talkを提案する。
本手法は,HDTFとMEADの両方のデータセット上で,優れた制御能力を示し,最先端の性能を実現する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:35:48 GMT)
Core-Periphery Principle Guided State Space Model for Functional Connectome Classification [30.0] Core-Periphery State-Space Model (CP-SSM)は、関数コネクトーム分類のための革新的なフレームワークである。
線形複雑性を持つ選択状態空間モデルであるMambaは、機能的脳ネットワークにおける長距離依存関係を効果的にキャプチャする。
CP-SSMは、計算複雑性を著しく低減しつつ、分類性能においてTransformerベースのモデルを上回る。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:03:27 GMT)
AttackEval: How to Evaluate the Effectiveness of Jailbreak Attacking on Large Language Models [29.9] ジェイルブレイク攻撃は、大規模言語モデル(LLM)のセキュリティに対する最も洗練された脅威の1つである。
LLMに対するジェイルブレイク攻撃の有効性を評価するための,革新的なフレームワークを提案する。
粗粒度評価と細粒度評価の2つの異なる評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:50:42 GMT)
SplatVoxel: History-Aware Novel View Streaming without Temporal Training [29.8] スパースビュー映像からの新たなビューストリーミングの問題について検討する。
既存のビュー合成手法は、時間的コヒーレンスと視覚的忠実さに苦慮している。
本稿では,ハイブリッド型スプラ・ボクセルフィードフォワードシーン再構築手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:00:47 GMT)
Multi-Granularity Class Prototype Topology Distillation for Class-Incremental Source-Free Unsupervised Domain Adaptation [29.6] クラスインクリメンタルソースフリーの非教師なしドメイン適応問題には2つの課題がある。
マルチグラニュラリティクラスプロトタイプトポロジー蒸留(GROTO)アルゴリズムを提案する。
提案手法は,3つの公開データセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:34:36 GMT)
DLPO: Towards a Robust, Efficient, and Generalizable Prompt Optimization Framework from a Deep-Learning Perspective [29.5] 大規模言語モデル(LLM)は、よく設計されたプロンプトによって、様々なタスクで顕著に成功している。
最近の研究では、自動的なプロンプト最適化を有望な解決策として検討している。
これらの努力にもかかわらず、既存の手法は、堅牢性、効率性、一般化において重要な課題に直面している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:41:37 GMT)
Efficient Last-iterate Convergence Algorithms in Solving Games [29.3] 近年の研究では、元のEFGのNEを、(摂動された)正規化されたEFGの列のNEを学ぶように再構成している。
本稿では,古典的パラメータフリーなRMベースのCFRアルゴリズムであるCFR$+$が,摂動正規化EFGのNEを学習する際の最終点収束を実現することを証明する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:31:00 GMT)
Appearance Matching Adapter for Exemplar-based Semantic Image Synthesis in-the-Wild [29.2] 例題ベースセマンティック画像合成は、例題の外観を保ちながら意味内容と整合した画像を生成する。
最近のチューニングフリーアプローチでは、暗黙のクロスイメージマッチングを通じて局所的な外観を転送することでこの問題に対処している。
そこで本稿では,AM-Adapterを用いて,先進的なセマンティック画像合成手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:31:49 GMT)
Empowering LLMs in Decision Games through Algorithmic Data Synthesis [29.1] 意思決定ゲームは、大規模言語モデルの推論能力を評価し、強化するための理想的なサンドボックスとして機能する。
データ合成戦略を設計し、2つの古典ゲーム、DoudizhuとGoから広範囲のオフラインデータセットをキュレートする。
我々は、このデータをLLMトレーニングに効果的に組み込むための一連の技術を開発し、その結果、Mastermind-Dou と Mastermind-Go という2つの新しいエージェントを生み出した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:30:29 GMT)
DUNE: Distilling a Universal Encoder from Heterogeneous 2D and 3D Teachers [28.9] 本稿では,2次元視覚,3次元理解,3次元知覚に優れた単一エンコーダであるDUNEを紹介する。
我々のモデルは、より大きな教師に匹敵するパフォーマンスを達成し、時には、それぞれのタスクにおいて彼らよりも優れています。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:47:27 GMT)
Solovay Kitaev and Randomized Compilation [28.3] 我々はSolovay Kitaev (SK) アルゴリズムを用いて、1つのキュービット回転のアンサンブルを生成し、ランダム化されたコンパイルを行う。
この単純なランダム化ゲート合成アルゴリズムは、量子ノイズがなければ、これらの回転の近似誤差を少なくとも2倍減らすことができる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 23:35:29 GMT)
MoVE-KD: Knowledge Distillation for VLMs with Mixture of Visual Encoders [28.2] 視覚エンコーダは視覚言語モデル(VLM)の基本コンポーネントである
近年の研究では、複数のエンコーダを単一のVLMに組み込んでおり、計算コストが大幅に増大している。
本稿では、複数の視覚エンコーダのユニークな習熟度を1つの効率的なエンコーダモデルに抽出する新しい枠組みを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:34:44 GMT)
Exploiting Student Parallelism for Efficient GPU Inference of BERT-like Models in Online Services [28.0] 我々は,オンラインワークロード上でのGPU推論の現実的な設定について,sysを提示する。
サイスは、積み重ね蒸留とアンサンブルの強化を採用し、オリジナルの深層モデルを浅いが事実上積み重ねられた学生モデルのグループに蒸留する。
その結果、sysのベースラインは4.1timessim 1.6times$で精度を保ち、ワークロードバーストに対して最大22.27times$でパフォーマンスが向上した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:33:28 GMT)
Kernel Single Proxy Control for Deterministic Confounding [27.7] 結果が確定的に生成されると因果回復が可能であることを示す。
これは、単一のプロキシ変数を持つ因果メソッドに関する既存の作業を継続的処理設定に一般化する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:55:29 GMT)
Modular Neural Wiretap Codes for Fading Channels [27.4] 本研究は,マルチタップフェーディングワイヤタップチャネルに対して,深層学習に基づく有限ブロック長符号構成を初めて実験的に評価したものである。
誤りおよび情報漏洩の平均確率の評価に加えて, フェージングの有無で設計された符号についても検討する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:22:41 GMT)
LLM-Driven Multi-step Translation from C to Rust using Static Analysis [27.1] レガシー言語で書かれたソフトウェアをCからRustなどのモダン言語に翻訳することは、メモリ安全性を改善する上で大きなメリットがある。
LLM駆動型C-to-Rustゼロショット変換ツールであるSACTORを2段階の翻訳手法を用いて提案する。
SACTORは、既存の方法と比較して、より自然でRustに準拠した翻訳を生成する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:17:27 GMT)
R1-Onevision: Advancing Generalized Multimodal Reasoning through Cross-Modal Formalization [26.8] 視覚知覚と深い推論のギャップを埋めるために設計されたマルチモーダル推論モデルであるR1-Onevisionを紹介する。
我々はR1-Onevisionデータセットを構築し、多様なドメインにまたがる詳細かつステップバイステップのマルチモーダル推論アノテーションを提供する。
先進的推論を育成するために,教師付き微調整と強化学習によりR1-Onevisionモデルをさらに発展させる。
実験結果から,R1-OnevisionはGPT-4oやQwen2.5-VLなど,最先端のモデルよりも優れた性能が得られることがわかった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:52:34 GMT)
Identifying Materials-Level Sources of Performance Variation in Superconducting Transmon Qubits [26.7] 本研究では、超伝導トランスモン量子ビットチップと既知の性能指標を用いて、デバイス間性能変動の基盤となる材料レベルソースを特定する。
エッチング基板トレンチの深さ, 表面酸化物の厚さ, 側壁の形状の変動の傾向を調べた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:58:02 GMT)
Is Linear Feedback on Smoothed Dynamics Sufficient for Stabilizing Contact-Rich Plans? [26.3] 本稿では,接触平滑化に基づく微分シミュレータを用いた線形制御器合成の有効性を解析する。
我々は300以上の軌道上で実証実験を行い、なぜLQRがコンタクトリッチプランの安定化に不十分なように見えるのかを分析した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:32:44 GMT)
Unlocking the Potential of Unlabeled Data in Semi-Supervised Domain Generalization [26.2] 本稿では,これまでSSDG設定で無視されていた未確認サンプルを組み込む手法を提案する。
提案手法は,ベースラインにアタッチされた場合の性能を一貫して改善し,競合するプラグアンドプレイ法より優れることを示す。
また、SSDGにおける本手法の役割を分析し、クラスレベルの識別性を高め、ドメインギャップを緩和することを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:19:33 GMT)
DualToken: Towards Unifying Visual Understanding and Generation with Dual Visual Vocabularies [25.8] 再建のために訓練された視覚トークンーは、低レベルの知覚の詳細を捉えるのに優れる。
対照的な学習によって訓練された視覚エンコーダは、言語とよく一致しているが、生成タスクのためにピクセル空間に復号化するのに苦労する。
本稿では,単一のトークン化器内での理解と生成の両方の表現を統一する手法であるDualTokenを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:56:46 GMT)
Mapping the Trust Terrain: LLMs in Software Engineering -- Insights and Perspectives [25.3] 大規模言語モデル(LLM)の応用は、様々なソフトウェア工学(SE)タスクのための業界や学術分野で急速に成長しています。
これらのモデルがクリティカルなプロセスにとってより不可欠なものになると、信頼性と信頼性が不可欠になります。
SE における LLM の信頼関連概念の展望は比較的不明瞭であり、信頼、不信、信頼といった概念は明確な概念化を欠いている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 00:49:43 GMT)
PLAY2PROMPT: Zero-shot Tool Instruction Optimization for LLM Agents via Tool Play [24.8] 大規模言語モデル(LLM)は、特殊な外部ツールと統合されつつある。
多くのタスクは、最小限またはノイズの多いドキュメントでゼロショットツールの使用を要求する。
提案するPLAY2PROMPTは,各ツールの入力・出力動作を体系的に「再生」する自動フレームワークである。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:09:57 GMT)
Conformal Prediction and Human Decision Making [24.6] 任意のモデルからの予測の不確実性を定量化する方法は、医学や金融といった高度な領域で要求されている。
コンフォーマルな予測は、特定の平均カバレッジを持つ一連の予測を生成する一般的な方法として現れてきた。
しかし, 人的意思決定を支援するための共形予測セットの価値は, カバレッジ保証と意思決定者の目標と戦略との不安定な関係が原因で, いまだ解明されていない。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:16:17 GMT)
A Randomized Method for Simulating Lindblad Equations and Thermal State Preparation [24.3] 我々は、Lindbladiansのアンサンブルにジェネレータを分解することで、Lindbladの力学をシミュレートするqDRIFT型ランダム化法について検討した。
我々はクリフォードランダム回路からサンプリングされたジャンプ演算子を利用する新しい量子ギブスサンプリングアルゴリズムを導出する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 00:01:42 GMT)
Optimized 3D Gaussian Splatting using Coarse-to-Fine Image Frequency Modulation [24.3] 本稿では,新しい周波数変調粗粒度最適化フレームワークOpti3DGSを提案する。
本手法は多くの3DGS技術とシームレスに統合可能であることを示す。
また、Opti3DGSは本質的に余分なコストを伴わずに詳細シーン表現を生成できることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:49:01 GMT)
CaReBench: A Fine-Grained Benchmark for Video Captioning and Retrieval [24.2] 本稿では,詳細な動画キャプションと検索のためのベンチマークであるCaReBenchを紹介する。
同様に、ビデオごとに手動で分離された空間アノテーションと時間アノテーションを提供する。
この設計に基づいて、ビデオ検索とビデオキャプションタスクに特化して、ReBiasとCapSTという2つの評価指標を導入する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:01:24 GMT)
Sparse Autoencoder as a Zero-Shot Classifier for Concept Erasing in Text-to-Image Diffusion Models [24.2] Interpret then Deactivate (ItD) は、T2I拡散モデルにおける正確な概念除去を可能にする新しいフレームワークである。
ItDはスパースオートエンコーダを使用して、各概念を複数の機能の組み合わせとして解釈する。
さらなるトレーニングを必要とせずに、簡単に複数の概念を消去できる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:12:52 GMT)
TestGenEval: A Real World Unit Test Generation and Test Completion Benchmark [24.1] TestGenEvalは、1,210のコードから68,647のテストと、11の保守されたPythonリポジトリにまたがるテストファイルペアで構成されている。
初期テストのオーサリング、テストスイートの補完、コードカバレッジの改善をカバーしている。
パラメータは7Bから405Bまで様々である。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:50:04 GMT)
Conformal Prediction and MLLM aided Uncertainty Quantification in Scene Graph Generation [24.0] SGG(Scene Graph Generation)は、オブジェクトとそのペア関係を識別することで、視覚的なシーンを表現することを目的としている。
予測の不確実性を定量化するために,既存のSGG法に適応した新しい Conformal Prediction (CP) ベースのフレームワークを提案する。
提案手法は,画像から多種多様なシーングラフを生成し,SGG手法の信頼性を評価し,全体的なSGG性能を向上させる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:27:57 GMT)
EIAD: Explainable Industrial Anomaly Detection Via Multi-Modal Large Language Models [23.9] 工業異常検出(IAD)は製造中の製品品質を確保するために重要である。
本稿では,コア特徴抽出からダイアログ機能を分離する専用マルチモーダル欠陥ローカライゼーションモジュールを提案する。
私たちはまた、Defect Detection Question Answering (DDQA) という、最初のマルチモーダル産業異常検出トレーニングデータセットにも貢献する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:33:29 GMT)
Beyond Atoms: Enhancing Molecular Pretrained Representations with 3D Space Modeling [23.9] 分子事前学習表現(MPR)は、薬物発見や材料設計などの応用において、限られた教師付きデータの課題に対処するための強力なアプローチとして登場した。
分子に分散した3次元空間全体を包含する原理的枠組みを提案する。
このフレームワークは,(1)グリッドベースの空間離散化,(2)グリッドサンプリング/マージ,(3)効率的な3次元位置符号化という3つの重要なコンポーネントを備えた,新しいTransformerベースのアーキテクチャであるSpaceFormerによって実装されている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:38:08 GMT)
Offline Hierarchical Reinforcement Learning via Inverse Optimization [23.7] OHIOは、階層的ポリシーのオフライン強化学習のためのフレームワークである。
エンド・ツー・エンドのRL法を大幅に上回り、ロバスト性を向上させる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:30:08 GMT)
ICE-Bench: A Unified and Comprehensive Benchmark for Image Creating and Editing [23.5] ICE-Benchは、画像生成モデルを厳格に評価するために設計された包括的なベンチマークである。
評価フレームワークは、6次元にわたる画像生成能力を評価する。
既存の世代モデルを徹底的に分析し、ベンチマークの難易度と現在のモデル能力と実世界の世代要件のギャップを明らかにする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:53:29 GMT)
Diffusion-based Data Augmentation and Knowledge Distillation with Generated Soft Labels Solving Data Scarcity Problems of SAR Oil Spill Segmentation [23.5] 石油流出セグメンテーションのための知識伝達(DAKTer)戦略を用いた拡散型データ拡張を提案する。
生成したSAR画像とソフトラベルを活用することで、学生セグメンテーションモデルは、同じタスクのために訓練された教師モデルなしで、堅牢な特徴表現を学習することができる。
我々の戦略は、他の生成的データ拡張手法と比較して、大きなマージンで優れた性能を達成するために、様々なセグメンテーションモデルを強化します。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:49:19 GMT)
Concat-ID: Towards Universal Identity-Preserving Video Synthesis [23.4] 本稿では、アイデンティティ保存ビデオ合成のための統合フレームワークであるConcat-IDを提案する。
Concat-IDはオートエンコーダを使って画像の特徴を抽出する。
整合性と顔の編集性のバランスをとるために、新しいクロスビデオペアリング戦略とマルチステージトレーニングレギュラーを導入する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:17:32 GMT)
Tailor: An Integrated Text-Driven CG-Ready Human and Garment Generation System [23.4] Tailorは、高忠実でカスタマイズ可能な3D人間をシミュレーション可能な衣服で生成する、テキストとアバターの統合システムである。
まず、テキスト記述をパラメータ化された体形に解釈するために、大きな言語モデルを用いる。
次に,新しい幾何学的損失を伴ってトポロジ保存を開発し,身体の幾何学に正確に適応する。
対称的な局所的な注意機構を持つ拡張されたテクスチャ拡散モジュールは、ビューの一貫性とフォトリアリスティックな詳細の両方を保証する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:08:49 GMT)
Temporally Consistent Object-Centric Learning by Contrasting Slots [23.2] ビデオオブジェクト中心モデルに対して、新しいオブジェクトレベルの時間的コントラスト損失を導入する。
本手法は学習対象中心表現の時間的一貫性を著しく向上させる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:01:07 GMT)
ExDDV: A New Dataset for Explainable Deepfake Detection in Video [23.2] 我々はExplainable Deepfake Detection in Videoの最初のデータセットとベンチマークであるExDDVを紹介した。
我々は、ExDDV上で様々な視覚言語モデルを評価し、様々な微調整および文脈内学習戦略を用いて実験を行う。
以上の結果から,ディープフェイクビデオのための堅牢な説明可能なモデルを開発するためには,テキストとクリックの監督が必要であることが示唆された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:55:07 GMT)
MoK-RAG: Mixture of Knowledge Paths Enhanced Retrieval-Augmented Generation for Embodied AI Environments [23.1] MoK-RAGは、知識パス強化検索機構の混合を実装した、新しいマルチソースRAGフレームワークである。
提案するMoK-RAG3Dは,3Dアセットを異なる部分に分割し,階層的な知識ツリー構造に基づいてそれらを整理することにより,このパラダイムを強化する。
我々の実験における自動評価と人的評価は、MoK-RAG3DがエンボディードAIエージェントの多様なシーン生成を支援することを実証している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:27:02 GMT)
Dynamic Accumulated Attention Map for Interpreting Evolution of Decision-Making in Vision Transformer [23.0] Vision Transformer (ViT) モデルは画像認識タスクに広く利用されている。
既存の視覚的説明法では、ViTモデルの内部構造内に隠れた注意の流れを表示できない。
動的累積アテンションマップ (DAAM) は,ViTネットワークを通した注意の流れを可視化するツールとして提案されている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:41:01 GMT)
Enhancing LLM Generation with Knowledge Hypergraph for Evidence-Based Medicine [23.0] エビデンスベースの医療(EBM)は、医療における大規模言語モデル(LLM)の適用において重要な役割を担っている。
本稿では,複数の情報源から散在する証拠をLCMを用いて収集し,知識ハイパーグラフに基づく証拠管理モデルを提案する。
本手法は,医療クイズ,幻覚検出,意思決定支援など,EMMに関心のあるアプリケーション領域において,既存のRAG技術よりも優れている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:17:31 GMT)
Make Your Training Flexible: Towards Deployment-Efficient Video Models [22.7] 予算間での入力情報を最大化するための新しいテスト設定であるToken Optimizationを提案する。
サンプリンググリッドをフレキシブルにし、トークンの選択を活用することで、最も人気のあるビデオトレーニングフレームワークに容易に採用できる。
大規模なビデオ事前トレーニングにFluxを統合し、その結果のFluxViTは、標準的なコストで広範囲のタスクにまたがって、新たな最先端の結果を確立します。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:15:58 GMT)
Stochastic Trajectory Prediction under Unstructured Constraints [22.7] 軌道予測は効果的な計画と意思決定を促進する一方、制約付き軌道予測は規制を予測に統合する。
制御可能軌道拡散(CTD)という条件付き生成パラダイムを用いた制約付き軌道予測の新しい手法を提案する。
CTDは、事前訓練されたスコアリングモデルを用いて適合度を予測し、このスコアを条件付き拡散モデルの条件として用いて軌道を生成する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:27:59 GMT)
CueTip: An Interactive and Explainable Physics-aware Pool Assistant [22.6] プール/ビリヤードの変形に対して,対話型かつ説明可能な自動コーチングアシスタントCueTipを提案する。
物理シミュレーターを用いて、従来の状態トレースと並んで自然言語で事象トレースを生成する。
我々は、CueTipの戦術的選択を相互作用性と説明可能性から切り離すニューラルアダプターを訓練する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:36:58 GMT)
Benchmarking Generative Models on Computational Thinking Tests in Elementary Visual Programming [22.3] 生成モデルは、プログラミング、自然科学、一般知識といった分野にわたる様々なベンチマークにおいて、人間のレベルの習熟度を示している。
学校での計算思考と問題解決のスキルを評価するために設計された、標準化されたプログラミング関連テストにおいて、最先端モデルはどのように機能するか?
本稿では,基礎的なビジュアルプログラミング領域に根ざした計算思考テストを含む新しいベンチマークをキュレートする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:03:15 GMT)
Why Do We Laugh? Annotation and Taxonomy Generation for Laughable Contexts in Spontaneous Text Conversation [22.2] 本研究は、笑いやすい文脈の根底にある理由を分類する分類法を開発した。
また、笑いやすい文脈の大多数のラベルを認識し、F1スコア43.14%のGPT-4oのパフォーマンスも評価した。
これらの知見は、よりニュアンスな認識と笑いの生成の基礎を確立することによって、会話型AIの進歩に寄与する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:50:37 GMT)
Doubly robust identification of treatment effects from multiple environments [22.2] 本稿では,基礎となる因果グラフの知識や学習を必要とせずに,不偏処理効果推定を行うアルゴリズムであるRAMENを提案する。
RAMENは二重の堅牢な識別を実現し、治療の因果親や結果の因果親が観察されるたびに、治療効果を識別することができる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:33:10 GMT)
The time scale of redundancy between prosody and linguistic context [22.0] 従来の研究では、韻律的特徴は過去と将来の両方の単語と大きな冗長性を示すことが示されている。
このスケールは過去と将来の言葉で異なります。
本研究は,効率的なコミュニケーションを形成する上での韻律の役割を強調した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:01:03 GMT)
An LLM Benchmark for Addressee Recognition in Multi-modal Multi-party Dialogue [21.9] 本論文は,次の順番に宛てられている相手を識別する,宛先認識の課題に焦点を当てる。
コーパスのサブセットにアドレナリ情報が付加され、明示的なアドレナリが会話のターンの約20%で表示されることが明らかになった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:39:36 GMT)
Level Set Teleportation: An Optimization Perspective [21.8] 勾配降下(GD)を加速しようとする最適化ルーチンであるレベルセットテレポーテーションについて検討する。
テレポーテーションはより大きなステップでGDを直感的に高速化するが、現在の目的は凸収束の理論を欠いている。
これは、テレポーテーションが改善も収束もしない標準的な(強く)設定とは対照的である。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:48:12 GMT)
MAC: A Benchmark for Multiple Attributes Compositional Zero-Shot Learning [21.8] 合成ゼロショット学習(CZSL)は、合成から意味的プリミティブ(属性とオブジェクト)を学ぶことを目的としている。
我々は,22,838の画像と17,627の合成を包括的および代表的属性アノテーションで包含する多属性合成データセットを提案する。
MACに基づいて,より深い意味理解と高度な属性関連を必要とする多属性合成ゼロショット学習を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:49:14 GMT)
PQPP: A Joint Benchmark for Text-to-Image Prompt and Query Performance Prediction [21.6] 本稿では,画像生成性能の点から手動でアノテートするプロンプトの最初のデータセットを紹介する。
我々はこれらの評価をテキスト・ツー・イメージ検索に拡張し、検索性能を表す手動アノテーションを収集する。
そこで我々は,PQPP (Properced and query performance prediction) とPQPP (Properced and query performance prediction) の2つのタスク間で10万以上のクエリからなる最初の共同ベンチマークを構築した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:45:09 GMT)
Less is More: Improving Motion Diffusion Models with Sparse Keyframes [21.5] 本稿では,スパースと幾何学的意味を意識した新しい拡散フレームワークを提案する。
本手法は,非鍵フレームをマスキングし,欠落フレームを効率的に補間することにより低減する。
我々のアプローチは、テキストアライメントやモーションリアリズムにおいて、最先端の手法よりも一貫して優れています。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:20:02 GMT)
Scale-Aware Contrastive Reverse Distillation for Unsupervised Medical Anomaly Detection [21.4] 教師なし異常検出は、その広範囲な適用性から、大きな研究の注目を集めている。
近年の手法では, メモリバンク, 正規化フロー, 自己指導型学習, 知識蒸留など様々な手法が検討されている。
本稿では,既存の逆蒸留法の2つの重要な限界に対処する,新しいスケール対応逆蒸留モデルを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:10:20 GMT)
Light4GS: Lightweight Compact 4D Gaussian Splatting Generation via Context Model [21.4] 3次元ビュー合成技術(3DGS)は,新規・新規コンテンツのための効率的な高忠実度パラダイムとして登場している。
3DGSを動的コンテンツに適用するために、変形可能な3DGSは、時間的に変形可能なプリミティブと学習可能な遅延埋め込みを組み込んで複雑な動きをキャプチャする。
優れた性能にもかかわらず、高次元の埋め込みと大量のプリミティブは、かなりのストレージ要件をもたらす。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:28:13 GMT)
Words Matter: Leveraging Individual Text Embeddings for Code Generation in CLIP Test-Time Adaptation [21.2] テスト時推論において視覚言語モデル(VLM)が遭遇する分布ドリフトを軽減するために,クラステキスト情報を活用する方法を示す。
本稿では,ラベル割り当て問題の固定セントロイドとしてジェネリッククラステキスト埋め込みを利用して,テスト時間サンプルの擬似ラベルを生成することを提案する。
多様な複雑性を示す複数の人気のあるテスト時間適応ベンチマークの実験は、CLIP-OTの優位性を実証的に示している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:02:05 GMT)
Learning an Optimal Assortment Policy under Observational Data [21.1] 我々は,MNL(Multinomial Logit)モデルに基づくオフラインアソシエーション最適化の基本的問題について検討する。
本稿では、オフライン学習のパラダイムを考察し、効率的なオフライン配置最適化のための最小限のデータ要件について検討する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 00:17:23 GMT)
Efficient Data Selection for Training Genomic Perturbation Models [20.7] グラフニューラルネットワークに基づく遺伝子発現モデルは、遺伝子摂動の結果を予測するために訓練される。
アクティブな学習方法は、トレーニングセットを構築するのに必要な実験のコストのために、これらのモデルをトレーニングするためにしばしば使用される。
本稿では,遺伝子発現モデルを訓練するためのグラフベースのワンショットデータ選択法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:52:03 GMT)
Mapping Urban Villages in China: Progress and Challenges [20.7] 質の高い都市化への転換は「都市村」問題に注目が集まっている。
都市村の地理空間データがないため、都市村の地図作成を優先することが重要である。
将来の研究は、全国にわたる大規模マッピングを達成するために、現在の研究を補完し、さらに進めることができる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:13:55 GMT)
Unlearning Concepts in Diffusion Model via Concept Domain Correction and Concept Preserving Gradient [20.7] 我々はtextbfDoCo (textbfDomaintextbfCorrection) という新しい概念領域補正フレームワークを提案する。
本手法は, 対象概念の包括的未学習を保証し, 先進的学習を通して, センシティブな概念とアンカーの概念の出力領域を整合させることにより, 対象概念の包括的未学習を確実にする。
また、矛盾する勾配成分を緩和し、特定の概念を学習しながらモデルの実用性を維持するための概念保存的勾配手術手法も導入する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:22:46 GMT)
MDTeamGPT: A Self-Evolving LLM-based Multi-Agent Framework for Multi-Disciplinary Team Medical Consultation [20.6] MDTコンサルテーションにおけるマルチロールコラボレーションは、しばしば過度に長い対話履歴をもたらす。
本稿では,これらの問題に対処する大規模言語モデル(LLM)に基づくマルチエージェントMDT医療相談フレームワークを提案する。
本フレームワークでは,コンセンサス・アグリゲーションと,マルチラウンド・コンサルテーションのための残余の議論構造を用いる。
また、CorrectKB (CorrectKB) とChain-of-Thought Knowledge Base (ChainKB) も採用している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:07:34 GMT)
Rethinking Cell Counting Methods: Decoupling Counting and Localization [20.5] 本稿では, 概念的にシンプルで効果的なセルカウントのための非結合学習手法を提案する。
計数と密度マップの推定を共同で学習するのとは対照的に、これらの目的を疎結合することで驚くほど結果が向上することを示す。
我々の重要な洞察は、疎結合学習は、高分解能密度マップを直接数えることを学ぶ必要性を軽減することである。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:50:03 GMT)
SketchSplat: 3D Edge Reconstruction via Differentiable Multi-view Sketch Splatting [20.4] エッジは3Dで構造情報を記述するための最も基本的なパラメトリックプリミティブの1つである。
従来の方法は、通常、多視点2Dエッジイメージから設定された3Dエッジポイントを再構成し、それから3Dエッジをポイントセットに適合させる。
そこで我々はSketchSplatを提案する。SketchSplatは,多視点スケッチスプラッティングにより,高精度で完全かつコンパクトな3次元エッジを再構築する手法である。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 23:30:03 GMT)
MusicInfuser: Making Video Diffusion Listen and Dance [20.4] MusicInfuserは、特定の音楽トラックに同期した高品質なダンスビデオを生成するアプローチである。
既存の映像拡散モデルがどのように音楽入力に適応できるかを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:59:58 GMT)
Advances in 4D Generation: A Survey [20.3] 2D3Dコンテンツ生成の成功に基づいて、4D世代は急速に発展している研究領域として現れている。
本稿では,この分野の包括的調査を行い,その理論的基礎,鍵となる方法論,実践的応用を体系的に検討する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:59:51 GMT)
Context Clues: Evaluating Long Context Models for Clinical Prediction Tasks on EHRs [20.1] 本稿では,EHRデータモデリングにおける文脈長の影響を初めて体系的に評価する。
より長いコンテキストモデルによって予測性能が向上することがわかった。
しかし, 臨床応用においては, モデル性能だけでは不十分である。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:04:32 GMT)
Graph-CNNs for RF Imaging: Learning the Electric Field Integral Equations [20.1] 本稿では、対応する逆モデルを学ぶために、ディープニューラルネットワーク(DNN)アーキテクチャを提案する。
グラフアテンションバックボーンは、システムのジオメトリをDNNに渡すことができ、残余の畳み込み層がオブジェクトの特徴を抽出する。
異なる特徴を持つ2つの合成データセットに対する評価は、提案した高度なアーキテクチャの性能向上を示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:16:40 GMT)
CANVAS: Commonsense-Aware Navigation System for Intuitive Human-Robot Interaction [20.0] 本稿では,コモンセンス認識ナビゲーションのための視覚的および言語的指示を組み合わせたフレームワークであるCANVASを提案する。
その成功は模倣学習によって引き起こされ、ロボットは人間のナビゲーション行動から学ぶことができる。
実験の結果,CANVASはすべての環境において,強力なルールベースシステムであるROS NavStackよりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:44:59 GMT)
Out-of-Distribution Generalization in Time Series: A Survey [20.0] 時系列はしばしば分布シフト、多彩な潜在特徴、非定常学習ダイナミクスを示す。
これらの特徴は、アウト・オブ・ディストリビューション(OOD)の一般化に重大な課題をもたらす。
本報告では,時系列のOOD一般化手法について概観する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:35:29 GMT)
A Comprehensive Study of LLM Secure Code Generation [19.8] これまでの研究は主に、生成されたコードの脆弱性を検出するために、単一の静的アナライザであるCodeQLに依存していた。
セキュリティ検査と機能検証の両方を同一生成コードに適用し、これら2つの側面をまとめて評価する。
我々の研究は、既存の技術が多くの場合、生成したコードの機能を損なうことにより、セキュリティが向上することを示した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:12:50 GMT)
Unifying Text Semantics and Graph Structures for Temporal Text-attributed Graphs with Large Language Models [19.7] 時間グラフニューラルネットワーク(TGNN)は時間グラフモデリングにおいて顕著な性能を示した。
TTAGモデリングのための既存のTGNNをシームレスに拡張する新しいフレームワークである textbfCross を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:50:10 GMT)
Driving behavior recognition via self-discovery learning [19.6] サンプル不足と類似行動との混同による長期分布は、効果的な運転行動検出を妨げている。
既存の手法は、しばしばサンプルの混乱に適切に対処できない。
データセットには、しばしば不明瞭なサンプルが含まれます。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:13:08 GMT)
VisEscape: A Benchmark for Evaluating Exploration-driven Decision-making in Virtual Escape Rooms [19.6] VisEscapeは、挑戦的な条件下でAIモデルを評価するために特別に設計された、20の仮想エスケープルームのベンチマークである。
VisEscapeでは、最先端のマルチモーダルモデルでさえ一般的に部屋から逃れることができず、進行と軌道のレベルにかなりの変化が見られた。
本稿では,メモリ,フィードバック,ReActモジュールを効果的に統合したVisEscaperを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:59:09 GMT)
Personalized Attacks of Social Engineering in Multi-turn Conversations -- LLM Agents for Simulation and Detection [19.6] ソーシャルメディアプラットフォームに対する社会工学(SE)攻撃は重大なリスクをもたらす。
マルチターン会話を生成することで,SE攻撃機構をシミュレートするLLM-agentic framework,SE-VSimを提案する。
本研究は,被害者の人格に関する事前知識を活用することで,ユーザに対してパーソナライズされた保護を提供するための概念実証SE-OmniGuardを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:14:44 GMT)
ConSCompF: Consistency-focused Similarity Comparison Framework for Generative Large Language Models [19.5] 生成型大規模言語モデルのための一貫性に着目した類似性比較フレームワーク(ConSCompF)を提案する。
2つのLCMによって生成されたテキストを比較し、類似度スコアを生成し、それらのレスポンス間の全体的な類似度を示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:38:04 GMT)
MagicComp: Training-free Dual-Phase Refinement for Compositional Video Generation [19.3] MagicCompは、T2V生成を2相精製により強化するトレーニングフリーの手法である。
MagicCompはモデルに依存しない汎用的なアプローチであり、既存のT2Vアーキテクチャにシームレスに統合することができる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:02:14 GMT)
C-Adapter: Adapting Deep Classifiers for Efficient Conformal Prediction Sets [19.3] 精度を犠牲にすることなく共形予測器の効率を向上させるためにtextbfConformal Adapter (C-Adapter) を導入する。
特に、命令保存関数のクラスとしてアダプタを実装し、提案した損失に合わせて調整する。
C-Adapterを使用すると、このモデルは間違ったラベルに対して非常に高い非整合性スコアを生成する傾向にある。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:54:13 GMT)
COPA: Comparing the Incomparable to Explore the Pareto Front [19.1] 機械学習(ML)では、デプロイするモデルを選択する際に、複数の目的を考慮に入れることが一般的である。
どのように比較し、集約し、最終的にこれらの目標をトレードオフすべきかは、しばしば不明確です。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:51:42 GMT)
CRCE: Coreference-Retention Concept Erasure in Text-to-Image Diffusion Models [19.1] 本稿では,新しい概念消去フレームワークCRCEを紹介する。
コアフェルデンシャルと保持概念を意味的に明示的にモデル化することにより、CRCEはより正確な概念除去を可能にする。
実験により、CRCEは様々な消去タスクにおいて既存の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:09:01 GMT)
KG-IRAG: A Knowledge Graph-Based Iterative Retrieval-Augmented Generation Framework for Temporal Reasoning [19.0] GraphRAGは、外部知識を必要とするタスクにおいて、LLM(Large Language Models)の性能を高めるのに非常に効果的であることが証明されている。
本稿では,KGと反復推論を統合する新しいフレームワークである知識グラフに基づく反復検索生成(KG-IRAG)を提案する。
KG-IRAGのパフォーマンスを評価するために、3つの新しいデータセットが作成され、従来のRAGアプリケーションを超える可能性を示している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:11:43 GMT)
VSTAR: Generative Temporal Nursing for Longer Dynamic Video Synthesis [18.8] 本稿では,時間的ダイナミクスの制御を改善するために,時間的時間的看護(GTN, Generative Temporal Nursing, GTN)の概念を導入する。
提案手法が既存のオープンソースT2Vモデルよりも長めで視覚的に魅力的なビデオを生成する場合の優位性を実験的に示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:55:22 GMT)
An Effective Theory of Bias Amplification [18.6] 機械学習モデルは、データに存在するバイアスをキャプチャして増幅し、ソーシャルグループ間で異なるテストパフォーマンスをもたらす。
本稿では、従来のモデルが単純化された状況下でのニューラルネットワークをフィードフォワードする尾根回帰の文脈で、精密な解析理論を提案する。
我々の理論は、機械学習バイアスの統一的で厳密な説明を提供し、バイアス増幅やマイノリティグループバイアスのような現象に関する洞察を提供する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:56:58 GMT)
Augmented Object Intelligence: Making the Analog World Interactable with XR-Objects [18.6] 本稿では,デジタルと物理の境界線を曖昧にするために設計された,新しいXRインタラクションパラダイムであるAugmented Object Intelligence(AOI)を紹介する。
我々は,オープンソースのプロトタイプシステムであるXR-Objectsの形で,AOIの概念を実装した。
このシステムにより、アナログオブジェクトは情報を伝えるだけでなく、詳細を問い合わせたりタスクを実行するといったデジタルアクションを開始することができる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 23:29:40 GMT)
LLM Generated Persona is a Promise with a Catch [18.5] ペルソナをベースとしたシミュレーションは、人口レベルのフィードバックに依存した変革の規律を約束する。
現実的なペルソナデータを収集する従来の方法は課題に直面します。
プライバシーの制約により、違法に高価で物議を醸している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:11:27 GMT)
Effectively Leveraging CLIP for Generating Situational Summaries of Images and Videos [18.3] 状況認識とは、エージェントが利用可能な情報や感覚入力に基づいて、様々な状況や状況を特定し、理解する能力である。
ClipSituは、CLIPに基づく画像、動詞、ロール埋め込みを利用して、動詞に関連するすべての役割を満たす名詞を予測する。
この結果から,ClipSituモデルでは,一般的なキャプションに比べて曖昧さを低減した構造化記述を作成できることがわかった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:14:55 GMT)
MOSAIC: Generating Consistent, Privacy-Preserving Scenes from Multiple Depth Views in Multi-Room Environments [18.1] 奥行き画像のみから多室屋内環境のプライバシ保存型デジタル双対を生成するための,拡散に基づく新しいアプローチを提案する。
我々のアプローチの中心は、新しいMOSAIC(Multi-view Overlapped Scene Alignment with Implicit Consistency)モデルである。
実験により、MOSAICは複雑なマルチルーム環境の再構築において、画像の忠実度測定における最先端のベースラインよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:50:57 GMT)
High-Quality 3D Head Reconstruction from Any Single Portrait Image [18.0] 本稿では,1枚のポートレート画像から,視点,表情,アクセサリーに関係なく,新しい高忠実度3次元頭部再構成手法を提案する。
本手法は,サイドフェイスアングルや複雑なアクセサリなど,難易度の高いシナリオに対して堅牢な性能を示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:58:46 GMT)
Effortless Active Labeling for Long-Term Test-Time Adaptation [18.0] 長期的なテストタイムの適応は、エラーの蓄積による難しい作業である。
最近のアプローチでは、各バッチに少数のサンプルを積極的にラベル付けすることでこの問題に対処している。
本稿では,各バッチにおけるアノテーションに対して,最大1つのサンプルが選択されるように,無駄なアクティブラベリングを実現する方法について検討する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:49:27 GMT)
CoTBal: Comprehensive Task Balancing for Multi-Task Visual Instruction Tuning [17.9] マルチタスク・ビジュアル・インストラクション・チューニングに適した包括的タスク・バランシング・アルゴリズムを提案する。
CoTBalアルゴリズムは,マルチタスク・ビジュアル・インストラクション・チューニングにおいて,より優れた,よりバランスの取れた全体的な性能を実現する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:24:54 GMT)
Survey of Adversarial Robustness in Multimodal Large Language Models [17.9] MLLM(Multimodal Large Language Models)は、人工知能において例外的な性能を示す。
現実世界のアプリケーションへのデプロイは、敵の脆弱性に対する重大な懸念を引き起こす。
本稿では,MLLMの対角的ロバスト性について述べる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:54:59 GMT)
RAT: Boosting Misclassification Detection Ability without Extra Data [17.8] 本研究では,逆方向摂動レンズを用いた画像分類モデルの誤分類入力の検出について検討する。
本稿では、信頼度としてロバスト半径を用い、2つの効率的な推定アルゴリズムRR-BSとRR-Fastを誤分類検出に使用することを提案する。
実験では,AURCの最大29.3%,FPR@95TPRの最大21.62%の削減が可能であった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 23:18:55 GMT)
Adversarial Training for Multimodal Large Language Models against Jailbreak Attacks [17.8] MLLM訓練期間中のジェイルブレイク攻撃に対する防御を目的とした,最初の対人訓練パラダイムを提示する。
エンド・ツー・エンドのATフレームワークであるProEAT(Projection Layer Against Adversarial Training)を紹介する。
ProEATは最先端の防御性能を達成し、テキストと画像のモダリティの平均マージン+34%で既存のベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:01:13 GMT)
Respiratory Subtraction for Pulmonary Microwave Ablation Evaluation [17.4] 肺癌は世界的ながん死亡の主な原因であり、しばしば最小限の侵襲的介入を必要とする。
術前および術後の画像誘導に基づく肺腫瘍アブレーション治療成績を評価するための呼吸減量法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:09:48 GMT)
LeanVAE: An Ultra-Efficient Reconstruction VAE for Video Diffusion Models [17.3] 本稿では,斬新で高効率なビデオVAEフレームワークLeanVAEを提案する。
我々のモデルは最大50倍のFLOPと44倍高速な推論速度を提供する。
ビデオ再生・生成におけるLeanVAEの優位性を検証した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:58:59 GMT)
Amuro and Char: Analyzing the Relationship between Pre-Training and Fine-Tuning of Large Language Models [17.3] 本研究では,複数の中間学習モデルチェックポイントの微調整による事前学習と微調整の関係について検討する。
18のデータセットで得られた結果は、事前学習が微調整後に発表される潜在的な方法でモデルを改善することを示唆している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:21:04 GMT)
Organ-aware Multi-scale Medical Image Segmentation Using Text Prompt Engineering [17.3] 既存の医用画像分割法は、画像やビデオなどの一様視覚入力に依存しており、労働集約的な手動アノテーションを必要とする。
医用イメージング技術は、単一のスキャン内で複数の絡み合った臓器をキャプチャし、セグメンテーションの精度をさらに複雑にする。
これらの課題に対処するため、MedSAMは画像特徴とユーザが提供するプロンプトを統合することでセグメンテーションの精度を高めるために開発された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:35:34 GMT)
CATD: Unified Representation Learning for EEG-to-fMRI Cross-Modal Generation [17.3] 本稿では,ニューロイメージングの終端から終端までのクロスモーダル合成のための条件付き時間拡散(CATD)フレームワークを提案する。
提案フレームワークは、ニューロイメージングのクロスモーダル合成のための新しいパラダイムを確立する。
パーキンソン病の予測を改善し、異常な脳領域を同定するといった医療応用の可能性を示している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:42:45 GMT)
Analyzing and Bridging the Gap between Maximizing Total Reward and Discounted Reward in Deep Reinforcement Learning [17.2] 最適目的は強化学習(RL)の基本的側面である
総リターンは理想的であるが、割引リターンはその安定性のために現実的な目的である。
目的を整合させる2つの方法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:27:15 GMT)
Can Large Vision Language Models Read Maps Like a Human? [16.8] MapBenchは1600ピクセル以上の空間マップパスで構成されており、100の多様なマップから問題を見つけることができる。
MapBenchでは、LVLMはマップイメージと開始と終了のランドマークを持つクエリを与えられた言語ベースのナビゲーション命令を生成する。
我々はMapBenchがゼロショットプロンプトとCoT(Chain-of-Thought)拡張推論フレームワークの両方において最先端のLVLMに大きく挑戦していることを実証した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:05:38 GMT)
VGFL-SA: Vertical Graph Federated Learning Structure Attack Based on Contrastive Learning [16.7] グラフニューラルネットワーク(GNN)は,グラフデータから表現を学習する能力に注目されている。
近年の研究では、垂直グラフフェデレーション学習フレームワークは、性能を低下させる敵攻撃に弱いことが示されている。
ラベルを使わずにローカルクライアント構造を変更してVGFLの性能を低下させるために,VGFL-SAと呼ばれる新しいグラフ対逆攻撃を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:07:23 GMT)
A Conditional Independence Test in the Presence of Discretization [16.7] 既存のテストメソッドは、離散化された観察しかできない場合、機能しない。
このような離散化の存在に対応するために特別に設計された条件付き独立テストを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:55:12 GMT)
LLM-based Unit Test Generation for Dynamically-Typed Programs [16.4] TypeTestは、ベクトルベースのRetrieval-Augmented Generationシステムを通じて、テスト生成における型正しさを高める新しいフレームワークである。
125の現実世界のPythonモジュールの評価において、TypeTestは平均で86.6%、ブランチで76.8%を獲得し、それぞれ5.4%、9.3%の最先端ツールを上回った。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:07:17 GMT)
Tapered Off-Policy REINFORCE: Stable and efficient reinforcement learning for LLMs [16.3] 強化学習を用いた大規模言語モデルの微調整のための新しいアルゴリズムを提案する。
オフ政治体制における正と負の例を適切に活用することで、テスト時間精度とトレーニングデータの効率が同時に向上することを示す。
この研究の結果として、REINFORCEのベースラインパラメータが、ネガティブな例の存在下でデータセット構成を定義する上で、重要かつ予期せぬ役割を担っていることが判明した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:23:37 GMT)
IMRL: Integrating Visual, Physical, Temporal, and Geometric Representations for Enhanced Food Acquisition [16.3] IMRL(Integrated Multi-dimensional Representation Learning, 統合多次元表現学習)を提案する。
提案手法は, 食品の種類や物理的特性を捉え, 獲得行動の時間的ダイナミクスをモデル化し, 最適スクーピング点を決定するための幾何学的情報を導入する。
IMRLにより、ILはコンテキストに基づいてスクーピング戦略を適応的に調整し、多様な食品取得シナリオを扱うロボットの能力を改善することができる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:32:55 GMT)
Leveraging Vision-Language Models for Open-Vocabulary Instance Segmentation and Tracking [16.3] 本稿では,視覚言語モデル(VLM)の機能を活用した新しいアプローチを提案する。
VLMの生成した構造化記述を用いて、可視オブジェクトのインスタンスを識別し、アプリケーション関連属性を収集し、開語彙検出器に通知し、対応するバウンディングボックスを抽出する。
新しい構造化された記述とそれに対応するオープン語彙検出を生成することで、トラックを必要に応じてオンラインで更新することができる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:18:42 GMT)
Uncertainty Distillation: Teaching Language Models to Express Semantic Confidence [16.3] 大規模言語モデル (LLM) は、事実質問に対する回答にますます使われている。
これらの不確実性の言葉化表現が意味を持つためには、表現された信頼度レベルでエラー率を反映すべきである。
多くの先行手法は語彙の不確かさを計算し、モデルが生成した特定の文字列に対する信頼度を推定する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 21:29:29 GMT)
Streamlining Prediction in Bayesian Deep Learning [16.1] 本研究は, サンプリング不要な単一前方通過によるBDLの合理化予測について検討する。
我々は、後続の予測分布に対する近似を解析的に計算する。
本稿では,ViT や GPT-2 などのトランスフォーマーにアプローチを示し,その性能を回帰および分類タスクで評価する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:18:04 GMT)
Flatness Improves Backbone Generalisation in Few-shot Classification [16.1] FSC(Few-shot Classification)は、トレーニング済みのバックボーンを利用して新しいクラスに迅速に適応することで、この問題に対する解決策を提供する。
フラットネスを意識したトレーニングと微調整を利用して,マルチドメインFSCにおけるバックボーントレーニングと選択のための効果的な戦略を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:19:45 GMT)
Rolling Forward: Enhancing LightGCN with Causal Graph Convolution for Credit Bond Recommendation [16.0] 光グラフ畳み込みネットワーク(LightGCN: Light Graph Convolutional Network)の新たな拡張を導入し、動的興味を捉えた時間ノードの埋め込みを学習する。
私たちのアプローチでは、前方のモデルアーキテクチャを維持するために因果的畳み込みを採用しています。
この結果から,時間依存アプリケーションにおけるグラフベースのレコメンデータシステムの設計に関する新たな知見が得られた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:47:01 GMT)
Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models [15.9] 拡散言語モデルは自己回帰モデルよりも独特な利点を提供する。
確率モデリングに遅れがあり、固定長生成に制限される。
本稿では,離散化拡散モデルと自己回帰モデルとを補間するブロック拡散言語モデルについて紹介する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:58:18 GMT)
Temporal Flexibility in Spiking Neural Networks: Towards Generalization Across Time Steps and Deployment Friendliness [15.8] スパイキングニューラルネットワーク(SNN)は、ニューロモルフィックハードウェアにエネルギー効率の高い実装を可能にする。
現在、現在のダイレクトトレーニングアプローチでトレーニングされているSNNは、特定の時間ステップに制限されている。
SNNの時間的柔軟性を改善する新しい手法であるMixed Time-step Training (MTT)を導入する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:09:42 GMT)
HandSplat: Embedding-Driven Gaussian Splatting for High-Fidelity Hand Rendering [15.8] 既存の3次元ガウススプラッティング法は、過度に単純化された非剛体運動モデルを持つ剛体骨格運動に依存している。
HandSplatは、ハンドレンダリングの忠実さと安定性を両立させる新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 21:09:04 GMT)
PCDreamer: Point Cloud Completion Through Multi-view Diffusion Priors [15.7] PCDreamerは、ポイントクラウド補完のための新しい方法である。
我々は、大規模モデル内での相対的なビュー一貫性を持つ多視点拡散プリミティブを利用する。
得られた画像集合は、大域および局所的な形状キューの両方を符号化する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:31:52 GMT)
CoDTS: Enhancing Sparsely Supervised Collaborative Perception with a Dual Teacher-Student Framework [15.5] 我々は,CoDTS(Dual Teacher-Student framework)のエンドツーエンド協調認識を提案する。
適応的な補完学習を用いて、高品質な擬似ラベルと高品質な擬似ラベルの両方を生成する。
CoDTSは、品質と量の両方において、擬似ラベルの最適バランスを効果的に保証する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:41:58 GMT)
Exploiting Inherent Class Label: Towards Robust Scribble Supervised Semantic Segmentation [15.4] 頑健なスクリブル教師付きセマンティックセマンティックセグメンテーションのためのクラス駆動型スクリブルプロモーションネットワークを提案する。
ネットワーク内では,ノイズラベルを緩和するローカライゼーション修正モジュールと,スクリブルアノテーションや擬似ラベルを取り巻く信頼性のある領域を識別する距離知覚モジュールを導入する。
提案手法は,既存の手法よりも優れていることを示すとともに,精度と堅牢性の両方において競争性能を示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:43:07 GMT)
SceneEval: Evaluating Semantic Coherence in Text-Conditioned 3D Indoor Scene Synthesis [15.4] 既存のメトリクスは、主に生成されたシーンのリアリズムを、一連の地味なシーンと比較することによって評価する。
この制限に対処するために設計された評価フレームワークであるSceneEvalを紹介する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 22:02:35 GMT)
Týr-the-Pruner: Unlocking Accurate 50% Structural Pruning for LLMs via Global Sparsity Distribution Optimization [15.0] T'yr-the-Prunerは、効率的なエンドツーエンド検索ベースのグローバルな構造解析フレームワークである。
実効的な局所刈り取りと,スーパーネット構築を改善するための予測誤差蓄積手法を導入する。
その結果、T'yr-the-Prunerは最先端の構造解析を達成し、高密度モデルの性能の97%を維持しながら、Llama-3.1-70Bのパラメータの50%を除去した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:51:05 GMT)
ARC-Calib: Autonomous Markerless Camera-to-Robot Calibration via Exploratory Robot Motions [15.0] ARC-Calibはモデルベースのマーカーレスカメラ・ロボットキャリブレーションフレームワークである。
完全に自律的で、多様なロボットにまたがって一般化できる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:03:32 GMT)
Do Multimodal Large Language Models Understand Welding? [14.8] 本稿では, 溶接に焦点をあて, 熟練生産作業におけるマルチモーダルLLM(MLLM)の性能について検討する。
本研究では,3つの文脈(RVとMarine,Aeronautical,Farming)における溶接受理性評価における最先端MLLMの性能評価を行った。
WeldPromptを開発した。これは、チェーン・オブ・ソート(Chain-of-Thought)生成とインコンテクスト学習を組み合わせて幻覚を緩和し、推論を改善するためのプロンプト戦略である。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:07:56 GMT)
Tiled Flash Linear Attention: More Efficient Linear RNN and xLSTM Kernels [14.8] ゲーティングを備えた線形RNNは、最近、言語モデリングにおけるトランスフォーマーと比較して、競合する性能を示した。
本稿では,線形RNNのための新しいカーネルアルゴリズムである Tiled Flash Linear Attention (TFLA) について述べる。
高速化ベンチマークでは、TFLAに基づく新しいmLSTMカーネルが、高度に最適化されたFlashアテンション、線形アテンション、およびMambaカーネルより優れていることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:09:47 GMT)
Speculative Decoding for Verilog: Speed and Quality, All in One [14.6] 本稿では,Verilogコード生成のための投機的復号法を提案する。
標準的なトークン化方式とは異なり、我々の手法はデコード停止を構文的に重要なトークンと一致させる。
実験の結果,Verilogのコード生成では最大5.05倍の高速化が達成された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:21:53 GMT)
Position: Model Collapse Does Not Mean What You Think [14.6] モデル崩壊の研究は、実際には8つの異なるモデル崩壊の定義に矛盾することがあると論じる。
モデル崩壊の予測された主張は、現実の条件に合わない仮定や条件に依存すると結論付けている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:48:25 GMT)
Restyling Unsupervised Concept Based Interpretable Networks with Generative Models [14.6] 本稿では,事前学習された生成モデルの潜在空間に概念特徴をマッピングすることに依存する新しい手法を提案する。
本手法の有効性を,解釈可能な予測ネットワークの精度,再現性,学習概念の忠実性,一貫性の観点から定量的に検証した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 21:58:33 GMT)
Advancing Medical Representation Learning Through High-Quality Data [14.5] PubMed Centralの高品質な医療データセットであるOpen-PMCを紹介する。
インテキスト参照は、典型的にはキャプションに見られる抽象的な情報を超えて、よりリッチな医療コンテキストを提供する。
我々は、検索とゼロショット分類タスクにわたるより大きなデータセットに対してOpen-PMCをベンチマークする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:10:11 GMT)
LLMs as Models for Analogical Reasoning [14.4] アナロジカル推論は人間の認知と学習の基本である。
近年の研究では、大きな言語モデルが類似の推論タスクにおいて人間と一致することが示されている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:49:06 GMT)
Light-R1: Curriculum SFT, DPO and RL for Long COT from Scratch and Beyond [14.4] 本稿では、長い推論モデルをトレーニングするためのオープンソースのスイートであるLight-R1を紹介する。
カリキュラムの学習は、多段階のポストトレーニングと組み合わせて、データの難易度を徐々に高めていく。
最終的なLight-R1-14B-DSは,AIME24と25のスコアが74.0,60.2の14Bモデル間でSOTA性能を実現している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:07:21 GMT)
Evaluating Global Geo-alignment for Precision Learned Autonomous Vehicle Localization using Aerial Data [14.3] 学習されたローカライゼーション手法は、自動運転車の正確な距離ローカライゼーションを提供するための課題を克服する可能性を示している。
訓練時の航空データと自律走行車両センサデータの整合性を改善することは,学習に基づくローカライゼーションシステムの性能向上に不可欠であることがわかった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:44:43 GMT)
SeFENet: Robust Deep Homography Estimation via Semantic-Driven Feature Enhancement [14.2] 厳しい環境で撮影された画像は、しばしばぼやけた細部、コントラストの低減、色歪みを示す。
本稿では,SeFENetと呼ばれる,ロバストなホモグラフィ推定のための意味駆動型機能拡張ネットワークを提案する。
SeFENetはSOTA法を著しく上回り,大規模データセット上での点一致誤差を少なくとも41%低減することを示した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:34:37 GMT)
MMR: A Large-scale Benchmark Dataset for Multi-target and Multi-granularity Reasoning Segmentation [14.1] MMR(Multi-target and Multi-granularity Reasoning)と呼ばれるデータセットを提案する。
MMRは194Kの複雑で暗黙的な命令で構成されており、マルチターゲット、オブジェクトレベル、そして部分レベルの側面を考慮に入れている。
本稿では,多目的,オブジェクトレベル,部分レベルの推論セグメンテーションのための,単純かつ効果的なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:23:09 GMT)
Towards Scalable Foundation Model for Multi-modal and Hyperspectral Geospatial Data [14.1] 本稿では,3つのイノベーションを取り入れた高効率空間スペクトル変換器について紹介する。
位置マスキングとチャネルマスキングを統合したHyperspectral Masked Autoencoderフレームワークを用いたLESS ViTの事前訓練を行った。
実験により, 提案手法は, 最先端のマルチモーダル地空間基盤モデルと競合する性能を示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:13:50 GMT)
Text-to-3D Generation using Jensen-Shannon Score Distillation [14.1] 我々はJensen-Shannon divergence(JSD)に基づく有界スコア蒸留目標を導出する。
本稿では,ジェネレーティブ・ディバイサル・ネットワークの理論を活用することで,JSDの実践的な実装を提案する。
T3Benchの実験結果から,本手法は高品質で多様な3Dアセットを創出できることが示された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:15:23 GMT)
Squeeze Out Tokens from Sample for Finer-Grained Data Governance [14.0] 私たちは、データガバナンスを、"願望"アプローチから"願望"アプローチにアップグレードします。
当社のデュアルブランチDataJuicerは、よりきめ細かいサンプル内ガバナンスを適用しています。
情報トークンを絞り出し、画像テキストアライメントを強化します。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:06:50 GMT)
FlexVLN: Flexible Adaptation for Diverse Vision-and-Language Navigation Tasks [14.0] 視覚・言語ナビゲーション(VLN)の革新的階層的アプローチであるFlexVLNを提案する。
教師付き学習ベースのインストラクションフォロワのナビゲーション能力とLLM Plannerの堅牢な一般化能力を統合する。
一般化能力を評価するために,REVERIE,SOON,CVDN-targetをドメイン外のデータセットとみなす。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:58:41 GMT)
Automatic MILP Model Construction for Multi-Robot Task Allocation and Scheduling Based on Large Language Models [14.0] 既存の手法は、動的な生産制約に適応する際の課題に直面します。
企業には 生産スケジュールデータに対する 高いプライバシ要件があります
本研究では,知識強化型混合整数線形時間(MILP)自動フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:45:19 GMT)
Enabling Inclusive Systematic Reviews: Incorporating Preprint Articles with Large Language Model-Driven Evaluations [14.0] 我々は,事前印刷の出版を予測するための高度なフレームワークであるAutoConfidenceを提案する。
手動のキュレーションへの依存を減らし、予測値の範囲を広げる。
このフレームワークは、エビデンスベースの医療において、プリプリント記事の体系的な取り込みを促進する可能性がある。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:14:23 GMT)
DPImageBench: A Unified Benchmark for Differentially Private Image Synthesis [13.9] 差分プライベート(DP)画像合成は、データセット内の個々の画像のプライバシーを保護しながら、機密画像の特性を保持する人工画像を生成することを目的としている。
近年の進歩にもかかわらず、不整合かつ時には欠陥のある評価プロトコルが研究全体で適用されている。
本稿では,DP画像合成のためのDPImageBenchについて述べる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:37:35 GMT)
Generating Causal Explanations of Vehicular Agent Behavioural Interactions with Learnt Reward Profiles [13.5] 我々はエージェント間相互作用の説明を因果的に推測できるようなエージェントに対する報酬指標の重み付けを学習する。
3つの実世界の運転データセットに対して定量的かつ定性的にアプローチを検証する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:53:59 GMT)
Inferring Event Descriptions from Time Series with Language Models [13.4] 時系列データは、時間とともに環境がどのように変化するかを測定し、金融や医療といった重要な領域における意思決定を促進する。
本研究では,Large Language Models (LLM) が時系列から自然言語イベントを推論できるかどうかを初めて検討する。
16個のLDMを評価し,時系列データから事象を推測する有望な能力を示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:07:33 GMT)
VARP: Reinforcement Learning from Vision-Language Model Feedback with Agent Regularized Preferences [13.3] 嗜好に基づくRLは、比較フィードバックから報酬を学ぶことによって、これらの落とし穴のいくつかを緩和する。
単一の最終状態の画像は、一般的にエージェントの完全な動きを捉えるのに失敗する。
本稿では,フィードバックの精度を向上し,報酬学習とエージェントのポリシーの整合性を向上する2部構成のソリューションを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:51:27 GMT)
ShapeShift: Towards Text-to-Shape Arrangement Synthesis with Content-Aware Geometric Constraints [13.2] ShapeShiftはテキスト誘導による画像から画像への変換タスクであり、入力された剛体形状の集合を重複しない構成に再構成する必要がある。
重複が発生した場合に,最小限の意味的コヒーレントな調整を施す,コンテンツ対応の衝突解決機構を導入する。
本手法は,空間的関係がテキストのプロンプトをはっきりと具現化した解釈可能な構成を与える。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:48:58 GMT)
Efficient Transfer Learning for Video-language Foundation Models [13.2] テキスト表現と視覚表現のアライメントを高めるために,パラメータ効率のよいマルチモーダルパティッシャ・テンポラル・アダプタ (MSTA) を提案する。
我々は,ゼロショット転送,少数ショット学習,ベース・ツー・ノーベル一般化,完全テンポラル学習という4つの課題にまたがるアプローチの有効性を評価する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:51:43 GMT)
An Real-Sim-Real (RSR) Loop Framework for Generalizable Robotic Policy Transfer with Differentiable Simulation [13.2] 本稿では,シミュレーションと実環境のギャップを解消する新しいリアルタイムループフレームワークを提案する。
我々の研究の重要な貢献は、多様で代表的な実世界のデータの収集を促進する情報的コスト関数の設計である。
我々のアプローチは多機能なMJXプラットフォーム上で実装されており、我々のフレームワークは幅広いロボットシステムと互換性がある。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:28:11 GMT)
Gricean Norms as a Basis for Effective Collaboration [12.9] 本稿では,Griceanノルムと認知フレームワークを大規模言語モデル(LLM)ベースのエージェントに統合する規範的フレームワークを提案する。
本フレームワークでは,人間とのコラボレーションを目的としたGPT-4エージェントであるLamoidsを紹介する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:54:14 GMT)
The Empty Chair: Using LLMs to Raise Missing Perspectives in Policy Deliberations [12.9] 会話をリアルタイムで書き起こすツールを開発し評価し、関連するが欠落している利害関係者からの入力をシミュレートする。
我々はこのツールを、キャンパスサステナビリティに関する19人の学生の集会に展開する。
参加者やファシリテーターは、このツールが新たな議論を巻き起こし、これまで考慮していなかった価値ある視点を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:45:08 GMT)
MP-GUI: Modality Perception with MLLMs for GUI Understanding [12.8] MP-GUIはGUI理解のための特別に設計されたMLLMである。
MP-GUIは、画面からグラフィカル、テキスト、空間のモダリティを抽出する3つの専門のパーシーバーを備えている。
トレーニングデータの不足に対処するため,自動データ収集のためのパイプラインも導入する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:32:22 GMT)
ShuffleGate: An Efficient and Self-Polarizing Feature Selection Method for Large-Scale Deep Models in Industry [12.7] ShuffleGateはインスタンス間ですべての機能を同時にシャッフルする。
モデルを再トレーニングすることなく、適切に分離された重要なスコアを生成し、パフォーマンスを見積もることができます。
様々なシナリオで、Bilibiliの検索モデルの日々のイテレーションにうまく統合されています。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:06:43 GMT)
Adversarial Robustness in Parameter-Space Classifiers [12.7] Inlicit Neural Representations (INR)は近年,様々な研究分野への関心が高まっている。
分類のために訓練されたパラメータ空間モデルは本質的に敵攻撃に対して堅牢であることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:53:11 GMT)
Multimodal Feature-Driven Deep Learning for the Prediction of Duck Body Dimensions and Weight [12.5] 本研究では、異なるビュー、深度画像、および3D点雲からのマルチモーダルデータ2D RGB画像を活用する革新的な深層学習モデルを提案する。
姿勢や条件の異なる5,000以上のサンプルからなる1,023羽のLinwuアヒルのデータセットを収集し、モデルトレーニングを支援した。
このモデルは平均絶対パーセンテージ誤差(MAPE)が6.33%、R2が0.953で8つの形態パラメータで達成され、強い予測能力を示した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:09:19 GMT)
SwarmUpdate: Hierarchical Software Updates and Deep Learning Model Patching for Heterogeneous UAV Swarms [12.4] 不均一無人航空機(UAV)群は、異なる役割とソフトウェア要件を持つ数十から数百のドローンで構成され、共有ミッションに向けて協力する。
我々は,SwarmSyncとSwarmModelPatchという2つの重要なコンポーネントで構成された,異種UAVスワムにおけるソフトウェア更新のためのSwarmUpdateフレームワークを紹介する。
SwarmSyncは、ソフトウェアアップデートをSwarm内の適切なサブセットに配布する階層的なソフトウェアアップデート同期戦略であり、SwarmModelPatchは、いくつかのレイヤを更新するだけで、(ディープラーニングモデル)更新のサイズを小さくするディープラーニングモデルパッチ方法である。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 00:23:21 GMT)
Zero-Knowledge Federated Learning: A New Trustworthy and Privacy-Preserving Distributed Learning Paradigm [12.3] フェデレートラーニング(FL)は、分散機械学習において有望なパラダイムとして登場した。
ZKPは、FLプロセス全体で信頼を確立し、システムの完全性を高めることで、潜在的なソリューションを提供する。
まず、ZKPの技術的役割を分類し分析する構造化ZK-FLフレームワークを提案する。
第2に、ZKPを用いてクライアント選択プロセスを洗練させる新しいアルゴリズム、Veri-CS-FLを導入する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:21:08 GMT)
Securing Automated Insulin Delivery Systems: A Review of Security Threats and Protectives Strategies [12.3] インスリン自動デリバリー(AID)システムは、糖尿病治療における重要な技術進歩として現れている。
無線接続とソフトウェア制御への依存により、AIDシステムは重大なセキュリティリスクにさらされている。
近年の進歩にもかかわらず、セキュアなAIDシステムの実現にはいくつかのオープンな課題が残っている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:11:19 GMT)
JuDGE: Benchmarking Judgment Document Generation for Chinese Legal System [12.3] JuDGE(Judgment Document Generation Evaluation)は、中国の法体系における判定文書生成の性能を評価するための新しいベンチマークである。
本研究では,実訴訟の事実記述からなる包括的データセットを構築し,対応する全判決文書と組み合わせた。
法律専門家と共同で,生成した判定文書の品質を評価するための総合的な自動評価フレームワークを構築した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:48:18 GMT)
Entente: Cross-silo Intrusion Detection on Network Log Graphs with Federated Learning [12.2] 我々は、GNIDSモデルのトレーニングはプライバシー規制を考慮する必要があり、この顕著な課題に対処するために、連邦学習(FL)を活用することを提案する。
これらの問題に,参照グラフ合成,グラフスケッチ,適応コントリビューションスケーリングなど,グラフデータセットに適した一連の新しいテクニックで対処する。
結果は、Ententeが他のベースラインFLアルゴリズム、時には非FL GNIDSよりも優れていることを示している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:21:24 GMT)
Bridging Past and Future: End-to-End Autonomous Driving with Historical Prediction and Planning [12.2] エンドツーエンドの自動運転は、タスクを差別化可能なフレームワークに統合し、計画指向の最適化を可能にし、注目を集める。
動作と計画のクエリを多段階のクエリとして再構成し、将来のステップ毎にクエリを区別するBridgeADを提案する。
この設計は、時間ステップに基づくエンド・ツー・エンドシステムの適切な部分にそれらを適用することにより、歴史的予測と計画の効果的利用を可能にし、知覚と運動計画の両方を改善する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:57:31 GMT)
CoSpace: Benchmarking Continuous Space Perception Ability for Vision-Language Models [12.2] 視覚言語モデル(VLM)の連続空間知覚能力を評価するためのベンチマークであるCoSpaceを提案する。
結果から,プロプライエタリなモデルを含むほとんどの評価モデルに対して,連続空間知覚能力に落とし穴があることが判明した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:31:58 GMT)
HSOD-BIT-V2: A New Challenging Benchmarkfor Hyperspectral Salient Object Detection [12.1] HSOD-BIT-V2は,これまでで最大かつ最も困難なHSODベンチマークデータセットである。
我々は高分解能HSODネットワークであるHyper-HRNetを提案する。
有効スペクトル情報を抽出し、統合し、保存し、自己相似スペクトルの特徴を捉え、次元性を減少させる。
詳細な詳細を伝達し、包括的グローバル情報と詳細なオブジェクト塩分表現を組み込むことで、オブジェクトの輪郭を正確に特定する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:09:42 GMT)
Semantic Prior Distillation with Vision Foundation Model for Enhanced Rapid Bone Scintigraphy Image Restoration [12.1] 本稿では,SAMをベースとしたセマンティック先行手法の医用画像復元への応用について述べる。
提案手法は,2つのカスケードネットワーク,$fIR1$と$fIR2$から構成される。
我々は,小児における骨シンチグラフィ画像の高速復元を目的とした最初のデータセットであるRBSと呼ばれる新しい高速骨シンチグラフィデータセットをリリースする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:23:43 GMT)
Sensory-driven microinterventions for improved health and wellbeing [12.1] 5つの感覚は私たちの幸福への入り口であり、その減少は公衆衛生上の重要な課題だと考えられている。
現代のテクノロジーは、感覚の力を活用して、私たちのアプローチを日々の医療に転換する能力を持っています。
予防・パーソナライズされた医療のための感覚駆動型マイクロインターベンションの考え方を紹介する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:17:55 GMT)
Tailoring Mixup to Data for Calibration [12.1] 混在するデータ間の距離によって、ラベルを間違ったラベルに割り当てる確率が増加することを示す。
本研究では, 混合する試料間の類似度に応じて, 係数の基底分布を動的に変化させることを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 21:28:33 GMT)
GeoFlow-SLAM: A Robust Tightly-Coupled RGBD-Inertial Fusion SLAM for Dynamic Legged Robotics [12.0] GeoFlow-SLAMは、高ダイナミック環境で動作する脚ロボットのための頑丈で効果的なRGBD慣性SLAMである。
提案アルゴリズムは,収集した脚ロボットとオープンソースデータセットを用いて最先端のアルゴリズムを実現する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:35:49 GMT)
XOXO: Stealthy Cross-Origin Context Poisoning Attacks against AI Coding Assistants [12.0] 本稿では,従来の分析手法と意味論的に等価な意味論に基づく新たな攻撃を提案する。
これにより、攻撃者はコードを操作してバックドアを含む不正なアウトプットを生成し、非難を被害者に移すことができる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:20:54 GMT)
Semantic Communication in Dynamic Channel Scenarios: Collaborative Optimization of Dual-Pipeline Joint Source-Channel Coding and Personalized Federated Learning [11.8] 複数のユーザを持つ複雑なネットワークトポロジでは、クライアントデータとチャネル状態情報(CSI)の組み合わせは、既存のセマンティック通信モデルに重大な課題をもたらす。
本稿では,チャネル認識モデルに基づくパーソナライズド・セマンティック・コミュニケーション・モデルを提案する。
本研究では,非帯域幅ロス関数の最適化ギャップをゼロにするフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:02:22 GMT)
Vision-Language Embodiment for Monocular Depth Estimation [11.7] 現在の深度推定モデルは、教師あり訓練における画像間関係に依存している。
本稿では,カメラモデルとその物理特性を深層学習モデルに具体化する手法を提案する。
このモデルでは,環境変化の即時変化に基づいて,実写シーンの深度をリアルタイムで計算することができる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:05:16 GMT)
Balanced Rate-Distortion Optimization in Learned Image Compression [11.7] ディープラーニングアーキテクチャを使用した学習可能な画像圧縮(lic)は、大きな進歩を遂げている。
標準レート歪み(R-D)最適化はしばしば、レートと歪みの目的の様々な勾配のために不均衡な更新に遭遇する。
本稿では2つのバランスの取れたR-D最適化手法を導入し、勾配更新を適応的に調整し、速度と歪みの両面でより公平な改善を実現する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:06:31 GMT)
Make the Most of Everything: Further Considerations on Disrupting Diffusion-based Customization [11.7] 拡散カスタマイズを目的とした2段階の対向攻撃であるDual Anti-Diffusion (DADiff)を提案する。
様々な主流の顔データセットに対する実験結果は、クロスプロンプト、キーワードミスマッチ、クロスモデル、クロスメカニズムのアンチカストマイゼーションにおいて10%-30%の改善が示されている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:22:03 GMT)
Safety Evaluation and Enhancement of DeepSeek Models in Chinese Contexts [11.6] DeepSeek-R1は例外的な推論機能とオープンソース戦略で有名だ。
DeepSeek-R1は有害なプロンプトを処理する際に100%の攻撃成功率を達成する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:38:10 GMT)
Potential Score Matching: Debiasing Molecular Structure Sampling with Potential Energy Guidance [11.6] 本稿では、ポテンシャルエネルギー勾配を利用して生成モデルを導出する手法として、ポテンシャルスコアマッチング(PSM)を提案する。
PSMは正確なエネルギー関数を必要とせず、限られた偏りのデータで訓練してもサンプル分布を偏りなくすることができる。
PSMにより生成された分子分布は従来の拡散モデルよりもボルツマン分布に近似していることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:27:28 GMT)
Design of an Expression Recognition Solution Employing the Global Channel-Spatial Attention Mechanism [11.5] 本稿では,ABAW(Affective Behavior Analysis in the Wild)コンペティションについて紹介する。
音声と画像の特徴処理を強化するため,大域的チャネル,空間的アテンション,中央値,空間的アテンションが向上するチャネルアテンションを提案する。
第6回ABAWコンペティションの表情認識タスクでは,オフィシャル検証において優れた結果を得た。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:50:24 GMT)
Estimating stationary mass, frequency by frequency [11.5] 我々は、任意の$alpha$-mixingプロセスの定常分布によって配置される確率質量を推定する問題を考える。
総変分距離におけるこの確率ベクトルを推定し、$n$の普遍的一貫性を示す。
自然自己正規化されたポアソン混合配列の濃度不等式を含む補完ツールを開発し、関連する問題に対する推定器の設計と解析に独立して有用であることを示した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:07:51 GMT)
Co-Learning Semantic-aware Unsupervised Segmentation for Pathological Image Registration [11.5] 本稿では,病理画像登録のための新しい教師なしアプローチであるGIRNetを提案する。
病理画像の登録は、完全に教師なしの学習フレームワークで達成される。
以上の結果から,本手法は画像診断に難渋した場合でも,病理像の登録と病変の同定を正確に行うことが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:26:12 GMT)
SDRT: Enhance Vision-Language Models by Self-Distillation with Diverse Reasoning Traces [11.5] 視覚言語モデルのための新しい自己蒸留フレームワークを提案する。
我々は、多様なコンテキスト内質問を生成するために、視覚的推論タスクに適したプロンプトライブラリを採用する。
次に,2段階の推論手法を用いて推論誘導応答を導出する。
これらの反応は自己蒸留に使用され、モデルが推論プロセスの内部化を可能にする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:05:25 GMT)
Endo-FASt3r: Endoscopic Foundation model Adaptation for Structure from motion [11.1] Endo-FASt3rは、両方のタスクに基礎モデルを使用する最初の単眼SSL深度とポーズ推定フレームワークである。
また、高階更新と高速収束を実現する新しい適応手法であるDoMoRAを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:21:53 GMT)
Segmentation-Guided Neural Radiance Fields for Novel Street View Synthesis [11.1] 本研究では,屋外ストリートシーンに対するニューラルラジアンスフィールド(NeRF)のセグメンテーション誘導による拡張を提案する。
提案手法はZipNeRFを拡張し,グラウンドドSAMを用いてセグメンテーションマスク生成を行う。
また、ビューシーケンス間の不整合照明に適応するための外観埋め込みも導入する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:54:36 GMT)
MAP: Multi-user Personalization with Collaborative LLM-powered Agents [11.0] 本稿では,リフレクション,分析,フィードバックの3段階からなるマルチユーザパーソナライズのためのユーザ中心ワークフローを提案する。
textbfMulti-textbfAgent system for multi-user textbfPersonalization -- MAPはこのワークフローを運用する。
ユーザ調査では、MAPの有効性とコンフリクト解決のユーザビリティを強調しながら、解決の検証と失敗管理におけるユーザの関与の重要性を強調した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:15:44 GMT)
RAD: Retrieval-Augmented Decision-Making of Meta-Actions with Vision-Language Models in Autonomous Driving [11.0] 視覚言語モデル(VLM)は、空間認識の不十分さや幻覚といった限界に悩まされることが多い。
本稿では,自律走行シーンにおけるメタアクションを確実に生成するVLMの能力を高めるための,検索強化意思決定(RAD)フレームワークを提案する。
我々は,NuScenesデータセットから得られたデータセットに基づいてVLMを微調整し,その空間的知覚と鳥眼視画像理解能力を高める。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:25:57 GMT)
A Parallel Hybrid Action Space Reinforcement Learning Model for Real-world Adaptive Traffic Signal Control [10.9] 本稿では,交通信号の位相と所要時間を同時に最適化する並列ハイブリッド行動空間強化学習モデル(PH-DDPG)を提案する。
本モデルでは,個別位相選択と関連する継続時間パラメータを並列に出力する適応的トラフィック制御に適したタスク固有並列ハイブリッド動作空間を特徴とする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:38:53 GMT)
TGBFormer: Transformer-GraphFormer Blender Network for Video Object Detection [10.7] 本稿では,ビデオオブジェクト検出のためのTransformer-GraphFormer Blender Network (TGBFormer)を提案する。
まず,グローバルな文脈情報を集約する時空間変換モジュールを開発する。
第2に,局所的空間的および時間的関係を利用して特徴を集約する空間時空間グラフフォーマーモジュールを提案する。
第3に、トランスフォーマーベースのグローバル表現とGraphFormerベースのローカル表現を適応的に結合するグローバルローカル機能ブレンダーモジュールを設計する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:03:05 GMT)
RWKV-7 "Goose" with Expressive Dynamic State Evolution [10.6] 本稿では,事前学習型言語モデルとともに,新しいシーケンスモデリングアーキテクチャであるRWKV-7"Goose"を提案する。
RWKV-7は、訓練の並列化性を保ちながら、全ての正規言語に対して状態追跡と認識を行うことができることを示す。
また、オープンソースの3.1兆のトークン多言語コーパスを拡張し、4つのRWKV-7モデルをトレーニングします。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:31:05 GMT)
Motion Synthesis with Sparse and Flexible Keyjoint Control [10.6] スパースおよびフレキシブルなキージョイント信号を尊重する制御可能なモーション合成フレームワークを提案する。
多様なデータセットやシナリオに関する総合的な実験を通じて,スパースかつフレキシブルなキージョイント制御の有効性を実証する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 21:21:15 GMT)
AdaCM$^2$: On Understanding Extremely Long-Term Video with Adaptive Cross-Modality Memory Reduction [10.6] AdaCM$2$は、ビデオストリーム上のビデオテキストアライメントに対する適応型クロスモダリティメモリリダクションアプローチである。
最大65%のGPUメモリ消費削減で、LVUデータセットの複数のタスク間で4.5%の改善を実現している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:28:48 GMT)
Faithful and Plausible Natural Language Explanations for Image Classification: A Pipeline Approach [10.5] 本稿では,CNNに基づく分類システムに適用可能な,ポストホックな自然言語説明法を提案する。
影響力のあるニューロンと対応する活性化マップを分析して、分類器の決定過程の忠実な記述を生成する。
実験の結果,提案手法により構築されたNLEは,より信頼性が高く,忠実であることがわかった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:13:40 GMT)
Unveiling the Role of Randomization in Multiclass Adversarial Classification: Insights from Graph Theory [10.5] マルチクラス分類における攻撃に対するロバスト性向上におけるランダム化の役割について検討する。
決定論的解からランダム化解への切り替えは、最適対逆リスクを著しく減少させる。
これらの知見は,マルチクラス分類における敵攻撃に対する頑健性を高める上で,ランダム化が重要な役割を担っていることを示唆している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:41:33 GMT)
Sublinear Regret for a Class of Continuous-Time Linear-Quadratic Reinforcement Learning Problems [10.4] 拡散に対する連続時間線形四元数(LQ)制御のクラスに対する強化学習(RL)について検討した。
モデルパラメータの知識にも,その推定にも依存しないモデルフリーアプローチを適用し,RLアルゴリズムを設計して,適切なポリシパラメータを直接学習する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:55:51 GMT)
Implicit Reasoning in Transformers is Reasoning through Shortcuts [10.4] テストタイム計算は、言語モデルの複雑な多段階推論機能を強化するための新しいパラダイムとして登場しつつある。
マルチステップタスクにおいて,言語モデルがどのように暗黙的推論を行うかを検討する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:08:17 GMT)
LLM-FE: Automated Feature Engineering for Tabular Data with LLMs as Evolutionary Optimizers [10.3] 大規模言語モデル(LLM)は、機能エンジニアリングプロセスにドメイン知識を統合することを可能にする。
進化的探索とドメイン知識とLLMの推論能力を組み合わせた新しいフレームワーク LLM-FE を提案する。
以上の結果から,LLM-FEは最先端のベースラインを一貫して上回っていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:11:24 GMT)
BiTrack: Bidirectional Offline 3D Multi-Object Tracking Using Camera-LiDAR Data [10.2] BiTrackは2D-3D検出融合、初期軌道生成、双方向軌道再最適化のモジュールを含む3D OMOTフレームワークである。
KITTIデータセットを用いた実験結果から,BiTrackは3次元OMOTタスクの最先端性能を精度と効率で達成できることが示された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:57:30 GMT)
A Review of Human-Object Interaction Detection [10.2] ヒトと物体の相互作用(HOI)の検出は、高レベルの視覚的理解において重要な役割を果たす。
本稿では,画像に基づくHOI検出における最近の研究を体系的に要約し,考察する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:22:59 GMT)
A CNN-based End-to-End Learning for RIS-assisted Communication System [10.2] RIS支援通信システムの送信機,受信機,RISを協調的に最適化する新しいCNNベースのオートエンコーダを提案する。
CNNベースのオートエンコーダシステムのビット誤り率(BER)性能は、RIS支援通信システムの理論的BER性能よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:24:55 GMT)
These Magic Moments: Differentiable Uncertainty Quantification of Radiance Field Models [10.0] 本稿では, レンダリング方程式の高次モーメントを利用して, 放射場に対する不確実性定量化手法を提案する。
本研究では,レンダリングの確率的性質により,高次モーメントの効率よく,かつ微分可能な計算が可能であることを実証する。
提案手法は, 処理後処理を必要とせずに, より直接的で, 計算効率が高く, 微分可能な定式化を提供しながら, 既存の放射界不確実性推定手法より優れている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:12:02 GMT)
Frequency and Generalisation of Periodic Activation Functions in Reinforcement Learning [9.7] 周期的なアクティベーションは低周波表現を学習し、その結果、ブートストラップされたターゲットへの過度な適合を避けることが示される。
また、重み減衰正則化は周期的活性化関数のオーバーフィットを部分的に相殺できることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:09:25 GMT)
Auto-Encoding Goodness of Fit [9.6] We developed a new type of generative autoencoder called the Goodness-of-Fit Autoencoder (GoFAE)。
ミニバッチレベルでは、正規化の目的としてGoFテスト統計を使用する。
よりグローバルなレベルでは、より高い批判に基づいて正規化係数を選択する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:55:53 GMT)
Fast Training Dataset Attribution via In-Context Learning [9.5] 我々は、インコンテキスト学習とプロンプトエンジニアリングを用いて、インストラクションチューニングされた大規模言語モデル(LLM)におけるトレーニングデータの貢献度を推定する。
本研究では,(1)LLM出力のコンテクストと非コンテクストとの差を測定する類似性に基づくアプローチと,(2)コントリビューションスコアを行列因数分解タスクとして識別する問題をモデル化する混合分布モデルアプローチを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 21:10:24 GMT)
Frac-Connections: Fractional Extension of Hyper-Connections [9.4] Frac-Connectionsは、隠れた状態を幅を広げるのではなく、複数の部分に分割する新しいアプローチである。
我々は,最大3Tトークンでトレーニングされた7B MoEモデルで,言語タスクに関する大規模な実験を行っている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:37:50 GMT)
Lost in Time: Clock and Calendar Understanding Challenges in Multimodal LLMs [9.3] 我々は,MLLMが時間関連視覚データを提示した場合に,視覚認識,数値推論,時間的推論をどのように行うかを分析することを目的とする。
評価の結果,近年の進歩にもかかわらず,時間的理解はMLLMにとって重要な課題であることがわかった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:43:52 GMT)
PIMRL: Physics-Informed Multi-Scale Recurrent Learning for Spatiotemporal Prediction [9.3] PIMRLフレームワークは、事前トレーニングを通じてニューラルネットワークに物理的な知識を組み込んで、学習のためのデータ駆動アプローチを採用する。
PIMRLは、1次元から3次元までの5つのベンチマークデータセットにおいて、最先端のパフォーマンスを一貫して達成している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:08:41 GMT)
Bayesian Modeling of Zero-Shot Classifications for Urban Flood Detection [9.3] ストリートシーンデータセットは、都市オブジェクトやストリートフラッディングのようなインシデントを検出する、有望な手段を提供する。
これらのデータセットを使用する際の大きな課題は、信頼性のあるラベルの欠如である。
本稿では,この困難を回避する2段階のアプローチであるBayFloodを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 21:53:37 GMT)
Improving Generalization of Neural Vehicle Routing Problem Solvers Through the Lens of Model Architecture [9.2] 本稿では,ESF(Scaling Factor)とDS(Distributed-Specific)デコーダを提案する。
ESFは、様々な大きさのVRPを解く際に、トレーニング中に発見された慣れ親しんだものに対して、モデルの注意重みパターンを調整する。
DSデコーダは、複数の補助光デコーダを通して複数のトレーニング分布パターンのVRPを明示的にモデル化し、モデル表現空間を拡大する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:40:04 GMT)
SMILE: a Scale-aware Multiple Instance Learning Method for Multicenter STAS Lung Cancer Histopathology Diagnosis [9.1] 病理学者は現在、非常に主観的で変動しがちな手作業による評価に時間を費やしている。
2,970個の肺がん組織スライドは、複数の中心から構成され、再診断され、3つの肺がんSTASデータセットを構築し、公開している。
肺癌のSTAS診断のためのSMILE法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:09:52 GMT)
Multimodal Adversarial Defense for Vision-Language Models by Leveraging One-To-Many Relationships [9.1] この研究は、視覚言語(VL)タスクにおけるマルチモーダル攻撃に対する防衛戦略を初めて探求した。
本稿では、画像とテキストの両モードに逆方向の摂動を組み込んだマルチモーダル対位トレーニング(MAT)を提案する。
これを解決するために,我々は一対多の関係を活用して強靭性を高めるための総合的な研究を行っている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:32:07 GMT)
Panoramic Distortion-Aware Tokenization for Person Detection and Localization Using Transformers in Overhead Fisheye Images [9.0] 人検出は、人の回転や小人数の人を含む要因のため、オープンな課題である。
魚眼画像をパノラマ画像に変換するために,パノラマ歪み認識トークン化を用いる。
本研究では,パノラマ画像の再マッピングとトークン化処理を組み合わせた人物検出・位置決め手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:05:41 GMT)
Incorporating Attributes and Multi-Scale Structures for Heterogeneous Graph Contrastive Learning [8.9] 異種グラフのための新しいコントラスト学習フレームワーク(ASHGCL)を提案する。
ASHGCLには3つの異なるビューがあり、それぞれがノード属性、高階構造情報、低階構造情報に焦点を当てている。
本稿では,属性情報と属性情報を組み合わせた属性強化型正のサンプル選択手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:15:21 GMT)
AIGVE-Tool: AI-Generated Video Evaluation Toolkit with Multifaceted Benchmark [8.8] 既存のメトリクスには、方法論を体系的に分類するための統一されたフレームワークがない。
AI生成ビデオ評価のための構造化分類と評価パイプラインを提供する統合フレームワークであるAIGVE-Toolを紹介する。
大規模なベンチマークデータセットは、手作りの指示とプロンプトに基づいて、5つのSOTAビデオ生成モデルで作成される。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:36:33 GMT)
Augmenting Software Bills of Materials with Software Vulnerability Description: A Preliminary Study on GitHub [8.7] 本稿では,40のオープンソースプロジェクトのSBOMに共通脆弱性と露出に関する情報を付加する予備研究の結果を報告する。
当社の強化されたSBOMは、プルリクエストを提出し、プロジェクトオーナーに調査への回答を求めることで評価されています。
ほとんどの場合、SBOMの更新を継続する必要があるため、拡張SBOMは直接受け入れられなかったが、受信したフィードバックは、提案されたSBOM拡張の有用性を示している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:04:22 GMT)
Consider What Humans Consider: Optimizing Commit Message Leveraging Contexts Considered By Human [8.7] コミットメッセージはソフトウェア開発において不可欠であり、メンテナンスタスクと開発者間のコミュニケーションをサポートする。
本稿では,大規模言語モデルと検索に基づく最適化を活用して,人間によるメッセージの書き起こしを最適化するCommit Message Optimization (CMO)を提案する。
CMOは、より合理的、包括的、表現的なコミットメッセージを生成し、最先端のCMGメソッドと人間のメッセージの40.3%から78.4%を上回っている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:15:33 GMT)
PSA-SSL: Pose and Size-aware Self-Supervised Learning on LiDAR Point Clouds [8.6] PSA-SSLは,オブジェクトのポーズやサイズを認識した特徴を学習するクラウドSSLの新たな拡張である。
提案手法は,3次元セマンティックセグメンテーションと3次元オブジェクト検出において,最先端のSSL手法よりも優れている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:17:06 GMT)
MAG: Multi-Modal Aligned Autoregressive Co-Speech Gesture Generation without Vector Quantization [8.6] 既存の手法では,ジェスチャ生成にベクトル量子化トークンを伴って自己回帰モデルを用いるのが一般的である。
我々は、離散トークン化に頼ることなく、高品質で多様な音声合成のための新しいマルチモーダルアライメントフレームワークMAGを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:02:02 GMT)
Benchmarking LLMs and LLM-based Agents in Practical Vulnerability Detection for Code Repositories [8.6] JitVulは、各関数をその脆弱性導入とコミットの修正にリンクする脆弱性検出ベンチマークである。
思考・行動・観察と相互言語的文脈を活用するReAct Agentsは,良性のあるコードと区別する上で,LLMよりも優れた性能を示すことを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:30:00 GMT)
Identifying and Mitigating Position Bias of Multi-image Vision-Language Models [8.5] 本稿では,LVLM(Large Vision-Language Models)が複数の画像にまたがる情報活用に苦慮していることを示す。
我々は、このバイアスを緩和する訓練なしのアプローチであるSoFt Attention(SoFA)を提案する。
実験により,SoFAは位置バイアスを低減し,既存のLVLMの推論性能を向上させることが示された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 00:45:02 GMT)
The global landscape of academic guidelines for generative AI and Large Language Models [8.4] ジェネレーティブ・人工知能(GAI)とLarge Language Models(LLM)の学界への統合は、その潜在的な教育的利益と倫理的考察に関する世界的な議論を刺激している。
ポジティブな反応は、コラボレーティブな創造性、教育へのアクセスの増加、トレーナーとトレーナーの強化など、いくつかの可能性を強調している。
しかし、ネガティブな反応は、倫理的な複雑さ、イノベーションと学術的整合性のバランス、不平等なアクセス、誤情報リスクに関する懸念を引き起こす。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:42:30 GMT)
IGGA: A Dataset of Industrial Guidelines and Policy Statements for Generative AIs [8.4] 本稿では,GAI(Generative AIs)とLLM(Large Language Models)を産業や職場で使用するための,160の産業ガイドラインと政策ステートメントのデータセットであるIGGAを紹介する。
データセットには104,565語が含まれており、要求工学に一般的に適用される自然言語処理タスクの貴重なリソースとして機能している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:44:15 GMT)
AGGA: A Dataset of Academic Guidelines for Generative AI and Large Language Models [8.4] 本稿では,GAI(Generative AI)とLLM(Large Language Models)の学術的利用に関する80のガイドラインをまとめたデータセットであるAGGAを紹介する。
このデータセットには188,674語が含まれており、要求工学に一般的に適用される自然言語処理タスクの貴重なリソースとして機能している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:45:54 GMT)
Reusable Formal Verification of DAG-based Consensus Protocols [8.3] 本稿では,DAGに基づく5つのコンセンサスプロトコルの安全性検証仕様を提案する。
DAG-Rider、Cordial Miners、Hashgraph、Eventualous BullSharkの4つのプロトコルがこの文献で十分に確立されている。
我々は、プロトコルの指定と証明書作成にTLA+を使用し、TLAPS証明システムは証明を自動的にチェックする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:10:48 GMT)
A Systematic Literature Review on Task Recommendation Systems for Crowdsourced Software Engineering [8.2] このSLRはKitchenham and Chartersのガイドラインに従って実施された。
我々は,データ抽出,解析,合成に関する65の一次研究を選択した。
以上の結果から,人的要因がCSEタスクレコメンデーションにおいて重要な役割を担っていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 00:44:05 GMT)
HDLCoRe: A Training-Free Framework for Mitigating Hallucinations in LLM-Generated HDL [8.1] HDLCoReは、大規模言語モデルのHDL生成能力を向上する、トレーニング不要のフレームワークである。
本フレームワークはRTLLM2.0ベンチマークにおいて優れた性能を発揮する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:09:39 GMT)
Sepsyn-OLCP: An Online Learning-based Framework for Early Sepsis Prediction with Uncertainty Quantification using Conformal Prediction [7.9] 敗血症早期予測は、敗血症患者の早期介入を促進する上で重要な役割を担っている。
本稿では,早期敗血症予測のための新しいオンライン学習アルゴリズムであるSepsyn-OLCPを提案する。
提案手法は正確で信頼性の高い予測を行い,高リスク医療アプリケーションにおける重要なニーズに対処する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:10:34 GMT)
Biologically-inspired Semi-supervised Semantic Segmentation for Biomedical Imaging [7.9] 本稿では,バイオインスパイアされた半教師付き学習手法を提案する。
バイオメディカルデータセットを用いて実験を行い,本手法の評価を行った。
その結果,提案手法はラベルの可用性の異なるレベルにおいてSOTA手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:28:57 GMT)
Automatic Differentiation is Essential in Training Neural Networks for Solving Differential Equations [7.9] ニューラルネットワークに基づくアプローチは、最近、科学と工学における偏微分方程式(PDE)の解法において大きな可能性を示している。
PDEのためのニューラルネットワーク手法の利点の1つは、その自動微分(AD)にある。
本稿では、ニューラルネットワークのトレーニングにおけるADの利点を定量的に示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:40:27 GMT)
See-Saw Modality Balance: See Gradient, and Sew Impaired Vision-Language Balance to Mitigate Dominant Modality Bias [7.8] 視覚言語(VL)モデルは、しばしば予測に特定のモダリティに依存し、「支配的なモダリティバイアス」をもたらす。
支配的モダリティバイアスを軽減するための新しいフレームワークであるBalGradを提案する。
UPMC Food-101、Hateful Memes、MM-IMDbデータセットの実験により、BalGradは予測を行う際に特定のモダリティに対する過度な信頼を効果的に緩和することを確認した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:17:41 GMT)
Layer-wise Adaptive Gradient Norm Penalizing Method for Efficient and Accurate Deep Learning [7.7] シャープネス認識最小化(SAM)は、ニューラルネットワークの一般化性能を改善するために知られている。
SAMは、高価なモデル摂動コストのため、現実世界のアプリケーションではまだ広く使われていない。
本稿では,SAMの高コストな計算コストに対処しつつ,より優れた一般化性能を維持しつつ,軽量な層次勾配法則のペナル化手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:30:57 GMT)
Still More Shades of Null: An Evaluation Suite for Responsible Missing Value Imputation [7.6] 本稿では,有意な値計算を行うための評価スイートであるShades-of-Nullを紹介する。
我々はShades-of-Nullを使って29,736の実験パイプラインを含む大規模な実験を行った。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:46:41 GMT)
Theoretical Foundation of Flow-Based Time Series Generation: Provable Approximation, Generalization, and Efficiency [7.6] 本稿では,フローベース生成モデルの観点から,最初の理論的枠組みを提案する。
一般的なデータモデルを仮定することにより、拡散変換器(DiT)の普遍近似の下でフローベース生成モデルの適合性は任意の誤差に収束することが確認される。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:53:48 GMT)
FusDreamer: Label-efficient Remote Sensing World Model for Multimodal Data Classification [7.5] 本稿では,マルチモーダルデータ融合(FusDreamer)のためのラベル効率のよいリモートセンシング世界モデルを提案する。
FusDreamerは、世界モデルを統一表現コンテナとして使用して、共通知識と高レベルの知識を抽象化する。
4つの典型的なデータセットで実施された実験は、提案されたFusDreamerの有効性と利点を示している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:45:51 GMT)
Robust3D-CIL: Robust Class-Incremental Learning for 3D Perception [7.5] 3D知覚は、自律運転、ロボット工学、AR/VRといった現実世界の応用において重要な役割を果たす。
クラスインクリメンタルラーニング(CIL)の採用は特に重要である。
本稿では,制限されたリプレイバッファメモリをより効率的に活用するために,ポイントクラウドダウンサンプリングに基づくリプレイ手法を提案する。
提案手法は,リプレイベースのCILベースラインの性能を2%から11%向上させ,実世界の3Dアプリケーションに有望な可能性を証明した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:36:17 GMT)
No Vulnerability Data, No Problem: Towards Predicting Mean Time To Remediate In Open Source Software Dependencies [7.3] MTTR(Mean-Time-To-Remediate)メトリックは、パッケージの脆弱性のあるバージョンを更新するのにどのくらいの時間を要するか、歴史的な視点を提供することができる。
MTTR_dep$ と $Mean-Time-To-Update_dep$ (MTTU_dep$) を併用した新しいMTTR計算アルゴリズムを提案する。
我々は,npm,PyPI,Cargoの163,207パッケージを用いて大規模な調査を行い,22,513パッケージのみが脆弱性の欠如を理由にMTTR_dep$を生産した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 23:21:54 GMT)
Efficient but Vulnerable: Benchmarking and Defending LLM Batch Prompting Attack [7.3] 悪意のあるユーザは、攻撃命令をバッチに注入することで、すべてのクエリに不要な干渉を引き起こす。
この脆弱性は、フィッシングリンクのような有害なコンテンツや論理的推論の中断をもたらす可能性がある。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:16:10 GMT)
TestForge: Feedback-Driven, Agentic Test Suite Generation [7.3] TestForgeは、現実世界のコードのための高品質なテストスイートをコスト効率よく生成するように設計されたエージェントユニットテスティングフレームワークである。
TestForgeは、最先端の検索ベースの技術と比較して、より自然で理解しやすいテストを生成する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:21:44 GMT)
Rethinking Image Evaluation in Super-Resolution [7.3] SR性能は低品質のGTによってモデル間で一貫して影響を受けられることを示す。
画像対の相対的品質差を測定する新しい知覚品質指標である相対品質指標(RQI)を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:39:06 GMT)
Detecting Backdoor Attacks in Federated Learning via Direction Alignment Inspection [7.2] フェデレートラーニング(FL)システムは、悪意のあるモデル更新に対して脆弱である。
バックドア攻撃に対してFLシステムを保護するために設計された新しい防御手法であるAlignInsを紹介する。
本稿では,AlignInsが最先端の防御手法と比較して高い堅牢性を実現することを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 22:09:36 GMT)
Hypergraph Neural Networks through the Lens of Message Passing: A Common Perspective to Homophily and Architecture Design [7.0] メッセージ・パッシング・スキームに基づく高階ネットワークにおけるホモフィリーの新たな概念化を提案する。
我々は、HNN内の高次構造を処理するための自然で、ほとんど探索されていない戦略について検討する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:45:21 GMT)
Data-Driven Semi-Supervised Machine Learning with Safety Indicators for Abnormal Driving Behavior Detection [7.0] 本研究では,階層型極端学習機械(HELM)に基づく半教師あり機械(ML)法を開発し,異常運転行動を検出する。
その結果、提案された半教師付きMLモデルは99.58%、最高のF1スコアは0.9913であることがわかった。
本研究は、異常運転行動の検出性能を向上させるための安全指標の重要性をさらに強調する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:13:54 GMT)
Exploring Disparity-Accuracy Trade-offs in Face Recognition Systems: The Role of Datasets, Architectures, and Loss Functions [7.0] 顔認識システム(FRS)は、識別認証と顔属性分析のために世界中に展開されている。
これらのモデルの性能は、モデルアーキテクチャ、最適化/ロス機能、データセット間の複雑な相互依存によって決定される。
本研究では,ジェンダー予測の課題に対する3つのFRSの詳細な分析を行う。
以上の結果から,これら3つのコンポーネントはいずれも個人であり,精度と相違性の両方に複合的な影響があることが示唆された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:04:57 GMT)
Breaking Boundaries: Investigating the Effects of Model Editing on Cross-linguistic Performance [6.9] 本稿では,多言語文脈における知識編集技術を検討することにより,言語的平等の必要性を戦略的に識別する。
Mistral, TowerInstruct, OpenHathi, Tamil-Llama, Kan-Llamaなどのモデルの性能を,英語,ドイツ語,フランス語,イタリア語,スペイン語,ヒンディー語,タミル語,カンナダ語を含む言語で評価した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:58:48 GMT)
LLM-Match: An Open-Sourced Patient Matching Model Based on Large Language Models and Retrieval-Augmented Generation [6.9] 患者マッチングとは、患者を適切な臨床試験に結びつけるプロセスであり、医療記録を正確に識別し、治験適格基準と整合させることである。
LLM-Matchは、細調整されたオープンソースの大規模言語モデルを活用する、患者マッチングのための新しいフレームワークである。
我々は、オープンソースモデルを用いて、n2c2、SIGIR、TREC 2021、TREC 2022の4つのオープンデータセットで評価し、TrialGPT、Zero-Shot、GPT-4ベースのクローズドモデルと比較した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:56:41 GMT)
RFUAV: A Benchmark Dataset for Unmanned Aerial Vehicle Detection and Identification [6.8] RFUAVは、無線周波数に基づく無人航空機(UAV)の識別のための新しいベンチマークデータセットである。
RFUAVは、37個の異なるUAVから収集された生の周波数データの約1.3TBである。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:28:48 GMT)
FeNeC: Enhancing Continual Learning via Feature Clustering with Neighbor- or Logit-Based Classification [6.7] FeNeC(Feature Neighborhood)とFeNeC-Log(FeNeC-Log)を導入する。
提案手法は,クラスタリングによって既存の概念を一般化し,クラス内変動を増大させる。
タスクの同一性が不明なシナリオでは,2つのFeNeC変種が競合性能を発揮することを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:42:38 GMT)
MamBEV: Enabling State Space Models to Learn Birds-Eye-View Representations [6.7] 我々は,Bird's Eye Viewの統一表現を学習するMamBEVというMambaベースのフレームワークを提案する。
MamBEVは、計算とメモリ効率を大幅に改善した複数の3D知覚タスクをサポートする。
MamBEVの有望なパフォーマンスを様々な視覚的知覚メトリクスで実証する実験である。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:18:45 GMT)
Zero-shot forecasting of chaotic systems [6.4] 多様なドメインからの膨大な時系列データに基づいて事前訓練されたファンデーションモデル。
ゼロショット学習パラダイムがカオスシステムを予測する困難な課題に拡張されるかどうかを評価する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:24:12 GMT)
Ten-channel Hong-Ou-Mandel interference between independent optical combs [6.4] 周波数同期方式を使わずに10個のスペクトル整列線を持つ2つの独立DKSコームを実験的に実証した。
個々のコムライン対の可視性は、精度周波数変換によって最大46.72 pm 0.63%$に達する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:08:20 GMT)
Spin squeezing in an ensemble of nitrogen-vacancy centers in diamond [6.3] 固体スピン系におけるスピンスクイーズの最初の実験例を示す。
本研究は, 固体中の光学活性スピンのマクロアンサンブルを用いたエンタングルメント強化メロロジーへの扉を開くものである。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:00:01 GMT)
DDF: A Novel Dual-Domain Image Fusion Strategy for Remote Sensing Image Semantic Segmentation with Unsupervised Domain Adaptation [6.2] 非教師なしドメイン適応(UDA)は、対象ドメインからの未分類情報を組み込む際に有利であることが証明されている。
本稿では,新しいデュアルドメイン画像融合戦略とともに,ハイブリッドトレーニング戦略を提案する。
提案手法の有効性は,ISPRS Vaihingen および Potsdam データセットを用いて行った広範囲なベンチマーク実験およびアブレーション研究によって実証された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:08:21 GMT)
Med-R1: Reinforcement Learning for Generalizable Medical Reasoning in Vision-Language Models [6.2] 視覚言語モデル(VLM)は、自然の場面で高度な推論を行うが、医療画像におけるその役割は未解明のままである。
医用推論におけるVLMの一般化性と信頼性を高めるための強化学習を探求するフレームワークであるMed-R1を紹介する。
Med-R1は、CT, MRI, Ultrasound, Dermoscopy, Fundus Photography, Optical Coherence Tomography, Microscopy, X-ray Imagingの8つの画像モダリティで評価されている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:12:38 GMT)
Engineering anisotropic Dicke model with dipole-dipole interaction for Rydberg atom arrays in cavity [6.2] 異方性ディックモデル(英語版)は、反回転波の項が光と2つの準位原子の結合に果たす重要な役割を明らかにしている。
励起レーザーを変調することにより、反回転波項と回転波項との比を0から無限に調整することができる。
我々のモデルは、量子シミュレーション、多体物理学、さらには情報処理のサブセケット研究のための広範な基盤を提供する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:35:52 GMT)
A Real-Time Human Action Recognition Model for Assisted Living [6.2] 本研究では,ディープラーニングモデルとライブビデオ予測・警告システムを組み合わせたリアルタイム人行動認識モデルを提案する。
TimeSformerは、主要なマクロF1スコア(95.33%)、リコール(95.49%)、精度(95.19%)を生かして、リアルタイム人間行動認識モデルを開発するために提案されている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:22:17 GMT)
Variable Time-Step MPC for Agile Multi-Rotor UAV Interception of Dynamic Targets [6.1] 既存の非線形モデル予測制御手法を使用したアジャイルプランニングは、ますます需要が高まるにつれて計画手順の数によって制限される。
本稿では,変動時間ステップを導入し,予測水平長と組み合わせることで,これらの制約に対処することを提案する。
簡易な点質量運動プリミティブは、四重項力学の微分平坦性と、平坦な出力空間における可能な軌道の軌道生成を利用するために用いられる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:59:24 GMT)
Morpheus: Text-Driven 3D Gaussian Splat Shape and Color Stylization [6.1] スティル化された世界は、限られたトレーニングデータとモデルのトレーニング分布を拡張する必要性のある下流タスクに使用できる。
現在のノベルビュー合成のスタイラス化技術のほとんどは、幾何を説得的に変える能力に欠けていた。
これは、任意の幾何学的変化はスタイルの強さを増す必要があり、しばしばスタイリングの安定性と一貫性のためにキャップされるためである。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:11:26 GMT)
Information Fusion in Smart Agriculture: Machine Learning Applications and Future Research Directions [6.1] レビューでは、機械学習(ML)技術とマルチソースデータ融合が組み合わさって、予測精度と意思決定を改善して精度の高い農業を強化する方法について論じている。
このレビューはAI研究と農業応用のギャップを埋め、研究者、産業専門家、政策立案者に情報融合とMLを利用して精密農業を推進するためのロードマップを提供する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:32:09 GMT)
GS-I$^{3}$: Gaussian Splatting for Surface Reconstruction from Illumination-Inconsistent Images [6.1] 3D Gaussian Splatting (3DGS) は表面再構成の分野で大きな注目を集めている。
不整合照明下での頑健な表面再構成の課題を解決するため,GS-3I と呼ばれる手法を提案する。
GS-3Iは複雑な照明のシナリオをまたいで、堅牢で正確な表面再構成を実現することができることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:03:21 GMT)
Implementing Spiking World Model with Multi-Compartment Neurons for Model-based Reinforcement Learning [6.0] 脳にインスパイアされたスパイクニューラルネットワーク(SNN)は、アルゴリズムの設計と知覚の応用において大きな研究の注目を集めている。
しかし、意思決定領域におけるその可能性、特にモデルに基づく強化学習については、未解明のままである。
本稿では,複数の樹状体源からの情報を非線形に積分し,長い逐次入力を動的に処理できるマルチコンパートメントニューロンモデルを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:49:46 GMT)
Word2Minecraft: Generating 3D Game Levels through Large Language Models [6.0] 本稿では,構造化されたストーリーに基づいて,Minecraftでプレイ可能なゲームレベルを生成するシステムであるWord2Minecraftを紹介する。
ストーリーの複雑さをカスタマイズできるフレキシブルなフレームワークを導入し、ダイナミックなレベル生成を可能にします。
GPT-4-Turboは物語のコヒーレンスや客観的楽しみなど,ほとんどの領域でGPT-4o-Miniより優れていた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:38:38 GMT)
Riemannian quantum circuit optimization based on matrix product operators [6.0] 量子系のハミルトニアンシミュレーションのための初期トロッター回路のシミュレーション精度を著しく向上する。
本手法は, 量子系に対して, 翻訳不変性などの対称性の仮定を課さない。
分子系,特に水素化リチウムに応用し,最大8桁の誤差改善を実現することで,本手法の汎用性を実証した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:49:31 GMT)
Measuring AI Ability to Complete Long Tasks [6.0] 人間が通常、AIモデルが達成できるタスクを完了するのに要する時間を50%の成功率で測定します。
Claude 3.7 Sonnetのような現在のフロンティアAIモデルは50分程度で50%タイムの地平線を持つ。
AIモデルの時間的地平線の増加は、より信頼性が高く、ミスに適応する能力によって引き起こされているように思われる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:59:31 GMT)
QuGStep: Refining Step Size Selection in Gradient Estimation for Variational Quantum Algorithms [5.9] 本稿では,ショット予算下での有限差分勾配推定におけるステップサイズ決定の課題に対処するアルゴリズムQuGStepを提案する。
いくつかの分子の基底状態エネルギーを近似する数値実験により、QuGStepは与えられたショット予算の適切なステップサイズを特定でき、効果的な勾配推定が得られることを示した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:48:09 GMT)
AI-Powered Prediction of Nanoparticle Pharmacokinetics: A Multi-View Learning Approach [5.9] 既存のAI駆動アプローチは、AI駆動の予測に依存しているが、NPプロパティについて学ばない。
この研究は、データ効率のよいAI駆動の薬物発見と精密ナノメディシンの基礎を築いた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:09:32 GMT)
A Relaxed Wasserstein Distance Formulation for Mixtures of Radially Contoured Distributions [5.9] 本稿では, 放射状凹凸分布の同定可能な混合物に対する簡易な緩和ワッサーシュタイン距離を提案する。
この距離のいくつかの性質を示し、その定義が限界整合を必要としないことを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:39:31 GMT)
Robust Machine Unlearning for Quantized Neural Networks via Adaptive Gradient Reweighting with Similar Labels [5.9] モデル量子化は、低ビットパラメータ表現によるエッジデバイスへのディープニューラルネットワークの効率的な展開を可能にする。
既存のマシン・アンラーニング(MU)手法は量子化されたネットワークにおける2つの基本的な制限に対処できない。
本稿では,量子化モデルのための学習フレームワークQ-MULを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:22:13 GMT)
A Compact One-Way Fault-Tolerant Optical Quantum Computation [5.9] 一方向量子計算は、普遍的でスケーラブルな計算とフォールトトレラントな量子クラスタを実現するための有望なアプローチである。
ここでは、誤り訂正符号の大多数と互換性のある大規模正準3次元立方体状態を構築するための実験的スキームを提案する。
提案手法は実験的な構成を大幅に単純化し,一方のフォールトトレラントな光量子計算のコンパクト化を実現する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 00:26:05 GMT)
Evaluating the Posterior Sampling Ability of Plug&Play Diffusion Methods in Sparse-View CT [5.8] Plug&Play(CT)拡散モデルはCT(Computerd tomography)再構成における最先端の手法である。
我々は少数の投射を持つシングラムからの流れに興味を持ち、結果として後部分布はもはや集中せず、またマルチモーダルでもなくなる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:00:53 GMT)
Trading-off Accuracy and Communication Cost in Federated Learning [5.8] 我々は,34倍の通信コスト削減を実現するトレーニング・バイ・プルーニング・プロトコルを開発した。
トレーニング・バイ・サンプリングとランダム凸幾何学の新たなリンクを確立する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:35:24 GMT)
Strategic resource allocation in memory encoding: An efficiency principle shaping language processing [5.8] 文処理におけるメモリ符号化の効率原理としての戦略的資源割り当てについて検討する。
生産と理解の両面から, 依存関係の局所性の観点から, 戦略的資源配分の確固たる証拠を見出した。
また,言語固有のフレーズ構造とどのように相互作用するかを,戦略的資源配分の原理として,より深く検討する必要があることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:58:43 GMT)
A Cascaded Random Access Quantum Memory [5.7] 超伝導回路とキャビティを用いた8ビットランダムアクセス量子メモリを実現する。
光子損失などの個々のエラーチャネルに加えて、量子記憶は多体自己相互作用からのデコヒーレンスを経験することができる。
個々のモードは1モードあたり$lesssim 1.5%$不忠実でアクセスでき、メモリ全体が任意の順序でアクセスでき、エラー率は表面コードの非分極しきい値以下である。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:42:51 GMT)
Toward Large-Scale Distributed Quantum Long Short-Term Memory with Modular Quantum Computers [5.7] 我々は、ノイズ中間スケール量子(NISQ)デバイス上でのスケーラビリティ問題に対処するために、分散量子長短期メモリ(QLSTM)フレームワークを導入する。
QLSTMは長期の時間的依存関係をキャプチャし、分散アーキテクチャは基礎となる変分量子回路をより小さく管理可能なサブ回路に分割する。
分散QLSTMは,古典的アプローチと比較して,安定した収束とトレーニングダイナミクスの向上を実現している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:07:34 GMT)
Identity-Preserving Pose-Guided Character Animation via Facial Landmarks Transformation [5.6] 本稿では,この制限に対処するために3次元モーフィブルモデルを利用する顔のランドマーク変換(Falcial Landmarks Transformation)手法を提案する。
2Dのランドマークを3Dのフェイスモデルに変換し、3Dのフェイスモデルを調整して参照のアイデンティティと整合させ、2Dのランドマークに戻す。
このアプローチにより、参照顔形状との正確なアライメントが保証され、生成されたビデオと参照画像の一貫性が向上する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:30:23 GMT)
Spotting Persuasion: A Low-cost Model for Persuasion Detection in Political Ads on Social Media [5.5] 本稿では,SemEval 2023 Task 3 の Subtask 3 における最先端性能を実現する,説得力のあるテキスト検出のための軽量モデルを提案する。
本研究は、説得力のある政治広告における微妙さの発見と、そのような戦略を限られた資源で検出・分析するための実践的なアプローチを示すものである。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:33:38 GMT)
Better Private Distribution Testing by Leveraging Unverified Auxiliary Data [5.5] 拡張分散テストのフレームワークを、微分プライベートな設定にまで拡張する。
これは、データアナリストが機密データ上で仮説テストタスクを実行しなければならないシナリオをキャプチャする。
3つのフラグシップディストリビューションテストタスクのために,この拡張設定でプライベートアルゴリズムを設計する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:17:20 GMT)
Weakly Supervised Spatial Implicit Neural Representation Learning for 3D MRI-Ultrasound Deformable Image Registration in HDR Prostate Brachytherapy [5.5] 本研究は, 3次元MRI-USデフォルマブル登録のためのSINRを基盤とした新しい手法を提案する。
HDR前立腺切開療法におけるリアルタイム画像誘導の精度,堅牢性,計算効率の向上を実現している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:30:08 GMT)
Is Discretization Fusion All You Need for Collaborative Perception? [5.4] 本稿では,Anchor-Centric paradigm for Collaborative Object Detection (ACCO)を提案する。
グリッド精度の問題を避け、より柔軟で効率的なアンカー中心の通信と融合を可能にする。
OPV2VおよびDair-V2Xデータセット上のACCOを評価するための総合的な実験を行った。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:25:03 GMT)
PIG: Physics-Informed Gaussians as Adaptive Parametric Mesh Representations [5.4] 本稿では,ガウス関数を用いた特徴埋め込みと軽量ニューラルネットワークを組み合わせた物理インフォームドガウス(PIG)を提案する。
提案手法では,各ガウス平均と分散にトレーニング可能なパラメータを用い,トレーニング中の位置と形状を動的に調整する。
実験の結果,複雑なPDEを解くための堅牢なツールとしての可能性を示した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:17:32 GMT)
Unsynchronized Decentralized Q-Learning: Two Timescale Analysis By Persistence [5.4] ゲームのための最近のMARLアルゴリズムである分散Q-ラーニングアルゴリズムの非同期変種について検討する。
提案手法では,Q-factorの更新において一定の学習率を利用することで,従来の作業の同期仮定を緩和する上で極めて重要であることを示す。
この研究は、分散Q-ラーニングアルゴリズムの適用性と、パラメータが独立した方法で選択される設定に対する相対性を拡張する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:30:39 GMT)
ADAPT: An Autonomous Forklift for Construction Site Operation [5.3] 本稿では、自律動的全テランのパレットトランスポーター(ADAPT)の開発と評価について述べる。
ADAPTは建設環境向けに設計された完全に自律的なオフロードフォークリフトである。
本研究では,その長期的性能を経験豊富な人間のオペレータと比較し,広範囲な実世界のテストを通じて検証する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:03:28 GMT)
Zero-Shot Scene Understanding with Multimodal Large Language Models for Automated Vehicles [5.3] 本稿では、ゼロショット・インコンテキスト学習環境におけるシーン理解のための4つのマルチモーダル大規模言語モデル(MLLM)の能力を評価する。
実験の結果,最大モデルであるGPT-4oはシーン理解において他のモデルよりも優れていた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 00:43:12 GMT)
Extending Structural Causal Models for Autonomous Vehicles to Simplify Temporal System Construction & Enable Dynamic Interactions Between Agents [5.3] 我々は、自動運転車と因果推論の分離を橋渡しすることを目指している。
まず、自動運転車における構造因果モデルの統合を制限した課題を特定する。
次に、これらの課題に取り組むために、構造因果モデルフォーマリズムに対する理論的拡張をいくつか導入する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:14:38 GMT)
COMM:Concentrated Margin Maximization for Robust Document-Level Relation Extraction [5.3] 文書レベルの関係抽出(DocRE)は、文書内の複数の文にまたがるエンティティ間の関係を識別し、抽出するプロセスである。
DocREに固有の複雑さにより、ラベル付けプロセスはエラーを起こしやすくなり、正の関係サンプルの極端に親和性がある。
DocREをよりよく解くために,textittextbfCOMMという堅牢なフレームワークを開発した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:31:57 GMT)
Comparative and Interpretative Analysis of CNN and Transformer Models in Predicting Wildfire Spread Using Remote Sensing Data [5.3] 本研究では,Autoencoder,ResNet,UNet,TransformerベースのSwin-UNetの4種類のディープラーニングアーキテクチャの性能,効率,説明性を徹底的に比較することを目的とする。
詳細な定量的比較分析により,TransformerベースのSwin-UNetとUNetがAutoencoderとResNetを上回っていることが判明した。
XAI分析によると、UNetとTransformerベースのSwin-UNetは、他の2つのモデルよりも重要な機能に集中できる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:16:48 GMT)
Accuracy-Preserving Calibration via Statistical Modeling on Probability Simplex [5.3] 本稿では, 確率単純度に基づく確率モデルとして, コンクリート分布を用いた精度保存キャリブレーション法を提案する。
提案手法は,ベンチマークを用いてキャリブレーションを精度よく保存する作業において,従来の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:30:43 GMT)
TAROT: Task-Oriented Authorship Obfuscation Using Policy Optimization Methods [5.2] 著者の難読化は、著者の身元をテキスト内で偽装することを目的としている。
この変更は、プライバシーとユーティリティのバランスを取る必要がある。
政策最適化を用いたタスク指向オーサリング難読化(TAROT: Task-Oriented Authorship Obfuscation Using Policy Optimization)を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:08:33 GMT)
FlexDeMo: Decoupled Momentum Optimization for Hybrid Sharded Data Parallel Training [5.2] 大規模なニューラルネットワークモデルのトレーニングには、大規模な計算リソースが必要で、多くの場合、複数のノードやアクセラレータに分散する。
最近の知見は、局所的に運動量を蓄積しながら勾配の高速移動成分を交換するだけで十分かもしれないことを示唆している(Decoupled Momentum)。
本稿では,ハイブリッドシャードデータ並列トレーニング戦略であるFlexDeMoを用いて,各アクセラレータ間の完全シャードモデルパラメータを局所的に分割する手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:00:57 GMT)
Anti-Tamper Radio meets Reconfigurable Intelligent Surface for System-Level Tamper Detection [5.2] 我々は、無線伝搬環境を動的に再構成するRISを補完するATRシステムを提案し、実験的に評価する。
提案手法は、信号操作攻撃に対する耐性を高め、帯域幅要件を数GHzから20MHzまで低減し、内部ファン運動などの環境障害に対する堅牢性を向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:18:31 GMT)
Memorization and Regularization in Generative Diffusion Models [5.1] 拡散モデルは、生成モデリングの強力なフレームワークとして登場した。
この分析は、解析的に抽出可能な最小化器の再生を避けるための正規化の必要性を強調している。
実験は記憶の文脈で評価され、今後の正規化の方向性が強調される。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:31:23 GMT)
SALAD: Skeleton-aware Latent Diffusion for Text-driven Motion Generation and Editing [5.1] 関節, フレーム, 単語間の複雑な相互関係を捉えるスケルトン対応潜伏拡散(SALAD)モデルを提案する。
生成プロセス中に生成したクロスアテンションマップを利用することで、アテンションベースのゼロショットテキスト駆動モーション編集を可能にする。
提案手法は, 生成品質を損なうことなく, テキスト・モーションアライメントにおいて, 従来手法よりも大幅に優れていた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:20:11 GMT)
Zero-Shot Action Recognition in Surveillance Videos [5.1] 現在のAIベースのビデオ監視システムは、広範囲の微調整を必要とするコアコンピュータビジョンモデルに依存している。
VideoLLaMA2はゼロショットのパフォーマンスが飛躍的に向上し、ベースラインを20%上回る。
さらに、Self-ReSはゼロショットアクション認識性能を44.6%に向上させた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:30:27 GMT)
Materials Map Integrating Experimental and Computational Data through Graph-Based Machine Learning for Enhanced Materials Discovery [5.1] 材料情報学(MI)は、材料発見と開発を大幅に効率化することが期待されている。
MIに使用されるデータは、計算と実験の両方から得られる。
本研究では,得られたデータを用いて材料マップを構築し,材料の構造的特徴との関係を可視化する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:43:10 GMT)
Navigating LLM Ethics: Advancements, Challenges, and Future Directions [5.0] 本研究では,人工知能分野におけるLarge Language Models(LLM)を取り巻く倫理的問題に対処する。
LLMと他のAIシステムによってもたらされる共通の倫理的課題を探求する。
幻覚、検証可能な説明責任、検閲の複雑さの復号化といった課題を強調している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:57:17 GMT)
IPCGRL: Language-Instructed Reinforcement Learning for Procedural Level Generation [4.9] IPCGRLは、強化学習による指示に基づく手続き的コンテンツ生成手法である。
IPCGRL ゲームレベル条件を効果的に圧縮するためのタスク固有の埋め込み表現。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:22:24 GMT)
Measurement Schemes for Quantum Linear Equation Solvers [4.9] 本稿では,CFD のユースケースに特化して,QSVT 行列逆変換アルゴリズムの出力を測定する手法を提案する。
量子信号処理(QSP)に基づく振幅推定アルゴリズムarxiv:2207.08628を用いて,QSVT行列逆変換アルゴリズムと組み合わせることができることを示す。
また,大振幅のみに着目し,CFD例で測定した振幅数を減少させる手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:31:14 GMT)
Correcting Noisy Multilabel Predictions: Modeling Label Noise through Latent Space Shifts [4.8] ほとんどの現実世界の機械学習アプリケーションでは、データのノイズは避けられないように思える。
マルチラベル分類における雑音ラベル学習の分野について検討した。
我々のモデルは、雑音のラベル付けは潜伏変数の変化から生じると仮定し、より堅牢で有益な学習手段を提供する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:19:06 GMT)
RoMedFormer: A Rotary-Embedding Transformer Foundation Model for 3D Genito-Pelvic Structure Segmentation in MRI and CT [4.8] 放射線治療,外科的計画,疾患診断などの応用には,MRIおよびCTにおけるゲニト骨構造の深層学習に基づくセグメンテーションが不可欠である。
我々は,MRIとCTの両方において3次元女性性骨盤構造セグメンテーションのための回転埋め込みトランスフォーメーションモデルであるRoMedFormerを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:45:05 GMT)
Revisiting Gradient Descent: A Dual-Weight Method for Improved Learning [4.8] 本稿では、各ニューロンの重みベクトルを2つの異なる部分に分解することで、ニューラルネットワークで学習するための新しいフレームワークを提案する。
この分解によって一般化が促進され、特にトレーニングデータが疎かでノイズの多い場合、過度に適合することを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:34:27 GMT)
Self-Vocabularizing Training for Neural Machine Translation [4.7] トレーニングされた翻訳モデルは、元のBPE語彙とは別個のBPE語彙反復を用いて、バイトペア符号化サブセット(BPE)を使用するように誘導される。
我々は,より小さく,より最適な語彙を自己選択する反復的手法である自己語彙学習を提案し,最大1.49BLEUの改善をもたらす。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:21:07 GMT)
SpecReX: Explainable AI for Raman Spectroscopy [4.5] 本稿ではRamanスペクトルの説明に特化したSpecReXを紹介する。
SpecReXは実際の因果関係の理論を用いてスペクトルの因果責任をランク付けする。
SpecReXがクラス間の既知の差異にローカライズできることを確立します。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:49:15 GMT)
LAG-MMLU: Benchmarking Frontier LLM Understanding in Latvian and Giriama [4.5] OpenAIのo1モデルは、英語で92.8%、ラトビアで88.8%、グリアマで70.8%、全言語で他より優れています。
我々の結果は、文化AIの文脈化を進める上で、局所的なベンチマークと人的評価の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:01:37 GMT)
Involution and BSConv Multi-Depth Distillation Network for Lightweight Image Super-Resolution [4.5] Single Image Super-Resolution (SISR)は、低解像度(LR)入力から高解像度(HR)イメージを再構成することを目的としている。
ディープラーニング、特に畳み込みニューラルネットワーク(CNN)は、高度なSISRを備えている。
これを解決するために、精度と効率のバランスをとるために軽量モデルが開発されている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 23:10:08 GMT)
Splintering Nonconcatenative Languages for Better Tokenization [4.5] 本稿では,テキストを線形形式に再構成する前処理ステップであるSPLINTERを提案する。
我々は、ヘブライ語、アラビア語、マレー語におけるトークン語彙を評価する本質的な尺度を用いて、そのメリットを実証する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:11:09 GMT)
SuperPC: A Single Diffusion Model for Point Cloud Completion, Upsampling, Denoising, and Colorization [4.5] 4つの処理タスクを同時に処理できる最初の統一拡散モデルであるSuperPCを紹介する。
提案手法では,新しい空間混合拡散戦略によって強化された3レベル拡散フレームワークを用いる。
以上の結果から,SuperPCは4つのタスクのすべてにおいて,最先端の特殊モデルよりも優れていたことが分かる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:21:58 GMT)
Multi-label feature selection based on binary hashing learning and dynamic graph constraints [4.5] 本研究では,BHDG(Binary Hashing and Dynamic Graph Constraint)と呼ばれる新しいマルチラベル特徴選択手法を提案する。
BHDGは低次元のバイナリハッシュ符号を擬似ラベルとして使用し、ノイズを低減し、表現の最小化を改善する。
BHDGは6つの評価指標で10の最先端メソッドを上回ります。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:58:31 GMT)
On The Convergence of Euler Discretization of Finite-Time Convergent Gradient Flows [4.4] 本稿では,RGF (Rescaled-gradient Flow) とSGF (Signed-gradient Flow) の2つの新しい一階最適化アルゴリズムの性能について検討する。
これらのアルゴリズムは、勾配線型関数のミニマに局所収束する非リプシッツ力学系からなる有限時間収束流の前方離散化から導かれる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:03:49 GMT)
QF-tuner: Breaking Tradition in Reinforcement Learning [4.4] 本稿では,Q学習アルゴリズムにおけるパラメータ自動調整のためのQF-tunerという新しい手法を提案する。
提案手法はOpenAI GymのCartPoleとFrozenLakeの2つの制御タスクを用いて評価されている。
QF-tunerは報酬を36%、学習時間を26%、CartPoleタスクでは報酬を57%、学習時間を20%削減した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:41:10 GMT)
EnQode: Fast Amplitude Embedding for Quantum Machine Learning Using Classical Data [4.3] 古典的なデータを量子回路に符号化するためには、振幅埋め込み(AE)が量子機械学習(QML)に不可欠である。
本稿では,データセットのクラスタリングによる制限に対処するシンボリック表現に基づく高速AE手法EnQodeを紹介する。
データマッピングにおける90%以上の忠実さを持つEnQodeは、ノイズの多い中間スケール量子(NISQ)デバイス上で、堅牢で高性能なQMLを実現する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:48:03 GMT)
Three-dimensional Reconstruction of the Lumbar Spine with Submillimeter Accuracy Using Biplanar X-ray Images [4.3] 提案手法は3次元再構成精度0.80mmを実現し, 主流手法よりも大幅に向上した。
本研究は, 体重位における腰椎の臨床診断に寄与する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:00:39 GMT)
The Problem of Coherence in Natural Language Explanations of Recommendations [4.2] 我々は、説明品質の重要な側面が実験的評価で見過ごされていることを論じる。
本稿では,最先端手法の1つによる説明書の手作業による検証結果について述べる。
次に,提案手法が推薦性能の他の側面に影響を与えることなく,説明コヒーレンスを大幅に改善することを示す実験的評価を行った。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:01:54 GMT)
Advanced Relay-Based Collaborative Framework for Optimizing Synchronization in Split Federated Learning over Wireless Networks [4.2] Split Federated Learning (SFL)はエッジコンピューティングにおける分散モデルトレーニングに有望なアプローチを提供する。
本研究では,ユーザの同期効率を最適化する協調SFLフレームワークを提案する。
提案するCSFLフレームワークは同期遅延を低減し,システム全体のスループットを向上させる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 22:11:54 GMT)
ViiNeuS: Volumetric Initialization for Implicit Neural Surface reconstruction of urban scenes with limited image overlap [4.2] ViiNeuSは、符号付き距離場を効率よく初期化する、新しいハイブリッドな暗黙曲面学習法である。
ViiNeuSは、訓練の2倍の速さで、様々な都市景観の正確な3次元表面表現を学習できることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:00:34 GMT)
Fair Summarization: Bridging Quality and Diversity in Extractive Summaries [4.2] 本稿では,FairExtractとFairGPTの2つの新しい抽出方法を紹介する。
我々は,これらの手法を,ホワイトアライメント,ヒスパニック,アフリカ系アメリカ人の方言ツイートのダイジェム要約データセットを用いて評価した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:53:09 GMT)
QuLTSF: Long-Term Time Series Forecasting with Quantum Machine Learning [4.2] 長期時系列予測(LTSF)は、過去の値に基づいて、時系列の多くの将来の値を予測する。
最近の量子機械学習(QML)は、古典的な機械学習モデルの能力を高めるための領域として進化している。
平均二乗誤差の低減と平均絶対誤差の両面から、最先端の古典的線形モデルに対するQuLTSFの利点を示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:30:51 GMT)
Uncertainty-Aware Global-View Reconstruction for Multi-View Multi-Label Feature Selection [4.2] グローバルビュー再構築の観点から構築した統一モデルを提案する。
信頼性を高めるため,再建過程におけるサンプルの不確かさの認識を取り入れた。
実験により,マルチビューデータセットにおける提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:35:39 GMT)
Foundation Feature-Driven Online End-Effector Pose Estimation: A Marker-Free and Learning-Free Approach [4.1] 本研究は,機能駆動型オンライン・エンド・エフェクト・オア・ポース推定アルゴリズムを提案する。
トレーニング不要の方法で、ロボットとエンドエフェクターをまたいで一般化する。
実験は、その優れた柔軟性、一般化、パフォーマンスを示します。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:12:49 GMT)
Learning Bimanual Manipulation via Action Chunking and Inter-Arm Coordination with Transformers [4.1] 両腕の調整と効率性、特に同期行動に重点を置いています。
協調行動を予測する新しい模倣学習アーキテクチャを提案する。
本モデルでは,比較において高い成功率を示し,両手操作のポリシー学習に適したアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:20:34 GMT)
zkMixer: A Configurable Zero-Knowledge Mixer with Proof of Innocence and Anti-Money Laundering Consensus Protocols [4.0] グループの参加者はミキサーへの入力を監視し、入力がミキサーの条件を満たすかどうかを判断することができる。
沈殿物がグループによって受け入れられると、ミキサーに入り、追跡不能になる。
承認が得られない場合、検証者は預金を凍結し、総括してその預金を返却するか、またはその預金を没収して別のユーザーに送付することができる。
この行動は、鉱床を調べ、それらが合法的な源泉に由来するかどうかを判断し、そうでなければ、犯罪の被害者に鉱床を返すために用いられる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:59:06 GMT)
"Well, Keep Thinking": Enhancing LLM Reasoning with Adaptive Injection Decoding [4.0] 大規模言語モデル(LLM)は強力な推論能力を示しており、多くの場合、ほとんどショットやゼロショットの連鎖(CoT)のプロンプトによるものである。
本稿では,LLMを体系的に推論を継続し,未熟な推論を防止できる新しい復号法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 00:25:47 GMT)
Sequence Analysis Using the Bezier Curve [3.9] 本稿では,B'ezier曲線を要素マッピングに用いた新しい画像変換手法を提案する。
要素を曲線にマッピングすると、各画像のシーケンス情報表現が強化される。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:40:46 GMT)
SocialJax: An Evaluation Suite for Multi-agent Reinforcement Learning in Sequential Social Dilemmas [3.9] 社会的ジレンマは、マルチエージェント強化学習の分野で重要な課題である。
JAXで実装されたシーケンシャルなソーシャルジレンマ環境であるSocialJaxを紹介します。
SocialJaxは、Melt PotのRLlibベースラインと比較して、リアルタイムのパフォーマンスで50texttimesの高速化を実現している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:03:59 GMT)
Monte Carlo Simulation of Operator Dynamics and Entanglement in Dual-Unitary Circuits [3.9] 二重単位回路における演算子ダイナミクスと絡み合い成長について検討する。
我々の研究は、長期演算子の進化と絡み合いを研究するためのスケーラブルな計算フレームワークを提供する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:11:39 GMT)
To Retrieve or Not to Retrieve? Uncertainty Detection for Dynamic Retrieval Augmented Generation [3.7] 不確実性検出メトリクスは、質問応答精度をわずかに低下させるだけで、検索呼び出し数をほぼ半分に減らすことができる。
以上の結果から,Degree Matrix Jaccard や Eccentricity などの不確実性検出指標は,質問応答精度をわずかに低下させることなく,検索回数をほぼ半分に抑えることが示唆された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:42:17 GMT)
Efficient Classical Simulation of the Quantum Random Access Memory [3.7] ノイズレスおよびノイズの多いバケットドレーQRAM回路の両方をシミュレートする,効率的でスケーラブルなフレームワークを提案する。
本フレームワークは、ノイズレスの場合の線形計算スケーリングを実現し、現実的な雑音条件下での安定した性能を維持する。
ノイズの多いQRAMシミュレーションを30層に拡張し,従来報告されていたQRAMシミュレーションの規模を上回った。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:14:17 GMT)
OpenReviewer: A Specialized Large Language Model for Generating Critical Scientific Paper Reviews [3.7] OpenReviewerは、機械学習とAIカンファレンスの論文の高品質なピアレビューを生成するための、オープンソースのシステムである。
Llama-OpenReviewer-8Bは8Bパラメータ言語モデルで、トップカンファレンスから79,000人の専門家レビューに基づいて微調整されている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:37:47 GMT)
What's in a Package? Getting Visibility Into Dependencies Using Security-Sensitive API Calls [3.7] 本稿では,エコシステムのためのセキュリティに敏感なAPIリストを構築するための新しい手法を提案する。
次に、機能的に類似したパッケージグループにおけるセキュリティに敏感なAPIの頻度を比較します。
開発者の半数以上が、もし利用可能であれば、依存関係の選択プロセスでセキュリティに敏感なAPI情報を使用するだろう。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:57:00 GMT)
Localized Physics-informed Gaussian Processes with Curriculum Training for Topology Optimization [3.6] 物理インフォームドガウス過程(GP)に基づく同時かつメッシュフリーなトポロジー最適化(TO)フレームワークを提案する。
我々のフレームワークは、カスタマイズされたディープニューラルネットワーク(DNN)を介してパラメータ化される共有のマルチアウトプット平均関数を持つGPプリエントを介して、すべての設計と状態変数を提供する。
我々のTOアプローチは、適切に定義された材料インターフェースを生成し、グローバルな最適性を促進するための継続特性を内蔵している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 22:59:16 GMT)
LeakageDetector: An Open Source Data Leakage Analysis Tool in Machine Learning Pipelines [3.5] 私たちの研究は、機械学習(ML)エンジニアがモデルでData Leakageのインスタンスを見つけて修正するのを助けることで、より良いコードを書くことを可能にすることを目的としています。
ML開発者は、コードにData Leakageを導入するのを避けるために、データをトレーニング、評価、テストセットに慎重に分離する必要がある。
本稿では,MLコードのData Leakageのインスタンスを識別するPythonプラグインであるLEAKAGEDETECTORを開発し,リークの除去方法について提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:53:44 GMT)
Consensus About Classical Reality in a Quantum Universe [3.5] 量子ダーウィン主義は、デコヒーレンスが環境上の好ましい準古典的ポインタ状態の冗長な記録をインプリントしていると認識している。
我々は、冗長性によって、関心のシステムに関する情報を取得するために、そのデコヒーリング環境の断片を使用するオブザーバ間のコンセンサス(コンセンサス)がいかに可能かを示します。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 23:44:42 GMT)
On the clustering behavior of sliding windows [3.4] クラスタリングがスライディングウィンドウで前処理されたデータをタイムリーにすることで、事態は驚くほど悪化する可能性がある。
ウィンドウサイズがタイムリーの長さとどのように比較されるかによって、驚くほどの失敗が3つ浮かび上がっています。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:28:14 GMT)
CTSAC: Curriculum-Based Transformer Soft Actor-Critic for Goal-Oriented Robot Exploration [3.4] 強化学習(RL)は自律型ロボット探査の分野で有望なアプローチになりつつある。
現在のRLベースの探索アルゴリズムは、限られた環境推論能力、緩やかな収束率、シム・トゥ・レアル転送における重大な課題に直面することが多い。
本稿では,探索効率と転送性能の両方を改善することを目的とした,カリキュラム学習に基づく変圧器強化学習アルゴリズム(CTSAC)を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:44:29 GMT)
Explicit block encodings of boundary value problems for many-body elliptic operators [3.3] 離散化楕円演算子を符号化するブロックの量子回路複雑性を系統的に解析する。
我々は、多体ラプラシアンを分離可能な周期性、ディリクレ、ノイマン、ロビン境界条件で符号化する明示的な回路を提供する。
次に,多体対流作用素の符号化をブロックし,対ポテンシャルによって生じる力を受ける相互作用粒子を記述する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 00:39:48 GMT)
Measurement-Induced Multimode Squeezed Light Interferometers with Scalable Architectures [3.3] 我々は,高度にスケーラブルで低損失なマルチモード圧縮光干渉計方式を実証し,実験を行った。
この開発は、大規模なノイズ中間量子(NISQ)アルゴリズムアプリケーションの実現に向けた一歩となる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:28:16 GMT)
Improving Adaptive Density Control for 3D Gaussian Splatting [3.2] 3D Gaussian Splattingは、過去1年で最も影響力のある作品の1つだ。
シーン再構築の際に使用されるガウス的プリミティブの数を適切に管理する上での課題に直面している。
本稿では,適応密度制御機構の3つの改良点を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:09:10 GMT)
Distribution and Purification of Entanglement States in Quantum Networks [3.2] 量子ネットワークのノード間で高忠実な絡み合った状態を分散する問題を考察する。
本稿では,高忠実度EP分布問題に対する最適解のアルゴリズムを提案する。
我々は,量子ネットワークシミュレータであるNetSquid上でのシミュレーションによる手法の評価を行った。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:19:44 GMT)
Heuristic and Optimal Synthesis of CNOT and Clifford Circuits [3.2] CNOTゲートからなる回路に相当する線形可逆回路は、古典計算において重要な応用である。
CNOTと一般クリフォード回路合成の手法として,絡み合う2ビットゲート数や回路深さを最小化する手法を提案する。
アルゴリズムは、古典的および量子コンピューティングコミュニティが使用するGitHubリポジトリに実装されている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:09:58 GMT)
Improved Scalable Lipschitz Bounds for Deep Neural Networks [3.2] 我々は、ECLipsE-Fastより優れた性能を実現するために、拡張性のあるリプシッツ境界の新たなファミリーを開発する。
具体的には、LipSDPの可能な点のより一般的なパラメータ化を利用して、様々な閉形式リプシッツ境界を導出する。
さらに,本手法はECLipsE-Fastを特殊なケースとして含み,拡張性のあるリプシッツ境界のクラスをはるかに大きくすることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:39:47 GMT)
MutualForce: Mutual-Aware Enhancement for 4D Radar-LiDAR 3D Object Detection [3.1] 本稿では,その表現を相互に強化する4Dレーダ-LiDARフレームワークを提案する。
まず、レーダーからの指示的特徴を利用して、レーダーとLiDARの幾何学的特徴学習をガイドする。
空隙を緩和するため、LiDARの形状情報はレーダーBEVの特徴を豊かにするために使用される。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:28:00 GMT)
From Patient Consultations to Graphs: Leveraging LLMs for Patient Journey Knowledge Graph Construction [3.1] 患者ジャーニー知識グラフ(PJKG)は、断片化された医療データの課題に対処するための新しいアプローチである。
PJKGのプロセスと構造 : 形式的臨床文書と非構造的患者とプロジェクタの会話
これらのグラフは、臨床遭遇、診断、治療、結果の間の時間的および因果関係をカプセル化する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:44:28 GMT)
KANITE: Kolmogorov-Arnold Networks for ITE estimation [3.1] 因果推論における複数の処理条件下での個別処理効果(ITE)推定にコルモゴロフ・アルノルドネットワーク(KAN)を利用するフレームワークであるKanITEを紹介する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:16:36 GMT)
Towards a Barrier-free GeoQA Portal: Natural Language Interaction with Geospatial Data Using Multi-Agent LLMs and Semantic Search [3.0] 地理空間データとのシームレスな自然言語インタラクションのための多エージェント大規模言語モデルフレームワークを用いたGeoQAポータルを提案する。
ケーススタディ、評価、およびユーザテストは、非専門家、GIS複雑性のブリッジング、パブリックアクセスに対する有効性を確認します。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:39:46 GMT)
Optimized Distribution of Entanglement Graph States in Quantum Networks [2.9] 量子ネットワークでは、ネットワーク上に分散されたマルチパーティの絡み合った状態は、多くの量子ネットワークアプリケーションの実装とサポートに役立ちます。
本研究は,複数部品の絡み合い状態を効率的に生成・分散するための最適手法の開発に焦点をあてる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:59:08 GMT)
Recursive Self-Similarity in Deep Weight Spaces of Neural Architectures: A Fractal and Coarse Geometry Perspective [2.9] 本稿では,Deep Weight Spacesを,離散整数スケールで観測可能な階層的,フラクタル的,粗い幾何学構造として概念化する。
我々は、フラクタル変換と呼ばれる粗い群作用、$T_r_k $を導入し、対称性群 $G = (mathbbZ, +) $ の下で作用する。
この観点は、一般に物理的構造の階層的およびスケール関連幾何学を評価するために使用されるボックスカウント技術を採用する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:41:23 GMT)
Task-driven single-image super-resolution reconstruction of document scans [2.8] 文書スキャンから光学的文字認識を改善するために,超解像を前処理ステップとして活用する可能性を検討する。
そこで本研究では,単一画像の超解像のための深層ネットワークをタスク駆動方式で訓練し,テキスト検出のための適応性を高めることを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:40:36 GMT)
Ensembling convolutional neural networks for human skin segmentation [2.8] 本稿では、異なる特徴に着目したデータセットを用いて畳み込みネットワークを訓練し、個々の結果を効果的に組み合わせたアンサンブルを作成することを提案する。
本研究は,セマンティックセグメンテーションシステムの性能を向上する,アンサンブルに基づく新しい手法の開発に役立てることを期待している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:58:47 GMT)
Empirical Calibration and Metric Differential Privacy in Language Models [2.8] 我々は、MIA(Commanship Inference Attacks)を用いて、フレームワーク間のノイズを経験的に校正する方法を示す。
我々は,Von Mises-Fisher(VMF)分布に基づく新たな指向性プライバシーを定義する。これは,ガウス雑音を付加する(等方性)のではなく,角距離を摂動する計量DP機構である。
公式な保証は相容れないが、実証的なプライバシ・キャリブレーションにより、各メカニズムがユーティリティとプライバシのトレードオフに関して異なる強度の領域を持っていることが明らかになった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:52:12 GMT)
TopoLM: brain-like spatio-functional organization in a topographic language model [2.8] 本研究では,2次元空間モデルユニットを明示したトランスフォーマー言語モデルであるTopoLMを開発する。
TopoLMは皮質言語系の機能的構造の出現をうまく予測する。
この結果から,人間の言語システムの機能的構造は,統合された空間的目的によって駆動されていることが示唆された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:40:54 GMT)
Reliable uncertainty quantification for 2D/3D anatomical landmark localization using multi-output conformal prediction [2.7] 現在の不確実量化のアプローチは、特に正規性仮定と組み合わせると、しばしば短くなる。
多出力回帰問題に対する有限サンプル妥当性を保証する2つの新しいアプローチを提案する。
提案手法は, 有効性と有効性の両方において, 既存の多出力共形予測手法より一貫して優れている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:21:32 GMT)
Construction Site Scaffolding Completeness Detection Based on Mask R-CNN and Hough Transform [2.7] 本稿では,コンピュータビジョンを用いた足場とその横断ブラス検出のための深層学習に基づくアプローチを提案する。
注釈付きラベル付き足場画像データセットを使用して、畳み込みニューラルネットワーク(CNN)モデルをトレーニングする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:27:22 GMT)
Transparent Attested DNS for Confidential Computing Services [2.7] ADNSは、証明されていない機密サービスの実装をドメイン名にバインドする名前サービスである。
ADNSはDNSSEC、DANE、ACME、Certificate Transparencyなどの標準に基づいている。
我々は,TEEのフォールトトレラントネットワークを用いて,秘密サービスとしてaDNSを実装した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:07:09 GMT)
3D Densification for Multi-Map Monocular VSLAM in Endoscopy [2.7] そこで本研究では, スパース内視鏡用マルチマップCudaSIFT-SLAMにおいて, 外れ値を取り除き, 最先端の地図を高密度化する手法を提案する。
本システムでは, 単分子深度推定における固有スケールのあいまいさを軽減し, オフレーヤをフィルタし, 信頼性の高い3次元地図を作成する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:25:38 GMT)
Analyzing DevOps Practices Through Merge Request Data: A Case Study in Networking Software Company [2.6] GitLabのリクエスト(MR)メカニズムは、コードの提出とレビューを合理化する。
MRデータは、コラボレーションパターン、生産性、プロセス最適化など、幅広い側面を反映しています。
本研究では、ネットワークソフトウェア企業の116プロジェクトの4チームから26.7kのMRを調査する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:33:34 GMT)
Multi-task Learning for Identification of Porcelain in Song and Yuan Dynasties [2.6] 中国の陶磁器は、歴史的、文化的に大きな価値を持っている。
伝統的な分類法は専門家分析に大きく依存している。
本稿では, 陶磁器の分類を自動化するために, DLと転写学習技術の応用について検討する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:09:00 GMT)
Learning Accurate Models on Incomplete Data with Minimal Imputation [2.6] データの欠落は実世界のデータセットに存在することが多く、正確な機械学習(ML)モデルを学ぶのにかなりの時間と労力を要する。
我々は、最小限のデータ計算の概念を導入し、命令されたデータセット上でトレーニングされた正確なMLモデルを保証する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:36:59 GMT)
Boosting Semi-Supervised Medical Image Segmentation via Masked Image Consistency and Discrepancy Learning [2.5] 3つの重要なモジュールを持つMasked Image Consistency and Discrepancy Learning(MICD)フレームワークを提案する。
Cross Feature Consistency (CFC)モジュールは、情報交換とモデルロバスト性を確立する。
Cross Model Discrepancy (CMD)モジュールは、EMAの教師ネットワークを利用して出力を監督し、分岐の多様性を維持する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:20:35 GMT)
Your copula is a classifier in disguise: classification-based copula density estimation [2.5] 本稿では,コプラ密度推定を識別タスクとして再解釈する。
我々は、よく知られたコプラクラスと、我々の解釈に自然に生じる分類問題との同値性を導出する。
推定器が最大推定値に類似した理論的保証を達成することを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:56:57 GMT)
Towards Physics-Guided Foundation Models [2.5] 物理誘導基礎モデル(PGFM)の表記法を提案する。
PGFMは、幅広いダウンストリームタスクに適用可能な広範囲または一般的な(科学的な)物理知識と統合された基礎モデルである。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:51:46 GMT)
SE(3)-Equivariant Robot Learning and Control: A Tutorial Survey [2.5] 本チュートリアルでは,ロボット工学における多種多様な深層学習・制御手法について概説する。
視覚ロボットの操作と制御設計において, 自然な3次元回転と翻訳の対称性を利用するSE(3)-equivariantモデルに焦点をあてる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:26:34 GMT)
How much do LLMs learn from negative examples? [2.5] 大規模な言語モデルが否定的な例にさらされるのは最終段階である。
本稿では,LLMのトレーニングにおける負の例の役割について考察する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:26:29 GMT)
Anomaly-Flow: A Multi-domain Federated Generative Adversarial Network for Distributed Denial-of-Service Detection [2.5] DDoS(Distributed denial-of-service)攻撃は、インターネットサービスにとって重要な脅威である。
現在のソリューションは、異種ネットワーク間で攻撃を検知しなければならないマルチドメイン環境に苦慮している。
本稿では,Federated Learning(FL)とGenerative Adversarial Networks(GAN)を組み合わせた新しいフレームワークであるAnomaly-Flowを紹介した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:13:51 GMT)
Landscape Complexity for the Empirical Risk of Generalized Linear Models: Discrimination between Structured Data [2.5] 我々は、Kac-Rice公式とランダム行列理論の結果を用いて、高次元の経験的損失関数の族の平均臨界点数を求める。
相関は、現在の機械学習システムでよく見られるように、データ中の構造の存在をモデル化するために導入された。
完全性のために、相関入力データの存在下での一般線形モデルの訓練に使用される損失関数についても検討する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:44:33 GMT)
An Explainable Framework for Misinformation Identification via Critical Question Answering [2.5] 本稿では,疑似情報検出のための新たなフレームワークを提案する。
NLAS-CQは3,566の教科書のような自然言語の議論スキームインスタンスと4,687の対応回答を組み合わせた最初のコーパスである。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:24:23 GMT)
Quantum Simulations of Chemical Reactions: Achieving Accuracy with NISQ Devices [2.5] 現在のノイズ中間スケール量子(NISQ)時代には、変分量子ソルバ(VQE)を用いて量子ビットを用いて分子をシミュレートし、分子特性を計算する。
しかしながら、VQEアルゴリズムを用いて反応エネルギーを計算するために反応をシミュレートする化学は、ベンチマーク計算化学法と比較してまだ化学精度に達していない。
本研究では,分子の基底状態と励起状態の両方の既約表現を取り入れ,化学反応を研究するための異なる活性空間の定義を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:52:23 GMT)
Entropy-regularized Gradient Estimators for Approximate Bayesian Inference [2.4] 本稿では,Kulback-Leibler分散系の勾配流を近似することにより,ベイズ後部を推定し,多様なサンプルを生成する。
本研究は, モデルベース強化学習における手法の性能評価と有効性を検討するために, 分類タスクに関する経験的評価を行う。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:47:01 GMT)
Empirical risk minimization algorithm for multiclass classification of S.D.E. paths [2.4] L2リスクの最小化に依存する分類アルゴリズムを提案する。
結果の予測値に対する収束率を確立する。
シミュレーションでは,分類アルゴリズムの数値的性能を強調した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:06:19 GMT)
Inference-Time Intervention in Large Language Models for Reliable Requirement Verification [2.4] 推論時間介入技術は微調整に代わる有望な手段である。
我々は、介入が通常時間を要する要求検証プロセスを自動化するためのきめ細かい制御を可能にする方法を実証する。
提案手法は, ベースラインモデルと微調整手法の両方において, 頑健で信頼性の高い出力を実現する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:49:36 GMT)
Image-Based Metrics in Ultrasound for Estimation of Global Speed-of-Sound [2.4] 組織音速(SoS)を推定するための新しい簡便なアプローチとして,従来の画像解析手法とメトリクスを活用することを提案する。
数値シミュレーションおよびファントム実験において,画像品質,画像類似性,多フレーム変動を評価するために,11の指標について検討した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:11:49 GMT)
BPINN-EM-Post: Stochastic Electromigration Damage Analysis in the Post-Void Phase based on Bayesian Physics-Informed Neural Network [2.2] 本稿では,BPINN-EM-Postと呼ばれる機械学習に基づく新しいフレームワークを提案する。
解析解を用いて損失関数の変数数を減らし,精度の低下を伴わずにトレーニング効率を大幅に改善し,変動効果を自然に組み込む。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 00:31:12 GMT)
A Linearized Alternating Direction Multiplier Method for Federated Matrix Completion Problems [2.2] マトリックス補完は、パーソナライズされた医療、電子商取引、レコメンデーションシステム、ソーシャルネットワーク分析における幅広い応用で欠落したデータを予測するための基本となる。
伝統的な行列補完アプローチは典型的には集中型データストレージを前提としている。
フェデレートされた行列補完問題の解法としてtextttFedMC-ADMM を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:46:32 GMT)
Speedup of high-order unconstrained binary optimization using quantum Z2 lattice gauge theory [2.2] 本稿では、高次非制約二項最適化を量子Z2格子ゲージ理論にマッピングする手法を提案する。
ゲージ対称性を用いてアルゴリズムの高速化を実現する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:56:39 GMT)
RETHINED: A New Benchmark and Baseline for Real-Time High-Resolution Image Inpainting On Edge Devices [2.2] 既存の画像塗装法は, 解像度の低い画像に対して顕著な完成率を示した。
超高解像度で塗布可能なエッジデバイス(RETHINED)上のReal-Time High- resolution Image Inpaintingの最初のベースラインを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 22:02:40 GMT)
PHGNN: A Novel Prompted Hypergraph Neural Network to Diagnose Alzheimer's Disease [2.1] 本稿では,ハイパーグラフに基づく学習と即時学習を統合した新しいPmpted Hypergraph Neural Network (PHGNN) フレームワークを提案する。
本モデルは,ADNIデータセットにおける広範囲な実験により検証され,AD診断とMCI変換予測の両方においてSOTA法より優れていた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:10:43 GMT)
FNDaaS: Content-agnostic Detection of Fake News sites [2.1] 本稿では,Fake News Detection-as-a Service (FND)を提案する。
FNDは過去のサイトで最大0.967のAUCスコアを達成でき、新しくフラッグされたサイトでは77-92%に達する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:28:14 GMT)
SagaLLM: Context Management, Validation, and Transaction Guarantees for Multi-Agent LLM Planning [2.1] SagaLLMは構造化マルチエージェントフレームワークで、現在のLLMアプローチの4つの基本的な制限に対処する。
特別なコンテキスト管理エージェントと検証プロトコルを実装することで、SagaLLMは複雑な計画プロセスを通して重要な制約と状態情報を保持する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:00:47 GMT)
Disentangling Fine-Tuning from Pre-Training in Visual Captioning with Hybrid Markov Logic [2.1] そこで我々は,Hybrid Markov Logic Networks (HMLNs) を用いて確率モデルを学習する。
生成されたキャプションに対して,HMLN分布に基づくトレーニング例の影響を定量化する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:39:26 GMT)
CP-NCBF: A Conformal Prediction-based Approach to Synthesize Verified Neural Control Barrier Functions [2.1] 制御バリア関数(CBF)は、安全クリティカルなコントローラを設計するための実践的なアプローチである。
近年,ニューラルCBFのような学習ベースの手法でこの問題に対処する研究が進められている。
本稿では, 分割整形予測を利用して, 正式に検証されたニューラルCBFを生成する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:01:06 GMT)
BioMamba: Leveraging Spectro-Temporal Embedding in Bidirectional Mamba for Enhanced Biosignal Classification [2.0] 既存のバイオシグナル分類手法は、フィードフォワード層が密集した注意に基づくフレームワークに依存している。
これら3つの重要なコンポーネントを統合することで、BioMambaは既存のメソッドの制限を効果的に解決する。
大規模な実験により、BioMambaは最先端の手法を著しく上回り、分類性能が著しく向上していることが示された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:39:07 GMT)
Multi-View Node Pruning for Accurate Graph Representation [2.0] マルチビューフレームワークと再構成損失に基づくグラフ解析手法を提案する。
MVPは、再構築とタスク損失の両方を考慮して、各ノードのスコアを学習する。
MVPは基本グラフプーリング法の性能を大幅に改善することを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:34:49 GMT)
Dual-Source SPIR over a noiseless MAC without Data Replication or Shared Randomness [2.0] Symmetric Private Information Retrieval (SPIR) は、単一のサーバを持つノイズレスチャネルに対して無効であることが知られている。
本稿では,情報理論のセキュリティ保証でSPIRを実現するための代替手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:38:14 GMT)
Strategic White Paper on AI Infrastructure for Particle, Nuclear, and Astroparticle Physics: Insights from JENA and EuCAIF [2.0] 深層学習法は、粒子、核、天体物理学におけるデータ分析、シミュレーション、信号検出において中心的な役割を果たしている。
このホワイトペーパーは、これらの障壁に対処するために、コミュニティ調査によって通知される戦略的ロードマップを提供する。
重要なインフラストラクチャ要件を概説し、トレーニングイニシアチブを優先し、今後5年間で基本物理学にわたってAI能力を拡張するための資金戦略を提案している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:11:11 GMT)
Counterfactual Generative Modeling with Variational Causal Inference [1.9] 本稿では, 逆ファクト生成モデリングタスクを扱うための変分ベイズ因果推論フレームワークを提案する。
実験では, 反ファクト生成モデルにおける最先端モデルと比較して, フレームワークの利点を実証する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:48:13 GMT)
Shift, Scale and Rotation Invariant Multiple Object Detection using Balanced Joint Transform Correlator [1.9] 同一フレーム内に複数のオブジェクトが存在する場合のSegmented PMT(SPMT)を提案する。
このSPMTを光電子継手変換相関器に統合し、複数の物体を同時に検出できる相関系を作成する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:51:20 GMT)
A Preliminary Investigation into Theory-Practice Barriers in Sino-New Zealand Undergraduate Computing Education [1.9] 学生は中国のキャンパスで学ぶが、中国とニュージーランドのコースは両国の講師が共同で教えている。
分析の結果,これらの障壁は学生の学業成績,エンゲージメント,スキル開発に大きく影響していることが明らかとなった。
本研究は, 専門科目, 言語サポートの強化, 指導方法の洗練, 資源配分の改善など, 対象の介入を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:55:02 GMT)
Interacting non-Hermitian edge and cluster bursts on a digital quantum processor [1.9] 非エルミート皮膚効果を持つ損失量子系は、バルクよりもシステムの境界で異常に高い損失を示す。
我々は、空間的に拡張されパターン化されるエッジバーストの相互作用する多体拡張を明らかにする。
我々の研究は、非エルミート凝縮物質物理学のための汎用的なプラットフォームとして、デジタル量子プロセッサを利用するための道を開いた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:00:52 GMT)
Geometrical constructions of purity testing protocols and their applications to quantum communication [1.9] 古典線形誤り訂正符号(LECC)から直接派生したプロトコルの幾何学的構成を提供する。
本研究は,一般的な量子エラーモデルに対する誤差検出,絡み合いの浄化,量子メッセージ認証など,様々なタスクにおける結果の影響について検討する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:09:33 GMT)
FrustumFusionNets: A Three-Dimensional Object Detection Network Based on Tractor Road Scene [1.9] 複雑なトラクターの路面に80ラインのライトアンドラング(LiDAR)とカメラを用いた物体検出スイートを構築した。
ハイブリッド核融合型マルチオブジェクト、高精度でリアルタイムな3次元物体検出技術を提供する。
また,他のフラストラムに基づく3次元物体検出法と比較して,道路歩行者物体の検出において有意な優位性を示した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:40:39 GMT)
Predicting Cardiopulmonary Exercise Testing Outcomes in Congenital Heart Disease Through Multi-modal Data Integration and Geometric Learning [1.9] 心肺運動テスト(CPET)は、重要な生理的変数を測定することにより、機能的能力の総合的な評価を提供する。
本研究では,先天性心疾患(CHD)患者におけるCPET変数を代理的死亡エンドポイントとして活用する。
これは、心電図と臨床文字から得られる情報を統合することでCPETの結果を予測する高度な機械学習アプローチの最初の成功例である。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:20:22 GMT)
ROCK: A variational formulation for occupation kernel methods in Reproducing Kernel Hilbert Spaces [1.8] 弱い定式化問題の大規模なクラスに対してRepresenter Theorem結果を示す。
我々は、従来の機械学習と数値手法の両方に、新しい技術と新しい技術の両方に、私たちの定式化の応用例を提示する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 00:43:13 GMT)
Downlink Channel Covariance Matrix Estimation via Representation Learning with Graph Regularization [1.7] 本稿では,UL CCM を DL CCM にマッピング関数でマッピングする環境について考察する。
推定問題の解法として表現学習アルゴリズムを提案する。
提案アルゴリズムは3つの誤差指標でベンチマーク手法を超越する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 21:48:14 GMT)
End-to-End Optimal Detector Design with Mutual Information Surrogates [1.7] 本稿では,局所深層学習(DL)サロゲートを用いた高エネルギー物理検出器の終端ブラックボックス最適化のための新しい手法を提案する。
本研究は, 現場で一般的に使用されている標準再建基準に加えて, 相互情報の情報理論指標について検討する。
筆者らは,(1)局所サロゲートを用いたエンドツーエンドのブラックボックス最適化は,検出器設計の実践的かつ説得力のあるアプローチであり,(2)情報に基づく相互最適化は,最先端物理インフォームド手法と密に一致した設計選択をもたらす。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:23:03 GMT)
Multi-Prototype Embedding Refinement for Semi-Supervised Medical Image Segmentation [1.7] 半教師型医用画像分割のためのマルチプロトタイプベース埋め込み精細化法を提案する。
具体的には, ボクセル埋め込みの構造的関係の観点から, セグメンテーションを再考し, マルチプロトタイプベースの分類戦略を設計する。
2つの一般的なベンチマークの徹底的な評価において,本手法は最先端の手法と比較して優れた性能を発揮する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:23:52 GMT)
Towards properties of adversarial image perturbations [1.6] 我々は,VMAF画像品質測定値の顕著な成長をもたらす対向摂動特性について検討した。
画像の明るさの適度な変動は、VMAFの成長を$sim 60%$で引き起こすことが示されている。
同じ直接VMAF最適化を用いて、ノイズからの画像復元を行う場合、メートル法値と主観的判断との有意な相違が示される。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:28:14 GMT)
Robust Object Detection of Underwater Robot based on Domain Generalization [1.6] 水中環境の多様性と複雑さは、物体検出に新たな課題をもたらす。
様々な水質と変更可能で極端な照明条件は、歪んだ、低いコントラスト、青または緑の画像をもたらす。
本稿では,水中環境がもたらす問題点を考察し,高性能で頑健な水中物体検出装置の設計を目的とする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 22:01:26 GMT)
A Two-step Linear Mixing Model for Unmixing under Hyperspectral Variability [1.6] スペクトルアンミキシングは、ハイパースペクトル画像処理の研究分野において重要な課題である。
線形混合モデルは、その単純さと使いやすさから注目を集めている。
モデルが競争力があり、場合によっては既存の未混合手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:05:10 GMT)
LesionDiffusion: Towards Text-controlled General Lesion Synthesis [1.6] 3次元CT画像のためのテキスト制御可能な病変合成フレームワークLesionDiffusionを提案する。
本モデルでは, 病変の属性を制御し, より広範囲な病変タイプをサポートする。
今回,8臓器に14種類の病変を網羅した1,505個のCTスキャンと2対の病変マスクと構造報告のデータセットを紹介した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:31:57 GMT)
Persistent Homology-induced Graph Ensembles for Time Series Regressions [1.6] データポイントのマルチスケールな構造特性を記述する数学的枠組みを用いて,複数のグラフを構築する。
次に、構築したグラフを入力として使用し、グラフニューラルネットワークのアンサンブルを作成します。
アンサンブルは、注目に基づくルーティング機構を介して、個々の学習者からの信号を集約する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:22:52 GMT)
Fibonacci-Net: A Lightweight CNN model for Automatic Brain Tumor Classification [1.6] 本研究では,MRIデータセットからの脳腫瘍の自動分類のための,非常に軽量なモデル"Fibonacci-Net"と,新しいプール技術を提案する。
実験の結果、提案されたFibonacci-Netを使用した結果、96.2%の精度、97.17%の精度、95.9%のリコール、96.5%のF1スコア、そして最も困難な44クラスのMRIデータセットの99.9%の特異性を達成した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:47:02 GMT)
Retrieval-Augmented Simulacra: Generative Agents for Up-to-date and Knowledge-Adaptive Simulations [1.6] 仮想SNS環境における投稿や返信作成に使用する検索拡張生成機構の効果を評価する。
評価の結果,人間の探索動作を模倣した検索拡張生成機構が,最も自然な交換を生成することを確認した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:17:10 GMT)
Good/Evil Reputation Judgment of Celebrities by LLMs via Retrieval Augmented Generation [1.6] 本稿では,大言語モデル(LLM)が,有名人の善悪評価を判断する上で,何が善悪であるかを理解できるかどうかを検討する。
まず、Webページ上の有名人に関する記事からターゲットの有名人に言及する文章を収集する作業に、大きな言語モデル(すなわちChatGPT)を適用する。
検索拡張生成(RAG)の枠組みを適用して,各有名人の側面や記述の良悪さを判断する作業において,大規模言語モデルが極めて有効であることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:15:55 GMT)
Sparse Autoencoders for Hypothesis Generation [1.5] hypotheSAEsはテキストデータ(例:見出し)とターゲット変数(例:クリック)の関係を仮説化する方法である。
テキスト埋め込みでスパースオートエンコーダを訓練し、データ分布を記述する解釈可能な特徴を生成する。
対象変数を予測する機能を選択し,(3)各特徴の自然言語解釈を生成する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:51:56 GMT)
Modelling Emotions in Face-to-Face Setting: The Interplay of Eye-Tracking, Personality, and Temporal Dynamics [1.5] 本研究では、視線追跡データ、時間的ダイナミクス、性格特性を統合することで、知覚と知覚の両方の感情の検出を大幅に向上させる方法について述べる。
本研究は,将来の情緒コンピューティングと人間エージェントシステムの設計を示唆するものである。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:15:32 GMT)
Better Gaussian Mechanism using Correlated Noise [1.5] 分散を$(sqrtd + 1)/4$にスケールしたガウス変数として分布するランダム変数を追加することで、独立雑音サンプルの分散を$(d + sqrtd)/4$でのみスケールできることを示す。
私たちのメカニズムの中心的な考え方はシンプルで、そのテクニックは柔軟です。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:23:20 GMT)
Empowering WebAssembly with Thin Kernel Interfaces [1.4] 本稿では,プロセス内サンドボックスを壊さずに,OSユーザ空間のsyscallを直接公開するWasmのカーネルインタフェースを提案する。
WASIのような既存のWasm用の機能ベースのAPIは、カーネルインターフェース上のWasmモジュールとして実装できる。
我々は,最新のWasmエンジンを拡張して,LinuxとZephyrという2つのカーネルに対して,この概念を実装した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:58:28 GMT)
Text-Guided Image Invariant Feature Learning for Robust Image Watermarking [1.4] 本稿では,ロバストな画像透かしのための新しいテキスト誘導不変特徴学習フレームワークを提案する。
提案手法を複数のデータセットにまたがって評価し,様々な画像変換に対して優れたロバスト性を示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:32:38 GMT)
Clustering Items through Bandit Feedback: Finding the Right Feature out of Many [1.4] 本稿では,帯域幅フィードバックに基づいて項目集合をクラスタリングする問題について検討する。
そこで我々は,学習者が1つの項目と1つの特徴を選択し,その特徴をうるさく評価する,逐次的かつ適応的な設定について考察する。
逐次Halvingアルゴリズムを利用して,クラスタリングタスクに関連する特徴の探索に依存するアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:42:38 GMT)
SimWorld: A Unified Benchmark for Simulator-Conditioned Scene Generation via World Model [1.4] 本稿では,世界モデルに基づくシミュレーション条件付きシーン生成エンジンを提案する。
実世界のシーンと一致したシミュレーションシステムを構築することで、シミュレーションデータとラベルを世界モデルにおけるデータ生成の条件として、任意のシーンに対して収集することができる。
その結果,これらの画像は下流知覚モデルの性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:41:02 GMT)
Generating Medically-Informed Explanations for Depression Detection using LLMs [1.3] ソーシャルメディアデータからうつ病を早期に検出することは、タイムリーな介入の貴重な機会となる。
本稿では,LLM-MTD(Large Language Model for Multi-Task Depression Detection)を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:23:22 GMT)
Modular Distributed Nonconvex Learning with Error Feedback [1.3] 圧縮通信を用いた新しい分散学習アルゴリズムを設計する。
より詳しくは、モジュラーアプローチ、ADMM、勾配に基づくアプローチを追求する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:16:51 GMT)
Retrospective: A CORDIC Based Configurable Activation Function for NN Applications [1.3] アクティベーション関数 (AF) の設計のための CORDIC ベースの構成は、リソース制約システムのためのASIC ハードウェア設計を高速化するために提案されている。
AIアプリケーションの進化するニーズに合わせて、DA-VINCI AFを導入します。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:38:37 GMT)
3D Gaussian Splatting against Moving Objects for High-Fidelity Street Scene Reconstruction [1.3] 本稿では,ダイナミックストリートシーン再構築のための新しい3次元ガウス点分布法を提案する。
提案手法では,高忠実度な静的シーンを保存しながらオブジェクトの移動を除去する。
実験により, 大規模動的環境における再現性の向上, レンダリング性能の向上, 適応性の向上が示された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:58:07 GMT)
OffLight: An Offline Multi-Agent Reinforcement Learning Framework for Traffic Signal Control [1.3] 我々は、TSCデータセットにおける異種行動ポリシーを処理するために設計された新しいオフラインMARLフレームワークであるOffLightを紹介する。
OffLightは、分散シフトの修正にImportance Smpling(IS)、高品質なエクスペリエンスにフォーカスするためにReturn-Based Prioritized Smpling(RBPS)を組み込んでいる。
OffLightは既存のオフラインRL手法よりも優れており、平均走行時間の7.8%、待ち時間の長さの11.2%にまで短縮されている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:22:42 GMT)
Better Differentially Private Approximate Histograms and Heavy Hitters using the Misra-Gries Sketch [1.2] 我々は、Misra-Griesスケッチを$(varepsilon,delta)$-differential privacyの下でリリースするためのより良いメカニズムを示す。
スケッチのサイズに依存しない大きさのノイズを追加する。
この新たなスケッチにノイズを加えるだけでは十分であり、非ストリーミング設定の2倍にも満たない。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:02:20 GMT)
Scam Detection for Ethereum Smart Contracts: Leveraging Graph Representation Learning for Secure Blockchain [1.2] グラフ表現学習を用いて、購入傾向を観察し、不正取引を見つける。
革新的な機械学習バージョンを使用して、請求データをグラフ構造に変換することで、強力な分類性能を実現することができる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:55:49 GMT)
Engineering Scientific Assistants using Interactive Structured Induction of Programs [1.2] 本稿では,そのような「科学加速器」のソフトウェア工学に焦点をあてる。
本稿では,ソフトウェア技術者とLLMが共同で科学データ解析のための「アシスト」を構築する,インタラクティブな「構造化」帰納型プログラミングの設計を提案する。
iStrucIndは、対話型構造化誘導が科学アシスタントの迅速な構築において有用な役割を担っていることを示唆する、より高速なプログラムの開発を可能にする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:57:16 GMT)
A-SCoRe: Attention-based Scene Coordinate Regression for wide-ranging scenarios [1.2] A-ScoReは、意味のある高セマンティックな2Dディスクリプタを生成するために、ディスクリプタマップレベルの注意を利用するアテンションベースのモデルである。
その結果,本手法はより軽量でフレキシブルでありながら,複数のベンチマークでState-of-the-artメソッドに匹敵する性能を示した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:39:50 GMT)
The Shape of Attraction in UMAP: Exploring the Embedding Forces in Dimensionality Reduction [1.2] 我々は、クラスターの形成と可視化に対する影響を明らかにするために、力を分析する。
我々の分析により、UMAPと類似の埋め込み手法がより解釈可能で、より堅牢で、より正確になる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:48:38 GMT)
Operational Change Detection for Geographical Information: Overview and Challenges [1.2] 気候変動と人的影響による領域の急速な進化は、国家地図庁が管理する地理空間データベースを迅速かつ効果的に更新する必要がある。
本稿では,大規模地理データベースの運用更新に適した変更検出手法について概観する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:25:28 GMT)
Digital-analog quantum computing of fermion-boson models in superconducting circuits [1.2] 本稿では,強い相関を持つフェルミオン-ボソン相互作用をシミュレートするディジタル・アナログ量子アルゴリズムを提案する。
DAQCアルゴリズムの回路深さの低減, デジタルステップとアナログブロックのシーケンス, 純粋にディジタルアプローチよりも優れることを示す。
我々の提案は、化学、材料、高エネルギー物理学のための複雑なシステムを計算するための扉を開く。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:33:14 GMT)
Parameterized bipartite entanglement measures and entanglement constraints [1.1] 我々は,$G_omega$-concurrence(G_omega$C)と命名された新しいパラメータ付き絡み合い尺度のクラスを証明した。
また、G_omega$-concurrence of aid(G_omega$CoA)という観点から、マルチキュービット量子絡み合いの新しいポリガミー関係を証明した。
S$G_omega$C のモノガミー性に基づいて、対応する多部交絡インジケータを構築することができ、これは、$N$-tangle が消えても、全ての真の多部交絡状態を検出することができる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:32:21 GMT)
On the Precise Asymptotics of Universal Inference [1.1] この写本は普遍的推論を用いた妥当性と保守性のギャップを研究する(Wasserman et al., 2020)
我々は,保守性の源を同定し,学生化と偏見補正に基づく一般的な治療法を提案する。
結果として得られた手法は、モデルミス特定の下でも、名目上の1-alpha$レベルで正確なカバレッジを得る。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:41:00 GMT)
EEG-CLIP : Learning EEG representations from natural language descriptions [1.0] 脳波復号のためのディープネットワークは、しばしば病理学やジェンダー復号のような特定のタスクのみを解決するために訓練される。
臨床脳波記録の医療報告を利用したより一般的なアプローチは、医療報告と脳波記録のマッピングを学ぶことである。
我々は,脳波時系列とそれに対応する臨床テキスト記述を共有埋め込み空間で整列する,対照的な学習フレームワークであるEEG-CLIPを開発した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:12:15 GMT)
From "Hallucination" to "Suture": Insights from Language Philosophy to Enhance Large Language Models [1.0] 本稿では,大規模言語モデル(LLM)における幻覚現象について,言語哲学と精神分析のレンズを用いて検討する。
ラカンの「記号の鎖」と「補足点」の概念を取り入れることで、幻覚を緩和するための新しいアプローチとしてアンカー・RAGフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:27:01 GMT)
ConQuer: A Framework for Concept-Based Quiz Generation [1.0] ConQuerは概念ベースのクイズ生成フレームワークで、外部の知識ソースを活用する。
我々は, LLMを審査員として, 生成したクイズの品質を評価するために, 包括的評価次元を用いた。
実験の結果, 評価スコアは4.8%改善し, 対比較では77.52%の勝利率を示した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:10:26 GMT)
High-Resolution Flood Probability Mapping Using Generative Machine Learning with Large-Scale Synthetic Precipitation and Inundation Data [1.0] 高解像度の洪水確率マップは、洪水のリスクを評価するのに役立っているが、しばしば過去のデータによって制限される。
本研究では、生成機械学習を利用して大規模な合成浸水データを生成する新しい手法である沈殿水深生成パイプラインを紹介する。
1万の合成イベントを生成した後、様々な浸水深度に対して洪水確率マップが作成される。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:58:53 GMT)
Powerful batch conformal prediction for classification [0.9] ラベル付けされていない例のラベルに推論するために、$n$ラベル付き例の校正サンプルが観察される。
共形$p$-値の組み合わせで有効な推論を行うための一般的なレシピを提供する。
また、バッチスコアを集約し、さらに強力な方法も導入しています。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:38:37 GMT)
Whole-Body Image-to-Image Translation for a Virtual Scanner in a Healthcare Digital Twin [0.9] 本研究では,全身CT画像を4つの領域(頭,幹,腕,脚)に分割し,地域固有のGAN(Generative Adversarial Networks)を用いてCT-PET翻訳を行うフレームワークを提案する。
この方法論は、CTデータから正確な仮想PETスキャンを可能にし、健康結果を監視し、予測し、最適化するための仮想イメージング表現を作成することで、ヘルスケアのDigital Twinsをサポートする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:19:28 GMT)
Dynamics in the presence of local symmetry-breaking impurities [0.9] 連続対称性は、量子多体系における相関関数の普遍的な緩やかな緩和をもたらす。
局所対称性を破る不純物がこれらの相関関数の力学にブラウン量子回路を用いてどのように影響するかを考察する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:05:43 GMT)
High-Precision Multi-Qubit Clifford+T Synthesis by Unitary Diagonalization [0.8] クリフォード+Tゲートセットで表される量子回路の資源効率と高精度な近似合成は、フォールトトレラント量子コンピューティングにとって不可欠である。
探索に基づく手法を利用して、まずはユニタリを概略対角化し、解析的に逆解析する。
提案手法は,実量子アルゴリズムからユニタリを評価した場合に,一桁のオーダーで合成アルゴリズムの実装精度と実行時間を向上する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:35:25 GMT)
SoccerSynth Field: enhancing field detection with synthetic data from virtual soccer simulator [0.8] サッカー場検出のための合成データセット(Soccer Synth-Field)の有効性を提案する。
合成サッカー場データセットはモデルを事前訓練するために作成され、これらのモデルの性能は実世界のデータセットで訓練されたモデルと比較された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:05:24 GMT)
Low-overhead non-Clifford fault-tolerant circuits for all non-chiral abelian topological phases [0.8] 本稿では,2次元平面格子上の幾何的局所回路群を提案する。
これらの回路は、離散的な不動点経路積分における1-形式対称性の測定から構成される。
位相回路の一般クラスに対して任意の局所雑音(非パウリ雑音を含む)の下での耐故障性を証明する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:56:16 GMT)
Enhanced High-Dimensional Data Visualization through Adaptive Multi-Scale Manifold Embedding [0.8] 本稿では,適応型マルチスケールマニフォールド埋め込み (AMSME) アルゴリズムを提案する。
順序距離を導入することで、高次元空間における次元性の呪いの制約を克服できることが示される。
実験により,AMSMEはクラスタ内トポロジ構造を著しく保存し,クラスタ間分離を改善した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:46:53 GMT)
COLSON: Controllable Learning-Based Social Navigation via Diffusion-Based Reinforcement Learning [0.7] 歩行者交通を伴う動的環境における移動ロボットナビゲーションは、自律型モバイルサービスロボットの開発において重要な課題である。
深い強化学習に基づく手法は、最適化能力によって従来のルールベースのアプローチよりも優れています。
本研究では,拡散に基づく強化学習手法をソーシャルナビゲーションに適用し,その有効性を検証した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:02:30 GMT)
Language Independent Named Entity Recognition via Orthogonal Transformation of Word Vectors [0.7] 単語埋め込みを用いた双方向LSTM/CRFを用いて、任意の言語に対して名前付きエンティティ認識を行うモデルを提案する。
これは、ソース言語(英語)のモデルをトレーニングし、ターゲット言語からソース言語の単語埋め込みに変換することで実現される。
モデルは、英語データセット上でモデルをトレーニングすることにより、アラビア語のデータセット上でモデルをトレーニングしたり微調整したりすることなく、アラビア語データセット内の名前付きエンティティを検出することができることを示している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 21:57:58 GMT)
Open Energy Services -- Forecasting and Optimization as a Service for Energy Management Applications at Scale [0.6] 本稿では,エネルギ・マネジメント・システム(EMS)の広範な適用を促進することを目的とする。
我々は、経済的な生存性は大規模なEMSの利用にとって深刻な問題であると主張している。
我々は、完全に機能するサービスの派生を可能にするemphEnergy Service Genericsソフトウェアフレームワークを提示する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:40:34 GMT)
TAMER: A Test-Time Adaptive MoE-Driven Framework for EHR Representation Learning [0.6] TAMERはElectronic Health Record (EHR)表現学習のためのテストタイム適応型MoE駆動フレームワークである。
MoEアーキテクチャは、TTA(Test-Time Adaptation)と共同で設計されており、患者の不均一性と分散シフトの相反する課題を軽減している。
TTAは、新しい患者サンプルが導入されたときに、リアルタイムに健康状態への適応を可能にする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:21:08 GMT)
FQsun: A Configurable Wave Function-Based Quantum Emulator for Power-Efficient Quantum Simulations [0.5] 量子エミュレータのFQsunを提案する。
数字の精度が異なる5つのFQsunバージョンがXilinx ZCU102に実装され、最大出力は2.41Wである。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:43:19 GMT)
Quantum Simulation of Lindbladian Dynamics via Repeated Interactions [0.5] 我々は、繰り返し相互作用(RI) CPTPマップに基づくリンドブラディアン力学と進化の近似対応を利用する。
弱結合極限における誤差$epsilon$スケールにおいて、Liouvillian $etmathcalL$をシミュレートするために必要な相互作用の数を示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:57:42 GMT)
Potential and limitations of random Fourier features for dequantizing quantum machine learning [0.5] 量子機械学習は、おそらく、短期量子デバイスの最もよく研究された応用の1つである。
パラメータ化量子回路(PQC)を学習モデルとして使用する変分量子機械学習の概念に多くの焦点が当てられている。
そこで本研究では,RFFがレグレッションのための変分量子機械学習の効率的な復号化を実現する上で必要かつ十分な条件を確立する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:11:57 GMT)
Automating Experimental Optics with Sample Efficient Machine Learning Methods [0.5] 我々は、最小限の監督力を持つ自由空間光共振器の自律的なモードマッチングを実現するために機械学習をどのように利用できるかを示す。
本研究では,最小限の監督力を持つ自由空間光共振器の自律的モードマッチングを実現するために,機械学習をどのように利用できるかを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:50:44 GMT)
Blockchain with proof of quantum work [0.5] 我々は、マイニングが量子コンピュータを必要とするブロックチェーンアーキテクチャを提案する。
量子力学の確率論的性質を取り入れるために、ブロックチェーンフレームワークを洗練しました。
この研究は、既存の技術を用いた他の短期量子コンピューティングアプリケーションの可能性を強調している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:37:22 GMT)
Simulating Raman Scattering Impairments with Depolarization Noise in Quantum-Classical Links [0.5] 偏光符号化された量子通信チャネルにおける自発ラマン散乱ノイズをモデル化する。
提案手法は, 量子ビット伝送, 絡み合い分布, テレポーテーションの実証に対して有効である。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:25:25 GMT)
DashCLIP: Leveraging multimodal models for generating semantic embeddings for DoorDash [0.4] 画像テキストデータに対するコントラスト学習を通じて,ユニモーダルエンコーダとマルチモーダルエンコーダを整列させることにより,製品およびユーザクエリのための共同トレーニングフレームワークを導入する。
提案手法では,クエリエンコーダをLLM計算した関連データセットでトレーニングし,エンゲージメント履歴への依存を解消する。
パーソナライズされた広告レコメンデーションでは、デプロイ後のクリックスルー率と変換レートが大きく上昇し、主要なビジネス指標への影響を確認します。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:38:31 GMT)
Quantification of Uncertainties in Probabilistic Deep Neural Network by Implementing Boosting of Variational Inference [0.4] Boosted Bayesian Neural Networks (BBNN)は、ニューラルネットワークの重み分布近似を強化する新しいアプローチである。
BBNNは従来のニューラルネットワークに比べて5%高い精度を実現している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:11:21 GMT)
Learning local neighborhoods of non-Gaussian graphical models: A measure transport approach [0.4] 局所マルコフ特性を利用して各変数の条件付き独立関係を推定するスケーラブルなアルゴリズムを提案する。
提案手法は,非ガウス分布 (L-Sing) の局所空間同定 (Localized Sparsity Identification) と名付けられ,フレキシブルなトランスポートマップのクラスを用いてグラフを推定する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:53:22 GMT)
Large Language Models for Virtual Human Gesture Selection [0.4] 共同音声ジェスチャーは様々な意味を伝達し、対面する人間の相互作用において重要な役割を果たす。
本研究では,大規模言語モデルのセマンティック機能を用いて,意味のある適切な音声合成手法を提案するジェスチャー選択手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:49:56 GMT)
CARE: A QLoRA-Fine Tuned Multi-Domain Chatbot With Fast Learning On Minimal Hardware [0.3] CARE (Customer Assistance and Response Engine) は、非常に最小限のハードウェアとデータ上でPhi3.5-miniを微調整した軽量モデルである。
主に通信サポート、医療サポート、銀行サポートの3つの領域にわたるクエリを処理するように設計されている。
CAREは様々な医学ベンチマークで比較的よく機能し、基本的な医学的提案に使用できることを示している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:58:10 GMT)
Scalable low loss cryogenic packaging of quantum memories in CMOS-foundry processed photonic chips [0.3] フォトニック集積回路(PIC)は、分散量子情報処理とネットワークにとって重要な技術である。
サーマルグレーティング・カプラと温度サイクルに頑健なアングルポリファイバアレイを用いたPICのパッケージング法を実証した。
光・電気的にパッケージ化された量子メモリモジュールは、必要な量子ビット制御をすべてチップに統合し、ミリケルビン温度で動作し、ファイバから量子メモリまで3dBの損失が得られることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:08:28 GMT)
Quantum simulation of superdiffusion breakdown in Heisenberg chains via 2D interactions [0.2] 積分可能な1次元ハイゼンベルク模型のスピン輸送における超拡散スケーリングは、非平衡量子多体物理学における重要な発見の1つである。
現在の量子ハードウェアは、1Dハイゼンベルクモデルの超拡散をシミュレートすることで、そのような非平衡現象の研究においてその有用性を既に確認している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:02:33 GMT)
The Hidden Bloat in Machine Learning Systems [0.2] ソフトウェア肥大(Software bloat)とは、実行時にソフトウェアが使わないコードや機能を指す。
機械学習(ML)システムにとって、肥大は技術的負債に対する大きな貢献者であり、パフォーマンスとリソースの浪費を減少させる。
我々は,共有ライブラリを解析することにより,MLフレームワークの肥大を識別・除去する新しいツールであるNegativa-MLを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:04:25 GMT)
Wiki-Quantities and Wiki-Measurements: Datasets of Quantities and their Measurement Context from Wikipedia [0.2] ウィキペディアとウィキデータに基づく2つの大きなデータセットを提示する。
Wiki-Quantitiesは、英語のウィキペディアで120万以上の注釈付き量のデータセットである。
Wiki-Measurementsは、ウィキペディアで38,738の注釈付き量のデータセットである。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:09:10 GMT)
Designing and Deploying AI Models for Sustainable Logistics Optimization: A Case Study on Eco-Efficient Supply Chains in the USA [0.1] 本研究では,米国における物流業務を最適化するためのAI手法について検討する。
主要なAIアプリケーションには、需要予測のための予測分析、機械学習による経路最適化、AI駆動の燃料効率戦略などがある。
現実のロジスティクスデータセットには、線形回帰、XGBoost、サポートベクトルマシン、ニューラルネットワークなど、さまざまなモデルが適用される。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 00:46:35 GMT)
Active Leakage Cancellation in Single Qubit Gates [0.1] 我々は、アクティブリークキャンセルを導入することにより、最先端のシングルキュービットゲートを強化する。
本手法を超伝導トランスモン量子ビットに適用し,10~5ドル以下でのリークを抑制する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 21:00:57 GMT)
Faster Algorithmic Quantum and Classical Simulations by Corrected Product Formulas [0.1] 積公式を用いたハミルトンシミュレーションは、量子コンピュータ上でのシミュレーションにおいて最も単純かつ実践的なアプローチである。
補正製品公式 (CPFs) は, 標準製品公式に補語と呼ばれる補助語を注入することによって得られる製品公式の変種である。
CPFは、限られた計算資源を持つ初期のフォールトトレラント量子コンピュータにとって、貴重なアルゴリズムツールである可能性がある。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:09:03 GMT)
Hierarchical Mutual Distillation for Multi-View Fusion: Learning from All Possible View Combinations [0.1] 本稿では,新しいMV-UWMD法を提案する。
MV-UWMDは既存のマルチビュー学習手法と比較して予測精度と一貫性を向上させる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:17:16 GMT)
Synthetic Clarification and Correction Dialogues about Data-Centric Tasks -- A Teacher-Student Approach [0.1] 我々は、ユーザとAIアシスタント間の制御されたマルチターン会話を合成的に生成する新しいフレームワークを開発する。
各会話は、共同作業を通じてテーブルベースの推論問題を解決することを目的としている。
我々は,合成会話の正確性を検証するために,強力な教師LLMを採用している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:37:25 GMT)
Deep Unsupervised Segmentation of Log Point Clouds [0.0] 製材所では、木製丸太などの原料を正確に測定し、製材工程を最適化することが不可欠である。
以前の研究では、レーザースキャナーによって生成された表面点雲だけでログの内部構造を正確に予測できることが示されている。
本稿では,非教師付きでログ表面に属する点を見つけることを学ぶポイントトランスフォーマーに基づくポイントクラウドセグメンテーション手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:28:10 GMT)
Towards synthetic generation of realistic wooden logs [0.0] 木製丸太のリアルな3次元表現を合成的に生成する手法を提案する。
効率的な製材はログの正確な測定と内部の結び目の分布に依存している。
提案した数学的ログモデルがCTスキャンから得られた実データに精度良く適合し,現実的なログの生成を可能にすることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:16:21 GMT)
Zero energy modes with Gaussian, exponential, or polynomial decay: Exact solutions in hermitian and nonhermitian regimes [0.0] 我々は、トポロジカル絶縁体や超伝導体のトポロジカルモードと非トポロジカルモードを分類し、理解する。
これらの知見は、トポロジカル絶縁体や超伝導体のトポロジカルモードと非トポロジカルモードの分類と理解を可能にする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:36:13 GMT)
Workflow for Safe-AI [0.0] 機能的安全性が重要な関心事であるアプリケーションにおいて、安全で信頼性の高いAIモデルの開発とデプロイが不可欠である。
この作業では、信頼性と質的可能性の両方を強調した、透明で、完全で、柔軟で、軽量なワークフローを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:45:18 GMT)
WebNav: An Intelligent Agent for Voice-Controlled Web Navigation [0.0] WebNavは、ReActにインスパイアされたアーキテクチャと生成AIを活用して、このフレームワークを提供する音声制御Webナビゲーションエージェントである。
予備評価では、WebNavは、視覚障害者に対する応答時間とタスク完了精度において、従来のスクリーンリーダーよりも優れていた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:33:27 GMT)
Wavefunction optimization at the complete basis set limit with Multiwavelets and DMRG [0.0] マルチウェーブレットに基づくマルチレゾリューション解析(MRA)におけるDMRGの統合アルゴリズムを開発した。
我々は、MRA領域に代表される軌道に対する既存のラグランジアン最適化アルゴリズムを採用し、その計算効率を向上させる。
本手法をH2,He,HeH2,BeH2,N2などの小系に適用する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:54:52 GMT)
Wasserstein-based Kernels for Clustering: Application to Power Distribution Graphs [0.0] この研究は、カーネルメソッドとワッサーシュタイン距離メトリクスを探索し、計算的に抽出可能なクラスタリングフレームワークを開発する。
このフレームワークは、グラフ解析や画像処理など、さまざまな領域に適用できるほど柔軟である。
879と34,920の分散グラフの2つのデータセットを含むケーススタディは、フレームワークの有効性と効率を実証している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:40:55 GMT)
ViewDelta: Text-Prompted Change Detection in Unaligned Images [0.0] 本稿では,テキストのプロンプトと,潜在的に一致しない2つの画像を用いた新しい変化検出タスクを提案する。
このテキスト条件付きフレームワークは、変更検出の範囲を大幅に広げる。
最初のテキストプロンプト条件の変更検出データセットをリリースする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:47:36 GMT)
ViVa-SAFELAND: a New Freeware for Safe Validation of Vision-based Navigation in Aerial Vehicles [0.0] ViVa-SAFELANDは、航空車両の視覚ベースのナビゲーション戦略のテストと評価を目的とした、オープンソースのソフトウェアライブラリである。
ViVa-SAFELANDは、異なるビジュアルナビゲーションソリューションを評価し比較するための、新しい、安全で、シンプルで、公正な比較ベースラインを提供する。
深層学習を用いた自律パイロットの訓練に有用である。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:48:50 GMT)
Vexed by VEX tools: Consistency evaluation of container vulnerability scanners [0.0] 本稿では,コンテナに適用された最先端の脆弱性スキャンツールについて検討する。
Vulnerability Exploitability eXchange (VEX) フォーマットに従うツールの開発に注力しています。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:22:43 GMT)
Validating Emergency Department Admission Predictions Based on Local Data Through MIMIC-IV [0.0] 本研究は,ギリシャの病院において,MIMIC-IVデータセットを総合的に活用して,小規模の局所的データセットを用いて開発された入院予測モデルを検証した。
MIMIC-IVデータを前処理した後,線形判別分析 (LDA), K-Nearest Neighbors (KNN), Random Forest (RF), Recursive Partitioning and Regression Trees (RPART), Support Vector Machines (SVM) の5つのアルゴリズムが評価された。
RFは、受信器動作特性曲線(AUC)が0.9999、感度が0.9997、MIMICが0.9999と、優れた性能を示した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:54:28 GMT)
Uncertainty Quantification in Machine Learning Based Segmentation: A Post-Hoc Approach for Left Ventricle Volume Estimation in MRI [0.0] 左室容積推定は各種心血管疾患の診断・管理に重要である。
近年の機械学習、特にU-Netのような畳み込みネットワークは、医療画像の自動セグメンテーションを促進している。
本研究では,LV容積予測におけるポストホック不確実性推定のための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:50:51 GMT)
Tracking time-varying signals with quantum-enhanced atomic magnetometers [0.0] 我々は、arXiv:2403.14764(2024)で導入された推定制御技術をスピン沈降磁力計の実験的な設定に適用する。
変動するフィールドのリアルタイム追跡は、測定によるスピンスクイーズによる利点を実証する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 23:56:43 GMT)
Towards Location-Specific Precipitation Projections Using Deep Neural Networks [0.0] 本研究では,局別降水近似において,深部ニューラルネットワーク(DNN)を利用してKrigingのような従来の手法を超越したパラダイムシフトを提案する。
本稿では,降水量,標高,位置を利用したNNアーキテクチャと,湿度,温度,風速などの気象パラメータを付加したNNアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:12:17 GMT)
Thermalization is typical in large classical and quantum harmonic systems [0.0] 物理的に関係するランダムな二次ハミルトニアンにおける粒子エネルギーのような様々な観測対象の熱化は、大規模システムで典型的であることを証明した。
また,通常のモードのごく一部しか励起されない非典型的初期条件でも熱化が生じることを示した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:18:31 GMT)
The Exoplanet Citizen Science Pipeline: Human Factors and Machine Learning [0.0] 市民科学者による太陽系外惑星観測のプロセスの合理化と簡素化に向けた作業の進捗について述べる。
ExoClockやExoplanet Watchのような国際的な協力により、市民科学者は小さな望遠鏡を使ってトランジット観測を行うことができる。
私たちのプロジェクトは、これらのコミュニティと密接に連携して、観察パイプラインを合理化し、より広範な参加を可能にします。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:54:00 GMT)
Testing classical properties from quantum data [0.0] 関数状態 $|frangle propto sum_x|x,f(x)rangle$ のコピーの形で、量子データからのみ$f$の特性をテストする量子アルゴリズムを導入する。
モノトニック性、対称性、三角形自由性の3つの確立された特性について、古典的テスタをサンプルデータに制限した場合のスピードアップは、量子データからのみ動作する量子アルゴリズムによって回復可能であることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:07:07 GMT)
Temporal Context Awareness: A Defense Framework Against Multi-turn Manipulation Attacks on Large Language Models [0.0] 大規模言語モデル(LLM)は、高度なマルチターン操作攻撃に対してますます脆弱である。
本稿では,この課題に対処するための新しい防御機構であるテンポラルコンテキスト認識フレームワークを紹介する。
シミュレーションされた敵シナリオに関する予備的な評価は、微妙な操作パターンを識別するフレームワークの可能性を示している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 22:30:17 GMT)
Technical Report: Aggregation on Learnable Manifolds for Asynchronous Federated Optimization [0.0] AsyncManifoldはFederated In Learning(FL)のための新しいフレームワーク
AsyncManifoldは、各ローカルトレーニング、遅延補正、集約ステージにおける基礎となるソリューション空間幾何を利用する。
本提案では,局所行動の総合的な探索研究を動機とした総合的な収束証明を添付した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:36:59 GMT)
Teaching Artificial Intelligence to Perform Rapid, Resolution-Invariant Grain Growth Modeling via Fourier Neural Operator [0.0] ミクロ構造進化は材料の物理的、光学的、電子的性質を形成する上で重要な役割を果たしている。
伝統的な位相場モデリングはこれらの現象を正確にシミュレートするが、計算集約的である。
本研究では、フーリエニューラル演算子(FNO)を用いて、分解能不変モデリングを実現する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:19:08 GMT)
Targeted Neural Architectures in Multi-Objective Frameworks for Complete Glioma Characterization from Multimodal MRI [0.0] 脳腫瘍は認知障害、運動機能障害、感覚障害などの神経学的障害を引き起こす。
深層学習(DL)と人工知能(AI)は、MRI(MRI)スキャンを用いて早期診断の医師を支援するためにますます利用されている。
本研究は、これらのグリオーマのグレードの局在化、セグメント化、分類が可能な多目的フレームワーク内のターゲット型ニューラルネットワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:56:39 GMT)
TEPID-ADAPT: Adaptive variational method for simultaneous preparation of low-temperature Gibbs and low-lying eigenstates [0.0] 低温下での熱ギブズ状態を作成する新しい方法を提案する。
TEPID-ADAPTは部分的に適応しており、最小数のアクビットを使用する。
我々は、さらなる最適化なしに、同じハミルトニアンの任意の低い温度で熱状態を作ることができる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:57:25 GMT)
Synthetic Data Generation Using Large Language Models: Advances in Text and Code [0.0] 大規模言語モデル(LLM)は、自然言語とコードの両方で合成トレーニングデータを生成する新たな可能性を開いた。
これらの手法が,分類や質問応答などの低リソースなタスクをどのように強化するかを示す。
生成したテキストの事実的不正確さ、スタイリスティックなリアリズムの欠如、バイアス増幅のリスクといった課題に対処する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:34:03 GMT)
Sustainable Greenhouse Microclimate Modeling: A Comparative Analysis of Recurrent and Graph Neural Networks [0.0] 本研究では,時空間グラフニューラルネットワーク(STGNN)の温室マイクロ気候モデリングへの応用について紹介する。
ギリシャのヴォロスの温室から15分間隔で収集した高周波データを用いて,RNNが冬季の条件下で異常な精度を達成できることを実証した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:20:37 GMT)
Structured Knowledge Accumulation: An Autonomous Framework for Layer-Wise Entropy Reduction in Neural Learning [0.0] 本稿では,ニューラルネットワークにおける知識アライメントの動的層単位としてエントロピーを再解釈する構造化知識蓄積(Structured Knowledge Accumulation, SKA)フレームワークを紹介する。
SKAは知識ベクトルの観点でエントロピーを定義し、複数の層にわたる決定確率に影響を与える。
このアプローチは、勾配に基づく学習、ブリッジング情報理論、人工知能に対するスケーラブルで生物学的に妥当な代替手段を提供する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:14:20 GMT)
Strong coupling non-Markovian quantum thermodynamics of a finite-bath system [0.0] 焦点は強結合非マルコフ量子系の量子熱力学を理解することである。
スピン浴に囲まれた中心スピンの非自明で非マルコフ的モデルを取り上げる。
チャージャーとして働くスピン浴に関する興味深い観察は、中心スピンが量子電池として想定されるシナリオで行われる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:02:57 GMT)
Stochastic Gradient Sampling for Enhancing Neural Networks Training [0.0] 我々はAdamアルゴリズムの新たな拡張であるStochGradAdamを紹介し、勾配サンプリング手法を取り入れた。
StochGradAdamは、イテレーション毎の勾配更新が少ない場合でも、Adamに匹敵する、あるいは優れたパフォーマンスを実現している。
その結果,このアプローチは大規模モデルやデータセットに特に有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:05:56 GMT)
State preparation with parallel-sequential circuits [0.0] ブロックウォールとシーケンシャル回路の間を補間する量子回路レイアウトのファミリである並列シーケンス回路(PS)を導入する。
我々はPS回路が1次元の多体基底状態を効率的に作成できるという数値的な証拠を提供する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:44:35 GMT)
Spatio-Temporal Graph Neural Networks for Infant Language Acquisition Prediction [0.0] 幼児・幼児向け言語習得モデルの構築と、時空間グラフ畳み込みネットワーク(STGCN)での活用
本稿では,子語彙獲得の予測に新たなアプローチを導入し,言語習得の過程で発生する言語関係の異なるタイプに対して,そのようなモデルの有効性を評価する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:21:27 GMT)
Solving Dicke superradiance analytically: A compendium of methods [0.0] 我々はDicke超放射能問題に対するいくつかの解析的アプローチを提案する。
この問題に対処する複数の手法を探索し、任意の時間とスピン数で有効な解を得る。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:23:08 GMT)
Signal amplification in a solid-state quantum sensor via asymmetric time-reversal of many-body dynamics [0.0] 固体室温量子センサにおける多体信号増幅の実験実験について報告する。
厳密には、後方の進化時間が前方の進化時間の2倍のときに最適な増幅が起こることを観察する。
これらの観察は、顕微鏡力学の時間反転ミラー対称性に由来すると理解することができる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:01:25 GMT)
Sheaf-Theoretic Causal Emergence for Resilience Analysis in Distributed Systems [0.0] 分散システムは、しばしばレジリエンスに影響を及ぼす創発的な振る舞いを示す。
本稿では,システムレジリエンスを評価するために,グラフモデル,フロー・オン・グラフシミュレーション,因果発生解析を組み合わせた理論的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:19:33 GMT)
Selecting time-series hyperparameters with the artificial jackknife [0.0] 私はそれをArtificial delete-d$ jackknifeと呼び、このアプローチが古典的な削除ステップを架空の削除に置き換えていることを強調します。
この手順はデータの順序をそのままに保ち、時系列とのプレーンな互換性を可能にする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 01:44:27 GMT)
Second language Korean Universal Dependency treebank v1.2: Focus on data augmentation and annotation scheme refinement [0.0] 第2言語(L2)韓国万国依存(UD)ツリーバンクを5,454文手書きで拡張する。
韓国語の3つのモデルを微調整し、ドメイン内およびドメイン外L2-韓国のデータセット上での性能を評価する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:42:42 GMT)
Scalable parallel measurement of individual nitrogen-vacancy centers [0.0] ダイヤモンド中の窒素空孔(NV)中心は固体スピン欠陥であり、量子センシングや量子情報処理に広く採用されている。
複数の光学的に解決されたNV中心を並列に扱う実験プラットフォームを提案する。
本研究では,108NV中心のスピン状態間のショット・ツー・ショット相関を高信号・ノイズ比で検出できることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:58:55 GMT)
Scalable and fault-tolerant preparation of encoded k-uniform states [0.0] エンコードされた$k$-uniform状態を作成するためのスケーラブルでフォールトトレラントな手法を提案する。
このハイブリッドアプローチは、資源状態の準備のための完全な物理実装よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:59:59 GMT)
Scalability Challenges in Variational Quantum Optimization under Stochastic Noise [0.0] 変分量子アルゴリズム(VQA)は有望な候補として注目されている。
ランダムQUBO問題インスタンスに対する量子損失関数の最小化について検討する。
我々の結果は、VQAを用いた最適化において、実用的な量子優位性を実現する可能性について、深刻な疑念を提起する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:00:19 GMT)
SEEK: Self-adaptive Explainable Kernel For Nonstationary Gaussian Processes [0.0] 本稿では,ガウス過程を通じて複雑な非定常関数をモデル化するための学習可能なカーネルのクラスであるSEEKを紹介する。
人工ニューロンにインスパイアされたSEEKは、対称性と正の半定性を保証するための第一原理から導かれる。
包括的感度分析と比較研究を行い、我々のアプローチが設計選択の多くに対して堅牢ではないことを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 23:30:02 GMT)
Revisit on quantum parameter estimation approach for Mach-Zehnder interferometry [0.0] 我々は、一般的な2腕のマッハ・ツェンダー干渉計における相対位相シフトを推定するための異なるモデルを分析する。
我々は、量子フィッシャー情報を用いて、変位した真空状態からなる入力状態を用いてマッハ・ツェンダー干渉計を解析する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:45:42 GMT)
Revealing higher-order neural representations with generative artificial intelligence [0.0] 本稿では,新しい強化学習(RL)に基づく生成人工知能(genAI)アプローチを提案し,不確実性分布のニューラル表現を探索する。
既存の機能的磁気共鳴画像データを用いて、RLアルゴリズムを用いて拡散ジェネシスモデルを学習し、人間の学習と同様のノイズ分布を学習する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:08:19 GMT)
Retrieval Augmented Generation for Topic Modeling in Organizational Research: An Introduction with Empirical Demonstration [0.0] 本稿では,LLMを用いたトピックモデリング手法として,エージェント検索拡張生成(Agentic RAG)を提案する。
1) LLM の事前訓練された知識を超えた外部データへの自動アクセスを可能にする検索,(2) LLM の機能を利用してテキスト合成を行う生成,(3) エージェント駆動学習, 反復的に検索とクエリの定式化を行う。
本研究は,本手法がより効率的で解釈可能であり,同時に,従来の機械学習手法と比較して信頼性と妥当性が向上することを示した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:00:26 GMT)
Reducing False Ventricular Tachycardia Alarms in ICU Settings: A Machine Learning Approach [0.0] 心室頻拍(VT)アラームは、その複雑な性質から正確に検出することは困難である。
本稿では,VTaCデータセットを用いた誤VTアラームを低減するための機械学習手法を提案する。
我々は、波形データから時間領域と周波数領域の特徴を抽出し、データを前処理し、真と偽のVTアラームを分類するためにディープラーニングモデルを訓練する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:18:38 GMT)
Reconstructing Cell Lineage Trees from Phenotypic Features with Metric Learning [0.0] 発達過程を研究するための重要なアプローチは、細胞系統分類と分化史のツリーグラフを推測することである。
本稿では,木グラフ推論に最適化された幾何学特性を持つ埋め込み空間を学習する新しいディープラーニング手法であるCellTreeQMを紹介する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:41:03 GMT)
Quantum thermal machines in BTZ black hole spacetime [0.0] 作業媒質としてUruh-DeWitt検出器を用いたオットー熱力学サイクルについて検討した。
熱機械が作動する熱・冷水貯留層をモデル化するために,フィールドの熱特性を利用する。
本研究では,相対論的量子熱機械の有限時間動作を理解するための一般的な枠組みを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:00:11 GMT)
Quantum switches for single-photon routing and entanglement generation in waveguide-based networks [0.0] 量子ノードの相互接続は 量子コンピューティングユニットのスケールアップを 約束します
系力学をコヒーレントに条件付ける量子スイッチとして、追加の量子ビット自由度を活用することを提案する。
ネットワークを横断する単一光子ルーティングにより絡み合った状態を生成するための決定論的プロトコルを提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:17:33 GMT)
Quantum correlations in a cluster spin model with three-spin interactions [0.0] 3スピン相互作用結合J_x(XZXスピン成分)とJ_y(YZYスピン成分)のクラスタースピンモデルについて検討した。
ダイナミクスは J_y=J_x のスピン保存であり、|h/J_x| 2 の臨界点の直線を示し、|h/J_x|>2 の非相関直積基底状態を示す。
次世代臨界点近傍に特異な特徴を示す次の量子相関法を解析的に検討した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:32:00 GMT)
Quantum contextuality of spin-1 massive particles [0.0] 文脈性は量子力学の基本的な性質である。
我々は,コライダー実験で生成したスピン-1大粒子の偏光が,実際に文脈性を示すことを示した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:00:01 GMT)
Quantum Pulse Gate Attack on IM/DD Optical Key Distribution Exploiting Symbol Shape Distortion [0.0] Intensity modulation/direct detection (IM/DD) optical key distribution (OKD) は秘密鍵を生成する方法である。
ここでは, 強度依存性のシンボル形状歪みがIM/DDOKDセキュリティに及ぼす影響について検討した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:19:35 GMT)
Quantifying Trapped Magnetic Vortex Losses in Niobium Resonators at mK Temperatures [0.0] ニオブ中のトラップされた磁気渦は超伝導デバイスにマイクロ波損失をもたらすことがある。
ミリケルビン温度まで低下するニオブ系量子デバイスにおいて,磁気渦による損失を初めて定量化する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:12:36 GMT)
QSTToolkit: A Python Library for Deep Learning Powered Quantum State Tomography [0.0] QSTToolkitは、光学量子状態測定データ上で量子状態トモグラフィ(QST)を実行するPythonライブラリである。
本稿では,データ生成機能や各種QSTメソッドの実装など,ライブラリの機能について述べる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:55:45 GMT)
Protected phase gate for the $0$-$π$ qubit using its internal modes [0.0] 0$-pi$ qubit に対して保護位相ゲートを提案する。
ゲートは、調整可能なジョセフソン素子を介してクビット−アンシラ結合を変化させることによって達成される。
この方式は、0$-$pi$ qubitの保護体制と互換性がある。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:35:38 GMT)
Probing non-equilibrium steady states of the Klein-Gordon field with Unruh-DeWitt detectors [0.0] 非平衡定常状態(NESS)に結合したUnruh-DeWitt検出器の遷移速度を計算する。
NESSは、2つの半無限熱浴を超表面に沿って熱接触させることから生じる。
得られた遷移速度は、慣性熱平衡状態に結合した検出器の場合と対比する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:56:28 GMT)
Predicting Human Choice Between Textually Described Lotteries [0.0] 本研究では,このような課題における人的意思決定の大規模探索を初めて行った。
我々は、微調整された大規模言語モデルを含む複数の計算手法を評価する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:10:33 GMT)
Precise Quantum Chemistry calculations with few Slater Determinants [0.0] 数百個の最適化された非直交行列式からなる変動波動関数は、最先端の手法に匹敵するエネルギー精度を達成できることを示す。
提案手法は、選択したパラメータに対するエネルギーの二次的依存を利用して、その正確な最適化を可能にする。
本手法の限界と拡張、および他の多体法への影響について論じる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:59:51 GMT)
Polarization-dependent topology in quantum emitter chains [0.0] 鎖がジグザグ型であれば、偏光方向を調整することで異なる位相位相を実現できることを示す。
我々の発見は、量子エミッタの1つの配列の中で、様々な位相位相を積極的に切り替える方法を開く。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 22:45:17 GMT)
Pauli Network Circuit Synthesis with Reinforcement Learning [0.0] 本稿では,量子回路の再合成のための強化学習法を提案する。
2ビットゲート数と深さで平均20%の改善が観察され、多くのケースで60%に達する。
これらの結果は、現実的で大規模な量子トランスパイレーションワークロードにおいて、回路品質を著しく向上させるRL駆動合成の可能性を強調している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:27:50 GMT)
Partial Quantum Shadow Tomography for Structured Operators and its Experimental Demonstration using NMR [0.0] 本稿では,密度行列要素のサブセットを推定できる部分量子シャドウトモグラフィープロトコルを提案する。
広範囲の2量子状態に対する部分影推定方式を実験的に実証した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:57:54 GMT)
PET-MAD, a universal interatomic potential for advanced materials modeling [0.0] 機械学習原子間ポテンシャル(MLIP)は原子スケールシミュレーションの範囲を大きく広げている。
安定な無機および有機固体を組み合わせたデータセット上で訓練された一般応用MLIPであるPET-MADを紹介する。
PET-MADの精度を確立されたベンチマークと6つの材料の高度なシミュレーションで評価した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:35:30 GMT)
Optimizing High-Dimensional Oblique Splits [0.0] 本稿では,高次元 $s$-sparse 斜め分割を $(vecw, vecwtopboldsymbolX_i) : iin 1,dots, n, vecw in mathbbRp, | vecw |_0 leq s $ から最適化する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:14:38 GMT)
Optimal control over the full counting statistics in a non-adiabatic pump [0.0] 本稿では, 最適制御理論に基づく体系的手法を導入し, 系の粒子輸送の総計数統計に対処する。
本手法は, ノイズを最小化しつつ, 平均ポンプ速度を同時に最適化することにより, 非断熱状態下でのThoulessポンプの性能を向上させる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:10:31 GMT)
Optimal and efficient qubit routing for quantum simulation [0.0] 量子シミュレーションは物理学の新しい発見を約束するが、ほとんどのプラットフォームではデバイス接続の制約によって進歩は制限される。
SWAPは挿入可能であるが、その使用により回路深さが増加し、現在の量子コンピュータでは許容できないようになり、フォールトトレラントデバイスでは計算コストが増大する。
我々は,SWAPのオーバーヘッドを効率的に最小化するために,このフレームワークを活用して実装する手法を提案する。
注目すべきは、SWAPオーバーヘッドのない解を見つけ、現在の量子コンピュータが幾何学的にフラストレーションされた磁気を探索する扉を開くことだ。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:00:04 GMT)
Optimal Moment-based Characterization of a Gaussian State [0.0] 圧縮真空状態のスクイーズ,反スクイーズ,およびスクイーズ角度の決定に,マルチパラメータモーメントに基づく推定法を適用した。
提案手法は,不確実性を低減したパラメータ推定を高速化し,Cram'er-Rao境界に達する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:02:01 GMT)
On a Matrix Ensemble for Arbitrary Complex Quantum Systems [0.0] 固有状態熱化仮説(ETH)の基礎としてドイッチュが提唱した固有ベクトルアンサンブルの変種について述べる。
このアンサンブルには追加のシステム依存の情報が含まれており、ランダム行列理論(RMT)の普遍的な予測を超えた複雑な量子系の研究を可能にする。
このアンサンブルによって定義される相関関数は、小さなエネルギー窓の場合、ETHによる予測に還元されることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 21:36:24 GMT)
ONDA: A High-Level Quantum Programming Language with Sequential Execution and Conditional Branching [0.0] ONDAは量子プログラミングを著しく単純化するために設計された量子プログラミング言語である。
ONDAは、特殊な量子ハードウェアによって自律的に実行される量子命令にコンパイルする。
コンパイルされた命令を自律的に処理する量子マイクロアーキテクチャを活用することで、ONDAは高レベルの量子アルゴリズムの直感的な実装を容易にする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:49:15 GMT)
ON-Traffic: An Operator Learning Framework for Online Traffic Flow Estimation and Uncertainty Quantification from Lagrangian Sensors [0.0] この研究は、新しいディープ演算子であるOn-Trafficを導入し、トラフィック状態のオンライン推定に適した水平方向学習ベースのフレームワークを提案する。
本フレームワークは,不規則でスパースな入力データを処理し,時間シフトに適応し,精度の高い不確実性推定を行うことのできる,数値データとシミュレーションデータの両方で評価される。
その結果, 衝撃波や混雑伝播などの複雑な交通シナリオを捉えるとともに, 騒音やセンサの落下に対する堅牢性を維持していることがわかった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:13:24 GMT)
Nonresonant Casimir-Polder repulsion with a monolayer topological insulator [0.0] 2レベル原子系の準安定な直交偏極状態に作用する非共鳴カシミール・ポルダー力の挙動について検討した。
単層トポロジカル絶縁体の材料例として、円偏光単色レーザー光で照射したスタンを考慮し、導電率テンソルの周波数分散が力挙動に及ぼす影響について検討した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 06:47:48 GMT)
NERCat: Fine-Tuning for Enhanced Named Entity Recognition in Catalan [0.0] 本稿では,カタルーニャ語テキストに特有なNER性能向上を目的とした,GLiNER[1]モデルの微調整版であるNERCatを紹介する。
筆者らは、手動でアノテートされたカタルーニャ語テレビの文字起こしのデータセットを使用して、そのモデルを訓練し、微調整し、政治、スポーツ、文化といった分野に焦点を当てた。
評価の結果, 精度, リコール, F1スコアが著しく向上した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:44:19 GMT)
MeshFleet: Filtered and Annotated 3D Vehicle Dataset for Domain Specific Generative Modeling [0.0] 微調整された大規模な生成モデルは、これらのモデルをエンジニアリングなどの分野で利用できるようにする上で有望な視点である。
我々は,最も広く公開されている3DオブジェクトコレクションであるXLから抽出した,フィルタおよび注釈付き3DデータセットであるMeshFleetを紹介する。
本手法の有効性を,字幕と画像の美的スコアに基づく手法との比較分析とSV3Dによる微調整実験により実証した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:09:24 GMT)
Many-Body Open Quantum Systems [0.0] 我々は、散逸性およびコヒーレントなプロセスの両方を高度に調整・制御できるプラットフォームにおけるオープン量子多体物理学の理解における最近の理論的進歩について論じる。
熱や多体損失などの相関した多体散逸過程の存在下でのオープン量子多体系のダイナミクスを概観する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 23:09:28 GMT)
Manual Labelling Artificially Inflates Deep Learning-Based Segmentation Performance on Closed Canopy: Validation Using TLS [0.0] フィールドベースの森林在庫に依存する伝統的な方法は、労働集約的であり、空間的範囲に限られている。
我々は、地上レーザー走査(TLS)データから、ボレアルと地中海の森林のドローン画像の高忠実性検証ラベルを生成する。
我々は、広く使われている2つのディープラーニングITCセグメンテーションモデル、DeepForest (RetinaNet) と Detectree2 (マスクR-CNN) の性能を評価する。
両モデルとも, 樹冠木に制限された場合でも, 厳密なIoUしきい値において, 局所化精度が極めて低かった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:09:00 GMT)
Localization and entanglement entropy in the Discrete Non-Linear Schrödinger Equation [0.0] ハミルトン力学によるマイクロカノニカルアンサンブルの数値的なサンプリングにより、局所化位相と絡み合いエントロピーの非自明な振る舞いの間の新しい微妙な関係が明らかになった。
絡み合いエントロピーが$S_textent(N) sim log(N)$として大きくなることは、DNLSE非熱的局所化相における付加性の欠如を美しくエンコードする。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:47:50 GMT)
Linear to Neural Networks Regression: QSPR of Drugs via Degree-Distance Indices [0.0] この研究は、予測精度を高めるために、トポロジカル指標と機械学習を統合するという革新的な視点を提供する。
この予測は、トポロジカルな指標と物理的性質の間の信頼性の高い関係を確立することで、化学者が分子の挙動に関する予備的な洞察を得ることができることを説明できるかもしれない。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:03:59 GMT)
Lightweight Gradient-Aware Upscaling of 3D Gaussian Splatting Images [0.0] 3DGSと比較すると、レンダリング速度が大幅に向上し、3DGSの再構築でよく見られるアーティファクトが削減される。
本手法は,低解像度の3DGSレンダリングを高速化し,コストを極端に増大させる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:42:52 GMT)
Leveraging Bi-Focal Perspectives and Granular Feature Integration for Accurate Reliable Early Alzheimer's Detection [0.0] 本稿では,異なるスケールでの情報抽出と効率的な情報フローを組み合わせた新しいグラニュラー特徴統合手法を提案する。
また,MRIにおける微妙な神経線維の絡み合いとアミロイドプラークの強調を目的としたバイフォーカスパースペクティブ機構を提案する。
我々のモデルはF1スコア99.31%、精度99.24%、リコール99.51%を達成した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:21:14 GMT)
Is there a future for AI without representation? [0.0] 本稿では,汎用表現のないAIの展望とロドニー・ブルックスの提案について検討する。
ブルックスの提案の特徴は、知的エージェントにおける中央制御の拒絶である。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:13:31 GMT)
International Agreements on AI Safety: Review and Recommendations for a Conditional AI Safety Treaty [0.0] GPAI(Advanced General-purpose AI)の悪意的使用や誤動作は「結婚や人類の絶滅」につながる可能性のあるリスクを引き起こす
これらのリスクに対処するため、AIの安全性に関する国際協定に関する提案が増えている。
本稿では,開発に厳格な監督を要する計算しきい値を確立する条約を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:29:57 GMT)
Influence functions and regularity tangents for efficient active learning [0.0] 本稿では,データに対する好奇心を持つ回帰モデルを提供するための効率的な方法について述べる。
提案手法では,潜在的な問合せデータポイントに関する「好奇心」の評価を,モデルの損失勾配を計算すると同時に迅速に行うことができる。
本手法により計算された量は,「影響関数」の例であり,モデル複雑性の2乗変化が期待できる値であることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:17:32 GMT)
Inducing Causal Structure for Interpretable Neural Networks Applied to Glucose Prediction for T1DM Patients [0.0] IIT(Interchange Intervention Training)のような因果抽象化技術は、因果モデルに符号化された専門家の知識をニューラルネットワークに注入するために提案されている。
本稿では,1型糖尿病(T1DM)患者におけるIITの血糖値予測への応用について検討する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:18:42 GMT)
Improving Tropical Cyclone Forecasting With Video Diffusion Models [0.0] 熱帯サイクロン(TC)予測は,災害対策と緩和に不可欠である。
本稿では,時間的依存関係を付加的な時間的階層を通じて明示的にモデル化する,TC予測のためのビデオ拡散モデルの新たな適用法を提案する。
提案手法により,複数のフレームを同時に生成し,サイクロンの進化パターンをよりよく捉えることができる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:41:23 GMT)
Identifying Critical Phases for Disease Onset with Sparse Haematological Biomarkers [0.0] 臨床血液検査は、大規模生物医学研究のための新しい分子データ源である。
従来の計算法は、生物学的解釈性に欠けながら歪んだ学習信号とバイアス予測にアプローチする。
デルタバイオマーカートラジェクトリをモデル化するために,GNAN(Graph Neural Additive Networks)を用いた新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:29:45 GMT)
High purity two-dimensional levitated mechanical oscillator [0.0] 本稿では,高純度な2次元状態の達成について報告する。
本システムは,2次元運動における連続変数の絡み合いを実現するための優れたプラットフォームとして機能する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:42:59 GMT)
Heisenberg-limited continuous-variable distributed quantum metrology with arbitrary weights [0.0] 連続変数DQMは、少なくとも1つの非古典的な入力を持つ線形ネットワークを使用する。
Dパラメータの任意の線形結合を測るためには、2つの入力が古典的であることを示す。
また、非古典的な入力のクラスに対して、局所光子数検出が最大感度を得ることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:44:21 GMT)
Harnessing of temporal dispersion for integrated pump filtering in spontaneous heralded single-photon generation processes [0.0] 隠蔽された単一光子生成とオンチップ検出の融合は、ポンプ光と単一光子を区別する能力を必要とする。
この目標を達成するために、光パルスの分散誘起時間分離について検討する。
本手法は、ポンプ光と単一光子の異なるグループ速度と、高分解能の単一光子検出器を利用する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:39:33 GMT)
Geometric constructions of generalized dual-unitary circuits from biunitarity [0.0] 加護目格子上の二元接続のネットワークが自然に多元回路を定義することを示す。
モノクリニック対称性と高次階層二重単位可解性を有する多層回路を導入する。
我々の研究は、時空における異なる幾何学的構造から生じるものとして、可解モデルの異なるクラスがどのように理解できるかを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:39:50 GMT)
Gender and content bias in Large Language Models: a case study on Google Gemini 2.0 Flash Experimental [0.0] 本研究では,Googleが開発した最先端の大規模言語モデル(LLM)であるGemini 2.0 Flash Experimentalのバイアスを評価する。
これは男女差の減少を示し、特に女性特有のプロンプトは受容率を大幅に上昇させる。
性的内容に対するより寛容な姿勢を採用し、性特例を含む暴力的なプロンプトに対する比較的高い受け入れ率を維持している。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:28:22 GMT)
Fully Automated Generation of Combinatorial Optimisation Systems Using Large Language Models [0.0] 大規模言語モデル(LLM)を利用した最適化システムの完全自動生成の可能性を検討する。
LLMは、自然言語でユーザが提供する問題記述を解釈し、問題固有のソフトウェアコンポーネントを設計、実装する責任を負う。
完全に自動化されたLCMに基づく最適化システムの原理を議論し、いくつかの概念実証生成器の評価を行い、それらの性能を4つの最適化問題で比較した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:23:51 GMT)
Evaluating the Application of SOLID Principles in Modern AI Framework Architectures [0.0] この研究は、現代のAIフレームワーク、特にスキキットラーンがSOLID設計原則にどの程度準拠しているかを評価する。
それぞれのフレームワークのドキュメンテーション、ソースコード、アーキテクチャコンポーネントを調べて、これらの原則への準拠性を評価しました。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 00:37:23 GMT)
Evaluating Machine Learning Approaches for ASCII Art Generation [0.0] 本稿では、構造化されたASCIIアートを生成するための最新の機械学習手法の適用について検討する。
我々は、忠実度、文字分類精度、出力品質の3つの重要な基準に焦点を当てる。
以上の結果から、複雑なニューラルネットワークアーキテクチャは、高品質のASCIIアートの作成に不足することが多いことが分かる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:07:29 GMT)
Error-mitigated photonic quantum circuit Born machine [0.0] 我々は、フォトニック量子コンピューティングの文脈で量子回路Born Machine(QCBM)を研究する。
本稿では, リサイクル緩和と呼ばれる最近開発された誤り軽減技術により, 光子損失を伴う現実シナリオにおけるQCBMのトレーニングが大幅に改善されたことを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:38:29 GMT)
Error correction of a logical qubit encoded in a single atomic ion [0.0] 量子誤り訂正(QEC)は、量子コンピュータが有用なアルゴリズムを実行するために不可欠である。
近年の研究では、単一粒子レベルで誤り訂正を行うための補完的なアプローチが提案されている。
ここでは、QECを単一原子イオンで示し、最大2.2倍の誤差を減少させ、量子ビットの有用な寿命を最大1.5倍に拡張する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:10:21 GMT)
Epidemic Forecasting with a Hybrid Deep Learning Method Using CNN-LSTM With WOA-GWO Parameter Optimization: Global COVID-19 Case Study [0.0] 本研究では,感染症の時系列予測を推し進める新たな深層学習フレームワークを提案する。
本フレームワークは6大陸24カ国の新型コロナウイルス19症例データに適用した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 03:10:14 GMT)
Entropic partial orderings of quantum measurements [0.0] 量子測定空間上の4つの部分順序について検討し、粗さ/微細さの4つの概念について述べる。
これらは古典的な後処理、測定された相対エントロピー、観測エントロピー、およびPOVMの線形関係である。
この階層は一般のPOVMでは厳密であり、4つの順序がすべて厳密に等価でないことを示す例を示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:41:05 GMT)
Ensemble Knowledge Distillation for Machine Learning Interatomic Potentials [0.0] 機械学習原子間ポテンシャル(MLIP)は、原子論シミュレーションと分子特性予測を加速するための有望なツールである。
MLIPの品質は、利用可能なトレーニングデータの量と、そのデータを生成するのに使用される量子化学(QC)レベルの理論に依存する。
本研究では,エネルギーのみのデータセットに学習した際のMLIP精度を向上させるために,アンサンブル知識蒸留(EKD)法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:32:51 GMT)
Enhancing nonnative speech perception and production through an AI-powered application [0.0] 本研究の目的は、AIを利用したモバイルアプリケーションによるトレーニングが、非ネイティブな音の知覚と生産に与える影響を検討することである。
この介入には、英語の母音を特徴とする録音タスクと発音フィードバックと練習を取り入れたSpeakometer Mobileアプリケーションによるトレーニングが含まれていた。
その結果,介入後の判別精度と目標コントラストの生成に有意な改善が認められた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 10:05:12 GMT)
Enhancing Trust in Language Model-Based Code Optimization through RLHF: A Research Design [0.0] 本研究の目的は、人間のフィードバックを効果的に統合する、信頼性の高いLMを用いたコード最適化手法を開発することである。
この作業は、ソフトウェアエンジニアリングの協力的側面と人間中心の側面を前進させるという、より広範な目標と一致します。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:12:46 GMT)
Enhancing AUTOSAR-Based Firmware Over-the-Air Updates in the Automotive Industry with a Practical Implementation on a Steering System [0.0] このプロジェクトの目的は、近代車両に適した高度なFOTAシステムの設計と実装である。
このシステムは更新プロセス中に認証とデータの整合性のためにUDS 0x27プロトコルを統合している。
システムの機能は、点滅LEDとLane Keeping Assist(LKA)システムという2つのアプリケーションを通して実証される。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:21:33 GMT)
Energy-time and time-bin entanglement: past, present and future [0.0] 絡み合いは多くの量子情報処理において重要なリソースである。
本稿では、エネルギー時間と時間ビンの絡み合いの始まりを概説する。
次に、今後の量子ネットワークにおいて、エネルギー時間と時間ビンの絡み合いが持つ重要な場所について論じる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:30:33 GMT)
Empowering Smaller Models: Tuning LLaMA and Gemma with Chain-of-Thought for Ukrainian Exam Tasks [0.0] 小型またはコンパクトなモデルの方が効率的だが、表現不足の言語を十分にサポートしていないことが多い。
この研究は、推論集約的なタスクを扱うために、コンパクトなオープンウェイト言語モデルのパラメータ効率の良い微調整の可能性を探る。
統合タスクトピックとステップバイステップのソリューション生成によるチューニング手法は、マッチングタスクにおける標準チェーン・オブ・シンキングよりも優れる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:44:49 GMT)
Elevating Visual Question Answering through Implicitly Learned Reasoning Pathways in LVLMs [0.0] MF-SQ-LLaVAは,エンド・ツー・エンドのトレーニングを通じて暗黙の自己問合せを可能にすることで,LVLMを強化する新しいアプローチである。
提案手法では,サブクエストと解答ペアからなる推論チェーンを用いて,視覚的質問応答データセットを増強する。
我々はScienceQAとVQAv2データセットに関する広範な実験を行い、MF-SQ-LLaVAが既存の最先端モデルよりも大幅に優れていることを示した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 19:29:07 GMT)
Ehrenfest dynamics accelerated with SPEED [0.0] 表面ホッピングやエレンフェストのダイナミクスのような混合量子古典法は、複数の電子状態を含む分子過程を記述するのに有用であることが証明されている。
ダイアバティック表現に共通する局所2次ポテンシャルを用いて全ての軌道が伝播するエレンフェスト力学の変種であるエレンフェスト力学(SPEED)の単一ポテンシャル評価法を提案する。
SPEEDは2つのフランモーティー間のホール移動率の温度依存性を定性的に捉え、衝突後の最終電荷分布を正確に予測する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 05:06:26 GMT)
Efficient Numerical Wave Propagation Enhanced By An End-to-End Deep Learning Model [0.0] 本稿では,数値解法とディープラーニングコンポーネントをエンドツーエンドのフレームワークに統合する,新しい統合システムを提案する。
安定かつ高速な解法により、高周波波成分を補正する並列時間アルゴリズムであるPararealが利用可能となる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 23:41:23 GMT)
Efficient Implementation of Multi-Controlled Quantum Gates [0.0] 本稿では,最先端手法と比較してコストを大幅に削減できるマルチコントロール量子ゲートの実装について述べる。
我々は,任意のターゲット量子ビットに対して手法を一般化し,追加のアンシラ量子ビットが利用可能であれば,さらなるコスト削減を提供する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:35:11 GMT)
Discrete-to-Continuum Approach for the Analytic Continuation of One-Particle Propagator on the Circle [0.0] 数値評価に適した円上の自由離散プロパゲータに対して有限表現を導出する。
これらの表現は、連続円極限におけるプロパゲータの再構成を可能にする。
この方法では、よく知られた無限直線極限が一貫して回復されることが示される。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:01:48 GMT)
Developing cholera outbreak forecasting through qualitative dynamics: Insights into Malawi case study [0.0] 本研究は,定性的ダイナミクスによる伝達傾向の洞察と,機械学習による予測を実現することを目的とする。
本研究では, 偏位相関係数に基づく感度分析を用いて, 疾患の動態を示す重要なパラメータを同定した。
我々は,機械的コレラダイナミクスを自己回帰統合型移動平均と自己回帰型ニューラルネットワークに組み込むことで,伝染性インフォームド機械学習モデルを開発した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:17:09 GMT)
Demonstration of High-Fidelity Entangled Logical Qubits using Transmons [0.0] 本稿では,動的デカップリング(DD)を利用して論理的誤りを劇的に抑制する手法を提案し,実装する。
結果として生じるハイブリッドQEC-LDD戦略は、原則として任意の重み誤差を扱うことができる。
本稿では,符号化されたベル状態に影響を及ぼす論理的誤りを検出する手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:47:08 GMT)
Deep learning modelling of manufacturing and build variations on multi-stage axial compressors aerodynamics [0.0] 本稿では,多段軸圧縮機の流れ場および空力特性予測のためのディープラーニングフレームワークの開発と応用について述べる。
物理に基づく次元還元アプローチは、流れ場予測の可能性を解き放つ。
提案したアーキテクチャは,産業関連アプリケーションに対して,CFDベンチマークに匹敵する精度をリアルタイムに達成できることが証明されている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:48:07 GMT)
Deep Jansen-Rit Parameter Inference for Model-Driven Analysis of Brain Activity [0.0] 本研究では3つのディープラーニングアーキテクチャを用いて、シミュレーションされた脳波データから効率的な接続性(EC)パラメータを推定する。
シナプスゲインや時間定数などの重要な局所パラメータの信頼性を実証する。
本研究は, 学習可能なJR-NMMパラメータのサブセットを推定する深層学習手法の実現可能性を示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:52:33 GMT)
Deep Adversarial Learning with Activity-Based User Discrimination Task for Human Activity Recognition [0.0] 本稿では,人間行動認識問題に対する新たな逆深層学習フレームワークを提案する。
本フレームワークは,個人間の変動に対処する,行動に基づく新たな識別タスクを取り入れている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 02:56:03 GMT)
Data Encoding for VQC in Qiskit, A Comparison With Novel Hybrid Encoding [0.0] 振幅符号化は必要な量子ビットを減らすため、アングル符号化は状態の自由を良くし、表現的符号化や位相に基づく区別に使用される。
本稿では,Amplitudeエンコーディングが要求されるqubitを削減し,Angleエンコーディングが状態自由度を向上し,表現的エンコーディングや位相に基づく区別に使用されることにより,効率的なqubit使用が保証されることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:36:09 GMT)
CryptoLLM: Unleashing the Power of Prompted LLMs for SmartQnA and Classification of Crypto Posts [0.0] 本研究は暗号通貨の理解とフィルタリングを強化することを目的としている。
我々は、reditポストとtwitterポストの分類タスクを解決するために、プロンプトベースの手法を用いてきた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:49:08 GMT)
Contextuality and Chaos [0.0] 古典的な説明に反する量子的性質である文脈性はカオスのサインとして機能することを示す。
カオス力学を行うスピン系に対して,ベル型不等式違反が正規領域とカオス領域を効果的に区別できることを実証する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:32:09 GMT)
Computing the Wave: Where the Gravitational Wave Community benefits from High-Energy Physics, and where it differs ? [0.0] 現在、一連のライブラリがプロトタイプ化され、https://git.ligo.org/kagra/libraries-addons/rootで利用可能になっている。
FFTWとKFRライブラリのパフォーマンスを比較した性能ベンチマークを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 14:32:19 GMT)
Complexity of Bose-Einstein condensates at finite temperature [0.0] ボース・アインシュタイン凝縮体(BEC)の有限温度における幾何学的量子複雑性について検討した。
We use the Bures and Sj"oqvist metrics -- generalizations of the Fubini-Study metric for mixed quantum state。
Nielsenの複雑性アプローチでは、混合状態の浄化と非一様ユニタリ演算に関連するゲージ自由度を厳格に扱う。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:28:16 GMT)
Cloud2BIM: An open-source automatic pipeline for efficient conversion of large-scale point clouds into IFC format [0.0] 本稿では,ポイントクラウドのBIMモデルへの変換を自動化するために設計された,オープンソースのソフトウェアツールであるCloud2BIMを紹介する。
既存のツールとは異なり、RANSACのような計算および校正集約技術を避け、非直交ジオメトリーをサポートし、高速競合ソリューションよりも最大7倍高速な処理速度を実現する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 21:53:55 GMT)
Cancer-Answer: Empowering Cancer Care with Advanced Large Language Models [0.0] 消化器癌(GI)は、世界のがん負担のかなりの部分を占める。
がん関連クエリは、タイムリーな診断、治療、患者教育に不可欠である。
我々は,GPT-3.5 Turboのような大規模言語モデル(LLM)を利用して,がん関連クエリに対する正確で文脈的に関連する応答を生成する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:36:28 GMT)
CINNAMON: A hybrid approach to change point detection and parameter estimation in single-particle tracking data [0.0] 単一粒子追跡トラジェクトリを分類し,その中の変化点を検出し,変化点間のセグメントにおける拡散パラメータを推定するハイブリッド手法を提案する。
提案手法は,ニューラルネットワーク,特徴に基づく機械学習,統計的手法の組み合わせに基づく。
第2回Anomalous Diffusion Challengeでベンチマークされた。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 13:43:57 GMT)
C(NN)FD -- Deep Learning Modelling of Multi-Stage Axial Compressors Aerodynamics [0.0] 本稿では,多段軸圧縮機の流れ場および空力特性の予測のための一般化されたディープラーニングフレームワークの開発と応用について述べる。
物理に基づく次元の減少は、大規模領域のフロー場予測の可能性を解き、非構造化領域から構造化領域への回帰問題を再定式化する。
提案フレームワークは,0D/1D/2D/3Dレベルで対応する空力ドライバを識別できるため,物理的に説明可能な性能予測の利点を有する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 15:58:58 GMT)
Bisognano-Wichmann Hamiltonian for the entanglement spectroscopy of fractional quantum Hall states [0.0] 球面上で定義された分数量子ホール状態に対するビソニャーノ・ヴィヒマンハミルトニアンの研究を行う。
ボソニックなラウリン状態は, 接触2体相互作用によって安定化される。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:11:01 GMT)
Binary AddiVortes: (Bayesian) Additive Voronoi Tessellations for Binary Classification with an application to Predicting Home Mortgage Application Outcomes [0.0] Additive Voronoi Tessellations (AddiVortes) モデルは多変量回帰モデルである。
潜在変数の定式化にプロビットモデルを組み込むことで、AddiVortesフレームワークをバイナリ分類に拡張する。
AddiVortesを用いて総合的な分析を行い、住宅ローンの承認を受ける可能性を予測する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:59:02 GMT)
Beyond holography: the entropic quantum gravity foundations of image processing [0.0] G. Bianconi は、多様体に関連するメトリクス間の量子相対エントロピーによって与えられる重力に対する作用を提案するエントロピー量子重力法を提案した。
ここでは、画像処理のための有名なペローナ・マリクアルゴリズムがエントロピー量子重力作用の勾配流であることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 09:06:33 GMT)
BI-RADS prediction of mammographic masses using uncertainty information extracted from a Bayesian Deep Learning model [0.0] ベイズ深層学習モデルにより抽出された不確実性情報を用いてBI_RADSスコアを予測する。
このモデルは良性検体を75.86%の精度で識別し、すべての悪性検体をBI_RADS 5と正しく識別することができる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 08:06:05 GMT)
Availability of Perfect Decomposition in Statistical Linkage Learning for Unitation-based Function Concatenations [0.0] 完全な分解を得るのに十分な人口の大きさを解析的に推定する。
SLLでは難しいと思われる問題の種類を同定する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:19:05 GMT)
Attribution Score Alignment in Explainable Data Management [0.0] 本研究では,手前のクエリに基づいて,異なるスコアのアライメントについて検討する。
因果責任の存在は、この点において重大な違いをもたらすことが判明した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:45:32 GMT)
Assessing Large Language Models for Automated Feedback Generation in Learning Programming Problem Solving [0.0] 大規模な言語モデル(LLM)は、フィードバック生成を自動化する潜在的なツールとして登場した。
本研究は,45の学生ソリューションのベンチマークデータセットを用いて,4つのLCMの性能を評価する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 18:31:36 GMT)
Application-Aware Benchmarking on NISQ Hardware using Expectation Value Fidelities [0.0] 回路モデルにおける汎用量子ハードウェア上のアプリケーションをベンチマークするための低コストなプロトコルを提案する。
超伝導ハードウェア上でのキックド・イシングモデルシミュレーションの具体例を考察し,ゲート誤差データを用いた予測よりも精度が高いことを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:06:21 GMT)
Analysis of human visual field information using machine learning methods and assessment of their accuracy [0.0] 本研究の目的は緑内障を分類できる様々な機械学習手法を検討することである。
平均年齢は30~85歳であった。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:39:41 GMT)
Accurate Automatic 3D Annotation of Traffic Lights and Signs for Autonomous Driving [0.0] 交通信号や道路標識などの交通管理対象の3D検出は、自動運転車にとって不可欠である。
本稿では,信号機や標識の3次元バウンディングボックスアノテーションを自動生成する手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 12:56:55 GMT)
AI and Deep Learning for Automated Segmentation and Quantitative Measurement of Spinal Structures in MRI [0.0] 本研究では,MRIスキャンにおける重要な脊髄構造をセグメント化し,計測する自律型AIシステムの開発を行う。
目標は、臨床の作業量を削減し、診断の整合性を高め、評価を改善することである。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 07:43:55 GMT)
A variational formulation of the governing equations of ideal quantum fluids [0.0] ボームの量子ポテンシャル項は理想量子流体の内部エネルギーに見出される。
非局所性は、遅延ポテンシャルを導入することで取り除くことができる。
これにより、量子ポテンシャルと理想量子流体の運動方程式の共変定式化が導かれる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 11:04:51 GMT)
A metropolitan-scale trapped-ion quantum network node with hybrid multiplexing enhancements [0.0] 内部に2種類の量子ビットを持つ5ドルイオン量子ネットワークノードを実験的に実現した。
高い忠実度が96.8%$/94.6%$/89.8%$、成功率が263,texts-1$/40,texts-1$/4.28,texts-1$をそれぞれ3,m/$1,$km/$12,$kmで生成できる。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 04:51:05 GMT)
A mathematical model for a universal digital quantum computer with an application to the Grover-Rudolph algorithm [0.0] 代数的確率論を用いた普遍デジタル量子計算のための新しいフレームワークを開発する。
量子回路を基本量子ゲートの有限列として定義する。
与えられた確率密度関数を近似する量子回路を設計する。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:25:37 GMT)
A RAG-based Question Answering System Proposal for Understanding Islam: MufassirQAS LLM [0.0] 本研究は,LLMの精度と透明性を高めるために,ベクトルデータベースに基づくRetrieval Augmented Generation (RAG)アプローチを用いる。
トルコの文脈を含むいくつかのオープンアクセスブックからなるデータベースを作成しました。
MufassirQAS と ChatGPT もセンシティブな質問でテストされている。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 17:14:43 GMT)
A Metric-based Principal Curve Approach for Learning One-dimensional Manifold [0.0] 空間データの1次元多様体を学習する新しい計量ベース主曲線(MPC)法を提案する。
MNISTデータセットを用いた実応用により,本手法は形状の観点から一次元多様体をよく学習できることを示す。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 20:30:38 GMT)
A Graph-Enhanced Deep-Reinforcement Learning Framework for the Aircraft Landing Problem [0.0] 航空機着陸問題(英: Aircraft Landing Problem、ALP)は、航空機の輸送と管理において難しい問題の一つである。
本稿では,グラフニューラルネットワークとアクター批判アーキテクチャを組み合わせてALPに対処する,新しい深層強化学習フレームワークを提案する。
その結果、学習アルゴリズムは異なる問題集合上でテストでき、その結果は研究アルゴリズムの運用と競合することを示した。
論文参考訳(メタデータ) (Tue, 18 Mar 2025 16:08:31 GMT)