GR00T N1: An Open Foundation Model for Generalist Humanoid Robots [133.2] 汎用ロボットには多目的体と知的な心が必要だ。
近年のヒューマノイドロボットの進歩は、汎用的な自律性を構築するためのハードウェアプラットフォームとして大きな可能性を秘めている。
我々はヒューマノイドロボットのオープン基盤モデルであるGR00T N1を紹介する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:52:43 GMT)
Model as a Game: On Numerical and Spatial Consistency for Generative Games [117.4] 本稿では,モデル・アズ・ア・ゲーム(MaaG)のメカニズムを十分に構築した上で,モデル・アズ・ア・ゲーム(MaaG)を真に構成するものを探るため,生成ゲームのパラダイムを再考する。
DiTアーキテクチャに基づいて,(1) LogicNetを統合してイベントトリガを決定する数値モジュール,(2) 探索領域のマップを維持する空間モジュール,(2) 生成中の位置情報を検索して連続性を確保する,という2つの特殊なモジュールを設計する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:46:15 GMT)
MoReVQA: Exploring Modular Reasoning Models for Video Question Answering [101.3] 本稿では,ビデオ質問応答(videoQA)の課題を,分解した多段階モジュラー推論フレームワークを用いて解決する。
従来の単一ステージ計画手法とは異なり、イベント、グラウンドステージ、最終的な推論ステージからなるマルチステージシステムと外部メモリとの組み合わせを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:18:09 GMT)
3DGen-Bench: Comprehensive Benchmark Suite for 3D Generative Models [94.5] 3D世代は急速に進歩しているが、3D評価の開発はペースを保っていない。
大規模人選好データセット3DGen-Benchを開発した。
次に、CLIPベースのスコアモデルである3DGen-ScoreとMLLMベースの自動評価器である3DGen-Evalを訓練する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:53:00 GMT)
VIA: Unified Spatiotemporal Video Adaptation Framework for Global and Local Video Editing [91.6] 我々は,グローバルなローカルビデオ編集のための統合ビデオ適応フレームワークであるVIAを導入し,一貫したビデオ編集の限界を推し進める。
本研究では,各フレーム内の局所的な一貫性を確保するため,事前学習した画像編集モデルに適応するテスト時間編集適応を設計した。
また,VIAは長時間の映像編集を一貫した時間で行うことができ,ビデオ編集作業が長続きする可能性を秘めていることを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:56:31 GMT)
Collab: Controlled Decoding using Mixture of Agents for LLM Alignment [90.6] 人間のフィードバックからの強化学習は、大規模言語モデルを整合させる効果的な手法として現れてきた。
制御された復号化は、再訓練せずに推論時にモデルを整列するメカニズムを提供する。
本稿では,既存の既成のLCMポリシを活用するエージェントベースのデコーディング戦略の混合を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:34:25 GMT)
CoT-VLA: Visual Chain-of-Thought Reasoning for Vision-Language-Action Models [89.4] 視覚言語行動モデル(VLA)に明示的な視覚連鎖(CoT)推論を組み込む手法を提案する。
視覚およびアクショントークンの理解と生成が可能な最先端の7B VLAであるCoT-VLAを紹介する。
実験の結果,CoT-VLAは実世界の操作タスクでは17%,シミュレーションベンチマークでは6%,最先端のVLAモデルでは6%,高い性能を示した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 22:23:04 GMT)
A Survey of Efficient Reasoning for Large Reasoning Models: Language, Multimodality, and Beyond [88.6] 大規模推論モデル (LRM) は, 推論中におけるチェーン・オブ・ソート (CoT) の推論長を拡大することにより, 高い性能向上を示した。
懸念が高まっているのは、過度に長い推論の痕跡を生み出す傾向にある。
この非効率性は、トレーニング、推論、現実のデプロイメントに重大な課題をもたらす。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:36:30 GMT)
Large Language Model Agent: A Survey on Methodology, Applications and Challenges [88.3] 大きな言語モデル(LLM)エージェントは、目標駆動の振る舞いと動的適応能力を持ち、人工知能への重要な経路を示す可能性がある。
本調査は, LLMエージェントシステムを方法論中心の分類法により体系的に分解する。
私たちの作業は、エージェントの構築方法、コラボレーション方法、時間の経過とともにどのように進化するか、という、統一されたアーキテクチャの視点を提供します。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:50:17 GMT)
Challenging the Boundaries of Reasoning: An Olympiad-Level Math Benchmark for Large Language Models [86.5] OlymMATHは、LLMの複雑な推論能力を厳格にテストするために設計された、Olympiadレベルの新しい数学ベンチマークである。
OlymMATHは200の厳密にキュレートされた問題があり、それぞれが手動で検証され、英語と中国語の並行バージョンで利用可能である。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:20:17 GMT)
ELIP: Enhanced Visual-Language Foundation Models for Image Retrieval [83.0] 本稿では,大規模な事前学習型視覚キュレーションモデルの性能向上を目的とした新しいフレームワークを提案する。
ELIP(Enhanced Language- Image Pre-training)と呼ばれるこのアプローチでは、単純なマッピングネットワークを通じてテキストクエリを使用して、視覚的なプロンプトのセットを予測する。
ELIPは一般的なCLIP、SigLIP、BLIP-2ネットワークに容易に適用できる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:57:43 GMT)
Video Motion Transfer with Diffusion Transformers [82.5] 本稿では,参照ビデオの動作を新たに合成したものに転送する方法であるDiTFlowを提案する。
まず、トレーニング済みのDiTを用いて参照ビデオを処理し、クロスフレームアテンションマップを分析し、パッチワイズ動作信号を抽出する。
我々は、位置埋め込みを変換し、ゼロショットモーション転送能力を向上する戦略を適用した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:57:50 GMT)
Locally Orderless Images for Optimization in Differentiable Rendering [80.1] そこで我々は,各画素が局所的な変化を保った強度のヒストグラムにマッピングする,局所的な秩序のない画像を利用する手法を提案する。
合成データと実データの両方を用いて,様々な逆問題に対する本手法の有効性を検証した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:17:58 GMT)
SparseFlex: High-Resolution and Arbitrary-Topology 3D Shape Modeling [79.6] SparseFlexは、新しいスパース構造のアイソサーフェス表現で、レンダリング損失から最大10243ドルの解像度で、差別化可能なメッシュ再構築を可能にする。
SparseFlexは、高解像度で差別化可能なメッシュ再構成とレンダリングロスによる生成を可能にすることで、3D形状の表現とモデリングの最先端性を著しく向上させる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:46:42 GMT)
EnvGS: Modeling View-Dependent Appearance with Environment Gaussian [78.7] EnvGSは、環境の反射を捉えるための明示的な3D表現として、ガウスプリミティブのセットを利用する新しいアプローチである。
これらの環境を効率的にレンダリングするために,高速レンダリングにGPUのRTコアを利用するレイトレーシングベースのリフレクションを開発した。
複数の実世界および合成データセットから得られた結果は,本手法がより詳細な反射を生成することを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:12:07 GMT)
Lumina-Image 2.0: A Unified and Efficient Image Generative Framework [76.4] Lumina-Image 2.0はテキストから画像を生成するフレームワークで、以前の作業と比べて大きな進歩を遂げている。
統一アーキテクチャ(Unified Next-DiT)を採用し、テキストと画像トークンをジョイントシーケンスとして扱う。
本稿では,T2I生成タスクに特化して設計された統一キャプションシステムUnified Captioner(UniCap)を紹介する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:57:07 GMT)
VBench-2.0: Advancing Video Generation Benchmark Suite for Intrinsic Faithfulness [76.2] 本稿では,本質的な忠実度を示すビデオ生成モデルを評価するためのベンチマークであるVBench-2.0を紹介する。
VBench-2.0は、人間の忠実さ、コントロール可能性、創造性、物理学、コモンセンスの5つの重要な次元を評価している。
VBench-2.0は、表面的な忠実性から本質的な忠実性までを推し進めることで、次世代のビデオ生成モデルの新たな標準を確立することを目指している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:57:01 GMT)
Tuning-Free Personalized Alignment via Trial-Error-Explain In-Context Learning [74.6] テキスト生成タスクのための言語モデルをパーソナライズするチューニング不要な手法であるITCL(Trial-Error-Explain In-Context Learning)を提案する。
ITCLは、試行錯誤説明プロセスを通じて、コンテキスト内学習プロンプトを反復的に拡張し、モデル生成陰性サンプルと説明を追加する。
語彙的および定性的な分析は、負のサンプルと説明によって、言語モデルがより効果的にスタイリスティックな文脈を学習できることを示している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:21:27 GMT)
Enhancing LLM Character-Level Manipulation via Divide and Conquer [74.6] 大規模言語モデル(LLM)は、幅広い自然言語処理(NLP)タスクにまたがる強力な一般化機能を示している。
彼らは文字レベルの文字列操作において顕著な弱点を示し、文字削除、挿入、置換といった基本的な操作に苦労した。
本稿では,トークンレベルの処理と文字レベルの操作のギャップを埋める新しい手法であるDivide and Conquerによる文字レベル操作を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:07:18 GMT)
Semantic Library Adaptation: LoRA Retrieval and Fusion for Open-Vocabulary Semantic Segmentation [72.3] オープン語彙セマンティックセグメンテーションモデルは、視覚とテキストを関連付け、テキストクエリを使用して未定義のクラスの集合からピクセルをラベル付けする。
本稿では,セマンティックライブラリ適応(Semantic Library Adaptation, SemLA)を紹介する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:59:58 GMT)
On Large Multimodal Models as Open-World Image Classifiers [71.8] 大規模マルチモーダルモデル(LMM)は、自然言語を使って画像を分類することができる。
原型,非原型,きめ細かな粒度,そして非常にきめ細かいクラスを含む10のベンチマークで13のモデルを評価した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:03:18 GMT)
Clean Image May be Dangerous: Data Poisoning Attacks Against Deep Hashing [71.3] クリーンなクエリ画像でさえ危険であり、望ましくない画像や違法な画像などの悪意のあるターゲット検索結果が誘導される。
具体的には,まず,対象の深部ハッシュモデルの挙動をシミュレートするために代理モデルを訓練する。
そこで, 毒性画像を生成するため, 厳密な勾配マッチング戦略を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:54:27 GMT)
SlowFast-LLaVA-1.5: A Family of Token-Efficient Video Large Language Models for Long-Form Video Understanding [70.8] ビデオ大言語モデル(LLM)のファミリーであるSlowFast-LLaVA-1.5(SF-LLaVA-1.5)を紹介する。
2ストリームのSlowFastメカニズムを合理化されたトレーニングパイプラインに組み込む。
我々は、公開データセットのみを慎重にキュレートしたデータ混合を用いて、共同でビデオイメージトレーニングを行う。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:34:06 GMT)
KAC: Kolmogorov-Arnold Classifier for Continual Learning [70.3] 継続的な学習には、モデルを忘れずに連続的なタスクにわたって継続的にトレーニングする必要がある。
既存の手法の多くは線形分類器を利用しており、新しいタスクを学習しながら安定した分類空間を維持するのに苦労している。
Kolmogorov-Arnold Networks (KAN) の単純な連続回帰タスクにおける学習の保存の成功に触発されて、我々はより複雑な連続的な学習シナリオにおける学習の可能性を探究した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 01:27:14 GMT)
OpenHuEval: Evaluating Large Language Model on Hungarian Specifics [70.0] OpenHuEvalはハンガリー語と特定の言語に焦点を当てた LLM の最初のベンチマークである。
OpenHuEvalは、複数の起源に由来するハンガリー固有の資料の膨大なコレクションから構築されている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:40:06 GMT)
AnyEdit: Edit Any Knowledge Encoded in Language Models [69.3] 大規模言語モデル(LLM)のための新しい自動回帰編集パラダイムであるAnyEditを提案する。
長い形式の知識を逐次チャンクに分解し、各チャンク内のキートークンを反復的に編集し、一貫性と正確な出力を保証する。
UnKEBench、AKEW、そして我々の長文の多様な知識のための新しいEditEverythingデータセットを含むベンチマークでは、強いベースラインを21.5%上回っている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:21:36 GMT)
TripoSG: High-Fidelity 3D Shape Synthesis using Large-Scale Rectified Flow Models [69.0] TripoSGは、入力画像に正確に対応した高忠実度3Dメッシュを生成することができる新しい合理化形状拡散パラダイムである。
結果として得られた3D形状は、高解像度の能力によって細部が強化され、入力画像に異常な忠実さを示す。
3Dジェネレーションの分野における進歩と革新を促進するため、我々はモデルを一般公開する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:25:50 GMT)
Embedding Compression Distortion in Video Coding for Machines [68.0] 現在、ビデオ伝送は人間の視覚システム(HVS)だけでなく、分析のための機械認識にも役立っている。
本稿では,機械知覚関連歪み表現を抽出し,下流モデルに埋め込む圧縮歪埋め込み(CDRE)フレームワークを提案する。
我々のフレームワークは,実行時間,パラメータ数といったオーバーヘッドを最小限に抑えて,既存のコーデックのレートタスク性能を効果的に向上させることができる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:01:53 GMT)
ResearchBench: Benchmarking LLMs in Scientific Discovery via Inspiration-Based Task Decomposition [67.3] 大規模言語モデル(LLM)は科学的研究を支援する可能性を示しているが、高品質な研究仮説を発見する能力はいまだ検討されていない。
我々は,LLMを科学的発見のサブタスクのほぼ十分セットで評価するための,最初の大規模ベンチマークを紹介する。
学術論文から重要コンポーネント(研究質問、背景調査、インスピレーション、仮説)を抽出する自動フレームワークを開発する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:09:15 GMT)
EventMamba: Enhancing Spatio-Temporal Locality with State Space Models for Event-Based Video Reconstruction [66.8] EventMambaは、イベントベースのビデオ再構成タスク用に設計された、特殊なモデルである。
EventMambaは、Transformerベースの方法と比較して、優れた視覚的品質を提供しながら、スピードを著しく向上させる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:41:35 GMT)
Can Video Diffusion Model Reconstruct 4D Geometry? [66.5] Sora3Rは、カジュアルなビデオから4Dのポイントマップを推測するために、大きなダイナミックビデオ拡散モデルのリッチ・テンポラリなテンポラリなテンポラリな時間を利用する新しいフレームワークである。
実験により、Sora3Rはカメラのポーズと詳細なシーン形状の両方を確実に復元し、動的4D再構成のための最先端の手法と同等の性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 01:44:46 GMT)
Gaga: Group Any Gaussians via 3D-aware Memory Bank [66.5] Gagaは、ゼロショットクラス非依存セグメンテーションモデルによって予測される一貫性のない2Dマスクを活用することで、オープンワールドの3Dシーンを再構築し、セグメント化する。
Gagaは、新しい3D認識メモリバンクを通じて、さまざまなカメラのポーズをオブジェクトマスクに関連付ける。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:59:25 GMT)
RF Challenge: The Data-Driven Radio Frequency Signal Separation Challenge [66.3] 本稿では、深層学習手法を利用したデータ駆動手法を用いて、高周波信号における干渉拒否の重大な問題に対処する。
本論文の主な貢献は、RF信号データセットであるRF Challengeの導入である。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:16:54 GMT)
DynamiCtrl: Rethinking the Basic Structure and the Role of Text for High-quality Human Image Animation [63.8] DynamiCtrlはMM-DiTで異なるポーズ誘導構造を探索する新しいフレームワークである。
適応層正規化を利用してスパースポーズ特徴を符号化するPose-Adaptive Layer Norm (PadaLN)を提案する。
テキストを活用することで、生成したコンテンツのきめ細かい制御を可能にするだけでなく、初めて背景と動きの同時制御を実現する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:07:45 GMT)
OmniBench: Towards The Future of Universal Omni-Language Models [63.2] OmniBenchは、視覚的、音響的、テキスト的入力を同時に認識し、解釈し、推論する能力を評価するために設計された新しいベンチマークである。
評価の結果,オープンソース OLM は三モーダル文脈における命令追従や推論に重大な制限があることが明らかとなった。
我々は,OLM性能を向上させるため,より堅牢な3モーダル統合技術とトレーニング戦略の開発を提唱する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:21:06 GMT)
A Survey on (M)LLM-Based GUI Agents [62.6] グラフィカルユーザインタフェース (GUI) エージェントは、人間とコンピュータのインタラクションにおいて、トランスフォーメーションパラダイムとして登場した。
大規模言語モデルとマルチモーダル学習の最近の進歩は、デスクトップ、モバイル、Webプラットフォーム全体でGUI自動化に革命をもたらした。
本調査では, 正確な要素位置決定, 効果的な知識検索, 長期計画, 安全に配慮した実行制御など, 重要な技術的課題を明らかにする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:58:31 GMT)
HORT: Monocular Hand-held Objects Reconstruction with Transformers [61.4] モノクロ画像から手持ちの物体を3Dで再構成することは、コンピュータビジョンにおいて重要な課題である。
ハンドヘルドオブジェクトの高密度な3次元点群を効率的に再構成するトランスフォーマーモデルを提案する。
提案手法は,高速な推測速度で最先端の精度を達成し,画像の幅を最適化する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:45:09 GMT)
Boosting Large Language Models with Mask Fine-Tuning [60.6] Mask Fine-Tuning (MFT)を導入し、モデルの整合性を適切に破壊すると驚くほど性能が向上することを示した。
MFTは様々なドメインやバックボーンで一貫したパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:17:57 GMT)
ObscuraCoder: Powering Efficient Code LM Pre-Training Via Obfuscation Grounding [60.4] 言語モデル(LM)は、コード記述ツールボックスのベースとなっている。
Code-LMの事前学習目標の変更を探求する研究は、データ効率の向上と構文とセマンティクスの相互接続性の向上を目的としており、顕著に不十分である。
本研究では,Code-LMが表面的な構文を超越し,事前学習したサンプルの効率を高めるために,難読化コードの基盤について検討する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 23:08:53 GMT)
Mobile-VideoGPT: Fast and Accurate Video Understanding Language Model [60.2] Mobile-VideoGPTはビデオ理解のための効率的なマルチモーダルフレームワークである。
軽量なデュアルビジュアルエンコーダ、効率的なプロジェクタ、小型言語モデル(SLM)で構成されている。
その結果,Mobile-VideoGPT-0.5Bは最大46トークンを毎秒生成できることがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:59:58 GMT)
GMTalker: Gaussian Mixture-based Audio-Driven Emotional Talking Video Portraits [60.1] GMTalkerはガウスの混合合成による感情的な音声画像生成フレームワークである。
具体的には,よりフレキシブルな感情操作を実現するために,連続的かつ不整合な潜在空間を提案する。
また,多種多様な頭部ポーズ,瞬き,眼球運動を生成するために,大規模データセット上で事前訓練された正規化フローベースモーションジェネレータを導入する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:47:12 GMT)
FaceID-6M: A Large-Scale, Open-Source FaceID Customization Dataset [59.2] FaceID-6Mは、600万の高品質テキストイメージペアを含む、最初の大規模なオープンソースのFaceIDデータセットである。
FaceID-6Mデータセットの有効性を示す実験を行った。
FaceIDカスタマイズコミュニティにおける研究を支援し、前進させるために、コード、データセット、モデルを公開しています。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:23:24 GMT)
Volumetric Surfaces: Representing Fuzzy Geometries with Layered Meshes [59.2] 高品質なビュー合成はボリュームレンダリング、スプレイティング、サーフェスレンダリングに依存している。
実時間ビュー合成のための新しい表現として,サンプリング位置の個数が小さく,有界であることを示す。
我々は、オブジェクトを半透明な多層メッシュとして固定順序で表現することで、これを実現する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:12:46 GMT)
Rethinking Video Tokenization: A Conditioned Diffusion-based Approach [58.2] 新しいトークン化ツールであるDiffusion Conditioned-based Gene Tokenizerは、GANベースのデコーダを条件付き拡散モデルで置き換える。
再建に基本的MSE拡散損失とKL項,LPIPSを併用した訓練を行った。
CDTのスケールダウン版(3$times inference speedup)でさえ、トップベースラインと互換性がある。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:46:22 GMT)
Model Assembly Learning with Heterogeneous Layer Weight Merging [57.8] モデル統合のための新しいパラダイムであるモデルアセンブリ学習(MAL)を紹介する。
MALは、様々なモデルのパラメータをオープンエンドモデル動物園に統合し、ベースモデルの能力を高める。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:21:53 GMT)
Motion Prompting: Controlling Video Generation with Motion Trajectories [57.0] スパースもしくは高密度なビデオ軌跡を条件とした映像生成モデルを訓練する。
ハイレベルなユーザリクエストを,詳細なセミセンスな動作プロンプトに変換する。
我々は、カメラや物体の動き制御、画像との「相互作用」、動画転送、画像編集など、様々な応用を通してアプローチを実証する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 21:38:09 GMT)
WVSC: Wireless Video Semantic Communication with Multi-frame Compensation [56.6] 既存の無線ビデオ伝送方式は画素レベルで直接映像符号化を行う。
本稿では,WVSCと略される無線ビデオセマンティック通信フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:27:15 GMT)
LeX-Art: Rethinking Text Generation via Scalable High-Quality Data Synthesis [56.0] 高品質なテキスト画像合成のための総合的なスイートであるLeX-Artを紹介する。
当社のアプローチは,Deepseek-R1に基づく高品質なデータ合成パイプラインの構築という,データ中心のパラダイムに従っています。
我々は、堅牢なプロンプトエンリッチメントモデルであるLeX-Enhancerを開発し、LeX-FLUXとLeX-Luminaの2つのテキスト・ツー・イメージモデルを訓練する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:56:15 GMT)
Layer- and Timestep-Adaptive Differentiable Token Compression Ratios for Efficient Diffusion Transformers [55.9] Diffusion Transformer (DiTs)は、最先端(SOTA)画像生成の品質を達成したが、レイテンシとメモリ非効率に悩まされている。
圧縮比の異なる動的DiT推論フレームワークであるDiffCRを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:42:18 GMT)
Sparse Feature Circuits: Discovering and Editing Interpretable Causal Graphs in Language Models [55.2] 本稿ではスパース特徴回路の発見と適用方法を紹介する。
これらは言語モデルの振る舞いを説明するための人間の解釈可能な特徴の因果関係の著作である。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:44:45 GMT)
debug-gym: A Text-Based Environment for Interactive Debugging [55.1] 大規模言語モデル(LLM)は、コーディングタスクにますます依存している。
LLMは、タスクに関連する情報を集めるために対話的にAを探索する能力の恩恵を受けることができると仮定する。
対話型符号化環境において,LLMベースのエージェントを開発するためのテキスト環境,すなわちデバッグジャムを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:43:28 GMT)
Reconstructing Humans with a Biomechanically Accurate Skeleton [55.1] 本研究では,生体力学的に正確な骨格モデルを用いて,単一の画像から3次元人体を再構築する手法を提案する。
3次元メッシュ回復のための最先端の手法と比較して,我々のモデルは標準ベンチマーク上での競合性能を実現している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:56:24 GMT)
Evaluating the effects of Data Sparsity on the Link-level Bicycling Volume Estimation: A Graph Convolutional Neural Network Approach [54.8] 本稿では,リンクレベルの自転車の体積をモデル化するためにGCNアーキテクチャを利用する最初の研究について述べる。
線形回帰、サポートベクターマシン、ランダムフォレストといった従来の機械学習モデルと比較した。
以上の結果から,GCNモデルは,年間平均自転車数(AADB)を予測する上で,従来のモデルよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:18:23 GMT)
Is Best-of-N the Best of Them? Coverage, Scaling, and Optimality in Inference-Time Alignment [54.8] 推論時間計算は、言語モデルのパフォーマンスをスケーリングするための重要な軸を提供する。
我々は, (i) 応答品質, (ii) 計算量の観点から, 推論時アライメントアルゴリズムの性能を解析する。
我々は$textttInferenceTimePessimism$を紹介した。これは推論時間計算の故意使用を通じて報酬ハッキングを緩和する新しいアルゴリズムである。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:00:08 GMT)
Understanding the Logic of Direct Preference Alignment through Logic [54.3] 本稿では,単一モデルと参照モデルに基づくアプローチの選好損失を特徴付ける新しいフォーマリズムを提案する。
そこで我々は,この嗜好学習の形式的視点が,DPA損失景観の大きさと構造の両方に新たな光を当てていることを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:30:56 GMT)
Reinforced Model Merging [53.8] 本稿では,タスク統合に適した環境とエージェントを含むRMM(Reinforced Model Merging)という,革新的なフレームワークを提案する。
評価プロセス中にデータサブセットを利用することで、報酬フィードバックフェーズのボトルネックに対処し、RMMを最大100倍高速化する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:52:41 GMT)
VidBot: Learning Generalizable 3D Actions from In-the-Wild 2D Human Videos for Zero-Shot Robotic Manipulation [53.6] VidBotは、WildのモノクルなRGBのみの人間ビデオから学習した3Dアベイランスを使って、ゼロショットロボット操作を可能にするフレームワークである。
VidBotは、人間の日常的なビデオを利用してロボットの学習をよりスケーラブルにする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 21:33:39 GMT)
Efficient Multi-Instance Generation with Janus-Pro-Dirven Prompt Parsing [53.3] Janus-Pro-driven Prompt Parsingは、テキスト理解とレイアウト生成をブリッジするプロンプト解析モジュールである。
MIGLoRAはパラメータ効率の良いプラグインで、低ランク適応を UNet (SD1.5) と DiT (SD3) のバックボーンに統合する。
提案手法はパラメータ効率を維持しつつCOCOおよびLVISベンチマークの最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 00:59:14 GMT)
Mitigating Low-Level Visual Hallucinations Requires Self-Awareness: Database, Model and Training Strategy [53.1] 低レベル視覚タスクにおける幻覚に焦点を当てた最初のインストラクションデータベースを提案する。
低レベル視覚タスクにおけるモデルの知覚と理解能力を向上させるための自己認識障害除去(SAFEQA)モデルを提案する。
低レベルの視覚課題に対する総合的な実験を行い、提案手法がこれらの課題におけるモデルの自己認識を著しく向上し、幻覚を低減させることを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:04:02 GMT)
R-PRM: Reasoning-Driven Process Reward Modeling [53.1] プロセス・リワード・モデル(Process Reward Models, PRM)は、各推論ステップを評価することによって、有望なソリューションとして登場した。
既存のPRMは評価スコアを直接出力し、学習効率と評価精度の両方を制限する。
推論駆動プロセスリワードモデリング(R-PRM)を提案する。
R-PRMは限られたアノテーションからシードデータを生成し、効果的にモデルの推論能力をブートストラップします。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:23:08 GMT)
Harmonizing Visual Representations for Unified Multimodal Understanding and Generation [53.0] 我々は,共有MARエンコーダによる理解と生成タスクを調和させる統合自己回帰フレームワークであるemphHarmonを提案する。
HarmonはGenEval、MJHQ30K、WISEベンチマークで最先端の画像生成結果を達成する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:50:38 GMT)
Towards Better Alignment: Training Diffusion Models with Reinforcement Learning Against Sparse Rewards [52.9] 拡散モデル微調整では強化学習(RL)が検討されている。
RLの有効性はスパース報酬の挑戦によって制限される。
$textB2text-DiffuRL$は既存の最適化アルゴリズムと互換性がある。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:34:59 GMT)
Critical Iterative Denoising: A Discrete Generative Model Applied to Graphs [52.5] 本稿では, 個別拡散を単純化し, 時間とともに条件付き独立性を仮定することで問題を回避できる, イテレーティブ・デノナイジング(Iterative Denoising)という新しい枠組みを提案する。
実験により,提案手法はグラフ生成タスクにおいて既存の離散拡散ベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:08:58 GMT)
AssistPDA: An Online Video Surveillance Assistant for Video Anomaly Prediction, Detection, and Analysis [52.3] AssistPDAは,Anomaly Prediction, Detection and Analysis (VAPDA) を単一のフレームワークに統合した,初のオンラインビデオ異常監視アシスタントである。
AssistPDAは、インタラクティブなユーザエンゲージメントをサポートしながら、ストリーミングビデオのリアルタイム推論を可能にする。
また,新しい事象レベルの異常予測タスクを導入し,異常が完全に展開される前に前向きな異常予測を可能にする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:30:47 GMT)
BOLT: Boost Large Vision-Language Model Without Training for Long-form Video Understanding [51.5] 大規模ビデオ言語モデル (VLM) は様々なビデオ理解タスクにおいて有望な進歩を示した。
均一なフレームサンプリングのような伝統的なアプローチは、必然的に無関係なコンテンツにリソースを割り当てる。
本稿では,フレーム選択戦略の総合的研究を通じて,付加的なトレーニングを伴わずに大規模VLMをブーストする方法であるBOLTを紹介する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:18:40 GMT)
OVO-Bench: How Far is Your Video-LLMs from Real-World Online Video Understanding? [51.5] OVO-Benchは、高度なオンラインビデオ理解機能のための新しいベンチマークである。
12のタスクで構成され、644のユニークなビデオと、正確なタイムスタンプを備えた約2,800の細かいメタアノテーションで構成されている。
Video-LLMの9つの評価によると、従来のベンチマークの進歩にもかかわらず、現在のモデルはオンラインビデオ理解に苦戦している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:40:09 GMT)
ReCap: Better Gaussian Relighting with Cross-Environment Captures [51.3] ReCapは、目に見えない環境で正確な3Dオブジェクトのリライトを行うマルチタスクシステムである。
具体的には、ReCapは共通の属性のセットを共有する複数の照明表現を共同で最適化する。
これにより、相互の材料属性を囲むコヒーレントな照明表現の集合が自然に調和し、様々な物体の外観の共通点と相違点を利用する。
合理化されたシェーディング機能と効果的な後処理とともに、ReCapは、拡張されたリライトベンチマークにおいて、主要な競合企業すべてを上回っている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:50:26 GMT)
Exploring the Roles of Large Language Models in Reshaping Transportation Systems: A Survey, Framework, and Roadmap [51.2] 大型言語モデル(LLM)は、輸送上の課題に対処するための変革的な可能性を提供する。
LLM4TRは,交通におけるLSMの役割を体系的に分類する概念的枠組みである。
それぞれの役割について,交通予測や自律運転,安全分析,都市移動最適化など,さまざまな応用について検討した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:56:27 GMT)
Do Multimodal Large Language Models See Like Humans? [50.9] MLLM(Multimodal Large Language Models)は、様々なビジョンタスクにおいて、近年の大規模言語モデルの進歩を活用して、印象的な成果を上げている。
現在のベンチマークでは、この観点からMLLMを評価する能力がない。
MLLMと人間の視覚システムとの整合性を評価するための大規模ベンチマークであるHVSBenchを紹介する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:59:55 GMT)
Event-boosted Deformable 3D Gaussians for Dynamic Scene Reconstruction [50.9] 本稿では,高時間分解能連続運動データと動的シーン再構成のための変形可能な3D-GSを併用したイベントカメラについて紹介する。
本稿では、3次元再構成としきい値モデリングの両方を大幅に改善する相互強化プロセスを作成するGS-Thresholdジョイントモデリング戦略を提案する。
提案手法は,合成および実世界の動的シーンを用いた最初のイベント包摂型4Dベンチマークであり,その上で最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:14:32 GMT)
Low Stein Discrepancy via Message-Passing Monte Carlo [50.8] Message-Passing Monte Carlo (MPMC)は、幾何学的深層学習のツールを活用する新しい低差サンプリング手法として最近導入された。
このフレームワークを、既知の確率密度関数を持つ一般多変量確率分布からサンプルに拡張する。
提案手法であるStein-Message-Passing Monte Carlo (MPMC) は,カーネル化されたSteinの相違を最小限に抑え,試料品質の向上を図る。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:49:31 GMT)
Achieving >97% on GSM8K: Deeply Understanding the Problems Makes LLMs Better Solvers for Math Word Problems [50.8] CoT(Chain-of-Thought)のプロンプトにより、さまざまな推論タスクにわたるLLM(Large Language Models)のパフォーマンスが向上した。
CoTは通常、セマンティックな誤解エラー、計算エラー、ステップミスという3つの落とし穴に悩まされる。
意味的誤解の誤りに対処し,LLMの数学的問題解決能力を改善するために,DUP(Deeply Understanding the Problems)を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:08:33 GMT)
Contextual AD Narration with Interleaved Multimodal Sequence [50.2] このタスクは、視覚障害者が映画のような長めのビデオコンテンツにアクセスするのを助けるために、視覚障害者のための視覚要素の記述を作成することを目的としている。
ビデオ機能、テキスト、文字バンク、コンテキスト情報を入力として、生成されたADは名前で文字に対応することができる。
我々は、ADを生成するためのシンプルで統一されたフレームワークを通じて、事前訓練された基礎モデルを活用することを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:51:25 GMT)
Learning Multi-modal Representations by Watching Hundreds of Surgical Video Lectures [50.1] 手術用コンピュータビジョンの応用の最近の進歩は、視覚のみのモデルによって駆動されている。
これらの手法は、固定されたオブジェクトカテゴリのセットを予測するために手動で注釈付き手術ビデオに依存する。
本研究では,オープンな外科的eラーニングプラットフォームを通じて提供される外科的ビデオ講義が,効果的な視覚と言語監督の信号を提供することができるという考えを提起した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:37:03 GMT)
Automatically Adaptive Conformal Risk Control [50.0] 本稿では,テストサンプルの難易度に適応して,統計的リスクの近似的条件制御を実現する手法を提案する。
我々のフレームワークは、ユーザが提供するコンディショニングイベントに基づく従来のコンディショニングリスク制御を超えて、コンディショニングに適した関数クラスのアルゴリズム的、データ駆動決定を行う。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:19:28 GMT)
M-DocSum: Do LVLMs Genuinely Comprehend Interleaved Image-Text in Document Summarization? [49.5] 本稿では,LVLM(Large Vision-Language Models)が文書中のインターリーブ画像テキストを真に理解しているかどうかを検討する。
既存の文書理解ベンチマークは、しばしば質問応答形式を用いてLVLMを評価する。
マルチモーダル文書要約ベンチマーク(M-DocSum-Bench)について紹介する。
M-DocSum-Benchは500の高品質なarXiv論文と、人間の好みに合わせたインターリーブされたマルチモーダル要約で構成されている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:28:32 GMT)
Rate-reliability functions for deterministic identification [49.1] 正の指数に対して線形スケーリングが復元され、信頼指数の関数であるレートが復元される。
製品入力制限付き古典量子チャネルや量子チャネルに結果を拡張します。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:42:43 GMT)
Deterministic identification over channels with finite output: a dimensional perspective on superlinear rates [49.1] 有限出力であるが任意の入力アルファベットを持つメモリレスチャネルに対する一般性の問題を考える。
主な発見は、メッセージの最大長が$R,nlog n$、ブロック長$n$と超直線的にスケールすることである。
出力分布のペアの信頼性を保証し、DIコードを構築するのに十分であることを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:47:05 GMT)
FineCIR: Explicit Parsing of Fine-Grained Modification Semantics for Composed Image Retrieval [48.6] Composed Image Retrieval (CIR)は、参照画像と修正テキストからなるマルチモーダルクエリによる画像検索を容易にする。
既存のCIRデータセットは主に粗粒度修正テキスト(CoarseMT)を使用し、粗粒度検索意図を不適切にキャプチャする。
我々は、不正確な正のサンプルを最小化し、修正意図を正確に識別するCIRシステムの能力を向上する頑健なCIRデータアノテーションパイプラインを開発する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:34:21 GMT)
A Unified Image-Dense Annotation Generation Model for Underwater Scenes [48.3] 本稿では,水中のシーンに対して,テキスト・ツー・イメージ・デンスアノテーションを統一的に生成する手法を提案する。
テキストのみを入力とし、リアルな水中画像と高度に一貫性のある複数のアノテーションを同時に生成する。
TIDEを用いて大規模な水中データセットを合成し,水中密集予測における手法の有効性を検証した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:59:43 GMT)
Leveraging 3D Geometric Priors in 2D Rotation Symmetry Detection [48.1] 本稿では,中心軸を中心に回転する物体が変化しない回転対称性に着目する。
従来の手法は手作りの特徴マッチングに頼っていたが、最近の畳み込みニューラルネットワークに基づくセグメンテーションモデルは回転中心を検出するが、幾何学的整合性に苦慮している。
本研究では、3次元空間における回転中心と頂点を直接予測し、構造的整合性を維持しながら結果を2次元に投影するモデルを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:40:25 GMT)
Latency Minimization for UAV-Enabled Federated Learning: Trajectory Design and Resource Allocation [47.2] フェデレーテッド・ラーニング(FL)は、無線ネットワークにまたがる分散機械学習において、トランスフォーメーションパラダイムとなっている。
本研究では,無人航空機(UAV)を移動体サーバとして活用し,FL訓練プロセスを強化する新しい枠組みを提案する。
提案手法は,遅延を最大15.29%削減する既存のベンチマークスキームを超えるだけでなく,理想的なシナリオとほぼ一致したトレーニング効率も達成できることを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:35:16 GMT)
Not Just Object, But State: Compositional Incremental Learning without Forgetting [47.0] コンポジションインクリメンタルラーニング(composition-IL)という新しい課題を提案する。
これにより、段階的な学習方法で状態オブジェクトの合成全体を認識できる。
そこで我々は,不明瞭な構成境界問題を克服するために,プロンプトベースのコンポジションインクリメンタルラーナ (Compiler) を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:15:46 GMT)
Are We Solving a Well-Defined Problem? A Task-Centric Perspective on Recommendation Tasks [46.7] 我々はRecSysタスクの定式化を解析し、入力出力構造、時間力学、候補項目選択といった重要なコンポーネントを強調した。
本稿では,タスク特異性とモデル一般化可能性のバランスについて考察し,タスク定式化がロバストな評価と効率的なソリューション開発の基礎となることを明らかにする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:10:22 GMT)
Shared Global and Local Geometry of Language Model Embeddings [46.3] 言語モデルのトークン埋め込みは、一般的な幾何学的構造を示す。
局所幾何学は,(1)局所線形埋め込みを用いて,(2)各トークン埋め込みの内在次元の簡単な測度を定義することによって特徴付ける。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 01:17:06 GMT)
VIRES: Video Instance Repainting via Sketch and Text Guided Generation [46.2] VIRESは、スケッチとテキストガイダンスを備えたビデオインスタンス再描画方法である。
本稿では,自己スケーリングを標準化したSequential ControlNetを提案する。
スケッチ対応エンコーダは、再塗装された結果が提供されるスケッチシーケンスに一致していることを保証する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:17:44 GMT)
Reducing CT Metal Artifacts by Learning Latent Space Alignment with Gemstone Spectral Imaging Data [45.9] CTスライス中の金属人工物は、長い間医学的診断において課題を提起してきた。
本稿では,Latent Gemstone Spectral Imaging (GSI) Alignment Frameworkを紹介する。
我々の研究は、アーティファクトに影響を及ぼした普通のCTシーケンスでさえ、詳細な構造を特定するのに十分な情報を含んでいるという重要な発見に基づいている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:35:10 GMT)
HORIZON: a Classification and Comparison Framework for Pricing-driven Feature Toggling [45.8] 本稿では,価格駆動環境に適した機能トグルツールフレームワークであるHoriZONを紹介する。
それは、より堅牢で適応可能なソリューションの開発を導く、焦点を絞った研究アジェンダの基盤となる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:40:10 GMT)
SegMAN: Omni-scale Context Modeling with State Space Models and Local Attention for Semantic Segmentation [45.7] 高品質なセマンティックセグメンテーションは,グローバルコンテキストモデリング,ローカルディテールエンコーディング,マルチスケール機能抽出という,3つの重要な機能に依存している。
SegMANと呼ばれるハイブリッド機能エンコーダと状態空間モデルに基づくデコーダを組み合わせた新しい線形時間モデルであるSegMANを紹介する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:15:45 GMT)
Fine-Grained Evaluation of Large Vision-Language Models in Autonomous Driving [45.4] $textbfVLADBenchは、トラフィック知識理解、一般要素認識、トラフィックグラフ生成、ターゲット属性、意思決定と計画の5つの主要なドメインにまたがる。
このベンチマークにおける一般およびドメイン固有(DS)VLMの徹底的な評価は、ADコンテキストにおけるその強みと臨界限界の両方を明らかにしている。
実験の結果,提案したベンチマークは,ADにおけるVLMのより包括的評価に向けた重要なステップであり,より認知的に洗練され,推論可能なADシステムの開発への道を開いた。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:45:47 GMT)
X$^{2}$-Gaussian: 4D Radiative Gaussian Splatting for Continuous-time Tomographic Reconstruction [45.3] X$2$-Gaussianは、連続4DCT再構成のための新しいフレームワークである。
動的放射スプラッティングと自己監督型呼吸運動学習を統合している。
従来の手法に比べて9.93dBのPSNR向上と2.25dBの改善を実現している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:59:57 GMT)
RapidPoseTriangulation: Multi-view Multi-person Whole-body Human Pose Triangulation in a Millisecond [45.1] 本研究は,高速三角測量速度と優れた一般化機能に着目し,多視点多人数ポーズ推定を改善するアルゴリズムを提案する。
アプローチは全身のポーズ推定にまで拡張され、表情から複数の個人と視点にわたる指の動きまでの詳細を捉えている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:57:33 GMT)
How NeRFs and 3D Gaussian Splatting are Reshaping SLAM: a Survey [45.1] 本稿では、放射場における最新の進歩のレンズによるSLAMの進展について概観する。
背景、進化の道、固有の強さと限界に光を当て、ダイナミックな進歩と特定の課題を強調するための基本的な参照として機能する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:03:25 GMT)
Tricking Retrievers with Influential Tokens: An Efficient Black-Box Corpus Poisoning Attack [45.0] 検索増強された世代システムは、コーパス中毒の攻撃に対して脆弱である。
本稿では,動的重要度誘導型遺伝的アルゴリズム(DIGA)を提案する。
DIGAは既存の方法に比べて効率とスケーラビリティが優れている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:54:37 GMT)
MAR-3D: Progressive Masked Auto-regressor for High-Resolution 3D Generation [44.9] ピラミッド変分オートエンコーダとカスケードマスク自動回帰変換器を統合したMAR-3Dを提案する。
我々のアーキテクチャは、トレーニング中にランダムマスキングを採用し、推論中にランダムな順序で自動回帰化を行い、自然に3D潜在トークンの無秩序な性質を調節する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:39:55 GMT)
MANTRA: Enhancing Automated Method-Level Refactoring with Contextual RAG and Multi-Agent LLM Collaboration [44.8] 本稿では,包括的Large Language ModelsエージェントベースのフレームワークであるMANTRAを紹介する。
ManTRAは、コンテキスト対応検索強化生成、協調型マルチエージェントコラボレーション、および言語強化学習を統合している。
MANTRA はベースライン LLM モデルを大幅に上回ることを示す実験結果が得られた。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 01:43:06 GMT)
Exploring the Evolution of Physics Cognition in Video Generation: A Survey [44.3] この調査は、このギャップを埋めるためにアーキテクチャ設計とそのアプリケーションに関する包括的な概要を提供することを目的としている。
我々は、認知科学の観点から、映像生成における身体認知の進化過程を論じ、整理する。
筆者らは,(1)生成のための基本的な認識,(2)生成のための物理知識の受動的認知,(3)世界シミュレーションのための能動的認知という3段階の分類法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:58:33 GMT)
OmniSplat: Taming Feed-Forward 3D Gaussian Splatting for Omnidirectional Images with Editable Capabilities [44.3] 全方位画像のための訓練不要な高速フィードフォワード3DGS生成フレームワークであるOmniSplatを提案する。
我々はYin-Yangグリッドを採用し、それに基づいて画像を分解し、全方位画像と視点画像の領域ギャップを低減する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:20:25 GMT)
Adversarial Wear and Tear: Exploiting Natural Damage for Generating Physical-World Adversarial Examples [44.2] AdvWTは、物理世界の敵の新たなクラスである。
「自然に生ずる摩耗と涙の現象からインスピレーションを得る。」
本稿では,AdvWTがデジタルドメインと物理ドメインの両方で効果的に誤解を招くことを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:19:41 GMT)
Energy Minimization for Participatory Federated Learning in IoT Analyzed via Game Theory [43.7] 参加型センシングとフェデレーション学習の同時実施について検討する。
エネルギー最小化のグローバルな目的は、個々のノードの局所的支出の最適化と組み合わせられる。
シミュレーションネットワークシナリオにおける理論的枠組みと実験の両方に基づいて,この手法の広範な評価を行う。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:35:38 GMT)
Frequency-Guided Diffusion Model with Perturbation Training for Skeleton-Based Video Anomaly Detection [43.5] ビデオ異常検出(VAD)はコンピュータビジョンにおいて不可欠だが複雑なオープンセットタスクである。
摂動トレーニングを用いた新しい周波数誘導拡散モデルを提案する。
2次元離散コサイン変換(DCT)を用いて、高周波(局所)と低周波(球状)の運動成分を分離する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:03:14 GMT)
ZJUKLAB at SemEval-2025 Task 4: Unlearning via Model Merging [43.5] 本稿では,ZJUKLABチームによるSemEval-2025 Task 4: Unlearning Sensitive Content from Large Language Modelsを提案する。
本課題は,大規模言語モデルからセンシティブな知識を選択的に消去することを目的としている。
本稿では,2つの専門モデルとよりバランスのとれた未学習モデルを組み合わせることによって,モデルマージを活用するアンラーニングシステムを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:03:25 GMT)
Flip Learning: Weakly Supervised Erase to Segment Nodules in Breast Ultrasound [43.3] 正確なセグメンテーションのために2D/3Dボックスにのみ依存するFlip Learningと呼ばれる新しい学習ベースのWSSフレームワークを導入する。
ボックスからターゲットを消去して分類タグのフリップを容易にするために複数のエージェントが使用され、消去された領域が予測されたセグメンテーションマスクとして機能する。
提案手法は最先端のWSS手法や基礎モデルより優れており,完全教師付き学習アルゴリズムと同等の性能を発揮する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:16:16 GMT)
Data-Driven Law Firm Rankings to Reduce Information Asymmetry in Legal Disputes [43.0] 我々は,各訴訟を原告と被告の法律事務所間の競争ゲームとして扱う新たな格付け枠組みを導入する。
以上の結果から,既存の評価に基づくランキングは,実際の訴訟成功と相関が低いことが示唆された。
これらの知見は、より透明でデータ駆動による法的なパフォーマンス評価の基礎を確立している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 00:35:30 GMT)
FusionSegReID: Advancing Person Re-Identification with Multimodal Retrieval and Precise Segmentation [43.0] 人物再識別(ReID)は、セキュリティ監視や犯罪捜査などのアプリケーションにおいて、重複しないカメラによってキャプチャされた大きな画像ギャラリーの個人をマッチングすることで、重要な役割を果たす。
従来のReIDの手法は、通常画像のような単調な入力に依存するが、オクルージョン、照明の変更、バリエーションのポーズといった課題のために、制限に直面している。
本稿では,画像入力とテキスト入力を組み合わせたマルチモーダルモデルFusionSegReIDを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:14:03 GMT)
Automated Analysis of Pricings in SaaS-based Information Systems [42.9] 本稿では,これらの価格管理タスクを部分的にあるいは完全に支援する7つの分析操作を提案する。
提案手法はMiniZincを使った参照フレームワークで実装され、150以上の価格モデルでテストされ、ベンチマークの35の価格でエラーを特定する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:36:57 GMT)
DOF-GS: Adjustable Depth-of-Field 3D Gaussian Splatting for Post-Capture Refocusing, Defocus Rendering and Blur Removal [42.4] 我々は,有限開口カメラモデルと明示的で微分可能なデフォーカスレンダリングを備えた新しい3DGSベースのフレームワークであるDOF-GSを紹介する。
その結果, DOF-GSは, 撮影後再フォーカス, 調整可能なデフォーカス, 高品質なオールインフォーカスレンダリングをサポートすることがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:55:24 GMT)
LLMs generate structurally realistic social networks but overestimate political homophily [42.2] 生成AI、特に大規模言語モデル(LLM)は、ソーシャルネットワーク生成の新しい可能性を提供します。
ネットワーク生成のための3つのプロンプト手法を開発し、生成したネットワークを実際のソーシャルネットワーク群と比較する。
より現実的なネットワークは、LLMが1つのペルソナの関係を1度に構築する"ローカル"な手法で生成される。
また, 生成されたネットワークは, 密度, クラスタリング, 接続性, 次数分布など, 様々な特性で実ネットワークと一致していることがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:30:43 GMT)
Neuroplasticity in Artificial Intelligence -- An Overview and Inspirations on Drop In \& Out Learning [42.1] 我々は、神経新生、神経アポトーシス、神経可塑性が将来のAI進歩にどのように影響するかを探求する。
神経新生と再考のためのドロップイン'の概念を導入し,神経アポトーシスのための構造解析を行った。
我々は、この学際領域におけるより大きな研究努力を提唱することで締めくくる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:09:04 GMT)
Embodied-Reasoner: Synergizing Visual Search, Reasoning, and Action for Embodied Interactive Tasks [42.0] Embodied Reasonerは、o1スタイルの推論をインタラクティブなエボダイド検索タスクに拡張するモデルである。
我々は、64kの対話画像と90kの多様な思考プロセスを含む9.3kのコヒーレントな観測・推察軌道を合成する。
モデルの性能を段階的に向上する3段階のトレーニングパイプラインを開発している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:00:51 GMT)
Hacking quantum computers with row hammer attack [41.9] 利用可能な商用量子コンピュータ(IBM)におけるクロストーク効果を利用した量子コンピューティングシステムにおけるハードウェア脆弱性を実証する。
具体的には、特定の量子ゲートによって生成されたクロストークに基づいて、列ハンマーアタックを実装します。
その結果,ターゲット量子ビット近傍に印加した2量子演算はクロストークによって大きく影響し,その状態を効果的に改善することがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:14:08 GMT)
A Delphi Study on the Adaptation of SCRUM Practices to Remote Work [41.9] この研究は、新型コロナウイルスのパンデミックの前後で、リモートとハイブリッドの作業のためにスクラムのプラクティスがどのように調整されたかを探る。
予備的な重要な発見は、コミュニケーションが主要な課題であり、ミーティング構造、情報共有プラクティス、コラボレーションツールの調整につながります。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:17:02 GMT)
ClimbingCap: Multi-Modal Dataset and Method for Rock Climbing in World Coordinate [41.9] HMR (Human Motion Recovery) は、主にランニングなどの地上運動に焦点を当てた研究である。
登山運動データセットの不十分性に対処するため、大規模に注釈付きかつ挑戦的な登山運動データセットであるAscendMotionを収集する。
我々は,グローバル座標系における連続的な3次元人間のクライミング動作を再構成する動き回復手法であるClimbingCapを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:49:33 GMT)
ProReason: Multi-Modal Proactive Reasoning with Decoupled Eyesight and Wisdom [40.9] 本稿ではProReasonという新しいビジュアル推論フレームワークを紹介する。
ProReasonは、マルチランプロアクティブな知覚と分離されたビジョン推論機能を備えている。
実験の結果、ProReasonは既存のマルチステップ推論フレームワークとパッシブピアメソッドの両方より優れていることがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:07:19 GMT)
Delving Deep into Semantic Relation Distillation [40.9] 本稿では,セマンティックスに基づく関係知識蒸留法(SeRKD)を提案する。
SeRKDは、各サンプルのセマンティクス関連レンズを通して知識蒸留を再現する。
スーパーピクセルに基づく意味抽出と関係に基づく知識蒸留を統合し、洗練されたモデル圧縮と蒸留を行う。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:50:40 GMT)
Joint Estimation and Prediction of City-wide Delivery Demand: A Large Language Model Empowered Graph-based Learning Approach [40.4] 電子商取引と都市化の進展は、都市部における配送業務を著しく強化した。
データ駆動予測手法、特に機械学習技術を利用した手法は、これらの複雑さを扱うために登場した。
本稿では,この問題を伝達可能なグラフ時間に基づく学習タスクとして定式化する。
中国とアメリカの8都市を含む2つの実世界の配送データセットに関する総合的な実証的評価結果から、我々のモデルは、精度、効率、転送性において最先端のベースラインを大幅に上回っていることが示された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:41:54 GMT)
Towards a Design Guideline for RPA Evaluation: A Survey of Large Language Model-Based Role-Playing Agents [40.2] ロールプレイングエージェント(Role-Playing Agent、RPA)は、様々なタスクにおいて人間のような振る舞いをシミュレートするLLMエージェントの一種である。
RPAの評価は多様なタスク要件とエージェント設計のために難しい。
本稿では, LLM に基づく RPA のためのエビデンスベース, 動作可能, 汎用的な評価設計ガイドラインを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:07:19 GMT)
Fwd2Bot: LVLM Visual Token Compression with Double Forward Bottleneck [40.2] 本稿では,LVLM自体を用いて視覚情報をタスクに依存しない方法で圧縮する,Fwd2Botという新しい圧縮手法を提案する。
Fwd2Botは、生成タスクと識別タスクの両方に適した高度に不変な圧縮表現をもたらす。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:57:07 GMT)
Rethinking Training for De-biasing Text-to-Image Generation: Unlocking the Potential of Stable Diffusion [39.8] 既存の脱バイアス技術は追加の訓練に大きく依存している。
これにより、現実世界のアプリケーションに広く採用されるのを妨げます。
本稿では,少数地域にランダムノイズを誘導する「弱誘導」という新しい脱バイアス手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:52:45 GMT)
iTool: Boosting Tool Use of Large Language Models via Iterative Reinforced Fine-Tuning [39.7] 大規模な言語モデルを外部ツールで拡張することは、その能力を強化するための有望なアプローチである。
その結果, 合成データの増加に伴い, トレーニングは著しく低下することがわかった。
本稿では,これらの課題を軽減するために,反復的に強化された微調整戦略を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:05:03 GMT)
Optimizing Multi-DNN Inference on Mobile Devices through Heterogeneous Processor Co-Execution [39.0] Deep Neural Networks(DNN)は、さまざまな産業に展開され、モバイルデバイスのサポートの需要が高まっている。
既存のモバイル推論フレームワークは、ハードウェアの使用を制限し、最適性能とエネルギー効率を引き起こすため、モデルごとにひとつのプロセッサに依存していることが多い。
本稿では,モバイルヘテロジニアスプロセッサ上でのマルチDNN推論を最適化するためのAdvanced Multi-DNN Model Scheduling (ADMS) 戦略を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:03:09 GMT)
HS-SLAM: Hybrid Representation with Structural Supervision for Improved Dense SLAM [38.8] NeRFベースのSLAMは、最近、追跡と再構築において有望な成果を上げている。
これらの問題に対処するためにHS-SLAMを提案する。
本稿では,ハッシュグリッド,トリプレーン,ワンブロブの相補的強みを組み合わせたハイブリッド符号化ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:59:54 GMT)
ReaRAG: Knowledge-guided Reasoning Enhances Factuality of Large Reasoning Models with Iterative Retrieval Augmented Generation [38.6] 大きな推論モデル(LRM)は、顕著な推論能力を示すが、主にパラメトリック知識に依存し、事実の正確性を制限する。
本稿では,過剰な反復を伴わない多様なクエリを探索する,事実性強化推論モデルReaRAGを提案する。
我々の研究は、レトリーバル強化世代(RAG)のロバスト推論を効果的に統合しつつ、LRMの事実性を向上する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:44:18 GMT)
FaceBench: A Multi-View Multi-Level Facial Attribute VQA Dataset for Benchmarking Face Perception MLLMs [38.2] MLLMの包括的顔認識能力を評価するために,階層的マルチビューとマルチレベル属性を備えたデータセットであるFaceBenchを紹介する。
この構造に基づいて、提案したFaceBenchは、評価のための49,919の視覚的質問応答(VQA)ペアと、微調整のための23,841のペアで構成されている。
さらに,提案した顔VQAデータを用いて,ロバストな顔認識MLLMベースラインであるFace-LLaVAを開発した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:45:44 GMT)
Bayesian Pseudo Posterior Mechanism for Differentially Private Machine Learning [38.1] 異なるプライバシ(DP)は、デプロイされた機械学習アプリケーションにとってますます重要になっています。
擬似後続分布を用いた学習モデルSWAG-PPMのための拡張性のあるDP機構を提案する。
SWAG-PPMは、私的でないコンパレータに対してわずかに機能劣化しか示さないが、同様のプライバシー予算のために業界標準のDP-SGDを大きく上回っている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:17:05 GMT)
Learning to Represent Individual Differences for Choice Decision Making [38.0] 我々は、表現学習を用いて、経済的な意思決定タスクにおいて、人のパフォーマンスの個人差を特徴づける。
表現学習を用いて個人差を捉えたモデルは、決定予測を一貫して改善することを示した。
この結果から,表現学習は個人差を捉えるのに有用で柔軟なツールであることが示唆された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:10:05 GMT)
Training-free Diffusion Acceleration with Bottleneck Sampling [37.9] Bottleneck Samplingは、低解像度の事前処理を活用して、出力の忠実さを維持しながら計算オーバーヘッドを低減する、トレーニング不要のフレームワークである。
画像生成に最大3$times$、ビデオ生成に2.5$times$、標準のフル解像度サンプリングプロセスに匹敵する出力品質を維持しながら、推論を加速する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:05:19 GMT)
From User Preferences to Optimization Constraints Using Large Language Models [37.9] 本研究は,Large Language Models (LLMs) を用いて,ユーザの好みを家電機器のエネルギー最適化制約に変換することを目的とする。
再生可能エネルギーコミュニティにおいて,自然言語利用者の発話をスマート家電の形式的制約に転換する作業について述べる。
我々は,古典的なゼロショット,ワンショット,少数ショットの学習設定に頼って,これらの好みを翻訳する上で,現在イタリアで利用可能な様々なLLMの有効性を評価する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:52:10 GMT)
ReSearch: Learning to Reason with Search for LLMs via Reinforcement Learning [37.2] 本稿では,強化学習を通じてLLMをReason with Searchに学習するフレームワークであるReSearchを提案する。
提案手法では,検索操作を推論チェーンの不可欠な要素として扱う。
分析によると、ReSearchは自然にリフレクションや自己訂正のような高度な推論機能を引き出す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:56:31 GMT)
Learning Class Prototypes for Unified Sparse Supervised 3D Object Detection [36.9] 本研究では,屋内および屋外の両方のシーンを対象としたスパース制御3次元物体検出手法を提案する。
ScanNet V2, SUN RGB-D, KITTIの完全監視検出器と比較して, 約78%, 90%, 96%の性能が得られた。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:37:05 GMT)
CLAIMCHECK: How Grounded are LLM Critiques of Scientific Papers? [36.8] CLAIMCHECKは、NeurIPS 2023と2024のアノテートデータセットであり、OpenReviewから抽出されたレビューである。
CLAIMCHECKは、レビューの弱点に関するMLの専門家によって豊富な注釈が付けられており、論文は、それらが矛盾していると主張しており、また、識別された弱点の妥当性、客観性、タイプに関するきめ細かいラベルも主張している。
我々は,CLAIMCHECK が支援する3つのクレーム中心タスクについて,(1) 紛争のクレームに弱点を関連付けること,(2) 弱点のきめ細かいラベルを予測し,その特異性を高めるために弱点を書き換えること,(3) 根拠付き推論で論文のクレームを検証すること,の3つについて,LCM をベンチマークする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:29:45 GMT)
Progressive Rendering Distillation: Adapting Stable Diffusion for Instant Text-to-Mesh Generation without 3D Data [36.6] テキストプロンプトから高品質な3Dメッシュを数秒で生成することが望ましい。
最近の試みでは、安定拡散(SD)のような事前訓練されたテキスト-画像拡散モデルが3次元表現のジェネレータ(トリプレーンなど)に応用されている。
本稿では,プログレッシブレンダリング蒸留(PRD)と呼ばれる新しいトレーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:59:15 GMT)
VideoMix: Aggregating How-To Videos for Task-Oriented Learning [36.2] VideoMixは、ユーザーがタスク上の複数のビデオから情報を集約することでハウツータスクの全体的理解を得るのを助けるシステムである。
Vision-Language Modelパイプラインによって提供されるVideoMixはこの情報を抽出し、整理し、関連するビデオクリップとともに簡潔なテキスト要約を提示する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:43:02 GMT)
Deep Cut-informed Graph Embedding and Clustering [36.2] 我々は,革新的で非GNNベースのDeep Cut-informed Graph Embedding and Clusteringフレームワーク,すなわちDCGCを提案する。
符号化モジュールに対しては,その結合正規化カットを最小化することにより,グラフ構造と属性を融合させる,カットインフォームドグラフ埋め込みの目的を導出する。
クラスタリングモジュールでは,クラスタリングの割り当てを得るために最適な輸送理論を利用する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:44:59 GMT)
Visual Jenga: Discovering Object Dependencies via Counterfactual Inpainting [35.6] 視覚ジェンガと呼ばれるシーン理解タスクを提案する。
提案したタスクは、背景だけが残るまで、単一のイメージからオブジェクトを段階的に削除することである。
実世界のさまざまな画像に対して驚くほど効果的である,データ駆動型トレーニングフリーなアプローチを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:59:33 GMT)
GMAI-VL & GMAI-VL-5.5M: A Large Vision-Language Model and A Comprehensive Multimodal Dataset Towards General Medical AI [34.8] 我々は,3段階のトレーニング戦略を持つ一般的な医用視覚言語モデルであるGMAI-VLを開発した。
GMAI-VLは様々なマルチモーダル医療タスクにおいて最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:24:29 GMT)
Q-MambaIR: Accurate Quantized Mamba for Efficient Image Restoration [34.4] 状態空間モデル(SSM)は、画像復元(IR)において大きな注目を集めている。
Q-MambaIRは、IRタスクのための正確で効率的で柔軟な量子マンバである。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:34:11 GMT)
MouseGPT: A Large-scale Vision-Language Model for Mouse Behavior Analysis [33.3] 視覚的手がかりを自然言語と統合してマウスの行動解析に革命をもたらす視覚言語モデル(VLM)であるマウスGPTを紹介する。
我々の全体分析フレームワークは、詳細な行動プロファイリング、クラスタリング、新しい行動発見を可能にし、労働を必要とせずに深い洞察を提供する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:38:37 GMT)
Optimizing Large Model Training through Overlapped Activation Recomputation [33.3] 我々は、トレーニングパイプラインにおける通信と重複する再計算によってオーバーヘッドを削減する新しい再計算フレームワークであるLynxを紹介する。
1.3B-23Bパラメータを持つGPTモデルによる包括的評価の結果,Lynxは既存の再計算手法よりも1.37倍高い性能を示した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:52:35 GMT)
Recurrent Feature Mining and Keypoint Mixup Padding for Category-Agnostic Pose Estimation [33.2] カテゴリーに依存しないポーズ推定は、任意の新規クラスに対するいくつかの注釈付きサポート画像に従って、クエリ画像上のキーポイントを見つけることを目的としている。
本稿では,FGSAの機能をサポートとクエリの両方から再検討する,新しい簡潔なフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:09:13 GMT)
Locally minimax optimal and dimension-agnostic discrete argmin inference [33.2] 高次元環境下での離散アルグミン推論問題を再検討する。
我々は、$d$が$n$でスケールするかどうかに関わらず、妥当性を維持する次元に依存しないテストを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:06:07 GMT)
DefectFill: Realistic Defect Generation with Inpainting Diffusion Model for Visual Inspection [32.8] DefectFillは、いくつかの参照欠陥画像のみを必要とする、現実的な欠陥生成のための新しい方法である。
詳細でローカライズされた欠陥機能の正確なキャプチャと、欠陥のないオブジェクトへのシームレスな統合を可能にする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:23:02 GMT)
ScalingNoise: Scaling Inference-Time Search for Generating Infinite Videos [32.1] ビデオ拡散モデル(VDM)は高品質のビデオの生成を容易にする。
近年,映像の質を高める「金音」の存在が報告されている。
本研究では,拡散サンプリングプロセスにおける黄金の初期雑音を識別する,プラグアンドプレイの推論時間探索手法であるScalingNoiseを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:12:43 GMT)
Unleashing the Potential of Large Language Models for Text-to-Image Generation through Autoregressive Representation Alignment [32.1] 本稿では,自己回帰表現アライメント(ARRA, Autoregressive Representation Alignment)を提案する。
ARRAは、グローバルな視覚的アライメント損失とハイブリットトークンHYB>を介して、外部視覚モデルからの視覚的表現と隠れ状態のアライメントを行う。
コードとモデルがリリースされ、自動回帰画像生成が進められる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:37:03 GMT)
Temporal-Guided Spiking Neural Networks for Event-Based Human Action Recognition [31.5] 本稿では、プライバシ保護人間行動認識(HAR)のための、ニューラルネットワーク(SNN)とイベントベースのカメラとの有望な相互作用について検討する。
時間セグメントベースSNN(textitTS-SNN)と3D畳み込みSNN(textit3D-SNN)の2つの新しいフレームワークを紹介した。
イベントベースHARにおけるさらなる研究を促進するため、高解像度のCeleX-Vイベントカメラを用いて収集したデータセット、textitFallingDetection-CeleXを作成する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:35:37 GMT)
Debiased Offline Representation Learning for Fast Online Adaptation in Non-stationary Dynamics [31.5] 高速オンライン適応(DORA)のためのデバイアスドオフライン表現(Debiased Offline Representation)という新しいアプローチを導入する。
DORAは、動的エンコーディングと環境データの間の相互情報を最大化する情報ボトルネック原理を取り入れている。
本稿では,情報ボトルネック原理のトラクタブルバウンダリを活用したDORAの実践的実装を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:46:17 GMT)
LANTERN++: Enhancing Relaxed Speculative Decoding with Static Tree Drafting for Visual Auto-regressive Models [31.2] LANTERN++は、静的ツリーのドラフトと、調整された緩和された受け入れ条件を統合するフレームワークである。
最先端のビジュアルARモデルの実験では、LANTERN++は推論を著しく加速し、標準的なARデコーディングよりも最大$mathbftimes 2.56$のスピードアップを実現している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:53:23 GMT)
UI-R1: Enhancing Action Prediction of GUI Agents by Reinforcement Learning [31.0] ルールベースの強化学習は、グラフィックユーザインタフェース(GUI)アクション予測タスクのためのマルチモーダル大言語モデル(MLLM)の推論能力を高めることができる。
我々はルールベースのアクション報酬を導入し、ポリシーベースのアルゴリズムによるモデル最適化を可能にした。
実験の結果,提案したデータ効率モデルであるUI-R1-3Bは,ドメイン内(ID)タスクとドメイン外(OOD)タスクの両方を大幅に改善することがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:39:30 GMT)
Towards Complementary Knowledge Distillation for Efficient Dense Image Prediction [31.0] 知識蒸留(KD)フレームワークを用いて訓練した小型高効率高密度画像予測(EDIP)モデルは,2つの課題に直面することが明らかとなった。
EDIPのKDフレームワーク内で, 相補的境界とコンテキスト蒸留(BCD)法を提案する。
我々の手法は、余分な監督や推論コストの増大を必要とせず、既存の手法よりも優れている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 01:07:52 GMT)
Recovering Dynamic 3D Sketches from Videos [30.9] Liv3Strokeは、変形可能な3Dストロークで動作中のオブジェクトを抽象化する新しいアプローチである。
まず,映像フレームから3Dポイント・クラウド・モーション・ガイダンスを意味的特徴を用いて抽出する。
提案手法は, 自然な3次元表現の集合として本質的な運動特徴を抽象化する曲線の集合を変形する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:31:57 GMT)
Time and Memory Trade-off of KV-Cache Compression in Tensor Transformer Decoding [30.8] テンソルバージョンにおけるキー値キャッシュは、推論中に重大なボトルネックを示す。
我々の研究は、テンソルアテンションバージョンによる空間複雑性障壁を一般化する。
全体として、我々の研究は、テンソルアテンションデコーディングにおけるKVキャッシュ圧縮の時間メモリトレードオフを理解するための理論的基盤を提供する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:02:19 GMT)
A Survey on Self-play Methods in Reinforcement Learning [30.6] エージェントとコピーや過去のバージョンとの相互作用を特徴とするセルフプレイは、近年、強化学習において注目されている。
本稿では,マルチエージェント強化学習フレームワークやゲーム理論の基本概念を含む,自己プレイの予備的概念を明らかにする。
統合されたフレームワークを提供し、このフレームワーク内で既存のセルフプレイアルゴリズムを分類する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:42:00 GMT)
Rethinking Graph Structure Learning in the Era of LLMs [29.9] Large Language and Tree Assistant (LLaTA)は、大きな言語モデルをグラフ表現に統合する効率的な方法である。
LLaTAは,任意のバックボーンを組み込んだ柔軟性とスケーラビリティを享受し,効率性の観点から他のLCMベースのGSL法よりも優れていることを示す。
10のTAGデータセットの実験では、LLaTAが柔軟性(バックボーン、スケーラビリティ)を享受していることが、実行効率の面で他のLLMベースのGSLメソッドよりも優れていることが示されている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:28:30 GMT)
Leveraging Textual Anatomical Knowledge for Class-Imbalanced Semi-Supervised Multi-Organ Segmentation [29.7] 3D画像に注釈をつけるには、相当な時間と専門知識が必要である。
臓器の複雑な解剖学的構造は、しばしば大きなクラス不均衡を引き起こす。
本稿では,テキスト解剖学的知識(TAK)をセグメンテーションモデルに統合する手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:23:15 GMT)
uLayout: Unified Room Layout Estimation for Perspective and Panoramic Images [29.3] 両視点およびパノラマ画像から部屋配置を推定するための統一モデルであるUvolutionを提案する。
我々の解の鍵となる考え方は、両方の領域を等角射影に統一することである。
両ドメインに1つのエンドツーエンドモデルを示すのは,今回が初めてです。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:47:05 GMT)
Stable-SCore: A Stable Registration-based Framework for 3D Shape Correspondence [29.2] 本稿では,3次元形状対応のための安定登録型フレームワークであるStable-SCoreを紹介する。
まず,信頼性と安定した2次元マッピングを実現する2次元文字対応基盤モデルについて検討する。
本稿では,メッシュ変形をガイドする2次元対応を利用したセマンティックフローガイドレジストレーション手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:59:02 GMT)
AdaMHF: Adaptive Multimodal Hierarchical Fusion for Survival Prediction [29.1] AdaMHFは、効率的で包括的で調整された特徴抽出と融合のために設計されたフレームワークである。
これは医療データのユニークさに特化しており、最小限のリソース消費で正確な予測を可能にする。
TCGAデータセットに対する大規模な実験は、AdaMHFが現在の最先端の手法を超越していることを示している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:27:55 GMT)
LongViTU: Instruction Tuning for Long-Form Video Understanding [28.9] 本稿では,映像理解のための大規模データセットであるLongViTUを紹介する。
本稿では,映像を階層木構造に整理してQA生成を行う手法を提案する。
各QAペアに対して、関連するイベントのタイムスタンプアノテーションを明示的に提供します。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:39:11 GMT)
RainyGS: Efficient Rain Synthesis with Physically-Based Gaussian Splatting [28.6] オープンワールドシーンにおける動的降雨効果を物理的精度で生成する新しい手法であるRainyGSを紹介した。
提案手法の核となるのは,高速な3DGSレンダリングフレームワークにおいて,物理的雨滴と浅水シミュレーション技術の統合である。
本手法は,30fps以上の降雨効果の合成をサポートし,降雨強度を柔軟に制御する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:35:03 GMT)
VALLR: Visual ASR Language Model for Lip Reading [28.6] リップレディング(Lip Reading)または視覚自動音声認識(Visual Automatic Speech Recognition)は、視覚的手がかりからのみ音声言語の解釈を必要とする複雑なタスクである。
視覚自動音声認識(V-ASR)のための新しい2段階音素中心のフレームワークを提案する。
まず,CTCヘッドを用いたビデオ変換器を用いて,視覚入力から音素のコンパクトな列を予測する。
この音素出力は、コヒーレントな単語と文を再構成する微調整された大言語モデル(LLM)への入力として機能する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:52:08 GMT)
SMAFormer: Synergistic Multi-Attention Transformer for Medical Image Segmentation [28.5] SMAFormerはトランスフォーマーをベースとしたアーキテクチャで,腫瘍や臓器のセグメンテーションを強化するために複数の注意機構を融合する。
SMAFormerは、医療画像セグメンテーションのローカル機能とグローバル機能の両方をキャプチャできる。
われわれは多臓器,肝腫瘍,膀胱腫瘍の分節化など,様々な医療画像の分節化作業について広範な実験を行い,その結果を得た。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:36:39 GMT)
Video-R1: Reinforcing Video Reasoning in MLLMs [28.0] Video-R1は、マルチモーダルな大言語モデル内でビデオ推論を行うためのR1パラダイムを体系的に探求する最初の試みである。
まず,T-GRPOアルゴリズムを提案する。
ビデオデータのみに頼るのではなく、高品質の画像推論データをトレーニングプロセスに組み込む。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:59:51 GMT)
VideoHandles: Editing 3D Object Compositions in Videos Using Video Generative Priors [27.7] 静止画とカメラモーションの映像の3Dオブジェクト合成を編集する手法として名前を提案する。
提案手法では,ビデオの全フレームにわたる3次元オブジェクトの位置を時間的に一貫した方法で編集することができる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 00:01:50 GMT)
StableMamba: Distillation-free Scaling of Large SSMs for Images and Videos [27.6] 状態空間モデル(SSM)は、状態空間の技術を深層学習に組み込むことにより、新しい文脈モデリング手法を導入した。
マンバベースのアーキテクチャは、パラメータの数に関してスケールが難しいため、ビジョンアプリケーションにとって大きな制限となる。
本稿では,拡張性,堅牢性,性能を向上させるMamba-Attentionインターリーブアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:45:04 GMT)
Prethermalization by Random Multipolar Driving on a 78-Qubit Superconducting Processor [27.1] 非周期駆動系の長寿命予熱相とチューナブル加熱速度の初回実験を行った。
我々の研究は、超伝導量子プロセッサを、駆動系における物質の非平衡相を探索するための強力なプラットフォームとして評価する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:40:09 GMT)
Towards Generating Realistic 3D Semantic Training Data for Autonomous Driving [27.1] 自律運転では、3Dセマンティックセグメンテーションが安全なナビゲーションを可能にする重要な役割を果たす。
3Dデータの収集と注釈付けの複雑さは、この開発のボトルネックである。
本稿では,3次元のセマンティック・シーン・スケールのデータを投影モデルやデカップリングモデルに頼らずに生成する手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:41:42 GMT)
Controlling Large Language Model with Latent Actions [27.0] 強化学習(Reinforcement Learning)を用いた下流タスクへの大規模言語モデルの適用は、効果的なアプローチであることが証明されている。
本稿では,LLMの制御性と探索性を高めるために,コンパクトな潜在動作空間を学習する。
我々は,遅延アクション空間を事前学習したLLMに統合するフレームワークである潜在アクションを用いた大規模言語モデル制御(CoLA)を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:25:22 GMT)
Video-Panda: Parameter-efficient Alignment for Encoder-free Video-Language Models [26.9] 本稿では,計算オーバーヘッドを大幅に削減しつつ,競争性能を向上するビデオ言語理解のための効率的なエンコーダレス手法を提案する。
本稿では,ビデオ入力を直接処理する時空間アライメントブロック(STAB)を提案する。
本モデルでは,標準ベンチマークによるオープンエンドビデオ質問応答に対して,エンコーダに基づくアプローチに匹敵する,あるいは優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:40:40 GMT)
Beyond Believability: Accurate Human Behavior Simulation with Fine-Tuned LLMs [26.5] 近年の研究では、LSMは人間の行動をシミュレートして、プロンプトのみの手法でLSMエージェントに電力を供給できることが示されている。
我々は Web アクション生成タスクにおいて,主観的信頼性よりも LLM の客観的精度を評価することに注力する。
本稿では,Web アクション生成タスクにおける最先端 LLM の総合的定量的評価について述べる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:42:03 GMT)
The Promise and Pitfalls of WebAssembly: Perspectives from the Industry [26.4] WebAssembly(Wasm)は2017年に提案され、JavaScriptの補完と見なされている。
実際に採用されたWasmバイナリを大規模に測定する研究は行われていない。
我々は、業界の観点からそれらのステータスを特徴付けるために、史上最大のデータセットを収集します。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:01:22 GMT)
Enhancing LLM-based Code Translation in Repository Context via Triple Knowledge-Augmented [25.8] 大規模言語モデル(LLM)は、リポジトリレベルのコンテキストなしで関数レベルのコード変換でうまく振る舞っている。
我々は,3つの知識を付加したK-Transを提案し,レポジトリコンテキスト下でのLLMの翻訳品質を向上させる。
実験の結果、K-Transは、CodeBLEUのpass@1と0.138の相対的な改善により、以前の研究に適合したベースラインを19.4%/40.2%で大幅に上回っている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:16:23 GMT)
Evaluation-Driven Development of LLM Agents: A Process Model and Reference Architecture [25.8] 大規模言語モデル(LLM)は、未特定目標を達成することができる自律システムの出現を可能にした。
本稿では,テスト駆動型および行動駆動型開発に触発された評価駆動型開発手法を提案する。
我々のアプローチは、オンライン(ランタイム)とオフライン(再開発)の評価を統合し、適応的なランタイム調整を可能にします。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:02:18 GMT)
A Survey on Computational Solutions for Reconstructing Complete Objects by Reassembling Their Fractured Parts [25.6] 完全な対象をその部分から再構成することは、多くの科学領域における根本的な問題である。
この文脈で既存のアルゴリズムを提供し、それらの類似点と汎用アプローチとの相違点を強調する。
アルゴリズムに加えて、この調査では既存のデータセット、オープンソースソフトウェアパッケージ、アプリケーションについても記述する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:45:43 GMT)
Composable Prompting Workspaces for Creative Writing: Exploration and Iteration Using Dynamic Widgets [25.4] 動的ウィジェットを用いたテキスト探索のためのコンポーザブルプロンプトキャンバスを提案する。
ユーザーはシステム提案、プロンプト、手動でタスク関連ファセットをキャプチャすることでウィジェットを生成する。
われわれのデザインはCreative Support Indexのベースラインを大きく上回った。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:36:47 GMT)
Entropy-Aware Branching for Improved Mathematical Reasoning [25.4] 大規模言語モデル(LLM)は、広範囲な事前学習と微調整によって効果的に整列する。
モデル出力分布において,高いエントロピーおよびエントロピーのばらつきを示すトークンにおいて,エラーが発生する可能性が高くなる。
本稿では,要求に応じて生成プロセスを動的に分岐する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:18:22 GMT)
RatBodyFormer: Rat Body Surface from Keypoints [25.0] そこで本研究では,ラットの体表面を高密度な点集合として再構築する最初の手法を提案する。
ひとつは、ラットの行動キャプチャーのための新しいマルチカメラシステムであるRatDomeと、3Dキーポイントと3Dボディサーフェスポイントからなる大規模なデータセットである。
第二のRatBodyFormerは、検出されたキーポイントを3Dボディサーフェスポイントに変換する新しいネットワークだ。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 01:58:34 GMT)
FakeReasoning: Towards Generalizable Forgery Detection and Reasoning [24.9] フォージェリ検出・推論タスク(FDR-Task)としてのAI生成画像の検出と説明のモデル化を提案する。
10つの生成モデルにわたる100K画像を含む大規模データセットであるMulti-Modal Forgery Reasoning dataset (MMFR-Dataset)を紹介する。
また、FakeReasoningという2つの重要なコンポーネントを持つ偽検出および推論フレームワークも提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:54:06 GMT)
UGen: Unified Autoregressive Multimodal Model with Progressive Vocabulary Learning [24.8] UGenは統合された自己回帰型マルチモーダルモデルであり、テキスト処理、画像理解、画像生成タスクを同時に行う強力なパフォーマンスを示す。
統一マルチモーダル学習に関連する課題に対処するために、UGenは、新しいメカニズム、すなわちプログレッシブ語彙学習を用いて訓練される。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:19:29 GMT)
ManipTrans: Efficient Dexterous Bimanual Manipulation Transfer via Residual Learning [24.7] シミュレーションにおいて,ヒトの両腕のスキルを手指に伝達する新しい手法であるManipTransを紹介した。
実験によると、ManipTransは成功率、忠実度、効率性において最先端の手法を超越している。
DexManipNetという大規模なデータセットも作成しています。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:50:30 GMT)
Systematic Knowledge Injection into Large Language Models via Diverse Augmentation for Domain-Specific RAG [24.7] Retrieval-Augmented Generation (RAG) は、Large Language Models (LLM) にドメイン知識を組み込む重要な手法として登場した。
本稿では,学習データを2つの方法で強化することで,微調整プロセスを大幅に強化する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:31:39 GMT)
GenFusion: Closing the Loop between Reconstruction and Generation via Videos [24.2] 本稿では,再現性のあるRGB-Dレンダリングにおける映像フレームの条件付けを学習する再構成駆動型ビデオ拡散モデルを提案する。
また、生成モデルからトレーニングセットへの復元フレームを反復的に追加する循環核融合パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:16:24 GMT)
VideoMage: Multi-Subject and Motion Customization of Text-to-Video Diffusion Models [24.0] VideoMageは、ユーザーが提供する画像やビデオからパーソナライズされたコンテンツをキャプチャするために、被写体とモーションのLoRAを使用している。
所望の動作パターンの中で被験者間の相互作用を導くための時空間合成手法を開発した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:59:58 GMT)
BACON: Improving Clarity of Image Captions via Bag-of-Concept Graphs [23.8] 本稿では,VLM生成キャプションを関係,スタイル,テーマなどの構造化要素に分解するプロンプト手法であるBACONを提案する。
BACON方式のキャプションは,様々なモデルに適用した場合の明瞭度が向上し,従来は達成不可能であったタスクを達成できたり,既存のSOTAソリューションをトレーニングなしで超えることができた。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:06:25 GMT)
Unveiling the Potential of Superexpressive Networks in Implicit Neural Representations [23.6] 「超表現ネットワークは、幅、深さ、高さの付加次元を特徴とする特化されたネットワーク構造を用いる。」
超表現的ネットワークは、高特殊化非線形アクティベーション関数を用いた近年の暗黙的ニューラル表現を超越することができることを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:36:12 GMT)
ChatAnyone: Stylized Real-time Portrait Video Generation with Hierarchical Motion Diffusion Model [23.6] 我々は,表現力とフレキシブルなビデオチャットが可能な,リアルタイムのポートレートビデオ生成のための新しいフレームワークを提案する。
第1段階は効率的な階層的な動き拡散モデルであり、明示的および暗黙的な動きの表現を考慮に入れている。
第2ステージは、手の動きを含む上半身の動きを特徴とするポートレートビデオを作成することを目的としている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:18:53 GMT)
Geometry Field Splatting with Gaussian Surfels [23.4] 我々は、最近の研究で提案された不透明曲面の幾何学的場を利用して、体積密度に変換することができる。
ガウス核やウェーバを体積よりも幾何場に適応させ、不透明な固体の正確な再構成を可能にする。
広範に使用されているデータセット上で再構成された3次元表面の質が大幅に向上したことを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:22:49 GMT)
Cultivating Game Sense for Yourself: Making VLMs Gaming Experts [23.4] ゲームプレイエージェント設計におけるパラダイムシフトを提案する。
ゲームプレイを直接制御する代わりに、VLMは射撃や戦闘などのタスクに適した特殊な実行モジュールを開発する。
これらのモジュールはリアルタイムゲームインタラクションを処理し、VLMをハイレベルな開発者に高める。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:40:47 GMT)
Passenger hazard perception based on EEG signals for highly automated driving vehicles [23.3] 本研究は,乗用車間相互作用の神経機構を解明し,乗用車認知モデル(PCM)と乗用車脳波復号戦略(PEDS)の開発に繋がるものである。
Central to PEDSは、空間的および時間的脳波データパターンをキャプチャする新しい畳み込みリカレントニューラルネットワーク(CRNN)である。
我々の研究は、事前観測された脳波データの予測能力、危険シナリオの検出の強化、より安全な自動運転車のためのネットワーク駆動型フレームワークの提供を強調した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:34:40 GMT)
BOOTPLACE: Bootstrapped Object Placement with Detection Transformers [23.3] 本稿では,オブジェクト配置を位置検出問題として定式化する新しいパラダイムであるBOOTPLACEを紹介する。
確立されたベンチマークの実験結果は、BOOTPLACEのオブジェクト再配置における優れた性能を示している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 21:21:20 GMT)
A Unified Framework for Diffusion Bridge Problems: Flow Matching and Schrödinger Matching into One [23.1] ディープラーニング時代のブリッジ問題に対処する最も一般的なアルゴリズムは、(条件付き)フローマッチングと反復的適合アルゴリズムである。
我々は、これらの一見無関係なアルゴリズムを1つに仮定する、新しい統一された視点と枠組みを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:57:03 GMT)
GCA-SUNet: A Gated Context-Aware Swin-UNet for Exemplar-Free Counting [22.9] 入力画像を可算オブジェクトの密度マップにマッピングするために,Gated Context-Aware Swin-UNetを提案する。
実世界のデータセットでの実験結果から、GCA-SUNetは最先端の手法よりも大きく、一貫して優れています。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 00:09:03 GMT)
How do language models learn facts? Dynamics, curricula and hallucinations [22.7] 大規模言語モデルは事前学習中に膨大な知識を蓄積するが、この買収を統括する力学はいまだに理解されていない。
本研究は,人工的事実記憶課題における言語モデルの学習力学について検討する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:43:45 GMT)
Squared families: Searching beyond regular probability models [22.7] 正方形族は統計量の線形変換を近似して得られる確率密度の族である。
彼らのフィッシャー情報は、ブレグマン発生器から誘導されるヘッセン計量の共形変換である。
正方形族核はフィッシャー情報、統計的発散、正規化定数のために計算する必要がある唯一の積分である。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:39:35 GMT)
The Devil is in Low-Level Features for Cross-Domain Few-Shot Segmentation [22.4] Cross-Domain Few-Shot (CDFSS)は、大規模なソースドメインデータセットから学んだピクセルレベルのセグメンテーション機能を、下流のターゲットドメインデータセットに転送するために提案されている。
我々は,CDFSSにおいてよく保存されているが未解決な現象に焦点をあてる:ターゲットドメインの場合,最初期のセグメンテーション性能はピークに達し,ソースドメインのトレーニングが進むにつれて急激に低下する。
2つのプラグアンドプレイモジュールを含む手法を提案する。1つは、新しいシャープネス認識法として、ソースドメイントレーニング中の低レベル特徴の損失景観を平坦化し、もう1つはターゲットを直接補完する手法である。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:37:52 GMT)
MESA: Effective Matching Redundancy Reduction by Semantic Area Segmentation [22.3] 本稿では,新しい特徴マッチング手法としてMESAとDMESAを提案する。
MESAはSAMの高度な画像理解に基づいて、点マッチングの前に暗黙のセマンティック領域マッチングを確立する。
繰り返し計算が少ないため、DMESAはMESAと比較して約5倍の速度向上を示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:11:57 GMT)
A Theoretical Analysis of Analogy-Based Evolutionary Transfer Optimization [22.2] アナログ推論を導入し,そのサブプロセスをETOの3つの重要な問題にリンクする。
我々は、サブプロセスの根底にある原理に根ざしたアナロジーに基づく知識伝達の理論を開発する。
本稿では,アナログに基づく知識伝達の性能向上,すなわち条件付き非負のパフォーマンス向上と条件付き正のパフォーマンス向上に関する2つの定理を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:49:20 GMT)
SyncDiff: Synchronized Motion Diffusion for Multi-Body Human-Object Interaction Synthesis [22.1] シンクロナイズドモーション拡散戦略を用いた多体インタラクション合成法SyncDiffを紹介する。
動きの忠実度を高めるため,周波数領域の動作分解手法を提案する。
また、異なる身体運動の同期を強調するための新しいアライメントスコアも導入する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:17:08 GMT)
NeuroLIP: Interpretable and Fair Cross-Modal Alignment of fMRI and Phenotypic Text [22.1] 本稿では,新しいクロスモーダル・コントラスト学習フレームワークであるNeuroLIPを提案する。
テキストトークン条件付注意 (TTCA) および局所化トークン (CALT) によるクロスモーダルアライメントを各疾患関連表現型トークンによる脳領域レベルの埋め込みに導入する。
トークンレベルの注意マップを通じて解釈可能性を改善し、脳の領域と疾患の関連を明らかにする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:22:42 GMT)
What Changed and What Could Have Changed? State-Change Counterfactuals for Procedure-Aware Video Representation Learning [22.0] 状態変化記述を取り入れたプロシージャ対応ビデオ表現学習について検討する。
我々は、仮説化された失敗の結果をシミュレートする状態変化反事実を生成する。
本研究は,提案した状態変化記述の有効性と,その有効性を実証するものである。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 00:03:55 GMT)
Datasets for Depression Modeling in Social Media: An Overview [22.0] うつ病は最も一般的な精神疾患であり、新型コロナウイルスのパンデミックによってその流行は増加した。
近年の研究では、従来のうつ病スクリーニング手法を強化するためにソーシャルメディアデータを活用することに注力している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:03:25 GMT)
LLaVA-CMoE: Towards Continual Mixture of Experts for Large Vision-Language Models [21.9] LLaVA-CMoE は連続的なMixture of Experts (MoE) アーキテクチャであり、再生データを持たない革新的なフレームワークである。
具体的には,プローブ専門家を駆使して,さらなる知識が必要かどうかを評価する手法として, Probe-Guided Knowledge Extension (PGKE) を開発した。
また,PTL(Probabilistic Task Locator)と呼ばれる階層的ルーティングアルゴリズムを導入する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:36:11 GMT)
AdvSGM: Differentially Private Graph Learning via Adversarial Skip-gram Model [21.8] 本稿では,グラフの個別スキップグラフであるAdvSGMを提案する。
私たちの中核となる考え方は、敵の訓練を活用してスキップグラムを民営化し、実用性を向上させることです。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:13:28 GMT)
Learning Multi-Index Models with Neural Networks via Mean-Field Langevin Dynamics [21.6] 平均場ランゲヴィンアルゴリズムを用いて学習した2層ニューラルネットワークを用いて,高次元のマルチインデックスモデルを学習する問題について検討する。
軽度の分布仮定の下では、サンプルと計算の複雑さの両方を制御する実効次元 $d_mathrmeff$ を特徴づける。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:40:20 GMT)
Unleashing the Power of LLM to Infer State Machine from the Protocol Implementation [21.4] 本稿では,Large Language Models (LLMs) を用いた新しい状態マシン推論手法であるProtocolGPTを提案する。
提案手法は90%以上の精度を達成し, ベースラインを30%以上上回った。
プロトコルファジィングとアプローチを統合することで、カバレッジが20%以上向上し、2つの0日間の脆弱性が明らかになった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:51:49 GMT)
HyperGraphRAG: Retrieval-Augmented Generation with Hypergraph-Structured Knowledge Representation [21.3] ハイパーエッジによるn-aryリレーショナル事実を表現するハイパーグラフベースRAG法であるHyperGraphRAGを提案する。
ハイパーグラフを検索・生成するために,ハイパーグラフ構築手法,ハイパーグラフ検索戦略,ハイパーグラフ誘導生成機構を備えた完全パイプラインを導入する。
医学、農業、コンピュータ科学、法学での実験では、HyperGraphRAGは標準的なRAGとGraphRAGを精度と生成品質で上回っている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:01:16 GMT)
Self-Expansion of Pre-trained Models with Mixture of Adapters for Continual Learning [21.2] 継続学習(CL)は、学習した知識を壊滅的に忘れることなく、定常的でないデータストリームから継続的に知識を蓄積することを目的としている。
既存の PTM ベースの CL メソッドは、これらのモジュールの固定セットへの制限された適応を使用して、忘れることを避ける。
PTM CL における安定性・塑性バランスの制御を強化する新しい手法である Modularized Adaptation (SEMA) を用いた事前学習モデルの自己拡張を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:58:57 GMT)
OODFace: Benchmarking Robustness of Face Recognition under Common Corruptions and Appearance Variations [21.0] 既存のオープンソースモデルと商用アルゴリズムは、ある種の複雑なOut-of-Distributionシナリオにおいて堅牢性に欠ける。
OODFaceは,顔認識モデルが直面するOOD課題を2つの視点から検討する。
私たちは、他のデータセットに容易に拡張可能な、すべての汚職と変動タイプを含む統一されたツールキットを提供しています。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:40:57 GMT)
SWI: Speaking with Intent in Large Language Models [21.0] 本稿では,大規模言語モデル(LLM)におけるSWI(Singing with Intent)の概念を紹介する。
人間の心における意図的・目的的な思考をエミュレートすることにより、SWIはLLMの推論能力と生成品質を高めることを仮定する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:34:28 GMT)
VERA: Explainable Video Anomaly Detection via Verbalized Learning of Vision-Language Models [20.9] 本稿では、視覚言語モデルによるビデオ異常検出を可能にするVERAという言語学習フレームワークを提案する。
VERAは、VADに必要な複雑な推論を、よりシンプルでより焦点を絞った質問のリフレクションに分解する。
推論中、VERAは学習した質問をモデルプロンプトに埋め込んで、セグメントレベルの異常スコアを生成するVLMをガイドする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:26:40 GMT)
Unlearning during Learning: An Efficient Federated Machine Unlearning Method [20.8] フェデレートラーニング(FL)は分散機械学習パラダイムとして注目されている。
忘れられる権利の実装を容易にするために、フェデレーション・マシン・アンラーニング(FMU)の概念も現れた。
我々はこれらの制限を克服することを目的とした革新的で効率的なFMUフレームワークであるFedAUを紹介する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:41:08 GMT)
TREAD: Token Routing for Efficient Architecture-agnostic Diffusion Training [20.7] 拡散モデルは通常、サンプルの非効率性と高いトレーニングコストに悩まされる。
TREADは計算コストを削減し、同時にモデル性能を向上することを示す。
ガイド付きで2.09、ガイドなしで3.93の競合FIDを達成する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:42:53 GMT)
GNN-Transformer Cooperative Architecture for Trustworthy Graph Contrastive Learning [20.5] グラフ表現学習(GCL)は、グラフ表現学習の分野でホットな話題となっている。
本稿では,信頼できるグラフコントラスト学習のためのGNN変換器協調アーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:44:56 GMT)
Semantic Consistent Language Gaussian Splatting for Point-Level Open-vocabulary Querying [20.5] 本稿では,LangSplatのフレームワーク上に構築されたポイントレベルのクエリ手法を提案する。
提案手法は,3D-OVSデータセット上でのmIoUによる+20.42の改善を実現する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:59:05 GMT)
Discretized Gaussian Representation for Tomographic Reconstruction [20.4] 我々はCT再構成のための離散化ガウス表現法(DGR)を提案する。
DGRは、離散化されたガウス関数の集合をエンドツーエンドで直接3Dボリュームを再構成する。
実世界のデータセットと合成データセットの両方に対する実験により、DGRはより優れた再構成品質を実現し、計算効率を大幅に向上することを示した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:00:57 GMT)
Learn by Reasoning: Analogical Weight Generation for Few-Shot Class-Incremental Learning [19.9] FSCIL(Few-shot class-incremental Learning)では、限られたデータから新しいクラスを学ぶことができる。
従来のFSCILメソッドは、新しいクラスデータに制限のある微調整パラメータを必要とすることが多い。
ヒト脳の類推学習機構に着想を得て,新しい類推生成法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:31:46 GMT)
GenoTEX: A Benchmark for Automated Gene Expression Data Analysis in Alignment with Bioinformaticians [19.8] 本稿では、遺伝子発現データの自動解析のためのベンチマークデータセットであるGenoTEXを紹介する。
GenoTEXは、幅広い遺伝子識別問題を解決するための注釈付きコードと結果を提供する。
フレキシブルな自己補正を備えた多段階プログラミングワークフローを採用したLLMエージェントチームであるGenoAgentを紹介する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:59:22 GMT)
Monte Carlo Sampling for Analyzing In-Context Examples [19.7] 本研究では,モンテカルロ法を用いてサンプル数の影響を探索し,順序や選択された例からの影響を明示的に説明する手法を開発した。
性能は順序付けや実例数に対して堅牢であるが, ランダムサンプリングに比べて予期せぬ性能劣化があることがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 21:37:40 GMT)
Video-3D LLM: Learning Position-Aware Video Representation for 3D Scene Understanding [19.4] Video-3D LLMは3Dシーンをダイナミックビデオとして扱い、3D位置エンコーディングをこれらの表現に組み込む。
本モデルは,複数の3次元シーン理解ベンチマークにおいて,最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:30:42 GMT)
Reason-RFT: Reinforcement Fine-Tuning for Visual Reasoning [19.3] 視覚的推論能力は、複雑なマルチモーダルデータを理解する上で重要な役割を果たす。
既存の手法は、チェーン・オブ・ソートによる微調整によるVLM推論を改善する。
我々は新しい強化微調整フレームワークReason-RFTを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:13:00 GMT)
Unsupervised Real-World Denoising: Sparsity is All You Need [19.3] 実世界の騒音評価のための教師付きトレーニングは、ペアのノイズとクリーンなイメージのデータセットの収集が困難であるため、課題を提起する。
本稿では,入力スペーシフィケーションに基づく,特にランダムな入力マスキングを用いた解を提案する。
MID(Mask, Inpaint, Denoise)と呼ばれる本手法では,デノイザーを訓練し,同時にデノイザーと合成ノイズペアを塗布する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:09:58 GMT)
Does RAG Introduce Unfairness in LLMs? Evaluating Fairness in Retrieval-Augmented Generation Systems [18.9] 本研究では,複数のRAG法において,公正性を実証的に評価することを目的とする。
その結果,最近のユーティリティ駆動最適化の進歩にもかかわらず,検索と生成の両段階において公平性の問題が持続していることが示唆された。
これらの知見は、RAGパイプライン全体の公平性に対処するための標的的介入の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:36:46 GMT)
Cross-Tokenizer Distillation via Approximate Likelihood Matching [17.6] 我々はこの欠乏を解消するためのクロストケナイザー蒸留法を開発した。
本手法は,次回の予測損失を伴わずにクロストケナイザー蒸留を可能にする最初の方法である。
本研究は,LLMの適応性向上と,LLM間の相互作用の強化に大きく貢献する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:54:04 GMT)
Refined Geometry-guided Head Avatar Reconstruction from Monocular RGB Video [17.4] 改良された3次元メッシュ表現を組み込んだ2相ヘッドアバター再構成ネットワークを提案する。
本手法は,複雑な顔のニュアンスをキャプチャするNeRFに適した洗練されたメッシュ表現を学習することを目的としている。
実験により,本手法は初期メッシュに基づくNeRFレンダリングをさらに強化することを示した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:02:41 GMT)
Dynamic Bi-Elman Attention Networks: A Dual-Directional Context-Aware Test-Time Learning for Text Classification [17.3] 本稿では,DBEAN(Dynamic Bidirectional Elman with Attention Network)を提案する。
DBEANは双方向時間モデリングと自己認識機構を統合している。
重みを入力のクリティカルセグメントに動的に割り当て、計算効率を維持しながら文脈表現を改善する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:24:27 GMT)
Frequency-Controlled Diffusion Model for Versatile Text-Guided Image-to-Image Translation [17.3] 大規模テキスト・ツー・イメージ拡散モデル(T2I)は画像・画像翻訳(I2I)の強力なツールとして登場した。
本稿では,周波数制御拡散モデル(FCDiffusion)を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:36:58 GMT)
JEEM: Vision-Language Understanding in Four Arabic Dialects [17.3] このデータセットは、視覚言語モデル(VLM)が方言をまたいで一般化する能力を評価することを目的としている。
5つの著名なオープンソースのアラビア語 VLM と GPT-4V の評価において,アラビア語 VLM は視覚的理解と方言固有の生成に苦慮し,一貫して性能が低下していることがわかった。
このことは、より包括的なモデルの必要性と、文化的に異なる評価パラダイムの価値を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:41:21 GMT)
Robust Feature Learning for Multi-Index Models in High Dimensions [17.2] ニューラルネットワークで対向的に堅牢な特徴学習を理解するための第一歩を踏み出します。
逆向きの堅牢な学習は、標準的な学習と同じくらい簡単であることを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:53:03 GMT)
FedMIA: An Effective Membership Inference Attack Exploiting "All for One" Principle in Federated Learning [17.1] Federated Learning(FL)は、分散データ上で機械学習モデルをトレーニングするための有望なアプローチである。
メンバーシップ推論攻撃(MIA)は、特定のデータポイントがターゲットクライアントのトレーニングセットに属するかどうかを判断することを目的としている。
我々はFedMIAと呼ばれる3段階のメンバーシップ推論攻撃(MIA)手法を導入し、MIAの有効性を高めるため、複数の通信ラウンドにまたがる全クライアントからの更新を平均化する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:38:46 GMT)
Generalizable Prompt Learning of CLIP: A Brief Overview [17.1] この記事では、数発のプロンプト学習に基づくCLIPの概要を紹介する。
このレビューの目的は、CLIPの一般化可能なプロンプトで研究を開始したばかりの研究者への参照を提供することである。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:28:13 GMT)
Asynchronous BFT Consensus Made Wireless [17.0] Asynchronous Byzantine fault-tolerant (BFT)コンセンサスプロトコルは、無線アプリケーションにとってますます重要になっている。
これらのプロトコルは有線ネットワークにおいて有効であることが証明されているが、無線環境への適応は重大な課題である。
非同期BFTコンセンサスは、高いメッセージ複雑性に悩まされ、ネットワークの混雑と非効率に繋がる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:59:30 GMT)
Whistle: Data-Efficient Multilingual and Crosslingual Speech Recognition via Weakly Phonetic Supervision [17.0] 本稿では、データ効率自動音声認識(MCL-ASR)に対する弱音声指導による事前学習のアプローチについて検討する。
我々は,LanguageNet grapheme-to-phoneme(G2P)モデルを活用して,ゴールドスタンダードな人間検証音声書き起こしの要求を緩和し,国際音声アルファベット(IPA)に基づく書き起こしを得る。
MCL-ASRにおける音素モデルの有効性を示す実験では, 未知言語に対する音声認識, 数ショットのデータ量の違いによる言語間のクロスリンガル性能, 破滅的な忘れ込み, 訓練効率を克服した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:38:29 GMT)
Combining Relevance and Magnitude for Resource-Aware DNN Pruning [17.0] ニューラルネットワークのプルーニングは、精度を維持しながらパラメータの一部を削除し、機械学習パイプラインのレイテンシを低減する主要な方法の1つである。
本稿では,学習時間と推論時間を組み合わせた新しいプルーニング手法FlexRelを提案する。
性能評価の結果,FlexRelは高いプルーニング係数を達成でき,通常の精度目標に対して35%以上の帯域幅を節約できることがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:29:43 GMT)
Resource-Efficient Federated Fine-Tuning Large Language Models for Heterogeneous Data [16.8] フェデレートラーニング(Federated Learning)、すなわちフェデレーションラーニング(FedLLM)を通じて、さまざまな下流アプリケーションにLLMをプライバシ保護方式で適応させるための微調整大型言語モデル(LLM)が提案されている。
資源制約装置の微調整コストを低減するため、FedLLMにローランク適応(LoRA)を統合することにより、モデルパラメータの小さなサブセットのみを微調整することを提案した。
本稿では、これらの課題に対処するため、階層的なFedLoRAフレームワークであるHierFedLoRAを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:05:22 GMT)
AnomalyNCD: Towards Novel Anomaly Class Discovery in Industrial Scenarios [16.8] 本稿では,異なる異常検出手法に適合する多クラス異常分類ネットワークであるAnomalyNCDを提案する。
異常の非優位性に対処するため,我々は主要素バイナライゼーション(MEBin)を設計し,異常中心の画像を得る。
次に、弱い意味を持つ異常を学習するために、マスクによって導かれる孤立した異常に焦点を当てたマスク誘導表現学習を設計する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:09:07 GMT)
AugWard: Augmentation-Aware Representation Learning for Accurate Graph Classification [16.7] AugWardはグラフ拡張によって導入された多様性を考慮に入れたグラフ表現学習フレームワークである。
AugWardは、拡張グラフと元のグラフの間のグラフ距離を予測するために、拡張対応トレーニングを適用している。
その結果, AugWardは, 教師付き半教師付きグラフ分類, 転送学習において, 最先端の性能を提供することがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:58:28 GMT)
LAGUNA: LAnguage Guided UNsupervised Adaptation with structured spaces [16.6] LAGUNA - LANguage Guided UNsupervised Adaptation with structured spaceを紹介する。
LAGUNAは言語空間におけるクラスラベル間の意味的・幾何学的関係に基づいてドメインに依存しない構造を定義する。
LAGUNAが4つの画像とビデオデータセットにまたがるドメイン適応タスクにおいて優れていることを実証的に示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 22:59:47 GMT)
Dual-Splitting Conformal Prediction for Multi-Step Time Series Forecasting [16.4] 時系列予測は、リソーススケジューリングやリスク管理といったアプリケーションでは不可欠である。
Conformal Prediction (CP) のほとんどの変種は、シングルステップの予測のために設計されており、マルチステップシナリオにおける課題に直面している。
マルチステップ予測のための時系列データに固有の依存関係をキャプチャする新しいCP手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:17:18 GMT)
ThinkEdit: Interpretable Weight Editing to Mitigate Overly Short Thinking in Reasoning Models [16.4] 本研究では、推論モデルの隠れ表現に、推論の長さがどのように埋め込まれているかを検討する。
我々は、過剰に短い推論の問題を軽減するために、シンプルだが効果的な重み付けアプローチであるThinkEditを紹介した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 23:53:45 GMT)
From Deep Learning to LLMs: A survey of AI in Quantitative Investment [16.2] 量的投資(量的投資)は、資産管理における新興かつ技術主導のアプローチである。
量子ファイナンスのためのディープラーニングと大規模言語モデル(LLM)の最近の進歩は、予測モデリングを改善し、エージェントベースの自動化を可能にした。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:10:15 GMT)
ATM: Improving Model Merging by Alternating Tuning and Merging [16.1] タスクベクトルをマルチタスク勾配にリンクすることで、タスクベクトルの有効性を動機付ける。
タスクベクトルの有効性は、最初のエポック勾配によって大きく左右される。
我々は、チューニングとマージを交互に行う反復的なプロセスにおいて、単一のステップとして、ビューングモデルマージを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:57:30 GMT)
Learning Generalizable Skills from Offline Multi-Task Data for Multi-Agent Cooperation [16.1] HiSSD(Hierarchical and Separate Skill Discovery)は、スキル学習を通じて、一般化可能なオフラインマルチタスクMARLのための新しいアプローチである。
HiSSDは、共通性とタスク固有のスキルを共同で学習する階層的なフレームワークを活用している。
タスク固有のスキルは、各タスクの先行を表現し、タスク誘導されたきめ細かいアクション実行を達成する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:35:59 GMT)
LaMOuR: Leveraging Language Models for Out-of-Distribution Recovery in Reinforcement Learning [16.1] 本稿では,不確実性推定に頼らずに回復学習を可能にするLaMOuR(Language Models for Out-of-Distriion Recovery)を提案する。
LaMOuRは、エージェントを元のタスクを成功させる状態に誘導する高密度な報酬コードを生成する。
実験の結果,LaMOuRは様々な移動課題における回復効率を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:17:19 GMT)
EQ-Negotiator: An Emotion-Reasoning LLM Agent in Credit Dialogues [16.1] 本稿では,事前学習した言語モデルからの感情知覚とゲーム理論と隠れマルコフモデルに基づく感情推論を組み合わせたEQ-negotiatorを提案する。
クライアントの現在の感情と過去の感情の両方を考慮して、インタラクション中の否定的な感情を管理し、対処する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 01:41:34 GMT)
One Snapshot is All You Need: A Generalized Method for mmWave Signal Generation [15.8] フルシーンmmWave信号生成に適したフレームワークであるmmGenを提案する。
物理信号伝達モデルを構築することにより、mGenは人間に反射された、環境に反射されたmWave信号を合成する。
商用のmmWaveデバイスとKinectセンサーを用いたプロトタイプシステムによる広範囲な実験を行った。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:24:10 GMT)
A Multi-Modal Knowledge-Enhanced Framework for Vessel Trajectory Prediction [15.6] 船舶軌道予測のためのマルチモーダル知識強化フレームワーク(MAKER)を提案する。
不規則なサンプリング時間間隔に対抗するため、MAKERはLarge Language Model-Guided Knowledge Transfer (LKT)モジュールを備えている。
複雑な軌跡パターンを学習する能力を強化するため、MAKERは知識ベースのセルフペースト学習(KSL)モジュールを組み込んでいる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 00:01:35 GMT)
Dynamics-Aware Gaussian Splatting Streaming Towards Fast On-the-Fly 4D Reconstruction [15.6] 現在の3DGSベースのストリーミング手法は、ガウス原始体を均一に扱い、密度の高いガウスを常に更新する。
そこで本研究では, 反復的流動性4次元動的空間再構成のための新しい3段階パイプラインを提案する。
提案手法は,オンライン4次元再構成における最先端性能を実現し,最速のオンザフライトレーニング,優れた表現品質,リアルタイムレンダリング能力を示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:49:30 GMT)
AnyBimanual: Transferring Unimanual Policy for General Bimanual Manipulation [15.4] 本稿では,AnyBimanualというプラグイン・アンド・プレイ方式を提案する。
我々は、AnyBimanualが12のシミュレートされたタスクに対して、従来の方法よりも12.67%改善したことを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:34:48 GMT)
Safe Human Robot Navigation in Warehouse Scenario [15.3] 本研究は,制御バリア機能(CBF)を活用し,倉庫ナビゲーションの安全性を高める手法を提案する。
学習ベースのCBFとOpen Robotics Middleware Framework(OpenRMF)を統合することで、マルチロボット、マルチエージェントシナリオにおける適応性と安全性向上の制御を実現する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:12:27 GMT)
Neuro-Symbolic Imitation Learning: Discovering Symbolic Abstractions for Skill Learning [15.3] 本稿では,ニューロシンボリックな模倣学習フレームワークを提案する。
低レベル状態-作用空間を抽象化する記号表現を学ぶ。
学習された表現はタスクをより簡単なサブタスクに分解し、システムはシンボリックプランニングを利用することができる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:50:29 GMT)
Generalizable Implicit Neural Representations via Parameterized Latent Dynamics for Baroclinic Ocean Forecasting [15.2] PINRODは、動的に認識される暗黙のニューラル表現とパラメータ化されたニューラル常微分方程式を組み合わせた新しいフレームワークである。
海洋中規模パラメトリック活動の実験は、既存のベースラインよりも精度が高い。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:04:52 GMT)
An Exponential Separation Between Quantum and Quantum-Inspired Classical Algorithms for Linear Systems [15.0] 本稿では、線形システムの解法の基本問題に対する量子と量子に着想を得た古典的アルゴリズムの最初の証明可能な指数的分離について述べる。
現在の状況からすると、どんな自然な機械学習タスクでも指数的な量子スピードアップを期待できるかどうかは不明だ。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:06:12 GMT)
Controlled Learning of Pointwise Nonlinearities in Neural-Network-Like Architectures [14.9] 本稿では,階層型計算アーキテクチャにおける自由形式非線形性のトレーニングのための一般的な変分フレームワークを提案する。
傾斜制約により、1-Lipschitz安定性、堅固な非膨張性、単調性/可逆性といった特性を課すことができる。
本稿では, 非線形性を適切な(一様でない)B-スプラインベースで表現することで, 数値関数最適化問題の解法を示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:23:29 GMT)
Bearing fault diagnosis based on multi-scale spectral images and convolutional neural network [14.9] 本稿では,マルチスケールスペクトル特徴画像とディープラーニングに基づく新しい故障診断手法を提案する。
実験の結果,提案手法は断層診断の精度を著しく向上させることがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:49:56 GMT)
Optimal Stepsize for Diffusion Sampling [14.8] 拡散モデルは、優れた生成品質を達成するが、最適以下のステップの離散化による計算集約サンプリングに苦しむ。
本稿では,参照軌道から知識を抽出し,理論的に最適なスケジュールを抽出する動的プログラミングフレームワークであるOptimal Stepsize Distillationを提案する。
実験では、GenEvalで99.4%のパフォーマンスを維持しながら、10倍の高速化されたテキスト-画像生成を示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:59:46 GMT)
Alleviating LLM-based Generative Retrieval Hallucination in Alipay Search [14.8] 生成的検索(GR)は大規模言語モデル(LLM)の出現とともに文書検索に革命をもたらした
検索幻覚を緩和する最適化されたGRフレームワークを提案する。
我々は、GRが検索したクエリドキュメント(q-d)ペアの評価と推論にLLMを使用し、GRモデルに転送された知識として推論データを蒸留する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:36:48 GMT)
ReFeed: Multi-dimensional Summarization Refinement with Reflective Reasoning on Feedback [14.7] フィードバックに対する反射的推論を通じて複数の次元を拡張可能な,強力な要約処理パイプラインであるReFeedを紹介する。
実験では, 寸法数, フィードバック露出, 推論ポリシが改良性能にどのように影響するかを明らかにした。
我々の発見は、適切なゴールとガイドラインでデータを作成することが効果的な推論の基本的な柱であることを強調している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:11:41 GMT)
Omni-AD: Learning to Reconstruct Global and Local Features for Multi-class Anomaly Detection [14.7] 私たちはOmni-ADというフレームワークを構築し、異なる粒度の通常のパターンを学び、徐々に再構築します。
公開異常検出ベンチマーク実験により,本手法はMUADの最先端手法よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:33:03 GMT)
ICG-MVSNet: Learning Intra-view and Cross-view Relationships for Guidance in Multi-View Stereo [14.5] マルチビューステレオ(MVS)は、一連の重なり合う画像から深度を推定し、3Dポイントの雲を再構成することを目的としている。
最近の学習ベースのMVSフレームワークは、特徴や相関に埋め込まれた幾何学的情報を見落とし、コストマッチングが弱くなる。
深度推定のためのビュー内関係とクロスビュー関係を明確に統合した ICG-MVSNet を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:13:31 GMT)
Towards Controllable Speech Synthesis in the Era of Large Language Models: A Survey [14.5] Text-to-speech (TTS)は、テキストから自然な人間の音声を生成することを目的としている。
TTS技術は、制御可能な音声生成を可能にするために、人間のような音声を超えて進化してきた。
拡散や大言語モデルといったディープラーニングは、制御可能なTSを大幅に強化した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:56:00 GMT)
Error bounds for composite quantum hypothesis testing and a new characterization of the weighted Kubo-Ando geometric means [14.4] 可換の場合、状態の重み付けされた幾何学的手段を考えると、仮説当たりの2つの状態がこのアプローチに最適であることを示す。
また、2つの量子チャネルの重み付けされたKubo-Ando幾何学的手段の類似した最適性を示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:41:23 GMT)
DuckSegmentation: A segmentation model based on the AnYue Hemp Duck Dataset [14.3] そこで,本論文では,ダックプロセシング(DuckProcessing)について述べる。
YOLOv8モジュールを使用して精度は98.10%、リコールは96.53%、F1は0.95点に達した。
本手法は, 実践的なシマアヒルスマート農業における新しい考え方を提供する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:02:30 GMT)
Perceptually Accurate 3D Talking Head Generation: New Definitions, Speech-Mesh Representation, and Evaluation Metrics [14.3] 音声信号と3次元顔メッシュの複雑な対応をキャプチャする音声-メシュ同期表現を提案する。
実験の結果, 知覚的損失を伴う3次元音声音声生成モデルの訓練は, 知覚的に正確な唇同期の3つの側面を著しく改善することがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:19:30 GMT)
Double Blind Imaging with Generative Modeling [14.3] 画像のブラインド逆問題(Blind inverse problem)は、画像の(ノイズの多い)測定に使用されるシステムの不確実性から生じる。
本研究では、未知のイメージングシステムにおけるパラメータの分布を特定するために、アンビエントGANに基づく生成手法を提案する。
この学習された分布は、ブラインドデコンボリューションのようなブラインド逆問題を解決するためにモデルベースのリカバリアルゴリズムで使用することができる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:40:49 GMT)
Probabilistic neural operators for functional uncertainty quantification [14.1] 本稿では,ニューラル演算子の出力関数空間上の確率分布を学習するフレームワークである確率論的ニューラル演算子(PNO)を紹介する。
PNOは、厳密な適切なスコアリングルールに基づく生成モデリングにより、ニューラル演算子を拡張し、不確実性情報をトレーニングプロセスに直接統合する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:19:41 GMT)
Leveraging LLMs with Iterative Loop Structure for Enhanced Social Intelligence in Video Question Answering [13.8] 社会的知性は効果的なコミュニケーションと適応応答に不可欠である。
現在のソーシャルインテリジェンスのためのビデオベースの手法は、一般的なビデオ認識や感情認識技術に依存している。
本稿では,大規模言語モデルと視覚情報を統合したLooped Video Debatingフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:14:21 GMT)
AutoPsyC: Automatic Recognition of Psychodynamic Conflicts from Semi-structured Interviews with Large Language Models [13.6] 心理的衝突は永続的で、しばしば人の行動や経験を形作る無意識のテーマである。
既存の精神医学診断の自動化ソリューションは、幅広い障害カテゴリーの認識に焦点を当てる傾向がある。
本稿では,精神力学的対立の存在と意義を認識するための最初の方法であるAutoPsyCを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:41:35 GMT)
Quantum umlaut information [13.6] 本稿では、二部量子状態$rho_AB$に対して定義された相関測度である量子ウムラウト情報について検討する。
エンタングルメント理論の最近の結果に触発されて、正規化されたユーラウト情報は量子チャネル上での古典的な情報伝達の質の基本的な尺度であることを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:11:49 GMT)
KernelFusion: Assumption-Free Blind Super-Resolution via Patch Diffusion [13.5] カーネルを仮定しないゼロショット拡散法を提案する。
まず、単一のLR入力画像上に、画像固有のパッチベースの拡散モデルをトレーニングし、その内部パッチの独自の統計値を取得する。
次に、同じ学習パッチ分布でより大きなHRイメージを再構成し、同時に正しいダウンスケーリングSR-カーネルを復元する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:37:09 GMT)
Ignite Forecasting with SPARK: An Efficient Generative Framework for Refining LLMs in Temporal Knowledge Graph Forecasting [13.4] 本稿では,TKG予測における大規模言語モデルの精錬のためのシーケンスレベルのプロキシフレームワークであるSPARKを紹介する。
推論時間アルゴリズムにインスパイアされたSPARKは、2つの重要なイノベーションを通じてコスト効率の良いプラグアンドプレイソリューションを提供する。
多様なデータセットにわたる実験は、SPARKの予測性能、堅牢な一般化能力、高効率を検証している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:02:02 GMT)
Robust Quantum Control using Reinforcement Learning from Demonstration [13.3] システムモデルで生成された制御シーケンスを活用するために,Reinforcement Learning from Demonstration (RLfD) を用いる。
このアプローチはサンプル数を減らしてサンプル効率を高めることができ、トレーニング時間を著しく短縮することができる。
我々はRLfD法を用いて複数の高忠実度非古典状態の生成をシミュレートした。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:01:28 GMT)
Inductive-Associative Meta-learning Pipeline with Human Cognitive Patterns for Unseen Drug-Target Interaction Prediction [13.2] BioBridgeは、限られたシーケンスデータを用いて、新規なドラッグとターゲットの相互作用を予測する。
変換可能なバインディング原理を蓄積するために、逆行訓練を備えたマルチレベルエンコーダが組み込まれている。
これは、上皮成長因子受容体とアデノシン受容体の仮想スクリーニングに有効であることが証明され、薬物発見におけるその可能性を裏付けている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:41:02 GMT)
Code Review Comprehension: Reviewing Strategies Seen Through Code Comprehension Theories [12.8] レビューキューから25のコードレビューを実行している間,10人の経験豊富なレビュアを観察し,インタビューした。
レノフスキーのコード理解モデルを用いて理論駆動理論解析を行った。
コード理解がコードレビューの基本であることが確認された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:44:40 GMT)
HyperMAN: Hypergraph-enhanced Meta-learning Adaptive Network for Next POI Recommendation [12.8] Next Point-of-Interest (POI) は、履歴チェックインシーケンスを活用することで、ユーザの次の位置を予測することを目的としている。
ヘテロジニアスなハイパーグラフモデリングと,次のPOIレコメンデーションのための難易度の高いメタラーニング機構を統合した,ハイパーグラフ強化メタラーニング適応ネットワーク(HyperMAN)を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 23:58:57 GMT)
Collaborative Evolution: Multi-Round Learning Between Large and Small Language Models for Emergent Fake News Detection [12.7] 大規模言語モデル(LLM)は、関連するデモンストレーションの欠如と知識のダイナミックな性質のために、偽ニュースを効果的に識別するのに不足している。
本稿では,これらの制約に対処するため,MRCD(Multi-Round Collaboration Detection)を提案する。
我々のフレームワークMRCDは、2つの実世界のデータセットPhemeとTwitter16でSOTA結果を実現し、SLMのみを使用する場合と比較して精度は7.4%と12.8%向上した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:39:26 GMT)
Neural Exploratory Landscape Analysis for Meta-Black-Box-Optimization [12.6] 本稿では,2段階の注目型ニューラルネットワークを用いてランドスケープの特徴を動的にプロファイリングする新しいフレームワークを提案する。
NeurELAは、マルチタスクの神経進化戦略を用いて、様々なMetaBBOアルゴリズム上で事前訓練されている。
実験によると、NeurELAは異なるMetaBBOタスクに統合された場合、一貫して優れたパフォーマンスを発揮する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 01:42:03 GMT)
MemInsight: Autonomous Memory Augmentation for LLM Agents [12.6] セマンティックなデータ表現と検索機構を強化するために,自動メモリ拡張手法であるMemInsightを提案する。
提案手法の有効性を,会話推薦,質問応答,イベント要約の3つのシナリオで実証的に検証した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:57:28 GMT)
Federated Learning with Differential Privacy: An Utility-Enhanced Approach [12.6] フェデレーション学習は、クライアントのデータを共有する必要性をなくすことによって、データのプライバシを保護するための魅力的なアプローチとして現れている。
最近の研究では、フェデレートされた学習だけではプライバシーが保証されないことが示されている。
本稿では,これらのバニラ微分プライベートアルゴリズムを,ハールウェーブレット変換ステップとノイズの分散を著しく低減する新しいノイズ注入方式に基づいて修正する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:48:29 GMT)
Adaptive Clipping for Privacy-Preserving Few-Shot Learning: Enhancing Generalization with Limited Data [12.6] そこで我々は,メタクリップ(Meta-Clip)と呼ばれる新しい手法を導入する。
トレーニング中にクリッピング閾値を動的に調整することにより、アダプティブクリッピング法は機密情報の開示をきめ細かな制御を可能にする。
我々は,既存プライバシ保存技術に比べて優れたトレードオフを示すとともに,実用上の劣化を最小限に抑えるアプローチの有効性を実証する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:14:18 GMT)
GNNMerge: Merging of GNN Models Without Accessing Training Data [12.6] モデルのマージは、オリジナルのトレーニングデータにアクセスすることなく、複数のトレーニングされたモデルを単一のモデルに統合する方法として、機械学習において注目されている。
既存のアプローチはコンピュータビジョンやNLPのような領域で成功を示しており、グラフニューラルネットワーク(GNN)への応用は未解明のままである。
タスクに依存しないノード埋め込みアライメント戦略を用いてGNNをマージするGNNMergeを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:32:05 GMT)
Data-Agnostic Robotic Long-Horizon Manipulation with Vision-Language-Guided Closed-Loop Feedback [12.6] 本稿では,言語条件のロングホライズンロボット操作のためのデータに依存しないフレームワークであるDAHLIAを紹介する。
LLMは、リアルタイムタスク計画と実行のための大きな言語モデルである。
本フレームワークは,多種多様な長期タスクにおける最先端性能を実証し,シミュレーションおよび実世界のシナリオにおいて強力な一般化を実現する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:32:58 GMT)
HyperFree: A Channel-adaptive and Tuning-free Foundation Model for Hyperspectral Remote Sensing Imagery [12.5] 本稿では,HyperFreeと呼ばれるチューニング不要なハイパースペクトル基盤モデルを提案する。
各種チャネル数を処理するために,0.4 sim 2.5,mutextm$から全スペクトルをカバーする学習重量辞書を設計し,埋め込み層を動的に構築する。
プロンプト設計をより魅力的にするために、HyperFreeは特徴距離をセマンティック類似性として扱うことで、1プロンプトごとに複数のセマンティックアウェアマスクを生成することができる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:27:10 GMT)
R2-KG: General-Purpose Dual-Agent Framework for Reliable Reasoning on Knowledge Graphs [12.5] R2-KGは、推論を2つの役割に分けるプラグイン・アンド・プレイのフレームワークである。
以上の結果から,R2-KGはKGベースの推論のための柔軟性とコスト効率のよい解であることがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:49:51 GMT)
Approximate Nullspace Augmented Finetuning for Robust Vision Transformers [12.5] 線形代数からのヌル空間の概念にインスパイアされた視覚変換器の堅牢性を高める。
我々の微調整アプローチは、逆方向と自然方向の両方の摂動に対するモデルの堅牢性を大幅に改善する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:41:21 GMT)
Robust DNN Partitioning and Resource Allocation Under Uncertain Inference Time [12.4] エッジインテリジェンスシステムでは、ディープニューラルネットワーク(DNN)のパーティショニングとデータオフロードが、リソース制約のあるモバイルデバイスに対してリアルタイムなタスク推論を提供する。
本稿では,タスクの確率的期限を満たしながら,モバイルデバイスの総エネルギー消費を最小化するためのロバストな最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:06:26 GMT)
Uni4D: Unifying Visual Foundation Models for 4D Modeling from a Single Video [12.3] マルチステージ最適化フレームワークであるUni4Dを導入し,複数の事前学習モデルを用いて動的3Dモデリングを行う。
その結果,動的4次元モデリングにおける視覚的品質の優れた最先端性能が示された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:57:32 GMT)
Multi-Objective Optimization for Privacy-Utility Balance in Differentially Private Federated Learning [12.3] フェデレートラーニング(FL)は、生データを共有せずに、分散クライアント間で協調的なモデルトレーニングを可能にする。
本稿では,多目的最適化フレームワークを用いて動的にクリッピング規範を調整する適応型クリッピング機構を提案する。
以上の結果から,適応的クリッピングは固定クリッピングベースラインを一貫して上回り,同一のプライバシー制約下での精度の向上を実現している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:57:05 GMT)
Empowering Retrieval-based Conversational Recommendation with Contrasting User Preferences [12.2] 我々は、Contrasting user pReference expAnsion and Learning (CORAL)と呼ばれる対話型推薦モデルを提案する。
コーラルは、ユーザの隠れた好みを、コントラストの好み拡張によって抽出する。
対照的な選好を明確に区別し、選好認識学習を通じてレコメンデーションプロセスに活用する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 21:45:49 GMT)
Multiple Embeddings for Quantum Machine Learning [12.2] 複数の量子データ埋め込み戦略を統合する新しい量子機械学習フレームワークを提案する。
実験により,提案手法の有効性を検証し,既存の最先端手法よりも大幅に向上した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:16:53 GMT)
Cognitive Science-Inspired Evaluation of Core Capabilities for Object Understanding in AI [12.2] 本稿では,オブジェクト指向研究の主要な理論的枠組みについて概観する。
我々は、現在のAIパラダイムが認知科学と比較して、どのようにアプローチし、対象能力をテストするかを評価する。
ベンチマークでは、AIシステムがオブジェクトの分離された側面をモデル化しているのを検出できますが、これらの機能間でAIシステムが機能的な統合を欠いている場合、ベンチマークは検出できません。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:35:02 GMT)
Multimodal Feature-Driven Deep Learning for the Prediction of Duck Body Dimensions and Weight [12.1] 本研究では、異なるビュー、深度画像、および3D点雲からのマルチモーダルデータ2D RGB画像を活用する革新的な深層学習モデルを提案する。
姿勢や条件の異なる5,000以上のサンプルからなる1,023羽のLinwuアヒルのデータセットを収集し、モデルトレーニングを支援した。
このモデルは平均絶対パーセンテージ誤差(MAPE)が6.33%、R2が0.953で8つの形態パラメータで達成され、強い予測能力を示した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:37:28 GMT)
Reinforced Lifelong Editing for Language Models [12.1] 大規模言語モデル(LLM)は、事前学習したコーパスから情報を取得するが、その記憶された知識は、時間とともに不正確になるか、時代遅れになる可能性がある。
モデル編集は、リトレーニングなしでモデルパラメータを変更することでこの課題に対処する。
本稿では,RLに基づく編集手法であるRLEditを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:46:13 GMT)
Typhoon T1: An Open Thai Reasoning Model [12.1] 推論モデルは、最終回答に到達する前に、長いチェーンの思考を生成する。
台風T1号はタイのオープン推論モデルを開発するためのオープンな取り組みを提示している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:45:15 GMT)
Adapting Language-Specific LLMs to a Reasoning Model in One Day via Model Merging -- An Open Recipe [12.1] 本稿では,言語固有の大規模言語モデル(LLM)の推論能力の向上を目的とする。
DeepSeek R1は推論に優れていますが、主に英語や中国語のような高リソース言語にメリットがあります。
低リソース言語は、英語中心のトレーニングデータとモデル最適化の優位性のため、いまだに保存されていない。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:45:16 GMT)
As easy as PIE: understanding when pruning causes language models to disagree [12.1] データポイントのサブセットは常に、プルーニング時に(精度の低下の観点から)ほとんどを保持します。
これらのデータポイントはPIEと呼ばれ、画像処理で研究されているが、NLPでは研究されていない。
我々は、PIEがより長く、より意味論的に複雑なテキストに対する推論を難しく、かつ影響のあるものにしていることを追跡している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:26:32 GMT)
MoQa: Rethinking MoE Quantization with Multi-stage Data-model Distribution Awareness [12.1] Mix-of-Experts (MoE) はLarge Language Models (LLM) のメインフォームとなった。
MoQaは、複数の分析段階におけるMoEのデータモデル分布の複雑さを分離する。
実験の結果、MoQaは言語モデリングタスクの1.692.18パープレキシティ低下と、ゼロショット推論タスクの1.58%8.91%の精度向上を実現している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:52:25 GMT)
Denoising VAE as an Explainable Feature Reduction and Diagnostic Pipeline for Autism Based on Resting state fMRI [11.9] 静止状態fMRIデータを用いた特徴量削減パイプラインを提案する。
rs-fMRIから機能接続データを抽出するためにクラドック・アトラスとパワー・アトラスを用いた。
変分オートエンコーダを用いることで,提案したパイプラインは接続機能を5つの潜在ガウス分布に圧縮する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:25:38 GMT)
UGNA-VPR: A Novel Training Paradigm for Visual Place Recognition Based on Uncertainty-Guided NeRF Augmentation [11.8] 視覚的位置認識(VPR)は、ロボットが以前訪れた場所を特定するために不可欠である。
既存のVPRデータセットのほとんどは、単一のビューポイントシナリオに限定されている。
本稿では,既存のVPRネットワークの性能向上のための新しいトレーニングパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:14:46 GMT)
What Do You See? Enhancing Zero-Shot Image Classification with Multimodal Large Language Models [11.7] 大規模言語モデル(LLM)は、画像分類を含む多くのコンピュータビジョンタスクに効果的に使用されている。
マルチモーダルLCMを用いたゼロショット画像分類法を提案する。
この結果は,複数のデータセットのベンチマーク精度を上回り,その顕著な効果を示した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:41:01 GMT)
SplatFlow: Self-Supervised Dynamic Gaussian Splatting in Neural Motion Flow Field for Autonomous Driving [11.6] 運動流場(NMFF)内における動的ガウススプラッティングSplatFlowについて紹介する。
SplatFlowは、トラックされた3Dバウンディングボックスを必要とせずに4次元の時空間表現を学習し、正確な動的シーン再構成とRGB/deepth/flow合成を可能にする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 00:51:33 GMT)
Bridging Evolutionary Multiobjective Optimization and GPU Acceleration via Tensorization [11.5] 進化的多目的最適化(EMO)は過去20年間に大きく進歩してきた。
従来のEMOアルゴリズムは、並列性とスケーラビリティが不十分なため、大幅な性能制限に直面している。
テンソル化手法を用いてGPU上でのEMOアルゴリズムの並列化を提案する。
実験の結果, テンソル化EMOアルゴリズムはCPUベースと比較して最大1113倍の高速化を実現していることがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:00:11 GMT)
Group Reasoning Emission Estimation Networks [11.5] 企業レベルの排出量推定を標準化する,AI駆動型炭素会計フレームワークを導入する。
大規模言語モデル(LLM)を用いた新しい推論手法を用いる。
1,114のAICSカテゴリの実験により、最先端の性能が得られる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:37:40 GMT)
RedditESS: A Mental Health Social Support Interaction Dataset -- Understanding Effective Social Support to Refine AI-Driven Support Tools [11.5] RedditESSはReddit投稿から派生した,サポート的なコメントとオリジナルポスターのフォローアップ応答を含む,新しい現実世界のデータセットだ。
効果的な支援の理解を深めることにより、我々の研究は、高度なAI駆動型メンタルヘルス介入の道を開く。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:03:11 GMT)
Effective Skill Unlearning through Intervention and Abstention [11.5] 大規模言語モデル(LLM)は、様々な領域で顕著なスキルを誇示している。
LLMのための2つの軽量無訓練機械スキルアンラーニング技術を導入する。
本研究では,7言語にわたる算数解法,Pythonコーディング,理解能力について検討した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:45:06 GMT)
A Logic for Reasoning About Aggregate-Combine Graph Neural Networks [11.3] 各式が等価グラフニューラルネットワーク(GNN)に変換可能であることを示す。
また, 満足度問題はPSPACE完全であることを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:38:15 GMT)
Less Noise, More Signal: DRR for Better Optimizations of SE Tasks [11.2] 本稿では,軽量アルゴリズムがいつ十分かを予測するための新しい指標であるDRR(Diality Reduction Ratio)を紹介する。
DRRは、DEHBのような高価なメソッドがオーバースキルである"単純な"タスクをピンポイントする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:02:06 GMT)
Scalable Expectation Estimation with Subtractive Mixture Models [11.2] 負の混合モデル(SMM)はサンプリングを複雑にし、高次元ではスケールしないコストのかかる自己回帰手法やアセプション・リジェクトアルゴリズムを必要とする。
本研究では、SMMの差分表現を用いて、SMMからサンプルを除去する非バイアスのIS推定器(DeltatextEx$)を構築する。
実験の結果,$DeltatextEx$は自動回帰サンプリングに匹敵する推定精度を達成できるが,MC推定ではかなり高速であることがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:25:03 GMT)
Outlier dimensions favor frequent tokens in language model [11.1] 我々は,多くの現代言語モデルにおいて,不規則な次元が出現することを示し,その関数を常に頻繁な単語の予測に遡ることを示す。
我々は,多くの異なるモデルによって有用なトークン予測を実装するための特別なメカニズムである,と結論付けている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:30:50 GMT)
RGB-Th-Bench: A Dense benchmark for Visual-Thermal Understanding of Vision Language Models [11.1] RGB-Th-Benchは、視覚言語モデル(VLM)によるRGB-熱画像ペアの理解能力を評価するために設計された最初のベンチマークである。
我々は、19の最先端VLMに対して広範囲な評価を行い、RGB-サーマル理解における大きな性能差を明らかにした。
以上の結果から, 最強モデルでさえ熱画像の理解に苦慮し, 性能はRGBベースの能力に強く制約されていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:11:22 GMT)
Vision-to-Music Generation: A Survey [11.0] ヴィジュアル・ツー・ミュージック・ジェネレーションは、映画スコアリング、ショートビデオ作成、ダンス音楽の合成といった分野における大きな応用可能性を示している。
ヴィジュアル・ツー・ミュージックの研究は、複雑な内部構造とビデオとの動的関係のモデル化が難しいため、まだ初期段階にある。
既存の調査では、ヴィジュアル・ツー・ミュージックに関する包括的な議論をすることなく、一般的な音楽生成に焦点を当てている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:21:54 GMT)
Simple and high-precision Hamiltonian simulation by compensating Trotter error with linear combination of unitary operations [11.0] そこで我々は,LCUを用いたハミルトンシミュレーションアルゴリズムを提案し,Trotter誤差を補償する。
我々の最初のアルゴリズムは、Kth-order Trotter公式の精度スケーリングを指数関数的に改善する。
格子ハミルトニアンにとって、このアルゴリズムはほぼ線形なシステムサイズ依存を享受する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:38:41 GMT)
Frequency-Aware Gaussian Splatting Decomposition [11.0] 3D Gaussian Splatting (3D-GS)は、その効率的で明示的な表現によって、新しいビュー合成に革命をもたらした。
入力画像のラプラシアピラミッドのサブバンドに対応する3Dガウスをグループ化する周波数分解3D-GSフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:35:40 GMT)
Graph Sampling for Scalable and Expressive Graph Neural Networks on Homophilic Graphs [10.9] グラフニューラルネットワーク(GNN)は多くのグラフ機械学習タスクに優れるが、大規模ネットワークへのスケーリングでは課題に直面している。
グラフ構造を保存するために特徴ホモフィリーを利用する新しいグラフサンプリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 21:40:10 GMT)
ProHOC: Probabilistic Hierarchical Out-of-Distribution Classification via Multi-Depth Networks [10.9] ディープラーニングにおけるアウト・オブ・ディストリビューション(OOD)検出は、伝統的にバイナリタスクとしてフレーム化されてきた。
クラス階層におけるOODサンプルの検出と分類を行うフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:39:55 GMT)
StarFlow: Generating Structured Workflow Outputs From Sketch Images [10.9] 本稿では,視覚言語モデルを用いたスケッチから構造化ワークフロー出力を生成するフレームワークであるStarFlowを紹介する。
アプローチの強みと限界を分析するために、複数の視覚言語モデルを微調整し、ベンチマークします。
この結果から,ファインタニングによりワークフロー生成が大幅に向上し,このタスクにおける視覚言語モデルの性能が向上することが示された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:04:05 GMT)
Federated Intelligence: When Large AI Models Meet Federated Fine-Tuning and Collaborative Reasoning at the Network Edge [10.8] 大規模人工知能(AI)モデルは、様々なアプリケーションシナリオにおいて顕著な能力を示す。
ネットワークエッジにデプロイすることは、データプライバシや計算リソース、レイテンシといった問題によって、重大な問題を引き起こす。
本稿では,資源制約のある無線ネットワークにおける大規模AIモデルの実装を容易にするための,ファインチューニングと協調推論技術について検討する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:56:36 GMT)
Graph-to-Vision: Multi-graph Understanding and Reasoning using Vision-Language Models [10.8] VLM(Vision-Language Models)は、例外的なクロスモーダルな関係推論能力と一般化能力を示す。
我々のベンチマークでは、知識グラフ、フローチャート、マインドマップ、ルートマップの4つのグラフカテゴリを網羅し、各グラフグループには、段階的に困難な3つの命令応答ペアが伴っている。
本研究は,VLMのマルチグラフ推論における未探索評価ギャップに対処するだけでなく,グラフ構造化学習における一般化優位性を実証的に検証する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:20:37 GMT)
DATA-WA: Demand-based Adaptive Task Assignment with Dynamic Worker Availability Windows [10.8] 空間的クラウドソーシングは、ロケーションベースのタスクをモバイルワーカーに割り当てる。
既存の研究は、現在、タスクの割り当てに重点を置いている。
本稿では,割り当てられたタスク数を最大化することを目的とした適応型タスク割り当て問題を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:46:12 GMT)
Beyond [cls]: Exploring the true potential of Masked Image Modeling representations [10.8] Masked Image Modeling (MIM) は視覚表現の自己監督学習(SSL)のための有望なアプローチとして登場した。
しかし、MIMのアウト・オブ・ボックス性能は競合するアプローチよりも劣る。
ほとんどのユーザは、大量のデータ、高いGPU消費、特別なユーザー知識を必要とするため、微調整はできません。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:59:41 GMT)
StyleStudio: Text-Driven Style Transfer with Selective Control of Style Elements [10.8] テキスト駆動型スタイル転送は、参照イメージのスタイルとテキストプロンプトによって記述されたコンテンツとをマージすることを目的としている。
テキスト・ツー・イメージ・モデルの最近の進歩はニュアンス・スタイルの変換を改善しているが、大きな課題は残る。
これらの問題に対処するための3つの補完戦略を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:10:19 GMT)
Pretrained Bayesian Non-parametric Knowledge Prior in Robotic Long-Horizon Reinforcement Learning [10.6] 強化学習(Reinforcement Learning, RL)の手法は通常、新しいタスクをゼロから学習する。
この研究は、潜在的な原始的なスキルモーションを未知の特徴を持つ非パラメトリックな特性を持つものとしてモデル化する手法を導入する。
非パラメトリックモデル、特にDirichlet Process Mixturesは、出生とマージによって強化され、スキルの多様な性質を効果的に捉えるための事前トレーニングに使用される。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:43:36 GMT)
Multispectral Demosaicing via Dual Cameras [10.3] マルチスペクトル(MS)画像は、幅広いスペクトル帯域にわたる詳細なシーン情報をキャプチャする。
MSデータの処理において重要なステップはデモサイシングであり、カメラが捉えたモザイクMS画像から色情報を再構成する。
本稿では、RGBとMSの両方が同一シーンを撮影するデュアルカメラ用に特別に設計されたMS画像復調方法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 22:40:55 GMT)
LeForecast: Enterprise Hybrid Forecast by Time Series Intelligence [10.2] LeForecastは、時系列タスクに適したエンタープライズインテリジェンスプラットフォームである。
時系列データとマルチソース情報の高度な解釈、および3ピラーモデリングエンジンを統合する。
本研究は3つの産業ユースケースにおけるLeForecastの展開とその性能についてレビューする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:58:06 GMT)
NeRF-based Point Cloud Reconstruction using a Stationary Camera for Agricultural Applications [10.2] 本稿では,ポイントクラウド(PCD)再構築のためのNeRFベースのフレームワークを提案する。
物体が台座上で回転するときに、静止カメラで画像をキャプチャするNeRFベースのPCD再構成法を開発した。
以上の結果から,静止カメラを用いて高品質なNeRFベースの3D再構成が可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:14:45 GMT)
Lobster: A GPU-Accelerated Framework for Neurosymbolic Programming [10.1] ニューロシンボリックプログラムは、より優れたデータ効率、解釈可能性、一般化可能性を達成するために、ディープラーニングとシンボリック推論を組み合わせる。
既存のニューロシンボリック学習フレームワークは、CPU上で動作するスローシンボリックコンポーネントを備えた、高度にスケーラブルでGPUを加速するニューラルコンポーネント間の不安定な結合を実装している。
ニューロシンボリック学習のために,GPUをエンドツーエンドに活用するための統一フレームワークであるLobsterを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:32:58 GMT)
DeCompress: Denoising via Neural Compression [10.1] 学習に基づくDenoisingアルゴリズムは、様々なDenoisingタスクにまたがって最先端のパフォーマンスを実現する。
しかし、そのようなモデルのトレーニングは、クリーンでノイズの多いイメージペアからなる大規模なトレーニングデータセットへのアクセスに依存している。
そこで本稿では,DeCompressと呼ぶ圧縮に基づくデノベーションアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 22:05:30 GMT)
ClusterSC: Advancing Synthetic Control with Donor Selection [10.1] 合成制御(SC)は、観察研究の顕著なツールとして登場した。
最近の研究は個人レベルのデータにその使用を拡大している。
観測単位が多ければ多いほど、このシフトはSCに次元性の呪いをもたらす。
本稿では,集団の行動が内部に整合するが,集団間で分散する,という考え方に基づいて,クラスタ・シンセティック・コントロール(ClusterSC)を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:50:32 GMT)
A Benchmark for Multi-speaker Anonymization [10.0] 本稿では,マルチ話者匿名化ベンチマークを提案する。
また、重複する会話のプライバシー漏洩についても論じる。
非オーバーラップシミュレーションと実世界のデータセットによる実験は、マルチスピーカー匿名化システムの有効性を実証している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:27:57 GMT)
Enhancing Domain-Specific Encoder Models with LLM-Generated Data: How to Leverage Ontologies, and How to Do Without Them [10.0] 限られたデータを持つ領域におけるエンコーダモデルの連続事前学習におけるLLM生成データの利用について検討する。
侵入生物学における埋め込みモデルの性能を評価するためのベンチマークをコンパイルする。
提案手法は,小さなエンコーダモデルのドメイン固有理解を向上させるために,完全自動パイプラインを実現することを実証した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 21:51:24 GMT)
Multimodal Data Integration for Sustainable Indoor Gardening: Tracking Anyplant with Time Series Foundation Model [9.8] 本稿では,コンピュータビジョン,機械学習(ML),環境センシングを統合し,植物の健康と成長を自動監視する新しいフレームワークを提案する。
従来のアプローチとは異なり、このフレームワークは、RGB画像、植物表現型データ、温度や湿度などの環境要因を組み合わせて、制御された生育環境における植物水ストレスを予測する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:19:37 GMT)
Research on the Design of a Short Video Recommendation System Based on Multimodal Information and Differential Privacy [9.6] 本稿では,マルチモーダル情報と差分プライバシー保護に基づく短いビデオレコメンデーションシステムを提案する。
深層学習モデルは、マルチモーダルデータの特徴抽出と融合に使われ、レコメンデーション精度を効果的に向上させる。
差分プライバシー保護機構は、システムの性能を維持しながら、ユーザのデータのプライバシを確保するように設計されている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 22:56:41 GMT)
GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics [9.5] GateLensはAlgebraベースのツールで、自動車分野のデータセットを分析する。
高いF1スコアを達成し、より堅牢な複雑で曖昧なクエリを処理する。
高い精度と信頼性を維持しながら、分析時間を80%以上削減する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:48:32 GMT)
JiraiBench: A Bilingual Benchmark for Evaluating Large Language Models' Detection of Human Self-Destructive Behavior Content in Jirai Community [9.5] 本稿では,大規模言語モデルによる自己破壊的コンテンツ検出の有効性を評価するための,最初のバイリンガルベンチマークである JiraiBench を紹介する。
我々は,薬物過剰摂取,摂食障害,自傷など多種の自己破壊行動を含む,全国的な地雷オンラインサブカルチャーに注目した。
本データセットは,3つの行動カテゴリーに沿って,多次元アノテーションを用いた10,419の中国語投稿と5000の日本語投稿からなる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:48:58 GMT)
Online POMDP Planning with Anytime Deterministic Guarantees [9.4] 近似解と最適解の間の離散POMDPに対する決定論的関係を導出する。
我々の導出は、新しいアルゴリズムセットの道を提供し、既存のアルゴリズムにアタッチできることを示します。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:30:07 GMT)
Hengqin-RA-v1: Advanced Large Language Model for Diagnosis and Treatment of Rheumatoid Arthritis with Dataset based Traditional Chinese Medicine [9.4] 本稿では,中国伝統医学(TCM)に特化した最初の大規模言語モデルであるHengqin-RA-v1を紹介する。
また,古代中国医学文献,古典文献,現代臨床研究から収集したRA特異的データセットであるHQ-GCM-RA-C1も紹介した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:39:45 GMT)
Empirical Studies of Large Scale Environment Scanning by Consumer Electronics [9.2] 六階建の細部走査(1,099点)を行う(17,567平方メートル)
多様なシナリオにおいて,デバイスの有効性,限界,性能の向上を評価する。
この研究は、Pro3が大規模アプリケーションに適した高品質な3Dモデルを生成する能力を示している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:27:35 GMT)
Improving Equivariant Networks with Probabilistic Symmetry Breaking [9.2] 同変ネットワークは既知の対称性をニューラルネットワークにエンコードし、しばしば一般化を強化する。
これは(1)自己対称性が共通な領域での予測タスク、(2)高対称性の潜在空間から再構成するために対称性を破らなければならない生成モデルの両方に重要な問題を引き起こす。
このような分布を表すのに十分な条件を確立する新しい理論結果を示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 21:04:49 GMT)
DeBackdoor: A Deductive Framework for Detecting Backdoor Attacks on Deep Models with Limited Data [9.1] 本稿では,現実的な制約下でのバックドア検出のための新しい枠組みを提案する。
可能なトリガの空間を誘導的に探索することで、候補トリガを生成する。
我々は、広範囲の攻撃、モデル、およびデータセットについて広範な評価を行う。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:31:10 GMT)
Exploring Widevine for Fun and Profit [8.9] 私たちは、最も広く使われているソリューションである、クローズドソースのWidevine DRMに焦点を当てています。
われわれの研究は、Androidにおけるワイドヴィン内部の研究である。
本研究では,Widevine関数呼び出しをトレースし,インスペクションのためのメッセージのインターセプトを行うFridaに基づくツールを開発した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:07:02 GMT)
SimROD: A Simple Baseline for Raw Object Detection with Global and Local Enhancements [8.8] RAWオブジェクト検出のための軽量かつ効果的なアプローチであるSimRODを提案する。
学習可能なグローバルガンマ変換を4つのパラメータで適用可能なグローバルガンマ拡張(GGE)モジュールを提案する。
我々の研究は、現実世界の物体検出のためのRAWデータの可能性を強調している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:58:54 GMT)
Accelerating Antibiotic Discovery with Large Language Models and Knowledge Graphs [8.8] そこで本研究では,LLMをベースとしたアラームシステムを構築し,抗生物質活性の先行的証拠を検知し,コストのかかる再発見を防止するパイプラインを提案する。
このシステムは生物と化学の文献を知識グラフ(KG)に統合し、分類学的解決、同義語処理、多段階の証拠分類を確実にする。
結果は、エビデンスをレビューし、偽陰性を減らし、意思決定を加速するためのパイプラインの有効性を強調した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:26:55 GMT)
Bandwidth-Efficient Two-Server ORAMs with O(1) Client Storage [8.7] セキュアな双方向RAM計算用に設計された2サーバORAMは、2つの非凝固サーバにデータを格納する。
本稿では,O(1)ローカルストレージ下での対数帯域幅を実現するクライアントフレンドリーな2サーバORAM方式を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:37:42 GMT)
Online Reasoning Video Segmentation with Just-in-Time Digital Twins [8.6] 推論セグメンテーション(RS)は、暗黙のテキストクエリに基づいて関心のあるオブジェクトを識別し、セグメンテーションすることを目的としている。
現在のRSアプローチは、マルチモーダルな大言語モデルの視覚知覚能力に大きく依存している。
LLMの微調整を伴わないオンラインビデオRSの認識と推論を阻害するエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 00:06:40 GMT)
Provable Reduction in Communication Rounds for Non-Smooth Convex Federated Learning [8.5] 我々は,複数の局所的なステップを改良したフェデレート学習アルゴリズムであるFedMLSを提案する。
FedMLSは$mathcalO(1/epsilon)$通信ラウンドで$epsilon$-suboptimalソリューションを得る。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:48:34 GMT)
Enhancing Repository-Level Software Repair via Repository-Aware Knowledge Graphs [8.5] リポジトリレベルのソフトウェア修復は、問題記述とコードパッチの間のセマンティックギャップを埋める際の課題に直面します。
既存のアプローチは、主に大きな言語モデル(LLM)に依存しており、意味的曖昧さ、構造的コンテキストの理解の制限、推論能力の不足に悩まされている。
本稿では,リポジトリのアーティファクト(課題とプル要求)とエンティティを正確にリンクする新しいリポジトリ対応知識グラフ(KG)を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:21:47 GMT)
CMD-HAR: Cross-Modal Disentanglement for Wearable Human Activity Recognition [8.3] HAR(Human Activity Recognition)は、多くの人間中心のインテリジェントなアプリケーションのための基礎技術である。
本研究の目的は、マルチモーダルデータミキシング、アクティビティディスク、センサに基づく人間活動における複雑なモデル展開などの課題に対処することである。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:21:49 GMT)
Evaluating Text-to-Image Synthesis with a Conditional Fréchet Distance [8.2] テキストと画像の合成を評価することは、確立されたメトリクスと人間の嗜好の相違により困難である。
視覚的忠実度とテキストプロンプトアライメントの両方を考慮に入れた指標であるcFreDを提案する。
本研究は,テキスト・ツー・イメージ・モデルの体系的評価のための,堅牢で将来性の高い指標として,cFreDを検証した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:35:14 GMT)
STAMICS: Splat, Track And Map with Integrated Consistency and Semantics for Dense RGB-D SLAM [8.2] 本稿では,3次元ガウス表現と意味情報を統合して局所化とマッピングの精度を向上させる新しい手法STAMICSを紹介する。
実験により、STAMICSはカメラのポーズ推定とマップの品質を著しく改善し、再現誤差を低減しつつ、最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:10:51 GMT)
MAP-based Problem-Agnostic diffusion model for Inverse Problems [8.2] 逆問題に対するMAPに基づく誘導項推定法を提案する。
このイノベーションは、データ固有の特性をよりよく捉え、パフォーマンスを向上します。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:10:42 GMT)
Quantization-aware Matrix Factorization for Low Bit Rate Image Compression [8.0] 画像圧縮は効率的な伝送と保存に不可欠である。
本稿では、量子化対応行列分解法(QMF)を導入し、新しい損失画像圧縮法を提案する。
我々の手法は、JPEGを低ビットレートで0.25ビット/ピクセル(bpp)以下で連続的に上回り、高いビットレートで比較する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:26:49 GMT)
ReWind: Understanding Long Videos with Instructed Learnable Memory [8.0] VLM(Vision-Language Models)は、テキスト情報と視覚情報の統合的な理解を必要とするアプリケーションに不可欠である。
本稿では,時間的忠実さを保ちながら,より効率的な長時間ビデオ理解を実現するためのメモリベースの新しいVLMであるReWindを紹介する。
本稿では,視覚的質問応答(VQA)と時間的グラウンド処理におけるReWindの優れた性能を実証的に示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 23:05:29 GMT)
Parametric Shadow Control for Portrait Generationin Text-to-Image Diffusion Models [8.0] Shadow Directorは、よく訓練された拡散モデル内で隠れたシャドウ属性を抽出し、操作する手法である。
私たちのアプローチでは、数千の合成画像とトレーニング時間しか必要としない、小さな推定ネットワークを使用します。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:42:52 GMT)
Improving $(α, f)$-Byzantine Resilience in Federated Learning via layerwise aggregation and cosine distance [7.9] フェデレートラーニング(FL)は、分散機械学習におけるデータプライバシの課題に対する潜在的な解決策である。
FLシステムは、悪意のあるノードが破損したモデル更新に寄与するビザンティン攻撃に弱いままである。
本稿では,高次元設定における規則の堅牢性向上を目的とした新しいアグリゲーション手法であるLayerwise Cosine Aggregationを紹介する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:07:39 GMT)
StyledStreets: Multi-style Street Simulator with Spatial and Temporal Consistency [7.9] textbfStyledStreetsは、命令駆動のシーン編集を実現するマルチスタイルのストリートシミュレータである。
ハイブリッド埋め込みスキームは、過渡的なスタイル属性から永続的なシーン幾何学を分離する。
統一パラメトリックモデルは 正規化更新による 幾何学的ドリフトを防ぐ
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:52:29 GMT)
Exponentially Weighted Instance-Aware Repeat Factor Sampling for Long-Tailed Object Detection Model Training in Unmanned Aerial Vehicles Surveillance Scenarios [7.8] E-IRFS(Exponentially Weighted Instance-Aware Repeat Factor Smpling)を導入する。
E-IRFSは、稀なクラスと頻繁なクラスを区別するために指数スケーリングを適用している。
本研究では,Fireman-UAV-RGBTデータセットから得られたデータセットからE-IRFSを評価する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:09:37 GMT)
Advancing CAN Network Security through RBM-Based Synthetic Attack Data Generation for Intrusion Detection Systems [7.8] Internet of Vehicles (IoV)では、CAN(Controller Area Network)が深刻なサイバーセキュリティの脅威に対して極めて脆弱になっている。
本稿では,制限ボルツマンマシン(RBM)を用いて合成CAN攻撃データを生成する手法を提案する。
CANetの精度は0.6477から0.9725に向上し、EfficientNetは0.1067から0.1555に向上した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:33:55 GMT)
TLUE: A Tibetan Language Understanding Evaluation Benchmark [7.7] チベット語は700万人以上の人々が話しているが、大きな言語モデルの開発と評価は無視されている。
我々は,チベット語におけるLLMの能力を評価するための,最初の大規模ベンチマークであるTLUE(A Tibetan Language Understanding Evaluation Benchmark)を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:38:57 GMT)
RoadSocial: A Diverse VideoQA Dataset and Benchmark for Road Event Understanding from Social Video Narratives [7.4] RoadSocialは、ソーシャルメディアの物語から一般的な道路イベントを理解するために設計された、大規模で多様なVideoQAデータセットである。
RoadSocialは、14Mフレームと414Kソーシャルコメントにまたがるソーシャルメディアビデオから派生したもので、結果として13.2Kビデオ、674タグ、260K高品質QAペアのデータセットが作られる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:49:09 GMT)
Reward Design for Reinforcement Learning Agents [7.3] リワード機能は強化学習(RL)の中心であり、最適な意思決定を導くためのエージェントである。
この論文は、RLにおける報酬シグナルの重要な役割を解明し、エージェントの行動と学習力学への影響を強調している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:48:02 GMT)
Characterization of GPU TEE Overheads in Distributed Data Parallel ML Training [7.2] 信頼できるコンピューティング(CC)または信頼できる実行エンクレーブ(TEE)は、クラウドでセキュアなコンピューティングを実現するための最も一般的なアプローチである。
NVIDIAによるGPU TEEの導入により、モデルウェイトやデータをクラウドプロバイダにリークすることなく、マシンラーニング(ML)モデルをトレーニングすることが可能になった。
本稿では,GPU TEEを用いた分散データ並列(DDP)MLトレーニングの実行に伴う性能オーバーヘッドについて,詳細な解析を行った。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 23:20:14 GMT)
HOT: Hadamard-based Optimized Training [7.2] メモリ使用量と計算オーバーヘッドを減らすためにバックプロパゲーションを最適化することがますます重要になっている。
本稿では,トレーニングコストの最大部分を占める行列乗法に着目し,そのバックプロパゲーションを詳細に分析する。
そこで本研究では,アダマールをベースとしたオプティマイズトレーニング手法を提案する。
このアプローチでは、Hadamard量子化やHadamard低ランク近似などのHadamardに基づく最適化を適用する。
我々の広範な分析によると、HOTは75%のメモリ節約と2.6倍の加速を実現している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:37:24 GMT)
Confidence Adjusted Surprise Measure for Active Resourceful Trials (CA-SMART): A Data-driven Active Learning Framework for Accelerating Material Discovery under Resource Constraints [7.2] 代理機械学習(英: surrogate machine learning、ML)モデルは、人間の科学者の科学的発見過程を模倣するモデルである。
サプライズの概念(期待された結果と観測された結果の相違を捉える)は、実験を推し進める大きな可能性を示している。
本稿では,データ駆動実験の最適化に適したベイズ的アクティブラーニングフレームワークである,アクティブ・リソース・トライアルのための信頼性調整サプライズ尺度(CA-)を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:21:42 GMT)
Neural Architecture Search by Learning a Hierarchical Search Space [7.2] Monte-Carlo Tree Search (MCTS) は、対戦ゲームのような多くの非微分不可能な検索関連問題に対して強力なツールである。
ニューラルネットワーク探索(NAS)では、最終アーキテクチャだけが重要なので、分岐の訪問順序を最適化して学習を改善することができる。
アーキテクチャの階層的クラスタリングにより分岐を学習することを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 00:20:13 GMT)
Graph Anomaly Detection in Time Series: A Survey [7.1] 時系列異常検出は,様々な時系列アプリケーションにおいて重要な課題である。
最近のグラフベースのアプローチは、この分野の課題に取り組む上で、驚くべき進歩を遂げている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:47:29 GMT)
Data Poisoning in Deep Learning: A Survey [7.1] ディープラーニングは現代の人工知能の基盤となり、幅広い領域にわたるトランスフォーメーションアプリケーションを可能にしている。
ディープラーニングモデルは、悪意ある操作されたトレーニングデータを導入して、モデルの精度を低下させたり、異常な振る舞いを引き起こす、データ中毒の重大な脅威に直面します。
この調査は、複数の視点でデータ中毒攻撃を分類し、その特徴と根底にある設計基準を詳細に分析する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:16:57 GMT)
Generative Decoding for Quantum Error-correcting Codes [7.0] 機械学習における生成モデリングを利用した復号化アルゴリズムを提案する。
自己回帰ニューラルネットワークを用いて、論理演算子とシンドロームの結合確率を教師なしで学習する。
提案手法は,実時間および高レートの量子誤り訂正符号をリアルタイムに復号化するための潜在的な解決策として,生成人工知能を強調している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:08:03 GMT)
An Empirical Study of the Impact of Federated Learning on Machine Learning Model Accuracy [6.9] Federated Learning (FL)は、グローバルスケールでプライベートユーザデータを分散MLモデルでトレーニングすることを可能にする。
我々は,この学習パラダイムが各種MLタスクの最先端MLモデルの精度にどのように影響するかを,体系的に検討する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:16:06 GMT)
An Efficient Training Algorithm for Models with Block-wise Sparsity [6.9] 本稿では,学習と推論において,計算コストとメモリコストの両方を削減できる効率的なトレーニングアルゴリズムを提案する。
我々のアルゴリズムは、ベースラインに比べて性能低下を伴わずに計算とメモリコストを大幅に削減できる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:14:27 GMT)
GI-GS: Global Illumination Decomposition on Gaussian Splatting for Inverse Rendering [6.8] GI-GSは3次元ガウススティング(3DGS)と遅延シェーディングを利用する新しい逆レンダリングフレームワークである。
筆者らのフレームワークでは,まずGバッファを描画し,シーンの詳細な形状と材料特性を捉える。
Gバッファと以前のレンダリング結果により、ライトウェイトパストレースにより間接照明を計算することができる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:48:33 GMT)
Towards Fully Automated Decision-Making Systems for Greenhouse Control: Challenges and Opportunities [6.8] マシンラーニングは、複雑なシステムを望ましい状態に駆動するコントロールポリシの構築に成功している。
本稿では、このような政策学習手法を、別のユニークな実用的なユースケースシナリオ-ファーミングのために検討する。
まず、ドメイン固有の課題だけでなく、潜在的な解決策の機会を特定するために、最新の研究の概要を概説する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:06:59 GMT)
On learning higher-order cumulants in diffusion models [6.6] 本研究では, 高次累積関数, あるいは連結n点関数の挙動を, 前方および後方の両方の過程下で研究する。
モーメントおよび累積生成関数の明示的な表現を導出する。
我々は,非ゼロ累積およびスカラー格子場理論を用いた,正確に解けるおもちゃモデルで実験結果を検証した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:59:55 GMT)
A tale of two goals: leveraging sequentiality in multi-goal scenarios [6.5] 目的が現在の目標だけでなく,その後の目標に到達したポリシを優先する,マルコフ決定プロセス(MDP)の2つの例を紹介する。
第一にエージェントは現在のゴールと最終ゴールの両方で条件付けされ、第二に、次の2つのゴールで条件付けされる。
標準GC-MDPと提案MDPの両方でTD3+HERでトレーニングされたポリシーを評価することで、ほとんどの場合、次の2つの目標を条件付けすることで安定性とサンプル効率が向上することを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:47:46 GMT)
HSLiNets: Evaluating Band Ordering Strategies in Hyperspectral and LiDAR Fusion [6.4] バンドオーダーがHSI-LiDAR融合性能に及ぼす影響について検討する。
複数のバンド順序構成から学習する新しい融合アーキテクチャを提案する。
我々の手法は最先端の核融合モデルより優れている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 01:11:31 GMT)
OmniVox: Zero-Shot Emotion Recognition with Omni-LLMs [6.4] ゼロショット感情認識タスクにおける4つのオムニ-LLMの最初の体系的評価であるOmniVoxを提案する。
我々は、IEMOCAPとMELDの2つの広く使われているマルチモーダル感情ベンチマークを評価し、ゼロショットのOmni-LLMが優れているか、微調整されたオーディオモデルと競合するかを見出した。
本稿では、音響特徴分析、会話コンテキスト分析、ステップバイステップ推論に焦点を当てた、オムニ-LLMの音声特異的プロンプト戦略である音響プロンプトについて述べる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:12:49 GMT)
Semi-Supervised Self-Learning Enhanced Music Emotion Recognition [6.3] 音楽感情認識(MER)は、ある楽曲で伝達される感情を特定することを目的としている。
現在利用可能な公開データセットは、サンプルサイズが制限されている。
本稿では,正誤ラベル付きサンプルを自己学習方式で識別する半教師付き自己学習法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:39:50 GMT)
SoK: How Robust is Audio Watermarking in Generative AI models? [6.2] 有効にするためには、音声透かしは検出を回避するために信号を歪ませる除去攻撃に抵抗しなければならない。
強靭性を主張する最近の透かし方式が広範囲の除去攻撃に耐えられるか検討する。
我々は、オープンソースコードを使用して9つの透かしスキームを再現し、新しい8つの非常に効果的な攻撃を特定し、11つの重要な発見をハイライトする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 00:51:02 GMT)
Magnitude-Phase Dual-Path Speech Enhancement Network based on Self-Supervised Embedding and Perceptual Contrast Stretch Boosting [6.2] BSP-MPNetは、音声強調のための自己教師付き特徴と等級情報を組み合わせたデュアルパスフレームワークである。
我々はVoiceBank+DEMANDとWHAMR!データセット上でBSP-MPNetを評価する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:52:06 GMT)
Counterfactual Influence in Markov Decision Processes [6.1] 対実的および介入的分布の比較に基づく影響の形式的特徴化を導入する。
我々は、与えられた報酬構造に最適であるだけでなく、観察された経路に合わせて調整された反事実政策を導出する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:59:05 GMT)
Recent advances in high-dimensional mode-locked quantum frequency combs [6.1] 本稿では,高次元エネルギー時間絡み合う量子周波数コムの最近の技術進歩について概説する。
我々は、スケーラブルな通信波長成分を用いて達成されたこれらの時間周波数キューディットが、大規模量子状態の生成をいかに促進するかを探求する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:40:36 GMT)
GlaLSTM: A Concurrent LSTM Stream Framework for Glaucoma Detection via Biomarker Mining [5.9] 緑内障検出のための新しいLSTMストリームフレームワークであるGlaLSTMを提案する。
画像から緑内障を主に検出する従来のCNNベースのモデルとは異なり、GlaLSTMはより深い解釈性を提供する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 22:22:48 GMT)
Entanglement harvesting of circularly accelerated detectors with a reflecting boundary [5.7] 反射境界と相互作用する円周加速検出器の遷移確率特性について検討する。
境界を持つ2つの円周加速検出器の絡み合い収穫現象を解析した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:20:42 GMT)
Retrieving Time-Series Differences Using Natural Language Queries [5.6] 本稿では,クエリで指定された差分に基づいて時系列データのペアを検索するための自然言語クエリに基づくアプローチを提案する。
違いの6つの重要な特徴を定義し、対応するデータセットを構築し、時系列データとクエリテキストの差分を一致させる対照的な学習ベースモデルを開発する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:15:17 GMT)
An Industry Interview Study of Software Signing for Supply Chain Security [5.4] 実際にソフトウェア署名の効果的な実装に影響を与える課題について検討する。
私たちは、ソフトウェア署名の実装を妨げる、技術的、組織的、人間的なさまざまな課題を強調します。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 21:00:56 GMT)
MSPLoRA: A Multi-Scale Pyramid Low-Rank Adaptation for Efficient Model Fine-Tuning [5.4] 我々は,グローバル共有ロラ,ミッドレベル共有ロラ,レイヤ特化ロラを導入して,グローバルパターン,中間レベル特徴,きめ細かい情報をキャプチャするMPPLoRAを提案する。
様々なNLPタスクの実験により、MPPLoRAはトレーニング可能なパラメータの数を著しく減らしながら、より効率的な適応とより良い性能を実現することが示された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:01:50 GMT)
Rethinking the Global Knowledge of CLIP in Training-Free Open-Vocabulary Semantic Segmentation [5.3] 本稿では,TF-OVSSにおけるCLIPのグローバル知識を抽出し,活用するためのGCLIPを提案する。
我々は、パッチ間の均一な注意パターンを導入せずに、最終ブロックの注意を画像レベルの特性と同等にすることを目指している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 01:18:44 GMT)
OccRobNet : Occlusion Robust Network for Accurate 3D Interacting Hand-Object Pose Estimation [5.3] 咬合は3Dのポーズを推定する上で難しい問題の一つだ。
本稿では,入力されたRGB画像から3次元手オブジェクトのポーズを推定するための,頑健で高精度なオクルージョン手法を提案する。
提案手法は,まずCNNモデルを用いて手関節のローカライズを行い,その後文脈情報を抽出して補修する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:36:55 GMT)
PLAIN: Scalable Estimation Architecture for Integrated Sensing and Communication [5.1] 統合センシング通信(ISAC)は、次世代モバイルネットワークが構築されるパラダイムの1つである。
センサ統合の主な側面は、周辺環境に関する情報を抽出するパラメータ推定である。
本論文では,複数次元で柔軟にスケール可能なテンソルベース推定アーキテクチャであるPLAINを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:04:46 GMT)
Geographical hotspot prediction based on point cloud-voxel-community partition clustering [5.0] 本研究では, ポイントクラウド-ボクセル-コミュニティ分割クラスタリングを用いて, 地理的ホットスポットの検出と予測を行う手法を提案する。
実験の結果,トルコの考古学遺跡のデータセットに適用すると,処理速度が19.31%向上し,精度が6%低下した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 01:59:24 GMT)
Gaze-Guided 3D Hand Motion Prediction for Detecting Intent in Egocentric Grasping Tasks [5.0] 本稿では,手ポーズと関節位置の両方の将来のシーケンスを予測する新しいアプローチを提案する。
ベクトル量子化された変分自動エンコーダを用いて,手の動き列予測のための自己回帰生成変換器を用いた手ポーズ符号化を行う。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:26:41 GMT)
VADMamba: Exploring State Space Models for Fast Video Anomaly Detection [4.9] VQ-Mamba Unet(VQ-MaU)フレームワークには、Vector Quantization(VQ)層と、Mambaベースの非負のVisual State Space(NVSS)ブロックが組み込まれている。
提案するVADMambaの有効性を3つのベンチマークデータセットで検証した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:38:12 GMT)
RocketPPA: Ultra-Fast LLM-Based PPA Estimator at Code-Level Abstraction [4.8] 完全クリーン化および合成可能なVerilogモジュールの21kデータセットを活用する新しいフレームワークを導入する。
我々は、LoRAに基づくパラメータ効率の手法を用いてCodeLlamaを微調整し、タスクを回帰問題としてフレーミングし、VerilogコードからPPAメトリクスを正確に予測する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:35:09 GMT)
AcL: Action Learner for Fault-Tolerant Quadruped Locomotion Control [4.6] Action Learner (AcL) は、教師による新しい強化学習フレームワークである。
AcLにより、四足歩行者は、複数の関節断層の下での安定した歩行に自律的に歩行を適応することができる。
我々は,単関節および二重関節の故障下で,実際のGo2四足歩行ロボット上でAcLを検証する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:47:20 GMT)
Interpretable Cross-Sphere Multiscale Deep Learning Predicts ENSO Skilfully Beyond 2 Years [4.6] PTSTnetは24ヶ月を超えるリードタイムで最先端のベンチマークを著しく上回り、解釈可能な予測を生成する。
私たちの成功は、革新的なニューラルオーシャンモデリングに関する解釈可能な洞察において、大きな一歩を踏み出します。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:55:29 GMT)
Simulation-informed deep learning for enhanced SWOT observations of fine-scale ocean dynamics [4.6] 微細なスケールでの海洋プロセスは、衛星やその場での観測に制限があるため、正確に観測することは極めて困難である。
現在の手法はノイズの多いデータに苦しむか、広範囲の教師付きトレーニングを必要とし、実世界の観測に効果を制限している。
本稿では、実SWOT観測とシミュレーション参照データを組み合わせた教師なし逆学習フレームワークであるSIMPGENを紹介する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:29:33 GMT)
A Quantitative Approach to Evaluating Open-Source EHR Systems for Indian Healthcare [4.5] インドの厚生省は、臨床文書の統一を容易にするため、電子健康記録最小データセット(EHRMDS)を導入した。
本研究は、インドにおける医療環境に最も適したシステムを決定するために、ERHMDSとOS-EHRSの整合性を体系的に評価する。
結果は、OpenEMRはメタデータ要素の73.81%をカバーし、EHRMDSとの互換性が最も高いことを示し、OpenClinicは33.33%のアライメントを示した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:55:03 GMT)
The Procedural Content Generation Benchmark: An Open-source Testbed for Generative Challenges in Games [4.4] ベンチマークには12のゲーム関連の問題があり、それぞれに複数のバリエーションがある。
各問題には、コンテンツ表現、制御パラメータ、品質、多様性、制御性の評価指標がそれぞれ備わっている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:05:40 GMT)
A Measure Based Generalizable Approach to Understandability [4.3] 成功したエージェントと人間のパートナーシップは、エージェントが生成した情報を人間に理解することを要求する。
本稿では,最先端エージェントのディレクティブとして利用可能な,理解可能性のドメイン非依存尺度の開発について論じる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:36:49 GMT)
CMED: A Child Micro-Expression Dataset [4.3] 本研究は, 自然発生児のマイクロエプレッションビデオのデータセットを作成した。
このデータセットは、大人と子供のマイクロ表現の主な特徴と違いを探索することを可能にする。
本研究は, 小児におけるマイクロ表現の自動スポッティングと認識の基準となることも確認した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:55:32 GMT)
A Catalog of Micro Frontends Anti-patterns [4.3] 本報告では12種類のMFEアンチパターンのカタログについて述べる。
業界関係者と調査を行い、アンチパターンを洗練させるために貴重なフィードバックを集めました。
収集されたフィードバックは、アンチパターンカタログの改良版の開発につながった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:31:41 GMT)
Unveiling Latent Information in Transaction Hashes: Hypergraph Learning for Ethereum Ponzi Scheme Detection [4.3] 既存の不正検出方法は通常、トランザクションをグラフとしてモデル化する。
本稿では,トランザクションをハイパーエッジとして扱うPonziスキーム検出のためのハイパーグラフモデリング手法を提案する。
Ponziスキーム検出におけるハイパーグラフの優位性を示すため,ハイパーホモグラフ検出チャネルは大幅な性能向上を実現していることを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:52:47 GMT)
LLM-Gomoku: A Large Language Model-Based System for Strategic Gomoku with Self-Play and Reinforcement Learning [4.2] 本研究では,大規模言語モデル(LLM)に基づく五目AIシステムの開発を目的とする。
五目成層論や論理を理解・適用し、合理的な決定を下すよう設計されている。
広範囲な自己演奏訓練を経て、モデルの五目演奏能力は顕著に強化された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:52:25 GMT)
Immersive Multimedia Communication: State-of-the-Art on eXtended Reality Streaming [4.2] 拡張現実(XR)は急速に進歩し、コンテンツの創造と消費に革命をもたらす可能性がある。
本調査は,マルチパラダイムに着目したXRストリーミングの現状を概観する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:28:53 GMT)
Extracting energy via bosonic Gaussian operations [4.2] 二次ハミルトニアンが支配するボソニック系から抽出できる最大エネルギーの式を見つける。
この式は、標準エルゴトロピーの有名な固有値ベースの式に似ているが、代わりにシンプレクティック固有値を用いて定式化される。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:56:00 GMT)
Enhance Vision-based Tactile Sensors via Dynamic Illumination and Image Fusion [4.1] 視覚ベースの触覚センサーは、構造光を使ってエラストマー界面の変形を測定する。
これまで、視覚ベースの触覚センサーは、センサーの特定のフォームファクタに合わせて調整された、構造化された光の1つの静的パターンを使用してきた。
我々は、異なる照明パターンで複数の測定値を取り込んで、それらを融合して、1つの高品質な測定値を得る方法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:19:57 GMT)
The Cost of Local and Global Fairness in Federated Learning [4.1] フェデレートラーニング(FL)における公平性の2つの概念
本稿では,マルチクラスFL設定において,特定のグローバル・ローカル・フェアネスのレベルを達成できない最小限の精度について検討する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:37:54 GMT)
Bias Evaluation and Mitigation in Retrieval-Augmented Medical Question-Answering Systems [4.0] 本研究は、複数のQAベンチマークで医療用RAGパイプライン内の人口統計バイアスを系統的に評価する。
我々は、思考の推論の連鎖、対実的フィルタリング、適応的即興改善、多数決の集約など、特定バイアスに対処するために、いくつかのバイアス緩和戦略を実装し、比較する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 01:51:23 GMT)
Stochastic Engrams for Efficient Continual Learning with Binarized Neural Networks [4.0] 我々は,メタプラスティック二項化ニューラルネットワーク(mBNN)のゲーティング機構として,可塑性活性化エングラムを統合した新しいアプローチを提案する。
以上の結果から, (A) トレードオフに対する安定性の向上, (B) メモリ集中度低下, (C) 双項化アーキテクチャの性能向上が示された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:21:00 GMT)
Multi-View and Multi-Scale Alignment for Contrastive Language-Image Pre-training in Mammography [4.0] マンモグラフィーへの完全CLIPモデルの最初の適応の一つを提案する。
われわれはまず,マンモグラフィーの多視点性を活用した特別監視フレームワークを開発する。
最後に,データ制限に対処するために,医学知識を事前学習した大規模言語モデルに対して,パラメータ効率のよい微調整手法を取り入れた。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:39:55 GMT)
Uncertainty propagation in feed-forward neural network models [4.0] 我々はフィードフォワードニューラルネットワークアーキテクチャのための新しい不確実性伝搬法を開発した。
ニューラルネットワーク出力の確率密度関数(PDF)の解析式を導出する。
鍵となる発見は、リークReLu活性化関数の適切な線形化が正確な統計的結果をもたらすことである。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 00:16:36 GMT)
The MVTec AD 2 Dataset: Advanced Scenarios for Unsupervised Anomaly Detection [4.0] 8000以上の高解像度画像を含む8つの異常検出シナリオの集合であるMVTec AD 2を提案する。
従来のデータセットでは考慮されていない、挑戦的で、非常に関係の深い産業検査のユースケースを含んでいる。
我々のデータセットは、実世界の分散シフト下でのメソッドのロバスト性を評価するために、照明条件の変更を伴うテストシナリオを提供する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:41:46 GMT)
SyncSDE: A Probabilistic Framework for Diffusion Synchronization [3.7] 本稿では,なぜ拡散同期が機能するのかを解析し,どの点に相関するべきかを明らかにするためのフレームワークを提案する。
タスク毎の最適相関モデルを特定し、従来の手法よりも優れた結果を得る。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:40:53 GMT)
Rolled Gaussian process models for curves on manifolds [3.5] ローリング操作は、球面と平面の間の局所的な等距離を誘導し、2つの曲線が互いに一意に決定する。
転がりを用いて、ユークリッドガウス過程から始まる多様体上のガウス過程の類似体を構築する。
得られたモデルは生成的であり、多様体上の曲線として与えられた統計的推測に従うことができる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:52:18 GMT)
Efficient Learning for Entropy-regularized Markov Decision Processes via Multilevel Monte Carlo [3.4] 本稿では,固定点反復とベルマン作用素の一般近似を融合したマルチレベルモンテカルロアルゴリズムを提案する。
本稿では,Bellman演算子に対する偏平MC推定値を用いることで,準ポリノミカル標本の複雑さが生じることを示す。
特に、これらのアルゴリズムは状態空間や作用空間の次元や濃度に依存しない。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:35:23 GMT)
Starjob: Dataset for LLM-Driven Job Shop Scheduling [3.4] ジョブショップスケジューリング問題(JSSP)の最初の教師付きデータセットであるStarjobを紹介します。
LLaMA 8B 4ビット量子化モデルをLoRA法で微調整し、エンドツーエンドのスケジューリング手法を開発した。
提案手法は従来のプライオリティ・ディスパッチ・ルール(PDR)を超えるだけでなく,L2Dのような最先端のニューラルアプローチよりも顕著に改善されていることを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:38:45 GMT)
Standalone FPGA-Based QAOA Emulator for Weighted-MaxCut on Embedded Devices [3.4] 本研究は,組み込みシステムのための,コンパクトでスタンドアロンなFPGAベースのQCエミュレータを提案する。
提案した設計は、時間複雑性を O(N2) から O(N) に還元する。
エミュレータは2キュービット構成の1.53倍から9キュービット構成の852倍までの省エネを実現した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:17:28 GMT)
Leveraging Large Language Models for Risk Assessment in Hyperconnected Logistic Hub Network Deployment [3.3] ハブデプロイメントを成功させるためには、動的リスクアセスメントが不可欠です。
従来の手法では、構造化されていない情報を効果的に捉え分析するのに苦労することが多い。
このフレームワークは長期記憶にスケーラビリティを取り入れ、説明と解釈を通じて意思決定を強化する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:13:22 GMT)
Scaling Automated Database System Testing [3.3] 我々は、Commonsqlの機能のサブセットをサポートするデータベースにテストオラクルを適用するビジョンとプラットフォームを提示する。
本研究では,Commonsqlの機能サブセットをサポートするデータベースに対して,テストオーラクルを適用するためのビジョンとプラットフォームであるSQLancer++を提示する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:10:36 GMT)
Interval Estimation of Coefficients in Penalized Regression Models of Insurance Data [3.3] ツイーディー指数分散ファミリーは、保険の損失をモデル化するために多くの人々の間で人気がある。
内在変数を記述する最も重要な特徴の信頼性(推論)を得るためには、しばしば重要である。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 21:34:50 GMT)
Fine-Grained Behavior and Lane Constraints Guided Trajectory Prediction Method [3.3] 本稿では,行動意図認識と車線制約モデリングを統合した新しいデュアルストリームアーキテクチャBLNetを提案する。
我々のネットワークは、既存の直接回帰とゴールベースアルゴリズムよりも大きな性能向上を示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:06:57 GMT)
The Risks of Using Large Language Models for Text Annotation in Social Science Research [3.3] 我々は,大規模言語モデル(LLM)をコーディングタスクに使用することの約束とリスクを体系的に評価する。
社会科学者がLLMをテキストアノテーションに組み込むためのフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 23:33:36 GMT)
Enhancing Pavement Crack Classification with Bidirectional Cascaded Neural Networks [3.2] 本稿では,2方向カスケードニューラルネットワーク(BCNN)の実装と評価について述べる。
提案したBCNNモデルは,前向き情報流と後向き情報流の両方を活用するために設計され,そのカスケード構造により検出精度が向上した。
総合精度は87%で,精度,リコール,F1スコアは各カテゴリーで高い有効性を示した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:08:15 GMT)
FACETS: Efficient Once-for-all Object Detection via Constrained Iterative Search [3.2] textbfunderlineConstrained ittextbfunderlineEratextbfunderlineTivetextbfunderlineSearchは、すべてのモジュールのアーキテクチャを循環的に洗練する新しい統一的なNASメソッドである。
FACETSは、プログレッシブ検索戦略の2倍の精度で最大4.75%の精度でアーキテクチャを実現する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 21:35:02 GMT)
Integrating Travel Behavior Forecasting and Generative Modeling for Predicting Future Urban Mobility and Spatial Transformations [3.2] 交通計画は、都市開発、経済移動、インフラの持続可能性を形成する上で重要な役割を担っている。
伝統的な都市計画手法は、長期的な都市の成長と交通需要を正確に予測するのに苦労することが多い。
本研究では, 時空間融合変換器を統合し, 人口統計データから移動パターンを予測し, 都市環境の予測を行う。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:52:33 GMT)
Lattice Based Crypto breaks in a Superposition of Spacetimes [3.1] 量子重力理論において仮定された時空の重ね合わせの計算的含意について検討する。
格子ベースの暗号スキームのセキュリティは、時空の重畳に基づく計算モデルで妥協される。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:45:13 GMT)
Improving Object Detection by Modifying Synthetic Data with Explainable AI [3.1] 本稿では,合成画像の設計効率を向上させるための新しい概念的アプローチを提案する。
XAI技術は、これらの画像を生成するために使用される3Dメッシュモデルを修正する、ループ中の人間プロセスを導く。
合成データは、トレーニング中に見えない方向の車両の検出を4.6%改善できることを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:57:53 GMT)
Uhlmann's theorem for relative entropies [3.0] ウルマンの定理を $alpha$-R'enyi 相対エントロピーに一般化する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:10:30 GMT)
Malicious and Unintentional Disclosure Risks in Large Language Models for Code Generation [2.9] 本稿では、コード生成のために訓練された大言語モデル(LLM)が、トレーニングデータに含まれる機密情報を開示するコンテンツを生成するリスクについて検討する。
我々はこのリスクを、意図しない開示と悪意のある開示の2つのコンポーネントに分解する。
トレーニングデータセットとモデルの異なるリリース間で、意図しない、悪意のない開示リスクを並べて評価する方法を述べる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:09:23 GMT)
A Selective Homomorphic Encryption Approach for Faster Privacy-Preserving Federated Learning [2.9] フェデレーション学習(Federated Learning)は、分散デバイスやサーバ上でのトレーニングモデルをサポートする機械学習手法である。
このアプローチは、機密性の高いデータを共有せずにトレーニングできるため、医療において特に有用である。
我々は,データ漏洩を最小限に抑えるために,選択的暗号化,同型暗号化,差分プライバシー,ビットワイズスクランブルを利用する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:44:27 GMT)
A Data-Driven Method for INS/DVL Alignment [2.9] 慣性センサーとドップラー速度ログ(DVL)融合は長距離水中航法において有望な解決策である。
本稿では,アライメントプロセスのためのエンドツーエンドのディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:38:37 GMT)
A Multilevel Framework for Partitioning Quantum Circuits [2.9] 本稿では、量子回路分割のための既存の構成を定式化し、拡張する。
複数レベルの粒度でハイパーグラフと分割を粗くする多層手法について検討する。
これにより、ランタイムが減少し、標準パーティショニングのソリューション品質が向上します。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:11:06 GMT)
Audio-driven Gesture Generation via Deviation Feature in the Latent Space [2.9] 本稿では,音声合成に適した遅延表現偏差を学習する弱教師付きフレームワークを提案する。
提案手法では,より正確かつニュアンスなジェスチャー表現を実現するために,遅延動作特徴を統合する拡散モデルを用いている。
実験により,本手法は映像の画質を大幅に向上させ,最先端技術を上回った。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:37:16 GMT)
CleanGen: Mitigating Backdoor Attacks for Generation Tasks in Large Language Models [2.9] 我々は,大規模言語モデルにおける生成タスクに対するバックドアアタックを軽減するために,CLEANGENという新しい推論時間ディフェンスを開発した。
CLEANGENは最先端のSOTA (State-of-the-art) LLMと互換性がある。
以上の結果から,CLEANGENは5つのSOTAベースライン防御よりも攻撃成功率(ASR)が低いことが示唆された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:21:02 GMT)
Investigating the Duality of Interpretability and Explainability in Machine Learning [2.8] 複雑な「ブラックボックス」モデルは異常な予測性能を示す。
その本質的に不透明な性質は、透明性と解釈可能性に関する懸念を提起する。
本質的に解釈可能なモデルを開発するのではなく、これらのモデルを説明することに注力しています。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:48:40 GMT)
Compact and stable source of polarization-entangled photon-pairs based on a folded linear displacement interferometer [2.7] 自発パラメトリックダウン変換に基づく線形変位干渉計における偏光絡み合った光子対の音源について述べる。
検出されたペアレートは2.5M対/s/mWでベル状態の忠実度は94.1%+/-2.1%である。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:41:28 GMT)
On the Utility of Quantum Entanglement for Joint Communication and Instantaneous Detection [2.7] 絡み合いは、量子資源を利用する通信および検出方式の性能を著しく向上させることが知られている。
本研究では、(結合)通信および検出スキームにおける量子絡み合いの同時利用について検討する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:51:59 GMT)
Quantum feedback induced entanglement relaxation and dynamical phase transition in monitored free fermion chains with Wannier-Stark ladder [2.6] 本研究では, 傾斜フリーフェミオン鎖の動的相転移を計測フィードバックプロトコルにより検討した。
我々は,ワニエ・スターク・ラグポテンシャルによって増強されたフィードバックによる皮膚効果を明らかにする。
臨界遷移をピンポイントし、量子ジャンプ変動のフィードバック駆動による抑制にリンクする直感的な物理画像を提供する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:33:28 GMT)
Nonlinear Multiple Response Regression and Learning of Latent Spaces [2.6] 教師なし設定と教師なし設定の両方で潜在空間を学習できる統一手法を提案する。
ブラックボックス」として動作する他のニューラルネットワーク手法とは異なり、我々のアプローチはより良い解釈可能性を提供するだけでなく、計算の複雑さも減少させる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:28:06 GMT)
SandboxEval: Towards Securing Test Environment for Untrusted Code [2.6] この研究は、テスト環境のセキュリティと機密性の評価に重点を置いている。
私たちは、現実世界の安全シナリオをシミュレートする手作業によるテストケースを備えたテストスイートであるSandboxEvalを紹介します。
まず、このテストスイートは、悪意のあるコードを生成するための命令の下にある LLM 操作上の制限を正確に記述する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:56:00 GMT)
Real-Time Evaluation Models for RAG: Who Detects Hallucinations Best? [2.5] 本稿では,検索・拡張世代(RAG)における幻覚を自動的に検出する評価モデルについて検討する。
LLM-as-a-Judge, Prometheus, Lynx, Hughes Hallucination Evaluation Model (HHEM), the Trustworthy Language Model (TLM)。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:50:14 GMT)
AMA-SAM: Adversarial Multi-Domain Alignment of Segment Anything Model for High-Fidelity Histology Nuclei Segmentation [2.5] 本稿では,Segment Anything Model(SAM)を拡張したAdrial Multi-domain Alignment of Segment Anything Model(AMA-SAM)を紹介した。
まず、ドメイン不変表現学習を促進するために、多様なドメインの特徴を調和させる条件勾配反転層(CGRL)を提案する。
次に,高分解能デコーダ (HR-Decoder) を設計することにより,SAM固有の低分解能出力に対処する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:59:39 GMT)
Improving clustering quality evaluation in noisy Gaussian mixtures [2.4] 本稿では,クラスタリング検証の品質を高めるためのFIR手法を提案する。
FIRは、特にノイズや不適切な特徴のある設定において、クラスター妥当性指標の値と基底真理との相関性を一貫して改善することを示した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:37:18 GMT)
Feedback-driven object detection and iterative model improvement [2.4] 本稿では,オブジェクト検出モデルの改良を目的としたプラットフォームの開発と評価について述べる。
このプラットフォームでは、イメージのアップロードとアノテートに加えて、微調整されたオブジェクト検出モデルも可能だ。
手動アノテーションと比較して,半自動で最大53%の時間短縮効果を示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:34:04 GMT)
Integrating DAST in Kanban and CI/CD: A Real World Security Case Study [2.3] Webアプリケーションの攻撃と悪用された脆弱性が増加している。
現代の開発プラクティスにセキュリティを統合することがますます重要になっている。
現代の開発プラクティスでセキュリティプラクティスやアクティビティを採用するのは難しいです。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:46:05 GMT)
From Individual to Group: Developing a Context-Aware Multi-Criteria Group Recommender System [2.3] 本研究は、文脈対応多言語グループレコメンダシステム(CA-MCGRS)の開発について述べる。
マルチヘッド・アテンション・メカニズムを活用することで、我々のモデルは異なる特徴の重要性を動的に評価する。
様々な評価と文脈変数を持つ教育データセットで行った実験は、CA-MCGRSが他のアプローチよりも一貫して優れていることを示した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:01:45 GMT)
Improved Runtime Analysis of a Multi-Valued Compact Genetic Algorithm on Two Generalized OneMax Problems [2.1] G-OneMax関数上の多値cGA(r-cGA)の最初の理論的解析を行った。
ランタイムは高い確率でO(nr3 log2 n log r)であることを示す。
また,r-OneMax上でのr-cGAのランタイム解析を改良する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:32:15 GMT)
Symmetric measurement-induced lower bounds of concurrence [2.0] 我々の下界は、より詳細な例により、既存の下界よりも量子絡み合いが良く見積もっていることを示す。
我々の下限は、ステート・トモグラフィーなしで実験的に識別できる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:01:32 GMT)
DGSUnet: An Improved Unet Model with DINO-Guided SAM2 for Multi-Scale Feature Collaboration [2.0] 本稿では,DINOv2によるSAM2用マルチスケール機能協調フレームワークを提案する。
コストのかかるトレーニングプロセスを必要とせず、カモフラージュ目標検出や有能なオブジェクト検出といった下流タスクにおいて、既存の最先端のメソオードを超越している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:08:24 GMT)
A Holistic Evaluation of Piano Sound Quality [2.0] 本研究では,異なるピアノの音質について検討した。
畳み込みニューラルネットワーク(CNN)の様々な事前学習モデルの微調整結果を比較して最適なピアノ分類モデルを選択する。
その結果、音楽的に訓練された個人は、異なるピアノの音質の違いを区別できることがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:31:56 GMT)
A Data Balancing and Ensemble Learning Approach for Credit Card Fraud Detection [1.9] 本研究では,SMOTE-KMEANS手法とアンサンブル機械学習モデルを組み合わせることで,クレジットカード不正を識別する革新的な手法を提案する。
提案モデルは、ロジスティック回帰、決定木、ランダムフォレスト、サポートベクターマシンといった従来のモデルと比較された。
その結果,提案モデルでは,SMOTE-KMEANSアルゴリズムと組み合わせたAUCが0.96と優れた性能を示した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:59:45 GMT)
InternVL-X: Advancing and Accelerating InternVL Series with Efficient Visual Token Compression [1.9] InternVL-Xは、性能と効率の両方で、InternVLモデルより優れている。
20%以下のビジュアルトークンを利用することで、InternVL-Xは7つのパブリックMLLMベンチマークで最先端のパフォーマンスを達成し、12タスクの平均メトリックを2.34%改善する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:31:35 GMT)
Geometry effect of the dynamical quantum phase transitions at finite temperatures [1.9] 非バンドモデルに対する並列クエンチと動的幾何次パラメータ(DGOP)の概念を導入する。
零温度では、DGOPはパンチャラトナム幾何学相に対応し、有限温度ではインターフェロメトリー幾何学相に対応している。
有限温度における熱ゆらぎと境界効果はDTOPの量子化を阻害するが、位相遷移の符号を保持する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:19:50 GMT)
FAIR-QR: Enhancing Fairness-aware Information Retrieval through Query Refinement [1.9] 本稿では,検索キーワードを改良し,表現不足なグループから文書を検索し,グループフェアネスを実現する新しいフレームワークを提案する。
提案手法は,妥当性と公平性に関する有望な検索結果を示すだけでなく,各イテレーションで使用される洗練されたキーワードを表示することで解釈可能性を示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:10:19 GMT)
On the Viability of Semi-Supervised Segmentation Methods for Statistical Shape Modeling [1.7] 統計的形状モデル (SSMs) は、個体群レベルの解剖学的変異を識別する。
SSMは専門家主導のマニュアルセグメンテーションの必要性によって制約されることが多い。
近年の深層学習手法により,非分割画像からのSSMの直接推定が可能となった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:59:24 GMT)
Dual-Task Learning for Dead Tree Detection and Segmentation with Hybrid Self-Attention U-Nets in Aerial Imagery [1.7] 本研究では,深層学習に基づく木分割を改良するハイブリッド後処理フレームワークを提案する。
ボレアル林の高解像度空中画像に基づいて、このフレームワークはインスタンスレベルのセグメンテーション精度を41.5%向上させた。
フレームワークの計算効率は、壁と壁の間の木死のマッピングのようなスケーラブルなアプリケーションをサポートする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:25:20 GMT)
Socially Constructed Treatment Plans: Analyzing Online Peer Interactions to Understand How Patients Navigate Complex Medical Conditions [1.7] 複雑な条件に対する治療計画の「社会的構築」の特徴について述べる。
我々は、現在最先端の大規模言語モデル(LLM)において、社会的に構築された治療関連知識がどのように反映されているかを検討する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 21:06:07 GMT)
Higher-order exceptional points in a non-reciprocal waveguide beam splitter [1.6] 我々は固有値を解析的に導出し、非エルミート系における例外点(EP)の形成を数値的に示す。
その結果,非相互開量子系における高次EPを実現するための新しい経路が開かれた。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:38:58 GMT)
How to Secure Existing C and C++ Software without Memory Safety [1.6] CとC++のソフトウェアでは、攻撃者はほとんどのバグや脆弱性を悪用して、ソフトウェア動作を完全に制御できる。
このセキュリティ上のメリットは、アプリケーションごとの労力を使わずに、修正されていないC/C++ソフトウェアに対して得ることができる。
これらのインターリーブを排除するために、オーバーヘッドが少なく、特別なハードウェアやプラットフォームのサポートを必要としないコンパイラやランタイムメカニズムがすでに存在している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:20:47 GMT)
Value of risk-contact data from digital contact monitoring apps in infectious disease modeling [1.5] 本稿では,デジタルコンタクトモニタリング(DCM)アプリから得られたリスク接触データを,従来のコンパートメンタルトランスミッションモデルに簡単に統合する手法を提案する。
オランダで最近流行した新型コロナウイルス(COVID-19)の流行に対して,健康監視アプリCOVID RADARの自己申告データと,接触追跡アプリCoronaMelderの近接データを用いて,本手法を適用した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:40:57 GMT)
Unveiling the Mechanisms of DAI: A Logic-Based Approach to Stablecoin Analysis [1.5] 本稿では,暗号コラテラル化とアルゴリズム機構を組み合わせたDAIステーブルコインについて述べる。
本稿では,Prologで実装され,オープンソースソフトウェアとしてリリースされたDAIのポリシーと操作を表現するための形式的論理ベースのフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:13:48 GMT)
Robust Counterfactual Inference in Markov Decision Processes [1.5] 現在のアプローチでは、カウンターファクトを識別するために特定の因果モデルを想定している。
反実遷移確率の厳密な境界を計算できる新しい非パラメトリック手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:20:21 GMT)
Robust Noise Suppression and Quantum Sensing by Continuous Phased Dynamical Decoupling [1.5] 実験連続相動的疎結合(CPDD)を提案する。
CPDDは短パルスを使用しないので、限られた駆動力や高磁場での核磁気共鳴の実験に適している。
提案手法をナノスケール核磁気共鳴に応用し,量子ヘテロダイン検出と組み合わせることで,120s測定における推定信号周波数におけるマイクロヘルツ不確実性を実現する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:21:33 GMT)
OminiAdapt: Learning Cross-Task Invariance for Robust and Environment-Aware Robotic Manipulation [1.5] 本稿では,ヒューマノイドロボットに適した模倣学習アルゴリズムを提案する。
主な課題に焦点をあてて,提案アルゴリズムは環境障害を抑制する。
実験の結果,提案手法は様々なタスクシナリオに対して頑健さとスケーラビリティを示すことがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:28:22 GMT)
Interdisciplinary PhDs face barriers to top university placement within their disciplines [1.5] 学際的な研究は複雑な課題に対処する上で注目されているが、初期の学歴への影響はいまだ不明である。
本研究は、博士課程における学際性が、様々な分野にまたがるトップ大学における教員配置にどのように影響するかを考察する。
上位の大学が新たに採用した学部は、博士号研究において学際的でない傾向にある。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:41:38 GMT)
Behavioral response to mobile phone evacuation alerts [1.4] 本研究では,チリのバルパライソで発生した2024年2月の山火事における携帯電話の避難警報に対する行動応答について検討した。
580,000台のデバイスから匿名化されたモバイルネットワークデータを用いて,緊急SMS通知による人口移動を分析した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:33:56 GMT)
Translation-Invariant Quantum Algorithms for Ordered Search are Optimal [1.4] 量子コンピュータは定数係数の高速化を達成できるが、正確な量子アルゴリズムでは$log_2n$の最良の係数は$(ln2)/pi approx 0.221$と$/log_2605 approx 0.433$の間にあることが知られている。
我々は、Farhi、Goldstone、Gutmann、Sipserによって導入されたワークスペースを持たない翻訳不変アルゴリズムの特別なクラスを考える。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:08:16 GMT)
Prompt, Divide, and Conquer: Bypassing Large Language Model Safety Filters via Segmented and Distributed Prompt Processing [1.4] 大規模言語モデル(LLM)はタスクの自動化とさまざまな領域にわたるコンテンツ生成を変革した。
本稿では,分散プロンプト処理と反復改良を組み合わせた新しいジェイルブレイク機構を導入し,安全性対策を回避した。
10のサイバーセキュリティカテゴリで500の悪意あるプロンプトでテストされたこのフレームワークは、悪意のあるコードを生成する上で73.2%の成功率(SR)を達成した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:19:55 GMT)
Empowering WebAssembly with Thin Kernel Interfaces [1.4] 本稿では,プロセス内サンドボックスを壊さずに,OSユーザ空間のsyscallを直接公開するWasmのカーネルインタフェースを提案する。
WASIのような既存のWasm用の機能ベースのAPIは、カーネルインターフェース上のWasmモジュールとして実装できる。
我々は,最新のWasmエンジンを拡張して,LinuxとZephyrという2つのカーネルに対して,この概念を実装した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:57:41 GMT)
A Comprehensive Benchmark for RNA 3D Structure-Function Modeling [1.4] RNA構造関数予測のためのベンチマークデータセットを7つ導入する。
我々のライブラリは、確立されたPythonライブラリrnaglibの上に構築されており、データ配布とエンコーディングが容易です。
グラフニューラルネットワークを用いて、全てのタスクに対して、初期ベースライン結果を提供する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:49:31 GMT)
Measuring and Analyzing Subjective Uncertainty in Scientific Communications [1.3] この研究は、様々な分野にわたる科学コミュニティにおける主観的不確実性とその影響を測定し、分析した。
このタイプの不確実性のレベルは、様々な分野、出版年数、地理的な場所によって大きく異なることを示した。
また,著者数・性別,コミュニティの集中度,引用数など,主観的不確実性といくつかの指標との関係について検討した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:12:50 GMT)
COMI-LINGUA: Expert Annotated Large-Scale Dataset for Multitask NLP in Hindi-English Code-Mixing [1.3] COMI-lingUAは、DevanagariとRomanスクリプトの3つの専門家アノテータによって評価された100,970のインスタンスを含む、コードミックステキスト用の手動アノテートデータセットとしては最大である。
このデータセットは5つの基本的なNLPタスクをサポートしている。言語識別、マトリックス言語識別、音声タギング、名前付きエンティティ認識、翻訳である。
我々は、COMIINGUAを用いてこれらのタスク上でLLMを評価し、現在の多言語モデリング戦略の限界を明らかにし、コード混合テキスト処理機能の改善の必要性を強調した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:36:39 GMT)
Vision language models are blind: Failing to translate detailed visual features into words [1.2] 視覚能力を持つ大規模言語モデル(VLM)は、人間にとって容易な低レベルの視覚タスクに苦労する。
BlindTestでは、4つの最先端VLMが平均58.07%の精度しか示していない。
クロード3.5ソンネットは77.84%の精度で最高の成績を収めている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:16:09 GMT)
KRAFT -- A Knowledge-Graph-Based Resource Allocation Framework [1.2] 本稿では,知識グラフと推論技術を活用して資源配分決定を支援する新しい手法であるKRAFTを紹介する。
我々は,知識グラフを資源割当ソフトウェアに統合することで,進化する知識ベースに基づく適応的で透明な意思決定が可能になることを実証した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:59:57 GMT)
Ring-exchange physics in a chain of three-level ions [1.1] 3つの内部レベルを持つ閉じ込められたイオンの連鎖は、1ラング当たり1ボソンの最大占有に制約されたはしごのような系を模倣できることを示す。
この設定は、全てのボソンが片足に制限された偏極状態とDBL状態の間で遷移する環交換相互作用を可能にする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:52:30 GMT)
Multimodal Object Detection using Depth and Image Data for Manufacturing Parts [1.1] 本研究では,赤緑色(RGB)カメラと3Dポイントクラウドセンサを組み合わせたマルチセンサシステムを提案する。
RGBと深度データの両方を処理するために,新しいマルチモーダルオブジェクト検出法を開発した。
その結果、マルチモーダルモデルは、確立されたオブジェクト検出基準に基づいて、深さのみのベースラインとRGBのみのベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:10:34 GMT)
LightSNN: Lightweight Architecture Search for Sparse and Accurate Spiking Neural Networks [1.0] スパイキングニューラルネットワーク(SNN)は、そのエネルギー効率、固有の活性化空間、エッジデバイスにおけるリアルタイム処理に適していると高く評価されている。
現在のSNN手法の多くは、従来の人工知能ニューラルネットワーク(ANN)に似たアーキテクチャを採用しており、SNNに適用した場合、最適以下の性能が得られる。
本稿では,高速かつ効率的なニューラルネットワークアーキテクチャ探索(NAS)技術であるLightSNNについて述べる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:38:13 GMT)
Unveiling the Power of Uncertainty: A Journey into Bayesian Neural Networks for Stellar dating [1.0] 本稿では,確率的関係をニューラルネットワークでモデル化した階層型ベイズアーキテクチャを提案する。
我々は、質量、半径、年齢(主ターゲット)などの恒星特性を予測する。
我々のシステムは予測値の潜在的な範囲をカプセル化する分布を生成する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:45:48 GMT)
DR-PETS: Learning-Based Control With Planning in Adversarial Environments [1.0] DR-PETSはPETSの分布的に堅牢な拡張であり、敵に対する堅牢性を証明している。
p-ワッサーシュタイン曖昧性集合を介して不確実性を定式化し、最悪の場合の摂動計画を可能にする。
振り子安定化とカートポールバランスの実験により、DR-PETSは対向性摂動に対する堅牢性を証明した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:07:27 GMT)
Artificial Intelligence in Pediatric Echocardiography: Exploring Challenges, Opportunities, and Clinical Applications with Explainable AI and Federated Learning [1.0] 本研究は,小児心エコー図におけるAIの限界と可能性について概観する。
XAIとFLの相乗的ワークフローと役割を強調し、研究のギャップを特定し、将来の発展を探求する。
XAI と FL の3つの臨床応用例は, (i) 視認, (ii) 疾患分類, (iii) 心臓構造の分節化, (iv) 心臓機能の定量的評価に焦点をあてたものである。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:30:00 GMT)
Survey on Monocular Metric Depth Estimation [1.0] 本稿では,従来の幾何学的手法からディープラーニングのブレークスルーまで,深さ推定の進化を体系的にレビューする。
モデル一般化や境界詳細損失といった課題に着目し, ゼロショットMMDEの最近の進歩について検討した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:21:42 GMT)
Intelligent IoT Attack Detection Design via ODLLM with Feature Ranking-based Knowledge Base [1.0] IoT(Internet of Things)デバイスは,重大なサイバーセキュリティ上の課題を導入している。
従来の機械学習(ML)技術は、混在するパターンと進化するパターンの複雑さのために、このような攻撃を検出するのに不足することが多い。
本稿では,オンデバイス大規模言語モデル(ODLLMs)を微調整と知識ベース(KB)統合で拡張し,インテリジェントなIoTネットワーク攻撃検出を実現する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:41:57 GMT)
Computing Isomorphisms between Products of Supersingular Elliptic Curves [0.9] Deligne-Ogus-Shioda定理は、有限体上の超特異楕円曲線の積の間の同型の存在を保証する。
曲線の環を考えると、これらの同型を時間内に明示的に計算する方法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:26:31 GMT)
GenEdit: Compounding Operators and Continuous Improvement to Tackle Text-to-SQL in the Enterprise [0.9] GenEditは企業固有の知識セットを構築し維持し、フィードバックを使って知識セットを更新し、将来の世代を改善する。
例えば、GenEditは複合演算子を活用して知識検索を改善し、生成を導く連鎖的なステップとして計画を作成する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:22:02 GMT)
Quantum Computing in Transport Science: A Review [0.8] 量子力学の原理を利用する量子コンピューティングは、原理的に計算能力を大幅に向上させることが知られている。
本稿では,輸送システムにおける複雑で大規模な問題に量子コンピューティングが取り組む可能性について考察する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:28:33 GMT)
EquiNO: A Physics-Informed Neural Operator for Multiscale Simulations [0.8] 我々は,マイクロスケール物理予測のための物理インフォームドPDEサロゲートとしてEquiNOを提案する。
我々のフレームワークは、いわゆるマルチスケール FE$,2,$ の計算に適用でき、有限要素法(FE)と演算子学習法(OL)を統合することで FE-OL アプローチを導入している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:42:13 GMT)
Flexible Moment-Invariant Bases from Irreducible Tensors [0.8] 不変量の集合は、それが入力の退化に対して完全で独立で堅牢であれば最適である。
2つの一般的なモーメント不変のアプローチを組み合わせることで、この脆弱性を克服する方法を示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:35:17 GMT)
Bipartite entanglement is sufficient for standard device-independent conference key agreement [0.8] 会議鍵合意(CKA)は、ネットワーク内の多くの分離されたパーティ間で共有され、プライベートなランダム性を確立することを目的としている。
DICKAプロトコルは、2つのカテゴリに分類される。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:13:26 GMT)
Sparse Bayesian Learning for Label Efficiency in Cardiac Real-Time MRI [0.8] 経時的な心室容積は、心拍数と呼吸速度に対応するスパース周波数によって支配されると仮定される。
患者のデータを調べると、正確なボリューム予測にはラベル付き画像がわずかに必要であることが示される。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:36:20 GMT)
Proof or Bluff? Evaluating LLMs on 2025 USA Math Olympiad [0.8] 本稿では,問題のある数学的問題に対する完全解法推論の総合評価について紹介する。
専門家のアノテータを用いて,2025 USAMOの6つの問題に対する最先端の推論モデルの評価を行った。
結果から,テスト対象モデルの平均は5%以下であった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:21:05 GMT)
Leveraging Language Models for Analyzing Longitudinal Experiential Data in Education [0.8] 本研究では,STEM学生の学術的軌跡の早期予測に事前学習言語モデル(LM)を活用する新しい手法を提案する。
このようなデータを扱う上で重要な課題は、欠落した値の高頻度、コストのかかるデータ収集によるデータセットサイズ制限、モダリティ間の複雑な時間的変動である。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:37:23 GMT)
MONO2REST: Identifying and Exposing Microservices: a Reusable RESTification Approach [0.7] 多くの組織は、レガシーなモノリシックシステムからアーキテクチャスタイルへの移行を追求しています。
このプロセスは困難で、リスクが高く、時間集約的であり、失敗しがちですが、いくつかの組織では、移行プロセスを構築するために必要な資金、時間、専門知識が不足しています。
移行することなく、レガシーシステムをマイクロサービスアプリケーションとして公開することを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:10:33 GMT)
QCPINN: Quantum Classical Physics-Informed Neural Networks for Solving PDEs [0.7] 物理インフォームドニューラルネットワーク(PINN)は、物理法則をニューラルネットワークに組み込むための有望な方法として登場した。
本稿では、量子と古典成分を組み合わせた量子古典物理学情報ニューラルネットワーク(QNN)を提案し、より少ないパラメータでPDEを解く。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 01:36:37 GMT)
HybridoNet-Adapt: A Domain-Adapted Framework for Accurate Lithium-Ion Battery RUL Prediction [0.7] 本稿では,データに依存しないRUL予測フレームワークとそのドメイン適応(DA)アプローチを紹介する。
提案手法は,特徴抽出,復調,正規化を含む包括的データ前処理を統合している。
実験により,本手法は最先端技術より優れていることが示された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:35:25 GMT)
Low-Resource Transliteration for Roman-Urdu and Urdu Using Transformer-Based Models [0.7] ウルドゥー語とそのローマ字形であるウルドゥー語との音訳は未発見のままである。
我々はm2m100多言語翻訳モデルを用いたトランスフォーマーに基づく手法を提案する。
我々のモデルは、ウルドゥー語で96.37点、ウルドゥー語で97.44点、ウルドゥー語で96.37点という高い音訳性能を達成している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:18:50 GMT)
TSKANMixer: Kolmogorov-Arnold Networks with MLP-Mixer Model for Time Series Forecasting [0.6] 時系列予測は長い間、経済、エネルギー、医療、交通管理など様々な分野の研究の中心であった。
最近の研究は時系列ミキサー(TSMixer)のような時系列モデルのための革新的なアーキテクチャを導入している。
我々は,Kolmogorov-Arnold Networks (KANs) の時系列予測機能について,kan layer (TSKANMixer) によるTSMixerの変更による検討を行った。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:34:13 GMT)
AlignDiff: Learning Physically-Grounded Camera Alignment via Diffusion [0.5] 本稿では,カメラ内在パラメータと外在パラメータをジェネリック・レイ・カメラ・モデルを用いて扱う新しいフレームワークを提案する。
従来のアプローチとは異なり、AlignDiffは意味論から幾何学的特徴へ焦点を移し、局所歪みのより正確なモデリングを可能にした。
実験により,提案手法は,推定光束の角誤差を8.2度,全体のキャリブレーション精度で著しく低減し,課題のある実世界のデータセットに対する既存手法よりも優れていることを示した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:59:59 GMT)
Adaptive Orchestration for Large-Scale Inference on Heterogeneous Accelerator Systems Balancing Cost, Performance, and Resilience [0.5] 本稿では,異種アクセラレータ間で要求を適応的に割り当てるハードウェア非依存制御ループを提案する。
このフレームワークは、レイテンシの目標を一貫して満たし、キャパシティの不足時にトラフィックを自動的にリダイレクトし、低コストのアクセラレータを収益化する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:16:44 GMT)
InteractionMap: Improving Online Vectorized HDMap Construction with Interaction [0.5] State-of-the-art map vectorization法は主に、エンドツーエンドでHDマップを生成するDETRライクなフレームワークに基づいている。
本稿では,ローカル-グローバル情報インタラクションをフル活用して,従来の地図ベクトル化手法を改善したInteractionMapを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:23:15 GMT)
OntoAligner: A Comprehensive Modular and Robust Python Toolkit for Ontology Alignment [0.4] オントロジーアライメント(OA)は、多様な知識システム間の相互運用性を実現するための基礎である。
私たちはOAアライメントのための包括的でモジュール的で堅牢なPythonツールキットであるOntoAlignerを紹介します。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:28:11 GMT)
Understanding the physics of D-Wave annealers: From Schrödinger to Lindblad to Markovian Dynamics [0.4] 量子モデルとマルコフモデルを用いてD波アニールのサンプリング挙動を解析した。
この結果から,これらのデバイスにおける量子力学の役割に関する知見が得られた。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:49:15 GMT)
Residual Learning Inspired Crossover Operator and Strategy Enhancements for Evolutionary Multitasking [0.4] 進化的マルチタスキングでは、クロスオーバー演算子やスキルファクター割り当てといった戦略が効果的な知識伝達に不可欠である。
本稿では,残差学習に基づくMFEA-RL法を提案する。
ResNetベースのメカニズムは、タスク適応性を改善するためのスキルファクタを動的に割り当て、ランダムマッピング機構は、効率的にクロスオーバー操作を行う。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:27:17 GMT)
Towards Privacy-Preserving Revocation of Verifiable Credentials with Time-Flexibility [0.4] 自己主権アイデンティティ(Self-Sovereign Identity、SSI)は、認証とクレデンシャルプレゼンテーションのための新興パラダイムである。
EUDIデジタルIDウォレットは、このパラダイムの具体的な実装になりつつある。
本稿では、匿名階層型IDベースの暗号化の使用をカスタマイズする新しい手法の基盤を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 21:58:32 GMT)
Retinal Fundus Multi-Disease Image Classification using Hybrid CNN-Transformer-Ensemble Architectures [0.3] 我々の研究は、網膜疾患による人口の急激な世界的な問題に動機付けられています。
我々の主な目的は、網膜疾患を正確に予測できる包括的診断システムを開発することである。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:55:07 GMT)
Personal Data Protection in Smart Home Activity Monitoring for Digital Health: A Case Study [0.3] HAR(Sensor-based Human Activity Recognition)は、臨床医が認知低下の初期段階のデジタルバイオマーカーとみなす行動変化の識別を可能にする。
高齢者の家庭におけるセンサーベースのHARシステムの実際の展開は、プライバシーや倫理的懸念など、いくつかの課題を引き起こしている。
本稿では,設計原則によるプライバシの適用経験を報告する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:35:55 GMT)
Orange Quality Grading with Deep Learning [0.3] マシンビジョンによるオレンジグレーディングのためのディープラーニングベースのソリューションを実装した。
単一ビューから果実を解析する一般的なグレーディングシステムとは異なり、よりリッチな表現を可能にするために、各オレンジのマルチビュー画像をキャプチャする。
合成画像上に畳み込みニューラルネットワーク(CNN)をトレーニングし、オレンジを3つのクラスに分類する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:14:56 GMT)
Adiabatic quantum state preparation in integrable models [0.3] 本稿では, 量子コンピュータ上での積分可能モデルの高エネルギー固有状態の生成に, 断熱アルゴリズムを適用することを提案する。
熱力学 Bethe ansatz に基づいて,アルゴリズム回路の深さが従来の手法よりも高い量子ビット数であることを示す。
モデルが相互作用しているにもかかわらず、アルゴリズムの回路深さが全固有状態に対して$N$であることを示す数値的な証拠を提供する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:51:20 GMT)
Randomization to Reduce Terror Threats at Large Venues [0.3] 本報告では,この問題の広範な研究から得られた知見について述べる。
インタビューや、選ばれた会場のセキュリティディレクターのアンケートを含む。
ランダム性が有効性を向上させる方法について議論する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:12:43 GMT)
An improved EfficientNetV2 for garbage classification [0.3] 本稿では,データ取得コスト,一般化,リアルタイムパフォーマンスの課題に対処するため,EfficientNetV2に基づく廃棄物分類フレームワークを提案する。
Huawei Cloudの廃棄物分類データセットの実験では、本手法は95.4%の分類精度を達成し、ベースラインを3.2%上回り、主流モデルを上回っている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:50:44 GMT)
Image-to-Text for Medical Reports Using Adaptive Co-Attention and Triple-LSTM Module [0.3] 医療報告の生成には、一般的な大型モデルが正確に把握できないような専門的な専門知識が必要である。
本稿では、トランスフォーマーアーキテクチャとマルチLSTMネットワークを組み合わせたディープラーニングモデルであるマルチモーダルモデル、コアテンショントリプルLSTMネットワーク(CA-TriNet)を提案する。
私たちのディープラーニングモデルは、包括的能力の観点から最先端のモデルよりも優れています。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:47:06 GMT)
Ontology Matching with Large Language Models and Prioritized Depth-First Search [0.2] 優先的な深度優先探索 (PDFS) 戦略に, 検索・識別・分岐パイプラインを組み込む新しいアプローチであるMILAを導入する。
このアプローチは、高い精度で多数の意味的対応を効果的に識別し、LLM要求を最も境界的なケースに限定する。
提案手法は,5つの教師なしタスクのうち4つのタスクのうち,最も高いF-Measureを実現し,最先端OMシステムよりも最大17%向上した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:29:21 GMT)
Efficient Continual Adaptation of Pretrained Robotic Policy with Online Meta-Learned Adapters [0.2] 一般の自律型エージェントには継続的適応が不可欠である。
オンラインメタラーニングアダプタ(OMLA)は、以前に学習したタスクから現在の学習タスクへの知識伝達を容易にする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:19:46 GMT)
Vibravox: A Dataset of French Speech Captured with Body-conduction Audio Sensors [0.2] Vibravoxは、General Data Protection Regulationに準拠したデータセットである。
Vibravox corpusには188人の参加者による音声サンプルと生理的音のセンサーが45時間含まれている。
音声認識や話者検証など,様々な音声関連課題について一連の実験を行った。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 01:13:48 GMT)
Model Lake: a New Alternative for Machine Learning Models Management and Governance [0.2] 私たちはML Model Lakeという概念を、組織環境内のデータセット、コード、モデルの集中管理フレームワークとして開発しています。
モデルのライフサイクル管理の強化,発見,監査,再利用性など,モデルレイクアプローチを採用する上での変革的可能性について議論する。
モデルレイクの現実的な応用と、データ、コード、モデル管理プラクティスに対する変革的な影響を説明します。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:35:51 GMT)
A Context-Aware Approach for Enhancing Data Imputation with Pre-trained Language Models [0.2] CRILMは、事前訓練された言語モデルを使用して、不足する値に対してコンテキストに関連のある記述子を作成する。
本評価は,MCAR,MAR,MNARシナリオにおけるCRILMの優れた性能とロバスト性を示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:22:43 GMT)
An evaluation of LLMs and Google Translate for translation of selected Indian languages via sentiment and semantic analyses [0.2] 大規模言語モデル(LLM)は低リソース言語を含む言語翻訳において顕著である。
本研究では,サンスクリット語,テルグ語,ヒンディー語を含むインドの言語における選択されたLLMの意味的・感情的分析を用いた。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:35:40 GMT)
Safeguarding Autonomy: a Focus on Machine Learning Decision Systems [0.2] MLパイプラインのさまざまなステージに注目して、MLエンドユーザの自律性に対する潜在的な影響を特定します。
本稿では、検出された各影響について関連する質問を行い、意思決定におけるMLエンドユーザの自律性を尊重する焦点を特定するためのガイダンスを提供する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 22:31:16 GMT)
Autoassociative Learning of Structural Representations for Modeling and Classification in Medical Imaging [0.2] 本研究では,視覚的プリミティブの観点から画像の再構成によって学習し,高レベルの構造的説明を強制的に行うニューロシンボリックシステムを提案する。
組織像の異常診断に応用すると, 従来型の深層学習の手法よりも, より透過的でありながら, 分類精度が優れていた。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:56:12 GMT)
Amplifying solid-state high harmonic generations with momentum k-gaps in band structure engineering [0.1] 運動量k-ギャップを用いたバンドギャップ工学を利用して, 固体中の高調波発生(HHG)を増幅する機構を提案する。
平衡, 交互ゲイン, 損失プロファイルを特徴とする単純な二原子格子を構成することにより, 固体HHGのバンド内チャネルにおけるkギャップ増幅ブロッホ振動の物理を探索する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:37:42 GMT)
Comparative Analysis of Image, Video, and Audio Classifiers for Automated News Video Segmentation [0.1] 本稿では,自動ニュースビデオセグメンテーションのための画像,ビデオ,音声分類器の比較分析を行う。
画像ベースの分類器は、より複雑な時間モデルに比べて優れた性能(84.34%の精度)を達成する。
バイナリ分類モデルは、遷移(94.23%)と広告(92.74%)の精度を達成した
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:42:50 GMT)
Using large language models to produce literature reviews: Usages and systematic biases of microphysics parametrizations in 2699 publications [0.1] 気象・研究予測モデルにおけるミクロ物理パラメトリゼーションに関連する2699の出版物に関する文献レビューを,大規模言語モデルを用いて構築する方法について述べる。
このデータベースは、Web of ScienceとScopus検索から特定された出版物で構成されている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:42:19 GMT)
Exploring the Energy Landscape of RBMs: Reciprocal Space Insights into Bosons, Hierarchical Learning and Symmetry Breaking [0.1] 離散分布に対する普遍近似能力で知られるリミテッドボルツマンマシン(RBM)に着目した。
相互空間の定式化を導入することにより、RBM、拡散過程、結合ボソン間の接続を明らかにする。
我々の研究結果は、異なる生成フレームワーク間のギャップを埋めると同時に、生成モデルにおける学習を支えるプロセスにも光を当てています。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:28:37 GMT)
Fine-Tuning LLMs on Small Medical Datasets: Text Classification and Normalization Effectiveness on Cardiology reports and Discharge records [0.1] テキスト分類と名前付きエンティティ認識タスクのための小さな医療データセットに対する細調整大言語モデル(LLM)の有効性について検討する。
実験の結果,微調整は両タスクのパフォーマンスを向上し,200-300のトレーニング例では顕著な改善が見られた。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:35:56 GMT)
Observation of the quantum equivalence principle for matter-waves [0.1] アインシュタインの相対性理論は同値原理に基づいている。
倫理原理は、相対論的時空のグローバルな記述にまで拡張される。
新しい干渉計は、量子理論と重力の間の界面のさらなる探索の扉を開く。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:29:46 GMT)
Vision Language Models versus Machine Learning Models Performance on Polyp Detection and Classification in Colonoscopy Images [0.1] 本研究は、確立された畳み込みニューラルネットワーク(CNN)に対する視覚言語モデル(VLM)の総合的な性能評価を提供する。
428例の大腸内視鏡像2,258例について検討した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:41:35 GMT)
A Local Perspective-based Model for Overlapping Community Detection [0.1] 地域コミュニティの観点から重なり合うコミュニティ検出モデルであるLQ-GCNを提案する。
LQ-GCNはBernoulli-Poissonモデルを用いてコミュニティアフィリエイトマトリックスを構築し、エンドツーエンド検出フレームワークを形成する。
LQ-GCNは、正規化された相互情報(NMI)が最大33%改善され、リコールが26.3%改善された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:43:42 GMT)
Formation Shape Control using the Gromov-Wasserstein Metric [0.1] 本稿では, エージェントの初期集団をGromov-Wasserstein距離を介して所望の配置にステアリングするための, 最適制御手法として, 形状制御アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:29:31 GMT)
Capturing strong correlation effects on a quantum annealer: calculation of avoided crossing in the H$_4$ molecule using the quantum annealer eigensolver [0.1] 量子アナーラー固有解法(QAE)アルゴリズムの範囲を拡大する。
矩形幾何学におけるH$_4$分子の古典的な例を考える。
我々は、実際の量子ハードウェア上でのFCI値の約1.2%で回避された交差を予測できることを発見した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:35:23 GMT)
A Low-Power Streaming Speech Enhancement Accelerator For Edge Devices [0.1] トランスフォーマーに基づく音声強調モデルは印象的な結果をもたらすが、その構造はモデル圧縮電位を制限する。
本稿では,モデルとハードウェア最適化による低消費電力ストリーミング音声強調器を提案する。
提案する高性能モデルは,モデル圧縮とターゲットアプリケーションの共同設計によるハードウェア実行に最適化されている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:13:41 GMT)
A 71.2-$μ$W Speech Recognition Accelerator with Recurrent Spiking Neural Network [0.1] 本稿では,2つの繰り返し層と1つの完全連結層,低時間ステップを有する小型の繰り返しスパイクニューラルネットワークを提案する。
2.79MBモデルでは、プルーニングと4ビットの固定点量子化が行われ、96.42%から0.1MBに縮小した。
このデザインは100kHzでリアルタイムに動作し、71.2 mu$Wを消費し、最先端の設計を上回っている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:14:00 GMT)
Comprehensive segmentation of deep grey nuclei from structural MRI data [0.0] HIPS(Histogram-based Polynomial Synthesis)は、標準的なT1からWMnのような画像を合成するために用いられる。
深い灰色核の分節に用いられる関節ラベル固定術によるマルチアトラス分節術
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:05:33 GMT)
Knowledge Graphs as World Models for Semantic Material-Aware Obstacle Handling in Autonomous Vehicles [0.0] 本研究では,センサと知識グラフ(KG)に基づく世界モデルを組み合わせることで,AVの物理材料質の理解を向上させることを提案する。
自律走行シミュレータCARLAを用いて,KG統合の有無にかかわらず,AV性能を評価した。
KGベースの手法は障害物管理を改善し、AVは材料品質を利用して車線変更や緊急ブレーキの適用についてより優れた判断を下すことができる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:46:45 GMT)
Multimodal surface defect detection from wooden logs for sawing optimization [0.0] 木製丸太の表面の結び目を検出するための,新しい,高品質で,要求の少ない手法を提案する。
RGB用の個別ストリームとポイントクラウドデータからなるデータ融合パイプラインを使用して、後期融合モジュールと組み合わせることで、より高い結び目検出精度を実現することができる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:58:45 GMT)
vGamba: Attentive State Space Bottleneck for efficient Long-range Dependencies in Visual Recognition [0.0] 状態空間モデル(SSM)は代替手段を提供するが、視界での応用は未定である。
この研究は、効率性と表現性を高めるために、SSMと注意機構を統合するハイブリッドビジョンバックボーンであるvGambaを導入している。
分類、検出、セグメンテーションタスクのテストでは、vGambaは精度と計算効率のトレードオフが優れており、既存のモデルよりも優れていることが示されている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:39:58 GMT)
Zero-Shot Visual Concept Blending Without Text Guidance [0.0] 視覚概念ブレンディング」は、複数の参照画像の特徴をソース画像に転送するきめ細かい制御を提供する。
本手法は, テクスチャ, 形状, 動き, スタイル, 抽象的な概念変換の柔軟な伝達を可能にする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:56:33 GMT)
When Astronomy Meets AI: Manazel For Crescent Visibility Prediction in Morocco [0.0] この研究は、Arc of Vision(ARCV)と三日月(W)の全幅という2つの重要な特徴を統合し、月面の視認性評価の精度を高める。
ロジスティック回帰アルゴリズムを用いた機械学習手法を用いて三日月可視条件を分類し、予測精度98.83%を達成する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:56:55 GMT)
What can unitary sequences tell us about multi-time physics? [0.0] マルチタイム量子プロセスは、時間的絡み合いやエキゾチック因果構造を含む、マルチパーティイト状態と同じリッチ性を持つ。
比較的限られた制御に直面した場合でも、これらの現象が初期段階の量子プロセッサでいかに驚くほどアクセスしやすくなっているかを示す。
我々の技術は一般的な量子力学プロセスに関係しており、凝縮物質物理学、量子生物学、NISQ時代の量子デバイスの深部診断など幅広い分野に及んでいる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:33:46 GMT)
VoxRep: Enhancing 3D Spatial Understanding in 2D Vision-Language Models via Voxel Representation [0.0] ボクセルグリッドは3次元空間の構造的表現を提供するが、高レベルの意味を抽出することは依然として困難である。
本稿では,VLM(Vision-Language Model)を用いて,ボクセルデータから"voxel semantics"オブジェクトの識別,色,位置を抽出する手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:07:11 GMT)
Variational quantum thermalizers based on weakly-symmetric nonunitary multi-qubit operations [0.0] 変分量子熱分解器(VQTs)は、与えられたハミルトニアンの熱(ギブ)状態を生成する。
現在のアルゴリズムは、ターゲット状態が不純だが絡み合いを示す中間温度で苦労している。
弱い対称性を利用するマルチキュービット非単位演算を考案し,アルゴリズムの性能を向上する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:23:15 GMT)
Unlocking the Potential of Past Research: Using Generative AI to Reconstruct Healthcare Simulation Models [0.0] 本研究では、生成人工知能(AI)を用いたフリー・アンド・オープン・ソース・ソフトウェア(FOSS)を用いた出版モデルを再現する可能性について検討する。
ユーザインタフェースを含む2つのDESモデルの生成,テスト,内部再現に成功した。
報告された結果は1つのモデルで複製されたが、分布に関する情報が不足しているため、もう1つのモデルでは再現されなかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:10:02 GMT)
Uncertainty-aware Bayesian machine learning modelling of land cover classification [0.0] 本稿では,入力測定の不確実性を考慮した生成モデルを用いたベイズ分類手法を提案する。
我々は、ランダムな森林やニューラルネットワークのような土地被覆マップで使われる一般的な分類モデルに対して、モデルの性能をベンチマークする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:59:19 GMT)
Tune It Up: Music Genre Transfer and Prediction [0.0] 我々は、ジャズやクラシックのジャンルで音楽スタイルの転送を行うために、CycleGANモデルを適応し改善する。
そこで我々は,新しい曲を容易に生成し,異なるジャンルの楽曲をカバーし,それらのプロセスに必要なアレンジメントを減らすことを目的としている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 21:55:57 GMT)
Towards an intelligent assessment system for evaluating the development of algorithmic thinking skills: An exploratory study in Swiss compulsory schools [0.0] 本研究は,大規模CT技術評価のための総合的枠組みの構築を目的とする。
我々はまずCTの位置と発達特性を捉える能力モデルを開発し、認知能力、年齢、文脈に合わせた活動の設計を指導した。
我々は,非デジタルアーティファクト(プラグ無し)と手動専門家アセスメントと,デジタルアーティファクト(仮想)と自動アセスメントの2つの変種で提供されるATスキルの大規模評価活動を開発した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:34:36 GMT)
Theory-Independent Context Incompatibility: Quantification and Experimental Demonstration [0.0] 整合性の概念は、もともと可観測体の可換性のシノニムとして現れ、後に測定整合性の概念へと発展していった。
近年、量子領域内でも、量子通信路における盗聴を検出するためのリソースとして、文脈不整合性の概念が提案されている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:34:00 GMT)
The Limits of AI in Financial Services [0.0] AIは産業を変革し、仕事のずれや意思決定の信頼性に関する懸念を高めている。
EPOCHフレームワークは、共感、プレゼンス、オピニオン、創造性、希望の5つの不可能な人間の能力を強調している。
課題は、AIの強みを活用しながら、人間の本質的な能力を維持しながら、プロフェッショナルが適応することを保証することだ。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 23:04:11 GMT)
The Birth of Quantum Mechanics: A Historical Study Through the Canonical Papers [0.0] 本稿では1900年から1927年にかけての量子力学理論の歴史的発展について考察する。
アインシュタインの光量子仮説の出現、ボーアの原子モデル、および区別不可能な粒子の統計的含意に従う。
古典量子論から現代量子力学への移行に特に重点を置いている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:32:57 GMT)
Taking the temperature of quantum many-body scars [0.0] 量子多体傷(quantum many-body scar)は、カオス多体ハミルトンの固有状態である。
そのエネルギー固有値は高温に対応するが、その絡み合い構造は低温固有状態と似ている。
量子多体傷は、状態構造内に符号化されたスペクトルにおけるそれらの位置について「ほぼ知識」を持つ。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:01:18 GMT)
Stochastic Inference of Plate Bending from Heterogeneous Data: Physics-informed Gaussian Processes via Kirchhoff-Love Theory [0.0] 物理インフォームドガウス過程(GP)を用いた古典的キルヒホフ・ラブプレートの推論手法を提案する。
プレート制御方程式の線形微分演算子を用いて, GPを偏向前に配置し, 共分散関数を導出することにより, 確率モデルを多出力GPとして定式化する。
正弦波荷重を受ける支持板と均一荷重を受ける固定板の2つの例で適用性を示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:40:00 GMT)
Statistics of the Random Matrix Spectral Form Factor [0.0] フォームファクター統計をD-1$拡張で次の先行順に識別する。
我々の発見は数字と完全に一致している。
それらは教育的な方法で提示され、次の順で統計的シグネチャの研究において新しい経路が強調される。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:34:12 GMT)
Statistical learning of structure-property relationships for transport in porous media, using hybrid AI modeling [0.0] 多孔質媒体の3次元微細構造は、有効拡散率や透過性を含む結果のマクロな性質に大きな影響を及ぼす。
多孔質媒体の性能を最適化するためには, 定量的構造・物性関係が重要である。
本論文は文献から得られた多孔質媒体の90,000個の仮想的な3次元微細構造を用いる。
このデータセットにハイブリッドAIフレームワークを適用することで,これらの知見を拡張した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:46:40 GMT)
Specifying the Intrinsic Back-action of a General Measurement [0.0] 本稿では,量子計測プロセスにおける本質的なバックアクションの数学的・厳密な評価法を提案する。
我々のフレームワークは、障害効果を2つの異なるコントリビューションに明示的に分解することで、詳細な分析を提供する。
我々の規則は、本質的な乱れと、ランダム性、不確実性、情報ゲインのような他の基本的な量子的特徴の間の定量接続を確立する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:23:51 GMT)
Solvability of N-level Systems under the Rotating Wave Approximation (RWA) and Dipole Selection Rules [0.0] 回転波近似と双極子選択規則の下でNレベル系の力学を解析する。
奇数あるいはパリティレベルが1つしかないシステムは解けると結論付けている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:55:07 GMT)
SoK: Towards Reproducibility for Software Packages in Scripting Language Ecosystems [0.0] このSoKは、今後の方向性を明らかにすることを目的として、既存の研究の概要を提供する。
私たちは、現在の研究における重要な側面を解明し、ソフトウェアの課題を特定し、エコシステム間でそれらをマッピングします。
文献は希少であり、個々の問題や生態系に焦点が当てられている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:10:38 GMT)
Simulating quantum circuits with restricted quantum computers [0.0] この論文は、局所量子演算を用いた非局所量子計算のシミュレーションに特化している。
本研究では, 広域な非局所状態およびチャネルの最適シミュレーションオーバーヘッドを特徴付ける。
また,地域間の古典的コミュニケーションの有用性についても検討する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:59:45 GMT)
Simulating Molecular Single Vibronic Level Fluorescence Spectra with ab initio Hagedorn Wavepacket Dynamics [0.0] ポリ原子分子の単一ビブロニックレベル (SVL) 蛍光スペクトルを効率よくシミュレートするために, Hagedorn Wavepacket を用いた実用的, 初期時間依存手法を提案する。
66次元高調波ポテンシャルエネルギー表面上でウェーブパレットダイナミクスを実行することにより,アントラセンのSVLスペクトルを計算する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 23:38:45 GMT)
Shape Modeling of Longitudinal Medical Images: From Diffeomorphic Metric Mapping to Deep Learning [0.0] 生体組織は複雑なシステムであり、外的および内的刺激に反応して常に成長し、変化する。
解剖学的構造における自然および病理学的(または異常な)変化のモデリングと理解は、非常に関連性が高い。
しかし, 生体組織の縦方向の形状変化をモデル化することは, 本質的に非線形な性質のため, 非自明な作業である。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:25:40 GMT)
Safety Verification and Optimization in Industrial Drive Systems [0.0] 本稿では,Uppaal Stratego を用いた実世界の産業用ベーシックドライブモジュールの安全性と診断性能を最適化する。
我々は,BDMの機能的安全アーキテクチャをタイムドオートマトンでモデル化し,その重要な機能的および安全性要件を正式に検証する。
正則モデルがベースラインとして正式に検証されたことを考えると,アップパール・ストラテゴの強化学習施設を活用し,安全故障率を90%の閾値まで最適化する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:27:19 GMT)
RiboGen: RNA Sequence and Structure Co-Generation with Equivariant MultiFlow [0.0] RiboGenはRNA配列と全原子3D構造を同時に生成する最初のディープラーニングモデルである。
実験の結果,RiboGenは化学的に可塑性かつ自己持続的なRNAサンプルを効率的に生成できることがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:11:11 GMT)
Rerouting Connection: Hybrid Computer Vision Analysis Reveals Visual Similarity Between Indus and Tibetan-Yi Corridor Writing Systems [0.0] この論文は、インダス・バレーの台本とチベット・李回廊の地図システムとの間の潜在的な歴史的つながりを調べるために、詳細な人類学的枠組みとともにCNN-Transformerのハイブリッドアーキテクチャを用いている。
チベット・李回廊の文字は、青銅器時代(10.2%-10.9%)や原エラマイト(7.6%-8.7%)に比べて、インダス文字(61.7%-63.5%)の約6倍の視覚的類似性を示した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 01:19:47 GMT)
Reasoning Under Threat: Symbolic and Neural Techniques for Cybersecurity Verification [0.0] 本調査では,サイバーセキュリティにおける自動推論の役割について概観する。
我々は、SOTAツールとフレームワークを調べ、ニューラルシンボリック推論のためのAIとの統合を調査し、重要な研究ギャップを浮き彫りにする。
本稿は,安全なシステム開発を促進することを目的とした,先進的な研究の方向性の集合をまとめてまとめる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:41:53 GMT)
Quantum probability for statisticians; some new ideas [0.0] いくつかの観点から、量子確率は統計的な設定において役割を果たすかもしれないと論じられている。
量子基底に対する新しいアプローチは、マクロ的な設定で等しく有効であるように見える仮定を持つ。
量子確率の統計的応用の可能性に関するアイデアのリストを提供し、議論する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:37:45 GMT)
Quantum enhanced parameter estimation with monitored quantum nonequilibrium systems using inefficient photo detection [0.0] 本研究では,散逸性量子多体系からの光放射の非効率検出は,量子化パラメータ推定に到達するのに十分であることを示す。
放射場の時間相関構造を解析することにより, ほぼ最適なパラメータ推定値の家系を構築することができる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:56:57 GMT)
Quantum approximated cloning-assisted density matrix exponentiation [0.0] ハミルトンシミュレーション技術は、行列の量子コンピュータへのロードを可能にする。
Lloyd-Mohseni-Rebentrostプロトコルは、量子状態の複数のコピーが利用可能であれば、行列指数を効率的に実装する。
本稿では、不完全な量子コピーを導入することにより、この制限を回避する方法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:12:31 GMT)
Quantitative Evaluation of Quantum/Classical Neural Network Using a Game Solver Metric [0.0] tac-toe のゲームにおける Elo 評価に基づくゲーム解決ベンチマークを提案する。
古典畳み込みニューラルネットワーク(CNN)、量子畳み込みニューラルネットワーク(QCNN)、ハイブリッド古典量子モデルを比較した。
以上の結果から,従来のCNNに匹敵するElo評価を実現する一方,スタンドアロンのQCNNは現在のハードウェア制約下では性能が劣ることがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:05:16 GMT)
Quantisations of exactly solvable ghostly models [0.0] 正確に解ける2次元ローレンツ結合量子系について検討する。
標準的な Pais-Uhlenbeck の定式化にマップする。
ゴーストモデルの物理的特性について検討した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:39:52 GMT)
PyUAT: Open-source Python framework for efficient and scalable cell tracking [0.0] PyUATは、タイムラプスイメージングにおいて微生物細胞を追跡するための効率的でモジュール化されたPython実装である。
大規模な2D+tデータセット上での性能を実証し、モジュラー生体モデルと撮像間隔が追跡性能に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:43:08 GMT)
Pretraining with random noise for uncertainty calibration [0.0] 多くのモデルは、誤った信頼のために幻覚(自信があるが不正確な反応)を示す。
発達神経科学にインスパイアされた本手法は,ランダムなノイズとラベルでネットワークを事前学習することでこの問題に対処する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:34:23 GMT)
Poster Abstract: Time Attacks using Kernel Vulnerabilities [0.0] タイムキーピングは現代のコンピューティングの基本的な構成要素であるが、システム時間のセキュリティは見落とされがちな攻撃面であり、重要なシステムは操作に弱いままである。
タイムキーピングは現代のコンピューティングの基本的な構成要素であるが、システム時間のセキュリティは見落とされがちな攻撃面であり、重要なシステムは操作に弱いままである。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:06:12 GMT)
PVLens: Enhancing Pharmacovigilance Through Automated Label Extraction [0.0] 我々は、FDA Structured Product Labels(SPL)からラベル付き安全情報を抽出し、MedDRAに用語をマッピングするシステムであるPVLensを紹介する。
97の薬物ラベルに対する検証において、PVLensは、高いリコール(0.983)と適度な精度(0.799)のF1スコアを0.882で達成した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 17:19:38 GMT)
On the Maiorana-McFarland Class Extensions [0.0] The closure $mathcalM_m#$ and the extension $widehatmathcalM_m$ of the Maiorana--McFarland class $mathcalM_m$。
集合 $mathcalM_m$ に最も近い曲がった関数の数を見つけ、$mathcalM_m#$ に対して同じ数の上限を与える。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:34:05 GMT)
On best approximation by multivariate ridge functions with applications to generalized translation networks [0.0] 近似の順序は$n-r/(d-ell)$として振る舞うが、$r$はソボレフ関数の正則性である。
我々の下限は、正則$r$の$L1$のときにも成り立つが、上限は$Lp$-Sobolevの$Lp$の$Lq p leq infty$の近似に適用される。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:29:38 GMT)
Observation of Magnomechanics at Low Temperatures [0.0] キャビティマグノメカニクスは、誘電体中のマグノンとマイクロ波キャビティ光子との強い結合と長寿命の機械共鳴を結合する。
低温下でのマグノメカニクスの初観測を9Kまで行った。
この実験はマイクロ波空洞内のYIG球を用いて行われ、熱力学的運動とマグノン線幅の温度依存性を計測した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:44:56 GMT)
Numerically efficient quasi-adiabatic propagator path integral approach with two independent non-commuting baths [0.0] 本稿では,一元的環境下でのQUIPI法で導入された近似の数値的効率と精度について考察する。
具体的には、メモリ時間、経路フィルタリング、マスクによる影響関数係数の粗粒化を近似として、鮮明に定義されたメモリタイムのカットオフを考える。
以上の結果から, 異なる浴槽へのシステム結合演算子が通勤しない場合, 統計的に独立な環境の付加的な性質が誤解を招く可能性が示唆された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:58:13 GMT)
Non-control-Data Attacks and Defenses: A review [0.0] 近年,ネットワークセキュリティの分野では,非制御データ攻撃がホットスポットとなっている。
これらの攻撃は、プログラム内の制御不能なデータを修正するためにメモリの脆弱性を利用する。
以前から発見されていたにもかかわらず、非制御データ攻撃の脅威は適切に対処されていない。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 23:19:08 GMT)
Network Density Analysis of Health Seeking Behavior in Metro Manila: A Retrospective Analysis on COVID-19 Google Trends Data [0.0] 本研究では,フィリピン首都圏のマニラ都市圏におけるCOVID-19関連健康診察行動の時間的側面について検討した。
2020年3月から2021年3月までの15日間および30日間の転がり窓を用いて,5つのカテゴリーにまたがる15のキーワードを調査した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 05:11:57 GMT)
Multimode Qubit-Conditional Operations via Generalized Cross-Resonance [0.0] 我々は、クロス共振駆動を一般化されたマルチモードスキームに拡張することにより、シングルモードおよびマルチモードキュービット条件演算を生成する。
これには、単モード条件変位と、1光と2光のクロス共振駆動によって引き起こされるスクイーズを含む。
マルチモード設定では、マルチモードキュービット条件ビームスプリッタと2モードスキューズ演算を導出する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:34:48 GMT)
Modular Time Evolution and the QNEC [0.0] 我々は、場の量子論における状態の進化を制限する不等式を確立する。
我々の不等式はフォン・ノイマン代数の半側モジュラー包含に関する言明である。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:33:35 GMT)
Medical Reasoning in LLMs: An In-Depth Analysis of DeepSeek R1 [0.0] 本研究は、100症例のMedQAを用いて、DeepSeek R1の専門的パターンに対する医学的推論を評価する。
このモデルは、診断精度93%を達成し、鑑別診断、ガイドラインに基づく治療選択、患者固有の因子の統合を通じて、体系的な臨床的判断を実証した。
誤り分析では, バイアスのアンカー, 競合するデータの整合性の課題, 代替案の探索不足, 過剰思考, 知識ギャップ, 中間的治療に対する決定的治療の早期優先順位付けなど, 持続的な限界が認められた。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:18:08 GMT)
Measurement-Induced Entanglement Phase Transition in Free Fermion Chains [0.0] 測定誘起絡み合い相転移(MIET)は、局所的な測定が量子システムをいかに駆動するかを示す。
本総説では, 単体ホッピングが測定による非ユニタリ性とどのように競合するかに着目し, 自由フェルミオンモデルにおけるMIETについて検討する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:13:33 GMT)
Mapping fMRI Signal and Image Stimuli in an Artificial Neural Network Latent Space: Bringing Artificial and Natural Minds Together [0.0] 本研究の目的は,視覚刺激とfMRIデータの潜在空間表現が共通情報を共有するかどうかを検討することである。
fMRIデータからの刺激の復号と再構成は、AIと神経科学の課題である。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:41:43 GMT)
Local Normalization Distortion and the Thermodynamic Formalism of Decoding Strategies for Large Language Models [0.0] 我々は、エルゴード理論の言語における平衡状態として一般的な復号アルゴリズムを表現し、言語モデルの復号戦略の理論を開発する。
本研究では, トポ-ク, 原子核, 温度サンプリングの局所正規化ステップの効果を解析し, 確率を1にまとめる。
一般的な説明とは対照的に、核サンプリングに対するトップkサンプリングの低性能の主な原因は局所正規化歪みである。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:15:43 GMT)
Liouville Fock state lattices and potential simulators [0.0] オープン量子系を可視化するためのフレームワークとして,Louville Fock状態格子を導入する。
リンドブラッドマスター方程式(LME)をベクトル化することにより、状態は二重空間で発展し、自然に合成格子を形成する。
これらの「古典的シミュレータ」をフォック表現と代替正半定表現の両方で検討する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 23:50:12 GMT)
LSEAttention is All You Need for Time Series Forecasting [0.0] トランスフォーマーベースのアーキテクチャは自然言語処理とコンピュータビジョンにおいて顕著な成功を収めた。
これまでの研究では、伝統的な注意機構が、この領域におけるそれらの有効性を制限する重要な要素として特定されてきた。
本稿では,トランスフォーマーを用いた時系列予測において,エントロピー崩壊を緩和し,不安定性をトレーニングするための新しいアプローチであるLATSTを紹介する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:00:07 GMT)
LLPut: Investigating Large Language Models for Bug Report-Based Input Generation [0.0] エラーを引き起こすインプットは、ソフトウェアバグの診断と分析において重要な役割を担います。
従来の研究では、様々な自然言語処理(NLP)技術を利用して自動入力抽出を行っている。
大規模言語モデル (LLMs) の出現により、重要な研究課題が生じる: ジェネレーティブLLMは、バグレポートから障害誘発インプットを効果的に抽出できるのか?
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:35:05 GMT)
Kondo-Zeno crossover in the dynamics of a monitored quantum dot [0.0] 量子系を継続的に監視することは、その性質に強く影響を与え、量子ゼノ効果によるコヒーレントな進化を抑えることができる。
ここでは、金属浴に結合した強く相互作用する量子ドットにおいて、近藤効果によって生じる最も単純な多体状態の1つに焦点を当てる。
本研究では, 初期偏極スピンの崩壊速度が, 相互作用によって制御されるコンドスクリーニングから量子ゼノ効果へのクロスオーバーを示すとともに, モニタリング速度が増大するにつれて, 裸散逸で減少する崩壊速度を示すことを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:39:14 GMT)
Kicking Quantum Fisher Information out of Equilibrium [0.0] 量子フィッシャー情報(Quantum Fisher Information)は、量子気象学から凝縮物質物理学まで幅広い応用分野を持つユビキタス量である。
ゼロ温度秩序相を持つ量子スピン鎖のQFIを増幅する自然な機構を明らかにする。
熱力学限界における大域的クエンチ後の量子フィッシャー情報の挙動を再検討する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:30:58 GMT)
Joint Estimation of Conditional Mean and Covariance for Unbalanced Panels [0.0] 非パラメトリックなカーネルベースジョイント推定器を開発し、大きなパネルとバランスの取れていないパネルにおける条件平均と共分散行列を推定する。
1962年から2021年までの月次米国株過剰リターンの広範なパネルに当てはめます。
慣用性リスクは, 平均して, 断面積の75%以上を説明できることがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:43:26 GMT)
Interferometric OTOC for Non-Markovian Open Quantum Systems [0.0] 時間外秩序相関器(OTOC)は量子カオスを研究する上で重要なツールである。
我々はOTOCを計算し、原子-磁場相互作用モデルとスピン-スピン相互作用モデルで衝突する量子情報を分析する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:23:19 GMT)
Integrating Large Language Models For Monte Carlo Simulation of Chemical Reaction Networks [0.0] 化学反応ネットワークは複雑な生物学的過程をモデル化し探索するための重要な方法である。
反応速度論を解析・生成するために,現代の大言語モデルの有効性と限界を示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:01:50 GMT)
Information Theoretic One-Time Programs from Geometrically Local $\text{QNC}_0$ Adversaries [0.0] ランダム線形コードと量子ランダムアクセスコード(QRAC)からワンタイムメモリを構築する。
我々は、敵の古典的な計算力、使用可能な量子ビットの数、およびその量子ビットのコヒーレンス時間に制限を課さない。
我々は、幾何学的に局所的な量子回路から理論的に1時間メモリを1つの時間情報で構築できるかどうかという疑問を解き放つ。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 22:10:42 GMT)
Improvement Graph Convolution Collaborative Filtering with Weighted addition input [0.0] We build a model WiGCN (Weighted input GCN) to describe and experiment on well-known datasets。
結論は、GCMC、NGCF、LightGCNといった最先端技術と比較した後で述べます。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:57:33 GMT)
Imitating Radiological Scrolling: A Global-Local Attention Model for 3D Chest CT Volumes Multi-Label Anomaly Classification [0.0] 3次元CTスキャンのマルチラベル分類は、データの体積特性と検出すべき異常の多様性のために難しい課題である。
畳み込みニューラルネットワーク(CNN)に基づく既存のディープラーニング手法は、長距離依存を効果的に捉えるのに苦労する。
我々は,3次元CTスキャン解析において,放射線技師のスクロール挙動をエミュレートする新しいグローバルアテンションモデルCT-Scrollを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:46:42 GMT)
Image segmentation of treated and untreated tumor spheroids by Fully Convolutional Networks [0.0] MCTS(Multicellular tumor spheroids)は、放射線(化学)療法の効果を評価するための先進的な細胞培養系である。
我々は2つの完全畳み込みネットワーク(UNetとHRNet)を訓練し、未処理および処理されたMCTSの自動セグメンテーションを開発する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:44:30 GMT)
Hybrid Emotion Recognition: Enhancing Customer Interactions Through Acoustic and Textual Analysis [0.0] 本研究では、高度深層学習、自然言語処理(NLP)、大規模言語モデル(LLM)を統合したハイブリッド感情認識システムを提案する。
このシステムは、複雑な感情状態を理解するための従来のアプローチの限界に対処し、ニュアンスな感情検出を実現する。
多様なデータセットに対する厳密なテストは、システムの堅牢性と正確性を示し、顧客サービスを変革する可能性を強調します。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:13:37 GMT)
How Likely Are You to Observe Non-locality with Imperfect Detection Efficiency and Random Measurement Settings? [0.0] 不完全な検出効率は、遠距離でループホールのないベル試験を行う際の大きな障害の1つとして残っている。
本研究では,限定検出効率がHaarランダム測定設定によるベルの不等式発生確率に及ぼす影響について検討した。
ベル不等式違反のいわゆる典型性は,検出効率が制限された場合でも有効であることを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:08:50 GMT)
Harnessing Chain-of-Thought Metadata for Task Routing and Adversarial Prompt Detection [0.0] 本研究では,タスク事前実行の難易度を決定するために,NofT(Number of Thoughts)と呼ばれるメトリクスを提案する。
思考数に基づいて閾値を設定することで、この指標はプロンプトの難しさを識別し、より効果的なプロンプトルーティングをサポートすることができる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:54:00 GMT)
Ground states of quasi-two-dimensional correlated systems via energy expansion [0.0] 本研究では,空間異方性2次元多体量子システムに適用可能な基底状態の汎用計算法を提案する。
我々は、弱結合鎖の3つの特定の2次元系(ハードコアボソン、スピン-1/2$ハイゼンベルク・ハミルトン、反発相互作用を持つスピンフルフェルミオン)に新しい手法を適用した。
前例のない大きさの格子を扱い、この系に準1次元の隙間のないスピン液体が存在することを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 22:04:56 GMT)
Geometric Flow Models over Neural Network Weights [0.0] ニューラルネットワークの重みの生成モデルは、ディープラーニング、学習最適化、転送学習など、多様なアプリケーションセットに役立ちます。
既存の重み空間生成モデルの研究は、しばしばニューラルネットワークの重みの対称性を無視したり、そのサブセットを考慮に入れたりする。
我々は最近,フローマッチングを用いた生成モデルの構築と,3つの異なる重み空間フローを設計するための重み空間グラフニューラルネットワークを構築した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:29:44 GMT)
Gauging $\mathbb{Z}_N$ symmetries of Narain CFTs [0.0] 格子共形場理論(CFT)における$mathbbZ_N$対称性のゲージングについて検討する。
応用として、約$mathbbZ_N$対称性でオービフォールディングの下で自己双対ボソニック CFT を生成する符号のクラスを同定する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:11:02 GMT)
Fusion of Graph Neural Networks via Optimal Transport [0.0] 本研究は,バニラ平均化性能を連続的に向上することを示す。
本稿では, OTを用いたモデル融合がGCNの場合には, プロセスにグラフ構造を組み込むよりも困難であることが示唆された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:59:54 GMT)
Function Alignment: A New Theory for Mind and Intelligence, Part I: Foundations [0.0] 本稿では,心と知性の新たな理論である機能アライメントを紹介する。
意味、解釈、類推が階層表現間の相互作用からどのように現れるかを明確にモデル化する。
それはしばしば、計算アーキテクチャ、心理学理論、さらには禅のような観念的伝統を結びつけて、規律を分割する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:59:01 GMT)
Feature-Enhanced Machine Learning for All-Cause Mortality Prediction in Healthcare Data [0.0] 本研究は,MIMIC-IIIデータベースを用いた全病院死亡予測のための機械学習モデルを評価する。
我々は,バイタルサイン(心拍数,血圧など),実験結果,人口統計情報などの重要な特徴を抽出した。
ランダムフォレストモデルは、AUCの0.94で最高性能を達成し、他の機械学習やディープラーニングのアプローチを著しく上回った。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 08:04:42 GMT)
Fast, Accurate, and Local Temperature Control Using Qubits [0.0] 量子ビットを用いた高速で高精度で局所的な温度制御を提案する。
サブケルビン温度の量子系がナノ秒の時間スケールで著しく正確に冷却されることを示す。
我々の提案は超伝導束量子ビット、電荷量子ビット、スピン量子ビットで実現することができる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:24:33 GMT)
Extracting Coupling-Mode Spectral Densities with Two-Dimensional Electronic Spectroscopy [0.0] 本稿では,電子状態間の遷移に対応するモードのスペクトル密度を抽出する手法を提案する。
我々は、シミュレーション信号の存在において、環境の非マルコビアン性が重要な役割を果たすことを示す近似解析解を導出する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:53:56 GMT)
Exploring the flavor structure of leptons via diffusion models [0.0] ニュートリノ質量行列を生成するために、I型シーソー機構による標準モデルの簡単な拡張を検討し、ニューラルネットワークを訓練する。
転移学習を利用することで、拡散モデルはニュートリノ質量2乗差とレプトニック混合角に整合した104の解を生成する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:17:00 GMT)
Explainable Boosting Machine for Predicting Claim Severity and Frequency in Car Insurance [0.0] 本稿では、本質的に解釈可能な特性と高い予測性能を組み合わせた説明可能なブースティングマシン(EBM)モデルを提案する。
本手法は,自動車保険頻度と重大度データに基づいて実装し,従来の競合相手と比較した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 09:59:45 GMT)
Evaluating book summaries from internal knowledge in Large Language Models: a cross-model and semantic consistency approach [0.0] 本研究では,大規模言語モデル(LLM)を用いて,包括的かつ正確な書籍要約を生成する能力について検討する。
これらのモデルが、確立された人間の解釈と一致した有意義な物語を合成できるかどうかを検討する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:36:24 GMT)
Entanglement in Typical States of Chern-Simons Theory [0.0] チャーン・サイモンズ経路積分によって作成された量子状態のバルクジオメトリ上での様々な平均を計算する。
典型的な状態は、境界ヒルベルト空間を定義するトーラスの任意の分割に交わらないことが分かる。
この平均状態が分離可能な状態であることは、異なる境界トーラスが十分複雑なバルク測度に対して古典的相関しか共有しないことを意味する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 18:11:55 GMT)
Entanglement distillation rates exceeding the direct transmission bound [0.0] 絡み合い分布は量子通信と暗号にとって重要である。
ノイズレス線形増幅(NLA)は、ノークローニング定理に違反することなくノイズレス増幅をサポートする。
増幅前後の損失を対称に分布させることにより,NLAの成功率のスケーリングが向上することを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:49:23 GMT)
Embedding Domain-Specific Knowledge from LLMs into the Feature Engineering Pipeline [0.0] 本稿では,Large Language Models (LLMs) を,データセットに知識を加えるための初期機能構築ステップとして用いることを提案する。
その結果、進化はより速く収束し、計算資源を節約できることがわかった。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:48:58 GMT)
Electronic structure dimensionality of the quantum-critical ferromagnet YbNi$_4$P$_2$ [0.0] YbNi$_4$P$$は、2階量子相転移を示す最初の既知の強磁性金属である。
現在の理論的理解は、2次元および3次元金属の2階強磁性量子臨界性を規定している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:27:42 GMT)
Efficiency Enhancement up to Unity in a Generalized Quantum Otto Engine: Comparative Analysis with Conventional Quantum Otto Engine Utilizing a Two-Qubit Heisenberg XXZ Chain [0.0] 新しい一般化量子オットーサイクル(GQOC)が導入された。
GQOCは、従来の量子オットーサイクルの効率を超える100%効率のポテンシャルを示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:07:12 GMT)
Effects of superradiance on relativistic Foldy-Wouthuysen densities [0.0] Klein-Gordon方程式のウェーブパレットダイナミクスについて検討する。
波動関数のFoldy-Wouthuysen変換に基づく密度は光円錐の外側で局所的に増幅できる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 11:49:18 GMT)
Effects of non-integrability in a non-Hermitian time crystal [0.0] 非可積分相互作用項を非エルミート時間結晶モデルに導入する効果について検討する。
十分に強い相互作用は予期せぬ対称性を破る遷移を引き起こす。
以上の結果から,非エルミート力学と多体相互作用の相互作用は,新しい対称性の破れにつながる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 23:29:17 GMT)
Dispersive regime of multiphoton qubit-oscillator interactions [0.0] シュリーファー・ウォルフ摂動理論を用いて、$n$- Photon qubit-oscillator相互作用の分散状態を分析する。
高次ケーラー項に加えて、量子ビット条件付き2n$-光子スクイージング項は、効果的な非回転波近似ハミルトニアンに現れる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 02:03:36 GMT)
Differential Evolution for Grassmann Manifold Optimization: A Projection Approach [0.0] グラスマン多様体 Gr(k,n) 上で定義される実数値目的関数に対する新しい進化的アルゴリズムを提案する。
我々のアプローチは、分解を通してベクトルを多様体に写像する射影を包含する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 21:04:19 GMT)
Detecting Markovianity of Quantum Processes via Recurrent Neural Networks [0.0] 本稿では、マルコフ的および非マルコフ的量子過程を分類するために、リカレントニューラルネットワーク(RNN)を利用する新しい手法を提案する。
このモデルは、様々なシナリオにまたがって95%を超える例外的な精度を示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 19:14:11 GMT)
DemoQuanDT: A Carrier-Grade QKD Network [0.0] 量子鍵分配ネットワーク(QKDN)は、強力な量子コンピュータの時代においてもセキュアな通信を可能にする。
本研究はキャリアグレードのQKDNアーキテクチャを示し,ネットワークオペレータの操作性を考慮したQKDNアーキテクチャを提案する。
展示された建築は、ベルリンとボン市を結ぶフィールド・デモレーター内で展開され、ドイツ横断923kmの接続距離で展開された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:07:51 GMT)
Demand Estimation with Text and Image Data [0.0] 本稿では,非構造化テキストと画像データを利用して置換パターンを推定する需要推定手法を提案する。
われわれはそれをAmazon上の40の製品カテゴリーに適用し、テキストと画像データが各カテゴリーの近い代替品を特定するのに役立つことを一貫して見つけている。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:28:31 GMT)
DeepRV: pre-trained spatial priors for accelerated disease mapping [0.0] 事前符号化された深層生成モデル(例えば、PrediorVAE、$pi$VAE、PrediorCVAE)はスケーラブルなベイズ推論のための強力なツールとして登場した。
我々は、訓練を加速し、現実の応用性を高める軽量でデコーダのみのアプローチであるDeepRVを提案する。
本研究は、シミュレートされたデータ、50歳未満の人における性別ごとのがん死亡率、ジンバブエにおけるHIV感染率を用いて、イギリスのプロセスエミュレーションおよび空間分析においてその効果を示す。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:04:41 GMT)
Decoherence rate expression due to air molecule scattering in spatial qubits [0.0] 空気分子との散乱・衝突による空間重ね合わせにおけるデコヒーレンスの解を提供する。
この結果は、文献で知られている短波長および長波長の限界を再現する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:37:56 GMT)
Debate-Driven Multi-Agent LLMs for Phishing Email Detection [0.0] エージェント間の偽りの議論をシミュレートしてフィッシングメールを検出する多エージェント大規模言語モデル(LLM)を提案する。
提案手法では,2つの LLM エージェントを用いて,最終判断を代弁する判断エージェントを用いて,分類課題の論拠を提示する。
結果は、議論の構造自体が、余分なプロンプト戦略を伴わずに正確な決定を下すのに十分であることを示している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 23:18:14 GMT)
Constraint-based causal discovery with tiered background knowledge and latent variables in single or overlapping datasets [0.0] 制約に基づく因果発見における相関した背景知識の利用を検討する。
階層型FCI (tiered FCI) アルゴリズムの特性に関する新しい知見を提示する。
我々は,階層型背景知識を取り入れたIODアルゴリズム(重なり合うデータセットの統合),階層型IODアルゴリズム(tIOD)を導入する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:14:21 GMT)
CombiGCN: An effective GCN model for Recommender System [0.0] グラフニューラルネットワーク(GNN)は、協調フィルタリング(CF)研究の潜在的ラインを開く。
本稿では,ユーザ・イテム相互作用グラフ上にのみアイテムの埋め込みを線形に伝播させるリコメンデーションフレームワークCombiGCNを提案する。
また,実世界の3つのデータセット上で,CombiGCNと最先端モデルを比較検討した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:03:27 GMT)
Combating the Bullwhip Effect in Rival Online Food Delivery Platforms Using Deep Learning [0.0] 本稿では,レストラン,オンライン食品アプリ,顧客を含む3部構成物流(PL)サプライチェーンモデルを提案する。
2相Long Short-Term Memory(LSTM)ネットワークを使用して、ディープラーニングベースの需要予測モデルを使用する。
提案手法はブルウィップ効果を著しく低減し,予測精度とサプライチェーン効率を向上する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 10:22:52 GMT)
Collective emission and selective-radiance in atomic clouds and arrays coupled to a microring resonator [0.0] 原子は自由空間を介する光誘起双極子-双極子相互作用と共振器のささやき声モードによって相互作用する。
これらのモードの異なる特性と不整合波数は複雑な力学を引き起こし、光-物質相互作用を制御する新しい機会を与える。
実験により得られた原子雲の文脈でこれらの現象を探索し,提案したサブ波長原子アレイのポテンシャルについて検討する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 03:20:47 GMT)
Cognitive-Mental-LLM: Evaluating Reasoning in Large Language Models for Mental Health Prediction via Online Text [0.0] 本研究では,Reddit から得られた複数のメンタルヘルスデータセットの分類精度を向上させるため,構造化推論手法-Chain-of-Thought (CoT), Self-Consistency (SC-CoT), Tree-of-Thought (ToT) の評価を行った。
我々は,Zero-shot CoTやFew-shot CoTといった推論駆動型プロンプト戦略を,Ba balanced Accuracy,F1 score,Sensitivity/Specificityといった重要なパフォーマンス指標を用いて分析する。
以上の結果から,特に複雑な場合において,推論手法により直接予測よりも分類性能が向上することが示唆された。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:14:15 GMT)
Cognitive Prompts Using Guilford's Structure of Intellect Model [0.0] 大規模言語モデル(LLM)は強力な言語生成能力を示すが、しばしば構造化推論に苦しむ。
本稿では,モデル応答の明瞭さ,コヒーレンス,適応性を向上させるために,SOIにインスパイアされた推論を強制する新しい認知促進手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 23:06:30 GMT)
Classical bounds on correlation-type Bell expressions and linear prepare-and-measure witnesses: efficient computation in parallel environments such as graphics processing units [0.0] 提案プログラムは,グラフィクス処理ユニット(GPU)を用いた行列$M$の$L_d$ノルムのブルート力計算を高速化することを目的としている。
CPUの代替も実装されており、アルゴリズムは任意の並列環境に適用できる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 15:14:32 GMT)
Building and aligning a 10-plane light converter [0.0] 多面光変換(MPLC)は単面変調の限界に対処する。
本稿では,10面型プログラマブル光コンバータの構築と整列のためのステップバイステップガイドを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:53:17 GMT)
Bosonic quantum error correction with microwave cavities for quantum repeaters [0.0] ボソニックな誤り訂正とメモリコンポーネントを組み込んだ量子リピータシステムの秘密鍵レートの理論解析を行う。
マイクロ波空洞と超伝導トランスモンからなる量子リピータの物理実装について論じる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 14:50:57 GMT)
Bias-Aware Agent: Enhancing Fairness in AI-Driven Knowledge Retrieval [0.0] 本研究では,エージェントフレームワークとバイアス検出装置の革新的利用を活用したバイアス認識知識検索手法を提案する。
透明性と意識をユーザに与えることによって、このアプローチはより公平な情報システムを促進することを目指している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:54:39 GMT)
Beyond asymptotic scaling: Comparing functional quantum linear solvers [0.0] 多くの量子線形解法(QLS)が開発され、最も優れたオラクル最悪のケースの複雑性を達成するために競合している。
ほとんどのQLSはフォールトトレラントな量子コンピュータを前提としているため、実際のハードウェアでベンチマークを行うことはできない。
近似行列反転関数を直接実装する4つのよく知られたQVTアルゴリズムについて考察する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:09:52 GMT)
AskSport: Web Application for Sports Question-Answering [0.0] AskSportはスポーツに関する質問に答えるウェブアプリケーションだ。
ユーザーは自然言語を使って質問し、最も関連性の高い3つの回答を検索することができる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 00:57:27 GMT)
An Artificial Trend Index for Private Consumption Using Google Trends [0.0] 本稿では、経済予測を改善する新しい指標を開発するために、Google検索データの可能性について考察する。
分類変数を選択して推定することにより、機械学習技術を適用する。
結果は、Googleの"Food"と"Tourism"カテゴリがプロジェクションエラーを大幅に削減していることを示している。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:58:01 GMT)
AlphaSpace: Enabling Robotic Actions through Semantic Tokenization and Symbolic Reasoning [0.0] AlphaSpaceは階層的セマンティクスに基づくトークン化戦略を採用し、粗いレベルときめ細かいレベルの空間情報をエンコードする。
提案手法は, 特徴, 位置, 高さ情報を構造化トークンで表現し, 従来の視覚による埋め込みに頼ることなく, 正確な空間推論を可能にする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:39:47 GMT)
AgRowStitch: A High-fidelity Image Stitching Pipeline for Ground-based Agricultural Images [0.0] 農業用画像は、繰り返しのテクスチャによって縫い付けが困難になり、植物は平面ではなく、多くの画像から作られたモザイクは、漂流の原因となるエラーを蓄積することができる。
我々は,作物の線形列の地上画像の縫合を行うための,ユーザフレンドリーでオープンソースのパイプラインを構築した。
2つの異なる農業用ロボットとカメラを使って、72mの作物の長い列に沿って集められた画像上でパイプラインをテストした。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 21:14:54 GMT)
Advancing Spatiotemporal Prediction using Artificial Intelligence: Extending the Framework of Geographically and Temporally Weighted Neural Network (GTWNN) for Differing Geographical and Temporal Contexts [0.0] ニューラルネットワーク(ANN)の数学的枠組みを拡張して予測犯罪モデルを改善することを目的とした論文。
我々は、地理的および時間的に重み付けられた回帰WRを解き、それをロンドン犯罪データに適用するための新しいアプローチを定式化した。
その結果,提案手法の仮定と近似の妥当性を裏付ける高精度な予測評価スコアが得られた。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 06:45:59 GMT)
Adaptive Resampling with Bootstrap for Noisy Multi-Objective Optimization Problems [0.0] 本稿では,ブートストラップと支配確率を用いて最適化問題の性質を取り入れた再サンプリング決定関数を提案する。
この再サンプリング手法の効率性は、NSGA-IIアルゴリズムに複数のノイズ変動下でのシーケンシャルな再サンプリング手順を適用して証明する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:32:42 GMT)
AGILE: A Diffusion-Based Attention-Guided Image and Label Translation for Efficient Cross-Domain Plant Trait Identification [0.0] クロスドメイン画像変換は、異なるドメイン間でラベルを転送することで、トレーニングデータの生成を容易にする。
既存の生成モデルは、ドメイン間で画像を翻訳する際にオブジェクトレベルの精度を維持するのに苦労する。
本稿では,画像翻訳のセマンティック制約に最適化されたテキスト埋め込みとアテンションガイダンスを利用する拡散型フレームワークAGILEを紹介する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 22:20:15 GMT)
A new estimation of the quantum Chernoff bound [0.0] 量子チャーノフ境界の新たな推定法を導出する。
我々は,行列減少関数を特徴付け,視点関数に対する行列Powers-St"ormer型不等式を確立する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 20:18:52 GMT)
A mathematical model for a universal digital quantum computer with an application to the Grover-Rudolph algorithm [0.0] 代数的確率論を用いた普遍デジタル量子計算のための新しいフレームワークを開発する。
量子回路を基本量子ゲートの有限列として定義する。
与えられた確率密度関数を近似する量子回路を設計する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 13:38:09 GMT)
A friendly introduction to triangular transport [0.0] 不確実性の下での意思決定は、科学と工学における横断的な挑戦である。
この問題に対するほとんどのアプローチでは、不確実性の確率的表現が採用されている。
三角トランスポートマップを用いた表現の特徴付けと操作について論じる。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 16:41:14 GMT)
A computational theory of evaluation for parameterisable subject [0.0] パラメータ可能な対象に対する評価の計算理論を導入する。
対象者に対する評価基準の一般化評価誤差と一般化因果効果誤差の上限を証明した。
また,測定対象の因果効果の予測と予測による一致性も証明した。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 04:00:49 GMT)
A Quantum Constraint Generation Framework for Binary Linear Programs [0.0] 量子コンピュータを用いたバイナリ線形プログラミング(BLP)のための新しい手法を提案する。
量子最適化アルゴリズム(ハイブリッドまたは量子専用)は現在、ICPのためのスタンドアロンの解法である。
本研究では,任意の量子最適化アルゴリズムを量子情報古典制約生成フレームワークにラップする。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 07:24:33 GMT)
A Contextual Approach to Technological Understanding and Its Assessment [0.0] 我々は,技術工芸品を用いて目的を実現する能力として,デジョンとデハラロの技術的理解の概念を洗練させる。
私たちは2つの追加のコンテキスト – 運用とイノベーション – を導入することで、設計コンテキストに対するオリジナルの仕様を拡張します。
技術的理解の性質をより明確にするために,反実的推論に基づく評価枠組みを提案する。
論文参考訳(メタデータ) (Thu, 27 Mar 2025 12:23:25 GMT)