Scaling Laws of Synthetic Data for Language Models [132.7] プレトレーニングコーパスを多種多様な高品質な合成データセットに変換するスケーラブルなフレームワークであるSynthLLMを紹介した。
提案手法は,グラフアルゴリズムを用いて複数の文書にまたがるハイレベルな概念を自動的に抽出し,再結合することで実現している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:23:44 GMT)
Zero-Shot Audio-Visual Editing via Cross-Modal Delta Denoising [114.4] そこで我々は,ゼロショット音声映像編集を導入し,新たなモデルトレーニングを必要とせず,特定のテキストプロンプトに合わせるために,オリジナル音声映像コンテンツを変換する新しいタスクを提案する。
この課題を評価するために、ゼロショットオーディオビデオ編集用に明示的に設計されたベンチマークデータセットAvED-Benchをキュレートする。
AvEDは、AvED-Benchと最近のOAVEデータセットの両方で優れた結果を示し、その一般化能力を検証する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:59:04 GMT)
SimBEV: A Synthetic Multi-Task Multi-Sensor Driving Data Generation Tool and Dataset [101.5] 近年,BEV(Bird's-eye view)の認識は自律運転において大きな注目を集めている。
SimBEVは、広範囲にスケーラブルでスケーラブルなランダム化された合成データ生成ツールである。
SimBEVは、さまざまな運転シナリオからの注釈付き知覚データの大規模なコレクションであるSimBEVデータセットを作成するために使用される。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:42:44 GMT)
OTTER: A Vision-Language-Action Model with Text-Aware Visual Feature Extraction [95.6] Vision-Language-Action(VLA)モデルは、視覚的な観察と言語指示に基づいてロボット行動を予測することを目的としている。
既存のアプローチでは、視覚的特徴と言語的特徴が独立して下流ポリシーに供給されるため、微調整済みの視覚言語モデル(VLM)が必要である。
本稿では,テキスト認識による視覚的特徴抽出によって既存のアライメントを活用する新しいVLAアーキテクチャOTTERを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:55:06 GMT)
Offline Action-Free Learning of Ex-BMDPs by Comparing Diverse Datasets [87.6] 本稿では,エージェント間の制御可能な特徴ダイナミクスの違いを利用して表現を学習する,サンプル効率のよいアルゴリズムCRAFTを紹介する。
我々はCRAFTの性能を理論的に保証し、おもちゃの例でその実現可能性を示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 22:05:57 GMT)
A Geometric Notion of Causal Probing [85.5] 線形部分空間仮説は、言語モデルの表現空間において、動詞数のような概念に関するすべての情報が線形部分空間に符号化されていることを述べる。
理想線型概念部分空間を特徴づける内在的基準のセットを与える。
2つの言語モデルにまたがる少なくとも1つの概念に対して、この概念のサブスペースは、生成された単語の概念値を精度良く操作することができる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:33:43 GMT)
Fantastic Copyrighted Beasts and How (Not) to Generate Them [83.8] 現状のイメージとビデオ生成モデルは,たとえ文字名が明記されていない場合でも,著作権付き文字を生成可能であることを示す。
文字生成を誘導するキーワードや記述を半自動で識別する手法を提案する。
DALL-Eのプロンプトリライトのような一般的な手法は,単独では不十分であり,ネガティブ・プロンプトのような補足的戦略が必要であることが判明した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:21:42 GMT)
Wan: Open and Advanced Large-Scale Video Generative Models [82.7] Wanは、ビデオ生成の境界を推し進めるために設計された、ビデオファンデーションモデルのスイートである。
我々は、ソースコードやすべてのモデルを含む一連のWanをオープンソース化し、ビデオ生成コミュニティの成長を促進することを目的としています。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:25:43 GMT)
EditCLIP: Representation Learning for Image Editing [80.9] 画像編集のための表現学習手法であるEditCLIPを紹介する。
InstructPix2Pixのテキストベースの命令を参照例画像ペアから計算したEditCLIP埋め込みに置き換える。
自動評価のために、EditCLIPは、所定の画像対のEditCLIP埋め込みとテキスト編集命令または他の参照画像対のEditCLIP埋め込みの類似度を測定することにより、画像編集を評価する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:36:25 GMT)
VPO: Aligning Text-to-Video Generation Models with Prompt Optimization [80.9] ビデオ生成モデルは、通常、高度に詳細で慎重に記述されたテキストとビデオのペアで訓練される。
VPOは3つの基本原則(無害性、正確性、有用性)に基づいてプロンプトを最適化する、原則化されたフレームワークです。
実験の結果,VPOは基準法に比べて安全性,アライメント,画質を著しく向上することがわかった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:28:20 GMT)
Defending against Backdoor Attack on Deep Neural Networks [79.0] トレーニングデータの一部にバックドアトリガーを注入する、いわゆるテキストバックドア攻撃について検討する。
実験の結果,本手法は攻撃成功率を効果的に低減し,クリーン画像の分類精度も高いことがわかった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:12:17 GMT)
Benchmarking Large Vision-Language Models via Directed Scene Graph for Comprehensive Image Captioning [77.3] 本稿では、シーングラフビューから視覚的コンテキストを評価するために、CompreCapと呼ばれる詳細なキャプションベンチマークを導入する。
画像は、まず、共通オブジェクトの語彙に従って意味的に意味のある領域に手動で分割し、また、これらすべての領域内のオブジェクトの属性を識別する。
そして、これらのオブジェクトの方向関係ラベルに注釈を付け、画像のリッチな構成情報を十分にエンコードできる方向のシーングラフを構成する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:10:20 GMT)
Long-context Protein Language Modeling Using Bidirectional Mamba with Shared Projection Layers [77.0] 言語モデル(LM)の自己教師による訓練は、有意義な表現の学習や創薬設計において、タンパク質配列に大きな成功を収めている。
ほとんどのタンパク質LMは、短い文脈長を持つ個々のタンパク質に基づいて訓練されたトランスフォーマーアーキテクチャに基づいている。
そこで我々は,選択的構造化状態空間モデルに基づいて,代替のタンパク質LMアーキテクチャであるBiMamba-Sに基づくLC-PLMを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:48:17 GMT)
EfficientMT: Efficient Temporal Adaptation for Motion Transfer in Text-to-Video Diffusion Models [74.0] 既存の動き伝達法は、ガイド生成のための参照ビデオの動作表現を探索した。
本稿では,ビデオモーション転送のための新しい,効率的なエンドツーエンドフレームワークであるEfficientMTを提案する。
我々の実験は, フレキシブルな動作制御性を維持しつつ, 既存の手法よりも効率が良いことを示した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:32:12 GMT)
DashGaussian: Optimizing 3D Gaussian Splatting in 200 Seconds [71.4] 3DGSの最適化複雑性に関するスケジューリング手法であるDashGaussianを提案する。
提案手法は, 各種3DGSバックボーンの最適化を平均45.7%高速化する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:34:29 GMT)
A Large-Scale Vision-Language Dataset Derived from Open Scientific Literature to Advance Biomedical Generalist AI [70.1] PubMed Central Open Accessサブセットから派生したオープンソースのデータセットであるBiomedicaを紹介する。
Biomedicaには600万以上の科学論文と2400万の画像テキストペアが含まれている。
私たちは、Webサーバを通じてスケーラブルなストリーミングと検索APIを提供し、AIシステムとのシームレスな統合を容易にします。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:56:46 GMT)
MLLM-Selector: Necessity and Diversity-driven High-Value Data Selection for Enhanced Visual Instruction Tuning [69.7] 視覚的インストラクションのチューニングに有用なデータを自動的に識別するMLLM-Selectorを提案する。
モデル性能を向上させるために,VITデータプールの各サンプルの必要なスコアを算出し,サンプルのピボットを同定する。
以上の結果から,データ選択における必要条件と多様性の混合の重要性が指摘され,MLLMセレクタの創出につながった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:42:37 GMT)
Assessing SAM for Tree Crown Instance Segmentation from Drone Imagery [68.7] 現在のモニタリング手法では、各種に対して手動で木を計測し、コスト、時間、労働力を必要とする。
ドローンリモートセンシングとコンピュータビジョンの進歩は、空中画像から木をマッピングし、特徴づける大きな可能性を秘めている。
若木植林の高分解能ドローン画像における樹冠の自動区分け作業におけるSAM法の比較を行った。
SAM out-of-box を用いたメソッドは、よく設計されたプロンプトであっても、カスタム Mask R-CNN よりも優れているわけではないが、SAM をチューニングするメソッドの可能性を秘めている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:45:36 GMT)
IHEval: Evaluating Language Models on Following the Instruction Hierarchy [67.3] 命令階層は、システムメッセージからユーザメッセージ、会話履歴、ツール出力への優先順位を定めている。
その重要性にもかかわらず、このトピックは限定的な注目を集めており、命令階層に従うモデルの能力を評価するための包括的なベンチマークが欠如している。
IHEvalは、異なる優先順位の命令が一致または矛盾するケースをカバーする、新しいベンチマークです。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:35:30 GMT)
COB-GS: Clear Object Boundaries in 3DGS Segmentation Based on Boundary-Adaptive Gaussian Splitting [67.0] 3D Gaussian Splatting(3DGS)に基づく3Dセグメンテーションは、オブジェクトの境界を正確に記述するのに苦労する。
セグメンテーション精度の向上を目的とした3DGS(COB-GS)のためのクリアオブジェクト境界を導入する。
意味指導には境界適応型ガウス分割法を導入する。
視覚的最適化のために、3DGSシーンの劣化したテクスチャを補正する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:20:44 GMT)
Policy Learning with a Language Bottleneck [66.0] 本稿では,AIエージェントが言語規則を生成可能なフレームワークであるPLLB(Language Bottleneck)について紹介する。
PLLBBは言語モデルによってガイドされる*ルール生成*ステップと、エージェントがルールによってガイドされる新しいポリシーを学ぶ*アップデート*ステップとを代替する。
PLLBエージェントは、より解釈可能で一般化可能な振る舞いを学べるだけでなく、学習したルールを人間のユーザと共有できることを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:53:57 GMT)
MATHGLANCE: Multimodal Large Language Models Do Not Know Where to Look in Mathematical Diagrams [65.0] ダイアグラムは視覚言語の基本形として機能し、複雑な概念と、構造化されたシンボル、形状、空間的配置を通してそれらの相互関係を表現する。
現在のベンチマークでは知覚と推論のタスクが明確化されており、マルチモーダルな大規模言語モデルが表面的なパターン認識以上の数学的図形を真に理解しているかどうかを評価することは困難である。
MLLMにおける数学的知覚の分離と評価を目的としたベンチマークであるMATHGLANCEを紹介する。
幾何学的プリミティブと正確な空間関係を付加した200K構造幾何画像テキストの知覚指向データセットであるGeoPePを構築した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:30:41 GMT)
UniSTD: Towards Unified Spatio-Temporal Learning across Diverse Disciplines [64.8] 本稿では,時間的モデリングのためのトランスフォーマーベースの統合フレームワークであるbfUnistageを紹介する。
我々の研究は、タスク固有の視覚テキストが時間学習のための一般化可能なモデルを構築することができることを示した。
また、時間的ダイナミクスを明示的に組み込むための時間的モジュールも導入する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:33:23 GMT)
FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [63.9] 画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基礎モデルと潜在空間アライメントによるクロスモーダルな知識伝達を確立する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:54:19 GMT)
ST-VLM: Kinematic Instruction Tuning for Spatio-Temporal Reasoning in Vision-Language Models [63.1] 視覚言語モデル(Ms)は、移動距離や移動物体の速度などの要素を分析するのに苦労する。
我々はSTKitとST-Benchと呼ばれるベンチマークデータセットを構築した。
本稿では,ST-VLMが多様な領域やタスクにまたがって頑健に一般化されていることを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:32:54 GMT)
Edited Media Understanding Frames: Reasoning About the Intent and Implications of Visual Misinformation [62.7] ディープフェイク(deepfakes)から単純な編集(deepfakes)までの多モーダルな偽情報は、社会的な重要な問題である。
この例と偽情報を広める有害な編集の違いは意図の1つである。
この意図を認識して記述することは、今日のAIシステムにとって大きな課題である。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:17:54 GMT)
EVolSplat: Efficient Volume-based Gaussian Splatting for Urban View Synthesis [61.2] 既存のNeRFおよび3DGSベースの手法は、フォトリアリスティックレンダリングを実現する上で有望な結果を示すが、スローでシーンごとの最適化が必要である。
本稿では,都市景観を対象とした効率的な3次元ガウススプレイティングモデルEVolSplatを紹介する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:47:27 GMT)
MMGen: Unified Multi-modal Image Generation and Understanding in One Go [61.0] 本稿では,複数の生成タスクを単一の拡散モデルに統合する統合フレームワークMMGenを紹介する。
提案手法は,マルチモーダル出力を柔軟にサポートし,単純なモーダルデカップリング戦略とともに,新しい拡散トランスフォーマを開発する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:37:17 GMT)
M-LLM Based Video Frame Selection for Efficient Video Understanding [60.9] 本稿では,ユーザのクエリに関連性の高いフレームを適応的に選択する,軽量なM-LLMベースのフレーム選択手法を提案する。
選択されたフレームは、視覚的推論と質問応答のための凍った下流ビデオM-LLMによって消化される。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:14:41 GMT)
Do We Need to Verify Step by Step? Rethinking Process Supervision from a Theoretical Perspective [59.6] 標準的なデータカバレッジの仮定では、強化学習はプロセスの監督よりも統計的に難しいものではない。
任意のポリシーの利点関数が最適なプロセス報酬モデルとして機能することを証明する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 22:45:31 GMT)
CLIP in Medical Imaging: A Survey [59.4] コントラスト言語-画像事前学習は、視覚モデルにテキスト管理を導入することに成功している。
CLIPの使用は最近、医療画像領域への関心が高まっている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:32:28 GMT)
Feature4X: Bridging Any Monocular Video to 4D Agentic AI with Versatile Gaussian Feature Fields [56.2] 2次元視覚基礎モデルから4次元領域へ機能を拡張するための普遍的なフレームワークであるFeature4Xを紹介する。
このフレームワークは、まずビデオファンデーションモデルの機能を、明示的な4D機能フィールドに蒸留し、持ち上げる。
実験では, 幾何学的, 外観的シーンの編集, 蒸留, 自由形VQAなど, まったく新しいビューセグメントを紹介した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:56:16 GMT)
Decoupling Fine Detail and Global Geometry for Compressed Depth Map Super-Resolution [56.0] 圧縮深度マップ超解像のための新しいフレームワークGDNetを提案する。
グローバルおよび詳細な幾何学的特徴を別々に扱うことにより、高品質な深度マップ再構築プロセスを分離する。
我々の解は、幾何的整合性と詳細回復の観点から、現在の方法よりも大幅に優れています。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:09:55 GMT)
Networking Systems for Video Anomaly Detection: A Tutorial and Survey [55.3] ビデオ異常検出(VAD)は人工知能(AI)コミュニティにおける基本的な研究課題である。
ディープラーニングとエッジコンピューティングの進歩により、VADは大きな進歩を遂げた。
この記事では、NSVADの初心者向けの包括的なチュートリアルを紹介します。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:44:38 GMT)
Collaborative Storytelling and LLM: A Linguistic Analysis of Automatically-Generated Role-Playing Game Sessions [55.2] RPG(ロールプレイングゲーム)とは、プレイヤーが互いに対話して物語を作るゲームである。
この共有物語の新たな形態は、主に口頭で注目されている。
本稿では,大言語モデル(LLM)の言語がRPGセッションの生成を依頼した場合に,どの程度に口頭や書面の機能を示すかを明らかにすることを目的とする。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:10:47 GMT)
Progress-Aware Video Frame Captioning [55.2] 本稿では,アクションシーケンス内の微細な時間的ダイナミクスをキャプチャするキャプションモデルであるProgressCaptionerを提案する。
我々は、トレーニングをサポートするFrameCapデータセットと、キャプションの品質を評価するFrameCapEvalベンチマークを開発する。
結果は、ProgressCaptionerが主要なキャプションモデルを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:26:56 GMT)
BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval [54.5] BRIGHTは、関係する文書を検索するために、集中的推論を必要とする最初のテキスト検索ベンチマークである。
私たちのデータセットは、経済学、心理学、数学、コーディングなど、さまざまな領域にまたがる1,384の現実世界のクエリで構成されています。
クエリに関する明示的な推論を取り入れることで、検索性能が最大12.2ポイント向上することを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:37:26 GMT)
Attribute-formed Class-specific Concept Space: Endowing Language Bottleneck Model with Better Interpretability and Scalability [54.4] 本稿では,解釈可能な画像認識を実現するために,Attribute-formed Language Bottleneck Model (ALBM)を提案する。
ALBMは属性形式クラス固有の空間において概念を整理する。
解釈性をさらに向上するため,細粒度属性の視覚的特徴を抽出するVAPL(Visual Attribute Prompt Learning)を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:59:04 GMT)
TAMA: A Human-AI Collaborative Thematic Analysis Framework Using Multi-Agent LLMs for Clinical Interviews [54.4] Thematic Analysis (TA) は、構造化されていないテキストデータの潜在意味を明らかにするために広く使われている定性的手法である。
本稿では,多エージェントLEMを用いた人間とAIの協調的テーマ分析フレームワークTAMAを提案する。
TAMA は既存の LLM 支援TA アプローチよりも優れており,高い主題的ヒット率,カバレッジ,独特性を実現している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:58:16 GMT)
DiTCtrl: Exploring Attention Control in Multi-Modal Diffusion Transformer for Tuning-Free Multi-Prompt Longer Video Generation [54.3] DiTCtrlは、MM-DiTアーキテクチャの下で初めてトレーニング不要なマルチプロンプトビデオ生成手法である。
MM-DiTの注意機構を解析し、3次元のフルアテンションがUNetのような拡散モデルにおけるクロス/セルフアテンションブロックと同様の振る舞いを示す。
我々の注意深い設計に基づいて、DiTCtrlによって生成されたビデオは、複数のシーケンシャルプロンプトが与えられた滑らかな遷移と一貫した物体の動きを達成する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:05:41 GMT)
MoRE-LLM: Mixture of Rule Experts Guided by a Large Language Model [54.1] 大規模言語モデル(MoRE-LLM)によるルールエキスパートの混合を提案する。
MoRE-LLMは、トレーニング中の局所的なルールベースのサロゲートの発見と、それらの分類タスクの利用を操縦する。
LLMはルールを修正・コンテキスト化することで、ルールのドメイン知識の整合性を高める役割を担います。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:09:21 GMT)
Inference-Time Policy Steering through Human Interactions [54.0] 推論中、人間はしばしばポリシー実行ループから取り除かれる。
本稿では,人間のインタラクションを活用して生成するサンプリングプロセスにバイアスを与える推論時ポリシーステアリングフレームワークを提案する。
提案手法は,アライメントと分布シフトの最良のトレードオフを実現する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:40:00 GMT)
Exploiting Temporal State Space Sharing for Video Semantic Segmentation [53.9] ビデオセマンティックセグメンテーション(VSS)はシーンの時間的進化を理解する上で重要な役割を担っている。
従来の手法では、ビデオはフレーム単位で、あるいは短い時間ウィンドウで分割されることが多く、時間的コンテキストや冗長な計算、重いメモリ要求に繋がる。
本研究では,時間的特徴共有にマンバ状態空間モデルを活用するための時間的ビデオ状態空間共有アーキテクチャを提案する。
本モデルでは,映像フレーム間の関連情報を効率的に伝播する選択的ゲーティング機構を特徴とし,メモリ量の多い機能プールの必要性を解消する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 01:47:42 GMT)
WiLoR: End-to-end 3D Hand Localization and Reconstruction in-the-wild [53.3] 野生における効率的なマルチハンド再構築のためのデータ駆動パイプラインを提案する。
提案するパイプラインは、リアルタイム完全畳み込みハンドローカライゼーションと、高忠実度トランスフォーマーに基づく3Dハンド再構成モデルという2つのコンポーネントで構成されている。
提案手法は, 一般的な2次元および3次元のベンチマークにおいて, 効率と精度の両方において, 従来の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:05:52 GMT)
Mitigating Low-Level Visual Hallucinations Requires Self-Awareness: Database, Model and Training Strategy [53.1] 低レベル視覚タスクにおける幻覚に焦点を当てた最初のインストラクションデータベースを提案する。
低レベル視覚タスクにおけるモデルの知覚と理解能力を向上させるための自己認識障害除去(SAFEQA)モデルを提案する。
低レベルの視覚課題に対する総合的な実験を行い、提案手法がこれらの課題におけるモデルの自己認識を著しく向上し、幻覚を低減させることを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:05:01 GMT)
Preference Optimization with Multi-Sample Comparisons [53.0] 本稿では,マルチサンプル比較を含むポストトレーニングの拡張手法を提案する。
これらのアプローチは、生成的多様性やバイアスといった重要な特徴を捉えられない。
マルチサンプル比較はシングルサンプル比較よりも集団特性の最適化に有効であることを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:48:11 GMT)
HLV-1K: A Large-scale Hour-Long Video Benchmark for Time-Specific Long Video Understanding [52.7] 我々は、長時間ビデオ理解モデルを評価するために、大規模な時間長ビデオベンチマークHLV-1Kを構築した。
HLV-1Kは、高品質質問応答(QA)とマルチチョイス質問応答(MCQA)を備えた1009時間ビデオからなる。
我々は,既存の最先端手法を用いてベンチマークを評価し,様々なレベルでの深層ビデオ理解能力をテストすることの価値を実証した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:12:50 GMT)
PHT-CAD: Efficient CAD Parametric Primitive Analysis with Progressive Hierarchical Tuning [52.7] ParaCADは1000万点以上のアノテートドローイングと、複雑なトポロジカルな構造とテストのための物理的な制約を備えた3,000の現実世界の産業図で構成されている。
PHT-CADは視覚言語モデルのモダリティアライメントと推論機能を利用する新しい2次元PPAフレームワークである。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:42:11 GMT)
TopV-Nav: Unlocking the Top-View Spatial Reasoning Potential of MLLM for Zero-shot Object Navigation [52.4] MLLMをベースとしたTopV-Navを提案する。
MLLMの空間推論能力をトップビューで完全に解き放つために,適応型視覚プロンプト生成法(AVPG)を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:26:43 GMT)
Regression-Based Estimation of Causal Effects in the Presence of Selection Bias and Confounding [52.1] 治療が介入によって設定された場合、対象変数$Y$に対して、予測因果効果$E[Y|do(X)]$を推定する問題を考える。
選択バイアスや欠点のない設定では、$E[Y|do(X)] = E[Y|X]$ となる。
選択バイアスとコンバウンディングの両方を組み込んだフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:43:37 GMT)
CogVideoX: Text-to-Video Diffusion Models with An Expert Transformer [51.8] 拡散トランスを用いた大規模テキスト・ビデオ生成モデルであるCogVideoXを提案する。
フレームレートは16fps、解像度は768×1360ピクセル。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:33:10 GMT)
MC-LLaVA: Multi-Concept Personalized Vision-Language Model [51.6] 本稿では,最初のマルチコンセプトパーソナライズパラダイムであるMC-LLaVAを提案する。
MC-LLaVAはマルチコンセプト命令チューニング戦略を採用し、1つのトレーニングステップで複数の概念を効果的に統合する。
総合的質的および定量的実験により、MC-LLaVAは印象的なマルチコンセプトパーソナライズされた応答を達成できることが示された。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:44:01 GMT)
From Trial to Triumph: Advancing Long Video Understanding via Visual Context Sample Scaling and Self-reward Alignment [51.3] 大規模言語モデルは単一の推論で有限フレームしか処理できない。
視覚的コンテキストサンプリングにより複数の予測を提案し,次に最終的な予測を選択するためのスコアリング機構を提案する。
実験により,この手法がビデオ質問の回答の正解を高い割合でカバーしていることが示されている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:53:03 GMT)
DAWN: Dynamic Frame Avatar with Non-autoregressive Diffusion Framework for Talking Head Video Generation [50.7] 本稿では,動的長大映像のオール・アット・オンス生成を可能にするフレームワークであるDAWNを提案する。
DAWNは,(1)潜在動作空間における音声駆動型顔力学生成,(2)音声駆動型頭部ポーズと点滅生成の2つの主要成分から構成される。
本手法は, 唇の動きを正確に表現し, 自然なポーズ・瞬き動作を特徴とする実写映像と鮮明な映像を生成する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:38:56 GMT)
OverLoCK: An Overview-first-Look-Closely-next ConvNet with Context-Mixing Dynamic Kernels [50.4] We present OverLoCK, the first pure ConvNet backbone architecture which include a top-down attention mechanism。
トップダウンアテンションのパワーを完全に解き放つために,コンテクスト混合動的畳み込み(ContMix)を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:10:07 GMT)
Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [50.0] 一般のスコアミスマッチ拡散サンプリング器に対する明示的な次元依存性を持つ最初の性能保証を示す。
その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。
この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:27:28 GMT)
Broadening Target Distributions for Accelerated Diffusion Models via a Novel Analysis Approach [50.0] 本研究では,新しいDDPMサンプリング器が,これまで考慮されていなかった3種類の分散クラスに対して高速化性能を実現することを示す。
この結果から, DDPM型加速サンプリング器におけるデータ次元$d$への依存性が改善された。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:07:52 GMT)
Context-Aware Weakly Supervised Image Manipulation Localization with SAM Refinement [49.9] 悪意のある画像操作は社会的リスクを生じさせ、効果的な画像操作検出方法の重要性を高めている。
画像操作検出の最近のアプローチは、完全に教師されたアプローチによって大きく推進されている。
本稿では,デュアルブランチトランスフォーマー-CNNアーキテクチャに基づく,弱教師付きフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:35:09 GMT)
Free4D: Tuning-free 4D Scene Generation with Spatial-Temporal Consistency [49.9] Free4Dは、単一の画像から4Dシーンを生成するためのチューニング不要のフレームワークである。
我々の重要な洞察は、一貫した4次元シーン表現のために、事前訓練された基礎モデルを蒸留することである。
結果の4D表現はリアルタイムで制御可能なレンダリングを可能にする。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:59:44 GMT)
How to organize an in-person, online or hybrid hackathon -- A revised planning kit [49.6] 当初の計画キットは、当時ハッカソンの支配的な形態であった個人内のイベントに焦点を当てていた。
現在では、さまざまな形式のイベント — 個人、オンライン、ハイブリッド – が世界中で実施されています。
このキットには、個人、オンライン、ハイブリッドイベントの余裕と要求について議論するセクションが含まれている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:41:58 GMT)
Hi-ALPS -- An Experimental Robustness Quantification of Six LiDAR-based Object Detection Systems for Autonomous Driving [49.6] 3Dオブジェクト検出システム(OD)は、自動運転車の運転決定において重要な役割を果たす。
敵対的な例は、入力データの変化、すなわち偽造(falsify)、ODの予測において、小さな、時には洗練された摂動である。
異なる種類の摂動条件下で6つの最先端3D ODのロバスト性を定量化する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:24:56 GMT)
Long-Sequence Recommendation Models Need Decoupled Embeddings [49.4] 我々は、既存の長期推薦モデルにおいて無視された欠陥を識別し、特徴付ける。
埋め込みの単一のセットは、注意と表現の両方を学ぶのに苦労し、これら2つのプロセス間の干渉につながります。
本稿では,2つの異なる埋め込みテーブルを別々に学習し,注意と表現を完全に分離する,DARE(Decoupled Attention and Representation Embeddings)モデルを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:45:15 GMT)
SpikeDerain: Unveiling Clear Videos from Rainy Sequences Using Color Spike Streams [49.3] 雨の映像から鮮明なフレームを復元することは、暴風雨の急激な動きによって大きな課題となる。
従来のフレームベースの視覚センサーは、シーンのコンテンツを同期的にキャプチャする。
本研究では,ダイナミックシーンのスパイクストリームを再構築し,雨害を正確に除去できるカラースパイクストリームレイニングネットワーク(SpikeDerain)を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:28:28 GMT)
COSMOS: Cross-Modality Self-Distillation for Vision Language Pre-training [49.3] 視覚言語事前学習のためのCOSMOS: CrOSs-modality Self-distillationを提案する。
新たなテキストクロッピング戦略とクロスアテンションモジュールを自己教師型学習フレームワークに統合する。
さまざまなゼロショットダウンストリームタスクにおいて、以前の強いベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:07:40 GMT)
Disentangled Source-Free Personalization for Facial Expression Recognition with Neutral Target Data [49.3] 本稿では,DSFDA(Disentangled Source-Free Domain Adaptation)法を提案する。
提案手法は,非ニュートラルなターゲットデータを生成しながら,表現と同一性に関連する特徴を解き放つことを学習する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:53:53 GMT)
4DRGS: 4D Radiative Gaussian Splatting for Efficient 3D Vessel Reconstruction from Sparse-View Dynamic DSA Images [49.2] 既存の手法は、しばしば最適以下の結果を生成するか、過剰な計算時間を必要とする。
高品質な高精細化を実現するため、4次元ガウススプラッティング(4DRGS)を提案する。
4DRGSは5分間のトレーニングで印象的な結果を得る。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:14:26 GMT)
Protecting Your Video Content: Disrupting Automated Video-based LLM Annotations [48.9] ビデオベースの大規模言語モデル(ビデオベースのLLM)は、様々なビデオ理解タスクにおいて印象的なパフォーマンスを実現している。
この急速な進歩は、特に個人ビデオデータの不正使用に関して、重要なプライバシーとセキュリティ上の懸念を引き起こす。
本研究では,ラムブリングスとミュートという,知覚不能な対向性摂動を伴う2種類の保護ビデオ透かしを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:11:58 GMT)
Leveraging 3D Geometric Priors in 2D Rotation Symmetry Detection [48.1] 本稿では,中心軸を中心に回転する物体が変化しない回転対称性に着目する。
従来の手法は手作りの特徴マッチングに頼っていたが、最近の畳み込みニューラルネットワークに基づくセグメンテーションモデルは回転中心を検出するが、幾何学的整合性に苦慮している。
本研究では、3次元空間における回転中心と頂点を直接予測し、構造的整合性を維持しながら結果を2次元に投影するモデルを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:02:16 GMT)
Enhancing Depression Detection via Question-wise Modality Fusion [47.5] うつ病は、かなりの個人的・社会的コストを発生させる、非常に普及し、無効な状態である。
そこで我々は,新しい不均衡正規対数関数を用いて学習した質問知度モダリティ・フュージョン(Modality Fusion)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:34:34 GMT)
Towards Real-World Test-Time Adaptation: Tri-Net Self-Training with Balanced Normalization [46.3] 既存の研究は、非I.d.データストリームと連続的なドメインシフトの下での実際のテスト時間適応を主に検討している。
我々は、最先端の手法の失敗は、まず不均衡なテストデータに正規化層を無差別に適応させることによって生じると論じる。
TRIBEと呼ばれる最後のTTAモデルは、バランスの取れたバッチノーム層を持つトリネットアーキテクチャ上に構築されている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:16:13 GMT)
LangBridge: Interpreting Image as a Combination of Language Embeddings [46.2] LangBridgeは、ビジュアルトークンをテキスト埋め込みの線形結合に明示的にマッピングする新しいアダプタである。
以上の結果から,LLaMA3-8BやQwen2.5-14Bといった大型モデルに対して,Qwen2-0.5Bで事前訓練したLangBridgeを直接適用できることが示唆された。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:46:53 GMT)
Synthesizing world models for bilevel planning [46.2] 理論に基づく強化学習(TBRL)は、このギャップに対処するために設計されたアルゴリズムフレームワークである。
TBRLは理論の階層的表現と、より強力な学習と計画のための効率的なプログラム合成手法を利用する。
政策を直接合成する手法が不十分な多様かつ挑戦的なグリッドワールドゲームに対して,このアプローチがうまく適用可能であることを実証する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 00:10:01 GMT)
QualiSpeech: A Speech Quality Assessment Dataset with Natural Language Reasoning and Descriptions [45.6] 包括的低レベル音声品質評価データセットであるQuariSpeechを紹介する。
また,聴覚大言語モデルの低レベル音声理解能力を評価するために,QuariSpeech Benchmarkを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:32:20 GMT)
NLPrompt: Noise-Label Prompt Learning for Vision-Language Models [45.4] 実世界のデータセットは、しばしば、迅速な学習性能を劣化させるうるノイズの多いラベルを含んでいる。
本稿では,PromptMAEという名前の学習における平均絶対誤差(MAE)損失を用いることで,雑音ラベルに対するロバスト性を著しく向上することを示す。
また,ロバスト性を高めるために,プロンプトを用いた最適輸送データ浄化手法であるPromptOTを導入する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:08:24 GMT)
Mobile-MMLU: A Mobile Intelligence Language Understanding Benchmark [45.3] モバイルインテリジェンスに適した大規模ベンチマークデータセットであるMobile-MMLUを紹介する。
80のモバイル関連分野にわたる16,186の質問で構成され、現実的なモバイルシナリオでLLMのパフォーマンスを評価するように設計されている。
挑戦的なサブセットであるMobile-MMLU-Proは、MMLU-Proと同じようなサイズで高度な評価を提供するが、我々の標準のフルセットよりもはるかに難しい。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:59:56 GMT)
Can We Make Code Green? Understanding Trade-Offs in LLMs vs. Human Code Optimizations [45.2] 大規模言語モデル(LLM)は、パフォーマンスとエネルギー効率の最適化を開発者が支援すると主張している。
この研究は、科学と工学の応用のために学術と産業の両方で広く使われているマットラブで書かれたソフトウェアに焦点を当てている。
トップ100のGitHubリポジトリで400スクリプトのエネルギ中心の最適化を分析します。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 00:27:29 GMT)
The mathematics of adversarial attacks in AI -- Why deep learning is unstable despite the existence of stable neural networks [45.0] 固定アーキテクチャを用いた分類問題に対するニューラルネットワークのトレーニングに基づくトレーニング手順が,不正確あるいは不安定なニューラルネットワーク(正確であれば)を生み出すことを証明している。
鍵となるのは、安定かつ正確なニューラルネットワークは入力に依存する可変次元を持つ必要があり、特に、可変次元は安定性に必要な条件である。
我々の結果は、正確で安定したニューラルネットワークが存在するというパラドックスを示しているが、現代のアルゴリズムはそれらを計算していない。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:57:28 GMT)
MAR-3D: Progressive Masked Auto-regressor for High-Resolution 3D Generation [44.9] ピラミッド変分オートエンコーダとカスケードマスク自動回帰変換器を統合したMAR-3Dを提案する。
我々のアーキテクチャは、トレーニング中にランダムマスキングを採用し、推論中にランダムな順序で自動回帰化を行い、自然に3D潜在トークンの無秩序な性質を調節する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:00:51 GMT)
FinAudio: A Benchmark for Audio Large Language Models in Financial Applications [44.7] 金融分野におけるAudioLLMの容量を評価するために設計された最初のベンチマークであるtextscFinAudioを紹介する。
まず,金融分野の特徴に基づく3つのタスクを定義した。1) 短期金融オーディオのためのASR,2) 長期金融オーディオのためのASR,3) 長期金融オーディオの要約である。
本評価では、金融分野における既存のAudioLLMの限界を明らかにし、AudioLLMを改善するための洞察を提供する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:07:51 GMT)
Clustered Switchback Designs for Experimentation Under Spatio-temporal Interference [44.6] 我々は, 平均治療効果 (GATE) を推定し, 全単位を常に治療やコントロールに曝露した平均結果の差を推定した。
そこで我々は,単位をクラスタにグループ化し,時間ステップをブロックにグループ化する,クラスタ化されたスイッチバック設計を提案する。
良好なクラスタリングを許容するグラフに対して, トラッピングされたHorvitz-Thompson推定器が$tilde O(1/NT)$平均二乗誤差(MSE)を達成することを示す。
我々の結果は、citethu2022switchback、ugander2013graph、citetleung2022rateの結果を同時に一般化する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 23:44:55 GMT)
Devil is in the Uniformity: Exploring Diverse Learners within Transformer for Image Restoration [44.4] トランスフォーマーベースのアプローチは、画像復元において大きな注目を集めている。
コアコンポーネントであるMulti-Head Attentionは、多様な特徴を捕捉し、高品質な結果を回復する上で重要な役割を担います。
本稿では,多様な学習者を探索し,頭部間の多様な相互作用を導入することで,MHAを改善することを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:58:41 GMT)
MonoTAKD: Teaching Assistant Knowledge Distillation for Monocular 3D Object Detection [43.7] カメラを用いた学生モデルにロバストな3次元視覚知識を伝達するために,モノクラー指導支援知識蒸留(Monocular teaching Assistant Knowledge Distillation, MonoTAKD)を導入する。
実験の結果,MonoTAKDはKITTI3Dデータセット上で最先端の性能を達成できた。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:08:02 GMT)
Flip Learning: Weakly Supervised Erase to Segment Nodules in Breast Ultrasound [43.3] 正確なセグメンテーションのために2D/3Dボックスにのみ依存するFlip Learningと呼ばれる新しい学習ベースのWSSフレームワークを導入する。
ボックスからターゲットを消去して分類タグのフリップを容易にするために複数のエージェントが使用され、消去された領域が予測されたセグメンテーションマスクとして機能する。
提案手法は最先端のWSS手法や基礎モデルより優れており,完全教師付き学習アルゴリズムと同等の性能を発揮する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:20:02 GMT)
Dynamic Motion Blending for Versatile Motion Editing [43.1] 我々は、入力テキストに基づいて身体部分の動きをブレンドすることでトレーニングトレーレットを生成するオンラインデータ拡張技術であるMotionMixCutを紹介する。
我々は、モーションコーディネータを備えた自己回帰拡散モデルであるMotionReFitを提案する。
提案手法は,高レベルの人的指示から直接,空間的および時間的動作の編集を行う。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:07:24 GMT)
Dissecting and Mitigating Diffusion Bias via Mechanistic Interpretability [42.3] 拡散モデルは多様なコンテンツにおいて印象的な能力を示している。
これらのモデルは、性別や人種など、しばしば社会的偏見を持続させる。
本研究では,拡散モデルの内部プロセスについて検討し,特定の意思決定機構を同定する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:13:35 GMT)
A decision-theoretic approach to dealing with uncertainty in quantum mechanics [42.2] 量子力学における不確実性を扱うための決定論的枠組みを提供する。
測定値が不確実な結果に作用することを示す。
本研究の数学的意義について論じる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:53:06 GMT)
Vision-Amplified Semantic Entropy for Hallucination Detection in Medical Visual Question Answering [42.1] マルチモーダル大言語モデル(MLLM)は、医療用視覚質問応答(VQA)において有意な可能性を証明している。
入力画像と矛盾する幻覚的不適切な反応を呈し、臨床的な意思決定に重大なリスクをもたらす傾向にある。
現在の幻覚検出法,特に意味エントロピー(SE)は,LLMに対して有望な幻覚検出能力を示す。
本稿では、弱い画像変換を取り入れ、視覚入力の影響を増幅する視覚増幅セマンティックエントロピー(VASE)を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:45:34 GMT)
AIGC-assisted Federated Learning for Edge Intelligence: Architecture Design, Research Challenges and Future Directions [41.9] フェデレートラーニング(FL)は、プライバシーとセキュリティを確保しながら、大規模な端末データを活用できる。
この課題に対処するために、革新的なデータ合成技術である人工知能生成コンテンツ(AIGC)が、潜在的な解決策の1つとして出現する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:45:19 GMT)
Multi-Modal Framing Analysis of News [41.4] 本稿では,大規模(ヴィジュアル言語)モデルを用いたマルチモーダル・マルチラベルフレーミング解析を大規模に実施する手法を提案する。
従来の定性的な作業で発見された問題固有のフレーム分析を用いて、トピックの高度にパーティショナリなフレーミングを識別する。
本稿では,ニュース中のテキストと画像の両方のスケーラブルな統合的フレーミング分析を行う方法を示し,メディアバイアスを理解するためのより完全な画像を提供する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:51:33 GMT)
Efficient First-Order Optimization on the Pareto Set for Multi-Objective Learning under Preference Guidance [41.2] ユーザ特定嗜好下での多目的学習は、公正な条件下での多言語音声認識のような実世界の問題で一般的である。
我々は,事前定義された選好関数の最適化を目標とする半ベクタリアル二段階最適化問題として,そのような問題をモデル化する。
修正された単一レベル問題を解くアルゴリズムを提案し,その収束保証を確立する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:41:07 GMT)
Pluggable Style Representation Learning for Multi-Style Transfer [41.1] スタイルモデリングと転送を分離してスタイル転送フレームワークを開発する。
スタイルモデリングでは,スタイル情報をコンパクトな表現に符号化するスタイル表現学習方式を提案する。
スタイル転送のために,プラガブルなスタイル表現を用いて多様なスタイルに適応するスタイル認識型マルチスタイル転送ネットワーク(SaMST)を開発した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:44:40 GMT)
Certified Robustness via Dynamic Margin Maximization and Improved Lipschitz Regularization [40.3] 我々は、弱い方向に沿ってモデルのリプシッツ定数を規則化しながら、出力(ロジット)空間のマージンを増大させる頑健なトレーニングアルゴリズムを開発する。
境界の相対的精度は過剰な正規化を防ぎ、決定境界をより直接的に操作することができる。
MNIST, CIFAR-10 および Tiny-ImageNet データセットを用いた実験により,提案アルゴリズムが最先端技術と比較して競争力に向上した結果が得られることを確認した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:55:55 GMT)
Multi-Agent Inverse Reinforcement Learning in Real World Unstructured Pedestrian Crowds [40.2] 実世界の非構造歩行者群を対象としたマルチエージェント最大エントロピー逆強化学習アルゴリズムを提案する。
われわれのアプローチの鍵は単純だが効果的で数学的トリックであり、いわゆるトラクタビリティ・リレーショナル・トレードオフ・トリック(tractability-rationality trade-off trick)と呼ばれている。
我々の重要な発見は、高密度のSpeedwayデータセットにおいて、単一エージェントIRLよりも2倍改善されたトップ7のベースラインの中で、我々のアプローチが1位であることを示している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:19:58 GMT)
CFunModel: A "Funny" Language Model Capable of Chinese Humor Generation and Processing [40.2] 中国におけるユーモア関連データセット「CFunSet」について紹介する。
このデータセットは、既存の中国のユーモアデータセットを集約し、Tieba-JokeBarから集めた2万以上のジョークを含んでいる。
我々は,中国における様々なユーモア関連タスクを扱うために設計された最初の大規模言語モデルである中国語ファンモデル(CFunModel)を開発した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:44:51 GMT)
Forest-of-Thought: Scaling Test-Time Compute for Enhancing LLM Reasoning [40.1] 我々はフォレスト・オブ・サート(FoT)と呼ばれる新しい推論フレームワークを提案する。
FoTは複数の推論木を統合し、複雑な論理問題を解くために集合的な意思決定を活用する。
FoTは、最も関連性の高い推論パスを選択するためにスパースアクティベーション戦略を採用し、効率と精度の両方を改善している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:56:45 GMT)
MCBLT: Multi-Camera Multi-Object 3D Tracking in Long Videos [39.8] MCBLTという3次元物体検出・追跡フレームワークを提案する。
既存の方法とは異なり、MCBLTは様々なシーンにまたがって印象的な一般化性を持ち、カメラの設定も様々である。
提案した MCBLT は AICity'24 データセットに 81.22$ HOTA で,WildTrack データセットに 95.6$ IDF1 で新たな最先端技術を確立する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:59:25 GMT)
HumanDiT: Pose-Guided Diffusion Transformer for Long-form Human Motion Video Generation [39.7] 提案するHumanDiTは,14,000時間の高品質ビデオを含むデータセットに基づいてトレーニングされたポーズ誘導拡散変換器(DiT)ベースのフレームワークである。
HumanDiTは多数のビデオ解像度と可変シーケンス長をサポートし、長いシーケンスのビデオ生成の学習を容易にする。
実験では、様々なシナリオにまたがる長めの、ポーズの正確なビデオを生成する上で、優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:27:17 GMT)
Mixture of Robust Experts (MoRE):A Robust Denoising Method towards multiple perturbations [39.5] 本研究では,特定の摂動型を扱うために逆向きに訓練された専門家ネットワークや,クリーンなデータの精度を高めるために通常訓練された専門家ネットワークを組み立てる。
私たちのMixture of Robust Experts(MoRE)アプローチは、幅広い堅牢なエキスパートと優れたパフォーマンスのフレキシブルな統合を可能にします。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:14:25 GMT)
Leveraging Implicit Sentiments: Enhancing Reliability and Validity in Psychological Trait Evaluation of LLMs [39.4] 大規模言語モデル(LLM)に特化して設計された新しい評価手法を提案する。
このツールはモデルに対する感情の傾向を暗黙的に評価し、楽観主義、悲観主義、中立性の3つの側面にわたるLLMの洞察に富んだ心理的肖像画を提供する。
CSIスコアとLLMの実世界のアウトプットの感情の相関は0.85を超え、LLMの挙動を予測する上で高い妥当性を示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:14:31 GMT)
RelTriple: Learning Plausible Indoor Layouts by Integrating Relationship Triples into the Diffusion Process [39.0] RelTripleは,物体と地域間の空間的関係を学習することで,家具の流通を促進する新しい手法である。
提案手法は,非条件レイアウト生成,フロアプラン条件付きレイアウト生成,シーンアレンジメントの視覚的評価において,既存の最先端手法よりも一貫して改善されている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:31:52 GMT)
ADS-Edit: A Multimodal Knowledge Editing Dataset for Autonomous Driving Systems [38.6] 大規模マルチモーダルモデル(LMM)は自律運転システム(ADS)において有望であることを示す
本稿では,モデル動作のターゲット変更を,完全なリトレーニングを必要とせずに行える知識編集手法を提案する。
ADSに特化して設計されたマルチモーダル知識編集データセットであるADS-Editを紹介する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:45:29 GMT)
Understanding R1-Zero-Like Training: A Critical Perspective [38.5] ベースモデルとRLの2つのコアコンポーネントを分析し,R1-Zeroライクなトレーニングを批判的に検討した。
本稿では,DeepSeek-V3-Baseを含む幅広いベースモデルについて検討し,事前学習特性がRL性能に与える影響について考察する。
AIME 2024では7Bベースモデルで43.3%の精度を達成できる最小限のR1-Zeroレシピを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:59:14 GMT)
Faster Parameter-Efficient Tuning with Token Redundancy Reduction [38.5] 遅延効率チューニング(PET)は、少数のパラメータを学習することで、事前訓練された基礎モデルを下流タスクに転送することを目的としている。
PETは、訓練済みのモデル容量が指数関数的に増加するにも拘わらず、各タスクのストレージと転送コストを著しく削減する。
ほとんどのPET法は、大きなバックボーンモデルの推論を継承し、しばしば計算オーバーヘッドを増大させる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:15:08 GMT)
PHYSICS: Benchmarking Foundation Models on University-Level Physics Problem Solving [38.4] 大学レベルの物理問題解決のための総合的なベンチマークであるPHYSICSを紹介する。
古典力学、量子力学、熱力学、統計力学、電磁気学、原子物理学、光学の6つの中核領域をカバーする1297のエキスパート注釈付き問題を含んでいる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:21:56 GMT)
Personalized Federated Learning of Probabilistic Models: A PAC-Bayesian Approach [37.9] Federated Learningは、複数のクライアントが格納するプライベートおよび分散データから、共有モデルを推論することを目的としている。
本稿では確率モデルのPFLのためのPAC-PFLフレームワークを紹介する。
従来のPFLアルゴリズムとは異なり、PAC-PFLはパーソナライズされたモデルを1つの共有モデルに向けて正規化していない。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:19:10 GMT)
TopoBench: A Framework for Benchmarking Topological Deep Learning [37.4] トポロジカルディープラーニング(TDL)の研究の標準化と高速化を目的としたオープンソースライブラリであるTopoBenchを紹介する。
TopoBenchは、TDLをデータ生成、ロード、変換、処理、モデルトレーニング、最適化、評価のための独立したモジュールのシーケンスに分解する。
TopoBenchの重要な機能は、トポロジカルドメイン間の変換とリフトをサポートすることだ。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:42:17 GMT)
Human Motion Instruction Tuning [37.3] 本稿では,人間の動作指導のためのフレームワークであるLLaMoについて述べる。
LLaMoは、命令チューニングのためのネイティブフォームで動作を保持します。
ビデオデータとモーションデータをテキスト入力と共に処理することで、LLaMoは柔軟な人間中心の分析を可能にする。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:20:11 GMT)
Point-Cache: Test-time Dynamic and Hierarchical Cache for Robust and Generalizable Point Cloud Analysis [36.9] 本稿では,ポイントクラウド認識モデルを用いて,テスト時の分散シフトを処理できる汎用的なソリューションを提案する。
オンラインテストデータのみに基づいてモデルを適応し、テスト時にこれまで見られたクラスと、新しくないクラスの両方を認識する。
Point-Cacheは8つの挑戦的なベンチマークと4つの代表的な大規模3Dモデルで大幅に向上し、その有効性を強調している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:08:20 GMT)
Model-Based Offline Reinforcement Learning with Adversarial Data Augmentation [36.9] 本稿では,AdversariaLデータ拡張を用いたモデルベースオフライン強化学習について紹介する。
MoRALでは,エンサンブルモデルと交互サンプリングを行うために,エンサンブルデータ拡張を用いて固定水平線ロールアウトを置き換える。
D4RLベンチマークの実験では、MORALはポリシー学習やサンプル効率の観点から、他のモデルベースのオフラインRLメソッドよりも優れていた。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:24:34 GMT)
Fine-Grained Domain Generalization with Feature Structuralization [36.5] 細粒度領域一般化(FGDG)は、クラス間差が小さく、クラス内差が比較的大きいため、従来のDGタスクよりも難しい課題である。
本稿では,特徴的構造的領域一般化モデルを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:15:23 GMT)
Traversing Distortion-Perception Tradeoff using a Single Score-Based Generative Model [35.9] 歪み知覚トレードオフは、歪みメトリクスと知覚品質の根本的な矛盾を明らかにします。
本稿では,1つのスコアネットワークがDPトレードオフを効果的かつ柔軟に越えられることを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:37:53 GMT)
GatedxLSTM: A Multimodal Affective Computing Approach for Emotion Recognition in Conversations [35.6] GatedxLSTMは、会話におけるマルチモーダル感情認識(ERC)モデルである。
話者と会話相手の双方の声と書き起こしを考慮し、感情的なシフトを駆動する最も影響力のある文章を特定する。
4クラスの感情分類において,オープンソース手法間でのSOTA(State-of-the-art)性能を実現する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:46:18 GMT)
Leveraging LLMs, IDEs, and Semantic Embeddings for Automated Move Method Refactoring [34.9] 大きな言語モデルには専門家による提案があるが、信頼できない:最大80%の提案は幻覚である。
我々は,MOVEMETHODの推奨から実行まで,エンドツーエンドライフサイクル全体を自動化した最初のLLM完全パワーアシスタントを紹介する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:05:20 GMT)
EuroBERT: Scaling Multilingual Encoders for European Languages [34.9] 汎用多言語ベクトル表現は、伝統的に双方向エンコーダモデルから得られる。
ヨーロッパおよび広く話されているグローバル言語をカバーする多言語エンコーダのファミリーであるEuroBERTを紹介する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:43:59 GMT)
ARFlow: Human Action-Reaction Flow Matching with Physical Guidance [34.3] Action-Reaction Flow Matchingは、直接アクションから反応へのマッピングを確立する新しいフレームワークである。
提案手法では,速度場ではなく人体の動きを直接出力するx1-prediction法と,サンプリング中の身体の侵入を効果的に防止するトレーニング不要で勾配に基づく物理的誘導機構を導入する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:43:09 GMT)
Fast mixed-species quantum logic gates for trapped-ion quantum networks [34.3] 本稿では, トラップイオン量子コンピュータにおける高速混在動作に対するアプローチを提案する。
我々は、MHz高速ゲートを実現するパルス列の理論と機械設計を開発する。
本稿では,トラップイオンプロセッサの光ネットワークにおける高速スピンデフォーカスに対する物質-光子界面の保護について述べる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:08:10 GMT)
Joint Learning for Scattered Point Cloud Understanding with Hierarchical Self-Distillation [34.3] そこで本研究では,部分点雲を高速に補正し,同定するエンド・ツー・エンドアーキテクチャを提案する。
階層型自己蒸留(HSD)は任意の階層ベースのポイントクラウドメソッドに適用できる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 01:39:19 GMT)
Agentic AI Software Engineer: Programming with Trust [33.9] 大きな言語モデル(LLM)は、コードスニペットを生成するのに驚くほどの習熟度を示している。
AIソフトウェアエンジニアのデプロイに成功するためには、人間主導のソフトウェアエンジニアリングプラクティスによって確立された信頼と同等以上の信頼レベルが必要である、と私たちは主張する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:08:40 GMT)
Chain-of-Thought Prompting for Speech Translation [33.8] 大規模言語モデル(LLM)は言語理解と生成において顕著な進歩を見せている。
近年の研究では、これらのモデルを音声埋め込みに応用し、高い性能を示す音声-LLMモデルを実現している。
本稿では,エンコーダ-デコーダテキスト LLM 上に構築された音声-LLM において,AST のプロンプトとして ASR 転写を利用する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:20:59 GMT)
A Theoretical Framework for Prompt Engineering: Approximating Smooth Functions with Transformer Prompts [33.3] 本稿では, トランスフォーマーモデルに, 慎重に設計したプロンプトを付与することで, 計算システムとして機能できることを実証する公式なフレームワークを提案する。
我々は、$beta$-timesの微分可能関数に対する近似理論を確立し、適切に構造化されたプロンプトで導かれるとき、変換器が任意の精度でそのような関数を近似できることを証明した。
我々の発見は、自律的な推論と問題解決の可能性を強調し、エンジニアリングとAIエージェント設計のより堅牢で理論的に根ざした進歩の道を開いた。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:58:02 GMT)
L4: Diagnosing Large-scale LLM Training Failures via Automated Log Analysis [33.2] 我々は,2023年5月から2024年4月までに,当社のPlatform-Xにおける428大言語モデルトレーニング失敗の報告に関する実証的研究を行った。
本研究は,ハードウェアおよびユーザ障害が根本原因であり,現在の診断プロセスがログのトレーニングに大きく依存していることを明らかにする。
我々は、ログベースの大規模LCMトレーニング失敗診断フレームワークL4を導入し、トレーニングログから障害指示情報を自動抽出する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:09:55 GMT)
Learning from spatially inhomogenous data: resolution-adaptive convolutions for multiple sclerosis lesion segmentation [32.9] MRIでは、ベンダー、病院、シークエンスの違いにより、非常に均一な画像データが得られる。
臨床応用には、様々なボクセル解像度でデータを扱うようにアルゴリズムを訓練する必要がある。
本研究では,空間的に不均一なデータから直接,再サンプリングせずに学習できるネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:07:52 GMT)
TechCoach: Towards Technical-Point-Aware Descriptive Action Coaching [32.9] 記述的行動コーチング(DescCoach)と呼ばれる新しいタスクの検討
モデルには、何がうまくいっているか、そして、アクション実行のための単純な品質スコアを超えて何が改善できるかについて、詳細なコメントを提供する必要があります。
DescCoachプロセスにTechPointレベルの推論を明示的に組み込む新しいフレームワークであるTechCoachを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:09:32 GMT)
Loss tangent fluctuations due to two-level systems in superconducting microwave resonators [32.6] 超伝導マイクロ波共振器は量子コンピューティングとセンシング技術にとって重要である。
12時間から16時間の低消費電力におけるQ_i$の時間変動について検討した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 01:28:50 GMT)
What to Retrieve for Effective Retrieval-Augmented Code Generation? An Empirical Study and Beyond [32.5] リポジトリレベルのコード生成は、複雑なコード依存と長いコンテキストの処理における大きな言語モデル(LLM)の制限のため、依然として困難である。
ユーザクエリを実装ステップに分解し,セマンティックな記述マッチングを通じてAPIを検索する,チェーン・オブ・シントを利用した新しいコンテキスト統合手法であるAllianceCoderを提案する。
CoderEvalとRepoExecに関する広範な実験を通じて、AllianceCoderは最先端のパフォーマンスを実現し、Pass@1を既存のアプローチよりも最大20%改善した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:41:38 GMT)
GLRD: Global-Local Collaborative Reason and Debate with PSL for 3D Open-Vocabulary Detection [32.4] 3Dオープンボキャブラリ検出では,既製のトレーニングラベルを使わずに,点雲から新しい物体を検出することを学ぶ必要がある。
従来の手法はオブジェクトレベルの表現の学習に重点を置いており、シーンレベルの情報を無視する。
ローカルオブジェクトレベル情報とグローバルシーンレベル情報の両方を考慮し、3次元OVDタスクのためのPSLフレームワークを用いたグローバルローカル協調推論と議論を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:18:25 GMT)
Neural Light Spheres for Implicit Image Stitching and View Synthesis [32.4] 暗黙的パノラマ画像縫合と再レンダリングのための球状神経電場モデル
従来の画像縫合法や放射場法に比べて再現性は向上した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 22:00:16 GMT)
Open Deep Search: Democratizing Search with Open-source Reasoning Agents [32.3] プロプライエタリな検索AIソリューションとオープンソースソリューションとのギャップを埋めるために、Open Deep Search(ODS)を導入します。
ODSは、ユーザが選択したベースLLMで動作する2つのコンポーネントで構成されている。
Open Search Toolは、プロプライエタリなツールよりも優れた、新しいWeb検索ツールだ。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:51:32 GMT)
Data-driven Seasonal Climate Predictions via Variational Inference and Transformers [32.0] 我々は季節予測のための気候モデル出力の生成モデルを訓練する。
気候変動に伴う傾向を超えた年次異常予測における手法の性能分析を行った。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:51:23 GMT)
Making AI Less "Thirsty": Uncovering and Addressing the Secret Water Footprint of AI Models [32.0] 世界のAI需要は2027年に4.2-6.6億立方メートルの水が流出すると予想されている。
これはデンマークの年間降水量4-6以上、イギリスの半分以上である。
グローバルな水の課題に対処するためには、AIは社会的責任を負い、例によってリードする必要がある。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:06:26 GMT)
Any2AnyTryon: Leveraging Adaptive Position Embeddings for Versatile Virtual Clothing Tasks [31.5] 画像ベースの仮想試行(VTON)は、入力された衣服を対象者の画像に転送することで仮想試行結果を生成することを目的としている。
組合わせ型衣料品データの不足は,VTONの高一般化と品質を実現する既存手法を困難にしている。
そこで,AnyTryonを提案する。AnyTryonは,異なるテキスト命令とモデル衣料品画像に基づいて試着結果を生成することができる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:08:33 GMT)
PhysGen3D: Crafting a Miniature Interactive World from a Single Image [31.4] PhysGen3Dは、単一の画像をアモーダルでカメラ中心のインタラクティブな3Dシーンに変換する新しいフレームワークだ。
中心となるPhysGen3Dは、物体の3D形状、ポーズ、物理的および照明特性を推定する。
我々はPhysGen3Dの性能を、Pika、Kling、Gen-3など、クローズド・ソース・オブ・ザ・アート(SOTA)画像・ビデオモデルと比較した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:31:04 GMT)
Playing the Fool: Jailbreaking LLMs and Multimodal LLMs with Out-of-Distribution Strategy [31.0] 安全アライメントを超越した入力のOOD化による新しいジェイルブレイクフレームワークJOODを提案する。
多様なジェイルブレイクシナリオに対する実験では、JOODが最近のプロプライエタリなLDMとMLLMを効果的にジェイルブレイクすることを示した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 01:25:24 GMT)
Nonparametric MLE for Gaussian Location Mixtures: Certified Computation and Generic Behavior [28.7] 一次元のガウス的位置混合に対する非パラメトリック最大度推定器$widehatpi$について検討する。
We provide a algorithm that for small enough $varepsilon>0$ computes a $varepsilon$-approximation of $widehatpi in Wasserstein distance。
また、$k$-atomicと条件付けられた$widehatpi$の分布は、関連する2k-1$次元パラメータ空間上の密度を許容することを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:36:36 GMT)
FB-4D: Spatial-Temporal Coherent Dynamic 3D Content Generation with Feature Banks [28.5] FB-4D は,生成フレームにおける空間的・時間的整合性を高めるために,Feature Bank 機構を統合した新しい 4D 生成フレームワークである。
FB-4Dは、レンダリング品質、空間的時間的整合性、ロバスト性において、既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:59:31 GMT)
TC-GS: Tri-plane based compression for 3D Gaussian Splatting [28.5] 3D Gaussian Splatting (3DGS)は、新しいビュー合成のための顕著なフレームワークとして登場し、高い忠実度と高速なレンダリング速度を提供する。
本稿では, ガウス属性を符号化し, 圧縮に属性の分布を活かしたよく構造化された三面体を提案する。
我々のアプローチは、複数のデータセットにわたる広範な実験において、SOTA 3D Gaussian Splatting圧縮作業と同等かそれ以上の結果を得た。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:26:22 GMT)
DEIM: DETR with Improved Matching for Fast Convergence [28.2] 我々は,Transformer-based architectures (DETR) を用いたリアルタイムオブジェクト検出における収束の促進を目的としたトレーニングフレームワークDEIMを紹介する。
DETRモデルにおける1対1(O2O)マッチングに固有のスパース監督を緩和するため、DEIMはDense O2Oマッチング戦略を採用している。
Dense O2Oマッチングはコンバージェンスを高速化する一方、パフォーマンスに影響を与える可能性のある低品質のマッチも多数導入されている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:41:29 GMT)
Learning Adaptive Dexterous Grasping from Single Demonstrations [27.8] この作業は、2つの重要な課題に対処する。人間による限られたデモンストレーションから、効率的なスキル獲得と、コンテキスト駆動のスキル選択だ。
AdaDexGraspは、スキルごとに1人の人間のデモからスキルを把握できるライブラリを学び、視覚言語モデル(VLM)を使用して最も適切なものを選択する。
我々はAdaDexGraspをシミュレーションと実世界の両方の環境で評価し、RLの効率を大幅に改善し、さまざまなオブジェクト構成をまたいだ人間的な把握戦略の学習を可能にした。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:05:50 GMT)
MCTS-RAG: Enhancing Retrieval-Augmented Generation with Monte Carlo Tree Search [27.4] 本稿では,知識集約型タスクにおける小言語モデルの推論能力を高める新しいアプローチであるMCTS-RAGを紹介する。
通常、推論から独立して情報を取得する標準的なRAG法とは異なり、MCTS-RAGは構造化推論と適応的検索を組み合わせる。
この統合されたアプローチは意思決定を強化し、幻覚を減らし、事実の正確性と応答の整合性を向上させる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:46:08 GMT)
BEAR: A Video Dataset For Fine-grained Behaviors Recognition Oriented with Action and Environment Factors [27.4] 我々は、BEARという、細粒度(類似した)の振る舞いを提供する、新しいビデオきめ細粒度行動データセットを開発した。
これには、類似した環境を持つきめ細かい行動と、類似した行動を伴うきめ細かい行動を含む2つのきめ細かい行動プロトコルが含まれる。
本研究は,行動認識の環境および行動に基づく側面を研究する上で重要な要素である入力モダリティの影響を主に検討する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:06:20 GMT)
IAP: Improving Continual Learning of Vision-Language Models via Instance-Aware Prompting [26.9] 我々は,MCIL(Multi-Domain Class-Incremental Learning)における多様なタスクの迅速な設計を最適化する課題に取り組む。
我々の Instance-Aware Gated Prompting (IA-GP) モジュールは、忘れを軽減しつつ、新しいタスクへの適応を強化する。
事例対応型クラス分散型プロンプト(IA-CDDP)は,各事例に対して正確なタスクラベル関連信頼スコアを決定することにより,タスク適応プロセスを改善する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:59:23 GMT)
Attention IoU: Examining Biases in CelebA using Attention Maps [26.6] 本稿では,モデルの内部表現におけるバイアスを明らかにするために,アテンションIoUメトリックとその関連スコアを紹介する。
我々はCelebAデータセットを分析し、Attention-IoUが精度の相違を超えて相関を明らかにすることを発見した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:43:45 GMT)
Beyond Believability: Accurate Human Behavior Simulation with Fine-Tuned LLMs [26.5] 近年の研究では、LSMは人間の行動をシミュレートして、プロンプトのみの手法でLSMエージェントに電力を供給できることが示されている。
我々は Web アクション生成タスクにおいて,主観的信頼性よりも LLM の客観的精度を評価することに注力する。
本稿では,Web アクション生成タスクにおける最先端 LLM の総合的定量的評価について述べる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:33:27 GMT)
FastFT: Accelerating Reinforced Feature Transformation via Advanced Exploration Strategies [26.5] 先進的な戦略の3つを活用する革新的なフレームワークであるFastFTを紹介します。
生成した変換シーケンスの新規性を評価する手法を開発した。
また、新規性とパフォーマンスを組み合わせて、優先順位付けされたメモリバッファを作成します。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:17:41 GMT)
RoboSpatial: Teaching Spatial Understanding to 2D and 3D Vision-Language Models for Robotics [26.4] ロボット工学における空間理解のための大規模データセットであるRoboSpatialを紹介する。
実際の屋内とテーブルトップのシーンで構成され、3Dスキャンとエゴセントリックなイメージとして撮影され、ロボット工学に関連する豊富な空間情報が注釈付けされている。
実験により, 空間空き時間予測, 空間的関係予測, ロボット操作など, 下流作業におけるRoboSpatialで訓練したモデルは, ベースラインよりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:30:26 GMT)
Patients Speak, AI Listens: LLM-based Analysis of Online Reviews Uncovers Key Drivers for Urgent Care Satisfaction [26.4] この研究は、DMVとフロリダのエリアでGoogle Mapsのレビューを収集する。
まず、人口密度、中央値所得、GINI指数、家賃対所得率、貧困率以下の世帯、保険率なし、失業率など、様々な側面の地理空間パターンを分析した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:45:01 GMT)
SARGes: Semantically Aligned Reliable Gesture Generation via Intent Chain [25.9] SARGesは,大規模言語モデルを利用して意味論的に意味のあるジェスチャーを生成する新しいフレームワークである。
SARGesは、効率的なシングルパス推論により、高度にセマンティックに整合したジェスチャーラベリングを実現する。
提案手法は意味的ジェスチャー合成のための解釈可能な意図推論経路を提供する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:55:41 GMT)
Enhancing the Robustness of LLM-Generated Code: Empirical Study and Framework [25.8] RobGenは、モデルの再トレーニングを必要とせずに、コードの堅牢性を高めるように設計されたフレームワークである。
RobGenは、ロバストなモデル生成コードの比率を20.0%削減する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:44:03 GMT)
StableToolBench-MirrorAPI: Modeling Tool Environments as Mirrors of 7,000+ Real-World APIs [25.6] MirrorAPIは、実際のAPIレスポンスを正確にシミュレートするために、特殊なLLMをトレーニングするフレームワークである。
我々は,シミュレーションの忠実度を高めるために,教師付き微調整と連鎖推論を用いる。
MirrorAPIは最先端の手法に比べて精度と安定性が優れている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:13:03 GMT)
MoLe-VLA: Dynamic Layer-skipping Vision Language Action Model via Mixture-of-Layers for Efficient Robot Manipulation [25.6] MLLM(Multimodal Large Language Models)は、複雑な言語と視覚的データの理解に優れる。
彼らの実世界の展開は、相当な計算とストレージの需要によって妨げられている。
動的LDM層活性化のためのMixture-of-Layers Vision-Language-Action Model (MoLe) アーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:05:38 GMT)
ViLBench: A Suite for Vision-Language Process Reward Modeling [25.6] 本稿では,現在の視覚大言語モデル(VLLM)を2種類の報酬モデルとしてベンチマークする。
我々は、集中的なプロセス報酬信号を必要とするように設計された視覚言語ベンチマークViLBenchを紹介する。
本稿では,一般VLLMと報奨モデルとのギャップを埋めるための有望な経路を予め紹介する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:38:31 GMT)
Towards Efficient and General-Purpose Few-Shot Misclassification Detection for Vision-Language Models [25.5] 現代のニューラルネットワークは、誤って分類された予測に対して過度に自信を示し、エラーを検出するための信頼度推定の必要性を強調している。
我々は、テキスト情報を利用した視覚言語モデル(VLM)を利用して、効率的で汎用的な誤分類検出フレームワークを確立する。
VLMのパワーを活用することで、MisDのためのFew-Shotプロンプト学習フレームワークであるFSMisDを構築し、スクラッチからトレーニングを控え、チューニング効率を向上させる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:31:04 GMT)
Synthetic Video Enhances Physical Fidelity in Video Synthesis [25.4] コンピュータグラフィックスパイプラインから合成したビデオを利用して,映像生成モデルの物理忠実度を高める方法について検討する。
本稿では,合成データをキュレートして統合する手法を提案し,その物理リアリズムをモデルに転送する手法を提案する。
我々の研究は、合成ビデオがビデオ合成における物理的忠実性を高める最初の実証的なデモンストレーションの1つを提供する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 00:45:07 GMT)
Learning state and proposal dynamics in state-space models using differentiable particle filters and neural networks [25.1] 本稿では,ニューラルネットワークを用いて粒子フィルタの提案分布と遷移分布を学習する新しい手法であるStateMixNNを提案する。
本手法は,ログライクリフをターゲットとしてトレーニングされており,観測シリーズのみを必要とする。
提案手法は, 最先端技術と比較して隠れ状態の回復を著しく改善し, 非線形シナリオの改善を図っている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 22:36:18 GMT)
Generating Multimodal Driving Scenes via Next-Scene Prediction [24.8] 自律運転(AD)における生成モデルは、多様なシーン生成を可能にするが、既存の方法は、限られた範囲のモダリティをキャプチャすることで不足する。
本稿では,4つの主要なデータモダリティを組み込んだマルチモーダル生成フレームワークを提案する。
我々のフレームワークは、拡張シーケンス上で複雑で現実的な運転シーンを効果的に生成し、マルチモーダル整合性を確保し、シーン要素のきめ細かい制御を提供する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:45:56 GMT)
A Survey of Secure Semantic Communications [24.5] セマンティックコミュニケーション(Semantic Communication, SemCom)は、6Gにおいて有望で革命的な技術であると考えられている。
セキュリティとプライバシの懸念は、SemComシステムの機密性、完全性、可用性に対する脅威を引き起こしている。
本稿では,SemComの安全性確保に利用可能な技術について,包括的調査を行う。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:35:20 GMT)
TransPlace: Transferable Circuit Global Placement via Graph Neural Network [24.4] 本研究では,混合サイズの細胞の複雑さを連続空間に配置することを学ぶグローバルな配置フレームワークであるTransPlaceを提案する。
最先端の配置法と比較すると、TransPlaceは1.2倍のスピードアップを持ついくつかの高品質な配置回路で訓練されている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:19:11 GMT)
PG-SAM: Prior-Guided SAM with Medical for Multi-organ Segmentation [24.0] Segment Anything Model (SAM)は強力なゼロショット機能を示す。
SAMの精度とロバスト性は、医用画像分割に適用すると著しく低下する。
我々は, 微粒なモーダリティ事前整合器を用いたプリエントガイドSAM (PG-SAM) を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:38:40 GMT)
A Spatial-temporal Deep Probabilistic Diffusion Model for Reliable Hail Nowcasting with Radar Echo Extrapolation [23.5] 本稿では,レーダエコー外挿によるハイル流し込みのための時空間gEnerAtive Model(SteamCast)を提案する。
SteamCastは、9つの異なる垂直方向のレーダー反射率変数に対して6分間隔で30分間の流星を、中国のヤンヤン市で約1km×1kmの解像度で緯度-経度格子上に供給している。
レーダエコーの時空間的特徴をうまく融合させることで、SteamCastは競争力を提供し、場合によってはPredRNNやVMRNNのような他のディープラーニングベースモデルよりも優れた結果をもたらす。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:14:19 GMT)
Unlocking the Hidden Potential of CLIP in Generalizable Deepfake Detection [23.5] 本稿では,顔の深部を部分的に操作して検出する課題に対処する。
我々は、Contrastive Language-Image Pre-Training(CLIP)モデル、特にViT-L/14ビジュアルエンコーダを利用する。
提案手法は,LNチューニングなどのPEFT技術を用いて,モデルのパラメータの小さな部分集合を調整する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:21:23 GMT)
Injecting Adrenaline into LLM Serving: Boosting Resource Utilization and Throughput via Attention Disaggregation [23.1] 大規模言語モデル(LLM)サービスシステムでは、各要求の実行は、計算集約型プリフィルフェーズとメモリ集約型デコードフェーズの2つのフェーズで構成される。
本稿では,資源利用と性能の向上を目的としたアダプティブ・デアグリゲーション・オフロード機構であるアドレナリンを提案する。
実験の結果,アドレナリンのメモリ容量は2.28倍,メモリ帯域幅は2.07倍に向上した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:48:35 GMT)
BASKET: A Large-Scale Video Dataset for Fine-Grained Skill Estimation [23.1] BASKETには、世界中の32,232人のバスケットボール選手を撮影する4,477時間のビデオがある。
私たちのデータセットには、性別、年齢、スキルレベル、地理的位置といった、前例のない多様性を持つ、膨大な数の熟練した参加者が含まれています。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:59:02 GMT)
Synthetic-to-Real Self-supervised Robust Depth Estimation via Learning with Motion and Structure Priors [22.8] 本稿では,実世界の知識を効果的に捉えるために,動きと構造を前もって組み込んだ,最初の合成から実までの頑健な深度推定フレームワークを提案する。
AbsRel と RMSE の nuScenes と Robotcar のデータセット(昼間,夜間,雨)における平均 7.5% と 4.3% の改善を実現している。
ドライビングステーオ (光, 霧) のゼロショット評価では, 本手法は従来の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:12:54 GMT)
RALLRec+: Retrieval Augmented Large Language Model Recommendation with Reasoning [22.5] 本稿では,Representation Learning and textbfReasoning empowered search-textbfAugmented textbfLarge textbfLanguage model textbfRecommendation (RALLRec+)を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:03:34 GMT)
Uncertainty Weighted Gradients for Model Calibration [22.4] ディープネットワークは、しばしば過信または過信の予測を生成し、誤校正につながる。
そこで我々は, モデルキャリブレーションにおけるそれらの優位性を損失重み付け因子に主に寄与する, 焦点損失とその変種に対する統一的損失フレームワークを提案する。
本手法は,SOTA(State-of-the-art)性能を実現する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:16:05 GMT)
ITA-MDT: Image-Timestep-Adaptive Masked Diffusion Transformer Framework for Image-Based Virtual Try-On [21.9] 本稿では、画像ベース仮想トライオン(IVTON)のための画像時間行列拡散変換フレームワークであるITA-MDTを紹介する。
IVTONタスクは、ある画像から別の人物に衣服をシームレスに重ね合わせ、指定された衣服を身に着けている人の現実的な描写を作成する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:49:44 GMT)
A Blockchain-based Quantum Binary Voting for Decentralized IoT Towards Industry 5.0 [21.8] 我々はIoT量子ブロックチェーンフレームワークのための量子バイナリ投票アルゴリズムを開発した。
投票プロトコルの正確性について詳述する。
また、IBM Quantumプラットフォーム上でシミュレーションされた量子回路を用いた投票アルゴリズムの実装も提供する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:28:18 GMT)
Unleashing Vecset Diffusion Model for Fast Shape Generation [21.8] FlashVDMはVecset Diffusion Model (VDM)におけるVAEとDiTの両方を高速化するためのフレームワークである
DiTでは、FlashVDMは5つの推論ステップと同等の品質でフレキシブルな拡散サンプリングを可能にする。
VAEでは,適応型KV選択,階層型ボリュームデコーディング,効率的なネットワーク設計を備えた稲妻ベクセットデコーダを導入する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:08:12 GMT)
Learnable Sequence Augmenter for Triplet Contrastive Learning in Sequential Recommendation [21.7] シーケンシャルレコメンデーション(LACLRec)における三重項コントラスト学習のための学習可能なシーケンスオーグメンタ
シーケンシャルレコメンデーション(LACLRec)におけるトリプルトコントラスト学習のための学習可能なシーケンスオーグメンタを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:56:29 GMT)
Guiding Human-Object Interactions with Rich Geometry and Relations [21.5] 既存の手法では、物体の遠心点や人間に最も近い点のような単純化された物体表現に頼り、物理的に可算な運動を達成する。
ROGは、HOIに固有の関係をリッチな幾何学的詳細で表現する新しいフレームワークである。
ROGは, 合成HOIのリアリズム評価と意味的精度において, 最先端の手法を著しく上回ることを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:57:18 GMT)
Progressive Focused Transformer for Single Image Super-Resolution [21.3] 本稿では、PFA(Progressive Focused Attention)を通してネットワーク内のすべての孤立した注意マップをリンクして、最も重要なトークンに注意を向ける、新規で効果的なProgressive Focused Transformer(PFT)を提案する。
PFAは、ネットワークがより重要な類似した特徴をキャプチャできるだけでなく、類似性を計算する前に無関係な特徴をフィルタリングすることで、ネットワーク全体の計算コストを大幅に削減する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:02:37 GMT)
BizGen: Advancing Article-level Visual Text Rendering for Infographics Generation [21.2] 本稿では,ユーザが提供する記事レベル記述プロンプトと超高密度レイアウトに基づいて,インフォグラフィックやスライドを含む高品質なビジネスコンテンツを生成する新しいタスクを提案する。
基本的な課題は、コンテキストの長さと高品質なビジネスコンテンツデータの不足である。
i)超高密度レイアウトを備えたスケーラブルで高品質なビジネスコンテンツデータセット、すなわちInfographics-650Kの構築、レイヤワイド検索強化インフォグラフィック生成方式の導入によるプロンプト、(ii)レイアウト誘導型クロスアテンション方式の2つの重要な技術貢献を行う。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:04:57 GMT)
Rethinking Vision-Language Model in Face Forensics: Multi-Modal Interpretable Forged Face Detector [21.2] ディープフェイク検出(Deepfake detection)は、悪意のある誤報の拡散を緩和するための、長年にわたって確立されてきた研究テーマである。
同時に両方を生成できる新しい方法を提案する。
提案手法は,事前学習したCLIPのマルチモーダル学習能力と,大規模言語モデルの前例のない解釈可能性を利用する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:28:46 GMT)
UniEDU: A Unified Language and Vision Assistant for Education Applications [21.1] UniEDUは、様々な教育応用のために設計された統一言語および視覚アシスタントである。
それは、強力な一般化能力を維持しながら、複数の教育タスクにまたがる。
UniEDUは、計算オーバーヘッドを大幅に削減することで、産業規模のデプロイメントに最適化されている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:33:04 GMT)
Towards Efficient Training of Graph Neural Networks: A Multiscale Approach [20.7] グラフニューラルネットワーク(GNN)は、グラフ構造化データから学習し、推論するための強力なツールとして登場した。
本稿では,グラフのマルチスケール表現にまたがる情報の統合を目的とした,GNNの効率的なマルチスケール学習のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:39:33 GMT)
Improving User Behavior Prediction: Leveraging Annotator Metadata in Supervised Machine Learning Models [20.7] 監視された機械学習モデルは、会話テキストからユーザーの振る舞いを予測するのに不適当であることが多い。
疲労やスピードといったアノテータのメタ機能を統合したメタデータ重み付け型アンサンブルモデル(MSWEEM)を導入する。
MSWEEMは標準アンサンブルを、ホールドアウトデータでは14%、代替データセットでは12%で上回っている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:30:48 GMT)
RSRWKV: A Linear-Complexity 2D Attention Mechanism for Efficient Remote Sensing Vision Task [20.2] 高分解能リモートセンシング分析は、シーンの複雑さとスケールの多様性による課題に直面している。
逐次処理と2次元空間推論を橋渡しする新しい2D-WKVスキャン機構を特徴とするSRWKVを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:03:46 GMT)
Unlocking the Value of Decentralized Data: A Federated Dual Learning Approach for Model Aggregation [20.0] フェデレートラーニング(FL)は、AIモデルを分散データでトレーニング可能にすることで、有望な代替手段を提供する。
既存のFLアプローチは、異種データ分散や通信遅延といった課題により、集中トレーニングのパフォーマンスに匹敵する。
クライアントからのモデル更新のマージをガイドするために,サーバにおける集中型データを活用するデュアルラーニング手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 01:00:35 GMT)
Oasis: One Image is All You Need for Multimodal Instruction Data Synthesis [19.8] 画像のみを用いて高品質なマルチモーダルデータを合成するための新しい手法Oasisを提案する。
Oasisは、MLLMにイメージのみをプロンプトすることで、従来のメソッドを分解する。
本手法はデータ品質を確保するための微妙な品質制御手法を特徴とする。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:01:55 GMT)
Learning Straight Flows by Learning Curved Interpolants [19.4] フローマッチングモデルは通常、フォワード/ノイズ加算プロセスを定義するために線形補間を用いる。
これにより、雑音と対象分布の独立結合とともに、しばしば非直線となるベクトル場が得られる。
直進ベクトル場を学習し、より高速な生成を実現するために、フレキシブルな(潜在的に湾曲した)補間子を学習することを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:54:56 GMT)
Are We There Yet? Unraveling the State-of-the-Art Graph Network Intrusion Detection Systems [19.4] グラフベースのNIDS (GIDS) は、データ通信のグラフ構造における複雑な関係を効果的に捉えることができるため、注目されている。
彼らの約束にもかかわらず、これらのGIDSの複製性はほとんど解明されていない。
本研究は,最先端GIDSを評価するための体系的アプローチを設計することによって,このギャップを埋めるものである。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:11:57 GMT)
Reason-RFT: Reinforcement Fine-Tuning for Visual Reasoning [19.3] 視覚的推論能力は、複雑なマルチモーダルデータを理解する上で重要な役割を果たす。
既存の手法は、チェーン・オブ・ソートによる微調整によるVLM推論を改善する。
我々は新しい強化微調整フレームワークReason-RFTを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:38:06 GMT)
Feature Statistics with Uncertainty Help Adversarial Robustness [19.0] 敵対的攻撃はディープニューラルネットワーク(DNN)の信頼性に重大な課題をもたらす
不確実性のある特徴統計(FSU)と呼ばれる頑健性向上モジュールを提案する。
チャネルワイドの特徴手段と多変量ガウス分布からの例の標準偏差を再サンプリングし、攻撃された例を再構築し、シフトした分布を校正するのに役立つ。
提案したFSUモジュールは、トレーニング、アタック、予測、微調整に普遍的な適用性を持ち、より簡単な追加時間コストで顕著な堅牢性向上能力を示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:30:33 GMT)
Lemur: Log Parsing with Entropy Sampling and Chain-of-Thought Merging [18.8] 我々は、textbfEntropy サンプリングとチェーン・オブ・シンクトの textbfMerging (model) を用いた最先端の textbfLog 解析フレームワークを導入する。
退屈な手作業のルールを捨てるために,情報エントロピーにインスパイアされた新しいサンプリング手法を提案し,典型的なログを効率的にクラスタリングする。
大規模な公開データセットの実験を行った。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:55:05 GMT)
DeSplat: Decomposed Gaussian Splatting for Distractor-Free Rendering [18.7] DeSplatは、ガウスプリミティブのボリュームレンダリングに基づいて、気晴らしと静的なシーン要素を純粋に分離する新しい方法である。
本稿では,3つのベンチマークデータセットに対してDeSplatの有効性を示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:13:24 GMT)
Both Direct and Indirect Evidence Contribute to Dative Alternation Preferences in Language Models [18.6] 我々は、長さとアニマシー(animacy)という、交互に選択する性質に焦点を当てている。
長さとアニマシーの直接的な証拠は重要であるが、そのような証拠がなくても、簡単優先の選好は継続する。
LMの創発的な構文的嗜好は、直接的および間接的ソースの混合に由来すると結論付けている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:32:41 GMT)
Optimizing Case-Based Reasoning System for Functional Test Script Generation with Large Language Models [18.2] テスト意図記述とそれに対応するテストスクリプトのケースバンクを保守し活用するケースベース推論(CBR)システムを提案する。
ユーザエクスペリエンスをさらに向上するために,再ランクベースの検索微調整と再利用微調整を併用したCBRシステムの最適化手法であるRe4を導入する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:23:59 GMT)
ManiCM: Real-time 3D Diffusion Policy via Consistency Model for Robotic Manipulation [18.2] 拡散モデルは自然画像から運動軌道への複雑な分布を生成するのに有効であることが確認されている。
近年の手法では3次元ロボット操作作業において顕著な性能を示すが、複数のデノナイジングステップにより実行時の非効率が悪化している。
拡散過程に一貫性の制約を課すリアルタイムロボット操作モデルManiCMを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:00:08 GMT)
TraNCE: Transformative Non-linear Concept Explainer for CNNs [18.2] 畳み込みニューラルネットワーク(CNN)は様々なコンピュータビジョンタスクで著しく成功している。
CNNは本質的には説明できないが、概念に基づいた説明可能性手法は、モデルが見たものに対する洞察を提供する。
本研究は,CNN説明可能性文学への3つのオリジナルの貢献について述べる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:49:46 GMT)
Competitive Multi-armed Bandit Games for Resource Sharing [18.0] 現代の資源共有システムでは、複数のエージェントが未知の状態の限られたリソースにアクセスしてタスクを実行する。
本稿では,N-player K-arm competitive MAB gameについて検討し,N-myopic player(エージェント)が互いに競い合い,未知の腕の多様な個人推定を行う。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:35:18 GMT)
TD-BFR: Truncated Diffusion Model for Efficient Blind Face Restoration [17.8] 効率的なブラインドフェース修復(TD-BFR)のための新しいトレンシド拡散モデルを提案する。
TD-BFRは、低解像度(LQ)の画像から始まり、サンプリング速度を向上させる革新的な切り抜きサンプリング手法を採用している。
提案手法は,TD-BFRが現状の拡散型BFR法より平均4.75$times$で高速であることを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:35:43 GMT)
TransDiffSBDD: Causality-Aware Multi-Modal Structure-Based Drug Design [17.8] 自己回帰変換器と拡散モデルを組み合わせた構造ベースドラッグデザインのための統合フレームワークであるTransDiffSBDDを提案する。
具体的には、自己回帰変換器は離散的な分子情報をモデル化し、拡散モデルは連続分布をサンプリングし、第一の課題を効果的に解決する。
第2の課題に対処するために、モーダル間の因果関係を明示的に尊重するタンパク質-リガンド複合体のハイブリッドモーダルシーケンスを設計する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:35:34 GMT)
Ensemble Debiasing Across Class and Sample Levels for Fairer Prompting Accuracy [17.6] 言語モデルは、強力な数発の学習者であり、テキスト分類タスクにおいて、全体的な精度が良好である。
我々は、全体的な精度の追求は、強い階級を豊かにするだけでなく、弱い階級を育てることによってもたらされると信じている。
本論文では,文脈内学習クラス確率のフレキシブルな修正を可能にするHeaviside Step関数に基づくアンサンブルデバイアス法を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:19:08 GMT)
Socratic Planner: Self-QA-Based Zero-Shot Planning for Embodied Instruction Following [17.6] EIF(Embodied Instruction following)は、対話型環境でオブジェクトをナビゲートし、対話することによって自然言語命令を実行するタスクである。
EIFにおける重要な課題は、典型的には教師付き学習やラベル付きデータによる少数ショットのインコンテキスト学習を通じて対処される構成的タスク計画である。
本稿では,自己QAに基づくゼロショット計画手法であるソクラティック・プランナーを紹介する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:42:56 GMT)
Video Motion Graphs [17.6] 我々は、リアルな人間のモーションビデオを生成するように設計されたMotion Graphsを紹介する。
システムは、まず、条件に合ったジェスチャーでビデオクリップを検索し、次にフレームを生成して、クリップ境界をシームレスに接続することによって、新しいビデオを生成する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:20:14 GMT)
CATD: Unified Representation Learning for EEG-to-fMRI Cross-Modal Generation [17.3] 本稿では,ニューロイメージングの終端から終端までのクロスモーダル合成のための条件付き時間拡散(CATD)フレームワークを提案する。
提案フレームワークは神経画像のクロスモーダル合成のための新しいパラダイムを確立し,パーキンソン病予測の改善や異常脳領域の同定などの医療応用の可能性を示唆している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 01:44:30 GMT)
General-purpose Clothes Manipulation with Semantic Keypoints [17.2] 本稿では,CLothes mAnipulation with Semantic KeyPoints (CLASP) について述べる。
CLASPの鍵となる考え方はセマンティック・キーポイント(例えば「右肩」、「左袖」など)であり、知覚と行動の両方に相応しい空間意味表現である。
Kinovaのデュアルアームシステムによる4つの異なるタスク(折り畳み、平ら化、吊り下げ、配置)に関する実験は、CLASPのパフォーマンスを本物のロボットで確認する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:56:09 GMT)
Unlocking Efficient Long-to-Short LLM Reasoning with Model Merging [17.0] Long-to-Short (L2S) 推論は推論深度と実用効率のバランスをとることを目的としている。
モデルマージは、System 1モデルの迅速な思考能力とSystem 2モデルの方法論的推論を統合することで、コスト効率が高く堅牢な代替手段を提供する。
実験の結果,モデルマージにより平均応答長を最大55%削減できることがわかった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:34:37 GMT)
Bonsai: Gradient-free Graph Condensation for Node Classification [17.0] グラフ凝縮は、GNNのスケーラブルなトレーニングを可能にするための有望な道として登場した。
本研究は,現在のグラフ凝縮技術における重大な欠点を明らかにするものである。
本稿では,テキスト計算木がメッセージパッシングGNNの基本処理単位を形成するという観察により,新しいグラフ凝縮法であるBonsaiを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:50:10 GMT)
Evaluating Large Language Models for Automated Clinical Abstraction in Pulmonary Embolism Registries: Performance Across Model Sizes, Versions, and Parameters [16.7] 肺塞栓症は心臓血管死の主要な原因である。
PERT ConsortiumレジストリはPE管理データを標準化するが、リソース集約的な手動抽象化に依存している。
LLMは、CTPE(Computed tomography PE)レポートから概念抽出を自動化するためのスケーラブルな代替手段を提供する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:38:06 GMT)
Black-Box Forgery Attacks on Semantic Watermarks for Diffusion Models [16.6] 攻撃者は、異なる潜在空間やアーキテクチャであっても、無関係なモデルを利用して、強力で現実的な偽造攻撃を行うことができることを示す。
第1は、対象の透かしを実画像に印字し、無関係のLCMにおいて任意の画像の潜在表現を操作する。
第2の攻撃は、透かし画像を反転させて任意のプロンプトで再生することにより、目標の透かしで新たな画像を生成する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:10:26 GMT)
Enhancement of superconducting pairing via quantum control [16.3] リャプノフ量子制御は、フェルミ・ハバードモデルにおける超伝導相関を強化する効果的な戦略を提供する。
提案手法では, 簡単なフィードバックベースのプロトコルを用いて, 超伝導相関の減少を防止する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:59:12 GMT)
SE#PCFG: Semantically Enhanced PCFG for Password Analysis and Cracking [16.3] 本稿では,意味的に拡張されたPCFG (probabilistic context-free grammars) に基づく汎用フレームワークSE#PCFGを提案する。
SE#PCFGを17の大規模な漏洩パスワードデータベースに適用し、その有用性を実証し、パスワードセマンティクスに関する幅広い新しい知見を報告する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:22:50 GMT)
EGVD: Event-Guided Video Diffusion Model for Physically Realistic Large-Motion Frame Interpolation [16.2] Event-Guided Video Diffusion Model (EGVD) は、事前訓練された安定したビデオ拡散モデルの強力な先行性を活用する新しいフレームワークである。
提案手法は,RGBフレームとイベント信号とを効果的に統合して拡散過程を導出するマルチモーダル運動条件生成器(MMCG)を特徴とする。
実データとシミュレーションデータの両方の実験により、EGVDは大きな動きを扱う既存の手法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:33:32 GMT)
Adaptive Local Clustering over Attributed Graphs [16.2] 局所グラフクラスタリングは、G$のサブグラフである$C_sを、$C_s$のサイズとほぼ線形に囲む$v_s$で識別することを目的としている。
既存のソリューションのほとんどは、単に$G$のノード間のトポロジ的接続に依存しているだけであり、それらが欠落またはノイズの多いリンクに対して脆弱である。
本稿では,複数の実データセット上での超高速な経験的性能を実現するLGCの効率的かつ効果的なアプローチであるLACAを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:24:07 GMT)
GAIA-2: A Controllable Multi-View Generative World Model for Autonomous Driving [16.1] GAIA-2は、単一の生成フレームワーク内の機能を統一する潜在拡散世界モデルである。
GAIA-2は、リッチな構造化された入力セットに条件付けされた制御可能なビデオ生成をサポートする。
地理的に多様な運転環境にまたがって高解像度で時間的に一貫したマルチカメラビデオを生成する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:11:35 GMT)
LaMOuR: Leveraging Language Models for Out-of-Distribution Recovery in Reinforcement Learning [16.1] 本稿では,不確実性推定に頼らずに回復学習を可能にするLaMOuR(Language Models for Out-of-Distriion Recovery)を提案する。
LaMOuRは、エージェントを元のタスクを成功させる状態に誘導する高密度な報酬コードを生成する。
実験の結果,LaMOuRは様々な移動課題における回復効率を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:55:34 GMT)
Covert Entanglement Generation and Secrecy [15.9] ノイズの多い量子チャネル上での絡み合い発生のカバート容量を決定する。
秘密は、送信された情報が敵にアクセスできないことを保証しますが、秘密の通信は送信自体が検出不可能であることを保証します。
秘密保持を伴わない古典的情報量と同一の秘密絡み発生率の達成可能性を確立する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:34:18 GMT)
Robust Deep Reinforcement Learning in Robotics via Adaptive Gradient-Masked Adversarial Attacks [15.8] 本稿では、DRLとグラデーションベースのソフトマスキング機構を組み合わせたホワイトボックス攻撃手法であるAGMRアタックを提案し、臨界状態次元を動的に識別し、敵のポリシーを最適化する。
AGMRは、被害者エージェントのパフォーマンスを低下させ、敵防御機構を通じて被害者エージェントの堅牢性を高める、最先端の敵攻撃方法より優れる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:08:58 GMT)
Low-Rank Adaptation of Pre-Trained Stable Diffusion for Rigid-Body Target ISAR Imaging [15.5] 剛体目標に対する新しい逆合成開口レーダ(ISAR)イメージング手法を提案する。
本手法はSD Turboの基本構造と事前学習パラメータを採用する。
我々は、LORA-SDをRIDベースのISARイメージングに統合し、高分解能で鮮明に焦点を絞ったデノライズドイメージングを可能にする。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:04:25 GMT)
High Quality Diffusion Distillation on a Single GPU with Relative and Absolute Position Matching [15.3] 拡散蒸留法である相対的位置マッチング(RAPM)を導入し、1つのGPU上で効率よく学習できる高品質な生成法を提案する。
4つの時間ステップを持つRAPMは、非常に限られた計算資源の下で1つの時間ステップを持つ最良の方法として、同等のFIDスコアを生成する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:29:08 GMT)
The Morphology-Control Trade-Off: Insights into Soft Robotic Efficiency [15.3] 本研究では,形態的・制御的複雑度間の相互作用とタスク性能に対する集団的影響について検討する。
その結果, 最適性能は形態と制御の整合性に依存することがわかった。
本研究は,現実シナリオにおけるソフトロボティクスの実用化に寄与する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:07:40 GMT)
ScreenLLM: Stateful Screen Schema for Efficient Action Understanding and Prediction [15.2] 先進的なUI理解とアクション予測に適したマルチモーダル大規模言語モデル(MLLM)のセットであるScreenLLMを紹介する。
我々の研究は、多様なソフトウェア環境におけるユーザインタラクションを強化するスケーラブルで堅牢でインテリジェントなGUIエージェントの基礎を築いた。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:41:24 GMT)
UPPRESSO: Untraceable and Unlinkable Privacy-PREserving Single Sign-On Services [15.1] シングルサインオン(SSO)により、ユーザーは認証プロバイダ(IdP)の資格のみを維持でき、複数の依存者(RP)にログインできる。
本稿では, (a) 正直なIdPと(b) 悪意あるRPが他のユーザと衝突することに対して, 正直なユーザのオンラインプロファイルを保護するために, UPPRESSOと呼ばれるプライバシ保護SSOスキームを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 01:31:30 GMT)
Vision as LoRA [15.0] MLLMをMLLMに変換するための新しいパラダイムであるLoRA(VoRA)について紹介する。
一般的なMLLMアーキテクチャとは異なり、VoRAは視覚固有のLoRA層を直接LLMに統合することで視覚機能を内部化する。
我々は,VoRAの視覚能力をさらに強化するために,事前学習したViTからLoRA層へ視覚的先行を伝達するブロックワイズ蒸留法を導入する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:15:42 GMT)
MMGDreamer: Mixed-Modality Graph for Geometry-Controllable 3D Indoor Scene Generation [15.0] MMGDreamerは、Mixed-Modality Graphを組み込んだシーン生成のための二重ブランチ拡散モデルである。
ビジュアルエンハンスメントモジュールは、テキスト埋め込みを使用して視覚表現を構築することで、テキストのみのノードの視覚的忠実度を高める。
我々の関係予測器はノード表現を利用してノード間の不連続な関係を推定し、より一貫性のあるシーンレイアウトをもたらす。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:27:37 GMT)
A Multimodal Vision Foundation Model for Clinical Dermatology [14.5] PanDermは、200万以上の現実世界の皮膚疾患の画像に対する自己教師付き学習を通じて事前訓練されたマルチモーダル皮膚科学の基礎モデルである。
PanDermは、評価されたすべてのタスクで最先端のパフォーマンスを達成し、ラベル付きデータの10%しか使用していない場合、しばしば既存のモデルを上回った。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 00:32:24 GMT)
Parameter-Efficient Fine-Tuning for Pre-Trained Vision Models: A Survey [14.4] パラメータ効率のよい微調整(PEFT)を研究中
PEFTは最小パラメータ修正による完全微調整の性能を上回ることを目指している。
本調査は視覚的PEFTの総合的概要と今後の方向性を提供する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:36:30 GMT)
Perceptually Accurate 3D Talking Head Generation: New Definitions, Speech-Mesh Representation, and Evaluation Metrics [14.3] 音声信号と3次元顔メッシュの複雑な対応をキャプチャする音声-メシュ同期表現を提案する。
実験の結果, 知覚的損失を伴う3次元音声音声生成モデルの訓練は, 知覚的に正確な唇同期の3つの側面を著しく改善することがわかった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:18:57 GMT)
CSPO: Cross-Market Synergistic Stock Price Movement Forecasting with Pseudo-volatility Optimization [14.2] Pseudo-volatility Optimization (CSPO)によるクロスマーケット・シナジーの枠組みを紹介する。
CSPOは、外部の未来の知識を活用するために効果的なディープ・ニューラル・アーキテクチャを実装している。
CSPOは、ストック固有の予測信頼性をモデル化するために擬似ボラティリティを取り入れている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:58:15 GMT)
Towards Scalable Foundation Model for Multi-modal and Hyperspectral Geospatial Data [14.1] 本稿では,3つのイノベーションを取り入れた高効率空間スペクトル変換器について紹介する。
位置マスキングとチャネルマスキングを統合したHyperspectral Masked Autoencoderフレームワークを用いたLESS ViTの事前訓練を行った。
実験により, 提案手法は, 最先端のマルチモーダル地空間基盤モデルと競合する性能を示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:15:55 GMT)
Offline Reinforcement Learning with Discrete Diffusion Skills [14.0] 複雑な長期的タスクに取り組むための時間的抽象化として、オフライン強化学習(RL)にスキルが導入された。
オフラインのRLのスキルは、主に連続的な潜伏空間内でモデル化されているが、離散的なスキル空間の可能性はほとんど探索されていない。
本稿では、最先端のトランスフォーマーベースのエンコーダと拡散型デコーダによってサポートされたオフラインRLタスクのためのコンパクトな離散スキル空間を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:04:42 GMT)
Skip-Vision: A Comprehensive Framework for Accelerating Vision-Language Models [13.8] 重要なボトルネックは、きめ細かい画像理解に必要な視覚トークンの拡散に起因する。
視覚言語モデルにおけるトレーニングと推論の非効率性に対処する統合フレームワークであるSkip-Visionを提案する。
実験の結果,Skip-Visionはトレーニング時間を最大35%短縮し,FLOPを75%,レイテンシを45%短縮した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:16:48 GMT)
Semi-supervised Node Importance Estimation with Informative Distribution Modeling for Uncertainty Regularization [13.7] 異種グラフにおける未ラベルデータの学習品質向上を目的とした,最初の半教師付きノード重要度推定フレームワークであるEASINGを提案する。
従来のアプローチとは異なり、EASingはモデル予測の信頼性を反映する不確実性を明示的に捉えている。
EASINGはラベル付きおよび擬似ラベル付きデータに基づいて、ノードの不確かさの正則化を伴う効果的な半教師付きヘテロ代数学学習を開発する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:27:06 GMT)
Inductive Link Prediction on N-ary Relational Facts via Semantic Hypergraph Reasoning [13.7] 我々は,n-aryリレーショナル事実に基づく完全帰納的リンク予測(ILP)のためのn-aryサブグラフ推論フレームワークを提案する。
具体的には,新たなグラフ構造であるn-ary意味ハイパーグラフを導入し,部分グラフ抽出を容易にする。
また、サブグラフ内の複雑な意味的相関を効果的にマイニングするために、サブグラフ集約ネットワークNS-HARTを開発した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:09:54 GMT)
TeleLoRA: Teleporting Model-Specific Alignment Across LLMs [13.6] TeleLoRAは、複数の大規模言語モデルにまたがるモデル固有のアライメントデータを相乗化するフレームワークである。
複数のLLMにまたがる局所的なアクティベーション情報を活用することで、LoRAアダプタウェイトを統一的に生成する。
LLMトロイジャン緩和ベンチマークの実験は、TeleLoRAが攻撃成功率を効果的に減少させることを示した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:46:31 GMT)
Deep Learning-Based Quantitative Assessment of Renal Chronicity Indices in Lupus Nephritis [13.5] ループス腎炎 (LN) 患者の長期予後の予測因子として, 腎慢性指数 (CI) が同定されている。
本研究の目的は、CIの評価を自動化し、疾患特異的の観点から貴重な予後洞察を提供するディープラーニングパイプラインを開発することである。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:20:59 GMT)
Representation Improvement in Latent Space for Search-Based Testing of Autonomous Robotic Systems [13.4] 自動運転車や無人航空機のような自律型ロボットシステムのテストは、予測不可能な環境との相互作用のために難しい。
より効率的にテストシナリオを生成するために、多くの検索ベースのアプローチが提案された。
変分オートエンコーダの潜在空間にマッピングすることで,テスト表現を向上させるRILaSTを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:34:42 GMT)
Evaluating Vision-Language Models as Evaluators in Path Planning [13.4] 大規模言語モデル(LLM)は、エンド・ツー・エンド・プランニングにおいて限定的な有効性を持つことが示されている。
本稿では,複雑な経路計画シナリオにおける計画評価器としてVLMを評価する新しいベンチマークであるPathEvalを紹介する。
分析の結果,これらのモデルがベンチマークにおいて重大な課題に直面していることが明らかとなった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:18:38 GMT)
Multimodal Image Matching based on Frequency-domain Information of Local Energy Response [13.2] 複雑な非線形強度差、非線形局所幾何学的歪み、ノイズ、回転変換はマルチモーダル画像マッチングの主要な課題である。
FILERと呼ばれる局所エネルギー応答の周波数領域情報に基づく手法を提案する。
FILERは他の最先端アルゴリズムよりも優れ、堅牢性と堅牢性が高いことを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:12:51 GMT)
PlatMetaX: An Integrated MATLAB platform for Meta-Black-Box Optimization [13.1] 最適化アルゴリズムの開発,評価,比較を行う新しいプラットフォームであるPlatMetaXを提案する。
PlatMetaXはMetaBoxとPlatEMOの強みを統合し、最適化アルゴリズムの開発、評価、比較のための包括的なフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:03:35 GMT)
JOG3R: Towards 3D-Consistent Video Generators [13.0] 映像生成装置も同様に3D認識能力を示すかを検討する。
映像生成装置の中間的特徴がカメラポーズ推定をサポートすることができるかどうかを検証する。
そこで本研究では,3D対応でリアルな映像フレームを生成し,他の3D対応タスクに再利用可能な,最初の統合映像生成装置を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:53:45 GMT)
Vision-based Multi-future Trajectory Prediction: A Survey [13.0] 視覚に基づく軌道予測は、自律システムにおける安全かつインテリジェントな振る舞いをサポートする重要なタスクである。
空間的特徴抽出と時間的特徴抽出を改善した先進的なアプローチが長年にわたって提案されてきた。
この問題に対処するために、MTP(Multi-Future trajectory Prediction)と呼ばれる重要なタスクが最近研究されている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:54:55 GMT)
Multi-agent Application System in Office Collaboration Scenarios [12.9] 本稿では,オフィスコラボレーションの効率化と作業品質向上を目的としたマルチエージェントアプリケーションシステムを提案する。
このシステムは人工知能、機械学習、自然言語処理技術を統合し、タスク割り当て、進捗監視、情報共有などの機能を達成する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:55:15 GMT)
UFM: Unified Feature Matching Pre-training with Multi-Modal Image Assistants [12.8] 広帯域のモーダル画像にまたがる特徴マッチング問題に対処するために,統一特徴マッチング事前訓練モデル(UFM)を導入する。
多様な特徴マッチング問題に対処できる微調整可能なマルチモーダルイメージアシスタント(MIA)トランスフォーマーを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:20:52 GMT)
MagicDec: Breaking the Latency-Throughput Tradeoff for Long Context Generation with Speculative Decoding [12.7] 我々は,中間列から長列への高スループット推論方式であっても,投機的復号化が高速化可能であることを示す。
最大高速化のための最適起草戦略を選択するための理論的モデルを提案する。
中程度から長いシーケンスでは、32から256までのバッチサイズでLlama3.1-8Bの2.51倍のスピードアップを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:42:17 GMT)
Fixseeker: An Empirical Driven Graph-based Approach for Detecting Silent Vulnerability Fixes in Open Source Software [12.7] オープンソースソフトウェアの脆弱性は、ダウンストリームアプリケーションに重大なセキュリティリスクをもたらす。
多くのセキュリティパッチは、セキュリティへの影響を明確に示すことなく、OSSリポジトリの新しいコミットで静かにリリースされている。
グラフベースのアプローチであるFixseekerを提案し、ハンクレベルでのコード変更間の様々な相関関係を抽出し、無声脆弱性の修正を検出する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:16:58 GMT)
A Multilingual, Culture-First Approach to Addressing Misgendering in LLM Applications [12.6] ミスジェンダー(英: missgendering)とは、性別によって、選択したアイデンティティと一致しない人を指す行為である。
英語に基づくアプローチは、その代名詞の使用など、誤解を避けるための明確なアプローチを持つ
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:01:35 GMT)
MuseTalk: Real-Time High-Fidelity Video Dubbing via Spatio-Temporal Sampling [12.4] 拡散に基づく手法は高い視覚的忠実性を達成するが、計算コストの禁止に苦しむ。
MuseTalkは、遅延空間最適化とデータサンプリング戦略を通じて、このトレードオフを解決する新しい2段階のトレーニングフレームワークである。
MuseTalkは、潜在領域における効果的なオーディオ-視覚機能融合フレームワークを確立し、NVIDIA V100 GPU上で256*256の解像度で30 FPS出力を提供する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:48:17 GMT)
Shape Generation via Weight Space Learning [12.4] 大規模な3次元形状生成モデル内の部分多様体は、トポロジカルな特性や微細な部分の特徴を別々に調整できることを示す。
結果は3次元形状生成と特殊微調整のための新しいアプローチを解き放つための重み空間学習の可能性を強調した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:49:27 GMT)
MARVEL-40M+: Multi-Level Visual Elaboration for High-Fidelity Text-to-3D Content Creation [12.3] MARVEL-40M+は,890万以上の3D資産に対して,4000万のテキストアノテーションを備えた広範なデータセットである。
我々の貢献は、オープンソースで事前訓練されたマルチビューVLMとLLMを統合した、新しいマルチステージアノテーションパイプラインである。
我々は2段階のテキスト・トゥ・3DパイプラインであるMARVEL-FX3Dを開発した。我々はアノテーションで安定な拡散を微調整し、事前訓練された画像・ツー・3Dネットワークを用いて15秒以内に3Dテクスチャメッシュを生成する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:06:10 GMT)
CNN+Transformer Based Anomaly Traffic Detection in UAV Networks for Emergency Rescue [12.1] ソフトウェア定義ネットワーク(SDN)フレームワークとブロックチェーン技術に基づく,UAVネットワークのための新しい異常トラフィック検出アーキテクチャを提案する。
畳み込みニューラルネットワーク(CNN)とトランスフォーマー(CNN+Transformer)を組み合わせた,異常なトラフィック検出のための統合アルゴリズムを開発し,CTranATDと呼ぶ。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:27:26 GMT)
Fast, Modular, and Differentiable Framework for Machine Learning-Enhanced Molecular Simulations [12.0] 分子動力学およびモンテカルロシミュレーションのためのエンドツーエンド微分分子シミュレーションフレームワーク(DIMOS)を提案する。
そのモジュール性のおかげで、古典的および機械学習に基づくアプローチは、システムのハイブリッド記述(ML/MM)に簡単に組み合わせることができる。
優れたパフォーマンスと高い汎用性は、さまざまなベンチマークやアプリケーションで調査されている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:39:10 GMT)
Stealthy Backdoor Attack in Self-Supervised Learning Vision Encoders for Large Vision Language Models [12.0] 我々は、視覚エンコーダを単に妥協させることで、視覚幻覚を大きな視覚言語モデル(LVLM)に誘導できる新たなバックドア脅威を明らかにした。
これらのエンコーダの共有と再利用のため、下流のLVLMの多くはエンコーダからバックドアの振る舞いを継承し、広くバックドアに繋がる可能性がある。
本稿では,新たなトリガ最適化とバックドア学習技術を備えたLVLM用SSLビジョンエンコーダにおいて,この脆弱性を利用する最初の方法であるBadVisionを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:37:46 GMT)
Latent Beam Diffusion Models for Decoding Image Sequences [11.9] 既存の手法は個々の画像を独立して生成し、切り離された物語に繋がる。
本研究では,静止空間探索のための新しいビーム探索手法を導入し,全画像列の条件付き生成を可能にする。
探索最適化と遅延空間改良の進歩により、この研究は構造化画像列生成の新しい標準となる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:01:10 GMT)
Dynamic Pyramid Network for Efficient Multimodal Large Language Model [11.9] MLLM(Multimodal large language model)は様々な視覚言語(VL)タスクにおいて顕著な性能を示す。
近年の取り組みは、MLLMの計算コストを抑えるために視覚的特徴を圧縮することを目的としている。
効率的なMLLMのための新しい動的ピラミッドネットワーク(DPN)を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:44:11 GMT)
The CTU Prague Relational Learning Repository [11.8] Prague Repositoryの目的は、マルチリレーショナルデータによる機械学習研究をサポートすることだ。
サーバはチェコ工科大学(CTU)が提供している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 23:32:07 GMT)
State-Aware Perturbation Optimization for Robust Deep Reinforcement Learning [11.8] 摂動ステルスネスと状態訪問分散を最適化するために,STARと命名された選択的状態認識強化敵攻撃法を提案する。
情報理論最適化の目的を取り入れ、摂動、環境状態、被害者の行動の相互情報を最大化し、分散した状態・視線分布を確保する。
実験により、STARは最先端のベンチマークより優れていることが示された。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:00:07 GMT)
Boltzmann Attention Sampling for Image Analysis with Small Objects [11.8] 肺結節や腫瘍病変などの小さな物体は、画像の0.1%未満を占める。
既存のスパースアテンション機構は、小さく、可変で、不確実な物体の位置を検出するのに不適な厳密な階層構造に依存している。
本稿では,これらの課題に動的に注意を払って対処するために設計された,新しいトランスフォーマーベースのアーキテクチャであるBoltzFormerを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:33:30 GMT)
A multi-scale lithium-ion battery capacity prediction using mixture of experts and patch-based MLP [11.8] マルチスケールキャパシティ予測モデルであるMSPMLPを提案する。
パッチサイズが異なるパッチベースのブロックを用いて、キャパシティシーケンスからマルチスケールの特徴を抽出する。
MSPMLPは0.0078の平均絶対誤差(MAE)を達成し、既存の手法に比べて41.8%改善した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:59:48 GMT)
Matrix product state fixed points of non-Hermitian transfer matrices [11.7] テンソルネットワークの仮想指標におけるゲージ自由度の影響について検討する。
ゲージ変換が伝達行列の固有状態の絡み合い構造に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:02:30 GMT)
Mamba-3D as Masked Autoencoders for Accurate and Data-Efficient Analysis of Medical Ultrasound Videos [11.6] ビデオデータの3次元構造を保存したデータ効率の良いビジョンマンバネットワークであるE-ViM$3$を紹介する。
本モデルでは, 臨床応用への潜在的な影響を明らかにするとともに, ラベルの限定による競争性能の向上を図っている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:54:13 GMT)
Comparing Styles across Languages: A Cross-Cultural Exploration of Politeness [11.5] 本稿では,多言語LMからスタイリスティックな違いを抽出し,言語間のスタイルを比較するための説明フレームワークを提案する。
我々のフレームワークはあらゆる言語で包括的なスタイルレキシカを生成する。
この枠組みを用いて丁寧さを比較し、最初の全体論的多言語多言語丁寧さデータセットを作成する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:04:41 GMT)
Bridging Evolutionary Multiobjective Optimization and GPU Acceleration via Tensorization [11.5] 進化的多目的最適化(EMO)は過去20年間に大きく進歩してきた。
従来のEMOアルゴリズムは、並列性とスケーラビリティが不十分なため、大幅な性能制限に直面している。
本稿では,Emphtensorization法を用いてGPU上でのEMOアルゴリズムの並列化を提案する。
実験の結果, テンソル化EMOアルゴリズムはCPUベースと比較して最大1113(times)の高速化を実現していることがわかった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:30:23 GMT)
What is the role of human decisions in a world of artificial intelligence: an economic evaluation of human-AI collaboration in diabetic retinopathy screening [11.3] 全国の糖尿病網膜症スクリーニングプログラムにおいて,健康・経済の観点から270のスクリーニングシナリオを分析した。
20~79歳層における年次対人AIスクリーニングは、人間とAIの双方が同意する際の基準決定とともに、人間とAIのコラボレーションにとって最もコスト効率の良い戦略であることがわかった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:31:06 GMT)
Synthetic Data Augmentation for Cross-domain Implicit Discourse Relation Recognition [11.2] 暗黙の談話関係認識(IDRR)は深い意味理解を必要とする。
近年の研究では、ゼロショットまたは少数ショットのアプローチが教師付きモデルに大きく遅れていることが示されている。
このアプローチをクロスドメイン設定に適用し、未ラベルなターゲットドメインデータを用いて談話継続を生成する。
大規模なテストセットで行った評価では、アプローチの異なるバリエーションが大きな改善をもたらすことはないことが判明した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:41:04 GMT)
Programmer Visual Attention During Context-Aware Code Summarization [11.1] 要約を書いている間、私たちは視線追跡装置を使ってプログラマの視覚的注意をマッピングしました。
その結果、プログラマは単語の読み出しを著しく減らし(p0.01)、多くのメソッドを要約して単語のリビジットを減らさなければならない(p0.03)。
我々は,経験的観察がプログラマの注意をモデル化し,文脈認識によるソースコードの自動要約を改善するための将来の研究にどのように役立つかについて議論する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:04:31 GMT)
Reasoning and Learning a Perceptual Metric for Self-Training of Reflective Objects in Bin-Picking with a Low-cost Camera [11.0] 低コストのRGB-Dカメラを用いた金属オブジェクトのビンピッキングは、しばしばスパース深度情報と反射面テクスチャに悩まされる。
本稿では,メートル法学習段階と自己学習段階からなる2段階の枠組みを提案する。
提案手法は,ROBIデータセットと新たに導入したSelf-ROBIデータセットの両方において,最先端の手法よりも優れている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:03:51 GMT)
Comprehensive Manuscript Assessment with Text Summarization Using 69707 articles [10.9] 我々は69707の科学論文から得られた、非常に包括的で大規模な情報のデータセットをキュレートするために、Scopusを利用する。
本稿では,原稿から抽出した意味的特徴と論文メタデータを活用する,インパクトベース分類タスクの深層学習手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:56:15 GMT)
Susceptibility of Large Language Models to User-Driven Factors in Medical Queries [10.9] 我々は,誤情報フレーミング,情報源権限,モデルペルソナ,重要な臨床詳細の欠落が,大規模言語モデル(LLM)の診断精度と信頼性に与える影響について検討した。
我々は,プロプライエタリモデル (GPT-4o, Claude 3.5 Sonnet, Claude 3.5 Haiku, Gemini 1.5 Pro, Gemini 1.5 Flash) とオープンソースモデル (LLaMA 3 8B, LLaMA 3 Med42 8B, DeepSeek R1 8B) を評価した。
全てのモデルはユーザ主導の誤情報に対して脆弱であり、プロプライエタリなモデルは特に決定的かつ権威的な言語の影響を受けていた。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 23:28:21 GMT)
InsViE-1M: Effective Instruction-based Video Editing with Elaborate Dataset Construction [10.9] 高品質なインストラクションベースのビデオ編集データセットを,100万トリプル,すなわちInsViE-1Mで提示する。
まず、高解像度で高品質なソースビデオと画像をキュレートし、次に効率的な編集フィルタリングパイプラインを設計し、モデルトレーニングのための高品質な編集三脚を構築する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:30:58 GMT)
Cross-Modal Prototype Allocation: Unsupervised Slide Representation Learning via Patch-Text Contrast in Computational Pathology [10.8] ProAlignは、クロスモーダルな教師なしスライド表現学習フレームワークである。
スライド画像全体に存在するプロトタイプタイプの記述テキストを生成するために,大規模言語モデル(LLM)を利用する。
本稿では、パッチとこれらのプロトタイプの類似性を利用して、教師なしスライド埋め込みを形成するパラメータフリーアテンションアグリゲーション戦略を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:31:07 GMT)
Reflex: Speeding Up SMPC Query Execution through Efficient and Flexible Intermediate Result Size Trimming [10.7] MPC演算子に簡単に付加できる演算子出力の柔軟かつ効率的なトリミングを提案する。
私たちは、最先端のトリミングアプローチを移植することで、より高速なランタイムとセキュリティを向上することで、私たちの作業が現実的であることを実証しています。
私たちの研究は、物理的なクエリプランを構成する際に、異なるパフォーマンスとセキュリティターゲットを選択することのできる、将来のMPCクエリプランナの基礎を定めています。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:04:05 GMT)
Dolphin: A Large-Scale Automatic Speech Recognition Model for Eastern Languages [10.7] Dolphinは、Whisperアーキテクチャを拡張して幅広い言語をサポートする、大規模多言語自動音声認識モデルである。
このアプローチでは、Dolphinのパフォーマンスを洗練、最適化するために、社内のプロプライエタリなデータセットとオープンソースデータセットを統合しています。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:14:03 GMT)
Poly-FEVER: A Multilingual Fact Verification Benchmark for Hallucination Detection in Large Language Models [10.7] 生成AIにおける幻覚、特にLarge Language Models(LLMs)は、多言語アプリケーションの信頼性に重大な課題をもたらす。
幻覚検出のための既存のベンチマークは、主に英語といくつかの広く話されている言語に焦点を当てている。
大規模多言語事実検証ベンチマークであるPoly-FEVERを紹介する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 23:53:56 GMT)
Semiring Provenance for Lightweight Description Logics [10.6] 本研究は,データベース設定で定義したフレームワークであるprofence semiringについて,記述ロジックについて検討する。
セミリングのいくつかの制限の下で、セマンティクスは望ましい性質を満たすことを示す。
本稿では,アサーションや接続型問合せ応答の証明に関連する問題の複雑性について検討する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:51:20 GMT)
Unconditional Priors Matter! Improving Conditional Generation of Fine-Tuned Diffusion Models [10.5] CFGの非条件雑音をベースモデルで予測したノイズに置き換えることで条件生成を大幅に改善できることを示す。
我々は,画像生成と映像生成の両面において,CFGに基づく条件付きモデルを用いて,我々の主張を実験的に検証した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:11:38 GMT)
Inference-Time Scaling for Flow Models via Stochastic Generation and Rollover Budget Forcing [10.5] 本稿では,事前学習した流れモデルに対する推論時間スケーリング手法を提案する。
本稿では,SDE に基づく生成,特に分散保存型 (VP) 補間型 (VP) 生成は,フローモデルにおける推論時間スケーリングのための粒子サンプリング法を改善することを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:12:38 GMT)
Advancements in Natural Language Processing: Exploring Transformer-Based Architectures for Text Understanding [10.5] 本稿では,BERT や GPT などのトランスフォーマーモデルの進歩を考察し,テキスト理解タスクにおける優れた性能に着目した。
その結果、GLUEやSQuADのようなベンチマークでは、高い計算コストなどの課題はあるものの、F1スコアが90%を超えている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:45:33 GMT)
AI Safety in the Eyes of the Downstream Developer: A First Look at Concerns, Practices, and Challenges [10.3] 事前トレーニングされたモデル(PTM)は、AIベースのソフトウェアの基礎となり、最小限のトレーニングオーバーヘッドで、迅速な統合と開発を可能にする。
本研究では,AIベースのソフトウェア開発におけるAI安全性問題に対する開発者の懸念,プラクティス,認識する課題について検討する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:57:42 GMT)
Data Mixture Optimization: A Multi-fidelity Multi-scale Bayesian Framework [10.3] 我々は,SlimPajamaデータセットから,さまざまなデータ構成を用いて,472言語モデルによる事前学習実行をベースとしたシミュレータを構築した。
単純な取得関数でさえ、20Mから1Bまでのトレーニングモデル間で、原則化されたトレーニング決定を可能にすることを観察する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 22:19:47 GMT)
Joint Task Offloading and User Scheduling in 5G MEC under Jamming Attacks [10.3] 本稿では,5Gモバイルエッジコンピューティング(MEC)システムを対象とした新しいタスクオフロードとユーザスケジューリング(JTO-US)フレームワークを提案する。
提案フレームワークは,高優先度タスクを効率的に処理しながら,ジャミングの影響を最小限に抑えるために,タスクとユーザを最適にスケジュールする。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:55:10 GMT)
KIEval: Evaluation Metric for Document Key Information Extraction [10.1] ドキュメントキー情報抽出(KIE)は、文書画像中の貴重な情報を構造化データに変換する技術である。
我々は、ドキュメントKIEモデルのための新しいアプリケーション中心評価指標であるKIEvalを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:55:40 GMT)
ILIAS: Instance-Level Image retrieval At Scale [10.0] ILIASはインスタンスレベルイメージ検索のための新しいテストデータセットである。
それは、現在および将来の基礎モデルと、特定のオブジェクトを認識するための検索技術を評価するために設計されている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:27:09 GMT)
Probabilistic Forecasting for Network Resource Analysis in Integrated Terrestrial and Non-Terrestrial Networks [9.9] 予測の不確かさを定量化する確率予測は、単一点予測手法の頑健な代替手段である。
その結果、黒確率予測モデルが正確で信頼性の高い予測を提供し、その不確実性を定量化する可能性が示された。
論文の最後には,TN-NTN統合環境における確率予測の応用シナリオと標準化ロードマップも提示する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:54:46 GMT)
Software Vulnerability Analysis Across Programming Language and Program Representation Landscapes: A Survey [9.7] 本稿では,プログラム言語,プログラム表現レベル,脆弱性のカテゴリ,検出技術について系統的に検討する。
脆弱性発見における現在のプラクティスを詳細に理解し、その強み、制限、特徴の区別を明確にする。
ソフトウェアセキュリティ分野における将来の研究への有望な方向性を概説している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:22:48 GMT)
Harmonia: A Multi-Agent Reinforcement Learning Approach to Data Placement and Migration in Hybrid Storage Systems [9.7] ハイブリッドストレージシステム(HSS)は、複数のストレージデバイスを多様な特徴と組み合わせて、高性能で低コストでキャパシティを実現する。
HSSの性能は,(1)入力データに最適な記憶装置を決定するデータ配置ポリシー,(2)デバイス間で格納データを並べ替えて高いHSS性能を維持するデータマイグレーションポリシーの2つの主要なポリシーの有効性に大きく依存する。
我々の目標は、HSSの可能性を完全に活用するために、データ配置とデータ移行ポリシーの両方を最適化する、HSSのための総合的なデータ管理手法を設計することです。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:47:52 GMT)
The Data Sharing Paradox of Synthetic Data in Healthcare [9.7] 本稿では、合成データがデータ共有のために設計されているが、しばしば制限されているパラドックス的状況について論じる。
我々はこの問題を緩和するためにどのようにフィールドを前進させるかについて議論する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:06:40 GMT)
Scale-Equivariant Imaging: Self-Supervised Learning for Image Super-Resolution and Deblurring [9.6] 自己監督法は, 様々な画像逆問題において, 教師付き法と同程度に有効であることが最近証明された。
本稿では,多くの画像分布がほぼ不変であるという事実を活かした,新たな自己教師型手法であるスケール不変イメージングを提案する。
提案手法が他の自己教師型手法より優れていることを示す実データセットに関する一連の実験を行った。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:34:53 GMT)
CryoSAMU: Enhancing 3D Cryo-EM Density Maps of Protein Structures at Intermediate Resolution with Structure-Aware Multimodal U-Nets [9.3] 低温電子顕微鏡(cryo-EM)3次元密度マップの中間分解能の向上は、タンパク質の構造決定に不可欠である。
近年のディープラーニングの進歩により、実験用Cryo-EM密度マップの強化のための自動アプローチが開発されている。
CryoSAMUは構造認識型マルチモーダルU-Netを用いたタンパク質構造の3次元Cryo-EM密度マップの高速化を目的とした新しい手法である。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:33:36 GMT)
Bayesian Modeling of Zero-Shot Classifications for Urban Flood Detection [9.3] ストリートシーンデータセットは、都市オブジェクトやストリートフラッディングのようなインシデントを検出する、有望な手段を提供する。
これらのデータセットを使用する際の大きな課題は、信頼性のあるラベルの欠如である。
本稿では,この困難を回避する2段階のアプローチであるBayFloodを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:25:03 GMT)
The Backfiring Effect of Weak AI Safety Regulation [9.2] 我々は,レギュレータ,汎用AI技術クリエータ,ドメインスペシャリスト間のインタラクションについて検討する。
私たちは、ドメインスペシャリストにのみ課される弱い安全規制が、バックファイアを発生させることに気付きました。
より強く、適切に配置された規制は、実際にはすべてのプレイヤーに利益をもたらすことができる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:08:22 GMT)
MVFNet: Multipurpose Video Forensics Network using Multiple Forms of Forensic Evidence [9.2] MVFNetは、インペイント、ディープフェイク、スプライシング、編集など、さまざまな種類の操作を検出できる多目的ビデオ法医学ネットワークである。
我々のネットワークは、ファルシファイドビデオの空間的・時間的異常を捉えた、幅広い法医学的特徴を抽出し、共同で分析する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:11:06 GMT)
Addressing Challenges in Time Series Forecasting: A Comprehensive Comparison of Machine Learning Techniques [9.0] 本稿では,TS回帰タスクに適したアルゴリズムを簡潔に記述し,コンパイルする。
我々は,これらのアルゴリズムと,多様なデータセットを用いた古典的ARIMA法を比較した。
特に長期的な予測では、精度の予測に重点を置いている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 01:55:56 GMT)
Physics-Informed Neural Networks with Unknown Partial Differential Equations: an Application in Multivariate Time Series [9.0] この研究は、データ駆動型発見と物理誘導学習のギャップを埋めることを目的としている。
歴史的データから部分微分方程式を自動的に抽出する手法を提案する。
次に、これらの学習方程式を3つの異なるモデリングアプローチに統合する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 01:24:47 GMT)
Explaining Deep Convolutional Neural Networks for Image Classification by Evolving Local Interpretable Model-agnostic Explanations [8.7] 提案手法はモデルに依存しない、すなわち、深い畳み込みニューラルネットワークモデルを説明するために利用することができる。
ImageNetからランダムに選択された4つの画像の進化した局所的説明を示す。
提案手法は,LIMEの10倍以上高速な局所的な説明を1分以内で得ることができる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 01:45:30 GMT)
Hierarchical Label Propagation: A Model-Size-Dependent Performance Booster for AudioSet Tagging [8.3] AudioSetは、約200万のオーディオサンプルを含む、オーディオタグの最も多く、かつ最大のデータセットの1つである。
HLPはオントロジー階層のラベルを伝播し、オーディオクリップあたりの正のラベルが1.98から2.39へと平均的に増加する。
我々の結果は、HLPが様々なモデルアーキテクチャにまたがって性能上の利点を提供することを示した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:45:43 GMT)
Consensus Capacity of Noisy Broadcast Channels [8.2] コンセンサスとの通信は、放送チャンネルが埋め込まれた場合にのみ可能であり、自然な「共通チャンネル」である。
放送チャンネルに「共通チャンネル」が埋め込まれた場合にのみ、コンセンサスとの通信が可能であることを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:39:33 GMT)
Forensic Self-Descriptions Are All You Need for Zero-Shot Detection, Open-Set Source Attribution, and Clustering of AI-generated Images [8.2] 従来の手法では、トレーニング中に既知のソースに特有の機能に依存するため、見えないジェネレータに一般化できない。
本稿では,法医学的微細構造を明示的にモデル化する新しい手法を提案する。
この自己記述により、合成画像のゼロショット検出、画像のオープンセットソース属性、および事前知識のないソースに基づくクラスタリングを行うことができる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:34:37 GMT)
Uni$\textbf{F}^2$ace: Fine-grained Face Understanding and Generation with Unified Multimodal Models [8.2] Uni$textbfF2$aceは、顔のきめ細かな理解と生成に特化した最初のUMMである。
一般的に、Uni$textbfF2$aceを自己構築された特別なデータセットでトレーニングします。
Uni$textbfF2$ace-130Kの実験は、Uni$textbfF2$aceが既存のUMMや生成モデルより優れていることを示した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:30:35 GMT)
Knowledge-Based Multi-Agent Framework for Automated Software Architecture Design [8.1] 知識に基づくマルチエージェントアーキテクチャ設計(MAAD)フレームワークを構想する。
MAADはエージェントを使用して、従来のソフトウェアアーキテクチャ設計プロセスにおけるヒューマンロールをシミュレートする。
アプリケーションレベルのシステム開発を完全に自動化することを目指しています。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:35:10 GMT)
ARMO: Autoregressive Rigging for Multi-Category Objects [8.0] 我々はOmniRigを紹介した。OmniRigは79,499個のメッシュで構成され、詳細なスケルトンとスキン情報を含んでいる。
定義済みの標準ポーズに依存する従来のベンチマークとは異なり、データセットにはさまざまな形状カテゴリ、スタイル、ポーズが採用されています。
本稿では、自己回帰モデルを用いて、関節位置と接続関係を統一的に予測する新しいリギングフレームワークARMOを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:56:48 GMT)
A Geometric Modeling of Occam's Razor in Deep Learning [8.0] ディープニューラルネットワーク(DNN)は、非常に高次元のパラメータ空間の恩恵を受ける。
彼らの巨大なパラメータの複雑さと実践上の素晴らしいパフォーマンスは、より興味深く、説明できないものです。
本稿では,この現象を研究するための幾何学的フレーバー付き情報理論手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:29:49 GMT)
Does GenAI Make Usability Testing Obsolete? [7.9] 本稿では,iOSアプリのユーザビリティ問題を予測するLarge Vision-Language Modelを利用した新しいツールUX-LLMを提案する。
UX-LLMの性能を評価するため,中程度の複雑さを持つ2つのオープンソースアプリケーションのユーザビリティ問題を予測し,ユーザビリティの専門家2人に予測の評価を依頼した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:56:04 GMT)
Refining Time Series Anomaly Detectors using Large Language Models [7.8] 時系列異常検出(TSAD)は、金融、医療、製造業など多くの産業で広く関心を集めている。
マルチモーダルな大言語モデル(LLM)を用いて,この処理を部分的に自動化する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 23:41:49 GMT)
Hiding Functions within Functions: Steganography by Implicit Neural Representations [7.8] 我々はステガノグラフィーを実装するStegaINRを提案する。
StegaINRはシークレット機能をステゴ機能に組み込み、メッセージ抽出器とステゴメディアの両方として機能する。
我々の知る限り、これは脳波をステガノグラフィーに導入する最初の試みである。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 00:53:00 GMT)
Boundary Time Crystals Induced by Local Dissipation and Long-Range Interactions [7.7] 駆動散逸多体系は平衡に存在しない非自明な量子位相をサポートする。
本研究は,局所散逸によって本質的に誘起される頑健な境界時間結晶(BTC)を実証する。
我々の研究は、非平衡相の範囲を大きく広げ、動的量子物質の実験的探索に新たな光を放つ。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:49:59 GMT)
MetaDE: Evolving Differential Evolution by Differential Evolution [7.6] 微分進化の内在的ハイパーパラメータとDそのものをメタレベルで利用する戦略を進化させるアプローチであるMetaDEを紹介する。
MetaDEの重要な側面は特別なパラメータ化技術であり、DEのパラメータと戦略を動的に変更する機能を備えている。
CEC2022ベンチマークスイートの大規模な評価は、MetaDEの有望なパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:06:11 GMT)
The cell as a token: high-dimensional geometry in language models and cell embeddings [7.6] シングルセルシークエンシングは、細胞内活動をコードする高次元空間に細胞をマッピングする。
この視点は、言語埋め込みの構造を理解することの進歩が、単一セルデータセットを分析し視覚化するための継続的な取り組みにどのように影響するかを探求する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:05:58 GMT)
Perspective-Shifted Neuro-Symbolic World Models: A Framework for Socially-Aware Robot Navigation [7.6] ソーシャルナビゲーションのためのニューロシンボリックモデルに基づく強化学習アーキテクチャを提案する。
部分的に観察可能な環境における信念追跡の課題に対処する。
また,信念推定のための視点シフト演算子を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:59:08 GMT)
No Black Box Anymore: Demystifying Clinical Predictive Modeling with Temporal-Feature Cross Attention Mechanism [7.5] TFCAM(Temporal-Feature Cross Attention Mechanism)は、臨床機能間の動的相互作用を時間をかけて捉えるための新しいディープラーニングフレームワークである。
慢性腎臓病の1,422人を対象に行った実験では、TFCAMはLSTMおよびRETAINベースラインに優れ、AUROCは0.95、F1スコアは0.69であった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 22:09:44 GMT)
ShieldAgent: Shielding Agents via Verifiable Safety Policy Reasoning [7.5] ShieldAgentは、他の保護されたエージェントの行動軌跡に対する明確な安全政策コンプライアンスを実施するために設計されたガードレールエージェントである。
保護剤の作用軌跡を考慮し、ShieldAgentは関連するルール回路を取得し、シールド計画を生成する。
ShieldAgentはAPIクエリを64.7%削減し、推論時間を58.2%削減した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:58:40 GMT)
Constraints on Velocity and Spin Dependent Exotic Interaction at the Millimeter Scale with a Diamagnetic-levitated Force Sensor [7.5] 光ボソンは電子スピンと核子の間の速度とスピン依存エキゾチック相互作用を媒介する。
本研究では, 磁気浮上型力センサを用いたエキゾチック相互作用をミリスケールで検出する手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:34:51 GMT)
Generating Synthetic Data with Formal Privacy Guarantees: State of the Art and the Road Ahead [7.4] プライバシを保存する合成データは、高領域における分離されたデータを活用するための有望なソリューションを提供する。
本調査では, 生成モデルと差分プライバシの理論的基礎を概説し, 現状の手法を概観する。
調査の結果は、未確認のプライバシー漏洩、正式な保証の実証的検証の不十分、現実的なベンチマークの重大な欠陥など、重要な課題を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:06:33 GMT)
Omnidirectional Depth-Aided Occupancy Prediction based on Cylindrical Voxel for Autonomous Driving [7.4] 事前導入には全方位深度推定を用いる。
また、偏光座標に基づく円筒型ボクセル表現を導入し、パノラマカメラビューとの整合性を向上する。
実験の結果,Sketch- Networkは3次元知覚性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 00:07:21 GMT)
Operating Room Workflow Analysis via Reasoning Segmentation over Digital Twins [7.3] 手術室 (OR) を解析し, OR効率に関する定量的知見を導出することが病院にとって重要である。
基礎モデルに基づく推論セグメンテーション(RS)は、ORビデオフィードからOR改善の自動分析を可能にする柔軟性を提供する。
ORDiRS(Operation Room Digital twin representation for Reasoning, LLMフリーRSフレームワーク)について述べる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 23:59:32 GMT)
Revisit Time Series Classification Benchmark: The Impact of Temporal Information for Classification [7.3] UCR時系列分類アーカイブの時間情報を妨害する置換テストを行う。
時間的情報が分類にほとんど影響しないデータセットのかなりの割合を同定する。
時間情報を抽出・活用する分類器の能力を評価するために,UCR時系列分類アーカイブに基づくベンチマークであるUCR Augmentedを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:13:41 GMT)
Beyond Intermediate States: Explaining Visual Redundancy through Language [7.3] MLLM(Multi-modal Large Langue Models)はしばしば数千の視覚トークンを処理する。
低いViT-[cls]アソシエーションと低いテキスト・ツー・イメージアテンションスコアを持つビジュアルトークンは、認識可能な情報を含むことができる。
冗長な視覚トークンを識別および解析するための信頼性の高い手法を開発した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:38:10 GMT)
DINeMo: Learning Neural Mesh Models with no 3D Annotations [7.2] カテゴリーレベルの3D/6Dポーズ推定は、総合的な3Dシーン理解に向けた重要なステップである。
最近の研究は、分析バイシンセサイザーの観点から、2Dおよび3Dタスクにアプローチするニューラルネットワークモデルについて検討している。
疑似対応を利用して3次元アノテーションを使わずにトレーニングした新しいニューラルネットワークモデルであるDINeMoを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:23:53 GMT)
Contrastive Learning Guided Latent Diffusion Model for Image-to-Image Translation [7.2] 拡散モデルはテキスト誘導画像翻訳のための多彩で高品質な画像において優れた性能を示した。
pix2pix-zeroConはゼロショット拡散に基づく手法で、パッチワイドのコントラスト損失を利用して追加のトレーニングを不要にする。
我々のアプローチでは、追加のトレーニングは必要とせず、事前訓練されたテキスト-画像拡散モデルで直接動作する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:15:25 GMT)
UniHDSA: A Unified Relation Prediction Approach for Hierarchical Document Structure Analysis [7.1] 我々は、UniHDSAと呼ばれるHDSAの統一的な関係予測手法を提案する。
UniHDSAは、様々なHDSAサブタスクを関係予測問題として扱い、関係予測ラベルを統一ラベル空間に統合する。
UniHDSAの有効性を検証するために,Transformerアーキテクチャに基づくマルチモーダル・エンド・ツー・エンド・システムを開発した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:59:45 GMT)
Lipschitz Constant Meets Condition Number: Learning Robust and Compact Deep Neural Networks [7.0] ネットワークプルーニングの対向的トレーニングフレームワークへの統合は、対向的ロバスト性を促進するために提案されている。
高度に刈り取られた重み行列は不調である傾向にあり、すなわち重み行列の条件数を増やすことが観察されている。
本研究は,ネットワークの重み分布,すなわち条件数制約を伴う変換スパース制約を調整するための,新しいジョイント制約を開発する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:33:18 GMT)
Quantized Area of the Schwarzschild Black Hole: A non-Hermitian Perspective [7.0] 我々は、シュワルツシルト質量の項で直接表現される制約のない還元ハミルトニアンを考える。
これにより、調和振動子レベルの観点から事象-水平領域の量子化が導かれる。
我々はホーキング温度とブラックホールエントロピーに関する新しい表現を導出した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:13:32 GMT)
Harmony: A Joint Self-Supervised and Weakly-Supervised Framework for Learning General Purpose Visual Representations [7.0] 本稿では,視覚的特徴を学習するために,視覚言語学習と識別的・生成的自己スーパービジョンを組み合わせたフレームワークであるHarmonyを紹介する。
当社のフレームワークは, ネガティブな例に頼らず, 1対1の対応問題に対処することで, ウェブスクラッドデータに特化して動作するように設計されている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:23:16 GMT)
Eyes Tell the Truth: GazeVal Highlights Shortcomings of Generative AI in Medical Imaging [6.9] 本稿では,専門的な視線追跡データと直接放射線学的評価を併用して,合成医用画像の品質評価を行うフレームワークであるGazeValを紹介する。
16人の放射線学者による実験により、生成された画像の96.6%が偽物であることが判明した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:11:07 GMT)
An Empirical Study of the Impact of Federated Learning on Machine Learning Model Accuracy [6.9] Federated Learning (FL)は、グローバルスケールでプライベートユーザデータを分散MLモデルでトレーニングすることを可能にする。
我々は,この学習パラダイムが各種MLタスクの最先端MLモデルの精度にどのように影響するかを,体系的に検討する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:52:30 GMT)
ATP: Adaptive Threshold Pruning for Efficient Data Encoding in Quantum Neural Networks [6.8] 我々は、量子ニューラルネットワーク(QNN)における効率的な計算のために、絡み合いを減らし、データの複雑さを最適化する符号化手法であるAdaptive Threshold Pruning (ATP)を導入する。
ATPは適応しきい値に基づいてデータの非定常的特徴を動的に引き起こし、高い性能を維持しながら量子回路の要求を効果的に低減する。
計算効率とモデルレジリエンスのバランスをとるATPの能力を強調し,少ないリソースで大幅な性能向上を実現した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 01:14:26 GMT)
Underwater Image Enhancement by Convolutional Spiking Neural Networks [6.8] 本稿では,水中画像の可視性向上のためのSNNベースのUIEアルゴリズムであるUIE-SNNを紹介する。
トレーニングデータセットがUIE-SNNアーキテクチャのユニークな利点であるエネルギー削減に与える影響を探索し、検証する。
提案アルゴリズムは,PSNRとSSIMを比較検討した結果,PSNRとSSIMを比較検討した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:15:38 GMT)
MamBEV: Enabling State Space Models to Learn Birds-Eye-View Representations [6.7] 我々は,Bird's Eye Viewの統一表現を学習するMamBEVというMambaベースのフレームワークを提案する。
MamBEVは、計算とメモリ効率を大幅に改善した複数の3D知覚タスクをサポートする。
MamBEVの有望なパフォーマンスを様々な視覚的知覚メトリクスで実証する実験である。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 01:01:11 GMT)
SparseGS: Real-Time 360° Sparse View Synthesis using Gaussian Splatting [6.5] 3D Splatting (3DGS)は3Dシーンをリアルタイムにレンダリングして新しいビュー合成を実現した。
この技術は3次元幾何学を正確に再構築するために、密集したトレーニングビューを必要とする。
スパーストレーニングビューのシナリオにおける3DGSの限界に対処するために設計された,効率的なトレーニングパイプラインであるSparseGSを紹介した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:59:58 GMT)
Continual learning via probabilistic exchangeable sequence modelling [6.3] 継続的な学習 (CL) は、過去の経験から有用な情報を保持しながら、継続的に学習し、新しい知識を蓄積する能力である。
本稿では,スケーラブルでトラクタブルなベイズ更新と予測を行う確率的ニューラルプロセスに基づくCLモデルであるCL-Brunoを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:08:20 GMT)
Enhancing Korean Dependency Parsing with Morphosyntactic Features [6.0] 本稿では,Universal Dependencies(UD)とUniversal Morphology(UniMorph)をブリッジする統合フレームワークであるUniDive for Koreanを紹介する。
韓国の豊かな屈折形態と柔軟な語順は、既存のフレームワークに課題をもたらす。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 22:27:26 GMT)
Unleashing HyDRa: Hybrid Fusion, Depth Consistency and Radar for Unified 3D Perception [5.9] 多様な3次元知覚タスクのための新しいカメラレーダ融合アーキテクチャであるHyDRaを紹介する。
我々のハイト・アソシエーション・トランスフォーマー・モジュールは、すでに視界のレーダー機能を利用して、より堅牢で正確な深度予測を行う。
HyDRaは64.2 NDS (+1.8) と58.4 AMOTA (+1.5) のカメラレーダー融合のための新しい最先端技術を実現している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:48:13 GMT)
Ancestral Mamba: Enhancing Selective Discriminant Space Model with Online Visual Prototype Learning for Efficient and Robust Discriminant Approach [5.8] Ancestral Mambaは、オンラインプロトタイプ学習を選択的識別空間モデルに統合する新しいアプローチである。
APAは、モデルがプロトタイプを継続的に適応し、祖先の知識に基づいて新しい課題に取り組むことを可能にする。
MFは目標とするフィードバックメカニズムとして機能し、挑戦的なクラスに集中し、表現を洗練します。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:36:05 GMT)
AutoRad-Lung: A Radiomic-Guided Prompting Autoregressive Vision-Language Model for Lung Nodule Malignancy Prediction [5.7] 肺がんは、世界中でがん関連死亡の原因の1つとなっている。
臨床実践では、放射線技師はCT画像から抽出した定量的で手作りの放射線学的特徴に頼っている。
本稿では,手作りラジオミクスから発生するプロンプトと,自己回帰的に事前訓練されたVLMを結合したAutoRad-Lungを紹介する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:56:48 GMT)
Don't Use LLMs to Make Relevance Judgments [5.7] 最近の大きな言語モデルの出現は、自然言語のプロンプトに反応して、驚くべきほど人間らしく流れるテキストを生成することで、IR研究者は、それらのモデルが関連判断の収集プロセスでどのように使われるのか疑問に思うようになった。
ACM SIGIR 2024 カンファレンスでは,ワークショップ LLM4Eval' が,この作業の場を提供し,TREC 深層学習トラックの判断を再現するデータチャレンジ活動を開催した。
ボトムアップフロントのメッセージは、TRECスタイルの評価のための関連判断を作成するためにLLMを使用しないことです。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:08:41 GMT)
Valid Conformal Prediction for Dynamic GNNs [5.6] 我々はテンソル文献で知られている動的グラフ表現を展開として使用し、共形予測によって有効な予測セットを達成する。
私たちの重要な貢献の1つは、動的グラフモデリングの文脈で起こりうる異なる推論シナリオに関する慎重に数学的考察である。
有効性を示し、ベースラインよりも精度が向上し、異なる障害モードにサインポストした実データ例を提供する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:54:52 GMT)
Contextual Similarity Distillation: Ensemble Uncertainties with a Single Model [5.6] 不確かさの定量化は強化学習と深層学習の重要な側面である。
本研究では,1つのモデルによる深層ニューラルネットワークのアンサンブルの分散を明示的に推定する新しい手法である文脈類似蒸留を提案する。
提案手法は,様々なアウト・オブ・ディストリビューション検出ベンチマークとスパース・リワード強化学習環境にまたがって実証的に検証する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:31:36 GMT)
$β$-GNN: A Robust Ensemble Approach Against Graph Structure Perturbation [5.6] グラフニューラルネットワーク(GNN)は、コンピュータシステムの効率的な操作とセキュリティにおいて、ますます重要な役割を担っている。
クリーンなデータ性能を犠牲にすることなく、GNNの堅牢性を向上するモデルである$beta$-GNNを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:24:07 GMT)
Is Reuse All You Need? A Systematic Comparison of Regular Expression Composition Strategies [5.5] 著者: コンポジションタスクは専用の機械を活用できるほどユニークなものなのでしょうか?
GitHubとRegExLibから抽出された新しいコンポジションタスクのデータセットを収集します。
本評価では,新しい計量を含む複数の次元を用いて,2つの合成手法との比較を行った。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:25:27 GMT)
MedSegNet10: A Publicly Accessible Network Repository for Split Federated Medical Image Segmentation [5.4] MedSegNet10は、スプリットフェデレーション学習を用いた医用画像セグメンテーション用に設計されたレポジトリである。
SplitFedの利点を活用することで、MedSegNet10はプライベートに格納された水平に分割されたデータの協調トレーニングを可能にし、プライバシと整合性を保証する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:40:59 GMT)
Wasserstein Distributionally Robust Bayesian Optimization with Continuous Context [5.4] 我々は,文脈分布の不確実性の下での逐次的データ駆動意思決定の課題に対処する。
We propose a novel algorithm for Wasserstein Distributionally Robust Bayesian Optimization。
我々の理論解析はヒルベルト空間における自己正規化濃度と分布的ロバストな最適化のための有限サンプル境界の最近の結果を組み合わせたものである。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:11:17 GMT)
Sampling reduced density matrix to extract fine levels of entanglement spectrum and restore entanglement Hamiltonian [5.4] 還元密度行列(RDM)の正確な抽出を可能にする,低い技術的障壁を持つ量子モンテカルロスキームを提案する。
RDMの対数固有値である絡み合いスペクトル(ES)の微細なレベルを示す。
シミュレーションの結果、前例のない大規模なシステムサイズを生かし、RDMに基づいて絡み合い量を決定するための実用的な計算枠組みを確立した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:02:37 GMT)
Harnessing Mixed Features for Imbalance Data Oversampling: Application to Bank Customers Scoring [5.1] MGS-GRFは複合機能用に設計されたオーバーサンプリング戦略である。
その結果,MGS-GRFはコヒーレンス(コヒーレンス),すなわち,原データセットにすでに存在する分類的特徴の組み合わせのみを生成できる能力,すなわち連続的特徴と分類的特徴との依存性を維持できる能力の2つの重要な特性を示すことがわかった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:53:40 GMT)
Self-ReS: Self-Reflection in Large Vision-Language Models for Long Video Understanding [5.1] SelfReSは、ユーザのプロンプトに基づいてキービデオフラグメントを動的に選択する、非時間的自己反射サンプリング手法である。
SelfReSは、強力なベースLVLMにシームレスに統合することができ、長時間ビデオタスクの精度を改善し、同じGPUメモリ予算で最大46%高速な推論速度を達成することができる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:39:58 GMT)
An Efficient scaled opposite-spin MP2 method for periodic systems [5.0] 我々は,SOS-RILT-MP2アルゴリズムを開発した。
従来のMP2と比較して,SOS-RILT-MP2の効率は大幅に向上した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:12:02 GMT)
Stabilizer Entanglement as a Magic Highway [5.0] 本研究では,局所的に注入された魔法の普及を促進するハイウェイとして,安定化器の絡み合いが機能することを示す。
我々は,浅深度レンガ加工回路による非安定化器の絡み合いとマジックインジェクションに解析を拡張した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:00:04 GMT)
Decoherence time maximization and partial isolation for open quantum harmonic oscillator memory networks [4.9] ハイゼンベルク図形量子メモリは、ハイゼンベルク図形量子メモリとして用いられる。
本稿では、量子ネットワークが外部フィールドにのみ影響される動的変数のサブセットを持つような設定について論じる。
部分的に分離されたサブネットワークは、高忠実度限界においてより長いデコヒーレンス時間を持ち、量子メモリの特に関連する候補となる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:09:47 GMT)
Look Before Leap: Look-Ahead Planning with Uncertainty in Reinforcement Learning [4.9] モデルに基づく探索計画を用いた不確実性を考慮したポリシー最適化のための新しいフレームワークを提案する。
政策最適化フェーズでは、不確実性駆動型探索政策を活用し、多様なトレーニングサンプルを積極的に収集する。
我々のアプローチは、様々な状態/行動空間と報酬構造を持つタスクに柔軟性と適用性を提供します。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 01:07:35 GMT)
Exploration of Multi-Element Collaborative Research and Application for Modern Power System Based on Generative Large Models [4.9] ジェネレーティブ・大型モデル(GLM)は、予測、スケジューリング、市場操作を強化するデータ駆動型アプローチを提供する。
時間的モデリングと強化学習を活用することで、GLMは動的エネルギースケジューリングを可能にし、グリッド安定性を改善し、炭素取引戦略を強化し、極端な気象イベントに対するレジリエンスを強化する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:58:49 GMT)
MMRL: Multi-Modal Representation Learning for Vision-Language Models [4.8] MMRL(Multi-Modal Representation Learning)は、共有、学習可能、モダリティに依存しない表現空間を導入するフレームワークである。
MMRLはスペーストークンをテキストと画像表現トークンに投影し、より効果的なマルチモーダルインタラクションを促進する。
15のデータセットにわたる実験では、MRLが最先端の手法より優れていることが示されている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:35:10 GMT)
Four Things People Should Know About Migraines [4.8] 一般大衆の偏頭痛リテラシーは低いことが知られており、この理解の欠如は移住者の生活の質に悪影響を及ぼす。
Redditのソーシャルメディアプラットフォーム上での偏頭痛に関する議論をテキストマイニングで調査する。
我々はこの知見を「慢性片頭痛について人々が知っておくべき4つのこと」という形で要約する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:19:31 GMT)
VesselSAM: Leveraging SAM for Aortic Vessel Segmentation with LoRA and Atrous Attention [4.8] 大動脈血管分節に対するSegment Anything Model(SAM)の拡張版であるVesselSAMを提案する。
VesselSAM には,Atrous Attention と Low-Rank Adaptation (LoRA) を統合した新たなモジュールであるAtrousLoRA が組み込まれている。
本稿では,Aortic Vessel Tree (AVT) データセットとType-B Aortic Dissection (TBAD) データセットの2つの挑戦的データセットを用いて VesselSAM を評価する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:10:48 GMT)
Low-resource Information Extraction with the European Clinical Case Corpus [4.7] 医療領域における多言語データセットであるE3C-3.0を提案する。
このデータセットには、5つの言語のネイティブテキストと、英語ソースから5つのターゲット言語に翻訳され投影されたテキストの両方が含まれている。
自動アノテーション投影を含む半自動的な手法が実装されている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:07:40 GMT)
Certified randomness using a trapped-ion quantum processor [4.7] インターネット経由でアクセスされたイオン量子コンピュータを用いて、ランダムなビットの生成を実証する。
我々は,我々のプロトコルのセキュリティを,現実的な短期的敵の限られたクラスに対して分析する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:38:22 GMT)
LogicQA: Logical Anomaly Detection with Vision Language Model Generated Questions [4.6] 異常検出(AD)を強化するフレームワークであるLogicQAを紹介する。
LogicQAは自動生成された質問をチェックリストにコンパイルし、論理的制約の違反を特定するために応答を収集する。
我々は,AUROCが87.6%,F1-maxが87.0パーセント,異常が説明されるとともに,公開ベンチマークであるMVTec LOCO AD上でのSOTA(State-of-the-art) Logical ADのパフォーマンスを達成した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:38:45 GMT)
RBFleX-NAS: Training-Free Neural Architecture Search Using Radial Basis Function Kernel and Hyperparameter Detection [4.6] RBFleX-NASは、最後の層の活性化出力と入力特徴の両方を考慮に入れた、新しいトレーニングフリーNASフレームワークである。
RBFleX-NASは、トップ1の精度で最先端のトレーニングなしNAS法を著しく上回っている。
NAFBeeも提案する。NAFBeeは、アクティベーションタイプを拡張して、様々なよく使われる関数を包含する新しいアクティベーション設計空間である。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:15:21 GMT)
Intuitive Axial Augmentation Using Polar-Sine-Based Piecewise Distortion for Medical Slice-Wise Segmentation [4.5] 我々は,従来のデジタル画像とは別に,医用画像の特徴を再考し,認識する。
本稿では, より弾力性が高く, 放射線検査法に適合する医用別拡張アルゴリズムを提案する。
本手法は,医療従事者にとって直感的な設計と理解の容易さが特徴である。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:19:56 GMT)
Towards End-to-End Neuromorphic Voxel-based 3D Object Reconstruction Without Physical Priors [4.5] ニューロモルフィックカメラを用いた高密度ボクセル3次元再構成のためのエンドツーエンド手法を提案する。
本手法は, ベースライン法に比べて54.6%の再現精度向上を実現している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:16:53 GMT)
A Survey on Event-driven 3D Reconstruction: Development under Different Categories [4.5] イベントカメラは、高時間分解能、低レイテンシ、高ダイナミックレンジのため、3次元再構成に注目が集まっている。
本稿では,ステレオ,モノクラー,マルチモーダルシステムを含むイベント駆動型3D再構成手法の総合的なレビューを行う。
ニューラルラディアンス場やイベントデータを用いた3次元ガウススプラッティングといった新興トレンドも取り上げている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:34:34 GMT)
Global and Local Structure Learning for Sparse Tensor Completion [4.4] 本稿では,テンソルの欠落を正確に予測するために,TGL(Tensor Decomposition Learning Global and Local Structures)を提案する。
TGLは、事前の知識なしにGNNで局所構造を学習する因子でテンソルを再構成する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:02:04 GMT)
Three Cars Approaching within 100m! Enhancing Distant Geometry by Tri-Axis Voxel Scanning for Camera-based Semantic Scene Completion [4.4] ScanSSCは、Scan ModuleとScan Lossで構成されるカメラベースのセマンティックシーンコンプリートモデルである。
スキャンモジュールは軸方向のマスキングを使用しており、各軸は近距離から遠距離のカスケードマスキングを用いており、これは以前のボクセルとの関係を捉えることができる。
Scan Lossは累積ロジットとそれに対応するクラス分布のそれぞれの軸に沿って、近距離方向のクロスエントロピーを計算し、リッチなコンテキスト認識信号を遠くのボクセルに伝搬する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:31:32 GMT)
Quantum advantage for learning shallow neural networks with natural data distributions [4.4] 本研究では,QSQモデルにおける周期性ニューロンの学習に有効な量子アルゴリズムについて検討した。
我々の知る限り、我々の研究は、実数値関数を明示的に考慮する古典関数に対する量子学習理論の最初の成果である。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:00:17 GMT)
Siformer: Feature-isolated Transformer for Efficient Skeleton-based Sign Language Recognition [4.4] 手話認識とは、与えられたビデオから手話のグルースを自動的に解釈することを指す。
最近の骨格に基づく行動認識は、被験者と背景のばらつきを個別に扱う能力によって、注目を集めている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:10:29 GMT)
The Art of Tool Interface Design [4.3] 本稿では,課題推論タスクにおける最先端技術を実現するエージェントフレームワーク,Thinkerを提案する。
GPT-4o(バージョン2024-06-01)で82.6%の成功率(ベースライン:68.3%)、Llama-3.1 405B(ベースライン:49.6%)で81.9%の成功率を達成した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 23:02:00 GMT)
Workshop Scientific HPC in the pre-Exascale era (part of ITADATA 2024) Proceedings [4.3] 2024年9月18日、イタリアのピサで開催されたSHPCのワークショップ「Scientific HPC in the pre-Exascale era (S HPC)」。
S HPCワークショップの主な目的は、天体物理学、宇宙論、その他の科学的文脈や実験において、現在のHPCにおける最も重要な質問がどのように出現するかを議論することであった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:22:15 GMT)
Perception of Visual Content: Differences Between Humans and Foundation Models [4.3] 本研究では、多様な社会経済的文脈を表す画像の人為的およびML的アノテーションを比較した。
本データセットは,様々な地域・所得水準の人々のイメージで構成され,日々の行動や家庭環境を網羅している。
我々は、人間とML生成アノテーションを意味的に比較し、予測モデルへの影響を評価する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:02:34 GMT)
Evaluating Facial Expression Recognition Datasets for Deep Learning: A Benchmark Study with Novel Similarity Metrics [4.1] 本研究では,ディープラーニングモデルの学習に広く用いられている顔表情認識(FER)データセットの特徴と適合性について検討した。
子ども, 成人, 高齢者など特定の年齢層を対象として, 24 FER データセットを収集, 分析した。
最先端のニューラルネットワークを用いたベンチマーク実験では、大規模で自動収集されたデータセットがより一般化される傾向があることが明らかになった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:01:00 GMT)
Permutation polynomials over finite fields from low-degree rational functions [4.0] 置換二項式の2つのクラスと置換五項式の6つのクラスを$F_q2$で得られる。
得られた二項式および五項式は,文献で知られているものと同等の準乗法であることを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:47:47 GMT)
Dual Audio-Centric Modality Coupling for Talking Head Generation [4.0] 音声駆動音声ヘッドビデオの生成は、仮想アバターやデジタルメディアなど、コンピュータビジョンとグラフィックスにおいて重要な課題である。
従来のアプローチは、しばしば音声と顔のダイナミックスの間の複雑な相互作用を捉え、唇の同期と視覚的品質の問題を引き起こす。
音声入力からコンテンツや動的特徴を効果的に統合する新しいNeRFベースのフレームワークであるDual Audio-Centric Modality Coupling (DAMC)を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:46:51 GMT)
DEMENTIA-PLAN: An Agent-Based Framework for Multi-Knowledge Graph Retrieval-Augmented Generation in Dementia Care [4.0] 本稿では,DementIA-PLANを提案する。
本モデルは,多次元知識表現を統合した多次元知識グラフアーキテクチャを用いている。
私たちの注目すべき革新は、知識検索と意味統合を協調する自己回帰計画エージェントです。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:34:04 GMT)
TN-Eval: Rubric and Evaluation Protocols for Measuring the Quality of Behavioral Therapy Notes [4.0] 行動療法用紙の品質基準は未整備である。
ルーリックベースの手動評価プロトコルは、従来のLikertスケールアノテーションよりも信頼性が高く解釈可能な結果を提供する。
ブラインドテストでは、セラピストは、セラピストが書いたノートよりもLLMが生成したノートの方が優れていると判断し、判断する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:40:40 GMT)
Narrating the Video: Boosting Text-Video Retrieval via Comprehensive Utilization of Frame-Level Captions [4.0] 本稿では,フレームレベルの字幕から得られる包括的情報を戦略的に活用するナレーション・ザ・ビデオ(NarVid)を提案する。
提案したNarVidは,ナレーションを複数の方法で活用する。1)ナレーションとビデオ間の相互モーダルな相互作用による機能強化,2)無関係あるいは不正な情報を抑制するためのクエリ対応適応フィルタリング,3)クエリ-動画類似度とクエリ-ナレーション類似度を付加したデュアルモーダルマッチングスコア。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:09:24 GMT)
A Survey of Multimodal Retrieval-Augmented Generation [4.0] MRAG(Multimodal Retrieval-Augmented Generation)は、マルチモーダルデータ(テキスト、画像、ビデオ)を検索および生成プロセスに統合することにより、大規模言語モデル(LLM)を強化する。
近年の研究では、MRAGは視覚とテキストの両方の理解を必要とするシナリオにおいて、従来の検索・拡張生成(RAG)よりも優れていることが示されている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:43:09 GMT)
Enhancing Multi-modal Models with Heterogeneous MoE Adapters for Fine-tuning [3.9] マルチモーダルモデルはクロスモーダルなタスクでは優れているが、数十億のパラメータのために計算コストが高い。
既存の手法は主にユニモーダル処理に重点を置いており、マルチモーダルタスクに必要な重要なモーダル融合を見越している。
我々は,従来のPEFTフレームワークを拡張して,マルチモーダルな専門家の組み合わせをサポートし,情報インタラクションを改善する専門家の混在を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:26:18 GMT)
Efficient Training of Neural Stochastic Differential Equations by Matching Finite Dimensional Distributions [3.9] 連続マルコフ過程を比較するための新しいスコアリングルールを開発する。
このスコアリングルールにより、シグネチャカーネルに関連する計算オーバーヘッドを回避できます。
計算効率と生成品質の両面において,FDMが既存の手法よりも優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:23:51 GMT)
Monte Carlo Simulation of Operator Dynamics and Entanglement in Dual-Unitary Circuits [3.9] 二重単位回路における演算子ダイナミクスと絡み合い成長について検討する。
我々の研究は、長期演算子の進化と絡み合いを研究するためのスケーラブルな計算フレームワークを提供する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:48:07 GMT)
PRECTR: A Synergistic Framework for Integrating Personalized Search Relevance Matching and CTR Prediction [3.8] 検索レコメンデーションシステムにおける2つの主要なタスクは、検索関連性マッチングとクリックスルー率(CTR)予測である。
パーソナライズされた検索関連マッチングとCTR予測融合モデル(PRECTR)を提案する。
具体的には、CTR予測と検索関連性マッチングを1つのフレームワークに統合し、2つのモジュールの相互作用と一貫性を強化する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:38:27 GMT)
TS-Inverse: A Gradient Inversion Attack Tailored for Federated Time Series Forecasting Models [3.7] フェデレーション学習は、プライバシに敏感な時系列データを持つクライアントが、予測モデルを協調的に学習することを可能にする。
サーバはグラデーション・インバージョン・アタック(GIA)を通じてクライアントのトレーニングデータを再構築できる
GIAは画像分類タスクに対して実証されるが、時系列回帰タスクについてはほとんど知られていない。
本稿では,勾配インバージョンモデルを学習することにより,TSデータの逆変換を改善する新しいGIAであるTS-Inverseを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:35:49 GMT)
Implicit neural representations for end-to-end PET reconstruction [3.7] Inlicit Neural representations (INRs) は、様々な医療画像のタスクにおいて強力な機能を示した。
暗黙的SIRENニューラルネットワークアーキテクチャに基づく教師なしPET画像再構成手法を提案する。
本手法では, ホログラムから直接PET画像の再構成を行うために, 前方投影モデルと損失関数が組み込まれている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:30:53 GMT)
Symmetry-Informed Graph Neural Networks for Carbon Dioxide Isotherm and Adsorption Prediction in Aluminum-Substituted Zeolites [3.6] 物質対称性を利用して吸着特性予測を改善するグラフニューラルネットワークアーキテクチャであるSymGNNを導入する。
メッセージパッシング機構に対称性演算を組み込むことで、異なるトポロジ間のパラメータ共有が促進され、一般化が向上する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:08:28 GMT)
A Retrieval-Based Approach to Medical Procedure Matching in Romanian [3.6] 命名規則の不整合は、誤った手続きにつながり、行政上の非効率性や保険請求問題を引き起こす。
本稿では,ルーマニアの医療システムにおける医療名マッチングのための文埋め込みを利用した検索型アーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:54:16 GMT)
OASST-ETC Dataset: Alignment Signals from Eye-tracking Analysis of LLM Responses [3.6] OASST-ETCは、24人の参加者の読書パターンを捉えた新しいアイトラッキングコーパスである。
分析の結果,好ましくない反応と好ましくない反応の読解パターンが明らかとなった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:24:43 GMT)
Contractive Dynamical Imitation Policies for Efficient Out-of-Sample Recovery [3.5] 模倣学習(imitation learning)は、専門家の行動からポリシーを学ぶための、データ駆動型アプローチである。
OOS(Out-of-sample)領域では信頼性の低い結果が出る傾向がある。
本稿では,契約型力学系をモデルとした政策学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:39:58 GMT)
Exploring the Effect of Robotic Embodiment and Empathetic Tone of LLMs on Empathy Elicitation [3.5] 本研究は, 社会的エージェントとの相互作用を通じて, 第三者に対する共感の誘発について検討した。
インタラクションは、困難な状況にあり、金銭的な寄付を必要としている架空のキャラクター、Katie Banksに焦点を当てている。
参加者数によって測定されたKatieの支援意欲は、エージェントに対する認識とともに、60人の参加者に対して評価された。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:00:05 GMT)
Spectrum from Defocus: Fast Spectral Imaging with Chromatic Focal Stack [3.5] ハイパースペクトルカメラは、本質的に低光度状態において、空間、スペクトル、時間分解能の間の厳しいトレードオフに直面している。
我々は,市販光学系と計算1秒の小さなシステムで,最先端のハイパースペクトル像を復元するカラー焦点消去法であるDefocusからSpectrumを提示する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:17:43 GMT)
On the Robustness of Kernel Ridge Regression Using the Cauchy Loss Function [3.5] ロバスト回帰は、外れ値、重み付き分布、または汚染データの存在下で未知の回帰関数を推定する手法を開発することを目的としている。
頑健な回帰における既存の理論結果の多くは、ノイズは有限絶対平均を持ち、コーシーやいくつかのノイズのような特定の分布に反する仮定を仮定している。
絶対平均が無限である場合でも、任意の順序の有限モーメントで全ての雑音分布を許容する一般化されたコーシーノイズフレームワークを導入する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 00:00:53 GMT)
Precise Asymptotic Generalization for Multiclass Classification with Overparameterized Linear Models [3.5] Subramanian et al.'22 の予想では、データポイント、特徴、クラスの数はすべて一緒になる。
我々の新しい下限は情報理論の強い逆に似ており、それらは誤分類率が0か1に近づくことを証明している。
厳密な解析の鍵はハンソン・ライトの不等式の新しい変種であり、スパースラベルの多重クラス問題に広く有用である。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 23:20:04 GMT)
A Pretraining-Finetuning Computational Framework for Material Homogenization [3.4] 均質化(homogenization)は、多スケールの物理現象を研究するための基本的なツールである。
本稿では,事前学習と微調整という2つのフェーズからなる新しい数値均質化フレームワークであるPreFine-Homoを提案する。
PreFine-Homoの事前学習フェーズは、従来の方法よりも1000倍高速な均質化を実現し、微調整フェーズは精度をさらに向上させる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:52:45 GMT)
Tunable coherent microwave beam splitter and combiner at the single-photon level [3.2] ビームスプリッター(ビームスプリッター、英: beam splitter)は、様々な光学系とマイクロ波系の光路を誘導・結合するために用いられる重要な構成要素である。
1次元開放導波路における周波数可変超伝導人工原子を利用した非線形ビームスプリッタとビームコンバインダを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:26:46 GMT)
Persistence of Backdoor-based Watermarks for Neural Networks: A Comprehensive Evaluation [3.2] バックドアベースの透かしは近年、プロプライエタリな権利を守るために活発に開発されている。
本稿では,ニューラルネットワークにおける最近のバックドアベース透かしの持続性について,微調整のシナリオで評価する。
トリガセットを露出することなく微調整後に透かしを復元する新しいデータ駆動型アイデアを提案・開発する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:09:41 GMT)
Modeling Story Expectations to Understand Engagement: A Generative Framework Using LLMs [3.2] 本稿では,ストーリーがどのように展開されるかという聴衆の考え方をモデル化するための新しい枠組みを紹介する。
提案手法は,各ストーリーの複数の潜在的継続を生成し,期待,不確実性,驚きに関連する特徴を抽出する。
その結果、読み、コメント、投票のためのエンゲージメントの異なるタイプは、現在のコンテンツ機能と期待されるコンテンツの異なる組み合わせによって引き起こされることが明らかとなった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:59:18 GMT)
Equivalence between the second order steady state for the spin-Boson model and its quantum mean force Gibbs state [3.1] 量子系が無視できないとき、その定常状態は教科書のギブス状態から逸脱する。
この定常状態は対応する一般化されたギブス状態と全く同じであることを示す。
この結果を用いて、パラメータの物理的選択の下での二重量子ドット系の力学と定常状態について検討する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:02:12 GMT)
An Encoding of Interaction Nets in OCaml [3.1] 本稿では,プログラミング言語OCamlにおけるインタラクションネットの符号化について,シンプルで簡潔なアプローチを示す。
この目的を達成するために、インタラクションネットプリミティブだけでなく、Lafontのオリジナル型システムもエンコードする。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:50:39 GMT)
TAR: Teacher-Aligned Representations via Contrastive Learning for Quadrupedal Locomotion [3.1] 強化学習(Reinforcement Learning, RL)による四足歩行運動は、教師/学生のパラダイムを用いて一般的に解決される。
本稿では,自己指導型コントラスト学習による特権情報を活用したTAR(Teacher-Aligned Representations)を提案する。
その結果,最先端のベースラインに比べて2倍のトレーニングが促進され,ピーク性能が得られた。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:49:26 GMT)
Network Inversion for Generating Confidently Classified Counterfeits [3.0] ネットワーク・インバージョン・テクニックを拡張して、信頼度の高い正偽合成サンプルを生成する。
本研究では, ジェネレータのコンディショニング機構をソフトベクトルコンディショニングからワンホットベクトルコンディショニングに変更することで実現した。
これにより、ジェネレータは、可塑性かつ確実な分類の両方のサンプルを生成できる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:26:49 GMT)
EVT: Efficient View Transformation for Multi-Modal 3D Object Detection [3.0] Bird's Eye View (BEV) 表現におけるマルチモーダルセンサの融合は、3Dオブジェクト検出における主要なアプローチとなっている。
本稿では,よく構造化されたBEV表現を構成する新しい3次元オブジェクト検出フレームワークであるEfficient View Transformation (EVT)を提案する。
nuScenesテストセットでは、EVTはリアルタイムの推論速度で75.3% NDSの最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:34:52 GMT)
Moiré Superradiance in Cavity Quantum Electrodynamics with Quantum Atom Gas [3.0] 本研究では, 1次元冷間原子空洞結合系におけるモーア効果を示す手法を提案する。
我々は空洞場スペクトルを導出し、動的構造因子に結合し、制御された原子拡散を示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:38:37 GMT)
Attention Xception UNet (AXUNet): A Novel Combination of CNN and Self-Attention for Brain Tumor Segmentation [3.0] 提案されたAttention Xception UNet (AXUNet)アーキテクチャは、Xceptionのバックボーンとドット生成自己保持モジュールを統合している。
AXUNetは全腫瘍(WT)および腫瘍コア(TC)領域で優れたDiceスコアを獲得し、WTは92.59、TCは86.81、ETは84.89を達成した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:22:17 GMT)
Adaptive State-Space Mamba for Real-Time Sensor Data Anomaly Detection [2.9] 本稿では,リアルタイムセンサデータ異常検出のためのemphAdaptive State-Space Mambaフレームワークを提案する。
我々のアプローチは、迅速で信頼性の高い検出機能を必要とする他の時系列タスクに容易に適用できます。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:37:48 GMT)
Reliable algorithm selection for machine learning-guided design [2.9] 本稿では,アルゴリズム選択のための設計手法を提案する。
ユーザが指定した成功基準を満たすデザインラベルの分布を生成するデザインアルゴリズムを選択することを目的としている。
本手法の有効性をシミュレートされたタンパク質およびRNA設計タスクで示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:52:19 GMT)
Enabling Heterogeneous Adversarial Transferability via Feature Permutation Attacks [2.9] ブラックボックス設定でのアドリアック攻撃は非常に実践的です。
転送ベースの攻撃は、敵の例を生成するのに最も効果的である。
本稿では,多様なアーキテクチャをまたいだ対向移動性を向上させるゼロFLOP,パラメータフリーな手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:20:17 GMT)
Fast and Noise-aware Machine Learning Variational Quantum Eigensolver Optimiser [2.9] 変分量子固有解法(VQE)は、ノイズのあるデバイスで基底状態を作成するためのハイブリッド量子古典的アルゴリズムである。
本研究では、中間パラメータと測定データに基づいて教師付き機械学習を用いて最適な最終パラメータを推定する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:07:38 GMT)
Optimizing Safe and Aligned Language Generation: A Multi-Objective GRPO Approach [2.9] ヒューマンフィードバックからの強化学習は、ステアリングモデルにおいて顕著な成功を収めてきたが、複雑で不安定である可能性がある。
直接選好最適化(DPO)のような最近のアプローチは、好みに基づく微調整を単純化するが、バイアスや特定の目的のトレードオフをもたらす可能性がある。
安全かつ整合性のある言語生成を実現するために,多ラベル報酬回帰モデルを用いたグループ相対政策最適化フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:50:33 GMT)
T-Graphormer: Using Transformers for Spatiotemporal Forecasting [2.9] T-Graphormerは、ルート平均二乗誤差(RMSE)と平均絶対パーセンテージ誤差(MAPE)を最大20%と10%削減する。
本稿では,T-Graphormerのリアルタイムトラフィック予測ベンチマークに対する有効性を示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:43:36 GMT)
TopoBDA: Towards Bezier Deformable Attention for Road Topology Understanding [2.8] 本稿では,道路トポロジの理解を深める新しいアプローチであるTopoBDAを紹介する。
TopoBDAは、マルチカメラの360度画像を処理して、Bird's Eye View(BEV)機能を生成する。
BDAはベジエ制御点を用いて変形可能なアテンション機構を駆動し、細長いポリリン構造の検出と表現を改善している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:29:03 GMT)
Digital quantum magnetism at the frontier of classical simulations [2.8] 我々は量子イジングモデルのディジタル化ダイナミクスをシミュレートするためにQuantinuumのH2量子コンピュータを使用する。
達成可能なディジタル化誤差によるダイナミクスの安定性の確認に加えて,結果の局所平衡の直接的証拠を示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:00:02 GMT)
Text-to-Model: Text-Conditioned Neural Network Diffusion for Train-Once-for-All Personalization [2.8] テキスト・ツー・モデル生成におけるGenAIの能力について検討する。
具体的には、列車一対一パーソナライズという現実的なシナリオについて検討する。
我々は、全個人化のためのテキスト条件付きニューラルネットワーク拡散であるTinaを提示する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:33:17 GMT)
Variational Quantum Algorithms in the era of Early Fault Tolerance [2.8] 量子コンピューティングのロードマップは、次の3~5年で10,000量子ビットデバイスが利用可能になることを予測している。
マジック状態注入によるRz回転をしながらクリフォード演算を誤り訂正する戦略である部分誤差補正(pQEC)を導入する。
以上の結果から,pQECは標準手法よりも9.27倍のVQA忠実度を向上できることが示された。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:06:32 GMT)
Comparison of marker-less 2D image-based methods for infant pose estimation [2.8] 成人で訓練された最高パフォーマンスジェネリックモデルであるViTPoseも幼児で最高のパフォーマンスを発揮する。
トップダウンビューから得られるポーズ推定精度は、対角ビューから得られるポーズ推定精度よりも著しく優れている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:45:59 GMT)
Uncertainty-Aware Graph Self-Training with Expectation-Maximization Regularization [2.7] 半教師付きノード分類のためのグラフ自己学習手法を提案する。
本手法は,擬似ラベル生成とモデル再学習における不確実性機構を組み込んだものである。
我々のフレームワークは、ノイズの多いグラフ構造や特徴空間をより効率的に扱うように設計されています。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:52:21 GMT)
Generalized Phase Pressure Control Enhanced Reinforcement Learning for Traffic Signal Control [2.7] 我々は,交通信号制御ポリシーを学習するための,柔軟で効率的かつ理論的に基礎づけた手法を開発した。
待ち行列理論に基づいて, 圧力制御理論を多元系道路網の一般形式に拡張する。
我々は、一般化位相状態表現とMPLightとCoLightを組み合わせることにより、強化学習(RL)ベースのアルゴリズムテンプレートG2P-XLightと、2つのRLアルゴリズムG2P-MPLightとG2P-CoLightを開発する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:03:12 GMT)
D4R -- Exploring and Querying Relational Graphs Using Natural Language and Large Language Models -- the Case of Historical Documents [2.6] D4Rは、非技術者、特に歴史家を支援するために設計されたデジタルプラットフォームである。
自然言語の質問をCypherクエリに変換し、Neo4Jデータベースからデータの検索を可能にする。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:41:42 GMT)
ProtoBERT-LoRA: Parameter-Efficient Prototypical Finetuning for Immunotherapy Study Identification [2.6] ProtoBERT-LoRAはPubMedBERTとプロトタイプネットワークを組み合わせたハイブリッドフレームワークであり、ローランド適応(LoRA)を効率よく微調整する。
トレーニング(20正,20負),プロトタイプセット(10正,10負),バリデーション(20正,200負),テスト(71正,765負)に分けた。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:09:11 GMT)
Segmenting Bi-Atrial Structures Using ResNext Based Framework [2.6] 心房細動(英: atrial fibrillation、AF)は、心不整脈で最も一般的な疾患であり、特に高齢者の死亡に寄与する。
最近の研究は、追加の心房領域、特に後期ガドリニウム強調MRI(LGE-MRI)で同定される線維性領域を標的にすることの重要性を強調している。
ディープラーニング技術、特に畳み込みニューラルネットワーク(CNN)は、セグメンテーションの自動化を約束している。
LGE-MRIにおいて,ResNeXtエンコーダと,右心房(RA)とLA壁と空洞の両方を分割する循環学習率を組み合わせた新しい2段階のフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 22:43:13 GMT)
An $(ε,δ)$-accurate level set estimation with a stopping criterion [2.5] 本稿では,停止基準を組み込んだレベルセット推定手法を提案する。
提案手法は,既存のアプローチにおける重要なギャップに対処するため,信頼性レベル1-delta$で$epsilon$-accuracyを満足することを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:41:07 GMT)
ML-Triton, A Multi-Level Compilation and Language Extension to Triton GPU Programming [2.5] Tritonは、より高いレベルでプログラミングによって、よりユーザフレンドリでポータブルな代替手段を提供するDSLです。
マルチレベルのコンパイルフローとプログラミングインタフェースを備えたML-Tritonを提案する。
提案手法は,Intel GPU上でのエキスパート記述カーネルの95%以上の性能を実現する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:06:37 GMT)
Learning Partial Graph Matching via Optimal Partial Transport [2.4] 最適部分移動にインスパイアされた部分グラフマッチングのための新しいフレームワークを提案する。
提案手法は, 偏りを取り入れつつ部分的代入を可能にする目的を定式化したものである。
我々の手法は,3次最悪のケースタイムの複雑さの中で,効率的かつ正確な解が得られる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:09:40 GMT)
Screening for Diabetes Mellitus in the U.S. Population Using Neural Network Models and Complex Survey Designs [2.4] 本稿では,ニューラルネットワーク(NN)モデルを用いた回帰と分類のための一般的な予測フレームワークを提案する。
この枠組みを適用し、アメリカの人口における糖尿病のリスクを評価するための頑健なリスクスコアモデルを開発する。
糖尿病に焦点が当てられているが、このNN予測フレームワークは様々な疾患や医療コホートにまたがる臨床モデルの開発に適応できる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 00:00:48 GMT)
Sociotechnical Effects of Machine Translation [2.4] 我々は、関連する副作用とリスクのいくつかと、それらが緩和される可能性について論じる。
ニューラルMTへの移行とLarge Language Models (LLMs) を用いたアプローチにより、気候変動に関連性がある。
危機シナリオでMTを適切に利用すれば、どのように命が救われるかを示し、その方法を提供します。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:49:46 GMT)
Explainable ICD Coding via Entity Linking [2.3] 臨床コーディングは医療において重要な課題である。
従来のクリニカルコーディングの自動化方法は、生産環境におけるコーダーに十分な証拠を与えない可能性がある。
本稿では,各文書にコードセットと各テキストのエビデンスをアノテートしたエンティティリンク問題として,タスクを再編成することを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:49:35 GMT)
MERGE: Matching Electronic Results with Genuine Evidence for verifiable voting in person at remote locations [2.2] 本稿では,電子投票の速さと紙返却の信頼性を組み合わせたMERGEプロトコルを提案する。
このプロトコルにより、有権者は投票の電子的記録を迅速に提出し、同時に紙票を送信して検証を行うことができる。
電子記録は予備的な結果に使用することができるが、紙の投票は時間が経過した場合にはリスク限界監査(RLA)で使用され、選挙の完全性を保証する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 01:51:52 GMT)
Iterative Prompting with Persuasion Skills in Jailbreaking Large Language Models [2.2] 本研究では,大規模言語モデル (LLM) を反復的プロンプト手法で活用する。
GPT-3.5, GPT-4, LLaMa2, Vicuna, ChatGLMなどのLCMの応答パターンを解析した。
説得戦略は、悪意のある意図との一貫性を維持しながら、迅速な効果を高める。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:40:46 GMT)
One Framework to Rule Them All: Unifying RL-Based and RL-Free Methods in RLHF [2.1] 本稿では,RLHF(Reinforcement Learning from Human Feedback)とLRM(Large Reasoning Models)に対処するために,RLベースおよびRLフリーの手法について検討する。
我々は、ニューラルネットワークによる帯域予測の観点から、いくつかのRLベースおよびRLフリーアルゴリズムを再解釈する。
これにより、完全なRLコンテキスト内で標準RLHFの目的を詳細に導出し、ニューラルネットワークのバンドイット予測と等価性を示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:37:33 GMT)
Robust Flower Cluster Matching Using The Unscented Transform [2.1] 本稿では,RGB-Dデータから生成された記述子を用いて,花クラスタをマッチングする手法を提案する。
提案手法はUnscented Transformを利用してプラント記述の不確かさ耐性を効率的に推定する。
モンテカルロシミュレーションは、アンセント変換の結果を検証するために用いられる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:24:58 GMT)
Towards Visual Discrimination and Reasoning of Real-World Physical Dynamics: Physics-Grounded Anomaly Detection [2.1] 人間は、物体条件の物理的知識に基づいて、知覚、相互作用、推論によって現実世界の物体の異常を検出する。
Phys-ADは、産業異常検出のための、最初の大規模で現実世界の物理地上ビデオデータセットである。
このデータセットには、22の現実世界のオブジェクトカテゴリにわたる6400以上のビデオが含まれており、ロボットアームやモーターと相互作用し、47種類の異常を示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:58:26 GMT)
iGAiVA: Integrated Generative AI and Visual Analytics in a Machine Learning Workflow for Text Classification [2.0] 視覚分析(VA)を用いて,大規模言語モデルを用いた合成データの生成を誘導する手法を提案する。
本稿では,データ不足の種別について論じ,その識別を支援するVA技術について述べるとともに,対象データ合成の有効性を実証する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 22:43:47 GMT)
Fully Distributed Fog Load Balancing with Multi-Agent Reinforcement Learning [2.0] 本稿では,MARL(Multi-Agent Reinforcement Learning)を用いた完全分散負荷分散ソリューションを提案する。
MARLエージェントは、環境の動的変化に対する生涯の自己適応のためにトランスファーラーニングを使用する。
文献における非現実的な一般的な仮定とは違って,現実的な周波数が環境の状態を観察するために与える影響を解析する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:25:26 GMT)
Maya: Optimizing Deep Learning Training Workloads using Emulated Virtual Accelerators [2.0] 大規模な基盤モデルのトレーニングには数億ドルの費用がかかり、デプロイメントの最適化が重要になる。
現在のアプローチでは、機械学習エンジニアが、高価な計算クラスタ上でエラーを起こしやすい試行錯誤を通じて、手動でトレーニングレシピを作成する必要がある。
透過的なデバイスエミュレーションによってこれらのトレードオフを解消するパフォーマンスモデリングシステムであるMayaを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:33:01 GMT)
InfoBid: A Simulation Framework for Studying Information Disclosure in Auctions with Large Language Model-based Agents [1.9] この研究は、理論的市場設計と実践的応用のギャップを埋め、市場シミュレーション、情報設計、エージェントベースの推論の研究を進める。
LLMエージェントを利用したフレキシブルなシミュレーションフレームワークInfoBidを導入し,マルチエージェントオークション設定における情報開示戦略の効果について検討する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:46:57 GMT)
Dynamic Learning and Productivity for Data Analysts: A Bayesian Hidden Markov Model Perspective [1.9] 本研究では、協調プラットフォーム上でのアナリストの生産性の進化について考察する。
クエリの記述とピアクエリの閲覧という,2つの重要な学習活動に重点を置いている。
2,001人のアナリストと79,797のクエリを持つ業界データセットを用いて、初級、中級、上級の3つの学習状態を特定する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:57:03 GMT)
Follow-the-Regularized-Leader with Adversarial Constraints [1.9] 制約付きオンライン凸最適化(COCO)は、標準オンライン凸最適化(OCO)フレームワークの一般化と見なすことができる。
私たちは、後悔と累積的制約違反の両方に縛られる最適な$O(sqrtT)$を得ることができることを初めて示します。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:52:31 GMT)
Reinforcement Learning for Efficient Toxicity Detection in Competitive Online Video Games [1.9] 本稿では,競合するオンラインゲームにおける毒性検出のための効率的なサンプリングの問題点について考察する。
本稿では,有害な行動に関連する変数に基づいて,モニタリング決定を行うコンテキスト的帯域幅アルゴリズムを提案する。
人気のファーストパーソンアクションゲームCall of Duty: Modern Warfare IIIのデータを用いて、我々のアルゴリズムがベースラインアルゴリズムを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:13:30 GMT)
Multi-dataset and Transfer Learning Using Gene Expression Knowledge Graphs [1.9] 遺伝子発現データセットは、遺伝子調節機構、生化学的経路、細胞機能に関する洞察を提供する。
遺伝子発現データは貴重な洞察を与えることができるが、式データセットの患者数が限られているため、課題が生じる。
本研究は、複数の遺伝子発現データセットとドメイン固有の知識を統合することで、これらの課題に対処する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:23:27 GMT)
LATTE-MV: Learning to Anticipate Table Tennis Hits from Monocular Videos [1.8] 本稿では,テーブルテニスの試合映像を3Dで再現するスケーラブルなシステムと,対戦行動を予測する不確実性認識コントローラを提案する。
本研究では,高速ヒットに対するボールリターン率を,ベースラインの非予測ポリシと比較して49.9%から59.0%に向上することを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:11:22 GMT)
Multi-head Reward Aggregation Guided by Entropy [1.8] 高い評価エントロピーによって特徴づけられる規則は、人間が好む反応を識別する上で信頼性が低い。
ENCOREは,高い評価エントロピーを示す低重み付け規則により,マルチヘッド報酬を構成する簡単なエントロピー誘導手法である。
提案手法はトレーニングフリーで,様々なデータセットに適用可能であり,解釈可能性を維持している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:16:48 GMT)
How Secure is Forgetting? Linking Machine Unlearning to Machine Learning Attacks [1.7] 機械学習(ML)におけるセキュリティ脅威の構造的分析と,そのマシン・アンラーニング(MU)への影響について述べる。
本研究では,バックドアアタック,メンバーシップ推論アタック(MIA),アタック,インバージョンアタックの4つの主要な攻撃クラスについて検討する。
倫理的考察を含むオープンな課題を特定し、将来有望な研究方向性を探求する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:49:34 GMT)
A multi-agentic framework for real-time, autonomous freeform metasurface design [1.7] セマンティックに記述されたフォトニックデザイン目標を高性能なフリーフォームデバイスレイアウトに変換するマルチエージェント設計フレームワークであるMetaChatを紹介する。
デザインアクセラレーションは、特徴量線形変調型マックスウェルサロゲートソルバにより促進される。
これらの概念は、多分野の革新と発見を促進するために、スペシャリストデザインエージェント、サロゲートソルバ、ヒューマンインタラクションを活用するための科学計算の青写真を提供する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:10:45 GMT)
Inferring fine-grained migration patterns across the United States [1.7] 我々は、高解像度だが偏りのあるプロプライエタリなデータを低解像度で信頼性の高いCensusデータで再現するスケーラブルな反復補間法を開発した。
この手法を適用して,2010年から2019年までの年間移動行列のデータセットであるMIGRATEを作成し,47億組のCensus Block Groupのフローをキャプチャする。
これらの推定は、外部の地中構造データセットと高い相関関係を持ち、精度を改善し、生のプロプライエタリなデータに対するバイアスを低減する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:07:44 GMT)
Entropy Collapse in Mobile Sensors: The Hidden Risks of Sensor-Based Security [1.6] 複数のアプリケーションコンテキストにまたがる4つの多様なデータセットにわたるモバイルセンサデータのエントロピーを系統的に分析する。
シャノンエントロピーは複数の倍数であるにもかかわらず, 単一センサの平均ミンエントロピー値は3.408-4.483ビット (S.D.=1.018-1.574) である。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 22:14:50 GMT)
Doubly-polylog-time-overhead fault-tolerant quantum computation by a polylog-time parallel minimum-weight perfect matching decoder [1.6] 従来のポリログ空間のオーバヘッドを維持しつつ,2倍のポリログ時間オーバヘッドを実現するプロトコルを開発した。
本プロトコルは, このデコーダを, シングルショットデコーダを組み込んだトポロジカル・コードプロトコルと統合し, 効率的な抽出を行う。
その結果, 従来のポリログ・タイム・オーバヘッドバリアを越え, 低オーバヘッドFTQCの新たなフロンティアを開拓できる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:07:10 GMT)
Deep Learning for Forensic Identification of Source [1.6] 対照的なニューラルネットワークを用いて,NBIDEデータセットの144カートリッジケーシング間の有用な類似点を学習した。
類似度スコアはしばしば、共通だが未知の情報源パラダイムの下で証拠を解釈するために用いられる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:13:08 GMT)
Diffusion Counterfactuals for Image Regressors [1.5] 拡散型生成モデルを用いて、画像回帰タスクの反実的説明を生成する2つの方法を提案する。
どちらもCelebA-HQと合成データセット上で現実的でセマンティックでスムーズな偽物を生成する。
回帰反事実に対して,特徴の変化は予測値の領域に依存することがわかった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:42:46 GMT)
A General Framework for Interpretable Neural Learning based on Local Information-Theoretic Goal Functions [1.5] 我々は、教師なし、教師なし、メモリ学習のタスクを実行するために、'不定型'ニューラルネットワークを導入する。
PIDフレームワークの解釈可能な性質を活用することで、インフォモーフィックネットワークは、局所学習の複雑な構造を理解するための貴重なツールとなる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:12:04 GMT)
From Annotation to Adaptation: Metrics, Synthetic Data, and Aspect Extraction for Aspect-Based Sentiment Analysis with Large Language Models [1.5] 本研究では,Aspect-Based Sentiment Analysis(ABSA)におけるLarge Language Models(LLMs)の性能について検討する。
合成スポーツフィードバックデータセットを用いて、アスペクトポーラリティペアを抽出するオープンウェイトLLMの能力を評価する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:52:40 GMT)
Reasoning Beyond Limits: Advances and Open Problems for LLMs [1.5] 最近の生成的推論のブレークスルーは、大規模言語モデル(LLM)が複雑な問題にどのように対処するかを変えた。
2023年から2025年の間にリリースされた上位27のLLMモデルを総合的に分析する。
人間の監督なしに多段階推論を改善することを含む,LLMの能力向上における重要な課題について論じる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:29:40 GMT)
Emergence of the Primacy Effect in Structured State-Space Models [1.5] 人工ニューラルネットワーク(ANN)モデルは通常、時間とともに単調に崩壊するメモリで設計される。
構造化状態空間モデル(Structured state-space model)と呼ばれる最近開発されたANNアーキテクチャは、トレーニングと評価の際、予備効果を示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:26:27 GMT)
Statistical Inference for Weighted Sample Average Approximation in Contextual Stochastic Optimization [1.5] 文脈最適化は、共変量による文脈情報を含む不確実性の下での意思決定のためのフレームワークを提供する。
まず、問題を正確に解けるときの最適値のwSAA推定に対する中心極限定理を確立する。
次に,計算予算制約による現実シナリオを調査し,サンプルサイズが大きくなるにつれて,統計的精度と計算コストの基本的なトレードオフを明らかにする。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:15:54 GMT)
On light cone bounds in quantum open systems [1.4] 少体マルコフ量子オープンシステム(MQOS)における量子情報の伝播について検討する。
このようなシステムの大規模なクラスでは、指数関数的に小さなこぼれ現象を持つ有効光円錐の存在が証明される。
また、Lieb-Robinson型境界と、量子メッセージの配信時間に対する低いバウンドも証明する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:29:32 GMT)
CLEAR: Cue Learning using Evolution for Accurate Recognition Applied to Sustainability Data Extraction [1.3] 精度認識のための進化的学習法(CLEAR)について紹介する。
CLEARは、LLMと進化計算を組み合わせて、画像の特殊特徴の認識が改善されるようにキューを生成し、最適化する。
CLEARは人間の認識よりも高い精度を実現し,最大2桁の精度で誤り率を向上する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 22:19:20 GMT)
Design and Evaluation of Neural Network-Based Receiver Architectures for Reliable Communication [1.2] ニューラルネットワークベースの受信機は、ディープラーニングを利用して信号検出と復号を最適化する。
2つの新しいモデル、DAT(Dual Attention Transformer)とRDNLA(Residual Dual Non-Local Attention Network)は、自己注意と残差学習を統合して信号再構成を強化する。
DATとRDNLAは、信号-雑音比(SNR)の異なる従来のニューラルレシーバモデルと他のニューラルレシーバモデルより優れていることがシミュレーションによって示されている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:39:56 GMT)
Feature Modulation for Semi-Supervised Domain Generalization without Domain Labels [1.2] 半教師付きドメイン一般化(SSDG)は、ラベル付きデータのごく一部をラベルなしデータとともに活用し、モデル一般化を強化する。
既存のSSDGメソッドの多くは、ラベルのないデータに対して擬似ラベル付け(PL)に依存しており、しばしばドメインラベルへのアクセスを前提としている。
我々は、未ラベルデータのドメインラベルがトレーニング中に利用できない、より困難なドメインラベル非依存のSSDGに取り組む。
本稿では,ドメイン固有情報を抑えつつ,クラス識別的特徴を高める特徴変調戦略を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:10:10 GMT)
Evaluating Prediction-based Interventions with Human Decision Makers In Mind [1.2] 我々は,予測モデルエイズの存在下での人的意思決定の様々なモデルを定式化し,検討する。
これらの行動モデルはそれぞれ、意思決定対象に依存性を生じさせ、既存の仮定に反する結果をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:23:41 GMT)
LGR: LLM-Guided Ranking of Frontiers for Object Goal Navigation [1.2] 本研究の目的は,大規模言語モデル(LLM)の常識推論機能を活用することで,最近のモジュラーマップレスOGNシステムを強化することである。
本稿では,フロンティア調査における訪問順序決定の課題をフロンティアランキング問題として検討する。
我々のアプローチは、LLMはフロンティアの絶対値を決定することができないが、ビューイメージをコンテキストとして単一の画像内で見る複数のフロンティア間の相対値を評価するのに優れているという最近の知見に基づいている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:15:26 GMT)
Musical Chairs: A new benchmark to evaluate AI [1.2] 本稿では,潜在的なAI設計の立案に使用されるベンチマークの増大に対する新たな貢献について述べる。
このベンチマークでは、"Musical Chairs"と呼ばれるゲームのパフォーマンスの観点からマシンをテストする。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:58:22 GMT)
A Low-complexity Structured Neural Network Approach to Intelligently Realize Wideband Multi-beam Beamformers [1.1] True-time-delay (TTD) ビームフォーマはアナログ信号領域とデジタル信号領域の両方で広帯域でスキントフリーなビームを生成することができる。
ニューラルネットワーク(NN)アーキテクチャを用いて,構造重み付け行列とサブマトリクスを用いた広帯域マルチビームビームフォーマを実現する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:25:32 GMT)
TerraTorch: The Geospatial Foundation Models Toolkit [1.1] TerraTorchは、PyTorch Lightning上に構築されたGeospatial Foundation Models用の微調整およびベンチマークツールキットである。
ドメイン固有のデータモジュール、事前に定義されたタスク、およびさまざまなデコーダヘッドとバックボーンをペアにするモジュールモデルファクトリを統合する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:59:29 GMT)
R-LiViT: A LiDAR-Visual-Thermal Dataset Enabling Vulnerable Road User Focused Roadside Perception [1.1] R-LiViTは、LiDAR、RGB、サーマルイメージングを道路面から組み合わせた最初のデータセットである。
1万フレームのLiDARフレームと2400フレームの時間的および空間的に整列されたRGBと熱画像が含まれており、150以上の交通シナリオにまたがっている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:38:07 GMT)
Medical-GAT: Cancer Document Classification Leveraging Graph-Based Residual Network for Scenarios with Limited Data [1.0] 我々は, 甲状腺癌, 大腸癌, 肺癌, 一般の話題に分類した, 1,874 の生医学的抄録を収集した。
我々の研究は、特にデータスカースシナリオにおいて、分類性能を改善するためにこのデータセットを活用することに焦点を当てている。
がん関連文書のセマンティック情報と構造的関係をキャプチャする複数のグラフアテンション層を備えたResidual Graph Attention Network(R-GAT)を導入する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:20:22 GMT)
Aligning Visual Contrastive learning models via Preference Optimization [0.9] 本稿では,複雑な概念を分解するために,異なる優先度最適化(PO)手法を用いて,コントラスト学習モデルを訓練する新しい手法を提案する。
提案手法は,モデル行動と所望の嗜好を体系的に整合させ,目標タスクの性能を向上させる。
特に,CLIPのような対照的な視覚言語モデルでよく見られる,タイポグラフィー攻撃や帰納的バイアスに対するモデルロバスト性の向上に焦点を当てた。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:37:00 GMT)
Benign landscape for Burer-Monteiro factorizations of MaxCut-type semidefinite programs [0.9] 低階解を持つMaxCut数値半定プログラム(SDP)を考える。
低階仮説を活用するために、標準的なアルゴリズム的アプローチはブラー・モンテイロ化係数である。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:39:13 GMT)
UWarp: A Whole Slide Image Registration Pipeline to Characterize Scanner-Induced Local Domain Shift [0.9] 種々の条件下でスキャンされた組織学的スライドを整列させる新しい登録ツールであるUWarpをベースとしたドメインシフト解析フレームワークを提案する。
実験により、UWarpは既存のオープンソース登録方法より優れており、中央値のターゲット登録誤差(TRE)は4ピクセル未満であることが示された。
UWarpを用いて、乳がんの病態応答予測のための深層学習モデルであるBreaast-NEOprAIdictの予測において、スキャナによる局所ドメインシフトを特徴付ける。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:48:38 GMT)
Quantum circuits for simulating neutrino propagation in matter [0.9] 我々はニュートリノ振動において重要な役割を果たす現象である物質中のニュートリノ伝播の量子シミュレーションを行う。
本研究では, ニュートリノ伝搬を定値および変動物質密度プロファイルでシミュレートする新しいゲート配置の量子回路を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:09:36 GMT)
ICLR Points: How Many ICLR Publications Is One Paper in Each Area? [0.9] ICLRポイントの概念を導入し、トップレベルの機械学習カンファレンスで1つの出版物を作成するのに必要な平均的な労力として定義します。
我々は,27のコンピュータサイエンス分野における平均出版活動量を定量的に測定し,比較した。
本分析では, 平均的な出版活動に有意な差が見られ, 逸話的認識の妥当性が検証された。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:57:21 GMT)
ProFed: a Benchmark for Proximity-based non-IID Federated Learning [0.9] ProFedは、異なる領域にまたがる様々な歪度でデータ分割をシミュレートするベンチマークである。
我々のゴールは、FLアルゴリズムをより効果的かつ一貫して、確立されたベースラインに対して評価するための標準化されたフレームワークを提供することです。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:08:08 GMT)
Cyborg Data: Merging Human with AI Generated Training Data [0.8] 生成型大規模言語モデルは、多くのタスクで訓練されており、ほとんどデータを持たない新しいタスクに一般化する印象的な能力を示している。
本研究では,大規模な生産モデルである教師が,はるかに小さなモデルである学生に教えるモデル蒸留パイプラインを提案する。
教師は、トレーニングデータの小さなサブセットに基づいてトレーニングされ、残りのトレーニングデータのスコアを提供するために使用され、学生のトレーニングに使用される。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:38:20 GMT)
Accurate Gauge-Invariant Tensor Network Simulations for Abelian Lattice Gauge Theory in (2+1)D [0.8] 本研究では,(2+1)Dにおけるアベリア格子ゲージ理論(LGT)の高精度かつ効率的なシミュレーションを実現するための新しい手法を提案する。
第1の鍵はゲージ不変テンソルネットワーク状態のゲージ標準形式(GCF)を特定することである。
第2の鍵は、(2+1)D LGT基底状態とゲージ場と物質場との効率的な変分最適化を実現するために、モンテカルロ変分法を組み合わせた射影対ペア状態(PEPS)のGCFを用いることである。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:04:21 GMT)
Dynamics of Algorithmic Content Amplification on TikTok [0.8] 本稿では,TikTokにおけるコンテンツ増幅のダイナミクスについて検討する。
以上の結果から,ボットの関心に沿うコンテンツが大幅に増幅されることが判明した。
TikTokのアルゴリズムはいくつかのコンテンツの多様性を保っているが、増幅と探索の間には強い負の相関がある。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:54:24 GMT)
Lowering Connectivity Requirements For Bivariate Bicycle Codes Using Morphing Circuits [0.8] モーフィング回路と呼ばれる新しいパリティチェック回路設計原理を一般化する。
パリティチェック回路が6次ではなく5次ビット接続を必要とするBB符号の新たなファミリーを定義する。
論理的な入力/出力は、二平面レイアウトでも可能である。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:39:33 GMT)
DR-PETS: Learning-Based Control With Planning in Adversarial Environments [0.8] DR-PETSはPETSの分布的に堅牢な拡張であり、敵に対する堅牢性を証明している。
p-ワッサーシュタイン曖昧性集合を介して不確実性を定式化し、最悪の場合の摂動計画を可能にする。
振り子安定化とカートポールバランスの実験により、DR-PETSは対向性摂動に対する堅牢性を証明した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:55:44 GMT)
Hacia la interpretabilidad de la detección anticipada de riesgos de depresión utilizando grandes modelos de lenguaje [0.7] スペイン語テキスト上でのLarge Language Models (LLM) を用いた抑うつ関連タスクの解法を提案する。
専門家を通してユーザを分析し,Geminiモデルにコンテキスト内学習を適用し,その性能を定量的かつ質的に評価するための推論基準を定義した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:14:21 GMT)
Benchmarking Machine Learning Methods for Distributed Acoustic Sensing [0.7] 分散音響センシング(DAS)技術は、光ファイバーに沿った微小な摂動を検出することによって、リアルタイムの音響信号監視を可能にする。
本研究では,DASデータ認識・解釈の文脈における古典的機械学習手法と最先端ディープラーニングモデルの比較性能特性を批判的に検討する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:17:22 GMT)
Eigenvalue analysis of three-state quantum walks with general coin matrices [0.7] 我々は、一般的なコイン行列を用いた3状態量子ウォークに適用可能な、より洗練された転送行列フレームワークを開発する。
我々は,これまで難解と考えられていたモデルに対して,正確な固有値を導出するための数値解析を行った。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:39:25 GMT)
The Crucial Role of Problem Formulation in Real-World Reinforcement Learning [0.7] 強化学習(RL)は、産業用サイバー物理システムにおける制御タスクのための有望なソリューションを提供する。
本稿では,RL問題の定式化に際し,小型ながらよく設計された修正が,性能,安定性,サンプル効率を大幅に向上させることを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:17:44 GMT)
SChanger: Change Detection from a Semantic Change and Spatial Consistency Perspective [0.7] 我々は,データ不足問題に対処するため,セマンティック・チェンジ・ネットワーク(SCN)と呼ばれる微調整戦略を開発した。
両画像間の変化位置は空間的に同一であり,空間的整合性(空間的整合性)の概念である。
これにより、マルチスケールな変更のモデリングが強化され、変更検出セマンティクスの基盤となる関係を捉えるのに役立ちます。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:15:43 GMT)
StepGrade: Grading Programming Assignments with Context-Aware LLMs [0.7] 本研究は,大規模言語モデル(LLM)を駆使したChain-of-Thought(CoT)の利用を探求するStepGradeを紹介する。
限定的および表面レベルの出力を提供する通常のプロンプトとは異なり、CoTプロンプトは相互接続されたグレーティング基準をステップバイステップで推論することを可能にする。
StepGradeの効率を実証的に検証するため,3つの難易度にまたがる30のPythonプログラムをケーススタディとして実施した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:36:26 GMT)
Robust Federated Learning Against Poisoning Attacks: A GAN-Based Defense Framework [0.7] フェデレートラーニング(FL)は、生データを共有せずに、分散デバイス間で協調的なモデルトレーニングを可能にする。
本稿では,クライアントの更新を認証するために,CGAN(Conditional Generative Adversarial Network)を利用してサーバで合成データを生成する,プライバシ保護型防衛フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:00:56 GMT)
Threshold Crossings as Tail Events for Catastrophic AI Risk [0.7] 我々は、AIシステムにおける分岐駆動ジャンプが創発的な重み付き結果分布と関連している状況を分析する。
我々の結果は、潜在的に破滅的なAIリスクを管理するために、AIシステムの監視、緩和、制御に関する研究に寄与する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:00:33 GMT)
Measuring Incompatible Observables with Quantum Neural Networks [0.6] ハイゼンベルクの不確実性原理は、不整合可観測物の同時測定を防ぐ。
単位量子チャネルをエミュレートする複数出力QNNを実装することで、多くの不整合可観測体の期待値を同時に測定できることが示される。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:03:42 GMT)
Development and Validation of a Deep-Learning Model for Differential Treatment Benefit Prediction for Adults with Major Depressive Disorder Deployed in the Artificial Intelligence in Depression Medication Enhancement (AIDME) Study [0.6] 大うつ病(MDD)の薬理学的治療は、試行錯誤のアプローチに依存している。
治療結果のパーソナライズを目的とした人工知能(AI)モデルを導入する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:29:31 GMT)
Exploratory Study into Relations between Cognitive Distortions and Emotional Appraisals [0.6] 本研究は,認知的歪みと感情的評価次元の関係について検討する。
認知的歪みと評価次元の統計的に有意な関係のパターンは、歪みのカテゴリーによって異なることを示す。
また,認知的再構成が評価次元に与える影響を分析し,認知的再構成の感情制御の側面を実証した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:52:15 GMT)
Performance of a Superconducting Quantum Battery [0.6] 量子優位性を示す超伝導量子電池(SQB)モデルを導入する。
モデルについて述べ、量子優位性の証拠を提供し、その後、電池の製造プロセスについて議論する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:37:27 GMT)
Towards Practical Emotion Recognition: An Unsupervised Source-Free Approach for EEG Domain Adaptation [0.6] 本稿では,領域間における脳波に基づく感情分類のための新しいSF-UDA手法を提案する。
本稿では,Dual-Loss Adaptive Regularization (DLAR)を導入し,予測誤差を最小化し,予測を疑似ラベルと整合させる。
我々の手法は最先端の手法よりも優れており、DEAでトレーニングし、SEEDでテストすると65.84%の精度が達成される。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:29:20 GMT)
Anti Robot Speciesism [0.6] 我々は,ヒト科のヒトに対する優遇的治療に適応する動機付けによって,ヒト科のヒト様の能力を否定する傾向がみられた。
6つの実験によると、ロボットは生物ではないため、人間のような属性を否定されている。
人は、完全に人間らしいロボットの能力に合理的に特化しないが、それらに適した能力は否定する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:56:30 GMT)
I'm Sorry Dave: How the old world of personnel security can inform the new world of AI insider risk [0.5] 急速に進化するAIの領域と、従来の人事セキュリティの世界との間には、意味のある相互作用はない。
人間のインサイダーによる複雑なリスクは、何十年もの努力にもかかわらず、理解と管理が難しい。
AIインサイダーによるセキュリティリスクの増大は、さらに不透明だ。
人間のインサイダーを扱う上で有用であることが証明された概念やアプローチは、AIインサイダーの出現するリスクにも適用できる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:22:54 GMT)
Towards Industrial-scale Product Configuration [0.5] COOM言語で定式化された製品モデルベンチマークのキュレートされた選択によるソリューションを提案する。
追加のスケーラブルな製品モデルは、関連するリソースとともに、COOMスイートに含まれている。
COOM Suiteは、製品構成の分野におけるステークホルダーの共通基盤となる、包括的でアクセス可能で代表的なサンプルセットを提供することを目的としています。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:12:30 GMT)
Broken symmetry states and Quantum Hall Ferromagnetism in decoupled twisted bilayer graphene [0.4] 大きなツイスト角を持つ二層グラフェン(TBLG)は、強い層間クーロン相互作用を持つ新しい2次元複層系である。
電子的に分離したTBLGにおける電荷遮蔽効果を実証する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:15:22 GMT)
Evaluating Pre-trained Convolutional Neural Networks and Foundation Models as Feature Extractors for Content-based Medical Image Retrieval [0.4] コンテンツベースの医用画像検索(CBMIR)は、画像の特徴に依存し、自動または半自動で抽出できる。
本研究では、よく知られた学習済み畳み込みニューラルネットワーク(CNN)と事前学習済み基礎モデルから、事前学習済み特徴抽出器を複数使用した。
以上の結果から,2次元データセットでは,基礎モデルの方がCNNよりも優れた性能が得られることがわかった。
画像サイズが大きくなると(特に2次元データセットの場合)性能が若干向上する一方、より小さい画像でも競争力のあるCBMIR性能が達成できることを確認した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:11:03 GMT)
Resilience of the quantum critical line in the Schmid transition [0.4] シュミドは、抵抗環境に結合した1つのジョセフソン接合が、シャント抵抗が抵抗量子$h/(4 e2)$を超えるとき、絶縁相への量子相転移を起こすと予測した。
最近の測定と理論的研究は、この遷移の場所がジョセフソンと充電エネルギーの比に依存するかどうかの議論を引き起こしている。
超伝導と絶縁挙動の遷移線はこのエネルギー比とは無関係であることを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:17:05 GMT)
New perspectives on quantum kernels through the lens of entangled tensor kernels [0.3] 量子核の埋め込みはすべて、絡み合ったテンソル核として理解できることが示される。
この視点が量子核の独特な帰納バイアスとそれらの量子化の潜在的な方法の両方に新しい洞察を得られるかについて議論する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:18:27 GMT)
Lightweight Online Adaption for Time Series Foundation Model Forecasts [0.3] AdapTSは、オンラインフィードバックに対するFM予測のオンライン適応のための軽量なメカニズムである。
本稿では,一連の標準時系列データセットを対象とした最近のFMと合わせてAdapTSの性能を評価する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:36:47 GMT)
Enhancing Finite State Machine Design Automation with Large Language Models and Prompt Engineering Techniques [0.3] 大規模言語モデル (LLM) は近年,ハードウェア記述言語 (HDL) 設計との互換性が著しいことから注目されている。
本稿では,有限状態機械(FSM)の設計における3つのLLM,Claude 3 Opus,ChatGPT-4,ChatGPT-4oの性能について検討する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:26:51 GMT)
Electrical control of a Kondo spin screening cloud [0.3] コンド雲(Kondo cloud)は、単一局在スピンを遮蔽する伝導電子の量子多体物体である。
我々は、雲の一部を量子ボックスに閉じ込めることで、金堂雲の変形の工学を報告する。
我々は,箱内の量子干渉を調整し,コンドの絡みをモニタリングする方法を開発し,コンド雲の定量的制御を実証する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:38:03 GMT)
Two pathways to resolve relational inconsistencies [0.3] 我々は、小さな違反が期待される関係の調整につながり、大きな違反は異なるメカニズムで解決されることを示した。
これらの結果から,期待値違反に直面した場合の事前期待値の安定性は,学習力学の自然な結果であることが示唆された。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:06:54 GMT)
Benchmarking the performance of a high-Q cavity qudit using random unitaries [0.3] 自然な戦略は、Fockベースを使ってクォーディットで情報をエンコードすることだ。
キャビティモードqudit上の量子演算は、系を非線形のアシラリートランスモン量子ビットに結合することで行うことができる。
我々は,これらのquditシステムのベンチマークツールをアルゴリズムに依存しない方法で開発する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:13:39 GMT)
Loop Series Expansions for Tensor Networks [0.3] 本稿では,テンソルネットワークの収縮に対するBP近似の精度を向上させるために,ループ列展開を適用する方法について述べる。
我々は、AKLTモデルの基底状態を表すiPEPSの縮約に関するこの提案を、ランダムに定義されたテンソルでベンチマークする。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:08:06 GMT)
RxRx3-core: Benchmarking drug-target interactions in High-Content Microscopy [0.3] RxRx3コアはRxRx3データセットのキュレートされ圧縮されたサブセットである。
わずか18GBのRxRx3コアは、大規模なHCSデータセットに関連するサイズバリアを大幅に削減する。
RxRx3コアは、736個のCRISPRノックアウトと1,674個の化合物を8濃度に分散した22,601枚の顕微鏡画像を含む。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:23:58 GMT)
Graph-Enhanced Model-Free Reinforcement Learning Agents for Efficient Power Grid Topological Control [0.2] 本稿では,従来の知識を使わずに電力ネットワークの運用を最適化することを目的とした,強化学習のモデルフリーフレームワークにおける新しいアプローチを提案する。
提案手法は,停電に対するグリッド安定性を確保しつつ,一貫した電力損失削減を実現することを実証する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:20:30 GMT)
Small Object Detection: A Comprehensive Survey on Challenges, Techniques and Real-World Applications [0.2] 小型物体検出(SOD)はコンピュータビジョンにおいて重要な課題である。
ディープラーニングの最近の進歩は革新的なソリューションを導入している。
軽量ニューラルネットワーク、知識蒸留(KD)、自己教師型学習といった新興トレンドは、検出効率を改善する上で有望な方向を提供する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:58:13 GMT)
Exploring Robustness of Cortical Morphometry in the presence of white matter lesions, using Diffusion Models for Lesion Filling [0.1] 多発性硬化症や小血管疾患などのT1強調画像における白色物質の低強度は、脳の分画の出力に影響を与えることが知られている。
これらの効果は、従来の脳のセグメンテーションツールの間でよく文書化されているが、ディープラーニングセグメンテーションに基づくツールでは広く研究されていない。
本稿では,WM病変の存在下での皮質厚測定の精度と効率を高めるため,深層学習の可能性を検討する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:18:35 GMT)
In the Blink of an Eye: Instant Game Map Editing using a Generative-AI Smart Brush [0.1] 我々は,アーティストが最小限の努力でゲームマップの選択領域をシームレスに修正できるようにデザインされた,地図編集のための新しいSmart Brushを紹介した。
当社のハイブリッドワークフローは,芸術的柔軟性と生産効率の向上を目標としています。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:11:10 GMT)
Cutting Voxel Projector a New Approach to Construct 3D Cone Beam CT Operator [0.1] 我々は3次元コーンビームトモグラフィ再構成のための新しいプロジェクターのクラスを導入する。
本手法は, ボクセルの局所改質を可能にし, 適応格子分解能と再構成品質の向上を実現する。
その結果, カットボクセルプロジェクターはTTプロジェクターよりも精度が高く, 特にコーンビーム角が大きいことが判明した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:51:33 GMT)
Process Channels: A New Layer for Process Enactment Based on Blockchain State Channels [0.1] ブロックチェーンベースのビジネスプロセス実行の基礎を、オンチェーンスマートコントラクトからステートチャネルに変更することを提案する。
ステートチャネルは、ほとんどのトランザクションをブロックチェーンによって提供されるコアセキュリティプロパティを保持しながら、チェーン外で実行することを可能にする。
我々の提案であるプロセスチャネルは、状態チャネル上でプロセスを実行するためのモデル駆動のアプローチである。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 22:44:30 GMT)
Capturing strong correlation effects on a quantum annealer: calculation of avoided crossing in the H$_4$ molecule using the quantum annealer eigensolver [0.1] 量子アナーラー固有解法(QAE)アルゴリズムの範囲を拡大する。
矩形幾何学におけるH$_4$分子の古典的な例を考える。
我々は、実際の量子ハードウェア上でのFCI値の約1.2%で回避された交差を予測できることを発見した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:35:57 GMT)
ESSR: An 8K@30FPS Super-Resolution Accelerator With Edge Selective Network [0.1] 本稿では,エッジ選択動的処理を備えた8K@30FPS加速器を提案する。
TSMC 28nmプロセスを使用して、ゲート数2749K、電力消費量0.2075W、4797Mピクセル/Jエネルギー効率で8K@30FPSを800MHzで達成できる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 05:27:23 GMT)
Zero-Shot LLMs in Human-in-the-Loop RL: Replacing Human Feedback for Reward Shaping [0.0] 強化学習はしばしば報酬の相違を伴う課題に直面します。
HIL(Human-in-the-loop)メソッドは、不整合性、主観的、あるいは不整合性フィードバックにつながるバイアスが伴うため、問題を悪化させる可能性がある。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:17:12 GMT)
World Model Agents with Change-Based Intrinsic Motivation [0.0] この問題に対処するための有望な戦略として、本質的なモチベーションと伝達学習が出現している。
CBET(Change Based Exploration Transfer)は、スパースフィードバックに対処する可能性を示しているが、現代のアルゴリズムによるその有効性はまだ検討されていない。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 23:40:03 GMT)
What quantum matter tells about quantisation of gravity in a statistical mechanics context [0.0] 統計力学モデルは、リンドラー空間における地平線の熱力学的解釈から自然に生じる。
場の量子論の経路積分の定式化は、統計力学の観点から解釈することができる。
これらの観点からすると、重力と物質は気体と同じ方法で互いに関連し、その化学的ポテンシャルは成り立つ。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:52:59 GMT)
UnReference: analysis of the effect of spoofing on RTK reference stations for connected rovers [0.0] 無人機(空中または地上の車両と表面の船)は、通常、スタンドアローンの受信機によって提供されるものよりもはるかに高い精度を必要とする。
センチメートルレベルの精度を達成するための最も効果的で経済的な方法は、固定周波数局の受信機が提供する補正に依存することである。
静的な性質のため、参照ステーションは単純なジャミングとスプーフィングの両方の攻撃の主要なターゲットである。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:40:19 GMT)
Transitions of the Lyapunov spectrum and entanglement entropy in monitored quantum dynamics with homogeneous unitary gates [0.0] 我々は、量子計測と空間的に均質なユニタリゲートによって進化したシステムにおけるリアプノフスペクトルとエンタングルメントエントロピーを探索する。
時間的にランダムかつフロケなユニタリゲートを持つモデルでは、リアプノフ指数は一般に測定結果とは無関係な値に収束する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:20:00 GMT)
Training in translation tools and technologies: Findings of the EMT survey 2023 [0.0] 本稿では,大学院翻訳教育プログラムの一環として,コンピュータ化されたツールと技術に関する調査の第3回について報告する。
これらの結果は,翻訳技術の革新に対するプログラムの応答性を示している。
新型コロナウイルスのパンデミックで必要となる柔軟性は、プログラムの持続的な変更にも繋がった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:49:14 GMT)
Time-Dependent Dunkl-Schrödinger Equation with an Angular-Dependent Potential [0.0] 時間依存質量と周波数を持つ高調波発振器に対する時間依存型シュリンガー方程式の解について検討する。
我々のアプローチは量子力学解析の範囲を広げ、様々な条件下での動的量子システムに対する正確な解と新たな洞察を提供する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:31:13 GMT)
Three Kinds of AI Ethics [0.0] 私は、AIと倫理の関係が少なくとも3つの方法で特徴づけられることを示した。
これらの3種類のAI倫理の特徴を解明し、彼らの研究課題を特徴づけ、各種類の専門知識の種類を特定します。
また、AI倫理に対する批判が、ある種類のAI倫理の観点から、異なる目標を持つ別の種類のものへと、どのようにずれているかを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:03:58 GMT)
The quantum Mpemba effect in free-fermionic mixed states [0.0] 特定のシナリオでは、より大きな初期対称性の破れは、量子Mpemba効果と同様に、より高速な回復をもたらす。
本研究では,混合初期状態と非単元ダイナミクスが対称性回復に及ぼす影響について検討する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:25:51 GMT)
The importance of the clustering model to detect new types of intrusion in data traffic [0.0] 提案手法では,クラスタリング手法としてK-meansアルゴリズムを用いる。
データはKali Linux環境、cicflowmeterトラフィック、Putty Softwareツールを利用して収集された。
モデルは攻撃を数え、それぞれに番号を割り当てた。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:42:39 GMT)
The foot, the fan, and the cuprate phase diagram: Fermi-volume-changing quantum phase transitions [0.0] フェルミ表面(FL)を持つフェルミ液体は、再構成された「小さなフェルミポケット」を持つスピン密度波状態(SDW)への量子相転移を持つことができる。
FL-SDW量子相転移における空間障害の影響の研究は、低温における拡張量子臨界グリフィス型位相を予測する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:55:38 GMT)
The Oxford Insights Government AI Readiness Index (GARI): An Analysis of its Data and Overcoming Obstacles, with a Case Study of Iraq [0.0] 本研究は,オックスフォード大学が発行する「Government AI Readines Index(GARI)」について検討する。
技術基盤、人的資源、支援政策、イノベーションのレベルなど、準備性を評価するために使われる評価基準を強調します。
この研究は特にイラクに焦点を当て、AI技術の採用と導入においてイラク政府が直面している課題を探求している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:26:07 GMT)
TempTest: Local Normalization Distortion and the Detection of Machine-generated Text [0.0] 本稿では,生成言語モデルに完全に依存した機械生成テキストを検出する手法を提案する。
これは、温度やトップkサンプリングのようなデコード戦略が条件付き確率測度を正規化する方法の欠陥を目標にすることで達成される。
我々は,様々な言語モデル,データセット,通過距離の異なる,白と黒のボックス設定での検出器の評価を行った。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:56:59 GMT)
Task-Specific Activation Functions for Neuroevolution using Grammatical Evolution [0.0] 我々は,新しいアクティベーション関数を自動進化させるために,文法進化(GE)を活用する革新的なアプローチであるNevo GEAFを紹介する。
有名なバイナリ分類データセットで実施された実験では、ReLUよりもF1スコア(2.4%と9.4%)が統計的に顕著に改善された。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:39:57 GMT)
Synthesis of Single Qutrit Circuits from Clifford+R [0.0] 2つの決定論的アルゴリズムが近似単一量子ゲートに提示される。
最初のアルゴリズムはクリフォード+$mathbfR$群を徹底的に探索する。
第2のアルゴリズムは、家庭用リフレクションを探索する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:55:43 GMT)
Symmetry resolved out-of-time-order correlators of Heisenberg spin chains using projected matrix product operators [0.0] 積分可能なハイゼンベルクスピンチェーンにおける情報スクランブルに対する相互作用の効果について検討する。
我々の焦点は、一定数の粒子を持つセクターを対象とする、時間外順序相関器(OTOC)である。
複数の粒子を持つすべてのセクターにおいて、OTOCは、局所作用素がランダムなユニタリ行列によって回転されたかのように振る舞う。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:54:20 GMT)
Symbol grounding in computational systems: A paradox of intentions [0.0] 本稿では,記号基底を計算学では説明できないという,計算システムのパラドックス的特徴を示す。
心が有意義なシンボルを計算している場合、その機能はシステム内の有意義なシンボルの存在を前提としている。
もし心が無意味なシンボルを計算しているなら、記号接地の前に意図的な認知プロセスは利用できない。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:26:34 GMT)
Solving 2-D Helmholtz equation in the rectangular, circular, and elliptical domains using neural networks [0.0] 物理インフォームドニューラルネットワークは、複雑な物理学を支配するいくつかの微分方程式を解く代替手段を提供した。
音場予測の成功は、ヘルムホルツ方程式を解く際に生じる消失段階の問題によって制限される。
2次元ヘルムホルツ方程式を所定の境界条件で解く問題は、試行錯誤法を用いて制約のない最適化問題として提案される。
トレーニングプロセスに先立って与えられた境界条件を満たす試行ニューラルネットワークを,超有限拘束法とR関数理論を用いて構築する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:28:49 GMT)
Solvable Quantum Circuits in Tree+1 Dimensions [0.0] 木グラフ上のユニタリ量子多体ダイナミクスの抽出可能なモデルを考案する。
木々の対称性を保つための厳密な局所量子回路の構築方法を示す。
木単位ゲートの様々な例を示し, 動的相関, 時間外相関器, 絡み合い成長について論じる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:00:01 GMT)
Semi-supervised learning for marine anomaly detection on board satellites [0.0] 衛星画像に訓練されたディープラーニング(DL)モデルを適用することで、海洋異常を識別することができる。
DLモデルは、トレーニングのために大量のラベル付きデータを必要とすることが多い。
本稿では,セマンティックセグメンテーションのための半教師付きアルゴリズムの性能について検討する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:23:34 GMT)
Selective and efficient quantum state tomography for multi-qubit systems [0.0] 任意の$N$-qubit 密度行列の複数の選択要素を効率的に推定する手法である選択的かつ効率的な QST (SEEQST) を導入する。
任意の$N$-qubit密度行列は、それぞれ2N$要素を含む2N$サブセットに分割可能であることを示す。
SEEQSTでは、そのような部分集合はたった2つの実験から正確に推定できる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:43:35 GMT)
Scar-induced imbalance in staggered Rydberg ladders [0.0] 本研究では, スタガードデチューニングを施した2脚はしご上でのリドベルク原子の運動論的拘束モデルについて検討した。
QMBSは、N'eel と Rydberg の真空初期状態のコヒーレントな多体再生と部位依存磁化ダイナミクスをもたらす。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:41:53 GMT)
Scalable Pattern Matching in Computation Graphs [0.0] グラフ書き換えは、コンパイラ、機械学習、量子コンピューティングといった分野におけるグラフ表現の最適化と修正に人気のあるツールである。
ポートグラフにおけるパターンマッチングの新しい解法を提案する。
提案アルゴリズムは,量子回路を記述した10000の実世界のパターンのデータセット上で,現在の実装よりも20倍の高速化を実現する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:51:45 GMT)
Sacred or Secular? Religious Bias in AI-Generated Financial Advice [0.0] 本研究では、ChatGPTの金融クエリに対する応答に着目し、AI生成の金融アドバイスにおける宗教的バイアスについて検討する。
また,ChatGPTが生み出す金融メールの50%は宗教的偏見を示し,内集団と外集団の相互作用に明らかな偏見が存在することがわかった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 00:27:04 GMT)
Review and Prospect of Algebraic Research in Equivalent Framework between Statistical Mechanics and Machine Learning Theory [0.0] 作用素代数のような統計力学における代数的アプローチは、相転移現象を数学的に解析することができることはよく知られている。
この論文は、統計力学と場の量子論の両方において代数研究の先駆者であるアラキ・フジヒロ教授の記憶に捧げられている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:32:59 GMT)
ReverBERT: A State Space Model for Efficient Text-Driven Speech Style Transfer [0.0] テキスト駆動音声スタイル転送のための効率的なフレームワークであるemphReverBERTを提案する。
画像領域の技法とは異なり,本手法は音声空間で動作し,音声特徴の離散フーリエ変換を統合する。
ベンチマーク音声コーパスの実験では、emphReverBERTは自然性、表現性、計算効率の点でベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:11:17 GMT)
RetrieveGPT: Merging Prompts and Mathematical Models for Enhanced Code-Mixed Information Retrieval [0.0] インドでは、ソーシャルメディアのユーザーはローマ文字を使ってコードミキシングされた会話をすることが多い。
本稿では,コードミキシングによる会話から関連情報を抽出することの課題に焦点をあてる。
我々は、コードミキシングされた会話から最も関連性の高い回答を自動的に識別するメカニズムを開発する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:30:49 GMT)
Reconstructing Gridded Data from Higher Autocorrelations [0.0] 我々は,高次自己相関からグリッド化されたデータセットを再構成する問題を考察する。
明示的な再構成アルゴリズムを記述し,次数3r + 3までの自動相関が常に十分であることを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 22:16:23 GMT)
RecTable: Fast Modeling Tabular Data with Rectified Flow [0.0] 本稿では,テキスト・ツー・イメージ・ジェネレーションやテキスト・ツー・ビデオ・ジェネレーションなどに適用された修正フローモデリングを用いたRecTableを紹介する。
実験により, RecTableは, 最先端拡散モデルやスコアベースモデルと比較して, 競争性能が向上することを示した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:12:20 GMT)
Quantum phase transitions in the multiphoton Jaynes-Cummings-Hubbard model [0.0] 多光子JCHMはモット絶縁体(MI)、超流体、ボース・アインシュタイン凝縮(BEC)相間の量子相転移を明らかにする。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 03:18:33 GMT)
Quantum decoherence in the Caldeira-Leggett model by the real-time path integral on a computer [0.0] 本稿では,環境を取り扱う実時間経路積分形式に基づくオープンシステムの第一原理計算と,コンピュータ上での我々の関心の共有システムを提案する。
我々は、特に量子デコヒーレンスモデルとしてよく知られているカルデイラ・レゲットモデルに焦点を当てる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:29:38 GMT)
Quantum beating and cyclic structures in the phase-space dynamics of the Kramers-Henneberger atom [0.0] クラマース・ヘネベルガー原子の位相空間ダイナミクスについて検討する。
KHポテンシャルに対して、固有状態のコヒーレント重ね合わせは運動量空間に制限された巡回運動を行う。
古典的な位相空間の制約と準確率フローの比較は、KH原子の場合、運動量は上から有界でなければならないことを示している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:18:17 GMT)
Quantum Signatures of Chaos from Free Probability [0.0] 本稿では、自由度に基づく量子カオスの定義を提案し、量子多体系における量子カオスの出現について検討する。
自由畳み込み予測の上の揺らぎは、普遍的なウィグナー・ダイソン統計に従うことを示し、量子カオスとの関係について議論する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:05:30 GMT)
Quantum Neural Network Restatement of Markov Jump Process [0.0] 論文は、量子力学系における難しい問題の設計、適応、定式化に関する問題に特化している。
機械知能システムの理論的および数値的研究への障害の1つは、次元の呪いと高次元確率分布からのサンプリングである。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:25:11 GMT)
Quantum Max $d$-Cut via qudit swap operators [0.0] 量子ビット系の量子マックスカット(QMC)問題は、2-局所ハミルトン問題の一例である。
本稿では,キューディット系におけるQMC問題の高次元アナログ構造について検討する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:30:17 GMT)
Quantum Fisher Information Reveals UV-IR Mixing in the Strange Metal [0.0] 最適にドープされたBi$$Sr$ quadratic$CaCu$ Mott$O$_8+x$の密度密度応答は、最近共形対称性を示すことが示されている。
マルチパーティ・エンタングルメントの証人である量子フィッシャー情報(QFI)を計算した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:49:16 GMT)
Quantum Entanglement Generation in the Heterometallic Ni$^\text{2+}_4$Gd$_4^\text{3+}$ Complexes [0.0] 外部磁場下でのNi$text2+_4$Gd$_4text3+$と表される錯体中の四部および二部量子絡みについて検討する。
量子エンタングルメント尺度としてネガティビティを用いて, テトラパルタイトおよびバイパルタイトエンタングルメントに対する単一イオン異方性と磁場の影響を解析した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:20:22 GMT)
Quantum Coherence of Topologically Frustrated Spin Chains [0.0] 位相的にフラストレーションされたシステムでは、絡み合いと魔法の性質は2つの異なる貢献に分解される。
1つはモデルとそのハミルトニアンの性質によって決定され、もう1つは位相的フラストレーション自体から生じ、ハミルトニアンのパラメータからは独立である。
我々の発見は、量子コヒーレンスと他の量子資源、特にマジックの振舞いの完全な類似性を明らかにした。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:00:05 GMT)
Prospect for measuring work statistics in quantum coherent systems [0.0] 量子熱力学 (quantum thermodynamics) は、量子コヒーレントシステムと熱や作業エージェントとの間の熱と仕事の交換に関係している。
熱ダイナミズムでは、これらの量の統計が重要な対象であるが、一般的なシステムでは測定することが難しいことが知られている。
本稿では,トランスモン・マイクロキャビティシステムの研究を通して,電子機器の作業統計測定の展望について考察する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:11:02 GMT)
Probabilistic Lexical Manifold Construction in Large Language Models via Hierarchical Vector Field Interpolation [0.0] 提案手法は,単語表現が位相的整合性に従属する確率関数空間を構築する。
確率制約は、文脈関係を洗練することによって語彙コヒーレンスを高め、複数の言語分布における意味的安定性を改善する。
計算効率の評価では、表現は小さな処理オーバーヘッドをもたらすが、構造化された表現学習アプローチは実用的展開にはスケーラブルである。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:56:31 GMT)
PowerGNN: A Topology-Aware Graph Neural Network for Electricity Grids [0.0] 本稿では,高再生能統合下での電力系統状態予測のためのトポロジ対応グラフニューラルネットワーク(GNN)フレームワークを提案する。
我々は,電力ネットワークのグラフベース表現を構築し,伝送線路をノードやエッジとしてモデル化し,グラフSAGE畳み込みとGRU(Gated Recurrent Units)を統合した特殊なGNNアーキテクチャを導入する。
提案したGNNは, 完全連結ニューラルネットワーク, 線形回帰モデル, 圧延平均モデルなどのベースラインアプローチより優れ, 予測精度が大幅に向上したことを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 01:22:31 GMT)
Power Networks SCADA Communication Cybersecurity, A Qiskit Implementation [0.0] 監視制御・データ取得システム(SCADA)を利用した電力ネットワークのサイバー物理システム
もっともらしい量子世界(Q-world)では、従来のアプローチは新たな課題に直面する可能性が高い。
本稿では、量子コンピューティングと通信システムにおけるSCADA通信の安全性確保の機会と課題について述べる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:40:31 GMT)
Physics-based Deep Learning [0.0] この文書は、物理シミュレーションの領域における深層学習のための、ハンズオンで包括的なガイドである。
すべてのコンセプトは、インタラクティブなJupyterノートブックとペアリングされています。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:04:18 GMT)
Phase transition analogs in laser collisions with a dark-field setup [0.0] 相互作用領域における衝突レーザーパルスの逆プロファイルに対する信号特性の強い依存性を観察する。
環状の遠方界プロファイルを特徴付けるように調整されたプローブビームの場合、信号の主放出方向は相転移のアナログを受けることができる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:03:44 GMT)
Parity-dependent state transfer for direct entanglement generation [0.0] 完全状態移動は、最も近い隣り合う結合のみを用いて、遠い量子ビット間の時間-最適状態移動を可能にする。
6個の超伝導トランスモン量子ビットの鎖上での完全状態移動と多量子絡み合いの発生を実験的に実証した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:16:18 GMT)
Packaged Quantum States and Symmetry: A Group-Theoretic Framework for Gauge-Invariant Packaged Entanglements [0.0] 有限群あるいはコンパクト群の任意の非自明な表現は、本質的にパッケージ化された絡み合いを誘導することを示す。
この枠組みでは、各単一粒子励起は、その既約表現によって決定される内部量子数の分離できないブロックを持つ。
我々の結果は、エキゾチックハドロン分光法、場の理論における拡張対称性の探索、量子技術への応用に有用かもしれない。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:35:58 GMT)
PVLens: Enhancing Pharmacovigilance Through Automated Label Extraction [0.0] 我々は、FDA Structured Product Labels(SPL)からラベル付き安全情報を抽出し、MedDRAに用語をマッピングするシステムであるPVLensを紹介する。
97の薬物ラベルに対する検証において、PVLensは、高いリコール(0.983)と適度な精度(0.799)のF1スコアを0.882で達成した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:33:26 GMT)
PAINT: Paying Attention to INformed Tokens to Mitigate Hallucination in Large Vision-Language Model [0.0] 幻覚は、しばしば注意重みの進歩的な弱体化から視覚的トークンへと生じる。
textbfPAINT (textbfPaying textbfAttention to textbfINformed textbfTokens) は、大規模視覚言語モデルの自己保持機構を介するプラグイン・アンド・プレイフレームワークである。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 01:49:37 GMT)
Optimal shortcut-to-adiabaticity quantum control [0.0] エネルギー消費を最小に抑えたショートカット・ツー・アディバチティティプロトコルを新たに導入する。
制御プロセスは反断熱駆動と同じ変換を生成するが、最小限のエネルギーコストで発生する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 00:46:19 GMT)
Optimal Scaling Laws for Efficiency Gains in a Theoretical Transformer-Augmented Sectional MoE Framework [0.0] 本稿では,Transformer-augmented, sectional Mixture-of-Expertsアーキテクチャの理論的枠組みを紹介する。
当社のアプローチでは,それぞれのトークン表現のセグメントを専用の専門家に割り当てる,埋め込みディメンション自体を分割しています。
我々は、専門家の数とモデル次元、シーケンス長、システムオーバーヘッドなどの要因の間の非線形関係が最適スケーリング法則を導出することにより、我々の理論を拡張した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:33:38 GMT)
Ontology-based Semantic Similarity Measures for Clustering Medical Concepts in Drug Safety [0.0] 6つの意味的類似度尺度 (SSMs) を薬物安全性データに分類し, MedDRA 優先用語 (PTs) のクラスタリングについて検討した。
特にINTRINSIC-LINとSokaLでは,クラスタリングの精度が向上した。
本研究は,早期信号検出の改善と手動による評価の低減により,ICベースのSSMの薬剤移動性向上に寄与することが示唆された。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:19:00 GMT)
On a certain inequality for the sum of norms and reverse uncertainty relations [0.0] 内積空間における2つのベクトルのノルムの和に対する単純な不等式を証明する。
いわゆる「逆不確実性関係」を導出し、その性質を解析する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:49:22 GMT)
New local stabilizer codes from local classical codes [0.0] 本稿では,近年の2D$ローカル・クラシック・コーパスの進歩から得られた局所的および低ウェイトな安定化符号について論じる。
重み付けおよびクォービット使用量5ドルのコードを構築し、高い距離またはより大きな論理的数で情報を保護することができる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:53:36 GMT)
Named Entity Recognition in Context [0.0] 本稿では,EvaHan2025 コンペティションのために Edit Dunhuang チームが開発した Named Entity Recognition システムについて述べる。
提案手法は3つのコアコンポーネントを統合した。Pindola, 古典中国語の大量のコーパスに事前訓練された, 近代中国語のトランスフォーマーをベースとした双方向エンコーダ, ターゲットシーケンスごとに関連する外部コンテキストを取得する検索モジュールである。
このアプローチを用いて、平均F1スコア85.58を達成し、競技ベースラインをほぼ5ポイント改善する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:37:19 GMT)
Modelling and optimization of pulsed squeezed state generation in a ring-resonator system [0.0] 損失リング共振器に側結合した導波路導波路におけるスクイーズスペクトルとアンチスクイーズスペクトルを計算した。
10dB以上のスキーズは,22dB未満の抗スキーズ用チャネルにおいて容易に達成できることが判明した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:04:39 GMT)
Modelling Privacy Compliance in Cross-border Data Transfers with Bigraphs [0.0] 筆者らはMilnerのBigraphical Reactive Systemsに基づくプライバシーフレームワークを提案する。
WhatsAppのプライバシポリシをモデル化することで、フレームワークの適用性を実証する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:50:55 GMT)
Model-Driven Rapid Prototyping for Control Algorithms with the GIPS Framework (System Description) [0.0] 我々は、ソフトウェアシステムの迅速なプロトタイピングをサポートするために、GIPS(Graph-based ILP Problem Specification)フレームワークを作成しました。
高レベルの仕様言語であるGIPSL(Graph-based ILP Problem Specification Language)を使用して、制約と目的のセットとして、望ましいモデル最適化を指定できます。
GIPSは、実行時に与えられた入力グラフインスタンスを最適化する実行可能な(Java)ソフトウェアアーティファクトを自動的に引き出すことができる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:52:52 GMT)
Lexical Manifold Reconfiguration in Large Language Models: A Novel Architectural Approach for Contextual Modulation [0.0] 連続的な幾何学的変換を通じてトークン埋め込みを動的に再構成するための構造化手法を開発した。
多様体をベースとした変換機構は、語彙的位置決めを規制するために統合され、埋め込みは制御されたシフトを受けることができる。
経験的評価により, 組込み再構成は難易度低減, 語彙コヒーレンスの改善, 文レベルの連続性の向上に寄与した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:58:26 GMT)
Learning Data-Driven Uncertainty Set Partitions for Robust and Adaptive Energy Forecasting with Missing Data [0.0] 短期的な風力発電予測モデルでは、投入時に入力データ(機能)が利用可能であることを前提としている。
機器の故障、破壊、サイバー攻撃は、そのようなモデルが運用に使用される際に欠落する可能性がある。
適応的ロバスト最適化と対向機械学習を用いて、不足したデータをシームレスに操作する予測モデルを開発する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:38:56 GMT)
Latent Convergence Modulation in Large Language Models: A Novel Approach to Iterative Contextual Realignment [0.0] 隠れ状態遷移を制御する構造変調機構が導入された。
格子調整は、パープレキシティ変動、エントロピー分散、および語彙不安定の低減に寄与した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:53:34 GMT)
LLPut: Investigating Large Language Models for Bug Report-Based Input Generation [0.0] エラーを引き起こすインプットは、ソフトウェアバグの診断と分析において重要な役割を担います。
従来の研究では、様々な自然言語処理(NLP)技術を利用して自動入力抽出を行っている。
大規模言語モデル (LLMs) の出現により、重要な研究課題が生じる: ジェネレーティブLLMは、バグレポートから障害誘発インプットを効果的に抽出できるのか?
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:25:01 GMT)
Intelligent Code Embedding Framework for High-Precision Ransomware Detection via Multimodal Execution Path Analysis [0.0] マルチモーダル実行経路解析によりランサムウェアの活動を特定する新しいフレームワークを開発した。
高次元の埋め込みと動的導出機構を統合し、多様な攻撃変異体にわたる行動パターンをキャプチャする。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:52:26 GMT)
Integrated utilization of equations and small dataset in the Koopman operator: applications to forward and inverse Problems [0.0] 本稿では,不明瞭な事前知識をEDMDアルゴリズムに組み込む手法を提案する。
曖昧な事前知識は、未知のパラメータを持つ基礎となる時間進化方程式に対応する。
提案手法を逆問題に適用する手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 23:45:06 GMT)
Innovative LSGTime Model for Crime Spatiotemporal Prediction Based on MindSpore Framework [0.0] 本稿では,Long Short-Term Memory(LSTM)とGated Recurrent Unit(RU)とMultiheadparse Self-attentionメカニズムを統合した犯罪時空間予測モデルLGSTimeを提案する。
統合モデルは、複雑な時間的データを扱うために、それぞれのテクニックの強みを活用する。
CNNモデルと比較して、Mean Squared Error(MSE)、Mean Absolute Error(MAE)、Root Mean Squared Error(RMSE)の2.8%、1.9%、および1.4%のパフォーマンス向上を示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 00:57:38 GMT)
Including local feature interactions in deep non-negative matrix factorization networks improves performance [0.0] 非負行列分解(NMF)は、正の長距離相互作用の生物学的制約を捉える。
NMFモジュールによる深層畳み込みネットワークの性能は、同様の大きさのCNNと一致しない。
この設定は、深層ネットワークの性能を向上させる可能性を秘めた、皮質(ハイパー)カラムにおける処理の生物学的により妥当なエミュレーションと見なすことができる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:21:38 GMT)
Improving Variational Quantum Circuit Optimization via Hybrid Algorithms and Random Axis Initialization [0.0] 変分量子回路(VQC)は、ノイズの多い中間スケールの量子コンピュータを実用的な問題に適用する上で欠かせないツールである。
VQCに特化して設計された勾配のない最適化アルゴリズムであるRotosolve法の性能を向上させる。
我々は、FQSの優れた表現性を活用しながら、ロトゾルの初期収束の恩恵を受けるハイブリッドアルゴリズムを構築した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:10:19 GMT)
Improving Speech Recognition Accuracy Using Custom Language Models with the Vosk Toolkit [0.0] 本研究は,オープンソースのVosk Toolkitを用いたカスタム言語モデルを用いて,各種設定における音声とテキストの精度を向上する方法について検討する。
Pythonベースの転写パイプラインは入力音声を処理し、VoskのKaldiRecognizerを使って音声認識を行い、出力をDOCXファイルにエクスポートするために開発された。
結果は、特に専門用語、アクセントの変化、背景雑音を含むドメイン固有のシナリオにおいて、カスタムモデルが単語エラー率を減少させることを示した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 22:20:48 GMT)
Imitating Radiological Scrolling: A Global-Local Attention Model for 3D Chest CT Volumes Multi-Label Anomaly Classification [0.0] 3次元CTスキャンのマルチラベル分類は、データの体積特性と検出すべき異常の多様性のために難しい課題である。
畳み込みニューラルネットワーク(CNN)に基づく既存のディープラーニング手法は、長距離依存を効果的に捉えるのに苦労する。
我々は,3次元CTスキャン解析において,放射線技師のスクロール挙動をエミュレートする新しいグローバルアテンションモデルCT-Scrollを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:47:50 GMT)
Hybrid interfaces at the single quantum level in fluorescent molecules [0.0] 複数の外部レーザー源が単一の蛍光分子の振動状態を制御している。
定常状態は振動の両モード性を示し、非古典的な振動子猫状態の統計的混合をもたらす。
この研究は、電子、光子、振動のハイブリッドな絡み合った状態を作るための最適量子ツールボックスとしての分子の役割を評価する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:00:03 GMT)
Hybrid Multi-Stage Learning Framework for Edge Detection: A Survey [0.0] 本稿では,CNN(Convolutional Neural Network)機能抽出とSVM(Support Vector Machine)を統合したハイブリッド多段階学習フレームワークを提案する。
提案手法は特徴表現と分類段階を分離し,堅牢性と解釈可能性を向上させる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:06:31 GMT)
Highly charged isomeric qubits from antiproton annihilation [0.0] イオントラップ装置で高電荷の合成量子ビットを生成するために, 抗陽子の消滅を利用する方法について述べる。
我々は、異性体と基底状態の単一電子からなる水素様原子の超微細分裂における量子ビット遷移を同定する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:50:31 GMT)
Grayscale to Hyperspectral at Any Resolution Using a Phase-Only Lens [0.0] 我々は、HxWグレースケールのスナップショット測定から、HxWx31ハイパースペクトル像を再構成する問題について検討する。
我々は,小さなパッチで動作する条件付き偏差拡散モデルを訓練することにより,限られたデータの利用を効率的に行う。
実験の結果,パッチサイズはPSFほど小さく,良好な結果が得られた。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 22:33:39 GMT)
Graph-Instructed Neural Networks for Sparse Grid-Based Discontinuity Detectors [0.0] このアプローチは、グラフ命令ニューラルネットワーク(GINN)とスパースグリッドを利用して、3より大きい次元の領域における不連続検出に対処する。
スパースグリッド上の問題点を特定するために訓練されたGINNは、グリッド上に構築されたグラフ構造を利用して、効率的で正確な不連続検出性能を実現する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:57:20 GMT)
Generator Cost Coefficients Inference Attack via Exploitation of Locational Marginal Prices in Smart Grid [0.0] リアルタイムの価格信号と発電レベルは、効率と透明性を促進するためにインディペンデント・システム・オペレーター(ISO)によって一般に公開されている。
発電機のコスト関数など、電力網に関する重要なプライベート情報を不注意に明らかにすることができる。
広告主はこれらの脆弱性を戦略的入札に利用でき、パワーマーケットの参加者や消費者に経済的損失をもたらす可能性がある。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 20:39:29 GMT)
Generalized hydrodynamics of integrable quantum circuits [0.0] 原型可積分モデルであるXXZハイゼンベルクスピン鎖の可積分トロッター化について検討する。
接合部における単一微細な欠陥、例えば1量子ビットの追加は、遅く出現する非平衡マクロ状態を変化させる可能性がある。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:24:49 GMT)
General protocols for the efficient distillation of indistinguishable photons [0.0] 識別不能な光子を蒸留するための最先端プロトコルを導入し、識別性エラー率を$n$の係数で低減する。
この効率的な判別可能性誤差率の低減は、フォールトトレラント線形光量子計算に直接的な応用をもたらす。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 22:04:20 GMT)
GD-VAEs: Geometric Dynamic Variational Autoencoders for Learning Nonlinear Dynamics and Dimension Reductions [0.0] 我々は、観測から非線形力学の同相表現を学習するためのデータ駆動手法を開発した。
このアプローチは、一般多様体ラテント空間の力学の非線形状態空間モデルを学ぶ。
パラメータ化されたPDEと物理における問題に動機付けられ, 縮小次元表現の学習タスクにおける手法の性能について検討した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 23:01:01 GMT)
From Public Data to Private Information: The Case of the Supermarket [0.0] 計算データ処理は現在のプロセスの多くに必要であり、プライバシー侵害ではない、と私は主張する。
問題とソリューションのスケッチはケーススタディ(スーパーマーケットの顧客カード)で説明されている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:22:02 GMT)
Flow Matching Beyond Kinematics: Generating Jets with Particle-ID and Trajectory Displacement Information [0.0] 我々はJetClassデータセットでトレーニングされた最初の生成モデルを紹介する。
本モデルでは, 構成レベルでジェットを発生させ, 流れマッチング法でトレーニングした変分同変連続正規化流(CNF)である。
また,ジェット部品の運動特性を超越した生成モデルも導入した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:50:52 GMT)
Filter-enhanced adiabatic quantum computing on a digital quantum processor [0.0] 本稿では,ノイズの存在下で量子ハードウェア上に基底状態フィルタを実装する戦略について述べる。
断熱的に準備された入力状態は、フィルタの成功確率を高め、回路深さの要求を低減させる。
量子スピンモデルにおける基底状態の精度の大幅な向上を示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:08:12 GMT)
Fault-Tolerant Optical Quantum Computation using 3D Hybrid Cluster States [0.0] 異なる物理系や自由度のハイブリッド化は、実用的で普遍的でスケーラブルでフォールトトレラントな量子計算(FTQC)を実現する上で大きな利点をもたらす
本稿では,離散可変(DV)と連続可変(CV)の双方の強度を利用して,低スケズ閾値の光FTQC方式を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 07:37:36 GMT)
FREIDA: A Framework for developing quantitative agent based models based on qualitative expert knowledge: an example of organised crime [0.0] 組織犯罪ネットワークのABMの開発は法執行戦略を支持するが、量的データ不足によって制限されることが多い。
FREIDAは、定性的および定量的なデータを組み合わせて、データスパースコンテキストにおけるABMの開発と訓練、検証を行う混合メソッドフレームワークである。
Freidaは、限られたデータで堅牢なABM開発を可能にし、法執行機関の決定とリソース割り当てを支援する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:31:00 GMT)
Exponential quantum speedups in quantum chemistry with linear depth [0.0] 我々は、フェルミオン魔法状態入力でマッチゲート回路を保持する粒子数との接続を証明した。
この結果は、短期量子ハードウェア用に設計された量子マルチ参照手法に適用する。
本稿では,短期ハードウェア上での量子化学における指数的量子優位性の実現について論じる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 23:15:32 GMT)
Euclidean Distance to Convex Polyhedra and Application to Class Representation in Spectral Images [0.0] 提案手法は, 高度地図の再構築における最先端手法を超越した手法である。
線形アンミックスモデルと互換性のないリチウムイオン電池のスペクトル画像への応用は、この方法の一般化と有効性を検証する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:55:18 GMT)
Entanglement routing via passive optics in CV-networks [0.0] 本稿では,大規模なボソニックノードネットワークにおいて,特定のノード間の絡み合いリンクを確立することを含む絡み合いルーティングについて考察する。
ネットワークは有限スキーズと受動線形光学から構築された連続可変グラフ状態である。
本研究では,2つのクライアント間の通信チャネルを確立することを目的として,双方向ルーティングプロトコルを構築した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:45:18 GMT)
Emotion Detection in Twitter Messages Using Combination of Long Short-Term Memory and Convolutional Deep Neural Networks [0.0] この記事では、約4億2000万人のアクティブユーザーがいる最も人気のあるソーシャルネットワークの1つであるTwitterを使って、データを抽出する。
本研究では、教師付き学習とディープニューラルネットワークアルゴリズムを用いて、Twitterユーザーの感情状態を分類する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 02:39:54 GMT)
Emotion Detection and Music Recommendation System [0.0] 本稿では,音楽レコメンデーションと感情に基づく検出にディープラーニングを用いた新しいシステムを提案する。
このシステムは人間の感情をリアルタイムで分析し、発見した気分を反映した音楽を演奏する。
本システムの目的は、レスポンシブで自動的な音楽選択体験を提供することで、音楽療法による感情的幸福感を改善することである。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:22:06 GMT)
Electric Field Distortions in Surface Ion Traps with Integrated Nanophotonics [0.0] 本研究では,表面イオントラップの電界歪みを導波路と格子カプラを一体化して検討する。
我々は, 対称性と透明導電性酸化物材料を利用して, これらの歪みを低減させる手法を解析した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:09:31 GMT)
Dissipative protection of a GKP qubit in a high-impedance superconducting circuit driven by a microwave frequency comb [0.0] 本稿では,GKP量子ビットの生成,保護,制御を行う新しい手法を提案する。
マイクロ波周波数コムを用いてジョセフソン回路をパラメトリック変調し、高いインピーダンス回路モードの散逸ダイナミクスを強制する。
符号化されたGKP量子ビットは、超伝導回路をプレーグする全ての支配的なデコヒーレンスチャネルに対して、準粒子中毒に対して堅牢に保護されている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:33:24 GMT)
Dewey Long Context Embedding Model: A Technical Report [0.0] dewey_en_betaは、MTEB(Eng, v2)およびLongEmbedベンチマーク上で優れたパフォーマンスを実現する、新しいテキスト埋め込みモデルである。
本稿では,オープンソースのdewey_en_beta埋め込みモデルのトレーニング手法と評価結果について述べる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:55:00 GMT)
Demand Estimation with Text and Image Data [0.0] 本稿では,非構造化テキストと画像データを利用して置換パターンを推定する需要推定手法を提案する。
提案手法は, 消費者の2番目の選択に対する反実的予測において, 標準属性ベースモデルよりも優れていることを示す。
また、Amazon.comの40の製品カテゴリにまたがって適用し、テキストと画像データが各カテゴリ内の近い代替品を特定するのに役立つことを一貫して見つける。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:47:14 GMT)
Decomposing the Spectral Form Factor [0.0] 系のスペクトルのエネルギー間の相関は、量子カオスの定義された特徴の1つである。
この2点相関関数の構築に各スペクトル距離がどのように寄与するかを考察する。
我々は、遠距離スペクトル距離からの寄与を反映して、ディップまたはThouless時間によって特徴づけられるランプの開始が、より短い時間に変化することを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 09:23:58 GMT)
Decentralized Entropy-Driven Ransomware Detection Using Autonomous Neural Graph Embeddings [0.0] このフレームワークはノードの分散ネットワークで動作し、単一障害点を排除し、ターゲット攻撃に対するレジリエンスを強化する。
グラフベースのモデリングと機械学習技術の統合により、このフレームワークは複雑なシステムインタラクションをキャプチャできる。
ケーススタディでは、実世界のシナリオでの有効性を検証するとともに、ランサムウェア攻撃を開始後数分で検出し軽減する能力を示している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:54:51 GMT)
Data Augmentation in Earth Observation: A Diffusion Model Approach [0.0] 本研究では,意味的多様性を高めるために拡散モデルを統合する4段階データ拡張手法を提案する。
我々のアプローチは確立された手法を一貫して上回り、意味的に多様なEO画像を生成し、AIモデルの性能を向上させる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:23:33 GMT)
Control, Optimal Transport and Neural Differential Equations in Supervised Learning [0.0] Ruiz-Balet and Zuazua (SIAM ReVIEW 2023)
著者は制御理論、最適輸送理論、および神経微分方程式の間の関係に関してオープンな問題を提起する。
本稿では,限界における真の動的最適輸送に収束する神経微分方程式の構成を提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:56:07 GMT)
Contextually Structured Token Dependency Encoding for Large Language Models [0.0] 自己注意機構は動的文脈依存を捉えるが、学習した重み分布への依存は、生成配列における長距離階層構造の保存を制限する。
依存性を意識したトークンエンコーディングでは,トークン表現内にリレーショナル制約を埋め込むという,構造化されたアプローチが導入されている。
経験的評価は、多種多様な言語ベンチマークにおけるパープレキシティの低下を示し、自己回帰テキスト生成における文脈的一貫性と予測一貫性の改善を示唆している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:53:32 GMT)
Contextual Subspace Manifold Projection for Structural Refinement of Large Language Model Representations [0.0] ディープ・ニューラル・アーキテクチャの内部表現は言語構造の高次元抽象化を符号化する。
本稿では,制御された部分空間制約によりトークン埋め込みを選択的に再構成する構造的精細化手法を提案する。
実験により、構造的介入により異方性が減少し、表現のコンパクト性が改善された。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:54:04 GMT)
Context-Aware Semantic Recomposition Mechanism for Large Language Models [0.0] コンテキスト・アウェア・セマンティック・リコレーション・メカニズム(CASRM)は、大規模テキスト生成タスクにおけるコヒーレンス、コンテキスト適応性、エラー伝搬の制限に対処する新しいフレームワークとして導入された。
実験により、技術的、会話的、物語的テキストを含む複数の領域における意味的コヒーレンスを大幅に改善した。
このフレームワークは、逐次的なタスクにおけるエラーの伝播を軽減し、対話継続と多段階テキスト合成のパフォーマンスを向上させる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:57:24 GMT)
Concept Map Assessment Through Structure Classification [0.0] 本研究では,317の異なる概念マップ構造について検討し,これらを3つのタイプのうちの1つに分類した。
決定木を用いた分類では86%の精度を得た。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 19:31:15 GMT)
Comparative analysis and evaluation of ageing forecasting methods for semiconductor devices in online health monitoring [0.0] 半導体およびパワーモジュールの一次時効機構は、熱疲労による亀裂成長に起因するボンドワイヤリフトオフである。
本研究は, 故障予測のための様々な予測手法を総合的に評価する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:24:20 GMT)
Cherry Yield Forecast: Harvest Prediction for Individual Sweet Cherry Trees [0.0] 本論文は,サツマイモのデジタル双生児を育成することを目的とした,For5Gプロジェクトの出版シリーズの一部である。
対象物が手動で数えられる場合, サツマイモの収量予測が可能であるとともに, 同様の精度で自動的特徴抽出が未解決の課題であることが結論された。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:50:02 GMT)
Cavity quantum electrodynamics with single perovskite quantum dots [0.0] 我々は,個々のCsPbBr$_3$ペロブスカイト量子ドットを,可変で高品質な,低モードの体積繊維をベースとしたFabry-P'erotマイクロキャビティに決定論的かつ可逆的に結合することを示す。
量子ドット放出と共鳴してキャビティモードを調整することにより、単一光子放出率の最大2倍の増大を観測する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:40:15 GMT)
Causal consistency requirements for gravity-induced entanglement in near-relativistic systems with internal energy [0.0] 我々は,重力場と位置空間量子状態との絡み合いを利用した思考実験を,より高速な光信号処理の手段として再考する。
本稿では、重力相シフトに対する感度を高めるために、より高い内部エネルギーレベルへの励起を含むプロトコルを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:11:43 GMT)
Can Large Language Models Predict Associations Among Human Attitudes? [0.0] 大規模言語モデル(LLM)は他の態度に基づいて人間の態度を予測することができることを示す。
多様な態度文に対する人間の反応の新たなデータセットを用いて,フロンティア言語モデル(GPT-4o)が個々の態度の相互相関を再現できることを発見した。
先行研究の進歩として,姿勢の相似性の欠如を予測できるGPT-4oの能力を検証した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 21:58:43 GMT)
BeLightRec: A lightweight recommender system enhanced with BERT [0.0] 本研究は,2つの項目類似性信号の源泉である協調フィルタリングと,項目名と記述間の意味的類似性尺度を組み合わせたものである。
信号はグラフ畳み込みニューラルネットワークに統合され、モデルウェイトを最適化し、正確なレコメンデーションを提供する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 04:03:20 GMT)
Automated and Risk-Aware Engine Control Calibration Using Constrained Bayesian Optimization [0.0] 筒内圧力曲線形状に基づく自己学習校正法を提案する。
最大熱機関効率を実現するため、最適化問題は、実際の気筒内圧力曲線と理想化熱力学サイクルとの差を最小化することを目的としている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 12:32:53 GMT)
Automated Reasoning in Blockchain: Foundations, Applications, and Frontiers [0.0] 分散コンセンサスアルゴリズムと暗号技術を通じて達成された分散化、不変性、監査性は、透明性と信頼を必要とするマルチステークホルダーアプリケーションに利点を提供する。
しかし、ブロックチェーンシステムの本質的な複雑さとセキュリティクリティカルな性質は、潜在的な脆弱性に対する正確性、信頼性、レジリエンスを保証するために厳格な分析と検証を必要とする。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 11:48:54 GMT)
Asset price movement prediction using empirical mode decomposition and Gaussian mixture models [0.0] GameStop、Tesla、Rippleの市場では、5年、2年、1年のロウソクデータのサンプルを使っていました。
線形モデルおよびその他の古典的特徴に基づいて,次の時間の動きを予測するために,いくつかの特徴を収集した。
我々はランダムフォレスト(RF)やXGBoostなど、さまざまな機械学習モデルの性能を市場の動きの分類において評価した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:12:11 GMT)
Assessing Generative Models for Structured Data [0.0] 本稿では,データ内のカラム間依存関係を調べることで,実データに対して合成データを評価するための厳密な手法を提案する。
大規模言語モデル (GPT-2) は,数発のプロンプトによってクエリされた場合と微調整された場合の両方で,GAN (CTGAN) モデルは元の実データに類似した依存関係を持つデータを生成しないことがわかった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:19:05 GMT)
Assessing Consistency and Reproducibility in the Outputs of Large Language Models: Evidence Across Diverse Finance and Accounting Tasks [0.0] 本研究は,財務・会計研究における大規模言語モデル(LLM)出力の整合性と精度の総合評価を初めて行った。
3つのOpenAIモデルを使用して、さまざまな財務資料やデータから340万以上のアウトプットを生成します。
LLMは、人間の専門家が意見が一致しない場合でも、専門家のアノテータを著しく上回っている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:48:00 GMT)
Application of Haldane's statistical correlation theory in classical systems [0.0] 修正された統計的相関理論は、指数の形で非線型性をハルデンの原理論に含めることによって提案されている。
統計的相関の相違性への依存性を強調した。
中間統計学の準古典学では、微分の不識別性を区別可能なシステムに導入することができる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:19:00 GMT)
An electrically controlled single molecule spin switch [0.0] 絶縁酸化物膜上に吸着したビスタブル錯体を用いた電気制御単分子スピンスイッチを提案する。
非弾性電子トンネル分光法(IETS)の測定と密度汎関数理論(DFT)の計算により、常磁性と非磁性スピン配置の間に明確な変化が見られる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 14:42:25 GMT)
An Operational Quantum Field Theoretic Model for Gravitationally Induced Entanglement [0.0] 空間重畳における2つの大物体間の重力誘起絡み合いの量子場理論モデルを構築した。
静的極限における線形化量子重力を用いることで、質量が占める場モード間の絡み合いを誘導する効果的なハミルトニアンを導出する。
重力によって引き起こされた絡み合いは、以前の非相対論的結果と一致して視界の低下につながる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 18:00:00 GMT)
Advancing Vulnerability Classification with BERT: A Multi-Objective Learning Model [0.0] 本稿では,BERT(Bi Representations from Transformers)モデルを用いて複数ラベル分類を行う新しい脆弱性レポートを提案する。
システムはREST APIとStreamlit UIを介してデプロイされ、リアルタイムの脆弱性分析を可能にする。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 06:04:45 GMT)
Active Data Sampling and Generation for Bias Remediation [0.0] トレーニング済みのクラスを微調整する際、不公平な分類を補うために、サンプリングとデータ生成の混合戦略が提案されている。
視覚的セマンティック・ロール・ラベリングのためのDeep Modelsのケーススタディとして、提案手法は90/10の不均衡から始まるシミュレートされたジェンダーバイアスを完全に解決することができる。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 10:42:15 GMT)
Accelerated State Expansion of a Nanoparticle in a Dark Inverted Potential [0.0] 125nmのシリカナノ粒子の質量中心の熱状態は、260 mu$sで43.4nmの位置不確実性に拡張する。
この研究は、前例のない質量と長さのスケールで、マクロ的な量子重ね合わせを準備するための重要な進歩を示している。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 16:40:33 GMT)
Accelerate Parallelizable Reasoning via Parallel Decoding within One Sequence [0.0] 推論プロセスを加速するために、特定のタスクの固有の並列化性を活用します。
実験結果から,提案手法は復号時間において100%以上の高速化を実現し,精度は基本的に維持できることがわかった。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:28:57 GMT)
AI-Driven MRI Spine Pathology Detection: A Comprehensive Deep Learning Approach for Automated Diagnosis in Diverse Clinical Settings [0.0] このAIシステムは、インドの13の大手ヘルスケア企業に展開された。
データセットは年齢層、性別、スキャナーメーカー間でバランスを取り、堅牢性と適応性を保証する。
正常と異常の分類は98.0パーセントの精度を達成した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:33:03 GMT)
A weakly-supervised deep learning model for fast localisation and delineation of the skeleton, internal organs, and spinal canal on Whole-Body Diffusion-Weighted MRI (WB-DWI) [0.0] 全体拡散強調MRI(WB-DWI)のADC値とTotal Diffusion Volume(TDV)が癌画像バイオマーカーとして認識されている。
最初のステップとして, 骨格, 隣接する内臓器(肝, 脾臓, 膀胱, 腎臓) および脊髄の高速かつ再現可能な確率マップを生成するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:03:46 GMT)
A Methodology to extract Geo-Referenced Standard Routes from AIS Data [0.0] 本研究では,海洋における関心点間の経路を解析し,地理的に基準となる経路を抽出する手法を提案する。
このアプローチは、北極地域とヨーロッパ、中東、北アフリカ地域をカバーする6年間のAISデータセットのデータに基づいてテストされている。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 13:29:41 GMT)
A Computational Model for Ransomware Detection Using Cross-Domain Entropy Signatures [0.0] マルチドメインシステムのバリエーションを分析するために,エントロピーに基づく計算フレームワークを導入した。
良性およびランサムウェア誘発のエントロピーシフトを区別する検出法を開発した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:56:28 GMT)
A Case Study in Acceleration AI Ethics: The TELUS GenAI Conversational Agent [0.0] 加速倫理は、人工知能におけるイノベーションと安全の間の緊張に対処する。
本稿では, 理論的な立場を要約し, 加速倫理が実例でどのように機能するかを示す。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 17:50:32 GMT)
3D Convolutional Neural Networks for Improved Detection of Intracranial bleeding in CT Imaging [0.0] 脳内出血(Intracranial bleeding, IB)は、外傷性脳損傷によって引き起こされる致命的な疾患である。
従来のイメージングは遅く、特に高圧のシナリオでは変動しがちである。
本稿では、緊急時にIB検出を変換するAIの役割について説明する。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 08:10:29 GMT)
100% Elimination of Hallucinations on RAGTruth for GPT-4 and GPT-3.5 Turbo [0.0] Acuraiは、入力前にクエリやコンテキストデータを再構成することで、大きな言語モデル(LLM)で100%幻覚のない応答を達成する。
本手法をRAGTruth corpusを用いて検証し, GPT-4 と GPT-3.5 Turbo の幻覚を100%除去できることを実証した。
論文参考訳(メタデータ) (Wed, 26 Mar 2025 15:18:53 GMT)