OASIS: Open Agent Social Interaction Simulations with One Million Agents [147.0] 実世界のソーシャルメディアプラットフォームに基づくスケーラブルなソーシャルメディアシミュレータを提案する。
OASISは最大100万人のユーザをモデリングできる大規模なユーザシミュレーションをサポートする。
我々は、情報拡散、グループ分極、XプラットフォームとRedditプラットフォーム間の群れ効果など、様々な社会現象を再現する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:22:19 GMT)
ALF: Adaptive Label Finetuning for Scene Graph Generation [116.6] 画像中の被写体と物体の関係を予測するためのシーングラフ生成の試み
関係の長期分布は、しばしば粗いラベルの偏りの予測につながり、SGGにおいて大きなハードルとなる。
我々はSGGに1段階のデータ転送パイプラインを導入し、ALF(Adaptive Label Finetuning)と呼ばれ、追加のトレーニングセッションを不要にする。
ALFは一般的なSGG法であるMotifに比べてmR@100が16%改善され、最先端のIETransに比べて計算コストは6%増加した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 01:55:07 GMT)
REDUCIO! Generating 1024$\times$1024 Video within 16 Seconds using Extremely Compressed Motion Latents [110.4] 大規模アプリケーションにとって重要な障害のひとつは、高価なトレーニングと推論コストである。
本稿では,ビデオには画像よりもはるかに冗長な情報が含まれており,非常に少ない動きの潜伏者によってエンコード可能であることを論じる。
我々は、合計3.2Kのトレーニング時間でReduceio-DiTをトレーニングし、1つのA100 GPUで15.5秒以内に16フレームの1024*1024ビデオクリップを生成する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:08:12 GMT)
UniVST: A Unified Framework for Training-free Localized Video Style Transfer [102.5] 本稿では拡散モデルに基づく局所化ビデオスタイル転送のための統合フレームワークUniVSTを提案する。
トレーニングを必要とせずに動作し、ビデオ全体にわたってスタイルを転送する既存の拡散方法に対して、明確なアドバンテージを提供する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:16:50 GMT)
LaVin-DiT: Large Vision Diffusion Transformer [100.0] LaVin-DiTは、20以上のコンピュータビジョンタスクを生成フレームワークで扱うために設計された、スケーラブルで統一された基盤モデルである。
視覚タスクの生成性能を最適化するための重要なイノベーションを紹介する。
このモデルは0.1Bから3.4Bのパラメータに拡張され、様々な視覚タスクにまたがる相当なスケーラビリティと最先端の性能を示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:48:45 GMT)
Efficient Long Video Tokenization via Coordinate-based Patch Reconstruction [93.7] CoordTokは、座標ベースの表現から入力ビデオの対応するパッチへのマッピングを学ぶビデオトークンである。
CoordTokは、ビデオを分解された三面体表現にエンコードし、ランダムにサンプリングされた$(x,y,t)$座標に対応するパッチを再構築する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:03:14 GMT)
Getting aligned on representational alignment [93.1] 本研究では,認知科学,神経科学,機械学習における表現的アライメントの研究を行う。
重複する関心にもかかわらず、これらの分野の間には知識の伝達が限られている。
本稿では,表現アライメント研究のための共通言語として機能する統一フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:31:41 GMT)
Anytime Acceleration of Gradient Descent [92.0] 我々は,任意の停止時間に対して,勾配降下が$O(T-1.03)$の収束保証を達成するための段階的スケジュールを提案する。
我々はこの理論を拡張して、滑らかで強い凸最適化のために$exp(-Omega(T/kappa0.97)$の収束を保証する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:29:44 GMT)
PassionSR: Post-Training Quantization with Adaptive Scale in One-Step Diffusion based Image Super-Resolution [87.9] 拡散に基づく画像超解像(SR)モデルでは、複数のデノナイジングステップのコストで優れた性能を示す。
本稿では,一段階拡散(OSD)画像SR,PassionSRにおける適応スケールの学習後量子化手法を提案する。
我々のPassionSRは、画像SRの最近の先進的な低ビット量子化法に対して大きな利点がある。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:49:42 GMT)
MVGenMaster: Scaling Multi-View Generation from Any Image via 3D Priors Enhanced Diffusion Model [87.7] MVGenMasterは3Dプリエントで拡張された多視点拡散モデルであり,NVS(多目的なノベルビュー合成)タスクに対処する。
我々のモデルは、可変参照ビューとカメラポーズで条件付けられた100の新しいビューを生成できる、シンプルで効果的なパイプラインを特徴としている。
スケールアップデータセットを用いてモデルを強化するために,いくつかのトレーニングとモデル修正を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:33:58 GMT)
3D Convex Splatting: Radiance Field Rendering with 3D Smooth Convexes [87.0] 多視点画像から幾何学的に有意な放射場をモデル化するためのプリミティブとして3次元滑らかな凸を利用した3次元凸法(3DCS)を提案する。
3DCSは、MipNeizer, Tanks and Temples, Deep Blendingなどのベンチマークで、3DGSよりも優れたパフォーマンスを実現している。
本結果は,高品質なシーン再構築のための新しい標準となる3Dコンベクシングの可能性を強調した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:59:43 GMT)
On the Element-Wise Representation and Reasoning in Zero-Shot Image Recognition: A Systematic Survey [82.5] ゼロショット画像認識(ZSIR)は、限られたデータから一般化された知識を学習することにより、目に見えない領域の認識と推論を目的としている。
本稿では,ZSIRの最近の進歩を徹底的に研究し,今後の発展の基盤となるものについて述べる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:02:11 GMT)
Diffusion State-Guided Projected Gradient for Inverse Problems [82.2] 逆問題に対する拡散状態ガイド型射影勾配(DiffStateGrad)を提案する。
DiffStateGrad は拡散過程の中間状態の低ランク近似である部分空間に測定勾配を投影する。
DiffStateGradは、測定手順のステップサイズとノイズの選択によって拡散モデルのロバスト性を向上させる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 22:02:27 GMT)
DiG: Scalable and Efficient Diffusion Models with Gated Linear Attention [82.2] Diffusion Gated Linear Attention Transformers (DiG) は、最小限のパラメータオーバーヘッドを持つ単純で適用可能なソリューションである。
より優れた効率性と競争効率を示す、平易なU字型アーキテクチャの2つのバリエーションを提供する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:42:34 GMT)
ComfyBench: Benchmarking LLM-based Agents in ComfyUI for Autonomously Designing Collaborative AI Systems [80.7] この研究は、LLMベースのエージェントを使用して、協調AIシステムを自律的に設計する試みである。
ComfyBenchをベースとしたComfyAgentは,エージェントが自律的に協調的なAIシステムを生成して設計できるようにするフレームワークである。
ComfyAgentは、o1-previewに匹敵する解像度を達成し、ComfyBenchの他のエージェントをはるかに上回っているが、ComfyAgentはクリエイティブタスクの15%しか解決していない。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:32:46 GMT)
ShowUI: One Vision-Language-Action Model for GUI Visual Agent [80.5] グラフィカルユーザインタフェース(GUI)アシスタントの構築は、人間のワークフロー生産性を向上させるための大きな約束である。
デジタルワールドにおける視覚言語アクションモデル、すなわちShowUIを開発し、以下のイノベーションを特徴とする。
256Kデータを使用した軽量な2BモデルであるShowUIは、ゼロショットのスクリーンショットグラウンドで75.1%の精度を実現している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:29:47 GMT)
Delta-CoMe: Training-Free Delta-Compression with Mixed-Precision for Large Language Models [79.5] 多様なアプリケーションへの微調整された大規模言語モデル(LLM)は、複雑な要求を満たすために不可欠である。
近年の研究では、微調整LDMをベースモデルと対応するデルタウェイトに分解し、低ランクまたは低ビットのアプローチで圧縮してコストを削減することが示唆されている。
本研究では,従来の低ランク圧縮法と低ビット圧縮法がタスク固有の微調整LDMのモデル性能を著しく損なうことを観察する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:50:52 GMT)
All Languages Matter: Evaluating LMMs on Culturally Diverse 100 Languages [73.9] ALM-benchは、100言語にわたるLMMを評価するための、これまでで最大かつ最も包括的な取り組みである。
様々な言語でテキストと組み合わせた文化的に多様なイメージを理解し、推論する能力をテストすることで、既存のモデルに挑戦する。
このベンチマークは、真/偽、複数選択、オープンな質問など、さまざまな質問フォーマットを備えた、堅牢でニュアンスの高い評価フレームワークを提供する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:32:19 GMT)
A Multi-Grained Symmetric Differential Equation Model for Learning Protein-Ligand Binding Dynamics [73.4] 薬物発見において、分子動力学(MD)シミュレーションは、結合親和性を予測し、輸送特性を推定し、ポケットサイトを探索する強力なツールを提供する。
我々は,数値MDを容易にし,タンパク質-リガンド結合ダイナミクスの正確なシミュレーションを提供する,最初の機械学習サロゲートであるNeuralMDを提案する。
従来の数値MDシミュレーションと比較して1K$times$ Speedupを実現することにより,NeuralMDの有効性と有効性を示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:13:02 GMT)
Mind the Graph When Balancing Data for Fairness or Robustness [73.0] データバランシングのためのトレーニングディストリビューションの条件を定義し、公正またはロバストなモデルに導く。
その結果、多くの場合、バランスの取れた分布は、望ましくない依存関係を選択的に除去することには対応しないことがわかった。
その結果,データバランシングを行う前に因果グラフを考慮に入れることの重要性を強調した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:51:08 GMT)
OSDFace: One-Step Diffusion Model for Face Restoration [72.5] 拡散モデルは、顔の修復において顕著な性能を示した。
顔復元のための新しいワンステップ拡散モデルOSDFaceを提案する。
その結果,OSDFaceは現状のSOTA(State-of-the-art)手法を視覚的品質と定量的指標の両方で上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:07:48 GMT)
A Survey on Multimodal Large Language Models [71.6] GPT-4Vで表されるマルチモーダル大言語モデル(MLLM)は、新たな研究ホットスポットとなっている。
本稿では,MLLMの最近の進歩を追跡・要約することを目的とする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:15:57 GMT)
Pushing the Limits of Large Language Model Quantization via the Linearity Theorem [71.3] 本稿では,階層的$ell$再構成誤差と量子化によるモデルパープレキシティ増加との直接的な関係を確立する「線形定理」を提案する。
この知見は,(1)アダマール回転とHIGGSと呼ばれるMSE最適格子を用いた単純なデータフリーLCM量子化法,(2)非一様層ごとの量子化レベルを求める問題に対する最適解の2つの新しい応用を可能にする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:35:44 GMT)
On-Road Object Importance Estimation: A New Dataset and A Model with Multi-Fold Top-Down Guidance [70.8] 本稿では,交通オブジェクト重要度(TOI)という,新しい大規模データセットを提案する。
ボトムアップ機能とマルチフォールドトップダウンガイダンスを統合するモデルを提案する。
我々のモデルは最先端の手法を大きなマージンで上回る。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:37:10 GMT)
Grounding-IQA: Multimodal Language Grounding Model for Image Quality Assessment [69.1] 我々は,新しい画像品質評価(IQA)タスクパラダイム,グラウンドング-IQAを導入する。
Grounding-IQAは2つのサブタスクからなる: Grounding-IQA-description (GIQA-DES) と visual question answering (GIQA-VQA)。
グラウンドディング-IQAを実現するために,提案した自動アノテーションパイプラインを通じて対応するデータセットGIQA-160Kを構築した。
提案したタスクパラダイム,データセット,ベンチマークが,よりきめ細かいIQAアプリケーションを促進することを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:03:16 GMT)
Open-Vocabulary Segmentation with Semantic-Assisted Calibration [68.4] オープンボキャブラリセグメンテーション(OVS)は,CLIPの文脈に先行して,語彙内およびドメインバイアスの埋め込み空間を校正することで研究される。
オープン語彙セグメンテーションベンチマークにおける最先端性能を実現するために,セマンティック・アシブ・キャリブレーション・ネットワーク(SCAN)を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:45:09 GMT)
WavChat: A Survey of Spoken Dialogue Models [66.8] GPT-4oのようなシステムで実証された音声対話モデルの最近の進歩は、音声領域において大きな注目を集めている。
これらの高度な音声対話モデルは、音声、音楽、その他の音声関連の特徴を理解するだけでなく、音声のスタイリスティックな特徴や音節的な特徴も捉える。
音声対話システムの進歩にもかかわらず、これらのシステムを体系的に組織化し分析する包括的調査が欠如している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:20:48 GMT)
VLRewardBench: A Challenging Benchmark for Vision-Language Generative Reward Models [66.6] 視覚言語生成報酬モデル(VL-GenRM)は、マルチモーダルAIシステムの調整と評価において重要な役割を果たす。
現在のアセスメント手法は、従来のタスクからAIアノテートされた好みラベルに依存している。
VL-RewardBenchは、一般的なマルチモーダルクエリ、視覚幻覚検出、複雑な推論タスクにまたがるベンチマークである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:08:34 GMT)
Contextual Bandits with Packing and Covering Constraints: A Modular Lagrangian Approach via Regression [65.9] 本稿では,線形制約付きコンテキスト帯域(CBwLC)について考察する。これは,アルゴリズムが全消費の線形制約を受ける複数のリソースを消費するコンテキスト帯域の変種である。
この問題はknapsacks (CBwK) を用いてコンテキスト的帯域幅を一般化し、制約のパッケージ化とカバー、および正および負のリソース消費を可能にする。
本稿では,回帰オラクルに基づくCBwLC(CBwK)のアルゴリズムについて述べる。このアルゴリズムは単純で,計算効率が良く,統計的に最適である。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:01:35 GMT)
StableAnimator: High-Quality Identity-Preserving Human Image Animation [64.6] 本稿では,最初のエンドツーエンドID保存ビデオ拡散フレームワークであるStableAnimatorについて述べる。
ポストプロセッシングなしで高品質なビデオを合成し、参照画像とポーズのシーケンスに条件付けする。
推論中,顔の質をより高めるためにハミルトン・ヤコビベルマン(HJB)方程式に基づく新しい最適化を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:59:22 GMT)
Promptable Anomaly Segmentation with SAM Through Self-Perception Tuning [63.6] Segment Anything Model (SAM) は、その顕著な一般化能力により、異常セグメンテーションタスクにおいて大きな進歩を遂げている。
SAMを直接適用する既存のメソッドは、しばしばドメインシフトの問題を見落としている。
本稿では, SAMの異常セグメンテーションに対する知覚能力を高めることを目的とした, 自己パーセプティノンチューニング(SPT)手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:33:25 GMT)
DreamMix: Decoupling Object Attributes for Enhanced Editability in Customized Image Inpainting [63.0] 本研究では,DreamMixを提案する。DreamMixは,ユーザが指定した場所のシーンに対象オブジェクトを挿入できる拡散型生成モデルである。
テキストベースの属性ガイダンスの多様性と識別能力を向上させるために,属性分離機構 (ADM) とテキスト属性置換 (TAS) モジュールを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:44:47 GMT)
UniFL: Improve Latent Diffusion Model via Unified Feedback Learning [61.7] 提案するUniFLは,フィードバック学習を活用して拡張モデルを包括的に拡張する統合フレームワークである。
UniFLは、視覚的品質を高める知覚的フィードバック学習、美的魅力を改善する分離されたフィードバック学習、推論を加速する敵対的フィードバック学習の3つの主要な構成要素から構成される。
詳細な実験と広範囲なユーザスタディにより、生成品質と推論加速度を向上させる上で、提案手法の優れた性能が検証された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:12:50 GMT)
Targeted Clifford logical gates for hypergraph product codes [61.3] ハイパーグラフ製品コードのための論理ゲートを明示的に構築する。
具体的な例として、$[[18,2,3]]$トーリック符号に対して論理回路を与える。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:32:44 GMT)
STAR: Synthesis of Tailored Architectures [61.1] 本稿では, 適合型アーキテクチャ (STAR) の新規な合成手法を提案する。
提案手法は線形入力可変系の理論に基づく新しい探索空間を結合し,階層的な数値エンコーディングをアーキテクチャゲノムに支持する。STARゲノムは,複数のモデル品質と効率の指標に最適化するために,勾配のない進化的アルゴリズムで自動的に精製・組換えされる。
STARを用いて、多種多様な計算単位と相互接続パターンを活用し、品質、パラメータサイズ、および自動回帰言語モデリングのための推論キャッシュのフロンティアにおける高度に最適化されたトランスフォーマーとストライプハイブリッドモデルを改善する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:42:42 GMT)
OphCLIP: Hierarchical Retrieval-Augmented Learning for Ophthalmic Surgical Video-Language Pretraining [60.8] OphCLIPは、眼科手術ワークフロー理解のための階層的検索強化視覚言語事前学習フレームワークである。
OphCLIPは、短いビデオクリップと詳細な物語記述、構造化タイトルによるフルビデオの調整によって、細粒度と長期の視覚表現の両方を学習する。
我々のOphCLIPは、探索されていない大規模なサイレント手術ビデオを活用するために、検索強化事前訓練フレームワークも設計している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:25:34 GMT)
Towards CausalGPT: A Multi-Agent Approach for Faithful Knowledge Reasoning via Promoting Causal Consistency in LLMs [60.2] Causal-Consistency Chain-of-Thoughtは、基礎モデルの忠実さと因果性を強化するために、マルチエージェントコラボレーションを活用する。
我々のフレームワークは、広範囲かつ包括的な評価を通じて、最先端の手法よりも大きな優位性を示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:39:04 GMT)
Against The Achilles' Heel: A Survey on Red Teaming for Generative Models [60.2] 120以上の論文を調査し,言語モデル固有の能力に根ざした,きめ細かい攻撃戦略の分類を導入した。
我々は、様々な自動レッドチーム化アプローチを統合するために、"searcher"フレームワークを開発した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:59:17 GMT)
LLM2CLIP: Powerful Language Model Unlocks Richer Visual Representation [60.0] この作業では、大規模な言語モデルと事前訓練されたCLIPビジュアルエンコーダを統合する、微調整のアプローチを導入している。
LLMの自己回帰的性質の課題に対処するために,キャプション・トゥ・キャプション・トゥ・キャプション・トゥ・コントラッシブ・ラーニング・フレームワークを提案する。
提案手法は,様々な下流タスクにおいて,大幅な性能向上を実現する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:59:28 GMT)
Words Worth a Thousand Pictures: Measuring and Understanding Perceptual Variability in Text-to-Image Generation [58.8] W1KPは、画像の集合における可変性の人間の校正尺度である。
最高の知覚距離は、9つの基準線を最大18ポイント精度で上回る。
実際のプロンプトの56の言語的特徴を分析し、プロンプトの長さ、CLIP埋め込みノルム、具体性、単語感覚が最も変動に影響を及ぼすことを示した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:40:18 GMT)
PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM [58.7] 本研究では,グラフィックレイアウトの自動生成のための統合フレームワークを提案する。
データ駆動方式では、レイアウトを生成するために構造化テキスト(JSONフォーマット)とビジュアルインストラクションチューニングを用いる。
我々は,ユーザのデザイン意図に基づいて編集可能なポスターを生成する自動テキスト投稿システムを開発した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:29:12 GMT)
Universal Segmentation at Arbitrary Granularity with Language Instruction [56.4] 言語命令のガイダンスを用いて任意の意味レベルでセグメンテーションを行うことができるユニバーサルセグメンテーションモデルUniLSegを提案する。
UniLSegをトレーニングするために、元の多様な分布から統一されたデータ形式にタスク群を再構成し、セグメンテーションターゲットを入力として記述したテキストと対応するマスクを出力する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:03:51 GMT)
Free$^2$Guide: Gradient-Free Path Integral Control for Enhancing Text-to-Video Generation with Large Vision-Language Models [56.3] Free$2$Guideは、生成したビデオをテキストプロンプトで整列するための、勾配のないフレームワークである。
Free$2$Guideは、様々な次元にわたるテキストアライメントを大幅に改善し、生成したビデオの全体的な品質を向上させる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:14:47 GMT)
Reward-Augmented Data Enhances Direct Preference Alignment of LLMs [56.2] 報奨条件付き大言語モデル(LLM)を導入し、データセット内の応答品質のスペクトル全体から学習する。
そこで本稿では,品質スコアに優先ペアを条件付け,報酬を加算したデータセットを構築する,効果的なデータレバーベリング手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:05:34 GMT)
DSTC: Direct Preference Learning with Only Self-Generated Tests and Code to Improve Code LMs [56.2] UnderlinetextbfDirect Preference Learning with only underlinetextbfSelf-Generated underlinetextbfTests and underlinetextbfCode (DSTC)を紹介する。
DSTCは自己生成コードスニペットとテストのみを使用して信頼性の高い選好ペアを構築する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 00:45:22 GMT)
Signs as Tokens: An Autoregressive Multilingual Sign Language Generator [55.9] テキスト入力から3Dサインアバターを自動回帰的に生成できる多言語手話モデルSigns as Tokens(SOKE)を導入する。
我々は,手話とLMを整合させるために,連続する記号を様々な身体部分を表すトークン列に識別する切り離されたトークン化器を開発した。
これらのサイントークンは、LMの生のテキスト語彙に統合され、手話データセットの教師付き微調整を可能にする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:28:09 GMT)
DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.5] 我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:25:13 GMT)
Efficient Multi-modal Large Language Models via Visual Token Grouping [55.5] 高解像度の画像やビデオは、彼らの広く普及するための障壁となる。
MLLMにおける視覚トークンの圧縮は、推論コストを削減するための有望なアプローチとして現れている。
本稿では,事前学習した視覚エンコーダの能力を利用して類似画像セグメントをグループ化する,新たなグループ化機構であるVisToGを紹介する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:36:02 GMT)
Contrastive CFG: Improving CFG in Diffusion Models by Contrasting Positive and Negative Concepts [55.3] As-Free Guidance (CFG) は条件拡散モデルサンプリングに有効であることが証明された。
対照的な損失を用いた負のCFG誘導を強化する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:29:27 GMT)
Learning the physics of open quantum systems from experiments [55.2] この論文は、実験データを用いて量子システムを特徴づけるツールとして適応推論を探求する。
ベイズの実験設計と高度なモンテカルロ手法を用いてハミルトン作用素とクラウス作用素を学習するためのアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:23:02 GMT)
Kochen-Specker for many qubits and the classical limit [55.2] 量子および古典予測は、量子ビットの数がマクロスケールに増加するにつれて収束することが示されている。
古典的極限を説明するこの方法は、以前にGHZ状態に対して報告された結果と一致し、改善する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 22:30:58 GMT)
Omegance: A Single Parameter for Various Granularities in Diffusion-Based Synthesis [55.0] 拡散合成における粒度を効果的に制御するために,単一のパラメータ$omega$を導入する。
このパラメータは拡散モデルの逆過程の認知段階に組み込まれている。
提案手法は,様々な画像および映像合成タスクにおける印象的な性能を示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:23:16 GMT)
Buffer Anytime: Zero-Shot Video Depth and Normal from Image Priors [54.9] Buffer Anytimeは、ビデオから深さと正規マップ(幾何バッファと呼ばれる)を推定するためのフレームワークです。
時間的整合性制約を持つ単一画像の先行値を活用することによって,高品質なビデオバッファ推定を実証する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:28:32 GMT)
AIGV-Assessor: Benchmarking and Evaluating the Perceptual Quality of Text-to-Video Generation with LMM [54.4] AIGVQA-DBは,1,048プロンプトを用いた15の高度なテキスト・ビデオ・モデルによって生成された36,576個のAIGVからなる大規模データセットである。
AIGV-Assessorは、複雑な品質特性を活用して、正確なビデオ品質スコアとペアビデオ嗜好をキャプチャする新しいVQAモデルである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:43:15 GMT)
Large-Scale Data-Free Knowledge Distillation for ImageNet via Multi-Resolution Data Generation [54.0] Data-Free Knowledge Distillation (DFKD)は、教師モデルから生徒モデルへの知識伝達を可能にする高度な技術である。
従来のアプローチでは、実際の画像の情報を活用することなく、高解像度で合成画像を生成してきた。
MUSEは、クラスアクティベーションマップ(CAM)を使用して、低い解像度で画像を生成し、生成された画像が重要なクラス固有の特徴を保持することを保証する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:23:31 GMT)
FTMoMamba: Motion Generation with Frequency and Text State Space Models [53.6] 本稿では,周波数状態空間モデルとテキスト状態空間モデルを備えた新しい拡散型FTMoMambaフレームワークを提案する。
微細な表現を学ぶために、FreqSSMは配列を低周波成分と高周波成分に分解する。
テキストと動作の一貫性を確保するために、TextSSMはテキスト機能を文レベルでエンコードする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:48:12 GMT)
Using Large Language Models for Expert Prior Elicitation in Predictive Modelling [53.5] 本研究では,大規模言語モデル (LLM) を用いて予測モデルの事前分布を推定する手法を提案する。
本研究では,LLMがパラメータ分布を真に生成するかどうかを評価するとともに,文脈内学習と事前推論のためのモデル選択戦略を提案する。
その結果,LLMによる事前パラメータ分布は,低データ設定における非形式的先行よりも予測誤差を著しく低減することがわかった。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:13:39 GMT)
Interleaved Scene Graph for Interleaved Text-and-Image Generation Assessment [53.5] 我々は、インターリーブされたテキスト・画像生成のための総合的な評価フレームワークISGを提案する。
ISGは、全体性、構造性、ブロックレベル、画像固有性の4つのレベルで反応を評価する。
ISGと組み合わせて、ISG-Benchというベンチマークを導入し、8つのカテゴリと21のサブカテゴリにわたる1,150のサンプルを網羅した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:55:57 GMT)
MALMM: Multi-Agent Large Language Models for Zero-Shot Robotics Manipulation [52.7] 大規模言語モデル(LLM)は、ロボティクスの操作やナビゲーションなど、さまざまな領域にまたがる優れた計画能力を示している。
特殊なLLMエージェント間で高レベル計画および低レベル制御コード生成を分散する新しいマルチエージェントLLMフレームワークを提案する。
長軸タスクを含む9つのRLBenchタスクに対するアプローチを評価し、ゼロショット環境でロボット操作を解く能力を実証した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:53:44 GMT)
Identity-Preserving Text-to-Video Generation by Frequency Decomposition [52.2] アイデンティティ保存型テキスト・ツー・ビデオ(IPT2V)生成は、一貫した人間のアイデンティティを持つ高忠実度ビデオを作成することを目的としている。
本稿では,PT2Vの技術フロンティアを,文献で未解決の2つの方向に推し進める。
本研究では,DiTをベースとした制御可能なPT2VモデルであるConsisIDを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:58:24 GMT)
When Precision Meets Position: BFloat16 Breaks Down RoPE in Long-Context Training [51.2] コンテキストウィンドウサイズの拡張により、大きな言語モデルでは、より長いシーケンスを処理し、より複雑なタスクを処理できる。
我々は,RoPEをBFloat16フォーマットで使用すると,数値的な問題が発生し,目的とする相対的位置エンコーディングから逸脱してしまうことを観察した。
我々は,BFloat16による数値問題を軽減するプラグイン・アンド・プレイアテンション法であるAnchorAttentionを開発した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:46:25 GMT)
Monocular Lane Detection Based on Deep Learning: A Survey [51.2] 車線検出は自律運転認識システムにおいて重要な役割を果たす。
ディープラーニングアルゴリズムが普及するにつれて、ディープラーニングに基づく単眼車線検出手法が優れた性能を示した。
本稿では, 成熟度の高い2次元車線検出手法と開発途上国の3次元車線検出技術の両方を網羅して, 既存手法の概要を概説する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:31:08 GMT)
RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.0] 本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。
提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:55:29 GMT)
Learning Chemical Reaction Representation with Reactant-Product Alignment [50.3] 本稿では,様々な有機反応関連タスクに適した新しい化学反応表現学習モデルであるモデルネームを紹介する。
反応物質と生成物との原子対応を統合することにより、反応中に生じる分子変換を識別し、反応機構の理解を深める。
反応条件を化学反応表現に組み込むアダプタ構造を設計し、様々な反応条件を処理し、様々なデータセットや下流タスク、例えば反応性能予測に適応できるようにした。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:41:44 GMT)
Generative Image Layer Decomposition with Visual Effects [49.8] LayerDecompは、イメージ層分解のための生成フレームワークである。
清潔な背景と、忠実に保存された視覚効果を持つ高品質な透明な前景を作り出す。
本手法は,オブジェクト除去や空間編集作業において,既存の手法よりも優れた分解特性を実現する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 20:26:49 GMT)
Semi-Supervised Semantic Segmentation Based on Pseudo-Labels: A Survey [49.5] 本総説は, 半教師付きセマンティックセグメンテーション分野における擬似ラベル手法に関する最新の研究成果について, 包括的かつ組織的に概観することを目的としている。
さらに,医用およびリモートセンシング画像のセグメンテーションにおける擬似ラベル技術の適用について検討する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:06:52 GMT)
Low-Bit Quantization Favors Undertrained LLMs: Scaling Laws for Quantized LLMs with 100T Training Tokens [49.1] 1500以上の量子化大言語モデル(LLM)を制御された環境で研究する。
我々は,QiDとトレーニングトークン数,モデルサイズ,ビット幅などの要因との関係を理解するためのスケーリング法則を導出する。
予測では,100兆以上のトークンでトレーニングされるであろう将来のモデルの低ビット量子化性能は望ましくないと考えられる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:57:58 GMT)
Exploring Selective Layer Fine-Tuning in Federated Learning [48.5] フェデレートラーニング(FL)は,分散データを用いた基礎モデルの微調整のための,有望なパラダイムとして登場した。
FLにおける選択的層微調整について検討し、クライアントがローカルデータやリソースに応じて選択した層を調整できるフレキシブルなアプローチを強調した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:49:12 GMT)
Hamba: Single-view 3D Hand Reconstruction with Graph-guided Bi-Scanning Mamba [48.5] 1枚のRGB画像からの3Dハンド再構成は、関節運動、自己閉塞、物体との相互作用により困難である。
既存のSOTA法では、3Dハンドポーズと形状を学ぶためにアテンションベースのトランスフォーマーを採用している。
本稿では,グラフ学習と状態空間モデリングを橋渡しするHambaというグラフ誘導型Mambaフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 20:51:51 GMT)
OpenAD: Open-World Autonomous Driving Benchmark for 3D Object Detection [47.9] OpenADは3Dオブジェクト検出のための世界初のオープンワールド自動運転ベンチマークである。
OpenADは、マルチモーダル大言語モデル(MLLM)と統合されたコーナーケースの発見とアノテーションパイプライン上に構築されている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 01:50:06 GMT)
Contrastive Graph Condensation: Advancing Data Versatility through Self-Supervised Learning [47.7] グラフ凝縮は、大規模原グラフのコンパクトで代替的なグラフを合成するための有望な解である。
本稿では、自己教師型代理タスクを取り入れたCTGC(Contrastive Graph Condensation)を導入し、元のグラフから批判的、因果的な情報を抽出する。
CTGCは、様々な下流タスクを限られたラベルで処理し、一貫して最先端のGCメソッドより優れている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:01:22 GMT)
D$^2$-World: An Efficient World Model through Decoupled Dynamic Flow [47.4] CVPR-2024 Workshop on Foundation Models for Autonomous Systems(CVPR-2024)で開催される予測的世界モデルチャレンジの2番目のソリューションを要約する。
D$2$-Worldは、Decoupled Dynamic Flowを通して将来の点雲を効果的に予測する新しい世界モデルである。
提案手法は,OpenScene Predictive World Modelベンチマークの最先端性能を実現し,第2位を確保し,ベースラインモデルよりも300%以上高速なトレーニングを行う。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 01:42:49 GMT)
A Computational Method for Measuring "Open Codes" in Qualitative Analysis [47.4] オープンコーディングは、データセットから"オープンコード"を特定し解釈する、帰納的定性的なプロセスである。
本稿では,「オープンコード」から潜在的なバイアスを系統的に計測し,同定する計算手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:31:07 GMT)
Distilling Spectral Graph for Object-Context Aware Open-Vocabulary Semantic Segmentation [47.0] 画像にオブジェクトレベルの文脈知識を取り入れた新しいアプローチを導入する。
提案手法は,多種多様なデータセットにまたがる高い一般化性を有する最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:34:48 GMT)
Exploring Aleatoric Uncertainty in Object Detection via Vision Foundation Models [46.7] 本稿では,視覚基盤モデルを用いた物体検出データに固有の不確実性をモデル化し,活用することを提案する。
我々は、物体の特徴の混合ガウス構造を仮定し、データの不確実性を定量化するためにマハラノビス距離に基づく測度を考案する。
推定されたアレータリック不確実性はデータセットのアノテーションの余分なレベルとして機能し、任意のモデルでプラグイン・アンド・プレイ方式で利用することができる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:14:30 GMT)
DOGE: Towards Versatile Visual Document Grounding and Referring [46.6] 本稿では,2種類の高品質な文書データを生成するDOGE-Engine(DOcument Grounding and Eferring Data Engine)を提案する。
エンジンを用いて,3つの文書タイプにまたがる7つのグラウンドと参照タスクを含むDOGE-Benchを構築した。
この先駆的なMLLMは、文書画像内の複数の粒度のテキストを正確に参照し、グラウンド化することができる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 05:38:34 GMT)
Epidemiology-informed Graph Neural Network for Heterogeneity-aware Epidemic Forecasting [46.6] 最近の研究では、異種時相の流行パターンを抽出する際の時空間ニューラルネットワーク(STGNN)の強い可能性を示している。
HeatGNNは、疫学的にインフォームドされた場所を、時間とともに自分自身の伝達メカニズムを反映するさまざまな場所に埋め込むことを学ぶ。
HeatGNNは、HeatHeatのさまざまな強力なベースラインを異なるサイズで上回る。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:29:45 GMT)
VIRES: Video Instance Repainting with Sketch and Text Guidance [46.2] スケッチとテキストガイダンスを備えたビデオインスタンス再描画手法であるVIRESを紹介する。
既存のアプローチは、提供されたスケッチシーケンスと時間的一貫性と正確なアライメントに苦慮している。
本稿では,自己スケーリングを標準化したSequential ControlNetを提案する。
スケッチ対応エンコーダは、再塗装された結果が提供されるスケッチシーケンスに一致していることを保証する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:43:01 GMT)
SuperMat: Physically Consistent PBR Material Estimation at Interactive Rates [46.2] 一段階の推論で高品質な材料分解を実現する一段階のフレームワークであるSuperMatを提案する。
これにより、アルベド、金属、粗さマップをミリ秒スケールで分解しながら、知覚的および再帰的な損失を伴うエンドツーエンドのトレーニングが可能になる。
我々は、UVリファインメントネットワークを通じて、我々のフレームワークを3Dオブジェクトに拡張し、効率を保ちながら視点を越えて一貫した材料推定を可能にする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:26:06 GMT)
Learning Hierarchical Polynomials of Multiple Nonlinear Features with Three-Layer Networks [46.2] ディープラーニング理論では、ニューラルネットワークが階層的特徴をどのように学習するかを理解することが重要な問題である。
本研究では,3層ニューラルネットワークを用いたテキストマルチプル非線形特徴の階層的学習について検討する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:14:48 GMT)
Baking Gaussian Splatting into Diffusion Denoiser for Fast and Scalable Single-stage Image-to-3D Generation [46.0] 単一視点からのオブジェクトおよびシーン生成のための新しい1段3次元拡散モデルDiffusionGSを提案する。
実験の結果,PSNRでは2.20dB,FIDでは23.25dB,SOTA法では5倍以上の速度(A100 GPUでは6s)が得られた。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:06:32 GMT)
VideoDirector: Precise Video Editing via Text-to-Video Models [45.5] 現在のビデオ編集法は、時間的コヒーレンス生成能力を欠くテキスト・ツー・ビデオ(T2V)モデルに依存している。
本稿では、より正確なピボットインバージョンを実現するために、時空間デカップリングガイダンス(STDG)と複数フレームのヌルテキスト最適化戦略を提案する。
実験結果から,本手法はT2Vモデルの強力な時間生成能力を効果的に活用できることが示唆された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:56:53 GMT)
Measuring Emergent Capabilities of LLMs for Software Engineering: How Far Are We? [45.1] ソフトウェア工学の文脈における能力の出現について検討する。
本稿では、バグ修正、コード翻訳、コミットメッセージ生成という3つのSEタスクでこの現象を評価するためのモデルに依存しないパイプラインを提案する。
我々の発見は、選択したタスクセットのモデルサイズをスケールすることによる創発的能力の概念を支持する証拠を提供していない。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 22:48:55 GMT)
MWFormer: Multi-Weather Image Restoration Using Degradation-Aware Transformers [44.6] 悪天候下で撮影された画像の復元は、多くのコンピュータビジョンアプリケーションにとって基本的な課題である。
本稿では,マルチウェザー変換器 (MWFormer) を提案する。
MWFormerは,既存の最先端手法と比較して,大幅な性能向上を実現していることを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:47:39 GMT)
NumGrad-Pull: Numerical Gradient Guided Tri-plane Representation for Surface Reconstruction from Point Clouds [41.7] 無秩序で秩序のない3Dポイントから連続的な表面を再構築することは、コンピュータビジョンとグラフィックスの根本的な課題である。
最近の進歩は、ニューラルサインされた距離関数をトレーニングして、表面上の最も近い点に3D位置クエリをプルすることでこの問題に対処している。
我々は三面構造の表現能力を活用して符号付き距離関数の学習を高速化するNumGrad-Pullを導入する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:54:30 GMT)
MVBoost: Boost 3D Reconstruction with Multi-View Refinement [41.5] 多様な3Dデータセットの不足は、3D再構成モデルの限定的な一般化能力をもたらす。
擬似GTデータを生成し,多視点補正(MVBoost)により3次元再構成を促進する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:55:20 GMT)
A Quality-Centric Framework for Generic Deepfake Detection [41.2] 異なるディープフェイクの偽造の質は様々である。 容易に認識できる偽造の手がかりを持つものもあれば、 非常に現実的なものもある。
既存の研究はしばしば、様々な偽造品の品質を持つディープフェイクの混合で検出器を訓練し、検出器は低品質の偽造品サンプルから容易に発見できるアーティファクトをショートカットする。
本稿では,品質評価器,低品質データ拡張モジュール,学習ペーシング戦略からなる,汎用的なディープフェイク検出のための新しい品質中心のフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:37:21 GMT)
AnchorCrafter: Animate CyberAnchors Saling Your Products via Human-Object Interacting Video Generation [40.8] AnchorCrafterは、ターゲットの人間とカスタマイズされたオブジェクトを特徴とする2Dビデオを生成するように設計された新しいシステムである。
本稿では,物体の外観認識を任意の視点から拡張するHOI-appearance Recognitionと,複雑な人間と物体の相互作用を可能にするHOI-motion Injectionという2つの重要なイノベーションを提案する。
提案システムは、人間の外観と動きの一貫性を維持しながら、物体の外観と形状の認識を保存するための既存の手法よりも優れる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:42:13 GMT)
The Extractive-Abstractive Spectrum: Uncovering Verifiability Trade-offs in LLM Generations [40.5] 情報共有ツールの妥当性と実用性の間の相互作用について検討する。
ユーザは,大規模言語モデルよりも検索エンジンの方が高いクエリを好んでいることがわかった。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:34:52 GMT)
Enhancing Zero-Shot Facial Expression Recognition by LLM Knowledge Transfer [40.5] 大規模言語モデル(LLM)からタスク知識を伝達することにより、ゼロショットFERを向上させる新しい手法Exp-CLIPを提案する。
具体的には、事前訓練された視覚言語エンコーダに基づいて、初期共同視覚言語空間を顔行動の表現をキャプチャする空間にマッピングするプロジェクションヘッドを組み込む。
衝突しない顔データから、Exp-CLIPは、7つの範囲のFERデータセット上でCLIPモデルや他のいくつかの大きなビジョン言語モデル(LVLM)よりも優れたゼロショット結果を達成する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:29:59 GMT)
ImpScore: A Learnable Metric For Quantifying The Implicitness Level of Language [40.4] インプシット言語は, 自然言語処理システムにおいて, 正確なテキスト理解を実現し, ユーザとの自然な対話を促進するために不可欠である。
本稿では,外部参照に頼ることなく,言語の暗黙度を定量化するスカラー計量を開発した。
我々は、ImpScoreを音声検出データセットの嫌悪に適用し、そのユーティリティを説明し、非常に暗黙的なコンテンツを理解する能力において、現在の大規模言語モデルの重大な制限を強調します。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:40:19 GMT)
HyperSeg: Towards Universal Visual Segmentation with Large Language Model [40.3] 本稿では,視覚的大言語モデル(VLLM)による強力な推論能力により,画像・映像知覚の普遍的セグメンテーションを実現することを目的とする。
画素レベルの画像と映像知覚のための,VLLMに基づく最初のユニバーサルセグメンテーションモデルであるHyperSegを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:18:20 GMT)
Transformer Wave Function for Quantum Long-Range models [39.6] 我々は、ビジョントランスフォーマー(ViT)アーキテクチャに基づくニューラルネットワークアーキテクチャを用いて、量子長距離モデルの基底状態を検出する。
強磁性および反強磁性の両方の場合において、モデルの全位相図と臨界特性を計算する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:14:15 GMT)
ER2Score: LLM-based Explainable and Customizable Metric for Assessing Radiology Reports with Reward-Control Loss [39.5] ER2Scoreは放射線学レポート生成(R2Gen)に特化して設計された自動評価指標である
ユーザが指定した基準に従ってレポートをスコアし、詳細なサブスコアを提供し、解釈可能性を高める。
実験では,ER2Scoreが人間の判断と高い相関性を示し,モデル選択における優れた性能を示した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:48:55 GMT)
AeroGen: Enhancing Remote Sensing Object Detection with Diffusion-Driven Data Generation [38.9] リモートセンシング画像オブジェクト検出(RSIOD)は、衛星や空中画像内の特定の物体を特定し、特定することを目的としている。
現在のRSIODデータセットにはラベル付きデータが不足しており、現在の検出アルゴリズムのパフォーマンスを著しく制限している。
本稿では,RSIODに適したレイアウト制御可能な拡散生成モデル(AeroGen)を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:54:02 GMT)
Path-RAG: Knowledge-Guided Key Region Retrieval for Open-ended Pathology Visual Question Answering [38.9] そこで我々はPath-RAGという新しいフレームワークを提案し,病理画像から関連分野の知識を抽出する。
実験の結果,LLaVA-Medの精度は38%から47%に向上することが示唆された。
長文の質問と回答のペアに対して、我々のモデルは一貫して32.5%のARCH-Open PubMed、30.6%のARCH-Open Books on H&E imageを実現している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:22:01 GMT)
Quantum noise modeling through Reinforcement Learning [38.5] 本稿では,量子チップに影響を及ぼすノイズを特徴付ける機械学習手法を導入し,シミュレーション中にエミュレートする。
我々のアルゴリズムは強化学習を活用し、様々なノイズモデルを再現する際の柔軟性を向上させる。
実超伝導量子ビット上でのシミュレーションおよび試験によりRLエージェントの有効性が検証された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 20:49:58 GMT)
DreamCache: Finetuning-Free Lightweight Personalized Image Generation via Feature Caching [38.5] 私たちは、効率的で高品質なパーソナライズされた画像生成のためのスケーラブルなアプローチであるDreamCacheを紹介します。
DreamCacheは最先端の画像とテキストアライメントを実現し、桁違いに少ない余分なパラメータを使用する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:03:14 GMT)
Learning Spatially-Aware Language and Audio Embeddings [38.3] マルチモーダルコントラスト学習を用いて学習した空間認識音声およびテキスト埋め込みモデルを提案する。
ELSAは音声の空間的・意味的要素を記述する非空間的音声、空間的音声、オープン語彙の字幕をサポートする。
特に、ELSAはベースライン上のオーディオ・トゥ・テキストとテキスト・トゥ・オーディオのR@1を+2.8%、ベースライン上の3Dソースのローカライゼーションにおいて-11.6degの平均・絶対エラーを上回ります。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:46:30 GMT)
DepthCues: Evaluating Monocular Depth Perception in Large Vision Models [37.7] 本研究では,大規模な事前学習型視覚モデルにおいて,暗黙の深度監視を伴わない深度知覚がどのように起こるかを検討する。
深度キュー理解の評価を目的とした新しいベンチマークDepthCuesを導入する。
我々の分析は、より最近の大型モデルで人間のような深度が現れることを示している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:44:17 GMT)
Robust Bayesian Optimization via Localized Online Conformal Prediction [37.5] 局所化オンライン共形予測に基づくベイズ最適化(LOCBO)を導入する。
LOCBOは局所オンライン共形予測(CP)によりGPモデルを校正する
観測対象関数を保留するLOCBOのイテレートについて理論的性能保証を行う。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:45:54 GMT)
Powerformer: A Section-adaptive Transformer for Power Flow Adjustment [37.2] 本稿では,ロバストな電力系統状態表現の学習に適したトランスフォーマーアーキテクチャを提案する。
具体的には,従来の変圧器の自己注意から分離する専用セクション適応型アテンション機構を開発する。
この機構は、電力系統状態と送信部情報とを効果的に統合し、ロバストな状態表現の開発を容易にする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:30:27 GMT)
EvaGaussians: Event Stream Assisted Gaussian Splatting from Blurry Images [36.5] 3次元ガウススプラッティング(3D-GS)は、3次元シーン再構成と新しいビュー合成において例外的な機能を示した。
本稿では,イベントストリーム支援型ガウシアンスプラッティング(EvaGaussians)について紹介する。これは,イベントカメラがキャプチャしたイベントストリームを統合して,ぼやけた画像から高品質な3D-GSを再構築する手法である。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 05:33:18 GMT)
Event-based Continuous Color Video Decompression from Single Frames [36.4] 本研究では,静止RGB画像とイベントカメラストリームから連続映像を生成する新しい手法であるContinuityCamを提案する。
提案手法は、連続した長距離動きモデリングとニューラル合成モデルを組み合わせることで、イベント内の任意のタイミングでフレーム予測を可能にする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:17:25 GMT)
PersonalVideo: High ID-Fidelity Video Customization without Dynamic and Semantic Degradation [36.2] カスタマイズされたID画像を持つアイデンティティ固有のヒューマンビデオ生成はまだ未調査である。
我々は、T2Vモデルにより合成されたビデオを直接監視する、textbfPersonalVideoと呼ばれる新しいフレームワークを提案する。
本手法は,従来のT2Vモデルに固有の映像生成特性を保ちながら,高いアイデンティティ忠実度を実現する上での優位性であり,従来手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:25:38 GMT)
On the ERM Principle in Meta-Learning [35.3] 1タスクあたりのサンプル数が少ないことは、学習を成功させるのに十分であることを示す。
また、各$varepsilon$に対して、$varepsilon$のエラーを達成するためにタスク毎の例がいくつ必要かを特定します。
この設定は、コンテキスト内学習、ハイパーネットワーク、学習から学習への学習など、現代の多くの問題に適用できる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 21:27:14 GMT)
A Topic-level Self-Correctional Approach to Mitigate Hallucinations in MLLMs [34.7] トピックレベルの幻覚を緩和するために,モデル自体をガイドする自己修正的アプローチであるトピックレベルの優先上書き(TPO)を導入する。
以上の結果から,TPOは信頼性の最先端性を達成し,対象幻覚の92%,全体幻覚の38%を著しく低減した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:42:07 GMT)
Hotspot-Driven Peptide Design via Multi-Fragment Autoregressive Extension [34.6] PepHARは、特定のタンパク質を標的としたペプチドを設計するためのホットスポット駆動の自己回帰生成モデルである。
ホットスポットサンプリングとフラグメントベースの拡張を組み合わせることで,ターゲットタンパク質に適合したデノボペプチドの設計が可能となった。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:13:17 GMT)
Navigating the Landscape of Hint Generation Research: From the Past to the Future [34.5] 本稿では,学習研究と認知科学のギャップを埋めることを目的として,ヒント生成に関する先行研究のレビューを行う。
本稿では,ヒント生成タスクの形式的定義を提案し,効果的なヒント生成システム構築のロードマップについて論じる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:17:20 GMT)
Boost 3D Reconstruction using Diffusion-based Monocular Camera Calibration [34.2] DM-Calibは単一の入力画像からピンホールカメラ固有のパラメータを推定するための拡散に基づくアプローチである。
我々は、カメラ画像と呼ばれる新しい画像ベース表現を導入し、数値カメラの内在を無意味に符号化する。
一つのRGB入力からカメラ画像を生成するための安定拡散モデルを微調整することにより、RANSAC操作を介してカメラ固有の特徴を抽出することができる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:04:37 GMT)
Automating grapevine LAI features estimation with UAV imagery and machine learning [34.0] 葉面積指数は作物の健康と成長を決定する。
従来の計算方法は、時間を費やし、破壊的であり、コストがかかり、スケールに制限される。
本研究では,ウシ科植物のドローン画像データと機械学習モデルを用いて,指標推定手法を自動化した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 21:24:27 GMT)
Can LLMs be Good Graph Judger for Knowledge Graph Construction? [34.0] 本稿では,上記の課題に対処するための知識グラフ構築フレームワークであるGraphJudgerを提案する。
提案手法には,エンティティ中心の反復的テキスト記述,知識認識型指導チューニング,グラフ判断の3つの革新的なモジュールが導入されている。
2つの一般的なテキストグラフペアデータセットと1つのドメイン固有のテキストグラフペアデータセットによる実験は、ベースライン法と比較して優れた性能を示した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:46:57 GMT)
Generalization, Expressivity, and Universality of Graph Neural Networks on Attributed Graphs [33.3] ノード属性を持つ属性グラフ上でのグラフニューラルネットワーク(GNN)の普遍性と一般化を解析する。
我々は、GNNに対する普遍近似定理と、属性グラフの任意のデータ分布上のGNNの有界一般化を証明した。
我々の研究は、属性のないグラフのみの導出理論、GNNが連続だが分離パワーのない導出コンパクトなメトリクス、GNNが連続かつ分離ポイントである導出指標を拡張・統合する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:41:06 GMT)
Maximally Separated Active Learning [33.0] 固定等角超球面点をクラスプロトタイプとして利用する能動的学習法を提案する。
5つのベンチマークデータセットにまたがる既存のアクティブラーニング技術よりも高いパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:02:43 GMT)
Scene Co-pilot: Procedural Text to Video Generation with Human in the Loop [32.9] Scene Copilotは、大規模言語モデル(LLM)と手続き型3Dシーンジェネレータを組み合わせたフレームワークである。
Scene Codexはテキスト入力を3Dシーンジェネレータで理解できるコマンドに変換するように設計されている。
BlenderGPTは、生成された3Dシーンと最終的な出力映像を正確に制御する直感的で直接的な方法を提供する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:21:57 GMT)
DiscoMatch: Fast Discrete Optimisation for Geometrically Consistent 3D Shape Matching [32.9] 本稿では,3次元形状マッチングにおける学習ベースとフォーマリズムの利点を組み合わせることを提案する。
我々の解法は準ニュートン法で大きく並列化可能である。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:49:06 GMT)
TechCoach: Towards Technical Keypoint-Aware Descriptive Action Coaching [32.9] 説明的行動コーチング(DAC)は、何がうまくいって何が改善できるかを詳細に解説するモデルを必要とする。
キーポイントレベルの推論をDACプロセスに明示的に組み込む新しいフレームワークであるTechCoachを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 05:49:25 GMT)
Correlation-Aware Graph Convolutional Networks for Multi-Label Node Classification [32.5] マルチラベルノード分類のための相関対応グラフ畳み込みネットワーク(CorGCN)を提案する。
CorGCNは新しい相関対応グラフ分解モジュールを導入することで、ラベルごとにリッチなラベル関連情報を含むグラフを学習できる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:52:47 GMT)
2D Matryoshka Training for Information Retrieval [32.4] 2D Matryoshka Trainingは、エンコーダモデルを様々なレイヤ次元のセットアップで同時にトレーニングするために設計された埋め込み表現トレーニングアプローチである。
STSタスクにおける2D Matryoshka Trainingの両バージョンの実装と評価を行い,解析を検索タスクに拡張した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:47:35 GMT)
Practical Membership Inference Attacks against Fine-tuned Large Language Models via Self-prompt Calibration [32.2] メンバーシップ推論攻撃は、対象のデータレコードがモデルトレーニングに使用されたかどうかを推測することを目的としている。
自己校正確率変動(SPV-MIA)に基づくメンバーシップ推論攻撃を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:19:15 GMT)
An In-depth Investigation of Sparse Rate Reduction in Transformer-like Models [32.0] スパースレートリダクション(SRR)と呼ばれる情報理論目的関数を提案する。
SRRは正の相関係数を持ち、パスノルムやシャープネスベースなど他の基準値よりも優れていることを示す。
ベンチマーク画像分類データセットの正規化として,SRRを用いて一般化を改善することができることを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:44:57 GMT)
Scaling Speech-Text Pre-training with Synthetic Interleaved Data [31.8] 音声言語モデル(SpeechLM)は音声入力を受け入れ、音声出力を生成し、より自然な人間とコンピュータの相互作用を可能にする。
従来のSpeechLMの開発手法は、教師なし音声データとパラレル音声テキストデータの可用性の制限によって制約されている。
本稿では,テキストコーパスから得られた大規模合成インターリーブデータを活用することによって,音声テキスト事前学習のスケールアップを行う手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:19:09 GMT)
SVGDreamer++: Advancing Editability and Diversity in Text-Guided SVG Generation [31.8] 既存の手法の限界に対処する新しいテキスト誘導ベクトルグラフィックス合成法を提案する。
Vectorized Particle-based Score Distillation (VPSD) アプローチは既存手法の過飽和問題に対処する。
プレトレーニングされた報酬モデルは、再重み付きベクトル粒子に組み込まれ、美的魅力を改善し、より高速な収束を可能にする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:13:38 GMT)
CoverBench: A Challenging Benchmark for Complex Claim Verification [31.7] 複雑な推論条件下でのLM出力の検証に重点を置いたベンチマークであるCoverBenchを紹介する。
CoverBenchは、さまざまなドメインにおける複雑なクレーム検証のための多彩な評価を提供する。
低レベルのラベルノイズを確実にするために、手動でデータの品質を検証します。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:34:23 GMT)
Efficient Self-Improvement in Multimodal Large Language Models: A Model-Level Judge-Free Approach [31.7] 本稿では,新しいモデルレベルの判断自由自己改善フレームワークを提案する。
本手法では,検証ループにおけるMLLMの必要性を解消しつつ,制御されたフィードバック機構を用いる。
計算要求が大幅に小さく、精度とリコールの精度が向上する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 00:44:37 GMT)
Rethinking Token Reduction in MLLMs: Towards a Unified Paradigm for Training-Free Acceleration [31.5] 本研究は,無訓練トークン還元研究の現況を再考する。
トークン還元を3つの異なる段階に分解する「フィルタ相関圧縮」パラダイムを提案する。
10のベンチマークでの実験結果から,本手法は最大82.4%のFLOP削減が可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:53:51 GMT)
Towards Robust Cross-Domain Recommendation with Joint Identifiability of User Preference [31.2] クロスドメインレコメンデーション(CDR)研究は、ドメイン共有とドメイン固有のユーザ表現がドメインギャップを緩和し、効果的な知識伝達を促進すると仮定している。
本稿では,ドメイン間のユーザ表現のユニークな対応を確立する共同識別可能性のモデル化を提案する。
本手法は, 相関の弱いタスクであっても, 常に最先端のタスクを超越していることを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:08:06 GMT)
LTOS: Layout-controllable Text-Object Synthesis via Adaptive Cross-attention Fusions [31.1] 制御可能なテキスト・ツー・イメージ生成は、ある条件下で画像中の視覚的テキストやオブジェクトを合成する。
ビジュアルテキストレンダリングとレイアウト・ツー・イメージ生成タスクは、制御可能なテキスト・ツー・イメージ生成で人気がある。
本稿では,テキストレンダリングとレイアウト・ツー・イメージ生成タスクをひとつのタスクに統合する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:58:31 GMT)
Video-Guided Foley Sound Generation with Multimodal Controls [30.5] MultiFoleyは、ビデオ誘導音声生成用に設計されたモデルである。
テキスト、オーディオ、ビデオによるマルチモーダルコンディショニングをサポートする。
私たちのモデルの重要な新規性は、低音質のインターネットビデオデータセットを共同でトレーニングすることにあります。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:59:58 GMT)
Warehouse optimization using a trapped-ion quantum processor [30.4] 本稿では,二元最適化問題に適した倉庫最適化問題の定式化に適応する。
トラップイオン量子コンピュータで実装する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:36:48 GMT)
Learning Robust Anymodal Segmentor with Unimodal and Cross-modal Distillation [30.3] 主な課題はユニモーダルバイアス(unimodal bias)であり、マルチモーダルセグメンタが特定のモダリティに依存しているため、他のセグメンタが欠落するとパフォーマンスが低下する。
視覚的モダリティの組み合わせを扱える頑健なセグメンタを学習するための最初のフレームワークを開発する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:15:27 GMT)
Leaning Time-Varying Instruments for Identifying Causal Effects in Time-Series Data [30.2] 因果効果推定の偏りを解消する新しい条件変数(CIV)を開発した。
マルコフ特性とプロキシ変数の可利用性の仮定に基づき、これらの学習された表現の妥当性を理論的に確立する。
提案するTDCIVは,ドメイン固有の知識に頼ることなく,時間変化CIVとその関連条件セットを効果的に学習する最初の方法である。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:47:24 GMT)
Symmetry Strikes Back: From Single-Image Symmetry Detection to 3D Generation [29.7] 我々は,多種多様な実世界のシナリオに対して堅牢な一般化が可能なスケーラブルなゼロショット対称性検出器であるReflect3Dを紹介する。
検出された対称性を単一画像の3D生成パイプラインに組み込むことの実用的利点を示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:14:31 GMT)
Orientation-Aware Graph Neural Networks for Protein Structure Representation Learning [29.4] タンパク質構造の幾何学的特性をよりよく把握するために,オリエンテーション対応グラフニューラルネットワーク(OAGNN)を提案する。
スカラーから3次元ベクトルへの1つの重みを拡張し、幾何学的に意味のある演算のリッチなセットを構築する。
OAGNNは古典的ネットワークに比べて幾何方向の特徴を感知する能力がある。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:18:30 GMT)
Learning Visual Hierarchies with Hyperbolic Embeddings [28.4] 本稿では,ハイパーボリック空間におけるユーザ定義のマルチレベル視覚階層を,明示的な階層ラベルを必要とせずに符号化できる学習パラダイムを提案する。
階層的検索タスクの大幅な改善を示し、視覚的階層を捉える上でのモデルの有効性を示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:58:06 GMT)
Repository-level Code Translation Benchmark Targeting Rust [28.3] Rustをターゲットにした375のタスクからなる、最初のリポジトリレベルのコード変換ベンチマークを紹介します。
このベンチマークを用いて、4つの最先端の大規模言語モデル(LLM)について検討する。
その結果,LCMは単純なタスクに比べて,リポジトリレベルでの翻訳性能が著しく低下(41.5%-56.2% Pass@1 drop of GPT-4)していることが判明した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:21:44 GMT)
RoboPEPP: Vision-Based Robot Pose and Joint Angle Estimation through Embedding Predictive Pre-Training [27.6] 関節角度の不明な関節ロボットの視覚に基づくポーズ推定は、協調ロボット工学や人間とロボットのインタラクションタスクに応用できる。
現在のフレームワークでは、ニューラルネットワークエンコーダを使用して、画像の特徴と下流層を抽出し、関節角とロボットのポーズを予測する。
本稿では,ロボットの物理モデルに関する情報を,マスクを用いた自己教師型埋め込み予測アーキテクチャを用いてエンコーダに融合させる手法であるRoboPEPPを紹介する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:26:17 GMT)
4D Scaffold Gaussian Splatting for Memory Efficient Dynamic Scene Reconstruction [27.5] ストレージコストを低減しつつ、4Dガウスの視覚的品質とレンダリング速度を維持する4Dアンカーベースのフレームワークを提案する。
実験結果から,4DGSよりも最先端の視覚的品質と97.8%のストレージ削減を実現した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:22:07 GMT)
LLM4DSR: Leveraing Large Language Model for Denoising Sequential Recommendation [27.3] シーケンスレコメンダは、ユーザの過去のインタラクションシーケンスに基づいてレコメンデーションを生成する。
これらの配列は、しばしばノイズ相互作用によって汚染され、レコメンデーション性能を著しく損なう。
広い言語モデル (LLM) には広い知識と意味論的推論能力が備わっており、この情報ギャップを埋めるための有望な道筋を提供する。
LLMを用いてシーケンシャルなレコメンデーションを識別するLLM4DSRを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:07:08 GMT)
Automatic Album Sequencing [27.2] データ駆動型アプローチでは,コレクション中のアイテムの物語的本質を抽出することにより,独立したメディアの一般的なコレクションをシーケンスする。
このアプローチは、アルバムシークエンシングのテクニックを意味するが、技術的でない聴衆には広くアクセスできない。
ユーザフレンドリーな新しいWebベースのツールを導入し、より技術的でないオーディエンスが楽曲をアップロードし、このテクニックをワンクリックで実行し、その結果をきれいに視覚化する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:55:05 GMT)
Finite-Time Decoupled Convergence in Nonlinear Two-Time-Scale Stochastic Approximation [27.0] 非線形二時間スケール近似における有限時間デカップリング収束の可能性について検討する。
ネストされた局所線型性仮定の下では、有限時間非結合収束速度は適切なステップサイズ選択によって達成できる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:07:27 GMT)
How Do Recommendation Models Amplify Popularity Bias? An Analysis from the Spectral Perspective [26.9] 勧告システム(RS)は、しばしば人気バイアスに悩まされる。
本研究は,本現象の根本原因を明らかにするための包括的実験および理論的解析を行う。
本稿では、スペクトルノルム正規化器を利用して主特異値の大きさをペナルティ化する新しいデバイアスング戦略を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:57:40 GMT)
Condense, Don't Just Prune: Enhancing Efficiency and Performance in MoE Layer Pruning [26.9] 本論文では,CD-MoE (Condense-MoE) とCD-MoE (Condense-MoE) について述べる。
フィードフォワードネットワークは多くの小さな専門家に分割されており、特定の専門家は、常にアクティブになっている共有専門家として機能するように分離されています。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 00:56:18 GMT)
Distractor-free Generalizable 3D Gaussian Splatting [26.8] ディトラクタフリー・ジェネラライザブル3Dガウススティング(DGS)の課題に対処する新しいフレームワークであるDGGSについて述べる。
トレーニングと推論フェーズの両方において、イントラクタ遅延データに対する一般化可能な3DGSの強化と、従来のイントラクタフリーアプローチへのクロスシーン適応機能の拡張である。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:17:41 GMT)
Inference Time Alignment with Reward-Guided Tree Search [26.7] 推測時間計算手法は大規模言語モデル(LLM)の性能を向上させる
Best-of-NサンプリングやMajority Voting、木探索アルゴリズムの変種といった一般的な手法は、LLMの性能向上に有効であることが証明されている。
本稿では,報酬誘導木探索によるアライメントを実現するために,報酬モデルのガイダンスを活用する推論時アライメント手法であるDARWINを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:13:21 GMT)
Reward Incremental Learning in Text-to-Image Generation [26.6] 本稿では,計算オーバーヘッドを最小限に抑える方法であるReward Incremental Distillation(RID)を提案する。
実験結果から,RILシナリオにおける一貫した高次勾配生成の実現におけるRIDの有効性が示された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:54:33 GMT)
GenDeg: Diffusion-Based Degradation Synthesis for Generalizable All-in-One Image Restoration [26.4] 我々は,クリーンな画像上で多様な劣化パターンを生成できる条件拡散モデルGenDegを紹介する。
我々は,550万点以上の試料を,ヘイズ,雨,雪,動きのぼやけ,低照度,雨滴の6種類に分けて合成した。
実験の結果,GenDSデータセットでトレーニングした画像復元モデルは,アウト・オブ・ディストリビューション性能の大幅な向上を示した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:55:49 GMT)
Learning Monotonic Attention in Transducer for Streaming Generation [26.2] 本研究では,Transducerベースのストリーミング生成モデルにおいて,非単調アライメントを扱うための学習可能なモノトニックアテンション機構を提案する。
提案手法により,Transducerモデルでは,指数関数的に大きなアライメント空間を列挙する必要がなく,その予測に基づいてアライメント範囲を適応的に調整することができる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:19:26 GMT)
MotionLLaMA: A Unified Framework for Motion Synthesis and Comprehension [26.2] MotionLLaMAは、モーション合成と理解のための統合されたフレームワークである。
HoMi Tokenizerは、新しいフルボディモーショントークンである。
MotionLLaMAは、動作完了、双方向のテキスト・トゥ・モーションの相互作用、およびすべての理解タスクにおける最先端(SOTA)パフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:28:01 GMT)
Beyond Walking: A Large-Scale Image-Text Benchmark for Text-based Person Anomaly Search [25.9] そこで本研究では,日常的・異常な活動に従事する歩行者をテキストで検索するタスクを提案する。
このタスクのトレーニングと評価を可能にするため,大規模画像テキストによる歩行者異常行動ベンチマークを構築した。
我々は、人物のポーズパターンをアイデンティティベースのハード・ネガティブ・ペア・サンプリングと統合するクロスモーダル・ポーズ・アウェア・フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:50:15 GMT)
Learning Generalizable Feature Fields for Mobile Manipulation [25.2] 本稿では,実時間でのナビゲーションと操作の統一表現として機能する,シーンレベルの一般化可能なニューラル特徴場であるGeFFを提案する。
オープンボキャブラリオブジェクト/部分レベルの操作におけるGeFFの能力を定量的に評価し、GeFFが実行時の点ベースラインとストレージ精度のトレードオフよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:31:15 GMT)
Label Noise Robustness of Conformal Prediction [24.9] 本研究では,不確実性定量化のための強力なツールである共形予測のロバスト性について検討した。
我々の分析は回帰問題と分類問題の両方に対処する。
我々は理論を拡張し、一般損失関数を正しく制御するための要件を定式化する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:18:47 GMT)
CLOVER: Constrained Learning with Orthonormal Vectors for Eliminating Redundancy [24.7] 本稿では,その基底ベクトルの線形結合を利用して,元の潜在空間内での制約学習を提案する。
パラメータ効率と安定な微調整では、Q, K, V, O を正規化し、特異値のみを微調整する。
8つのコモンセンス推論データセット上でLLaMA-2-7Bを微調整すると、我々の手法はLoRAを5.4%、DoRAを4.4%上回る。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:34:02 GMT)
Dual-task Mutual Reinforcing Embedded Joint Video Paragraph Retrieval and Grounding [24.5] 本稿では,DMR-JRG(Dual-task Mutual Reinforcecing Embedded Joint Video Paragraph Retrieval and Grounding Method)を提案する。
検索部はビデオ間のコントラスト学習を用いて、段落や動画のグローバルな特徴を大まかに調整する。
ビデオセグメントとテキスト段落の局所的,大域的,時間的次元の整合性を探ることで,正確なクロスモーダルマッチングとグラウンド化を実現する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:46:42 GMT)
GraphSubDetector: Time Series Subsequence Anomaly Detection via Density-Aware Adaptive Graph Neural Network [24.4] サブシーケンス異常検出,すなわちGraphSubDetectorに対する新しいアプローチを提案する。
まず、正規パターンと異常パターンの両方の特徴を強調する長さ選択機構を用いて、適切な列長を適応的に学習する。
第2に、サブシーケンス間のメッセージパッシングによる異常検出のための正規データの分散に対して、より堅牢な表現を生成できる密度対応適応グラフニューラルネットワーク(DAGNN)を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:36:07 GMT)
Advancing Cross-domain Discriminability in Continual Learning of Vision-Language Models [24.2] RAILは回帰ベースのアダプタで、ドメインのシーケンスから非forgettingな方法で学習する。
VLMのゼロショット能力を参照データなしで未確認領域に保持する。
X-TAILと既存のマルチドメインタスクインクリメンタルラーニング設定の両方におけるRAILの最先端性能を確認する実験結果が得られた。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:07:45 GMT)
PhysMotion: Physics-Grounded Dynamics From a Single Image [24.1] 物理シミュレーションの原理を取り入れた新しいフレームワークであるPhysMotionを導入し,1つの画像から生成された中間3次元表現をガイドする。
我々のアプローチは、従来のデータ駆動生成モデルの限界に対処し、より一貫した物理的に妥当な動きをもたらす。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:59:11 GMT)
Image Augmentation with Controlled Diffusion for Weakly-Supervised Semantic Segmentation [23.9] 制御拡散による画像拡張(IACD)という新しいアプローチを導入する。
IACDは、制御された拡散を通じて多様な画像を生成することで、ラベル付きデータセットを効果的に強化する。
また,拡散モデルのランダム性による潜在的なノイズを軽減するため,高品質な画像選択手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:11:53 GMT)
SOS-Match: Segmentation for Open-Set Robust Correspondence Search and Robot Localization in Unstructured Environments [23.7] SOS-Matchは、非構造化環境でオブジェクトを検出し、マッチングするための新しいフレームワークである。
フィンランド南部の沿岸海域で収集されたドローン飛行を含む,バトヴィクの季節データセット上でSOS-Matchを評価する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 20:59:11 GMT)
Invertible Bloom Lookup Tables with Less Memory and Randomness [23.7] Invertible Bloom Lookup Tables (IBLT) は、セット和解プロトコル、エラー訂正符号、高度な暗号プリミティブの設計に応用されている。
IBLTは同時に空間効率が良く、ランダム性が低い新しい構成を提案する。
k$ の独立ハッシュ関数 $h:U to [Cn]$ for some enough large constant $C$ guarantees with probability $1 - 2-Omega(k)$ that least $n/2$ key will have a unique hash value。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:05:11 GMT)
Pre-training for Action Recognition with Automatically Generated Fractal Datasets [23.7] 本稿では,短い合成ビデオクリップの大規模データセットを自動生成する手法を提案する。
生成されたビデオクリップは、複雑なマルチスケール構造を生成するフラクタルの自然能力に起因した顕著な多様性によって特徴づけられる。
通常のKineeticsの事前トレーニングと比較すると、報告結果が近くなり、下流のデータセットよりも優れています。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:51:11 GMT)
Don't Command, Cultivate: An Exploratory Study of System-2 Alignment [23.6] o1システムカードは、o1モデルをOpenAIの中でもっとも堅牢なものとして識別する。
モデル安全性に及ぼすシステム2思考パターンの影響について検討する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:27:43 GMT)
PEFTGuard: Detecting Backdoor Attacks Against Parameter-Efficient Fine-Tuning [23.5] 低ランクアダプタは、オープンソースプラットフォーム上で共有および利用することができる。
敵は、このメカニズムを利用して、これらのアダプタにバックドアを注入し、悪意のある振る舞いをもたらす。
PEFTベースのアダプタに対する最初のバックドア検出フレームワークであるPEFTGuardを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:12:09 GMT)
Geometry Field Splatting with Gaussian Surfels [23.4] 我々は、最近の研究で提案された不透明曲面の幾何学的場を利用して、体積密度に変換することができる。
ガウス核やウェーバを体積よりも幾何場に適応させ、不透明な固体の正確な再構成を可能にする。
広範に使用されているデータセット上で再構成された3次元表面の質が大幅に向上したことを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:07:05 GMT)
Finding Blind Spots in Evaluator LLMs with Interpretable Checklists [23.4] テキスト生成タスクにおける評価器として,Large Language Models (LLMs) の有効性を検討する。
我々は,4つの重要な能力を評価する上で,評価用LLMの習熟度を評価するための新しいフレームワークであるFBIを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:18:16 GMT)
Adaptive Deployment of Untrusted LLMs Reduces Distributed Threats [22.8] 大規模言語モデルが意図的に回避しようとする場合でも,安全対策が有効かどうかを検討する。
マイクロプロトコールの選択には、適応マクロプロトコールを使用する2段階のデプロイメントフレームワークを使用する。
有効なレベルでは、適応的デプロイメント戦略は、非適応的ベースラインに比べて、バックドアの数を80%削減します。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:58:20 GMT)
MADE: Graph Backdoor Defense with Masked Unlearning [22.6] グラフニューラルネットワーク(GNN)は、グラフ関連タスクの処理能力に優れていたため、研究者から大きな注目を集めている。
最近の研究では、GNNはトレーニングデータセットにトリガを注入することで実装されたバックドア攻撃に対して脆弱であることが示されている。
この脆弱性は、薬物発見のようなセンシティブなドメインにおけるGNNの応用に重大なセキュリティリスクをもたらす。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 22:50:53 GMT)
Bi-ICE: An Inner Interpretable Framework for Image Classification via Bi-directional Interactions between Concept and Input Embeddings [22.3] 内的解釈性は、AIシステムの内部メカニズムを明らかにすることに焦点を当てた、有望な分野である。
まず,大規模画像分類タスクにおいて,内部解釈可能性と多段階解析をサポートする概念的枠組みを提案する。
本稿では,概念と入力の埋め込み(Bi-ICE)モジュールの双方向インタラクションについて紹介する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:52:00 GMT)
LESS: Efficient Log Storage System Based on Learned Model and Minimum Attribute Tree [21.7] 本稿では,より小さなストレージ空間を消費し,より高速なストレージとクエリをサポートする新しいプロファイランスグラフストレージシステムであるLESSを提案する。
我々は、前駆グラフをグラフ構造と属性の2つの異なる構成要素に分割し、それらを個別に保存する。
最先端のアプローチと比較すると、LEONARDはストレージ時間の6.29倍、ディスク使用率の5.24倍、クエリ速度の18.3倍を実現している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:06:42 GMT)
Reprogramming Pretrained Target-Specific Diffusion Models for Dual-Target Drug Design [21.7] 生成タスクとして二重ターゲットのドラッグデザインを定式化し、シナジスティックな薬物の組み合わせに基づいて、潜在的なターゲットペアの新たなデータセットをキュレートする。
本稿では,単一ターゲットタンパク質-リガンド複合体対で訓練された拡散モデルを用いた二重ターゲット薬物の設計を提案する。
我々のアルゴリズムは、単一目標事前学習で得られた知識をゼロショット方式で二重目標シナリオに転送することができる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:26:29 GMT)
Do Automatic Factuality Metrics Measure Factuality? A Critical Evaluation [21.7] 「本研究は、要約文の表層的属性が事実性を予測するのに十分であるか否かを調査する。」
そして, 実測値が矛盾した要約の事実修正にどのように反応するかを評価し, 有意義な改善を示すものはごくわずかであることを確認した。
これらの知見に触発されて、生成した要約に無害な文を付加することにより、(最も)自動的事実性指標、すなわち、確実に事実性スコアをインフレーションすることができることを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:38:04 GMT)
GaNI: Global and Near Field Illumination Aware Neural Inverse Rendering [21.6] GaNIは、同じ位置にある光とカメラで撮影されたシーンの画像から、幾何学、アルベド、粗さのパラメータを再構築することができる。
既存の逆レンダリング技術と光カメラは、単一の物体のみに焦点を合わせている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:28:06 GMT)
Single-cell Curriculum Learning-based Deep Graph Embedding Clustering [21.3] シングルセル学習に基づく深層グラフ埋め込みクラスタリング(scCLG)を提案する。
まず,3つのデコーダに対応する3つの最適化目標を組み合わせたマルチデコーダ(ChebAE)を用いたChebyshevグラフ畳み込みオートエンコーダを提案する。
我々は、ノードの特徴とエントロピーに基づいてGNNを訓練し、高品質なグラフを維持するための難易度スコアに基づいて困難なノードを訓練する選択的なトレーニング戦略を採用している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:38:06 GMT)
Seeking the Sufficiency and Necessity Causal Features in Multimodal Representation Learning [21.3] 必要満足度(PNS)の確率は、結果を予測するのに必要かつ十分である特徴セットの可能性を測る。
単調なデータの表現学習を指導し、予測性能とモデルロバスト性の両方を高める効果が証明されている。
この拡張は、PNS推定、異種性、単調性の条件がマルチモーダルな文脈で再考される必要があるため、ユニークな課題を示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:54:29 GMT)
From Graph Diffusion to Graph Classification [21.3] グラフ拡散モデルをグラフ分類に適用する方法を示す。
サンプリングベース推論手法を用いた実験では,識別訓練により最先端のグラフ分類精度が達成される。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:57:41 GMT)
Words Matter: Leveraging Individual Text Embeddings for Code Generation in CLIP Test-Time Adaptation [21.2] テスト時推論において視覚言語モデル(VLM)が遭遇する分布ドリフトを軽減するために,クラステキスト情報を活用する方法を示す。
本稿では,ラベル割り当て問題の固定セントロイドとしてジェネリッククラステキスト埋め込みを利用して,テスト時間サンプルの擬似ラベルを生成することを提案する。
多様な複雑性を示す複数の人気のあるテスト時間適応ベンチマークの実験は、CLIP-OTの優位性を実証的に示している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 00:15:37 GMT)
Learning Positional Attention for Sequential Recommendation [21.2] 位置関係を直接学習する新しい注意モデルを導入する。
提案モデルである textbfPARec と textbfFPARec は,従来の自己意識に基づくアプローチよりも優れていた。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:34:55 GMT)
Frame Interpolation with Consecutive Brownian Bridge Diffusion [21.2] ビデオフレーム補間(VFI)は、拡散に基づく条件付き画像生成問題としてVFIを定式化しようとする。
本稿では,Branian Bridge Diffusionを用いたフレーム補間法を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 23:18:14 GMT)
Strategic Prompting for Conversational Tasks: A Comparative Analysis of Large Language Models Across Diverse Conversational Tasks [21.1] Llama, OPT, Falcon, Alpaca, MPTの5大言語モデルの性能と限界を評価する。
この研究は、予約、共感反応生成、メンタルヘルス、法的カウンセリング、説得、交渉など様々な会話的タスクを含む。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:21:24 GMT)
Distributed Sign Momentum with Local Steps for Training Transformers [21.0] 事前学習型のTransformerモデルはリソース集約型である。
近年,手話モーメントは大規模深層学習モデルの訓練に有効な手法であることが示されている。
本稿では,局所的な更新を伴う通信効率の高い分散符号運動量法について検討する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 20:31:11 GMT)
What's in the Image? A Deep-Dive into the Vision of Vision Language Models [20.7] VLM(Vision-Language Models)は、最近、複雑な視覚コンテンツを解釈する際、顕著な能力を示した。
本稿では,各層にまたがるアテンションモジュールに着目し,徹底的な経験分析を行う。
これらのモデルが視覚データをどのように処理するかについて、いくつかの重要な洞察を明らかにします。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:59:06 GMT)
Learning to Optimize for Mixed-Integer Non-linear Programming [20.5] 混合整数非NLPプログラム(MINLP)はエネルギーシステムや輸送など様々な領域で発生するが、解決は困難である。
機械学習の最近の進歩は、最適化のための学習として知られる領域において、顕著な成功をもたらしている。
勾配を保ちながら整数出力を生成する2つの異なる補正層を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 21:55:41 GMT)
Tiny-Align: Bridging Automatic Speech Recognition and Large Language Model on the Edge [20.4] 大規模言語モデル(LLM)と自動音声認識(ASR)は、ユーザのための音声ベースの対話を可能にする強力なパーソナライズされたアシスタントとして機能する。
既存のASR-LLMモデルは、主に高性能コンピューティング環境で訓練され、かなりのモデル重みを生み出す。
エッジデバイスにASRとLLMをブリッジして、パーソナライズされたオーディオ入力を処理するリソース効率の良いクロスモーダルアライメントフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 05:12:26 GMT)
Towards Black-Box Membership Inference Attack for Diffusion Models [20.2] 本稿では,イメージ・ツー・イメージ・バラツキAPIのみを用いた新たなメンバシップ推論攻撃手法を提案する。
私たちのアプローチでは、サンプルがトレーニングセットの一部であったかどうかを分類することができます。
実験結果は従来手法より一貫して優れていた。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 05:05:32 GMT)
A Condensed Transition Graph Framework for Zero-shot Link Prediction with Large Language Models [20.2] ゼロショットリンク予測(CTLP)のための凝縮遷移グラフフレームワークを提案する。
CTLPは、すべてのパス情報を線形時間複雑性でエンコードし、エンティティ間の見えない関係を予測する。
提案手法は,3つの標準ZSLPデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:32:22 GMT)
Enhancing Character-Level Understanding in LLMs through Token Internal Structure Learning [20.1] Token Internal Position Awareness (TIPA) は、LLMの内部トークン構造に対する理解を高める新しいアプローチである。
TIPAは、モデルが文字の位置と内部構造を効果的に学習し、一般化することを可能にする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:44:39 GMT)
OracleSage: Towards Unified Visual-Linguistic Understanding of Oracle Bone Scripts through Cross-Modal Knowledge Fusion [19.8] 中国最古の成熟した書記システムであるOracle bone script (OBS) は、自動認識において重大な課題を提起している。
私たちは、階層的な視覚的理解とグラフベースのセマンティック推論を統合する新しいクロスモーダルフレームワークであるOracleSageを紹介します。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:26:06 GMT)
One Mind, Many Tongues: A Deep Dive into Language-Agnostic Knowledge Neurons in Large Language Models [19.6] 大規模言語モデル(LLM)は大規模コーパスでの自己教師付き事前学習を通じて、膨大な量の事実知識を学習してきた。
LLMはまた、学習した知識を複数の言語で表現できる優れた多言語機能を示した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:03:49 GMT)
BinEnhance: An Enhancement Framework Based on External Environment Semantics for Binary Code Search [19.6] Binは、関数間セマンティクスを活用するように設計された新しいフレームワークで、バイナリコード検索のための内部コードセマンティクスの発現を強化する。
BinのHermesSim、Asm2vec、TREX、Gemini、Asteriaへの応用により平均精度(MAP)は53.6%から69.7%に向上した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:30:12 GMT)
NEMO: Can Multimodal LLMs Identify Attribute-Modified Objects? [19.5] 我々は,オリギナル果実とそれに対応するアトリビュート修飾果実の900枚の画像からなる新しいベンチマークNEMOを紹介する。
ベンチマークを用いて26の最近のオープンソースおよび商用モデルを評価した。
本研究は,NEMOにおける物体認識における性能差を明らかにするとともに,異なるモデル間で異なる解の選好を明らかにすることを目的とした。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:47:34 GMT)
Task Singular Vectors: Reducing Task Interference in Model Merging [19.5] Task Arithmeticは、追加のトレーニングなしでモデルをマージするためのシンプルで効果的な方法として登場した。
本研究では,タスク層行列とその特異値分解に着目し,タスクベクトルを層レベルで研究する。
TSV-Merge (TSV-M) は,圧縮と干渉低減を組み合わせた新しいモデルマージ手法である。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 22:53:06 GMT)
DiagramQG: A Dataset for Generating Concept-Focused Questions from Diagrams [19.3] 様々な被験者に対して8,372の図と19,475の質問を含むデータセットであるDiagramQGを紹介した。
本稿では,図式質問生成のための階層的知識統合フレームワーク(HKI-DQG)を強力なベースラインとして提示する。
既存のVQGモデル,オープンソースおよびクローズドソースビジョン言語モデル,およびDiagramQGデータセット上でのHKI-DQGの性能を評価する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:27:50 GMT)
VLTP: Vision-Language Guided Token Pruning for Task-Oriented Segmentation [19.0] ビジョントランスフォーマー(ViT)は多くのセグメンテーションモデルのバックボーンとして登場し、常に最先端(SOTA)のパフォーマンスを実現している。
より複雑なタスク指向セグメンテーション(TOS)に適用した場合、以前のアプローチは、各イメージパッチのクラスは事前に定義されていないが、特定の入力タスクに依存する。
この研究は、ViTベースのセグメンテーションモデルを加速できる新しいトークンプルーニング機構であるVision Language Guided Token Pruning (VLTP)を導入している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 23:14:12 GMT)
MFF-FTNet: Multi-scale Feature Fusion across Frequency and Temporal Domains for Time Series Forecasting [18.8] 時系列予測は多くの分野において重要であるが、現在のディープラーニングモデルはノイズやデータの分散、複雑なパターンのキャプチャに苦労している。
本稿では,コントラスト学習とマルチスケール特徴抽出を組み合わせることで,これらの課題に対処する新しいフレームワークであるMFF-FTNetを提案する。
5つの実世界のデータセットに対する大規模な実験は、MFF-FTNetが最先端のモデルを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:41:42 GMT)
Flaws of ImageNet, Computer Vision's Favourite Dataset [18.7] ImageNet-1kデータセットは、モデルパフォーマンスを評価するためのゴールドスタンダードになっている。
この記事では、ImageNet-1kデータセットの問題点を分析します。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:47:59 GMT)
Health AI Developer Foundations [18.7] Health AI Developer Foundations(HAI-DEF)は、トレーニング済み、ドメイン固有の基礎モデル、ツール、レシピのスイートで、ヘルスアプリケーションのための機械学習の構築を加速する。
モデルは、放射線学(X線とCT)、病理学、皮膚画像、オーディオなど、様々なモダリティや領域をカバーする。
これらのモデルは、ラベル付きデータが少なく、トレーニング時間が短く、計算コストが削減されたAI開発を容易にする、ドメイン固有の埋め込みを提供する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:01:08 GMT)
Physically Parameterized Differentiable MUSIC for DoA Estimation with Uncalibrated Arrays [18.7] 到着方向推定(DoA)は、レーダー、ソナー、オーディオ、無線通信システムにおいて一般的な検知問題である。
本研究は,モデルに基づくアプローチに従って,共同でDoA推定とハードウェア障害学習手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:51:25 GMT)
ChatGen: Automatic Text-to-Image Generation From FreeStyle Chatting [18.0] ChatGen-Evoは、モデルに不可欠な自動化スキルを徐々に装備する多段階進化戦略である。
ChatGen-Evoは様々なベースラインのパフォーマンスを大幅に向上させる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:31:12 GMT)
LLM-RankFusion: Mitigating Intrinsic Inconsistency in LLM-based Ranking [18.0] 大規模言語モデル(LLM)によるランク付けは、現代の情報検索(IR)システムにおいて有望な性能を達成することができる。
ソートに基づく手法では、パスを正しくソートするには一貫した比較が必要であり、LCMがしばしば違反することを示す。
LLMベースのランキングフレームワークであるLLM-RankFusionを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:37:54 GMT)
LexEval: A Comprehensive Chinese Legal Benchmark for Evaluating Large Language Models [17.9] 大規模言語モデル (LLM) は自然言語処理タスクにおいて大きな進歩を遂げており、法的領域においてかなりの可能性を示している。
既存のLLMを法制度に適用し、その可能性や限界を慎重に評価することなく適用することは、法律実務において重大なリスクをもたらす可能性がある。
我々は、標準化された総合的な中国の法律ベンチマークLexEvalを紹介する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:35:49 GMT)
Self-reconfiguration Strategies for Space-distributed Spacecraft [17.7] 本稿では、将来の宇宙船が軌道上で異なる機能を持つモジュールを組み立てられる分散軌道上の宇宙船組立アルゴリズムを提案する。
軌道上での軌道上での自己再構成アルゴリズムは、分散宇宙船の利点を実現する上で重要な役割を担っている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:05:44 GMT)
POWQMIX: Weighted Value Factorization with Potentially Optimal Joint Actions Recognition for Cooperative Multi-Agent Reinforcement Learning [17.6] 値関数分解法は、協調型マルチエージェント強化学習において一般的に用いられる。
本稿では, 潜在的に最適な関節動作を認識し, トレーニング中の損失により高い重みを割り当てるPOWQmix(Possally Optimal Joint Actions Weighted Qmix)アルゴリズムを提案する。
行列ゲーム,難易度の高い捕食者前処理,およびStarCraft II Multi-Agent Challenge環境における実験により,我々のアルゴリズムは最先端の値に基づくマルチエージェント強化学習法よりも優れていることを示した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:46:12 GMT)
Sample Selection Bias in Machine Learning for Healthcare [17.5] サンプル選択バイアス(SSB, sample selection bias)は, 対象個体群が対象個体群に比例しない特定の種類の偏見である。
既存の機械学習技術は、主に研究と対象個体群の分布のバランスをとることによってバイアスを補正しようとする。
偏り補正ではなく,対象集団の同定に基づいて,SSBに対処するための新たな研究方向を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 21:13:05 GMT)
RTL-Breaker: Assessing the Security of LLMs against Backdoor Attacks on HDL Code Generation [17.5] 大規模言語モデル(LLM)は、ハードウェア設計のためのコード生成/補完タスクにおいて顕著な可能性を示している。
LLMはいわゆるデータ中毒やバックドア攻撃の影響を受けやすい。
ここでは、攻撃者はトレーニングデータに対して悪意のあるコードを注入し、LLMによって生成されたHDLコードに渡すことができる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:31:18 GMT)
How do Multimodal Foundation Models Encode Text and Speech? An Analysis of Cross-Lingual and Cross-Modal Representations [17.5] クロスモーダル表現は、テキスト処理と音声処理に特化した初期層を除いて、モデル層に収束する。
音声はテキストよりも言語間の違いが大きい。
モダリティに依存しない表現のために明示的に訓練されていないモデルでは、モダリティギャップは言語ギャップよりも顕著である。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:29:11 GMT)
Star Attention: Efficient LLM Inference over Long Sequences [17.4] 本稿では,複数のホストに注意を向けることで,計算効率を向上させる2相ブロックスパース近似であるStar Attentionを紹介する。
Star Attentionは、グローバルな注意でトレーニングされたほとんどのTransformerベースのLarge Language Modelとシームレスに統合され、95~100%の精度を維持しながら、メモリ要件と推論時間を最大11倍削減する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 05:10:04 GMT)
Geometric Point Attention Transformer for 3D Shape Reassembly [17.3] 本稿では,幾何学的関係に関する推論の課題に対処するネットワークを提案する。
我々は大域的な形状情報と局所的な対幾何学的特徴と、各部分の回転ベクトルや変換ベクトルとして表されるポーズを統合する。
意味的および幾何学的組立作業におけるモデルの評価を行い、絶対的なポーズ推定において従来の手法よりも優れていたことを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:29:38 GMT)
Natural Language Understanding and Inference with MLLM in Visual Question Answering: A Survey [17.3] VQA(Visual Question Answering)は、自然言語処理とコンピュータビジョン技術を組み合わせた課題である。
この調査は、画像とテキストの自然言語理解の最新の合成を提供する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:21:03 GMT)
LiteVAR: Compressing Visual Autoregressive Modelling with Efficient Attention and Quantization [17.2] 現在のARベースのビジュアル生成モデルは、リソース制約のあるデバイスに適用性を制限するために、かなりの計算資源を必要とする。
性能を維持しつつ,VARモデルの効率を向上させるために,効率的な注意機構と低ビット量子化手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:32:36 GMT)
PROGRESSOR: A Perceptually Guided Reward Estimator with Self-Supervised Online Refinement [16.8] 本稿では,タスクに依存しない報酬関数をビデオから学習するフレームワークであるProgESSORを提案する。
ProGRESSORは、ロボットが外部の監督なしに複雑な動作を学習できるようにする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:17:51 GMT)
Self-supervised Video Instance Segmentation Can Boost Geographic Entity Alignment in Historical Maps [16.4] ビデオ・インスタンス・セグメンテーション(VIS)を用いた歴史的地図における地理的実体のセグメンテーションとアソシエーションを組み合わせた新しいアプローチを提案する。
この課題を軽減するために,歴史地図上でのVIS性能を向上させる自己教師付き学習(SSL)技術について検討する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:31:51 GMT)
The belief in Moore's Law is undermining ICT climate action [16.3] The True Cost of ICT: From Materiality to Techno-Solutionism (TCICT) は、スウェーデンのストックホルムで2024年に開催されたICT for Sustainability(ICT4S)カンファレンスで開かれたワークショップである。
我々は、ICTの効率とエネルギー利用という観点からではなく、システムとしてのICTの影響に対処することの重要性を指摘する。
我々は、半導体産業の交叉気候の影響とそれが具現化するテクノ・ソリューション主義に対処するために、同心的で批判的な同僚のコミュニティを構築することを呼びかけて締めくくります。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:50:05 GMT)
CRASH: Challenging Reinforcement-Learning Based Adversarial Scenarios For Safety Hardening [16.3] 本稿では, CRASH - Challenging Reinforcement-learning based Adversarial scenarios for Safety Hardeningを紹介する。
第1のCRASHは、Ego車両との衝突を自動的に誘導するために、AVシミュレータ内のNon Player Character(NPC)エージェントを制御することができる。
我々はまた、敵エージェントに対する改善シナリオをシミュレートすることで、運動プランナーを反復的に洗練する安全硬化という新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 00:00:27 GMT)
Unconstrained Open Vocabulary Image Classification: Zero-Shot Transfer from Text to Image via CLIP Inversion [16.3] 我々は、自動回帰変換器を用いて言語として分類ラベルを生成出力する、革新的なリアルタイムuN制約Open Vocabulary ImageであるNOVICを紹介した。
本稿では,テンプレート生成したオブジェクト名詞集合の大規模92Mターゲットデータセットに基づいて,オブジェクトデコーダモデルを提案する。
これはCLIPテキストキャプションを効果的に反転させ、基本的には英語全体のテキストオブジェクトラベルを画像由来の埋め込みベクトルから直接生成することを可能にする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:28:35 GMT)
IL-TUR: Benchmark for Indian Legal Text Understanding and Reasoning [16.1] 世界中の法制度は、事例や文書の指数的な増加と共に浸水している。
法律文書を自動的に処理し理解するためのNLPおよびML技術を開発する必要がある。
本稿では, IL-TUR: Benchmark for Indian Legal Text Understanding and Reasoningを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:48:42 GMT)
DeltaKWS: A 65nm 36nJ/Decision Bio-inspired Temporal-Sparsity-Aware Digital Keyword Spotting IC with 0.6V Near-Threshold SRAM [16.1] 本稿では,音声制御デバイスを対象としたDelta$RNN対応時空間細粒度対応KWS ICについて紹介する。
87%の時間間隔で、計算遅延とエネルギー/推論はそれぞれ2.4X/3.4Xに減少する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:37:57 GMT)
BadSFL: Backdoor Attack against Scaffold Federated Learning [16.1] フェデレートラーニング(FL)は、分散クライアント上のディープラーニングモデルのトレーニングにより、データのプライバシを保護します。
BadSFLは、非IID環境での足場集約アルゴリズムを用いて、FLフレームワーク用に設計された新しいバックドアアタック手法である。
BadSFLは、グローバルモデルで60ラウンド以上有効であり、既存のベースライン攻撃の最大3倍の長さである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:00:34 GMT)
Tracing Optimization for Performance Modeling and Regression Detection [16.0] 性能モデルは、システムのパフォーマンスと実行時のアクティビティの関係を解析的に記述する。
性能に敏感なコード領域を識別・排除することで、トレーシングオーバーヘッドを低減する統計的手法を提案する。
私たちのアプローチは完全に自動化されており、最小限の人的労力で本番環境で使用できるようにしています。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:11:55 GMT)
Differentially private and decentralized randomized power method [16.0] 微分プライバシー(DP)を実現するために導入されたノイズの分散を低減するための戦略を提案する。
精度を保ちながら、計算と通信のオーバーヘッドが低い分散化フレームワークに適応する。
本研究では,集中型環境におけるノイズスケールを,集中型環境におけるノイズスケールと類似した分散化環境で使用することができることを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:06:12 GMT)
On Statistical Rates of Conditional Diffusion Transformers: Approximation, Estimation and Minimax Optimality [15.9] 条件付きDiTと潜伏変種の両方が、特定条件下での非条件付きDiTの最小最適性をもたらすことを示す。
本研究は, 条件付きおよび非条件付きDiTの統計的限界を確立し, より効率的かつ高精度なDiTモデル開発に向けた実践的ガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:30:48 GMT)
DWCL: Dual-Weighted Contrastive Learning for Multi-View Clustering [15.8] マルチビュークラスタリングのためのDWCL(Dual-Weighted Contrastive Learning)と呼ばれる新しいモデルを提案する。
具体的には、信頼性の低いクロスビューの影響を軽減するために、革新的なBest-Other(B-O)コントラスト機構を導入する。
ビュー品質重みとビュー差重みを反映し、ビュー品質重みを両立させる2重み付け戦略を開発した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:57:20 GMT)
sbi reloaded: a toolkit for simulation-based inference workflows [15.7] $texttsbi$は、ニューラルネットワークに基づいたベイズSBIアルゴリズムを実装するPyTorchベースのパッケージである。
texttsbi$ツールキットを使えば、科学者やエンジニアが最先端のSBIメソッドをブラックボックスシミュレータに適用できる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:31:47 GMT)
DRiVE: Diffusion-based Rigging Empowers Generation of Versatile and Expressive Characters [15.6] DRiVEは複雑な構造を持つ3Dヒューマンキャラクタの生成とリグのための新しいフレームワークである。
コードとデータセットは受理後、学術的利用のために公開される。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:30:41 GMT)
ReC-TTT: Contrastive Feature Reconstruction for Test-Time Training [15.6] 深層学習モデルを新しい未知の領域に適応させるテストタイムトレーニング手法を提案する。
ReC-TTTは、凍結エンコーダと2つのトレーニング可能なエンコーダの間の補助的なタスクとしてクロスコンストラクションを使用する。
ReC-TTTは、ほとんどのドメインシフト分類課題において、最先端技術よりも優れた結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 20:38:02 GMT)
E-Trojans: Ransomware, Tracking, DoS, and Data Leaks on Battery-powered Embedded Systems [15.5] バッテリー駆動組込みシステム (BES) はユビキタス化されている。
関連するリスクにもかかわらず、BESの内部攻撃面についてはほとんど研究されていない。
我々はe-scooters内部のセキュリティとプライバシに関する最初の評価を提示する。
我々は、BES内部を標的とした4つの新しい攻撃であるE-Trojansを開発する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:47:26 GMT)
Desert Camels and Oil Sheikhs: Arab-Centric Red Teaming of Frontier LLMs [15.4] 大規模言語モデル(LLM)は広く使われているが、社会的バイアスが組み込まれているため倫理的懸念が高まる。
本研究では、女性の権利、テロリズム、反ユダヤ主義を含む8つの領域にわたるアラブ人と西洋人に対するLCMバイアスについて検討する。
GPT-4, GPT-4o, LlaMA 3.1 (8Bおよび405B), Mistral 7B, Claude 3.5 Sonnetの6つのLCMを評価した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 22:44:15 GMT)
Rising Rested Bandits: Lower Bounds and Efficient Algorithms [15.4] 本論文は、連続マルチアーマッドバンド(MAB)の分野である。
我々は,腕の期待される報酬が単調に非減少性であり,結束する残留包帯の特定の症例について検討した。
我々は,本アルゴリズムを実世界のデータセットに対するオンラインモデル選択問題や,複数の合成されたタスクに対する非定常MABの最先端手法と経験的に比較した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 22:39:42 GMT)
WF-VAE: Enhancing Video VAE by Wavelet-Driven Energy Flow for Latent Video Diffusion Model [15.2] ビデオ変分オートエンコーダ(VAE)は、ビデオを低次元の潜在空間にエンコードする。
VAEは、ほとんどの遅延ビデオ拡散モデル(LVDM)のキーコンポーネントである
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:23:53 GMT)
CliquePH: Higher-Order Information for Graph Neural Networks through Persistent Homology on Clique Graphs [15.0] 本稿では,グラフ内の高次構造に関する情報を抽出する新しい手法を提案する。
テスト精度は最大で31%向上する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:01:01 GMT)
Exploiting Watermark-Based Defense Mechanisms in Text-to-Image Diffusion Models for Unauthorized Data Usage [15.0] 安定拡散のようなテキストと画像の拡散モデルは、高品質な画像を生成するのに例外的な可能性を示している。
近年の研究では、これらのモデルのトレーニングに不正データを使用することが懸念されており、知的財産権侵害やプライバシー侵害につながる可能性がある。
本稿では、拡散過程を利用して保護された入力に対して制御された画像を生成するRATTANを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:12:32 GMT)
ΩSFormer: Dual-Modal Ω-like Super-Resolution Transformer Network for Cross-scale and High-accuracy Terraced Field Vectorization Extraction [14.8] 棚田は土壌・水質保全(SWC)の重要な工学的実践である
本研究は,知的TFVEのための新しい2モードOmega型超解像トランスネットワークを提案する最初のものである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:00:28 GMT)
ICODE: Modeling Dynamical Systems with Extrinsic Input Information [14.5] モデルの学習過程に,正確なリアルタイム入力情報を組み込んだ入力共役ニューラルネットワーク(ICODE)を導入する。
いくつかの代表的実動力学の実験を通して本手法を検証する。
この研究は、明示的な外部入力情報で物理的システムを理解するための貴重なニューラルネットワークODEモデルのクラスを提供する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:36:50 GMT)
MambaCSR: Dual-Interleaved Scanning for Compressed Image Super-Resolution With SSMs [14.4] MambaCSRは、圧縮画像超解像(CSR)タスクのためのMambaをベースにしたフレームワークである。
本稿では,2つの走査戦略からなるCSRのための効率的なデュアルインターリーブ走査パラダイム(DIS)を提案する。
複数のベンチマークの結果から,圧縮画像超解像タスクにおけるMambaCSRの優れた性能が示された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:32:19 GMT)
Navigating Spatial Inequities in Freight Truck Crash Severity via Counterfactual Inference in Los Angeles [14.4] 本研究は, 社会経済的格差, 道路インフラ, 環境条件が貨物トラック事故の地理的分布と重大さに与える影響を解析した。
その結果, 人口密度, 所得水準, マイノリティの異なる地域において, 衝突重大度の空間的格差が顕著であった。
この発見は、道路インフラ、照明、交通制御システムの強化を示唆する、目標、位置特異的な政策介入に関する洞察を与える。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:15:49 GMT)
MAT: Multi-Range Attention Transformer for Efficient Image Super-Resolution [14.3] 多様な空間範囲にわたる注意の柔軟な統合は、大幅なパフォーマンス向上をもたらす可能性がある。
スーパーレゾリューション(SR)タスクに適したマルチランジアテンショントランス(MAT)を提案する。
MATは、様々な空間範囲にまたがる依存関係を包含し、その特徴表現の多様性と有効性を向上させる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:30:31 GMT)
Asynchronous Fractional Multi-Agent Deep Reinforcement Learning for Age-Minimal Mobile Edge Computing [14.3] 計算集約的な更新のタイムラインを調査し、AoIを最小化するためにタスク更新とオフロードポリシーを共同で最適化する。
具体的には、エッジ負荷のダイナミクスを考慮し、期待時間平均AoIを最小化するためにタスクスケジューリング問題を定式化する。
提案アルゴリズムは,実験における最良基準アルゴリズムと比較して平均AoIを最大52.6%削減する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:59:33 GMT)
Neural-Network-Enhanced Metalens Camera for High-Definition, Dynamic Imaging in the Long-Wave Infrared Spectrum [14.1] 我々は、シングルトを用いた長波長赤外線イメージングのための軽量で費用対効果の高いソリューションを開発した。
我々は,高周波化サイクル-GANニューラルネットワークをメタレンスイメージングシステムに統合する。
我々のカメラは、12.58のエンドポイント誤差値で毎秒125フレームのダイナミックイメージングを実現することができる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:09:45 GMT)
FedReMa: Improving Personalized Federated Learning via Leveraging the Most Relevant Clients [14.0] Federated Learning (FL) は分散機械学習のパラダイムであり、分散計算と周期モデル合成によってグローバルに堅牢なモデルを実現する。
広く採用されているにもかかわらず、既存のFLとPFLの作業は、クラス不均衡の問題に包括的に対処していない。
本稿では,適応型クライアント間コラーニング手法を用いて,クラス不均衡に対処できる効率的なPFLアルゴリズムであるFedReMaを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:50:37 GMT)
Redefining Crowdsourced Test Report Prioritization: An Innovative Approach with Large Language Model [14.0] 本稿では,大規模言語モデル(LLM)を用いたクラウドソーステストレポートの優先順位付け手法であるLLMPriorを紹介する。
この結果から,LLMPriorは現在の最先端のアプローチに勝るだけでなく,実用性,効率,信頼性も高いことが示唆された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:23:30 GMT)
CutS3D: Cutting Semantics in 3D for 2D Unsupervised Instance Segmentation [13.9] 我々は,シーンのポイントクラウド表現を利用して,最後の2Dインスタンスを得るために,3次元のセマンティックマスクをカットすることを提案する。
また,クリーンな学習信号の分離を目的とした3つの空間信頼成分を用いたクラス非依存検出器のトレーニングの強化も提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:14:34 GMT)
Inference Scaling $\scriptsize\mathtt{F}$Laws: The Limits of LLM Resampling with Imperfect Verifiers [13.8] 近年の研究では、推論スケーリングにより、より弱い言語モデルがより強力なモデルの精度に適合または超えることを期待している。
より弱いモデルの推論スケーリングの量は、十分に強いモデルの単一サンプル精度に匹敵することができないことを示す。
また、精度以上の偽陽性には、コーディングスタイルの慣行への順守の欠如など、他の望ましくない性質があることも示している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:13:06 GMT)
Dense ReLU Neural Networks for Temporal-spatial Model [13.8] 非パラメトリック推定にRectified Linear Unit (ReLU) アクティベーション機能を利用する完全接続深層ニューラルネットワークに着目する。
我々は、観測された測定における時間的および空間的依存に対処するため、収束率につながる非漸近境界を導出する。
我々はまた、多様体上のデータをモデル化し、高次元データの本質的な次元性を探求することで、次元性の呪いに取り組む。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:56:41 GMT)
Visatronic: A Multimodal Decoder-Only Model for Speech Synthesis [13.7] 本稿では,VTTSのビデオから音声を生成するタスクを提案し,マルチモーダル音声生成のための新しい手法を提案する。
本稿では,このタスクをビザトロニクスと呼ぶデコーダのみのマルチモーダルモデルを提案する。
視覚、テキスト、音声を直接トランスフォーマーモデルの共通部分空間に埋め込み、自己回帰的損失を用いて、話者ビデオや音声の書き起こしに条件付けられた離散化メル-スペクトログラムの生成モデルを学ぶ。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:57:29 GMT)
Gotta Hear Them All: Sound Source Aware Vision to Audio Generation [13.6] Vision-to-audio (V2A) はマルチメディアに広く応用されている。
音源認識型V2A(SSV2A)ジェネレータを提案する。
SSV2Aは, 世代的忠実度と関連性の両方において, 最先端の手法を超越していることを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:49:11 GMT)
Learning via Surrogate PAC-Bayes [13.4] PAC-Bayes学習は、学習アルゴリズムの一般化能力を研究するための包括的な設定である。
本稿では,一連の代理学習目標を最適化することで,反復学習アルゴリズムを構築するための新しい原則的戦略を提案する。
PAC-Bayes境界による学習の一般的なレシピを提供するのに加えて、(i)サロゲートの反復最適化が元の一般化境界の最適化を意味することを示す理論的結果を提供する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:03:54 GMT)
Demonstrating a universal logical gate set on a superconducting quantum processor [13.4] 超伝導量子プロセッサWuitkongを用いて,距離2の表面コード上に任意の1量子ビット回転ゲートを持つ論理CNOTゲートを実験的に実装した。
我々は論理的ベル状態のフォールトトレラントな準備とCHSH不等式違反の観察を行い、論理的量子ビット間の絡み合いを確認した。
普遍論理ゲートセットと絡み合った論理状態のデモンストレーションは、超伝導量子プロセッサにおけるFTQCの重要な側面を強調している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:50:55 GMT)
Efficient Progressive Image Compression with Variance-aware Masking [13.3] 本稿では,まず画像がベース品質とトップ品質の潜在表現のペアとして表現されるプログレッシブ画像圧縮法を提案する。
残留潜在表現は、トップとベース表現の要素ワイド差として符号化される。
我々は、計算複雑性、復号時間、パラメータ数を大幅に削減しながら、最先端の競合相手と競合する結果を得る。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:09:52 GMT)
Universal Functional Regression with Neural Operator Flows [13.3] 普遍汎関数回帰の概念を導入し、非ガウス函数空間上の事前分布を学習することを目指す。
我々は正規化フローの無限次元拡張であるニューラル演算子フロー(OpFlow)を開発した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 21:46:44 GMT)
Rapid Distributed Fine-tuning of a Segmentation Model Onboard Satellites [13.2] 本研究は、Unibap iX10-100衛星ハードウェアに搭載された、軽量で事前訓練されたセグメンテーションモデルであるMobileSAMを用いた概念実証を行う。
本研究は,災害に迅速に対応し,複数の衛星上での微調整型MobileSAMの分散化の可能性について検討する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:11:36 GMT)
Towards Maximum Likelihood Training for Transducer-based Streaming Speech Recognition [13.2] 本稿では,トランスデューサニューラルネットワークを用いた音声認識(ASR)のストリーミング手法を提案する。
従来のフレームワークでは、ストリーミングトランスデューサモデルは、非ストリーミング再帰規則に基づく可能性関数の最大化のために訓練されている。
FoCCEトレーニングにより,ストリーミングトランスデューサの精度が向上することを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:53:13 GMT)
Modality-Incremental Learning with Disjoint Relevance Mapping Networks for Image-based Semantic Segmentation [13.1] 自律運転では、多様なセンサーが悪天候や照明条件に対する堅牢性に寄与する。
継続的学習の文脈では、インクリメンタル学習は特に大きなドメインシフトにおいて困難である。
本稿では,新しいモダリティを段階的に学習し,以前に学習したモダリティの性能を保ちながら,改良されたレバレンスマッピングネットワーク(RMN)を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:21:53 GMT)
Confidence-Aware Deep Learning for Load Plan Adjustments in the Parcel Service Industry [13.1] 本研究では,大規模輸送物流企業におけるインバウンド負荷計画調整を自動化するためのディープラーニングに基づくアプローチを開発する。
これは、不確実性が増大する中で、効率よくレジリエントなEコマース事業計画のための重要な課題に対処する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:13:13 GMT)
DriveMLLM: A Benchmark for Spatial Understanding with Multimodal Large Language Models in Autonomous Driving [13.1] 自律運転におけるマルチモーダル大言語モデル(MLLM)の空間的理解能力を評価するためのベンチマークであるDriveMLLMを紹介する。
DriveMLLMには、880の前面カメライメージが含まれており、言語学的に多様な自然言語問題を伴う絶対的および相対的空間推論タスクが導入されている。
我々は,DriveMLLMにおける最先端MLLMの評価を行い,運転環境における複雑な空間的関係を理解する上での現在のモデルの限界を明らかにした。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:24:04 GMT)
InsightEdit: Towards Better Instruction Following for Image Editing [12.7] InstructPix2Pix, InstructDiffusion, SmartEditといった以前の作業では、エンドツーエンドの編集が検討されている。
MLLM(Multimodal Large Language Models)によるテキスト的特徴と視覚的特徴の両方を利用した2ストリームブリッジ機構を提案する。
InsightEditは,従来の画像との背景の整合性を保ちながら,複雑な命令の追従に優れ,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:11:10 GMT)
Prompting Visual-Language Models for Dynamic Facial Expression Recognition [12.5] 本稿ではDFER-CLIPと呼ばれる新しい視覚言語モデルを提案する。
これはCLIPモデルに基づいており、幅内動的顔表情認識のために設計されている。
DFEW、FERV39k、MAFWベンチマークの現在の教師付きDFER法と比較すると、最先端の結果が得られる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:37:36 GMT)
Integrating Dual Prototypes for Task-Wise Adaption in Pre-Trained Model-Based Class-Incremental Learning [12.5] クラスインクリメンタルラーニング(CIL)は、歴史知識を漸進的に保存しつつ、新しいクラスを取得することを目的としている。
本稿では,PTMに基づくCILのタスクワイド適応(DPTA)のためのDual Prototype Networkを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 05:04:38 GMT)
MARVEL-40M+: Multi-Level Visual Elaboration for High-Fidelity Text-to-3D Content Creation [12.3] MARVEL-40M+は,890万以上の3D資産に対して,4000万のテキストアノテーションを備えた広範なデータセットである。
我々の貢献は、オープンソースで事前訓練されたマルチビューVLMとLLMを統合した、新しいマルチステージアノテーションパイプラインである。
我々はまた、2段階のテキスト・ツー・3DパイプラインであるMARVEL-FX3Dを開発し、アノテーションで安定拡散を微調整し、事前訓練された画像・ツー・3Dネットワークを用いて15秒以内に3Dテクスチャメッシュを生成する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 23:39:43 GMT)
Enhancing Lane Segment Perception and Topology Reasoning with Crowdsourcing Trajectory Priors [12.3] 本稿では, 軌道先行の新たな視点から, 先行オーディメンテーションを考察する。
我々は、融合プロセス中にアライメントを考慮に入れた信頼に基づく融合モジュールを設計する。
その結果,本手法の性能は現在の最先端手法よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:05:05 GMT)
CityWalker: Learning Embodied Urban Navigation from Web-Scale Videos [12.3] 我々は,人間のような都市ナビゲーションのためのスケーラブルでデータ駆動型アプローチを提案する。
われわれは何千時間もの間、何千時間もの街を歩きながらウェブから動画を流すエージェントを訓練している。
我々のモデルは、多様な課題や重要なシナリオを扱うために洗練されたナビゲーションポリシーを学びます。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:02:20 GMT)
Brainformer: Mimic Human Visual Brain Functions to Machine Vision Models via fMRI [12.2] 本稿では,人間の知覚システムにおけるfMRIパターンを解析するためのBrainformerという新しいフレームワークを紹介する。
この研究は、人間の知覚からニューラルネットワークに知識を移すための先進的なアプローチを導入する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:38:28 GMT)
Updating the constraint on the quantum collapse models via kilogram masses [12.1] 量子力学はすべての顕微鏡現象を制御し、古典的な振る舞いを示すマクロな物体に適用する際の課題に遭遇する。
このマイクロマクロ格差に対処するために、連続自発局所化(CSL)やディオシ・ペンローズ(DP)モデルのような崩壊モデルが提案されている。
我々は、これらの量子崩壊モデルをテストするために深層地下実験室を使うことの潜在的な利点について論じる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:55:51 GMT)
Simple GNNs with Low Rank Non-parametric Aggregators [12.1] 最先端(SOTA)のGNNアーキテクチャは、一般的なSSNCベンチマークデータセットに対してオーバーエンジニアリングされる可能性がある。
特徴集約を非パラメトリック学習者に置き換えることで、GNN設計プロセスを合理化できます。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 22:44:45 GMT)
CleanVul: Automatic Function-Level Vulnerability Detection in Code Commits Using LLM Heuristics [12.1] 本稿では,Large Language Model (LLM) を用いて,VFCからの脆弱性修正変更を自動的に識別する手法を提案する。
VulSifterは大規模な調査に適用され、GitHubで127,063のリポジトリをクロールし、5,352,105のコミットを取得しました。
LLM拡張手法を用いて11,632個の関数からなる高品質なデータセットであるCleanVulを開発した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:51:55 GMT)
Dual-Representation Interaction Driven Image Quality Assessment with Restoration Assistance [12.0] 歪み画像の非参照画像品質評価は、画像内容のばらつきと歪みの多様性のために常に難しい問題である。
以前のIQAモデルは、主に、品質スコア予測のための品質認識表現を得るために、合成画像の明示的な単一品質特徴を符号化していた。
低画質画像の劣化・品質情報を別々にモデル化するDRI法を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:48:47 GMT)
Push the Limit of Multi-modal Emotion Recognition by Prompting LLMs with Receptive-Field-Aware Attention Weighting [11.9] 本稿では,受動的フィールド認識重み付けによる大規模言語モデルの実現により,あるバニラモデルの性能を向上させるフレームワークであるLanternを提案する。
実験では、バニラモデルCORECTとSDTがGPT-4またはLlama-3.1-405Bでランタンに配備された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:35:24 GMT)
A Distractor-Aware Memory for Visual Object Tracking with SAM2 [11.9] メモリベースのトラッカー(英: Memory-based tracker)は、最近追跡されたフレームをメモリバッファに連結し、現在の画像をバッファされたフレームに到達させることでターゲットをローカライズすることにより、ターゲットモデルを形成するビデオオブジェクトセグメンテーション手法である。
SAM2.1++はSAM2.1と関連するSAMメモリ拡張を7つのベンチマークで上回り、6つのベンチマークで新しい最先端を設定できる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:41:09 GMT)
I2VControl: Disentangled and Unified Video Motion Synthesis Control [11.8] I2VControlは,映像合成における複数の動作制御タスクを統一するフレームワークである。
提案手法では,映像を個々のモーションユニットに分割し,各ユニットをアンタングル制御信号で表現する。
我々の方法論は、事前訓練されたモデルのためのプラグインとしてシームレスに統合され、特定のモデルアーキテクチャに依存しないままです。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:21:22 GMT)
I2VControl-Camera: Precise Video Camera Control with Adjustable Motion Strength [11.8] I2Vコントロルカメラ(I2VControl-Camera)は、被写体運動の強度を提供しながら、制御性を大幅に向上させる新しいカメラ制御方法である。
被写体運動の強度を正確に制御・調整するために,映像軌道展開の高次成分を明示的にモデル化する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:53:29 GMT)
SpikeAtConv: An Integrated Spiking-Convolutional Attention Architecture for Energy-Efficient Neuromorphic Vision Processing [11.7] スパイキングニューラルネットワーク(SNN)は、従来の人工ニューラルネットワークに代わる生物学的にインスパイアされた代替手段を提供する。
SNNは、画像分類などの複雑な視覚的タスクにおいて、まだ競争力のある性能を達成できていない。
本研究では,有効性とタスク精度の向上を目的とした新しいSNNアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:57:38 GMT)
COAP: Memory-Efficient Training with Correlation-Aware Gradient Projection [11.7] トレーニング性能を維持しながら計算オーバーヘッドを最小限に抑えるメモリ効率の高いCOAPを提案する。
LLaMA-1Bでは、メモリをわずか2%追加で61%削減し、AdamWと同じPPLを実現する。
8ビット量子化により、COAPはメモリを81%削減し、LLaVA-v1.5-7BファインチューニングのためにGaLoreを4倍高速化する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:50:52 GMT)
BPP-Search: Enhancing Tree of Thought Reasoning for Mathematical Modeling Problem Solving [11.6] 我々は、完全な数学的モデリングプロセスをキャプチャする包括的ラベルを付したStructuredORデータセットをリリースする。
本稿では,強化学習をツリー・オブ・シント構造に統合するアルゴリズムであるBPP-Searchを提案する。
BPP-Searchは、Chain-of-Thought、Self-Consistency、Tree-of-Thoughtなど、最先端の手法を大幅に上回っている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:05:53 GMT)
BRACTIVE: A Brain Activation Approach to Human Visual Brain Learning [11.5] 本稿では,脳活動ネットワーク(BRACTIVE)について紹介する。
BRACTIVEの主な目的は、被験者の視覚的特徴をfMRI信号を介して対応する脳表現と整合させることである。
実験の結果, BRACTIVEは顔や身体選択領域など, 個人特有の関心領域を効果的に識別できることがわかった。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:40:08 GMT)
A Survey on Human-Centric LLMs [11.5] 大型言語モデル(LLM)は人間の認知と行動をシミュレートすることができる。
この調査は個々のタスクと集合タスクの両方のパフォーマンスに焦点を当てている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:03:08 GMT)
DexTouch: Learning to Seek and Manipulate Objects with Tactile Dexterity [11.5] 視覚に頼らずに触覚で物体を操作できる多指ロボットシステムを提案する。
日常の生活を模倣するタスクのために、ロボットは触覚を使ってランダムに配置された物体を暗く操作する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:58:14 GMT)
TinyViM: Frequency Decoupling for Tiny Hybrid Vision Mamba [11.2] Mambaはその線形複雑性のためにコンピュータビジョンに大きな可能性を示している。
既存の軽量なMambaベースのバックボーンは、ConvolutionやTransformerベースのメソッドにマッチするパフォーマンスを示すことはできない。
モバイルフレンドリーなコンボリューションと効率的なLaplaceミキサーを組み合わせることで、TinyViMと呼ばれる小さなハイブリッドビジョンを構築できる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:34:36 GMT)
Quantum simulation of the Sachdev-Ye-Kitaev model using time-dependent disorder in optical cavities [11.1] SYKモデル(Sachdev-Ye-Kitaev model)は、超量子カオス、非フェルミ液体の挙動、ホログラフィック物質に対するパラダイムである。
本稿では,乱数乱数ハミルトン群の結合分布を,スパース時間依存型障害実現によるトロッター化サイクルを用いて一般化する手法を提案する。
実験資源が利用可能なcQEDプラットフォームにおける複雑なSYK$_4$モデルの実現において、このスキームがどう耐えられるかを説明する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:00:00 GMT)
From Fairness to Infinity: Outcome-Indistinguishable (Omni)Prediction in Evolving Graphs [11.0] これらのテクニックをグラフの進化に適用し、オンラインの結果を区別できない、リッチな(おそらく無限の)差別化要因のセットを得る。
これは、人口集団のペアに関して、エッジ形成のマルチキャリブレート予測をもたらす。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:49:16 GMT)
LHPF: Look back the History and Plan for the Future in Autonomous Driving [10.9] 本稿では,歴史計画情報を統合した模倣学習プランナ LHPF を紹介する。
我々のアプローチでは、歴史的計画意図をプールする歴史的意図集約モジュールを採用している。
実世界のデータと合成データの両方を用いた実験は、LHPFが既存の高度な学習ベースのプランナーに勝るだけでなく、純粋に学習ベースのプランナーがエキスパートを上回った最初の事例であることを示している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:30:26 GMT)
Self-supervised Monocular Depth and Pose Estimation for Endoscopy with Generative Latent Priors [10.6] 内視鏡における3Dマッピングは、消化管(GI)内の定量的、全体的病変のキャラクタリゼーションを可能にする。
既存の合成データセットや複雑なモデルに依存する手法は、しばしば内視鏡的条件に挑戦する際の一般化性に欠ける。
本稿では,多変量オートエンコーダと生成潜在銀行を組み込んだ,頑健な自己監督型単眼深度とポーズ推定フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:43:06 GMT)
Not All Adapters Matter: Selective Adapter Freezing for Memory-Efficient Fine-Tuning of Language Models [10.6] 早期訓練段階において適応に寄与しない重要でないアダプタを徐々に凍結するSAFEを提案する。
実験では,メモリ使用量,計算量,トレーニング時間をそれぞれ42.85%,34.59%,11.82%削減した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:41:45 GMT)
GMFlow: Global Motion-Guided Recurrent Flow for 6D Object Pose Estimation [10.5] ポーズ推定のためのGMFlowと呼ばれるグローバルな動き誘導型リカレントフロー推定法を提案する。
我々は、物体の構造情報を利用して、剛体の可視部分の運動を、その可視領域に拡張する。
提案手法は,競合計算効率を維持しつつ,既存の手法の精度を向上する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:28:48 GMT)
DECODE: Domain-aware Continual Domain Expansion for Motion Prediction [10.5] 動作予測のための新しい連続学習フレームワークであるDECODEを紹介する。
専門化と一般化のバランスをとり、リアルタイムの要求に合わせて動的に調整する。
保存率は0.044で平均0.584mである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 22:20:22 GMT)
RealTraj: Towards Real-World Pedestrian Trajectory Forecasting [10.3] 本稿では,軌道予測の現実的適用性を高める新しいフレームワークであるRealTrajを提案する。
Det2TrajFormerは、過去の検出を入力として、ノイズの追跡に不変な軌道予測モデルである。
従来のトラジェクトリ予測手法とは異なり,本手法では,地平線検出のみを用いてモデルを微調整し,コストのかかる個人IDアノテーションの必要性を著しく低減する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:35:26 GMT)
CrowdMAC: Masked Crowd Density Completion for Robust Crowd Density Forecasting [10.3] 群集密度予測タスクは,過去の群集密度マップから今後,群集密度マップがどのように変化するかを予測することを目的としている。
過去の群衆密度マップは、歩行者のミス検出のため、しばしば不完全である。
本稿では,クラウド密度予測(CrowdMAC)のためのMAsked crowd density Completionフレームワークを提案する。
CrowdMACは、部分的に隠された過去の群衆密度マップから、将来の群衆密度マップを予測するために同時に訓練されている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:36:34 GMT)
On the Generalization of Handwritten Text Recognition Models [10.3] 本研究では,HTRモデルにおける分布外データ(OOD)の一般化に関する制約について検討する。
我々は、広く使用されている7つのデータセットにまたがる8つの最先端HTRモデルから、336のOODケースを分析し、5つの言語にまたがる。
我々は,OODシナリオにおけるHTRモデルの誤差を確実に推定し,70%のケースで10点以下に減少することを示した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:20:21 GMT)
Enhancing Code-Switching ASR Leveraging Non-Peaky CTC Loss and Deep Language Posterior Injection [9.7] 多言語話者が会話中に言語を交互に切り替えるコードスイッチングは、エンドツーエンド(E2E)自動音声認識(ASR)システムに重大な課題をもたらす。
まず、エンコーダの中間層に言語識別情報を組み込んで、より詳細な言語情報による出力埋め込みを強化することを目的としています。
第二に、言語境界アライメント損失の新たな応用により、後続のASRモジュールは、言語後続の知識をより効果的に活用することができる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:49:05 GMT)
DiffSLT: Enhancing Diversity in Sign Language Translation via Diffusion Model [9.5] そこで我々は,Gloss-free手話翻訳フレームワークであるDiffSLTを提案する。
DiffSLTは、入力ビデオの視覚的特徴に基づいてランダムノイズをターゲット潜在表現に変換する。
DiffSLT-Pは擬似グルースによる視覚的特徴の条件を定め、重要なテキストガイダンスを提供し、モダリティのギャップを減らし、DiffSLT-Pを導入している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:26:36 GMT)
From Machine Learning to Machine Unlearning: Complying with GDPR's Right to be Forgotten while Maintaining Business Value of Predictive Models [9.4] この研究は、Ensemble-based iTerative Information Distillation (ETID)と呼ばれる、総合的な機械学習から学習へのフレームワークを開発する。
ETIDには、データ消去要求の処理を容易にする正確な予測モデルを構築するための、新しいアンサンブル学習手法が組み込まれている。
また, 効率的かつ効率的なデータ消去を実現するために, 構築されたアンサンブルモデルに適した, 蒸留に基づく未学習手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 05:42:46 GMT)
Neural network modelling of kinematic and dynamic features for signature verification [9.1] 角速度, 角位置, 力トルクを推定するための2つの手法を提案する。
最初のアプローチは、物理的なUR5eロボットアームを使用して、それらのパラメータを時間をかけてキャプチャしながらシグネチャを再現する。
2つ目の方法はコスト効率のよいアプローチで、ニューラルネットワークを使って同じパラメータを推定する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:17:24 GMT)
Bias Unveiled: Investigating Social Bias in LLM-Generated Code [9.1] 大規模言語モデル(LLM)は、自動コード生成の分野を大幅に進歩させた。
本研究では,LLM生成コードの社会的バイアスの評価と緩和を目的とした,新しいフェアネスフレームワークであるSolarを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:44:21 GMT)
Network Inversion and Its Applications [9.1] ニューラルネットワークは、さまざまなアプリケーションにまたがる強力なツールとして登場したが、意思決定プロセスはしばしば不透明であり、「ブラックボックス」と認識される。
ネットワークの反転技術は、これらのブラックボックスの中を覗き見し、ネットワークが意思決定プロセスの背後で学んだ特徴とパターンを明らかにすることで、ソリューションを提供します。
本稿では,訓練されたニューラルネットワークの入力空間におけるデータ分布を学習する厳密な条件付きジェネレータを用いて,ネットワークインバージョンに対する簡易かつ効果的なアプローチを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:04:52 GMT)
Socio-Emotional Response Generation: A Human Evaluation Protocol for LLM-Based Conversational Systems [9.1] 本稿では、応答生成の前に社会情緒戦略を計画する中間段階を含むニューラルアーキテクチャを提案する。
本研究は, 予測された戦略ラベルの列を予測し, このシーケンスを用いて応答を生成することにより, 直接的なエンドツーエンド生成方式よりも優れた結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:15:36 GMT)
Multiscale spatiotemporal heterogeneity analysis of bike-sharing system's self-loop phenomenon: Evidence from Shanghai [8.9] 本研究では,空間的自己回帰モデルと二重機械学習フレームワークを用いたマルチスケール解析を行う。
その結果,自転車シェアリングの自己ループ強度は道路規模で空間ラグ効果が顕著であることがわかった。
自転車シェアリングの連携を強化するため,地下鉄の利用率が高く,バスの運行率も低い地域での自転車利用率の向上を提唱する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:18:38 GMT)
Multimodal Crash Likelihood Prediction: A Complexity-Infused Approach Integrating Semantic, Contextual, and Driving Features [8.8] 本稿では,道路の複雑化機能と衝突予測機能を統合した2段階のフレームワークを提案する。
最初の段階では、エンコーダがこれらの特徴から隠れたコンテキスト情報を抽出し、複雑さを注入した特徴を生成する。
第2段階では、原型と複雑性に富んだ両方の特徴を用いて衝突確率を予測し、精度は87.98%に達した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 21:16:36 GMT)
MiceBoneChallenge: Micro-CT public dataset and six solutions for automatic growth plate detection in micro-CT mice bone scans [8.7] 高品質な3D mu$CT 骨スキャンデータセットを8,399ドルマウスから作成し,注釈を付した。
この挑戦は、世界中から80ドル以上のAI科学者を惹きつけ、23ドルのチームを結成した。
成長板面の位置を正確に識別できるコンピュータビジョンソリューションが6つ開発された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:37:47 GMT)
Fast and Robust Phase Retrieval via Deep Expectation-Consistent Approximation [8.7] 本稿では,EC近似とDeep Denoising Networkを組み合わせたDeepECprを提案する。
DeepECprは、最近の拡散法にインスパイアされた、新しい減衰スキームを含んでいる。
また,PSNRとSSIMの両面で改善がみられた。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:38:37 GMT)
P2DFlow: A Protein Ensemble Generative Model with SE(3) Flow Matching [8.6] P2DFlowはSE(3)フローマッチングに基づく生成モデルであり、タンパク質の構造的アンサンブルを予測する。
ATLASのMDデータセットでトレーニングと評価を行うと、P2DFlowは他のベースラインモデルよりも優れている。
タンパク質分子シミュレーションの潜在的プロキシ剤として、P2DFlowによって生成された高品質なアンサンブルは、様々なシナリオでタンパク質の機能を理解するのに大いに役立つ。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:10:12 GMT)
APT: Architectural Planning and Text-to-Blueprint Construction Using Large Language Models for Open-World Agents [8.5] 本稿では,自律型エージェントによるMinecraftの複雑な構造構築を可能にする,LLM(Large Language Model)駆動のフレームワークを提案する。
連鎖分解とマルチモーダル入力を用いることで、このフレームワークは詳細なアーキテクチャレイアウトと青写真を生成する。
本エージェントは, メモリとリフレクションモジュールの両方を組み込んで, 生涯学習, 適応的洗練, エラー訂正を容易にする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:31:28 GMT)
Accelerating Proximal Policy Optimization Learning Using Task Prediction for Solving Games with Delayed Rewards [8.5] オフラインポリシとオンラインPPOポリシを組み合わせたハイブリッドポリシアーキテクチャと,TWTL(Time Window Temporal Logic)を用いた報酬形成機構の2つを導入する。
我々は,逆振り子と月面着陸機環境に関する広範囲な実験を通じて,我々のアプローチの有効性を実証する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 20:22:31 GMT)
CoTAR: Chain-of-Thought Attribution Reasoning with Multi-level Granularity [8.4] 本稿では、属性の精度を高めるために、属性指向のチェーン・オブ・ソート推論手法を提案する。
GPT-4を用いた2つの文脈付き質問応答データセットの評価により,属性の精度と正確性が改善された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 21:43:01 GMT)
Disentangled Interpretable Representation for Efficient Long-term Time Series Forecasting [8.3] 業界 5.0 が時系列予測(LTSF)の新たな課題を導入
既存のディープラーニングと線形モデルは、しばしば過度の複雑さに悩まされ、直感的に解釈できない。
本稿では,Dentangled Interpretable である DiPE-Linear を提案する。
線形ネットワーク。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:33:09 GMT)
Fault Localization from the Semantic Code Search Perspective [8.3] 本稿では,障害局所化タスクをクエリ生成と障害検索の2つのステップに分解する障害ローカライザを提案する。
CosFLはTop-1で324のバグをローカライズすることに成功し、最先端のアプローチを26.6%-57.3%上回った。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:52:13 GMT)
Material synthesis through simulations guided by machine learning: a position paper [8.2] 石切り工程からのカルシウム豊富な残留物である大理石汚泥は、様々な材料を混ぜて再利用することができる。
大理石汚泥再利用のための最適混合設計分野における持続可能なデータ収集手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:53:44 GMT)
SatVision-TOA: A Geospatial Foundation Model for Coarse-Resolution All-Sky Remote Sensing Imagery [8.1] 本稿では,14バンドMODIS L1B Top-Of-Atmosphere (TOA) を用いた新しい基礎モデルであるSatVision-TOAを紹介する。
SatVision-TOA モデルは Masked-Image-Modeling (MIM) フレームワークと SwinV2 アーキテクチャを使って事前訓練されている。
その結果、SatVision-TOAは、下流タスクのベースラインメソッドよりも優れたパフォーマンスを実現することがわかった。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 00:08:00 GMT)
TabulaX: Leveraging Large Language Models for Multi-Class Table Transformations [8.1] 本稿では,多クラス変換にLarge Language Models(LLM)を利用する新しいフレームワークであるTabulaXを紹介する。
本研究では,TabulaXが既存の最先端手法よりも精度が高く,より広範な変換クラスをサポートし,効率的に適用可能な解釈可能な変換を生成することを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 05:00:23 GMT)
Mixed-state additivity properties of magic monotones based on quantum relative entropies for single-qubit states and beyond [8.0] 安定化器の忠実度は、任意の数の単一量子状態のテンソル積に対して乗法可能であることを証明する。
また、魔法の相対エントロピーは、全ての単一量子状態が安定化器オクタヘドロンの対称性軸に属する場合、加法的であることを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 05:35:42 GMT)
Different Bias Under Different Criteria: Assessing Bias in LLMs with a Fact-Based Approach [8.0] 大規模言語モデル(LLM)は、しばしば現実世界のバイアスを反映し、これらの効果を緩和する努力に繋がる。
事実に基づく基準と実世界統計を用いたバイアス評価のための新しい指標を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:32:43 GMT)
LampMark: Proactive Deepfake Detection via Training-Free Landmark Perceptual Watermarks [8.0] 本稿では,LampMarkを略して,新しい学習自由なランドマークとして紹介する。
まず、Deepfake操作の構造に敏感な特性を分析し、セキュアで機密性の高い変換パイプラインを考案する。
本稿では,保護対象画像に関する透かしを認識不能に埋め込み,抽出するエンド・ツー・エンドの透かしフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:24:56 GMT)
Engineering AI Judge Systems [7.9] FMwareのAI判断システム開発における産業経験に基づく課題について論じる。
これらの課題は、かなりの時間消費、コスト、不正確な判断につながる。
高品質なAI判断システムを開発する際の生産性向上を目的として,課題に対処する枠組みを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:43:32 GMT)
Automated Test Transfer Across Android Apps Using Large Language Models [7.9] 本稿では、LLM(Large Language Models)を活用して、モバイルアプリ間で使用量ベースのUIテストを効率的に転送する革新的な手法であるLLMigrateを紹介する。
LLMigrateは自動テスト転送で97.5%の成功率を達成でき、スクラッチからテストを書くのに必要な手作業が91.1%削減された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 23:06:09 GMT)
Perceptually Optimized Super Resolution [7.7] 超高解像度技術における視覚的品質と効率を制御するために,知覚にインスパイアされ,アーキテクチャに依存しない手法を提案する。
コアは知覚モデルであり、画像の詳細に対する人間の感度に応じて動的に超解像法を導く。
本稿では,ネットワーク分岐とネットワーク複雑性の低減を併用して提案手法の適用を実証し,可視品質損失を伴わない超解像法の計算効率の向上を図った。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:24:45 GMT)
From Goal-Conditioned to Language-Conditioned Agents via Vision-Language Models [7.7] 視覚言語モデル(VLM)は、基底言語に非常に大きな可能性を秘めている。
本稿では,言語条件付きエージェント(LCA)構築問題の新しい分解法を提案する。
また,VLMを用いたLCAの高速化と品質向上についても検討した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:15:53 GMT)
MRIFE: A Mask-Recovering and Interactive-Feature-Enhancing Semantic Segmentation Network For Relic Landslide Detection [7.7] 長い期間にわたって形成された遺物地すべりは、再活性化の可能性を秘めており、危険な地質現象となっている。
遺物地すべりの高解像度リモートセンシング画像は、物体の視界のぼかし問題など、多くの課題に直面している。
より効率的な特徴抽出と分離のためのセマンティックセグメンテーションモデルとして,マスクの回収と対話型フェールエンハンシング(MRIFE)を提案する。
提案したMRIFEは実地すべりデータセットを用いて評価され,実験結果から,地すべり検出の性能が大幅に向上することが示された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:15:50 GMT)
Unveiling the Secrets: How Masking Strategies Shape Time Series Imputation [7.7] 時系列計算はデータマイニングにおいて重要な課題であり、特に医療や環境モニタリングのような分野では、欠落したデータが分析結果を損なう可能性がある。
本研究では, 多様なマスキング戦略, 正規化タイミング, 欠落パターンが3つの多様なデータセットにおける11種類の最先端計算モデルの性能に及ぼす影響について検討した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:26:58 GMT)
Training a neural netwok for data reduction and better generalization [7.5] スパース学習者の動機は、優れた一般化に必要なものだけを選択することで入力(特徴)を圧縮することである。
人工的な特徴の選択により,無関係な特徴を無視する段階から,それらを取り出す段階へ,顕著な段階的変化を示す。
このアプローチは、高次元データを意味のある罰則のコンパクトで解釈可能な部分集合に解釈するために圧縮された特徴を検知する形態であると見なすことができる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:41:15 GMT)
$H^3$Fusion: Helpful, Harmless, Honest Fusion of Aligned LLMs [7.5] 命令ベースデータセットを用いた事前学習LLMのアライメントは、人間の好みを反映した微調整モデルを作成する上で重要である。
本稿では,3つの特徴を持つアライメント融合法(H3$Fusion)を考案した。
個々のモデルを11.37%$で上回り、最先端のLLMアンサンブルのアプローチに比べて13.77%$で強い堅牢性を提供する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:42:38 GMT)
Multimodal Alignment and Fusion: A Survey [7.3] マルチモーダル統合により、モデルの精度と適用性が改善される。
我々は既存のアライメントと融合の手法を体系的に分類し分析する。
この調査は、ソーシャルメディア分析、医療画像、感情認識といった分野の応用に焦点を当てている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:10:27 GMT)
Heterogeneous Graph-based Framework with Disentangled Representations Learning for Multi-target Cross Domain Recommendation [7.2] CDR(Cross-Domain Recommendation)は、レコメンデーションシステムにおけるデータ空間の問題に対する重要な解決策である。
本稿では,HGDR (Heterogeneous Graph-based Framework with Disentangled Representations Learning)を提案する。
実世界のデータセットとオンラインA/Bテストの実験により、提案モデルがドメイン間の情報を効果的に伝達できることが証明された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:28:24 GMT)
Conformalised Conditional Normalising Flows for Joint Prediction Regions in time series [7.2] Conformal Predictionは、機械学習モデルの不確実性を定量化する強力なフレームワークを提供する。
正規化フローのような確率的生成モデルに共形予測を適用することは簡単ではない。
本研究では,条件付き正規化フローを適合させる新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:19:13 GMT)
Direction-Oriented Visual-semantic Embedding Model for Remote Sensing Image-text Retrieval [7.1] 本稿では,視覚と言語の関係を考察するため,方向指向型ビジュアル・セマンティック・エンベディング・モデル(DOVE)を提案する。
我々の目指すのは、潜在空間における視覚的およびテキスト的表現を極力近く、冗長性のない地域視覚表現に向けることである。
我々は、単一の視覚的依存を減らすためにグローバルな視覚意味制約を利用し、最終的な視覚的およびテキスト的表現の外部制約として機能する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 01:49:33 GMT)
Spatio-Temporal Conformal Prediction for Power Outage Data [7.0] 本研究では,広範囲な四半期毎の停止データを解析し,グラフ整列予測法を開発した。
本手法の有効性を, 極度気象事象の影響を受けやすいいくつかの州で, 広範囲な数値実験により実証した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:34:38 GMT)
ThreatModeling-LLM: Automating Threat Modeling using Large Language Models for Banking System [7.0] ThreatModeling-LLMは、大規模言語モデルを使用した銀行システムの脅威モデリングを自動化するフレームワークである。
1)データセットの作成、2)プロンプトエンジニアリング、3)モデルファインチューニングの3段階で動作する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:57:28 GMT)
Neural refractive index field: Unlocking the Potential of Background-oriented Schlieren Tomography in Volumetric Flow Visualization [6.7] 本研究はニューラル屈折指数場(NeRIF)と呼ばれる革新的な再構成手法を提案する。
NeRIFはニューラルネットワークで流れの場を暗黙的に表現する。
乱流文泉火炎における数値シミュレーションと実験実験の両方により, 再現精度と空間分解能を大幅に向上させることができることが示唆された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:32:37 GMT)
SAM-MPA: Applying SAM to Few-shot Medical Image Segmentation using Mask Propagation and Auto-prompting [6.7] 医用画像のセグメンテーションは、しばしば高額なアノテーションコストの課題に直面している。
本稿では,10億枚以上のマスクで事前学習したセグメンション・アプライシング・モデル(SAM)を活用することを提案する。
SAM-MPA は,医療画像の断片化のためのイノベーティブな SAM ベースのフレームワークである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:12:12 GMT)
Puzzle Similarity: A Perceptually-guided No-Reference Metric for Artifact Detection in 3D Scene Reconstructions [6.7] 本稿では,新しい視点でアーティファクトをローカライズする手法であるPuzzle similarityを提案する。
提案手法は, 人的評価に関連し, 新たな視点での成果物のローカライズを成功させるだけでなく, 直接参照なしでも実現可能である。
我々は新しいメトリクスを活用して、画像の自動復元、ガイド付き取得、スパース入力からの3D再構成などの応用を強化することができる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:57:30 GMT)
Isotropy Matters: Soft-ZCA Whitening of Embeddings for Semantic Code Search [6.7] 埋め込み空間における低等方性は、意味推論を含むタスクのパフォーマンスを損なう。
様々なコード言語モデルを分析し,その埋め込み空間における等方性とその探索効率への影響について検討する。
埋め込みにおける等方性レベルを制御するための改良型ZCA白化手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:53:28 GMT)
Multimodal Outer Arithmetic Block Dual Fusion of Whole Slide Images and Omics Data for Precision Oncology [6.6] 本稿では,オミックデータを早期と後期の両方で統合する2重融合フレームワークを提案する。
初期の融合段階では、オミック埋め込みはパッチワイドの潜伏空間に投影され、オミック-WSI埋め込みを生成する。
後期核融合期には、スライドレベルのOmic-WSI埋め込みを融合することにより、オミックデータを再導入する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:25:53 GMT)
Attamba: Attending To Multi-Token States [6.6] Attambaは、状態空間モデルを用いてトークンの塊を圧縮する新しいアーキテクチャである。
変換器のキーと値のプロジェクションをSSMに置き換えることで、モデルの品質が向上し、フレキシブルなトークンチャンキングが可能になる。
アタンバは可変長のチャンク列に注意を向けることができ、二次スケーリングと線形スケーリングのスムーズな遷移を可能にする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:52:06 GMT)
MUSE-VL: Modeling Unified VLM through Semantic Discrete Encoding [6.5] マルチモーダル理解と生成のための離散言語を通して、統一視覚言語モデルセマンティックであるMUSE-VLを紹介する。
提案手法は,様々な視覚言語ベンチマークにおいて,従来の最先端モデルを大幅に上回り,専用の理解モデルよりも優れた性能を実現している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:33:52 GMT)
Linguistic Collapse: Neural Collapse in (Large) Language Models [6.5] スケール(および正規化)で発展する$mathcalNC$プロパティは一般化と関連している。
私たちの研究は、言語モデリングの斬新でより困難な設定にまで拡張されるにつれて、$mathcalNC$の一般性を強調しています。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:54:09 GMT)
Large enhancement of nonlinear optical response of graphene nanoribbon heterojunctions with multiple topological interface states [6.3] GNRヘテロ接合の非線形光学応答は,界面における位相状態の数が増えるにつれて顕著に向上することを示す。
GNRヘテロ接合におけるトポロジカルな界面状態の存在は、量子プラズモン周波数において重要な赤方偏移を引き起こす。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:03:35 GMT)
Bridging Weighted First Order Model Counting and Graph Polynomials [6.3] Weak Connectedness PolynomialsとStrong Connectedness Polynomialsを1次論理文に使用する。
既存の公理の全てを抽出可能であることが知られているWFOMCを解くのに使用できる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:00:54 GMT)
Task Progressive Curriculum Learning for Robust Visual Question Answering [6.2] トレーニング戦略をシンプルに拡張することで、堅牢なビジュアル質問回答が実現可能であることを初めて示します。
提案手法であるタスクプログレッシブ・カリキュラム・ラーニング(TPCL)では,主課題であるVQA問題をより小さく,より簡単なタスクに分解する。
標準データセットの包括的評価により,TPCLの有効性を示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:29:47 GMT)
Functionality understanding and segmentation in 3D scenes [6.2] Fun3DUは、3Dシーンで機能を理解するために設計された最初のアプローチである。
Fun3DUは言語モデルを使用して、Chain-of-Thought推論を通じてタスク記述を解析する。
我々はFun3DUをSceneFun3D上で評価する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:45:22 GMT)
Improving Resistance to Noisy Label Fitting by Reweighting Gradient in SAM [6.2] ノイズラベルは機械学習において重大な課題となり、しばしば過度に適合し、一般化が不十分になる。
SANER (Sharpness-Aware Noise-Explicit Reweighting) を提案する。
CIFAR-10, CIFAR-100, Mini-WebVision を用いた実験により, SANER は SAM を一貫して上回り, CIFAR-100 では 50% のラベルノイズで 8% の増加を達成できた。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 05:54:12 GMT)
TrackPGD: Efficient Adversarial Attack using Object Binary Masks against Robust Transformer Trackers [6.1] 敵対的摂動は、入力に小さな、知覚不能なノイズを加えることで、ニューラルネットワークを欺くことができる。
トランスフォーマーバックボーンを持つ最近のオブジェクトトラッカーは、データセットの追跡に強いパフォーマンスを示している。
トランストラッカーはブラックボックス攻撃に対して耐性があるが、既存のホワイトボックス攻撃はこれらの新しいトランストラッカーに対して普遍的に適用できない。
我々は、予測対象のバイナリマスクを用いて、ロバストなトランスフォーマートラッカーをターゲットとする、新しいホワイトボックス攻撃であるTrackPGDを紹介する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:17:46 GMT)
"Stupid robot, I want to speak to a human!" User Frustration Detection in Task-Oriented Dialog Systems [6.0] デプロイされたTODシステムにおけるユーザフラストレーションに着目し,ユーザフラストレーション検出のためのアウト・オブ・ザ・ボックスソリューションの実現可能性を評価する。
我々は,展開したキーワードベースのアプローチ,感情分析へのオープンソースアプローチ,ダイアログの分解検出方法,LLMベースの新たなインコンテキスト学習手法の性能を比較した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:51:48 GMT)
Fairness And Performance In Harmony: Data Debiasing Is All You Need [6.0] 本研究では,870のプロファイルを持つ実世界の大学入試データセットを用いて,公正さについて検討する。
個人的公正性については,さまざまな背景を持つ専門家とMLモデルによる意思決定の整合性を評価する。
その結果、MLモデルは人間を14.08%から18.79%上回った。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:31:10 GMT)
Refined and Segmented Price Sentiment Indices from Survey Comments [5.9] 我々は,内閣府が実施した経済監視者調査から価格に関するコメントを抽出する。
大規模言語モデル(LLM)を用いて価格トレンドを分類する。
我々は、一般的な目的だけでなく、より具体的な目的のために価格感指数を構築します。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:31:44 GMT)
Learning from Noisy Labels via Conditional Distributionally Robust Optimization [5.9] クラウドソーシングは、大規模なデータセットをラベル付けするための実用的なソリューションとして現れました。
これは、様々なレベルの専門知識を持つアノテータからのノイズの多いラベルによって、正確なモデルを学習する上で大きな課題となる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 05:03:26 GMT)
ALPI: Auto-Labeller with Proxy Injection for 3D Object Detection using 2D Labels Only [5.7] 3Dオブジェクト検出は、自動運転車、ロボット工学、拡張現実など、さまざまな応用において重要な役割を果たす。
画像から2次元境界ボックスアノテーションにのみ依存する弱教師付き3次元アノテータを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:54:44 GMT)
Synthetic Data Generation with LLM for Improved Depression Prediction [5.5] 本研究では, 抑うつ予測モデルの性能向上のために, 合成データを生成するための大規模言語モデルのためのパイプラインを提案する。
データの完全性とプライバシ保護の指標が満足できるだけでなく、トレーニングデータセットの重大度分布のバランスも取れた。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:31:14 GMT)
QMA vs. QCMA and Pseudorandomness [5.5] そのようなオラクルは、ある量子擬ランダム性予想が成立するときに存在することを示す。
私たちの結果は、"Win-win"シナリオの確立と見なすことができます。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:55:32 GMT)
Improving the Convergence Rates of Forward Gradient Descent with Repeated Sampling [5.4] 前向き勾配降下(FGD)は、生物学的により妥当な勾配降下の代替として提案されている。
本稿では、各トレーニングサンプルに基づいて、$ell$FGDステップを計算することにより、この亜最適係数が$d/(ell wedge d)$となることを示す。
また、繰り返しサンプリングしたFGDは入力分布の低次元構造に適応できることを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:28:16 GMT)
Can a Single Tree Outperform an Entire Forest? [5.4] 一般的な考え方は、単一の決定木は、テスト精度において古典的なランダムな森林を過小評価する。
本研究では,斜め回帰木の試験精度を大幅に向上させることで,このような考え方に挑戦する。
本手法は,木習熟を非制約最適化タスクとして再編成する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 00:18:18 GMT)
Can artificial intelligence predict clinical trial outcomes? [5.3] 本研究では,大言語モデル(LLM)の臨床試験結果の予測能力について検討した。
我々は、バランスの取れた精度、特異性、リコール、マシューズ相関係数(MCC)などの指標を用いてモデルの性能を比較する。
高い複雑さを特徴とする腫瘍学の試行は、全てのモデルで難しいままである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:05:27 GMT)
Large Language Model Supply Chain: A Research Agenda [5.2] 大規模言語モデル(LLM)は、自然言語処理とマルチモーダルコンテンツ生成において前例のない能力を導入し、人工知能に革命をもたらした。
本稿では,LLMサプライチェーンの総合的な研究課題を初めて提示し,重要な課題と機会を特定するための構造的アプローチを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:35:05 GMT)
Quantum-Classical Correspondence of Non-Hermitian Symmetry Breaking [5.2] 実-複素スペクトル遷移は非エルミート物理学の中心である。
我々の研究は非エルミート対称性の破れの物理的メカニズムを明らかにする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:57:39 GMT)
Polarization and Orbital Angular Momentum Encoded Quantum Toffoli Gate Enabled by Diffractive Neural Networks [5.2] 制御された量子ゲートは、量子ビット間の相互作用を促進することによって量子普遍演算を可能にする上で重要な役割を果たす。
単一光子の偏光と軌道角運動量を完全に活用した量子トフォリゲートの実験実験を行った。
我々は、216の異なる入力状態の量子状態トモグラフィーと量子プロセストモグラフィーによりゲートの性能を特徴付け、プロセス忠実度は94.05pm 0.02%$である。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:42:19 GMT)
Learning Explainable Treatment Policies with Clinician-Informed Representations: A Practical Approach [5.1] 我々は、RPM対応DHIに対する説明可能な治療方針を学習するためのパイプラインを開発する。
本研究の主な貢献は, 臨床領域における知識の発達と, 効果的な, 効果的, 解釈可能なターゲティングポリシーのための行動表現の重要性を明らかにすることである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:32:08 GMT)
Breast Tumor Classification Using EfficientNet Deep Learning Model [5.1] 我々は、集中的なデータ拡張パイプラインとコスト感受性学習を導入し、表現を改善し、モデルが多数派クラスを過度に好まないことを保証する。
以上の結果より,バイナリ分類性能が著しく向上し,良性症例に対する例外的リコールが向上した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 20:38:33 GMT)
Storing overlapping associative memories on latent manifolds in low-rank spiking networks [5.0] 我々はスパイクベースの計算の理解の進歩を踏まえ、連想記憶問題を再考する。
大規模全阻止ネットワークのスパイク活性は,低次元,凸,片方向線形多様体上に位置することを示す。
学習ルールをいくつか提案し, 記憶容量をニューロン数で線形に拡張し, パターン完備化能力を示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:48:25 GMT)
CoA: Chain-of-Action for Generative Semantic Labels [5.0] CoA(Chain-of-Action)メソッドは、画像の文脈的に関連する特徴に沿ったラベルを生成する。
CoAは、豊かで価値のある文脈情報が推論時の生成性能を改善するという観察に基づいて設計されている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:09:14 GMT)
Learning Instance-Specific Parameters of Black-Box Models Using Differentiable Surrogates [5.0] 本研究では,ブラックボックスの入力固有パラメータを学習する。
我々は、ブラックボックスの挙動を近似するために、微分可能な代理モデル(ニューラルネットワーク)を用いる。
次に、別のニューラルネットワークをエンドツーエンドで使用して、ブラックボックスの入力インスタンス固有のパラメータを学習する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:58:09 GMT)
Towards Universal Performance Modeling for Machine Learning Training on Multi-GPU Platforms [5.0] 我々は,コンピュータシステム上での機械学習(ML)ワークロードのトレーニングパフォーマンスを特徴付けるパイプラインを開発し,予測する。
私たちのパイプラインは、TransformerベースのNLPモデルなど、他のタイプのMLワークロードに一般化されています。
最速の埋め込みテーブルシャーディング構成を素早く選択するような洞察を生成することができる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:35:31 GMT)
Semantic Data Augmentation for Long-tailed Facial Expression Recognition [4.9] 本稿では,表情認識のための新しい意味拡張手法を提案する。
私たちのメソッドは、FERタスクだけでなく、より多様なデータハングリーシナリオでも使用できます。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:31:12 GMT)
Peer2PIR: Private Queries for IPFS [4.9] InterPlanetary File System (IPFS) は、分散ファイルシステムにデータを格納するためのピアツーピアネットワークであり、152か国に190,000以上のピアをホストしている。
私たちの研究は、分散システムへのPIRの統合に固有の、新たな課題を強調し、対処します。
我々は、新しいプライベートプロトコルを提示し、通信と計算のオーバーヘッドが著しく低いことを実証する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:45:00 GMT)
MAROON: A Framework for the Joint Characterization of Near-Field High-Resolution Radar and Optical Depth Imaging Techniques [4.8] 我々は、光学領域と電波領域の両方から深度イメージを特徴付けるというユニークな課題に挑戦する。
本研究では, 対象物, ジオメトリー, 物体間距離について, 深度測定の総合的な評価を行う。
すべてのオブジェクトの測定は、MAROONと呼ばれるマルチモーダルデータセットとして公開されます。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:44:57 GMT)
Multi-feature Reconstruction Network using Crossed-mask Restoration for Unsupervised Industrial Anomaly Detection [4.7] 産業生産における品質検査には, 教師なし異常検出が重要である。
本稿では,クロスマスク復元を用いた多機能再構成ネットワークMFRNetを提案する。
提案手法は,4つの公開データセットと1つの自作データセットにおいて,他の最先端のデータセットと高い競争力,あるいは大幅に上回っている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:51:07 GMT)
SoK: Decentralized AI (DeAI) [4.7] ブロックチェーンベースのDeAIソリューションのためのSoK(Systematization of Knowledge)を提案する。
モデルライフサイクルに基づいて既存のDeAIプロトコルを分類する分類法を提案する。
我々は、ブロックチェーン機能がAIプロセスのセキュリティ、透明性、信頼性の向上にどのように貢献するかを調査する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:28:25 GMT)
LLM-Based Offline Learning for Embodied Agents via Consistency-Guided Reward Ensemble [4.4] エージェント学習のための一貫性誘導型報酬アンサンブルフレームワーク(CoREN)を提案する。
このフレームワークは、トレーニングデータセットにおけるドメイン基底の報酬を導出するために、時間的に一貫した報酬の適応的なアンサンブルを使用する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:04:10 GMT)
Modified Recursive QAOA for Exact Max-Cut Solutions on Bipartite Graphs: Closing the Gap Beyond QAOA Limit [4.4] 量子近似最適化アルゴリズム(Quantum Approximate Optimization Algorithm, QAOA)は、MAX-CUT問題などの最適化問題を概ね解くことを目的として提案された量子古典ハイブリッドアルゴリズムである。
まず、二部グラフ上のMAX-CUT問題の解法におけるレベル1QAOAの性能限界を解析的に証明する。
第2に、再帰的QAOA(RQAOA)は、QAOAをサブルーチンとしてグラフサイズを削減し、レベル1のQAOAを上回る性能を示す。
最後に,制限パラメータを持つRQAOAが,これらの制約に完全に対処可能であることを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:35:19 GMT)
ScaleNet: Scale Invariance Learning in Directed Graphs [4.2] グラフニューラルネットワーク(GNN)を用いたノード分類では、実際には分類される中心ノードのエゴグラフである。
複数方向エッジの順序列である非方向のシングルエッジをスケールドエッジに置き換える「スケールドエゴグラフ」の概念を提案する。
スケール不変性に基づくグラフ学習は、よりシンプルで、より速く、より正確に、ランダムウォークから派生した開始モデルより優れている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:01:36 GMT)
SAMWISE: Infusing wisdom in SAM2 for Text-Driven Video Segmentation [4.2] 私たちは、堅牢なセグメンテーションとトラッキング機能を提供するSegment-Anything 2 (SAM2)モデルを構築します。
本稿では,特徴抽出プロセスにおいて,時間的情報やマルチモーダルな手がかりを注入する新しいアダプタモジュールを提案する。
提案手法であるSAMWISEは,4.2Mパラメータの無視可能なオーバーヘッドを追加することで,様々なベンチマークで最先端を実現する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:10:54 GMT)
SelfSplat: Pose-Free and 3D Prior-Free Generalizable 3D Gaussian Splatting [4.1] ポーズフリーで3次元の事前自由な一般化可能な3次元再構成を実現するための新しい3次元ガウススプラッティングモデルであるSelfSplatを提案する。
本モデルでは,これらの課題に対して,自己教師付き深度とポーズ推定手法を効果的に統合することによって対処する。
提案手法の性能を評価するため,RealEstate10K,ACID,DL3DVなどの大規模実世界のデータセットを用いて評価を行った。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:01:50 GMT)
Multi-Label Bayesian Active Learning with Inter-Label Relationships [3.9] 両課題に対処する多ラベルアクティブラーニング戦略を提案する。
本手法は, 漸進的に更新された正相関行列と負相関行列を組み込んで, 共起関係と解離関係を捉える。
私たちの戦略は、いくつかの確立された方法と比較して、信頼性と優れたパフォーマンスを継続的に達成します。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 23:28:54 GMT)
Recurrent Stochastic Configuration Networks with Hybrid Regularization for Nonlinear Dynamics Modelling [3.9] リカレント・コンフィグレーション・ネットワーク(RSCN)は不確実性のある非線形力学系をモデル化する大きな可能性を示している。
本稿では,ネットワークの学習能力と一般化性能を両立させるために,ハイブリッド正規化を備えたRCCNを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:06:39 GMT)
Noise Adaptor: Enhancing Low-Latency Spiking Neural Networks through Noise-Injected Low-Bit ANN Conversion [3.9] 雑音適応器は、競争力のある低遅延スパイクニューラルネットワーク(SNN)を構築するための新しい方法である
量子化ANNトレーニング中にノイズを注入することにより、ノイズアダプタはANNとSNNの動的差異をよりよく考慮する。
従来の手法とは異なり、ノイズアダプタはSNNにおける実行時ノイズ補正技術の適用を必要としない。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:39:52 GMT)
LongKey: Keyphrase Extraction for Long Documents [3.8] LongKeyは、長いドキュメントからキーフレーズを抽出する新しいフレームワークである。
LongKeyは、既存の教師なしおよび言語モデルに基づくキーフレーズ抽出方法よりも一貫して優れている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 20:26:47 GMT)
Cross-D Conv: Cross-Dimensional Transferable Knowledge Base via Fourier Shifting Operation [3.7] クロスD Conv 演算はフーリエ領域における位相シフトを学習することで次元ギャップを橋渡しする。
本手法は2次元と3次元の畳み込み操作間のシームレスな重み移動を可能にする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:41:29 GMT)
ScribbleLight: Single Image Indoor Relighting with Scribbles [3.7] 本稿では,スクリブルによる照明効果の局所的きめ細かい制御を支援する生成モデルであるScribbleLightを紹介する。
我々の重要な技術的新奇性はアルベド条件の安定な画像拡散モデルであり、リライティング後の原画像の本質的な色とテクスチャを保存します。
我々は、スパース・スクリブルアノテーションから異なる照明効果(例えば、ライトのオン/オフ、ハイライトの追加、キャストシャドウ、または間接的なライト)を作成するScribbleLightの能力を実証する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:59:11 GMT)
Emergenet: A Digital Twin of Sequence Evolution for Scalable Emergence Risk Assessment of Animal Influenza A Strains [3.7] この研究は、列の進化のデジタル双対を推定するツールであるEmergenetを導入し、新しい変種が野生でどのように出現するかを示す。
220,151個のヘマグルチニン(HA)配列のみを用いて構築したエマージェネッツに基づく予測は、WHOの季節ワクチンの勧告を一貫して上回っている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:50:18 GMT)
A Bilayer Segmentation-Recombination Network for Accurate Segmentation of Overlapping C. elegans [3.6] 線虫Caenorhabditis elegans(C. elegans)は、寿命が短く、ヒト遺伝子とのホモロジーも高いため、優れたモデル生物である。
1)C. elegansの活性軌道は制御不能であり、複数の線虫が重なり合い、C. elegansの境界が曖昧になる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:18:59 GMT)
Efficient Deployment of Transformer Models in Analog In-Memory Computing Hardware [3.4] 本稿では,AIMCハードウェア上に事前学習したトランスフォーマーモデルをデプロイするための新しい手法を提案する。
ハードウェアを意識したトレーニングを必要とする従来のアプローチとは異なり、当社の手法はオリジナルのモデルを再トレーニングすることなく、ダイレクトデプロイメントを可能にします。
提案手法は,複数のタスクにまたがって単一のアナログモデルを再利用できるため,マルチタスクシナリオにおいて特に魅力的である。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:20:18 GMT)
Breaking the Illusion: Real-world Challenges for Adversarial Patches in Object Detection [3.4] 敵対的攻撃は、機械学習システムの堅牢性と信頼性に重大な脅威をもたらす。
本研究では,物理世界におけるYOLOオブジェクト検出ネットワークにおける逆パッチの性能について検討した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:30:57 GMT)
Linguistic Laws Meet Protein Sequences: A Comparative Analysis of Subword Tokenization Methods [3.4] トークン化は、機械学習モデルのためのタンパク質配列を処理するための重要なステップである。
本研究は、Byte-Pairという3つの顕著なトークン化アプローチを評価する。
Piece、Word、SentencePieceは、さまざまな語彙サイズに対応している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:30:20 GMT)
From RNNs to Foundation Models: An Empirical Study on Commercial Building Energy Consumption [3.4] 商業ビルの短期エネルギー消費予測はスマートグリッドの運用に不可欠である。
スマートメーターとディープラーニングモデルは、複数の建物からの過去のデータを使用した予測を可能にするが、多様な建物からのデータの異質性は、モデルの性能を低下させる可能性がある。
我々は、米国の商業ビルのエネルギー消費データを提供するComStockデータセットを用いてこの問題に対処する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:55:52 GMT)
Optimal Estimation of Shared Singular Subspaces across Multiple Noisy Matrices [3.3] 本研究は,低ランク行列デノジングフレームワークにおいて,複数の行列にまたがる共有(左)特異部分空間を推定することに焦点を当てる。
信号行列の真の特異部分空間が同一である場合、Stack-SVDは最小の最大速度最適化を実現する。
部分的共有の様々なケースにおいて、Stack-SVDが有効であり続ける条件を厳格に特徴付け、最小限の最適性を達成したり、一貫した見積もりを達成できなかったりする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:49:30 GMT)
Scalable Spatiotemporal Prediction with Bayesian Neural Fields [3.3] BayesNFは、階層的ベイズ推定と高容量推定のためのディープニューラルネットワークアーキテクチャを統合し、堅牢な予測の不確実性を実現する。
BayesNFは、数万の計測値を含む気候および公衆衛生データから予測問題を改善する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 21:26:10 GMT)
Predict. Optimize. Revise. On Forecast and Policy Stability in Energy Management Systems [3.3] 本研究は,エネルギー管理システムにおける予測と最適化の統合という課題に対処する。
スイッチングコストを用いてオンライン最適化問題を解析し,決定論的および確率的予測によって実現するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:35:46 GMT)
DROID-Splat: Combining end-to-end SLAM with 3D Gaussian Splatting [3.3] 本稿では,エンドツーエンドトラッカーをベースとしたSLAMシステムを導入し,最近の3次元ガウス切削技術に基づくレンダラーで拡張する。
フレームワーク textbfDroidSplat は、共通のSLAMベンチマーク上での SotA のトラッキングとレンダリングの結果を達成する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:25:51 GMT)
Quantum Advantage via Efficient Post-processing on Qudit Shadow tomography [3.2] 計算量と記憶量の両方を削減できるquditシャドウトモグラフィーに基づく量子的アプローチを提案する。
(operatornametr(rho O)) は (textpoly(log d)) 計算で効率的に推定できる。
これらの進歩は、効率的な高次元データ解析とモデリングのための新しい道を開く。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:22:53 GMT)
MTS-UNMixers: Multivariate Time Series Forecasting via Channel-Time Dual Unmixing [3.2] 時系列予測(MTS-UNMixer)のためのチャネル時間二元混合ネットワークを提案する。
MTS-UNMixersは、全系列を時間次元とチャネル次元の両方にわたって臨界基底と係数に分解する。
MTS-UNMixers は,複数のベンチマークデータセットにおいて既存手法よりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:23:42 GMT)
Uncertainty quantification for White Matter Hyperintensity segmentation detects silent failures and improves automated Fazekas quantification [3.2] ホワイトマター・ハイパーインテンシティ(White Matter Hyperintensities、WMH)は、脳MRIに存在する小血管疾患の主要な神経放射線学的マーカーである。
WMHは, 形状, 位置, サイズ, 未定義境界, および他の病理と類似の強度プロファイルにより, セグメンテーションが困難である。
WMHの不確実性情報を組み込むことで,ファゼカス分類性能と校正性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:34:24 GMT)
Crack Detection in Infrastructure Using Transfer Learning, Spatial Attention, and Genetic Algorithm Optimization [3.2] 亀裂検出は、道路、橋、建物などのインフラの維持と安全性において重要な役割を担っている。
伝統的に手動検査が標準であったが、労働集約的で主観的で危険である。
本稿では, 深層学習, 移動学習, 空間的注意機構, 遺伝的アルゴリズム(GA)最適化を活用した, インフラのひび割れ検出のための高度な手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:12:56 GMT)
Imaginary part of timelike entanglement entropy [3.1] 場の理論の文脈では、ツイスト作用素のウィック回転を通して時間的な絡み合いのエントロピーを得るのがより適切である。
ある特別な場合において、時間的絡み合いエントロピーの虚部はツイスト作用素とその一階時間微分の可換性と関連している。
解析により、ストリップ幾何学において、時間的エンタングルメントエントロピーの虚部は、ツイスト作用素の可換子とその一階時間微分にのみ関係していることが示された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:48:13 GMT)
Dynamical suppression of many-body non-Hermitian skin effect in Anyonic systems [3.1] 非エルミート皮膚効果(英: non-Hermitian skin effect, NHSE)は、固有状態が系の境界に大きく局在する非平衡系において興味深い現象である。
本研究は,NHSEと異種統計学の相互作用から,新しい非エルミート現象を探求するための新たな道を開くものである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:09:23 GMT)
NexusSplats: Efficient 3D Gaussian Splatting in the Wild [3.1] そこで本研究では,NexusSplatsと呼ばれるネクサスカーネルによる3次元シーン再構築手法を提案する。
この結果から,NexusSplatsは最先端のレンダリング品質を実現すると同時に,現在の最高の品質に比べて,再構築時間を最大70.4%削減できることがわかった。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:49:45 GMT)
Network Inversion of Convolutional Neural Nets [3.0] ニューラルネットワークは、さまざまなアプリケーションにまたがる強力なツールとして登場したが、意思決定プロセスはしばしば不透明である。
ネットワークの反転技術は、これらのブラックボックスの中を覗くことができるソリューションを提供します。
本稿では,厳密な条件付きジェネレータを用いたネットワークインバージョンに対する簡易かつ効果的なアプローチを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:39:49 GMT)
NetQIR: An Extension of QIR for Distributed Quantum Computing [2.9] NetQIRは、MicrosoftのQuantum Intermediate Representation (QIR)の拡張である。
ネットワーク層とハードウェア層における抽象化の欠如に対応して開発された。
高レベルの量子アルゴリズム設計と低レベルのハードウェア実行のギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:57:14 GMT)
A Dequantized Algorithm for the Guided Local Hamiltonian Problem [2.9] 誘導局所ハミルトニアン問題(GLH)は量子コンピュータ上で効率よく解くことができ、BQP完全であることが証明されている。
これにより、GLH問題は古典計算と量子計算の基本的な分離を探求するための貴重なフレームワークとなる。
ランダム化量子想像時間進化量子アルゴリズムの量子化古典アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:33:20 GMT)
Achieving Privacy Utility Balance for Multivariate Time Series Data [2.9] データユーティリティとプライバシ保護の最適なバランスを実現するために最適化アルゴリズムを用いた多変量全パスフィルタリング手法を提案する。
提案手法の有効性を検証するため,米国国勢調査局のQWIデータセットから得られたシミュレーションデータと実データの両方にMAPフィルタリングを適用した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 01:59:38 GMT)
Adaptive Client Selection with Personalization for Communication Efficient Federated Learning [2.8] Federated Learning(FL)は、機械学習モデルを協調的にトレーニングするための分散アプローチである。
本稿では, FL環境下でのモデルのトレーニングにおいて, 全体的な通信コストと計算コストを削減できるACSP-FLについて紹介する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:20:59 GMT)
Dynamic data summarization for hierarchical spatial clustering [2.8] HDBSCANは密度と空間的近接性を考慮して空間データに有意義なパターンを見出す。
本稿では,HDBSCANのクラスタリング階層を点挿入や削除時に更新するアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:36:43 GMT)
KACDP: A Highly Interpretable Credit Default Prediction Model [2.8] 本稿では,KAN(Kolmogorov-Arnold Networks)に基づく手法を提案する。
Kansは学習可能なアクティベーション機能を持ち、線形重みを持たない新しいタイプのニューラルネットワークアーキテクチャである。
実験により、KACDPモデルは、パフォーマンス指標において、メインストリームの信用デフォルト予測モデルより優れていることが示された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:58:03 GMT)
Comparison of marker-less 2D image-based methods for infant pose estimation [2.8] 成人で訓練された最高パフォーマンスジェネリックモデルであるViTPoseも幼児で最高のパフォーマンスを発揮する。
トップダウンビューから得られるポーズ推定精度は、対角ビューから得られるポーズ推定精度よりも著しく優れている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:59:22 GMT)
Box for Mask and Mask for Box: weak losses for multi-task partially supervised learning [2.8] 1つのタスクの情報を使ってもう1つのタスクをトレーニングすることは、マルチタスクの部分的に教師付き学習にとって有益である。
Box-for-MaskとMask-for-Boxの戦略は、1つのタスクアノテーションから必要な情報を排除し、もう1つのタスクをトレーニングするために提案されている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:51:25 GMT)
A 3D deep learning classifier and its explainability when assessing coronary artery disease [2.7] 冠動脈疾患の早期発見と診断は、命を救い、医療費を削減できる。
現在のほとんどのアプローチはディープラーニング手法を利用しているが、中心線抽出と多平面再構成が必要である。
提案手法は,最先端モデルの分類精度を21.43%向上させる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:40:27 GMT)
BioNeRF: Biologically Plausible Neural Radiance Fields for View Synthesis [2.7] BioNeRFは3D表現でシーンをモデル化し、放射場を通して新しいビューを合成する生物学的にもっともらしいアーキテクチャである。
BioNeRFは、複数のソースからの入力をメモリのような構造に融合させる、認知にインスパイアされたメカニズムを実装している。
実験の結果,BioNeRFは人間の知覚を符号化する品質指標に関して,最先端の結果よりも優れていた。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 05:28:44 GMT)
Privacy Preserving Federated Unsupervised Domain Adaptation with Application to Age Prediction from DNA Methylation Data [2.7] 高次元設定における教師なしドメイン適応のためのプライバシ保護フレームワークを提案する。
我々のフレームワークは、フェデレートされた環境における高次元ドメイン適応のための最初のプライバシ保護ソリューションである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:19:16 GMT)
Towards Intention Recognition for Robotic Assistants Through Online POMDP Planning [2.7] 意図認識は、人間の日常的なタスクを支援する自動アシスタントの設計と開発において重要な役割を果たす。
本稿では,オンラインの意図認識のための部分的に観測可能なモデルについて述べるとともに,予備的な実験結果を示すとともに,この問題のファミリに存在する課題について論じる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:13:00 GMT)
AI-Driven Guided Response for Security Operation Centers with Microsoft Copilot for Security [2.7] Microsoft Copilot for Security Guided Response (CGR)は、セキュリティアナリストを3つの重要なタスクにガイドする。
CGRはMicrosoft Defender XDR製品に統合され、世界中でデプロイされ、数百万のレコメンデーションを生成する。
私たちは、100万件のインシデントにまたがる1300万のエビデンスにまたがる、現実世界のセキュリティインシデントに関する最大の公開コレクションであるGUIDEをリリースします。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:08:55 GMT)
Reliability of deep learning models for anatomical landmark detection: The role of inter-rater variability [2.6] 解剖学的ランドマーク検出のための深層学習モデルにおいて,様々なアノテーション融合戦略を考察した。
本研究は, レータ間変動, DLモデルの性能, 不確実性との重要な関連性を明らかにする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 20:07:16 GMT)
Exploring Behavior-Relevant and Disentangled Neural Dynamics with Generative Diffusion Models [2.6] 行動の神経基盤を理解することは神経科学の基本的な目標である。
私たちのアプローチは、BeNeDiff'と呼ばれるもので、まずきめ細やかな神経部分空間を識別します。
次に、最先端の生成拡散モデルを使用して、各潜伏因子の神経力学を解釈する行動ビデオを合成する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 05:26:42 GMT)
Enhancing Quantum Memories with Light-Matter Interference [2.6] 本稿では, 量子メモリプロトコルの拡張に新たなアプローチを導入, 実証する。
本手法は,セシウム蒸気中のラマン量子メモリを用いて実装し,全効率の3倍以上の改善を示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:13:21 GMT)
New Test-Time Scenario for Biosignal: Concept and Its Approach [2.6] オンラインテスト時間適応(OTTA)は、テスト中にラベルのないデータでトレーニング済みのモデルを更新することで、モデルの堅牢性を高める。
ラベル付けされていないサンプルと時折ラベル付けされたサンプルのストリームで新しいテストタイムシナリオを導入する。
このフレームワークは教師付き学習と自己教師型学習を組み合わせて,データ型のバランスをとるために,二重キューバッファと重み付きバッチサンプリングを利用する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:54:02 GMT)
EVINCE: Optimizing Adversarial LLM Dialogues via Conditional Statistics and Information Theory [2.5] 本稿では,条件付き統計と情報理論を用いたマルチLLM対話を最適化するフレームワークEVINCEを紹介する。
疾患診断からニュースデバイアスに至るまで,単一LLMよりも一貫した改善が見られた。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:30:41 GMT)
LC-SVD-DLinear: A low-cost physics-based hybrid machine learning model for data forecasting using sparse measurements [2.5] 本稿では, 特異値分解(SVD)と浅い線形ニューラルネットワークを統合して高分解能流体力学データの予測を行う手法を提案する。
本稿では,高階特異値分解アルゴリズムの低コストバージョンと高階データ用に設計されたDLinearネットワークを組み合わせたLC-HOSVD-DLinearを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:43:50 GMT)
Activity Sparsity Complements Weight Sparsity for Efficient RNN Inference [2.5] 本研究では、繰り返しニューラルネットワークモデルにおいて、活動空間がパラメータ空間と乗算的に構成可能であることを示す。
私たちはPenn Treebank言語モデリングタスクで60ドル以下の難易度を維持しながら、最大20ドルまで計算の削減を実現しています。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 23:41:27 GMT)
Effect of Adaptive Communication Support on Human-AI Collaboration [2.5] マルチモーダル言語フィードバック(HRT-ML)を用いたヒューマンロボットコラボレーションフレームワークを提案する。
HRT-MLフレームワークには、ハイレベルで低頻度な戦略ガイダンスのためのコーディネータと、タスク固有の高周波命令のためのマネージャの2つのコアモジュールが含まれている。
人間の能力に対してタスクの複雑さが増大するにつれて、人間のチームメイトは、頻繁で積極的な支援を提供するロボットエージェントに対してより強い嗜好を示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 00:06:47 GMT)
CAMLD: Contrast-Agnostic Medical Landmark Detection with Consistency-Based Regularization [2.4] 医学画像の解剖学的ランドマーク検出は、様々な臨床および研究用途に不可欠である。
既存のディープラーニング(DL)手法では、よく注釈付けされた大量のデータを必要とすることが多い。
非ラベルスキャンにおける解剖学的ランドマーク検出のための新しい自己教師型DLフレームワークであるCAMLDを紹介する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:56:29 GMT)
Enhancing generalization in high energy physics using white-box adversarial attacks [2.3] 教師付き学習は、標準モデルを超えて信号を識別する最も広く使われている方法の1つである。
本稿では,局所最小値のシャープさを低減し,教師付きモデルの一般化性を向上することを目的とする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:27:23 GMT)
AI-Augmented Ethical Hacking: A Practical Examination of Manual Exploitation and Privilege Escalation in Linux Environments [2.3] 本研究は,Linux ベースの浸透試験環境における手動操作および特権エスカレーションタスクにおける生成AI(GenAI)の適用について検討する。
以上の結果から,GenAIは攻撃ベクトルの特定や,特権エスカレーション時の機密データに対する複雑な出力解析など,プロセスの合理化が可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:55:15 GMT)
IMPROVE: Improving Medical Plausibility without Reliance on HumanValidation -- An Enhanced Prototype-Guided Diffusion Framework [2.3] 本稿では,人間のフィードバックを必要とせず,画像の医療的有用性を向上するための新しいアプローチを提案する。
骨マーロウとHAM10000データセットの実験を行い、人間のフィードバックなしに医療精度を大幅に向上させることができることを示した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:51:15 GMT)
BadScan: An Architectural Backdoor Attack on Visual State Space Models [2.2] 最近導入されたVisual State Space Model (VMamba) は視覚変換器 (ViT) と比較して非常に優れた性能を示している。
一般的なアプローチの1つは、トレーニングデータにトリガーを組み込んでモデルを再トレーニングすることで、データサンプルをターゲットクラスに誤分類する。
我々は、VMambaモデルを欺くように設計されたBadScanと呼ばれる新しいアーキテクチャバックドアアタックを導入する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:13:09 GMT)
Structure-Guided MR-to-CT Synthesis with Spatial and Semantic Alignments for Attenuation Correction of Whole-Body PET/MR Imaging [2.2] 深層学習に基づくMR-to-CT合成は、組織の電子密度を推定し、全身PET/MRイメージングにおけるPET減衰補正を容易にする。
本稿では,これらの課題に対処する3つの新しいモジュールからなるMR-to-CT合成フレームワークを提案する。
提案した全身MR-to-CTフレームワークが視覚的に可視かつ意味的にリアルなCT画像を生成することを実証するための広範な実験を行い、PET減衰補正におけるその有用性を検証する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:57:07 GMT)
LOLA: LLM-Assisted Online Learning Algorithm for Content Experiments [2.2] 現代のメディア企業は、ユーザーにとって最も魅力的で魅力的なコンテンツを特定するために、自動化され効率的な方法を必要としている。
本稿ではまず,3つの純LLM手法を用いて,最もキャッチラインを識別する能力について検討する。
LLM-Assisted Online Learning Algorithm (LOLA) は,Large Language Models (LLM) と適応実験を統合し,コンテンツ配信を最適化する新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:51:57 GMT)
A Combined Feature Embedding Tools for Multi-Class Software Defect and Identification [2.2] 本稿では,GraphCodeBERTとGraph Convolutional Networkを組み合わせた実験手法であるCodeGraphNetを提案する。
この方法は、機能間の複雑な関係船をキャプチャし、脆弱性のより正確な識別と分離を可能にする。
決定木とニューラルネットワークのハイブリッドであるDeepTreeモデルは、最先端のアプローチよりも優れています。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:33:02 GMT)
Autoencoder Enhanced Realised GARCH on Volatility Forecasting [2.2] この論文は、様々な実現されたボラティリティ指標がボラティリティ予測に与える影響を合成することを目的としている。
本稿では,自動エンコーダ生成合成実現尺度を組み込んだRealized GARCHモデルの拡張を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:05:44 GMT)
vesselFM: A Foundation Model for Universal 3D Blood Vessel Segmentation [2.2] 本稿では3次元血管セグメンテーションの幅広い課題に特化して設計された基盤モデルである vesselFM を提案する。
以前のモデルとは異なり、 vesselFM は見当たらない領域に懸命に一般化することができる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:44:42 GMT)
IG-CFAT: An Improved GAN-Based Framework for Effectively Exploiting Transformers in Real-World Image Super-Resolution [2.2] 近年, 複合核融合注意変換器 (CFAT) は, 従来のSOTAモデルよりも高画質である。
本稿では,実世界の画像超解像における変換器の性能を効果的に活用するために,CFATモデルを取り入れた新しいGANベースのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:31:53 GMT)
Leveraging Large Language Models and Topic Modeling for Toxicity Classification [2.2] コンテンツモデレーションのためのトピック・モデリング手法を用いて,アノテータの位置がデータセットに与える影響について検討した。
その結果,特定のトピックについてモデルを微調整すると,モデルのF1スコアが顕著に向上することが示唆された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 20:47:24 GMT)
AI2T: Building Trustable AI Tutors by Interactively Teaching a Self-Aware Learning Agent [2.1] 著者は、ステップバイステップのソリューションを提供し、AI2T独自の問題解決の試みをグレードすることで、AI2Tを指導する。
わずか20~30分間のインタラクティブトレーニングから、AI2Tはステップバイステップのソリューショントラッキングのための堅牢なルールを導き出すことができる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 22:39:11 GMT)
What AI evaluations for preventing catastrophic risks can and cannot do [2.1] 評価は、現在のパラダイムでは克服できない基本的な制限に直面している、と我々は主張する。
これは、評価が価値のあるツールである一方で、AIシステムが安全であることを保証する主要な方法として、評価に頼るべきではないことを意味します。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:00:36 GMT)
DGNN-YOLO: Dynamic Graph Neural Networks with YOLO11 for Small Object Detection and Tracking in Traffic Surveillance [2.1] 本稿では,動的グラフニューラルネットワーク(DGNN)をYOLO11と統合した新しいフレームワークであるDGNN-YOLOについて紹介する。
グラフ構造の構築と更新により、DGNN-YOLOはオブジェクトをノードとして、そのインタラクションをエッジとして効果的に表現し、複雑でダイナミックな環境で適応的で正確なトラッキングを保証する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:29:27 GMT)
Stochastic Neural Network Symmetrisation in Markov Categories [2.1] 我々は、群準同型に沿ってニューラルネットワークをシンメトリする問題を考察する。
これをマルコフ圏の項で定式化する。
シンメトリションのためのフレキシブルで構成的な枠組みを得る。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 21:24:08 GMT)
Can LLMs plan paths in the real world? [2.0] 実世界の6つのパスプランニングシナリオを通じて,3つの大規模言語モデル(LLM)を検証した。
実験の結果,全てのLSMが複数の誤りを犯し,信頼できないパスプランナであることが判明した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 22:06:39 GMT)
Is Attention All You Need For Actigraphy? Foundation Models of Wearable Accelerometer Data for Mental Health Research [2.0] アクチノグラフィーに特化して設計された,事前訓練と完全注意に基づくモデルを開発した。
NHANES患者29,307名を対象に, PATをプレトレーニングした。
パラメータが200万未満で、モデル説明機能が組み込まれているため、PATは堅牢で、健康研究環境でのデプロイが容易である。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:11:42 GMT)
Revisiting Point Cloud Completion: Are We Ready For The Real-World? [2.0] 現在のベンチマークでは、現実的な環境で捉えた点雲の重要な構成要素である、リッチなトポロジ的特徴が欠如していることが示されている。
私たちは、ポイントクラウド補完のための最初の実世界の産業用ポイントクラウドデータセットであるRealPCにコントリビュートしています。
3次元骨格の形で完全な形状のグローバルな位相を抽出する0次元$mathcalPH$predsは、トポロジ的に一貫性のある完全形状を生成するモデルを支援することができることを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:46:47 GMT)
Multipartite Greenberger-Horne-Zeilinger Entanglement in Monitored Random Clifford Circuits [1.9] 定常相転移, 臨界特性, 絡み合いダイナミクスに関する一連の新しい結果が得られた。
textGHZ_3$エンタングルメントについて、有限個のエンタングルメントを持つ位相とそのようなエンタングルメントを持たない位相の間の測定誘起遷移を同定する。
マルチパーティの$textGHZ_ngeq 4$エンタングルメントの場合、それらは測定誘起臨界度にのみ現れる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:18:52 GMT)
From Stars to Insights: Exploration and Implementation of Unified Sentiment Analysis with Distant Supervision [1.9] 本稿では,ACD,ACSA,RPをコヒーレントなフレームワークに統合する新しい学習パラダイムであるUni-SAを紹介する。
本稿では, 単語, アスペクト, 文書レベルでの感情を捉えるためにピラミッド構造を用いたDSPN(Distantly Supervised Pyramid Network)を提案する。
本研究はDSPNの有効性と効率を検証し,感情分析のための堅牢で資源効率の高い統一的な枠組みを構築した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:40:56 GMT)
SoftmAP: Software-Hardware Co-design for Integer-Only Softmax on Associative Processors [1.9] ソフトマックスやレイヤーノルムのような非線形作用素は、量子化に対する感度のためにボトルネックのままである。
In-Memory Compute (IMC) ハードウェアを用いた整数のみの低精度Softmaxを実装したソフトウェアハードウェアの共同設計手法であるSoftmAPを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 20:00:54 GMT)
Mitigating the Impact of Noisy Edges on Graph-Based Algorithms via Adversarial Robustness Evaluation [1.9] 本稿では, スペクトル対角法を用いて, ノイズエッジがグラフベースアルゴリズムの性能に与える影響を緩和する手法を提案する。
提案手法は,ノイズの多いエッジに対して脆弱でない点を識別し,これらの頑健な点のみを利用してグラフベースのアルゴリズムを実行する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:55:03 GMT)
Evaluating the Impact of Underwater Image Enhancement on Object Detection Performance: A Comprehensive Study [1.8] 本研究の目的は、最先端の画像強調モデルの評価、水中物体検出への影響調査、検出性能向上の可能性を探ることである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:45:54 GMT)
Passive Deepfake Detection Across Multi-modalities: A Comprehensive Survey [1.8] ディープフェイク(DF)は、個人の偽装、誤情報拡散、アーティストのスタイルの模倣など、悪意ある目的に利用されてきた。
この調査では、画像、ビデオ、オーディオ、マルチモーダルドメインなど、複数のモダリティにまたがる受動的アプローチについて調査する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 22:04:49 GMT)
Basic Research, Lethal Effects: Military AI Research Funding as Enlistment [1.8] 我々は、2007年から2023年までのDoD助成金のコーパスから、人工知能(AI)分野の研究者に宛てたものに焦点を当てた。
我々は、基礎研究と応用研究の区別を批判的に検証し、基礎研究として資金調達の枠組みがどうあるべきかを示した。
我々は、助成金は、研究開発機関と学術AI研究コミュニティの相互参加のための手段として機能し、研究アジェンダを設定していると論じている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:29:27 GMT)
cWDM: Conditional Wavelet Diffusion Models for Cross-Modality 3D Medical Image Synthesis [1.8] 本稿では「BraTS 2024脳MR画像合成チャレンジ」に貢献する。
高分解能ボリュームの対画像変換タスクを解くための条件付きウェーブレット拡散モデルを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:17:57 GMT)
Real-Time Multimodal Signal Processing for HRI in RoboCup: Understanding a Human Referee [1.7] 本研究では、キーポイント抽出と分類によるジェスチャー認識のための2段階パイプラインと、効率的なwhi検出のための連続畳み込みニューラルネットワーク(CCNN)を実装した。
提案されたアプローチは、RoboCupのような競合する環境でのリアルタイムな人間とロボットのインタラクションを強化し、人間と協力できる自律システムの開発を前進させるためのツールを提供する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:39:43 GMT)
Pre-Release Experimentation in Indie Game Development: An Interview Survey [1.7] 継続的実験(CE)にはユーザデータが必要です。
この課題は、限られた資源を持つ独立した(インディー)ゲーム会社にとってさらに悪化している。
本研究は,インディーゲーム開発の初期段階において,限られたユーザデータを用いた実験を行う上での課題と実践について概説した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:47:21 GMT)
Software Fault Localization Based on Multi-objective Feature Fusion and Deep Learning [1.7] ソフトウェアのフォールトローカライゼーションは、機能の多様性が制限され、従来の手法の精度が低いため、依然として困難である。
本稿では,多目的最適化を深層学習モデルに統合し,フォールトローカライゼーション(FL)の精度と効率を両立させる手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:37:32 GMT)
A Framework for the Security and Privacy of Biometric System Constructions under Defined Computational Assumptions [1.5] 本稿では,安全な生体認証システムを構築するための公式な枠組みを提案する。
普遍的な構成可能性の原理を活用することで、個々のシステムコンポーネントのモジュラー解析と検証を可能にします。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:10:11 GMT)
Implementing transferable annealing protocols for combinatorial optimisation on neutral atom quantum processors: a case study on smart-charging of electric vehicles [1.5] 本稿では,類似した局所構造を持つ問題インスタンス間のパラメータ転送可能性の有望性に基づいて構築する。
本研究は,共有ジオメトリを持つグラフ族上の最大独立集合問題に対して,最適パラメータが自然に集中していることを明らかにする。
本手法を用いて,実データセット上でのスマートチャージ最適化問題に対処する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:14:24 GMT)
A Generalized Unified Skew-Normal Process with Neural Bayes Inference [1.5] 近年、統計学者は非対称性や重尾のような非ガウス的な振る舞いを示す空間データに遭遇している。
ガウスモデルの限界に対処するため、様々な歪んだモデルが提案され、その人気は急速に高まっている。
文学における様々な提案の中で、統一スキュー・ノルマル(SUN)のような統一スキュー分布が注目されている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:00:39 GMT)
Asymmetric Quantum Harmonic Otto Engine Under Hot Squeezed Thermal Reservoir [1.5] 熱圧縮熱貯留層下での量子調和オットーエンジンの非対称性について検討した。
第1構成では、膨張ストロークの駆動プロトコルが自然界において突然スイッチされ、圧縮ストロークが断熱的に駆動される。
急激な圧縮ストロークに接近する間だけ, 急激な膨張の場合の達成可能な最大効率は1/2であることが判明した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:43:48 GMT)
Enhancing Robustness in Deep Reinforcement Learning: A Lyapunov Exponent Approach [1.5] 本稿では,決定論的連続制御タスクにおいて,深部RLポリシーの単一状態への摂動について検討する。
システム状態に対する小さな摂動がその後の状態と報酬軌道に大きな影響を与えるため、RLポリシーは決定論的にカオスとなる可能性がある。
本稿では,最大リアプノフ指数正規化を実装したDreamer V3アーキテクチャの改良を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:10:08 GMT)
A Behavior Tree-inspired programming language for autonomous agents [1.5] 本稿では,行動木(BT)のアイデアとモチベーションから構築した自律エージェントのための関数型プログラミング言語の設計を提案する。
BTはロボット工学とAIにおけるエージェントの振る舞いを設計するための一般的なモデルである。
我々はBTにインスパイアされた言語の完全な仕様を示し、関数型プログラミング言語Haskellの実装を提供します。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 22:47:06 GMT)
An Attempt to Develop a Neural Parser based on Simplified Head-Driven Phrase Structure Grammar on Vietnamese [1.5] 既存のベトナムのコーパスは、簡易な頭駆動句構造文法規則に従わなかった。
我々は、ベトナムのテキストをエンコードできるPhoBERTまたはXLM-Roaモデルに置き換えることで、最初のPenn Treebankを修正した。
以上の結果から,HPSG Neural corpora の簡易化は,選挙区解析において82%のFスコアを達成できた。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:46:32 GMT)
First result for testing semiclassical gravity effect with a torsion balance [1.5] Schr"odinger-Newton方程式は、低周波力学系において重力が測定可能な偏差を引き起こすことを予測している。
この研究は、量子力学と重力の間の相互作用を探索する精密光学の可能性を実証している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:01:42 GMT)
Photonic Spin Hall Effect in a Four-Level Coherent Control Scheme within Cavity QED [1.5] 空洞量子力学(QED)における4レベルクローズドコヒーレント制御方式を用いたフォトニックスピンホール効果(PSHE)の操作に関する研究
Lambda$-type システムは、CTL システムと同様の PSHE を示し、吸収のゼロと分散による PSHE の強化を示す。
制御磁場強度と原子密度はPSHEには影響しない。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:31:43 GMT)
Realization of High-Fidelity CZ Gate based on a Double-Transmon Coupler [1.4] Double-transmon coupler (DTC) は、抑制された残差相互作用と高速な高忠実な2ビットゲートの両方を同時に実現することを目的としている。
我々は、強化学習に基づく最先端の加工技術とモデルフリーパルス最適化プロセスを利用する。
DTC方式の性能は、超伝導量子プロセッサの競争力のあるビルディングブロックとしての可能性を示している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:59:58 GMT)
in-Car Biometrics (iCarB) Datasets for Driver Recognition: Face, Fingerprint, and Voice [1.4] 生体計測データ(iCarB-Face、iCarB-Fingerprint、iCarB-Voice)には、顔ビデオ、指紋画像、音声サンプルを含む。
データは赤外線カメラ2台、指紋スキャナー2台、マイク2台で取得され、ボランティアは運転席に座っていた。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:52:15 GMT)
FORS-EMG: A Novel sEMG Dataset for Hand Gesture Recognition Across Multiple Forearm Orientations [1.4] 表面筋電図(sEMG)信号はジェスチャー認識と頑健な義手発達に重要な可能性を秘めている。
本研究は、3つの異なる方向をまたいだ手の動きを評価するための新しいMFI sEMGデータセットを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:49:08 GMT)
A Novel Word Pair-based Gaussian Sentence Similarity Algorithm For Bengali Extractive Text Summarization [1.4] 本稿では,2つの文間の意味的関係を計算するために,ワードペアベースのガウス文類似性(WGSS)アルゴリズムを提案する。
単語平均化法で直面する文表現問題を補正する単語対単語ベースで2つの文を比較する。
提案手法は, 4つの異なるデータセットを用いて検証し, ROUGEの平均値に対して43.2%向上した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:42:16 GMT)
End-to-end QKD network with non-localized trust [1.4] エンド・ツー・エンドのセキュリティサービスへの道のりにある石の1つは、このプロトコルを使用することで取り除かれる可能性がある。
提案提案では, ツインフィールドQKDと古典的ポストプロセッシングと通信を併用し, Alice と Bob が秘密鍵を共有できるようにする。
AliceとBobの中間ノードの連立関係は、新しいスキームを破るために必要であり、セキュリティの観点から信頼性の高いノードアプローチを著しく上回っている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:08:31 GMT)
Enhancing Person Re-Identification via Uncertainty Feature Fusion and Auto-weighted Measure Combination [1.3] 人物再識別(Re-ID)は、監視システムにおいて、異なるカメラビューで同一人物を特定することを含む、困難なタスクである。
本稿では,不確定特徴融合法(UFFM)と自動重み付け器(AMC)によるReIDモデルの能力を向上する新しい手法を提案する。
本手法は,人物の再識別データセットで評価した場合のランク@1精度と平均精度(mAP)を大幅に改善する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:09:15 GMT)
Data-driven development of cycle prediction models for lithium metal batteries using multi modal mining [1.3] ABC(Automatic Battery Data Collector)を用いた新しいマルチモーダルデータ駆動方式を提案する。
このプラットフォームは、現在最先端のバッテリ材料データとサイクリング性能メトリクスの正確な抽出を可能にする。
ABCプラットフォームによるデータベースから,リチウム金属電池の容量と安定性を正確に予測できる機械学習モデルを開発した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:37:12 GMT)
Rapid Deployment of Domain-specific Hyperspectral Image Processors with Application to Autonomous Driving [1.3] この記事は、低レイテンシでオンボードの画像セマンティックセマンティックセグメンテーションのための複数層完全畳み込みネットワーク(FCN)の編成と展開の課題に対処する。
このSOMは、オートマチック・ドライブ・システム(ADS)の展開に適したローエンドだがはるかに安価なMPSoCを備えている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:04:20 GMT)
HSI-Drive v2.0: More Data for New Challenges in Scene Understanding for Autonomous Driving [1.3] ハイパースペクトルイメージング(HSI)を用いた自動走行システム(ADS)の開発を目的としたHSI-Driveデータセットの更新版を提案する。
v2.0バージョンには、冬と秋に実際の運転シナリオで録画されたビデオの新しい注釈付き画像が含まれている。
新しいv2.0データセットでトレーニングされたモデルの強化性能を示すとともに,v1.1データセットで得られた結果に対して達成された改善点を示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:45:59 GMT)
A robust image encryption scheme based on new 4-D hyperchaotic system and elliptic curve [1.2] 画像暗号化のための新しい4次元ハイパーカオスシステムを提案し,その有効性を実証した。
提案システムは, 2つの非線形性を持つ8項からなるため, 単純と考えられる。
混乱と拡散を伴う2段階の暗号化プロセスは、デジタル画像の機密性を保護するために使用される。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:08:39 GMT)
Non-Bloch band theory for non-Hermitian continuum systems [1.2] 連続体系の格子モデルへの適切な離散化は、後者のホッピング範囲と前者の境界条件の数とを一致させる必要があることを示す。
我々の理論は、非エルミート連続体系におけるリッチな非ブロッホ物理学を調査するための有用な道具箱として機能する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:46:56 GMT)
HOPE: Homomorphic Order-Preserving Encryption for Outsourced Databases -- A Stateless Approach [1.2] Homomorphic OPE(Homomorphic OPE)は、クライアント側のストレージを排除し、クエリ実行中に追加のクライアントサーバ間のインタラクションを回避する新しいOPEスキームである。
我々は、広く受け入れられているIND-OCPAモデルの下で、HOPEの正式な暗号解析を行い、その安全性を証明した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 00:38:46 GMT)
Robustness of tripartite entangled states in passive ${\cal P}{\cal T}$-symmetric qubits [1.1] 非エルミート量子ビットにおける例外点(EP)によって引き起こされる三部体の絡み合いのロバスト性について検討する。
以上の結果から,全結合を持つ非エルミート量子ビットはGHZ状態を生成する一方,近傍相互作用を持つビットはW状態を生成することが明らかとなった。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:22:44 GMT)
Divergence Inequalities with Applications in Ergodic Theory [1.0] 2次微分可能な$f$-divergencesに対する$chi2$-divergencesという観点から、ピンスカーの不等式と一般境界の簡単な方法を確立する。
多くの$f$-divergencesに対して、時間同質マルコフ連鎖の収縮率は、$chi2$-divergenceの入力依存収縮係数によって特徴づけられる。
これらの結果は、効率的な計算の保証がないにもかかわらず、量子情報理論におけるPetz $f$-divergencesに拡張する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:06:20 GMT)
DeepMDV: Learning Global Matching for Multi-depot Vehicle Routing Problems [1.0] 近年、企業はより多くの補給所を追加する戦略を採用してきた。
複数の補給所の存在は、既存のVRPソリューションを最適にするために、さらなる複雑さをもたらす。
従来のMDVRPの解法は時間を要することが多く、大規模なインスタンスには適さない。
本稿では,2つの鍵層を持つデコーダを特徴とするアテンション機構を用いたMDVRPの新しい解を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:41:01 GMT)
A generalised novel loss function for computational fluid dynamics [1.0] 新たな損失関数をGMSE(Gradient Mean Squared Error)と呼ぶ
フィールドごとに重要領域を自動的に動的に識別し、局所的な分散に応じて適切な重みを割り当てる。
この損失関数により,計算流体力学における機械学習の高速化が期待できる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:57:31 GMT)
Experimental entanglement swapping through single-photon $χ^{(2)}$ nonlinearity [0.8] 我々は、$chi(2)$-nonlinear光導波路において、単一光子間の総周波発生(SFG)を用いた第1の絡み合わせスワップを実証する。
その結果, 交換状態の忠実度は0.770(76)以下であることが確認された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:44:50 GMT)
Evolving Markov Chains: Unsupervised Mode Discovery and Recognition from Data Streams [0.7] 本研究では、進化的マルコフ連鎖(EMC)を構築するためのオンラインかつ効率的な方法を提案する。
EMCは、遷移確率を適応的に追跡し、モードを自動的に検出し、オンライン方式でモードスイッチを検出する。
本研究は,脳波計測によるヒトの行動認識,運動状態のモニタリング,眼状態の認識における人工的データおよび実世界の応用について評価し,アプローチの汎用性を示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:42:21 GMT)
GARL: Genetic Algorithm-Augmented Reinforcement Learning to Detect Violations in Marker-Based Autonomous Landing Systems [0.7] 従来のオフラインテスト手法では、人間や動物のような動的なオブジェクトによる違反事例を見逃します。
オンラインテストの方法は、限られた予算で実行できない広範囲なトレーニング時間を必要とする。
本稿では遺伝的アルゴリズム(GA)と強化学習(RL)を組み合わせたフレームワークであるGARLを紹介する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:08:26 GMT)
What Differentiates Educational Literature? A Multimodal Fusion Approach of Transformers and Computational Linguistics [0.7] 英語カリキュラムへの新しい文学の統合は、様々な教室のニーズに対して、読みやすさとテキストの適応を迅速に評価するスケーラブルなツールがしばしば欠如しているため、依然として課題である。
本研究は,変圧器を用いたテキスト分類と言語的特徴分析を組み合わせたマルチモーダル手法により,このギャップに対処することを提案する。
提案手法は、ステークホルダーが対象とするWebアプリケーションにカプセル化され、非技術ステークホルダーが、テキストの複雑さ、読みやすさ、カリキュラムのアライメント、学習年齢範囲に関するリアルタイムな洞察にアクセスできるようにする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:01:27 GMT)
An Improved Quantum Algorithm of the Multislice Method [0.7] マルチサイス法は透過電子顕微鏡における電子回折と画像シミュレーションのための重要なアルゴリズムである。
本研究では,改良された量子アルゴリズムを開発した。
マルチ制御量子ゲートを用いずに位相シフト量子回路を再構成し,計算効率を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:47:51 GMT)
Assessing Vulnerability in Smart Contracts: The Role of Code Complexity Metrics in Security Analysis [0.7] 本研究は,Solidityスマートコントラクトにおける脆弱性のあるコードの指標として,コード複雑性メトリクスを使用することを検討する。
21の複雑性メトリクスを分析して、それらの相互関係、脆弱性との関連性、識別力、および脆弱性と中立なコードの平均値を検討した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:36:32 GMT)
Optimizing Brain Tumor Segmentation with MedNeXt: BraTS 2024 SSA and Pediatrics [0.7] 本研究は,MedNeXtを用いたBraTS-2024 SSAおよび小児腫瘍のセグメンテーション法について述べる。
提案手法は,BraTS-2024 SSAデータセットでは平均Dice similarity Coefficient(DSC)が0.896,BraTS小児腫瘍データセットでは平均DSCが0.830であった。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:24:19 GMT)
Towards safe Bayesian optimization with Wiener kernel regression [0.7] 本稿では、最近提案されたWienerカーネル回帰に基づいて、新しいエラー境界を提案する。
比較的穏やかな仮定の下では、提案された誤差境界は、文献に記録された境界よりも厳密であることを示す。
提案手法の有効性を示す数値的な例を挙げる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:57:54 GMT)
TDAvec: Computing Vector Summaries of Persistence Diagrams for Topological Data Analysis in R and Python [0.6] 我々は永続化ダイアグラム(PD)のベクトル化を効率化する新しいソフトウェアパッケージを導入する。
PDの空間の非ヒルベルト的な性質は、機械学習アプリケーションで直接使用する上での課題を提起する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:34:12 GMT)
Asynchronous Quantum Repeater using Multiple Quantum Memory [0.6] 本格的な量子ネットワークは、量子リピータの助けを借りて、遠隔地間の絡み合ったリンクの形成に依存している。
単一光子干渉プロトコルと同じ効率を保った後マッチングの考え方を用いた量子リピータプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 01:06:42 GMT)
Assessing the feasibility of quantum learning algorithms for noisy linear problems [0.6] ノイズのある線形問題を解くための量子アルゴリズムは、既存の文献と同じ仮定で再検討される。
この研究の成果には、Griloらによって解かれた量子学習問題の適用性の拡張が含まれている。
一方,本論文では,量子サンプルを用いた雑音線形問題の解法として,効率的な古典的アルゴリズムが存在することも示している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 01:27:24 GMT)
Rock the KASBA: Blazingly Fast and Accurate Time Series Clustering [0.6] 我々は、新しい時系列クラスタリング(TSCL)アルゴリズム、$k$-means (K)Accelerated (A) subgradient (S) Barycentre (B) Average (A)を提案する。
KASBAは、クラスタリングのすべての段階で、Move-Split-Merge (MSM) の弾性距離を使用し、ランダム化下降降下を適用してバリセント・セントロイドを見つけ、クラスタリングの各段階をリンクして収束を加速し、MSM距離の計量特性を利用して距離計算を行う、$k$-meansクラスタリングアルゴリズムである。
汎用的でスケーラブルなクラスタリングである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:26:17 GMT)
Present and Future Generalization of Synthetic Image Detectors [0.6] この研究は系統的な分析を行い、その洞察を用いて、堅牢な合成画像検出器の訓練のための実践的ガイドラインを開発する。
モデル一般化機能は、実際のデプロイメント条件を含む、さまざまな設定で評価される。
現在の手法は特定のシナリオにおいて優れているが、単一の検出器が普遍的な効果を達成できないことを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:12:30 GMT)
Functional Brain Network Identification in Opioid Use Disorder Using Machine Learning Analysis of Resting-State fMRI BOLD Signals [0.6] 本研究では、複数の時間点を表すrs-fMRI BOLD特徴のデータ駆動機械学習(ML)モデルを用いて、OUD被験者と健康制御(HC)を区別する関心領域を特定する。
次に,Boruta ML アルゴリズムを用いて OUD と OUD を区別する統計学的に重要な BOLD の特徴を同定し,DMN を OUD の最も有意な機能的ネットワークとして同定する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 21:01:57 GMT)
High-Performance and Scalable Fault-Tolerant Quantum Computation with Lattice Surgery on a 2.5D Architecture [0.6] 表面符号(SC)を用いた格子手術(LS)に基づく高性能・低オーバヘッドFTQCアーキテクチャを提案する。
提案したBypassアーキテクチャは、密度と粗いキュービット層からなる2.5次元アーキテクチャである。
その結果、BypassアーキテクチャはFTQCの忠実度を改善し、1.73倍のスピードアップと17%のハードウェアリソース削減を実現している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:27:59 GMT)
Exploring Structural Dynamics in Retracted and Non-Retracted Author's Collaboration Networks: A Quantitative Analysis [0.5] リトラクションは科学文献の信頼性と将来の研究の基盤を損なう。
本研究では, 抽出紙と非抽出紙のネットワーク構造を比較した。
リトラクションされたネットワークは階層的かつ集中的な構造を示し、非リトラクションされたネットワークはより強力なクラスタリングと接続性を備えた分散コラボレーションを示した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:04:36 GMT)
Relations, Negations, and Numbers: Looking for Logic in Generative Text-to-Image Models [0.5] 関係、否定、離散数という3種類の論理作用素について検討する。
人的合意のスコアが50%を超えることは確実ではない。
本稿では,マルチモーダル学習システムに固有の制約について論じる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:06:52 GMT)
The Muon Space GNSS-R Surface Soil Moisture Product [0.5] Muon Spaceは小型衛星のコンステレーションを構築しており、その多くがグローバルな航法衛星システムリフレクトメトリー(GNSS-R)受信機を搭載している。
この星座の打ち上げに備え、我々は一般化されたディープラーニング検索パイプラインを開発した。
入力データセット,前処理方法,モデルアーキテクチャ,開発手法,およびこれらの検索から生成された土壌水分生成物の詳細について述べる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:01:42 GMT)
RankMap: Priority-Aware Multi-DNN Manager for Heterogeneous Embedded Devices [0.5] RankMapは、不均一な組み込みデバイス上でのマルチDNNタスク用に特別に設計された優先順位対応のマネージャである。
RankMapは既存の手法に比べて平均スループットがx3.6であることを示す実験結果が得られた。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 20:34:17 GMT)
Explainable AI for Classifying UTI Risk Groups Using a Real-World Linked EHR and Pathology Lab Dataset [0.5] 英国ブリストル,ノースサマセット,サウスグロスターシャーの尿路感染症(UTI)を特徴付けるために,リンクEHRデータセットを利用する。
包括的なデータ前処理とキュレーションパイプラインは、生のEHRデータをAIモデリングに適した構造化フォーマットに変換する。
臨床専門知識によりUTIリスク推定フレームワークを構築し,個別の患者タイムラインにまたがってUTIリスクを推定する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:10:51 GMT)
PIM-AI: A Novel Architecture for High-Efficiency LLM Inference [0.5] 本稿では,大規模言語モデル推論用に設計された新しいDDR5/LPDDR5 PIMアーキテクチャであるPIM-AIを紹介する。
クラウドベースのシナリオでは、PIM-AIはクエリ毎秒あたりの3年間のTCOを最大6.94倍削減する。
モバイルシナリオでは、PIM-AIは最先端のモバイルSOCと比較してトークン当たりのエネルギーを10倍から20倍に削減する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:54:19 GMT)
A multi-language toolkit for the semi-automated checking of research outputs [0.4] 本稿では、セキュアなデータ環境におけるプライバシー開示のための研究出力(SACRO)の半自動チェックをサポートする、フリーでオープンソースのツールキットについて述べる。
SACROは、研究者が分析を行う際に、最も実践的な原理に基づく統計開示制御(SDC)技術を適用したフレームワークである。
このツールキットは、テーブル、プロット、統計モデルなどの出力を生成するよく知られた分析ツールの上に置かれる軽量のPythonパッケージで構成されている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:53:40 GMT)
Support Vector Machine for Person Classification Using the EEG Signals [0.4] 本稿では,この課題に対処するために,脳波信号を用いた個人識別を提案する。
脳波信号は、有望な認証可能性を提供し、活力検出のための新しい手段を提供し、それによって偽造攻撃を緩和する。
本研究では8チャンネルのOpenBCIヘルメットを用いて記録された12人の被験者の脳波データを特徴付ける疲労解析のために最初にコンパイルされたパブリックデータセットを用いる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:03:58 GMT)
Do LLMs Agree on the Creativity Evaluation of Alternative Uses? [0.4] 本稿では,大規模言語モデル (LLM) が,代替利用テスト (AUT) への対応において,創造性を評価することに合意しているかどうかを検討する。
AUT応答のオラクルベンチマークセットを用いて、これらの出力を評価する4つの最先端LCMを実験した。
その結果、モデル間の高い合意が示され、スピアマンの相関はモデル全体で0.7以上、オラクルに関して0.77以上に達している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:25:22 GMT)
On Limitations of LLM as Annotator for Low Resource Languages [0.4] 低リソース言語は、教師付き学習、アノテーション、分類といったタスクのための十分な言語データ、リソース、ツールが不足しているため、重大な課題に直面している。
この不足は正確なモデルやデータセットの開発を妨げるため、感情分析やヘイトスピーチ検出といった重要なNLPタスクの実行が困難になる。
このギャップを埋めるために、Large Language Models (LLM) は潜在的なアノテータの機会を提供する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:55:37 GMT)
BERT or FastText? A Comparative Analysis of Contextual as well as Non-Contextual Embeddings [0.4] 埋め込みの選択は、NLPタスクのパフォーマンス向上に重要な役割を果たす。
本研究では,Marathi言語固有のNLP分類タスクに,コンテキストBERTベース,非コンテキストBERTベース,FastTextベースの様々な埋め込み技術が与える影響について検討する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:25:57 GMT)
Mixed-State Quantum Denoising Diffusion Probabilistic Model [0.4] 本稿では,混合状態量子復調拡散確率モデル(MSQuDDPM)を提案する。
MSQuDDPMは、前方拡散過程における脱分極ノイズチャネルとパラメータ化量子回路と、後方除極ステップにおける射影測定を統合する。
量子アンサンブル生成タスクにおけるMSQuDDPMの評価を行い,その性能を実証した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:20:58 GMT)
Event-based Spiking Neural Networks for Object Detection: A Review of Datasets, Architectures, Learning Rules, and Implementation [0.4] スパイキングニューラルネットワーク(SNN)は、コンピュータビジョン(CV)アプリケーションのための従来の人工知能ニューラルネットワーク(ANN)に代わるエネルギー効率の良い代替手段を提供する。
本稿では,SNNを用いたCVベース物体検出タスクにおいて,データセット,アーキテクチャ,学習方法,実装手法,評価手法を体系的に検討する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 00:28:43 GMT)
A Practical Approach to Formal Methods: An Eclipse Integrated Development Environment (IDE) for Security Protocols [0.3] セキュリティプロトコルの設計、検証、実装のためのEclipse IDEを提示します。
モデル駆動開発アプローチの一部として、フォーマル化プロセスでユーザフレンドリな支援を提供する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 22:44:08 GMT)
CatNet: Effective FDR Control in LSTM with Gaussian Mirrors and SHAP Feature Importance [0.3] CatNetは、False Discovery Rate(FDR)を効果的に制御し、ガウスミラー(GM)法でLSTMの重要な特徴を選択するアルゴリズムである。
リンク関数の異なる線形モデルとLSTMモデルの両方において、シミュレーションデータを用いてCatNetの性能を評価する。
我々は、S&P500指数部品の価格を予測するため、多要素投資ポートフォリオを構築した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:23:19 GMT)
Segmentation-Free Outcome Prediction from Head and Neck Cancer PET/CT Images: Deep Learning-Based Feature Extraction from Multi-Angle Maximum Intensity Projections (MA-MIPs) [0.3] 頭頸部癌(HNC)患者の予後予測のための,革新的な,シンプルで効果的なセグメンテーションフリーアプローチを提案する。
PETボリュームに適用された深層学習に基づく特徴抽出技術と多角最大強度投影(MA-MIP)を活用することにより,手動セグメンテーションの必要性を解消する。
PETボリューム上で頭頸部領域の自動収穫を行うための最先端物体検出モデルを訓練する。
その後、事前訓練された深部畳み込みニューラルネットワークのバックボーンを用いて72乗から得られたMA-MIPから深部特徴を抽出する
論文参考訳(メタデータ) (Tue, 26 Nov 2024 22:31:42 GMT)
Scalable iterative pruning of large language and vision models using block coordinate descent [0.3] 重みの一部を除去するプルーニングニューラルネットワークは、しばしば高い精度を維持しながら、少なくとも一定の限界まで、モデルの複雑さを著しく低減する。
本稿では,Y Combinatorial Brain Surgeonに基づくニューラルネットワークのプルーニング手法を提案するが,ネットワーク重みのサブセットに対する最適化問題を反復的,ブロック的に解決する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:54:02 GMT)
Investigating Self-Supervised Image Denoising with Denaturation [0.3] 理論的解析と数値実験により,デ変性データを用いた自己教師付き復調アルゴリズムを解析する。
その結果, 劣化画像を用いたアルゴリズムトレーニングは有効であり, 経験的性能は理論的結果と一致していることがわかった。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:44:34 GMT)
How to Segment in 3D Using 2D Models: Automated 3D Segmentation of Prostate Cancer Metastatic Lesions on PET Volumes Using Multi-angle Maximum Intensity Projections and Diffusion Models [0.3] 本研究は,PSMA PET/CT 3Dボリューム画像における転移病変の自動分割のための新しいアプローチを提案する。
提案手法は,PSMA PET画像の多重角最大強度投影(MA-MIP)に病変を分割する。
提案法は, 微小転移性PCa病変の検出・分節における精度, 堅牢性の観点から, 最先端の3次元分節法に比べ, 優れた性能を示した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 22:21:18 GMT)
Modelling and Classification of Fairness Patterns for Designing Sustainable Information Systems [0.3] 本稿では,社会技術システム設計における公正性の概念について考察する。
これは、価値、仮定、規制、メートル法、タスクの概念を捉えた参照持続可能性メタモデルに基づいている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 21:23:56 GMT)
Evaluating the Overhead of the Performance Profiler Cloudprofiler With MooBench [0.3] 本研究では、ネイティブおよびディスクプロセスを測定するためにC++で実装されたパフォーマンスプロファイラであるCloudknownrのオーバーヘッドを測定する。
プロファイラプロセスを目標プロセスの外に配置し、クリティカルパスから書き込みオーバーヘッドを移動させることで、プロファイラのオーバーヘッドを最小限に抑える。
非圧縮ハンドラの6.15倍高速である。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:20:19 GMT)
RealSeal: Revolutionizing Media Authentication with Real-Time Realism Scoring [0.3] 既存の合成データの透かし方法は、簡単に取り除いたり、変更したりできるため、不足している。
コンテンツオリジンの検証にメタデータに依存するプロヴァンステクニックは、ステージドメディアやフェイクメディアの根本的な問題に対処できない。
本稿では,メディア認証における画期的なパラダイムシフトについて紹介する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:48:23 GMT)
Quantum Optics Applications of Hexagonal Boron Nitride Defects [0.2] 六方晶窒化ホウ素(hBN)は、古典的および量子技術の双方にとって魅力的なプラットフォームとして出現している。
本稿では、量子センシング、量子鍵分布、量子コンピューティング、量子メモリなど、hBNの基本概念と重要な応用について概説する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:51:39 GMT)
Scholar Name Disambiguation with Search-enhanced LLM Across Language [0.2] 本稿では,複数の言語にまたがる検索強化言語モデルを用いて,名前の曖昧さを改善する手法を提案する。
検索エンジンの強力なクエリ書き換え、意図認識、およびデータインデックス機能を利用することで、エンティティの識別やプロファイルの抽出を行うため、よりリッチな情報を集めることができる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:39:46 GMT)
How should AI decisions be explained? Requirements for Explanations from the Perspective of European Law [0.2] 本稿は、国際的概念や規制はあるものの、ヨーロッパ(および一部ドイツ人)の法律に焦点をあてる。
XAI-タコノミに基づき、XAI(メソッド)の要件はそれぞれの法的根拠から導かれる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:13:46 GMT)
Self-supervised learning for skin cancer diagnosis with limited training data [0.2] 自己教師付き学習(SSL)は、限られたトレーニングデータを持つシナリオに対するImageNetの標準教師付き事前トレーニングの代替である。
textitfurther SSL をタスク固有のデータセットで事前トレーニングし、その実装は教師あり転送学習によって動機づけられる。
タスク固有のデータに対するより最小限のSSL事前トレーニングは、限られたラベル付きデータによる医療画像分類タスクにおいて、ImageNet上の大規模なSSL事前トレーニングと同じくらい効果的である。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 05:29:17 GMT)
Influencers' Reposts and Viral Diffusion: Prestige Bias in Online Communities [0.2] われわれは5500万件以上の投稿と5億2000万件のTwitter投稿(現在はX)を分析した。
その結果、インフルエンサーが共有する投稿は、非インフルエンサーが共有する投稿よりも、より多く共有される可能性が示唆された。
非常に影響力のあるユーザの小さなグループは、カスケードを再投稿する際の情報フローの約半分を占めていた。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:22:46 GMT)
Digital Democracy in the Age of Artificial Intelligence [0.2] この章では、デジタル民主主義における人工知能(AI)の影響について論じる。
市民権、参加権、代表権、公共の領域の4つに焦点が当てられている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:20:53 GMT)
Advancing Content Moderation: Evaluating Large Language Models for Detecting Sensitive Content Across Text, Images, and Videos [0.1] 政府、教育者、そして親はしばしば、そのようなコンテンツの拡散を規制し、制御し、制限する方法についてメディアプラットフォームと対立している。
自然言語処理やコンピュータビジョンといった技術は、センシティブなコンテンツを自動的に識別し、フィルタリングするために広く使われている。
テキストと画像の両方のコンテキストを理解するためのより洗練されたアルゴリズムは、コンテンツ検閲の改善のための部屋を開くかもしれない。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 05:29:18 GMT)
An Ensemble Approach for Brain Tumor Segmentation and Synthesis [0.1] 磁気共鳴イメージング(MRI)における機械学習の統合は、信じられないほど効果的であることが証明されている。
ディープラーニングモデルは、複雑なデータの複雑な詳細をキャプチャするために、複数の処理層を利用する。
本稿では,最先端アーキテクチャを組み込んだディープラーニングフレームワークを提案し,精度の高いセグメンテーションを実現する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:28:51 GMT)
Automatic Skull Reconstruction by Deep Learnable Symmetry Enforcement [0.1] 何千人もの人々が頭蓋骨の損傷に苦しんでおり、頭蓋腔を埋めるためにパーソナライズされたインプラントを必要としている。
深層学習に基づく頭蓋再建はいくつかの課題に直面している。
本稿では,これらの課題に対して,学習可能な対称性の強制による再構築を強化することによる,新たなアプローチを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:35:32 GMT)
Beyond Grids: Exploring Elastic Input Sampling for Vision Transformers [0.1] 視覚変換器は様々なコンピュータビジョンタスクに優れてきたが、主にパッチの固定サイズのグリッドを使った厳密な入力サンプリングに依存している。
本稿では,視覚変換器の入力弾性の概念を定式化し,この弾性を測定するための評価プロトコルを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:28:26 GMT)
Classifier Enhanced Deep Learning Model for Erythroblast Differentiation with Limited Data [0.1] 病態と遺伝疾患の1%を含む血液疾患は、重大な診断上の課題を呈している。
本手法では,機械学習モデルの有効性を考慮した各種機械学習設定の評価を行う。
データが利用可能になった場合、提案されたソリューションは、小さくてユニークなデータセットの精度を高めるためのソリューションである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 04:09:46 GMT)
Tower of Structured Excited States from Measurements [0.1] 量子位相推定を利用して大域観測可能度を測定する対数深度プロトコルを提案する。
量子力学において有用な構造励起状態の塔を作る能力を示す。
本研究は,量子多体系における高絡み合い状態へのアクセスに対する測定に基づくアプローチの有用性を拡大するものである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 01:07:46 GMT)
X-MeshGraphNet: Scalable Multi-Scale Graph Neural Networks for Physics Simulation [0.0] 我々は、MeshGraphNetのスケーラブルでマルチスケールな拡張であるX-MeshGraphNetを紹介する。
X-MeshGraphNetは、大きなグラフとハローリージョンを分割することで、スケーラビリティのボトルネックを克服する。
実験の結果,X-MeshGraphNetは全グラフGNNの予測精度を維持していることがわかった。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:10:05 GMT)
Wigner's Phase Space Current for Variable Beam Splitters -Seeing Beam Splitters in a New Light- [0.0] We study the behavior of variable beam splitter and their dynamics using Wigner's phase space distribution, W。
我々は、対応するウィグナー電流であるJの形状を、互いに追跡した後の各アウトゴーイングモードから導出する。
それぞれのウィグナー分布とウィグナー電流を用いて各モードが相互に与える影響を解析・可視化する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:13:40 GMT)
Variational Quantum Simulation of the Fokker-Planck Equation applied to Quantum Radiation Reaction [0.0] ペタワット級レーザーによる近未来の実験は、ガンマ線と電子-陽電子対の高フラックスを生み出すことが期待されている。
この研究は、プラズマ物理シナリオの量子シミュレーションに向けた第一歩として役立つだろう。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:27:00 GMT)
Universal approximation with complex-valued deep narrow neural networks [0.0] 境界幅と任意の深さを持つ複素数値ニューラルネットワークの普遍性について検討する。
より狭い複素数値ネットワークは、その活性化関数が正則でもなく、反正則でもなく、$mathbbR$-affineでもない場合に限り普遍であることを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:39:59 GMT)
Training Hamiltonian neural networks without backpropagation [0.0] 本稿では,ハミルトニアン系を近似するニューラルネットワークのトレーニングを高速化するバックプロパゲーションフリーアルゴリズムを提案する。
従来のハミルトニアンニューラルネットワークよりもCPUの方が100倍以上高速であることを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:22:30 GMT)
Towards parameterizing the entanglement body of a qubit pair [0.0] 手法は、2-キュービットの絡み合い空間の一般部分上の座標の構成に基づいている。
Subset $mathcalSE_2times2 subsetmathcalE_2times2$ corresponding to rank-4 2-qubit states。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:32:43 GMT)
Towards early fault tolerance on a 2$\times$N array of qubits equipped with shuttling [0.0] 局所的に相互作用する量子ビットの2次元グリッドは、フォールトトレラント量子コンピューティングのための有望なプラットフォームである。
本稿では,そのような制約のあるアーキテクチャも耐障害性をサポートすることを示す。
エラー訂正が可能であることを実証し、このプラットフォームに自然に適合するコードのクラスを特定する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:23:16 GMT)
Toward a Quantum Computing Formulation of the Electron Nuclear Dynamics Method via Fukutome Unitary Representation [0.0] 本稿では、変分量子シミュレータ(VQS)における電子核動力学(END)法の定式化を初めて実施する: END/QC/VQS。
ENDは凍結したガウス波パケットと電子を持つ核を表し、Thouless非単位表現において単一の決定状態を持つ。
単電子二原子分子におけるMとVの評価を行うQC回路を設計する。log2-log2プロットでは、これらの評価の誤差と偏差はショット数とともに線形に減少し、スロープ=-1/2となる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:21:30 GMT)
Topological finite size effect in one-dimensional chiral symmetric systems [0.0] 本稿では,位相的エッジモードのバルク導電率に基づく有限位相系を特徴付けるための新しい基準を提案する。
本稿では,現代中規模実験におけるトポロジ決定の実践的知見を提供する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:02:39 GMT)
Topological domain-wall pump with $\mathbb{Z}_2$ spontaneous symmetry breaking [0.0] 局所的な$U(1)$ゲージ不変量を用いて、S=1/2$スピンの拡張クラスタモデルによるドメインウォールポンプを提案する。
自発的対称性の破れ(SSB)に関連する基底状態は、追加の空間反転によってまだ対称性が保護されている。
このポンプは、チャーンドメインウォールの端状態の特異な振る舞いと非自明な数のバルクを誘導する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:37:19 GMT)
Time-Series Forecasting in Smart Manufacturing Systems: An Experimental Evaluation of the State-of-the-art Algorithms [0.0] TSFは製造を含む様々な領域で成長している。
本研究の目的は、13の製造データセット上でのSoTA TSFアルゴリズムの評価により、このギャップを埋めることである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:10:31 GMT)
Time, bits, and nickel: Managing digital and analog continuity [0.0] 章では、仮想Webコンテンツと物理的紙ベースの2つの方法について、デジタル形式とアナログ形式で、時間を通してアーカイブする方法について論じている。
時間と空間の観点から、様々な種類のアーカイビング手法やツール、それらがもたらした経営課題を探求するだけでなく、イノベーション、保守、そして「連続性」も探求している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:09:37 GMT)
The ParlaSpeech Collection of Automatically Generated Speech and Text Datasets from Parliamentary Proceedings [0.0] 我々は,低リソース言語による大規模かつオープンな音声・テキスト対応データセットを構築するためのアプローチを提案する。
我々は3つのスラヴ語、すなわちクロアチア語、ポーランド語、セルビア語に焦点を当てている。
このパイロット実行の結果は、5000時間以上のスピーチと付随するテキストの書き起こしにまたがる、高品質な3つのデータセットである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:50:50 GMT)
The Impact of School and Family Networks on COVID-19 Infections Among Dutch Students: A Study Using Population-Level Registry Data [0.0] 我々は、SARS-CoV-2送信に対する学校、家族、その他の社会接触の影響を調べるために、広範な登録データを用いている。
以上の結果から,SARS-CoV-2の普及における家庭と家族の伝達の重要性が学校設定に比較して強調された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 21:27:18 GMT)
The Exploration of Neural Collapse under Imbalanced Data [0.0] 我々は、バイアス項を持つ$L$拡張非制約特徴モデルを検討し、大域最小化の理論的解析を提供する。
1) 同一クラス内の特徴は, 偏りのない平衡ケースと不均衡ケースの両方と同様, クラス平均に収束する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:59:34 GMT)
Temporal Entanglement Barriers in Dual-Unitary Clifford Circuits with Measurements [0.0] 本研究では,空間的ユニタリティを保った確率的測定により,両単位クリフォード回路の時間的絡みについて検討した。
我々は,無測定状態における時間的絡み合い障壁を正確に特徴づけ,弾道的成長と崩壊と容積法的なピークを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:29:37 GMT)
TAFM-Net: A Novel Approach to Skin Lesion Segmentation Using Transformer Attention and Focal Modulation [0.0] 我々は、自己適応型トランスフォーマーアテンション(TA)と焦点変調(FM)を利用した革新的なモデルであるTAFM-Netを開発する。
提案モデルでは,空間およびチャネル関連サリエンシを高めるためにTAを利用するEfficientNetV2B1エンコーダを,密結合デコーダはスキップ接続内にFMを統合する。
新しい動的損失関数アマルガメート領域と境界情報、効果的なモデルトレーニングの導出
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:18:48 GMT)
Superactivation of memory effects in a classical Markov environment [0.0] バックフロー・オブ・インフォメーション(SBFI)のスーパーアクティベーションとして知られる現象について検討する。
我々は,SBFIが絡み合う必要はなく,ヘルストロムアンサンブルの量子性のみを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:57:04 GMT)
Spin flip locking by the tunneling and relaxation in a driven double quantum dot with spin-orbit coupling [0.0] 周期電界によって駆動される半導体ナノワイヤに形成される二重量子ドットについて検討する。
特定の状態において、座標チャネルの高速な緩和とスピンチャネルの緩やかな緩和の組み合わせは、高速なスピン操作と緩やかなスピン緩和の有望な組み合わせをもたらすことが判明した。
予測された効果は、座標とスピンチャネルの両方に対して幅広い緩和時間と駆動振幅で維持され、より高い低調波周波数で観測される。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:38:58 GMT)
Social Distancing Induced Coronavirus Optimization Algorithm (COVO): Application to Multimodal Function Optimization and Noise Removal [0.0] 感染拡大のペースは、社会的距離を保てば遅くなる。
COVO最適化の主な動機は、より高速な収束で複雑な問題を解くことにより、様々なアプリケーションに対する大域的な解を得ることである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:09:36 GMT)
Singularity with and without disorder at AKLT points [0.0] 我々は、SU(N) モデルの族に対して、AKLT 点は障害点ではないことを示す。
この新たな可能性は、表現が自己共役でないモデルと、移動行列が非エルミート的であるようなモデルに対して一般的なものであると推測する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 20:05:18 GMT)
Singly poled thin film lithium niobate waveguide as a tunable source of photon pairs across telecom band [0.0] 波長特性の異なる光子対のコンバーチブルソースとして機能する波長導波路(TFLN)について報告する。
このような多彩な光子対の源は、異なる通信帯域の光子と所望のスペクトル特性を必要とする様々な量子光学的タスクにおいて重要な要素となると信じている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:25:10 GMT)
Sharp bounds for max-sliced Wasserstein distances [0.0] 我々は、分離可能なヒルベルト空間上の確率測度と、$n$サンプルからの経験的分布との予想最大1-ワッサーシュタイン距離の上限と下限を一致させる。
また、ユークリッド空間上の対称確率測度$mu$の間の予想最大2-ワッサーシュタイン距離に対して、対数係数まで鋭い上限を得る。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:38:22 GMT)
Selfish Evolution: Making Discoveries in Extreme Label Noise with the Help of Overfitting Dynamics [0.0] 自己中心的進化(Selfish Evolution)は、破損したラベルを弱教師付きで検出し、修正することを可能にする。
我々はSupernova-huntingデータセットのメインタスクを評価するとともに、より標準的なMNISTデータセット上で効率を示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:51:43 GMT)
Safe to Serve: Aligning Instruction-Tuned Models for Safety and Helpfulness [0.0] 大規模言語モデル (LLM) は複雑な推論やテキスト生成において顕著な能力を示した。
LLMは、問題のある入力を誘導すると、不安全または偏りの応答を不注意に生成することができる。
本研究は、有用なコンテンツと無害コンテンツの両方を生成する言語モデルを開発する上で、重要な課題に対処する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:52:22 GMT)
Rewiring Techniques to Mitigate Oversquashing and Oversmoothing in GNNs: A Survey [0.0] グラフニューラルネットワーク(GNN)は,グラフ構造化データから学習するための強力なツールだが,その有効性は2つの重要な課題によって制約されることが多い。
オーバーキャッシング(Oversquashing) – 遠いノードからの情報の過剰な圧縮が大きな情報損失と過度なスムース化をもたらし、繰り返しメッセージパッシングの繰り返しがノード表現を均質化し、意味のある区別を隠蔽する。
本研究では,グラフトポロジを改良して情報拡散を高めることで,これらの構造的ボトルネックに対処する手法であるグラフリウィリング手法について検討する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:38:12 GMT)
Representation of Classical Data on Quantum Computers [0.0] 量子コンピューティングシステムに使用されるデータを表現することは必須である。
本報告では,ゲート型量子コンピュータ上でのこれらのデータ型表現方法の概要について述べる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:21:01 GMT)
Reanalysis of Everett's relative-state formulation of quantum mechanics [0.0] エバレットの「量子力学の相対的状態定式化」(RSQM)
この報告は、エヴェレットの2つの研究が、実験物理学の圧倒的な体と矛盾する量子力学の定式化を記述していることを示している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 00:01:17 GMT)
Quantum versus classical $P$-divisibility [0.0] P$-divisibility は古典的および量子的非マルコフ過程において中心的な概念である。
古典的な$P$分割性の喪失は、純粋に散逸的な$P$分割可能な量子力学の古典的な還元から生じる可能性があることを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:36:23 GMT)
Quantum gravitational decoherence of a mechanical oscillator from spacetime fluctuations [0.0] 本稿では, ゆらぎ変形パラメータと変形可換関係による変動時空のシナリオ, あるいは揺らぎ計量テンソルについて考察する。
結果のダイナミクスを計算し、これらの変動を平均化することにより、システムは運動量ベースでデコヒーレンスを経験する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 21:18:58 GMT)
Quantum clocks driven by measurement [0.0] エントロピー低減により駆動される量子クロックを計測により記述する。
この機構は、オープンコプラナー共振器に結合された超伝導トランスモンキュービットで構成されている。
測定自体が条件モーメントの変動周期とともにコヒーレント振動を誘導することを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:46:48 GMT)
Quantum Wave Simulation with Sources and Loss Functions [0.0] この枠組みは、音響波動方程式、マクスウェル方程式、弾性波動方程式を含む幅広い種類の波動方程式を含む。
サブスペースエネルギーを抽出し,$l$-loss関数を用いて波動場を比較する。
離散化波動方程式のハミルトニアンは局所結合を持つので、このクォートスピードアップは時間領域解に最適であると主張する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:42:55 GMT)
Quantum Orbital-State Control of a Neutral Nitrogen-Vacancy Center at Millikelvin Temperatures [0.0] 中性窒素空孔中心(NV$0$)は、単一のマイクロ波光子との強い結合を実現することを約束している。
単一NV$0$は、高周波マイクロ波共振器と結合すると強い結合状態に達する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:54:02 GMT)
Pulse Engineering via Projection of Response Functions [0.0] 本稿では,最適忠実度を持つ所望の演算の実装を目的とした,量子システムの反復最適制御法を提案する。
方法の更新ステップは、制御演算子に対する忠実度の線形応答と、対応する演算子のモード関数への投影に基づく。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:50:40 GMT)
Properties and dynamics of generalized squeezed states [0.0] 変位や2光子のスクイージングとは対照的に、高次のスクイージングは振動ダイナミクスをもたらす。
状態はダイナミクスの初期段階で圧縮されるが、後段でスクイーズが逆転し、状態はほぼ完全に初期状態に戻る。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 01:13:32 GMT)
Phase diagram of non-Hermitian BCS superfluids in a dissipative asymmetric Hubbard model [0.0] 非エルミタン(NH)の非対称ホッピングと複素数値相互作用を持つフェルミ・ハッバードモデルについて検討する。
ホッピングの弱い非対称性は、BdGハミルトニアンの固有値の虚部のみに影響を与えるので、BCS超流動性には影響しない。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:27:44 GMT)
Patience Is The Key to Large Language Model Reasoning [0.0] そこで我々は,モデルに患者推論スタイルを採用することを奨励する簡単な方法を提案する。
我々は、肯定的な例として詳細な推論プロセス、否定的な例として単純な回答を生成し、その結果、その反応の完全性を支持するようにモデルを訓練する。
この結果から,軽量データセット上でのトレーニングにより,GSM8kのパフォーマンスは最大6.7%向上した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:57:42 GMT)
Partition function estimation with a quantum coin toss [0.0] 量子分割関数の推定は、様々な分野において重要な課題である。
本稿では,分割関数 $Z_beta$ を乗法誤差まで一般化したハミルトニアン$H$ の量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:01:19 GMT)
PP-LEM: Efficient and Privacy-Preserving Clearance Mechanism for Local Energy Markets [0.0] PP-LEMは、スタックルバーグゲームとしてモデル化された新しい競争理論的クリアランス機構を取り入れている。
このメカニズムに基づき、部分的に同型暗号システムを用いてプライバシ保護市場モデルを開発する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 00:22:31 GMT)
On the Efficiency of NLP-Inspired Methods for Tabular Deep Learning [0.0] 本稿では,表層深層学習(DL)の最新技術について批判的に考察する。
性能と計算効率に重点を置いている。
ソースコードはhttps://github.com/basf/mamba-tabular.comで入手できる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:23:29 GMT)
Object-centric proto-symbolic behavioural reasoning from pixels [0.0] 我々は、ピクセルから学習し、その環境を解釈し、制御し、推論する脳に触発されたディープラーニングアーキテクチャを提案する。
その結果,エージェントは創発的条件付き行動推論を学習できることがわかった。
提案アーキテクチャは、教師なし学習における重要な帰納バイアスとして、接地オブジェクト表現の操作方法を示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 13:54:24 GMT)
Nonequilibrium relaxation exponentially delays the onset of quantum diffusion [0.0] 我々は、空間を包含する従来の時間的意味を超えて記憶の概念を一般化する最近のブレークスルーを利用する。
我々は、短時間で小さな格子の力学を用いて、任意に長い時間スケールで熱力学的に大きな格子の力学を予測する。
また, ポーラロン移動物理における次元の影響を調べるために, 1次元系と 2次元系の輸送特性を比較した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 01:09:23 GMT)
Neural Networks Use Distance Metrics [0.0] 本稿では、ReLUとAbsolute Valueを活性化したニューラルネットワークが距離に基づく表現を学習する経験的証拠を示す。
我々は、訓練されたモデルにおける内部アクティベーションの距離と強度の両特性を独立に操作し、両方のアーキテクチャが小さな距離に基づく摂動に非常に敏感であることを発見した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 23:04:56 GMT)
Multi-site gates for state preparation in quantum simulation of the Bose Hubbard Model [0.0] 容易に構築された積状態からBose-Hubbardモデルの超流動基底状態への近似に変換する多地点ゲート列を構築した。
写像は1次元のハードコア極限において完全であり、1次元と2次元の非相互作用粒子に対しては正確である。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:58:36 GMT)
Multi-Objective Reinforcement Learning for Automated Resilient Cyber Defence [0.0] サイバー攻撃は、軍事指揮統制ネットワーク、情報、監視、偵察(ISR)システム、民間の臨界国家インフラにセキュリティ上の脅威をもたらす。
これらの攻撃における人工知能と自律エージェントの使用は、この脅威の規模、範囲、複雑さを増大させ、それらが引き起こす破壊を後押しする。
自律サイバー防衛(ACD)エージェントは、マシンスピードとこの問題に対処するために必要なスケールで応答することで、この脅威を軽減することを目指している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:51:52 GMT)
Motion Free B-frame Coding for Neural Video Compression [0.0] 本稿では,上記の2つの典型的なアーキテクチャの欠点に対処する新しいアプローチを提案する。
モーションフリーアプローチの利点は2つある: ネットワークの符号化効率を改善し、計算複雑性を著しく低減する。
実験の結果,提案フレームワークはHEVCクラスBデータセット上でのSOTAディープ・ニューラルビデオ圧縮ネットワークよりも優れていた。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 07:03:11 GMT)
Meaningless is better: hashing bias-inducing words in LLM prompts improves performance in logical reasoning and statistical learning [0.0] ハッシュ」は、認知バイアスを減らすために、意味のない識別子で大きな言語モデルでバイアスを誘発する可能性のある単語を隠蔽する。
この方法は、合計490のプロンプトを含む3つの実験セットで試験された。
本手法は,外部知識のバイアス低減と包摂性の向上を図った。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:52:08 GMT)
Making History Readable [0.0] このポスターは、手書きの手紙、新聞、デジタル化された地形図に焦点を当てた3つのコレクションをハイライトしている。
各コレクションで課題を議論し、それに対処するためのアプローチの詳細を述べます。
提案手法は,これらのコレクションの内容を検索し,ナビゲートしやすくすることで,ユーザエクスペリエンスを向上させることを目的としている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:06:58 GMT)
Magnetization and Polarization of Coupled Nuclear Spin Ensembles [0.0] 一般スピン-I系に対する高場定理を証明する。
結果は磁化方程式と密度行列形式の両方を用いて導出される。
この研究は磁気共鳴の確立された原理を補強するだけでなく、さらなる探査のための領域も強調する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:14:21 GMT)
Machine Learning and Multi-source Remote Sensing in Forest Carbon Stock Estimation: A Review [0.0] 本研究は,80以上の関連研究から,厳格な包摂基準を満たす25の論文を体系的に分析した。
ランダムフォレストは最も頻繁に出現し(88%)、エクストリームグラディエント・ブースティングは他の方法と比較された研究の75%で優れた性能を示した。
センチネル-1は最も利用されたリモートセンシング源として出現し、マルチセンサーのアプローチは特に有効であることが証明された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:34:59 GMT)
Long-lived Particles Anomaly Detection with Parametrized Quantum Circuits [0.0] パラメタライズド量子回路に基づく異常検出アルゴリズムを提案する。
このアルゴリズムは古典的なコンピュータで訓練され、シミュレーションや実際の量子ハードウェアでテストされている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 21:08:39 GMT)
Light Statistics from Large Ensembles of Independent Two-level Emitters: Classical or Non-classical? [0.0] 弱駆動系におけるコヒーレントに駆動される非相互作用性2レベル原子のアンサンブルの光子統計について検討した。
強力なアンチバンチングからスーパーバンチングまで、並外れた2光子相関が得られた。
基礎となるメカニズムは、干渉による空間的ゆらぎを示すコヒーレント散乱と、等方的自発崩壊の形での散逸の相互作用である。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:38:30 GMT)
LRSAA: Large-scale Remote Sensing Image Target Recognition and Automatic Annotation [0.0] LRSAAと呼ばれる大面積リモートセンシング画像におけるオブジェクト認識と自動ラベリングの手法を提案する。
YOLOv11とMobileNetV3-SSDオブジェクト検出アルゴリズムをアンサンブル学習により統合し,モデル性能を向上させる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:51:34 GMT)
Joint Resource Optimization, Computation Offloading and Resource Slicing for Multi-Edge Traffic-Cognitive Networks [0.0] 本稿では,プラットフォームとESの両方が自己関心を持つエンティティであるマルチエージェントシステムについて検討する。
そこで我々は,利害関係者間の相互作用をモデル化し,最適化問題を解くための新しいゲームベースフレームワークStackelbergを提案する。
さらに、ニューラルネットワーク最適化とプライバシ保護情報交換プロトコルを活用した分散ソリューションを設計する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:51:10 GMT)
Joint Combinatorial Node Selection and Resource Allocations in the Lightning Network using Attention-based Reinforcement Learning [0.0] Lightning Network(LN)は、Bitcoinのスケーラビリティ問題に対する第2層ソリューションとして登場した。
本稿では,変換器のパワーによって強化されたDeep Reinforcement Learningフレームワークを提案する。
以上の結果から,LNの分散化目標と個人収益最大化インセンティブの対立が欠如しているだけでなく,両者の肯定的な関係が示唆された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:56:19 GMT)
Is ETHICS about ethics? Evaluating the ETHICS benchmark [0.0] 道徳理論,心理学,迅速な評価に基づいて,ETHICSベンチマークの有効性を問う。
倫理の明確な理解と経験的現象との関連性を持つことは、AIの倫理評価の有効性の鍵となる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:58:37 GMT)
Interplay of magnetic field and chemical potential induced anisotropy and frame dependent chaos of a $Q\bar{Q}$ pair in holographic QCD [0.0] ホログラム原理に基づくQCD精細糸におけるカオス力学の出現における磁場と化学的ポテンシャルの両方の役割について検討した。
先に開発されたアインシュタイン-マクスウェル-ディラトン重力のボトムアップモデルが、QCDの特徴をかなりよく模倣している。
カオスに関する定性的情報は、ポアンカーのセクションとリャプノフ指数を用いて得られる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:01:31 GMT)
Integrating Machine Learning and Quantum Circuits for Proton Affinity Predictions [0.0] ガス相では、陽子親和性(PA)測定により陽子生成部位が決定される。
機械学習(ML)モデルと組み合わせて,複数記述子を用いてPA予測を高速かつ高精度に行う手法を開発した。
その結果,R2は0.96,MAEは2.47kcal/mol,MAEは2.47kcal/molであった。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 20:13:56 GMT)
Indefinite causal key distribution [0.0] 不確定因果順序(ICO)で実行される量子鍵分布(QKD)プロトコルを提案する。
キーに関する情報を公に比較することなく盗聴者を検出することが可能であることが判明した。
また、個別の盗聴攻撃に対するこのプロトコルの安全性も証明する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:27:34 GMT)
Impact of Scalar NSI on Spatial and Temporal Correlations in Neutrino Oscillations [0.0] 非標準相互作用(NSI)はニュートリノ振動において重要な役割を果たす。
最近、スカラーNSIのバウンダリが改善されている。
本研究は空間的非局所性対策と時間的非局所性対策の両方を対象とする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:14:27 GMT)
HOPPR Medical-Grade Platform for Medical Imaging AI [0.0] HOPPR Medical-Grade Platformは、開発者が特定のユースケースのために微調整できる基盤モデルのスイートを提供する。
HOPPRのミッションは、医療画像のためのLVLMソリューションの展開を迅速化し、最終的にフィールドの増大する要求を満たすことである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 21:21:45 GMT)
Going beyond quantum Markovianity and back to reality: An exact master equation study [0.0] オープン量子系の解析的描写を提供する。
系の定常励起数(AEN)は、非マルコビアン性の増加に伴う急激なエスカレーションを示す。
Mpemba効果は、非マルコフ系では驚くほど超冷却的な効果で観察できる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:10:35 GMT)
GaussianDiffusion: 3D Gaussian Splatting for Denoising Diffusion Probabilistic Models with Structured Noise [0.0] 本稿では3Dコンテンツ生成フレームワークであるGaussian Diffusionについて,Gaussian Splattingに基づく新しいテキストを紹介した。
3次元生成における多視点一貫性の実現という課題は、モデリングの複雑さと精度を著しく損なう。
本稿では,3次元外観の質と安定性を高めるため,変分ガウススメッティング法を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:01:14 GMT)
From the Shastry-Sutherland model to the $J_1$-$J_2$ Heisenberg model [0.0] 本稿では,Shastry-Sutherlandモデルと$J_1$-$J$Heisenbergモデルを橋渡しする一般化Shastry-Sutherlandモデルを提案する。
大規模密度行列再正規化群と完全拡張行列積状態計算を用いて、純粋なシャストリー・サザランドモデルにおけるプラケット価結合状態(PVBS)とネエル反強磁性(AFM)相の相転移が弱いことを確かめる。
この結果はPVBSにおけるエキゾチック三臨界点の存在を示唆している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:12:00 GMT)
From quantum enhanced to quantum inspired Monte Carlo [0.0] 量子化モンテカルロ法 [Nature, 619, 282-287 (2023) の包括的解析を行う。
ハミルトン強度の最適混合を観察し,システムの大きさと総進化時間のスケーリングを解析した。
提案手法は,従来の実ハードウェアではなく,古典的近似量子シミュレータを用いて提案するものである。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:02:21 GMT)
From memorization to generalization: a theoretical framework for diffusion-based generative models [0.0] 拡散に基づく生成モデルは、トレーニングデータセットを記憶するから、トレーニングセットのサイズが大きくなるにつれて、非記憶状態に移行することを示す。
これは、モデルの記憶性能が低下する別のシナリオと対比されるが、一般化性能は改善しない。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:00:01 GMT)
Finite time path field theory perturbative methods for local quantum spin chain quenches [0.0] 有限時間経路場理論の摂動法による局所磁場クエンチについて検討する。
i) 焼成鎖のLoschmidt echo (LE) における基本気泡図式を摂動の任意の順序で計算する方法を示し、(ii) 気泡図形のフェルミオン二点遅延関数に対する一般化シュウィンガー-ダイソン方程式を再開する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 19:00:03 GMT)
Fast, accurate, and error-resilient noise spectroscopy via basis optimization [0.0] 本稿では、一般に実行される動的デカップリングに基づくコヒーレンス測定を処理する方法を提案する。
ダイヤモンド中の窒素空孔センサのノイズスペクトルを再構成するために,本手法を用いた。
提案手法のノイズスペクトル再構成により,従来考えられていなかった構造が明らかとなり,前例のない精度が得られた。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:04:05 GMT)
Fair Mixed Effects Support Vector Machine [0.0] 機械学習の公正性は、トレーニングデータに存在するバイアスを緩和し、不完全性をモデル化することを目的としている。
これは、モデルが民族性や性的指向といった繊細な特徴に基づいて決定するのを防ぐことで達成される。
両問題を同時に処理できるベクターマシンアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:49:48 GMT)
Fair Generalized Linear Mixed Models [0.0] 機械学習の公正性は、データとモデルの不正確さのバイアスが差別的な決定に結びつかないことを保証することを目的としている。
両問題を同時に処理できるアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 11:48:15 GMT)
Exploring Superpixel Segmentation Methods in the Context of Citizen Science and Deforestation Detection [0.0] 熱帯の森林は地球の生態系において重要な役割を担っている。
森林破壊と劣化は 彼らの存在に重大な脅威をもたらします
イニシアチブは、政府や民間セクターの監視プログラムから、市民科学キャンペーンに基づくソリューションまで、さまざまです。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 22:31:09 GMT)
Exploring Privacy and Security as Drivers for Environmental Sustainability in Cloud-Based Office Solutions (Extended Abstract) [0.0] 本稿では,クラウドベースのオフィスソリューションにおけるプライバシ,サイバーセキュリティ,環境影響の交わりについて検討する。
プライバシとセキュリティを重視したソリューションは,データ収集や広告を通じて調達したソリューションよりも“グリーン”である,という仮説を立てています。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:17:22 GMT)
Evaluating Tokenizer Performance of Large Language Models Across Official Indian Languages [0.0] 本稿では,12の大規模言語モデル (LLM) が使用するトークンの包括的評価を行った。
SUTRAトークンライザは、いくつかのIndic特化モデルを含む他のモデルよりも優れており、14言語で優れている。
本研究は,多言語およびインデックス中心モデルを対象としたトークン化戦略の開発において重要であることを示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:14:50 GMT)
Evaluating Generative AI-Enhanced Content: A Conceptual Framework Using Qualitative, Quantitative, and Mixed-Methods Approaches [0.0] Generative AI(GenAI)は、コンテント生成に革命をもたらし、言語コヒーレンス、可読性、全体的な品質を改善するためのトランスフォーメーション機能を提供する。
本論文は,GenAIモデルの性能評価のための定性的,定量的,混合方法論の研究アプローチの応用を探求する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 23:34:07 GMT)
Entanglement asymmetry in the Hayden-Preskill protocol [0.0] 本研究では,Hayden-Preskillシンキング実験におけるブラックホール放射のエンタングルメント非対称性の時間発展について考察する。
放射の$U(1)$対称性は、ある遷移時間の前に現れる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:59:09 GMT)
Enhancing Project Performance Forecasting using Machine Learning Techniques [0.0] 本研究は,プロジェクトパフォーマンス指標を予測するための機械学習に基づく手法を提案する。
天気パターンや資源の可用性などの外部要因を、予測の精度を高める機能として組み込んでいる。
本研究は,都市道路再建事業を事例として,提案手法の有効性を検証することを目的とする。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 22:09:55 GMT)
Efficient MPS representations and quantum circuits from the Fourier modes of classical image data [0.0] 高速に減衰するフーリエスペクトルを持つ古典的データは、シュミットランクの小さい状態によってよく近似できることを示す。
これらの近似状態は、隣り合う2量子ビットゲートの線形数を持つ量子コンピュータ上で準備することができる。
また、異なる変分回路のアンゼを考慮し、1次元のシーケンシャル回路がより強力なアンゼと同じ圧縮品質を達成できることを数値的に示す。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 00:09:45 GMT)
EchoDFKD: Data-Free Knowledge Distillation for Cardiac Ultrasound Segmentation using Synthetic Data [0.0] 本稿では, 実データおよび合成データに基づいて, 知識蒸留を専門に訓練したモデルを提案する。
我々は,終末期および終末期のフレームを識別するタスクにおいて,最先端のSOTA(State-of-the-art)値を得る。
また,人間のアノテーションを必要とせず,大規模な補助モデルに依存する新たな評価手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:36:25 GMT)
ECG-Based Patient Identification: A Comprehensive Evaluation Across Health and Activity Conditions [0.0] 本稿では,心電図信号を用いた医療システムにおける患者識別のための新しいアプローチを提案する。
畳み込みニューラルネットワーク(CNN)は、心電図信号から派生した特定のタイプの画像である心電図に基づいてユーザを分類するために使用される。
提案した同定システムは複数のデータベースで評価され、健常者では99.84%、循環器疾患では97.09%、健常者および不整脈患者では97.89%である。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 10:07:58 GMT)
Driving Enhanced Exciton Transfer by Automatic Differentiation [0.0] 各種ネットワークにおける励起,吸収,移動の過程について検討する。
外部共振励起を最適に吸収し、ネットワークを介して伝達する方法を検討する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 21:42:14 GMT)
Dissipative Forces in Photon-Medium Interactions Using Perturbation Theory [0.0] 本研究は、光子-ナトリウム相互作用における散逸力を研究するために、単一ヘリウム4原子に焦点をあてる。
結果は、量子情報処理の進歩、非線形光学、および量子流体の散逸機構の研究に潜在的に影響する可能性がある。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 21:40:00 GMT)
Diagnosing Hate Speech Classification: Where Do Humans and Machines Disagree, and Why? [0.0] 我々は、ヘイトスピーチ分類の診断にコサイン類似度比、埋め込み回帰、手動再注釈を用いる。
女性アノテーターは黒人を標的とする人種的なスラリーに敏感である。
機械が人間のアノテータと矛盾するところの診断において、機械は人間よりもミスが少ないことがわかった。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:28:54 GMT)
Designing the virtual CAT: A digital tool for algorithmic thinking assessment in compulsory education [0.0] アルゴリズム思考(英: Algorithmic Thinking、AT)は、今日のデジタル社会において重要なスキルである。
仮想クロスアレイタスク(CAT)の設計と開発プロセスについて述べる。
スイスの強制教育におけるアルゴリズムスキルの評価を目的とした、プラグのない評価活動のデジタル化である。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:05:55 GMT)
Cyclic measurements and simplified quantum state tomography [0.0] 我々は、全量子状態トモグラフィーを実行することができるサイクリック・タイトな測定の概念を導入する。
このタイプの測定は、物理系の量子状態を取得するのに必要な実験的なセットアップの複雑さを著しく単純化する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 12:04:45 GMT)
Creative Agents: Simulating the Systems Model of Creativity with Generative Agents [0.0] 仮想エージェントを用いた創造性のシステムモデルの実装とシミュレーションを行った。
その結果, 生成エージェントは, 創造性のシステムモデルにおいて, より優れた性能を発揮する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 03:06:04 GMT)
Convergence of a L2 regularized Policy Gradient Algorithm for the Multi Armed Bandit [0.0] 一方のマルチアームバンド(MAB)と他方のポリシー勾配アプローチは、強化学習の最もよく使われるフレームワークである。
この研究において、$L2$正規化項が'softmax'パラメトリゼーションと共同で存在する状況に対するそのような手順の収束について検討する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 09:54:59 GMT)
Conditional Variable Flow Matching: Transforming Conditional Densities with Amortized Conditional Optimal Transport [0.0] 本研究では,連続条件変数間のアモート化を伴う条件分布の変換を学習するフレームワークである条件変数フローマッチングを提案する。
CVFMは、離散的かつ連続的な条件付きマッピングベンチマーク、画像から画像へのドメイン転送、製造過程における材料内部構造の時間的進化をモデル化するなど、ますます困難な問題群で実証する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:34:21 GMT)
Combining Threat Intelligence with IoT Scanning to Predict Cyber Attack [0.0] 本研究では,ダークウェブ情報を収集・分析し,ハッカーのウェブサイトを識別する手法を提案する。
この方法論には情報収集、分析、可視化技術が含まれており、IoTデバイスの一部を利用している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 23:00:51 GMT)
Charging a Quantum Battery Mediated by Parity-Deformed Fields [0.0] クビット型オープン量子電池のワイヤレス充電性能に及ぼす環境場モードのパリティ変形の影響について検討した。
強い結合状態において、環境場のパリティ変形は、チャージャーバッテリ系の非マルコフ量子メモリをさらに引き起こすことができる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 16:12:10 GMT)
Barriers to Adopting Design for Assembly in Modular Product Architecture: Development of a Conceptual Model Through Content Analysis [0.0] 本研究は,MFD(Modular Function Deployment)法を用いて構築されたモジュール型製品アーキテクチャにおいて,アセンブリの原則を設計する上での障壁について検討する。
主な課題は、データ使用の規制要件の遵守、知的財産権の懸念、量的データの可用性の制限である。
本研究は,学術文献と産業実践の両面から知見を分析した結果,DFAをMFDに適用する際の主要な課題を記述した概念モデルを開発した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 08:18:45 GMT)
Automating Chapter-Level Classification for Electronic Theses and Dissertations [0.0] 本稿では,ETDチャプタを自動的に分類する機械学習とAI駆動型ソリューションを提案する。
この解決策は、発見可能性を改善し、章の理解を促進することを目的としている。
我々は、学際的な研究を支援し、ETDをよりアクセスしやすくすることを目指している。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:27:18 GMT)
Applying the quantum approximate optimization algorithm to general constraint satisfaction problems [0.0] ランダム制約満足度問題(CSP)に適用した場合に量子近似最適化(QAOA)の性能を解析するための理論的手法を開発する。
提案手法により,ランダムに生成されたCSPのインスタンスに適用した場合に,各レイヤとパラメータを用いてQAOAの成功確率を計算することができる。
ランダムな$k$-SATは、QAOAを用いた量子古典的分離を示す上で、これらのCSPの中で最も有望であると考えられる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:00:34 GMT)
Agentic AI for Improving Precision in Identifying Contributions to Sustainable Development Goals [0.0] 本研究では,学術出版物における国連の目標(UN)への関連する学術的貢献を特定するために,自己回帰型大規模言語モデル(LLM)を評価エージェントとして活用することを検討した。
ローカルにホストされた小さなLCMは、SDGターゲットに対する意味的に関連するコントリビューションを、従来のメソッドの制限に対処して、因果的キーワードマッチングによって検索された文書と区別できることを実証する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 17:06:30 GMT)
Adiabatic charging of open quantum battery [0.0] 我々は,3レベルQBの断熱充電を,断熱量子マスター方程式の定式化を用いて再検討する。
我々は, 貯蔵エネルギー, エルゴトロピー, およびQBの総進化時間依存性を解析した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 20:10:49 GMT)
Addressing Vulnerabilities in AI-Image Detection: Challenges and Proposed Solutions [0.0] 本研究では,AI生成画像の検出における畳み込みニューラルネットワーク(CNN)とDenseNetアーキテクチャの有効性を評価する。
本稿では,ガウスのぼかしやテキスト変更,ローランド適応(LoRA)などの更新や修正が検出精度に与える影響を解析する。
この発見は、現在の検出方法の脆弱性を強調し、AI画像検出システムの堅牢性と信頼性を高めるための戦略を提案する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 06:35:26 GMT)
A new architecture for high speed core-selective switch for multicore fibers [0.0] 高速なコア選択スイッチを構築するための新しいアーキテクチャを開発した。
デバイスはマルチコアの干渉に依存しており、出力は0.7 us未満で変更できる。
実環境下で機能するマルチコア光ファイバスイッチの動作を初めて実証した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:06:44 GMT)
A hierarchy of semidefinite programs for generalised Einstein-Podolsky-Rosen scenarios [0.0] アインシュタイン・ポドルスキー・ローゼン(EPR)のシナリオの相関は、非正規化量子状態のテクストアセンブラグによって捉えられ、最近、コミュニティの注目を集めている。
各レベルが量子アセンブリの集合の非メンバシップを決定するか、あるいは決定不能なテストの階層を導入する。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 02:02:03 GMT)
A Precisão da Metrologia Quântica: Limite de Cramér-Rao, Informação de Fisher e possíveis Aplicações Tecnológicas [0.0] 本稿では,古典的,量子的両方の基本的な原理を,できる限り実践的に探求する。
我々は、Cram'er-Rao境界とパラメータ推定の最大精度をどのように定義するかに焦点をあてる。
量子状態が古典的限界を超え、より精度の高い量子状態を実現する方法について論じる。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 18:01:06 GMT)
A Machine Learning-based Anomaly Detection Framework in Life Insurance Contracts [0.0] 生命保険は大量のデータに大きく依存している。
データベースに格納されたデータの完全性への信頼が不可欠です。
データ信頼性を保証する方法の1つは、異常の自動検出である。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 15:06:12 GMT)
A Graph Neural Network deep-dive into successful counterattacks [0.0] この研究は、性別固有のグラフニューラルネットワークを構築し、反撃が成功する可能性をモデル化する。
モデル性能に最も影響した特徴は, 置換特徴を用いて, 直線速度, ゴールへの角度, 球側線から横線への角度, などが示される。
この研究には、すべてのデータとコードを含むオープンソースリポジトリが伴い、オープンソースのPythonパッケージも伴っている。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 14:07:48 GMT)
"Give me the code" -- Log Analysis of First-Year CS Students' Interactions With GPT [0.0] 本稿では,69人の新入生がプロジェクト課題の中で特定のプログラミング問題を解くために用いたプロンプトを解析する。
本研究は,未解決のプロンプト技術を用いているにもかかわらず,ほとんどの学生がGPTをうまく活用できたことを示唆している。
学生の半数は、複数のGPT生成ソリューションから選択する際の判断を訓練する能力を示した。
論文参考訳(メタデータ) (Tue, 26 Nov 2024 20:11:46 GMT)