OASIS: Open Agents Social Interaction Simulations on One Million Agents [147.3] 実世界のソーシャルメディアプラットフォームに基づくスケーラブルなソーシャルメディアシミュレータを提案する。
OASISは最大100万人のユーザをモデリングできる大規模なユーザシミュレーションをサポートする。
我々は、情報拡散、グループ分極、XプラットフォームとRedditプラットフォーム間の群れ効果など、様々な社会現象を再現する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:57:35 GMT)
Exploring Context Window of Large Language Models via Decomposed Positional Vectors [107.2] トランスフォーマーベースの大規模言語モデル(LLM)は通常、限られたコンテキストウィンドウを持つ。
本研究では,コンテキストウィンドウ内外の位置情報について検討する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:15:56 GMT)
LaVin-DiT: Large Vision Diffusion Transformer [100.0] LaVin-DiTは、20以上のコンピュータビジョンタスクを生成フレームワークで扱うために設計された、スケーラブルで統一された基盤モデルである。
視覚タスクの生成性能を最適化するための重要なイノベーションを紹介する。
このモデルは0.1Bから3.4Bのパラメータに拡張され、様々な視覚タスクにまたがる相当なスケーラビリティと最先端の性能を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:05:27 GMT)
Technical Report: Enhancing LLM Reasoning with Reward-guided Tree Search [95.1] o1のような推論アプローチは困難で、研究者はこのオープンな研究領域を前進させようとさまざまな試みを行ってきた。
本稿では,報酬誘導木探索アルゴリズムを用いて,LLMの推論能力を高めるための予備的な検討を行う。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:15:17 GMT)
Alien Recombination: Exploring Concept Blends Beyond Human Cognitive Availability in Visual Art [90.9] 視覚芸術の創造において、AIが人間の認知的限界を超越する方法を示します。
我々の研究は、視覚芸術には膨大な未探索の概念的組み合わせが含まれているという仮説を立てている。
本稿では,人間の認知能力を超えた概念の組み合わせを同定し,生成するエイリアン組換え法を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:55:38 GMT)
The Sound of Water: Inferring Physical Properties from Pouring Liquids [85.3] 注水液の音響・視覚観測と物理の関連性について検討した。
本研究の目的は, 液位, 容器形状, 注水速度, 充填時間などの物性を自動的に推定することである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:19:37 GMT)
What Do Learning Dynamics Reveal About Generalization in LLM Reasoning? [83.8] モデルの一般化動作は,事前記憶列車の精度と呼ばれるトレーニング指標によって効果的に特徴づけられることがわかった。
モデルの学習行動と一般化を結びつけることで、トレーニング戦略に目標とする改善を導くことができる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:49:59 GMT)
Uncovering Hidden Connections: Iterative Search and Reasoning for Video-grounded Dialog [83.6] ビデオグラウンドダイアログは、正確な応答生成のために、ダイアログ履歴とビデオコンテンツの両方を深く理解する必要がある。
本稿では,テキストエンコーダ,ビジュアルエンコーダ,ジェネレータで構成される反復探索・推論フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:18:14 GMT)
Identifying and Addressing Delusions for Target-Directed Decision-Making [81.2] ターゲット指向のエージェントは、問題のあるターゲットを盲目的に追跡する傾向があり、その結果、より一層の一般化と安全性の破滅が生じる。
これらの行動は、トレーニングに関する不適切な設計から生じる妄想の結果であることを示す。
我々は、エージェントが先制的かつ自律的に妄想に対処する方法を実証する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:40:57 GMT)
Safe + Safe = Unsafe? Exploring How Safe Images Can Be Exploited to Jailbreak Large Vision-Language Models [80.8] Safety Snowball Agent (SSA) は、エージェントの自律的およびツール使用能力をジェイルブレイクLVLMに活用する新しいエージェントベースのフレームワークである。
我々の実験では、ほぼすべての画像を用いてLVLMを誘導し、安全でないコンテンツを生成し、最新のLVLMに対して高いジェイルブレイク率を達成できることを示した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:58:07 GMT)
T-GAE: Transferable Graph Autoencoder for Network Alignment [79.9] T-GAEはグラフオートエンコーダフレームワークで、GNNの転送性と安定性を活用して、再トレーニングなしに効率的なネットワークアライメントを実現する。
実験の結果、T-GAEは最先端の最適化手法と最高のGNN手法を最大38.7%、50.8%で上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 22:05:04 GMT)
PerfCodeGen: Improving Performance of LLM Generated Code with Execution Feedback [78.9] 大規模言語モデル(LLM)は、ソフトウェア開発タスクを支援するために広く採用されている。
LLM生成コードの性能を向上させるトレーニングフリーフレームワークPerfCodeGenを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:22:38 GMT)
ArtWeaver: Advanced Dynamic Style Integration via Diffusion Model [74.0] Stylized Text-to-Image Generation (STIG)は、テキストプロンプトとスタイル参照画像から画像を生成することを目的としている。
我々は、事前訓練された安定拡散を利用して、誤解釈スタイルや一貫性のない意味論といった課題に対処する新しいフレームワーク、ArtWeaverを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:35:46 GMT)
To what extent can ASV systems naturally defend against spoofing attacks? [73.1] 本研究は, ASV がスプーフィング攻撃に対して頑強に堅牢性を得るか否かを考察する。
ASVの進化は本質的にスプーフ攻撃に対する防御機構を組み込んでいることを実証する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:46:11 GMT)
DeSiRe-GS: 4D Street Gaussians for Static-Dynamic Decomposition and Surface Reconstruction for Urban Driving Scenes [71.6] 本稿では,自己教師型ガウススプラッティング表現であるDeSiRe-GSについて述べる。
複雑な駆動シナリオにおいて、効率的な静的・動的分解と高忠実な表面再構成を可能にする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:49:16 GMT)
AtomThink: A Slow Thinking Framework for Multimodal Mathematical Reasoning [71.0] AtomThinkは、長い思考の連鎖(CoT)をステップバイステップで構築するフレームワークであり、複雑な推論を行うためのMLLMを導く。
AtomMATHは、長いCoTの大規模マルチモーダルデータセットであり、数学的タスクの原子能力評価指標である。
AtomThinkはベースラインMLLMの性能を大幅に改善し、MathVistaでは50%、MathVerseでは120%の精度向上を実現している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:54:58 GMT)
Exploring the Adversarial Vulnerabilities of Vision-Language-Action Models in Robotics [70.9] 本稿では,VLAに基づくロボットシステムのロバスト性を体系的に評価する。
本研究では,ロボット行動の不安定化に空間的基盤を活用する,標的のない位置認識型攻撃目標を提案する。
また、カメラの視野内に小さなカラフルなパッチを配置し、デジタル環境と物理環境の両方で効果的に攻撃を実行する逆パッチ生成アプローチを設計する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:52:20 GMT)
Semantic or Covariate? A Study on the Intractable Case of Out-of-Distribution Detection [70.6] ID分布のセマンティック空間をより正確に定義する。
また,OOD と ID の区別性を保証する "Tractable OOD" の設定も定義する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:09:39 GMT)
A Fair Loss Function for Network Pruning [70.4] 本稿では, 刈り込み時のバイアスの抑制に使用できる簡易な改良型クロスエントロピー損失関数である, 性能重み付き損失関数を提案する。
CelebA、Fitzpatrick17k、CIFAR-10データセットを用いた実験は、提案手法が単純で効果的なツールであることを実証している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:50:46 GMT)
Incorporating Arbitrary Matrix Group Equivariance into KANs [69.3] Kolmogorov-Arnold Networks (KAN) は科学分野で大きな成功を収めている。
しかし、スプライン関数は、機械学習において重要な事前知識であるタスクの対称性を尊重しないかもしれない。
本研究では,Equivariant Kolmogorov-Arnold Networks (EKAN)を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 04:28:09 GMT)
Utilize the Flow before Stepping into the Same River Twice: Certainty Represented Knowledge Flow for Refusal-Aware Instruction Tuning [68.6] Refusal-Aware Instruction Tuning (RAIT) により、Large Language Models (LLM) は未知の質問に答えることを拒否できる。
RAITは、初期LCMの応答の正しさに基づいてトレーニングサンプルを変更する。
この粗末なアプローチは、LLMが正しく答えられる可能性のある質問に答えることを過剰に拒否する可能性がある。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:15:41 GMT)
ConU: Conformal Uncertainty in Large Language Models with Correctness Coverage Guarantees [68.3] 自己整合性理論に基づく新しい不確実性尺度を導入する。
次に,CPアルゴリズムに正当性に整合した不確かさ条件を組み込むことにより,適合性不確かさの基準を策定する。
実証的な評価は、我々の不確実性測定が過去の最先端手法よりも優れていることを示している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:33:35 GMT)
GPS-Gaussian+: Generalizable Pixel-wise 3D Gaussian Splatting for Real-Time Human-Scene Rendering from Sparse Views [67.3] スパースビューカメラ設定下での高解像度画像レンダリングのための一般化可能なガウススプラッティング手法を提案する。
我々は,人間のみのデータや人景データに基づいてガウスパラメータ回帰モジュールをトレーニングし,深度推定モジュールと共同で2次元パラメータマップを3次元空間に引き上げる。
いくつかのデータセットに対する実験により、我々の手法はレンダリング速度を超越しながら最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:18:44 GMT)
CausalDiff: Causality-Inspired Disentanglement via Diffusion Model for Adversarial Defense [61.8] 人間は、本質的な要因のみに基づいて判断するので、微妙な操作によって騙されるのは難しい。
この観察に触発されて、本質的なラベル因果因子を用いたラベル生成をモデル化し、ラベル非因果因子を組み込んでデータ生成を支援する。
逆の例では、摂動を非因果因子として識別し、ラベル因果因子のみに基づいて予測することを目的としている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:06:52 GMT)
Dual-Frequency Filtering Self-aware Graph Neural Networks for Homophilic and Heterophilic Graphs [60.8] 我々は、Dual-Frequency Filtering Self-Aware Graph Neural Networks (DFGNN)を提案する。
DFGNNは低域通過フィルタと高域通過フィルタを統合し、滑らかで詳細な位相的特徴を抽出する。
フィルター比を動的に調整し、ホモフィルグラフとヘテロフィルグラフの両方に対応する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 04:57:05 GMT)
SOFTS: Efficient Multivariate Time Series Forecasting with Series-Core Fusion [60.0] 時系列予測は、金融、交通管理、エネルギー、医療など様々な分野で重要な役割を果たしている。
いくつかの方法は、注意やミキサーのようなメカニズムを利用して、チャネル相関をキャプチャすることでこの問題に対処する。
本稿では,効率的なモデルであるSOFTS(Series-cOre Fused Time Series forecaster)を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:41:59 GMT)
Batch-Size Independent Regret Bounds for Combinatorial Semi-Bandits with Probabilistically Triggered Arms or Independent Arms [59.8] 半帯域 (CMAB) について検討し, 半帯域 (CMAB) におけるバッチサイズ (K$) の依存性の低減に着目した。
まず,確率的に引き起こされるアーム(CMAB-T)を用いたCMABの設定に対して,分散を考慮した信頼区間を持つBCUCB-Tアルゴリズムを提案する。
次に,独立アームを用いた非トリガ型CMABの設定に対して,TPVM条件の非トリガ型を利用したSESCBアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:30:05 GMT)
Towards Open-Vocabulary Audio-Visual Event Localization [59.2] 本稿では,オープン語彙音声・視覚イベントのローカライズ問題を紹介する。
この問題は、音声・視覚イベントのローカライズと、推測時に見つからないデータの両方の明確なカテゴリの予測を必要とする。
OV-AVEBenchデータセットを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 04:35:20 GMT)
Character is Destiny: Can Role-Playing Language Agents Make Persona-Driven Decisions? [59.0] 我々は、ペルソナ駆動意思決定におけるLarge Language Models(LLM)の能力をベンチマークする。
高品質な小説において, LLM が先行する物語のキャラクターの判断を予測できるかどうかを検討する。
その結果、現状のLLMは、このタスクに有望な能力を示すが、改善の余地は残されている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:29:47 GMT)
Grounded 3D-LLM with Referent Tokens [58.9] そこで我々は,Grounded 3D-LLMを提案する。
このモデルは、3Dシーンを参照するために特別な名詞句としてシーン参照トークンを使用する。
タスクごとの指示追従テンプレートは、3D視覚タスクを言語形式に翻訳する際の自然と多様性を保証するために使用される。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:29:08 GMT)
Combinatorial Multivariant Multi-Armed Bandits with Applications to Episodic Reinforcement Learning and Beyond [58.4] CMAB(Multi-armed bandits)の多変量および確率的トリガーアーム(CMAB-MT)を用いた新しい枠組みを導入する。
CMAB-MTは既存のCMABと比べ、モデリング能力を高めるだけでなく、多変量確率変数の異なる統計特性を活用することで結果を改善することができる。
本フレームワークは, エピソード強化学習(RL)や商品分布の確率的最大カバレッジなど, 応用として多くの重要な問題を含むことができる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 22:18:03 GMT)
Towards Degradation-Robust Reconstruction in Generalizable NeRF [58.3] GNeRF(Generalizable Radiance Field)は,シーンごとの最適化を回避する手段として有効であることが証明されている。
GNeRFの強靭性は, ソース画像に現れる様々な種類の劣化に対して限定的に研究されている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:13:47 GMT)
A Comprehensive Survey of Forgetting in Deep Learning Beyond Continual Learning [58.1] 蓄積とは、以前に獲得した知識の喪失または劣化を指す。
フォッテッティングは、深層学習における様々な研究領域でよく見られる現象である。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:26:41 GMT)
SciInstruct: a Self-Reflective Instruction Annotated Dataset for Training Scientific Language Models [58.0] 我々はSciInstructを紹介した。SciInstructは、大学レベルの科学的推論が可能な科学言語モデルを訓練するための科学指導スイートである。
我々は、物理学、化学、数学、公式な証明を含む多種多様な高品質なデータセットをキュレートした。
SciInstructの有効性を検証するため、SciInstruct、すなわちChatGLM3(6Bと32B)、Llama3-8B-Instruct、Mistral-7B: MetaMathを用いて言語モデルを微調整した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:30:50 GMT)
RP1M: A Large-Scale Motion Dataset for Piano Playing with Bi-Manual Dexterous Robot Hands [57.6] ロボットピアノ100万のデータセットには,100万回以上の軌跡の動作データをバイマニュアルで演奏するロボットピアノが組み込まれている。
指の配置を最適な移動問題として定式化し、大量の未収録曲の自動アノテーションを可能にする。
既存の模倣学習手法のベンチマークでは、RP1Mを活用することにより、最先端のロボットピアノ演奏性能に達することが示されている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:14:22 GMT)
Fine-Grained Verifiers: Preference Modeling as Next-token Prediction in Vision-Language Alignment [57.0] 本研究では,視覚言語アライメントを改善するための細粒度検証器として,モデル自身のビジュアルエンコーダを利用する新たな自己アライメント手法であるFiSAOを提案する。
ビジョンエンコーダからのトークンレベルのフィードバックを活用することで、FiSAOは視覚言語アライメントを大幅に改善する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:58:16 GMT)
Modulating Language Model Experiences through Frictions [56.2] 言語モデルの過度な消費は、短期において未確認エラーを伝播し、長期的な批判的思考のために人間の能力を損なうリスクを出力する。
行動科学の介入にインスパイアされた言語モデル体験のための選択的摩擦を提案し,誤用を抑える。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:41:24 GMT)
Partial Scene Text Retrieval [56.1] 部分的なシーンテキスト検索のタスクは、画像ギャラリーから与えられたクエリテキストと同一または類似のテキストインスタンスをローカライズして検索することである。
既存のメソッドはテキストラインインスタンスのみを扱うことができ、部分パッチの検索は未解決のままである。
テキストラインインスタンスと部分パッチの両方を同時に検索できるネットワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:43:25 GMT)
Clustering and Ranking: Diversity-preserved Instruction Selection through Expert-aligned Quality Estimation [56.1] 本稿では,産業に優しく,専門家に順応し,多様性に配慮した指導データ選択手法を提案する:クラスタリングとランキング(CaR)
CaRは2段階のプロセスを採用している: まず、専門家の好みに合わせた高精度(84.25%)のスコアリングモデルを使用して、命令ペアをランク付けする。
我々の実験では、CaRはAlpacaのITデータのわずか1.96%を効率よく選択したが、結果のAlpaCaRモデルはGPT-4の評価において平均32.1%の精度でAlpacaのパフォーマンスを上回った。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:26:51 GMT)
MoE-Lightning: High-Throughput MoE Inference on Memory-constrained GPUs [56.0] MoEアーキテクチャは、推論コストの比例的な増加なしにモデルキャパシティを向上できることで有名である。
MoE-LightningはCPU-GPU-I/OパイプラインスケジュールであるCGOPipeを導入し、ページ重み付けにより高いリソース利用を実現する。
MoE-Lightningは、単一のT4 GPU(16GB)上でMixtral 8x7Bの最先端オフロード可能なLLM推論システムよりも最大10.3倍高いスループットを実現することができる
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:06:12 GMT)
Contextual Combinatorial Bandits with Probabilistically Triggered Arms [55.9] 確率的に誘発される腕(C$2$MAB-T)を様々な滑らかさ条件下で検討した。
トリガー変調 (TPM) 条件の下では、C$2$-UC-Tアルゴリズムを考案し、後悔すべき$tildeO(dsqrtT)$を導出する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:26:10 GMT)
Open Domain Question Answering with Conflicting Contexts [55.7] あいまいでオープンなドメインの質問の25%は、Google Searchを使って検索すると、コンフリクトのあるコンテキストにつながります。
我々はアノテータに正しい回答の選択についての説明を依頼する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:23:42 GMT)
MSSIDD: A Benchmark for Multi-Sensor Denoising [55.4] 我々は,マルチセンサSIDDデータセットという新しいベンチマークを導入する。これは,認知モデルのセンサ伝達性を評価するために設計された,最初の生ドメインデータセットである。
そこで本研究では,センサに不変な特徴を認知モデルで学習することのできるセンサ一貫性トレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:32:59 GMT)
Fingerprinting and Tracing Shadows: The Development and Impact of Browser Fingerprinting on Digital Privacy [55.2] ブラウザのフィンガープリントは、クッキーのような従来の方法なしでオンラインでユーザーを特定し、追跡するテクニックとして成長している。
本稿では, 各種指紋認証技術について概説し, 収集データのエントロピーと特異性を解析する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:32:31 GMT)
Continual Task Learning through Adaptive Policy Self-Composition [55.0] CompoFormerは構造ベースの連続トランスフォーマーモデルであり、メタポリシックネットワークを介して、以前のポリシーを適応的に構成する。
実験の結果,CompoFormerは従来の継続学習法(CL)よりも優れており,特にタスクシーケンスが長いことが判明した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:20:21 GMT)
Straightness of Rectified Flow: A Theoretical Insight into Wasserstein Convergence [54.6] 拡散モデルは画像生成とデノナイズのための強力なツールとして登場した。
最近、Liuらは新しい代替生成モデル Rectified Flow (RF) を設計した。
RFは,一連の凸最適化問題を用いて,ノイズからデータへの直流軌跡の学習を目的としている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:35:52 GMT)
DrivingSphere: Building a High-fidelity 4D World for Closed-loop Simulation [54.0] 本研究では,現実的でクローズドループなシミュレーションフレームワークであるDrivingSphereを提案する。
その中核となる考え方は、4Dの世界表現を構築し、実生活と制御可能な運転シナリオを生成することである。
動的で現実的なシミュレーション環境を提供することで、DrivingSphereは自律運転アルゴリズムの包括的なテストと検証を可能にする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:00:33 GMT)
GLDesigner: Leveraging Multi-Modal LLMs as Designer for Enhanced Aesthetic Text Glyph Layouts [53.6] コンテンツ対応のテキストロゴレイアウトを生成するVLMベースのフレームワークを提案する。
本稿では,複数のグリフ画像の同時処理における計算量を削減するための2つのモデル手法を提案する。
アウトモデルのインストラクションチューニングを支援するために,既存の公開データセットよりも5倍大きい2つの拡張テキストロゴデータセットを構築した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:04:10 GMT)
Retrieval-Augmented Personalization for Multimodal Large Language Models [53.3] 本稿では,MLLMのパーソナライズのためのRAP(Retrieval Augmented Personalization)フレームワークを紹介する。
RAPは、外部データベースを更新することで、リアルタイムの概念編集を可能にする。
RAP-MLLMは、追加の微調整なしで無限の視覚概念に一般化することができる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:35:14 GMT)
Optimized Feature Generation for Tabular Data via LLMs with Decision Tree Reasoning [53.2] 本稿では,大規模言語モデル(LLM)を用いて,効率的な特徴生成ルールを同定するフレームワークを提案する。
我々は、自然言語で容易に表現できるため、この推論情報を伝達するために決定木を使用します。
OCTreeは様々なベンチマークで様々な予測モデルの性能を継続的に向上させる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:47:10 GMT)
MEMO-Bench: A Multiple Benchmark for Text-to-Image and Multimodal Large Language Models on Human Emotion Analysis [53.0] そこで本研究では、7,145枚の肖像画からなる総合的なベンチマークであるMEMO-Benchを紹介した。
以上の結果から,既存のT2Iモデルは負のモデルよりも肯定的な感情を生成するのに効果的であることが示唆された。
MLLMは人間の感情の識別と認識に一定の効果を示すが、人間のレベルの正確さには欠ける。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:09:48 GMT)
MatchTime: Towards Automatic Soccer Game Commentary Generation [52.4] 観客の視聴体験を改善するために,自動サッカーゲーム解説モデルの構築を検討する。
まず、既存のデータセットでよく見られるビデオテキストのミスアライメントを観察し、49試合のタイムスタンプを手動でアノテートする。
第2に,既存のデータセットを自動的に修正・フィルタリングするマルチモーダル時間アライメントパイプラインを提案する。
第3に、キュレートされたデータセットに基づいて、MatchVoiceという自動コメント生成モデルをトレーニングします。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 04:45:19 GMT)
Rendering-Oriented 3D Point Cloud Attribute Compression using Sparse Tensor-based Transformer [52.4] 3D視覚化技術は、私たちがデジタルコンテンツと対話する方法を根本的に変えてきた。
ポイントクラウドの大規模データサイズは、データ圧縮において大きな課題を呈している。
そこで我々はPCACと差別化可能なレンダリングをシームレスに統合するエンドツーエンドのディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:13:24 GMT)
RAWMamba: Unified sRGB-to-RAW De-rendering With State Space Model [52.3] 本稿では, sRGB-to-RAWデレンダリングのための統一フレームワークであるRAWMambaを提案する。
RAWMambaのコアはUnified Metadata Embedding (UME)モジュールである。
Local Tone-Aware Mambaモジュールは、メタデータの効果的なグローバルな伝搬を可能にするために、長距離依存関係をキャプチャする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:45:44 GMT)
Word-Sequence Entropy: Towards Uncertainty Estimation in Free-Form Medical Question Answering Applications and Beyond [52.2] 本稿ではワードシーケンスエントロピー(WSE)を紹介し,単語レベルとシーケンスレベルの不確実性を校正する手法を提案する。
We compare WSE with six baseline method on five free-form medical QA datasets, using 7 popular large language model (LLMs)。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:19:25 GMT)
A Theoretical Understanding of Self-Correction through In-context Alignment [51.6] 大規模言語モデル(LLM)は自己補正によって純粋に能力を向上させることができる。
LLMが比較的正確な自己評価を報酬として与える場合、文脈内応答を補充できることを示す。
これらの知見に触発されて,LLMジェイルブレイクに対する防御などの自己補正の応用についても解説した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:42:23 GMT)
Python is Not Always the Best Choice: Embracing Multilingual Program of Thoughts [51.5] 本稿では,多言語からの強みと多様性を生かしたMultiPoTというタスクとモデル非依存のアプローチを提案する。
実験の結果、Python Self-Consistencyを著しく上回ることがわかった。
特にMultiPoTはChatGPT(gpt-3.5-turbo-0701)で平均4.6%以上の改善を実現している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:53:03 GMT)
A survey and taxonomy of loss functions in machine learning [51.4] 本稿では, 回帰, 分類, 生成モデル, ランキング, エネルギーベースモデリングなど, 主要なアプリケーションにまたがる最も広く使われている損失関数について概観する。
直感的な分類法で構築された43個の個別の損失関数を導入し,それらの理論的基礎,特性,最適な適用状況を明らかにした。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:01:29 GMT)
Search, Verify and Feedback: Towards Next Generation Post-training Paradigm of Foundation Models via Verifier Engineering [51.3] 検証工学は、基礎モデルの時代のために特別に設計された新しいポストトレーニングパラダイムである。
検証工学のプロセスは,検索,検証,フィードバックの3段階に分類する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:04:52 GMT)
How Unique is Whose Web Browser? The role of demographics in browser fingerprinting among US users [50.7] ブラウザのフィンガープリントは、クッキーを使わずとも、Web上のユーザを識別し、追跡するために利用できる。
この技術と結果として生じるプライバシーリスクは10年以上にわたって研究されてきた。
我々は、さらなる研究を可能にするファースト・オブ・ザ・キンド・データセットを提供する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:06:57 GMT)
ReST-MCTS*: LLM Self-Training via Process Reward Guided Tree Search [50.5] ReST-MCTS*と呼ばれる強化された自己学習手法を開発し、プロセス報酬指導と木探索MCTS*を統合して、高品質な推論トレースを収集し、ポリシーや報酬モデルにステップごとの価値を学習する。
ReST-MCTS* における木探索ポリシーは,Best-of-N や Tree-of-Thought といった従来の LLM 推論ベースラインと比較して,同じ検索予算内で高い精度を達成できることを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:36:16 GMT)
Teaching Video Diffusion Model with Latent Physical Phenomenon Knowledge [49.6] 本稿では,物理現象の知識が潜むビデオ拡散モデルを教える新しい手法を提案する。
CLIPビジョンと言語エンコーダの空間的関係に基づいて擬似言語プロンプトを生成する。
物理現象の数値シミュレーションと実世界観測の両方を通して,本手法を広範囲に検証した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:26:09 GMT)
Towards Evaluating Large Language Models for Graph Query Generation [49.5] 大言語モデル(LLM)は、生成人工知能(GenAI)の景観に革命をもたらしている
本稿では,オープンアクセス LLM を用いてグラフデータベースと対話する強力な言語としてクエリを生成することの課題について比較検討する。
クエリ生成精度を実証的に分析したところ、Claude Sonnet 3.5は特定のドメインでそれよりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:57:04 GMT)
MagicStick: Controllable Video Editing via Control Handle Transformations [49.3] MagicStickは、抽出した内部制御信号の変換を利用してビデオプロパティを編集する、制御可能なビデオ編集方法である。
統合フレームワークにおける多数の実例について実験を行った。
また、形状対応テキストベースの編集や手作り動画生成と比較し、従来の作品よりも優れた時間的一貫性と編集能力を示した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:39:00 GMT)
Benchmarking and Building Long-Context Retrieval Models with LoCo and M2-BERT [48.4] 検索パイプラインは、文書が長い(例えば10Kトークン以上)ドメインや、関連する文書を識別する場合は、テキスト全体にわたって情報を合成する必要がある。
これらのドメインに適した長文検索エンコーダを開発する。
LoCoV1は,チャンキングが不可能か有効でない場合の長文検索のための新しい12タスクベンチマークである。
次に、M2-BERT検索エンコーダについて述べる。M2-BERT検索エンコーダは、Monarch Mixerアーキテクチャから構築された80Mパラメータの状態空間エンコーダモデルであり、最大32Kトークンまで拡張可能である。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:52:49 GMT)
A Complete Survey on LLM-based AI Chatbots [46.2] 過去数十年間、データの増加を目撃し、データ収集、学習ベースのAI技術の基礎を築いた。
AIチャットボットと呼ばれる会話エージェントは、大きな言語モデル(LLM)をトレーニングし、ユーザのプロンプトに応じて新しいコンテンツ(知識)を生成するために、そのようなデータに大きく依存している。
本稿では,様々な分野におけるLLMベースのチャットボットの進化と展開に関する完全な調査を行う。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:36:13 GMT)
SoGAR: Self-supervised Spatiotemporal Attention-based Social Group Activity Recognition [45.4] 本稿では,自己教師型トランスフォーマーを用いた社会グループ活動(SoGAR)の新たなアプローチを提案する。
我々の目的は、対照的な視点から抽出された特徴が、自己時間領域間で一貫していることを保証する。
提案手法は, 3つのグループアクティビティ認識ベンチマークにおいて, 最先端の結果を得た。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:03:35 GMT)
Validation tests of Gaussian boson samplers with photon-number resolving detectors [45.0] 我々は位相空間シミュレーション法を適用し、光子数分解(PNR)検出器を実装したガウスボソンサンプリング(GBS)の最近の実験を部分的に検証する。
全体としては,完全スクイーズのための理論的予測と相違点が示される。
このような検証テストは,GBS量子コンピュータ実験を改善するためのフィードバック手法の基礎となる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:41:22 GMT)
Federated Graph Condensation with Information Bottleneck Principles [44.4] グラフニューラルネットワーク(GNN)におけるフェデレーショングラフ凝縮の新しい問題を提案し,研究する。
グラフ凝縮の典型的な勾配マッチングプロセスをクライアント側勾配計算とサーバ側勾配マッチングに分離する。
私たちのフレームワークは、トレーニング中のメンバシップのプライバシを一貫して保護することができます。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:17:56 GMT)
MC-LLaVA: Multi-Concept Personalized Vision-Language Model [44.3] 現在の視覚言語モデル(VLM)は、視覚的質問応答を含む様々なタスクにまたがる例外的な能力を示している。
本稿では,MC-LLaVA と呼ばれるマルチコンセプトパーソナライズ手法と高品質なマルチコンセプトパーソナライズデータセットを提案する。
我々は、MC-LLaVAが印象的なマルチコンセプトパーソナライズされた応答を達成できることを実証するために、総合的な質的、定量的な実験を行う。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:33:52 GMT)
BONE: a unifying framework for Bayesian online learning in non-stationary environments [44.3] BONE は (B)ayesian (O)nline learning in (N)on-stationary (E)nvironments の略である。
BONEは、オンライン学習、事前予測、文脈的盗賊など、さまざまな問題に対処するための共通の構造を提供する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:16:14 GMT)
DEFT: Efficient Fine-Tuning of Diffusion Models by Learning the Generalised $h$-transform [44.3] DFT(Doob's h-transform Efficient FineTuning)は、非常に小さなネットワークを微調整して条件付き$h$-transformを高速に学習する条件生成手法である。
画像再構成作業では, 自然画像の知覚品質と医用画像の再現性能を最良に保ちながら, 最大1.6$times$の高速化を実現している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:11:11 GMT)
Domain walls from SPT-sewing [43.9] 1d SPT相と非可逆な$Gtimes textRep(G)times G$対称性と群$G$に付随する量子二重の可逆領域壁との対応性を提案する。
また、3dトーリック符号の新規なエキゾチックなドメインウォールであるエンファンチョリングドメインウォールを,これらのドメインウォールに固定された半ループ的なエキゾチックなエキゾチックなエキゾチックなエキゾチックなエキゾチックなエキゾチックなエキゾチックなエキゾチックなエキゾチックなエキゾチックなエキゾチックなエキゾチックなエキゾチックなエキゾチックなエキゾチックなエキゾチックなエキゾチックなエキゾチックなエキゾチックなエキゾチックなエキゾチックなドメインウォールを構築するために,本手法を用いた。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:00:16 GMT)
Robust Reinforcement Learning under Diffusion Models for Data with Jumps [43.6] 本稿では,MSBVE(Mean-Square Bipower Variation Error)アルゴリズムを提案する。
我々はまず,連続時間RLで一般的に使用される平均平方TDエラー(MSTDE)アルゴリズムを再検討し,状態ダイナミクスのジャンプ処理における制限を強調した。
提案したMSBVEアルゴリズムは平均2乗2乗変動誤差を最小化し,ジャンプを伴うSDEを特徴とする環境におけるMSTDEよりも優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:17:34 GMT)
V2X-R: Cooperative LiDAR-4D Radar Fusion for 3D Object Detection with Denoising Diffusion [43.6] 我々は、LiDAR、カメラ、および4Dレーダを取り入れた初のシミュレーションV2XデータセットであるV2X-Rを提案する。
V2X-Rには12,079のシナリオがあり、LiDARと4Dレーダーポイント雲の37,727フレーム、150,908の画像、170,859の注釈付き3D車両バウンディングボックスがある。
本稿では,3次元物体検出のための新しいコラボレーティブLiDAR-4Dレーダ融合パイプラインを提案し,様々な融合戦略を用いて実装する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:54:54 GMT)
FLMarket: Enabling Privacy-preserved Pre-training Data Pricing for Federated Learning [42.8] 本稿では,2段階のオークションベースの価格設定機構をセキュリティプロトコルに統合し,ユーティリティとプライバシの対立に対処するFLMarketを提案する。
FLMarketによるクライアント選択は、最新手法と比較して、その後のFLトレーニングにおいて10%以上の精度を達成可能であることを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:37:41 GMT)
PEAC: Unsupervised Pre-training for Cross-Embodiment Reinforcement Learning [42.4] 本稿では,教師なし学習を活用したクロス・エボディメント・アントラクショナル・RL(CEURL)の概念を導入し,エージェントがエンボディメント・アウェアやタスク非依存の知識を習得できるようにする。
我々はCEURLを扱うための新しいアルゴリズムPEAC(Pre-trained Embodiment-Aware Control)を開発し、クロス・エボディメント・プレトレーニング用に特別に設計された本質的な報酬関数を組み込んだ。
PEACは適応性能とクロスエボディメントの一般化を著しく改善し、CEURLのユニークな課題を克服する効果を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:06:10 GMT)
Molecule Generation with Fragment Retrieval Augmentation [42.0] Fragment Retrieval-Augmented Generation (f-RAG) は、新しい分子の完成と生成のための新たなフラグメントを提案する事前訓練された分子生成モデルに基づいている。
既存のフラグメントを超えて外挿するために、f-RAGは、反復的な洗練プロセスを通じて生成されたフラグメントでフラグメント語彙を更新する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:43:52 GMT)
GradCraft: Elevating Multi-task Recommendations through Holistic Gradient Crafting [41.7] 既存のマルチタスク学習手法は、推薦シナリオの特定の特徴を見落としている。
そこで我々は,GradCraftという革新的な方法論を提案する。
GradCraftは勾配を動的に調整し、最大勾配ノルムに合わせて調整する。
その後、全ての矛盾するタスクを同時に考慮しながら、方向の勾配の衝突を除去するためにプロジェクションを使用する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:25:14 GMT)
Exploring LLMs for Verifying Technical System Specifications Against Requirements [41.2] 知識に基づく要求工学(KBRE)の分野は、システム要件の活用、検証、管理を支援する知識を提供することによって、技術者を支援することを目的としている。
大規模言語モデル(LLM)の出現はKBREの分野で新たな機会を開く。
本研究は, LLMの要件検証における可能性について実験的に検討する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:59:29 GMT)
GNN-Based Code Annotation Logic for Establishing Security Boundaries in C Code [41.1] 今日の相互接続されたソフトウェアランドスケープにおけるセンシティブなオペレーションの確保は、非常に難しいものです。
現代のプラットフォームは、セキュリティに敏感なコードをメインシステムから分離するために、Trusted Execution Environments (TEEs) に依存している。
Code Logic(CAL)は、TEE分離のためのセキュリティに敏感なコンポーネントを自動的に識別する先駆的なツールである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:40:03 GMT)
Zero-Shot Load Forecasting with Large Language Models [40.6] 本稿では,Chronos モデルで表される高度な LLM フレームワークを用いたゼロショット負荷予測手法を提案する。
トレーニング済みの広範な知識を利用することで、Chronosモデルは、広範なデータ固有のトレーニングを必要とせずに、データスカースシナリオの正確な負荷予測を可能にする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:39:46 GMT)
Medical Video Generation for Disease Progression Simulation [40.4] 疾患関連画像と映像の特徴を制御できる第1の医用ビデオ生成フレームワークを提案する。
胸部X線,眼底写真,皮膚画像の3領域にまたがる枠組みを検証した。
MVGは、コヒーレントで臨床的に妥当な疾患軌跡を発生させる上で、ベースラインモデルよりも著しく優れている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:37:09 GMT)
Noise Filtering Benchmark for Neuromorphic Satellites Observations [39.8] イベントカメラはスパース、高時間分解能、高ダイナミックレンジ、低消費電力、スパースデータ出力を提供する非同期の輝度変化をキャプチャする。
これらの利点は、特に望遠鏡の視野内を移動する常駐の宇宙物体を検出するのに、宇宙状況認識に理想的である。
しかしながら、イベントカメラからの出力は、しばしば、低照度条件でより多く見られる背景活動ノイズを含む。
このノイズは衛星信号によって発生するスパース事象を圧倒し、検出と追跡をより困難にする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:02:24 GMT)
Quantifying Preferences of Vision-Language Models via Value Decomposition in Social Media Contexts [39.7] 我々は、Schwartzの値次元に基づいて視覚言語モデル(VLM)を評価するためのベンチマークであるValue-Spectrumを紹介する。
我々は、TikTok、YouTube Shorts、Instagram Reelsからソースされた5万本以上の短いビデオをベクター化したデータベースを構築しました。
また,ビデオ閲覧と解析を自動化するVLMエージェントパイプラインを開発した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:31:10 GMT)
Hilbert space geometry and quantum chaos [39.6] 種々の多パラメータランダム行列ハミルトン多様体に対するQGTの対称部分を考える。
エルゴード位相は滑らかな多様体に対応するが、可積分極限は円錐欠陥を持つ特異幾何として自身を示す2次元パラメータ空間を求める。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:00:17 GMT)
A comprehensive survey of oracle character recognition: challenges, benchmarks, and beyond [39.5] オラクルの文字認識は考古学、古生物学、歴史文化研究と交差する重要な分野となっている。
伝統的な神託文字認識法は、専門家による手作業による解釈に大きく依存している。
近年のパターン認識とディープラーニングの進歩により、オラクル文字認識の自動化に向けた動きが高まっている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:50:22 GMT)
Centaur: a foundation model of human cognition [39.4] 本稿では,自然言語で表現可能な実験において,人間の行動を予測する計算モデルCentaurを紹介する。
我々は、サイコ-101と呼ばれる新しい大規模データセットに基づいて、最先端の言語モデルを微調整することでCentaurを導出した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:39:18 GMT)
Color-Oriented Redundancy Reduction in Dataset Distillation [39.0] 本稿では,個々の画像とデータセットの全体レベルでの色冗長性を最小化するフレームワークを提案する。
画像レベルでは、縮小色空間から各ピクセルに動的に色を割り当てるために、専用ニューラルネットワークであるパレットネットワークを用いる。
既存のDD法と比較して,提案した色認識DDの優れた性能を示す総合的な性能評価を行った。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:48:11 GMT)
Reliable Poisoned Sample Detection against Backdoor Attacks Enhanced by Sharpness Aware Minimization [39.0] 我々は,バニラ学習アルゴリズムではなく,シャープネス・アウェア最小化(SAM)アルゴリズムを用いて1つのモデルを訓練することを提案する。
いくつかのベンチマークデータセットに対する大規模な実験は、弱いバックドア攻撃と強いバックドア攻撃の両方に対して提案手法の信頼性の高い検出性能を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:35:08 GMT)
Transcending Language Boundaries: Harnessing LLMs for Low-Resource Language Translation [38.8] 本稿では,キーワードに着目して,低リソース言語における翻訳品質を向上させる新しい検索手法を提案する。
本手法の有効性を評価するため,北米の絶滅危惧種であるチェロキー語,アジアにおける歴史的・文化的に重要な言語であるチベット語,話者がほとんどいない満州語という3つの低資源言語に英語から翻訳した実験を行った。
GPT-4oとLLaMA 3.1 405Bのゼロショット性能と比較すると、低リソース言語への変換において、これらのモデルが直面する重要な課題が浮き彫りになっている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:41:27 GMT)
Preprocessing for lessening the influence of eye artifacts in eeg analysis [37.7] 我々は, eeg信号におけるアーティファクトの問題に, 長い試行錯誤の使用に関して対処した。
具体的には, eeg 信号に含まれる眼のアーチファクトについて検討し, それらが脳活動の時間的変化に与える影響について検討した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 22:04:41 GMT)
Backpropagation-Free Multi-modal On-Device Model Adaptation via Cloud-Device Collaboration [37.5] ユニバーサルオンデバイスマルチモーダルモデル適応フレームワークを提案する。
このフレームワークは、クラウドにホストされるFast Domain Adaptor(FDA)を特徴とし、デバイス上の軽量マルチモーダルモデル用に調整されたパラメータを提供する。
私たちの貢献は、オンデバイスマルチモーダルモデル適応(DMMA)の先駆的なソリューションである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 23:06:46 GMT)
Exploring adversarial robustness of JPEG AI: methodology, comparison and new methods [37.3] JPEG AIは、エンドツーエンドのニューラルイメージ圧縮メソッドの最初の標準である。
本稿ではJPEG AIのロバスト性に関する大規模な評価を行う。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:08:52 GMT)
MAIRA-Seg: Enhancing Radiology Report Generation with Segmentation-Aware Multimodal Large Language Models [36.6] 放射線学レポート生成のためのセグメンテーション対応MLLMフレームワークMAIRA-Segを紹介する。
我々は、CXRにおける放射線学固有の構造のためのマスク擬似ラベルを得るために、専門家セグメンテーションモデルを訓練する。
我々は,プロンプトのマスク・アウェア・プロンプトを用いて,放射線学のドラフトレポートを作成している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:13:22 GMT)
Relational Contrastive Learning and Masked Image Modeling for Scene Text Recognition [36.6] 本稿では,STRのためのコントラスト学習とマスド画像モデリングの統一フレームワークを提案する。
提案したRCMSTRは、STR関連下流タスクにおいて優れた性能を示し、既存の最先端の自己教師型STR技術よりも優れた性能を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:11:47 GMT)
Introducing Spectral Attention for Long-Range Dependency in Time Series Forecasting [36.6] 最近の線形および変圧器ベースの予測器は時系列予測において優れた性能を示している。
時系列データにおける長距離依存関係を効果的に扱うことができないという点で制約されている。
本稿では,試料間の時間的相関を保った高速かつ効果的なスペクトル注意機構を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:20:49 GMT)
MVLight: Relightable Text-to-3D Generation via Light-conditioned Multi-View Diffusion [36.4] 本稿では,光条件を直接生成プロセスに統合する新しい光条件多視点拡散モデルMVLightを提案する。
これにより、複数のカメラビューにまたがる特定の照明環境を忠実に反映した高品質な画像を合成することができる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:22:04 GMT)
Thermodynamic Transferability in Coarse-Grained Force Fields using Graph Neural Networks [36.1] グラフ畳み込みニューラルネットワークアーキテクチャを用いて、粗いきめ細かい力場のための高度に自動化されたトレーニングパイプラインを開発する。
この手法により, 高精度な力場が得られるが, これらの力場は様々な熱力学条件によりより伝達可能であることを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:21:31 GMT)
Drowning in Documents: Consequences of Scaling Reranker Inference [35.5] クロスエンコーダはしばしば、より安価な初期IRシステムによって取得された文書を再スコアするために使用される。
本研究は,第1段階検索を再現するだけでなく,完全検索のための再ランカ性能を計測する。
私たちの実験では驚くべき傾向が示されています: 最高のリランカーは、徐々に多くのドキュメントをスコアリングするときに、リターンを減少させます。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:46:32 GMT)
Preserving Expert-Level Privacy in Offline Reinforcement Learning [35.5] 本稿では,既存のオフラインRLアルゴリズムと互換性のある,コンセンサスに基づく専門家レベルの個別オフラインRLトレーニング手法を提案する。
我々は、強い経験的性能を維持しながら、厳密な差分プライバシー保証を証明している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:26:53 GMT)
Watermark-based Detection and Attribution of AI-Generated Content [34.9] 我々は,AI生成コンテンツの透かしに基づくユーザレベルの属性に関する最初の体系的研究を行う。
私たちのキーとなるアイデアは、GenAIサービスの各ユーザにユニークな透かしを割り当て、この透かしを、そのユーザが作成したAI生成コンテンツに埋め込むことです。
次に、アトリビューションは、与えられたコンテンツから抽出したユーザとベストマッチしたユーザを特定して実行される。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:35:06 GMT)
Learning to Ask: Conversational Product Search via Representation Learning [34.7] 本研究では,対話型商品検索モデルであるConvPSを提案する。
このモデルはまず、ユーザ、クエリ、アイテム、会話のセマンティック表現を共同で学習するように訓練されている。
提案したConvPSモデルは,ユーザ,クエリ,アイテム,会話の表現学習を統合された生成フレームワークに統合することができる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:05:43 GMT)
IKEA Manuals at Work: 4D Grounding of Assembly Instructions on Internet Videos [34.7] IKEA Video Manualsは、家具部品の3次元モデル、指導マニュアル、インターネットからの組み立てビデオ、そして最も重要なのは、これらのデータモダリティ間の密集時間アライメントのアノテーションを含むデータセットである。
形態形成に不可欠な5つの応用として, 組み立て計画生成, 部分条件付きセグメンテーション, 部分条件付きポーズ推定, ビデオオブジェクトセグメンテーション, および教示ビデオマニュアルに基づく家具組み立てについて述べる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:30:05 GMT)
Reliable Learning of Halfspaces under Gaussian Marginals [34.6] 本稿では,カライらの信頼的無知モデルにおけるPAC学習ハーフスペースの問題について検討する。
我々の主な肯定的な結果は、サンプルおよび計算複雑性を持つ$mathbbRd$上のガウス半空間の信頼性学習のための新しいアルゴリズムである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:13:11 GMT)
DARNet: Dual Attention Refinement Network with Spatiotemporal Construction for Auditory Attention Detection [34.4] 聴覚注意検出(AAD)アプローチは、脳波信号などの脳信号を分析して、出席者を特定する。
これらの課題に対処するために,DARNet 構築モジュール,デュアルアテンション改善モジュール,機能融合時・モジュールからなる DARNet を提案する。
実験の結果,DARNetは最先端モデルと比較して平均分類精度が0.1sで5.9%,1sで4.6%,DTUデータセットで2sで3.9%向上していることがわかった。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:25:53 GMT)
Learning a Neural Association Network for Self-supervised Multi-Object Tracking [34.1] 本稿では,多目的追跡のためのデータアソシエーションを自己管理的に学習するための新しいフレームワークを提案する。
実世界のシナリオでは、オブジェクトの動きが通常マルコフプロセスで表現できるという事実により、我々は、トラッキングのための検出を関連付けるためにニューラルネットワークをトレーニングする新しい期待(EM)アルゴリズムを提案する。
我々は,挑戦的なMOT17とMOT20データセットに対するアプローチを評価し,自己教師付きトラッカーと比較して最先端の結果を得る。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:22:29 GMT)
Llama Guard 3-1B-INT4: Compact and Efficient Safeguard for Human-AI Conversations [33.8] 本稿では,Meta Connect 2024中にコミュニティにオープンソース化された,コンパクトで効率的なLlama Guardモデルを提案する。
Llama Guard 3-1B-INT4は、リソース制約のあるデバイスにデプロイ可能で、少なくとも30トークン/秒のスループットと2.5秒以下のタイム・ツー・ファーストのスループットを、コモディティなAndroidモバイルCPU上で実現可能であることを実証した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:42:17 GMT)
Optimization Algorithm for Inventory Management on Classical, Quantum and Quantum-Hybrid Hardware [33.7] フローラックを用いた倉庫におけるアイテム割り当ての最適化に重点を置いており, 第一報, 第一報 (FIFO) のロジスティクス用に設計されている。
本稿では,古典的,量子的,ハイブリッドなハードウェア実装に適したQUBO問題として定式化された新しい戦略を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:36:45 GMT)
BertaQA: How Much Do Language Models Know About Local Culture? [33.3] 本稿では,英語とバスク語に平行なトリビアデータセットであるBertaQAを紹介する。
データセットは、バスク文化に関連する質問のあるローカルサブセットと、より広い関心を持つ質問を持つグローバルサブセットで構成されている。
バスク語での事前学習は、英語で質問しても、バスク語文化におけるモデルのパフォーマンスを大幅に向上させることを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:40:54 GMT)
A Perspective for Adapting Generalist AI to Specialized Medical AI Applications and Their Challenges [33.2] 大規模言語モデル(LLM)の医療応用への統合は、医療業界で広く関心を集めている。
本稿では,LSMを利用した医療用AIアプリケーション構築の内的課題について論じる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:41:08 GMT)
Continuous Speculative Decoding for Autoregressive Image Generation [33.1] 連続評価された自己回帰(AR)画像生成モデルは、離散的傾向よりも顕著な優位性を示している。
投機的復号化は大規模言語モデル(LLM)の加速に有効であることが証明された
この研究は離散トークンから連続空間への投機的復号アルゴリズムを一般化する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:19:15 GMT)
Autoregressive Action Sequence Learning for Robotic Manipulation [33.0] 既存の自己回帰型アーキテクチャは、言語モデリングにおいて単語トークンとして順次、エンドエフェクタ・ウェイポイントを生成する。
我々は、因果変換器の単一トークン予測を拡張し、単一のステップで可変数のトークンを予測する。
本稿では,ハイブリッドなアクションシーケンスを生成することで操作タスクを解消するAutoregressive Policyアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:06:46 GMT)
Multi-modal Situated Reasoning in 3D Scenes [32.8] 大規模マルチモーダル位置推論データセットであるMSQA(Multi-modal Situated Question Answering)を提案する。
MSQAには、9つの異なる質問カテゴリにまたがる251Kの質問答えペアが含まれており、複雑なシナリオを3Dシーンでカバーしている。
また,MSNN(Multi-modal Situated Next-step Navigation)ベンチマークを考案し,ナビゲーションに対するモデルの位置的推論を評価する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:32:22 GMT)
Chameleon: A Data-Efficient Generalist for Dense Visual Prediction in the Wild [32.3] 大規模言語モデルは、汎用言語インタフェースと大規模事前学習の恩恵を受け、データ効率のジェネラリストを進化させてきた。
しかし、濃密な視覚予測のためにデータ効率のよいジェネラリストを構築することは、異なるタスクにまたがるラベル構造の変化が原因で、大きな課題となる。
本研究では,不明瞭なラベル構造に柔軟に適用可能な普遍モデルについて,いくつかの例を挙げて検討する。
我々は,ビデオ,3D,医療,生物学的,ユーザインタラクションタスクなど,ローショット学習が望ましい実世界のシナリオの範囲で,我々のモデルを評価した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:03:19 GMT)
Joint-Optimized Unsupervised Adversarial Domain Adaptation in Remote Sensing Segmentation with Prompted Foundation Model [32.0] 本稿では、ソースドメインデータに基づいてトレーニングされたモデルをターゲットドメインサンプルに適用するという課題に対処する。
SAM(Segment Anything Model)とSAM-JOANet(SAM-JOANet)を併用した協調最適化対向ネットワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:46:17 GMT)
On the Efficiency of ERM in Feature Learning [31.3] 特徴写像によって誘導される線形クラスの和和に対する2乗損失を伴う回帰問題に対する経験的リスク最小化の性能について検討する。
集合 $mathcalT$ が大きすぎることと、一意の最適特徴写像が存在するとき、これらの量子は、オラクル手順の過剰なリスクと最大2倍に一致することを示す。
一般仮定下での疎線形回帰における最良部分集合選択法の性能に関する新たな保証を得る。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:05:05 GMT)
Benchmarking Graph Learning for Drug-Drug Interaction Prediction [30.7] 薬物・薬物相互作用の予測(DDI)は薬理学と医療において重要な役割を担っている。
近年,薬物と薬物の相互作用を予測するグラフ学習法が提案されている。
グラフ学習におけるDDI予測ベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:22:40 GMT)
Enhancing Decision Transformer with Diffusion-Based Trajectory Branch Generation [30.0] 決定変換器(DT)は、オフライン強化学習(RL)を教師付きシーケンスモデリングタスクに変換することにより、オフラインデータセットから効果的なポリシーを学習することができる。
拡散モデルにより生成された分岐を用いてデータセットの軌道を拡大する拡散ベース軌道分岐生成(BG)を導入する。
BGはD4RLベンチマークで最先端のシーケンスモデリング手法より優れている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:44:14 GMT)
A Code Knowledge Graph-Enhanced System for LLM-Based Fuzz Driver Generation [29.5] ファジドライバ生成プロセスを自動化するために,コード知識グラフをインテリジェントエージェントと統合する新しいシステムであるCodeGraphGPTを提案する。
ファズドライバ生成をコード生成タスクとしてフレーミングすることで、CodeGraphGPTはプログラム分析を活用して、コードリポジトリの知識グラフを構築する。
我々は8つのオープンソースプロジェクトでCodeGraphGPTを評価し、最先端の手法と比較してコードカバレッジが平均8.73%向上した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:41:16 GMT)
Matching Patients to Clinical Trials with Large Language Models [29.3] 本稿では,大規模言語モデルを用いたゼロショット患者間マッチングのためのエンドツーエンドフレームワークTrialGPTを紹介する。
TrialGPTは3つのモジュールから構成されており、まず大規模フィルタリングを行い、候補トライアル(TrialGPT-Retrieval)を検索し、次に基準レベルの患者資格(TrialGPT-Matching)を予測し、最終的にトライアルレベルのスコア(TrialGPT-Ranking)を生成する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:55:02 GMT)
Towards Empirical Interpretation of Internal Circuits and Properties in Grokked Transformers on Modular Polynomials [29.1] モジュラー加算のグロキングは、変換器の三角形状のフーリエ表現とその計算回路を実装することが知られている。
各操作でグラクされたモデル間の転送性は、特定の組み合わせに限られることを示す。
マルチタスクの混合によってコグルーキングが発生し、すべてのタスクで同時にグルーキングが発生する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:56:27 GMT)
Vision-guided and Mask-enhanced Adaptive Denoising for Prompt-based Image Editing [28.9] 視覚誘導・マスク強調適応編集法(ViMAEdit)を提案する。
まず,画像の埋め込みを明示的なガイダンスとして活用し,従来のテキストのプロンプトに基づく記述プロセスを強化することを提案する。
第2に,自己注意型反復編集領域接地戦略を考案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:09:19 GMT)
Exploring Emerging Trends and Research Opportunities in Visual Place Recognition [28.8] 視覚に基づく認識は、コンピュータビジョンとロボティクスのコミュニティにおける長年の課題である。
ほとんどのローカライズ実装では、視覚的位置認識が不可欠である。
研究者は最近、視覚言語モデルに注意を向けている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:36:17 GMT)
Bi-Mamba: Towards Accurate 1-Bit State Space Models [28.5] Bi-Mambaは、より効率的な大規模言語モデルのために設計されたスケーラブルでパワフルな1ビットのMambaアーキテクチャである。
Bi-Mambaは完全な精度(FP16やBF16など)に匹敵するパフォーマンスを実現し、ポストトレーニングバイナリ化(PTB)のMambaベースラインよりもはるかに精度が高い。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:59:15 GMT)
Causal Effect of Group Diversity on Redundancy and Coverage in Peer-Reviewing [28.4] 本報告では,レビュアーの多様性の異なる尺度がレビューのカバレッジと冗長性に与える影響について検討する。
多様な組織や地理的な場所のレビュアーと、レビュアーが密接な関係にあるという証拠は見つからない。
本研究は,ピアレビューにおけるレビュア割り当てに対するグループ意思決定の視点を採用し,レビュア割り当てプロセスの指針となる多様性の次元を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:08:10 GMT)
Generative World Explorer [28.1] 部分観察による計画は、AIの具体化における中心的な課題である。
我々は,エゴセントリックな世界探査フレームワークであるtextitGenerative World Explorer (Genex)$を紹介した。
Genexは、エージェントが大規模3D世界を精神的に探索し、その信念を更新するために想像された観察を得ることを可能にする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:59:31 GMT)
A Recipe for CAC: Mosaic-based Generalized Loss for Improved Class-Agnostic Counting [27.4] クラスカウント(Class counting, CAC)は、クエリ画像中の任意の参照オブジェクトの総発生数をカウントするために使用できる視覚計算タスクである。
マルチクラスの設定を考えると、モデルは参照イメージを考慮せず、クエリイメージ内のすべての支配的なオブジェクトを盲目的にマッチさせます。
既存のCAC評価手法の背景にある問題を解決するための新しい評価プロトコルとメトリクスを導入する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:52:09 GMT)
Toward Personalized Federated Node Classification in One-shot Communication [27.3] ワンショットフェデレートラーニング(OFL)は、単一のコミュニケーションラウンドでのコラボレーションを可能にし、通信コストと潜在的なセキュリティ上の懸念を大幅に低減します。
ノード分類のための一括パーソナライズされたフェデレーショングラフ学習手法を最初に提案する。
本研究では,グローバルな擬似グラフからのローカルデータとグローバル情報からの個人情報を適応的に活用するための2段階個別学習を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:59:29 GMT)
Semantic Operators: A Declarative Model for Rich, AI-based Analytics Over Text Data [27.1] 構成可能なAIベースの操作でリレーショナルモデルを拡張するプログラミングインターフェースであるセマンティック演算子を導入する。
データフレームAPIを備えたオープンソースのクエリエンジンであるLOTUSで演算子を実装します。
LOTUSクエリはタスク毎の最先端のAIパイプラインの精度と一致し、最大28$times$高速に動作していることを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:01:24 GMT)
The Dark Side of Trust: Authority Citation-Driven Jailbreak Attacks on Large Language Models [27.0] 大きな言語モデル(LLM)が人間の価値と一致することを保証することが大きな関心事である。
本研究では, LLMの権威に対する偏見という新たな脅威を紹介する。
我々は,ブラックボックス設定用に設計された適応型権威引用マッチングとジェネレータであるDarkCiteを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:28:58 GMT)
RoboGSim: A Real2Sim2Real Robotic Gaussian Splatting Simulator [27.0] RoboGSimは本物の2sim2realのロボットシミュレータで、3Dガウシアン・スプレイティングと物理エンジンで動く。
シミュレーションされたデータを、新しいビュー、オブジェクト、軌跡、シーンで合成することができる。
実数2simとsim2realの転写実験は、テクスチャと物理において高い一貫性を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:58:03 GMT)
Logical computation demonstrated with a neutral atom quantum processor [26.4] 距離2符号を用いて24個の論理量子ビットの絡み合いを示し、同時に誤りを検出し、損失量子ビットの補正を行う。
また,[4,1,2]コードで符号化された最大28個の論理量子ビットを用いて,Bernstein-Vaziraniアルゴリズムを実装した。
これらの結果は、プログラム可能な中性原子量子プロセッサで科学的量子優位を達成するための道を切り開く。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:39:23 GMT)
The Discrete Gaussian for Differential Privacy [26.2] 微分プライベートシステムを構築するための重要なツールは、機密データセットで評価された関数の出力にガウスノイズを追加することである。
これまでの研究は、一見無害な数値エラーがプライバシーを完全に破壊することを示した。
差分プライバシーの文脈において、離散ガウシアンを導入・分析する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:32:34 GMT)
CCExpert: Advancing MLLM Capability in Remote Sensing Change Captioning with Difference-Aware Integration and a Foundational Dataset [26.1] 本稿では,新しいマルチモーダル大規模モデルフレームワークであるCCExpertを提案する。
まず,両時間画像間のマルチスケール差をキャプチャする差分認識統合モジュールを設計する。
第2に、20万の画像対と120万のキャプションを含む、CC-Foundationと呼ばれる高品質で多様なデータセットを構築しました。
最後に,3段階のプログレッシブ・トレーニング・プロセスを用いて,事前学習したMLLMと差認識統合モジュールの深い統合を保証した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:10:49 GMT)
The Power of Many: Multi-Agent Multimodal Models for Cultural Image Captioning [26.0] 異なる文化的ペルソナを持つLMMを用いて、異文化間画像キャプションを強化する枠組みであるMosAICを紹介する。
我々は、中国、インド、ルーマニアの画像に対して、文化に富んだ画像キャプションのデータセットを英語で提供します。
マルチエージェントインタラクションは、異なるメトリクス間でシングルエージェントモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:37:10 GMT)
Video-to-Task Learning via Motion-Guided Attention for Few-Shot Action Recognition [25.6] 空間的・時間的関係モデリングにより,行動認識の精度は著しく向上した。
近年、クラスプロトタイプを用いてタスク固有の特徴を学習しているが、タスクレベルで異なるビデオ間の関係を見落としている。
そこで本研究では,DMGAL(Dual Motion-Guided Attention Learning)法を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:01:59 GMT)
Non-convex Stochastic Composite Optimization with Polyak Momentum [25.1] 一般化近位勾配は広く用いられる勾配降下法(SGD)の強力な一般化である。
しかし、メソッドがマシン内の多くのアプリケーションに収束しないことは知られている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:44:08 GMT)
FedCoLLM: A Parameter-Efficient Federated Co-tuning Framework for Large and Small Language Models [24.6] FedCoLLMは、Large Language Models (LLM) とSmall Language Models (SLM) の共用用に設計された新しいフレームワークである。
FedCoLLM はサーバ側の LLM の知識をクライアントの SLM に適応的に転送し、同時にクライアントからのドメイン洞察で LLM を豊かにする。
NLPテキスト生成タスクの多種多様な公開LLMとSLMを利用してFedCoLLMの評価を行ったところ,LLMの助けを借りて顕著な改善が得られた。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:34:58 GMT)
SoK: On the Role and Future of AIGC Watermarking in the Era of Gen-AI [24.2] AIGCの透かしは、悪意のあるアクティビティを緩和するための効果的なソリューションを提供する。
透かしのコア特性に基づいた分類法を提供する。
我々はAIGC透かしの機能とセキュリティの脅威について論じる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:26:42 GMT)
Metamorphic Evaluation of ChatGPT as a Recommender System [24.1] 本稿では,GPTに基づくレコメンデータシステムの評価のためのメタモルフィックテストについて紹介する。
MRの出力でその関係が満たされたかどうかを測定するために、類似度指標が配置される。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 23:18:55 GMT)
Relevance-guided Audio Visual Fusion for Video Saliency Prediction [23.9] 本稿では,SP と呼ばれる新しい関連性誘導型音声視覚情報量予測ネットワークを提案する。
Fusionモジュールは、音声と視覚要素間の意味的関連性に基づいて、音声機能の保持を動的に調整する。
マルチスケール機能Synergy(MS)モジュールは、異なるエンコーディングステージからの視覚的特徴を統合し、様々なスケールでオブジェクトを表現するネットワークの能力を向上する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:42:27 GMT)
QARM: Quantitative Alignment Multi-Modal Recommendation at Kuaishou [23.8] 異なる下流モデルに対して、専門的で訓練可能なマルチモーダル情報をカスタマイズするための定量的なマルチモーダルフレームワークを導入する。
ダウンストリームタスクの利用における2つの難題に着想を得て、異なるダウンストリームモデルに対して、専門的で訓練可能なマルチモーダル情報をカスタマイズする定量的なマルチモーダルフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:08:35 GMT)
A Framework for Leveraging Partially-Labeled Data for Product Attribute-Value Identification [23.7] GenToCは、部分的にラベル付けされたデータで直接トレーニングするために設計されたモデルである。
既存の最先端モデルよりも優れており、正確な抽出回数が56.3%増加した。
私たちのモデルは、インド最大のB2BeコマースプラットフォームであるIndiaMARTに統合されました。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:50:30 GMT)
Conceptwm: A Diffusion Model Watermark for Concept Protection [23.6] 現在の透かし方式は、特定の概念をターゲットにした洗練された方法で適用するのではなく、すべての画像に透かしを追加する。
拡散モデルの概念に知覚不能な透かしをシームレスに埋め込む新しい概念指向透かしフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:11:25 GMT)
SAMURAI: Adapting Segment Anything Model for Zero-Shot Visual Tracking with Motion-Aware Memory [23.5] 本稿では,視覚的物体追跡に特化して設計されたSAM 2を改良したSAmuraiを紹介する。
提案した動き認識メモリ選択機構に時間的動作手がかりを組み込むことで、物体の動きを効果的に予測し、マスク選択を洗練し、トレーニングや微調整を必要とせず、堅牢で正確なトラッキングを実現する。
評価では、既存のトラッカーよりも成功率と精度が大幅に向上し、LaSOT$_ext$で7.1%、GOT-10kで3.5%向上した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:59:03 GMT)
PhD: A ChatGPT-Prompted Visual hallucination Evaluation Dataset [23.5] 本稿では,ChatGPTによる視覚幻覚評価データセットを提案する。
VHEの本質は、特定の画像についてMLLMに質問し、幻覚への感受性を評価することである。
低レベル(対象/属性認識)から中レベル(知覚/位置認識とカウント)までの5つの視覚的認識タスクが検討されている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:57:14 GMT)
Scideator: Human-LLM Scientific Idea Generation Grounded in Research-Paper Facet Recombination [23.5] 我々は、科学的思考のための新しい混合開始ツールであるSideatorに貢献する。
ユーザが提供する論文セットから、Sideatorはこれらおよび関連する論文からキーファセット(目的、メカニズム、評価)を抽出する。
またSideatorは、ユーザーが文学を検索することで、アイデアの斬新さを判断するのに役立つ。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:25:38 GMT)
Learning Differentiable Surrogate Losses for Structured Prediction [23.2] 本稿では,ニューラルネットワークによってパラメータ化された構造化損失関数を,出力トレーニングデータから直接学習する新しいフレームワークを提案する。
結果として、微分可能な損失は、サロゲート空間の有限次元によるニューラルネットワークの学習を可能にするだけでなく、出力データの新しい構造を予測できる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:07:47 GMT)
Statistical-Computational Trade-offs for Recursive Adaptive Partitioning Estimators [23.1] 我々は,高次元回帰のためのグリーディアルゴリズムが局所最適点において立ち往生していることを示す。
低い推定誤差を達成するために、greedyトレーニングには$exp(Omega(d))$が必要であることを示す。
この二分法は、平均場状態における勾配降下(SGD)を訓練した2層ニューラルネットワークを反映する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:18:54 GMT)
Extended Neural Contractive Dynamical Systems: On Multiple Tasks and Riemannian Safety Regions [22.8] 我々は最近、安定性を保証するニューラルネットワークアーキテクチャであるNCDS(Neural Contractive Dynamical Systems)を提案した。
本稿では、より慎重な正規化、複数のタスクを扱うフレームワークの条件変種、遅延障害回避に対する不確実性駆動アプローチによりフレームワークを拡張した。
実験では、開発システムは、自律ロボット工学に必要な安定性を確保しながら、通常のニューラルネットワークの柔軟性があることを検証する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:27:49 GMT)
Towards Personalized Brain-Computer Interface Application Based on Endogenous EEG Paradigms [22.6] パーソナライズされた脳-コンピュータインタフェース(BCI)アプリケーションのための概念的フレームワークを提案する。
このフレームワークには,ユーザ識別と意図分類という,2つの重要なコンポーネントが含まれている。
EEG信号はパーソナライズされたBCIアプリケーションを効果的にサポートし、堅牢な識別と信頼性の高い意図的復号を提供する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:58:41 GMT)
TSINR: Capturing Temporal Continuity via Implicit Neural Representations for Time Series Anomaly Detection [22.4] 時系列異常検出は、データの異常なパターンや、システムの期待する振る舞いからの逸脱を特定することを目的としている。
このタスクでは、教師なし学習を通じてポイントワイド表現を学習するリコンストラクションベースの手法が主流である。
本稿では,暗黙的ニューラル表現(INR)再構成に基づく時系列異常検出手法TSINRを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:19:54 GMT)
Generalizable Person Re-identification via Balancing Alignment and Uniformity [22.3] ドメイン一般化可能な人物再識別(DG re-ID)は、分布シフトに頑健な識別表現を学習することを目的としている。
ある増補は、このタスクにおいて偏極効果を示し、分配性能を低下させながら、分配性能を向上させる。
本研究では,アライメントと統一性のバランスを維持することによって,この効果を効果的に軽減する新しい枠組みであるBAUを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:13:30 GMT)
Read to Play (R2-Play): Decision Transformer with Multimodal Game Instruction [22.3] 本稿では,エージェントに対するタスクガイダンスの強化について検討し,ゲームプレイ指導の理解を可能にした。
命令チューニングを決定変換器に組み込むためのマルチモーダルゲーム命令セットを構築する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:31:52 GMT)
TrojanRobot: Backdoor Attacks Against Robotic Manipulation in the Physical World [22.3] 本稿では,ロボット操作に特化したバックドアアタックを提案し,物理世界で初めてバックドアアタックを実装した。
バックドア視覚言語モデルをロボットシステム内の視覚知覚モジュールに組み込むことで,ロボットアームの動作を物理的に誤解させることに成功した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:09:26 GMT)
All-domain Moveline Evolution Network for Click-Through Rate Prediction [22.2] 電子商取引アプリのユーザーは論理的に一貫性のある行動を示す。
シーンレベルの全ドメインユーザ移動ラインを形成するために、一連のマルチシナリオユーザ動作が相互に接続する。
従来のCTR予測手法は、対象アイテムと歴史的に相互作用したアイテムの間のアイテムレベルの相互作用に焦点を当てている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:02:24 GMT)
Data Driven Automatic Electrical Machine Preliminary Design with Artificial Intelligence Expert Guidance [21.9] 本稿では, 巻線同期発電機(WRSG)を設計例として用いたデータ駆動型電気機械設計(EMD)フレームワークを提案する。
専門知識に大きく依存する従来の予備的なプロセスとは異なり、このフレームワークは人工知能ベースのエキスパートデータベースを活用する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:18:18 GMT)
Understanding the Role of Textual Prompts in LLM for Time Series Forecasting: an Adapter View [21.7] 大規模言語モデル(LLM)の急成長する領域では、時系列予測にLLMを適用することへの関心が高まっている。
本研究の目的は,LLMへのテキストプロンプトの統合が時系列の予測精度を効果的に向上させる方法と理由を理解することである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:27:38 GMT)
Detecting Multi-Parameter Constraint Inconsistencies in Python Data Science Libraries [21.7] 本稿では,コードとドキュメントの不整合を検出するMPDetectorを提案する。
MPDetectorは、シンボリック実行を通じて実行パスを探索することで、これらの制約をコードレベルで識別する。
本研究では,LLM出力の予測不可能性を再現するファジィ制約論理を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:30:14 GMT)
Leveraging MLLM Embeddings and Attribute Smoothing for Compositional Zero-Shot Learning [21.5] 合成ゼロショット学習は、見かけの合成から学んだ属性やオブジェクトの新規な構成を認識することを目的としている。
以前の作業では、同じ属性を共有するイメージペア間の共有部分と排他的部分を抽出することで、属性とオブジェクトをアンタングルにする。
本稿では,MLLM (Multimodal Large Language Model) という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:55:54 GMT)
Enhancing Vision-Language Model Safety through Progressive Concept-Bottleneck-Driven Alignment [21.4] 本稿では,視覚的モダリティの安全性向上を目的とした,プログレッシブなコンセプトベースアライメント戦略であるPSA-VLMを提案する。
提案手法は,VLMの安全性ベンチマークにおいて,最先端の安全性を実現する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:01:57 GMT)
FLAME: Frozen Large Language Models Enable Data-Efficient Language-Image Pre-training [21.4] 言語イメージの事前学習は、特定のフォーマットの限られたデータと、テキストエンコーダの制約された容量のために、重大な課題に直面している。
我々は,凍結した大言語モデルをテキストエンコーダとして利用するFLAME (Frozen Large lAnguage Models Enable data- efficient language-image pre-training)を提案する。
FLAMEは,1)長いキャプションから多様な意味表現を抽出する多面的急速蒸留技術,2)オフライン埋め込み戦略を補完する顔分離型アテンション機構である。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:19:30 GMT)
Utilizing Large Language Models in an iterative paradigm with domain feedback for molecule optimization [21.3] 本稿では,シンプルなドメインフィードバックプロバイダである$textRe3$DFを提案する。
$textRe3$DFは、修飾分子が化学的に無効である場合、外部ツールキットRDKitを使用して分子幻覚を処理する。
20の単価目標に対して、$textRe3$DFは、それぞれ緩い(textttl)と厳格な(texttts)の閾値の下で、ヒット比を16.95%、20.76%向上させる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:41:01 GMT)
Coverage-Constrained Human-AI Cooperation with Multiple Experts [21.2] 本稿では,CL2DC法(Coverage-Constrained Learning to Defer and Complement with Specific Experts)を提案する。
CL2DCは、AI予測単独または特定の専門家に延期または補完することで、最終的な決定を行う。
最先端のHAI-CC法に比べて優れた性能を発揮する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:06:01 GMT)
Syllabus: Portable Curricula for Reinforcement Learning Agents [21.2] Syllabusは、カリキュラム学習でRLエージェントを訓練するためのライブラリである。
Syllabusはカリキュラム学習アルゴリズムのためのユニバーサルAPIを提供する。
本稿では,NetHackとNeural MMOにおけるカリキュラム学習の最初の例を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:22:30 GMT)
Collaborative Contrastive Network for Click-Through Rate Prediction [21.2] CCN(Collaborative Contrastive Network)と呼ばれる,より汎用的で堅牢なCTR予測手法を導入する。
CCNは、ユーザの興味や関心を表現できる2つのアイテムクラスタを特定することを学ぶ。
大規模な実世界のデータを用いたオンラインA/Bテストでは、CCNがタオバオで最先端のパフォーマンスを新たに設定し、CTRを12.3%、注文量を12.7%引き上げたことが示されている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:12:47 GMT)
Frame Interpolation with Consecutive Brownian Bridge Diffusion [21.2] ビデオフレーム補間(VFI)は、拡散に基づく条件付き画像生成問題としてVFIを定式化しようとする。
本稿では,Branian Bridge Diffusionを用いたフレーム補間法を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:53:41 GMT)
Activating Self-Attention for Multi-Scene Absolute Pose Regression [21.2] マルチシーン絶対ポーズ回帰は、高速でメモリ効率のよいカメラポーズ推定の需要に対処する。
変圧器エンコーダは、崩壊した自己アテンションマップのために未利用である。
クエリとキーをアライメントし、クエリキー空間の歪みを防止できる補助的損失を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:45:17 GMT)
ControlNet++: Improving Conditional Controls with Efficient Consistency Feedback [20.9] ControlNet++は、生成した画像と条件付き制御の間のピクセルレベルのサイクル一貫性を明示的に最適化することで、制御可能な生成を改善する新しいアプローチである。
ControlNetの11.1%のmIoU、13.4%のSSIM、7.6%のRMSE、それぞれセグメンテーションマスク、ラインアートエッジ、深さ条件の改善を実現している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 00:21:40 GMT)
Look a Group at Once: Multi-Slide Modeling for Survival Prediction [20.8] GroupMILは、集団分析の臨床的実践に触発された新しいフレームワークである。
GPAMambaは、スライディングとインタースライディングの相互作用を促進するために設計されたモデルである。
我々のモデルはThe Cancer Genome Atlasの5つのデータセットで最先端のアプローチを大幅に上回っている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:48:45 GMT)
Theoretical Corrections and the Leveraging of Reinforcement Learning to Enhance Triangle Attack [20.4] Adrialversaの例は、多くのセンシティブなドメインで機械学習モデルを適用する上で深刻な問題である。
敵の例を生成するために、決定に基づくブラックボックス攻撃は最も実践的な手法の1つである。
我々は,新たな決定に基づくブラックボックス攻撃,Triangle Attack with Reinforcement Learning (TARL)を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:31:24 GMT)
SpecGen: Automated Generation of Formal Program Specifications via Large Language Models [20.4] SpecGenは、大規模言語モデルに基づく形式的なプログラム仕様生成のための新しいテクニックである。
SV-COMP 279ベンチマークと手動で構築したデータセットを含む2つのデータセット上でSpecGenを評価する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:30:06 GMT)
Superpixel-informed Implicit Neural Representation for Multi-Dimensional Data [20.2] 本稿では,S-INR(Superpixel-informed INR)を提案する。
S-INRの精巧に設計されたモジュールは、一般化されたスーパーピクセル内のセマンティック情報を巧みに活用することができる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:57:59 GMT)
Suicide Risk Assessment on Social Media with Semi-Supervised Learning [20.2] ラベル付きおよびラベルなしデータを活用する半教師付きフレームワークを提案する。
擬似ラベル生成の複数の試行において一括して予測されなかった擬似ラベルデータのサブセットを手動で検証する。
本研究は,一部検証済み擬似ラベル付きデータに加えて,地味ラベル付きデータを活用することで,ソーシャルメディア投稿から自殺リスクを評価する能力を大幅に向上する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:43:05 GMT)
PSPO*: An Effective Process-supervised Policy Optimization for Reasoning Alignment [20.1] 我々は,報酬得点を決定するための推論ステップの数を考慮したPSPO-WRSを開発し,非線形報酬形成に最適化されたワイブル分布を利用する。
6つの数学的推論データセットの実験結果は、PSPO-WRSが現在の主流モデルより一貫して優れていることを示している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:03:51 GMT)
DeUEDroid: Detecting Underground Economy Apps Based on UTG Similarity [19.8] アンダーグラウンドエコノミーアプリ(UEware)は、非準拠のサービスを提供することで利益を得る。
UI遷移グラフ(UTG)を考慮したUEwareの効率的かつ効率的な検出手法を提案する。
提案手法に基づいて,検出を行うシステムDeUEDroidの設計と実装を行う。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 04:12:26 GMT)
SportsNGEN: Sustained Generation of Realistic Multi-player Sports Gameplay [19.8] 本稿では,トランスフォーマーデコーダを用いたスポーツシミュレーションエンジンであるSportsNGENについて述べる。
プロテニス追跡データの大規模なデータベースをトレーニングすることにより,SportsNGENが生成したシミュレーションがラリーの結果を予測することができることを示す。
モデル出力サンプリングパラメータはシミュレーションリアリズムに不可欠であり,SportsNGENは確率論的に実データに適合していることを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:09:57 GMT)
TSPRank: Bridging Pairwise and Listwise Methods with a Bilinear Travelling Salesman Model [19.7] トラベリングセールスマン問題ランキング (TSPRank) は、ハイブリッド・ペア・リストワイズ・ランキング法である。
TSPRankの堅牢性と、異なるドメインにわたる優れたパフォーマンスは、汎用的で効果的なLETORソリューションとしての可能性を強調している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:10:14 GMT)
Visual-Semantic Graph Matching Net for Zero-Shot Learning [19.3] Zero-shot Learning (ZSL) は、目に見えないクラスを認識するために追加のセマンティック情報を活用することを目的としている。
本稿では,ビジュアル・セマンティックな埋め込みを支援するために,VSGMNと呼ばれるビジュアル・セマンティックなグラフマッチングネットを提案する。
3つのベンチマークデータセットに対する大規模な実験は、VSGMNが従来のZSLシナリオと一般的なZSLシナリオの両方で優れたパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:43:12 GMT)
Do Captioning Metrics Reflect Music Semantic Alignment? [19.1] 従来のメトリクスが統語的変化に弱い場合を示し、人間の判断と相関しないことを示す。
音楽キャプションの評価方法に対する批判的再評価の必要性を強調することを目的としている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:13:49 GMT)
Image Demoireing in RAW and sRGB Domains [18.9] 我々は、Gated Feedback Module (GFM) と Frequency Selection Module (FSM) を備えたスキップ接続型復号モジュール(SCDM)を開発した。
我々はRGB Guided ISP(RGISP)を設計し、デバイス依存のISPを学習し、色回復のプロセスを支援する。
我々のRRIDは、PSNRでは0.62dB、SSIMでは0.003のモアレパターン除去とカラーキャスト補正の性能において、最先端のアプローチよりも優れています。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:20:10 GMT)
VL-Uncertainty: Detecting Hallucination in Large Vision-Language Model via Uncertainty Estimation [18.9] 本稿では,大規模な視覚言語モデルにおける幻覚を検出するための,最初の不確実性に基づくフレームワークであるVL-Uncertaintyを紹介する。
意味論的に等価だが摂動的プロンプト間の予測分散を分析して不確実性を測定する。
LVLMは信頼性が高く、意味論的に等価なクエリに対して一貫した応答を提供する。
しかし、不確実な場合には、目標LVLMの応答はよりランダムになる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 04:06:04 GMT)
Prediction-Guided Active Experiments [18.5] 予測誘導能動実験(PGAE)のための新しいフレームワークについて紹介する。
PGAEは、既存の機械学習モデルからの予測を活用して、サンプリングと実験をガイドする。
我々は、PGAEの適応型推定器が依然として効率的であり、ある仮定の下で同じ半パラメトリック境界に達することを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:16:24 GMT)
Stacking Brick by Brick: Aligned Feature Isolation for Incremental Face Forgery Detection [18.5] 鼻訓練IFFDモデルは、新しい偽造物が統合されると破滅的な忘れがちである。
本稿では、SURデータを利用して分布を分離・調整するLatent-space Incremental Detector(LID)を提案する。
評価のために、IFFDに適したより高度で包括的なベンチマークを構築した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:18:36 GMT)
No-regret Exploration in Shuffle Private Reinforcement Learning [18.1] パーソナライズされたサービスにおけるユーザのプライバシの懸念に対処するために、差分プライバシー(DP)がエピソード強化学習(RL)に導入された。
シャッフルモデルでは,信頼されたシャッフルが中央エージェントに送信する前に,ユーザのデータをランダムに置換する。
分析の結果,アルゴリズムは集中型モデルに匹敵するほぼ最適の後悔を達成し,プライバシコストの点で局所モデルよりも大幅に優れていることがわかった。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:24:11 GMT)
ChatHTTPFuzz: Large Language Model-Assisted IoT HTTP Fuzzing [18.1] Internet of Things(IoT)デバイスは、Webインターフェース、Web VPN、その他のWebベースのサービスを通じて利便性を提供し、すべてHTTPプロトコルに依存している。
最先端のツールの多くは依然としてランダムな突然変異戦略に依存しており、HTTPプロトコルの構造を正確に理解し、多くの無効なテストケースを生成するのが困難である。
本稿では,プロトコルフィールドを自動的に解析し,サービスコードロジックを解析してプロトコル準拠のテストケースを生成する,新たなLLM誘導型IoT HTTPファジリング手法ChatHTTPFuzzを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:48:53 GMT)
DemMamba: Alignment-free Raw Video Demoireing with Frequency-assisted Spatio-Temporal Mamba [18.1] 2つの同様の反復パターンの干渉によるモアレパターンは、画面上の画像やビデオのキャプチャ中に頻繁に観察される。
本稿では,周波数アシスト型マンバを用いたアライメントレス生ビデオ復調ネットワークを提案する。
提案するDemMambaはPSNRで1.3dBの最先端手法を超越し,良好な視覚体験を提供する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:46:35 GMT)
Adaptive AI-Driven Material Synthesis: Towards Autonomous 2D Materials Growth [17.9] 本研究では,進化的手法で学習したニューラルネットワーク(ANN)を用いた自律材料合成の最前線について検討する。
我々のアプローチは、ニューラルネットワークがグラフェンの効率的な成長のための時間依存プロトコルを反復的かつ自律的に学習できることを示します。
この研究は材料工学の分野に大きく貢献し、合成プロセスにおける革新と効率の新しい時代を育む。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:57:23 GMT)
Loop Quantum Photonic Chip for Coherent Multi-Time-Step Evolution [17.8] Loop-QPCは、1つのチップで複数の時間ステップで量子力学を効率的にシミュレートするように設計されている。
低損失窒化ケイ素(SiN)集積フォトニックチップ上でのスピンボソンモデルのダイナミクスを実験的に実証した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:03:05 GMT)
Decoupling Training-Free Guided Diffusion by ADMM [17.4] 非条件生成モデルと誘導損失関数を明確に分離する新しいフレームワークを提案する。
そこで我々は,これらの成分を適応的にバランスをとるために,alternating Direction Method of Multipliers (ADMM) に基づく新しいアルゴリズムを開発した。
実験の結果,提案手法は高品質なサンプルを連続的に生成することがわかった。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 23:05:54 GMT)
Controlling Diversity at Inference: Guiding Diffusion Recommender Models with Targeted Category Preferences [17.2] 我々は,提案手法であるtextbfD3Rec (UnderlineDisentangled UnderlineDiffusion model for UnderlineDiversified UnderlineRecommendation) を提案する。
D3Recは,(1)カテゴリー選好に基づくレコメンデーション,(2)推論フェーズにおけるカテゴリー選好の制御,(3)任意のカテゴリー選好に対応することによって,私たちの3つのデシダータに適合する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:15:29 GMT)
TEEMATE: Fast and Efficient Confidential Container using Shared Enclave [17.0] ホストシステム上でエンクレーブを利用する新しいアプローチであるTeeMateを紹介した。
我々は、TeeMateが従来の機密コンテナ上に構築されたアプリケーションに比べて、少なくとも4.5倍のレイテンシと2.8倍のメモリ使用率を達成することを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:50:20 GMT)
An Open-Source Tool for Mapping War Destruction at Scale in Ukraine using Sentinel-1 Time Series [16.9] 本研究では、戦争による建物被害を推定するためのスケーラブルで伝達可能な手法を提案する。
まず、SAR(Synthetic Aperture Radar)衛星画像時系列から画素単位の破壊確率を出力する機械学習モデルを訓練する。
次に、オープン・ビル・フットプリントを用いて、これらの評価を後処理し、建物ごとの最終的な損傷推定値を得る。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:59:55 GMT)
Steering Language Model Refusal with Sparse Autoencoders [16.8] 拒否動作を媒介するPhi-3 Miniの特徴を同定し,操舵する。
機能ステアリングはPhi-3 Minisのロバスト性を向上し,さまざまな障害に対するジェイルブレイクの試みに有効であることがわかった。
しかし、機能ステアリングはベンチマーク全体のパフォーマンスに悪影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:47:02 GMT)
Understanding Chain-of-Thought in LLMs through Information Theory [16.8] 我々は,情報理論レンズを用いて,大規模言語モデル(LLM)におけるChain-of-Thought(CoT)推論を定式化する。
具体的には、各推論ステップにおける情報ゲインの定量化を行い、障害モードの識別を可能にする。
提案手法の有効性を,玩具およびGSM-8Kデータに対する広範囲な実験により実証し,既存の結果に基づく手法よりも優れていることを示した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:14:36 GMT)
AgentSquare: Automatic LLM Agent Search in Modular Design Space [16.7] 大規模言語モデル(LLM)は、幅広い複雑なタスクを処理できるエージェントシステムの急速な成長をもたらした。
Modularized LLM Agent Search (MoLAS) という新しい研究課題を紹介した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:25:15 GMT)
Dataset Distillers Are Good Label Denoisers In the Wild [16.6] ノイズ除去にデータセット蒸留を利用する新しい手法を提案する。
本手法は,既存の手法に共通するフィードバックループを回避し,トレーニング効率を向上させるとともに,オフライン処理による強力なプライバシ保護を提供する。
本研究では, 対称雑音, 非対称雑音, 実世界の自然騒音など, 様々な騒音条件下での3つの代表的データセット蒸留法(DATM, DANCE, RCIG)を厳格に評価した。
実験結果から,データセットの蒸留はランダムノイズのシナリオにおいて効果的にデノナイジングツールとして機能するが,非対称な非対称ノイズパターンに悩まされ,蒸留試料に吸収される可能性が示唆された。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:26:41 GMT)
Eidos: Efficient, Imperceptible Adversarial 3D Point Clouds [16.6] Eidosは、3D pOintクラウドSに対して効果的な非受容性アディバーサリアルアタックを提供するフレームワークである。
本稿では,3次元pOintクラウドSに対して,効率的な非知覚的アディバーサリアルアタックを提供するフレームワークであるEidosを提示することで,敵攻撃の理解を深める。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:00:25 GMT)
Fair Distillation: Teaching Fairness from Biased Teachers in Medical Imaging [16.6] 本研究では,Fair Distillation (FairDi) 法を提案する。
また,FairDiの精度は,既存手法に比べて向上し,グループ別精度も向上した。
FairDiは分類やセグメンテーションなどの様々な医療タスクに適応し、公平なモデルパフォーマンスのための効果的なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:50:34 GMT)
METEOR: Evolutionary Journey of Large Language Models from Guidance to Self-Growth [16.6] 本稿では,弱いデータ蒸留,反復訓練,自己進化戦略の3段階を含むMeteor法を提案する。
実験により,本手法はドメイン固有タスクにおける精度,完全性,妥当性,一貫性,信頼性を著しく向上することが示された。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:09:50 GMT)
Task Adaptive Feature Distribution Based Network for Few-shot Fine-grained Target Classification [16.6] タスク適応型特徴分散ネットワークであるTAFD-Netを提案する。
タスクレベルのニュアンスをキャプチャするための組み込みのためのタスク適応コンポーネント、クエリサンプルとサポートカテゴリ間の特徴分布の類似性を計算するための非対称メトリック、パフォーマンスを高めるための対照的な測定戦略を備えている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:44:30 GMT)
Information Extraction from Clinical Notes: Are We Ready to Switch to Large Language Models? [16.3] 大規模言語モデル(LLM)は生成タスクに優れるが、抽出タスクのパフォーマンスについては議論が続いている。
本研究は,オープンソースLLMを用いた包括的臨床用IEシステムの開発と評価を行った最初の試みである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:14:51 GMT)
Unconstrained Open Vocabulary Image Classification: Zero-Shot Transfer from Text to Image via CLIP Inversion [16.3] 我々は、自動回帰変換器を用いて言語として分類ラベルを生成出力する、革新的なリアルタイムuN制約Open Vocabulary ImageであるNOVICを紹介した。
本稿では,テンプレート生成したオブジェクト名詞集合の大規模92Mターゲットデータセットに基づいて,オブジェクトデコーダモデルを提案する。
これはCLIPテキストキャプションを効果的に反転させ、基本的には英語全体のテキストオブジェクトラベルを画像由来の埋め込みベクトルから直接生成することを可能にする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:43:38 GMT)
Hybrid Data-Driven SSM for Interpretable and Label-Free mmWave Channel Prediction [16.0] 本稿では,データ駆動型ニューラルネットワークを従来のモデルベースワークフローに統合するハイブリッド手法を提案する。
ラベルのないデータだけで組み込みニューラルネットワークをトレーニングするために、新しい教師なし学習戦略が開発された。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:54:44 GMT)
Theoretical Foundations of Conformal Prediction [15.9] コンフォーマルな予測と関連する推論技術は、多様なタスクの配列で有用である。
コンフォーマル予測の主な魅力は、正式な有限サンプル保証を提供する能力である。
本書の目的は、共形予測を研究する際に生じる基本的な技術的議論について読者に教えることである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:44:00 GMT)
Hacking Back the AI-Hacker: Prompt Injection as a Defense Against LLM-driven Cyberattacks [15.7] 大規模言語モデル(LLM)はサイバー攻撃の自動化にますます活用されている。
マンティス(Mantis)は、LLMが悪意ある操作を弱めるために敵の入力に対する感受性を悪用するフレームワークである。
マンティスはLLMによる自動攻撃に対して95%以上の効果を継続的に達成した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:15:46 GMT)
SynArtifact: Classifying and Alleviating Artifacts in Synthetic Images via Vision-Language Model [15.6] 総合的なアーティファクト分類法を開発し、微調整視覚言語モデル(VLM)のためのアーティファクトアノテーションを用いた合成画像のデータセットを構築する。
微調整されたVLMは、アーティファクトを識別し、ベースラインを25.66%上回る優れた能力を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:43:58 GMT)
Code Interviews: Design and Evaluation of a More Authentic Assessment for Introductory Programming Assignments [15.3] 本稿では,家庭内プログラミングの課題に対する,より正確な評価手法であるコードインタビューについて述べる。
コードインタビューは、学生に自分の仕事について議論するよう促し、よりニュアンスな、時には反復的な洞察を動機づけた。
我々は、学生体験、学術的整合性、作業負荷の教育など、コードインタビューの設計に関するさまざまな決定について論じる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:52:58 GMT)
Mitigating Knowledge Conflicts in Language Model-Driven Question Answering [15.3] 本研究では,入力源と生成内容との明示的な相関によって幻覚を緩和することができることを論じる。
本稿では,学習時の実体とその記述の相関が推論時のモデル行動を妨げる,幻覚,実体に基づく知識衝突の典型的な例に着目した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:33:10 GMT)
TimeFormer: Capturing Temporal Relationships of Deformable 3D Gaussians for Robust Reconstruction [15.1] 動的シーン再構築は3次元視覚における長期的課題である。
近年の手法では,3次元ガウス平滑化を動的シーンに拡張し,変形を誘導するために運動流のような明示的な制約を適用している。
彼らは個々のタイムスタンプから動きの変化を個別に学習し、複雑なシーンの再構築を困難にしている。
我々はTimeFormerと呼ばれるプラグイン・アンド・プレイ・モジュールを設計し、既存の変形可能な3Dガウス再構成手法を学習の観点から暗黙的にパターンをモデル化することができるようにした。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:11:11 GMT)
Deep Learning-based Code Reviews: A Paradigm Shift or a Double-Edged Sword? [15.0] 私たちは、自動生成されたコードレビューのサポートなしで、異なるプログラムをレビューする29人の専門家による制御された実験を実行しました。
本研究は,LLMが自動認識する問題の大部分をレビュアが有効とみなし,自動化されたレビューを出発点として利用できることが,彼らの行動に強く影響していることを示す。
しかし、自動化されたレビューから始まったレビュアーは、完全な手作業のプロセスと比較して、より高重度な問題を特定できない一方で、より多くの低重度な問題を特定した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:24:01 GMT)
Learning-Based Pricing and Matching for Two-Sided Queues [14.9] 複数のタイプの顧客とサーバを持つ動的システムについて検討する。
各キューの到着率は、未知の需要または供給機能に応じて価格によって決定される。
このシステムは、乗客やドライバーとの乗り合い市場のような、両側の市場をモデル化するのに使用することができる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:58:35 GMT)
LeC$^2$O-NeRF: Learning Continuous and Compact Large-Scale Occupancy for Urban Scenes [14.8] NeRFにおいて重要な問題は、空き空間のスキップと点サンプリングを誘導するために、占有率を効果的に見積もることである。
本稿では, 3次元点を占有点または占有点に分類できる, 連続的かつコンパクトな大規模占有網を提案する。
実験では,我々の占有網は,占有網よりもコンパクトで,正確で,スムーズな占有網を迅速に学習することができる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:37:48 GMT)
MGNiceNet: Unified Monocular Geometric Scene Understanding [14.2] 単図形幾何学的シーン理解は、パノプティクスのセグメンテーションと自己教師付き深度推定を組み合わせたものである。
本稿では,汎視的セグメンテーションと自己教師型深度推定にリンクされたカーネルの定式化を利用する統一的なアプローチMGNiceNetを紹介する。
我々のモデルは、他のリアルタイム手法と比較して最先端の結果を示し、計算に要求される手法とのギャップを埋める。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:01:25 GMT)
TS-ACL: A Time Series Analytic Continual Learning Framework for Privacy-Preserving and Class-Incremental Pattern Recognition [14.1] TS-ACLは、プライバシー保護とクラスインクリメンタルパターン認識のための新しいフレームワークである。
モデルの各更新は、クローズドフォームのソリューションで、勾配のない分析学習プロセスに変換される。
同時に、非鍛造、プライバシー保護、軽量消費を実現し、様々なアプリケーションに広く適合する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:30:06 GMT)
ByteScience: Bridging Unstructured Scientific Literature and Structured Data with Auto Fine-tuned Large Language Model in Token Granularity [14.0] ByteScienceは非営利のクラウドベースの自動車ファインチューニング大型言語モデル(LLM)プラットフォームである。
構造化された科学データを抽出し、巨大な科学コーパスから新しい科学知識を合成するように設計されている。
このプラットフォームは、少量の注釈付き記事で顕著な精度を達成している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:36:26 GMT)
Mapping out the Space of Human Feedback for Reinforcement Learning: A Conceptual Framework [13.9] 我々は、対話型学習シナリオにおける人間のフィードバックの共通理解を開発することにより、機械学習と人間とコンピュータの相互作用のギャップを埋める。
そこで我々は,9つの重要な次元に基づいて,人的フィードバックから報酬に基づく学習を行うためのフィードバックタイプ分類を導入した。
フィードバックを表現できる人間の能力と、フィードバックから学習するエージェントの能力に影響を及ぼす、人間のフィードバックの質の指標を7つ同定する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:40:42 GMT)
MagicFace: Training-free Universal-Style Human Image Customized Synthesis [13.9] MagicFaceは、マルチコンセプトのユニバーサルなヒューマンイメージパーソナライズされた合成のためのトレーニング不要の方法である。
私たちの中核となる考え方は、人間が特定の概念を与えられた画像を作成する方法をシミュレートし、まずセマンティックなレイアウトを確立することです。
第1段階では、RSAは遅延画像がすべての参照概念から同時に特徴を問合せすることを可能にする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:14:37 GMT)
DreamText: High Fidelity Scene Text Synthesis [13.9] シーンテキスト合成では、指定されたテキストを任意の画像にレンダリングする。
現在の方法は、通常、このタスクをエンドツーエンドで定式化するが、トレーニング中に効果的なキャラクタレベルのガイダンスが欠如している。
本稿では,高忠実度シーンテキスト合成のためのDreamTextを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:52:26 GMT)
Scalable spectral representations for multi-agent reinforcement learning in network MDPs [13.8] マルチエージェント制御の一般的なモデルであるNetwork Markov Decision Processes (MDPs)は、効率的な学習に重大な課題をもたらす。
まず、ネットワークMDPに対してスケーラブルなスペクトル局所表現を導出し、各エージェントの局所$Q$関数に対するネットワーク線形部分空間を誘導する。
我々は,連続的な状態対応ネットワークMDPのためのスケーラブルなアルゴリズムフレームワークを設計し,アルゴリズムの収束をエンドツーエンドで保証する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:21:40 GMT)
3D microstructural generation from 2D images of cement paste using generative adversarial networks [13.7] 本稿では, 単一の2次元(2次元)画像から3次元構造を生成可能な, 逆ネットワークに基づく生成手法を提案する。
本手法では,2次元断面画像から微細構造情報を学習することにより,3次元画像を合成するフレームワークを設計する。
視覚観察により、生成した3D画像は、同様の細孔分布や粒子形態を含む2D画像と類似した微細構造を示すことが確認された。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:56:06 GMT)
ShiftAddLLM: Accelerating Pretrained LLMs via Post-Training Multiplication-Less Reparameterization [13.6] ShiftAddLLMは大規模言語モデルの効率的な乗算自由モデルである。
5.6および22.7ポイントのパープレキシティ改善を同等または低いレイテンシで達成する。
5つのLLMファミリーと8つのタスクの実験は、ShiftAddLLMの有効性を一貫して検証している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:18:32 GMT)
Active learning for efficient discovery of optimal gene combinations in the combinatorial perturbation space [13.4] NAIADは、最適な遺伝子ペアを効率的に発見する、アクティブな学習フレームワークである。
4つのCRISPR摂動データセットで、合計35万以上の遺伝子相互作用が評価された。
我々のフレームワークは、新規で効果的な遺伝子の組み合わせの同定を改善し、CRISPRライブラリーの設計をより効率的にする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:49:51 GMT)
Dissecting Payload-based Transaction Phishing on Ethereum [13.4] ペイロードベースのトランザクションフィッシング(PTXPHISH)は、悪意のあるペイロードの実行を通じてユーザを騙すスマートコントラクトインタラクションを操作する。
PTXPHISHは急速に重大な脅威となり、2023年の報告書では7000万ドルを超える損失を招いた。
5000のフィッシングトランザクションからなるPTXPHISHデータセットを構築。
そこで本研究では,PTXPHISHを同定するためのルールベース多次元検出手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:53:30 GMT)
Competing Bandits in Decentralized Large Contextual Matching Markets [13.3] 我々は、需要側(プレイヤーまたはエージェント)が大きな供給側(腕)と競合する二面的マッチング市場における分散学習を研究する。
提案アルゴリズムは,腕の数によらず,インスタンス依存の対数的後悔を実現する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:08:05 GMT)
GROOT: Effective Design of Biological Sequences with Limited Experimental Data [13.3] 本稿では,生物配列最適化のためのグラフベースのラテント平滑化であるGROOTを紹介する。
タンパク質の最適化(GFP, AAV)やデザイン・ベンチの正確なオーラクルを用いた3つのタスクを含む,様々な生物配列設計タスクにおけるGROOTの評価を行った。
その結果、GROOTはブラックボックスのオーラクルや大量のラベル付きデータへのアクセスを必要とせず、既存のメソッドを均等に越えることを示した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:38:42 GMT)
MV2Cyl: Reconstructing 3D Extrusion Cylinders from Multi-View Images [13.3] 2次元多視点画像から3次元を再構成する新しい手法であるMV2Cylを提案する。
本研究では,2次元スケッチと抽出パラメータ推定において最適な精度で最適な再構成結果を得る。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:28:57 GMT)
Newclid: A User-Friendly Replacement for AlphaGeometry [13.2] 我々は、AlphaGeometryをベースとしたニュークリッドと呼ばれる新しい幾何学の記号解法を導入する。
ニュークリッドにはDDARN(DDAR-Newclidに由来する)と呼ばれるシンボリックソルバが含まれており、これはAlphaGeometryのDDARシンボリックソルバの大幅なアップグレードである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:24:21 GMT)
Efficient Transfer Learning for Video-language Foundation Models [13.2] テキストと視覚分岐における表現のアライメントを改善するため,MSTA(Multi-modal Spatio-supervised)を提案する。
提案手法の有効性は,ゼロショット転送,少数ショット学習,ベース・ツー・ヴァリアント,完全言語学習の4つの課題にまたがる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:25:58 GMT)
FuXi Weather: A data-to-forecast machine learning system for global weather [13.1] FuXi Weatherは、複数の衛星のデータと類似した機械学習の天気予報システムである。
FuXi 気象は、中央アフリカなどの観測圏において、ECMWF HRES を一貫して上回っている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:19:17 GMT)
Edge-Enhanced Dilated Residual Attention Network for Multimodal Medical Image Fusion [13.0] マルチモーダル・メディカル・イメージ・フュージョン(Multimodal Medical Image fusion)は、様々な画像モダリティからの相補的な情報を統一的な表現に結合する重要なタスクである。
深層学習手法は融合性能が著しく向上しているが、既存のCNNベースの手法では、微細なマルチスケールとエッジの特徴を捉えるには不十分である。
マルチスケール機能抽出のためのDilated Residual Attention Network Moduleを導入することで,これらの制約に対処する新しいCNNアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:11:53 GMT)
CLUE-MARK: Watermarking Diffusion Models using CLWE [13.0] 本稿では,拡散モデルに対する最初の検出不能な透かし方式であるCLUE-Markを紹介する。
CLUE-Markは、ウォーターマークされたモデルの変更を一切必要とせず、計算効率が良く、モデル出力の品質に影響を与えないことが保証されている。
CLUE-Markは、最近のステガノグラフィー攻撃では検出や除去ができない。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:03:01 GMT)
Separating Tongue from Thought: Activation Patching Reveals Language-Agnostic Concept Representations in Transformers [12.9] 変圧器に基づく言語モデルにおいて,単語翻訳作業中の潜時表現(潜時表現)を解析する。
出力言語は、翻訳される概念よりも前のレイヤの潜在層にエンコードされていることが分かりました。
本研究は,言語に依存しない概念表現の存在を実証するものである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:41:38 GMT)
Dissecting Misalignment of Multimodal Large Language Models via Influence Function [12.8] コントラスト損失に対する拡張影響関数 (ECIF) を導入し, コントラスト損失に対する影響関数について検討した。
ECIFは正と負の両方のサンプルを考慮し、対照的な学習モデルの閉形式近似を提供する。
ECIFを基盤として,MLLMにおけるデータ評価,誤アライメント検出,誤予測トレースバックタスクなどの一連のアルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:45:41 GMT)
Mirror Descent on Reproducing Kernel Banach Spaces [12.7] 本稿では,再生カーネルを用いたバナッハ空間の学習問題に対処する。
再生カーネルを用いてバナッハ空間の双対空間における勾配ステップを利用するアルゴリズムを提案する。
実際にこのアルゴリズムをインスタンス化するために、$p$-normのRKBSの新しいファミリーを導入する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:18:32 GMT)
Exact Quantum Algorithm for Unit Commitment Optimization based on Partially Connected Quantum Neural Networks [12.7] 本稿では、量子ニューラルネットワーク(QNN)に基づく正確な量子アルゴリズムによる単位コミットメント問題の実装に焦点を当てる。
その結果、改良されたアルゴリズムにより正確な解を得ることができ、量子回路の深さを同時に低減できることがわかった。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:29:50 GMT)
Large Language Models and Cognitive Science: A Comprehensive Review of Similarities, Differences, and Challenges [12.4] 本稿では,Large Language Models(LLM)と認知科学の交わりについて概観する。
我々は,LLMの認知能力を評価する手法を分析し,認知モデルとしての可能性について議論する。
我々はLLMの認知バイアスと限界を評価し,その性能向上手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:17:32 GMT)
The ADUULM-360 Dataset -- A Multi-Modal Dataset for Depth Estimation in Adverse Weather [12.2] この研究は、深度推定のための新しいマルチモーダルデータセットであるADUULM-360データセットを提示する。
ADUULM-360データセットは、既存の自動運転センサー、カメラ、ライダー、レーダーを全てカバーしている。
良質な気象条件と悪質な気象条件の多様なシーンを含む最初の深度推定データセットである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:42:53 GMT)
Robust Markov Decision Processes: A Place Where AI and Formal Methods Meet [12.1] マルコフ決定プロセス(MDP)は、シーケンシャルな意思決定問題の標準モデルである。
形式的手法や人工知能(AI)など、多くの科学分野で広く使われている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:34:14 GMT)
MMBind: Unleashing the Potential of Distributed and Heterogeneous Data for Multimodal Learning in IoT [11.9] 分散および異種IoTデータのマルチモーダル学習のための新しいフレームワークであるMBindを提案する。
同様の事象を観測する異なるモードのデータを、異なる時間や場所で捉えたとしても、マルチモーダルトレーニングに効果的に利用できることを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 23:34:07 GMT)
Exploring Eye Tracking to Detect Cognitive Load in Complex Virtual Reality Training [11.8] 視線追跡に基づく機械学習手法を用いて、ユーザの認知負荷を検出するための研究が進行中である。
寒冷噴霧のためのVRトレーニングシステムを開発し,22名の被験者を対象に実験を行った。
予備分析は、複雑なVR体験における認知負荷を検出するためにアイトラッキングを使用することの可能性を示している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:44:19 GMT)
Optimal and Fair Encouragement Policy Evaluation and Learning [11.7] 本研究は, 陽性の潜在的な違反を含む最適治療規則の因果同定とロバストな評価について検討した。
一般制約下でのパラメタライズされたポリシークラスを解くための2段階のアルゴリズムを開発し、分散感応的後悔境界を求める。
本研究は, SNAP給付のリマインダーデータ, 保険申請の無作為化促進, および電子監視による事前管理リリースに基づく3つのケーススタディである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:40:52 GMT)
Fast Convergence of Softmax Policy Mirror Ascent [11.5] 自然ポリシー勾配 (NPG) は共通ポリシー最適化アルゴリズムであり、確率空間におけるミラー上昇と見なすことができる。
我々はこのアルゴリズムを改良し、アクション間の正規化の必要性を排除し、結果の方法を分析する(SPMA参照)。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:27:13 GMT)
Variational Graph Autoencoder for Heterogeneous Information Networks with Missing and Inaccurate Attributes [11.4] Heterogeneous Information Networks (HINs) は近年,グラフマイニングにおいて優れた性能を示している。
本稿では,欠落属性,不正確な属性,ノードのラベル不足に対処するための自己教師付き生成モデルGraMIを提案する。
GraMIは、非分散ノードに対する情報機能を完備するだけでなく、属性ノードに対する不正確な機能を修正できる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:55:45 GMT)
BeeManc at the PLABA Track of TAC-2024: RoBERTa for task 1 -- LLaMA3.1 and GPT-4o for task 2 [11.4] 本報告はPLABA 2024の2つのサブタスクに対応する2つのセクションを含む。
課題1では,微調整されたReBERTa-Baseモデルを用いて,バイオメディカル抽象化における難解な用語,用語,頭字語を識別・分類し,F1スコアを報告した。
第2タスクでは,Llamma3.1-70B-Instruct と GPT-4o を用いて抽象的な適応を完了し,BLEU,SARI,BERTScore,LENS,SALSAでスコアを報告した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:51:17 GMT)
Feature-wise and Sample-wise Adaptive Transfer Learning for High-dimensional Linear Regression [11.0] 本稿では,F-AdaTrans(F-AdaTrans)やS-AdaTrans(S-AdaTrans)の変換可能な構造を検出・集約できる適応型トランスファー学習法を提案する。
F-AdaTransは適切に選択された重みによって、既知の伝達可能な構造を持つオラクル推定器に近い収束率が得られることを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:30:16 GMT)
GazeGen: Gaze-Driven User Interaction for Visual Content Generation [11.0] 本稿では,ユーザの視線で示される位置の視覚的コンテンツ(画像とビデオ)を生成するユーザインタラクションシステムであるGazeGenを紹介する。
オブジェクト検出と生成AIの高度な技術を使用して、GazeGenは、画像オブジェクトの視線制御された画像の追加/削除、再配置、および表面スタイルの変更を実行し、静的イメージをビデオに変換する。
GazeGenの中心は、281Kパラメータしか持たない超軽量モデルであるDFT Gazeエージェントである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 00:31:33 GMT)
Mirror and Preconditioned Gradient Descent in Wasserstein Space [10.9] 我々は、ミラー降下とプレコンディショニング勾配という2つの明示的なアルゴリズムを持ち上げることに重点を置いている。
目的関数と正則化器の新しいペアリングに対して、ワッサーシュタイン勾配に基づく離散時間スキームの収束を保証する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:56:37 GMT)
Harnessing High-Level Song Descriptors towards Natural Language-Based Music Recommendation [10.7] 言語モデル(LM)は、ユーザーが大規模なカタログをナビゲートするのを支援することで人気を集めている。
ジャンル,ムード,リスニングコンテキストなどの記述子を用いたユーザ自然言語記述や項目に基づく楽曲の推薦におけるLMの有効性を評価した。
その結果,LMは言語間の類似性,情報検索,より長い記述をより短い高レベルな音楽記述子にマッピングするために微調整されているため,性能が向上したことが明らかとなった。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:04:14 GMT)
Adapting to Cyber Threats: A Phishing Evolution Network (PEN) Framework for Phishing Generation and Analyzing Evolution Patterns using Large Language Models [10.6] フィッシングはいまだに広範囲にわたるサイバー脅威であり、攻撃者は詐欺メールを使って被害者を誘惑し、機密情報を暴露している。
人工知能(AI)はフィッシング攻撃に対する防御において重要な要素となっているが、これらのアプローチは重大な制限に直面している。
本稿では,大規模言語モデル (LLM) と対向学習機構を活用するフレームワークであるPhishing Evolution Network (PEN) を提案し,高品質で現実的なフィッシングサンプルを連続的に生成する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:03:51 GMT)
Debiased Regression for Root-N-Consistent Conditional Mean Estimation [10.5] 本稿では,高次元および非パラメトリック回帰推定器を含む回帰推定器のデバイアス化手法を提案する。
理論解析により,提案した推定器は,緩やかな収束率条件下で$sqrtn$-consistencyと正規性を達成することを示した。
提案手法は,推定精度の向上や信頼区間の簡易化など,いくつかの利点を提供する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:25:06 GMT)
ptt5-v2: A Closer Look at Continued Pretraining of T5 Models for the Portuguese Language [10.4] この作業は、$textttptt5-v2$を導入し、ポルトガル向けのT5モデルの継続的な事前トレーニングを調査した。
ポルトガルの下流3つのタスクの微調整は、後者の2つにSOTAの結果をもたらす。
おそらく意外なことに、その影響はベースラインと比べて微妙だ。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:19:02 GMT)
Strong-to-Weak Spontaneous Symmetry Breaking in Mixed Quantum States [10.4] 本稿では,強い対称性を弱い対称性に分解する新しいタイプの自発対称性破壊(SSB)について検討する。
SW-SSBは混合状態量子相の普遍的性質であることを示す。
我々は、(固定対称性の電荷を持つ)正準アンサンブルにおける非零温度の熱状態は、自発的に強い対称性を破るべきであると論じる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:28:47 GMT)
Pursuing Overall Welfare in Federated Learning through Sequential Decision Making [10.4] 従来のフェデレートラーニングでは、単一のグローバルモデルはすべてのクライアントに対して等しく機能することができない。
我々の研究は、既存の公正を意識したアグリゲーション戦略をオンライン凸最適化フレームワークに統合できることを明らかにした。
AAggFFは、両方の実践的な設定において、既存のメソッドよりもクライアントレベルの公平性が高い。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:06:59 GMT)
Learning to mask: Towards generalized face forgery detection [10.2] フェースフォージェリ検出器にとって、偽造の見当たらない型に対する一般化性は不可欠である。
私たちの目標は、トレーニングフェーズで簡単に学習できる機能を減らすことで、特定のフォージェリータイプに過度に適合するリスクを減らすことです。
機能領域の偽造を合成するために、深い機能混在戦略も提案されている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:14:42 GMT)
BrightDreamer: Generic 3D Gaussian Generative Framework for Fast Text-to-3D Synthesis [10.2] 本稿ではBrightDreamerを提案する。BrightDreamerは、汎用的で高速なテキストから3D生成を実現するエンドツーエンドフィードフォワードアプローチである。
まず、変形形状とその新しい位置を予測するために、テキスト誘導形状変形(TSD)ネットワークを提案する。
次に,新しい3次元オブジェクトの3次元表現を生成するために,テキスト誘導型3次元ジェネレータ(TTG)を設計する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:19:52 GMT)
SP${ }^3$ : Superpixel-propagated pseudo-label learning for weakly semi-supervised medical image segmentation [10.1] 弱半教師付きセグメンテーションにおいて,超Pixel-Propagated Pseudo-label Learning法を提案する。
本手法は,WSSS設定下での腫瘍と臓器のセグメンテーションデータセットの最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:14:36 GMT)
Federated Contrastive Learning of Graph-Level Representations [10.1] グラフレベルの表現(FCLG)の相互比較学習
本稿では,グラフレベル表現のFederated Contrastive Learning of Graph-level Representations(FCLG)と呼ぶ新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 22:10:31 GMT)
In-Situ Melt Pool Characterization via Thermal Imaging for Defect Detection in Directed Energy Deposition Using Vision Transformers [10.1] ポーシティや亀裂などの内部欠陥は、機械的特性や全体的な性能を損なう可能性がある。
本研究は,DEDプリント部品の欠陥検出と品質管理の改善を目的として,ポロシティに関連するプールのその場監視とキャラクタリゼーションに焦点を当てた。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:03:49 GMT)
PyGim: An Efficient Graph Neural Network Library for Real Processing-In-Memory Architectures [10.0] 実PIMシステム上でグラフニューラルネットワークを高速化する,効率的なMLライブラリであるPyGimを紹介する。
我々は、計算集約型およびメモリ集約型カーネルをプロセッサ中心およびメモリ中心のシステムで実行するハイブリッドGNN実行を提供する。
我々は、1992年のPIMコアを持つ実世界のPIMシステム上で、新しいGNNモデルを用いてPyGimを広範囲に評価し、Intel Xeonの最先端CPUを平均3.04倍に上回っていることを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:05:29 GMT)
Harnessing Scale and Physics: A Multi-Graph Neural Operator Framework for PDEs on Arbitrary Geometries [10.0] 偏微分方程式は多くの科学的現象を導くが、伝統的な計算手法は複雑なシステムや不規則な幾何学としばしば苦労する。
本稿では,textbfArbitrary ジオメトリ上でPDEを効率的に解くために設計されたニューラル演算子である textbfAMG 法を提案する。
6つのベンチマークでAMGを総合的に評価し、既存の最先端モデルよりも一貫した優位性を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:35:03 GMT)
Don't Be So Positive: Negative Step Sizes in Second-Order Methods [9.8] 負のステップサイズを用いることは、一般的なヘッセン変換法よりも効果的であることが示される。
負のステップサイズを用いることは、一般的なヘッセン変換法よりも効果的であることが実験的に実証された。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:27:44 GMT)
Unveiling the Inflexibility of Adaptive Embedding in Traffic Forecasting [9.8] 急速な都市化は交通パターンや旅行需要の動的変化をもたらし、正確な長期交通予測の大きな課題となっている。
我々は,既存のST-GNNの性能劣化を,拡張トラヒックベンチマークで評価し,その性能劣化を観測した。
本稿では,モデルが再学習せずに新たなシナリオに適応可能なPCA(Principal Component Analysis)の組込み手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:30:34 GMT)
Quantum Frontiers in High Energy Physics [9.7] 標準モデルを超えた新しい物理の微妙な効果を検知する量子デバイスの可能性について論じる。
また、初期の宇宙や衝突機におけるリアルタイム非摂動力学の研究における量子アルゴリズムと大規模量子コンピュータの変換的役割についても論じる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:41:08 GMT)
Count on Your Elders: Laplace vs Gaussian Noise [9.5] 多くの環境では、ラプラスノイズはガウスノイズよりも好まれるかもしれないと我々は主張する。
ガウス機構によって付加される雑音は、常に同値な分散のラプラスノイズに置き換えることができることを示す。
これはガウスノイズが高次元雑音に使用されるという従来の知恵に挑戦する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:40:25 GMT)
Reinforced Symbolic Learning with Logical Constraints for Predicting Turbine Blade Fatigue Life [9.5] 本稿では,機械的特性と疲労寿命を関連付ける予測式を導出するReinforced Symbolic Learning (RSL)を提案する。
提案手法はGH4169とTC4の2つのタービンブレード材料を用いて評価した。
6つの経験式と5つの機械学習アルゴリズムと比較すると、RSLはより解釈可能な式を生成するだけでなく、優れた予測精度または同等の予測精度を達成する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:01:48 GMT)
Variable Rate Neural Compression for Sparse Detector Data [9.3] 本稿では,スパース畳み込みによるキーポイント識別によるTPCデータ圧縮手法を提案する。
BCAE-VSは、以前の最先端モデルよりも圧縮率を10%高め、再構築精度を75%高めている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:15:35 GMT)
Simple But Not Secure: An Empirical Security Analysis of Two-factor Authentication Systems [9.0] 2FAシステムの脆弱性を検出するための脆弱性評価フレームワークSE2FAを提案する。
我々はTranco Top 10,000リストから407の2FAシステムのセキュリティを分析した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:08:56 GMT)
A Novel Fusion Architecture for PD Detection Using Semi-Supervised Speech Embeddings [9.0] 本稿では,パーキンソン病(PD)をWebアプリケーションを用いて収集した英語パングラム発話音声を通して認識する枠組みを提案する。
我々のデータセットには、PDと診断された392人を含む1306人の世界的コホートが含まれている。
We used deep learning embeddeds derived from semi-supervised model, Wav2Vec 2.0, WavLM, ImageBind represented the speech dynamics associated with PD。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:43:37 GMT)
Redefining Proactivity for Information Seeking Dialogue [9.0] Information-Seeking Dialogue (ISD) エージェントは、ユーザのクエリに対して正確な応答を提供することを目的としている。
生成した各反応の「積極性」を高めることに焦点を当てた新規な積極性定義を提案する。
2,000の単ターン会話からなるプロアクティブ対話データセットを構築し、応答のプロアクティブ性を評価するためにいくつかの自動メトリクスを導入する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:13:31 GMT)
A Pre-Trained Graph-Based Model for Adaptive Sequencing of Educational Documents [9.0] 大規模なオープンオンラインコース(MOOC)は、教育をよりアクセスしやすいものにするために大きく貢献している。
多くのMOOCは、個々の学習者の多様なニーズや背景に対処できない、厳格で一大の全ての構造を維持している。
本研究では,専門家のアノテーションを使わずに機能するパスパーソナライズ学習のための,新たなデータ効率フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:29:06 GMT)
JESTR: Joint Embedding Space Technique for Ranking Candidate Molecules for the Annotation of Untargeted Metabolomics Data [9.0] アノテーションのための新しいパラダイム(JESTR)を導入する。
分子指紋やスペクトルを明示的に構築する以前のアプローチとは異なり、JESTRはそれらの表現を共同空間に埋め込む。
JESTRを3つのデータセット上でmol-to-specおよびspec-to-FPアノテーションツールに対して評価する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:03:57 GMT)
FastVideoEdit: Leveraging Consistency Models for Efficient Text-to-Video Editing [8.9] 既存のビデオ編集における画像生成モデルへのアプローチは、ワンショットの微調整、追加条件抽出、DDIMの逆変換といった時間を要する。
我々は、一貫性モデル(CM)にインスパイアされた効率的なゼロショットビデオ編集手法であるFastVideoEditを提案する。
本手法は,特別な分散スケジュールを用いて,ソース映像からターゲット映像への直接マッピングを可能にする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 23:08:21 GMT)
Backdoor defense, learnability and obfuscation [8.9] 本研究では,攻撃者と防御者の間のゲームを用いて,バックドアに対する防御性に関する公式な概念を導入する。
私たちの定義は単純で、学習について明示的に言及していませんが、学習容易性と密接な関係があることを示します。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:48:59 GMT)
Membership Inference Attack against Long-Context Large Language Models [8.8] すべての情報を長いコンテキストに統合することで、センシティブな情報のリポジトリになる、と我々は主張する。
LCLMに適した6つのメンバシップ推論攻撃戦略を提案する。
LCLMがそのような会員情報を明らかにするのに有効な理由について検討する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:50:54 GMT)
Zoomed In, Diffused Out: Towards Local Degradation-Aware Multi-Diffusion for Extreme Image Super-Resolution [8.7] 大規模で事前訓練されたテキスト・ツー・イメージ(T2I)拡散モデルが画像生成タスクで大きな人気を集めている。
既存のほとんどのT2I拡散モデルは解像度限界512x512で訓練されており、この解像度を超えるスケーリングは画像超解法(SR)にとって未解決だが必要な課題である。
本稿では,2K,4K,さらに8K画像も追加トレーニングなしで生成できる新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:32:49 GMT)
Distill the Best, Ignore the Rest: Improving Dataset Distillation with Loss-Value-Based Pruning [8.7] 『プーン・ファースト・ディスティル・アフター』フレームワークは、蒸留に先立って、損失ベースのサンプリングを通じてデータセットをプーンする。
提案手法は蒸留品質を著しく向上させ, 最大5.2ポイントの精度向上を実現した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 22:51:44 GMT)
Structural-Based Uncertainty in Deep Learning Across Anatomical Scales: Analysis in White Matter Lesion Segmentation [8.6] 不確実性定量化(英: Uncertainty Quantification、UQ)は、ホワイトマター病変(WML)セグメンテーションの文脈における、自動ディープラーニング(DL)ツールの信頼性の指標である。
我々は, 構造的予測の相違から, 病変や患者スケールの不確かさを定量化する尺度を開発した。
444例の多心MRIデータから, 病変のモデル誤差をより効果的に把握し, 患者規模を計測できることが示唆された。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:16:43 GMT)
Targeted Efficient Fine-tuning: Optimizing Parameter Updates with Data-Driven Sample Selection [8.6] FISHマスクのサンプル-パラメータ対選択を最適化するために、反復距離減少(IRD)アルゴリズムを提案する。
GLUEベンチマークを用いて提案手法の有効性と合理性を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:32:16 GMT)
Sensing atomic superfluid rotation beyond the standard quantum limit [8.6] リングトラップ内のボース・アインシュタイン凝縮体(BEC)を用いて形成された原子超流体は、超流動流体力学、量子センシング、物質波干渉計の文脈で研究されている。
近年の研究では、環BECを軌道角運動量を持つ光学キャビティモードに結合させることにより、縮合体の回転を最小限に破壊的に測定する手法が提案されている。
圧縮光とバックアクション回避技術を用いることで、凝縮体の角運動量が標準量子限界よりかなり低いノイズで感知できることを実証するために、詳細な理論的解析を行った。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 23:43:55 GMT)
QuanTA: Efficient High-Rank Fine-Tuning of LLMs with Quantum-Informed Tensor Adaptation [8.4] QuanTAは、大規模事前学習言語モデルのための推論オーバーヘッドのない、実装が容易で微調整の手法である。
従来の手法と比較して,QuanTAはコモンセンス推論,算術推論,拡張性を著しく向上させることを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 22:24:16 GMT)
SAD-TIME: a Spatiotemporal-fused network for depression detection with Automated multi-scale Depth-wise and TIME-interval-related common feature extractor [8.3] うつ病は重度の精神疾患であり、正確な診断はうつ病患者の治療とリハビリに欠かせない。
より客観的な診断方法を探すために、研究者は、うつ病を識別するディープラーニングベースの方法の実験を開始した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:29:38 GMT)
Understanding Generalizability of Diffusion Models Requires Rethinking the Hidden Gaussian Structure [8.3] 学習したスコア関数の隠れた性質を調べた結果,拡散モデルの一般化可能性について検討した。
拡散モデルが記憶から一般化へと遷移するにつれて、対応する非線形拡散デノイザは線形性を増加させる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:04:09 GMT)
SoliDiffy: AST Differencing for Solidity Smart Contracts [8.2] SoliDiffyは、Solidity用に特別に設計された、新しい差別化ツールである。
SoliDiffyは、スマートコントラクトの正確かつ簡潔な編集スクリプトを生成することによって、きめ細かい分析を可能にする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:28:15 GMT)
Just Leaf It: Accelerating Diffusion Classifiers with Hierarchical Class Pruning [8.2] 本稿では、データセット固有の階層的ラベル構造を利用する階層的拡散(HDC)を提案する。
HDCは、維持しながら最大60%の推論を加速し、場合によっては分類精度を向上させる。
我々の研究により、速度と精度のトレードオフの新しい制御機構が実現され、現実世界のアプリケーションでは拡散に基づく分類がより有効になる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:34:05 GMT)
Physics-informed Machine Learning for Battery Pack Thermal Management [8.2] 電池セルを熱ペーストで囲む冷板を上下に配置した21700バッテリパック間接液体冷却システムを開発した。
冷媒流量が高いため、蓄電池が熱源であるのに対し、冷板は一定の温度境界とみなすことができる。
物理インフォームド畳み込みニューラルネットワークは、電池パックの温度分布を推定する代理モデルとして機能した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:27:04 GMT)
Fine-Grained Uncertainty Quantification via Collisions [8.2] 衝突行列を用いた微細不確実性定量化(UQ)のための新しい手法を提案する。
K 時間 K$ クラスを含む分類問題に対して、衝突行列 $S$ は各クラスを区別する固有の(アラート的な)困難を測る。
既存のUQ法とは対照的に、衝突行列は分類の難しさをより詳細に示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 23:41:27 GMT)
SeqProFT: Applying LoRA Finetuning for Sequence-only Protein Property Predictions [8.1] 本研究では,ESM-2モデルのエンド・ツー・エンドの微調整を行うためにLoRA法を用いる。
下流ネットワークにマルチヘッドアテンション機構を統合して、シーケンス特徴とコンタクトマップ情報を組み合わせる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:40:39 GMT)
DecoR: Deconfounding Time Series with Robust Regression [8.0] この研究は、第3の観測されていない時系列によって構成される2つの時系列間の因果効果を推定することに焦点を当てる。
本稿では、周波数領域における頑健な線形回帰を用いて因果効果を推定する新しいアプローチである、ロバスト回帰(DecoR)によるデコンウンディングを導入する。
我々は、地球系科学の合成データと実世界のデータの両方に関する実験を通じて、DecoRの有効性を実証する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:02:13 GMT)
Phenome-wide causal proteomics enhance systemic lupus erythematosus flare prediction: A study in Asian populations [8.0] 全身性エリテマトーデス(Systemic lupus erythematosus, SLE)は、予測不能フレアを特徴とする複雑な自己免疫疾患である。
本研究は,アジア系SLE人口を対象とした新しいループに基づくリスク予測モデルの構築を目的とする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:50:36 GMT)
Receiver-device-independent quantum secure direct communication [8.0] デバイス非依存(DI)と測定デバイス非依存(MDI)の量子セキュアダイレクト通信プロトコルは、理論上QSDCの実用的セキュリティを高めることができる。
単一光子ベースの受信デバイス非依存(RDI)QSDCプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:50:03 GMT)
Investigating the Use of Productive Failure as a Design Paradigm for Learning Introductory Python Programming [7.8] プロダクティブ・フェース(Productive Failure, PF)とは、未学習の概念を対象とする新たな問題に学生が取り組む学習手法である。
STEM分野の最近の応用は、PFが学習者がより堅牢な概念的知識を開発するのに役立つことを示唆している。
我々は、コンシューマーグレードのウェアラブルセンサーからリアルタイム心拍データを非侵襲的に収集する新しいPFベースの学習アクティビティを設計した。
初等学習結果に差は認められなかったが, PF アプローチを施行した学生は, 遅れながら類似した課題に対して, 知識の保持と性能の向上が認められた。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:39:05 GMT)
AdaptLIL: A Gaze-Adaptive Visualization for Ontology Mapping [7.8] 本稿では,視線を主入力源とするリアルタイム適応型リンクインデントリストオントロジーマッピングであるAdaptLILについて紹介する。
リアルタイムシステム、ディープラーニング、Web開発アプリケーションのマルチモーダルな組み合わせを通じて、このシステムは、視線のみに基づく個々のユーザのためのリンクインデントリストオントロジー可視化のペアマッピングにグラフィカルオーバーレイ(適応)を一意に調整する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:47:54 GMT)
Heterogeneity-Aware Cooperative Federated Edge Learning with Adaptive Computation and Communication Compression [7.6] クラウドベースのフェデレーション・ラーニング(FL)の欠点により、モバイルエッジネットワーク上でのFLの効率を改善するために、協調フェデレーション・エッジ・ラーニング(CFEL)が提案されている。
CFELは、動的および不均一なデバイス特性から生じる重要な課題に直面し、収束を遅くし、リソース消費を増加させる。
本稿では、トレーニング時間とエネルギー消費を最小化し、モデル精度を最大化することを目的とした、textitHeterogeneity-Aware Cooperative Edge-based Federated Averaging (HCEF)と呼ばれる不均一性を考慮したCFEL方式を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:46:40 GMT)
Quantum Coherence and Distinguishability: A Resource-Theoretic Perspective on Wave-Particle Duality [7.6] 波動-粒子双対性(英語版)は量子力学の基礎であり、量子系の2つの相補的な側面の間の重要なトレードオフを示している。
互いに純状態のアンサンブルにおける量子コヒーレンスと識別可能性の新たな双対関係を明らかにする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:09:49 GMT)
Reviving Dormant Memories: Investigating Catastrophic Forgetting in Language Models through Rationale-Guidance Difficulty [7.6] また, 受動的に外部から与えられた理論的根拠を受け付けると, 忘れたタスクに対する性能を復元できることが判明した。
与えられた指示が適切な合理性を生成する際にモデルをどのように効果的に導くかを評価するために、Rationale-Guidance Difficultyメトリックを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:28:04 GMT)
Deep Generative Classification of Blood Cell Morphology [7.5] 細胞形態を効果的にモデル化する拡散型分類器であるCytoDiffusionを紹介する。
本手法は異常検出における最先端の識別モデルよりも優れている。
直接解釈可能な逆ファクト・ヒートマップの生成によりモデル説明可能性を向上させる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:08:16 GMT)
Simulation of Quantum Transduction Strategies for Quantum Networks [7.5] 量子ネットワークの離散イベントシミュレータであるSeQUeNCeを量子トランスデューサコンポーネントで拡張する。
光チャネルを介して超伝導ノード間で量子情報を伝達する2つのプロトコルを探索する。
予備的な結果と理論的予測が一致し,プロトコルのシミュレーションに基づく検証が可能となった。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:47:11 GMT)
CROW: Eliminating Backdoors from Large Language Models via Internal Consistency Regularization [7.3] 大規模言語モデル(LLM)は、バックドア攻撃の影響を受けやすい。
バックドアトリガによる階層的不整合に対処するために、内部一貫性規則化(CROW)を導入する。
CROWは、さまざまなバックドア戦略やタスクにおける攻撃成功率の大幅な削減を一貫して達成している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:52:12 GMT)
Topology-aware Preemptive Scheduling for Co-located LLM Workloads [7.2] 我々は,ハイブリッドワークロードのスケジューリングのための微粒なトポロジ認識手法を開発した。
本手法は, プリエンプションの効率を大幅に向上し, LLMワークロードのスケジュール性能を55%向上させる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:26:09 GMT)
FruitNinja: 3D Object Interior Texture Generation with Gaussian Splatting [7.2] 現実世界では、オブジェクトはスライスやカット時に内部のテクスチャを明らかにするが、この振る舞いは3D生成タスクでは十分に研究されていない。
幾何学的・位相的変化を考慮した3次元物体の内部テクスチャ生成法FruitNinjaを紹介する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 22:00:19 GMT)
A Potential Game Perspective in Federated Learning [7.1] Federated Learning(FL)は、分散クライアント間で機械学習モデルをトレーニングするための新興パラダイムである。
本稿では,各クライアントの個々の努力とサーバが提供する報酬によって,各クライアントの支払いが決定される可能性のあるゲームフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:06:44 GMT)
PALMS: Parallel Adaptive Lasso with Multi-directional Signals for Latent Networks Reconstruction [6.9] 本稿では,圧縮センシング技術を用いたネットワーク再構成手法のための汎用分散並列計算フレームワークを提案する。
分散アルゴリズムを用いた近似推定は理論的結果を維持することができることを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:58:16 GMT)
Improving Data Curation of Software Vulnerability Patches through Uncertainty Quantification [6.9] 本稿では、不確実性定量化(UQ)を用いて、公開可能なソフトウェア脆弱性パッチのデータセットをキュレートする手法を提案する。
Model EnsembleとHerescedasticモデルは、脆弱性パッチデータセットのベストチョイスです。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:37:28 GMT)
BALI: Learning Neural Networks via Bayesian Layerwise Inference [6.8] 我々はベイズニューラルネットワークを学習し,それを多変量ベイズ線形回帰モデルのスタックとして扱う新しい手法を提案する。
主なアイデアは、各レイヤの目標出力を正確に知っていれば、階層的に後方に推論することである。
これらの擬似ターゲットをフォワードパスから出力する層として定義し、対象関数のバックプロパゲーションによって更新する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 22:18:34 GMT)
Quantum Coherence: A Fundamental Resource for Establishing Genuine Multipartite Correlations [6.7] 我々は,真の多粒子絡み合い(GME)尺度とそれに対応するコヒーレンス尺度との深い等価性を確立する。
真のマルチパーティタイトステアリングと非局所性は、コヒーレンスが対応するキュービット状態に存在する場合にのみ存在することが分かる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:44:19 GMT)
Freezing of Gait Detection Using Gramian Angular Fields and Federated Learning from Wearable Sensors [6.7] 歩行凍結はパーキンソン病(PD)の不安定な症状である
従来の検出法は、患者内および患者間変動による課題に直面している。
FOGSenseは、制御不能で自由な環境のために設計された新しいFOG検出システムである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:43:43 GMT)
Physics meets Topology: Physics-informed topological neural networks for learning rigid body dynamics [6.7] 剛体力学と学習衝突相互作用をモデル化するための新しい枠組みを提案する。
そこで本研究では,物理法則を直接モデルに組み込む物理インフォームドメッセージパッシングニューラルアーキテクチャを提案する。
この研究は、様々な科学的・工学的な領域にまたがる応用において、マルチエンタリティ・ダイナミックな相互作用の課題に対処する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:03:15 GMT)
AI's Spatial Intelligence: Evaluating AI's Understanding of Spatial Transformations in PSVT:R and Augmented Reality [6.5] 3次元空間の回転を理解するには、言葉による記述や視覚的、インタラクティブな例が伴う。
近年の研究では、言語と視覚能力を備えた人工知能は、空間推論の限界に直面している。
我々は,その画像と言語処理機能を利用してオブジェクトの回転を理解する,生成AIの空間的能力について検討した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:10:38 GMT)
SADDE: Semi-supervised Anomaly Detection with Dependable Explanations [6.4] SADDEは2つの主要な目的を達成するために設計された一般的なフレームワークである。
これにより、異常検出プロセスが解釈可能となり、解釈結果の信頼性が向上する。
ネットワーク異常検出に適した新しい2段階半教師付き学習フレームワークを概念化する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:39:00 GMT)
Regret-Free Reinforcement Learning for LTL Specifications [6.3] 強化学習は、未知のダイナミクスを持つシステムの最適制御ポリシーを学習するための有望な方法である。
現在のRLベースの手法は保証のみを提供しており、学習フェーズにおける過渡的なパフォーマンスについての洞察を与えていない。
マルコフ決定プロセス上の仕様の一般的なクラスに対処するコントローラを学習するための,最初の後悔のないオンラインアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:01:45 GMT)
Semantic-Geometric-Physical-Driven Robot Manipulation Skill Transfer via Skill Library and Tactile Representation [6.3] 知識グラフに基づくスキルライブラリフレームワークは,高度なスキル認識と空間的意味理解を備えたロボットを支援する。
動作レベルでは,A*アルゴリズムとスキルライブラリを用いて適応軌道伝達法を開発した。
身体レベルでは,触覚に基づく適応的輪郭抽出と姿勢知覚法を導入する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:42:07 GMT)
SpatialDreamer: Self-supervised Stereo Video Synthesis from Monocular Input [6.3] 本研究では,SpatialDreamerと呼ばれるビデオ拡散モデルを用いて,自己監督型ステレオ合成ビデオパラダイムを提案する。
ステレオビデオデータ不足に対処するため,Depth ベースのビデオ生成モジュール DVG を提案する。
また,RefinerNetと,効率的で専用のトレーニングを容易にするための自己教師型合成フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:12:59 GMT)
Masked Autoencoders are Parameter-Efficient Federated Continual Learners [6.2] pMAEは、画像再構成によりクライアント側の再構成プロンプトを学習する。
アップロードされた復元情報を再構築して、以前のタスクと異なるクライアント間でのデータ分散をキャプチャする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:16:36 GMT)
Analyzing and Improving the Skin Tone Consistency and Bias in Implicit 3D Relightable Face Generators [6.2] 我々は,より軽い肌色で偏りのあるアルベド画像の問題を緩和する戦略を提案する。
また、生成した画像の照明量の分布とトレーニングデータとを一致させるスケーリング戦略を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:38:34 GMT)
Toxicity of the Commons: Curating Open-Source Pre-Training Data [6.1] 本研究では、パブリックドメインデータに基づいてトレーニングされたモデルにより有害な出力を減らすためのデータキュレーションパイプラインを提案する。
現在の毒性フィルタリングに対する最先端のアプローチは、しばしばオープンデータモデルに不適当または不適当である。
我々は5つの異なる次元にまたがって分類されたテキストからなるカスタムトレーニングデータセット、ToxicCommonsを作成します。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:42:44 GMT)
Rethinking Thinking Tokens: Understanding Why They Underperform in Practice [6.1] 思考トークン (TT) は言語モデルにおける推論を容易にする教師なしの手法として提案されている。
TTsは,Chain-of-Thought (CoT) の推論と比較して,性能を極端に改善し,一貫して性能を低下させることを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:34:38 GMT)
Measuring coherence via Kirkwood-Dirac nonclassicality with respect to mutually unbiased bases [6.0] カークウッド・ディラックの古典性を相互に偏りのない基底に関して検討する。
素次元ヒルベルト空間に対して、互いに偏りのない基底の2つの異なる集合に対してカークウッド・ディラック古典性を示す量子状態が$A$,$B'$は必ずしも$A$に対して不整合でなければならないことを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:45:25 GMT)
Crypto-Ransomware and Their Defenses: In-depth Behavioral Characterization, Discussion of Deployability, and New Insights [6.0] 我々は117件のランサムウェア・ディフェンスワークをレビューし、それらが実装されているレベルによって分類し、デプロイ可能性について議論する。
より深い洞察を得るために、実世界のランサムウェアサンプルのランタイム動作を定量的に特徴づける。
我々の発見は、ランサムウェア防衛の展開可能性を理解し、より効果的で実用的なソリューションを作成するのに役立ちます。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:16:34 GMT)
Reuse-Aware Compilation for Zoned Quantum Architectures Based on Neutral Atoms [6.0] ゾーンアーキテクチャのためのスケーラブルなコンパイラZACを提案する。
ZACは、クォービット再利用でゾーン間のデータの移動オーバーヘッドを最小限にする。
ZACはモノリシックアーキテクチャに比べて22倍の忠実性向上を実現している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:58:16 GMT)
Continuous K-space Recovery Network with Image Guidance for Fast MRI Reconstruction [5.9] 高速MRIは、アンダーサンプリングされたk空間から高品質な画像を復元することを目的としている。
既存の方法では、アンサンプされたデータをアーティファクトのないMRI画像にマッピングするために、ディープラーニングモデルを訓練する。
画像領域誘導を用いた暗黙的ニューラル表現の新しい視点から、連続的なk空間回復ネットワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 04:54:04 GMT)
Bitcoin Under Volatile Block Rewards: How Mempool Statistics Can Influence Bitcoin Mining [5.9] Bitcoinがより半減期を経験するにつれて、プロトコル報酬はゼロに収束し、取引手数料がマイナー報酬の主要な源となる。
以前のBitcoinのセキュリティ分析では、固定ブロック報酬モデルまたは高度に単純化された揮発性モデルが検討されている。
本研究では,より現実的な揮発性モデルの下での鉱業戦略の分析を目的とした強化学習ツールを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:29:20 GMT)
Equivariant spatio-hemispherical networks for diffusion MRI deconvolution [5.7] 本稿では,$math(3) times SO(3)$ groupに同値な畳み込みネットワーク層を開発することにより,そのような球面データの解析を推し進める。
白色物質を回収するスパース球状繊維デコンボリューションの文脈において、提案した同変ネットワーク層は、性能と効率性を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:37:39 GMT)
Robust Subgraph Learning by Monitoring Early Training Representations [5.5] グラフニューラルネットワーク(GNN)は、グラフ学習やノード分類タスクにおける卓越したパフォーマンスに対して、大きな注目を集めている。
敵攻撃、特に感受性のあるノードによる攻撃に対する脆弱性は、意思決定において課題となる。
本稿では,SHERD(Subgraph Learning Hale through Early Training Representation Distances)を導入し,グラフ入力の性能と対角的堅牢性に対処する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:43:31 GMT)
Harnessing spontaneous emission of correlated photon pairs from ladder-type giant atoms [5.5] はしご型三層巨大原子は高効率で強い相関性を持つ光子対を自然に放出することを示す。
局所位相を最適結合配列に符号化することにより、指向性2光子相関転写を実現することができる。
このような相関した光子対は、量子情報処理に大きな可能性を持つ。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:46:05 GMT)
WoodYOLO: A Novel Object Detector for Wood Species Detection in Microscopic Images [5.5] WoodYOLOは、顕微鏡木繊維解析に特化して設計された新しい物体検出アルゴリズムである。
我々のアプローチは、大規模な高解像度顕微鏡画像による課題に対処するために、YOLOアーキテクチャを適用している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:07:37 GMT)
On the physics of nested Markov models: a generalized probabilistic theory perspective [5.5] 一般化確率論のレンズを通してネストされたマルコフモデルを検査する。
ネストされたマルコフモデルを定義するすべての等式制約が、有効理論を独立に保持することを示す。
我々は,高次元ベル型因果構造から投影される有効分布を定義する新しい因果モデルを確立する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:40:58 GMT)
Not Eliminate but Aggregate: Post-Hoc Control over Mixture-of-Experts to Address Shortcut Shifts in Natural Language Understanding [5.4] 本稿では,各専門家が比較的異なる潜伏特徴を捉えていると仮定して,実験結果の混合予測を悲観的に集約する手法を提案する。
実験結果から,専門家に対するポストホック制御は,ショートカットにおける分布シフトに対するモデルのロバスト性を大幅に向上させることが示された。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:51:38 GMT)
GD doesn't make the cut: Three ways that non-differentiability affects neural network training [5.4] 本稿では,非微分可能関数(NGDM)に適用される手法と,微分可能関数に対する古典的勾配降下(GD)との区別を批判的に検討する。
我々の研究は、強い仮定に対する過度な信頼から生まれた、影響力のある文学におけるアルゴリズムの批判的な誤解を識別する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 22:26:15 GMT)
Cross-Patient Pseudo Bags Generation and Curriculum Contrastive Learning for Imbalanced Multiclassification of Whole Slide Image [5.4] 本稿では,従来のWSIに類似した特徴分布を持つサブバッグを生成することによって,詳細な情報を学習することを提案する。
疑似バグ生成アルゴリズムを用いて、WSIの豊富な冗長な情報をさらに活用する。
従来のアプローチとは異なり,我々のフレームワークは,バッグレベルの表現の学習から,マルチインスタンスバッグの特徴分布の理解と活用へと移行している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:35:34 GMT)
DecTest: A Decentralised Testing Architecture for Improving Data Accuracy of Blockchain Oracle [5.3] データ精度の向上を目的とした新しい分散テストアーキテクチャ(DecTest)を導入します。
ノードの監視と検証を強化するために、ブロックチェーンオラクルランダムシークレットテストメカニズムが最初に提案されている。
得られたデータの離散エントロピー値を61.4%削減した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:58:21 GMT)
Understanding Student Sentiment on Mental Health Support in Colleges Using Large Language Models [5.3] 本稿では,学生音声調査データを用いて,大規模言語モデル(LLM)を用いたメンタルヘルス支援に対する学生の感情分析を行う。
従来の機械学習手法と最先端のLCMの両方の調査は、この新しいデータセット上でのGPT-3.5とBERTの最高のパフォーマンスを示した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:53:15 GMT)
Extracting Database Access-control Policies From Web Applications [5.2] アプリケーションコードにどのポリシーが埋め込まれているのか、アプリケーションがどのデータにアクセスするのかを神にするのは困難です。
本稿では,アクセス制御政策の抽出という政策抽出に取り組む。
Oteは、Ruby-on-Rails Webアプリケーションのポリシー抽出ツールである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:58:11 GMT)
LLM App Store Analysis: A Vision and Roadmap [5.2] 大規模言語モデル(LLM)アプリストアは、研究者、開発者、ユーザ、アプリストアマネージャにとって新たな機会と課題を生み出している。
本稿では,データマイニング,セキュリティリスクの識別,開発支援,市場ダイナミクスといった重要な側面に着目し,LCMアプリストアを前方から分析する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:21:38 GMT)
Unpicking Data at the Seams: VAEs, Disentanglement and Independent Components [5.1] データのゆがみ(disentanglement)、あるいは統計的に独立な要因を特定することは、機械学習と統計学の多くの分野に関心がある。
絡み合いは、変分オートエンコーダ(VAE)、生成逆数ネットワーク(Generative Adversarial Networks)、拡散モデルなど、いくつかの生成パラダイムで生じる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:36:04 GMT)
Entanglement signature in quantum work statistics in the slow-driving regime [4.9] ゆるやかに駆動される古典システムでは、作業量は量であり、その確率分布は、作業のゆらぎと散逸の関係を満たすことが知られている。
複数のシステムを備えた設備における作業変動の非古典的特徴について検討する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:15:52 GMT)
Clustering and Classification Risks in Non-parametric Hidden Markov and I.I.D. Models [4.7] クラスタリングのベイズリスクと分類のベイズリスクを詳細に分析する。
2つのリスクが同等かどうか、関連する最小化要因が関連しているかどうかを識別する。
次に、プラグインクラスタリング手順の過剰なリスクを制御する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:55:43 GMT)
Transmission Line Outage Probability Prediction Under Extreme Events Using Peter-Clark Bayesian Structural Learning [4.7] 本稿では,ベイジアンネットワークとPeter-Clark構造学習を組み合わせた伝送線路停止確率の予測手法を提案する。
提案手法は, 精度の高い停止確率計算を可能にするだけでなく, 限られたデータであっても, より優れたスケーラビリティとロバストな性能を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:10:49 GMT)
PQA: Zero-shot Protein Question Answering for Free-form Scientific Enquiry with Large Language Models [4.5] Protein Question Answering (PQA) は、タスク固有のトレーニングなしで、幅広いタンパク質関連クエリに答えるように設計されたタスクである。
Pikaは、PQA用に調整された硬化した脱バイアスデータセットと、生化学的に関連するベンチマーク戦略で構成されている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:32:06 GMT)
Graph Retention Networks for Dynamic Graphs [4.4] 動的グラフの深層学習のための統合アーキテクチャとしてグラフ保持ネットワークを提案する。
GRNは、グラフ保持としての動的グラフデータに対して、コア計算の保持方法を拡張している。
ベンチマークデータセットを用いて行った実験は、エッジレベルの予測とノードレベルの分類タスクの両方において、GRNの優れた性能を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:28:11 GMT)
Preempting Text Sanitization Utility in Resource-Constrained Privacy-Preserving LLM Interactions [4.4] 本稿では,大規模言語モデルに送信される前に,衛生効果がプロンプトに与える影響を推定するアーキテクチャを提案する。
このアーキテクチャを評価した結果,差分プライバシーに基づくテキストのサニタイズに重大な問題があることが明らかとなった。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:31:22 GMT)
Resources of the Quantum World [4.4] 量子資源理論は、単一の枠組みの下で様々な量子現象を統合することを目指している。
本は読者に、この急速に発展する分野にナビゲートし貢献するために必要な高度な数学的ツールと物理原理を装備することを目的としている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:03:41 GMT)
An Efficient Multicast Addressing Encoding Scheme for Multi-Core Neuromorphic Processors [4.3] エネルギー効率のよいローカルコンピューティングとスケーラブルなモジュラーアーキテクチャにより、マルチコアのニューロモルフィックプロセッサはますます重要になりつつある。
同数のルーティングビットに対して、最先端のシンボルベースのスキームのアドレッシング能力を拡大する階層的ビット文字列符号化方式を提案する。
実際のニューロモルフィックタスクで作業を行う場合、この階層的なビット列符号化は、面積コストを約29%削減し、エネルギー消費を約50%削減する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:04:38 GMT)
Estimating the Influence of Sequentially Correlated Literary Properties in Textual Classification: A Data-Centric Hypothesis-Testing Approach [4.2] スティロメトリーは、ジャンルやテーマといった要素とは異なる半意識的な選択を反映していると考えられる文学的特徴を分析して著者を区別することを目的としている。
主題的内容など一部の文学的特性は、隣接するテキスト単位間の相関関係として表される可能性が高いが、権威的なスタイルのように、その独立性を持つものもいる。
テキスト分類における逐次相関文学的特性の影響を評価するための仮説検証手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:15:59 GMT)
Efficient and Robust Continual Graph Learning for Graph Classification in Biology [4.1] 本稿では,グラフデータ分類のための頑健で効率的な連続グラフ学習フレームワークであるPerturbed and Sparsified Continual Graph Learning (PSCGL)を提案する。
PSCGLはタスク間の知識を保持するだけでなく、生物学におけるグラフ分類モデルの効率性と堅牢性を高める。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:47:37 GMT)
Establishing Minimum Elements for Effective Vulnerability Management in AI Software [4.1] 本稿では,AI脆弱性管理の最小要素と人工知能脆弱性データベース(AIVD)の確立について論じる。
AI脆弱性の公開、分析、カタログ化、文書化のための標準化されたフォーマットとプロトコルを提供する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:22:20 GMT)
Joint Diffusion models in Continual Learning [4.0] 共同拡散モデルに基づく生成的リハーサルを用いた連続学習法であるJDCLを紹介する。
生成的再生に基づく連続学習手法は、生成的モデルからサンプリングされた新しいデータとリハーサルデータを組み合わせたモデルの再学習によってこの問題を緩和しようとする。
このような共有パラメトリゼーションと知識蒸留技術を組み合わせることで、破滅的な忘れをせずに新しいタスクに安定した適応ができることを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:48:06 GMT)
UniHands: Unifying Various Wild-Collected Keypoints for Personalized Hand Reconstruction [4.0] 標準化されながらパーソナライズされたハンドモデルを作成する新しい方法であるUniHandsを提案する。
既存の暗黙的表現法とは異なり、UniHandsはMANOとNIMBLEを広く採用している。
また、メッシュから統一されたハンドジョイントを導き出し、様々なハンド関連タスクへのシームレスな統合を容易にする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:59:58 GMT)
A Hybrid Loss Framework for Decomposition-based Time Series Forecasting Methods: Balancing Global and Component Errors [3.9] シーケンス分解を伴う既存の時系列手法における全体の損失の影響について検討する。
その結果,全体の損失はモデル学習に偏りをもたらし,より重要なサブシリーズの優先順位付けの学習を妨げることが明らかとなった。
グローバルな損失とコンポーネントの損失を組み合わせたハイブリッド・ロス・フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:15:23 GMT)
Association between built environment characteristics and school run traffic congestion in Beijing, China [3.9] 学校は、学校周辺の交通渋滞を著しく悪化させ、学校運営中にフリーフローの確率を8.34%削減している。
学校が運営する交通渋滞は、複数の学校、バスの停留所、ビジネスや金融機能に関連する景観がある地域では深刻である。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:05:49 GMT)
Moral Persuasion in Large Language Models: Evaluating Susceptibility and Ethical Alignment [3.9] 大きな言語モデル(LLM)は、初期決定を変更し、確立した倫理的枠組みと整合させることによって影響を受けます。
本研究は,LLMの道徳的説得に対する感受性を評価するための2つの実験に基づいている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:59:59 GMT)
Search for Multiple Adjacent Marked Vertices on the Hypercube by a Quantum Walk with Partial Phase Inversion [3.8] マルチループラカダシカル量子ウォークのハイパーキューブへの応用について検討する。
部分位相反転を用いることで、確率振幅を 1 に近い値に増幅できることが示される。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:38:52 GMT)
Multi-self-loop Lackadaisical Quantum Walk with Partial Phase Inversion [3.8] 本稿では,部分位相反転を用いた多ループラカダシカル量子ウォークを提案する。
提案アルゴリズムはGroverのアルゴリズムに基づいて部分的に動作し、与えられた量$s m$の自己ループの位相を変更する。
これは最大成功確率を$O (sqrt(n+m)cdot N)$で1ドルに近い値に改善し、$n$はハイパーキューブ次数である。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:34:01 GMT)
MEEG and AT-DGNN: Improving EEG Emotion Recognition with Music Introducing and Graph-based Learning [3.8] 音楽誘発脳波(EEG)記録のマルチモーダルコレクションであるMEEGデータセットについて述べる。
本稿では,脳波に基づく感情認識のための新しいフレームワークである動的グラフニューラルネットワーク(AT-DGNN)を用いた注意に基づく時間学習について紹介する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:55:00 GMT)
SatDiffMoE: A Mixture of Estimation Method for Satellite Image Super-resolution with Latent Diffusion Models [3.8] 我々はtextbfSatDiffMoE と呼ばれる新しい拡散型融合アルゴリズムを提案する。
アルゴリズムは非常に柔軟で、任意の数の低解像度画像のトレーニングと推測が可能である。
実験の結果,SatDiffMoE法は衛星画像の超解像処理に優れていた。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:52:03 GMT)
Constructing local models for general measurements on bosonic Gaussian states [3.8] ガウス量子状態の与えられた測度から得られる相関の局所性について、簡単な基準を導出する。
この基準は、状態の固有ガウスノイズの一部を測定に渡すことで機能する局所隠れ変数モデルの構築に基づいている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:28:01 GMT)
LibreLog: Accurate and Efficient Unsupervised Log Parsing Using Open-Source Large Language Models [3.8] 本稿では,非教師なしのログ解析手法であるLibreLogを紹介する。
LogHub-2.0の評価では、LibreLogは最先端のLCMに比べて25%高い解析精度とプロセス2.7倍の高速化を実現している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:18:51 GMT)
LLM-IE: A Python Package for Generative Information Extraction with Large Language Models [3.8] LLM-IEは完全な情報抽出パイプラインを構築するためのPythonパッケージである。
鍵となる革新は、スキーマ定義と迅速な設計をサポートする対話型LLMエージェントである。
システム評価は直感的な可視化を提供する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:56:13 GMT)
Uncertainty Evaluation of the Caesium Fountain Primary Frequency Standard NIM6 [3.8] 中国国立地下鉄研究所(NIM)で新しいセシウム(Cs)蛍光時計NIM6が開発された。
Cs蛍光時計NIM6は、原子密度の高い1.0x10-13 Tau-1/2の短期安定を達成する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:39:00 GMT)
Enhancing High-order Interaction Awareness in LLM-based Recommender Model [3.8] 本稿では,LLMベースのリコメンデータ(ELMRec)について述べる。
我々は、レコメンデーションのためのグラフ構築相互作用のLLM解釈を大幅に強化するために、単語全体の埋め込みを強化する。
ELMRecは、直接およびシーケンシャルなレコメンデーションの両方において、最先端(SOTA)メソッドよりも優れています。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:28:01 GMT)
Partial Information Decomposition for Data Interpretability and Feature Selection [3.7] PIDF(Partial Information Decomposition of Features)は、データの同時解釈と特徴選択のための新しいパラダイムである。
合成データと実世界のデータの両方を用いてPIDFを広範囲に評価し,その可能性と有効性を示した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:22:41 GMT)
Feature Selection for Network Intrusion Detection [3.7] 本稿では,ネットワーク侵入を検出する際に,非情報的特徴の排除を容易にする情報理論を提案する。
提案手法は,ニューラルネットワークを用いた関数近似に基づいて,再帰層を組み込んだアプローチのバージョンを実現する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:25:55 GMT)
Leveraging Computational Pathology AI for Noninvasive Optical Imaging Analysis Without Retraining [3.7] 非侵襲的な光学画像モダリティは、患者の組織を3Dでプローブし、時間とともに、サンプルごとに臨床的に関係のあるデータをギガバイト生成する。
このデータを分析し、臨床ワークフローを支援するために、AIモデルが必要である。
本稿では,リトレーニングなしで計算病理から任意のAIモデルを適用する手法であるFoundationShiftを紹介する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:35:01 GMT)
Introducing Milabench: Benchmarking Accelerators for AI [3.6] AIワークロード、特にディープラーニングによって駆動されるワークロードは、ハイパフォーマンスコンピューティングシステムに新しい利用パターンを導入している。
ミルラは深層学習に特化した最大の学術研究センターの1つである。
コミュニティの多様な要件に対処するカスタムベンチマークスイートの開発の必要性を特定した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:07:08 GMT)
Interpretable Machine Learning for Survival Analysis [3.6] 解釈可能な機械学習(IML)や説明可能な人工知能(XAI)はこの10年でますます重要になっている。
簡単に利用できるIML手法の欠如は、公衆衛生における医療実践者や政策立案者が機械学習の潜在能力を最大限に活用することを妨げる可能性がある。
一般のIML分類学の文脈における生存分析のためのIML法に関する限られた既存の研究成果について概説する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:06:01 GMT)
Higher Order Graph Attention Probabilistic Walk Networks [3.5] メッセージパッシングニューラルネットワークは、グラフ構造に埋め込まれた潜時関係を利用する。
既存の方法は、1ドルのホップ地区内のローカル情報に依存している。
本稿では,特徴ベクトルの多様性に基づいた可変長経路に重みを割り当てる高次アテンション(HoGA)モジュールを提案する。
HoGAは、高次の関係を、いかなるシングルホップアテンション機構にも適用可能な、堅牢な自己意識の形式として表現している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:46:02 GMT)
Reducing Label Dependency for Underwater Scene Understanding: A Survey of Datasets, Techniques and Applications [3.4] 調査は、人間の専門家の入力への依存を減らすアプローチに焦点を当てている。
弱く自己監督的な深層学習の背景を提供し、これらの要素を水中モニタリング、コンピュータビジョン、深層学習の交差点を中心とする分類学に統合する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:16:09 GMT)
The complexity of solving a random polynomial system [3.4] 本稿では,多変量系の解法に用いる一般アルゴリズムの概要について述べる。
次に、ランダムなシステム、特に"ランダム"が私たちにとって何を意味するかについて話します。
このようなランダムシステムの正則度と解度の両方に上限を与える。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:22:52 GMT)
TL-CLIP: A Power-specific Multimodal Pre-trained Visual Foundation Model for Transmission Line Defect Recognition [3.4] 伝送線路欠陥認識のための2段階の伝送線路指向コントラスト言語画像事前学習(TL-CLIP)フレームワークを提案する。
事前学習プロセスでは、パワー関連セマンティック知識のモデリングを改善するために、2つのパワー特化事前学習タスクを補助する、新しいパワー特化マルチモーダルアルゴリズムを採用している。
実験により,本手法は,分類タスクと検出タスクの両方において,伝送線路欠陥認識の性能を著しく向上することを示した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:32:51 GMT)
Large Language Model for Qualitative Research -- A Systematic Mapping Study [3.3] 先進的な生成AIを駆使した大規模言語モデル(LLM)がトランスフォーメーションツールとして登場した。
本研究は, LLMを用いた定性的研究に関する文献を体系的にマッピングする。
LLMは様々な分野にまたがって利用されており、プロセスの自動化の可能性を示している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:28:00 GMT)
KAN-Mamba FusionNet: Redefining Medical Image Segmentation with Non-Linear Modeling [3.3] 本研究では,KAN(Kolmogorov-Arnold Networks)とMamba層を組み合わせた医用画像分割手法を提案する。
提案する Kan-Mamba FusionNet フレームワークは,コンボリューショナル並列トレーニングと自動回帰展開に注目駆動機構を統合することにより,画像セグメンテーションを改善する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:19:16 GMT)
Spatial-variant causal Bayesian inference for rapid seismic ground failures and impacts estimation [3.2] 地震後の地盤破壊と建物被害の迅速かつ正確な推定は、地震後の効果的な応答に不可欠である。
先進的な進歩は、新しい因果グラフベースのベイジアンネットワークを導入し、地震の地すべりを継続的に改善し、衛星画像から得られた損傷推定を構築した。
本研究では, 空間的複雑度を考慮に入れた手法として, 周囲のハザードから関係を捉えるために, 両側フィルタの影響を受けやすい空間変数を導入する手法を考案した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:01:28 GMT)
A Review on Machine Unlearning [3.1] 本稿では、機械学習モデルにおけるセキュリティとプライバシに関する詳細をレビューする。
まず、機械学習が日々の生活でユーザーのプライベートデータをどのように活用できるか、そしてこの問題で果たす役割について述べる。
次に,機械学習モデルにおけるセキュリティ脅威を記述することによって,機械学習の概念を導入する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:18:13 GMT)
Multi-layer matrix factorization for cancer subtyping using full and partial multi-omics dataset [3.1] 本稿では,マルチオミクスデータクラスタリングを用いた癌サブタイプのための新しいアプローチとして,MLMF(Multi-Layer Matrix Factorization)を提案する。
完全かつ欠落した値を持つ10のマルチオミクスがんデータセットで実施された実験では、Fがいくつかの最先端アプローチのパフォーマンスに匹敵する結果を得るか、超える結果が得られることを示した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:58:11 GMT)
Lifted Model Construction without Normalisation: A Vectorised Approach to Exploit Symmetries in Factor Graphs [3.1] パラメトリック係数グラフの形でリフト表現を構築するための現在の最先端アルゴリズムは、交換可能だがスケールの異なる因子間の対称性を見逃している。
本稿では、パラメトリック因子グラフを構築するための最先端カラーパスアルゴリズム(ACP)の一般化を提案する。
提案アルゴリズムは任意の因子のポテンシャルを任意に拡張することができ、元のACPアルゴリズムよりも効率的に対称性を検出できる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:59:44 GMT)
Machine Vision-Based Assessment of Fall Color Changes and its Relationship with Leaf Nitrogen Concentration [2.9] 本研究は, 葉の色変化と葉の窒素含量との相関を定量化するための機械ビジョンに基づくシステムについて検討した。
画像データセットは2021年秋から2023年秋の5週間にわたって、地上の車両をベースとした立体視センサーを用いて商業用果樹園で収集された。
葉の窒素濃度が低い木は、高い窒素濃度の木よりも早く黄色に変化した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:03:47 GMT)
Physics Encoded Blocks in Residual Neural Network Architectures for Digital Twin Models [2.9] 本稿では,新しい物理符号化残差ニューラルネットワークアーキテクチャに基づく汎用的アプローチを提案する。
本手法は,物理モデルからの数学的演算子として物理ブロックを,フィードフォワード層を構成する学習ブロックと組み合わせる。
従来のニューラルネットワーク方式と比較して,本手法はデータ要求量を大幅に減らして一般化性を向上させる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:58:20 GMT)
Unveiling Redundancy in Diffusion Transformers (DiTs): A Systematic Study [2.8] Diffusion Transformer(DiTs)のモデル容量の増大は、推論遅延の著しい増加につながった。
本研究では,主要なDiTモデルの幅広いスペクトルにおける冗長性について検討する。
個別モデルの冗長性を解析するツールを導入し、その後の研究で適切なキャッシュ戦略の開発が可能となる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:49:23 GMT)
Hierarchical Structure Enhances the Convergence and Generalizability of Linear Molecular Representation [2.8] 本稿では、TSISD(TSIS with Depth-First Search)、TSISO(TSIS in Order)、TSISR(TSIS in Random)をt-SMILESフレームワークの不可欠なコンポーネントとして紹介する。
この結果から, t-SMILESの階層構造は, 当初予想されていたよりも容易に解析できることが判明した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:01:29 GMT)
Memory Based Collaborative Filtering with Lucene [2.7] メモリベースの協調フィルタリングは、リコメンデーションを提供するために広く使われているアプローチである。
このアプローチの欠点は、一般的な協調フィルタリングシステムの一般化と柔軟性の喪失である。
我々は,従来のフルテキスト検索エンジン上に,スケーラブルで効果的な協調フィルタリングシステムを構築する手法を開発した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:36:40 GMT)
Entanglement Classification of Arbitrary Three-Qubit States via Artificial Neural Networks [2.7] 3ビットシステムの絡みを検知・分類する人工知能ニューラルネットワーク(ANN)を設計・実装する。
モデルはランダムに生成された状態のシミュレーションデータセット上で訓練され、検証される。
注目すべきは、密度行列の7つの対角要素をANNに供給するだけで、両方のタスクに対して94%以上の精度が得られることである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:50:10 GMT)
ZeFaV: Boosting Large Language Models for Zero-shot Fact Verification [2.7] ZeFaVはゼロショットベースのファクトチェック検証フレームワークで、大規模な言語モデルのファクト検証タスクのパフォーマンスを向上させる。
我々は,HoVerとFEVEROUSを含む2つのマルチホップファクトチェックデータセットに対するアプローチを実証実験により評価した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:35:15 GMT)
Addressing Hallucinations in Language Models with Knowledge Graph Embeddings as an Additional Modality [2.6] 本稿では,Large Language Models (LLMs) における幻覚を減らすために,知識グラフ (KGs) を付加的なモダリティとして組み込んだアプローチを提案する。
本手法では,入力テキストを一組のKG埋め込みに変換し,アダプタを用いて言語モデル空間に組み込む。
我々は、このデータセットを用いてMistral 7B、LLaMA 2-7B(チャット)、LLaMA 3-8B(インストラクション)モデルのアダプタを訓練し、我々のアプローチが性能を向上させることを示した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:40:51 GMT)
Popular LLMs Amplify Race and Gender Disparities in Human Mobility [2.6] 本研究では,大規模言語モデル (LLM) が人種や性別に基づく人体移動の予測に偏りを示すかどうかを検討する。
LLMは、既存の社会的バイアスをよく反映し、増幅する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:41:20 GMT)
HATT: Hamiltonian Adaptive Ternary Tree for Optimizing Fermion-to-Qubit Mapping [2.6] 本稿では、特定のフェルミオンハミルトニアンに対して最適化されたフェルミオン-量子マッピングをコンパイルするためのハミルトニアン-アダプティブ・ターナリー・ツリー(HATT)フレームワークを紹介する。
各種フェルミオン系の評価とシミュレーションにより、パウリ重量、ゲート数、回路深さを5sim20%以上削減し、より大きな系に優れたスケーラビリティを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:36:13 GMT)
Unmasking Parkinson's Disease with Smile: An AI-enabled Screening Framework [2.5] このデータセットは、PDの256人、臨床診断165人、自己申告91人を含む。
参加者はウェブカメラを使って 3つの表情を模倣しました
顔のランドマークは自動的に記録から追跡され、低体温症に関連する特徴を抽出する。
機械学習アルゴリズムはこれらの特徴に基づいて訓練され、PDの有無に関わらず個人を区別する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:45:26 GMT)
Machine Learning Evaluation Metric Discrepancies across Programming Languages and Their Components: Need for Standardization [2.4] 本研究では,分類,回帰,クラスタリング,相関解析,統計的テスト,セグメンテーション,イメージ・ツー・イメージ(I2I)翻訳などのタスクのメトリクスを評価する。
メトリクスはPythonライブラリ、Rパッケージ、Matlab関数で比較され、一貫性を評価し、相違点を強調した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:07:31 GMT)
N-DriverMotion: Driver motion learning and prediction using an event-based camera and directly trained spiking neural networks on Loihi 2 [2.4] 本稿では,ドライバーの動きを学習し,予測する新しいシステムと,イベントベース高分解能データセット(1280x720)を提案する。
提案したニューロモルフィック視覚システムは、CSNNアーキテクチャでドライバの動きを認識する際に、同等の精度94.04%を達成する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:30:20 GMT)
ARNN: Attentive Recurrent Neural Network for Multi-channel EEG Signals to Identify Epileptic Seizures [2.4] A Attention Recurrent Neural Network (ARNN) が提案され、大量のデータを効率的に正確に処理できる。
ARNN細胞は、配列に沿って注意層を繰り返し適用し、配列長と線形複雑である。
このフレームワークは、注意層と長い短期記憶(LSTM)細胞にインスパイアされているが、この典型的な細胞を複数の順序でスケールアップし、マルチチャネル脳波信号を並列化する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:46:04 GMT)
Few-shot Model Extraction Attacks against Sequential Recommender Systems [2.4] 本研究では、シーケンシャルレコメンデータに対する新しい数ショットモデル抽出フレームワークを提案する。
数ショットデータを利用して優れたサロゲートモデルを構築するように設計されている。
3つのデータセットの実験により、提案された数ショットモデル抽出フレームワークが優れたサロゲートモデルを生成することが示された。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:57:14 GMT)
MedCLIP-SAMv2: Towards Universal Text-Driven Medical Image Segmentation [2.3] MedCLIP-SAMv2はCLIPとSAMモデルを統合して臨床スキャンのセグメンテーションを行う新しいフレームワークである。
提案手法は,DHN-NCE(Decoupled Hard Negative Noise Contrastive Estimation)によるBiomedCLIPモデルの微調整を含む。
また,ゼロショットセグメンテーションラベルを弱教師付きパラダイム内で使用することにより,セグメンテーション品質をさらに向上する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:14:03 GMT)
Temporal and Spatial Reservoir Ensembling Techniques for Liquid State Machines [2.2] LSM(Liquid State Machines)は、脳内のニューロンの組織にインスパイアされた貯水池コンピューティングの特殊な例である。
マルチ長スケール貯水池アンサンブル(MuLRE)とテンポラル励振部貯水池アンサンブル(TEPRE)を効果的に組み合わせるための2つのアプローチを提案する。
3600-neuron LSMモデルを用いて,N-MNISTの98.1%のテスト精度を実現した。
また、視覚タスクのための多長スケール貯水池アンサンブルモデルと協調して作業するために、受動的フィールドベース入力重みを貯水池に提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:35:22 GMT)
MERGE: Matching Electronic Results with Genuine Evidence for verifiable voting in person at remote locations [2.2] 本稿では,電子投票の速さと紙返却の信頼性を組み合わせたMERGEプロトコルを提案する。
このプロトコルにより、有権者は投票の電子的記録を迅速に提出し、同時に紙票を送信して検証を行うことができる。
電子記録は予備的な結果に使用することができるが、紙の投票は時間が経過した場合にはリスク限界監査(RLA)で使用され、選挙の完全性を保証する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 23:15:47 GMT)
Towards fast DBSCAN via Spectrum-Preserving Data Compression [2.2] 本稿では,スペクトルデータ圧縮を用いてDBSCANを大幅に高速化する新しい手法を提案する。
提案手法は,本質的なクラスタリング特性を保ちながら,データセットのサイズを5倍に縮小する。
USPSのような実世界のデータセットの実験では、クラスタリング性能を維持しながら、この劇的なデータサイズ削減を実現する方法の能力を実証している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:46:45 GMT)
DeforHMR: Vision Transformer with Deformable Cross-Attention for 3D Human Mesh Recovery [2.2] DeforHMRは、人間のポーズパラメータの予測を強化するために設計された、新しい回帰ベースの単分子HMRフレームワークである。
DeforHMRは、トランスフォーマーデコーダ内の新しいクエリ非依存の変形可能なクロスアテンション機構を活用する。
広範に使用されている3D HMRベンチマーク3DPW と RICH 上で,単一フレーム回帰に基づく手法の最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 00:46:59 GMT)
Modeling Multivariable High-resolution 3D Urban Microclimate Using Localized Fourier Neural Operator [2.1] 従来の計算流体力学シミュレーションでは、速度と温度が計算に高価である。
最近の機械学習の進歩は、都市部の微小気候シミュレーションを加速するための有望な代替手段を提供する。
そこで我々は,局所学習,幾何符号化,パッチオーバーラップを用いた局所フーリエニューラル演算子(Local-FNO)モデルを提案する。
CFDソルバの50倍近い速度で、単一の32GB GPU上で、1億5000万のフィーチャディメンションを持つ高解像度の予測を提供する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:38:25 GMT)
BeautyBank: Encoding Facial Makeup in Latent Space [2.1] 素顔とメイク顔のパターン特徴をアンタングルする新しいメイクアップエンコーダであるBeautyBankを提案する。
本手法は, 化粧品の形状を高次元空間にエンコードし, 化粧品の復元に必要な細部を保存する。
また, 詳細な化粧品の保存性を高めるために, プログレッシブ・メイクアップ・チューニング(PMT)戦略を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:52:31 GMT)
Upside-Down Reinforcement Learning for More Interpretable Optimal Control [2.1] ニューラルネットワーク(NN)以外の関数近似アルゴリズムも,アップサイドダウン強化学習フレームワークで利用できるかを検討する。
我々の実験は、いくつかの一般的な最適制御ベンチマークで実施され、ランダムフォレストや極端ランダム化ツリーのような木に基づく手法が、NNと同様に動作可能であることを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:44:20 GMT)
LP Data Pipeline: Lightweight, Purpose-driven Data Pipeline for Large Language Models [2.1] 私たちは、CPUで完全に動作するフレームワークである、軽量で目的駆動型(LP)データパイプラインを紹介します。
4つのコア原則に基づいて、LP Data Pipelineは、高いデータ品質を維持しながら、準備時間とコストを大幅に削減します。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:17:27 GMT)
Fermionic Neural Networks through the lens of Group Theory [2.0] 反対称ニューラルネットワーク波動関数を構成する最も一般的な方法の1つである行列式が群畳み込みの結果として理解可能であることを示す。
我々は、群表現論は、ニューラル量子状態に明示的に対称性を組み込むための有望な道であると結論付けている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:27:55 GMT)
Does Unlearning Truly Unlearn? A Black Box Evaluation of LLM Unlearning Methods [2.0] 大規模言語モデルアンラーニングは、LLMが悪意ある目的のために使用するのを防ぐために学んだ有害な情報を除去することを目的としている。
LMUとRMUは、LLMアンラーニングの2つの方法として提案され、アンラーニングベンチマークで印象的な結果を得た。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 22:31:17 GMT)
Coupled Integral PINN for conservation law [2.0] The Physics-Informed Neural Network (PINN) は、様々な偏微分方程式を解く革新的な手法である。
本稿では,ニューラルネットワークを用いた積分解方程式の組込みを含む,結合統合型PINN手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 04:32:42 GMT)
Towards Accessible Learning: Deep Learning-Based Potential Dysgraphia Detection and OCR for Potentially Dysgraphic Handwriting [2.0] 図形障害(Dysgraphia)は、手書き能力に影響を与える学習障害である。
早期検出とモニタリングは、タイムリーなサポートと介入を提供するために不可欠である。
本研究では、ディープラーニング技術を用いて、ディジグラフィ検出と光学的文字認識の2つの課題に対処する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:28:26 GMT)
Exploring the Requirements of Clinicians for Explainable AI Decision Support Systems in Intensive Care [2.0] Thematic analysis revealed three coremes: (T1) ICU decision-making based on a wide range factors, (T2) patient state is challenge for shared decision-making, (T3) requirements and capabilities of AI decision support system。
臨床的なインプットからデザインレコメンデーションを含め、将来のAIシステムに集中治療を知らせるための洞察を提供する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:53:07 GMT)
Formal Verification of Deep Neural Networks for Object Detection [1.9] ディープニューラルネットワーク(DNN)は、現実世界のアプリケーションで広く使われているが、エラーや敵攻撃に弱いままである。
この研究は形式的検証を、より複雑なエホブジェクト検出モデルの領域に拡張する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:54:05 GMT)
Automating Autograding: Large Language Models as Test Suite Generators for Introductory Programming [1.9] 本研究では,大規模言語モデルを用いてプログラミング問題に対するテストスイートの自動生成の有効性を評価する。
本研究では,LLM生成テストスイートとインストラクター生成テストスイートのパフォーマンスを比較した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:41:26 GMT)
Calibrated and Efficient Sampling-Free Confidence Estimation for LiDAR Scene Semantic Segmentation [1.9] 分類タスクの信頼度を適切に推定するためのサンプリング不要な手法を提案する。
提案手法は,処理速度の向上を図りながら,精度の高い信頼度を維持している。
本手法は, 過信予測よりも不信感を生じ, 安全クリティカルなアプリケーションに有利である。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:13:20 GMT)
Re-examining learning linear functions in context [1.9] 文脈学習(ICL)は、幅広い問題を解決するための魅力的な方法である。
我々は、異なるサイズでスクラッチからトレーニングされたいくつかのトランスフォーマーモデルに対して、さまざまなトレインおよびテスト設定でICLについて検討する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:58:46 GMT)
Tackling prediction tasks in relational databases with LLMs [1.8] この研究は、大規模言語モデル(LLM)が関係データベース上で満足な結果を得ることができないという概念に対処する。
最近導入された RelBench ベンチマークを用いて,LLM の簡単な適用さえも,これらのタスクにおける競合性能を実現することを実証した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:48:13 GMT)
Specification Overfitting in Artificial Intelligence [1.8] 機械学習(ML)と人工知能(AI)のアプローチは、その固有のバイアスと、制御の欠如、説明責任、透明性のためにしばしば批判される。
公平性や堅牢性といった高レベルの要件は、具体的な仕様メトリクスに形式化する必要があります。
本稿では,高レベルの要求とタスク性能の低下に対して,特定の指標に過度に注目するシナリオである仕様オーバーフィッティングを定義する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:21:53 GMT)
Can Highlighting Help GitHub Maintainers Track Security Fixes? [1.8] リポジトリ内のパッチを自動的に検索する検索システムを構築した。
説明はセキュリティメンテナによるパッチトレースの決定に役立ちますか?
さらに,Tf-Idf統計を利用したTfIdf-Highlightという説明手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:23:51 GMT)
Efficient Sample-optimal Learning of Gaussian Tree Models via Sample-optimal Testing of Gaussian Mutual Information [1.7] ガウス確率変数に対する条件付き相互情報テスタを開発した。
条件付き相互情報の連鎖ルールは、推定された(条件付き)相互情報の保持を継続することを示す。
また、基礎となるガウスモデルが木構造であることが分かっていない場合、$widetildeTheta(n2varepsilon-2)$サンプルが必要であることも示している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:25:34 GMT)
Generalization ability and Vulnerabilities to adversarial perturbations: Two sides of the same coin [1.7] 自己組織化マップ(SOM)を用いて、ディープラーニングモデルの意思決定に関連する内部コードを分析する。
解析により,入力層に近い浅層が同質コードにマップされ,出力層に近い深層が浅層内のこれらの浅層を多様コードに変換することが示唆された。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:40:09 GMT)
CNMBert: A Model For Hanyu Pinyin Abbreviation to Character Conversion Task [1.6] 漢友ピニイン略語を漢字に変換するという課題は、中国語スペルリング・コレクション(CSC)の領域において重要な分岐点である。
本稿では,この問題に対する解決策として,zh-CN Pinyin Multi-mask Bert Modelの略であるCNMBertを提案する。
CNMBertは数発のGPTモデルを超え、10,424サンプルのHanyu Pinyin短縮テストデータセットで59.63%のMRRを達成した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:50:34 GMT)
Implicit Regularization for Multi-label Feature Selection [1.6] 暗黙の正規化とラベル埋め込みに基づく新しい推定器を用いて,多言語学習の文脈における特徴選択の問題に対処する。
いくつかの既知のベンチマークデータセットの実験結果から、提案された推定器は余分なバイアスを伴わず、良心的な過度な適合につながる可能性が示唆されている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:08:05 GMT)
A Multimodal Adaptive Graph-based Intelligent Classification Model for Fake News [1.5] 偽ニュース検出のためのマルチモーダル適応グラフに基づくインテリジェント分類(MAGIC)を導入する。
ソフトマックス関数によるマルチモーダル入力を分類する前に,適応型グラフアテンションネットワークを用いて包括的情報相互作用グラフを構築した。
MAGICは2つの偽ニュースデータセット、すなわちFakeddit(英語)とMultimodal Fake News Detection(中国語)で訓練され、それぞれ98.8%と86.3%の精度を達成した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:19:34 GMT)
Joint Communication and Sensing over the Lossy Bosonic Quantum Channel [1.5] データ伝送システムにおける共同通信とセンシングの問題について検討する。
最適な量子機器を用いてデータを送信し、同時に環境パラメータを推定する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:26:17 GMT)
Two-component repulsive atomic Fermi gases in a thin spherical shell [1.4] 薄い球状殻形状の反動相互作用を持つ2成分原子フェルミガスの基底状態構造を示す。
このシステムは、相互作用強度が臨界値を超えたときに、均一混合物から2チャンク相分離への不可解な遷移を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:24:17 GMT)
MIST: A Simple and Scalable End-To-End 3D Medical Imaging Segmentation Framework [1.4] 医用イメージングツールキット(MIST)は、深層学習に基づく医用イメージングセグメンテーション手法の一貫性のあるトレーニング、テスト、評価を容易にするように設計されている。
MISTはデータ分析、前処理、評価パイプラインを標準化し、複数のアーキテクチャと損失関数を収容する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:59:10 GMT)
Sequential Kalman Tuning of the $t$-preconditioned Crank-Nicolson algorithm: efficient, adaptive and gradient-free inference for Bayesian inverse problems [1.4] 本稿では,EKI と Flow Annealed Kalman Inversion の適応的な実装を提案する。
EKIはガウス的目標測度と線形前方モデルにおいてのみ正確なものである。
標準SMCの適応に比べてコンバージェンス率が大きく改善した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:07:08 GMT)
Investigating OCR-Sensitive Neurons to Improve Entity Recognition in Historical Documents [1.3] OCR感受性ニューロンは、歴史的文書におけるエンティティ認識に影響を及ぼす。
クリーンでノイズの多いテキスト入力に応答してニューロンの活性化パターンを解析することにより、OCR感受性ニューロンを同定し、中和し、モデル性能を向上させる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:22:32 GMT)
ST-Tree with Interpretability for Multivariate Time Series Classification [1.3] Swin Transformer (ST) は、自己認識機構を利用して、きめ細かい局所パターンとグローバルパターンの両方をキャプチャすることで、これらの問題に対処する。
ST-Treeモデルは、STをバックボーンネットワークとして追加のニューラルツリーモデルと組み合わせる。
これにより、研究者はモデルの意思決定プロセスを明確に把握し、意味のある解釈を抽出できる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:49:12 GMT)
Scaling Deep Learning Research with Kubernetes on the NRP Nautilus HyperCluster [1.3] 合計で234のディープニューラルモデルがNautilusで4,040時間トレーニングされている。
本研究では,NRP Nautilus HyperClusterを用いたディープラーニングモデルトレーニングの自動化とスケールアップについて検討する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:19:49 GMT)
Optimizing Luxury Vehicle Dealership Networks: A Graph Neural Network Approach to Site Selection [1.2] 本研究では,米国における高級車メーカーのディーラーネットワークプランニングを最適化するために,グラフニューラルネットワーク(GNN)の新たな応用を提案する。
ディーラーの立地決定要因に関する総合的な文献レビューを行い、65の郡レベルの説明変数を特定した。
34の変数の組み合わせと10の最先端GNN演算子によるアブレーション研究は、様々な変数の予測力に関する重要な洞察を明らかにしている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:11:45 GMT)
Electrically tunable quantum correlations of dipolar polaritons with micrometer-scale blockade radii [1.2] フォトニック系による単一光子に対する極端に再構成可能な非線形応答は、普遍的な2光子ゲートを実現するために重要である。
ここでは半導体チップ上の双極子導波路偏光子における電気的に可変な部分光子遮断を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:57:57 GMT)
Parsing altered brain connectivity in neurodevelopmental disorders by integrating graph-based normative modeling and deep generative networks [1.2] 神経型接続パターンからの分岐の定量化は、診断と治療の介入を知らせる有望な経路を提供する。
本稿では,生物にインスパイアされた深層生成モデルと規範的モデリングを統合したBRIDGEフレームワークによる脳表現について述べる。
BRIDGEは、接続ベースの脳年齢と時間年齢の違いに基づくグローバルなニューロディバージェンススコアと、局所的な接続性の違いを強調する地域的なニューロディバージェンスマップを提供する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:29:05 GMT)
Mitigating Gender Bias in Contextual Word Embeddings [1.2] 本稿では,コンテキスト埋め込みにおける性別バイアスを大幅に軽減する,リップスティック(マスケ・ランゲージ・モデリング)の新たな目的関数を提案する。
また, 静的な埋め込みを嫌悪する新しい手法を提案し, 広範囲な解析と実験による実証実験を行った。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:36:44 GMT)
Cascaded Diffusion Models for 2D and 3D Microscopy Image Synthesis to Enhance Cell Segmentation [1.1] 本稿では,高密度な2Dおよび3D細胞顕微鏡画像の合成のための新しいフレームワークを提案する。
マルチレベル拡散モデルと3次元表面再構成手法であるNeuSを用いて,スパース2次元アノテーションから2次元および3次元セルマスクを合成する。
合成データと実データを組み合わせたセグメンテーションモデルをトレーニングすることで,複数のデータセットで最大9%のセルセグメンテーション性能が向上することを示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:22:37 GMT)
Chapter 7 Review of Data-Driven Generative AI Models for Knowledge Extraction from Scientific Literature in Healthcare [1.1] NLPに基づくテキスト要約手法の開発について概観する。
変換器(BERT)と生成事前学習器(GPT)からの双方向表現を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:13:47 GMT)
Enhancing Bidirectional Sign Language Communication: Integrating YOLOv8 and NLP for Real-Time Gesture Recognition & Translation [1.1] We have used the You Only Look Once (YOLO) model and Convolutional Neural Network (CNN) model。
YOLOモデルはリアルタイムに実行され、生のビデオストリームから識別的空間時間特性を自動的に抽出する。
ここでのCNNモデルは、手話検出のためにリアルタイムに実行される。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:55:11 GMT)
Ethical Challenges and Evolving Strategies in the Integration of Artificial Intelligence into Clinical Practice [1.0] 我々は、正義と公正、透明性、患者の同意と機密性、説明責任、患者中心で公平なケアの5つの重要な倫理的関心事に焦点を当てる。
この論文は、患者の信頼を維持する上でのバイアス、透明性の欠如、そして課題が、医療におけるAIアプリケーションの有効性と公正性を損なう可能性があるかを考察する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 00:52:22 GMT)
EXCON: Extreme Instance-based Contrastive Representation Learning of Severely Imbalanced Multivariate Time Series for Solar Flare Prediction [1.0] このような不均衡の中で、分類性能を高めるために設計されたコントラスト表現学習フレームワークEXCONを提示する。
結果は、太陽フレアデータセットのベンチマークと、バイナリとマルチクラスラベルによる複数の時系列アーカイブデータセットの評価を含む。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:36:19 GMT)
Structure learning with Temporal Gaussian Mixture for model-based Reinforcement Learning [0.9] 本稿では,知覚モデルと遷移モデルからなる時間的ガウス混合モデルを提案する。
知覚モデルは、変分ガウス混合確率を用いて連続観測から離散状態(ラテン)を抽出する。
遷移モデルはディリクレカテゴリーの共役性を利用して連続する時間ステップ間の時間遷移を学習する。
最後に、状態に対する信念からQ値を学ぶことができるQ-ラーニングの変種を用いて意思決定を行う。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:16:03 GMT)
Hierarchical-Graph-Structured Edge Partition Models for Learning Evolving Community Structure [0.9] 本稿では,時間的ネットワーク内での潜在コミュニティの進化を捉えるために,新しい動的ネットワークモデルを提案する。
我々のモデルは、推測されたコミュニティ構造が相互に結合し、分割し、相互作用し、複雑なネットワークのダイナミクスを包括的に理解することを可能にする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:48:15 GMT)
Teapot: Efficiently Uncovering Spectre Gadgets in COTS Binaries [0.8] 本稿では,COTSバイナリで動作する最初のSpectreガジェットスキャナであるTeapotについて述べる。
そこで本研究では,通常の実行と投機シミュレーションのバイナリコードを分離して,実行時の効率を改善する新しい手法であるSpeculation Shadowsを紹介する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:56:56 GMT)
Accelerating spherical K-means clustering for large-scale sparse document data [0.7] 本稿では,大規模かつ高次元のスパース文書データセットを対象とした球面K平均クラスタリングアルゴリズムを提案する。
提案手法は, 大規模文書において, 最先端技術を用いたアルゴリズムと比較して, 高速性能を効果的に達成できることを実験的に実証した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:50:58 GMT)
ITACLIP: Boosting Training-Free Semantic Segmentation with Image, Text, and Architectural Enhancements [0.7] ビジョン言語モデルの最近の進歩は、コンピュータビジョンタスクにおける評価パラダイムを再形成している。
これらの基礎モデル、特にCLIPは、オープン語彙コンピュータビジョンタスクの研究を加速してきた。
本研究では,CLIPのセマンティックセグメンテーション性能を,新しいモジュールの導入と修正によって向上させる。
ITACLIPはセグメンテーションベンチマークの最先端手法よりも優れている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:31:38 GMT)
Multi-scale Restoration of Missing Data in Optical Time-series Images with Masked Spatial-Temporal Attention Network [0.7] リモートセンシング画像に欠落した値を出力する既存の方法は、補助情報を完全に活用できない。
本稿では,時系列リモートセンシング画像の再構成のためのMS2という,深層学習に基づく新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:36:53 GMT)
Solving Generalized Grouping Problems in Cellular Manufacturing Systems Using a Network Flow Model [0.6] 本稿では, セル製造システムにおける一般化グループ化問題に焦点をあてる。
本研究は,ネットワークフローアルゴリズムの広範かつ広範な利用に着想を得て,一般化グループ化のためのプロセス経路ファミリー形成を定式化した。
提案モデルでは, 生成する部品の数を事前に指定することなく, プロセス経路のファミリー形成問題を最適に解決する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 23:15:36 GMT)
Tripartite measurement uncertainty in Schwarzschild space-time [0.6] シュワルツシルトブラックホール背景の観測不確かさに及ぼすホーキング放射の影響を解析した。
ホーキング温度の上昇に伴い測定の不確実性は着実に増大する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:51:07 GMT)
The Statistical Accuracy of Neural Posterior and Likelihood Estimation [0.6] 我々はNPEとNLEの統計的挙動を詳細に調査する。
これらの手法は、近似ベイズ計算(ABC)やベイズ合成可能性(BSL)のような一般的な統計手法に類似した理論的保証があることを証明している。
この精度は計算コストが大幅に削減され,ABCやBSLよりも魅力的な近似が得られることが証明された。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:25:32 GMT)
Virtual Reality in Teacher Education: Insights from Pre-Service Teachers in Resource-limited Regions [0.6] この研究は、初めてVRに関わったガーナ人の教師36人の経験と振り返りを参考にしている。
参加者は、VRに満足したレッスンが、同期オンライン学習に代わる有望な代替手段だと考えている。
これらの有望な認識にもかかわらず、参加者は、限られたインフラ、信頼性の低いインターネット接続、VR機器へのアクセス不足など、重要な課題を特定した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:14:37 GMT)
Effective Virtual Reality Teleoperation of an Upper-body Humanoid with Modified Task Jacobians and Relaxed Barrier Functions for Self-Collision Avoidance [0.5] 本稿では,上半身のヒューマノイドを効果的に遠隔操作するために,市販のバーチャルリアリティ(VR)トラッカーを再ターゲットするアプローチを提案する。
この効果の鍵は、修正されたタスクジャコビアンと緩和されたバリア関数によって、トラッカーをジョイント集合に適切に割り当てることであった。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:49:46 GMT)
Order Parameter Discovery for Quantum Many-Body Systems [0.5] 本稿では, 位相図作成のための新しい手法について紹介する。
この方法では、量子位相をマッピングし、最適化問題を定式化し、順序パラメータに対応する可観測性を発見する。
本稿では,Axial Next Nearest Neighbour Interaction(ANNNI)モデル,クラスタ状態モデル,およびRydberg原子の連鎖など,確立されたモデルに適用することで,アプローチの有効性を実証する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:37:25 GMT)
Many-body enhancement of energy storage in a waveguide-QED quantum battery [0.5] 量子電池として機能する導波路-QED系の異なる構成について検討する。
集合的な効果は、電池の自己放電時間を遅くする可能性がある。
どちらの構成でも、集合効果は光学系のエネルギー保護特性を高めるために用いられる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 00:22:07 GMT)
A Review of Digital Pixel Sensors [0.5] デジタルピクセルセンサー(DPS)は、現代のイメージングシステムにおいて重要なコンポーネントとして進化してきた。
しかし、ADC回路の調節に起因する各画素に固有の複雑さは、画素ピッチを大幅に増加させる。
本稿では,DPS技術の広範な領域について概観する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:37:19 GMT)
HamLib: A library of Hamiltonians for benchmarking quantum algorithms and hardware [0.4] 量子量子ハミルトニアンの大規模なデータセットを提示する。
HamLibと呼ばれるデータセットはオンラインで無料で利用でき、問題のサイズは2から1000キュービットである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:01:54 GMT)
Cuvis.Ai: An Open-Source, Low-Code Software Ecosystem for Hyperspectral Processing and Classification [0.4] cuvis.aiは、データ取得、前処理、モデルトレーニングのためのオープンソースでローコードなソフトウェアエコシステムである。
パッケージはPythonで書かれており、一般的な機械学習ライブラリのラッパーを提供する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:33:40 GMT)
HistoEncoder: a digital pathology foundation model for prostate cancer [0.4] ファンデーションモデルは、複雑なパターンを区別するために大量のデータに基づいて訓練されている。
前立腺癌デジタル病理学の基礎モデルであるHistoEncoderを,前立腺組織タイル画像4800万枚に事前トレーニングして開発した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:46:05 GMT)
Generative AI on the Edge: Architecture and Performance Evaluation [0.4] 6GのAIネイティブビジョンであるアドバンストインテリジェンスをネットワークに組み込むには、エッジデバイス上のジェネレーティブAI(GenAI)モデルを体系的に評価する必要がある。
本研究では,ORANのエッジテストベッドとして機能する1つのコモディティRaspberry Pi上でのLLM(Large Language Models)推論の計算要求について検討する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:09:01 GMT)
DAWN: Designing Distributed Agents in a Worldwide Network [0.4] DAWNはグローバルに分散エージェントを登録し、ゲートウェイエージェントを通じて簡単に発見できる。
No-LLM Mode for Deterministic Task, Copilot for augmented decision-making, and LLM Agent for autonomous operations。
DAWNは、専用の安全性、セキュリティ、コンプライアンスレイヤを通じて、世界中のエージェントコラボレーションの安全性とセキュリティを保証する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:30:47 GMT)
Zero-Shot Automatic Annotation and Instance Segmentation using LLM-Generated Datasets: Eliminating Field Imaging and Manual Annotation for Deep Learning Model Development [0.4] 本研究では, 果樹園におけるリンゴの深層学習に基づくインスタンスセグメンテーション手法を提案する。
そこで我々は, YOLO11ベースモデルと統合したSegment Anything Model (SAM) を用いて, オーチャード画像を合成し, 自動的に注釈付けを行った。
その結果、自動生成したアノテーションはDice Coefficient 0.99513 と IoU 0.9303 を達成し、マスクアノテーションの精度と重複性を検証した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:11:29 GMT)
Searching for internal symbols underlying deep learning [0.4] ディープラーニング(DL)は、ディープニューラルネットワーク(DNN)が、指示や指針なしに、与えられた例から複雑なタスクやルールを自動的に学習することを可能にする。
研究の1行は、DNNが人間に認識可能な高いレベルの特徴である概念を学習する可能性があることを示唆している。
基礎セグメンテーションモデルと教師なし学習を組み合わせて、内部コードを抽出し、抽象コードの可能性を特定し、DLの決定をより信頼性と安全性を高める。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:47:56 GMT)
Making Sigmoid-MSE Great Again: Output Reset Challenges Softmax Cross-Entropy in Neural Network Classification [0.3] 本研究では,平均二乗誤差(MSE)とソフトマックスクロスエントロピー(SCE)の2つの目的関数の比較分析を行った。
MSEは、従来の回帰タスクと結びついているが、分類問題の代替手段として有効である。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 00:46:38 GMT)
Learning complexity gradually in quantum machine learning models [0.3] トレーニングセット全体に対して情報的データポイントを優先するフレームワークを提案する。
情報的サンプルに選択的に焦点をあてることで、パラメータ空間のより好ましい領域に向けて最適化プロセスのステアリングを目指す。
この戦略は,量子機械学習モデルの性能向上に有効である可能性が示唆された。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:00:01 GMT)
Strong nanophotonic quantum squeezing exceeding 3.5 dB in a foundry-compatible Kerr microresonator [0.3] 窒化ケイ素マイクロリングを用いて直接検出したナノフォトニック量子スクイーズを報告する。
この結果から、Si$_3$N$_4$はCMOS互換でスケーラブルなアーキテクチャにおいて、強力な量子ノイズ低減のための実行可能なプラットフォームであることが示された。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:59:50 GMT)
Effective Predictive Modeling for Emergency Department Visits and Evaluating Exogenous Variables Impact: Using Explainable Meta-learning Gradient Boosting [0.2] 本稿では,毎日のED訪問を正確に予測するためのメタラーニンググラディエント・ブースター(Meta-ED)手法を提案する。
提案したMeta-EDは,4つの基礎学習者からなる。Catboost,Random Forest,Extra Tree,LightGBoostは信頼性の高いトップレベルの学習者,Multi-Layer Perceptron(MLP)である。
そこで本研究では,メタEDモデルの有効性を,23モデルを含む広範囲な比較分析により評価した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 04:23:20 GMT)
Autoassociative Learning of Structural Representations for Modeling and Classification in Medical Imaging [0.2] 本研究では,視覚的プリミティブの観点から観察画像の再構成によって学習するニューロシンボリックシステムのクラスを提案する。
組織像の異常診断に応用すると,従来のディープラーニングアーキテクチャよりも分類精度が優れていた。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:29:50 GMT)
Fault-tolerant logical measurements via homological measurement [0.1] ホモロジー測定は、CSS安定化符号でエンコードされた論理的パウリ演算子を測定するためのフレームワークである。
我々は、一般的なqLDPC符号の任意の論理パウリ演算子の耐故障性測定のための特定のプロトコルを開発する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 22:08:54 GMT)
High-fidelity universal gates in the $^{171}$Yb ground state nuclear spin qubit [0.1] 単一キュービットゲートと2キュービットゲートを個別に制御し並列に適用した汎用高忠実ゲートセットを実証する。
これらの結果は、中性原子を用いた複雑で一般的な量子計算を実行するための重要なマイルストーンである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:36:32 GMT)
Towards Scalable Insect Monitoring: Ultra-Lightweight CNNs as On-Device Triggers for Insect Camera Traps [0.1] カメラトラップは、自動化されたスケーラブルな生物多様性監視を実現する手段として登場した。
カメラトラップをトリガーする受動赤外線(PIR)センサーは、昆虫のような小型で素早く動く外惑星を検出するには適していない。
本研究は、低消費電力ハードウェア上で動作する超軽量畳み込みニューラルネットワークであるPIRトリガの代替を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:46:39 GMT)
ACE2: Accurately learning subseasonal to decadal atmospheric variability and forced responses [0.1] ACE2 (Ai2 Climate Emulator version 2) では過去80年間の大気変動を数日から数十年の時間スケールで再現する。
世界規模の乾いた空気量と湿気を正確に保存し、壁時計1日あたり1500年程度のスループットで、任意に多くのステップで安定して前進することができる。
過去80年間に、エルニーニョの変動と地球の温度トレンドに対する大気の反応を正確に再現する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:57:07 GMT)
CerviXpert: A Multi-Structural Convolutional Neural Network for Predicting Cervix Type and Cervical Cell Abnormalities [0.1] 子宮頸癌は、世界中の女性のがん関連死亡の主な原因である。
パパ・スミアや頚椎生検のような伝統的な診断法は、細胞学の専門知識に大きく依存している。
本研究では,CerviXpertについて紹介する。CerviXpertは,頚椎型を効率よく分類し,頸部細胞異常を検出するように設計された多構造畳み込みニューラルネットワークモデルである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:00:58 GMT)
Learning Personalized Treatment Decisions in Precision Medicine: Disentangling Treatment Assignment Bias in Counterfactual Outcome Prediction and Biomarker Identification [0.1] 精密医療は、機械学習(ML)と人工知能(AI)を用いて、個々の患者に対して治療決定を調整できる可能性がある
臨床観察データの複雑なバイアスと、生物学的データの高次元的な性質により、大きな課題に直面している。
本研究は,相互情報を用いた多種多様な治療課題バイアスをモデル化し,それらのMLモデルへの影響について検討する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:55:24 GMT)
Probing de Sitter Space Using CFT States [0.0] dS$_3/$CFT$$の演算は、AdS$_3/$CFT$$の演算と明らかに異なる。
これにより、CPT-in方式で異なる一次状態から構築された2つの局所状態を組み合わせる必要がある。
この分析は、dS ユークリッド真空におけるグリーン関数が、AdS のウィック回転から簡単には得られない理由を説明する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 02:30:10 GMT)
Improved GUI Grounding via Iterative Narrowing [0.0] 自然言語クエリからインタフェースイメージ上の正確な位置を特定するタスクは、視覚言語モデル(VLM)エージェントの能力を高める上で重要な役割を果たす。
近年の研究では、ワンショットGUIグラウンドリングに特化してこれらのモデルを微調整することに焦点が当てられ、ベースライン性能よりも大幅に改善されている。
本稿では,GUIグラウンディングにおける汎用モデルと微調整モデルの両方の性能を高めるために,Iterative Narrowing (IN) という視覚的プロンプトフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:47:12 GMT)
An Internet Voting System Fatally Flawed in Creative New Ways [0.0] 最近公開された"MERGE"プロトコルは、プロトタイプのCAC-voteシステムで使用されるように設計されている。
投票用キオスクおよびプロトコルは、インターネット上で投票を送信し、投票者検証可能な紙投票をメールを介して送信する。
MERGEプロトコルでは、インターネット上で送信された投票は結果を集計し、勝者を決定するために使用されるが、監査と再集計は間に合う紙の投票を使用する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:10:05 GMT)
qHEOM: A Quantum Algorithm for Simulating Non-Markovian Quantum Dynamics Using the Hierarchical Equations of Motion [0.0] オープン量子系の非マルコフ力学をシミュレートする量子アルゴリズムを提案する。
提案手法により,雑音型中間スケール量子コンピュータ上での任意の量子マスター方程式の実装が可能となる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:41:10 GMT)
Zonal Architecture Development with evolution of Artificial Intelligence [0.0] 本稿では、従来の集中型アーキテクチャが、スケーラビリティ、信頼性、性能、コスト効率といった課題に対処するために、分散地域アプローチにどのように移行しているかを説明する。
自動運転車の高度なセンサー融合と意思決定機能の実現におけるエッジコンピューティングとニューラルネットワークの役割について検討した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:15:44 GMT)
Value Imprint: A Technique for Auditing the Human Values Embedded in RLHF Datasets [0.0] 本稿では,RLHFデータセットに埋め込まれた人間の値の監査と分類を行うフレームワークであるValue Imprintを紹介する。
我々は,Arthropic/hh-rlhf,OpenAI WebGPT Comparisons,Alpaca GPT-4-LLMデータセットの3つのケーススタディ実験を行った。
我々は、Wisdom/KnowledgeやInformation Seekingを含む情報活用価値が、3つのRLHFデータセットの中で最も重要な人的価値であることを発見した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:12:24 GMT)
Universal solution to the Schrieffer-Wolff Transformation Generator [0.0] シュリーファー・ヴォルフ変換(シュリーファー・ヴォルフ変換、英: Schrieffer-Wolff transformation、SWT)は、量子力学において、低エネルギー部分空間と高エネルギー部分空間を分離することによってハミルトニアンを単純化するために用いられる重要な摂動法である。
既存のSWTの実装方法は、任意の摂動システムに一般的な適用性を欠いていることが多い。
我々はこれらの欠点に対処するSWTのための体系的で統一されたフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:46:57 GMT)
Towards a Practical Ethics of Generative AI in Creative Production Processes [0.0] 本稿では,Double Diamondデザインモデルのような創造的生産プロセスにおける倫理的課題に対処するための枠組みを紹介する。
我々は、美徳倫理学、デオントロジー、実用主義、契約理論、ケア倫理学、実在論の6つの主要な倫理理論を描いている。
私たちは、AIに遊び的で探索的なアプローチを採用することで、デザイナはAI技術の潜在能力を責任を持って活用できる、と論じます。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:07:26 GMT)
Timescale-agnostic characterisation for collective attention events [0.0] Twitter上のハッシュタグの使用には,トピックに対する注意パターンの異なる4つの特徴がある。
本研究では,これらの現象の発生に影響を及ぼす要因を調べるため,エージェントベースモデルを構築した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:01:59 GMT)
The why, what, and how of AI-based coding in scientific research [0.0] 生成AI、特に大きな言語モデル(LLM)は、コーディングを直感的な会話に変換する可能性がある。
私たちは3つの重要なレンズを通してAIベースのコーディングを区別します。
コーディングにおけるAIの限界と将来の展望に対処する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:36:36 GMT)
The ethical landscape of robot-assisted surgery. A systematic review [0.0] ロボット支援手術の倫理的問題は、あまり注目されなかった。
倫理的議論の7つの主要な柱が分析中に現れた。
これには、損害と利益、責任とコントロール、専門的な患者との関係、外科訓練と学習における倫理的問題、正義、翻訳的問題、経済的な考慮などが含まれる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:15:24 GMT)
The Role of Accuracy and Validation Effectiveness in Conversational Business Analytics [0.0] 本研究では、従来のセルフサービス分析を使用してエンドユーザを効果的に妨げている技術的ギャップにAIを用いて対処する、会話型ビジネス分析について検討する。
自然言語による対話によって、対話型ビジネス分析は、ユーザが独立してデータを検索し、洞察を生成することを可能にする。
予測ユーティリティ理論に基づくモデルを用いて、部分的または完全なサポートを通じて、会話ビジネス分析が人間の専門家への委譲よりも優れている状況を特定する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 23:58:24 GMT)
The Generalization Error of Machine Learning Algorithms [0.0] 差分法は,機械学習アルゴリズムの一般化誤差に対する情報量の観点から,閉形式式を導出する手法である。
提案手法により,機械学習アルゴリズムの一般化誤差に対する既存の正確な表現が得られる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:05:51 GMT)
The GECo algorithm for Graph Neural Networks Explanation [0.0] 本稿では,グラフ分類問題の解釈可能性に対処するために,グラフコミュニティを包含する新たな方法論を提案する。
GECoと呼ばれる提案手法は、コミュニティがグラフノードの密結合部分集合であるなら、この性質はグラフ分類において役割を果たすべきであるという考えを生かしている。
得られた結果は、人工グラフデータセットおよびほとんどの実世界のデータセットの他の手法よりも優れている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:08:30 GMT)
Testing Uncertainty of Large Language Models for Physics Knowledge and Reasoning [0.0] 大規模言語モデル(LLM)は、近年、様々な分野の質問に答える能力で大きな人気を集めている。
本稿では,オープンソースLLMの性能評価のための解析手法を提案する。
我々は,物理に関する話題における解答精度と変数の関係に注目した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:42:13 GMT)
SynCoTrain: A Dual Classifier PU-learning Framework for Synthesizability Prediction [0.0] 素材の合成可能性を予測するための半教師付き機械学習モデルであるSynCoTrainを提案する。
我々のアプローチでは、明示的な負のデータがないことに対処するために、肯定的および非ラベル付き学習(PU)を用いています。
モデルは堅牢なパフォーマンスを示し、内部および離脱テストセットで高いリコールを達成する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:53:19 GMT)
Symmetries and singular behaviors with Bohmian trajectories [0.0] 量子力学は、最も単純な物理シナリオであっても、挑戦的な振る舞いを予測することができる。
この研究は、位相に基づく現象を分析する上で、ボーム力学がかなり便利な理論的な枠組みであることをどのように証明するかに焦点を当てている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:31:23 GMT)
Surface criticality in the mixed-field Ising model with sign-inverted next-nearest-neighbor interaction [0.0] 光ツイーザーアレイのリドバーグ原子はスピン=1/2$反強磁性イジングモデルの量子シミュレータとして使われている。
反強磁性相と常磁性相の1次量子相転移に伴う表面臨界性について検討する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:27:50 GMT)
Suppressing Si Valley Excitation and Valley-Induced Spin Dephasing for Long-Distance Shuttling [0.0] シリコン量子ドットにおける電子スピンシャットリング中の誤差を抑制するスケーラブルなプロトコルを提案する。
最適化により、シャットリングパスの1つの小さなセグメント上のシャットリング速度プロファイルが洗練される。
このプロトコルは、シリコンスピンベースの量子コンピューティングデバイスにおける高忠実度量子トランスポートのためのチップスケールソリューションを提供する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:17:24 GMT)
Study of the Performance of CEEMDAN in Underdetermined Speech Separation [0.0] CEEMDANアルゴリズムは、非定常信号の解析に使用される現代的な手法の1つである。
本研究は, 音源分離における本手法の有効性について検討し, その限界について考察する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:13:51 GMT)
Stochastic quantization and diffusion models [0.0] 本稿では,物理学における量子化と機械学習における拡散モデルとの関係について概説する。
機械学習の応用においては、デノナイジング拡散モデルが成功技術として確立されている。
本稿では,スコアベース生成モデルにおけるSDE手法について述べる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:47:41 GMT)
Stabilizer disentangling of conformal field theories [0.0] 局所クリフォード演算により冷却された共形場理論を包含する格子モデルの絡み合い特性について検討する。
連関がボリュームに依存しない定常的な利得体制と、連関がボリュームとともに増加する対数ゲイン体制の2つの異なる体制を明らかにする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:50:47 GMT)
Spin-bounded correlations: rotation boxes within and beyond quantum theory [0.0] 量子論がスピン 0, 1/2, 1 に対して最も一般的な回転相関を持つことを証明している。
また、スピンの3/2の超量子リソースが同じスピンの全ての量子リソースより優れているようなメトロジーゲームも証明する。
結果は空間がどのように量子論の構造を制約するかという問題に照らされる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:13:12 GMT)
Spikes in Poissonian quantum trajectories [0.0] 測定速度の限界における連続監視量子ビットの力学を考察する。
また,ポアソンノイズにもスパイクが観測された。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:40:00 GMT)
Spatio-Temporal Jump Model for Urban Thermal Comfort Monitoring [0.0] 空間次元と時間次元の両方にまたがってデータを扱うアテンポ的ハンドルを導入する。
我々は,本手法を広範囲なシミュレーションにより検証し,真に基礎となる分割を復元する際の精度を実証した。
本提案では, 都市環境の動的設定と実環境モニタリングへの適合性を実証し, その有効性を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:50:45 GMT)
Signaling and Social Learning in Swarms of Robots [0.0] 本稿では,ロボット群における協調性向上におけるコミュニケーションの役割について検討する。
クレジット代入問題に対処する上で,コミュニケーションが果たす役割を強調した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:42:15 GMT)
Scalable Multispecies Ion Transport in a Grid-Based Surface-Electrode Trap [0.0] 格子型表面電極ポールトラップにおけるイオン結晶制御のためのスケーラブルな方法を提案する。
格子上の隣接部位間でのイオン交換の条件付き再秩序結晶と条件付き交換を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:47:43 GMT)
SL-YOLO: A Stronger and Lighter Drone Target Detection Model [0.0] 本稿では,小型目標検出のボトルネックを解消する革命モデルSL-YOLO(Stronger and Lighter YOLO)を提案する。
本稿では,最も難易度の高い環境においても,非並列検出精度を確保することのできる,大規模機能融合の先駆的手法を提案する。
VisDrone 2019データセットの実験結果によると,mAP@0.5が43.0%から46.9%に向上した。
モデルパラメータは 11.1M から 9.6M に減少し、FPS は 132 に到達し、資源制約のある環境でのリアルタイムの小さな物体検出に理想的な解となる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:26:11 GMT)
Robust Causal Analysis of Linear Cyclic Systems With Hidden Confounders [0.0] 多くの複雑なシステムにはフィードバックループがあり、これは我々の手法が周期的因果関係を許容する必要があることを意味する。
データは、しばしば汚染されたプロセスによって歪むので、そのような歪みに対して堅牢な手法を適用する必要があります。
我々はLLCの堅牢性について検討する。 citellcは、隠れた共同設立者と循環モデルを扱う数少ない因果分析手法の1つだ。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:09:01 GMT)
Revitalizing Electoral Trust: Enhancing Transparency and Efficiency through Automated Voter Counting with Machine Learning [0.0] この研究は、OpenCV、CVZone、MOG2アルゴリズムといった最先端技術を利用する自動化システムが、選挙操作の有効性とオープン性を大幅に向上させる方法について、光を当てることを目的としている。
また、F1スコアなどの厳密な指標を用いて、自動システムの精度を手動の計数方法と体系的に比較する方法についても強調されている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:10:14 GMT)
Relativistic Quantum Information from Unequal-Time QFT Correlation Functions [0.0] 本稿では,QFTの相関関数に含まれる既約量子的挙動から,量子資源の定義に焦点をあてる。
我々の主な対象は、$N$-detectorイベントの確率密度の関連階層である。
新しいリソースは、ベルの不等式にカプセル化された量子的挙動とは異なる、既約量子的挙動のインスタンスをキャプチャする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:03:18 GMT)
Reducing measurement costs by recycling the Hessian in adaptive variational quantum algorithms [0.0] 本稿では,適応VQAに適した準ニュートン最適化プロトコルを提案する。
我々は,適応VQAの繰り返しを通じて,逆ヘッセン行列に対する近似を連続的に構築し,成長させる準ニュートンアルゴリズムを実装した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:38:37 GMT)
Recurrent Stochastic Configuration Networks with Incremental Blocks [0.0] リカレント・コンフィグレーション・ネットワーク(RSCN)は、順序の不確実性を伴う非線形力学系のモデリングにおいて、将来性を示す。
本稿では,ブロックインクリメントを持つブロックRCCN(BRSCN)を開発した。
BRSCNは建設中に複数の貯水池ノード(貯水池)を同時に追加することができる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:58:47 GMT)
Real-Time Fitness Exercise Classification and Counting from Video Frames [0.0] 本稿では,Bidirectional Long Short-Term Memory (BiLSTM) ニューラルネットワークを用いた実時間運動分類手法を提案する。
このモデルは、視点、ユーザーの位置、身体の違いの変化に適応し、一般化を改善する。
手動のエクササイズ選択なしでリアルタイムなエクササイズ分類と繰り返しカウントを提供するWebアプリケーションに統合される。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:06:29 GMT)
Random Forest-Supervised Manifold Alignment [0.0] 本稿では,半教師付きアライメントアルゴリズムの基礎としてランダム森林を用いた多様体アライメント手法を提案する。
近年開発されたアライメントグラフをベースとした2つのアライメントグラフの強化に焦点をあてる。
従来の手法では,下流の分類に十分な情報を取得する埋め込みの生成に失敗することが多い。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:14:50 GMT)
Quantum coherence between mass eigenstates of a neutrino can be destroyed by its mass-momentum entanglement [0.0] 不安定な粒子の崩壊で生じるニュートリノや反ニュートリノが付随する粒子と絡まっていない場合、その質量はその運動量と相関する。
この絡み合いは、運動量と位置表現の両方においてニュートリノの質量固有状態の間の量子コヒーレンスを破壊する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:27:41 GMT)
Quantum Thermoelectric Circuits: A Universal Approach [0.0] 我々は定常状態における量子熱電回路理論のパノラマ的スキーマを開発する。
熱電流と温度勾配に関するキルヒホフの法則の類似性を定義することによって基礎を確立する。
我々は量子熱ステップ変換器のモデルを開発することができた。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:11:48 GMT)
Quantum Dissipative Search via Lindbladians [0.0] 我々は、構造化されていない古典的な探索空間上の純粋に散逸した量子ランダムウォークを解析する。
ある種のジャンプ演算子は量子過程を古典的過程に複製させ、他方はオープン量子(OQRW)と古典的ランダムウォークの違いをもたらすことを示す。
また,従来観測されていた2次高速化も明らかにし,OQRWは古典的検索ほど効率的ではないことを示した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:21:11 GMT)
Pumping Chirality in Three Dimensions [0.0] 非自明な3フェルミオン量子セルオートマトン(QCA)の簡単な形を与える。
我々は、このフレーミング依存フェーズを、システムを通して$p+ip$状態の8ドルのコピーのポンプに関連付ける。
我々は、$p+ip$状態のコピーの少ないポンプについて論じ、その位相的に退化した基底状態に対する作用について述べる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 22:27:36 GMT)
Pricing Weather Derivatives: A Time Series Neural Network Approach [0.0] 我々は,トロントとシカゴのパシフィックリム指数を評価するために,時系列予測とニューラルネットワークアプローチを用いた。
本研究の目的は,気温と降水量に基づく気象デリバティブ契約を基礎となる気候変数として価格設定することである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:54:28 GMT)
Performance Evaluation of Geospatial Images based on Zarr and Tiff [0.0] これにより、ZarrとTIFFの2つの異なるデータストレージフォーマットを用いて、地理空間画像処理の性能を評価する。
従来のタグ付きイメージファイルフォーマットは、シンプルで互換性があるが、大規模なデータセットで作業する際のパフォーマンス制限が欠けているため、主に使用されている。
Zarは、データチャンキングと圧縮技術を備えたスケーラビリティと効率的なストレージを提供する、クラウドシステム用に設計された新しいフォーマットである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:34:31 GMT)
OpenCap markerless motion capture estimation of lower extremity kinematics and dynamics in cycling [0.0] マーカレスモーションキャプチャは、従来のマーカーベースのシステムよりもいくつかの利点がある。
システムは人体のランドマークを直接検出することができ、手作業による処理やマーカーの配置に伴うエラーを減らすことができる。
本研究では,マーカーレスモーションキャプチャシステムであるOpenCapと,サイクリングバイオメカニクス評価における従来のマーカーベースシステムとの比較を行った。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:08:21 GMT)
On the hardness of cloning and connections to representation theory [0.0] 隠れた部分空間上の最大絡み合った状態のクローニングアルゴリズムについて推測する。
予想と結果は、量子計算と表現論の間の関係から導かれる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:19:08 GMT)
Mechanism and Emergence of Stacked Attention Heads in Multi-Layer Transformers [0.0] 最小限の層数を持つ変圧器でのみ解決できる単純な推論タスクである検索問題を紹介します。
大規模な言語モデルは、微調整をせずに、異なるプロンプト式でタスクを解くことができることを実証する。
学習の成功は暗黙のカリキュラムの存在下でのみ起こります。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 23:12:13 GMT)
Lung Disease Detection with Vision Transformers: A Comparative Study of Machine Learning Methods [0.0] 本研究では,機械学習における最先端アーキテクチャであるビジョントランスフォーマー(ViT)の胸部X線解析への応用について検討する。
胸部X線像と肺分画領域に焦点を当てた2つのViT法の比較検討を行った。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:40:25 GMT)
Lorentz covariant physical Brownian motion: Classical and quantum [0.0] 我々はGoldstein-Kacc速度切替モデルを再検討する。
プロセスの前方および後方のチャップマン・コルモゴロフ方程式がローレンツ共変であることが証明される。
時空における不整合支持状態間の遷移は起こらないことを検証する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:02:42 GMT)
Long-time Freeness in the Kicked Top [0.0] 自由度に関する大きな偏差理論を導入し、関連する時間スケールを定義し解析する。
本研究は,カオス力学の長期的挙動に関する新たな知見を提供し,多体量子力学の研究に広く影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:43:11 GMT)
Linear-optical protocols for mitigating and suppressing noise in bosonic systems [0.0] 我々は、ボソニックノイズチャネルを緩和し、抑制するための線形光学的手法を確立する。
予測値推定における誤差を軽減するため、確率誤差キャンセルを行うことができる。
弱い中央ガウス・ガウスの脱落は、アンシラの数とともに単調に抑制忠実度が増大する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 06:14:42 GMT)
LightFFDNets: Lightweight Convolutional Neural Networks for Rapid Facial Forgery Detection [0.0] 本研究では,Fake-Vs-Real-Faces [10]と140k Real and Fake Faces [61]データセットを用いた画像処理による偽造検出に焦点を当てた。
これらの画像を用いて偽造検出を行うために,2つの軽量ディープラーニングモデルを提案する。
提案した軽量ディープラーニングモデルは,顔画像の偽造を正確に,かつ効率的に検出できることが示されている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:44:10 GMT)
Leveraging Gene Expression Data and Explainable Machine Learning for Enhanced Early Detection of Type 2 Diabetes [0.0] 2型糖尿病(T2D)の早期発見は、医療結果の改善と資源配分の最適化に重要である。
本研究では、T2D患者から得られた遺伝子発現データに機械学習(ML)技術を活用することにより、早期T2D検出のギャップを解消する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:24:08 GMT)
Learning policies for resource allocation in business processes [0.0] 本稿では,ビジネスプロセスにおける資源配分のための2つの学習手法を提案する。
最初の方法は、リソースをアクティビティに割り当てることでポリシーを学ぶために、Deep Reinforcement Learning (DRL)を活用する。
第2の方法はスコアベースの値関数近似手法であり、リソース割り当ての優先順位付けのためにキュレートされた特徴の集合の重みを学習する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:05:33 GMT)
Large corpora and large language models: a replicable method for automating grammatical annotation [0.0] 英語評価動詞構築における形式的変化の事例研究に応用された方法論的パイプライン「consider X (as) (to be) Y」を紹介する。
少数のトレーニングデータだけで、保留中のテストサンプルで90%以上の精度でモデルに到達します。
本研究は, 文法的構成と文法的変化および変化に関する幅広いケーススタディに対して, 結果の一般化可能性について論じる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:29:48 GMT)
LLMs and Memorization: On Quality and Specificity of Copyright Compliance [0.0] 大規模言語モデル(LLM)のメモリ化が懸念されている。
LLMは、著作権のある作品を含むトレーニングデータの一部を容易に再現できることが示されている。
これは、欧州AI法と同様に、既存の著作権法に違反している可能性があるため、解決すべき重要な問題である。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:44:26 GMT)
KAN/MultKAN with Physics-Informed Spline fitting (KAN-PISF) for ordinary/partial differential equation discovery of nonlinear dynamic systems [0.0] 動的システムの物理的理解を開発するためには、機械学習モデルを解釈する必要がある。
本研究では, (SRDD) アルゴリズムをデノナイズするための逐次正規化導関数を含む方程式発見フレームワークを提案し, 式構造を同定し, 関連する非線形関数を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:14:51 GMT)
Investigating Sensitive Directions in GPT-2: An Improved Baseline and Comparative Analysis of SAEs [0.0] Sparse Autoencoder (SAE) 再構成誤差に対するKLのばらつきは, 改善されたベースラインと比較して, もはや病理学的に高くはない。
また,SAEが発見する特徴方向が,SAEの疎度に依存するモデル出力に与える影響も示した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:20:35 GMT)
Interpretation of High-Dimensional Regression Coefficients by Comparison with Linearized Compressing Features [0.0] リチウムイオン電池のサイクル寿命を予測することによって,高次元関数データからの非線形応答を線形回帰がいかに近似するかを理解することに注力する。
我々は,回帰解の経路の最も近い回帰係数と比較し,特徴係数を導出する線形化法を開発した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:59:38 GMT)
Integrating GNN and Neural ODEs for Estimating Non-Reciprocal Two-Body Interactions in Mixed-Species Collective Motion [0.0] 本稿では,観測軌道から基礎となる運動方程式を推定するための新しいディープラーニングフレームワークを提案する。
本フレームワークは,グラフニューラルネットワークとニューラルディファレンシャル方程式を統合し,二体相互作用の効果的な予測を可能にする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:28:57 GMT)
Homeostatic motion planning with innate physics knowledge [0.0] 単純な動物でさえ、ロボット工学ではまだ再現されていない複雑な計画を開発し、実行することができる。
離散閉ループ制御器と一時閉ループ制御器の集合を定義することで解を提案する。
提案するフレームワークは実際のロボット向けに実装され、概念実証として2つのシナリオでテストされた。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:54:06 GMT)
High resolution microprice estimates from limit orderbook data using hyperdimensional vector Tsetlin Machines [0.0] そこで本研究では,マイクロプライスの誤り訂正モデルを提案する。
このモデルは、拡散と不均衡を求める最善の入札が与えられた現在のマイクロプライス推定を考慮に入れ、価格ランクの不均衡の最近のダイナミクスに基づいてマイクロプライスを調整する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:18:30 GMT)
Harnessing coherence generation for precision single- and two-qubit quantum thermometry [0.0] 量子フィッシャー情報と付随する量子信号-雑音比を用いて温度推定の精度を評価する。
様々な環境構成のための量子プローブとして、最初は絡み合ったり分離された2つの相互作用量子ビットを分析した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:25:36 GMT)
Hardness results for decoding the surface code with Pauli noise [0.0] 曲面符号に対する量子極大極大復号法(QMLD)と退化量子極大復号法(DQMLD)はそれぞれNP-hardと#P-hardであることを示す。
我々は、式を立方体依存のパウリノイズモデルと、公式の満足度特性を符号化するシンドロームの集合に変換する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 22:06:17 GMT)
Graph Neural Networks on Graph Databases [0.0] 本稿では,最小限のデータをメモリに格納し,クエリエンジンを用いてサンプリングすることにより,グラフDB上でGNNを直接トレーニングする方法を示す。
我々のアプローチでは、GNNのスケーリングの新しい方法と、グラフDBの新しいアプリケーション領域が開きます。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 08:39:24 GMT)
Graph Artificial Intelligence for Quantifying Compatibility Mechanisms in Traditional Chinese Medicine [0.0] 我々は,従来のTCM理論と現代生物医学科学を橋渡しする知識グラフを開発した。
本研究は,解釈可能なモデル,オープンソースデータ,コードを用いて,TCM理論の進歩と薬物発見のための堅牢なツールを提供する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 11:16:13 GMT)
Generative Spatio-temporal GraphNet for Transonic Wing Pressure Distribution Forecasting [0.0] このフレームワークは、オートエンコーダを用いて、高次元の圧力分布データを低次元の潜在空間に圧縮する。
グラフベースの時間層は、過去のデータに基づいて将来の翼圧力を予測するために使用される。
提案フレームワークの有効性は,Benchmark Super critical Wingテストケースへの適用を通じて検証される。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:10:20 GMT)
Generalizing Bell nonlocality without global causal assumptions [0.0] ベルシナリオは、パーティ間の通信を除外するマルチパーティシナリオである。
このようなシナリオにおける相関の非古典性の概念であるアンチノミティ(Antinomicity)を導入する。
相関集合の厳密な階層構造の存在を証明する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:21:12 GMT)
From Spectra to Geography: Intelligent Mapping of RRUFF Mineral Data [0.0] 我々は1次元のConvNeXt1Dニューラルネットワークアーキテクチャを用いて、スペクトル信号のみに基づいてミネラルスペクトルを分類する。
処理されたデータセットは、101か国にまたがる32,900以上の鉱物サンプルからなる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:15:00 GMT)
Flying Spin Qubits in Quantum Dot Arrays Driven by Spin-Orbit Interaction [0.0] 内在的なスピン軌道相互作用(SOI)により、ホールスピン量子ビットは高速な量子演算を約束する。
我々は,SOIが媒介するフライングスピン量子ビットについて,短絡による断熱プロトコルを用いて検討する。
電場操作はSOIの動的制御を可能にし、同時に量子ゲートの実装を可能にする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 18:22:36 GMT)
Fine-Tuning a Time Series Foundation Model with Wasserstein Loss [0.0] クロスエントロピー損失をワッサーシュタイン損失に置き換えることで,点推定が大幅に向上することを示す。
その結果, クロスエントロピー損失をワッサーシュタイン損失に置き換えることにより, 点推定が大幅に向上することが示唆された。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:00:32 GMT)
Feynman's Relativistic Cut-Off for Quantum Electrodynamics [0.0] ファインマンの電磁力学への修正は、ポドルスキーによって開発されたハミルトン的アプローチと同値であることが示されている。
自由スピン=frac12$粒子の自己エネルギーの計算は、自由スピン=0粒子の自己エネルギーの計算にも適用可能である。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 04:35:32 GMT)
Fast and Automated Optical Polarization Compensation of Fiber Unitaries [0.0] 液晶を用いた高速かつ自動化された偏光補償法を提案する。
このアプローチは、回転する四分波板に基づく偏光測定と液晶セルの高速制御を組み合わせ、多種多様な用途に適した高忠実度補償を提供する。
本手法は, 平均6回未満で99%以上の忠実度を達成し, 99.5%以上の忠実度にさらに微調整を行う。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:20:32 GMT)
Fast Kernel Summation in High Dimensions via Slicing and Fourier Transforms [0.0] カーネルベースの手法は機械学習で多用されている。
彼らは考慮されたデータポイントの$O(N2)$複雑さに悩まされる。
近似法を提案し、この複雑さを$O(N)$に削減する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:24:17 GMT)
Fair Generalized Linear Mixed Models [0.0] 機械学習の公正性は、データとモデルの不正確さのバイアスが差別的な決定に結びつかないことを保証することを目的としている。
両問題を同時に処理できるアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 07:34:51 GMT)
FERT: Real-Time Facial Expression Recognition with Short-Range FMCW Radar [0.0] 本研究では、1つの送信(Tx)と3つの受信(Rx)アンテナを備えた短距離周波数変調連続波レーダ(FMCW)を用いたリアルタイム顔認識手法を提案する。
提案手法は人別でリアルタイムに動作し,様々な用途において,低コストのFMCWレーダを効果的な表情認識に活用する可能性を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:48:06 GMT)
Exploring the Potential Role of Generative AI in the TRAPD Procedure for Survey Translation [0.0] 本稿では、生成型AIが調査機器の翻訳にどう役立つかを探索し、評価する。
我々は、ChatGPTを用いたゼロショットプロンプト実験を実施し、生成的AIの言語的聴衆への翻訳が困難である可能性のある質問の特徴を識別する能力を探究する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:53:58 GMT)
Evaluating Synthetic Activations composed of SAE Latents in GPT-2 [0.0] スパースオートエンコーダ(SAE)は、機械的解釈可能性において一般的に用いられる。
最近の研究は、モデルが初期層でアクティベーションを乱すことが、モデルの最終層アクティベーションのステップ関数のような変化をもたらすことを示した。
実際の活性化とSAE潜伏剤からなる合成活性化を比較した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:35:37 GMT)
Ergonomic Design of Computer Laboratory Furniture: Mismatch Analysis Utilizing Anthropometric Data of University Students [0.0] コンピュータ・ラボラトリー・エルゴノミクスを改善するのに適した人文計測に基づく家具次元
調整不能椅子と調整不能椅子の2種類の家具について検討した。
提案した寸法は, 既設の家具と比較して, 男女ともに適合性が高く, ミスマッチ率も低かった。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 23:21:50 GMT)
Encoding of Probability Distributions for Quantum Monte Carlo Using Tensor Networks [0.0] 本稿では, 確率負荷問題に対処する手段として, テンソル-トレインクロス近似 (TT-cross) アルゴリズムを評価した。
本手法が財務分布に与える影響を実証し,TTクロス手法のスケーラビリティと精度を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:37:37 GMT)
Design and Development of a Localized E-Commerce Solution for Students focussing on Economical Sharing [0.0] 本研究は,主に中古品の購入・販売を容易にするために,大学生向けに設計されたローカルWebアプリケーションであるShareSpaceを提案する。
高齢者が残した余剰品やジュニアが経験した不足といった不均衡に対処することで、ShareSpaceはキャンパスエコシステム内での持続可能性と低価格性を促進する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:37:00 GMT)
Deep learning waterways for rural infrastructure development [0.0] 米国における水路の位置を学習するためのコンピュータビジョンモデル(WaterNet)を構築した。
その後、アフリカ大陸の新たな環境に展開します。
私たちのアウトプットは、ここでマップされていない水路構造の詳細を提供します。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:36:05 GMT)
Data-driven model reconstruction for nonlinear wave dynamics [0.0] 複雑な波動媒質における光ウェーブレットの非線形進化ダイナミクスを解析するための解釈可能な機械学習フレームワークを提案する。
我々はスパースレグレッションを用いて、ウェーブパケットエンベロープの力学を正確に記述できるより単純な有効モデルに微視的な離散格子モデルを還元する。
再構成された方程式は、自己中心化や自己焦点化を含む線形分散非線形効果を正確に再現する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:17:10 GMT)
Crystal-field effects in the formation of Wigner-molecule supercrystals in moiré TMD superlattices [0.0] モワール多層MD超格子に対しては、フルコンフィグレーション・インタラクション(FCI)計算が提示される。
2つの新しい物質状態が報告されている: (i) (sliding$ Wigner molecules (WMs) の真に量子力学的な超結晶。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:08:09 GMT)
Covariance-based method for eigenstate factorization and generalized singlets [0.0] 我々は、多体ハミルトニアン$H$の固有状態の正確な分解 $|Psirangle=otimes_p |psi_prangle$ に必要な十分条件を決定するための一般的な手法を導出する。
この形式は、スピン系における正確な二量化とクラスター化条件を導出するために用いられる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:04:08 GMT)
Correlated emission lasing in a single quantum dot embedded inside a bimodal photonic crystal cavity [0.0] 両モードフォトニック結晶キャビティに結合したコヒーレント駆動単一量子ドットにおける相関発光ラシング現象について検討した。
励起子-フォノン相互作用を説明するために、ポーラロン変換マスター方程式を通して非摂動的アプローチを組み込む。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:15:54 GMT)
Cooperative Evolutionary Pressure and Diminishing Returns Might Explain the Fermi Paradox: On What Super-AIs Are Like [0.0] 適応されたアルゴリズムは、例えば銀河を素早く植民地化するアルゴリズムであり、減少するリターンの下での協調と公正性の進化のモデルである。
また、各実体が一定の空間を占有するため、数学的理由から指数的植民地化や複製はできないことも注目されている。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:58:00 GMT)
Compression of Higher Order Ambisonics with Multichannel RVQGAN [0.0] RVQGANニューラルコーディング法のマルチチャネル拡張を提案する。
提案した拡張は、16kbit/sで高品質な16チャンネルのアンビニクスコンテンツを符号化するのに適している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:48:18 GMT)
Coherent States in Gauge Theories: Topological Defects and Other Classical Configurations [0.0] 古典的構成の一貫した量子記述としてコヒーレント状態の定式化を提案する。
重要な洞察の1つは、純粋ゲージ構成のコヒーレントな状態を構築する可能性である。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:35:57 GMT)
Closed-loop multi-step planning with innate physics knowledge [0.0] 入力制御問題としてロボット計画の階層的枠組みを提案する。
このフレームワークを実際のロボットに実装し、概念実証として超越したシナリオでテストする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:15:16 GMT)
Characterizing stable regions in the residual stream of LLMs [0.0] モデル出力が小さいアクティベーション変化に敏感なままであるトランスフォーマーの残ストリーム内の安定領域を同定する。
これらの領域はトレーニング中に出現し、トレーニングの進行やモデルサイズの増加に伴ってより定義される。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:32:32 GMT)
Casimir effect in magnetic dual chiral density waves [0.0] 磁場下での有限密度物質中のディラック場に由来するカシミール効果を理論的に検討する。
特に、磁気二重カイラル密度波(MDCDW)相におけるクォーク場を相互作用するディラック・フェルミオン系の不均一基底状態として重視する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:00:02 GMT)
Benchmarking pre-trained text embedding models in aligning built asset information [0.0] 本研究では、組立資産情報とドメイン固有の技術的概念の整合性を評価するため、最先端のテキスト埋め込みモデルの比較ベンチマークを提案する。
提案した6つのデータセットを対象としたベンチマークの結果は、クラスタリング、検索、再ランク付けの3つのタスクをカバーし、将来のドメイン適応技術の研究の必要性を強調している。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 20:54:17 GMT)
Bayesian optimization of atomic structures with prior probabilities from universal interatomic potentials [0.0] 原子構造の最適化は、望ましい特性を持つ材料を理解し設計する上で重要な役割を果たす。
機械学習駆動サロゲートモデルの最近の進歩は、この計算負担を軽減するための有望な道を提供する。
本稿では,汎用機械学習の強みをベイズ的アプローチと組み合わせた新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:17:25 GMT)
Attention-guided Spectrogram Sequence Modeling with CNNs for Music Genre Classification [0.0] 注意に基づく時間的シグネチャモデリングを用いて音楽ジャンルを分類する革新的なモデルを提案する。
我々のアプローチは各作品の中でもっとも時間的に重要な瞬間を捉え、ジャンル識別のためのユニークな「シグナチャ」を作り上げる。
この研究は、技術的分類タスクと、ジャンルの微妙で人間的な経験のギャップを埋めるものである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 21:57:03 GMT)
Artificial Intelligence Mangrove Monitoring System Based on Deep Learning and Sentinel-2 Satellite Data in the UAE (2017-2024) [0.0] 2024年のUAEのマングローブ面積は約9,142.21ヘクタールであり、2017年と比較して2,061.33ヘクタール増加した。
アブダビはマングローブ面積が最大であり、UAEのマングローブ栽培において主要な役割を担っており、2017年から2024年の間に1,85ヘクタール増加した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 03:37:33 GMT)
Analysis of Hardware Synthesis Strategies for Machine Learning in Collider Trigger and Data Acquisition [0.0] 機械学習は、インテリジェントなデータ処理と取得のために検出器エレクトロニクスに実装することができる。
衝突時のリアルタイムMLの実装には、ソフトウェアベースのアプローチでは実現不可能な非常に低いレイテンシが必要です。
フィールドプログラマブルゲートアレイにおけるコライダートリガーアルゴリズムの適用に着目し,ニューラルネットワークの推論効率の解析を行った。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 15:59:30 GMT)
Analysis of Generalized Hebbian Learning Algorithm for Neuromorphic Hardware Using Spinnaker [0.0] 本稿では,大規模なニューロモルフィックプラットフォーム,特にSpiNNakerにおける一般化ヘビアンアルゴリズム(GHA)の適用例を示す。
本研究は,生物にインスパイアされた学習アルゴリズムの可能性を示すとともに,分類精度の大幅な向上を示すものである。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 13:53:10 GMT)
Advance Detection Of Bull And Bear Phases In Cryptocurrency Markets [0.0] Bitcoinの市場シェアは50%近くだ。
暗号通貨のブルとベアのフェーズは、Bitcoinの50日と200日の移動平均のパフォーマンスに基づいて決定される。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 01:48:16 GMT)
Advacheck at GenAI Detection Task 1: AI Detection Powered by Domain-Aware Multi-Tasking [0.0] 本稿では,GenAI検出タスク1コンペティションのモノリンガルサブタスクにおいて,機械生成テキストと人文テキストを認識できるようにAdvacheckチームが設計したシステムについて述べる。
開発したシステムはマルチタスクアーキテクチャであり,複数の分類ヘッド間で共用トランスフォーマーを備える。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 17:03:30 GMT)
Accelerated quantum search using partial oracles and Grover's algorithm [0.0] グロバーのアルゴリズム(英: Grover's algorithm)は、順序のないデータベースを探索する手段として考案されたアルゴリズムであり、量子計算によって生成される結果集合から解を抽出するためにも用いられる。
マッチング条件の各ビットに個別のオラクルを関連付け、独立にテスト可能な複数の部分的なオラクル関数を得るという考え方を探求する。
アルゴリズムは最も単純な検索シナリオに対して検証され、入力されたインデックスビットは置換演算を用いてスクランブルされる。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 16:50:10 GMT)
A Scalable Training Strategy for Blind Multi-Distribution Noise Removal [0.0] 本稿では適応サンプリング/アクティブラーニング戦略を用いたネットワークの学習手法を提案する。
本研究は, 真の仕様空間の近似を組み込むことにより, 最近提案されたユニバーサルデノイザトレーニング戦略を改善した。
本手法はポアソン・ガウス・スペックル共振器の共振器雑音のシミュレーション実験を行い,提案手法を用いることで,単一ブラインド型一般雑音器ネットワークが一様有界な特定雑音器ネットワーク内でピーク信号-雑音比を達成できることを実証する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 05:09:42 GMT)
A Recursive Lower Bound on the Energy Improvement of the Quantum Approximate Optimization Algorithm [0.0] 我々は、遷移状態に関するコスト関数の解析的拡張を用いて、深いQAOAに関する洞察を得る。
計算の結果, 得られたQAOAコスト関数の有界値と真値が, 層数$p$に比例して指数関数的に減少していることが判明した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 14:13:35 GMT)
A Novel Speech Analysis and Correction Tool for Arabic-Speaking Children [0.0] 本稿では、発音に問題を抱えるアラビア語の子供を対象に、ArPAという新しいアプリケーションを紹介した。
本アプリケーションは診断モジュールと治療モジュールの2つの重要なコンポーネントから構成される。
診断プロセスでは、子供の音声信号をキャプチャし、前処理し、K-Nearest Neighbors(KNN)、Support Vector Machine(SVM)、Decision Treesといったさまざまな機械学習分類器を使用して分析する。
治療モジュールは、それぞれの正しく話された文字がより高いアバターレベルを獲得し、子供の発音改善に肯定的な強化を与える、アイキャッチ・ギャミファイドインターフェースを提供する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 09:43:40 GMT)
A New Genuine Multipartite Entanglement Measure: from Qubits to Multiboundary Wormholes [0.0] 量子系における真の多重粒子絡みを特徴付ける新しい尺度として、潜在エントロピー(L-エントロピー)を導入する。
本研究は,多粒子状態絡み合いモノトンとして機能し,混合多粒子状態への拡張を短時間で行うことを実証する。
特に、$n geq 5$の場合、最大多部絡みを持つ2-一様状態に近いランダム状態を示す。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:00:03 GMT)
A Neural Network Training Method Based on Distributed PID Control [0.0] 前回の記事では、対称微分方程式に基づくニューラルネットワークフレームワークを紹介した。
そこで本研究では,チェーンルールの導出ではなく,微分方程式信号の伝搬を利用した学習手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 19:25:26 GMT)
A Modular Open Source Framework for Genomic Variant Calling [0.0] 本稿では、DeepVariantの畳み込みニューラルネットワーク(CNN)アーキテクチャを活用して、変分検出を改善する可変呼び出しパイプラインを提案する。
われわれの研究は、DeepChemフレームワークにモジュラーおよび変種呼び出しフレームワークを追加し、DeepChemの薬物発見インフラをバイオインフォマティクスパイプラインとより緊密に統合する将来の作業を可能にする。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 12:21:48 GMT)
A Hybrid Approach for COVID-19 Detection: Combining Wasserstein GAN with Transfer Learning [0.0] 我々は、後にディープラーニングモデルに入力された画像を合成して、COVID-19、ノーマル、ウイルス肺炎の画像の分類を行うGANベースのアプローチを提案する。
この拡張データセットを使用して、VGG-16、ResNet-50、GoogLeNet、MNASTの4つの提案されたディープラーニングモデルをトレーニングする。
VGG-16は4つの計画の中で99.17%の精度を達成した。
論文参考訳(メタデータ) (Mon, 18 Nov 2024 10:53:24 GMT)