The Art of Saying No: Contextual Noncompliance in Language Models [123.4] 本稿では,ユーザの要求に従わないモデルについて,コンテキスト非準拠の包括的分類を導入する。
我々の分類は、不完全、不完全、不完全、不決定、人為的要求を含む幅広いカテゴリーにまたがる。
言語モデルの非準拠性をテストするために,1000個の非準拠プロンプトの新たな評価スイートを開発するために,この分類法を用いる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:48:57 GMT)
MME-Survey: A Comprehensive Survey on Evaluation of Multimodal LLMs [97.9] MLLM(Multimodal Large Language Models)は、産業と学術の両方から注目を集めている。
開発プロセスでは、モデルの改善に関する直感的なフィードバックとガイダンスを提供するため、評価が重要である。
この研究は、研究者に異なるニーズに応じてMLLMを効果的に評価する方法を簡単に把握し、より良い評価方法を促すことを目的としている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:59:54 GMT)
MambaIRv2: Attentive State Space Restoration [96.4] 本稿では,空間復元モデルに到達するために,MambaとViTsに似た非因果モデリング能力を備えたMambaIRv2を提案する。
具体的には、提案された注意状態空間方程式は、スキャンされたシーケンスを超えることができ、単一のスキャンで画像の展開を容易にする。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 12:45:12 GMT)
TÜLU 3: Pushing Frontiers in Open Language Model Post-Training [94.1] 我々は、完全にオープンな最先端の訓練後モデルであるT"ULU 3を紹介する。
T"ULU 3はLlama 3.1ベースモデルをベースにしており、Llama 3.1、Qwen 2.5、Mistral、さらにGPT-4o-mini、Claude 3.5-Haikuといったクローズドモデルにも勝っている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:44:04 GMT)
SEP: Self-Enhanced Prompt Tuning for Visual-Language Model [93.9] SEP(Self-Enhanced Prompt Tuning)という新しいアプローチを導入する。
SEPは、テキストレベルの埋め込みと視覚レベルの埋め込みの両方を強化するために、差別的な事前知識を明示的に取り入れている。
様々なベンチマークやタスクの総合的な評価は、プロンプトチューニングにおけるSEPの有効性を確認している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 06:33:23 GMT)
Efficient Long Video Tokenization via Coordinated-based Patch Reconstruction [93.7] CoordTokは、座標ベースの表現から入力ビデオの対応するパッチへのマッピングを学ぶビデオトークンである。
CoordTokは、ビデオを分解された三面体表現にエンコードし、ランダムにサンプリングされた$(x,y,t)$座標に対応するパッチを再構築する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 06:50:44 GMT)
DepthSplat: Connecting Gaussian Splatting and Depth [90.1] ガウススプラッティングと深さ推定を結合するDepthSplatを提案する。
まず,事前学習した単眼深度特徴を生かして,頑健な多眼深度モデルを提案する。
また,ガウス的スプラッティングは教師なし事前学習の目的として機能することを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:34:19 GMT)
Unveil Benign Overfitting for Transformer in Vision: Training Dynamics, Convergence, and Generalization [88.6] 本研究では, ソフトマックスを用いた自己保持層と, 勾配勾配下での完全連結層からなるトランスフォーマーの最適化について検討した。
この結果から,データモデルにおける信号対雑音比に基づいて,小さなテストエラー位相と大規模なテストエラー状態とを区別できるシャープ条件を確立した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:24:39 GMT)
3D Convex Splatting: Radiance Field Rendering with 3D Smooth Convexes [87.0] 3D Splatting (3DGS) による3Dラディアンス分野の最近の進歩は, 合成プリミティブを用いたシーンの表現により, 高品質な新規なビューを実現している。
本研究では,3次元凸凸場を利用した3次元凸法(3DCS)を提案する。
本研究は,3Dコンベクシングの新たなページ再構築標準としての可能性を強調した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:31:39 GMT)
Anti-Forgetting Adaptation for Unsupervised Person Re-identification [87.0] デュアルレベル・ジョイント・アダプテーションとアンチフォゲッティング・フレームワークを提案する。
ソースドメインと各適用対象ドメインを忘れることなく、モデルを新しいドメインに漸進的に適応させる。
提案手法は、教師なしのReIDモデルのアンチフォッゲッティング、一般化、後方互換性能力を大幅に改善する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:05:06 GMT)
Conditional Text-to-Image Generation with Reference Guidance [82.0] 本稿では,拡散モデルを生成するために,特定の対象の視覚的ガイダンスを提供する画像の追加条件を用いて検討する。
我々は、異なる参照を取る能力を持つ安定拡散モデルを効率的に支持する、小規模のエキスパートプラグインを複数開発する。
専門的なプラグインは、すべてのタスクにおいて既存のメソッドよりも優れた結果を示し、それぞれ28.55Mのトレーニング可能なパラメータしか含まない。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 21:38:51 GMT)
Constrained Diffusion Models via Dual Training [80.0] 拡散プロセスは、トレーニングデータセットのバイアスを反映したサンプルを生成する傾向がある。
所望の分布に基づいて拡散制約を付与し,制約付き拡散モデルを構築する。
本稿では,制約付き拡散モデルを用いて,目的と制約の最適なトレードオフを実現する混合データ分布から新しいデータを生成することを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:41:58 GMT)
Interpreting the Weight Space of Customized Diffusion Models [79.1] 微調整拡散モデルの重み空間は、新しいモデルを生成する解釈可能なメタラテント空間として振る舞うことができることを示す。
この結果から,微調整拡散モデルの重み空間は,新しいモデルを生成する解釈可能なメタラテント空間として振る舞うことが示唆された。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:12:30 GMT)
KBAda: Efficient Self Adaptation on Specific Knowledge Bases [75.8] 大規模言語モデル(LLM)は通常、知識材料を瞬時に活用するために、検索強化世代に依存している。
KBAdaは,知識ベースを含む下流タスクへの効率的な適応を目的とした手法である。
提案手法は,Q&Aペアやリビジョン提案などの自己注釈付きデータを用いて反復学習を行い,モデルが知識内容を効率的に把握できるようにする。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:21:03 GMT)
Leveraging Hallucinations to Reduce Manual Prompt Dependency in Promptable Segmentation [74.0] 本稿では,プロペラジェネレータとマスクジェネレータを備えたProMaC(Prompt-Mask Cycle Generation framework)を提案する。
プロンプトジェネレータは、最初は、テストイメージ上で拡張された文脈知識を抽出するための幻覚を探究する、複数スケールの思考プロンプトの連鎖を使用する。
生成されたマスクは、プロンプトジェネレータを反復的にタスク関連の画像領域に集中させ、無関係な幻覚を減らし、より良いプロンプトとマスクを共同で生成する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:27:31 GMT)
CustAny: Customizing Anything from A Single Example [73.9] 10kカテゴリにわたる315kのテキストイメージサンプルを特徴とする,汎用オブジェクトの大規模なデータセットを構築するための新しいパイプラインを提案する。
MC-IDCの助けを借りて、汎用オブジェクトの柔軟なテキスト編集をサポートするゼロショットフレームワークであるCustomizing Anything (CustAny)を紹介した。
当社のコントリビューションには、大規模なデータセット、CustAnyフレームワーク、新しいID処理などが含まれています。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 09:31:14 GMT)
Spectrum Breathing: Protecting Over-the-Air Federated Learning Against Interference [73.6] モバイルネットワークは、近隣のセルやジャマーからの干渉によって損なわれる可能性がある。
本稿では,帯域幅拡大を伴わない干渉を抑制するために,カスケード段階のプルーニングとスペクトル拡散を行うスペクトルブリーチングを提案する。
呼吸深度によって制御された勾配プルーニングと干渉誘発誤差の間には,性能的トレードオフが認められた。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 04:27:10 GMT)
FitDiT: Advancing the Authentic Garment Details for High-fidelity Virtual Try-on [73.1] Diffusion Transformer (DiT) を用いた高忠実度仮想試行用ガーメント知覚増強技術FitDiT
布地テクスチャ抽出装置を導入し, 布地や模様, テクスチャなどのリッチな細部を, よりよく捉えられるようにした。
また,クロスカテゴリー試着中にマスク領域全体を埋める衣服の発生を防止し,衣料の正しい長さに適応する拡張緩和マスク戦略を採用した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:19:48 GMT)
Whats in a Video: Factorized Autoregressive Decoding for Online Dense Video Captioning [71.9] ビデオの高密度キャプションを生成するための,効率的なオンライン手法を提案する。
我々のモデルは、新しい自己回帰因子化復号化アーキテクチャを使用している。
提案手法は,オフライン手法とオンライン手法の両方と比較して優れた性能を示し,計算コストを20%削減する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:46:44 GMT)
Who Can Withstand Chat-Audio Attacks? An Evaluation Benchmark for Large Language Models [71.0] アドリヤル音声攻撃は、音声に基づく人間と機械の相互作用において、大きな言語モデル(LLM)の増大に重大な脅威をもたらす。
本稿では,4種類の音声攻撃を含むChat-Audio Attacksベンチマークを紹介する。
Gemini-1.5-Pro や GPT-4o など,音声対話機能を備えた6つの最先端 LLM の評価を行った。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:30:48 GMT)
AtomThink: A Slow Thinking Framework for Multimodal Mathematical Reasoning [71.0] AtomThinkは、長い思考の連鎖(CoT)をステップバイステップで構築するフレームワークであり、複雑な推論を行うためのMLLMを導く。
AtomMATHは、長いCoTの大規模マルチモーダルデータセットであり、数学的タスクの原子能力評価指標である。
AtomThinkはベースラインMLLMの性能を大幅に改善し、MathVistaでは50%、MathVerseでは120%の精度向上を実現している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:24:15 GMT)
Exploring the Adversarial Vulnerabilities of Vision-Language-Action Models in Robotics [70.9] 本稿では,VLAに基づくロボットシステムのロバスト性を体系的に評価する。
本研究では,ロボット行動の不安定化に空間的基盤を活用する,標的のない位置認識型攻撃目標を提案する。
また、カメラの視野内に小さなカラフルなパッチを配置し、デジタル環境と物理環境の両方で効果的に攻撃を実行する逆パッチ生成アプローチを設計する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:16:40 GMT)
TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior [70.8] 我々は、標準定義地図(SDMaps)を見るために知覚モデルを訓練することを提案する。
我々はSDMap要素をニューラル空間マップ表現やインスタンストークンにエンコードし、先行情報のような補完的な特徴を組み込む。
レーンセグメント表現フレームワークに基づいて、モデルはレーン、中心線、およびそれらのトポロジを同時に予測する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 06:13:42 GMT)
Data Diet: Can Trimming PET/CT Datasets Enhance Lesion Segmentation? [70.4] 我々はAutoPET3データ中心のトラックで競合するアプローチについて述べる。
AutoPETIIIデータセットでは、データセット全体をトレーニングしたモデルが望ましくない特性を示す。
我々は、スクラッチから再トレーニングする前に、モデル損失によって測定されたトレーニングデータセットから最も簡単なサンプルを取り除き、これを対処する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 12:43:37 GMT)
Multi-granularity Interest Retrieval and Refinement Network for Long-Term User Behavior Modeling in CTR Prediction [68.9] クリックスルーレート(CTR)の予測は、オンラインパーソナライズプラットフォームにとって不可欠である。
近年の進歩は、リッチなユーザの振る舞いをモデル化することで、CTR予測の性能を大幅に改善できることを示している。
マルチグラニュラリティ興味検索ネットワーク(MIRRN)を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:29:05 GMT)
OminiControl: Minimal and Universal Control for Diffusion Transformer [68.3] OminiControlは、イメージ条件をトレーニング済みのDiffusion Transformer(DiT)モデルに統合するフレームワークである。
コアとなるOminiControlはパラメータ再利用機構を活用しており、強力なバックボーンとしてイメージ条件をエンコードすることができる。
OminiControlは、主観駆動生成や空間的に整合した条件を含む、幅広いイメージコンディショニングタスクを統一的に処理する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:55:15 GMT)
Any-to-3D Generation via Hybrid Diffusion Supervision [67.5] XBindは、クロスモーダルな事前アライメント技術を用いた、任意の3D生成のための統一されたフレームワークである。
XBindは、任意のモダリティから3Dオブジェクトを生成するために、事前訓練された拡散モデルとマルチモーダル整列エンコーダを統合する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:52:37 GMT)
Speech2UnifiedExpressions: Synchronous Synthesis of Co-Speech Affective Face and Body Expressions from Affordable Inputs [67.3] 本稿では,デジタル文字の表情と上半身ジェスチャーを同時に合成するマルチモーダル学習手法を提案する。
提案手法は, 映像データから直接推定される, まばらな顔のランドマークと上体関節から学習し, もっともらしい感情的性格運動を生成する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:41:58 GMT)
Zeroth-Order Fine-Tuning of LLMs in Random Subspaces [66.3] 言語モデルのサイズが大きくなるにつれて、バックプロパゲーションに対するメモリ要求が増加する。
Zeroth-order (ZOZO) 最適化手法はメモリ効率の代替手段を提供する。
本稿では,SubZeroがファインチューニングを強化し,通常のZOZO手法と比較して高速な結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:08:59 GMT)
Gradient Masking All-at-Once: Ensemble Everything Everywhere Is Not Robust [66.0] あらゆるものをアンサンブルすることは、敵の例に対する防御である。
この防御は敵の攻撃に対して堅牢ではないことを示す。
次に、標準的なアダプティブアタック技術を用いて、防御の堅牢な精度を低下させる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:17:32 GMT)
Point Cloud Understanding via Attention-Driven Contrastive Learning [64.7] トランスフォーマーベースのモデルは、自己認識機構を活用することにより、先進的なポイントクラウド理解を持つ。
PointACLは、これらの制限に対処するために設計された、注意駆動のコントラスト学習フレームワークである。
本手法では, 注意駆動型動的マスキング手法を用いて, モデルが非集中領域に集中するように誘導する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:41:00 GMT)
One-Shot Safety Alignment for Large Language Models via Optimal Dualization [64.5] 本稿では,制約付きアライメントを等価な非制約アライメント問題に還元する双対化の観点を提案する。
我々は、閉形式を持つ滑らかで凸な双対函数を事前に最適化する。
我々の戦略は、モデルベースと嗜好ベースの設定における2つの実用的なアルゴリズムに導かれる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:55:58 GMT)
FedMLLM: Federated Fine-tuning MLLM on Multimodal Heterogeneity Data [64.5] フェデレートラーニング(FL)による微調整型マルチモーダル大言語モデル(MLLM)は、プライベートデータソースを含めることで、トレーニングデータの範囲を拡大することができる。
マルチモーダルなヘテロジニアスシナリオにおけるMLLMのファインチューニングにおける様々なダウンストリームタスクを評価するためのベンチマークを提案する。
我々は,2つのモダリティに依存しない戦略とともに,4つの代表的FL手法を統合する汎用FedMLLMフレームワークを開発した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 04:09:23 GMT)
VideoRepair: Improving Text-to-Video Generation via Misalignment Evaluation and Localized Refinement [63.4] VideoRepairは、モデルに依存しない、トレーニングなしのビデオリファインメントフレームワークである。
微粒なテキストビデオの誤りを特定し、明示的な空間的およびテキスト的フィードバックを生成する。
VideoRepairは、テキストとビデオのアライメントの指標で、最近のベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:31:47 GMT)
TEXGen: a Generative Diffusion Model for Mesh Textures [63.4] 我々は、UVテクスチャ空間自体における学習の根本的な問題に焦点を当てる。
本稿では,点クラウド上にアテンション層を持つUVマップ上の畳み込みをインターリーブするスケーラブルなネットワークアーキテクチャを提案する。
テキストプロンプトとシングルビュー画像によって導かれるUVテクスチャマップを生成する7億のパラメータ拡散モデルを訓練する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:22:11 GMT)
MovieBench: A Hierarchical Movie Level Dataset for Long Video Generation [62.9] 長いビデオ生成モデルの分析、評価、トレーニングに適したデータセットは公開されていない。
The MovieBench: A Hierarchical Movie-Level dataset for Long Video Generation。
データセットは公開され、継続的に維持され、長いビデオ生成の分野を前進させることを目的としている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:25:08 GMT)
From Novice to Expert: LLM Agent Policy Optimization via Step-wise Reinforcement Learning [62.5] 本稿では,エージェントの強化学習プロセスの最適化にステップワイド報酬を利用するStepAgentを紹介する。
エージェント反射とポリシー調整を容易にする暗黙の逆・逆の強化学習手法を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:24:44 GMT)
VideoEspresso: A Large-Scale Chain-of-Thought Dataset for Fine-Grained Video Reasoning via Core Frame Selection [61.5] 空間的詳細と時間的コヒーレンスを保持するビデオQAペアを特徴とする,新しいデータセットであるVideoEspressoを紹介する。
GPT-4o を用いた QA ペア生成にあたり, 冗長性を抑えるためにセマンティック・アウェア法を用いて構成パイプラインを構築した。
フレームセレクタと2段階の命令微調整推論LVLMを備えたハイブリッドLVLM協調フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:33:36 GMT)
SlimLM: An Efficient Small Language Model for On-Device Document Assistance [61.0] SlimLMはモバイル端末上での文書支援タスクに最適化された一連のSLMである。
SlimLMはSlimPajama-627Bで事前訓練され、DocAssistで微調整されている。
我々はSlimLMを既存のSLMと比較し、同等または優れた性能を示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 06:44:22 GMT)
STEP: Spatial Temporal Graph Convolutional Networks for Emotion Perception from Gaits [60.4] 歩行から知覚された人間の感情を分類するために,STEPと呼ばれる新しいネットワークを提案する。
私たちは何百もの注釈付き現実世界のゲイトビデオを使って、何千もの注釈付き合成ゲイトでそれらを強化しています。
STEPは感情の特徴を学習でき、E-Gaitでは89%の分類精度を示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:59:33 GMT)
Derivative-Free Diffusion Manifold-Constrained Gradient for Unified XAI [60.0] 微分自由拡散多様体制約勾配(FreeMCG)を導入する。
FreeMCGは、与えられたニューラルネットワークの説明可能性を改善する基盤として機能する。
提案手法は,XAIツールが期待する本質性を保ちながら,最先端の成果が得られることを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:15:14 GMT)
Hokoff: Real Game Dataset from Honor of Kings and its Offline Reinforcement Learning Benchmarks [59.5] 我々は、オフラインのRLとオフラインのMARLをカバーする、事前コンパイルされたデータセットの包括的なセットであるHokoffを提案する。
このデータは、Multiplayer Online Battle Arena(MOBA)ゲームとして認知されているHonor of Kingsに由来する。
また,ゲーム固有の階層的アクション空間に適した,新しいベースラインアルゴリズムを導入する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:46:30 GMT)
About Time: Advances, Challenges, and Outlooks of Action Understanding [57.8] この調査は、様々なタスクにおけるユニモーダルおよびマルチモーダルな行動理解の進歩を包括的にレビューする。
我々は,現在普及している課題,広く採用されているデータセットの概要,そして最近の進歩を重視したセミナー作品の調査に焦点をあてる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:09:27 GMT)
Take an Emotion Walk: Perceiving Emotions from Gaits Using Hierarchical Attention Pooling and Affective Mapping [55.7] 本稿では、ビデオやモーションキャプチャーデータから得られた歩行スタイルから、知覚された人間の感情を分類するためのオートエンコーダに基づくアプローチを提案する。
3次元ポーズシーケンスから抽出した各ステップのポーズにおける各関節の動きを考慮し、これらの関節の動きをエンコーダに階層的にプールする。
我々はデコーダを訓練し、潜伏埋め込みからトップダウン方式で1ステップ当たりの関節の動きを再構築する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:51:03 GMT)
Self-Ensembling Gaussian Splatting for Few-Shot Novel View Synthesis [55.6] 3D Gaussian Splatting (3DGS) は新規ビュー合成(NVS)に顕著な効果を示した
しかし、3DGSモデルはスパースポーズビューで訓練すると過度に適合する傾向にあり、その一般化能力は新規ビューに制限される。
オーバーフィッティング問題を緩和するために,Self-Ensembling Gaussian Splatting (SE-GS) アプローチを提案する。
提案手法は,NVSの品質向上に寄与し,既存の最先端手法よりも優れる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:39:59 GMT)
Cell as Point: One-Stage Framework for Efficient Cell Tracking [54.2] 本稿では,一段階の効率的なセルトラッキングを実現するために,新しいエンドツーエンドCAPフレームワークを提案する。
CAPは検出またはセグメンテーション段階を放棄し、細胞点の軌跡間の相関を利用して細胞を共同で追跡することでプロセスを単純化する。
Capは強力なセルトラッキング性能を示し、既存の方法の10倍から55倍の効率を示している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:16:35 GMT)
Large Language Models for Lossless Image Compression: Next-Pixel Prediction in Language Space is All You Need [53.6] 前例のないインテリジェンスを持つ言語大モデル(LLM)は、様々なデータモダリティのための汎用ロスレス圧縮機である。
P$2$-LLMは,様々な入念な洞察と方法論を統合した次世代の予測型LLMである。
ベンチマークデータセットの実験では、P$2$-LLMがSOTAの古典的および学習的コーデックに勝ることを示した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:31:13 GMT)
Show Me What I Like: Detecting User-Specific Video Highlights Using Content-Based Multi-Head Attention [52.8] そこで本稿では,従来視聴したビデオに表示されていたハイライトクリップに基づいて,対象ビデオの個別化ハイライトを検出する手法を提案する。
本手法は,対象物と人的活動の事前学習機能を用いて,好むクリップの内容と対象ビデオの両方を明示的に活用する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:47:22 GMT)
HighlightMe: Detecting Highlights from Human-Centric Videos [52.8] 我々は,人間中心のビデオからハイライト可能な抜粋を検出するために,ドメインとユーザに依存しないアプローチを提案する。
本研究では,時空間グラフ畳み込みを用いたオートエンコーダネットワークを用いて,人間の活動やインタラクションを検出する。
我々は,最先端の手法に比べて,人手によるハイライトのマッチングの平均精度が4~12%向上したことを観察した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:49:52 GMT)
Physical Layer Deception with Non-Orthogonal Multiplexing [52.1] 本稿では,ワイヤタッピングの試みに積極的に対処する物理層騙し(PLD)の枠組みを提案する。
PLDはPLSと偽装技術を組み合わせることで、積極的に盗聴の試みに対処する。
本研究では,PLDフレームワークの有効性を詳細な分析で証明し,従来のPLS手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 21:07:35 GMT)
Real-world Image Dehazing with Coherence-based Label Generator and Cooperative Unfolding Network [50.3] 実世界のイメージデハジングは、実世界の設定におけるヘイズによる劣化を軽減することを目的としている。
本研究では,大気散乱と画像シーンを協調的にモデル化する,協調的展開ネットワークを提案する。
また,コヒーレンスに基づくラベルジェネレータと呼ばれるRID指向の反復型平均教師フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:23:26 GMT)
SymDPO: Boosting In-Context Learning of Large Multimodal Models with Symbol Demonstration Direct Preference Optimization [49.9] 研究者は、インコンテキスト学習機能を備えた大規模マルチモーダルモデルを開発する技術を開発した。
既存のLMMは、マルチモーダルなデモンストレーションで視覚的コンテキストを効果的に活用せず、単にテキストパターンに従う。
本稿では,マルチモーダルな実演構築の伝統的なパラダイムを破るために,記号記述直接選好最適化(SymDPO)を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:34:15 GMT)
Third quantization with Hartree approximation for open-system bosonic transport [49.2] 定常状態における弱い相互作用を持つ開系ボソニックリンドブラッド方程式を解くための自己整合形式論を提案する。
本手法により, コールド原子実験に関連する相互作用ボゾン系における量子輸送の大規模系の挙動を解析し, 予測することができる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 01:36:54 GMT)
LayoutDiT: Exploring Content-Graphic Balance in Layout Generation with Diffusion Transformer [46.7] 我々は、高品質で視覚的に魅力的なレイアウトを生成するために、コンテンツとグラフィック機能のバランスをとるフレームワークを導入する。
具体的には、レイアウト生成空間に対するモデルの認識を最適化する適応係数を設計する。
また、視覚領域における画像と幾何学パラメータ領域におけるレイアウトのモダリティ差を橋渡しするために、図形条件であるサリエンシ境界ボックスを導入する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:07:46 GMT)
SafeguardGS: 3D Gaussian Primitive Pruning While Avoiding Catastrophic Scene Destruction [45.7] 本稿では, 3DGSプルーニング技術を, Scene-level pruning と Pixel-level pruning の2つのタイプに分類した。
実験により、ピクセルレベルのプルーニングはプルーニングの固有の境界、すなわちガウス的プルーニングの保護を与えることが示された。
我々は,今後の研究に3DGSを最適化するための貴重な洞察を提供すると考えている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 23:43:24 GMT)
Large Multi-modal Models Can Interpret Features in Large Multi-modal Models [45.5] まず、スパースオートエンコーダを用いて表現を人間の理解可能な特徴に分解する。
LMM自体がSAEで学んだオープンセマンティックな特徴を解釈するための自動解釈フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:41:36 GMT)
Addressing a fundamental limitation in deep vision models: lack of spatial attention [43.4] この写本の目的は、現在の深層学習モデル、特に視覚モデルにおいて重要な限界を強調することである。
人間の視覚とは異なり、深層視覚モデルは画像全体を処理する。
我々は、次世代のより効率的な視覚モデルに道を開く2つのソリューションを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:56:30 GMT)
Multi-Branch Generative Models for Multichannel Imaging with an Application to PET/CT Synergistic Reconstruction [43.0] 本稿では,マルチブランチ生成モデルを用いた医用画像の相乗的再構築のための新しい手法を提案する。
我々は,MNIST (Modified National Institute of Standards and Technology) とPET (positron emission tomography) とCT (Computed tomography) の2つのデータセットに対するアプローチの有効性を実証した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:42:10 GMT)
Efficient Eigenstate Preparation in an Integrable Model with Hilbert Space Fragmentation [42.4] 量子回路を用いたスピン鎖の固有状態の合成について検討する。
我々は、粒子間の相互作用が十分に単純である相互作用モデルにおいても、成長の成果が得られていることを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:57:08 GMT)
LIBER: Lifelong User Behavior Modeling Based on Large Language Models [42.0] 大規模言語モデルに基づく生涯ユーザ行動モデリング(LIBER)を提案する。
LIBERはHuaweiの音楽レコメンデーションサービスにデプロイされ、ユーザーの再生回数と再生時間の3.01%と7.69%を大幅に改善した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:43:41 GMT)
Measuring Bullshit in the Language Games played by ChatGPT [41.9] 生成的大言語モデル(LLM)は真理値と直接対応しないテキストを生成する。
LLMはフランクフルトの有名なモノグラフOn Bullshitに記述されている言語に類似している。
ブルジットの言語統計モデルは、ブルジットの政治・職場機能とフランクフルト人の人工ブルジットを確実に関連付けることができることを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:55:21 GMT)
Style-Friendly SNR Sampler for Style-Driven Generation [41.6] 参照画像による微調整は最も有望な手法であるが、しばしば事前訓練に使用する目標と雑音レベルの分布を盲目的に利用する。
本研究では,SNR分布を微調整時に高雑音レベルに積極的にシフトさせるSNRサンプリング器を提案する。
これにより、モデルは独自のスタイルをキャプチャし、より高いスタイルアライメントで画像を生成することができる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:29:25 GMT)
RED: Effective Trajectory Representation Learning with Comprehensive Information [41.6] トラジェクティブ表現学習(TRL)は、様々な下流タスクに使用できるベクトルにトラジェクトリをマッピングする。
本稿では,複数のトラジェクトリ情報を効果的に活用する自己教師型TRLフレームワークREDを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:51:21 GMT)
Grid and Road Expressions Are Complementary for Trajectory Representation Learning [40.9] トラジェクトリ表現学習(TRL)は、多くの下流タスクに使用できるベクトルにトラジェクトリをマッピングする。
既存のTRL法では、グリッドトラジェクトリ、自由空間における移動のキャプチャー、道路トラジェクトリ、道路ネットワークにおける移動のキャプチャーのいずれかを入力として使用する。
GREENと呼ばれる新しいマルチモーダルTRL手法を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 07:15:46 GMT)
Delving into the Reversal Curse: How Far Can Large Language Models Generalize? [40.6] 大きな言語モデル(LLM)は、一見自明なタスクに直面しているときに制限を示す。
主要な例として、最近議論された「逆の呪い」があり、これはモデルが「AはBである」という事実に基づいて訓練されたとき、この知識を一般化して「BはAである」と推測するのに苦労している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 09:00:10 GMT)
Boosting Weakly-Supervised Referring Image Segmentation via Progressive Comprehension [40.2] 本稿では、画像とテキストのペアから直接ターゲットのローカライゼーションを学習する、困難な設定に焦点を当てる。
そこで本研究では,対象対象対象の局所化にターゲット関連テキストキューを活用する新しいプログレッシブネットワーク(PCNet)を提案する。
本手法は3つのベンチマークでSOTA法より優れている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 04:32:55 GMT)
Event USKT : U-State Space Model in Knowledge Transfer for Event Cameras [40.2] イベントカメラは、消費電力の削減やフレームレートの向上など、従来のRGBカメラよりも明確な利点がある。
イベント・ツー・RGBの知識伝達のためのU字型状態空間モデル知識伝達フレームワークを提案する。
このフレームワークは、RGBフレームと互換性のある入力を生成し、イベントデータがトレーニング済みのRGBモデルを効果的に再利用できるようにする。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:13:23 GMT)
Free Energy Projective Simulation (FEPS): Active inference with interpretability [40.1] FEP(Free Energy Projective Simulation)とAIF(Active Inference)は、多くの成功を収めている。
最近の研究は、最新の機械学習技術を取り入れた複雑な環境におけるエージェントの性能向上に重点を置いている。
ディープニューラルネットワークを使わずに解釈可能な方法でエージェントをモデル化するための自由エネルギー射影シミュレーション(FEPS)を導入する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:01:44 GMT)
HeadRouter: A Training-free Image Editing Framework for MM-DiTs by Adaptively Routing Attention Heads [39.9] Headは、MM-DiTの異なるアテンションヘッドにテキストガイダンスを適応的にルーティングすることで、ソースイメージを編集する、トレーニング不要の画像編集フレームワークである。
テキスト/画像のトークン表現を洗練し,正確な意味指導と正確な領域表現を行う。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:08:03 GMT)
Material Anything: Generating Materials for Any 3D Object via Diffusion [39.5] 本稿では,3次元オブジェクトのための物理的材料を生成するための,完全自動統合拡散フレームワークを提案する。
Material Anythingは、多様な照明条件下でオブジェクトに適応可能な堅牢でエンドツーエンドのソリューションを提供する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:59:39 GMT)
Attributed Graph Clustering via Generalized Quaternion Representation Learning [39.0] 本稿では,効率的な構造化特徴表現学習を実現するために,グラフオートエンコーダネットワークを提案する。
提案したグラフクラスタリングによって学習されたノードの表現は、グローバルな分布情報を含むより差別的であり、より一般的なもので、異なる$k$のダウンストリームクラスタリングに適していることが判明した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 04:46:31 GMT)
DiffusionDrive: Truncated Diffusion Model for End-to-End Autonomous Driving [38.9] 拡散モデルは、ロボット政策学習の強力な生成技術として登場した。
本稿では,従来のマルチモードアンカーを取り入れ,拡散スケジュールを切り離す,新たな切り離された拡散ポリシーを提案する。
提案したモデルであるDiffusionDriveは、バニラ拡散ポリシーと比較して10ドル程度のデノナイジングステップの削減を実証している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:59:47 GMT)
VLM Agents Generate Their Own Memories: Distilling Experience into Embodied Programs of Thought [38.0] 大規模生成言語と視覚言語モデル (LLMs と VLMs) は、意思決定と指示の追従のために、数ショットのインコンテクスト学習で優れている。
In-Context Abstraction Learning (ICAL) は,マルチモーダルな体験のメモリを構築する手法である。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 07:43:21 GMT)
Introducing Spectral Attention for Long-Range Dependency in Time Series Forecasting [36.6] 最近の線形および変圧器ベースの予測器は時系列予測において優れた性能を示している。
時系列データにおける長距離依存関係を効果的に扱うことができないという点で制約されている。
本稿では,試料間の時間的相関を保った高速かつ効果的なスペクトル注意機構を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 01:41:37 GMT)
Applications of fractional calculus in learned optimization [36.4] フラクショナル勾配降下法は、従来の勾配降下法を拡張する能力に焦点をあてて、広範囲に研究されてきた。
しかし、分数次パラメータを微調整する問題は未解決のままである。
本研究では、ニューラルネットワークをトレーニングして勾配の順序を効果的に予測できることを実証する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:13:33 GMT)
AttriBoT: A Bag of Tricks for Efficiently Approximating Leave-One-Out Context Attribution [35.2] 本稿では,文脈属性に対するLOO誤差の近似を効率的に計算する一連の新しい手法であるAttriBoTを紹介する。
AttriBoTは、以前のコンテキスト属性メソッドよりもターゲットモデルのLOOエラーに忠実でありながら、>300倍のスピードアップを提供することができる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:06:14 GMT)
When Spatial meets Temporal in Action Recognition [34.5] 本稿では、時間情報を組み込んだ新しい前処理技術であるTIME(Temporal Integration and Motion Enhancement)について紹介する。
TIME層は、元のシーケンスを再構成し、時間順を保ちながら、時間的に進化するフレームを1つの空間グリッドに埋め込むことにより、新しいビデオフレームを生成する。
実験の結果,TIME層は認識精度を高め,映像処理タスクに有用な洞察を提供することがわかった。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:39:45 GMT)
HanDiffuser: Text-to-Image Generation With Realistic Hand Appearances [34.5] テキスト・ツー・イメージ生成モデルは高品質な人間を生み出すことができるが、現実主義は手を生成する際に失われる。
一般的なアーティファクトには、不規則な手ポーズ、形、不正確な指の数、物理的に不明瞭な指の向きなどがある。
そこで我々はHanDiffuserという新しい拡散型アーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:42:46 GMT)
TagFog: Textual Anchor Guidance and Fake Outlier Generation for Visual Out-of-Distribution Detection [34.3] オフ・オブ・ディストリビューション(OOD)検出は多くの現実世界のアプリケーションにおいて重要である。
本稿では,画像エンコーダのトレーニングを支援するために,単純なJigsawベースの偽OODデータと,ChatGPTによるID知識の記述からリッチセマンティック埋め込み(アンカー)を利用する新たな学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:40:25 GMT)
Omni-IML: Towards Unified Image Manipulation Localization [33.4] IMLタスクを統一する最初の一般モデルであるOmni-IMLを提案する。
我々は、自然画像、文書画像、顔画像の3つの主要なシナリオにわたるIMLタスクに対するアプローチを検証する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 09:44:13 GMT)
Foundation Cures Personalization: Recovering Facial Personalized Models' Prompt Consistency [33.4] FreeCureは、基礎モデル自体から固有の知識を活用して、パーソナライゼーションモデルの迅速な一貫性を改善する、トレーニング不要のフレームワークである。
パーソナライズモデルの出力における複数の属性を、新しいノイズブリーディング戦略と反転に基づくプロセスによって強化する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:21:38 GMT)
TIMotion: Temporal and Interactive Framework for Efficient Human-Human Motion Generation [30.7] 本稿では,人間の動作生成のための効率的かつ効果的なフレームワークであるTIMotion(Temporal and Interactive Modeling)を紹介する。
本稿では2つの異なるシーケンスを時間的および因果的特性を利用した因果的シーケンスとしてモデル化するための因果的対話注入を提案する。
よりスムーズで合理的な動きを生成するために,短期動作パターンをキャプチャする局所パターン増幅法を設計した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:46:48 GMT)
Deep ReLU Networks Have Surprisingly Simple Polytopes [30.4] ReLUネットワークはポリトープ上の一括線形関数である。
ポリトープの形状をポリトープの顔数を用いて検討する。
ポリトープの形状を特徴付けることで、他の問題に対する新たなレバレッジとなり得る。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 07:23:23 GMT)
Beyond the Doors of Perception: Vision Transformers Represent Relations Between Objects [30.1] ビジョントランス (ViT) は様々な環境で最先端のパフォーマンスを実現している。
しかし、視覚的関係を含むタスクを遂行する際、驚くべき失敗を経験する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 19:16:50 GMT)
Evaluating and Advancing Multimodal Large Language Models in Ability Lens [30.1] textbfAbilityLensは、6つの重要な知覚能力にまたがるMLLMを評価するために設計された統一ベンチマークである。
現在のモデルの長所と短所を特定し、安定性のパターンを強調し、オープンソースモデルとクローズドソースモデルの顕著なパフォーマンスギャップを明らかにします。
また、早期訓練段階から最高の能力チェックポイントを組み合わせ、能力衝突による性能低下を効果的に軽減する、簡易な能力特異的モデルマージ手法を設計する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 04:41:20 GMT)
SceneCraft: Layout-Guided 3D Scene Generation [29.7] シーンクラフト(SceneCraft)は、テキスト記述や空間的レイアウトの好みに則った、室内の詳細なシーンを生成する新しい方法である。
本手法は,多様なテクスチャ,一貫した幾何,現実的な視覚的品質を有する複雑な屋内シーン生成において,既存のアプローチを著しく上回っている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:32:29 GMT)
Panther: Illuminate the Sight of Multimodal LLMs with Instruction-Guided Visual Prompts [29.1] マルチモーダル大言語モデル(MLLM)は、人間の視覚知覚能力とのギャップを急速に埋めている。
本稿では,ユーザの指示に忠実に固執し,興味の対象を正確に特定するMLLMであるPantherを紹介する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 07:03:11 GMT)
Neural Network-Based Bandit: A Medium Access Control for the IIoT Alarm Scenario [28.7] IIoTアラームのシナリオに対して,NNBB(Neural Network-Based Bandit)と題する分散ランダムアクセス方式を提案する。
このようなシナリオでは、デバイスは共通のクリティカルイベントを検出し、アラーム情報が少なくとも1つのデバイスから確実に配信されることが目標である。
シミュレーションの結果,ネットワーク内のデバイス数の増加に伴い,マルチアーマッドバンド (MAB) RA ベンチマークと比較してNNBBの性能向上が見られた。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:35:53 GMT)
DyCoke: Dynamic Compression of Tokens for Fast Video Large Language Models [28.4] トークン表現の最適化とビデオ大言語モデルの高速化を目的とした,トレーニング不要なトークン圧縮手法であるDyCokeを提案する。
DyCokeは、フレーム間で冗長トークンをマージすることによって、時間的冗長性を最小化するために、プラグインとプレイの時間的圧縮モジュールを組み込んでいる。
各デコードステップでクリティカルトークンを動的に保持することで、高品質な推論を保証する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:55:19 GMT)
Dynamic Tube MPC: Learning Tube Dynamics with Massively Parallel Simulation for Robust Safety in Practice [28.4] 追跡不能なエラーは、安全を確保するために名目上の計画の堅牢化を必要とする。
本研究では,超並列シミュレーションを利用して動的チューブ表現を学習する手法を提案する。
結果のダイナミックMPCチューブは、3DホッピングロボットARCHERに適用される。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 21:22:51 GMT)
The 1st Workshop on Human-Centered Recommender Systems [27.2] このワークショップは、研究者が人間中心のレコメンダシステムを開発するためのプラットフォームを提供することを目的としている。
HCRSは、設計と運用の中心にある人間の要求、価値観、能力を優先するレコメンデーターシステムを作成することを指す。
このワークショップには、堅牢性、プライバシー、透明性、公正性、多様性、説明責任、倫理的考慮事項、ユーザフレンドリーなデザインなど、トピックスを含めるが制限されない。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 06:46:41 GMT)
MaGS: Reconstructing and Simulating Dynamic 3D Objects with Mesh-adsorbed Gaussian Splatting [27.1] 本稿では,この課題に対処するために,メッシュ吸着型ガウス平滑化法(MaGS)を提案する。
MaGSは、3Dガウス人がメッシュの近くで歩き回ることを制約し、相互に吸着されたメッシュ-ガウスの3D表現を生成する。
このような表現は、3Dガウスのレンダリングの柔軟性とメッシュの構造的特性の両方を利用する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:20:26 GMT)
What Do GNNs Actually Learn? Towards Understanding their Representations [27.1] 4つの標準グラフニューラルネットワーク(GNN)で学習したノード表現について検討する。
いくつかのモデルが全てのノードに対して同じ表現を生成するのに対し、他のモデルによって学習された表現は、ノードから始まる特定の長さのウォークの概念とリンクしている。
すべてのノードの初期表現が同じ方向に向けられている場合、モデルの$k$-層で学んだ表現は、正確に$k$ステップで到達できるノードの初期特徴にも関連している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:41:13 GMT)
Quantization without Tears [26.6] QwT(Quantization without Tears)は、量子化速度、精度、単純さ、一般化性を同時に達成する手法である。
QwTは、量子化中の情報損失を軽減するために、軽量な追加構造を量子化ネットワークに組み込む。
様々な視覚、言語、マルチモーダルタスクにわたる広範囲な実験は、QwTが高効率かつ多目的であることを示した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:17:55 GMT)
On the Impact of Fine-Tuning on Chain-of-Thought Reasoning [26.1] 本研究では,大規模言語モデルの推論能力に及ぼす微調整の影響について検討した。
タスク固有の微調整が全体的な推論能力に与える影響、微調整がCoT推論性能に及ぼす影響、そしてCoT推論の忠実性に与える影響に関する疑問に対処する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 23:54:37 GMT)
ReVisionLLM: Recursive Vision-Language Model for Temporal Grounding in Hour-Long Videos [26.0] ReVisionLLMは、1時間ビデオ中のイベントを見つけるために設計された視覚言語モデルである。
人間の検索戦略にインスパイアされた私たちのモデルは、当初は幅広い関心領域をターゲットとしていました。
私たちのモデルは、数分から数時間の間、非常に異なる長さの動画をシームレスに処理することができます。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 12:46:50 GMT)
FastGrasp: Efficient Grasp Synthesis with Diffusion [25.9] 本稿では,一段階的に把握ポーズを生成する拡散モデルに基づく新しいアプローチを提案する。
これにより、生成速度と生成した手ポーズの多様性を大幅に改善できる。
提案手法は,最先端手法よりも高速な推論,多様性の向上,ポーズの質の向上を実現している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:06:32 GMT)
Benchmarking the Robustness of Optical Flow Estimation to Corruptions [25.8] 光フローモデルのベンチマークに特化して設計された7つの時間的破損について紹介する。
2つのロバスト性ベンチマーク、KITTI-FCとGoPro-FCが、光学フロー推定のための最初の汚職性ベンチマークとして確立されている。
15個の光学流法から29種類のモデルが評価され、10個の興味深い観測結果が得られた。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:31:01 GMT)
Morph: A Motion-free Physics Optimization Framework for Human Motion Generation [25.5] 我々のフレームワークは、身体的可視性を大幅に向上させながら、最先端のモーション生成品質を実現する。
テキスト・トゥ・モーション・アンド・ミュージック・トゥ・ダンス・ジェネレーション・タスクの実験は、我々のフレームワークが最先端のモーション・ジェネレーション・クオリティを達成することを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:09:56 GMT)
TDSM: Triplet Diffusion for Skeleton-Text Matching in Zero-Shot Action Recognition [25.3] ゼロショットスケルトンに基づくアクション認識では、見えないアクションを正確に予測するためには、スケルトン特徴とアクションラベルのテキスト特徴との整合が不可欠である。
本フレームワークは,スケルトン・テキストマッチング(TDSM)方式のトリプルト拡散として設計されており,スケルトンの特徴を逆拡散によるテキストプロンプトと整合させる。
識別力を高めるために,TDSMが不正確な3重項拡散(TD)損失を生じさせ,不正確な3重項拡散(TD)を推し進める。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:49:47 GMT)
FodFoM: Fake Outlier Data by Foundation Models Creates Stronger Visual Out-of-Distribution Detector [25.2] オープンソースのアプリケーションに機械学習モデルをデプロイする際には、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
本稿では,新しいOOD検出フレームワークFodFoMを提案する。
最新のOOD検出性能は、複数のベンチマークで実現されている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:29:52 GMT)
GOT4Rec: Graph of Thoughts for Sequential Recommendation [25.0] GOT4Recは、思考のグラフ(GoT)のプロンプト戦略を利用するシーケンシャルレコメンデーション手法である。
我々は,ユーザ履歴シーケンスにおいて,短期的関心事,長期的関心事,他ユーザからの協力的情報という3つの重要な情報を識別し,活用する。
実世界のデータセットに対する大規模な実験は、GOT4Recの有効性を示し、既存の最先端ベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:24:01 GMT)
Effective SAM Combination for Open-Vocabulary Semantic Segmentation [24.1] Open-vocabulary semantic segmentationは、無制限のクラスにわたる画像にピクセルレベルのラベルを割り当てることを目的としている。
ESC-Netは、SAMデコーダブロックを利用してクラスに依存しないセグメンテーションを行う新しい1段オープン語彙セグメンテーションモデルである。
ESC-NetはADE20K、PASCAL-VOC、PASCAL-Contextなどの標準ベンチマークで優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 04:36:12 GMT)
BillBoard Splatting (BBSplat): Learnable Textured Primitives for Novel View Synthesis [24.1] 本稿では,テクスチャ化された幾何学的プリミティブに基づく3次元シーン表現のための新しい手法として,BBSplat(Billboard Splatting)を提案する。
BBSplatはこのシーンを、学習可能なRGBテクスチャと、その形状を制御するアルファマップを備えた、最適化可能なテクスチャ化された平面プリミティブのセットとして表現している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:35:52 GMT)
Cinematic Gaussians: Real-Time HDR Radiance Fields with Depth of Field [23.9] 放射場法は、多視点写真から複雑なシーンを再構成する際の技法の状態を表現している。
ピンホールカメラモデルへの依存は、すべてのシーン要素が入力画像に集中していると仮定し、実用的な課題を提示し、新規な視点合成において再焦点を複雑にする。
様々な露光時間,開口の放射率,焦点距離を多視点LDR画像を用いて高ダイナミックレンジシーンを再構成する3Dガウススメッティングに基づく軽量解析手法を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:57:08 GMT)
Differentially Private Adaptation of Diffusion Models via Noisy Aggregated Embeddings [23.7] 差分プライバシー制約下で拡散モデルを適用する新しい手法を導入し、微調整なしでプライバシー保護スタイルとコンテンツ転送を可能にする。
これらの手法を,パリ2024年パリオリンピックの美術品コレクションとピクトグラムの2つのプライベートデータセットを用いて,スタイル適応のための安定拡散に適用する。
実験結果から, タイベース適応は, 強いプライバシー保証の下でも, スタイル伝達において優れた忠実性が得られることが示された。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 00:09:49 GMT)
EMatch: A Unified Framework for Event-based Optical Flow and Stereo Matching [23.5] イベントカメラは光学的フロー推定やステレオマッチングといった視覚的応用において有望であることを示している。
イベントベースフロー推定とステレオマッチングを統合された高密度対応マッチング問題として再構成する。
本モデルでは,光学的フローとステレオ推定の両方を効果的に処理し,両タスクの最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:58:23 GMT)
MolReFlect: Towards In-Context Fine-grained Alignments between Molecules and Texts [23.5] MolReFlectは、微細な方法で分子カプセルアライメントを文脈的に実行するように設計された教師学生向けフレームワークである。
実験の結果,MorReFlectはMistral-7BのようなLLMを従来のベースラインよりも大幅に向上させることができることがわかった。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 04:28:56 GMT)
Exploring the Boundaries of Semi-Supervised Facial Expression Recognition using In-Distribution, Out-of-Distribution, and Unconstrained Data [23.5] 表情認識(FER)における最新の半教師あり手法11について検討する。
本研究は,非流通,アウト・オブ・ディストリビューション,制約のない,非常に小さなデータからの半教師付き学習を対象とする。
ラベル付きサンプルの数が等しいため、半教師付き学習は教師付き学習よりも大幅に改善される。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:08:34 GMT)
Controlling Language and Diffusion Models by Transporting Activations [23.4] 本稿では,最適な輸送理論で導かれる活性化を制御するためのフレームワークであるアクティベーショントランスポート(AcT)を紹介する。
我々は,大規模言語モデル (LLM) とテキスト・ツー・イメージ拡散モデル (T2Is) の重要な課題に対処することで,我々のアプローチの有効性と汎用性を実験的に示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:04:44 GMT)
UniGaussian: Driving Scene Reconstruction from Multiple Camera Models via Unified Gaussian Representations [23.3] 運転シーンで魚眼カメラを効果的にシミュレートする方法は、未解決の問題である。
複数のカメラモデルから統一された3次元ガウス表現を学習する新しいアプローチであるUniGaussianを提案する。
我々のアプローチは、複数のセンサー(ピンホールと魚眼カメラ)とモード(深度、意味、正常、LiDAR点雲)をモデル化する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 21:59:46 GMT)
Diff-IP2D: Diffusion-Based Hand-Object Interaction Prediction on Egocentric Videos [22.8] そこで我々は,Diff-IP2Dを提案する。
提案手法は,市販のメトリクスと新たに提案した評価プロトコルの両方において,最先端のベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:09:29 GMT)
Cross Group Attention and Group-wise Rolling for Multimodal Medical Image Synthesis [22.6] マルチモーダルMR画像合成は、いくつかのMRIデータを融合してマッピングすることで、欠落したモダリティ画像を生成することを目的としている。
マルチモーダルMR画像合成におけるモダリティ間関係とモダリティ間関係の両方を探索するAdaptive Group-wise Interaction Network (AGI-Net)を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:29:37 GMT)
Zero-Shot Coreset Selection: Efficient Pruning for Unlabeled Data [22.5] Coreset選択は、モデルをトレーニングするデータの代表的なサブセットを見つけることを目的としている。
ZCoreは、真実ラベルや候補データによるトレーニングなしに、コアセットを効率的に選択する手法である。
我々は、4つのデータセット上でZCoreを評価し、いくつかの最先端のラベルベースの手法より優れています。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 21:17:49 GMT)
EADReg: Probabilistic Correspondence Generation with Efficient Autoregressive Diffusion Model for Outdoor Point Cloud Registration [22.1] 我々は,LiDAR点雲の効率的かつロバストな登録のためのEADRegという新しいフレームワークを提案する。
我々は、二方向ガウス混合モデル(BGMM)を用いて、外接点を拒絶し、純化された点雲対を得る。
微細な段階では,拡散型PCRを自己回帰プロセスとして扱い,ロバストな点対応を生成する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:03:54 GMT)
ADOPT: Modified Adam Can Converge with Any $β_2$ with the Optimal Rate [21.4] 本稿では,ADOPTという新しい適応勾配法を提案する。これは,有界雑音の仮定に依存することなく,$mathcalOの最適収束率を実現する。
ADOPTは、画像分類、生成モデル、自然言語処理、深層強化学習など、幅広いタスクにおいて、Adamとその変種と比較して優れた結果が得られる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:15:10 GMT)
FLAME: Frozen Large Language Models Enable Data-Efficient Language-Image Pre-training [21.4] 言語イメージの事前学習は、特定のフォーマットの限られたデータと、テキストエンコーダの制約された容量のために、重大な課題に直面している。
我々は,凍結した大言語モデルをテキストエンコーダとして利用するFLAME (Frozen Large lAnguage Models Enable data- efficient language-image pre-training)を提案する。
FLAMEは,1)長いキャプションから多様な意味表現を抽出する多面的急速蒸留技術,2)オフライン埋め込み戦略を補完する顔分離型アテンション機構である。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:30:29 GMT)
OVO-SLAM: Open-Vocabulary Online Simultaneous Localization and Mapping [21.3] 本稿では,Open-Vocabulary Online 3DセマンティックSLAMパイプラインについて述べる。
CLIPベクターを用いた3Dセグメントの検出と追跡を行い,これらの3Dセグメントが観測される視点から,新しいアグリゲーションによって計算した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:25:05 GMT)
Adaptive Communications in Collaborative Perception with Domain Alignment for Autonomous Driving [21.1] 本稿では,チャネル認識型協調認識フレームワークACC-DAを提案する。
まず,通信グラフを構築可能な伝送遅延最小化法を設計する。
次に、速度歪みトレードオフを動的に調整し、知覚効率を向上させる適応データ再構成機構を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:25:18 GMT)
AdaFlow: Imitation Learning with Variance-Adaptive Flow-Based Policies [21.0] 本稿では,フローベース生成モデルに基づく模倣学習フレームワークであるAdaFlowを提案する。
AdaFlowは状態条件付き常微分方程式(ODE)によるポリシーを表す
AdaFlowは高速な推論速度で高い性能を実現する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:11:23 GMT)
Fine-Grained Alignment in Vision-and-Language Navigation through Bayesian Optimization [20.6] 本稿では,視覚・言語ナビゲーション(VLN)タスクにおける細粒度アライメントの課題に対処する。
現在のアプローチでは、対照的な学習を用いて、言語を視覚的軌跡シーケンスと整合させる。
本稿では, ベイズ最適化に基づく逆最適化フレームワークを導入し, 微細なコントラスト視覚サンプルを作成する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 09:12:02 GMT)
Generative AI may backfire for counterspeech [20.6] 我々は、最先端AIが生み出す文脈化された逆音声が、オンラインヘイトスピーチを抑制するのに有効であるかどうかを分析する。
その結果,非コンテクスチュアライズされた対応音声は,オンラインヘイトスピーチを著しく減少させることがわかった。
しかし、LLMsによって生成される文脈化された反音声は効果が無く、バックファイアさえも生じうる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:47:00 GMT)
PyTester: Deep Reinforcement Learning for Text-to-Testcase Generation [20.4] テスト駆動開発(TDD)は、実際のコードを書く前に要件に基づいてテストケースを書くことを義務付ける。
テストケースを書くことはTDDの中心ですが、時間がかかり、コストがかかり、開発者が悩まされることも少なくありません。
PyTesterは、テキストからテストケースを生成するアプローチで、正しい、実行可能な、完全な、効果的なテストケースを自動的に生成します。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 06:42:56 GMT)
GraphCL: Graph-based Clustering for Semi-Supervised Medical Image Segmentation [20.4] 本稿では,グラフデータ構造を統合深層モデルで共同モデル化し,半教師付き医用画像分割(GraphCL)のためのグラフベースのクラスタリングを提案する。
提案したGraphCLアルゴリズムは,最先端の半教師付き医用画像分割法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 09:18:20 GMT)
De-biased Multimodal Electrocardiogram Analysis [20.3] 医療分野ではMLLM(Multimodal large language model)がますます採用されている。
これまでの研究では、ECGを複数のテキストタグに変換することでこの問題に対処してきた。
本研究は,射影層を通したLCMへのECGの埋め込みを直接供給する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:35:35 GMT)
Financial Risk Assessment via Long-term Payment Behavior Sequence Folding [20.3] 長期ユーザーの支払い行動は、金融リスクを予測するモデルの能力を高める可能性がある。
本稿では,LBSFと呼ばれる長期納付行動列形成法を提案する。
大規模実世界のデータセットを用いて,金融リスク評価タスクにおけるLBSFの評価を行った。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:43:26 GMT)
Dimension-independent rates for structured neural density estimation [20.1] 深部ニューラルネットワークは, 構造密度の学習において, 次元に依存しない収束率を達成することを示す。
我々の結果は、画像、音声、ビデオ、テキストデータの現実的なモデルに適用できる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:50:27 GMT)
FloAt: Flow Warping of Self-Attention for Clothing Animation Generation [20.0] 拡散モデルに基づくアプローチであるFloAtControlNetを提案する。
本手法のバックボーンは,トレーニング不要なシステムで動作する正規マップ条件付きコントロールネットである。
自己注意マップの操作により,衣服のアニメーションの質が大幅に向上し,自然に見えやすくなり,背景のアーティファクトが抑制されることを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:59:48 GMT)
Learning to Stabilize Faces [19.9] 我々は、シンプルで完全に自動化された新しい学習ベースのアプローチを提案する。
3次元形態モデル(3DMM)を用いて合成トレーニングデータを生成し、3DMMパラメータが顔の皮膚の動きから頭蓋骨の動きを分離するという事実を生かした。
本手法は,個別の表情セットを安定化させる作業において,定量的かつ質的に,最先端技術よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:03:25 GMT)
Sketch-guided Cage-based 3D Gaussian Splatting Deformation [19.4] 3D Gaussian Splatting (GS)は最も有望な3D表現の1つである。
本稿では,3次元GSモデルの形状を直感的に修正できる3次元GS変形システムを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:25:13 GMT)
Deep Policy Gradient Methods Without Batch Updates, Target Networks, or Replay Buffers [19.1] アクション・バリュー・グラディエント(AVG)は、新たなディープ・ポリシー・グラディエント法である。
インクリメンタルアップデートのみを使用して、実際のロボットによる効果的な深層強化学習を初めて示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:46:21 GMT)
Bayesian Optimisation with Unknown Hyperparameters: Regret Bounds Logarithmically Closer to Optimal [18.9] 本稿では,Longth Scale Balancing (LB)について紹介する。
LBは、長いスケールを維持しながら、長いスケールの候補値を追加し、探索とエクスプロイトのバランスをとる。
LB はオラクルの後悔からわずか$log g(T) 離れている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 23:40:56 GMT)
Health AI Developer Foundations [18.7] Health AI Developer Foundations(HAI-DEF)は、トレーニング済み、ドメイン固有の基礎モデル、ツール、レシピのスイートで、ヘルスアプリケーションのための機械学習の構築を加速する。
モデルは、放射線学(X線とCT)、病理学、皮膚画像、オーディオなど、様々なモダリティや領域をカバーする。
これらのモデルは、ラベル付きデータが少なく、トレーニング時間が短く、計算コストが削減されたAI開発を容易にする、ドメイン固有の埋め込みを提供する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:51:51 GMT)
Achieving the Multi-parameter Quantum Cramér-Rao Bound with Antiunitary Symmetry [18.6] 我々は,反単位対称性の助けを借りて,戦略を符号化するパラメータを最適化するための,新しい包括的アプローチを提案する。
その結果、トレードオフのない複数のパラメータの最終的な精度の同時達成が示された。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:37:43 GMT)
WildLMa: Long Horizon Loco-Manipulation in the Wild [18.5] In-the-wildモバイル操作は、さまざまな現実世界環境にロボットを配置することを目的としている。
WildLMaは、模倣や学習プランナーを通じて得られる、汎用的なビズモータスキルのライブラリである。
我々は,大学の廊下や屋外の地形でゴミを掃除するなど,実用的なロボット応用を実演する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:56:56 GMT)
E-Calib: A Fast, Robust and Accurate Calibration Toolbox for Event Cameras [18.5] E-Calibは、イベントカメラの新しい、高速で、堅牢で、正確なキャリブレーションツールボックスである。
提案手法は,様々なイベントカメラモデルに対する様々な厳密な実験で検証される。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 19:47:09 GMT)
Geminio: Language-Guided Gradient Inversion Attacks in Federated Learning [18.3] 我々は、GAAを意味論的に意味のある標的攻撃に変換する最初のアプローチであるGeminioを紹介する。
Geminioは、新たなプライバシ攻撃体験を可能にする。攻撃者は自然言語で、彼らが価値とみなすデータの種類を説明することができる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:49:56 GMT)
Prioritize Denoising Steps on Diffusion Model Preference Alignment via Explicit Denoised Distribution Estimation [18.3] 本稿では,信用割当の新しい手法であるDenoized Distribution Estimation (DDE)を提案する。
DDEは、各ステップの観点から、端末の復号化分布を直接推定する。
2つの推定戦略を備え、1つのモデル推論で全聴覚軌跡を表現できる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:45:33 GMT)
ScribeAgent: Towards Specialized Web Agents Using Production-Scale Workflow Data [18.1] 大規模言語モデル(LLM)エージェントは、ますます複雑なWebベースのタスクを処理するために急速に改善されている。
汎用 LLM は、HTML のような特別な Web コンテキストを理解するために特別に訓練されていない。
我々は、60億のトークンに対応する250以上のドメインから収集された実運用規模のワークフローデータを用いて、オープンソースLLMを微調整する別のアプローチを探る。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:26:23 GMT)
VISTA3D: A Unified Segmentation Foundation Model For 3D Medical Imaging [18.1] VISTA3D,Versatile Imaging SegmenTation,voxel modelを提案する。
確立された3Dセグメンテーションパイプライン上に構築されている。
これは、3D自動(127クラスのサポート)と3Dインタラクティブセグメンテーションの両方で最先端のパフォーマンスを達成する最初のモデルである。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:15:00 GMT)
Maps from Motion (MfM): Generating 2D Semantic Maps from Sparse Multi-view Images [18.0] OpenStreetMapは、1100万人の登録ユーザーが手動でGPSの位置情報に157億以上のエントリをアノテートした結果である。
同時に、手動のアノテーションにはエラーが含まれ、更新が遅く、マップの精度が制限される。
動きからのマップ (MfM) は、非校正された多視点画像のコレクションから直接意味オブジェクトの2Dマップを計算することにより、そのような時間を要する地図作成手順を自動化するためのステップである。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:29:58 GMT)
A Benchmark Dataset for Collaborative SLAM in Service Environments [17.9] 屋内サービス環境における複数のサービスロボットを対象としたマルチモーダルC-SLAMデータセットを提案する。
シミュレーションを用いることで、ステレオRGB、ステレオ深度、IMU、グラウンド真理(GT)ポーズなどの正確な時間同期センサデータを提供できる。
我々は,最先端のシングルロボットSLAMとマルチロボットSLAMを多種多様な方法で評価することにより,データセットを実証する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 07:33:33 GMT)
LLaNA: Large Language and NeRF Assistant [17.8] 我々は、NeRFキャプションなどの新しいタスクを実行することができる初の汎用NeRF言語アシスタントであるLLaNAを開発した。
我々は,人的介入を伴わないさまざまなNeRF言語タスクに対して,テキストアノテーションを用いたNeRFのデータセットを構築した。
その結果,NeRF重みの処理は,NeRFから2次元あるいは3次元の表現を抽出することに対して良好な効果が得られた。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:38:42 GMT)
CaT-BENCH: Benchmarking Language Model Understanding of Causal and Temporal Dependencies in Plans [17.6] 本稿では,調理レシピ計画において,ステップの前後にステップが必ず発生する必要があるかどうかを検証した,ステップ順序予測のベンチマークであるCaT-Benchを紹介する。
我々はSOTA LLMが圧倒されていること(最もゼロショットはF1でわずか0.59)、より頻繁に依存を予測することに偏っていることを発見した。
人間による説明の評価と回答の正しさは、平均して人間はモデル推論と一致しないことを示している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:07:14 GMT)
SPAC-Net: Rethinking Point Cloud Completion with Structural Prior [17.3] ポイント雲の完成は、その部分的な観測から完全な形状を推測することを目的としている。
多くのアプローチは純粋なエンコーダデコーダパラダイムを利用しており、部分スキャンから学習した形状の先行によって完全な形状を直接予測することができる。
本研究では,新しい構造的事前指導の下で完了作業を再考することを目的とした新しいフレームワークSPAC-Netを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:54:17 GMT)
LocRef-Diffusion:Tuning-Free Layout and Appearance-Guided Generation [17.2] LocRef-Diffusionは、画像内の複数のインスタンスの外観と位置をカスタマイズできるチューニング不要のモデルである。
インスタンス配置の精度を高めるために,インスタンス生成位置を制御するレイアウトネットを導入する。
参照画像に対する外観忠実度を改善するために,インスタンスの外観特徴を抽出する外観ネットを用いる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:44:39 GMT)
Cross-Modal Pre-Aligned Method with Global and Local Information for Remote-Sensing Image and Text Retrieval [17.0] グローバルな情報とローカルな情報を活用するクロスモーダル・プレアライメント手法であるCMPAGLを提案する。
我々のGswin変換ブロックは、ローカルウィンドウの自己アテンションとグローバルローカルウィンドウのクロスアテンションを組み合わせて、マルチスケールな特徴をキャプチャする。
RSICDとRSITMDを含む4つのデータセットの実験はCMPAGLの有効性を検証する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:28:55 GMT)
Ex Uno Pluria: Insights on Ensembling in Low Precision Number Systems [16.9] ディープニューラルネットワークの組み立ては、一般化性能を改善することを約束している。
本稿では,低精度数値システム内の単一モデルからアンサンブル部材を導出する,低精度アンサンブルを提案する。
実験により,既存のアンサンブル手法と比較し,提案手法の有効性を実証した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:18:20 GMT)
ReXrank: A Public Leaderboard for AI-Powered Radiology Report Generation [16.7] 我々は、AIを利用した放射線学レポート生成を評価するためのリーダーボードで課題であるReXrankを紹介する。
このフレームワークには1万の研究からなる最大のテストデータセットであるReXGradientが組み込まれています。
この標準化された評価フレームワークを提供することで、ReXrankはモデルパフォーマンスの有意義な比較を可能にします。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:40:02 GMT)
EfficientViM: Efficient Vision Mamba with Hidden State Mixer based State Space Duality [16.6] 隠れ状態ミキサーを用いた状態空間双対性(HSM-SSD)に基づく新しいアーキテクチャであるEfficient Vision Mamba(EfficientViM)を紹介する。
HSM-SSD層は、隠れ状態内のチャネル混合操作を可能にする。
その結果、EfficientViMファミリはImageNet-1k上で新しい最先端のスピード精度トレードオフを実現する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:02:06 GMT)
LiDAR-based End-to-end Temporal Perception for Vehicle-Infrastructure Cooperation [16.5] LET-VIC(LDAR-based End-to-End Tracking framework for Vehicle-Temporal Cooperation)を紹介する。
LET-VICはV2X通信を利用して、車両とインフラの両方のセンサーから空間データと時間データを融合することで、時間知覚を高める。
V2X-Seq-SPDデータセットの実験では、LET-VICはベースラインモデルよりも優れており、少なくともmAPが13.7%、AMOTAが13.1%改善している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:34:29 GMT)
Can GNNs Learn Link Heuristics? A Concise Review and Evaluation of Link Prediction Methods [16.4] 本稿では,リンク予測のための各種情報学習におけるグラフニューラルネットワーク(GNN)の機能について検討する。
解析の結果,GNNは2つのノード間の共通隣接点数に関する構造情報を効果的に学習できないことがわかった。
また、トレーニング可能なノード埋め込みにより、GNNベースのリンク予測モデルの性能が向上することを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:38:20 GMT)
TIPO: Text to Image with Text Presampling for Prompt Optimization [16.0] TIPOは、言語モデル(LM)によるテキスト・ツー・イメージ(T2I)生成を強化するために設計された革新的なフレームワークである。
LLM(Large Language Models)や強化学習(RL)に依存する従来のアプローチとは異なり、TIPOはトレーニングされたプロンプトデータセットの配布によって、ユーザの入力プロンプトを調整する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:58:31 GMT)
Interval Abstractions for Robust Counterfactual Explanations [16.0] 対実的説明(CE)は、説明可能なAI研究における主要なパラダイムとして現れている。
既存のメソッドは、生成したモデルのパラメータにわずかな変更が発生すると、しばしば無効になる。
本稿では,機械学習モデルのための新しいインターバル抽象化手法を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:01:12 GMT)
OSMamba: Omnidirectional Spectral Mamba with Dual-Domain Prior Generator for Exposure Correction [15.9] 我々は新しい露光補正ネットワークであるOmnidirectional Spectral Mamba (OSMamba)を提案する。
OSMambaは、Mambaを周波数領域に適応させる全方位スペクトル走査機構を導入している。
我々は、よく露出した画像から学習し、劣化のない拡散前生成を行うデュアルドメイン先行生成器を開発した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:54:16 GMT)
On the Linear Speedup of Personalized Federated Reinforcement Learning with Shared Representations [15.5] フェデレート強化学習(FedRL)は、エージェントと環境相互作用の間に収集された局所的な軌跡を共有することなく、複数のエージェントが協調的にポリシーを学ぶことを可能にする。
異種環境におけるエージェント間の共通構造を生かし, 共生型FedRLフレームワーク(PFedRL)を導入する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:42:43 GMT)
Improving Mathematical Reasoning Capabilities of Small Language Models via Feedback-Driven Distillation [15.5] 大規模言語モデル(LLM)は例外的な推論能力を示し、様々なタスクで最先端のパフォーマンスを達成する。
有望な解決策は知識蒸留であり、LLMがSmall Language Models (SLM)に推論機能を移行し、低リソースデバイスへのより広範なデプロイを可能にする。
本研究では,SLMの数学的推論能力を高めるために,フィードバック駆動蒸留(FDD)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:12:39 GMT)
Improving Code Search with Hard Negative Sampling Based on Fine-tuning [15.3] 本稿では,クエリとコードの結合を共同で符号化するコード検索のためのクロスエンコーダアーキテクチャを提案する。
また、両エンコーダとクロスエンコーダをカスケードしたRetriever-Ranker(RR)フレームワークを導入し、評価とオンラインサービスの有効性を高める。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 09:34:34 GMT)
Self-Training Meets Consistency: Improving LLMs' Reasoning With Consistency-Driven Rationale Evaluation [15.1] 大規模言語モデル(LLM)の自己学習アプローチは、自己生成的理性に基づいてモデルをトレーニングすることで推論能力を向上させる。
これまでのアプローチでは、与えられた質問に対する正しい答えをトレーニングに適するように、合理的にラベル付けしてきた。
CREST(Consistency-driven Rationale Evaluation for Self-Training)は,フォローアップ質問を通じて各根拠を更に評価する自己学習フレームワークである。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:54:17 GMT)
There is no SAMantics! Exploring SAM as a Backbone for Visual Understanding Tasks [15.1] Segment Anything Model (SAM) はもともとラベルに依存しないマスク生成のために設計された。
分類タスクにおけるベース画像エンコーダの有効性を比較することにより,SAMのセマンティック能力の定量化を図る。
その結果,SAM特徴表現における意味的識別性の欠如が明らかとなった。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:00:18 GMT)
Exploiting Watermark-Based Defense Mechanisms in Text-to-Image Diffusion Models for Unauthorized Data Usage [15.0] 安定拡散のようなテキストと画像の拡散モデルは、高品質な画像を生成するのに例外的な可能性を示している。
近年の研究では、これらのモデルのトレーニングに不正データを使用することが懸念されており、知的財産権侵害やプライバシー侵害につながる可能性がある。
本稿では,テキスト・ツー・イメージ・モデルに適用された様々な透かしに基づく保護手法のロバスト性について検討する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:28:19 GMT)
Quantum Hamiltonian Descent for Graph Partition [14.7] グラフ分割問題の解法として量子ハミルトニアン Descent を導入する。
我々はQHDの量子インスパイアされたダイナミクスを利用して最適なコミュニティ構造を同定する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:08:24 GMT)
ContourDiff: Unpaired Image-to-Image Translation with Structural Consistency for Medical Imaging [14.5] 適切な翻訳のために考慮すべき領域間の構造バイアスを定量化するための新しい指標を導入する。
次に、ドメイン不変な解剖学的輪郭表現を利用する新しい画像から画像への変換アルゴリズムであるContourDiffを提案する。
腰部脊柱管拡大術と大腿部CT-to-MRIの術式について検討した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 01:29:06 GMT)
TPIE: Topology-Preserved Image Editing With Text Instructions [14.4] テキストによるトポロジー保存画像編集(TPIE)
TPIEは、新しく生成されたサンプルを与えられた入力テンプレートの変形可能なバリエーションとして扱い、制御可能かつ構造保存可能な編集を可能にする。
TPIEを2次元画像と3次元画像の多種多様なセットで検証し,最新の画像編集手法と比較した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:08:27 GMT)
Double Machine Learning for Adaptive Causal Representation in High-Dimensional Data [14.3] サポートポイントサンプル分割(SPSS)は、因果推論において効率的なダブル機械学習(DML)に使用される。
ランダムサンプル中の全生データの最適な代表点として支持点を選択して分割する。
それらは、完全な大きなデータセットの最良の表現を提供するが、従来のランダムデータ分割による基礎となる分布の単位構造情報は、ほとんど保存されない。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 01:54:53 GMT)
A Reproducibility and Generalizability Study of Large Language Models for Query Generation [14.2] 生成AIと大規模言語モデル(LLM)は、体系的な文献レビュープロセスに革命をもたらすことを約束する。
本稿では,LLMを用いたBooleanクエリ生成を体系的レビューのために広範囲に研究する。
本研究は,ChatGPTを用いて得られた結果の複製性と信頼性について検討した。
次に、オープンソースモデルの解析と評価により結果を一般化する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:15:03 GMT)
FCDM: Sparse-view Sinogram Inpainting with Frequency Domain Convolution Enhanced Diffusion Models [14.0] シングラムデータに適した新しい拡散型塗布フレームワークを提案する。
FCDMは既存の手法よりも優れており、SSIMが0.95以上、PSNRが30dB以上、SSIMが33%、PSNRが29%である。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 21:17:56 GMT)
AGLP: A Graph Learning Perspective for Semi-supervised Domain Adaptation [13.5] 半教師付きドメイン適応(SSDA)において、このモデルは、部分的にラベル付けされたターゲットドメインデータと大量のラベル付けされたソースドメインデータを活用することを目的としている。
本稿では,半教師付きドメイン適応のためのグラフ学習視点(AGLP)を提案する。
グラフ畳み込みネットワークをインスタンスグラフに適用することにより,重み付きグラフエッジに沿って構造情報を伝搬することができる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 09:21:01 GMT)
FedCRL: Personalized Federated Learning with Contrastive Shared Representations for Label Heterogeneity in Non-IID Data [13.1] 本稿では,FedCoSR(Federated Contrastive Shareable Representations)という,個人化学習アルゴリズムを提案する。
ローカルモデルの浅い層と典型的なローカル表現のパラメータはどちらもサーバの共有可能な情報である。
クライアント間でのラベル分布スキューによる性能の低下に対処するため、局所表現とグローバル表現の対比学習を採用する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 12:51:47 GMT)
Natural Language Processing RELIES on Linguistics [13.1] 言語学がNLPに寄与する6つの主要な面を包含する頭字語RELIESを論じる。
このリストは徹底的なものではないし、言語学もこれらのテーマの下でのあらゆる努力の主点ではない。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:36:32 GMT)
High-Resolution Image Synthesis via Next-Token Prediction [13.1] D-JEPA$cdot$T2Iは,フローマッチング損失を取り入れたD-JEPAの拡張であり,連続的な解像度学習を可能にする。
我々は,次世代の予測により,最先端のテクスチャ高分解能画像合成を初めて達成した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 09:08:58 GMT)
Sample Complexity of Probability Divergences under Group Symmetry [13.1] 群不変分布の変分分散推定におけるサンプル複雑性の改善を厳密に定量化する。
ワッサーシュタイン1計量とリプシッツ規則化された$alpha$-divergencesの場合、標本の複雑さの減少は群が有限であれば群のサイズに比例する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 19:10:46 GMT)
VIVID-10M: A Dataset and Baseline for Versatile and Interactive Video Local Editing [13.0] 本稿では,データセットVIVID-10MとベースラインモデルVIVIDを紹介する。
VIVID-10Mは、最初の大規模ハイブリッド画像-ビデオローカル編集データセットである。
提案手法は,ビデオローカル編集における最先端性能を実現し,自動計測とユーザスタディの両方においてベースライン手法を超越した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:04:05 GMT)
Con4m: Context-aware Consistency Learning Framework for Segmented Time Series Classification [12.7] 時系列分類(TSC)は、シーケンス全体を分類するか、セグメント化されたサブシーケンスを分類する2つの設定を含む。
MVDの特徴はセグメンテーションされたTSCに固有の課題をもたらすが、既存の研究でほとんど見落とされた。
連続セグメントの識別にコンテキスト情報を効果的に活用する新しい一貫性学習フレームワークCon4mを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:57:13 GMT)
Quantum Advantage via Solving Multivariate Quadratics [12.6] p_i(x_n)=y_i_iin [m]$ over $mathbbF$。
解は高い確率で存在するが、古典的暗号解析に基づく解を見つけることは困難である。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:10:10 GMT)
Hammer: Towards Efficient Hot-Cold Data Identification via Online Learning [12.6] ビッグデータとクラウドコンピューティング環境におけるストレージリソースの管理には、データの"コールド"と"ホット"状態の正確な識別が必要である。
ルールベースのアルゴリズムや初期のAIテクニックといった従来の手法は、動的ワークロードと苦労することが多い。
本稿では,オンライン学習戦略に基づく新たなソリューションを提案し,精度の向上と運用コストの低減を図る。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 06:46:16 GMT)
A probabilistic framework for learning non-intrusive corrections to long-time climate simulations from short-time training data [12.6] 本稿では,カオスシステムの非侵襲的に解けない長期シミュレーションにニューラルネットワークモデルをトレーニングするための戦略を提案する。
トレーニングで見られるデータより30倍以上長い時間的地平線上での異方性統計を正確に予測する能力を示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:59:47 GMT)
Reconciling Semantic Controllability and Diversity for Remote Sensing Image Synthesis with Hybrid Semantic Embedding [12.3] 本稿では,HySEGGAN(Hybrid Semantic Embedding Guided Geneversarative Adversarial Network)を提案する。
特徴記述をベースとして,局所的セマンティックレイアウトの微粒化を調整するハイブリッドセマンティック・エンベディング法を提案する。
セマンティック・リファインメント・ネットワーク(SRN)が導入された。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 07:51:36 GMT)
Semantically-Prompted Language Models Improve Visual Descriptions [12.3] 本稿では,表現力のある視覚記述を生成する新しい手法であるV-GLOSS: Visual Glossesを提案する。
V-GLOSSは視覚的記述を改善し、画像分類データセットのゼロショット設定において強い結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:58:28 GMT)
Dynamics-Aware Gaussian Splatting Streaming Towards Fast On-the-Fly Training for 4D Reconstruction [12.1] 現在の3DGSベースのストリーミング手法は、ガウス原始体を均一に扱い、密度化されたガウスを常に更新する。
そこで本研究では, 反復的流動性4次元動的空間再構成のための新しい3段階パイプラインを提案する。
提案手法は,オンライン4次元再構成における最先端性能を実現し,実時間トレーニング速度の20%向上,表現品質の向上,リアルタイムレンダリング能力の向上を実証する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:47:47 GMT)
BIP3D: Bridging 2D Images and 3D Perception for Embodied Intelligence [11.9] 画像中心の3次元知覚モデルBIP3Dを導入し,点中心の手法の限界を克服する。
我々は、事前学習された2次元視覚基盤モデルを利用して意味理解を強化し、空間理解を改善するために空間拡張モジュールを導入する。
我々の実験では、BIP3Dは、EmbodiedScanベンチマークで現在の最先端結果より優れており、3D検出タスクでは5.69%、視覚的グラウンドタスクでは15.25%の改善が達成されている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:35:42 GMT)
ZT-SDN: An ML-powered Zero-Trust Architecture for Software-Defined Networks [11.9] Software-Defined Networks におけるネットワークアクセス制御の学習と実施のためのフレームワーク ZT-SDN を提案する。
ZT-SDNは基盤となるネットワークからデータを収集し、エンティティをグラフとして通信することで実行されるネットワークの"トランザクション"をモデル化する。
許可されたプロトコルスタックやポート番号など、ネットワークデータから直接トランザクションパターンを抽出するために、新しい教師なしの学習アプローチを使用する。
実ネットワークデータセットを用いてネットワーク条件を変化させる際の,異常なネットワークアクセスの検出と許容フローの悪用について,本フレームワークの有効性を示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:49:27 GMT)
RankByGene: Gene-Guided Histopathology Representation Learning Through Cross-Modal Ranking Consistency [11.8] ランク付けに基づくアライメント損失を用いて、遺伝子と画像の特徴を整列する新しいフレームワークを提案する。
そこで我々は,教師と学生のネットワークアーキテクチャを用いた自己指導型知識蒸留を用いて,アライメントの安定性をさらに向上させる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:08:28 GMT)
Efficient and Robust Registration on the 3D Special Euclidean Group [11.8] 高精度で頑健で高速な3Dスキャンの登録方法を提案する。
リー群の幾何学的性質と、反復的に再重み付けされた最小二乗最適化によって得られるロバスト性を利用する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:57:30 GMT)
Social Media Algorithms Can Shape Affective Polarization via Exposure to Antidemocratic Attitudes and Partisan Animosity [11.8] 偏光性のあるコンテンツの効果をテストするために,フィードをリアルタイムに再ランクする手法を開発した。
AAPA被曝が減少し、AAPA被曝が増加すると、より肯定的な外部感情が観察される。
これらの知見は、感情分極を緩和するフィードアルゴリズムを開発するための潜在的な経路を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 00:55:07 GMT)
Leapfrog Latent Consistency Model (LLCM) for Medical Images Generation [11.6] 本稿では,MedImgsデータセットに基づく再学習拡散モデルから抽出したLapfrog Latent Consistency Model (LLCM)を提案する。
本モデルは,医用画像の生成における最先端性能を示す。
実験の結果, 犬心X線画像の既存モデルよりも優れていた。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:19:58 GMT)
Facial Features Matter: a Dynamic Watermark based Proactive Deepfake Detection Approach [11.5] 本稿では,顔特徴に基づく能動的深度検出法(FaceProtect)を提案する。
本稿では,128次元顔特徴ベクトルを入力として利用するGODWGM(One-way Dynamic Watermark Generating Mechanism)を提案する。
また, ステガノグラフィとGODWGMを併用し, ベンチマーク透かしの同時送信を可能にするWatermark-based Verification Strategy (WVS)を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:49:08 GMT)
MultiADE: A Multi-domain Benchmark for Adverse Drug Event Extraction [11.5] アクティブな有害事象監視は、異なるデータソースからの逆薬物イベント(ADE)を監視する。
ほとんどのデータセットや共有タスクは、特定のタイプのテキストからADEを抽出することに焦点を当てている。
ドメインの一般化 - 新しい、目に見えないドメイン(テキストタイプ)でうまく機能する機械学習モデルの能力は、まだ解明されていない。
我々はMultiADEと名づけた有害薬物イベント抽出のためのベンチマークを構築した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 21:40:35 GMT)
Design-o-meter: Towards Evaluating and Refining Graphic Designs [11.4] 本稿では,グラフィックデザインの良さを定量化するデータ駆動手法であるDesign-o-meterを紹介する。
私たちの知る限りでは、Design-o-meterは統一されたフレームワークで設計をスコア付けし洗練する最初のアプローチです。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:17:46 GMT)
Trading off performance and human oversight in algorithmic policy: evidence from Danish college admissions [11.4] 学生の退学は教育機関にとって重要な関心事である。
シーケンシャルなAIモデルはより正確で公正な予測を提供する。
入場決定を導くための単純なAIモデルでさえ、大きな経済的利益をもたらすと見積もっている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 21:12:54 GMT)
J-Invariant Volume Shuffle for Self-Supervised Cryo-Electron Tomogram Denoising on Single Noisy Volume [11.2] Cryo-Electron Tomography (Cryo-ET) は、近ネイティブ状態における細胞構造の詳細な3次元可視化を可能にする。
Cryo-ETは画像の制約により信号対雑音比が低い。
本稿では,Cryo-ETボリュームの画像を1つのノイズボリュームで表現する,新しい自己教師型学習モデルを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:06:12 GMT)
Agnostic Learning of Arbitrary ReLU Activation under Gaussian Marginals [10.9] 正方形損失目標を持つガウスの辺縁部における任意のバイアスのReLU活性化(あるいはニューロン)を学習する問題を考察する。
我々の主な成果は時間統計クエリ(SQ)アルゴリズムであり、任意のバイアスに対して最初の定数係数近似を与える。
我々のアルゴリズムは、勾配降下に基づく既存のアルゴリズムから興味深い逸脱を示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:18:23 GMT)
ArrivalNet: Predicting City-wide Bus/Tram Arrival Time with Two-dimensional Temporal Variation Modeling [10.8] バスと路面電車のための2次元時間変動に基づく多段階ATPであるtextitArrivalNetを提案する。
1次元の時間列を周期内および周期間変分に分解し、2次元テンソルに再キャストする。
異なる周波数で変換された2Dブロックは、コンピュータビジョンのバックボーンで効果的な学習を可能にする画像のような特徴表現を持つ。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 06:59:27 GMT)
Summarizing Bayesian Nonparametric Mixture Posterior -- Sliced Optimal Transport Metrics for Gaussian Mixtures [10.7] 非パラメトリック混合モデルにおける後部推論を要約する新しい手法を提案する。
混合度(または混合度)の密度推定を推定対象として優先順位付けする。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:15:38 GMT)
The AI Alignment Paradox [10.7] AIモデルを私たちの価値観と整合させるほど、敵がモデルを誤アライズするのが容易になるかもしれません。
AIの現実世界への影響が増大しているため、研究者の広いコミュニティがAIアライメントパラドックスを認識していることが不可欠である。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:55:11 GMT)
Enhancing Molecular Design through Graph-based Topological Reinforcement Learning [10.6] 本稿では,化学データと構造データを統合したグラフベーストポロジカル強化学習(GraphTRL)を提案する。
評価の結果、GraphTRLは既存のアフィニティ予測法よりも優れており、薬物発見を加速するための有望なアプローチを提供する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 04:45:55 GMT)
PointRecon: Online Point-based 3D Reconstruction via Ray-based 2D-3D Matching [10.6] 単眼RGBビデオからオンラインのポイントベース3D再構成手法を提案する。
我々のモデルは、シーンのグローバルなポイントクラウド表現を維持し、新しい画像が観察されるにつれて、特徴とポイントの3D位置を継続的に更新する。
ScanNetデータセットを用いた実験により,オンラインMVS手法と同等の品質を達成できた。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 01:35:33 GMT)
Scaling Down to Scale Up: A Guide to Parameter-Efficient Fine-Tuning [10.5] 本稿は,2019年前半から2024年半ばにかけて発行された50以上の論文を対象とした,パラメータ効率の高い微調整手法の体系的概要について述べる。
幅広い手法を網羅し,詳細な方法比較を行う分類法を提案する。
また,15種類のPEFT法を用いて,最大11Bパラメータのモデル上での性能と効率を評価する実験を行った。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:02:26 GMT)
AnyText2: Visual Text Generation and Editing With Customizable Attributes [10.2] 本稿では,自然シーン画像の生成と編集において,多言語テキスト属性を正確に制御する新しい手法であるAnyText2を紹介する。
従来のAnyTextと比較して、私たちの新しいアプローチはイメージリアリズムを強化するだけでなく、推論速度の19.8%も向上します。
AnyTextの拡張として、この方法では、各行の属性をカスタマイズすることができ、それぞれ中国語と英語のテキスト精度が3.3%と9.3%向上した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:31:56 GMT)
Optimizing Social Media Annotation of HPV Vaccine Skepticism and Misinformation Using Large Language Models: An Experimental Evaluation of In-Context Learning and Fine-Tuning Stance Detection Across Multiple Models [10.2] 我々は,HPVワクチン関連ツイートに対するスタンス検出のためのソーシャルメディアコンテンツアノテーションのスケールアップのための最適戦略を実験的に決定する。
一般に、インコンテキスト学習は、HPVワクチンのソーシャルメディアコンテンツに対するスタンス検出において微調整よりも優れる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 04:19:32 GMT)
Robustness and Confounders in the Demographic Alignment of LLMs with Human Perceptions of Offensiveness [10.2] 大規模言語モデル(LLM)は人口統計学的バイアスを示すことが知られているが、複数のデータセットにまたがってこれらのバイアスを体系的に評価する研究は少ない。
以上の結果から、人口統計学的特徴、特に人種、影響のアライメントはデータセット間で矛盾し、しばしば他の要因と絡み合っていることが明らかとなった。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:22:35 GMT)
Exploring Facets of Language Generation in the Limit [10.2] 任意の可算言語コレクションは、その極限において非一様生成の強い特性を持つ生成子を持つことを示す。
我々は,[KM24]の生成アルゴリズムにおける妥当性と幅の緊張関係を,徹底的な生成の定義を導入して定式化する。
以上の結果から,有効性と広さのトレードオフは,その限界における生成に固有であることが示唆された。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:13:40 GMT)
Leveraging Large Language Models to Measure Gender Representation Bias in Gendered Language Corpora [10.0] テキストコーパスにおけるジェンダーバイアスは、社会的不平等の永続性と増幅につながる可能性がある。
テキストコーパスにおけるジェンダー表現バイアスを計測する既存の手法は、主に英語で提案されている。
本稿では,スペインのコーパスにおけるジェンダー表現バイアスを定量的に測定する手法を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 12:03:34 GMT)
NeuroGraph: Benchmarks for Graph Machine Learning in Brain Connectomics [9.8] グラフベースのニューロイメージングデータセットのコレクションであるNeuroGraphを紹介する。
行動的特徴と認知的特徴の複数のカテゴリを予測するための実用性を実証する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:39:16 GMT)
The Zamba2 Suite: Technical Report [9.8] Zamba2は1.2B、2.7B、7.4BパラメータハイブリッドのMamba2変換器である。
それは彼らのクラスの主要なオープンウェイトモデルに対して、アートパフォーマンスの状態を達成します。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:55:20 GMT)
Dynamic Attention-Guided Diffusion for Image Super-Resolution [9.4] 画像超解法(SR)における拡散モデルは、すべての画像領域を均一に処理し、全体の画質を損なうリスクがある。
画像SRのための動的注意誘導拡散プロセス「あなた専用拡散領域」(YODA)を提案する。
我々は,先進拡散法SR3,DiffBIR,SRDiffを拡張することで,YODAを実証的に検証する。
実験では,PSNR,SSIM,LPIPSの計測値にまたがって,対面および一般SRタスクにおける新しい最先端性能を示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:05:17 GMT)
Lightweight Frequency Masker for Cross-Domain Few-Shot Semantic Segmentation [9.4] 大規模なソースドメインデータセット上でモデルを事前トレーニングするために、クロスドメイン・ショットセグメンテーション(CD-FSS)が提案されている。
本稿では,Amplitude-Phase Masker (APM) モジュールとAdaptive Channel Phase Attention (ACPA) モジュールによるチャネル相関の低減を図る。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 06:41:07 GMT)
Learning Lifted STRIPS Models from Action Traces Alone: A Simple, General, and Scalable Solution [9.4] アクショントレースからSTRIPSアクションモデルを学ぶことは、ドメインの述語も学習するので、難しい問題です。
この研究では、よく知られたLOCMシステムと同様、SATアプローチと同様にスケーラブルで完全である新しいアプローチが導入された。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:09:50 GMT)
MSSF: A 4D Radar and Camera Fusion Framework With Multi-Stage Sampling for 3D Object Detection in Autonomous Driving [9.2] 本研究では,4次元レーダとカメラを用いた簡易かつ効果的なマルチステージサンプリング・フュージョン(MSSF)ネットワークを提案する。
MSSFは、View-of-Delft(VoD)とTJ4DRadsetデータセットの3D平均精度を7.0%と4.0%改善している。
さらには、VoDデータセット上の古典的なLiDARベースのメソッドを超越している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:45:23 GMT)
PPLqa: An Unsupervised Information-Theoretic Quality Metric for Comparing Generative Large Language Models [9.0] 生成型大規模言語モデル(LLM)の応答の質を測定するため,計算が容易で言語に依存しない情報理論の指標であるPPLqaを提案する。
この方法と測定基準により、ユーザが生成言語モデルに応答の質をランク付けし、与えられたタスクに最適なモデルを選択することができる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 19:28:06 GMT)
Improving the accuracy of automated labeling of specimen images datasets via a confidence-based process [9.0] 本稿では,自動ラベリング精度を大幅に向上させる手法を提案する。
初期精度の86%を生んだナイーブモデルでは,性能が向上することが実証された。
このアプローチを様々な方法で検証した後、60,000以上のハーバリウム標本の大規模なデータセットに注釈を付けました。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:12:36 GMT)
IRASNet: Improved Feature-Level Clutter Reduction for Domain Generalized SAR-ATR [8.9] 本研究ではIRASNetと呼ばれるドメイン一般化SAR-ATRのためのフレームワークを提案する。
IRASNetは効果的な機能レベルのクラッタ削減とドメイン不変の機能学習を可能にする。
IRASNetは、性能を向上するだけでなく、特徴レベルのクラッタ低減を大幅に改善し、レーダ画像パターン認識の分野での貴重な進歩となる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 00:24:06 GMT)
Random Fourier Signature Features [8.8] 代数はシグネチャカーネルと呼ばれる任意の長さの列の類似性の最も強力な尺度の1つを生み出す。
署名カーネルのスケールを、配列の長さと数で2次的に計算する以前のアルゴリズム。
本研究では,非ユークリッド領域に作用するシグネチャカーネルのランダムなフーリエ特徴量に基づくアクセラレーションを開発する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 12:30:38 GMT)
Heavy-tailed Contamination is Easier than Adversarial Contamination [8.6] ハマー (Huber, 1960) にさかのぼる統計学と計算機科学のコミュニティにおける研究の成果は、統計学的および計算学的に効率的なアウトリア・ローバスト推定器に繋がった。
2つの特定の外れ値モデル、すなわち対向モデルと重尾モデルが注目されている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 19:00:33 GMT)
Analytic Continuation by Feature Learning [8.5] 解析的継続は、実時間グリーン関数からリアルタイムスペクトル関数を再構成することを目的としている。
本稿では,スペクトル関数の予測精度を高めるために,特徴学習ネットワーク(FL-net)と呼ばれる新しいニューラルネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:12:27 GMT)
Learning General Continuous Constraint from Demonstrations via Positive-Unlabeled Learning [8.4] 本稿では,実証から連続的,任意の,あるいは非線形な制約を推測する,正の未ラベル(PU)学習手法を提案する。
提案手法の有効性を2つのMujoco環境で検証した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 12:58:21 GMT)
Understanding Generalizability of Diffusion Models Requires Rethinking the Hidden Gaussian Structure [8.3] 学習したスコア関数の隠れた性質を調べた結果,拡散モデルの一般化可能性について検討した。
拡散モデルが記憶から一般化へと遷移するにつれて、対応する非線形拡散デノイザは線形性を増加させる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:48:41 GMT)
TSkips: Efficiency Through Explicit Temporal Delay Connections in Spiking Neural Networks [8.1] 本稿では、時間的遅延を明示する前向きおよび後向きの接続を含むスパイキングニューラルネットワークを増強するTSkipsを提案する。
これらの接続は、長期的アーキテクチャをキャプチャし、長いシーケンスのスパイクフローを改善する。
4つのイベントベースデータセットにアプローチの有効性を示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:58:18 GMT)
Understanding LLM Embeddings for Regression [8.1] 本論文は埋め込み型回帰に関する最初の包括的な研究の1つを提供する。
LLMを機能として組み込むことは,従来の機能工学よりも高次元回帰作業に有効であることを示す。
私たちは異なるモデル効果、特にモデルのサイズと言語理解の貢献を定量化します。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:33:51 GMT)
Engagement-Driven Content Generation with Large Language Models [8.0] 大規模言語モデル(LLM)は1対1の相互作用において重要な説得能力を示す。
本研究では,相互接続型ユーザにおけるLCMの社会的影響と複雑な意見力学について検討する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:05:40 GMT)
PRIMUS: Pretraining IMU Encoders with Multimodal Self-Supervision [7.9] パーソナルデバイスに埋め込まれた慣性測定ユニット(IMU)は、健康と健康に大きな応用を可能にしている。
ラベル付きIMUデータは少ないが、ラベル付きまたは弱いラベル付きIMUデータを収集して人間の動きをモデル化することができる。
ビデオやテキストのモダリティに対して、"pretrain and adapt"アプローチでは、ラベル付きまたは弱いラベル付きデータを大量に使用して、事前トレーニングを行い、強力な特徴抽出器を構築し、その後、限定ラベル付きデータを使用して特定のタスクに適応する。
このアプローチはIMUドメインでは,(1)事前学習手法がIMUの文脈であまり理解されていないこと,の2つの理由から広く採用されていない。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:46:30 GMT)
Optimized Vessel Segmentation: A Structure-Agnostic Approach with Small Vessel Enhancement and Morphological Correction [7.9] マルチモーダル血管セグメンテーションのための小型血管拡張と形態的補正を取り入れた構造診断手法を提案する。
本手法は,より優れたセグメンテーション精度,一般化,34.6%の接続性向上を実現し,臨床応用の可能性を強調した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:38:30 GMT)
Feature-interactive Siamese graph encoder-based image analysis to predict STAS from histopathology images in lung cancer [7.8] 病理組織学はSTAS検出のゴールドスタンダードであるが、従来の方法では主観的、時間的、誤診の傾向が強い。
肺がん画像からSTASを予測するために,機能的対話型シームズグラフエンコーダを用いた画像解析モデルVERNを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:21:52 GMT)
Enhancing Autonomous Driving Safety through World Model-Based Predictive Navigation and Adaptive Learning Algorithms for 5G Wireless Applications [7.7] NavSecureは、脅威を予測し、安全なルートを定式化するビジョンベースのナビゲーションフレームワークである。
我々のアプローチは、大規模な実世界の試行錯誤学習の必要性を減らす。
NavSecureは、衝突防止やリスク低減など、重要な安全性指標に優れています。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:16:07 GMT)
FLARE: FP-Less PTQ and Low-ENOB ADC Based AMS-PiM for Error-Resilient, Fast, and Efficient Transformer Acceleration [7.4] 本稿では,DQ-Q処理を不要にし,FPUおよび分割自由非線形処理を導入し,低ENOB-ADCに基づくスパース行列ベクトル乗法を用いるAMS-PiMアーキテクチャを提案する。
RAPは数値安定性を維持しながら、エラー回復力、面積/エネルギー効率、計算速度を改善する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:01:35 GMT)
Forecasting Unseen Points of Interest Visits Using Context and Proximity Priors [7.3] 機械学習モデルは、個人が過去の訪問パターンを分析することによって、将来訪問する可能性が高いポイント・オブ・関心(POI)を予測することができる。
従来の研究では、各クラスがPOIに対応するPOI分類器を学習することでこの問題に対処していた。
本稿では,学習データの外部に新たなPOIを予測するためのモデルを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:50:10 GMT)
Locating the Leading Edge of Cultural Change [7.3] 社会証拠との整合性は,文章が最上四分詞を通して表現される場合に最も強いことを示す。
これは、テキストの影響は、高いレベルのイノベーションを維持することよりも、最も前向きな瞬間に依存する可能性があることを示唆している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:56:38 GMT)
Self-supervised learning for radio-astronomy source classification: a benchmark [7.2] 近日発売のスクエア・キロメーター・アレイ(SKA)望遠鏡は、電波天文学において重要な一歩を踏み出した。
光写真画像に事前訓練された従来の視覚モデルは、電波干渉画像では最適に動作しない可能性がある。
本研究では,ラジオ天文学へのセルフ・スーパーバイザード・ラーニングの適用について検討する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 09:46:23 GMT)
Reliable Evaluation of Attribution Maps in CNNs: A Perturbation-Based Approach [7.2] 本稿では、畳み込みニューラルネットワーク(CNNGrads)の予測の解釈において中心的な役割を果たす属性マップの評価手法を提案する。
本研究では,広く使用されている挿入・削除指標が,ランキングの信頼性に影響を及ぼす分布シフトの影響を受けやすいことを示す。
提案手法は, 画素修正を逆方向の摂動に置き換えることであり, より堅牢な評価フレームワークを提供する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:57:56 GMT)
Leveraging Hierarchical Prototypes as the Verbalizer for Implicit Discourse Relation Recognition [7.1] 暗黙の言論関係認識は、明示的な言論接続によってリンクされていないテキストのスパン間の関係を決定することを含む。
それまでの作業は、暗黙の言論関係認識のための手話代行にのみ依存していた。
特定のクラスレベルの意味的特徴をキャプチャするプロトタイプと、異なるクラスに対する階層的なラベル構造を、動詞化子として活用する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 12:01:04 GMT)
Constructing quantum codes from any classical code and their embedding in ground space of local Hamiltonians [7.1] 古典的なコードを取り、対応するQECコードを明示的に構築するフレームワークを導入する。
具体的な利点は、古典的な符号の望ましい性質が、結果の量子コードの設計に自動的に組み込まれることである。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:19:50 GMT)
Constructions and performance of hyperbolic and semi-hyperbolic Floquet codes [7.1] 閉双曲曲面のカラーコードタイリングから派生したフロケ符号の族を構築する。
また、距離スケーリングを改善した半双曲型フロケット符号も構築する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:55:45 GMT)
IRLab@iKAT24: Learned Sparse Retrieval with Multi-aspect LLM Query Generation for Conversational Search [7.0] iKAT 2024は、対話アシスタントの進化に焦点を当て、対話と応答をパーソナライズされたユーザー知識から適応することができる。
このトラックには、Personal Textual Knowledge Base(PTKB)と会話型AIタスク(通訳ランキングや応答生成など)が組み込まれている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:18:35 GMT)
Structural Group Unfairness: Measurement and Mitigation by means of the Effective Resistance [6.7] ソーシャルネットワークは、コミュニティ内の関係、信頼の規範、相互性として定義された社会資本の分配に寄与する。
集団レベルでの社会的資本の定量化方法の欠如は、保護属性に基づいてグループを定義した場合に特に重要である。
グループ分離, グループ径, グループ制御という, グループ資本の効果的な抵抗に基づく3つの尺度を導入し, グループを保護属性の値に応じて定義する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:46:06 GMT)
MemFusionMap: Working Memory Fusion for Online Vectorized HD Map Construction [6.7] オンラインHDマップ構築のための時間的推論機能を強化した新しい時間的融合モデルを提案する。
具体的には,動作メモリの融合モジュールにコントリビュートして,モデルメモリの容量を向上し,フレームの履歴を解析する。
また、時間重なり情報と車両軌道についてモデルに明確に通知する新しい時間重なりヒートマップを設計する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:37:23 GMT)
BrightVAE: Luminosity Enhancement in Underexposed Endoscopic Images [6.7] 過度に露出した内視鏡画像は、コントラストの低下と不均一な明るさに悩まされることが多い。
階層型ベクトル量子変分オートエンコーダ(階層型VQ-VAE)に基づくアーキテクチャであるBrightVAEを紹介する。
私たちのアーキテクチャは、内視鏡画像に固有のユニークな課題に取り組むために慎重に設計されています。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 01:41:27 GMT)
Adaptive Group Robust Ensemble Knowledge Distillation [6.5] 適応型グループロバスト・アンサンブル知識蒸留(AGRE-KD)を提案する。
本手法は, バイアスモデルから逸脱した傾き方向の教師を重み付けすることで, 最低性能のサブグループを改善するための知識を持つ教師を選択的に選択する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:44:51 GMT)
FairAdapter: Detecting AI-generated Images with Improved Fairness [6.5] フェアアダプタ(Fairadapter)という新しいフレームワークを提案する。
既存の最先端手法と比較して,本モデルでは公正性性能が向上する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 06:23:58 GMT)
Comparison of Tiny Machine Learning Techniques for Embedded Acoustic Emission Analysis [6.4] 本稿では,音響放射(AE)信号の分類のために,機械学習と異なる入力データ形式を比較した。
AE信号は多くの構造的健康モニタリングアプリケーションにおいて有望なモニタリング技術である。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:58:25 GMT)
Universal and Context-Independent Triggers for Precise Control of LLM Outputs [6.4] 大規模言語モデル(LLM)は、自動コンテンツ生成や重要な意思決定システムといったアプリケーションで広く採用されている。
勾配に基づくホワイトボックス攻撃技術の最近の進歩は、ジェイルブレイクやシステムプロンプトリークといったタスクにおいて有望であることを示している。
そこで本研究では,このようなトリガを効果的に発見し,攻撃の有効性を評価する手法を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:17:18 GMT)
Multipartite Entanglement in Crossing the Quantum Critical Point [6.2] 臨界点を横断する遅い量子クエンチの多部絡みについて検討する。
量子イジングモデルとLipkin-Meshkov-Glickモデルは,それぞれ局所および完全連結量子系である。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 06:24:30 GMT)
Safe Multi-Agent Reinforcement Learning with Convergence to Generalized Nash Equilibrium [6.2] マルチエージェント強化学習(MARL)は協調作業において顕著な成功を収めた。
MARLエージェントを現実世界のアプリケーションにデプロイすることは、重大な安全性上の課題を示す。
我々は,エージェントが訪れるすべての状態において,安全要件を強制する,$textitstate-wise$制約付き安全なMARLの新たな理論的枠組みを提案する。
複雑な高次元システムにおける実践的展開のために、$textitMulti-Agent Dual Actor-Critic$ (MADAC)を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:08:42 GMT)
System 2 Reasoning via Generality and Adaptation [5.8] 本稿では,システム2推論の高度化における既存手法の限界について考察する。
これらのギャップに対処するための4つの重要な研究指針を提案する。
我々は,AI(Artificial General Intelligence, AGI)に必要な推論能力に,計算モデルを近づけることで,一般化と適応の能力の向上を目指している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 07:18:19 GMT)
Continuous-variable quantum digital signatures that can withstand coherent attacks [5.8] 量子デジタルシグネチャ(QDS)は、量子法則に基づく古典的メッセージの真正性、完全性、非再考を保証する。
我々は,最先端の忠実度テスト関数を用いて,一般的なコヒーレント攻撃に耐えるように設計されたCV QDSプロトコルを提案する。
その結果、メガビットメッセージ署名タスクにおいて、8桁の署名長が大幅に削減された。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 06:39:26 GMT)
Enabling Data Confidentiality with Public Blockchains [5.7] 相互運用アプリケーション(MARTSIA)のためのトランザクションシステムに対するマルチオーソリティアプローチ
MARTSIAは、メッセージ部分のレベルで共有データの読み取りアクセス制御を可能にする。
Multi-Authority Attribute-Based Encryption (MA-ABE)に基づいて、MARTSIAはメッセージ部分のレベルで共有データの読み取りアクセス制御を可能にする。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:13:53 GMT)
Nd-BiMamba2: A Unified Bidirectional Architecture for Multi-Dimensional Data Processing [5.7] 我々はNd-BiMamba2という新しい多次元双方向ニューラルネットワークアーキテクチャを提案する。
Nd-BiMamba2は、1D、2D、3Dデータを効率的に処理する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 23:45:15 GMT)
Neural 4D Evolution under Large Topological Changes from 2D Images [5.7] 本研究では,大きなトポロジ的変化の下での3次元神経進化を4次元に拡張する上での課題に対処する。
i) 変形を識別・符号化する新しいアーキテクチャを導入し, SDF を学習し, (ii) 時間的一貫性を強制する手法を提案する。
2次元画像から直接の学習を容易にするために,RGB画像から幾何学や外観を遠ざける学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:47:42 GMT)
Boosting Cybersecurity Vulnerability Scanning based on LLM-supported Static Application Security Testing [5.6] 大規模言語モデル(LLM)は、強力なコード解析機能を示しているが、静的トレーニングデータとプライバシリスクは、その有効性を制限している。
LSASTは,LSLMをSASTスキャナと統合し,脆弱性検出を強化する手法である。
静的な脆弱性分析のための新しいベンチマークを設定し、堅牢でプライバシを重視したソリューションを提供しました。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 09:44:01 GMT)
Understanding Model Selection For Learning In Strategic Environments [5.6] モデルが持つデータ量が多ければ多いほど、パフォーマンスが向上します。
本稿では,アクションゲームにおけるアクションセットとして,エージェントがさまざまなモデルクラスを選択しようとする新しいパラダイムを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:27:19 GMT)
Physical and Software Based Fault Injection Attacks Against TEEs in Mobile Devices: A Systemisation of Knowledge [5.6] Trusted Execution Environments (TEE) は、現代のセキュアコンピューティングの重要なコンポーネントである。
機密データを保護し、セキュアな操作を実行するために、プロセッサに分離されたゾーンを提供する。
その重要性にもかかわらず、TEEは障害注入(FI)攻撃に対してますます脆弱である。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:59:44 GMT)
Continuous Automatic Polarization Channel Stabilization from Heterodyne Detection of Coexisting Dim Reference Signals [5.6] 量子ネットワークは、容易さと精度のために偏極状態の情報を符号化し続けている。
展開されたファイバーによって誘導される可変環境分極変換は、展開された量子ネットワークの補正を必要とする。
本稿では,APC(Automatic polarization compensation)の新たな手法を提案し,その性能を大都市圏量子ネットワーク上で実証する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:58:01 GMT)
QMA vs. QCMA and Pseudorandomness [5.5] そのようなオラクルは、ある量子擬ランダム性予想が成立するときに存在することを示す。
私たちの結果は、"Win-win"シナリオの確立と見なすことができます。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 19:35:05 GMT)
Neuro-Symbolic Evaluation of Text-to-Video Models using Formalf Verification [5.5] 我々は,新しい合成ビデオ評価指標であるNeuS-Vを紹介する。
NeuS-Vは、ニューロシンボリック形式検証技術を用いて、テキストとビデオのアライメントを厳格に評価する。
既存の指標と比較すると,NeuS-Vは5倍以上の相関性を示すことがわかった。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 23:59:12 GMT)
Domain and Range Aware Synthetic Negatives Generation for Knowledge Graph Embedding Models [5.4] 低次元空間におけるエンティティとエッジを表現する知識グラフ埋め込みモデルは、知識グラフ(KG)の完成と探索に関わるタスクの解決に非常に成功した。
トレーニングの鍵となる側面の1つは、真の肯定と偽の肯定(否定)を区別するように教えることである。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:17:32 GMT)
Mode-conditioned music learning and composition: a spiking neural network inspired by neuroscience and psychology [5.2] そこで我々は,脳のメカニズムや心理的理論にインスパイアされたスパイクニューラルネットワークを提案し,音楽モードとキーを表現する。
我々の研究は、音楽を学び、生成するだけでなく、人間の認知と人工知能のギャップを埋めるシステムを作ることを目指している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 07:29:26 GMT)
Distillable entanglement under dually non-entangling operations [5.2] 二重非絡み合い (DNE) 演算のセットの下で, 絡み合い蒸留の正確な解を与える。
そこで本研究では,DNE蒸留可能なエンタングルメントについて,このエンタングルメントの正規化相対エントロピーの修正版を用いて,その引数を分離可能な測定値で測定した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:32:40 GMT)
Deep sr-DDL: Deep Structurally Regularized Dynamic Dictionary Learning to Integrate Multimodal and Dynamic Functional Connectomics data for Multidimensional Clinical Characterizations [5.2] 静止機能MRI(r-fMRI)接続と拡散テンソルイメージング(DTI)トラクトグラフィーから補完情報を共同でモデル化する新しい統合フレームワークを提案する。
本フレームワークは,コネクトロミクスデータの生成モデルと,行動スコアを予測するディープネットワークを結合する。
我々のハイブリッドモデルは、臨床結果予測における最先端のアプローチよりも優れており、脳組織の解釈可能なマルチモーダルニューラルシグネチャを学習する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 04:16:41 GMT)
A Deep-Generative Hybrid Model to Integrate Multimodal and Dynamic Connectivity for Predicting Spectrum-Level Deficits in Autism [5.2] 我々のフレームワークの生成部分は、構造的に規則化された動的辞書学習(sr-DDL)モデルである。
本フレームワークの深部はLSTM-ANNブロックであり,Sr-DDL負荷の経時的変化をモデル化し,多次元的臨床的重症度を予測する。
自閉症スペクトラム障害(ASD)と診断された57例のマルチスコア予測課題における枠組みの検証を行った。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 01:30:46 GMT)
LoRA-FAIR: Federated LoRA Fine-Tuning with Aggregation and Initialization Refinement [5.2] ファンデーションモデル(FM)は、タスク固有の微調整によって、多様なタスクにまたがる強力なパフォーマンスを実現する。
低ランク適応 (LoRA) のようなローランク適応 (LoRA) 手法は、少ないパラメータをチューニングするための低ランク行列を導入することで、このコストを削減する。
LoRA-FAIRは計算と通信の効率を維持し、最先端の手法よりも優れた性能が得られる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:19:01 GMT)
A Constant Measurement Quantum Algorithm for Graph Connectivity [4.9] 定数数を用いてグラフ接続性を決定する新しい量子アルゴリズムを提案する。
これはZX計算から取られた非単位アーベルゲートに依存している。
このアルゴリズムは、アシラ量子ビットで修復できる状態崩壊を示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:44:00 GMT)
Gen-AI for User Safety: A Survey [4.9] 本書は,Gen-AI技術を用いたユーザ安全性に関するさまざまな作業の概要を包括的に紹介する。
具体的には、まず、Gen-AI技術が適用されたさまざまなドメイン(フィッシング、マルウェア、コンテンツモデレーション、偽造、物理的安全性など)を提供する。
次に、ユーザ安全の侵害を検出するために、さまざまなデータモダリティとともにGen-AI技術がどのように使用できるかを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 20:34:26 GMT)
Evaluating Language Models for Generating and Judging Programming Feedback [4.7] 大規模言語モデル(LLM)は、幅広い領域で研究と実践を変革してきた。
我々は,オープンソースのLCMのプログラミング課題に対する高品質なフィードバック生成における効率性を評価する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 01:13:13 GMT)
A Careful Examination of Large Language Model Performance on Grade School Arithmetic [4.6] 大規模言語モデル (LLM) は、数学的推論のための多くのベンチマークで驚くべき成功を収めた。
このパフォーマンスの一部は、実際にデータセットの汚染を反映している、という懸念が高まっている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:27:49 GMT)
Recursive Gaussian Process State Space Model [4.6] 動作領域とGPハイパーパラメータの両方に適応可能な新しいオンラインGPSSM法を提案する。
ポイントを誘導するオンライン選択アルゴリズムは、情報的基準に基づいて開発され、軽量な学習を実現する。
合成データセットと実世界のデータセットの総合的な評価は,提案手法の精度,計算効率,適応性を示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:22:59 GMT)
Open-Amp: Synthetic Data Framework for Audio Effect Foundation Models [4.6] 本稿では,大規模かつ多様なオーディオエフェクトデータを生成するための合成データフレームワークであるOpen-Ampを紹介する。
実験により, ギターエフェクトエンコーダの訓練に Open-Amp を用いることで, 複数のギターエフェクト分類タスクにおいて, 新たな最先端結果が得られることがわかった。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:27:59 GMT)
PoneglyphDB: Efficient Non-interactive Zero-Knowledge Proofs for Arbitrary SQL-Query Verification [4.3] 本稿では,機密性と証明性の両方をサポートするデータベースシステムであるPoneglyphDBを紹介する。
従来のデータベースとは異なり、PoneglyphDBは、生データがホストにのみ保持されることを保証することによって、機密性を高める。
PoneglyphDBは、既存の最先端のZKPメソッドよりも優れた機密性と信頼性の両方を効率的に達成することができる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:03:46 GMT)
Xmodel-1.5: An 1B-scale Multilingual LLM [4.3] 2兆のトークンで事前訓練された多言語大言語モデルであるXmodel-1.5を紹介する。
Xmodel-1.5は65,280個のトークンを持つカスタムユニグラムトークンライザを採用し、効率と精度の両方を最適化している。
このモデルは、タイ語、アラビア語、フランス語、中国語、英語など、複数の言語で競合する結果をもたらす。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:57:42 GMT)
Sketched Equivariant Imaging Regularization and Deep Internal Learning for Inverse Problems [4.3] 等変イメージング(EI)正則化は、ディープイメージングネットワークの教師なしトレーニングにおけるデファクト技術となっている。
本稿では,ランダムなスケッチ手法を応用したスケッチ付きEI正規化手法を提案する。
次に、スケッチしたEI正規化を拡張して、高速化された深層学習フレームワークを開発する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:29:47 GMT)
Ordinal Multiple-instance Learning for Ulcerative Colitis Severity Estimation with Selective Aggregated Transformer [4.3] 選択的アグリゲータトークンを用いた変圧器による患者レベルの重症度推定法を提案する。
本手法は, 各患者で撮影した画像から, 重篤な部分の特徴を効果的に収集することができる。
提案手法の2つのデータセットに対する有効性を示す実験を行った。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 06:11:35 GMT)
Mera: Memory Reduction and Acceleration for Quantum Circuit Simulation via Redundancy Exploration [4.3] メモリ使用量の削減とシミュレーションの高速化を目的として,マルチレベル最適化,すなわちMeraを提案する。
多数のスパース量子ゲートに対して、低レベルフルステートシミュレーションのための2つの圧縮された構造を提案する。
実験により, 圧縮された構造では量子ビット数が17から35に増加し, QNNの6.9倍の加速が達成された。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 20:07:31 GMT)
Scaling up the Evaluation of Collaborative Problem Solving: Promises and Challenges of Coding Chat Data with ChatGPT [4.3] 本稿では,ChatGPTを用いてCPSチャットデータを直接コードする際の知見を,複数のデータセットやコーディングフレームワークのパフォーマンスをベンチマークすることで報告する。
また,ChatGPTをベースとしたコーディングは,会話が口語言語によって特徴付けられるタスクにおいて,人間のコーディングよりも優れていた。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 20:06:53 GMT)
Harlequin: Color-driven Generation of Synthetic Data for Referring Expression Comprehension [4.2] Referring Expression(REC)は、自然言語表現によってシーン内の特定のオブジェクトを識別することを目的としており、視覚言語理解において重要なトピックである。
このタスクの最先端のメソッドは、一般的に高価で手動でラベル付けされたアノテーションを必要とするディープラーニングに基づいている。
テキストと視覚の両方を考慮したRECタスクのための人工データを生成する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 09:08:36 GMT)
RE-Bench: Evaluating frontier AI R&D capabilities of language model agents against human experts [4.1] 7つの挑戦的でオープンなMLリサーチエンジニアリング環境と、61人の専門家による71の8時間の試みのデータで構成されるRE-Benchを紹介します。
最高のAIエージェントは、環境当たりの合計時間予算が2時間与えられたとき、人間の専門家よりも4倍高いスコアを得る。
現在、人間は時間予算の増加に対してより良いリターンを示しており、8時間予算で上位AIエージェントのスコアをわずかに上回り、合計32時間(異なる試み)で上位AIエージェントのスコアを2倍にしている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:30:46 GMT)
UnMarker: A Universal Attack on Defensive Image Watermarking [4.0] 防衛的な透かしに対する最初の実践的普遍的な攻撃であるUnMarkerを紹介します。
UnMarkerは検出器のフィードバックを必要とせず、透かしスキームや類似したモデルに関する非現実的な知識も必要とせず、先進的な復調パイプラインも必要としない。
SOTAスキームに対する評価は、UnMarkerの有効性を証明する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:56:26 GMT)
Unified Semantic Log Parsing and Causal Graph Construction for Attack Attribution [4.0] マルチソースログは、進行中のシステムアクティビティの包括的概要を提供し、詳細な分析によって潜在的な脅威を検出することができる。
脅威検出の実践的なアプローチは、システム動作の分析を容易にするために、グラフを構築するためのエンティティトリプル(オブジェクト、アクション、オブジェクト)を明示的に抽出することである。
個別のログソースから複数のサブグラフをマージして因果グラフを構築するために意味解析を採用する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 21:40:19 GMT)
SemiKong: Curating, Training, and Evaluating A Semiconductor Industry-Specific Large Language Model [4.0] 大型言語モデル (LLM) は半導体業界におけるいくつかの問題に対処する可能性を実証している。
それらはしばしば汎用的なモデルであり、この分野の独特な課題に取り組むのに必要な専門知識を欠いている。
SemiKongは、カスタマイズされたプロプライエタリなモデルを開発するために使用できる基盤を提供する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:32:09 GMT)
Exploring the Robustness and Transferability of Patch-Based Adversarial Attacks in Quantized Neural Networks [4.0] 量子ニューラルネットワーク(QNN)は、リソース制約のあるプラットフォームへのディープラーニングモデルの効率的なデプロイにますます利用されている。
量子化はモデルのサイズと計算要求を減少させるが、その逆の堅牢性への影響は依然として不十分である。
局所的で視認性の高い摂動を特徴とするパッチベースの攻撃は、その伝達性とレジリエンスのために重大なセキュリティリスクを生じさせる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 07:05:35 GMT)
Regulator-Manufacturer AI Agents Modeling: Mathematical Feedback-Driven Multi-Agent LLM Framework [3.9] 本研究では,Large Language Models (LLMs) で拡張されたマルチエージェントモデリング手法を用いて,制御力学をシミュレートする。
本研究は,規制の変化が産業行動に与える影響を明らかにし,規制実践を改善する戦略的機会を特定することを目的とする。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:02:56 GMT)
XGrammar: Flexible and Efficient Structured Generation Engine for Large Language Models [3.9] 文脈自由文法は制約付き復号化による構造化生成を可能にするフレキシブルなアプローチである。
XGrammarは、大規模言語モデルのための柔軟で効率的な構造生成エンジンである。
XGrammarは、既存のソリューションで最大100倍のスピードアップを達成することができる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:01:37 GMT)
Don't Mesh with Me: Generating Constructive Solid Geometry Instead of Meshes by Fine-Tuning a Code-Generation LLM [3.9] 本稿では,表面構造型固体形状(CSG)を生成する3次元幾何生成のための新しいアプローチを提案する。
まず,境界表現幾何学(BREP)をCSGベースのPythonスクリプトに変換することで,コードスクリプトとして表現される3次元機械部品のデータセットを作成する。
次に、GPT-4を用いて自然言語でアノテーションを作成し、その結果のデータセットをコード生成LLMの微調整に使用する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:29:12 GMT)
Light-Matter Hybridization and Entanglement from the First-Principles [3.8] 我々は、光子場の非調和量子ゆらぎを記述できる変分スキーズ変換を導入する。
この形式主義は、光物質混成の理解のための第一原理の枠組みを提供するために、光物質混成の記述を強化する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:52:50 GMT)
Stable Neural Stochastic Differential Equations in Analyzing Irregular Time Series Data [3.7] 実世界の時系列データにおける不規則サンプリング間隔と欠落値は,従来の手法の課題である。
本稿では,Langevin-type SDE,Linear Noise SDE,Geometric SDEの3つの安定クラスを提案する。
本研究は,実世界の不規則時系列データを扱う上で,提案手法の有効性を示すものである。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 07:57:14 GMT)
SwissADT: An Audio Description Translation System for Swiss Languages [3.6] スイス語3言語と英語の最初の音声記述翻訳システムであるSwissADTについて紹介する。
スイスの多様な言語人口に対する情報アクセシビリティ向上を目的として,ADスクリプトをスイス語に自動翻訳する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:23:07 GMT)
Introducing Milabench: Benchmarking Accelerators for AI [3.6] AIワークロード、特にディープラーニングによって駆動されるワークロードは、ハイパフォーマンスコンピューティングシステムに新しい利用パターンを導入している。
ミルラは深層学習に特化した最大の学術研究センターの1つである。
コミュニティの多様な要件に対処するカスタムベンチマークスイートの開発の必要性を特定した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 21:36:19 GMT)
WaveMamba: Spatial-Spectral Wavelet Mamba for Hyperspectral Image Classification [3.5] 本稿では、ウェーブレット変換を空間スペクトルマンバアーキテクチャと統合し、HSI分類を強化する新しいアプローチであるWaveMambaを紹介する。
WaveMambaは既存のモデルを超え、ヒューストン大学のデータセットでは4.5%、パヴィア大学のデータセットでは2.0%の精度向上を実現している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 12:04:05 GMT)
On the Convergence of Loss and Uncertainty-based Active Learning Algorithms [3.5] 本研究では、勾配降下法(SGD)アルゴリズムを用いて機械学習モデルの学習に必要な収束率とデータサンプルサイズについて検討する。
線形分類器と線形分離可能なデータセットに対する2乗ヒンジ損失と類似のトレーニング損失関数を用いた収束結果を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 21:59:25 GMT)
How Sparse Can We Prune A Deep Network: A Fundamental Limit Viewpoint [3.4] ネットワークプルーニングは、ディープニューラルネットワークの記憶と計算の負担を軽減するために一般的に使用される尺度である。
我々は、急激な位相遷移点、すなわちプルーニング比の基本極限を特徴づけるために、第一原理的アプローチをとる。
我々は,大規模かつ非正のヘッセン行列を推定する際の課題に対処するために,効率的な対策を提供する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 12:39:18 GMT)
Dynamic Intelligence Assessment: Benchmarking LLMs on the Road to AGI with a Focus on Model Confidence [3.4] 我々は、AIモデルをテストするための新しい方法論であるDynamic Intelligence Assessment (DIA)を紹介する。
このフレームワークは、複数の試みにわたるモデルの信頼性と信頼性を評価するために、4つの新しいメトリクスを導入している。
付随するデータセットであるDIA-Benchには、さまざまなフォーマットで表示される可変パラメータを備えたチャレンジテンプレートのコレクションが含まれている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 20:15:01 GMT)
Efficient Pruning of Text-to-Image Models: Insights from Pruning Stable Diffusion [3.4] 本稿では,安定拡散2号の訓練後刈り込みに関する先駆的な研究について述べる。
テキスト・ツー・イメージ領域におけるモデル圧縮に対する重要なニーズに対処する。
本稿では,テキストエンコーダを47.5%,拡散生成器を35%にプルークする最適プルーニング構成を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:29:37 GMT)
Mining individual daily commuting patterns of dockless bike-sharing users: a two-layer framework integrating spatiotemporal flow clustering and rule-based decision trees [3.4] 本論文は、ドックレス自転車共有旅行データから、個人自転車の日々の通勤パターンをユーザIDで抽出する枠組みを提案する。
このフレームワークの有効性と適用性は、深センでの2億回以上の自転車共有旅行記録によって実証されている。
多くの自転車共有通勤者が都市村や古い町の近くに住んでおり、特に中心部では生活費が低い。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:09:30 GMT)
Minimax Optimal Two-Sample Testing under Local Differential Privacy [3.3] ローカルディファレンシャルプライバシ(LDP)の下でのプライベート2サンプルテストにおけるプライバシと統計ユーティリティのトレードオフについて検討する。
本稿では,Laplace,離散Laplace,GoogleのRAPPORなど,実用的なプライバシメカニズムを用いたプライベートな置換テストを紹介する。
我々は,ビンニングによる連続データの研究を行い,その一様分離率をH"olderとBesovの滑らか度クラスよりもLDPで検討した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 07:00:06 GMT)
Global spatio-temporal downscaling of ERA5 precipitation through generative AI [3.3] 本研究では,地球規模での降水量の時間的ダウンスケーリングを初めて行う深層学習システムSpateGAN-ERA5について紹介する。
SpateGAN-ERA5は条件付き生成対向神経ネットワーク(cGAN)を使用し、ERA5の降水量は24kmから1時間から2kmと10分に増大する。
現実的で大局的なパターンと極端を含む正確な降雨量分布を持つ高解像度の降雨場を提供する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:11:23 GMT)
Persistent Homology for Structural Characterization in Disordered Systems [3.3] 障害のあるシステムにおける局所的構造と大域的構造の両方を特徴付けるために,永続的ホモロジー(PH)に基づく統一的なフレームワークを提案する。
同じアルゴリズムとデータ構造を使って、ローカルとグローバルのディスクリプタを同時に生成できる。
この枠組みに基づき,非パラメトリックな指標である分離指数(SI)を定義し,位相分類タスクにおける従来の結合配向順序パラメータより優れる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:04:33 GMT)
Prompt Framework for Role-playing: Generation and Evaluation [3.3] 大規模言語モデル(LLM)は、自然言語生成、ユーザ命令の理解、人間に似た言語使用のエミュレートにおいて、優れた習熟度を示す。
このプロジェクトでは、ロールプレイング対話データセットの生成にGPTの機能を活用するために設計されたプロンプトベースのフレームワークを紹介する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 06:19:35 GMT)
A Joint Network Optimization Framework to Predict Clinical Severity from Resting State Functional MRI Data [3.3] 静止状態fMRI(rs-fMRI)データから臨床重症度を予測する新しい枠組みを提案する。
フレームワークを2つの別々のデータセット上で10倍のクロスバリデーション設定で検証する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:39:33 GMT)
Simplifying CLIP: Unleashing the Power of Large-Scale Models on Consumer-level Computers [3.2] Contrastive Language-Image Pre-Training (CLIP) はその優れたゼロショット性能と下流タスクへの優れた転送性のために注目を集めている。
しかし、そのような大規模モデルのトレーニングは通常、実際の計算とストレージを必要とするため、一般ユーザにとって消費者レベルのコンピュータでは障壁となる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:17:46 GMT)
Many happy returns: machine learning to support platelet issuing and waste reduction in hospital blood banks [3.1] 本稿では,期限前に返却されたユニットが再発行される可能性を高めるため,機械学習(ML)誘導型発行ポリシーを提案する。
我々のモデルは17,297件の血小板に対するリターンを予測できるように訓練され,9,353件のAUROC 0.74が得られた。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:50:56 GMT)
A Unified Energy Management Framework for Multi-Timescale Forecasting in Smart Grids [3.0] 時系列データの中間および長期の依存関係を正確に把握することは困難である。
本稿では、時間的位置符号化層を備えた新しいアーキテクチャにより、その依存性を捉えるマルチスケール電力負荷予測フレームワークであるMulti-pofoを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:45:41 GMT)
Boosting Photon-Number-Resolved Detection Rates of Transition-Edge Sensors by Machine Learning [3.0] 遷移エッジセンサー(TES)は、非常に効果的な光子数分解(PNR)検出器である。
比較的遅い熱回復時間は、実験シナリオでの運用速度を著しく制限する。
我々は,検出イベント間の完全回復時間を待つことなく,TESが光子パルスを検出し,正確に分類できるアルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:09:50 GMT)
SafeLight: Enhancing Security in Optical Convolutional Neural Network Accelerators [3.0] ハードウェアトロイの木馬(HT)攻撃は、光学ニューラルネットワーク(ONN)プラットフォームのパフォーマンスとセキュリティを損なう可能性がある。
我々は、HTsが最先端の非コヒーレントANN加速器においてマイクロリング共振器(MR)を妥協する方法を示す。
我々は,これらの攻撃に対するONN加速器のロバスト性を高める手法を提案し,その精度低下を効果的に回復する方法を示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 20:32:32 GMT)
STREAM: A Universal State-Space Model for Sparse Geometric Data [2.9] ポイントクラウドやイベントベースのビジョンなど、非構造化の幾何学的データを扱うことは、マシンビジョンの分野における急激な課題である。
状態空間モデルのパラメータ化に幾何構造を明示的にエンコードすることを提案する。
本モデルでは, スパースデータを最新のハードウェアに効率的にマッピングするために, カーネルを改良したMamba選択状態空間モデルをデプロイする。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:21:50 GMT)
Distributionally robust self-supervised learning for tabular data [2.9] エラースライスの存在下での堅牢な表現の学習は、高い濃度特徴とエラーセットの構築の複雑さのために困難である。
従来の堅牢な表現学習手法は、コンピュータビジョンにおける教師付き設定における最悪のグループパフォーマンスの改善に主に焦点をあてている。
提案手法は,Masked Language Modeling (MLM) の損失を学習したエンコーダ・デコーダモデルを用いて,頑健な潜在表現を学習する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:29:02 GMT)
The Power of Types: Exploring the Impact of Type Checking on Neural Bug Detection in Dynamically Typed Languages [2.8] 種々の誤用バグに対する各種神経バグ検出装置に対する型チェックの影響について検討した。
以上の結果から,既存のバグ検出データセットには,タイプ関連バグのかなりの割合が含まれていることが示唆された。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:29:37 GMT)
TPLogAD: Unsupervised Log Anomaly Detection Based on Event Templates and Key Parameters [2.8] 本研究では,非構造化ログを解析するための共通教師なし手法TPLogADを提案する。
TPLogADに含まれるitemplate2vecとpara2vecは、ログの効率的で実装が容易なセマンティック表現方法である。
4つの公開ログデータセットに対する実験により、TPLogADは既存のログ異常検出方法より優れていることが示された。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:25:21 GMT)
Just In Time Transformers [2.7] JITtransは,エネルギー消費予測精度を大幅に向上させる,トランスフォーマー深層学習モデルである。
本研究は, エネルギー管理を革新し, 持続可能な電力システムを構築するための先進的な予測技術の可能性を明らかにするものである。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:47:37 GMT)
Curriculum-enhanced GroupDRO: Challenging the Norm of Avoiding Curriculum Learning in Subpopulation Shift Setups [2.7] サブポピュレーションシフトのシナリオでは、Curriculum Learning (CL)アプローチはモデルの重み付けを早期にインプリントするだけであり、容易に学習可能なスプリアス相関を持つ。
本稿では,最も難しいバイアス確認サンプルと最も簡単なバイアス強調サンプルを優先する,CeGDRO(Curriculum-enhanced Group Distributionally Robust Optimization)アプローチを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:38:56 GMT)
Developer Challenges on Large Language Models: A Study of Stack Overflow and OpenAI Developer Forum Posts [2.7] 大規模言語モデル(LLM)は、様々なドメインにまたがる例外的な機能のために広く普及している。
本研究は,Stack OverflowとOpenAI Developer Forum上でのコミュニティインタラクションを分析することによって,開発者の課題を調査する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:24:58 GMT)
LLM for Barcodes: Generating Diverse Synthetic Data for Identity Documents [2.7] 我々は,LLMを用いた合成データ生成に新たなアプローチを導入し,事前定義されたフィールドに依存することなく,文脈的にリッチでリアルなデータを生成する。
我々のアプローチはデータセット作成のプロセスを単純化し、広範なドメイン知識の必要性を排除します。
このスケーラブルでプライバシ優先のソリューションは、自動文書処理とID認証のための機械学習の進歩の大きな一歩だ。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:21:18 GMT)
Hierarchical localization with panoramic views and triplet loss functions [2.7] 本研究の目的は,移動ロボットの安全なナビゲーションに不可欠な視覚的位置決めに取り組むことである。
提案手法はパノラマ画像と三重畳み込みニューラルネットワークを用いる。
提案手法の限界を探索するため,異なる屋内環境下で三重項ネットワークを同時にテストした。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:51:52 GMT)
Fine-tuned Generative Adversarial Network-based Model for Medical Image Super-Resolution [2.6] The Real-Enhanced Super-Resolution Generative Adversarial Network (Real-ESRGAN) is a practical model for recovery HR images from real-world LR images。
実世界の画像劣化をシミュレートするReal-ESRGANの高次劣化モデルを用いる。
提案モデルでは,Real-ESRGANモデルに比べて知覚品質が優れ,細部を効果的に保存し,より現実的なテクスチャで画像を生成する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:01:43 GMT)
Feature graph construction with static features for malware detection [2.6] アプリケーションを特徴付けるために,機能グラフに基づくマルウェア検出手法であるMFGraphを導入する。
マルウェア検出タスクにおいて,AUCスコア0.98756を達成し,他のベースラインモデルよりも優れていることを示す。
MFGraphのAUCスコアは1年でわずか5.884%減少し、コンセプトドリフトの影響を受けていないことを示している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:04:08 GMT)
Boson-fermion universality of mesoscopic entanglement fluctuations in free systems [2.6] 波動関数のシュル「オーディンガー進化に関連する絡み合いのゆらぎは、ユニークな視点を与える。
ここでは、多体物理学における正準ボソニックモデルの絡み合いのダイナミクスを再考する。
系が平衡から追い出されると、長時間の絡み合いのダイナミクスは自由フェルミオンモデルと厳密に同じ統計挙動を示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:43:18 GMT)
ChatEMG: Synthetic Data Generation to Control a Robotic Hand Orthosis for Stroke [2.4] ChatEMGは自己回帰生成モデルであり、プロンプトで条件付けられた合成EMG信号を生成することができる。
インテント分類器が脳卒中生存者によって整形機能の制御のためにデプロイされたのはこれが初めてである。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 23:15:26 GMT)
Adversarial Poisoning Attack on Quantum Machine Learning Models [2.3] 量子無差別データ中毒攻撃(QUID)を導入する。
QUIDはベースラインモデルと比較して、モデル性能の最大92%の精度劣化を達成している。
また、QUIDを最先端のクラシックディフェンスに対してテストし、精度の低下は50ドルを超えました。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:41:02 GMT)
Improved Background Estimation for Gas Plume Identification in Hyperspectral Images [2.3] 遠赤外線(LWIR)ハイパースペクトルイメージングは、リモートセンシングにおいて多くのタスクに利用できる。
気柱が検出されれば、気柱にどのガスやガスが存在するのかを正確に判断する必要がある。
識別中は、関心のガスのスペクトル特性を明らかにするために、プルームの下の背景を推定・除去する必要がある。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 23:43:22 GMT)
The CTSkills App -- Measuring Problem Decomposition Skills of Students in Computational Thinking [2.3] 本稿では,K-12コンピュータサイエンス教育におけるCT(Computer Thinking)の重要な構成要素として,問題分解スキルの導入について論じる。
CTSKillsは,学生の問題解決能力を測定するために開発された Web ベースのスキルアセスメントツールである。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:57:49 GMT)
Leveraging LLMs for Legacy Code Modernization: Challenges and Opportunities for LLM-Generated Documentation [2.2] MUMPSやメインフレームアセンブリといった時代遅れの言語で記述されたレガシーソフトウェアシステムは、効率性、メンテナンス、スタッフリング、セキュリティにおいて課題を提起する。
本稿では,2つのデータセットを用いたレガシコードのための文書生成におけるLCMの利用について検討する。
本稿では,ラインワイドなコードコメントを生成するためのプロンプト戦略を提案し,その完全性,可読性,有用性,幻覚性を評価する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:27:27 GMT)
Comparative Analysis of Pooling Mechanisms in LLMs: A Sentiment Analysis Perspective [2.2] BERTやGPTのようなトランスフォーマーベースのモデルは、トークンレベルの埋め込みを文レベルの表現に集約するためにプール層に依存している。
Mean、Max、Weighted Sumといった一般的なプール機構は、この集約プロセスにおいて重要な役割を果たす。
本稿では,これらのプール機構が文レベル感情分析の文脈における2つの著名なLCMファミリー(BERTとGPT)に与える影響について検討する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 00:59:25 GMT)
Color code with a logical control-$S$ gate using transversal $T$ rotations [2.2] カラーコードの3次元的な例は、その構造、特に論理作用素の支持の交叉が、非クリフォード$T$と$CCZ$を生じさせることを示す。
ここでは、論理制御付きカラーコードを示す-$S$ゲートは、物理量子ビット上で$Tdagger$回転によって達成される。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:08:33 GMT)
An Attention-based Framework for Fair Contrastive Learning [2.2] そこで本稿では,バイアスを考慮したインタラクションをモデル化するための注意機構を用いた,公正なコントラスト学習のための新しい手法を提案する。
我々の注意機構は、モデルに相反するバイアスを発生させるサンプルを避け、意味論的に意味のある表現を学習するのに役立つバイアスを誘発するサンプルに焦点をあてる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 07:11:35 GMT)
Quantum-enhanced unsupervised image segmentation for medical images analysis [2.1] 乳がんは、世界中で女性のがん関連死亡の原因となっている。
人工知能を用いたイメージセグメンテーションは、このワークフローを合理化するための有望な代替手段を提供する。
マンモグラフィーの医用画像セグメンテーションのための第1のエンドツーエンド量子拡張フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:28:07 GMT)
Comparative Analysis of nnUNet and MedNeXt for Head and Neck Tumor Segmentation in MRI-guided Radiotherapy [2.1] 我々はHNTS-MRG24 MICCAI ChallengeにチームTUMORとしてソリューションを提示する。
前RTおよび中RTMRI画像における原発性GTVpと転移性リンパ節GTVnの自動分画に焦点を当てた。
第1タスクの解は最終テスト段階では第1位、第2タスクの解は第8位、第2タスクの解は第1位、第2タスクの解は第8位、スコアは0.7005であった。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 06:16:56 GMT)
FrontierMath: A Benchmark for Evaluating Advanced Mathematical Reasoning in AI [2.1] FrontierMath(フロンティアマス、フロンティアマス、FrontierMath)は、数学者が考案し検証した何百もの数学問題のベンチマークである。
現在の最先端のAIモデルは、問題の2%未満を解決し、AI能力と数学的コミュニティの長所との間に大きなギャップが浮かび上がっている。
AIシステムが専門家レベルの数学的能力に向かって進むにつれ、FrontierMathは彼らの進歩を定量化する厳格なテストベッドを提供する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:00:00 GMT)
Early stopping and polynomial smoothing in regression with reproducing kernels [2.0] 再生カーネルヒルベルト空間(RKHS)における反復学習アルゴリズムの早期停止問題について検討する。
本稿では,いわゆる最小不一致原理に基づく検証セットを使わずに早期停止を行うデータ駆動型ルールを提案する。
提案したルールは、異なるタイプのカーネル空間に対して、ミニマックス最適であることが証明されている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 23:53:38 GMT)
Is Attention All You Need For Actigraphy? Foundation Models of Wearable Accelerometer Data for Mental Health Research [2.0] アクチノグラフィーに特化して設計された,事前訓練と完全注意に基づくモデルを開発した。
NHANES患者29,307名を対象に, PATをプレトレーニングした。
パラメータが200万未満で、モデル説明機能が組み込まれているため、PATは堅牢で、健康研究環境でのデプロイが容易である。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 01:58:35 GMT)
The Explabox: Model-Agnostic Machine Learning Transparency & Analysis [2.0] 私たちは、透過的で責任ある機械学習(ML)モデルの開発と使用のためのオープンソースのツールキットであるExplaboxを紹介します。
説明可能な、公正で、堅牢なモデルを達成するのに、探索、調査、説明、公開という4段階の戦略を採用する。
このツールキットは、記述的な統計、パフォーマンスメトリクス、モデル行動の説明(ローカルおよびグローバル)、堅牢性、セキュリティ、公正性評価のための消化可能なものを含んでいる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 09:10:57 GMT)
Boundless Across Domains: A New Paradigm of Adaptive Feature and Cross-Attention for Domain Generalization in Medical Image Segmentation [1.9] ドメイン不変表現学習は、ドメイン一般化の強力な方法である。
従来のアプローチでは、高い計算要求、トレーニングの不安定性、高次元データによる限られた有効性といった課題に直面していた。
本研究では,分布空間を探索しながら分布外サンプルを生成する適応的特徴ブレンディング(AFB)手法を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 12:06:24 GMT)
Generalizable data-driven turbulence closure modeling on unstructured grids with differentiable physics [1.9] 本研究では,Navier-Stokes方程式を解くために,有限要素ソルバ内にディープラーニングモデルを埋め込むフレームワークを提案する。
後方向きのステップを流れる流れの手法を検証し,その性能を新しい測地で検証する。
我々は,GNNに基づくクロージャモデルについて,解法制約付き最適化としてクロージャモデリングを解釈することにより,データ制限シナリオで学習可能であることを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 19:02:10 GMT)
A Brief Summary of Explanatory Virtues [1.9] 本報告では,説明的処女に関する哲学,心理学,認知科学の文献を要約し,これらの概念をeXplainable AIにリンクする。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:27:56 GMT)
Continuous Generative Neural Networks: A Wavelet-Based Architecture in Function Spaces [1.7] 本研究では,連続的な環境下での連続生成ニューラルネットワーク(CGNN)について検討する。
このアーキテクチャはDCGANにインスパイアされ、1つの完全に接続された層、いくつかの畳み込み層、非線形活性化関数を持つ。
本稿では,畳み込みフィルタの条件と,CGNNが注入可能であることを保証する非線形性について述べる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:13:22 GMT)
Purrfessor: A Fine-tuned Multimodal LLaVA Diet Health Chatbot [1.7] Purrfessorは対話的でマルチモーダルなエンゲージメントを通じて、パーソナライズされた食事指導を提供する。
食品と栄養データと人道へのアプローチを微調整したモデル。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:28:28 GMT)
Accurate quantum-centric simulations of supramolecular interactions [1.6] 本稿では,超分子的アプローチによる非共有結合相互作用の量子中心シミュレーションについて述べる。
結果は量子コンピューティングの化学問題への応用における大きな進歩を示している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:57:34 GMT)
VisGraphVar: A Benchmark Generator for Assessing Variability in Graph Analysis Using Large Vision-Language Models [1.6] LVLM(Large Vision-Language Models)は、抽象的な視覚タスクに取り組む能力がますます高まっている。
VisGraphVarは7つのタスクカテゴリのグラフ画像を生成することができる、カスタマイズ可能なベンチマークジェネレータである。
画像の視覚特性の変化(例えばノードのラベル付けやレイアウト)と視覚的不完全さの意図的な含意がモデルの性能に大きく影響することを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:10:53 GMT)
Differentiable Biomechanics for Markerless Motion Capture in Upper Limb Stroke Rehabilitation: A Comparison with Optical Motion Capture [1.6] Markerless Motion Captureは、臨床環境でのモーションキャプチャーに有望なアプローチを提供する。
本研究は, バイオメカニカルモデルを用いたMCCデータとOCCデータを用いて, 飲酒作業を行う15名の脳卒中患者のキーキネマティックな結果を比較した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:02:29 GMT)
Evaluating LLM Prompts for Data Augmentation in Multi-label Classification of Ecological Texts [1.6] 大規模言語モデル(LLM)は自然言語処理(NLP)タスクにおいて重要な役割を果たす。
本研究では,ロシアのソーシャルメディアにおけるグリーンプラクティスの言及を検出するために,プロンプトベースのデータ拡張を適用した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 12:37:41 GMT)
AdamZ: An Enhanced Optimisation Method for Neural Network Training [1.5] AdamZは、オーバーシューティングと停滞に対処するメカニズムを組み込むことで、学習率を動的に調整する。
損失関数の最小化に一貫して優れており、精度が重要なアプリケーションに特に有利である。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 23:33:41 GMT)
Empowering Clients: Transformation of Design Processes Due to Generative AI [1.4] この研究は、AIがアイデアの迅速な視覚化を通じて、クライアントが設計プロセスに参加することを可能にすることによって、アイデアのフェーズを破壊できることを明らかにしている。
私たちの研究は、AIが設計に対して貴重なフィードバックを提供することができる一方で、そのような設計を生成できない可能性があることを示しています。
アーキテクチャの解釈的主権と,AIが設計プロセスのオーサシップをますます引き継ぐにつれて,意味とアイデンティティの喪失について,アーキテクトの間に不確実性があることも明らかになった。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:48:15 GMT)
AI Tailoring: Evaluating Influence of Image Features on Fashion Product Popularity [1.4] 本研究では,TransformerベースのモデルとRandom Forestを統合した予測モデルであるFashion Demand Predictorを開発し,製品イメージに基づいて市場人気を予測する。
選好のランキングを収集するサーベイを通じて、これらの結果を検証する。
機能によって強化された製品は、修正された製品よりも予測される人気が著しく向上したことを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:11:51 GMT)
NonGEMM Bench: Understanding the Performance Horizon of the Latest ML Workloads with NonGEMM Workloads [1.3] 本稿では,非GEMM演算子のベンチマークであるベンチについて述べる。
まず、さまざまなドメインから一般的なMLワークロードを使用してベンチを構築し、その後、さまざまなグレードのGPUプラットフォームでケーススタディを実行します。
GEMM演算子と非GEMM演算子とのギャップを埋める上で重要なポイントをいくつか提示する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 01:54:26 GMT)
Negotiating with LLMS: Prompt Hacks, Skill Gaps, and Reasoning Deficits [1.3] LLMとの価格交渉において,全年齢層で40人以上の個人を対象とするユーザスタディを実施している。
交渉された価格が、LLMと効果的に相互作用する際のリテラシーのギャップを指摘し、人類が幅広い範囲で達成したことを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:34:12 GMT)
Efficient Brain Imaging Analysis for Alzheimer's and Dementia Detection Using Convolution-Derivative Operations [1.2] アルツハイマー病(英語版) (AD) は進行性神経変性を特徴とし、ヒト脳における有害な構造変化をもたらす。
VBM(Voxel-based morphometry)における空間正規化から導かれるジャコビアン写像は、ADに関連する体積変化の解釈に役立っている。
本研究では,計算効率の良い代替手段として,SKAD(Sobel kernel angle difference)を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:26:22 GMT)
GuideGen: A Text-Guided Framework for Full-torso Anatomy and CT Volume Generation [1.1] GuideGenは、フリーフォームのテキストプロンプトに基づいて、胸部から骨盤まで、解剖学的マスクとそれに対応するCTボリュームを生成する制御可能なフレームワークである。
提案手法は,リアルなフルトルソ解剖を作成するためのテキスト条件セマンティックシンセサイザー,コントラストを意識した様々なコントラストレベルの詳細な特徴抽出用オートエンコーダ,CT画像,解剖学的セマンティクス,入力プロンプト間のアライメントを保証する潜在特徴生成装置の3つのコアコンポーネントを含む。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 09:17:02 GMT)
CardioLab: Laboratory Values Estimation and Monitoring from Electrocardiogram Signals -- A Multimodal Deep Learning Approach [1.1] 我々はMIMIC-IVデータセットを用いてマルチモーダル深層学習モデルを構築し、推定(リアルタイム)と監視(将来の間隔での予測)実験値異常の可能性を示す。
AUROCスコアが0.70を超え、23の実験室値と26の観測室値に対して統計的に有意な精度で予測性能を示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 12:10:03 GMT)
Simulation of the Dissipative Dynamics of Strongly Interacting NV Centers with Tensor Networks [1.0] ダイヤモンド中のNV中心は、磁場やその他の物理量に対する高感度量子センサーのための有望なプラットフォームである。
我々は多体混合状態を表現し,NVのアンサンブルのダイナミクスをシミュレートするために,マトリックス製品密度演算子(MPDO)法を用いる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:18:18 GMT)
Application of AI to formal methods -- an analysis of current trends [1.0] 形式的方法(FM)は、コンピュータ科学における問題に関する健全で理解可能な推論を提供する。
多くの研究者がこのギャップを越え、FMアプローチを強化するためにAI技術を適用した。
本研究では,従来の5年間のFM応用AIについて検討した。
本調査の結果は189項目であり,現在の傾向の解明,研究ギャップの明確化,今後の研究への提案などについて詳しく検討する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:43:39 GMT)
Energy participation ratio analysis for very anharmonic superconducting circuits [1.0] 超伝導回路は大規模量子デバイスに採用されている。
超伝導回路設計を解析するための最も先進的な手法の1つは、エネルギー参加率(EPR)法である。
我々は、高非線形超伝導回路に効果的に対処するために、EPRアプローチを拡張した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:11:34 GMT)
Optically Switching $χ^{(2)}$ in Diamond Microcavities [0.9] ダイヤモンド空洞内の窒素空孔(NV)中心を介する第2高調波発生の光誘起変化が観察された。
NV中心の励起は、デバイスの第2高調波放射を加熱する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 00:00:04 GMT)
High-performance automated abstract screening with large language model ensembles [0.9] 大規模言語モデル(LLM)は入力テキストの処理と解釈を必要とするタスクに優れる。
LLMは、抽象スクリーニングのためのゼロショットバイナリ分類において、その精度を評価するために、体系的なレビューで試された。
800レコードのサブセットに対する試行では、最適なプロンプト戦略を特定し、人間の研究者にとって優れたパフォーマンスを示した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:11:13 GMT)
One to rule them all: natural language to bind communication, perception and action [0.9] 本稿では,Large Language Models (LLMs) によるコミュニケーション,知覚,計画を統合したロボット行動計画のための高度なアーキテクチャを提案する。
Planner Moduleはシステムの中核であり、修正されたReActフレームワークに組み込み、ユーザーコマンドの解釈と実行にLLMが使用される。
修正されたReActフレームワークは、リアルタイムな環境認識と身体行動の結果を提供することにより、実行スペースをさらに強化する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:05:54 GMT)
The Dynamics of Innovation in Open Source Software Ecosystems [0.9] 新しいライブラリは、ポスト当たりのエコシステム内で驚くほど予測可能なサブ線形レートで出現する。
最も広く使われている図書館は、平均よりも何倍も頻繁に使われている。
新しいユーザは、新しいライブラリと新しい組み合わせを使うことが多い。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 12:31:25 GMT)
Time is on my sight: scene graph filtering for dynamic environment perception in an LLM-driven robot [0.9] 本稿では,人間とロボットのインタラクションにおける重要な課題に対処するロボット制御アーキテクチャを提案する。
アーキテクチャはLarge Language Modelsを使用して、自然言語コマンドを含む多様な情報ソースを統合する。
このアーキテクチャは、動的環境における適応性、タスク効率、人間とロボットのコラボレーションを強化する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:58:26 GMT)
Imperfect-Information Games on Quantum Computers: A Case Study in Skat [0.8] 非完全情報ゲームにおいて,量子コンピュータが重要な役割を担っていることを示す。
我々は、最も人気のあるドイツのカードゲームSkatの例を使って、Quantum Computersがこの種のゲームを解く上で、いかに重要な役割を果たすかを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:19:33 GMT)
Single color digital H&E staining with In-and-Out Net [0.8] 本稿では,仮想染色タスクに特化して設計された新しいネットワークIn-and-Out Netを提案する。
我々はGAN(Generative Adversarial Networks)に基づいて,反射共焦点顕微鏡(RCM)画像からヘマトキシリンおよびエオシン染色画像へ効率的に変換する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:59:38 GMT)
Sequential Quantum Maximum Confidence Discrimination [0.8] 最大信頼度を有する量子状態判別の逐次シナリオについて検討する。
最大信頼度測定のための正の演算値測定要素が線形独立である場合にのみ、等しく高い信頼度を持つ逐次状態判別が実現できることを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:31:40 GMT)
GreenMachine: Automatic Design of Zero-Cost Proxies for Energy-Efficient NAS [0.8] 本稿では,Deep Neural Networks (DNN) を効率的に評価するために,ゼロコストプロキシを自動設計することで,モデル評価の課題に対処する。
提案手法は,NATS-Benchベンチマークを用いて,無作為に生成されたゼロコストプロキシセットから開始する。
その結果, 本手法は, 階層化サンプリング戦略において, 既存の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:24:19 GMT)
Feasibility Study for Supporting Static Malware Analysis Using LLM [0.8] 大規模言語モデル(LLM)はより進歩し、広く普及している。
本研究は,静的解析を支援するためにLLMを使用できるかどうかに焦点を当てる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:03:07 GMT)
Automatic virtual voltage extraction of a 2x2 array of quantum dots with machine learning [0.8] 量子ドットの2x2配列におけるクロスキャパシタンスの効果を緩和し,それを2xNおよびNxN配列に拡張する理論的枠組みを開発する。
提案手法は,QD配列におけるクロスキャパシタンス効果を緩和する完全自動化ツールを提供する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:04:59 GMT)
HiBO: Hierarchical Bayesian Optimization via Adaptive Search Space Partitioning [0.8] HiBOは,グローバルレベルの検索空間分割情報をローカルBOベースの取得戦略に統合した,新しい階層型アルゴリズムである。
一連の評価は、HiBOが高次元の合成ベンチマークにおいて最先端の手法より優れていることを示している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:18:55 GMT)
Construction and Preliminary Validation of a Dynamic Programming Concept Inventory [0.7] 概念発明は、学術分野における重要な概念に対する学生の理解を評価する標準化された評価である。
STEM分野に広く普及しているが、その開発は動的プログラミング(DP)のような先進的なコンピュータ科学のトピックに遅れがある。
本研究は,DP概念に関する既知学生の誤解を対象とする複数選択質問を定式化するための反復的プロセスについて詳述する。
我々は,D PCIを172名の大学生に実施し,質問を適切な難易度と判断し,学生の理解度の違いを効果的に判別することで,予備的な心理測定検証を行った。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 01:01:43 GMT)
SecONN: An Optical Neural Network Framework with Concurrent Detection of Thermal Fault Injection Attacks [0.7] 本稿では,まず,Mach-Zhender干渉計を用いたベクトル行列乗算器(VMM)に基づくSPAAのサーマルフォールトインジェクション攻撃の脅威を提案する。
そこで本研究では,推論だけでなく,同時検出が可能な光ニューラルネットワークフレームワークSecONNを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:31:36 GMT)
Solving Generalized Grouping Problems in Cellular Manufacturing Systems Using a Network Flow Model [0.6] 本稿では, セル製造システムにおける一般化グループ化問題に焦点をあてる。
本研究は,ネットワークフローアルゴリズムの広範かつ広範な利用に着想を得て,一般化グループ化のためのプロセス経路ファミリー形成を定式化した。
提案モデルでは, 生成する部品の数を事前に指定することなく, プロセス経路のファミリー形成問題を最適に解決する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:14:34 GMT)
Characterizing User Archetypes and Discussions on Scored.co [0.6] ソーシャルハイパーネットワークにおけるノードとハイパーエッジを特徴付けるためのフレームワークを提案する。
Scored.coに焦点をあてる。
本研究は,社会的ダイナミクスの理解における高次相互作用の重要性を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:39:04 GMT)
Multiverse of Greatness: Generating Story Branches with LLMs [0.6] 本稿では,動的コンテキストウィンドウ履歴を持つグラフベースのコンテンツを生成するための LLM と対話する新しいフレームワークである Dynamic Context Prompting/Programming (DCP/P) を提案する。
LLMにコンテキスト履歴を提供しず,初期ストーリデータのみに依存するDCP/Pをベースラインに対して評価する。
我々は,それぞれのアプローチから,客観的に最高のパフォーマンスを得られるゲームの品質を質的に検討する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:11:37 GMT)
ElastiFormer: Learned Redundancy Reduction in Transformer via Self-Distillation [0.6] ElastiFormerは、トレーニング済みのTransformerモデルを、可変推論時間計算と弾力性のあるものに適合させる。
ルーティングモジュールは、事前訓練されたモデルの出力と弾力性のあるモジュールとの差を最小限に抑えるために、自己蒸留損失を使用して訓練される。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:11:14 GMT)
Designing Cellular Manufacturing System in Presence of Alternative Process Plans [0.6] 本稿では, セル製造システムにおいて, 部品や機械をグループ化するための整数計画式を4つ提示する。
部品種別連続動作の最大回数を同一セル及び同一マシンに割り当てることにより、セル間移動及びセル内移動の最小化を実現する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:10:42 GMT)
Interpretable Water Level Forecaster with Spatiotemporal Causal Attention Mechanisms [0.6] 本研究では,水位予測に着目し,解釈可能性の定量化を目的とした深層学習モデルを提案する。
我々は,2016年から2021年にかけて,韓国ソウルから得られた漢川データセットの比較分析を行った。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:28:44 GMT)
Continuous-Variable Source-Independent Quantum Random Number Generator with a Single Phase-Insensitive Detector [0.5] 量子乱数生成器(QRNG)は、真のランダム性を生成するために量子力学的不予測性を利用する。
単一位相非感受性検出器を用いたCV-SI-QRNG方式を提案し、半定値プログラミング(SDP)に基づくセキュリティ証明を提供する。
これらの結果は,本フレームワークの実現可能性を示し,実用的でシンプルなSI-QRNG実装への道を開いた。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 09:26:53 GMT)
Tight concentration inequalities for quantum adversarial setups exploiting permutation symmetry [0.5] 量子状態に対する我々の片側濃度の不等式は、置換不変量として$N$-qudit系を必要とすることを示す。
簡単な量子情報処理タスクにおいて,境界の厳密さを数値的に示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 09:38:50 GMT)
From Text to Pose to Image: Improving Diffusion Model Control and Quality [0.5] 提案手法では,新しいサンプリングアルゴリズムとともにテキスト・ツー・プレイス(T2P)生成モデルを導入し,ポーズの忠実度を高めるためにより多くのポーズ・キーポイントを組み込んだ新しいポーズ・アダプタを提案する。
これら2つの新しい最先端モデルによって、拡散モデルにおける高ポーズ制御のための生成的テキスト・ツー・プレイス・ツー・イメージ・フレームワークが、初めて実現された。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:26:27 GMT)
VQalAttent: a Transparent Speech Generation Pipeline based on Transformer-learned VQ-VAE Latent Space [0.5] VQalAttentは、調整可能な性能と解釈性を備えた偽音声を生成するために設計された軽量モデルである。
以上の結果から,VQalAttentが限られた計算資源を持つ可知音声サンプルを生成する能力を示した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 00:21:39 GMT)
HistoEncoder: a digital pathology foundation model for prostate cancer [0.4] ファンデーションモデルは、複雑なパターンを区別するために大量のデータに基づいて訓練されている。
前立腺癌デジタル病理学の基礎モデルであるHistoEncoderを,前立腺組織タイル画像4800万枚に事前トレーニングして開発した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:32:01 GMT)
Evolutionary Automata and Deep Evolutionary Computation [0.4] 進化的オートマトン(英: Evolution Automaticon)とは、進化的計算を無限世代で行う自動機械である。
これはまた、環境との対話的なフィードバックによって自己進化する自然進化の力のヒントを与える。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:31:50 GMT)
EV-PINN: A Physics-Informed Neural Network for Predicting Electric Vehicle Dynamics [0.4] 動的パラメータ(例えば、空力抵抗、ローリング抵抗)のオンボード予測は、EVの正確な経路計画を可能にする。
本稿では,物理情報を用いたニューラルネットワーク手法EV-PINNについて述べる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:56:47 GMT)
Accelerating CALPHAD-based Phase Diagram Predictions in Complex Alloys Using Universal Machine Learning Potentials: Opportunities and Challenges [0.4] 本研究は、位相図計算を著しく高速化する機械学習原子間ポテンシャル(MLIP)の利用について検討する。
Cr-Mo, Cu-Au, Pt-Wなどのケーススタディを用いて, MLIP, 特にORBがDFTに比べて3桁を超える計算スピードアップを達成することを示した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 21:24:13 GMT)
Unboxing Engagement in YouTube Influencer Videos: An Attention-Based Approach [0.4] モデルが捉えた関係に関する洞察を提供する「解釈可能なディープラーニングフレームワーク」を開発します。
印刷広告における視覚的注意に触発された解釈手法は,映像特徴に対するモデル注意の尺度を用いる。
当社のフレームワークをYouTubeインフルエンサービデオに適用し、動画機能を浅いエンゲージメントと深いエンゲージメントの尺度にリンクする。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 20:24:33 GMT)
Privacy Guarantees for Personal Mobility Data in Humanitarian Response [0.4] 集約されたモビリティトレースでさえ、個人の動きに関する情報を悪意のあるアクターに公開することができる。
本稿では,個人の移動データを公開するためのアプローチを開発し,検証し,基礎となる被験者のプライバシーに関する公式な保証を提供する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 00:02:47 GMT)
Manipulating spectral transitions and photonic transmission in a non-Hermitian optical system through nanoparticle perturbations [0.3] ナノ粒子による線形スピン共振器のスペクトル遷移と光子伝達について検討した。
本研究は,現実的な条件下での散逸型量子デバイスの設計に有用な知見を提供する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:22:34 GMT)
SpikeFI: A Fault Injection Framework for Spiking Neural Networks [0.3] SpikeFIはニューラルネットワーク(SNN)のためのフォールトインジェクションフレームワーク
信頼性分析とテスト生成の自動化に使用できる。
SpikeFIはオープンソースで、GitHubからhttps:// GitHub.com/SpikeFI.comからダウンロードできる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 12:08:06 GMT)
Iterative Reweighted Framework Based Algorithms for Sparse Linear Regression with Generalized Elastic Net Penalty [0.3] 弾性ネットペナルティはパラメータ回帰と変数選択のための高次元統計学においてしばしば用いられる。
経験的証拠は、$ell_q$-norm のペナルティが $ell_r$-norm のペナルティよりもよく退行することを示している。
局所的なLipschitz連続$epsilon$-approximation to $ell_q$-norm に基づく2つの効率的なアルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:55:37 GMT)
Detecting Hallucinations in Virtual Histology with Neural Precursors [0.3] テスト時間検出のためのVSモデル埋め込みからNHP(Neural Hallucination Precursor)を識別する,スケーラブルなポストホック幻覚検出手法を提案する。
幻覚の少ないVSモデルは、必ずしもそれらをよりよく開示するわけではないことを示し、以前のメトリクスだけを報告する際に、セキュリティの誤った感覚を危険にさらしている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:46:00 GMT)
The Re-Label Method For Data-Centric Machine Learning [0.2] 業界におけるディープラーニングアプリケーションでは、手動でラベル付けされたデータには、ある種のノイズの多いデータがあります。
本稿では,人間のラベル付けにおける参照としてモデル予測を考慮し,ノイズデータを探し出し,ノイズデータを再ラベルする簡単な方法を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 01:41:55 GMT)
Information Extraction from Heterogenous Documents without Ground Truth Labels using Synthetic Label Generation and Knowledge Distillation [0.2] 本稿では,視覚的にリッチな文書をラベルなしで合成する手法であるタスク認識命令に基づくラベリング(TAIL)を提案する。
応答型知識蒸留を用いた多モード視覚リッチ文書理解モデル(VRDU)をTAILラベル上で微調整する。
得られたモデルが、最先端のLMMよりも大規模な多国籍組織の内部費用文書に匹敵する性能を示した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:16:09 GMT)
Soil Characterization of Watermelon Field through Internet of Things: A New Approach to Soil Salinity Measurement [0.2] 本研究の目的は,スイカ分野を対象とした知的IoTによる土壌評価システムの設計と実装である。
IoTベースの開発システムは、異なるセンサーを使用して土壌の水分、温度、pHを測定する。
土壌中の塩分濃度はスイカの収量に影響を与える。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 09:54:29 GMT)
Exploring Kolmogorov-Arnold Networks for Interpretable Time Series Classification [0.2] Kolmogorov-Arnold Networks (KAN) は最先端モデルのより解釈可能な代替として提案されている。
本稿では,時系列分類のためのKANアーキテクチャの包括的かつ堅牢な探索を実現することを目的とする。
その結果,(1)効率の良いKANは,タスク分類タスクに適した性能を示し,性能と計算効率に優れていた。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:01:36 GMT)
Proportional infinite-width infinite-depth limit for deep linear neural networks [0.2] 大規模ネットワークのコンテキストにおけるランダムパラメータを持つ線形ニューラルネットワークの分布特性について検討し,各層あたりのニューロン数に比例して層数が分散することを示した。
出力間の相関を保った非ガウス分布を導出し, 深さと幅の両方が分岐するが, 一定比を維持するような比例極限を探索する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:25:52 GMT)
Test Security in Remote Testing Age: Perspectives from Process Data Analytics and AI [0.1] 新型コロナウイルス(COVID-19)のパンデミックは、遠隔操作による高リスク評価の導入と受け入れを加速させている。
クリックストリームプロセスデータに基づくデータ分析とAIメソッドは、テスト実行プロセスに関する深い洞察を得ることができます。
この章は現実世界の例を使って、これが事実であることを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 20:05:12 GMT)
PaRCE: Probabilistic and Reconstruction-based Competency Estimation for CNN-based Image Classification [0.1] 確率的・再構成型能力推定法(PaRCE)を開発した。
本手法は, 異常領域を有するOODサンプルを正しく分類し, 誤分類し, 識別するのが最適であることがわかった。
本手法は,認識モデル信頼度という全体論的概念を最も確実に捉えた解釈可能なスコアを生成する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:08:57 GMT)
Competency-Aware Planning for Probabilistically Safe Navigation Under Perception Uncertainty [0.1] 知覚に基づくナビゲーションシステムは、複雑な地形における無人地上車両(UGV)のナビゲーションに有用である。
本研究では,確率的・再構成型能力推定法(PaRCE)を開発し,入力画像との親しみ度を推定する。
総合能力スコアは, 正しく分類され, 誤分類され, アウト・オブ・ディストリビューション (OOD) のサンプルを正確に予測できることがわかった。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:13:52 GMT)
Exploring Foundation Models Fine-Tuning for Cytology Classification [0.1] 既存の基盤モデルが細胞学的分類にどのように適用できるかを示す。
4つの細胞分類データセットにまたがる5つの基盤モデルを評価する。
以上の結果から,LoRAによる事前学習したバックボーンの微調整により,モデル性能が大幅に向上することが示唆された。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:34:04 GMT)
Opportunities and Challenges of Generative-AI in Finance [0.1] 本稿では,金融分野におけるGen-AI技術の応用について概観する。
本稿では,Gen-AI技術の育成に使用可能な各種手法と,金融エコシステムにおけるGen-AI技術の応用分野について述べる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 20:36:17 GMT)
AI-Driven Real-Time Monitoring of Ground-Nesting Birds: A Case Study on Curlew Detection Using YOLOv10 [0.1] 本研究は,カリュー(Numenius arquata)に着目したAIによるリアルタイム種検出手法を提案する。
カスタムトレーニングされたYOLOv10モデルは、Create AIプラットフォームにリンクされた3/4G対応カメラを使用して、カリューとそのニワトリを検知し、分類するために開発された。
ウェールズの11箇所で、このモデルは高い性能を達成し、感度は90.56%、特異度は100%、F1スコアは95.05%だった。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:36:29 GMT)
What You See is Not What You Get: Neural Partial Differential Equations and The Illusion of Learning [0.0] 科学機械学習のための微分可能プログラミングは、第一原理物理学から派生したニューラルネットワークをPDE内に組み込む。
コミュニティでは、NeuralPDEはブラックボックスモデルよりも信頼性が高く、一般化可能であると広く仮定されている。
我々は、NeuralPDEと差別化可能なプログラミングモデルは、PDEシミュレーションで私たちが考えているように物理的に解釈可能であるか?
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:04:46 GMT)
Utilizing Large Language Models to Synthesize Product Desirability Datasets [0.0] 本研究は,大規模言語モデル(LLMs)を用いて,製品適合性ツールキット(PDT)テストのための合成データセットを生成することを目的とする。
3つの方法、Word+Review、Review+Word、Require-Wordが、それぞれ1000の製品レビューを合成するために使用された。
生成されたデータセットは、感情アライメント、テキストの多様性、データ生成コストとして評価された。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:24:07 GMT)
Unwanted couplings can induce amplification in quantum memories despite negligible apparent noise [0.0] 理論量子メモリの設計は、理想の$Lambda$-configurationを模倣するために、特定のエネルギーレベルに選択的にフォーカスすることが多い。
我々は,NV中心型吸収性メモリにおける不要エネルギーレベルと不要結合の存在が,信号の増幅を著しくすることを示した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:10:45 GMT)
Unsupervised Machine Learning for Osteoporosis Diagnosis Using Singh Index Clustering on Hip Radiographs [0.0] Singh Index (SI) は単純で半定量的な骨粗しょう症の診断方法である。
本研究は, 機械学習アルゴリズムを用いて, ラジオグラフからのSI識別を自動化することを目的とする。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:44:43 GMT)
Understanding the Impact of News Articles on the Movement of Market Index: A Case on Nifty 50 [0.0] 本研究は,様々な話題に関連するニュース項目に関する感情に対するニフティ50指数の動きの分析に焦点をあてた。
調査の結果,他の話題のニュース記事の感情スコアも指標の動きに大きく影響していることがわかった。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 06:09:14 GMT)
Uncorrectable-error-injection based reliable and secure quantum communication [0.0] 量子テレポーテーションは任意の量子状態の伝送に広く用いられている。
遠距離で絡み合いを分配するために、絡み合いの交換と浄化が必要である。
これらの課題は、実世界の量子通信ネットワークにおける実用性を制限する。
本稿では,誤り訂正符号を用いて符号化された量子状態を直接伝送する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:34:26 GMT)
Tunable Two-Species Spin Models with Rydberg Atoms in Circular and Elliptical States [0.0] 超低温リドバーグ原子を用いた多用途量子シミュレータの構築手法を提案する。
内部原子状態の励起的な異なる部分空間により、原子は2つの有効なスピン種をシミュレートすることができる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:09:10 GMT)
Transforming NLU with Babylon: A Case Study in Development of Real-time, Edge-Efficient, Multi-Intent Translation System for Automated Drive-Thru Ordering [0.0] リアルタイムの会話型AIエージェントは、ドライブスルーシステムのような動的で屋外環境で自然言語理解(NLU)を実行するという課題に直面している。
これらの設定では、バックグラウンドノイズ、多様なアクセント、マルチインテントクエリを処理するためにNLUモデルが必要である。
目的翻訳タスクとしてNLUに取り組むトランスフォーマーベースのアーキテクチャであるBabylonを紹介する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 23:03:35 GMT)
Towards quantum simulation of lower-dimensional supersymmetric lattice models [0.0] 超対称性モデルは、粒子物理学の標準モデルに対する価値ある拡張を提供する。
これらのモデルの非摂動的特徴を探索する格子研究は、重大な課題に直面する。
我々は、IBMゲートベースの量子シミュレータ上でのモデル超対称性の破れの実装と検証について強調する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:18:25 GMT)
Towards Variational Quantum Algorithms for generalized linear and nonlinear transport phenomena [0.0] 本稿では線形および非線形熱流体動的輸送方程式を解くための変分量子アルゴリズム(VQA)を提案する。
ハイブリッド古典量子フレームワークは、異なる工学的境界条件と組み合わせて、熱、波動、バーガースの方程式によって支配される問題に適用される。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:39:49 GMT)
Towards Speaker Identification with Minimal Dataset and Constrained Resources using 1D-Convolution Neural Network [0.0] 本稿では,最小限のデータセット上で話者識別を行うために設計された,軽量な1D-Convolutional Neural Network (1D-CNN)を提案する。
提案手法は97.87%の精度を達成し,バックグラウンドノイズや限られたトレーニングサンプルの処理にデータ拡張技術を活用する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:18:08 GMT)
Towards Measuring Goal-Directedness in AI Systems [0.0] 意図しない目標を追求するAIシステムにとって重要な前提条件は、一貫性のあるゴール指向の方法で振る舞うかどうかである。
そこで本稿では,多くの報酬関数に準最適であるかどうかをモデル化する政策の目的指向性の定義を新たに提案する。
私たちの貢献は、AIシステムが危険な目標を追求できるかどうかという問題にアプローチするために、シンプルで計算が容易なゴール指向性の定義です。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 00:52:08 GMT)
Time-of-arrival distributions for continuous quantum systems and application to quantum backflow [0.0] 任意の連続量子系(ガウス系かそれ以外)に対して、時変問題はボルン則の中に隠されていることを示す。
この発見は、長期にわたる地域問題に対する答えが、実際にはボルンルールの中に秘かに隠されていることを示唆している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 19:03:10 GMT)
Threetangle in the XY-model class with a non-integrable field background [0.0] 3つの三角形の平方根は、積分性を破る平面内磁場成分を持つ横XYモデルに対して計算される。
このシステムは3つの絡み合った状態の準純度源として、あるいは絡み合いによって引き起こされるスイッチとして実験的に使用できる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:05:25 GMT)
Thermodynamics and State Preparation in a Two-State System of Light [0.0] 2段階の量子システムを熱環境に結合することは根本的な問題であり、キュービット状態の準備からスピンモデルまで幅広い応用がある。
Nボソンが熱浴に結合した2レベル系に浮かび上がることを実証した。
我々の実験は、量子技術における状態準備と量子熱力学の研究を約束する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:22:03 GMT)
The spinorial ball (II): a manipulable qubit at human scale [0.0] スピノリアルボールは、回転群表現からスピン1/2の起源を議論するために最近紹介した電子操作可能な装置である。
また、量子二層系のマクロ的な可視化であり、従って量子ビットのいくつかの一般的な特徴の直観を得るのに使うことができる。
本論文は、ボールを操作するための実用的なガイドとして記述され、スピノリアルボールとジェネリック2レベルシステムとの正確な対応を確立する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:45:13 GMT)
Sycophancy in Large Language Models: Causes and Mitigations [0.0] 大規模言語モデル (LLM) は、幅広い自然言語処理タスクにおいて顕著な機能を示した。
シコファンの行動を示す傾向は、その信頼性と倫理的展開に重大なリスクをもたらす。
本稿では, LLMにおけるサイコフィナンシーの技術的調査を行い, その原因, 影響, 潜在的な緩和戦略について分析する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:56:49 GMT)
Solving Free Fermion Problems on a Quantum Computer [0.0] 指数関数的に改善されたポリログ$(N)$コストで量子アルゴリズムによって解くことができる、相互作用しないフェルミオン問題をいくつか提示する。
シミュレーションアルゴリズムは,自由なボソンシステムを含む他の有望な対象に一般化可能であることを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:03:35 GMT)
Self-Supervised Learning for Ordered Three-Dimensional Structures [0.0] 近年の研究では、自己教師型タスクで大規模言語モデルをトレーニングし、それらのモデルを微調整して、トランスファーラーニング環境で新しいタスクを完了させることが強力なアイデアであることが証明されている。
本研究では,秩序な3次元構造の大規模研究に適した幾何的タスクの集合を定式化する。
我々は、幾何学的代数に基づく深部回転・置換同変ニューラルネットワークを構築し、これらを用いて、理想化された3次元構造とシミュレートされた3次元構造の両方においてこれらの課題を解決する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:24:15 GMT)
Segmenting Action-Value Functions Over Time-Scales in SARSA using TD($Δ$) [0.0] 本研究では,時間差分分解法であるTD($triangle$)をSARSAアルゴリズムに拡張する。
TD($triangle$)は、アクション値関数を異なる割引係数に関連するコンポーネントに分解することで、いくつかの時間スケールでの学習を容易にする。
本手法は,SARSAの更新におけるバイアスを軽減するとともに,高密度報酬を特徴とする文脈における収束を促進させる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 07:52:28 GMT)
Scrapping The Web For Early Wildfire Detection: A New Annotated Dataset of Images and Videos of Smoke Plumes In-the-wild [0.0] PyroNear-2024は、画像とビデオの両方で構成された新しいデータセットで、煙管検出モデルのトレーニングと評価を可能にする。
textit(i) パブリックなカメラネットワークからの山火事のWebスクラップビデオ、ワイルドファイア検出のためのワイルドファイア検出用ビデオ、我々の社内のカメラネットワークからのテキスト(ii) ビデオ、そしてtextit(iii) 合成画像と実画像のごく一部から得られたデータである。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:07:35 GMT)
Reassessing quantum-thermodynamic enhancements in continuous thermal machines [0.0] コヒーレンス(コヒーレンス)は、熱力学的タスクを実行する量子システムの運用能力に影響を与えることが示されている。
熱貯水池や作業源と弱い相互作用を持つ定常量子熱機械の場合、摂動によって引き起こされるコヒーレンスの存在は、真の熱力学的優位性を保証する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:18:27 GMT)
Rapid Integration of LLMs in Healthcare Raises Ethical Concerns: An Investigation into Deceptive Patterns in Social Robots [0.0] 大規模言語モデル(LLM)を社会ロボットに統合することで、その能力は大幅に向上した。
市販のLCMベースケアソフトウェアにおいて,ロボットに組み込まれた誤認行動パターンを観察した。
この偽りの行動は、信頼性が最重要である医療環境において重大なリスクをもたらす。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:31:28 GMT)
Quantum-circuit algorithms for many-body topological invariant and Majorana zero mode [0.0] トポロジカルな物質状態は、フォールトトレラント量子コンピュータを構成するための有望な資源である。
トポロジカルな性質を調べるための既存の量子回路アルゴリズムはまだ限られている。
1) 指定されたパリティ部分空間内の基底状態を決定するために設計された3つの量子回路アルゴリズムを導入し、(ii) 多体位相不変量を特定し、(iii) ゼロエネルギーエッジモードを可視化する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:45:48 GMT)
Quantum-Electrodynamical Density-Functional Theory Exemplified by the Quantum Rabi Model [0.0] 量子電磁力学の最小実装における密度汎関数理論(DFT)の鍵となる特徴を実証する。
我々は密度変数においてほとんど明示的な断熱接続の形式を導出する。
これにより、DFTのいくつかの重要な特徴を近似なしで研究することができる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 09:03:28 GMT)
Quantum Time Travel Revisited: Noncommutative Möbius Transformations and Time Loops [0.0] 我々は、グリーンベルガーとスヴォジルによって導入された量子時間ループの理論を、時間旅行系がヒルベルト空間の多次元基底を持つ一般的な状況にまで拡張する。
出現する主要な数学的ツールは非可換モフス変換である。
新しい環境では、祖父のパラドックスを分析します。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 21:50:30 GMT)
Quantum Photonic Gates with Two-Dimensional Random Walkers [0.0] 連続時間2次元ランダムウォーキング光子を利用する量子フォトニックゲートについて検討する。
これらのゲートは、光子が二酸化ケイ素散乱体を埋め込んだ2次元シリコンホスト媒体の中をランダムに歩く逆設計法を用いて実装することができる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 19:38:09 GMT)
Quantum Decision Theory [0.0] 本稿では、量子力学の形式論を用いて、エージェントのいわゆる「異常」な振る舞いを記述し、説明することを提案する。
基本的な考え方は、選択が下されるか決定が下される前に、これらのエージェントの選好が不確定であると仮定することである。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:37:52 GMT)
Quantum Algorithm for the Multiple String Matching Problem [0.0] 我々は$m$文字列のシーケンスを$S$と表現し、それを辞書と呼ぶ。
目的は、テキスト内の辞書から文字列のすべてのインスタンスを特定することである。
我々は,$O(n+sqrtmLlog nlog n)$クエリ複雑性と$O(n+sqrtmLlog n)=O*(n+sqrtmL)$タイム複雑性を持つ量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:50:43 GMT)
Predictive Modeling For Real-Time Personalized Health Monitoring in Muscular Dystrophy Management [0.0] 本稿では,筋ジストロフィー管理を支援するモノのインターネットシステムを提案する。
治療戦略を強化し、患者が自分の状態をよりよく管理し、医療専門家に彼らの管理決定への信頼を高めることを目的としている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:27:07 GMT)
Polaronic mechanism of Nagaoka ferromagnetism in Hubbard models [0.0] 長岡型強磁性は, 様々な実験プラットフォームが出現し, 新たな注目を集めている。
ここでは長岡強磁性の普遍的なメカニズムを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 06:17:21 GMT)
Personalization of Wearable Sensor-Based Joint Kinematic Estimation Using Computer Vision for Hip Exoskeleton Applications [0.0] 実時間関節キネマティック推定のためのコンピュータビジョンに基づくDL適応フレームワークを提案する。
このフレームワークは小さなデータセット(すなわち1-2歩行サイクル)しか必要とせず、プロのモーションキャプチャー設定に依存しない。
本フレームワークは, スマートフォンカメラ学習型DLモデルを用いて, 臨床における新規ユーザ間でのリアルタイム関節キネマティクスを推定し, ウェアラブルロボットへの応用の可能性を示すものである。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 22:17:42 GMT)
Parent Hamiltonian for Fully-augmented Matrix Product States [0.0] 完全に強化された行列積状態 (FAMPS) が最近導入された[Chin. Phys. Lett. 40, 057102 (2023)]。
FAMPS形式はMPS形式を2次元に拡張し、波動関数アンサッツの絡み合いを増加させる。
与えられたFAMPSをその正確な基底状態(FAMPSの親ハミルトニアン)とする二次元ハミルトニアンを構成する手順を説明する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:12:33 GMT)
Optimal Dose-Limited Phase Estimation without Entanglement [0.0] 損失媒体では、位相シフトを介して送信される粒子毎の到達可能な情報に上限がある。
以前は、この境界を飽和させるために、絡み合った測定しか示されていなかった。
エンタングルメントに頼らずに境界を飽和させることができる測定手法を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 19:49:55 GMT)
On the non-hermitian Kitaev chain [0.0] 任意のパラメータに対する非エルミート的北エフ連鎖モデルについて検討する。
無限大極限における複素平面における固有値曲線の簡潔な特徴付けを与える。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 07:43:46 GMT)
On the group-theoretical approach to energy quantization of a perturbed vortex ring: spectrum calculating in the pipe-type domain [0.0] 細長い管内を移動する量子渦ループのエネルギースペクトルの問題を示す。
我々は,この力学系を新しい手法で定量化し,非自明な循環結果をもたらす。
我々は、量子乱流を記述するために得られた結果を適用することができるモデルを改善する方法について論じる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 06:44:25 GMT)
On the Quantum Uncertainty of the Neutron Electric Dipole Moment [0.0] 我々は、現在の境界と、関連する量における期待される量子不確実性との間の約13桁の差から生じる明らかな緊張について論じる。
弱い測定という概念の観点で「ノズル」の解法を提供する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 20:09:48 GMT)
OSPtrack: A Labeled Dataset Targeting Simulated Open-Source Package Execution [0.0] このデータセットには9,461のパッケージレポート(悪意のある1,962)が含まれており、ファイル、ソケット、コマンド、DNSレコードなどの静的および動的機能を備えている。
ソースコードアクセスが制限されている場合、特に悪意のあるインジケータの特定を支援し、実行時に効率的な検出方法をサポートする。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:07:42 GMT)
Non-Abelian entanglement asymmetry in random states [0.0] 任意の対称性群に対して、平均エンタングルメント非対称性は、部分系がその補集合よりも小さいときに熱力学的極限において消滅する。
より大きいサブシステムサイズに対して、絡み合う非対称性は、群の次元によって固定係数で対数スケーリングを表示する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:11:46 GMT)
Nagaoka ferromagnetism in doped Hubbard models in optical lattices [0.0] ハバード模型の強磁性は1966年以来卓越した問題となっている。
量子シミュレーションの最近の進歩は、原子系のドープハバードモデルの研究を可能にした。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:45:48 GMT)
Multi-modal Representation Learning Enables Accurate Protein Function Prediction in Low-Data Setting [0.0] HOPER(Holistic ProtEin Representation)は、低データ設定でタンパク質機能予測(PFP)を強化するために設計された新しいフレームワークである。
本研究は,生物研究におけるデータ制限を克服するためのマルチモーダル表現学習の有効性を強調した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 20:13:55 GMT)
Market Reaction to News Flows in Supply Chain Networks [0.0] 発表前には、前向きなニュースが株価の変動率を増加させていることがわかりました。
プラスニュースは、開示前にサプライヤーやクライアントの株価も上昇させる。
一般的に、先物効果よりも先物企業やサプライヤー、クライアントの株価に対する後物効果が大きい。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:43:55 GMT)
Machine Learning for Practical Quantum Error Mitigation [0.0] 量子エラー軽減のための機械学習は、そのコストを大幅に削減することを示す。
本稿では,ML-QEMを用いて従来の緩和手法を模倣し,より優れた実行効率で拡張性を実現する方法を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:25:01 GMT)
Linear convergence of proximal descent schemes on the Wasserstein space [0.0] 相対エントロピー $operatornameKL(cdot|pi)$ が独自のワッサーシュタイン部分次数を持ち、相対フィッシャー情報が実際に有限であることを証明する。
我々は、一様対数ソボレフ不等式(LSI)とエントロピーの「サンドウィッチ」補題を用いて、arXiv:2201.10469とarXiv:2202.01009から解析を拡張した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:56:12 GMT)
Learnable Activation Functions in Physics-Informed Neural Networks for Solving Partial Differential Equations [0.0] 物理情報ネットワーク(PINN)における学習可能なアクティベーション関数を用いた部分微分方程式(PDE)の解法について検討する。
従来のMLP(Multilayer Perceptrons)とKAN(Kolmogorov-Arnold Neural Networks)に対する固定および学習可能なアクティベーションの比較を行った。
この発見は、PDEソルバのトレーニング効率、収束速度、テスト精度のバランスをとるニューラルネットワークアーキテクチャの設計に関する洞察を提供する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:25:13 GMT)
Instantaneous tunneling time within the theory of time-of-arrival operators [0.0] 量子トンネルは古典的TOAのワイル量子化によって構築された時変演算子を用いて瞬時に行われる。
しかし、古典的なTOAの量子画像は無限に存在するため、他のものよりも一意に好まれているかどうかは不明だ。
ここでは、位置と運動量観測値の間の順序規則によらず、古典的到着時間の可能な全ての量子画像についてトンネル時間が消滅することを実証する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:19:21 GMT)
Influence functions and regularity tangents for efficient active learning [0.0] 本稿では,データに対する好奇心を持つ回帰モデルを提供するための効率的な方法について述べる。
機械学習の分野では、好奇心を表現するためのフレームワークをアクティブラーニング(Active Learning)と呼ぶ。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:14:26 GMT)
Improving EO Foundation Models with Confidence Assessment for enhanced Semantic segmentation [0.0] 我々は,拡張セマンティックセグメンテーション(CAS)モデルのための信頼度評価法を開発した。
セグメントレベルとピクセルレベルの両方の信頼度を評価し、ラベルと信頼スコアの両方を出力として提供する。
この研究は、特にセマンティックセグメンテーションの下流タスクにおけるEOファンデーションモデルの評価において重要な応用がある。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:45:55 GMT)
Implementation of Real-Time Lane Detection on Autonomous Mobile Robot [0.0] カメラを用いたSEATER P2MC-BRINプロトタイプのリアルタイム適用を目的としたUltra Fast Lane Detectionアルゴリズムの実現を目指している。
データ処理速度と精度の観点からアルゴリズムの性能を評価するための予備実験を行った。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:53:33 GMT)
High-dynamic-range atomic clocks with dual Heisenberg-limited precision scaling [0.0] Greenberger-Horne-Zeilinger状態(GHZ)は、量子センシングの基本的な精度限界に達することができる最大多粒子エンタングル状態である。
GHZ状態に基づく原子時計は、ハイゼンベルク限界精度を達成する可能性を持っているが、ダイナミックレンジの減少に悩まされている。
ここでは、ベイズ量子推定を用いて、GHZ状態に基づく原子時計のダイナミックレンジを拡張する方法を示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:57:32 GMT)
Gill and Massar type bound for estimation of $SU(2)$ channel [0.0] 任意の重み行列に対してGillおよびMassar型非バイアス推定器の重み付きトレースの下界を導出できることが示される。
条件を満たす場合,Gill および Massar 型の下界はランダム化戦略を用いて達成可能であることを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:14:56 GMT)
GeoScatt-GNN: A Geometric Scattering Transform-Based Graph Neural Network Model for Ames Mutagenicity Prediction [0.0] 本稿では, 3つの接地的アプローチを導入することで, 変異原性予測の急激な課題に取り組む。
まず,従来の分子ディスクリプタと比較して,分子画像から抽出した2次元散乱係数の優れた性能を示す。
第2に、幾何学グラフ散乱(GGS)、グラフ同型ネットワーク(GIN)、機械学習モデルを組み合わせて、変異原性予測において強力な結果を得るハイブリッドアプローチを提案する。
第3に、新しいグラフニューラルネットワークアーキテクチャMOLG3-SAGEを導入し、GGSノード機能を完全に連結されたグラフ構造に統合し、優れた予測精度を実現する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 19:52:56 GMT)
GIS Copilot: Towards an Autonomous GIS Agent for Spatial Analysis [0.0] ジェネレーティブAIは、空間分析に有望な機能を提供する。
これらの可能性にもかかわらず、ジェネレーティブAIと確立されたGISプラットフォームの統合はいまだ検討されていない。
GIS Copilot" はGISユーザが自然言語コマンドを使ってQGISと対話して空間分析を行うことを可能にする。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:00:21 GMT)
Funhouse Mirror or Echo Chamber? A Methodological Approach to Teaching Critical AI Literacy Through Metaphors [0.0] 本研究では,概念メタファー理論(CMT)とユネスコのAI能力フレームワークを組み合わせて,クリティカルAIリテラシー(CAIL)を開発する手法を提案する。
我々は,CAIL の教え方として,GenAI をエコーチャンバーとして,GenAI をファンハウスミラーとして,GenAI をブラックボックスマジシャンとして,GenAI をマップとして,4つの重要なメタファを特定し,提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:01:11 GMT)
Fixed Points of Completely Positive Trace-Preserving Maps in Infinite Dimension [0.0] ここでは、ある追加の仮定の下で不動点が存在することを証明する。
この問題の動機は、閉時間のような曲線を持つ時空で量子論を定義する方法に関するDeutschの提案から来ています。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:50:53 GMT)
First-order optimality conditions for non-commutative optimization problems [0.0] 非可換変数の導出状態平均を最適化する問題を考察する。
状態最適条件はすべてのNPO問題によって満たされる。
作用素最適条件はカルーシュ=クーン=タッカー条件の非可換類似である。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:41:09 GMT)
Financial Fraud Detection using Jump-Attentive Graph Neural Networks [0.0] 金融サービス部門の大部分は、トランザクションデータをモデル化するために、XGBoost、Random Forest、ニューラルネットワークなど、さまざまな機械学習アルゴリズムを使用している。
非類似ノードからのカモフラージュ検出と重要な特徴情報の保存に有効な効率的な近傍サンプリング手法を用いた新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:34:58 GMT)
Few-shot Multispectral Segmentation with Representations Generated by Reinforcement Learning [0.0] 本稿では,強化学習を用いたマルチスペクトル画像における少数ショットセグメンテーション性能向上のための新しい手法を提案する。
我々の手法は、エージェントを訓練して、小さなデータセットを使って最も情報に富む表現を識別することを含む。
表現の長さが限られているため、モデルはオーバーフィッティングのリスクを伴わずに有用な表現を受け取る。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 19:04:08 GMT)
Fast convolution algorithm for state space models [0.0] 本稿では,線形時間不変系の行列伝達関数を時間領域に適用するための頑健なアルゴリズムを提案する。
有限個のユーザ選択精度に対して、行列ベクトル乗算の数は$mathcalOleft(log_2Lright)$に削減できることを示す。
重要なことに、時間領域におけるカスケードの実装を用いることで、転送関数を適用するには、N+1$行列ベクトル乗算しか必要としない。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:30:03 GMT)
Fantastic Biases (What are They) and Where to Find Them [0.0] 一般にバイアスとは何かを定義しようとする。
マシンラーニングで避けたいのは、一般的に負のバイアスと見なされるものの概念に注目します。
我々はそれらを検出するための古典的な方法に目を向けて結論付けた。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:38:03 GMT)
FTA generation using GenAI with an Autonomy sensor Usecase [0.0] 本稿では,FTA(Fault Tree Analysis)を開発するために生成人工知能(GenAI)の利用範囲を探究する。
さまざまな利用可能なオープンソースのLarge Language Models(LLM)モデルを探索し、その1つを深く掘り下げて、その応答を研究し、分析します。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:31:20 GMT)
FEAD: Figma-Enhanced App Design Framework for Improving UI/UX in Educational App Development [0.0] 本研究では、Figmaの高度なデザインツールをMIT App Inventorに統合する構造化フレームワークである、Figma-Enhanced App Design (FEAD)メソッドを紹介した。
比較評価では、61.2%の参加者がFEADで強化されたデザインをプロのアプリと同等に感じている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:56:53 GMT)
Exploring the Use of Machine Learning Weather Models in Data Assimilation [0.0] GraphCastとNeuralGCMは、MLベースの有望な2つの気象モデルであるが、データ同化への適合性はまだ未定である。
GraphCast と NeuralGCM の TL/AD 結果と,既存の数値天気予報モデルである Model for Prediction Across Scales - Atmosphere (MPAS-A) との比較を行った。
GraphCastとNeuralGCMの隣り合わせの結果はMPAS-Aのものと多少似ているが、様々な垂直レベルの非物理的ノイズも示し、運用DAシステムに対する堅牢性への懸念を提起している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:18:28 GMT)
Evaluating Vision Transformer Models for Visual Quality Control in Industrial Manufacturing [0.0] 工業生産における機械学習の最も有望なユースケースの1つは、欠陥のある製品の早期発見である。
我々は、異常検出手法とともに、現在の視覚変換器モデルを評価する。
品質管理システムに適したモデルアーキテクチャを実際に選択するためのガイドラインを提示する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:12:35 GMT)
Entanglement asymmetry in CFT with boundary symmetry breaking [0.0] 半無限バルク境界への対称性破れから生じるサブシステム$A$の非対称性について検討する。
ツイスト場の形式性を利用することで、非対称性に対する普遍的な表現を導出する。
本研究の正確な分析結果は,Isingモデルと3状態ポッツモデルにおける数値シミュレーションによって検証される。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 14:25:29 GMT)
Enhancing Link Prediction with Fuzzy Graph Attention Networks and Dynamic Negative Sampling [0.0] Fuzzy Graph Attention Networks (FGAT) は、動的負サンプリングのためにファジィ粗集合を統合する新しいアプローチである。
FNSはファジィ類似性に基づいて高品質な負エッジを選択し、トレーニング効率を向上させる。
2つの研究コラボレーションネットワークの実験は、FGATの優れたリンク予測精度を示し、最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 00:48:57 GMT)
Detection of a semitransparent object with no exchange of quanta [0.0] 本研究では,光子交換を伴わない部分吸収物体の検出を目的として,ファブリ・ペロト空洞の最適化を解析した。
対象物による吸収による空洞崩壊速度が空洞のそれと同程度であれば, 2つの確率の積は空洞によって最大化されることを示す。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 23:59:42 GMT)
Detecting Visual Triggers in Cannabis Imagery: A CLIP-Based Multi-Labeling Framework with Local-Global Aggregation [0.0] 本研究では,大麻食用のオンライン議論における視覚的特徴とテキスト的特徴の相互作用について検討した。
私たちはFacebookから42,743枚の画像を分析した(2021年3月1日~8月31日)。
線形回帰分析では,食関連視覚とユーザエンゲージメントスコアとの間に有意な正の相関が認められた。
画像のカラフルさや特定のテキストテーマと負の関連が観察された。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:19:29 GMT)
Deep Learning-Based Automatic Delineation of Liver Domes in kV Triggered Images for Online Breath-hold Reproducibility Verification of Liver Stereotactic Body Radiation Therapy [0.0] 定位体放射線療法(SBRT)は、肝癌および肝転移に対する、正確かつ最小限の侵襲的治療方法である。
現在の方法では、kVトリガー画像から肝ドームの位置を手動で検証する必要があることが多い。
そこで本研究では,kV平面画像から肝ドームを自動的に切り離す深層学習パイプラインの実証実験を提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 19:30:40 GMT)
Decoherence of electron spin qubit during transfer between two semiconductor quantum dots at low magnetic fields [0.0] 電子シャットリング(Electron shuttling)は、半導体量子ドットベースのスピン量子ビットをスケールするために追求されている現在の道の1つである。
理論的には、2つのトンネル結合量子ドット間で断熱的に転送されるスピン量子ビットの劣化を解析する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 12:41:19 GMT)
DAIRHuM: A Platform for Directly Aligning AI Representations with Human Musical Judgments applied to Carnatic Music [0.0] 本稿では,AI音楽モデルRepresentationsとHuman Musical judgments(DAIRHuM)の直接的なアライメントを探求するプラットフォームを提案する。
ミュージシャンや実験家が音楽録音のデータセットに類似点をラベル付けできるように設計され、事前訓練されたモデルのラベルとのアライメントを調べる。
その結果、リズムの調和の人的判断とモデルアライメントに関する顕著な知見が得られ、また、リズム知覚とカーナティック音楽特有の音楽類似性判断に重要な違いが浮き彫りにされた。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:04:51 GMT)
Cosmological Analysis with Calibrated Neural Quantile Estimation and Approximate Simulators [0.0] 我々は,多数の近似シミュレーションをトレーニングに利用し,少数の高忠実度シミュレーションをキャリブレーションに利用した新しいシミュレーションベース推論(SBI)手法を提案する。
概念の証明として、2次元暗黒物質密度写像から、z=0$で$k_rm maxsim1.5,h$/Mpcまでの距離で宇宙的パラメータを推定できることが示される。
キャリブレーション後部は、$sim104$ expensive Particle-Particle (PP) シミュレーションの直接トレーニングにより得られたものとよく一致するが、計算コストのごく一部で一致する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 05:53:46 GMT)
Constructing Multipartite Planar Maximally Entangled States from Phase States and Quantum Secret Sharing Protocol [0.0] 位相状態からの平面最大角度(PME)状態の構築について検討する。
PME状態は、隣接する粒子の任意の部分集合が、粒子の総数の半分以下であるような$n$-partite状態のクラスを形成する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 17:10:58 GMT)
Completeness of Energy Eigenfunctions for the Reflectionless Potential in Quantum Mechanics [0.0] 我々は、リフレクションレスポテンシャルの散乱(連続)状態とともに、境界(離散)状態の集合が完全集合を形成することを証明する。
単一境界状態の場合、対応する波動関数は系の連続固有状態の知識から得られる。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:53:55 GMT)
Comparative Study of Neural Network Methods for Solving Topological Solitons [0.0] 位相ソリトンは、非線形微分方程式の安定で局所的な解である。
我々は,ソリトンを効率的に解くためにニューラルネットワーク(NN)を用いた新しい手法を開発した。
同様のNNアプローチとして、物理情報ニューラルネットワーク(PINN)がある。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:54:52 GMT)
Comment on "Time Crystal in a Single-mode Nonlinear Cavity" [0.0] 特に、デファス化や追加の非線形性を考えると、その位相はランダムにドリフトする傾向にある。
このコメントが、タイムクリスタルと見なすべきでないものについて、議論を巻き起こすことを願っています。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 08:27:56 GMT)
Causal Representation Learning with Generative Artificial Intelligence: Application to Texts as Treatments [0.0] テキストなどの非構造的高次元処理による因果推論の有効性を高める方法について述べる。
本稿では,大規模言語モデル(LLM)のような深層生成モデルを用いて治療を効率的に生成することを提案する。
この真の内部表現の知識は、関心事の処理特徴を乱すのに役立ちます。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:31:25 GMT)
Can Features for Phishing URL Detection Be Trusted Across Diverse Datasets? A Case Study with Explainable AI [0.0] フィッシング(Phishing)は、ユーザーを操り、偽装戦術によって機密性の高い個人情報を暴露するサイバー脅威として広く利用されている。
フィッシングURL(またはウェブサイト)を積極的に検出することは、広く受け入れられた防衛アプローチとして確立されている。
公開されている2つのフィッシングURLデータセットを分析し、それぞれのデータセットにはURL文字列とWebサイトコンテンツに関連する独自の、重複した機能セットがあります。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:14:02 GMT)
Brain-Computer Interfaces for Emotional Regulation in Patients with Various Disorders [0.0] この研究は、脳波データを理解するための新しいニューラルネットワークアルゴリズムの開発に焦点を当てている。
データ分析は、アルゴリズムが高い精度で感情状態の分類に成功し、有望な結果を示す。
このことは、脳波に基づくBCIは、感情の認識と制御において、様々な神経学的および生理的障害を持つ個人を支援する貴重なツールとなる可能性があることを示唆している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 01:57:14 GMT)
Bone: Block-Affine Adaptation of Large Language Models [0.0] Low-Rank Adaptation (LoRA)は、オリジナルの重量を凍結し、低ランクの行列のみを訓練することで、優れたトレーニング結果を得た。
本稿では,Block-Affine Adaptation (Bone)と呼ばれる,LoRAとは異なる新しいPEFT手法を提案する。
Boneはメモリ使用量を大幅に削減し、高速な計算を実現する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:40:35 GMT)
Bio-inspired AI: Integrating Biological Complexity into Artificial Intelligence [0.0] 人工知能を作ることの追求は、私たち自身の知性を理解することへの長年の関心を反映している。
最近のAIの進歩は約束を守るが、特異なアプローチはしばしば知性の本質を捉えるのに不足する。
本稿では,生物計算の基本原理が真にインテリジェントなシステムの設計をいかに導くかを検討する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:55:39 GMT)
Benchmarking Multimodal Models for Ukrainian Language Understanding Across Academic and Cultural Domains [0.0] 大学入試(ZNO)から得られた総合的マルチモーダルウクライナ中心ベンチマークZNO-Visionを紹介する。
このベンチマークは、数学、物理学、化学、人文科学など12の分野にまたがる4300以上の専門家による質問で構成されている。
新しいベンチマークとともに、ウクライナ語のマルチモーダルテキスト生成に関する最初の評価研究を行った。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 00:37:49 GMT)
Bayesian dynamic mode decomposition for real-time ship motion digital twinning [0.0] 本稿では, 船体動特性の予測ツールとして, ハンケル・ダイナミックモード分解法のベイズ拡張を提案する。
提案アルゴリズムは, デジタルツインニングに係わる定式化の要件をすべて満たし, 物理系からデータを取得することにより, 結果のモデルを適応させることができる。
3種類のCFDソルバのデータを用いて,Fr = 0.33 におけるビームベース海洋7不規則波の5415Mモデルの軌道維持について検討した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 10:25:44 GMT)
BanglaEmbed: Efficient Sentence Embedding Models for a Low-Resource Language Using Cross-Lingual Distillation Techniques [0.0] この研究はバングラ語のための2つの軽量な文変換器を導入している。
この方法は、事前訓練されたハイパフォーマンスな英語文変換器からの知識を蒸留する。
新しい手法は既存のBangla文変換器を一貫して上回った。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 13:03:25 GMT)
Automatic Design of Semantic Similarity Ensembles Using Grammatical Evolution [0.0] 単一の意味的類似度尺度はすべてのタスクに最も適しており、研究者はパフォーマンスを確保するためにアンサンブル戦略を使うことが多い。
本研究は,意味的類似性アンサンブルを自動設計する手法を提案する。
提案手法は,人的判断の相関を最大化するアンサンブルを作成するために,まず,候補のプールから測度を自動的に選択・集約するために文法的進化を利用する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 12:42:14 GMT)
Attosecond physics hidden in Cherenkov radiation [0.0] 超光速で移動する荷電粒子のチェレンコフ放射は、よく研究されている現象である。
ここでは、チェレンコフ放射の固有動力学を探索するための理論的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:13:06 GMT)
Astro-HEP-BERT: A bidirectional language model for studying the meanings of concepts in astrophysics and high energy physics [0.0] このプロジェクトは、科学の歴史、哲学、社会学の応用に双方向トランスフォーマーを適用することの有効性と可能性を示す。
トレーニングプロセス全体は、無償のコード、事前訓練された重み、テキスト入力を使用して実行され、1つのMacBook Pro Laptopで完了した。
予備的な評価は、Astro-HEP-BERTのCWEが、より大きなデータセットでスクラッチからトレーニングされたドメイン適応BERTモデルと互換性があることを示している。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 11:59:15 GMT)
Are vacuum fluctuations relevant in absorption dynamics? [0.0] 我々は、その提案の整合性と過去の結果とを二重自然発光で分析する。
2つの原子による単一吸収の場合、その後の自然放出パターンの時間依存性に基づく試験を行う。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 12:41:12 GMT)
Antineutrinos produced from $β$ decays of neutrons cannot be in coherent superpositions of different mass eigenstates [0.0] 反ニュートリノ-プロトン-電子系の波動関数全体を解析する。
反ニュートリノは、異なる質量固有状態のコヒーレントな重ね合わせでは存在できないことが証明されている。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 03:08:10 GMT)
Achieving computational gains with quantum error correction primitives: Generation of long-range entanglement enhanced by error detection [0.0] 論理エンコーディングのないQECプリミティブの戦略的応用は超伝導プロセッサにおいて大きな利点をもたらす可能性があることを示す。
本稿では,GHZ(Greenberger-Horne-Zeilinger)状態に依存した長距離CNOTゲートを実装するための新しいプロトコルを提案する。
我々は,現在報告されている中で最大である,真の多部絡み合いを示す75量子GHZ状態を生成する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 00:08:23 GMT)
Absolute frequency measurements on the $5s5p^{3}$P$_{0}\to5s6d^{3}$D$_{1}$ transition in strontium [0.0] 5s5p3$P$_0to5s6d3$D$_1$トランジションを394nmの安定ストロンチウム同位体で測定した。
フェルミオン同位体8,7$Srの超微粒子定数A,BをkHzで計算する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:22:05 GMT)
A Unified Approach to Semi-Supervised Out-of-Distribution Detection [0.0] 初期の弱点の1つが特定された。
深層トレーニングは 信頼性の低い予測を 提供できないことです
MoLARは訓練に効率的で、強度を提供します。
OODパフォーマンスは、模範を代表に選んだ小さな画像群と比較するだけである。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 01:20:29 GMT)
A Real-Time DETR Approach to Bangladesh Road Object Detection for Autonomous Vehicles [0.0] 検出トランスフォーマーは、オブジェクト検出の最先端のソリューションになっている。
実時間DECRモデルは、推定時間において大幅に向上する。
この結果、公的な60%テストセットで0.41518、プライベートな40%テストセットで0.28194、mAP50スコアが0.41518となった。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 18:21:20 GMT)
A QCA for every SPT [0.0] 3次元では、非自明な量子セルオートマトン (QCA) があり、3つのフェルミオンウォーカー-ワング模型を歪めている。
QCAのいくつかはクリフォードであり、これらの定理をクリフォード QCAの分類定理に関連付ける。
クリフォードQCAを4m+1$次元で同定し、クリフォードゲートを使用せず、クリフォードゲートを使用せずに低深さの回路記述を求める。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 01:22:28 GMT)
A New Way: Kronecker-Factored Approximate Curvature Deep Hedging and its Benefits [0.0] 本稿では, Kronecker-Factored Approximate Curvature (K-FAC) 最適化の新たな統合により, ディープヘッジフレームワークの計算効率を向上する。
提案アーキテクチャは,K-FACの2次最適化とLong Short-Term Memory (LSTM)ネットワークを結合する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 15:19:40 GMT)
A Lightweight Edge-CNN-Transformer Model for Detecting Coordinated Cyber and Digital Twin Attacks in Cooperative Smart Farming [0.0] ある農場でのサイバー攻撃は広範囲に及ぼし、標的の農場だけでなく、協同組合内の全ての農場にも影響を及ぼす可能性がある。
本研究は協調型スマートファーミング(CSF)のための新規でセキュアなアーキテクチャを提案する。
本稿では,CNN変換器を用いたネットワーク異常検出モデルを提案する。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 04:52:13 GMT)
A Decision Support System for daily scheduling and routing of home healthcare workers with a lunch break consideration [0.0] 本研究は、昼休みを条件とした在宅医療スケジュール・ルーティング問題(HHSRP)について検討する。
目的は、ルート内の旅行距離を最小化することと、訪問されていない患者(費用)のコストを最小化することである。
我々は,短時間で高品質なソリューションを提供するために,効果的な適応型大規模近傍探索アルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 16:18:09 GMT)
A Data-Driven Pool Strategy for Price-Makers Under Imperfect Information [0.0] 本稿では,不完全情報に基づく価格設定者のプール戦略について検討する。
価格メーカーは、利用可能な歴史情報を用いて、提供曲線に関する市場結果を見積もるべきである。
論文参考訳(メタデータ) (Fri, 22 Nov 2024 02:58:45 GMT)