Robust and Transferable Backdoor Attacks Against Deep Image Compression With Selective Frequency Prior [118.9] 本稿では,学習画像の圧縮モデルに複数のトリガを付加したバックドアアタックを起動するための新しい周波数ベースのトリガインジェクションモデルを提案する。
1) 圧縮品質をビットレートと再現精度で劣化させる,2) 顔認識やセマンティックセグメンテーションといったタスク駆動型対策を目標とする,様々なシナリオに適した攻撃目標を設計する。
実験の結果, トリガーインジェクションモデルと, エンコーダパラメータの微調整を組み合わせることで, 複数のバックドアとトリガーを1つの圧縮モデルに注入することができた。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:58:40 GMT)
HaGRIDv2: 1M Images for Static and Dynamic Hand Gesture Recognition [108.5] 本稿では,ハンドジェスチャ認識データセットHaGRID-HaGRIDv2の2番目のバージョンを提案する。
我々は会話と制御機能を備えた15の新しいジェスチャーをカバーしている。
動的ジェスチャー認識アルゴリズムを実装し、さらに3つの新しい操作ジェスチャー群を追加して拡張する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:01:44 GMT)
Second FRCSyn-onGoing: Winning Solutions and Post-Challenge Analysis to Improve Face Recognition with Synthetic Data [104.3] 第2回FRCSyn-onGoingチャレンジは、CVPR 2024で開始された第2回顔認識チャレンジ(FRCSyn)に基づいている。
我々は、顔認識における現在の課題を解決するために、個々のデータと実際のデータの組み合わせの両方で合成データの利用を検討することに重点を置いている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:12:01 GMT)
T2Vid: Translating Long Text into Multi-Image is the Catalyst for Video-LLMs [102.7] そこで我々は,T2Vidと呼ばれるビデオライクなサンプルを合成し,学習コーパスの多様性を高める手法を開発した。
提案手法は,長いビデオサンプルをトレーニングすることなく,長いビデオ理解の性能を向上させることができる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:54:47 GMT)
Visual Cue Enhancement and Dual Low-Rank Adaptation for Efficient Visual Instruction Fine-Tuning [102.2] VCE(Vision Cue Enhancement)とDual-LoRA(Dual-LoRA)の2つの新しいアプローチによる効率的な微調整フレームワークを提案する。
VCEは、マルチレベルビジュアルキューを統合することで、視覚プロジェクタを強化し、きめ細かい視覚的特徴をキャプチャするモデルの能力を向上させる。
Dual-LoRAは、命令チューニングのための2つの低ランク構造を導入し、スキルとタスク空間に学習を分離し、様々なタスクにまたがって正確な制御と効率的な適応を可能にする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:41:38 GMT)
From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation Models [98.4] グラフ形式のデータの可視化は、データ分析において重要な役割を担い、重要な洞察を提供し、情報的な意思決定を支援する。
大規模言語モデルのような大規模な基盤モデルは、様々な自然言語処理タスクに革命をもたらした。
本研究は,自然言語処理,コンピュータビジョン,データ解析の分野における研究者や実践者の包括的資源として機能する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:22:40 GMT)
Behavior Backdoor for Deep Learning Models [95.5] 我々は,行動訓練されたバックドアモデルトレーニング手順として定義された行動バックドアアタックに向けた第一歩を踏み出す。
本稿では,行動バックドアを実装する最初のパイプライン,すなわち量子バックドア(QB)攻撃を提案する。
さまざまなモデル、データセット、タスクで実験が行われ、この新たなバックドア攻撃の有効性が実証された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:54:02 GMT)
DiffPatch: Generating Customizable Adversarial Patches using Diffusion Model [88.1] DiffPatchと呼ばれる新しい拡散型カスタマイズ可能なパッチ生成フレームワークを提案する。
提案手法により,ランダムノイズから始めるのではなく,参照画像をソースとして利用することが可能になる。
我々は, YOLOv5sを対象とする物理逆TシャツデータセットAdvPatch-1Kを開発した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:30:35 GMT)
VibeCheck: Discover and Quantify Qualitative Differences in Large Language Models [82.9] VibeCheckは、2つの大きな言語モデルを自動的に比較するシステムである。
明確に定義され、差別化され、ユーザ整合したモデル(ビーブ)の特性を発見する。
VibeCheckは、ラマは友好的で、面白く、やや物議を醸していると明かす。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:27:39 GMT)
FIRE: A Dataset for Feedback Integration and Refinement Evaluation of Multimodal Models [81.0] 我々は27のソースデータセットから派生した1.10万のマルチターン会話からなるフィードバック・リファインメント・データセットを構築した。
データ収集のスケールアップには、FIRE-100KとFIRE-1Mの2つのコンポーネントが使用される:FIRE-100KはGPT-4Vで生成され、FIRE-1MはFIRE-100Kで訓練されたモデルを介して自由に生成される。
FIRE-100KおよびFIRE-1M上でのLLaVAの微調整によりFIRE-LLaVAモデルを構築し、FIRE-Bench上で顕著なフィードバック精錬能力を示し、未学習のVLMを50%上回る性能を示した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:43:40 GMT)
GausSurf: Geometry-Guided 3D Gaussian Splatting for Surface Reconstruction [79.4] GausSurfは、テクスチャリッチな領域におけるマルチビュー一貫性と、シーンのテクスチャレスな領域における通常の事前の幾何学的ガイダンスを採用している。
本手法は,再現性や計算時間の観点から,最先端の手法を超越した手法である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:47:15 GMT)
Truth or Mirage? Towards End-to-End Factuality Evaluation with LLM-Oasis [78.1] LLM-Oasisは、エンド・ツー・エンドの事実性評価をトレーニングするための最大のリソースである。
ウィキペディアからクレームを抽出し、これらのクレームのサブセットを偽造し、事実と非事実のテキストのペアを生成することで構築される。
次に、データセットの品質を検証し、事実性評価システムのための金の標準テストセットを作成するために、人間のアノテータに依存します。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:28:07 GMT)
X-Prompt: Towards Universal In-Context Image Generation in Auto-Regressive Vision Language Foundation Models [78.0] インコンテキスト生成は、大規模言語モデル(LLM)のオープンタスク一般化機能の重要なコンポーネントである。
X-Promptは純粋に自動回帰型の大規模言語モデルであり、画像生成タスクと見えないタスクの両方で、幅広いパフォーマンスを提供するように設計されている。
テキストと画像の予測を統一したトレーニングタスクにより、X-Promptは、テキスト内の例からタスク認識を強化して、一般的な画像生成を処理できる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:59:26 GMT)
Commit0: Library Generation from Scratch [77.4] Commit0は、AIエージェントにスクラッチからライブラリを書くよう促すベンチマークである。
エージェントには、ライブラリのAPIを概説する仕様文書と、インタラクティブなユニットテストスイートが提供されている。
Commit0はまた、モデルが生成したコードに対して静的解析と実行フィードバックを受け取る、インタラクティブな環境も提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:11:30 GMT)
Compute-Constrained Data Selection [77.1] 多くの強力なデータ選択手法は、ほとんど計算に最適ではないことが分かりました。
計算最適トレーニングでは、パープレキシティと勾配データ選択は、それぞれ5xと10xのトレーニング-選択モデルサイズ比を必要とする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:59:28 GMT)
VQA$^2$: Visual Question Answering for Video Quality Assessment [76.8] ビデオ品質アセスメント(VQA)は、低レベルの視覚知覚において古典的な分野である。
画像領域における最近の研究は、視覚質問応答(VQA)が視覚的品質を著しく低レベルに評価できることを示した。
VQA2インストラクションデータセットは,ビデオ品質評価に焦点をあてた最初の視覚的質問応答インストラクションデータセットである。
VQA2シリーズは、ビデオにおける空間的時間的品質の詳細の知覚を高めるために、視覚的および運動的トークンをインターリーブする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:09:39 GMT)
Demystify Mamba in Vision: A Linear Attention Perspective [72.9] Mambaは線形計算複雑性を持つ効率的な状態空間モデルである。
我々は,Mambaが線形アテンショントランスフォーマーと驚くほど類似していることを示す。
本稿では,これら2つの鍵設計の利点を線形注意に取り入れた,マンバインスパイアされた線形注意(MILA)モデルを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:41:46 GMT)
Self-Improvement in Language Models: The Sharpening Mechanism [70.9] 言語モデリングにおける最近の研究は、言語モデルが外部からのフィードバックなしにより高いパフォーマンスを達成するために、言語世代を評価し、洗練する自己改善の可能性を高めている。
我々は、レンズを通して自己改善の能力について、新たな視点を提供する。
言語モデルは、正しい応答を生成する場合よりも、応答品質の検証が優れているという観察に感銘を受けて、後学習において、モデル自体を検証対象として、自己改善を形式化する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:24:17 GMT)
GuardSplat: Efficient and Robust Watermarking for 3D Gaussian Splatting [70.8] 3D Gaussian Splatting (3DGS)は、最近、様々なアプリケーションのための印象的な資産を作成した。
既存の透かし方式は、セキュリティ、キャパシティ、可視性を考慮して3DGSには適していない。
本稿では、3DGS資産の著作権を効果的に保護する革新的で効率的なフレームワークであるGuardSplatを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:44:52 GMT)
LSceneLLM: Enhancing Large 3D Scene Understanding Using Adaptive Visual Preferences [70.1] LSceneLLMはタスク関連領域を自動的に識別する適応型フレームワークである。
濃密なトークンセレクタは、LDMの注意マップを調べて、命令入力の視覚的嗜好を特定する。
適応自己保持モジュールを利用して、粗い粒度と選択されたきめ細かい視覚情報を融合する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:07:57 GMT)
Embryo 2.0: Merging Synthetic and Real Data for Advanced AI Predictions [69.1] 2つのデータセットを使用して、2つの生成モデルをトレーニングします。
2-cell, 4-cell, 8-cell, morula, blastocyst など, 様々な細胞で合成胚画像を生成する。
これらは実画像と組み合わせて、胚細胞ステージ予測のための分類モデルを訓練した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:24:49 GMT)
OminiControl: Minimal and Universal Control for Diffusion Transformer [68.3] OminiControlは、イメージ条件をトレーニング済みのDiffusion Transformer(DiT)モデルに統合するフレームワークである。
コアとなるOminiControlはパラメータ再利用機構を活用しており、強力なバックボーンとしてイメージ条件をエンコードすることができる。
OminiControlは、主観駆動生成や空間的に整合した条件を含む、幅広いイメージコンディショニングタスクを統一的に処理する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:59:40 GMT)
World-consistent Video Diffusion with Explicit 3D Modeling [67.4] World-Consistent Video Diffusion (WVD)は、XYZ画像を用いた明示的な3D監視を含む新しいフレームワークである。
我々は拡散変換器を訓練し、RGBとXYZフレームの結合分布を学習する。
WVDは、シングルイメージから3D生成、マルチビューステレオ、カメラ制御ビデオ生成といったタスクを統一する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:58:23 GMT)
Understanding Warmup-Stable-Decay Learning Rates: A River Valley Loss Landscape Perspective [66.8] Warmup-Stable-Decay (WSD) スケジュールは、一定の学習率を使用して、所定の計算予算なしで無限に継続できるイテレーションのメインブランチを生成する。
プレトレーニング損失は,河底に川がある深い谷に類似した河谷景観を呈することを示す。
この理論にインスパイアされたWSD-Sは、従来のチェックポイントの崩壊フェーズを再利用し、メインブランチを1つだけ保持するWSDの変種である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:54:54 GMT)
Are We There Yet? Revealing the Risks of Utilizing Large Language Models in Scholarly Peer Review [66.7] 大規模言語モデル(LLM)がピアレビューに統合された。
未確認のLLMの採用は、ピアレビューシステムの完全性に重大なリスクをもたらす。
5%のレビューを操作すれば、論文の12%が上位30%のランキングでその地位を失う可能性がある。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:55:03 GMT)
FoundIR: Unleashing Million-scale Training Data to Advance Foundation Models for Image Restoration [66.6] 既存の手法は現実のシナリオにおける一般化ボトルネックに悩まされる。
既存のトレーニングデータに対して,2つの大きなメリットがある,100万規模のデータセットをコントリビュートしています。
実世界のシナリオにおいて,より広範囲の復元作業に対処するために,ロバストなモデルFoundIRを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:08:40 GMT)
AC3D: Analyzing and Improving 3D Camera Control in Video Diffusion Transformers [66.3] カメラの動きを第一原理の観点から分析し、正確な3Dカメラ操作を可能にする洞察を明らかにする。
これらの知見を合成して、高度な3Dカメラ制御(AC3D)アーキテクチャを設計する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:43:30 GMT)
PhysGame: Uncovering Physical Commonsense Violations in Gameplay Videos [66.1] ゲームプレイビデオにおける物理コモンセンス違反を評価するための先駆的ベンチマークとしてPhysGameを提案する。
以上の結果から,現在のオープンソースビデオLLMのパフォーマンスは,プロプライエタリビデオよりも大幅に遅れていることが明らかとなった。
このデータセットに基づいて,PhysVLMを物理知識強化ビデオLLMとして提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:47:25 GMT)
Look Ma, No Ground Truth! Ground-Truth-Free Tuning of Structure from Motion and Visual SLAM [64.6] 評価は、モーション(SfM)と視覚SLAM(VSLAM)システムから構造を開発・調整する上で重要である。
この土台真実への依存は、様々な環境におけるSfMおよびSLAMアプリケーションを制限する。
幾何学的基底真理の必要をなくすため,GTF評価手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:40:03 GMT)
MALT: Improving Reasoning with Multi-Agent LLM Training [64.1] 推論問題に対するマルチエージェントLLMトレーニング(MALT)に向けた第一歩を提示する。
提案手法では,ヘテロジニアスLSMが割り当てられた逐次的マルチエージェント構成を用いる。
我々は,MATH,GSM8k,CQAにまたがるアプローチを評価し,MALT on Llama 3.1 8Bモデルでそれぞれ14.14%,7.12%,9.40%の相対的な改善を実現した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:30:36 GMT)
Inspiring the Next Generation of Segment Anything Models: Comprehensively Evaluate SAM and SAM 2 with Diverse Prompts Towards Context-Dependent Concepts under Different Scenes [64.0] 基礎モデルSAMはコンピュータビジョンの複数の分野に影響を与えており、そのアップグレード版SAM 2はビデオセグメンテーションの能力を高めている。
SAMは、人、車、道路といったコンテキストに依存しない概念のセグメンテーションにおいて優れたパフォーマンスを示してきたが、視覚的サリエンシ、カモフラージュ、製品欠陥、医学的障害など、より困難なコンテキスト依存(CD)の概念を見落としている。
自然, 医療, 産業のシーンにおいて, 11枚のCDのコンセプトを2D, 3D画像, ビデオで徹底的に定量的に評価する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:03:56 GMT)
Enhancing Compositional Text-to-Image Generation with Reliable Random Seeds [63.8] テキスト間拡散モデルは任意のテキストプロンプトからリアルな画像を生成することができる。
彼らはしばしば「2匹の犬」や「ボウルの右側のペンギン」のような作曲のプロンプトに対して矛盾した結果を出す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:10:34 GMT)
LamRA: Large Multimodal Model as Your Advanced Retrieval Assistant [63.3] LamRAは大規模マルチモーダルモデルに高度な検索と再ランク機能を持たせるために設計された多機能フレームワークである。
検索には、言語のみの事前学習とマルチモーダル・インストラクション・チューニングからなる2段階のトレーニング戦略を採用する。
再格付けには、ポイントワイドとリストワイドの両方のジョイントトレーニングを採用し、検索性能をさらに向上させる2つの方法を提供している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:10:16 GMT)
VLsI: Verbalized Layers-to-Interactions from Large to Small Vision Language Models [63.3] VLsI: Verbalized Layers-to-Interactions, a new VLM family in 2B and 7B model size。
GPT-4Vよりも優れた性能向上(2Bは11.0%、7Bは17.4%)を達成した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:58:25 GMT)
Learning Temporally Consistent Video Depth from Video Diffusion Priors [62.4] 本研究は,ストリーム映像深度推定の課題に対処する。
フレームやクリップ間でコンテキスト情報を共有することは、時間的一貫性を育む上で重要である、と我々は主張する。
具体的には、任意の長さの動画に対して一貫したコンテキスト認識学習と推論戦略を提案し、クロスクリップなコンテキストを提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:10:34 GMT)
CopyrightShield: Spatial Similarity Guided Backdoor Defense against Copyright Infringement in Diffusion Models [61.1] 拡散モデルは 著作権侵害の標的だ
本稿では拡散モデルにおける複製の空間的類似性を詳細に解析する。
本稿では,著作権侵害攻撃を対象とする新たな防衛手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:19:44 GMT)
GLaPE: Gold Label-agnostic Prompt Evaluation and Optimization for Large Language Model [59.5] 我々は,ゴールドラベルへの依存を軽減するため,ゴールドラベルに依存しないプロンプト評価(GLaPE)を提案する。
GLaPEは,ゴールドラベルが存在しない場合でも,精度よく信頼性の高い評価を行う。
一般的な6つの推論タスクにおいて、GLaPEベースのプロンプト最適化により、精度ベースのプロンプトに匹敵する効果的なプロンプトが得られる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:47:00 GMT)
MoTrans: Customized Motion Transfer with Text-driven Video Diffusion Models [59.1] MoTransは、新しいコンテキストにおける類似した動きのビデオ生成を可能にする、カスタマイズされたモーション転送方式である。
再カプセル化されたプロンプトとビデオフレームからのマルチモーダル表現は、外観のモデリングを促進する。
本手法は, 特定の動きパターンを, 単一の参照ビデオや複数参照ビデオから効果的に学習する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:07:59 GMT)
Event-Based Tracking Any Point with Motion-Augmented Temporal Consistency [58.7] 本稿では,任意の点を追跡するイベントベースのフレームワークを提案する。
出来事の空間的空間性や動きの感度によって引き起こされる課題に対処する。
競合モデルパラメータによる処理を150%高速化する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:13:29 GMT)
Medchain: Bridging the Gap Between LLM Agents and Clinical Practice through Interactive Sequential Benchmarking [58.3] 臨床ワークフローの5つの重要な段階をカバーする12,163の臨床症例のデータセットであるMedChainを提示する。
フィードバック機構とMCase-RAGモジュールを統合したAIシステムであるMedChain-Agentも提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:25:02 GMT)
NitroFusion: High-Fidelity Single-Step Diffusion through Dynamic Adversarial Training [57.2] 我々は,動的対向フレームワークを通じて高品質な生成を実現する単一ステップ拡散に対する基本的に異なるアプローチであるNitroFusionを紹介した。
本フレームワークは, (i) 動的識別器プールと, 生成品質向上のための特殊識別器グループ, (ii) 識別器過適合を防止する戦略的リフレッシュ機構, (iii) マルチスケール品質評価のためのグローバルな識別器ヘッドを組み合わせる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 23:20:35 GMT)
Texture, Shape and Order Matter: A New Transformer Design for Sequential DeepFake Detection [57.1] シーケンシャルディープフェイク検出は、順番に操作シーケンスを予測する新しいタスクである。
本稿では, テクスチャ, 形状, 操作順序の3つの視点を探索し, TSOM と呼ばれる新しいトランスフォーマーの設計について述べる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:06:47 GMT)
Occam's LGS: A Simple Approach for Language Gaussian Splatting [57.0] 言語接地型3次元ガウススプラッティングの高度な技術は、単に不要であることを示す。
オッカムのカミソリを手作業に適用し、重み付けされた多視点特徴集計を行う。
我々の結果は2桁のスピードアップによる最先端の結果を提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:50:37 GMT)
Holistic Understanding of 3D Scenes as Universal Scene Description [56.7] 3Dシーン理解は、コンピュータビジョンにおける長年の課題であり、混合現実、ウェアラブルコンピューティング、そして具体化されたAIを実現する上で重要な要素である。
高品質な手動アノテーションを備えたUniversal Scene Description (USD)フォーマットで、専門家がキュレートしたデータセットを導入する。
広範かつ高品質なアノテーションにより、このデータは総合的な3Dシーン理解モデルの基礎を提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:33:55 GMT)
Hiding Faces in Plain Sight: Defending DeepFakes by Disrupting Face Detection [56.3] 本稿では,プロアクティブなディープフェイク防衛フレームワークであるエム・フェイスポージョンの有効性について検討し,個人がディープフェイクビデオの被害者にならないようにした。
FacePoisonをベースとしたEm VideoFacePoisonは、各フレームに個別に適用するのではなく、ビデオフレーム間でFacePoisonを伝搬する戦略である。
本手法は5つの顔検出器で検証され,11種類のDeepFakeモデルに対する広範な実験により,顔検出器を破壊してDeepFakeの発生を妨げる効果が示された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:17:48 GMT)
RELOCATE: A Simple Training-Free Baseline for Visual Query Localization Using Region-Based Representations [55.7] RELOCATEは、長いビデオにおけるビジュアルクエリローカライゼーションの難しいタスクを実行するために設計された、トレーニング不要のベースラインである。
タスク固有のトレーニングを不要にするために、RELOCATEは事前訓練された視覚モデルから派生した領域ベースの表現を利用する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:59:53 GMT)
DAE-Talker: High Fidelity Speech-Driven Talking Face Generation with Diffusion Autoencoder [55.6] そこで本研究では,DAE-Talkerを用いて全映像フレームを合成し,音声の内容に合わせて自然な頭部の動きを生成する。
また、ポーズ制御性のための音声2latentのポーズモデリングも導入する。
実験の結果,DAE-Talkerはリップシンク,ビデオの忠実さ,自然さなどの既存の手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:06:28 GMT)
Efficient Multi-modal Large Language Models via Visual Token Grouping [55.5] 高解像度の画像やビデオは、彼らの広く普及するための障壁となる。
MLLMにおける視覚トークンの圧縮は、推論コストを削減するための有望なアプローチとして現れている。
本稿では,事前学習した視覚エンコーダの能力を利用して類似画像セグメントをグループ化する,新たなグループ化機構であるVisToGを紹介する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:55:49 GMT)
Horizon-GS: Unified 3D Gaussian Splatting for Large-Scale Aerial-to-Ground Scenes [55.2] 本稿では,ガウシアン・スプレイティング技術に基づく新しい手法であるHorizon-GSを導入し,航空やストリートビューの統一的な再構築とレンダリングに挑戦する。
提案手法は,これらの視点と新たなトレーニング戦略を組み合わせることによる重要な課題に対処し,視点の相違を克服し,高忠実度シーンを生成する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:42:00 GMT)
Free Process Rewards without Process Labels [55.1] より安価な応答レベルラベルでORMをトレーニングすることで,テキストシンプルなPRMを追加のコストで得ることができることを示す。
我々の暗黙のPRMは、クロスエントロピー(CE)損失でインスタンス化されると、よりデータ効率が良く、命令1回に1回しか応答しない訓練でも生成モデルを改善することができることを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:20:02 GMT)
Collaborative Instance Navigation: Leveraging Agent Self-Dialogue to Minimize User Input [54.8] 我々は,ナビゲーション中の動的エージェントと人間との相互作用を考慮したCoIN(Collaborative Instance Navigation)を提案する。
CoINに対処するために,新しいエージェント・ユーザ・インタラクションとUncerTainty Awareness (AIUTA)を提案する。
AIUTAは、最先端のメソッドに対するナビゲーションにおける競合的なパフォーマンスを実現し、ユーザの入力を処理する際の柔軟性を示している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:16:38 GMT)
Multi-View Large Reconstruction Model via Geometry-Aware Positional Encoding and Attention [54.7] 本稿では,M-LRM(Multi-view Large Restruction Model)を提案する。
具体的には、M-LRMが入力画像から情報を正確にクエリできるマルチビュー整合型クロスアテンション方式を提案する。
従来の手法と比較して,提案手法は高忠実度の3次元形状を生成することができる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:23:47 GMT)
RandAR: Decoder-only Autoregressive Visual Generation in Random Orders [54.5] RandARはデコーダのみの視覚的自己回帰(AR)モデルで、任意のトークン順序で画像を生成することができる。
我々の設計では、各画像トークンが予測される前に「配置命令トークン」を挿入することで、ランダムな順序付けを可能にする。
RandARはゼロショットでインペイント、アウトペイント、解像度推論をサポートする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:59:53 GMT)
XQ-GAN: An Open-source Image Tokenization Framework for Autoregressive Generation [54.3] XQ-GANは画像再構成と生成の両方のために設計された画像トークン化フレームワークである。
我々のフレームワークは、ベクトル量子化(VQ)、残留量子化(RQ)、マルチスケール残留量子化(MSVQ)、製品量子化(PQ)、バイナリ球面量子化(BSQ)など、最先端の量子化技術を統合する。
標準の ImageNet 256x256 ベンチマークでは,本モデルが MAGVIT-v2 (0.9 rFID) と VAR (0.9 rFID) を大幅に上回り,0.64 の rFID を達成した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:58:06 GMT)
Customizing Text-to-Image Diffusion with Object Viewpoint Control [53.6] テキストから画像への拡散モデルのカスタマイズにおいて、オブジェクト視点の明示的な制御を可能にする新しいタスクを導入する。
これにより、カスタムオブジェクトのプロパティを変更し、テキストプロンプトを通じて、さまざまなバックグラウンドシーンでそれを生成することができます。
本稿では,対象視点からレンダリングした3次元オブジェクトの特徴に拡散過程を規定する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:15:29 GMT)
Autobidders with Budget and ROI Constraints: Efficiency, Regret, and Pacing Dynamics [53.6] オンライン広告プラットフォームで競合するオートバイディングアルゴリズムのゲームについて検討する。
本稿では,全ての制約を満たすことを保証し,個人の後悔を解消する勾配に基づく学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:13:35 GMT)
SAUP: Situation Awareness Uncertainty Propagation on LLM Agent [52.4] 大規模言語モデル(LLM)は多段階エージェントシステムに統合され、様々なアプリケーションにまたがる複雑な意思決定プロセスを可能にする。
既存の不確実性推定手法は主に最終段階の出力に重点を置いており、これは多段階決定プロセスにおける累積的不確実性やエージェントとその環境間の動的相互作用を考慮できない。
LLMエージェントの推論プロセスの各ステップを通じて不確実性を伝播する新しいフレームワークであるSAUPを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 01:31:13 GMT)
A Memory-Based Reinforcement Learning Approach to Integrated Sensing and Communication [52.4] 本稿では、送信機が受信機に送信した信号をメモリ付きチャネル上で送信するISACシステムについて考察する。
オンライン方式でセンシングを行う場合,ISAC問題に対するキャパシティ・歪みトレードオフを定式化する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:30:50 GMT)
ARTIST: Improving the Generation of Text-rich Images with Disentangled Diffusion Models and Large Language Models [52.2] 本稿では,テキスト構造の学習に特化するために,専用のテキスト拡散モデルを組み込んだARTISTという新しいフレームワークを紹介する。
我々は、事前訓練されたテキスト構造モデルからテキスト構造情報を同化できるように、視覚拡散モデルを微調整する。
この歪んだアーキテクチャ設計とトレーニング戦略は、テキストリッチな画像生成のための拡散モデルのテキストレンダリング能力を著しく向上させる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:17:48 GMT)
RIRAG: Regulatory Information Retrieval and Answer Generation [52.0] 本稿では,質問を自動生成し,関連する規制通路と組み合わせる,問合せペアを生成するタスクを紹介する。
我々は、Abu Dhabi Global Markets (ADGM) の財務規制文書から得られた27,869の質問を含むObliQAデータセットを作成する。
本稿では,RIRAG(Regulation Information Retrieval and Answer Generation)システムをベースラインとして設計し,新しい評価基準であるRePASを用いて評価する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:13:28 GMT)
Temporally Grounding Instructional Diagrams in Unconstrained Videos [51.9] 本稿では,ビデオ中の命令図中のクエリ列を同時にローカライズするという課題について検討する。
既存のほとんどのメソッドは、クエリの固有の構造を無視しながら、一度に1つのクエリをグラウンドすることに焦点を当てている。
ステップダイアグラムの視覚的特徴を包括的にペアリングして構築した複合クエリを提案する。
ステップ図のグラウンド化のためのIAWデータセットと自然言語クエリのグラウンド化のためのYouCook2ベンチマークに対するアプローチの有効性を示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:39:10 GMT)
Aligning Step-by-Step Instructional Diagrams to Video Demonstrations [51.7] 組立図として表現される(i)命令ステップと、(ii)動画セグメントとを関連付ける新しい設定について考察する。
本稿では,ビデオの微妙な詳細化を学習する,教師付きコントラスト学習手法を提案する。
池田組立におけるIAW実験は, 代替案に対するアプローチの優れた性能を示すものである。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:55:49 GMT)
Monocular Lane Detection Based on Deep Learning: A Survey [51.2] 車線検出は自律運転認識システムにおいて重要な役割を果たす。
ディープラーニングアルゴリズムが普及するにつれて、それらに基づく単眼車線検出法は優れた性能を示した。
本稿では, 成熟度の高い2次元車線検出手法と開発途上国の3次元車線検出技術の両方を網羅して, 既存手法の概要を概説する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:05:29 GMT)
Beyond Gaussians: Fast and High-Fidelity 3D Splatting with Linear Kernels [51.1] 本稿では,ガウスカーネルを線形カーネルに置き換えて,よりシャープで高精度な結果を得る3Dリニアスティング(DLS)を提案する。
3DLSは、最先端の忠実さと正確さを示し、ベースライン3DGSよりも30%のFPS改善を実現している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:44:39 GMT)
Interpreting and Improving Attention From the Perspective of Large Kernel Convolution [51.1] 本稿では,LKCA(Large Kernel Convolutional Attention)について紹介する。
LKCAは、特にデータ制約のある設定において、様々な視覚的タスク間での競合性能を達成する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 00:04:23 GMT)
A Top-down Graph-based Tool for Modeling Classical Semantic Maps: A Crosslinguistic Case Study of Supplementary Adverbs [51.0] セマンティックマップモデル(SMM)は、言語横断的なインスタンスや形式からネットワークのような概念空間を構築する。
ほとんどのSMMは、ボトムアップ手順を使用して、人間の専門家によって手動で構築される。
本稿では,概念空間とSMMをトップダウンで自動生成するグラフベースの新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:06:41 GMT)
Efficient Prompting Methods for Large Language Models: A Survey [50.8] 効率的なプロンプティング手法は幅広い注目を集めている。
本稿では,異なるプロンプト成分に対する自動プロンプトエンジニアリングと連続空間および離散空間におけるプロンプト圧縮について論じる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:47:24 GMT)
Memory-Efficient Training for Deep Speaker Embedding Learning in Speaker Verification [50.6] 資源制約のあるシナリオにおける深層話者埋め込み学習のためのメモリ効率のトレーニング戦略について検討する。
アクティベーションのために、中間アクティベーションを格納する必要がない2種類の可逆ニューラルネットワークを設計する。
状態に対して、元の32ビット浮動小数点値を動的ツリーベースの8ビットデータ型に置き換える動的量子化手法を導入する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:57:46 GMT)
Understanding the World's Museums through Vision-Language Reasoning [50.0] 博物館は、様々なエポック、文明、地域にまたがる文化遺産や歴史的遺物の重要な保管物として機能している。
我々は、世界中の展示のために、標準的な博物館カタログフォーマットで65万枚の画像と2億枚の質問回答ペアの大規模なデータセットを収集し、キュレートする。
BLIPモデルと視覚言語対応の埋め込みを持つが、大きな言語モデルの表現力に欠ける2つのVLMと、視覚言語推論能力に富んだ強力な命令チューニング LLaVA モデルを訓練する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:54:31 GMT)
Large Language Models for Data Annotation and Synthesis: A Survey [49.8] 本調査は,データアノテーションと合成のための大規模言語モデルの有用性に焦点を当てる。
LLMがアノテートできるデータタイプの詳細な分類、LLM生成アノテーションを利用したモデルの学習戦略のレビュー、データアノテーションと合成にLLMを使用する際の主な課題と制限に関する詳細な議論を含む。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:55:15 GMT)
3D Spine Shape Estimation from Single 2D DXA [49.5] 2次元DXAスキャンから3次元スピン形状を推定する自動フレームワークを提案する。
我々はDXAスキャンから脊椎の矢状視界を明示的に予測することでこれを実現する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:58:26 GMT)
COSMOS: Cross-Modality Self-Distillation for Vision Language Pre-training [49.3] 視覚言語事前学習のためのCOSMOS: CrOSs-modality Self-distillationを提案する。
新たなテキストクロッピング戦略とクロスアテンションモジュールを自己教師型学習フレームワークに統合する。
さまざまなゼロショットダウンストリームタスクにおいて、以前の強いベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:56:06 GMT)
Normalizing flows as approximations of optimal transport maps via linear-control neural ODEs [49.2] 我々は、絶対連続測度$mu,nuinmathcalP(mathbbRn)$間の$Wimat$-optimal transport map Tを線形制御ニューラルネットワークのフローとして回収する問題を考える。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:18:52 GMT)
Attacks on multimodal models [49.2] 本研究は、そのようなモデルに対する様々な種類の攻撃を調査し、それらの一般化能力を評価することを目的としている。
本研究の主な対象は、CLIPアーキテクチャとそのイメージエンコーダ(CLIP-ViT)と、それに対する様々なパッチアタックのバリエーションである。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:15:59 GMT)
HUGSIM: A Real-Time, Photo-Realistic and Closed-Loop Simulator for Autonomous Driving [48.8] HUGSIMは、自律運転アルゴリズムを評価するためのクローズドループ、フォトリアリスティック、リアルタイムシミュレータである。
我々は、視点外挿や360度車両レンダリングを含む閉ループシナリオにおける新しいビュー合成の課題に取り組む。
HUGSIMは、KITTI-360、nuScenes、PandaSetから70以上のシーケンスにまたがる包括的なベンチマークと400以上のさまざまなシナリオを提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:07:59 GMT)
CRAYM: Neural Field Optimization via Camera RAY Matching [48.3] マルチビュー画像からカメラポーズとニューラルフィールドのジョイント最適化にカメラレイマッチング(CRAYM)を導入する。
入力画像のキーポイントを通過するカメラ光に焦点をあてて、各光線最適化と一致した光線コヒーレンスを定式化する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:39:09 GMT)
Towards Understanding Jailbreak Attacks in LLMs: A Representation Space Analysis [47.8] 大規模言語モデル(LLM)は、有害な内容を出力するためにLLMを誤解させるジェイルブレーキング(jailbreaking)と呼ばれるタイプの攻撃を受けやすい。
本稿では, LLMの表現空間における有害かつ無害なプロンプトの挙動を考察し, ジェイルブレイク攻撃の本質的特性について検討する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:48:47 GMT)
The Landscape of Causal Discovery Data: Grounding Causal Discovery in Real-World Applications [47.6] 因果発見は、データから因果関係を自動的に発見することを目的としている。
現在の手法は非現実的な仮定に頼り、単純な合成玩具のデータセットでのみ評価される。
生物学、神経科学、地球科学に応用する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:26:29 GMT)
Can Large Language Models Serve as Evaluators for Code Summarization? [47.2] LLM(Large Language Models)は、コード要約手法の効果的な評価手法である。
LLMはエージェントに、コードレビュアー、コード作者、コードエディタ、システムアナリストなどの様々な役割を演じるよう促す。
CoDERPEは、人間の評価と81.59%のスピアマン相関を達成し、既存のBERTScoreの基準を17.27%上回った。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:56:18 GMT)
SeqAfford: Sequential 3D Affordance Reasoning via Multimodal Large Language Model [46.8] 3D割当セグメンテーションは、人間の指示を3Dオブジェクトのタッチ可能な領域にリンクして、操作を具体化することを目的としている。
既存の取り組みは、通常、単目的、単順のパラダイムに固執する。
本稿では,複雑なユーザ意図から推論することで従来のパラダイムを拡張したSequential 3D Affordance Reasoningタスクを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:37:57 GMT)
Critic-V: VLM Critics Help Catch VLM Errors in Multimodal Reasoning [46.4] Critic-Vは、視覚言語モデル(VLM)の推論能力を高めるためにアクター・クライブパラダイムにインスパイアされたフレームワークである。
リアソナーは視覚的およびテキスト的入力に基づいて推論パスを生成し、批判はこれらのパスを洗練するための建設的批評を提供する。
評価の結果,Critic-V フレームワークは GPT-4V を含む既存手法を8つのベンチマークのうち5つで大幅に上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:00:19 GMT)
CBOL-Tuner: Classifier-pruned Bayesian optimization to explore temporally structured latent spaces for particle accelerator tuning [46.3] 本稿では,空間表現のための複合型畳み込み時間オートエンコーダ(AE)を提案する。
CBOLTuneは、複数の最適な設定を特定する上で、優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:43:16 GMT)
Provable Acceleration of Nesterov's Accelerated Gradient for Rectangular Matrix Factorization and Linear Neural Networks [46.0] 我々はネステロフの加速勾配が複雑性$O(kappalogfrac1epsilon)$に達することを証明している。
特に,NAGが線形収束速度を加速できることを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:41:51 GMT)
Domain Adaptive Diabetic Retinopathy Grading with Model Absence and Flowing Data [45.8] ドメインシフトは、糖尿病網膜症などの臨床応用において重要な課題である。
本稿では,データ中心の観点から適応可能なGUES(Generative Unadversarial Examples)を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:14:25 GMT)
MVImgNet2.0: A Larger-scale Dataset of Multi-view Images [45.5] MVImgNetは238クラスの220万の現実世界のオブジェクトのマルチビュー画像を含む大規模なデータセットである。
本稿では,MVImgNetを520kのオブジェクトと515のカテゴリに拡張したMVImgNet2.0データセットを構築する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:10:04 GMT)
Existential Unforgeability in Quantum Authentication From Quantum Physical Unclonable Functions Based on Random von Neumann Measurement [45.4] 物理的非閉包関数(PUF)は、固有の非閉包不可能な物理的ランダム性を利用して、ユニークな入出力ペアを生成する。
量子PUF(Quantum PUFs)は、量子状態を入出力ペアとして使用することによって、この概念を拡張している。
ランダムなユニタリQPUFは、量子多項式時間に対する実存的非偽造性を達成できないことを示す。
本稿では,QPUFが非単体量子チャネルとして機能する2番目のモデルを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:58:24 GMT)
NLPrompt: Noise-Label Prompt Learning for Vision-Language Models [45.4] 実世界のデータセットは、しばしば、迅速な学習性能を劣化させるうるノイズの多いラベルを含んでいる。
本稿では,PromptMAEという名前の学習における平均絶対誤差(MAE)損失を用いることで,雑音ラベルに対するロバスト性を著しく向上することを示す。
また,ロバスト性を高めるために,プロンプトを用いた最適輸送データ浄化手法であるPromptOTを導入する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:25:09 GMT)
MuSiCNet: A Gradual Coarse-to-Fine Framework for Irregularly Sampled Multivariate Time Series Analysis [45.3] 我々は、不規則性は本質的にある意味で相対的であるという新しい視点を導入する。
MuSiCNetは、3つのメインストリームタスクでSOTAと一貫して競合するISMTS分析フレームワークである。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 02:50:01 GMT)
A Self-Supervised Task for Fault Detection in Satellite Multivariate Time Series [45.3] この研究は、複雑な分布と高次元分布をモデル化する能力で有名な物理インフォームドリアルNVPニューラルネットワークを活用する新しいアプローチを提案する。
実験には、セルフスーパービジョンによる事前トレーニング、マルチタスク学習、スタンドアロンのセルフ教師付きトレーニングなど、さまざまな構成が含まれている。
結果は、すべての設定で大幅にパフォーマンスが向上したことを示している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:04:40 GMT)
GLOV: Guided Large Language Models as Implicit Optimizers for Vision Language Models [44.8] 大型言語モデル(LLM)は視覚言語モデル(VLM)の暗黙の役割を果たす
我々のGLOVメタプロンプトは、下流のタスク記述でLLMをメタプロンプトし、適切なVLMプロンプトに問い合わせる。
VLMの2つのファミリーを用いて16種類の多様なデータセット上でGLOVを評価した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:49:55 GMT)
Predicting and Enhancing the Fairness of DNNs with the Curvature of Perceptual Manifolds [44.8] 近年の研究では、テールクラスは必ずしも学習が困難ではないことが示されており、サンプルバランスのデータセットではモデルバイアスが観察されている。
本研究ではまず,モデルフェアネスを解析するための幾何学的視点を確立し,次いで,一連の幾何学的測度を体系的に提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:18:41 GMT)
Image Statistics Predict the Sensitivity of Perceptual Quality Metrics [44.1] 画像の確率から、このリンクが数学的にどのように表現されるかは定かではない。
本稿では,自然画像の生成モデルを用いて画像の確率を評価する。
我々は,現在最先端の主観的画像品質指標の感度を予測するために,確率関連因子をどのように組み合わせることができるか分析する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:33:19 GMT)
Estimating Non-Stabilizerness Dynamics Without Simulating It [43.8] 繰り返しクリフォード回路再正規化(I CCR)は、量子回路における非安定化性のダイナミクスを効率的に扱うように設計されている。
I CCRは、非安定化剤の複雑なダイナミクスを効果的な初期状態の流れに埋め込む。
我々はI CCRアルゴリズムを実装し,N = 1000までの大きさのシステムに対する非安定化性ダイナミクスを評価する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:21:35 GMT)
HDGS: Textured 2D Gaussian Splatting for Enhanced Scene Rendering [43.6] そこで本研究では,2次元サーベイルをテクスチャマップに整列させ,画像の描画の整合性と効率性を高めるために,光線深度ソートと漁船によるプルーニングを併用する新しい手法を提案する。
正しい順序で、サーファーごとのテクスチャマップは細部を捉える能力を大幅に改善した。
異なる視点で高忠実度の詳細を描画するために, アーティファクトを緩和するフラスタムを用いたサンプリング法を設計した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:59:09 GMT)
V2XPnP: Vehicle-to-Everything Spatio-Temporal Fusion for Multi-Agent Perception and Prediction [43.5] V2X(Valby-to-everything)技術は、単一車両システムにおける制約された可観測性の制限を緩和する、有望なパラダイムを提供する。
以前の研究は主に単一フレームの協調的な認識に焦点を当てていた。
本稿では,V2Xシナリオにおける時間的知覚と予測タスクと,ワンステップ・マルチ時間通信戦略に着目した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:55:34 GMT)
An Information Theoretic Approach to Machine Unlearning [43.4] AIやデータ規則に従うためには、トレーニングされた機械学習モデルからプライベートまたは著作権のある情報を忘れる必要性がますます高まっている。
この研究では、ゼロショットのアンラーニングシナリオに対処し、未学習のアルゴリズムは、トレーニングされたモデルと忘れられるデータだけが与えられたデータを削除できなければならない。
モデルの幾何に基づいて、単純だが原則化されたゼロショットアンラーニング法を導出する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 00:03:53 GMT)
SfM-Free 3D Gaussian Splatting via Hierarchical Training [42.9] 本研究では、ビデオ入力のための新しいSfM-Free 3DGS(SFGS)手法を提案し、既知のカメラポーズやSfM前処理の必要性を排除した。
提案手法では,複数の3次元ガウス表現を1つの統一3DGSモデルに訓練・統合する階層的学習戦略を導入する。
実験の結果,本手法は最先端のSfMフリー新規ビュー合成法を大きく上回っていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:39:06 GMT)
Adaptive High-Pass Kernel Prediction for Efficient Video Deblurring [42.9] 最先端のビデオデブロアリング手法は、深層ネットワークアーキテクチャを用いて、シャープ化されたビデオフレームを復元する。
細部とエッジをキャプチャするために、明示的なネットワーク構造を実装します。
この戦略は非常に効率的で、トレーニングのための低メモリフットプリントと推論のための高速実行を実現している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:47:27 GMT)
FERERO: A Flexible Framework for Preference-Guided Multi-Objective Learning [42.0] pREfeRence-guided Multi-Objective Learning (FERERO) のためのフレキシブルフラムワークを提案する。
この問題を解決するために、収束アルゴリズムは単一ループと原始変種の両方で開発される。
複数のベンチマーク実験により、提案手法は優先誘導最適解の探索に非常に適していることが示された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:21:16 GMT)
Hard Constraint Guided Flow Matching for Gradient-Free Generation of PDE Solutions [41.6] 計算コストや微調整を必要とせず、ゼロショットで制約を正確に満たすために、事前訓練された非拘束フローマッチングモデルを適用するための新しいフレームワークを提案する。
ECIサンプリングの枠組みは外挿(E)、補正(C)、生成(I)の段階を交互に行い、生成の妥当性を保ちながら制約情報の正確な統合を保証する。
本研究では,これらの制約により引き起こされる複雑な分散シフトを正確に把握し,ECI誘導生成が物理的制約に厳密に準拠することを示し,PDEシステムにおけるアプローチの有効性を実証する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:36:26 GMT)
MVBoost: Boost 3D Reconstruction with Multi-View Refinement [41.5] 多様な3Dデータセットの不足は、3D再構成モデルの限定的な一般化能力をもたらす。
擬似GTデータを生成し,多視点補正(MVBoost)により3次元再構成を促進する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:04:20 GMT)
Multi-turn Reinforcement Learning from Preference Human Feedback [41.3] RLHF(Reinforcement Learning from Human Feedback)は、大規模言語モデルと人間の嗜好を整合させる標準的なアプローチとなっている。
既存のメソッドは、選好を単一の決定(ターン)レベルでエミュレートすることで機能する。
本研究では,2つの全会話間の嗜好フィードバックから強化学習のための新しい手法を開発する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:37:46 GMT)
Enhancing Perception Capabilities of Multimodal LLMs with Training-free Fusion [40.6] マルチモーダルLLM (Multimodal LLMs) は、視覚エンコーダと言語モデルとの整合による視覚能力を備えた言語モデルである。
MLLMの視覚知覚を高める既存の方法は、しばしばより強力な視覚エンコーダを設計する。
市販のMLLMから複数の視覚エンコーダを効率的に活用する新しい統合フレームワークであるVisionFuseを紹介する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:02:28 GMT)
HyperSeg: Towards Universal Visual Segmentation with Large Language Model [40.3] 本稿では,視覚的大言語モデル(VLLM)による強力な推論能力により,画像・映像知覚の普遍的セグメンテーションを実現することを目的とする。
画素レベルの画像と映像知覚のための,VLLMに基づく最初のユニバーサルセグメンテーションモデルであるHyperSegを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:19:04 GMT)
Learning a Filtered Backprojection Reconstruction Method for Photoacoustic Computed Tomography with Hemispherical Measurement Geometries [40.2] 半走査FBP法は半解析的逆投影法である。
半スキャンFBP法におけるフィルタ操作の明示的な形式を近似するために,学習に基づく手法を提案する。
その結果,半スキャンFBP法は半スキャンデータから3次元画像を正確に再構成できることを確認した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:01:11 GMT)
OBI-Bench: Can LMMs Aid in Study of Ancient Script on Oracle Bones? [40.2] OBIベンチ(OBI-Bench, OBI-Bench, OBI-Bench)は,大口径マルチモーダルモデル(LMM)を全プロセスで評価するための総合的なベンチマークである。
OBI-Benchは、5,523個の細心の注意を払って収集された多様なソース画像を含み、認識、再結合、分類、検索、解読の5つの主要な領域問題をカバーする。
既存のベンチマークとは異なり、OBI-Benchは高度な視覚認識とOBI固有の知識による推論に焦点を当てており、専門家が直面しているようなタスクを実行するためにLMMに挑戦している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:31:28 GMT)
A multi-criteria decision support system to evaluate the effectiveness of training courses on citizens' employability [40.1] 生涯学習は、雇用を確保したり、既存のキャリアの見通しを高める上で重要な要素である。
本研究は,学習コース評価のための多基準意思決定支援システムの実装について提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:29:28 GMT)
Early Exit Is a Natural Capability in Transformer-based Models: An Empirical Study on Early Exit without Joint Optimization [39.7] アーリーエグジット(EE)は、自動回帰デコーディングを加速することを目的としている。
EEはモデル全体を使用する代わりに中間層から出力を生成する。
最適なEEレイヤを配置する精度を改善することで、課題に対処するために、共同最適化を使わなければならない。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:46:34 GMT)
MuLan: Adapting Multilingual Diffusion Models for Hundreds of Languages with Negligible Cost [39.4] 多言語アノテーションによる高品質な画像に調整されたモデルとは異なり、広く利用可能なテキストエンコーダを活用することで、ノイズの多いインターネット画像とテキストのペアは、データの効率を大幅に向上させる。
我々は,20M未満のパラメータを持つ軽量言語アダプタであるMulan(Multi-Language Adapter)を導入し,凍結テキストエンコーダと画像拡散モデルを用いて訓練を行った。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:38:19 GMT)
Driving Scene Synthesis on Free-form Trajectories with Generative Prior [39.2] 我々はDriveXと呼ばれる新しいフリーフォーム駆動ビュー合成手法を提案する。
得られたモデルにより、記録軌道外の高忠実度仮想運転環境を作成できる。
実際の運転シーン以外にも、DriveXはAI生成ビデオから仮想運転世界をシミュレートすることもできる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:07:53 GMT)
EchoSight: Advancing Visual-Language Models with Wiki Knowledge [39.0] 知識に基づく視覚質問応答のための新しいフレームワークであるEchoSightを紹介する。
ハイパフォーマンスな検索のために、EchoSightはまずビジュアルのみの情報を用いてwikiの記事を検索する。
The Encyclopedic VQA and InfoSeek datasets on our experimental results on the Encyclopedic VQA and InfoSeek shows that EchoSight establishs new-of-the-art results in knowledge-based VQA。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 02:34:47 GMT)
A Shared Standard for Valid Measurement of Generative AI Systems' Capabilities, Risks, and Impacts [38.7] 生成AI(GenAI)システムの能力、リスク、影響の有効な測定は、これらのシステムを評価する能力の基盤となる。
本稿では,現在使用されている様々な評価手法の多くを,共通の足場に配置する上で有効な評価基準を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:50:00 GMT)
VersaTune: An Efficient Data Composition Framework for Training Multi-Capability LLMs [38.7] VersaTuneは、トレーニング中の大規模言語モデルのマルチビリティパフォーマンスを向上させるために設計された、新しいデータ合成フレームワークである。
我々は、知識を法律、医学、金融、科学、法典など、異なる領域に分類する。
VersaTuneは、包括的なマルチドメインタスクの35.21%の強化により、マルチドメインパフォーマンスの大幅な改善を実現している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 02:27:17 GMT)
CellSeg1: Robust Cell Segmentation with One Training Image [37.6] 任意の形態とモダリティの細胞をセグメント化するためのソリューションであるCellSeg1について,数ダースのセルアノテーションを1イメージで紹介する。
19の多様なセルデータセットでテストされ、CellSeg1は1枚の画像でトレーニングされ、0.5 IoUで平均平均mAP0.81に達し、500枚以上の画像でトレーニングされた既存のモデルと同等に動作した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:55:22 GMT)
Reject Threshold Adaptation for Open-Set Model Attribution of Deepfake Audio [37.4] 本稿では,rejection threshold adapt (ReTA) を用いたディープフェイク音声のオープンセットモデル帰属のための新しいフレームワークを提案する。
ReTAは、システム指紋の表現を、ターゲットクラスまたはランダムに選択された他のクラスラベルに対応するラベルと組み合わせて訓練する。
拒絶しきい値算出モジュールは、ガウス確率推定を利用して、マッチングと非マッチング再構成誤差の分布に適合する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:06:50 GMT)
Pard: Permutation-Invariant Autoregressive Diffusion for Graph Generation [36.9] 本稿では,拡散モデルと自己回帰手法を統合した置換不変な自己回帰拡散モデルを提案する。
Pardは分子と非分子のデータセットで最先端のパフォーマンスを達成し、1.9M分子を含むMOSESのような大規模なデータセットにスケールする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:57:12 GMT)
Dual-Personalizing Adapter for Federated Foundation Models [35.9] 本稿では,テスト時間分布シフトを同時に処理するフェデレートデュアルパーソナライズアダプタアーキテクチャを提案する。
提案手法の有効性を,異なるNLPタスクのベンチマークデータセットを用いて評価した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:44:08 GMT)
Coherent emission from single impurities in ZnSe through resonant excitation [35.1] II-VI半導体における不純物結合励起子は、光学活性な固体スピン量子ビット系を約束する。
共振駆動型単一不純物結合エキシトン inSe からのコヒーレント光放射を実証した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:23:54 GMT)
Knowledge Entropy Decay during Language Model Pretraining Hinders New Knowledge Acquisition [34.9] 本研究では,モデルがパラメトリック知識を広く統合する傾向が,事前学習を通じてどのように進化するかを検討する。
モデルが関与するメモリ源の範囲を定量化する知識エントロピーの概念を導入する。
知識のエントロピーの低下は、モデルの知識獲得と保持能力を損なうことがわかった。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:43:16 GMT)
End-to-End Supervised Hierarchical Graph Clustering for Speaker Diarization [34.9] グラフニューラルネットワーク(GNN)に基づくエンドツーエンドの階層クラスタリングアルゴリズムを提案する。
提案するE-SHARCフレームワークは,グラフベースのクラスタリング手法を用いて,競合ダイアリゼーション結果を提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:38:21 GMT)
Quantifying Imaginarity in Neutrino Systems [34.2] ニュートリノのフレーバーとスピン・フレーバー振動の虚偽量化を初めて分析する。
以上の結果から, 2成分混合の場合においても, 虚偽性はゼロではないことが明らかとなった。
我々は,非ゼロCP相の影響を取り入れて,三フレーバーニュートリノ混合のダイナミクスを探求するために分析を拡張した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:34:18 GMT)
PASTA-4-PHT: A Pipeline for Automated Security and Technical Audits for the Personal Health Train [34.2] この研究は、DevSecOpsの原則にインスパイアされたPHT準拠のセキュリティと監査パイプラインについて論じる。
我々は、PHTに脆弱性を導入し、我々のパイプラインを5つの現実世界のPHTに適用する。
最終的に、私たちの仕事はPHTフレームワーク内のデータ処理アクティビティのセキュリティと全体的な透明性の向上に貢献します。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:43:40 GMT)
Precision Profile Pollution Attack on Sequential Recommenders via Influence Function [33.7] プロファイル汚染攻撃に対するインフルエンス関数に基づく攻撃手法INFAttackを導入する。
汚染されたシーケンスを生成する際の影響関数を用いて、元のモデルに対する修正を計算する。
我々は、元のシーケンスを置換するために最も大きく影響されたシーケンスを選択し、それによってターゲット項目を促進させる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:03:56 GMT)
An Efficient Unsupervised Framework for Convex Quadratic Programs via Deep Unrolling [33.5] 凸擬似プログラム(QP)に特化したPDHGアルゴリズム「PDQP」の展開に着目する。
最適QPソリューションを学習するためのニューラルネットワークモデル"PDQP-net"を提案する。
この方法で訓練されたPDQP-netは最適QP解を効果的に近似できることを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 02:22:44 GMT)
AniFaceDiff: Animating Stylized Avatars via Parametric Conditioned Diffusion Models [33.4] 本稿では,スタイリングされたアバターをアニメーション化するための新しい条件付きモジュールを組み込んだ,AniFaceDiffと呼ばれる安定拡散に基づく新しい手法を提案する。
提案手法は,入力画像の一貫性を維持しながら,対象映像からのポーズと表現を効果的に保存する。
この研究は、ポジティブなアプリケーションのための仮想スタイリングアニメーションの品質を高めることを目的としている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:18:12 GMT)
Data-Centric and Heterogeneity-Adaptive Sequence Parallelism for Efficient LLM Training [33.2] 既存のシーケンス並列化法は、均質なシーケンス長(すなわち全ての入力シーケンスの長さが等しい)を仮定し、従って全ての入力シーケンスに対して単一の静的散乱戦略を利用する。
LLMトレーニングコーパスの配列長は,長い尾分布の後に大きく変動することがわかった。
この問題に対処する不均一適応列並列化法を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:16:03 GMT)
Stress-Testing Long-Context Language Models with Lifelong ICL and Task Haystack [33.2] 長いコンテキスト言語モデル(LM)に挑戦し、インコンテキスト学習(ICL)を通して言語タスクのシーケンスを学習する問題設定であるLifelong ICLを導入する。
長文LMがLifelong ICLのコンテキストをどのように利用するかを評価し診断するための評価スイートであるTask Haystackを紹介する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:23:49 GMT)
Unlocking Video-LLM via Agent-of-Thoughts Distillation [32.9] 本稿では,ビデオ質問応答(VideoQA)の課題に取り組む。
大規模なビデオ言語モデルはベンチマークでよく機能するが、説明可能性や時空間の接地性が欠けていることが多い。
本稿では,自動生成したCoTを命令調整プロセスに組み込むことで,モデルを強化する手法であるAoTDを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:37:50 GMT)
TSA on AutoPilot: Self-tuning Self-supervised Time Series Anomaly Detection [32.7] 時系列異常検出(TSAD)は、環境センサ、産業タイプ、患者バイオマーカーなど、多くの応用を見出す。
TSADの2倍の課題は、様々な種類の時系列異常を検出できる汎用的で教師なしのモデルである。
TSAP for TSA "on autoPilot"を導入します。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:20:19 GMT)
PAR: Prompt-Aware Token Reduction Method for Efficient Large Multimodal Models [32.3] MLLM(Multimodal large language model)は、視覚的タスクにまたがる強力なパフォーマンスを示す。
しかし、それらの効率は、マルチモーダル入力で長いコンテキストを処理することによる計算とメモリの要求によって妨げられている。
PAR(Prompt-Aware Token Reduction)は,モデルの性能を損なうことなく,視覚トークンを効率よく削減する新しい,プラグアンドプレイ方式である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:43:33 GMT)
Data Uncertainty-Aware Learning for Multimodal Aspect-based Sentiment Analysis [31.8] 本稿では,不確実性を考慮したマルチモーダル・アスペクトに基づく感情分析手法UA-MABSAを提案する。
UA-MABSAは、画像品質とアスペクトベースの相互関連性の両方を考慮した、新しい品質評価戦略を採用している。
提案手法はTwitter-2015データセット上でのSOTA(State-of-the-art)性能を実現する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:13:40 GMT)
Scaling Speech-Text Pre-training with Synthetic Interleaved Data [31.8] 音声言語モデル(SpeechLM)は音声入力を受け入れ、音声出力を生成し、より自然な人間とコンピュータの相互作用を可能にする。
従来のSpeechLMの開発手法は、教師なし音声データとパラレル音声テキストデータの可用性の制限によって制約されている。
本稿では,テキストコーパスから得られた大規模合成インターリーブデータを活用することによって,音声テキスト事前学習のスケールアップを行う手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:13:24 GMT)
Multi-Scale Representation Learning for Protein Fitness Prediction [31.7] これまでの手法は主に、巨大でラベルなしのタンパク質配列や構造データセットに基づいて訓練された自己教師型モデルに依存してきた。
本稿では,タンパク質の機能を統合する新しいマルチモーダル表現学習フレームワークであるSequence-Structure-Surface Fitness (S3F)モデルを紹介する。
提案手法は,タンパク質言語モデルからの配列表現と,タンパク質のバックボーンと詳細な表面トポロジーをコードするGeometric Vector Perceptronネットワークを組み合わせる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:28:10 GMT)
Morphological-Symmetry-Equivariant Heterogeneous Graph Neural Network for Robotic Dynamics Learning [31.7] ロボット力学学習のための形態的対称性等価な異種グラフニューラルネットワークMS-HGNNを提案する。
MS-HGNNは、ロボットキネマティック構造と形態的対称性を単一のグラフネットワークに統合する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:10:37 GMT)
Moner: Motion Correction in Undersampled Radial MRI with Unsupervised Neural Representation [31.4] 放射状MRIにおける運動補正(MoCo)は、被験者の動作の予測不能のため難しい問題である。
剛体動乱k空間データからアーチファクトフリーのMR画像と正確な動きを共同で解き、教師なしのMoCo法であるMonerを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:01:53 GMT)
Structure-Guided Input Graph for GNNs facing Heterophily [31.4] ノードが構造的特性を共有している場合、ノードが接続される新しいグラフを作成します。
実験の結果,新たに定義されたグラフではラベルのスムーズさが示され,GNNアーキテクチャの性能も向上した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:52:33 GMT)
Efficient Semantic Communication Through Transformer-Aided Compression [31.3] セマンティックコミュニケーションのためのチャネル対応適応フレームワークを提案する。
視覚変換器を用いて、パッチの意味的内容の尺度として注意マスクを解釈する。
本手法は,エンコード解像度をコンテンツ関連性に適応させることで通信効率を向上させる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:57:28 GMT)
3DSceneEditor: Controllable 3D Scene Editing with Gaussian Splatting [31.1] ガウススプラッティングを用いた3次元シーンのリアルタイムかつ高精度な編集を行う3DceneEditorを提案する。
従来の方法とは異なり、3DSceneEditorは3Dパイプラインを通して動作し、効率よく高品質な編集のためにガウシアンを直接操作できる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:03:55 GMT)
Revisiting Generative Policies: A Simpler Reinforcement Learning Algorithmic Perspective [31.0] 我々は、様々な生成的政策訓練と展開技術を比較し、分析する。
既存のトレーニング目標を2つのカテゴリに分類します。
実験により,提案手法はオフラインRLデータセット上での最先端性能を実現することを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:06:07 GMT)
Mastering Board Games by External and Internal Planning with Language Models [30.8] 検索ベースプランニングにより,複数のボードゲームにおいてLLMのプレイ能力を大幅に向上させることができることを示す。
外部探索において、モデルはモンテカルロ木探索のロールアウトと外部エンジンへの呼び出しなしに評価をガイドし、内部探索では、モデルが潜在的将来性の線形化木を直接コンテキスト内で生成する。
どちらも、関連するドメイン知識に基づいて事前訓練された言語モデルを構築し、これらのゲーム間の遷移と価値関数をキャプチャする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:56:51 GMT)
TRUST: A Toolkit for TEE-Assisted Secure Outsourced Computation over Integers [30.7] 本稿では,TRUST という整数を用いた TEE 支援 (Trusted Execution Environment) SOC のためのツールキットを提案する。
システムアーキテクチャの面では、TRUSTは、REE(Rich Execution Environment)とTEEの計算をシームレスに統合することで、単一のTEEを備えたクラウドサーバに該当する。
TRUSTに基づくセキュアなデータトレーディングである textttSEAT を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:19:29 GMT)
Schedule On the Fly: Diffusion Time Prediction for Faster and Better Image Generation [30.6] 時間予測拡散モデル (TPDM) は拡散モデルの適応型スケジューラである。
TPDMはプラグイン・アンド・プレイの時間予測モジュール(TPM)を採用しており、各聴覚ステップにおける現在の潜時特徴に基づいて次のノイズレベルを予測する。
安定拡散3ミディアムアーキテクチャでは、TPDMは5.44の美的スコアと29.59の人間の嗜好スコアを達成し、より優れたパフォーマンスを達成するために約50%のデノナイジングステップを使用する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:05:26 GMT)
Towards Complementary Knowledge Distillation for Efficient Dense Image Prediction [30.5] 知識蒸留(KD)フレームワークを用いて訓練した小型高効率高密度画像予測(EDIP)モデルは,2つの課題に直面することが明らかとなった。
EDIPのKDフレームワーク内で, 相補的境界とコンテキスト蒸留(BCD)法を提案する。
我々の手法は、余分な監督や推論コストの増大を必要とせず、既存の手法よりも優れている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 02:55:29 GMT)
ControlFace: Harnessing Facial Parametric Control for Face Rigging [30.4] フレキシブルで高忠実な制御を可能にする3DMMレンダリングに条件付けされた新しい顔リグ手法であるControlFaceを導入する。
ひとつはFaceNetと呼ばれ、アイデンティティと詳細をキャプチャし、もうひとつは生成に焦点を当てています。
顔ビデオデータセットをトレーニングすることで、FaceNetのリッチな表現を完全に活用し、コントロールの順守を確保します。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:00:27 GMT)
Referring Video Object Segmentation via Language-aligned Track Selection [30.2] Referring Video Object (RVOS)は、自然言語表現に基づいて、ビデオ全体を通してオブジェクトをセグメント化しようとする。
不整合マスクトラックは、視覚言語アライメントを妨害し、最適以下のパフォーマンスをもたらす。
我々は、RVOSを2つのサブプロブレム、トラック生成とトラック選択に再構成する新しいフレームワークであるSelection by Object Language Alignment (SOLA)を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:20:35 GMT)
Refined Analysis of Federated Averaging's Bias and Federated Richardson-Romberg Extrapolation [29.9] 本稿では,FedAvgのステップサイズを一定とし,基礎となるプロセスのマルコフ特性に依存する新しい解析法を提案する。
等質な条件と異質な条件の両方において、バイアスの1次展開を提供する。
このバイアスを軽減するために,Richardson-Romberg外挿法に基づく新しいアルゴリズムを導入する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:22:19 GMT)
No-Regret Learning and Equilibrium Computation in Quantum Games [29.8] 非回帰アルゴリズムは時間平均における分離可能な量子ナッシュ平衡に収束することを示す。
一般的なマルチプレイヤー量子ゲームの場合、我々の研究は、分離可能な量子粗相関平衡の新たな解の概念へと導かれる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:52:43 GMT)
DisCoRD: Discrete Tokens to Continuous Motion via Rectified Flow Decoding [29.6] DisCoRDは離散的な動きトークンを整流によって連続的な動きにデコードする。
DisCoRDは最先端のパフォーマンスを実現し、HumanML3Dでは0.032、KIT-MLでは0.169である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:34:45 GMT)
Continual Learning in the Presence of Repetition [29.0] 継続的学習(CL)は、絶え間なく進化する環境でモデルをトレーニングするためのフレームワークを提供する。
データストリームにおける繰り返しの概念は、CLの標準ベンチマークではよく考慮されない。
本稿では,CVPR 2023におけるCLVisionチャレンジの要約を紹介する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:54:31 GMT)
Object Agnostic 3D Lifting in Space and Time [28.9] カテゴリー非依存の3Dキーリフトにおけるカテゴリー非依存の視点を時間的シーケンス上で提示する。
まず、オブジェクトに関するデータが不足している場合、類似したオブジェクトからの一般的な情報が活用され、パフォーマンスが向上します。
第二に、時間情報は重要だが、最も重要な情報は即時近接である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:09:46 GMT)
One Shot, One Talk: Whole-body Talking Avatar from a Single Image [28.9] リアルでアニマタブルなアバターを作るには、マルチビューや単眼で自撮りするビデオが数分必要だ。
本稿では,1)複雑な動的モデリングと2)新しいジェスチャーや表現への一般化という,2つの重要な問題に対処するパイプラインを提案する。
提案手法により,1枚の画像から,写実的で正確にアニマタブルで表現力のある全身会話アバターを作成できる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:27:41 GMT)
SailCompass: Towards Reproducible and Robust Evaluation for Southeast Asian Languages [28.9] 東南アジア言語(SEA)におけるLarge Language Models(LLM)の評価のための再現可能で堅牢な評価ベンチマークであるSailを紹介する。
Sailは3つの主要なSEA言語を含み、14のデータセットを含む8つの主要なタスクが3つのタスクタイプ(生成、多重選択、分類)をカバーする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:42:51 GMT)
Structured 3D Latents for Scalable and Versatile 3D Generation [28.7] 汎用的で高品質な3Dアセット作成のための新しい3D生成手法を提案する。
基本となるのは、異なる出力フォーマットへのデコードを可能にする、構造化されたLATent表現である。
これは、疎人口の少ない3Dグリッドと、強力な視覚基盤モデルから抽出された濃密な多視点視覚特徴を統合することで実現される。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:58:38 GMT)
FedFDP: Fairness-Aware Federated Learning with Differential Privacy [28.6] Federated Learning(FL)は、データサイロの課題に対処するために設計された、新興の機械学習パラダイムである。
公平性とデータプライバシに関する永続的な問題に対処するため,FedFairというフェアネスを考慮したFLアルゴリズムを提案する。
FedFairをベースとした差分プライバシーを導入し、公正性、プライバシ保護、モデルパフォーマンスのトレードオフに対処するFedFDPアルゴリズムを作成します。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:17:08 GMT)
Tokenizing 3D Molecule Structure with Quantized Spherical Coordinates [28.5] Mol-StrucTokは、3次元分子構造をトークン化する新しい方法である。
球面座標系において局所的な原子座標を抽出して3次元分子の線記法を設計する。
ベクトル量子化変分オートエンコーダ(VQ-VAE)を用いてこれらの座標をトークン化し、生成記述子として扱う。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:50:44 GMT)
Noisy Nonnegative Tucker Decomposition with Sparse Factors and Missing Data [28.2] 本研究では, 雑音下での非負データ回復のための, スパース非負のタッカー分解と補修法を提案する。
我々の理論結果は既存のテンソル法や行列法よりも優れている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 01:00:34 GMT)
Reviewer2: Optimizing Review Generation Through Prompt Generation [28.1] 本稿では、Reviewer2と呼ばれる効率的な2段階レビュー生成フレームワークを提案する。
従来の作業とは異なり、このアプローチは、レビューが対処する可能性のある側面の分布を明示的にモデル化する。
アスペクトプロンプトでアノテートした27k論文と99kレビューの大規模なレビューデータセットを生成します。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:40:45 GMT)
A Statistical Framework of Watermarks for Large Language Models: Pivot, Detection Efficiency and Optimal Rules [27.7] 我々は,透かしの統計的効率と強力な検出規則を推論するための枠組みを導入する。
枠組みに基づく透かしの最適検出規則を導出する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:27:10 GMT)
LoBAM: LoRA-Based Backdoor Attack on Model Merging [27.6] モデルマージ(Model merging)は、異なるタスクに微調整された複数のモデルを統合して、複数のドメインにまたがる汎用モデルを作成する、新たなテクニックである。
既存の研究は、かなりの計算資源を仮定することで、そのような攻撃のリスクを実証しようとするものである。
最小限のトレーニングリソースで高い攻撃成功率を得る方法であるLoBAMを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:59:41 GMT)
TAS-TsC: A Data-Driven Framework for Estimating Time of Arrival Using Temporal-Attribute-Spatial Tri-space Coordination of Truck Trajectories [27.3] 本稿では,トラックの到着時刻(ETA)を向上させるためのTAS-TsC(Temporal-Attribute-Spatial Tri-space Coordination)フレームワークを提案する。
本フレームワークは,時間空間モデルを用いた時間空間学習モジュール (TLM) と,逐次的特徴を構造化属性埋め込みに変換する属性抽出モジュール (AEM) と,複数のトラジェクトリ間の相互作用をモデル化する空間融合モジュール (SFM) から構成される。
深センから収集した実トラック軌道データに対してTAS-TsCの有効性を検証し,既存手法と比較して優れた性能を示した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:58:48 GMT)
Recent Advances in Attack and Defense Approaches of Large Language Models [27.3] 大規模言語モデル(LLM)は、高度なテキスト処理と生成機能を通じて、人工知能と機械学習に革命をもたらした。
彼らの広範な展開は、重大な安全性と信頼性の懸念を引き起こした。
本稿は,LLMの脆弱性と脅威に関する最近の研究をレビューし,現代防衛機構の有効性を評価する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:53:40 GMT)
How Much Can Time-related Features Enhance Time Series Forecasting? [27.0] 時間関連機能であるTime Stamp Forecaster (TimeSter) をエンコードするモジュールを導入する。
TimeSterは単一の線形プロジェクタの性能を大幅に改善し、ElectricityやTrafficなどのベンチマークデータセットで平均23%MSEを削減している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:45:26 GMT)
Think-to-Talk or Talk-to-Think? When LLMs Come Up with an Answer in Multi-Step Reasoning [26.8] 記号的多段階推論における言語モデルの内部推論機構について検討する。
単純なサブプロブレムは連鎖開始前に解き、より複雑なマルチホップ計算はCoT中に行われる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:35:54 GMT)
On the Feature Learning in Diffusion Models [26.5] 本稿では,拡散モデルの学習力学を従来の分類モデルと比較し,分析・比較することを目的とした特徴学習フレームワークを提案する。
我々の理論的分析は、同じ条件下で拡散モデルがデータのよりバランスよく包括的な表現を学習することを奨励していることを示している。
対照的に、分類のために訓練された類似アーキテクチャを持つニューラルネットワークは、データの特定のパターンを学ぶことを優先する傾向がある。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 00:41:25 GMT)
Continuous-Time Human Motion Field from Events [26.4] 本稿では,イベントの流れから連続的な人体運動場を推定する上での課題について述べる。
我々は、繰り返しフィードフォワードニューラルネットワークを用いて、人間の動きの潜在空間における人間の動きを予測する。
本稿では,従来の離散時間予測を時系列関数として表現した連続的な人体運動場に置き換える最初の研究について述べる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:42:59 GMT)
Epipolar Attention Field Transformers for Bird's Eye View Semantic Segmentation [26.2] 本稿では,変換器を用いた画像とBEV特徴マップ要素の相関関係の学習位置エンコーディングへの依存性について述べる。
本稿では, エピポーラ・アテンション・フィールドによるカメラとBEVの関係をモデル化するために, エピポーラ幾何学的制約を活用することを提案する。
実験の結果, EAFormer法は, マップセマンティックセグメンテーションにおいて, 従来のBEV手法よりも2% mIoUの方が優れていることがわかった。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:15:10 GMT)
Gated Parametric Neuron for Spike-based Audio Recognition [26.1] スパイキングニューラルネットワーク(SNN)は、生物学的に可塑性ニューロンを持つヒト脳内の実際のニューラルネットワークをシミュレートすることを目的としている。
本稿では,ゲーティング機構を用いて時間的情報を効率的に処理するための漏れパラメトリックニューロン(GPN)を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:46:26 GMT)
Rectified Flow For Structure Based Drug Design [26.1] 深層生成モデルは、構造に基づく薬物設計において大きな成功を収めた。
FlowSBDDの新しいフレームワークは、特定のターゲットを最適化するために、フレキシブルに追加の損失を組み込むことができます。
提案手法は,高親和性分子の生成における最先端性能を実現することができる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:26:25 GMT)
[CLS] Attention is All You Need for Training-Free Visual Token Pruning: Make VLM Inference Faster [26.0] 大規模言語モデル(LLM)におけるテキスト・ビジュアル・クロスアテンションに基づく視覚トークンの重要性を評価する既存手法
我々は、視覚的トークンの重要性をより正確に評価する、トレーニング不要な視覚的トークンプルーニング手法であるFasterVLMを紹介した。
FasterVLMは、LLaVA-1.5-7Bの性能の90%を維持しながら、95%の視覚トークンをプルーする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:57:40 GMT)
Point-SAM: Promptable 3D Segmentation Model for Point Clouds [26.0] 本稿では,ポイントクラウドに着目した3Dプロンプト可能なセグメンテーションモデルであるPoint-SAMを提案する。
我々は、SAMを3Dドメインに拡張する、ポイントクラウドに適した効率的なトランスフォーマーベースのアーキテクチャを採用している。
次に、データエンジンを導入し、2D SAMから大規模に部分レベルおよびオブジェクトレベルの擬似ラベルを生成することにより、2D SAMから豊富な知識を抽出する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 23:28:56 GMT)
Phaseformer: Phase-based Attention Mechanism for Underwater Image Restoration and Beyond [26.0] 水中画像復元(UIR)のための1.77Mパラメータを持つ軽量位相変換器ネットワークを提案する。
本手法は,位相に基づく自己認識機構を用いて,非汚染特徴を効果的に抽出することに焦点を当てる。
LOLデータセットを用いた低照度画像強調の有効性を示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:48:19 GMT)
Review of Mathematical Optimization in Federated Learning [25.9] フェデレートラーニング(FL)は、応用数学と情報科学の両方において、学際的な研究分野として人気を博している。
FLは、さまざまなプライバシとシステムの制約を満たしながら、分散データセット上の対象関数の集約を協調的に最適化することを目的としている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:45:46 GMT)
MathGLM-Vision: Solving Mathematical Problems with Multi-Modal Large Language Model [25.9] 大規模言語モデル(LLM)は、数学的推論において重要な能力を示している。
MLLMは幾何学的な問題を解くことに集中する傾向があるが、数学の他の領域で利用可能な視覚情報の多様性を無視する傾向がある。
本研究の目的は,MathGLM-Vision と呼ばれる特殊な数学的MLLMのシリーズを開発することである。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:59:08 GMT)
Morph: A Motion-free Physics Optimization Framework for Human Motion Generation [25.5] 我々のフレームワークは、身体的可視性を大幅に向上させながら、最先端のモーション生成品質を実現する。
テキスト・トゥ・モーション・アンド・ミュージック・トゥ・ダンス・ジェネレーション・タスクの実験は、我々のフレームワークが最先端のモーション・ジェネレーション・クオリティを達成することを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:38:39 GMT)
MLLM-LLaVA-FL: Multimodal Large Language Model Assisted Federated Learning [25.5] MLLM-LLaVA-FL(Multimodal Large Language Model Assisted Federated Learning)と呼ばれる新しいフェデレーション学習フレームワークを導入する。
当社のフレームワークは,Webサイトや強力なサーバサイド計算リソースからアクセス可能な,広範かつ未公開のオープンソースデータを活用することに長けています。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:18:38 GMT)
Evaluating LLMs for Hardware Design and Test [25.4] 大規模言語モデル(LLM)は、ハードウェア記述言語(HDL)でコードを生成する能力を実証した。
機能的および検証目的でVerilogを生成する際に,最先端の会話型LLMの機能と限界について検討する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 01:59:30 GMT)
Depression Detection and Analysis using Large Language Models on Textual and Audio-Visual Modalities [25.3] うつ病は公衆衛生上の重大な問題であり、個人の心理的健康に大きな影響を与えている。
診断されていない場合、うつ病は重篤な健康問題を引き起こし、身体的に現れて自殺に至る。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:02:18 GMT)
Cerberus: Attribute-based person re-identification using semantic IDs [25.0] 我々は属性に基づく人物再識別(reID)のための新しいフレームワークCerberusを紹介した。
提案手法は,性別や衣服スタイルなどの特徴を符号化した局所的・グローバルな人物表現を学習するために,人物属性ラベルを活用する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 02:12:28 GMT)
The Reality of AI and Biorisk [24.9] AIモデルやシステムがバイオリスクを増大させるための健全な理論的脅威モデルと、その脅威モデルをテストする堅牢な方法の両方を持つことが必要である。
本稿では,2つのAIおよびバイオリスク脅威モデルに関する既存の研究について分析する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:14:46 GMT)
Cross-Task Inconsistency Based Active Learning (CTIAL) for Emotion Recognition [24.9] 本稿では,感情分類と推定のクロスタスク変換のための一貫性に基づく能動学習手法を提案する。
影響規範は先行知識として利用され、分類的感情と次元的感情のラベル空間を接続する。
コーパス内およびクロスコーパス転送の実験は、クロスタスクの不整合がアクティブラーニングにおいて非常に価値のある指標であることを示した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:23:46 GMT)
Global Estimation of Building-Integrated Facade and Rooftop Photovoltaic Potential by Integrating 3D Building Footprint and Spatio-Temporal Datasets [24.8] 本研究は, ビル・インテグレート型太陽光発電(BIPV)ポテンシャルを時間的・空間的に推定することの課題に取り組む。
各種気象データソースと3Dビルディングフットプリントモデルを統合し,BIPVポテンシャルを評価するための総合的手法を提案する。
我々は, BIPV電位測定における3次元建築形態, 都市景観形態, 地理的位置決めの重要性を強調した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:04:16 GMT)
Detection, Pose Estimation and Segmentation for Multiple Bodies: Closing the Virtuous Circle [24.6] 境界ボックスの代わりにセグメンテーションマスクによるポーズ推定モデルを適用し,インスタンス分離を改善する。
BBox-Mask-Pose (BMP)は、検出、セグメンテーション、ポーズ推定を自己改善フィードバックループに統合する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:50:15 GMT)
Invertible Consistency Distillation for Text-Guided Image Editing in Around 7 Steps [24.4] 本研究の目的は, 蒸留されたテキストから画像への拡散モデルに, 実画像の潜在空間へのエンコードを効果的に行うことにある。
Invertible Consistency Distillation (iCD) は,高画質な画像合成と高精度な画像符号化を,わずか3~4ステップで実現する,汎用的な一貫性蒸留フレームワークである。
我々は、ダイナミックガイダンスを備えたiCDが、より高価な最先端の代替品と競合して、ゼロショットテキスト誘導画像編集の高効率ツールとして役立つことを実証した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:26:57 GMT)
Su-RoBERTa: A Semi-supervised Approach to Predicting Suicide Risk through Social Media using Base Language Models [24.3] 本稿では,Redditデータを用いた自殺リスク評価について検討した。
我々は、より小さな言語モデル、すなわち5億未満のパラメータの使用も効果的であることを示した。
本研究では,自殺リスク予測タスクにおける細調整RoBERTaであるSu-RoBERTaを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:31:12 GMT)
HandOS: 3D Hand Reconstruction in One Stage [24.1] HandOSは3Dハンドコンストラクションのためのエンドツーエンドフレームワークである。
本稿では,対話型2D-3Dデコーダを提案する。
本研究では,手検出,2次元ポーズ推定,3次元メッシュ再構成のエンドツーエンド統合を実現する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:28:29 GMT)
Improved AdaBoost for Virtual Reality Experience Prediction Based on Long Short-Term Memory Network [23.2] AdaBoostの改良したLong Short-Term Memory Network (LSTM)に基づく分類予測アルゴリズムを用いて,仮想現実(VR)ユーザエクスペリエンスの予測を行う。
データセットは、7:3の比率でトレーニングとテストセットにランダムに分割される。
最終的な損失値0.31は、モデルがトレーニングデータによく適合し、予測と分類をより正確にすることができることを示している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 02:16:35 GMT)
Hierarchical Object-Oriented POMDP Planning for Object Rearrangement [23.2] 本稿では,新しい階層的オブジェクト指向部分観測マルコフ決定プロセス(HOO-POMDP)の計画手法を提案する。
このアプローチは、(a)サブゴールを生成するオブジェクト指向のPOMDPプランナー、(b)サブゴール達成のための低レベルポリシーのセット、(c)連続低レベル世界を抽象計画に適した表現に変換する抽象システムからなる。
提案システムは,AI2-THORシミュレーション環境における様々なオブジェクト,部屋,問題タイプに対して,有望な結果で評価する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:19:36 GMT)
Imagine and Seek: Improving Composed Image Retrieval with an Imagined Proxy [23.0] Zero-shot Composed Image Retrieval (ZSCIR)は、クエリイメージと相対的なキャプションにマッチした画像を取得する必要がある。
我々は、クエリ画像とテキスト記述に整合したプロキシ画像を生成する訓練不要な方法であるImagined Proxy for CIR(IP-CIR)を紹介した。
新たに提案したバランス指標はテキストベースとプロキシ検索の類似性を統合し,より正確な画像検索を可能にする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:12:35 GMT)
AnySynth: Harnessing the Power of Image Synthetic Data Generation for Generalized Vision-Language Tasks [23.0] 任意の種類の合成データを生成可能な統合フレームワークであるAny Synthを提案する。
我々は、Few-shot Object Detection、クロスドメインオブジェクト検出、Zero-shot Image Retrieval、Multi-modal Image Perception and Groundingなど、さまざまなタスクでフレームワークの性能を検証する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:05:34 GMT)
Beyond Pairwise Correlations: Higher-Order Redundancies in Self-Supervised Representation Learning [23.0] 埋め込み空間の冗長性の概念を形式化し、より複雑で高次の依存関係を捉える冗長性尺度を導入する。
本稿では,組込み空間における冗長性を低減する手法として,予測可能性最小化による自己教師付き学習(SSLPM)を提案する。
我々はSSLPMが最先端の手法と競合していることを示し、最も優れたSSLメソッドが低埋め込み空間冗長性を示すことを示した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:23:22 GMT)
Learning Structured Representations with Hyperbolic Embeddings [23.0] ラベル階層を学習表現に正確に埋め込むハイパーボリック構造正規化手法HypStructureを提案する。
いくつかの大規模ビジョンベンチマークの実験では、歪みを低減するためのHypStructureの有効性が示されている。
構造化された表現をよりよく理解するために、表現幾何学と改善されたout-of-Distribution(OOD)検出性能をリンクする固有値解析を行う。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 00:56:44 GMT)
AdaZeta: Adaptive Zeroth-Order Tensor-Train Adaption for Memory-Efficient Large Language Models Fine-Tuning [23.0] 微調整型大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著なパフォーマンスを実現している。
メモリ効率のゼロ階数法(MeZO)は、前方通過のみを使用してLPMを微調整しようとするため、バックプロパゲーショングラフは不要である。
本稿では,ZO手法の性能と収束性を改善するために,AdaZeta(Adaptive Zeroth-order-Train Adaption)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:03:47 GMT)
Advances in 3D Neural Stylization: A Survey [22.8] 現代の人工知能は、デジタルアートを作るための斬新で変革的なアプローチを提供する。
本稿では,ニューラルネットワークの表現力による3Dアセット作成と操作のスタイル化の進歩について報告する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:04:47 GMT)
SEAL: Semantic Attention Learning for Long Video Representation [21.9] 本稿では,長編ビデオの新たな統一表現であるセマンティック・アテンション・ラーニング(SEAL)を紹介する。
計算複雑性を低減するために、長いビデオは3つの異なるタイプのセマンティックエンティティに分解される。
私たちの表現は多目的であり、様々な長いビデオ理解タスクにまたがるアプリケーションを可能にします。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:46:12 GMT)
OffRAMPS: An FPGA-based Intermediary for Analysis and Modification of Additive Manufacturing Control Systems [21.8] アダプティブ・マニュファクチャリング(AM)におけるサイバーセキュリティの脅威はますます懸念される。
AMは現在、航空宇宙、輸送、医療の分野で使われている。
OFFRAMPS」プラットフォームはオープンソースの3Dプリンタ制御ボード「RAMPS」をベースにしている
論文参考訳(メタデータ) (Mon, 02 Dec 2024 01:57:15 GMT)
NLLG Quarterly arXiv Report 09/24: What are the most influential current AI Papers? [21.7] NLLGのarXivレポートは、cs.CL、cs.CV、cs.AI、cs.LGカテゴリにわたる、急速に進化するNLPとAI研究の展望をナビゲートするのに役立つ。
この4回目のインストールは、ChatGPTのデビュー後の2023年1月1日から2024年9月30日まで、AIの歴史の変革期を捉えている。
前回のレポート以来、最も暗黙の論文のトップ40のうち45%が新しい論文である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 22:10:38 GMT)
OmniFlow: Any-to-Any Generation with Multi-Modal Rectified Flows [21.7] OmniFlowは、テキスト・ツー・イメージ、テキスト・ツー・オーディオ、オーディオ・ツー・イメージ・シンセサイザーなど、あらゆる世代のタスク用に設計された新しい生成モデルである。
テキスト・ツー・イメージやテキスト・ツー・オーディオ合成など、さまざまなタスクにおいて、これまでの任意のモデルよりも優れています。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:13:01 GMT)
Explicitly Representing Syntax Improves Sentence-to-layout Prediction of Unexpected Situations [21.6] 文の構文を暗黙的にあるいは明示的にエンコードする言語表現から2次元空間レイアウトを予測することができることを示す。
本稿では,入力文の構文的構造をよりよく強制する構造的損失関数を提案する。
この損失は、木のような構造が条件付けのモダリティの下にある他の世代タスクで使われる可能性がある。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:30:50 GMT)
CRISP: Object Pose and Shape Estimation with Test-Time Adaptation [21.5] RGB-D画像からオブジェクトのポーズと形状を推定する問題を考察する。
カテゴリに依存しないオブジェクトポーズと形状推定パイプラインであるCRISPを紹介する。
また,ドメインギャップによる推定誤差を補正する最適化型ポーズ・形状補正器を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 02:26:21 GMT)
Probabilistic Graph Rewiring via Virtual Nodes [21.3] メッセージパッシンググラフニューラルネットワーク(MPNN)は、グラフベースの機械学習の強力なパラダイムとして登場した。
MPNNは、受信フィールドの制限や構造的ボトルネックが、グラフ内の情報フローを妨げている、アンダーリーチ(low-reaching)やオーバースキャッシング(over-squashing)といった課題に直面している。
本稿では,暗黙的にメッセージパッシングニューラルネットワーク(IPR-MPNN)を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:29:47 GMT)
VERA: Explainable Video Anomaly Detection via Verbalized Learning of Vision-Language Models [20.9] 本稿では、視覚言語モデルによるビデオ異常検出を可能にするVERAという言語学習フレームワークを提案する。
VERAは、VADに必要な複雑な推論を、よりシンプルでより焦点を絞った質問のリフレクションに分解する。
推論中、VERAは学習した質問をモデルプロンプトに埋め込んで、セグメントレベルの異常スコアを生成するVLMをガイドする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:10:14 GMT)
Lossless and Privacy-Preserving Graph Convolution Network for Federated Item Recommendation [20.8] グラフニューラルネットワーク(GNN)は、アイテムレコメンデーションのための最先端のソリューションとして登場した。
既存のGNNベースのレコメンデーション手法は、断片化されたユーザ・イテムインタラクションサブグラフの集中ストレージと、集約されたグローバルグラフのトレーニングに依存している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:31:22 GMT)
Robot Learning with Super-Linear Scaling [20.7] CASHERは、データ収集と学習をシミュレーションでスケールアップするためのパイプラインであり、パフォーマンスは人間の努力と超直線的にスケールする。
そこで我々は,CASHERにより,人的努力を伴わないビデオスキャンにより,事前学習したポリシーを目標シナリオに微調整できることを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:12:02 GMT)
FD-LLM: Large Language Model for Fault Diagnosis of Machines [20.7] 本研究では,時系列センサデータから故障を識別するための数値データ入力に,大規模言語モデルを効果的に適用した新しいIFD手法を提案する。
マルチクラス分類問題としてLLMのトレーニングを定式化することにより,故障診断に特化して設計されたLLMフレームワークであるFD-LLMを提案する。
FD-LLM フレームワークに基づく4つのオープンソース LLM の故障診断能力を評価し,各種動作条件下でのモデルの適応性と一般化性を評価する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:36:35 GMT)
OmniGuard: Hybrid Manipulation Localization via Augmented Versatile Deep Image Watermarking [20.7] 既存の多用途透かしアプローチは、タンパーの局所化精度と視覚的品質のトレードオフに悩まされている。
オムニガード(OmniGuard)は、能動的埋め込みと受動的、視覚的抽出を統合した新しい多目的透かし手法である。
コンテナ画像のPSNRは4.25dB、ノイズ条件ではF1スコアは20.7%、平均ビット精度は14.8%である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:38:44 GMT)
Adapting Large Language Models to Log Analysis with Interpretable Domain Knowledge [20.7] 大規模言語モデル(LLM)を用いた故障・エラー管理の新しい手法を開発する。
CPT(Continuous pre-training)によって解釈可能なドメイン知識をオープンソース LLM に統合し,自然言語処理能力を維持しながらログタスクのパフォーマンスを向上させる。
このデータセットでトレーニングしたSuperLogは、4つのログ分析タスクで最高のパフォーマンスを達成し、平均12.01%の2番目に良いモデルを上回っています。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:05:31 GMT)
INSIGHT: Explainable Weakly-Supervised Medical Image Analysis [20.6] INSIGHTは、熱マップ生成を誘導バイアスとして統合する、弱制御アグリゲータである。
CTとWSIのベンチマークでは、INSIGHTは最先端の分類結果と弱いラベル付きセマンティックセグメンテーション性能を達成する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 22:31:23 GMT)
VisScience: An Extensive Benchmark for Evaluating K12 Educational Multi-modal Scientific Reasoning [20.6] MLLM(Multi-modal large language model)は、様々なタスクにまたがる有望な機能を示す。
本稿では,25種の代表的MLLMの科学的推論における性能について詳細に評価する。
最も優れた性能は、クロード3.5-ソネットによる数学の53.4%の精度、GPT-4oによる物理学の38.2%、ジェミニ1.5-Proによる化学の47.0%である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:11:23 GMT)
TruncFormer: Private LLM Inference Using Only Truncations [20.5] プライベート推論(PI)は、ユーザデータのプライバシを保証する上で重要な役割を果たす。
PIは、機械学習モデルにおける非線形関数に関連する膨大なレイテンシコストのために、事実上難解なままである。
TruncFormerは、任意の機械学習モデルを取得し、それをPIのプレーンテキストエミュレーションに変換するためのフレームワークである。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 01:55:42 GMT)
NoisyNN: Exploring the Impact of Information Entropy Change in Learning Systems [20.3] 本研究では,特定の条件下での各種深部モデルの性能向上効果を示す。
ノイズがタスクの複雑さを軽減するのに役立つかどうかに基づいて、ノイズを正ノイズ(PN)と有害ノイズ(HN)の2つのタイプに分類する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:10:31 GMT)
Limits to Predicting Online Speech Using Large Language Models [20.2] 最近の理論的結果は、ユーザのソーシャルサークルからの投稿は、ユーザの過去の投稿と同じくらい、ユーザの将来の投稿を予測可能であることを示唆している。
我々は予測可能性について、モデルの不確実性の尺度として定義する。
サイズが15億から70億の4つの大きな言語モデルにまたがって、ユーザの投稿を仲間の投稿から予測すると、パフォーマンスが低下することがわかった。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:46:35 GMT)
MeasureNet: Measurement Based Celiac Disease Identification [20.0] セリアック病はグルテンの摂取によって引き起こされる自己免疫疾患である。
vili-to-crypt長比として算出されたvilli-crypt長の低下は,セリアック病の重症度を示している。
提案手法は,ポリラインの局在化と,測定タスクに特化して設計されたオブジェクト駆動損失を考慮した,病理駆動型ポリライン検出フレームワークである。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:40:16 GMT)
Energy-Based Modelling for Discrete and Mixed Data via Heat Equations on Structured Spaces [19.9] エネルギーベースモデル(EBM)は、様々なデータドメインにわたる確率的モデリングのための柔軟なフレームワークを提供する。
本稿では,データポイントにおけるエネルギー関数の評価のみを必要とする損失関数であるEnergy Discrepancyを用いた個別ESMの訓練を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 00:35:29 GMT)
Research on Optimizing Real-Time Data Processing in High-Frequency Trading Algorithms using Machine Learning [19.4] 本研究の目的は、高周波トレーディングアルゴリズムにおいて、データのリアルタイム処理を最適化することである。
動的特徴選択メカニズムは、市場データをリアルタイムで監視および分析する責任がある。
軽量ニューラルネットワークはモジュラー方式で設計されており、高速な畳み込み層とプルーニング技術を備えている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 02:46:10 GMT)
ReHub: Linear Complexity Graph Transformers with Adaptive Hub-Spoke Reassignment [19.2] 本稿では,効率的な再割り当て手法により線形複雑化を実現するグラフトランスフォーマーアーキテクチャReHubを提案する。
ReHubは航空会社のハブアンドスポークモデルからインスピレーションを得ており、フライトは固定数の仮想ノードに割り当てられている。
LRGB実験では,線形複雑度を維持しつつ,ベース手法であるNeural Atomsよりも一貫した改善が見られた。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:10:23 GMT)
A Neurosymbolic Fast and Slow Architecture for Graph Coloring [19.0] 制約満足度問題(CSP)は人工知能に重大な課題をもたらす。
既存のシンボリック・ソルバは、しばしば遅く、以前の研究では、LLM(Large Language Models)は、その複雑さのため、CSP(Large Language Models)のみに苦しむことが示されている。
私たちは、Daniel Kahneman氏の'Thinking, Fast and Slow'の認知モデルをAIに適用する、既存のSOFAIアーキテクチャ(SOFAI-v1)に基づいています。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:47:13 GMT)
HGCLIP: Exploring Vision-Language Models with Graph Representations for Hierarchical Understanding [19.0] 異なる階層レベルでカテゴリを分類する場合、従来のユニモーダルアプローチは主にイメージ機能に焦点を当て、複雑なシナリオにおける制限を明らかにする。
ビジョンランゲージモデル(VLM)とクラス階層を統合する最近の研究は、将来性を示しているが、階層関係を完全に活用するには至っていない。
本稿では,CLIPとグラフ表現学習による階層型クラス構造のより深い活用を効果的に組み合わせた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 00:42:44 GMT)
Concept Based Continuous Prompts for Interpretable Text Classification [18.8] 本稿では、連続的なプロンプトを人間可読な概念に分解して解釈する枠組みを提案する。
我々は、GPT-4oを用いて概念プールを生成し、差別的で代表的な潜在的候補概念を選択する。
実験により,本フレームワークは従来のPチューニングや単語ベースアプローチと同じような結果が得られることが示された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:56:08 GMT)
Dual-Branch Graph Transformer Network for 3D Human Mesh Reconstruction from Video [18.7] モノクルビデオからのヒューマンメッシュ再構成(HMR)は、人間とロボットの相互作用と協調において重要な役割を果たす。
既存のビデオベースのHMR再構成手法は、正確な再構成と滑らかな動作のトレードオフに直面している。
DGTRというビデオから3DヒューマンメッシュのtextbfReconstructionを実現するための textbfDual-branch textbfGraph textbfTransformer ネットワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:37:44 GMT)
Asynchronous Feedback Network for Perceptual Point Cloud Quality Assessment [18.7] 非同期フィードバック品質予測ネットワーク(AFQ-Net)を提案する。
AFQ-Netは人間の視覚知覚機構に動機付けられ、グローバルな特徴や局所的な特徴を扱うために二重ブランチ構造を採用している。
3つのデータセットに関する総合的な実験を行い、最先端のアプローチよりも優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:18:11 GMT)
Research on Cervical Cancer p16/Ki-67 Immunohistochemical Dual-Staining Image Recognition Algorithm Based on YOLO [18.2] 本稿では, YOLOv5に基づく新しい頸部癌二重画像認識(DSIR-YOLO)モデルを提案する。
Swin-Transformerモジュール、GAMアテンション機構、マルチスケール機能融合、EIoUロス関数を融合することにより、検出性能が大幅に向上する。
5倍のクロスバリデーションにおけるYOLOv5sと比較して、改良アルゴリズムの精度、リコール、mAP@0.5、mAP@0.5:0.95はそれぞれ2.3%、4.1%、4.3%、そして8.0%向上する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:55:38 GMT)
AR-Facilitated Safety Inspection and Fall Hazard Detection on Construction Sites [17.9] 我々は,高層建設現場の安全検査を容易にするために,ヘッドマウント型拡張現実の可能性を探っている。
業界で特に懸念されているのは、人や物体の落下を防ぐために、高いレベルの建設現場で、周囲の安全画面を検査することである。
我々は,安全画面のどの部分が検査されたかを追跡することで,この検査作業を支援することを目的とする。
機械学習を用いて、近距離検査と修復を必要とする周辺スクリーンのギャップを自動的に検出し、レポートを自動化する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:38:43 GMT)
Deep Learning and Machine Learning, Advancing Big Data Analytics and Management: Object-Oriented Programming [17.6] オブジェクト指向プログラミング(OOP)は、現代のソフトウェアシステムの複雑さの増大を管理するための重要なパラダイムになっています。
この作業は、これらのドメイン内でOOP技術を統合するための包括的な紹介を提供する。
機械学習システムの構造と効率を高めるために,設計パターンとモジュールプログラミングをどのように利用することができるかを検討する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:56:26 GMT)
Locally purified density operators for noisy quantum circuits [17.4] 我々は、$N$ qubitsのLPDOを、はしご上で定義された2時間N$の純粋な状態にマッピングし、仮想およびクラウス結合を管理する統一的な方法を導入する。
数値的にノイズの多いランダムな量子回路を,忠実度と絡み合いエントロピーを精度測定として,最大$d=40$の深さでシミュレートする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:54:00 GMT)
On Meta-Prompting [17.3] 本稿では,カテゴリ理論に基づく理論的枠組みを提案し,プロンプトの一般化と記述を行う。
私たちは、モデル研究の2つの領域、創造性と思考でフレームワークをテストします。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:32:41 GMT)
Cross-Modal Visual Relocalization in Prior LiDAR Maps Utilizing Intensity Textures [17.2] 近年、クロスモーダルな地域化が注目されている。
そこで我々は,強度テクスチャを利用した先行LiDARマップにおけるモーダルな視覚的再局在システムを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:13:14 GMT)
Scaling Law for Language Models Training Considering Batch Size [17.1] 大規模言語モデル(LLM)は近年顕著な進歩を遂げており、この急速な進歩においてスケーリング法則が重要な役割を担っている。
本稿は,LLMトレーニングの実践において,重要なハイパーパラメータ,すなわちグローバルバッチサイズがどのように影響するかを実証的に検討する。
モデルのサイズとトレーニングデータ量に関する基本的なスケーリング法則を確立します。
次に,バッチサイズや学習率の変化が,これらのモデルの収束と一般化にどのように影響するかを検討する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:58:35 GMT)
Learning Differential Pyramid Representation for Tone Mapping [17.0] 学習可能な微分ピラミッド表現ネットワーク(DPRNet)を導入する。
DPRNetは、高品質なトーンマッピング回復に不可欠である詳細なテクスチャと構造をキャプチャすることができる。
さらに、グローバルな一貫性と局所的なコントラストを達成するために、グローバルなトーン知覚モジュールと局所的なトーンチューニングモジュールを設計する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:59:46 GMT)
Silenced Voices: Exploring Social Media Polarization and Women's Participation in Peacebuilding in Ethiopia [17.0] この研究は、エチオピアにおけるソーシャルメディアの分極と武器化の重大な脅威を強調している。
効果的なデジタル平和構築イニシアチブが欠如していることを明らかにする。
この研究はアルゴリズム設計におけるモデレーションの強化と倫理的考察を推奨している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:37:41 GMT)
See What You Seek: Semantic Contextual Integration for Cloth-Changing Person Re-Identification [16.8] 衣服交換者再識別(CC-ReID)は、衣服の変化にもかかわらず、複数の監視カメラで個人をマッチングすることを目的としている。
既存の方法は通常、衣服の変化の影響を緩和したり、ID関連機能を強化することに重点を置いている。
本稿では,CC-ReIDのための新しいプロンプト学習フレームワークSemantic Contextual Integration(SCI)を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:11:16 GMT)
Long Video Diffusion Generation with Segmented Cross-Attention and Content-Rich Video Data Curation [16.8] 長距離コヒーレンスとリッチコンテンツを備えた15秒ビデオを生成するために設計された,新しいビデオ拡散モデルであるPrestoを紹介する。
PrestoはVBench Semantic Scoreで78.5%、Dynamic Degreeで100%のスプリットを達成した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:32:36 GMT)
LV-UNet: A Lightweight and Vanilla Model for Medical Image Segmentation [16.6] 本稿では,事前学習したMobileNetv3-Largeのバックボーンを活用し,モジュールを組み込んだ軽量かつバニラモデルであるLVUNetを紹介する。
ISIC 2016、BUSI、CVCClinicDB、CVCColonDB、KvairSEGデータセットの実験結果は、パフォーマンスと計算負荷のトレードオフをより良く示している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:39:07 GMT)
The Bare Necessities: Designing Simple, Effective Open-Vocabulary Scene Graphs [16.6] 3次元オープンボキャブラリシーングラフ法は, エンボディエージェントの有望な地図表現である。
一般的なシーングラフフレームワークを提案し,画像前処理,特徴融合,特徴選択に着目した3つの研究を行う。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:29:31 GMT)
ChatRex: Taming Multimodal LLM for Joint Perception and Understanding [16.5] 認識設計を分離したMLLMであるChatRexを紹介する。
データの観点からは、完全に自動化されたデータエンジンを構築します。
ChatRexはマルチモーダル理解性能を維持しながら、強い知覚能力を示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:04:40 GMT)
Hierarchical VAE with a Diffusion-based VampPrior [16.5] 拡散に基づく後方前葉の変動混合(VampPrior)を用いた階層型VAEの導入
提案手法により,従来の VampPrior の動作や,その他の階層的なVAE と比較して,パフォーマンスが向上する。
提案手法を標準ベンチマークデータセット上で実証的に検証し,トレーニング安定性の向上と遅延空間利用の実証を行った。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:58:09 GMT)
PartGS:Learning Part-aware 3D Representations by Fusing 2D Gaussians and Superquadrics [16.4] ポイントクラウド、メッシュ、NeRF、そして3Dガウスのような低レベルの3D表現は、一般的に3Dオブジェクトやシーンを表現するために使用される。
2D $textbfG$aussiansと$textbfS$uperquadricsのハイブリッド表現による、$textbfPartGS$, $textbfPart$-aware 3D再構築を紹介します。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:04:07 GMT)
Topology-Based Reconstruction Prevention for Decentralised Learning [16.1] プライバシ保存の要約を数回行った結果,受動的に誠実だが正確な敵が,他のユーザのプライベートデータを推測できることが判明した。
本稿では,復興攻撃に対する最初のトポロジに基づく分散型防衛法を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:54:09 GMT)
Approximate Quantum Circuit Synthesis for Diagonal Unitary [16.0] 対角ユニタリ合成は、量子回路合成問題において重要な役割を果たす。
本稿では,特定の量子リソース制限に基づいて対角的なユニタリ実装を設計するための量子回路合成アルゴリズムを提案する。
我々のアルゴリズムは、通常のラップトップ上で最大15キュービットの量子回路に対して対角ユニタリを合成することができる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:54:23 GMT)
Fine Tuning vs. Retrieval Augmented Generation for Less Popular Knowledge [15.6] 言語モデル(LM)は膨大な事実知識を記憶し、様々なタスクやドメインにまたがって強力なパフォーマンスを示す。
低頻度トピックにおけるLMの性能を高めるための2つの顕著なアプローチは、検索型拡張生成(RAG)と合成データに対する微調整(FT)である。
本稿では,質問応答タスクにおける低周波エンティティ処理におけるLMのカスタマイズに対するRAGとFTの影響について検討し,評価する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:48:36 GMT)
Personalized Coupled Tensor Decomposition for Multimodal Data Fusion: Uniqueness and Algorithms [15.5] データ融合の課題に対処するパーソナライズされたCTDフレームワークを提案する。
各データセットを2つのコンポーネントの和として表現するフレキシブルモデルが提案されている。
共通成分と異なる成分を計算するための2つのアルゴリズムが提案されている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:19:47 GMT)
Fire-Image-DenseNet (FIDN) for predicting wildfire burnt area using remote sensing data [15.5] 深層学習に基づく予測モデルFire-Image-DenseNet(FIDN)を開発した。
FIDNは、山火事の環境および気象要因に関する、ほぼリアルタイムおよび再分析データから得られた空間的特徴を用いる。
平均二乗誤差 (MSE) は, 細胞オートマトン (CA) と最小走行時間 (MTT) に基づく予測モデルよりも約82%, 67%低い値を示した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:35:31 GMT)
CPA: Camera-pose-awareness Diffusion Transformer for Video Generation [15.5] CPAはテキスト・ビデオ生成のアプローチであり、テキスト・ビジュアル・空間的条件を統合している。
トラジェクトリの整合性とオブジェクトの整合性において最適な性能を保ちながら、長いビデオ生成のためのLDM法よりも優れる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:10:00 GMT)
A 2-step Framework for Automated Literary Translation Evaluation: Its Promises and Pitfalls [15.5] 文芸機械翻訳を評価するための2段階パイプラインの実現可能性を提案し,評価する。
私たちのフレームワークは、文学翻訳に適した細粒度で解釈可能なメトリクスを提供します。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:07:01 GMT)
R-Bot: An LLM-based Query Rewrite System [15.5] 機械学習に基づくクエリ書き換えシステムであるR-Botを提案する。
まず,複数ソースのリライトエビデンス作成パイプラインを設計し,クエリリライトエビデンスを生成する。
次に,構造解析と意味解析を組み合わせたハイブリッド・セマンティック検索手法を提案する。
広く使われているベンチマークで包括的な実験を行い、システムの性能を実証する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:13:04 GMT)
Adapting Pre-Trained Vision Models for Novel Instance Detection and Segmentation [15.4] 統一的でシンプルで効果的なフレームワーク(NIDS-Net)を提案する。
NIDS-Netはオブジェクトの提案生成、インスタンステンプレートと提案領域の埋め込み生成、インスタンスラベルの割り当ての埋め込みマッチングを含む。
我々のフレームワークは現在の最先端の手法を超え、4つの検出データセットの平均精度(AP)において22.3、46.2、10.3、24.0の顕著な改善を示している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:51:41 GMT)
Enhancing Function-Calling Capabilities in LLMs: Strategies for Prompt Formats, Data Integration, and Multilingual Translation [15.3] 大規模言語モデル(LLM)は、特に関数呼び出しにおいて、かなり高度な自律エージェントを持つ。
本研究は, LLMの機能呼び出し能力の向上を, 様々なアプローチを探求することによって研究している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:10:41 GMT)
ODE: Open-Set Evaluation of Hallucinations in Multimodal Large Language Models [15.2] 大規模言語モデル(MLLM)における幻覚を評価するためのオープンセット動的プロトコルを提案する。
ODEは、現実世界のオブジェクト概念、それらの属性、それらの間の分布関係を表現するために、グラフベースの構造を用いる。
生成タスクと識別タスクの両方において幻覚を評価する構造化クエリのさまざまなサンプルを生成する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:51:09 GMT)
Using Large Language Models in Automatic Hint Ranking and Generation Tasks [15.1] 情報へのアクセスが容易な時代には、人間の認知能力を刺激し、維持することが不可欠である。
本稿では,ヒントを代替として,あるいは直接回答のための補足として活用することで,このような課題に対処する。
まず手動で構築したヒントデータセットであるWHINTIKIを紹介します。
次に,LLaMA-3.1 などのオープンソース LLM を微調整して,応答認識と応答非依存の文脈におけるヒント生成を行う。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:44:19 GMT)
LMAct: A Benchmark for In-Context Imitation Learning with Long Multimodal Demonstrations [15.1] エージェントとして使用する場合、ファンデーションモデルは単純な推論や意思決定のタスクに苦労することが多い。
我々はこれらのモデルを意思決定シナリオでプレッシャーテストするためのベンチマークを示す。
我々の結果は、現在でもほとんどのモデルが、コンテキスト内デモから望ましい振る舞いを模倣するのに苦労していることを示唆している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:31:58 GMT)
Adversarial Attacks on Hyperbolic Networks [15.0] 本稿では、一般的に用いられているFGMとPGDの対向攻撃に対する双曲的代替法を提案する。
既存のデータセットの解釈可能な総合ベンチマークと実験を通じて、既存の、新しく提案された攻撃がどのように異なるかを示す。
これらのネットワークは異なるタイプの脆弱性に悩まされており、新たに提案された双曲的攻撃はこれらの違いに対処できない。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:48:41 GMT)
A Conditional Independence Test in the Presence of Discretization [14.9] 既存のテストメソッドは、離散化された観察しかできない場合、機能しない。
このような離散化の存在に対応するために特別に設計された条件付き独立テストを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:12:54 GMT)
FedAH: Aggregated Head for Personalized Federated Learning [14.6] Federated Learning (FL)は、プライバシー保護と協調学習機能で人気を集めている。
本稿では,各反復時にアグリゲートヘッドで頭部を初期化するFedAH(Federated Learning with Aggregated Head)と呼ばれる新しいPFL手法を提案する。
FedAHはテスト精度を2.87%向上させ、最先端のFL法を10つ上回っている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:08:51 GMT)
STATIC : Surface Temporal Affine for TIme Consistency in Video Monocular Depth Estimation [14.6] ビデオ単眼深度推定は、自律運転、AR/VR、ロボット工学などのアプリケーションに不可欠である。
近年の変圧器を用いた単眼単眼深度推定モデルは単一画像上では良好に機能するが,ビデオフレーム間の奥行きの整合性に苦慮している。
本研究では,静的および動的領域における時間的一貫性を付加情報なしで学習する新しいモデルであるSTATICを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:53:33 GMT)
AdaptiveDrag: Semantic-Driven Dragging on Diffusion-Based Image Editing [14.5] マスクレスのポイントベース画像編集手法であるAdaptiveDragを提案する。
入力画像とドラッグプロセスとの包括的接続を確保するため,セマンティック駆動型最適化を開発した。
提案手法は,これらの効果的な設計に基づいて,単一入力画像とハンド・ターゲット・ポイント・ペアのみを用いて,優れた生成結果を提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:33:56 GMT)
Cross-Refine: Improving Natural Language Explanation Generation by Learning in Tandem [14.5] 人間と同様に、大きな言語モデル(LLM)は、最初の試みについて最適な説明を常に生成するとは限らない。
本稿では,2つのLLMをジェネレータとして配置し,それぞれに役割モデリングを施したクロスリファインを紹介する。
ジェネレータは、最初のNLEを出力し、その後、批評家から提供されるフィードバックと提案を使って、この最初の説明を洗練する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:04:18 GMT)
Towards Universal Soccer Video Understanding [14.5] 本稿では,サッカー理解のための総合的マルチモーダルフレームワークを開発することを目的とする。
これまでで最大のマルチモーダルサッカーデータセットである SoccerReplay-1988 を紹介する。
サッカー分野における最初の視覚言語基礎モデルであるMatchVisionについて述べる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:58:04 GMT)
Structure-Aware Human Body Reshaping with Adaptive Affinity-Graph Network [14.4] 本稿では, 適応親和性グラフネットワーク(Adaptive Affinity-Graph Network, AAGN)を提案する。
高周波の詳細については、高周波数領域と空間領域の両方から情報を抽出するために、Body Shape Discriminator (BSD) が設計されている。
本フレームワークは,画像の美的魅力を著しく向上させ,すべての評価指標の最先端化を図っている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:29:46 GMT)
The Seeds of the FUTURE Sprout from History: Fuzzing for Unveiling Vulnerabilities in Prospective Deep-Learning Libraries [14.3] Futureは、新しく導入され、将来的なDLライブラリ用に調整された最初のユニバーサルファジィフレームワークである。
既存のライブラリからの履歴バグ情報と、特殊なコード生成のための微調整LDMを使用する。
バグ検出、バグ再現の成功率、コード生成の妥当性、APIカバレッジにおいて、既存のファジィアよりも大幅に優れています。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:33:28 GMT)
Federated Motor Imagery Classification for Privacy-Preserving Brain-Computer Interfaces [14.3] 本稿では,バッチ固有のバッチ正規化とシャープネス認識の最小化によるフェデレーション分類を提案する。
FedBSはユーザのEEGデータのプライバシを保護し、複数のBCIユーザが大規模な機械学習モデルトレーニングに参加することを可能にする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:35:27 GMT)
CaliScalpel: In-Situ and Fine-Grained Qubit Calibration Integrated with Surface Code Quantum Error Correction [14.0] CaliScalpelは、表面符号のin situキャリブレーションのための革新的なフレームワークである。
以上の結果から,CaliScalpelは最小のキュービットオーバーヘッドと無視可能な実行時間の影響で同時キャリブレーションと計算を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 23:37:03 GMT)
Inference Scaling fLaws: The Limits of LLM Resampling with Imperfect Verifiers [13.8] 近年の研究では、推論スケーリングにより、より弱い言語モデルがより強力なモデルの精度に適合または超えることを期待している。
より弱いモデルの推論スケーリングの量は、十分に強いモデルの単一サンプル精度に匹敵することができないことを示す。
また、精度以上の偽陽性には、コーディングスタイルの慣行への順守の欠如など、他の望ましくない性質があることも示している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:54:28 GMT)
EsurvFusion: An evidential multimodal survival fusion model based on Gaussian random fuzzy numbers [13.5] EsurvFusionは、決定レベルでマルチモーダルデータを組み合わせるように設計されている。
信頼性の割引層を通じてモダリティレベルの信頼性を推定する。
これは、不確実性と信頼性の両方でマルチモーダルサバイバル分析を研究する最初の研究である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:35:29 GMT)
Combining Induction and Transduction for Abstract Reasoning [13.4] 我々は、ARC上で誘導(潜伏関数の推論)および伝達(与えられたテスト入力に対するテスト出力を直接予測する)のためにニューラルネットワークを訓練する。
インダクティブモデルとトランスダクティブモデルは、同じトレーニング問題を持ち、同じニューラルアーキテクチャを共有するにもかかわらず、さまざまな種類のテスト問題を解決する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:36:30 GMT)
Ponder & Press: Advancing Visual GUI Agent towards General Computer Control [13.4] Ponder & Press(ポンダー・アンド・プレス)は、視覚的入力のみを使用する汎用コンピュータ制御のための分断型フレームワークである。
我々のエージェントは、幅広い応用に適用可能な、多目的で人間のような相互作用パラダイムを提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:35:31 GMT)
NCDD: Nearest Centroid Distance Deficit for Out-Of-Distribution Detection in Gastrointestinal Vision [13.3] 消化器視覚における深層学習ツールの統合は、診断、治療、患者ケアの大幅な進歩の可能性を秘めている。
しかし、大きな課題は、目に見えない、または新しく出現する病気のパターンに遭遇しても、これらのツールが過度に自信の持たない予測を行う傾向があることである。
消化管OOD検出のための特徴空間において, 新たにNCCD(Nest-centroid distance loss)スコアを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:07:55 GMT)
Inducing Group Fairness in Prompt-Based Language Model Decisions [13.0] 新たなプロンプトベース言語モデル(LM)決定は、分類タスクを解く新しい機会を生み出した。
LMベースの意思決定者にとって「修復ツールキット」は不完全であり、意思決定者グループフェアネスを改善する方法についてはほとんど理解されていない。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:27:02 GMT)
Efficient LLM Inference using Dynamic Input Pruning and Cache-Aware Masking [12.7] 動的入力プルーニング(Dynamic Input Pruning, DIP)は、最小限の微調整で精度を保ち、予測不要な動的スペーシフィケーション手法である。
本稿では、キャッシュの状態とアクティベーションの規模を考慮し、キャッシュヒット率をさらに向上させる新しいキャッシュ対応マスキング戦略について述べる。
Phi-3-Mediumでは、DIPは46%のメモリ削減と40%のスループット向上を実現している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:07:51 GMT)
A Survey and Benchmark of Automatic Surface Reconstruction from Point Clouds [12.6] このタスクは、ノイズ、外れ値、非一様サンプリング、欠落データなどの要因により、現実世界の取得において特に困難である。
従来のアプローチでは、入力点の雲または結果として生じる表面に手作りの先行を課すことで、問題を単純化することが多い。
ディープラーニングモデルは、データから入力ポイントクラウドと所望の表面のプロパティを直接学習する機能を持っている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:11:13 GMT)
emg2pose: A Large and Diverse Benchmark for Surface Electromyographic Hand Pose Estimation [12.6] 信頼性と常に利用可能な手ポーズ推論は、人間とコンピュータの相互作用に対する新しい直感的な制御スキームをもたらす可能性がある。
装着可能な手首型表面筋電図(sEMG)は有望な代替手段である。
emg2poseは、高品質の手ポーズラベルと手首のsEMGレコードの公開データセットとして最大である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 23:39:37 GMT)
Who's Gaming the System? A Causally-Motivated Approach for Detecting Strategic Adaptation [12.5] 我々は、最も積極的なゲーミングを行う「悪質な犯罪者:」エージェントを特定することを目標とするマルチエージェント設定について検討する。
本稿では,各エージェントのゲーム傾向をスカラーでパラメータ化するフレームワークを提案する。
異なるエージェントが異なる「処理」を表現している因果効果推定問題として問題を再キャストすることにより、ゲームパラメータによる全てのエージェントのランキングが特定可能であることを証明した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 22:07:48 GMT)
LeanGaussian: Breaking Pixel or Point Cloud Correspondence in Modeling 3D Gaussians [12.4] 変形可能なトランスフォーマーにおける各クエリを1つの3次元ガウス楕円体として扱う新しいアプローチであるLeanGaussianを紹介する。
変形可能なデコーダを用いて、画像特徴をキーと値として、ガウス層を反復的に洗練する。
提案手法は従来の手法よりも約6.1%優れ,PSNRは25.44,PSNRは22.36であった。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:11:06 GMT)
Global Average Feature Augmentation for Robust Semantic Segmentation with Transformers [12.3] セグメンテーションのための視覚変換器のロバスト性を向上させるために,チャネルワイズ機能拡張を提案する。
CWFAは、トレーニング中に最小の計算オーバーヘッドでエンコーダ当たりの全世界的な摂動を推定する。
CWFAで強化されたSegFormer-B5は、新しい最先端の84.3%の保持率を実現し、最近発表されたFAN+STLよりも0.7%改善した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:05:05 GMT)
Composition of Experts: A Modular Compound AI System Leveraging Large Language Models [12.3] コンポジション・オブ・エキスパートズ(CoE)は,複数専門家大規模言語モデル(LLM)を活用したモジュール型複合AIシステムである。
本稿では,これらの複雑さに対処する2段階のルーティング手法を提案し,まず最初にルータを用いて異なるカテゴリに分類し,次に所望のエキスパートを得るためのカテゴリ・ツー・エキスパート・マッピングを提案する。
実験により,CoEの計算オーバーヘッド低減による性能向上効果が実証された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:43:21 GMT)
RL2: Reinforce Large Language Model to Assist Safe Reinforcement Learning for Energy Management of Active Distribution Networks [12.2] 大規模言語モデル(LLM)は、ADNにおけるエネルギー管理のための安全なRLを支援するための有望な方法を提供する。
本稿では,複数ラウンドの対話を通して生成した関数を反復的かつ適応的に洗練するRL2機構を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:15:36 GMT)
I Spy With My Little Eye: A Minimum Cost Multicut Investigation of Dataset Frames [12.2] 視覚フレーミング分析は、社会科学において、談話における共通テーマや概念を決定するための重要な方法である。
本稿では,クラスタリングタスクを最小コストマルチカット問題 [MP] と表現する。
MPに対する解は、同じクラスタに属する2つの画像の局所的対の確率のみから、後続確率を最大化するクラスタリングを提供することが示されている。
最適クラスタリング(定義によって)と組み合わせて空間差を埋め込むという私たちの洞察は、自動的な視覚的フレーム検出を進歩させます。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:09:47 GMT)
FEVER-OOD: Free Energy Vulnerability Elimination for Robust Out-of-Distribution Detection [12.1] 自由エネルギースコア定式化(OOD)における未探索および固有の脆弱性について検討した。
最終線形層の最小特異値を最大化するために, 新規な正則化を導入し, サンプル間自由エネルギー分離を向上する。
実験の結果, FEVER-OOD法は画像ネット100におけるOOD検出の状態を達成し, 平均OOD偽陽性率(95%真正率)は35.83%であった。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:15:24 GMT)
Neighboring Slice Noise2Noise: Self-Supervised Medical Image Denoising from Single Noisy Image Volume [12.1] 近距離スライスノイズ2ノイズ(NS-N2N)の自己監督型医用画像復号法を提案する。
NS-N2Nは、画像ボリューム自体の高品質な denoising を実現するために、1つの医療画像から得られるノイズの多い画像ボリュームのみを必要とする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:36:39 GMT)
InfinityDrive: Breaking Time Limits in Driving World Models [12.0] InfinityDriveは、例外的な一般化機能を備えた最初の駆動世界モデルである。
最先端のパフォーマンスを高忠実さ、一貫性、多様性で実現し、微細なビデオ生成を実現している。
複数のデータセットにおける我々の実験は、InfinityDriveが複雑で多様なシナリオを生成する能力を検証する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:15:41 GMT)
R.I.P.: A Simple Black-box Attack on Continual Test-time Adaptation [12.0] テスト時間適応(TTA)は、マシンラーニングの継続的なドメインシフトに取り組むための、有望なソリューションとして登場した。
連続的なTTAモデルの性能を低下させることのできるデータサンプリングプロセスにおけるリスクの特定に成功した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:55:13 GMT)
Representation Learning for Sequential Volumetric Design Tasks [11.7] 本稿では,設計知識を専門家や高性能な設計シーケンスの集合から符号化することを提案する。
学習した表現の密度を推定して選好モデルを開発する。
逐次設計生成のための自己回帰変換モデルを訓練する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 22:33:40 GMT)
MFTF: Mask-free Training-free Object Level Layout Control Diffusion Model [11.7] 拡散に基づく視覚言語モデルには、生成画像中の物体の形状、外観、位置を正確に制御する能力がない。
マスクや画像の追加を必要とせずにオブジェクトの位置を正確に制御できるMFTFモデルを提案する。
これは拡散モデルの分極過程を並列分極により制御することによって達成される。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:56:13 GMT)
Towards Understanding Domain Adapted Sentence Embeddings for Document Retrieval [11.7] テレコム、ヘルス、サイエンスのデータセットを使って質問応答に適応する。
我々は,異なる埋め込みに対する類似度スコアのしきい値を得るための体系的手法を確立する。
ドメイン固有の文に対する埋め込みは、ドメインに依存しない文とほとんど重複しないことを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:08:49 GMT)
Stock Movement Prediction with Multimodal Stable Fusion via Gated Cross-Attention Mechanism [11.7] 本研究は,MSGCA (Multimodal Stable Fusion with Gated Cross-Attention) という新しいアーキテクチャを導入する。
MSGCAフレームワークは、(1)インジケータシーケンス、動的文書、および関係グラフを処理し、それらの特徴表現を標準化する三次符号化モジュール、(2)プライマリおよび一貫性のある特徴が一対のゲート型クロスアテンションネットワークを介して3つのモダリティのマルチモーダル融合を導くクロスフュージョンモジュール、(3)時間的および次元的縮小により融合した特徴を洗練して正確に実行する予測モジュールからなる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:04:17 GMT)
Self and Cross-Model Distillation for LLMs: Effective Methods for Refusal Pattern Alignment [11.6] OpenAIのGPTシリーズ、AnthropicのClaude、MetaのLLaMaのような大きな言語モデル(LLM)は、テキスト生成において顕著な能力を示している。
有害なプロンプトに対する感受性は、重大なセキュリティ上の課題を呈している。
本稿では,SFT(Supervised Fine-Tuning)やRLHF(Reinforcement Learning from Human Feedback)などのアライメント手法について検討する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:22:01 GMT)
Artificial Intelligence for Geometry-Based Feature Extraction, Analysis and Synthesis in Artistic Images: A Survey [11.4] このレビューは、幾何学的データをAIモデルに統合する大きなメリットを強調している。
高いクラス間のバリエーション、ドメインギャップ、コンテンツからのスタイルの分離といった課題に対処する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:41:15 GMT)
Constraining Generative Models for Engineering Design with Negative Data [11.4] 本稿では,制約を満たす出力に向けて生成モデルを導くための新しいトレーニング手法を提案する。
我々の負データ生成モデル(NDGM)の定式化は、古典的モデルよりも容易に優れている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:20:12 GMT)
Generalized EXTRA stochastic gradient Langevin dynamics [11.4] ランゲヴィンアルゴリズムは、ベイズ学習のためのマルコフ・チェイン・モンテカルロ法(Markov Chain Monte Carlo method)として人気がある。
Langevin dynamics (SGLD)のような彼らのバージョンは、ランダムにサンプリングされたミニバッチに基づいた反復学習を可能にする。
通信とプライバシーの制約を受けるエージェントのネットワークでデータが分散化されると、標準のSGLDアルゴリズムは適用できない。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:57:30 GMT)
Quantization-Aware Imitation-Learning for Resource-Efficient Robotic Control [11.4] 我々は,低ビット精度誤差に対するロバスト性を高めるために,パラメータを微調整するILベースのポリシーモデルのための新しい量子化フレームワークを提案する。
実エッジGPU上での4ビット重み量子化のためのロボット操作による評価は,我々のフレームワークが最大2.5倍の高速化と2.5倍の省エネを実現していることを示す。
これらの結果は、リソース制約のあるデバイスにILベースのポリシーモデルをデプロイする現実的な可能性を強調している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 01:33:49 GMT)
RaD: A Metric for Medical Image Distribution Comparison in Out-of-Domain Detection and Other Applications [11.3] Radiomic Feature Distance (RaD)は、医療画像に適した新しい知覚距離である。
種々の実験において、RaDはドメイン外検出(OOD)において他の指標よりも優れていることを示す。
RaDはまた、解釈可能性や、低いサンプルサイズでの安定性と計算効率といった追加の利点も提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:49:14 GMT)
Learning Smooth Distance Functions via Queries [11.2] 問合せに基づく学習フレームワークにおける学習距離関数の問題について検討する。
我々は、スムースに学習するために必要なクエリの複雑さに関する公式な保証を確立するが、そうでなければ距離関数の一般性は保証する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:03:05 GMT)
Asynchronous Message-Passing and Zeroth-Order Optimization Based Distributed Learning with a Use-Case in Resource Allocation in Communication Networks [11.2] 分散学習と適応は大きな関心を集め、機械学習信号処理に広く応用されている。
本稿では、エージェントが共通のタスクに向けて協調するシナリオに焦点を当てる。
送信者として働くエージェントは、グローバルな報酬を最大化するために、それぞれのポリシーを共同で訓練する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:02:53 GMT)
Pixel-aligned RGB-NIR Stereo Imaging and Dataset for Robot Vision [11.1] 移動ロボットに搭載されたRGB-NIRステレオカメラとLiDARセンサを備えたロボットビジョンシステムを提案する。
システムは同時に、RGBステレオ画像、NIRステレオ画像、時間同期LiDAR点の画素整列をキャプチャする。
実験により,様々な照明条件におけるRGB-NIR画像の有用性が示された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:42:28 GMT)
Align-KD: Distilling Cross-Modal Alignment Knowledge for Mobile Vision-Language Model [11.0] VLM(Vision-Language Models)は、マルチモーダルタスクに強力な理解と推論能力をもたらす。
そこで我々は,浅層で発生するクロスモーダルマッチングを学生モデルで学習するためのAlign-KD法を提案する。
Align-KDの指導のもと、1.7B MobileVLM V2モデルは、訓練損失の軽さで7B教師モデルから豊富な知識を学ぶことができる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:55:19 GMT)
Fighting Bias with Bias: A Machine Learning Approach to Assess Human Bias [11.0] 人為的意思決定におけるバイアスを評価するための機械学習ベースのフレームワークを提案する。
提案手法が既存の代替手段よりも優れていることを示す理論的保証と実証的証拠を提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:15:54 GMT)
LLMs4Life: Large Language Models for Ontology Learning in Life Sciences [10.7] 既存のLarge Language Models(LLM)は、複数の階層レベル、豊富な相互接続、包括的なカバレッジで生成するのに苦労しています。
我々は,先進的な急進的工学技術を用いたLCMを用いたオントロジー学習のためのNeOn-GPTを拡張した。
本評価は,LLMの学習性を示すもので,長期にわたるモデル性能とスケーラビリティの限界に対する解決策を提供するものである。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 23:31:52 GMT)
Evaluating Automated Radiology Report Quality through Fine-Grained Phrasal Grounding of Clinical Findings [10.5] 本研究は, 多数の臨床所見の位置, 側方性, 重症度を把握した, きめ細かい発見パターンを抽出し, 報告品質評価法を開発した。
次に、テキストと視覚の計測値を組み合わせて、生成されたレポートの品質を評価する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 01:27:47 GMT)
A Note on Doubly Robust Estimator in Regression Continuity Designs [10.5] 回帰不連続性(RD)設計のための二重頑健性(DR)推定器を提案する。
DR-RD推定器はRD設計における処理効果推定器のロバスト性を高める。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:58:18 GMT)
Do Large Language Models with Reasoning and Acting Meet the Needs of Task-Oriented Dialogue? [10.5] タスク指向対話(TOD)を行う大規模言語モデル(LLM)のガイドにReAct戦略を適用した。
ReAct-LLMは、シミュレーションにおける最先端のアプローチを過小評価しているように見えるが、人間による評価は、手作りシステムよりも高いユーザ満足度を示している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:30:22 GMT)
Cavity-Heisenberg spin-$j$ chain quantum battery and reinforcement learning optimization [10.4] 本稿では,スピン-$jを用いたキャビティ-ハイゼンベルクスピンチェーン量子電池モデルを提案する。
その結果、QBの充電エネルギーと電力はスピンサイズで大幅に向上した。
最適化機構を解析し,キャビティスピンの絡み合いと充電性能の関係を明らかにする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:32:07 GMT)
DIR: Retrieval-Augmented Image Captioning with Comprehensive Understanding [10.3] Dive Into Retrieval (DIR) は、画像からテキストへの検索プロセスと、検索したテキストの利用の両方を強化するように設計されている。
DIRはドメイン内性能の競争力を維持するだけでなく、ドメイン外の一般化も大幅に改善する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:39:17 GMT)
SerialGen: Personalized Image Generation by First Standardization Then Personalization [10.3] SerialGenは、参照画像を標準化する標準化段階と、標準化された参照に基づいてパーソナライズされた生成段階の2つのステージからなるシリアル生成方法である。
本実験は,参照画像全体の外観を忠実に再現するパーソナライズされた画像を生成するためのフレームワークの能力を検証するものである。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:35:45 GMT)
A Hybrid BPMN-DMN Framework for Secure Inter-organizational Processes and Decisions Collaboration on Permissioned Blockchain [10.3] 本稿では、BPMN(Business Process Model and Notation)とDMN(Decision Model and Notation)をシームレスに統合する新しいモデル駆動フレームワークであるBlockCollabを提案する。
このアプローチは、統合されたBPMNDMNモデルをHyperledger Fabricと互換性のあるスマートコントラクト(SC)に自動的に変換します。
提案されたフレームワークには、ブロックチェーンに基づいたオープンソースのサードパーティのコラボレーションプラットフォームが含まれている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:58:40 GMT)
FastRM: An efficient and automatic explainability framework for multimodal generative models [10.2] FastRMは、LVLMモデルの説明可能な関連性マップを予測する効果的な方法である。
我々は、FastRMが関連マップ生成の計算時間を99.8%削減し、評価されたLVLMのメモリフットプリントを44.4%削減することを示した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:39:29 GMT)
Traversing the Subspace of Adversarial Patches [10.0] 本稿では, 対向パッチの集合の解析を行い, 3つの異なる次元削減手法の再構築能力について検討する。
以上の結果から, より洗練された次元減少法は, 単純な主成分分析に勝るものではないことが示唆された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:19:35 GMT)
GameGen-X: Interactive Open-world Game Video Generation [10.0] 我々は,オープンワールドゲームビデオの生成とインタラクティブ制御に特化して設計された,最初の拡散トランスフォーマーモデルであるGameGen-Xを紹介する。
革新的なキャラクター、動的環境、複雑なアクション、多様なイベントなど、一連のゲームエンジン機能をシミュレートする。
インタラクティブな制御性を提供し、現在のクリップに基づいたコンテンツの予測と将来的な変更を可能にし、ゲームプレイシミュレーションを可能にする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:54:23 GMT)
61A Bot Report: AI Assistants in CS1 Save Students Homework Time and Reduce Demands on Staff. (Now What?) [10.0] GPT-4をベースとした大規模CS1コースの学生向け対話型宿題アシスタント(61Aボット)
2000人以上の学生が2学期にわたってBotのリクエストを10万件以上作りました。
50歳から80歳までの学生の場合、1学期ごとに30分以上削減でき、前学期と同じパーセンタイル級の学生よりも50%少ない。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:51:34 GMT)
InvDesFlow: An AI search engine to explore possible high-temperature superconductors [9.9] InvDesFlowは、深層モデルの事前トレーニングと微調整技術、拡散モデル、物理ベースのアプローチを統合するAI検索エンジンである。
非常に小さなサンプルセットに基づいて,AIモデルにより予測される臨界温度がT_c geq$15Kと予測された74個の動的安定材料を得た。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:29:14 GMT)
Down with the Hierarchy: The 'H' in HNSW Stands for "Hubs" [9.9] ベクトル埋め込みの近似近傍探索(ANN)におけるアルゴリズム設計の性質について検討する。
平面グラフは高次元データセット上でのHNSWの利点をすべて保持している。
我々はさらに一歩進んで、HNSWの階層構造が高次元において何の利益も与えない理由について研究する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:04:06 GMT)
Unveiling Interpretability in Self-Supervised Speech Representations for Parkinson's Diagnosis [9.9] 本稿では,パーキンソン病の診断を支援するための新しい枠組みを提案する。
提案するフレームワークは, 単純かつ効果的なクロスアテンション機構の設計を通じて, 2つの異なる相補的視点から解釈可能性を提供する。
提案手法は最先端の手法と競合すると同時に,言語間シナリオにおける堅牢性も実証する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 22:23:43 GMT)
Two Tales of Single-Phase Contrastive Hebbian Learning [9.8] 完全局所学習アルゴリズムである「二重伝搬」は,性能ギャップをバックプロパゲーションに埋めることが可能であることを示す。
このアルゴリズムは、その数値安定性が、生物学的およびアナログ的な実装において制限的な対称ヌーディングに依存しているという欠点がある。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:33:58 GMT)
FedPAW: Federated Learning with Personalized Aggregation Weights for Urban Vehicle Speed Prediction [9.8] 既存の方法では、ドライバーのデータプライバシーを保護しながら、パーソナライズされた車両の速度予測を実現することはできない。
本稿では,これらの課題を克服するために,個人化集約度(FedPAW)を用いたフェデレート学習フレームワークを提案する。
FedPAWは10秒間の予測誤差が最も低く、テストMAEは0.8%減少している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:54:43 GMT)
CoMERA: Computing- and Memory-Efficient Training via Rank-Adaptive Tensor Optimization [9.8] LLMやDLRMといった大規模なAIモデルのトレーニングには、膨大なGPUと計算時間を要する。
CoMERAは、多目的最適化の定式化により、ランク適応テンソル圧縮(pre)訓練を実現する。
CoMERAは、トレーニングのエポック1回あたり2ドル、メモリ効率がGaLoreよりも高い9ドルだ。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:48:21 GMT)
Remote Staking with Optimal Economic Safety [9.7] 我々は、最適経済安全を保証された最初のリモートステイキングプロトコルを提示する。
この作業の主要なユースケースは、プロバイダチェーンがBitcoinである場合であり、PoSチェーンを保護するために1.7兆米ドル以上の資産を利用可能にしている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:39:50 GMT)
Graph Community Augmentation with GMM-based Modeling in Latent Space [9.5] グラフコミュニティ拡張(GCA)と呼ばれるアルゴリズムを提案する。
我々は,新しいコミュニティ構造を持つグラフ生成におけるGAAの有効性を,合成および実際のデータセット上で実証的に実証した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:05:10 GMT)
TTSDS -- Text-to-Speech Distribution Score [9.4] 最近発表されたText-to-Speech (TTS) システムは、実際の音声に近い音声を生成する。
本稿では,韻律,話者識別,知性といった複数の要因を組み合わせた合成音声の質を評価することを提案する。
2008年から2024年にかけて開発された35のTTSシステムをベンチマークし, 評価値の非重み付き平均値として計算した結果が人体評価と強く相関していることを示した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:45:42 GMT)
HumekaFL: Automated Detection of Neonatal Asphyxia Using Federated Learning [9.2] 出生時Apxia(BA)は出産時に新生児に酸素を供給できないという重篤な症状である。
過去20年間で新生児死亡率が低下してきたが、サハラ以南のアフリカでは、死亡率が5歳未満の水準で推移している。
我々は,BAの早期検出のためにFLパイプラインを組み込んだユーザフレンドリーで費用対効果の高いモバイルアプリケーションを開発した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:10:11 GMT)
PROFIT: A PROximal FIne Tuning Optimizer for Multi-Task Learning [9.1] ProFITは、新しいタスクやデータセット上で、段階的に微調整された収束モデルのために特別に設計された、最初のスポットライトの1つです。
PROFITは、様々なタスクで従来の微調整方法より優れています。
PROFITはロジックにカプセル化されており、最小限のエンジニアリング労力で任意のトレーニングパイプラインに容易に統合できる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:37:34 GMT)
Dense Dispersed Structured Light for Hyperspectral 3D Imaging of Dynamic Scenes [9.1] ハイパースペクトル3Dイメージングは、深度マップとハイパースペクトル画像の両方をキャプチャし、幾何学的および物質的分析を可能にする。
近年の手法ではスペクトルと深さの精度が高いが、数分で長い取得時間を要する場合や、高価な大型システムに依存する場合が多い。
ステレオRGBカメラと安価な回折格子膜を用いたダイナミックシーンの高精度ハイパースペクトル3次元イメージング法を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:30:18 GMT)
PKRD-CoT: A Unified Chain-of-thought Prompting for Multi-Modal Large Language Models in Autonomous Driving [9.0] 本研究では、PKRD-CoTというゼロショットチェーン・オブ・ソートプロンプト設計を提案し、MLLMの自律運転システムへのシームレスな統合について検討する。
我々の設計では、MLLMは事前の経験なく問題に対処できるため、非構造自律運転環境における有効性を高めることができる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 23:08:38 GMT)
VideoLights: Feature Refinement and Cross-Task Alignment Transformer for Joint Video Highlight Detection and Moment Retrieval [8.9] 大規模言語モデルと視覚言語モデル(LLM/LVLM)は、様々な領域で広く普及している。
ここでは、(i)Convolutional ProjectionとFeature Refinementモジュールを通してこれらの制限に対処する新しいHD/MRフレームワークであるVideoLightsを提案する。
QVHighlights、TVSum、Charades-STAベンチマークに関する総合的な実験は、最先端のパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:45:53 GMT)
Reliable and scalable variable importance estimation via warm-start and early stopping [8.9] 我々は,反復的なカーネル更新方程式として表現できる任意のアルゴリズムに対して,変数の重要度を推定するスケーラブルな手法を開発した。
ニューラルネットワークのカーネルベースの手法を早期に停止する理論を用いて理論的保証を行う。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:45:10 GMT)
Multimodal Fusion Learning with Dual Attention for Medical Imaging [8.7] マルチモーダル・フュージョン・ラーニングは皮膚癌や脳腫瘍など様々な疾患の分類において有望である。
既存のメソッドには3つの重要な制限がある。
DRIFAは、ディープニューラルネットワークと統合することができ、DRIFA-Netと呼ばれるマルチモーダル融合学習フレームワークを形成する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:11:12 GMT)
Importance Weighted Expectation-Maximization for Protein Sequence Design [8.7] そこで本研究では,IsEM-Proという,特定の適合基準に向けてタンパク質配列を生成する手法を提案する。
中心となるIsEM-Proは、独立に学習されたマルコフランダムフィールド(MRF)の構造特徴によって強化された潜在生成モデルである。
8つのタンパク質配列設計タスクの実験により、我々のIsEM-Proは、平均的なフィットネススコアで少なくとも55%以上のパフォーマンスで過去のベストメソッドよりも優れていたことが示される。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:36:44 GMT)
Learning Identifiable Factorized Causal Representations of Cellular Responses [8.7] 本稿では, 単一細胞摂動データにおける因果構造を明らかにするFCR学習法を提案する。
FCRは、切り離された複数の細胞表現を学習する。
我々は$mathbfz_tx$と$mathbfz_tx$と$mathbfz_tx$のブロック単位の識別可能性を証明する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:21:08 GMT)
Quantum Scheme for Private Set Intersection and Union Cardinality based on Quantum Homomorphic Encryption [8.7] 対応する量子回路を伴って、新しい量子プライベートセットの交叉とユニオンの基数プロトコルを提案する。
量子ホモモルフィック暗号に基づいて、このプロトコルは、ユーザのプライベートセットの交わりと結合の濃度を量子暗号化データで計算することを可能にする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 01:31:06 GMT)
DUSt3R: Geometric 3D Vision Made Easy [8.5] Dense and Unconstrained Stereo 3D Reconstruction of arbitrary image collections。
本定式化は単眼および両眼の再建症例を円滑に統一することを示す。
私たちの定式化はシーンの3Dモデルと深度情報を直接提供しますが、興味深いことに、シームレスに回復できます。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:00:56 GMT)
MPBD-LSTM: A Predictive Model for Colorectal Liver Metastases Using Time Series Multi-phase Contrast-Enhanced CT Scans [8.4] 我々は,大腸癌肝転移の予測方法を評価するため,最先端のディープラーニング技術を構築した。
実験の結果,MPBD-LSTMと呼ばれる3次元双方向LSTMに基づくマルチプレーンアーキテクチャが最適であることがわかった。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:02:11 GMT)
Cautious Optimizers: Improving Training with One Line of Code [8.4] 我々はAdamWをCautious、例えばC-AdamWに改名した。
我々の理論的な洞察によって、全く新しい結果の族が明らかになる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:00:52 GMT)
Learning Counterfactual Distributions via Kernel Nearest Neighbors [8.4] カーネルをベースとした近傍の分布一般化を導入し,その基礎となる分布を推定する。
2つ以上の測定値にアクセスできれば, 近接するアプローチがヘテロセシダスティックノイズに対して堅牢であることを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:18:46 GMT)
Practical Performative Policy Learning with Strategic Agents [8.4] 本研究では,政策学習の課題について検討し,エージェントが提案した方針に応えて特徴を調整し,その潜在的な結果を改善する。
本稿では,高次元分布マップの代用として,微分可能な分類器を用いた勾配型ポリシー最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:09:44 GMT)
Understanding Generalizability of Diffusion Models Requires Rethinking the Hidden Gaussian Structure [8.3] 学習したスコア関数の隠れた性質を調べた結果,拡散モデルの一般化可能性について検討した。
拡散モデルが記憶から一般化へと遷移するにつれて、対応する非線形拡散デノイザは線形性を増加させる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:00:18 GMT)
EmojiDiff: Advanced Facial Expression Control with High Identity Preservation in Portrait Generation [8.3] 既存の手法では、中性あるいは立体的な表現で肖像画を合成する傾向がある。
EmojiDiffは、微細な表現とアイデンティティの同時制御を容易にするエンドツーエンドのソリューションである。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:24:11 GMT)
Query Performance Explanation through Large Language Model for HTAP Systems [8.3] ハイブリッドトランザクションおよび分析処理システムでは、ユーザは、あるエンジンからのクエリプランが他のエンジンよりも遅い理由を理解するのに苦労することが多い。
本稿では,大規模言語モデル(LLM)を活用して,HTAPシステムにおけるクエリ性能を説明する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:55:07 GMT)
Unifying AMP Algorithms for Rotationally-Invariant Models [8.1] 本稿では、回転不変モデルのための近似メッセージパッシング(AMP)アルゴリズムを構築するための統一的なフレームワークを提案する。
一般的な反復型アルゴリズムテンプレートを使用し、それを長期記憶型オルソゴンAMP(OAMP)に還元することにより、AMPアルゴリズムの正しいオンサーガー項を体系的に導出する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:56:35 GMT)
Understanding LLM Embeddings for Regression [8.1] 本論文は埋め込み型回帰に関する最初の包括的な研究の1つを提供する。
LLMを機能として組み込むことは,従来の機能工学よりも高次元回帰作業に有効であることを示す。
私たちは異なるモデル効果、特にモデルのサイズと言語理解の貢献を定量化します。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:52:21 GMT)
A2VIS: Amodal-Aware Approach to Video Instance Segmentation [8.1] 本稿では,映像中のオブジェクトの包括的理解を実現するために,アモーダル表現を取り入れた新しいフレームワーク,A2VISを提案する。
A2VIS(Amodal-Aware Video Instance)は、ビデオ内のオブジェクトの可視部分と隠蔽部分の両方について、信頼性の高い包括的な理解を実現するために、アモーダル表現を取り入れている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:44:29 GMT)
Using Reinforcement Learning to Guide Graph State Generation for Photonic Quantum Computers [8.1] フォトニック量子コンピュータ(英: Photonic quantum computer, PQC)は、量子コンピューティングのパラダイムである。
PQCのグラフ状態は、量子エミッタによって決定的に生成される。
最適な生成シーケンスを識別する新しいコンパイルフレームワーク RLGS を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 01:43:46 GMT)
Optimal Strategies for Winning Certain Coset-Guessing Quantum Games [8.0] 最近発表されたコセット推測ゲームでは、アリスがボブとチャーリーと対戦し、共同勝利を狙った。
ボブとチャーリーの予想が同時に正しい確率は、m が増加するにつれて指数関数的にゼロとなることを示す。
CNOT と Hadamard ゲートのみを用いた符号化回路を考案した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:41:46 GMT)
A Block Coordinate Descent Method for Nonsmooth Composite Optimization under Orthogonality Constraints [7.9] textbfOBCDは標準臨界点よりも高い最適性を示すことを示す。
また,textbfOBCDの非エルグ収束率を示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 00:54:47 GMT)
Efficient Compression of Sparse Accelerator Data Using Implicit Neural Representations and Importance Sampling [7.8] 核物理学と高エネルギー物理学における大規模粒子衝突は、異常な速度でデータを生成する。
データ学習と圧縮のための暗黙的ニューラル表現を用いた新しい手法を提案する。
また,ネットワークトレーニングプロセスの高速化のための重要サンプリング手法も導入する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:50:49 GMT)
6DOPE-GS: Online 6D Object Pose Estimation using Gaussian Splatting [7.7] 1台のRGB-Dカメラで6Dオブジェクトのポーズを推定・追跡する新しい手法である6DOPE-GSを提案する。
その結果,6DOPE-GSはモデルレス同時ポーズトラッキングと再構築のための最先端ベースラインの性能と一致していることがわかった。
また,実世界の環境下での動的物体追跡と再構成のための手法の適合性を実証した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:32:19 GMT)
Recurrences reveal shared causal drivers of complex time series [7.6] 本研究は,複数時系列にまたがる同時繰り返し現象により,共有された未観測駆動信号の構造が明らかになることを示す。
本稿では,ガラスのような構造を持つ反復グラフを反復的に構築することにより,因果ドライバーを再構成する物理に基づく教師なし学習アルゴリズムを提案する。
本手法は, 生態学, ゲノム学, 流体力学, 生理学にまたがる多様な実験データセットから因果的ドライバを抽出する能力を示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:07:42 GMT)
The Evolution and Future Perspectives of Artificial Intelligence Generated Content [7.6] レビューでは、AIGCの進化が4つの発展的なマイルストーンを辿っている。
本研究は,AIGCモデルの選択と最適化における研究者や実践者の指導を目的とする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:16:40 GMT)
TextSSR: Diffusion-based Data Synthesis for Scene Text Recognition [7.6] TextSSRは、シーンテキスト認識データを合成するための新しいフレームワークである。
指定された画像領域内でテキストを生成することに集中することで精度を確保する。
我々は、複雑さと現実性を備えた0.4百万のテキストインスタンスを持つアナグラムベースのTextSSR-Fデータセットを構築した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:26:25 GMT)
AVS-Net: Audio-Visual Scale Net for Self-supervised Monocular Metric Depth Estimation [7.5] 単眼ビデオからのメトリクス深度予測は、データセット間の悪い一般化に苦しむ。
多視点再構成を用いた自己教師付きトレーニングは、大規模な自然ビデオの恩恵を受けることができるが、適切なスケールを提供しない。
我々は,いくつかの最先端手法の予測を改善する方法と,自己監督深度手法のスケール補正方法を示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:48:25 GMT)
HybridMQA: Exploring Geometry-Texture Interactions for Colored Mesh Quality Assessment [7.5] メッシュ品質評価(MQA)モデルは、メッシュ運用システムの設計、最適化、評価において重要な役割を果たす。
モデルベースおよびプロジェクションベースのアプローチを統合するハイブリッドフル参照色付きMQAフレームワークであるHybridMQAを紹介する。
提案手法はグラフ学習を用いて詳細な3次元表現を抽出し,新しい特徴レンダリングプロセスを用いて2次元に投影する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:35:33 GMT)
TACO: Training-free Sound Prompted Segmentation via Deep Audio-visual CO-factorization [7.4] 音声信号で聴く物体に対応する画像領域をセグメント化することを目的として,音声プロンプテッド・セグメンテーションの特定の課題に取り組む。
既存のアプローチの多くは、事前訓練されたモデルを微調整したり、タスク専用の追加モジュールをトレーニングすることでこの問題に対処している。
我々は、非負行列因子化(NMF)を利用した学習自由アプローチを採用し、事前学習されたモデルから音声と視覚の特徴を共ファクタし、共通の解釈可能な概念を明らかにする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:39:49 GMT)
A Novel Generative Multi-Task Representation Learning Approach for Predicting Postoperative Complications in Cardiac Surgery Patients [7.4] 機械学習は、術後合併症に対する患者のリスクを特定し、予測するために利用することができる。
新規な手術用変分オートエンコーダを用いて術後合併症の予測と評価を行った。
surgVAEは、クロスタスクとクロスコホートプレゼンテーション学習を通じて固有のパターンを明らかにする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:24:02 GMT)
RO-SVD: A Reconfigurable Hardware Copyright Protection Framework for AIGC Applications [7.4] AIコンテンツのためのブロックチェーンベースの著作権トレーサビリティフレームワークを提案する。
我々のフレームワークは、既存のAIアクセラレーションデバイスで簡単に構築できる。
これは、AI生成コンテンツに特化した著作権トレーサビリティを議論し、実装する最初の実用的なハードウェア研究である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:20:23 GMT)
GaMeS: Mesh-Based Adapting and Modification of Gaussian Splatting [7.1] メッシュと同じようにガウス成分を修正可能なガウスメッシュスプラッティング(GaMeS)モデルを導入する。
また、メッシュ上の位置のみに基づいてガウススプレートを定義し、アニメーション中の位置、スケール、回転を自動的に調整する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:55:44 GMT)
A Semantic Communication System for Real-time 3D Reconstruction Tasks [7.1] 本稿では,限られたモバイル機器を用いたリアルタイムなセマンティックマッピングタスクを実現する手法を提案する。
具体的には,リアルタイム・セマンティック・マッピングタスクのためのエンコーディング・デコード・セマンティック・コミュニケーション・フレームワークを設計する。
シミュレーション実験では、TUMデータセットに基づいて、システムが0.1%未満の誤差を持つことを確認した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:50:05 GMT)
Machine Learning Analysis of Anomalous Diffusion [7.1] 異常拡散解析のための機械学習技術の統合を体系的に紹介する。
拡散パラメータと軌道分割の推論に使用される古典的機械学習とディープラーニングの両方を含む機械学習手法を広範囲に比較する。
一方,ニューラルネットワークの垂直層からの特徴ベクトルとオートエンコーダからの潜在表現の組合せを含む,異常拡散を表現するための3つの主要な戦略を概説する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:27:26 GMT)
Synergies Between Federated Learning and O-RAN: Towards an Elastic Architecture for Multiple Distributed Machine Learning Services [7.1] 5G以上の無線ネットワーク上でのフェデレートラーニング(FL)は、一般的な分散機械学習(ML)技術である。
5G以上の無線ネットワークの実装は、(i)無線ネットワーク条件のダイナミクスと(ii)システム内の複数のFLサービスの共存によって引き起こされる重要な課題に直面している。
まず、これらの課題を詳しく調べ、リソースの過剰/アンダープロビジョンと視点駆動のロードバランシングという、微妙な現象を明らかにします。
次に、弾性FL(Elastic FL)と呼ばれる新しい分散MLアーキテクチャを提案することにより、これらの現象に対処する第一歩を踏み出す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:10:41 GMT)
Forward and Inverse Simulation of Pseudo-Two-Dimensional Model of Lithium-Ion Batteries Using Neural Networks [7.1] 擬二次元(P2D)モデルの前方及び逆シミュレーションにおいて,バトラー・ボルマー方程式の高非線形性によって生じる課題に対処する。
提案手法は,BV方程式を含む前方問題と逆問題の両方を解くのに有効である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 02:50:46 GMT)
Spatial Conformal Inference through Localized Quantile Regression [7.0] 等角予測はパラメトリックな仮定に頼ることなく有効な予測間隔を提供する。
本研究では,空間データに特化して設計された共形予測法である局所空間整形予測(L SCP)を提案する。
L SCP は既存の手法に比べて非常に厳密で一貫した予測間隔で正確なカバレッジを実現する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:15:06 GMT)
Bio-Inspired Adaptive Neurons for Dynamic Weighting in Artificial Neural Networks [6.9] 従来のニューラルネットワークは、推論中に一定の重みを使い、入力条件の変化に適応する能力を制限する。
本稿では,ニューロン重みを入力信号の関数としてモデル化する,適応型ニューラルネットワークのための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:45:30 GMT)
CantorNet: A Sandbox for Testing Geometrical and Topological Complexity Measures [6.8] カントール集合の3進構成にインスパイアされたemphCantorNetを導入する。
CantorNetはReLUニューラルネットワークのファミリーであり、コルモゴロフ複雑性の可能な全スペクトルにまたがる。
我々の研究は、幾何学的に無知なデータ拡張技術と敵攻撃の潜在的な落とし穴を示すのに役立つかもしれない。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:53:59 GMT)
LoyalDiffusion: A Diffusion Model Guarding Against Data Replication [6.8] 拡散モデルは、特にトレーニングデータが機密情報を含む場合、トレーニングデータを複製することができる。
画像品質に欠かせない接続に情報転送ブロックを組み込んだ複製対応U-Netアーキテクチャを提案する。
実験により、LoyalDiffusionは、画像の品質を維持しながら48.63%の複製を減少させる、最先端の複製緩和法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:41:30 GMT)
Deepfake for the Good: Generating Avatars through Face-Swapping with Implicit Deepfake Generation [6.7] 本稿では,新しい深層学習技術を組み合わせて,高機能な3D深層学習アバターの製作方法について述べる。
私たちのImplicitDeepfakeは、古典的なディープフェイクアルゴリズムを使って、すべてのトレーニングイメージを別々に修正し、修正された顔にNeRFとGSをトレーニングします。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:04:25 GMT)
Diffusion models learn distributions generated by complex Langevin dynamics [6.6] 生成AIのクラスである拡散モデルは、データから分布を学習することができる。
このコントリビューションでは、複雑なランゲヴィン過程によって生成された分布を学習する拡散モデルについて検討する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:07:14 GMT)
Fermionic tensor network contraction for arbitrary geometries [6.5] 本稿では,大域的順序と局所的順序の両方の定式化の中で,任意の格子上のフェルミオンテンソルネットワークの縮約の実装について述べる。
本稿では3次元ダイヤモンド格子上に定義された有限ハバードモデルのフェルミオン射影対状態シミュレーションについて述べる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:57:54 GMT)
SITReg: Multi-resolution architecture for symmetric, inverse consistent, and topology preserving image registration [6.4] マルチレゾリューション特徴表現の抽出に基づく新しいディープラーニング登録アーキテクチャを提案する。
提案手法は,3つのデータセットに対して,最先端の登録精度を実現する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:37:24 GMT)
When Fine-Tuning LLMs Meets Data Privacy: An Empirical Study of Federated Learning in LLM-Based Program Repair [6.3] 大規模言語モデル(LLM)は、ソフトウェア開発とメンテナンスプラクティスの強化において、顕著な可能性を示している。
本稿では,プライバシ保護手法としてのフェデレーション学習の活用について検討する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:18:47 GMT)
Identifying Reliable Predictions in Detection Transformers [6.2] 実際には、DETRは画像に存在するオブジェクトの実際の数よりはるかに多い数百の予測を生成する。
同一画像内の異なる予測が、どのように異なる役割を担い、その結果、これらの予測の信頼性レベルが変化するかを示す。
我々は、異なるモデルと特定のモデル内の様々な構成の両方でキャリブレーション品質を評価することができるオブジェクトレベルエラー(OCE)を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:34:17 GMT)
BroadTrack: Broadcast Camera Tracking for Soccer [6.0] カメラキャリブレーションとローカライゼーションはサッカー放送における多くの応用を可能にする。
本稿では,サッカー中継カメラのタスクを効率的に,頑健かつ正確に追跡できるシステムを提案する。
我々の追跡システムであるBroadTrackは、平均再投射誤差率を半減し、サッカーネットデータセットのカメラキャリブレーションのジャカード指標の15%以上を得る。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:10:52 GMT)
How the use of feature selection methods influences the efficiency and accuracy of complex network simulations [5.9] 複雑なネットワークシステムのモデルは、シミュレーションとリンク予測を用いて現実世界のネットワークをエミュレートするように設計されている。
本研究では,教師なしフィルタリング技術を利用して実世界のノードの特徴をランク付けする特徴選択手法を提案する。
提案手法は,実世界のネットワークのシミュレーション10点中8点を改良したFS-SNSである。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:12:53 GMT)
Representation and Regression Problems in Neural Networks: Relaxation, Generalization, and Numerics [5.9] 浅層ニューラルネットワーク(NN)の訓練に伴う3つの非次元最適化問題に対処する。
我々はこれらの問題と表現を凸化し、不在緩和ギャップを証明するために代表者勾配を適用した。
我々はこれらの境界に対する鍵パラメータの影響を分析し、最適な選択を提案する。
高次元データセットに対して,勾配降下と組み合わせて効率的な解を求めるスペーシフィケーションアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:40:29 GMT)
Physics-informed Gaussian Processes as Linear Model Predictive Controller [5.9] 追従問題における線形時間不変系を制御する新しいアルゴリズムを提案する。
コントローラはガウス過程(GP)に基づいており、その実現は定数係数を持つ線形常微分方程式の系を満たす。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:37:37 GMT)
Addressing general measurements in quantum Monte Carlo [5.9] 本稿では,一般測定の課題に対処するための普遍的なスキームを提案する。
重み付け経路は物理パラメータに限らず、空間や(想像上の)時間でも機能する。
我々の研究は、量子モンテカルロシミュレーションにおいて複雑な対角線作用素を捕捉する簡単かつ効率的な方法である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:12:19 GMT)
Query-Guided Self-Supervised Summarization of Nursing Notes [5.8] 本稿では,QGSummについて紹介する。QGSummは,抽象看護ノート要約のためのクエリ誘導型自己教師型ドメイン適応手法である。
本研究は,看護ノート要約のためのアプローチや他の最先端の大規模言語モデル (LLM) について検討する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:42:24 GMT)
Free-Mask: A Novel Paradigm of Integration Between the Segmentation Diffusion Model and Image Editing to Improve Segmentation Ability [5.8] セグメンテーションのための拡散モデルと高度な画像編集機能を組み合わせたフレームワーク textbfFree-Mask を提案する。
その結果、textbfFree-Mask は VOC 2012 ベンチマークで未確認のクラスに対して、新しい最先端の結果を達成していることがわかった。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:42:09 GMT)
RILQ: Rank-Insensitive LoRA-based Quantization Error Compensation for Boosting 2-bit Large Language Model Accuracy [5.8] 低ランク適応(LoRA)がパラメータ効率のLLM微調整の主流となっている。
LoRAベースの量子化誤差補償(LQEC)は圧縮LDMの精度を回復するための強力なツールである。
RILQ(Rank-Insensitive LoRA-based Quantization Error Compensation)を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:09:56 GMT)
Can We Afford The Perfect Prompt? Balancing Cost and Accuracy with the Economical Prompting Index [5.7] 本稿では,正確度スコアとトークン消費を組み合わせた新しい指標であるEconomical Prompting Index(EPI)を紹介する。
本研究は, 思考の連鎖, 自己整合性, 思考の木の6つの先進的促進技術について検討した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:34:18 GMT)
Nonlinear functions of quantum states [5.6] 我々は、ユニタリとパラメタライズド量子回路の線形結合によりSWAPテストを拡張することにより、量子状態関数(QSF)フレームワークを導入する。
我々は基本課題の量子アルゴリズムを開発し、フォン・ノイマンエントロピー推定と量子状態忠実度計算の両方に対して$tildemathcalO (1/(varepsilon2kappa)$のサンプル複雑性を達成する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:40:17 GMT)
GlocalCLIP: Object-agnostic Global-Local Prompt Learning for Zero-shot Anomaly Detection [5.5] グローバルプロンプトとローカルプロンプトの相補的学習を改善するために,局所的コントラスト学習を導入する。
ZSADにおけるGlocalCLIPの一般化性能を実世界の15のデータセットで実証した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 02:24:08 GMT)
PassionNet: An Innovative Framework for Duplicate and Conflicting Requirements Identification [5.5] 重複と矛盾する要件の早期検出と解決は、プロジェクトの効率性と全体的なソフトウェア品質を大幅に向上させる。
研究者は、重複や矛盾する要求を検出するために人工知能(AI)の可能性を活用することで、様々な計算予測器を開発した。
この研究は、3種類の予測パイプラインの開発を容易にする包括的なフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:05:38 GMT)
NYT-Connections: A Deceptively Simple Text Classification Task that Stumps System-1 Thinkers [5.4] 我々はNew York Times Connectionsゲームから派生した358の簡単な単語分類パズルのコレクションであるNYT-Connectionsを紹介する。
このベンチマークは、素早い直感的な"システム1"思考をペナルティ化し、基本的な推論スキルを分離するように設計されている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:41:47 GMT)
Enriching Ontologies with Disjointness Axioms using Large Language Models [5.4] 大型モデル(LLM)は、クラス不整合公理を識別し、主張することで一貫性を提供する。
本研究の目的は,LLMに埋め込まれた暗黙の知識を活用して,存在論的不一致を分類することである。
以上の結果から, LLMは効果的なプロンプト戦略によって導かれることにより, 不整合性関係を確実に識別できることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:21:36 GMT)
Semantic Scene Completion with Multi-Feature Data Balancing Network [5.3] RGBおよび深度データ(F-TSDF)入力のためのデュアルヘッドモデルを提案する。
プリアクティベーション残余モジュールにおけるアイデンティティ変換を伴うハイブリッドエンコーダデコーダアーキテクチャは、F-TSDF内の多様な信号を効果的に管理する。
我々は,RGB特徴融合戦略を評価し,2次元RGB特徴量と重み付きクロスエントロピーを併用して3次元SSC予測を行う。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:12:21 GMT)
ConvMixFormer- A Resource-efficient Convolution Mixer for Transformer-based Dynamic Hand Gesture Recognition [5.3] 動的ハンドジェスチャのための新しいConvMixFormerアーキテクチャを探索し,考案する。
提案手法は,NVidia Dynamic Hand Gesture と Briareo のデータセットを用いて評価する。
我々のモデルは、単一およびマルチモーダル入力に対して最先端の結果を得た。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:11:07 GMT)
Simplified derivations for high-dimensional convex learning problems [5.3] 本研究では,高次元学習問題を解析するための空洞的手法を提案する。
これらの問題は共通の構造を共有し、統一的な分析を可能にする。
パーセプトロン・キャパシティ問題に対しては、Na" 法による正しいキャパシティの導出を可能にする対称性を同定する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:32:14 GMT)
Making Differential Privacy Easier to Use for Data Controllers using a Privacy Risk Indicator [5.3] 差分プライバシー(DP)は個人データ分析を可能にするが、実際は利用が困難である。
典型的なDPデプロイメントでは、データコントローラは個人の機密データを管理し、データアナリストのクエリに応答する責任を持つ。
それらはプライバシ損失予算である$epsilon$を選択し、クエリ出力にどの程度のノイズを加えるかを制御する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 22:14:44 GMT)
Discovering group dynamics in coordinated time series via hierarchical recurrent switching-state models [5.3] システムレベルと個別レベルのダイナミクスを学習するために、教師なしの方法でトレーニングできる新しいスイッチング状態モデルを提案する。
我々は、遅延系レベルの離散状態マルコフ連鎖を用いて、遅延系レベルの連鎖にトップダウンの影響を与え、各観測時系列の放出を制御している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:35:07 GMT)
Transfer Learning for Control Systems via Neural Simulation Relations [5.2] 本稿では、ソース制御システムからターゲット制御システムへ制御ロジックを効果的に転送することに焦点を当てる。
我々は、2つのシステムの挙動間の観測的等価性を特徴付けるために(近似的な)シミュレーション関係を用いる。
また, 条件が満たされれば, 対応する制御器を備えた2つのシステムの出力のクローズネスが保証される, 妥当性条件も導入する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:34:35 GMT)
An Architectural Approach to Enhance Deep Long-Tailed Learning [5.2] 我々はLong-Tailed Differential Architecture Search (LTDAS)を紹介する。
長いデータに対して優れたパフォーマンスを示すアーキテクチャコンポーネントを探索するために、広範な実験を行います。
これにより、検索プロセスを通じて得られたアーキテクチャが優れたコンポーネントを組み込むことが保証される。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:49:05 GMT)
Order-six CHMs containing exactly three distinct elements [5.2] 複素アダマール行列(CHM)は、異なる行列要素の数と密接に関連している。
ここでは,3つの異なる元素を含むCHMについて検討する。
我々の結果は、第1行の要素がすべて 1 である 6 時間 6$ CHM のより完全な分類に繋がるかもしれない。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:58:35 GMT)
Multi-Facet Blending for Faceted Query-by-Example Retrieval [5.2] 本稿では,多面体ブレンディング(FaBle)拡張法を提案する。
モジュール化によって、事前に定義されたファセットの知識やラベルが不要になります。
1K文書上のFaBle拡張は、ファセット条件埋め込みの訓練を著しく支援する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:32:19 GMT)
Adversarial Sample-Based Approach for Tighter Privacy Auditing in Final Model-Only Scenarios [5.1] 追加の仮定を伴わずにより厳密な経験的下限を実現する新しい監査手法を提案する。
提案手法は従来のカナリア方式の逆数を超え,ホワイトボックスとブラックボックスの両方のシナリオで有効である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:52:16 GMT)
BricksRL: A Platform for Democratizing Robotics and Reinforcement Learning Research and Education with LEGO [5.1] 我々は、強化学習研究と教育のためのロボットへのアクセスを民主化するためのプラットフォームであるBricksRLを紹介する。
BricksRLは、強化学習エージェントのためのTorchRLライブラリと対話することで、現実世界でのカスタムLEGOロボットの作成、設計、訓練を容易にする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:49:23 GMT)
ForecastBench: A Dynamic Benchmark of AI Forecasting Capabilities [5.0] ForecastBenchは、機械学習システムの精度を評価するためのベンチマークである。
ForecastBenchは、提出時に既知の回答がない将来のイベントに関する質問のみで構成されている。
私たちはwww.forecastbench.orgの公開リーダーボードにシステムと人間のスコアを表示します。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:27:16 GMT)
PainterNet: Adaptive Image Inpainting with Actual-Token Attention and Diverse Mask Control [5.0] PainterNetは様々な拡散モデルに柔軟に埋め込まれるプラグインである。
本稿では,局所的なプロンプト入力,注意制御点(ACP),実際の注意注意損失(ATAL)を提案する。
大規模な実験分析の結果,PaterNetは画像品質やグローバル/ローカルテキスト整合性といった重要な指標において,既存の最先端モデルを上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:40:47 GMT)
Best Practices for Large Language Models in Radiology [5.0] 様々な活動の鍵は、言語へのニュアンスな適用である。
大型言語モデル(LLM)の出現は、放射線学における膨大なデータの管理と解釈を改善する機会を提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:54:55 GMT)
Simulation-based inference with scattering representations: scattering is all you need [5.0] 画像を用いたシミュレーションに基づく推論において,さらなる圧縮を伴わない散乱表現の有効利用を実証する。
空間平均化とより表現力のある密度推定器を組み合わせることでこれを克服する。
予想通り、散乱のみが従来の2次要約統計よりも多くの情報を引き出すことを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:09:05 GMT)
Salient Information Prompting to Steer Content in Prompt-based Abstractive Summarization [4.9] 大規模言語モデル (LLMs) は、プロンプト技術を用いて、ドメイン間の流動的な要約を生成することができる。
キーフレーズをプロンプトに追加することで、ROUGE F1とリコールが改善されることを示す。
本稿では,有意なキーフレーズを抽出する軽量モデルであるKeyphrase Signal Extractor (SigExt)を紹介する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:06:29 GMT)
Latent Diffusion for Neural Spiking Data [4.9] 本稿では,低次元潜時空間を持つ拡散型生成モデルであるLDNSについて述べる。
これらの推論された潜伏剤を用いて、表現的拡散モデル(条件付き拡散モデル)を訓練し、現実的な単一ニューロンと集団スパイキング統計を用いた神経活動のサンプル化を可能にした。
本研究では, 潜伏状態に依存しない単一ニューロンのダイナミクスを考慮した表現型観測モデルを用いて, LDNSの装備方法を示し, 生成したサンプルのリアリズムをさらに高めている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:16:03 GMT)
Transversal Logical Clifford gates on rotated surface codes with reconfigurable neutral atom arrays [4.8] 回転曲面符号に論理的HとSゲートを実装するためのハードウェア効率の良いスキームを提案する。
我々のプロトコルは、回転曲面符号に設定された論理的クリフォードゲートを完了し、中性原子配列プラットフォーム上での効率的な実装を認める。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:24:46 GMT)
Universal microscopic descriptions for statistics of particles and extended excitations [4.8] 任意の次元の格子におけるアベリア粒子の一般化統計と励起の普遍的研究法を提案する。
本手法は粒子とループのブレイディングと融合に関する統計を統一し, 膜励起に関する新しい統計の発見につながる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:00:00 GMT)
Hierarchical Text Classification (HTC) vs. eXtreme Multilabel Classification (XML): Two Sides of the Same Medal [4.8] 階層的テキスト分類(HTC)は、セマンティックなラベル階層を伴う数百のエントリからなる小さなラベルプールを持つデータセットに焦点を当てている。
eXtreme Multi-Label Text Classification (XML)は、最大数百万のエントリを持つ非常に大きなラベルプールを、ラベルが特定の方法で配列されていないとみなしている。
ここでは、あるドメインの最先端モデルが、他のドメインのデータセット上でトレーニングおよびテストを行う際に、どのように機能するかを検討する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:07:09 GMT)
Exploring Long-Term Prediction of Type 2 Diabetes Microvascular Complications [4.7] 2型糖尿病患者の微小血管合併症の予測には,コードに依存しないアプローチを用いる。
本手法は,臨床言語モデルを用いて,個々のEHRをテキストとして符号化する。
コードに依存しないアプローチがコードベースモデルより優れていることを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:54:51 GMT)
Real-Time Multilingual Sign Language Processing [4.6] 手話処理(SLP)は、自然言語処理(NLP)とコンピュータビジョンからなる学際分野である。
伝統的なアプローチは、言語固有のものであり、手話の多次元的な性質を捉えるのに不十分なグロスベースのシステムを使用することによって、しばしば制約されてきた。
本稿では,手話文字起こし表記システムであるSignWiringを,手話の視覚・ジェスチャーのモダリティとテキストに基づく言語表現の中間的リンクとして用いることを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:51:41 GMT)
From ChebNet to ChebGibbsNet [4.6] スペクトルグラフ畳み込みネットワーク(SpecGCN)の可能性の解析
我々は、ChebNetが、GPR-GNNやBernNetのような他の先進的なSpecGCNよりも、均質グラフと異質グラフの両方において優れていることを示す。
我々の実験は、ChebGibbsNetが、GPR-GNNやBernNetのような他の先進的なSpecGCNよりも、均質グラフと不均一グラフの両方において優れていることを示している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:37:45 GMT)
Usage Governance Advisor: from Intent to AI Governance [4.5] AIシステムの安全性を評価することは、それらをデプロイする組織にとって、厳しい関心事である。
本稿では,半構造化ガバナンス情報を作成するユーザガバナンスアドバイザを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:36:41 GMT)
Explainable fault and severity classification for rolling element bearings using Kolmogorov-Arnold networks [4.5] ベアリング故障は機械の故障の主な原因である。
本研究では,これらの課題に対処するためにKolmogorov-Arnold Networksを用いた。
説明可能な結果を提供する軽量モデルを生成する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:40:03 GMT)
PLD+: Accelerating LLM inference by leveraging Language Model Artifacts [4.4] LLMの推論過程を高速化するために開発された,新しいアルゴリズム群であるPLD+を提案する。
我々は5つの入力誘導タスクにアプローチを試行し、広範な実験により、PLD+はチューニング不要なアプローチよりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:36:27 GMT)
Universal Spreading Dynamics in Quasiperiodic Non-Hermitian Systems [4.4] 非エルミティアン系は、非ハーミティニティと障害の複雑な相互作用のため、独特のタイプの波動伝播を示す。
準周期性障害を伴う古ヘルミタン・オーブリー・アンドルーモデルの拡散ダイナミクスについて検討する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:13:43 GMT)
ProtFAD: Introducing function-aware domains as implicit modality towards protein function prediction [4.3] 本稿では,タンパク質の異なる機能を識別するために,機能認識ドメイン表現とドメイン結合型学習戦略を提案する。
提案手法は, 様々なベンチマークにおいて, 最先端の手法よりも大きく, 包括的に優れている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:42:34 GMT)
QFNN-FFD: Quantum Federated Neural Network for Financial Fraud Detection [4.2] 本研究ではQFNN-FFD(Quantum Federated Neural Network for Financial Fraud Detection)を提案する。
QFNN-FFDは、金融詐欺検出のために、量子機械学習(QML)とFederated Learning(FL)との量子コンピューティングを統合するフレームワークである。
量子技術の計算能力とFLが提供する堅牢なデータプライバシ保護を利用することで、QFNN-FFDは不正取引を識別するためのセキュアで効率的な方法として現れる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:36:05 GMT)
Reliable Generation of Privacy-preserving Synthetic Electronic Health Record Time Series via Diffusion Models [4.2] 電子健康記録(Electronic Health Records, EHRs)は、患者レベルの豊富なデータソースであり、医療データ分析に有用なリソースを提供する。
しかしながら、プライバシー上の懸念はしばしばEHRへのアクセスを制限し、下流の分析を妨げる。
本研究では,現実的かつプライバシに保護された合成ERH時系列を効率的に生成することで,これらの課題を克服することを目的とする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:46:33 GMT)
CLASSLA-Express: a Train of CLARIN.SI Workshops on Language Resources and Tools with Easily Expanding Route [4.2] CLASSLA-Expressワークショップの最初のイテレーションは、5カ国6つのワークショップを含む。
その目的は、最近リリースされたCLASSLA-webコーパスと同様に、コーパスクエリツールの使用に関する知識を共有することである。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:15:10 GMT)
From Text to Insight: Large Language Models for Materials Science Data Extraction [4.1] 科学知識の大部分は、構造化されていない自然言語に存在する。
構造化データは革新的で体系的な材料設計に不可欠である。
大きな言語モデル(LLM)の出現は、大きな変化を示している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:42:53 GMT)
ECG-SleepNet: Deep Learning-Based Comprehensive Sleep Stage Classification Using ECG Signals [4.1] 本研究は,心電図信号を用いた睡眠段階分類のための新しい3段階アプローチを提案する。
第1フェーズでは、FIN(Feature Imitating Networks)を用いて重要な特徴を推定し、より高精度で高速な収束を実現する。
第2段階は、心電図信号の時間周波数表現によるN1睡眠段階の同定に焦点を当てている。
第3段階は以前の段階からモデルを統合し、KAN(Kolmogorov-Arnold Network)を使用して5つの異なる睡眠ステージを分類する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:31:25 GMT)
Graph structure of quantum mechanics [3.9] 量子力学は1960年代に隠れ変数を認めないことが証明されており、これは量子系が文脈的であることを意味する。
局所的な一貫性と排他性を持つ文脈性理論を特徴付ける部分ブール代数のアプローチを開発する。
我々の結論は、量子力学が複数の隠れ変数理論のグラフ構造の組み合わせであることを示し、量子テクスチュアリティの正確な数学的枠組みを提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:57:47 GMT)
Training Stiff Neural Ordinary Differential Equations with Explicit Exponential Integration Methods [3.9] 剛常微分方程式(ODE)は多くの科学や工学の分野で一般的である。
標準的なニューラルODEアプローチは、厳密なシステムを正確に学習するのに苦労する。
本稿では、明示的な指数積分法を探求することによって、これまでの研究を拡大する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:40:08 GMT)
High-Throughput Detection of Risk Factors to Sudden Cardiac Arrest in Youth Athletes: A Smartwatch-Based Screening Platform [3.9] 突然の心臓発作は、世界中のあらゆる年齢のアスリートの死因となっている。
現在の心臓危険因子のスクリーニング方法は、ほとんど効果がない。
国際オリンピック委員会による12リードのECGスクリーニングの勧告の実施は、違法に高価である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:35:12 GMT)
AERO: Softmax-Only LLMs for Efficient Private Inference [3.8] 本稿では,変換器を用いたデコーダのみの言語モデルにおける非線形性の役割を理解するための包括的解析を行う。
AEROは,既存のLLMアーキテクチャを改良した4段階アーキテクチャ最適化フレームワークである。
まず,効率のよい PI に適したFLOP が大幅に少ないSoftmax のみのアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:42:36 GMT)
Moral Alignment for LLM Agents [3.7] 本稿では,基礎エージェントモデルの微調整による強化学習のためのコアヒューマン値を明示的に符号化する報酬関数の設計を紹介する。
我々は,Deontological EthicsとUtilitarianismの伝統的な哲学的枠組みを用いて,我々のアプローチを評価する。
我々は、エージェントが以前開発された自己中心的な戦略を解き放つことを可能にするために、いかに道徳的な微調整を展開できるかを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:25:30 GMT)
Kernel-Based Optimal Control: An Infinitesimal Generator Approach [3.7] 無限次元再生ヒルベルト核空間内での無限小生成学習を用いた非線形システムの最適制御手法を提案する。
我々の学習フレームワークは、システム力学とステージコスト関数のデータサンプルを利用しており、制御のペナルティと制約しか提供されていない。
このアプローチが現代的な凸作用素-理論的ハミルトン・ヤコビ・ベルマン再帰とシームレスに統合されることを示し、最適制御問題に対するデータ駆動解を可能にする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:08:55 GMT)
CREW: Facilitating Human-AI Teaming Research [3.7] 我々は,リアルタイム意思決定シナリオにおける人間-AIコラボレーション研究を支援するプラットフォームCREWを紹介する。
これには、認知研究のための事前構築されたタスクや、モジュール設計から拡張可能なポテンシャルを備えたヒューマンAIコラボレーションが含まれます。
CREWは、最先端のアルゴリズムとよく訓練されたベースラインを使用して、リアルタイムの人間誘導型強化学習エージェントをベンチマークする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:37:01 GMT)
Strongly-polynomial time and validation analysis of policy gradient methods [3.7] 本稿では,有限状態および行動マルコフ決定過程(MDP)と強化学習(RL)のための,優位ギャップ関数と呼ばれる新しい終了基準を提案する。
この利点ギャップ関数をステップサイズルールの設計に組み込むことで、最適ポリシーの定常状態分布に依存しない新しい線形収束率を導出する。
政策勾配法に対してそのような強い収束特性が確立されたのはこれが初めてである。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:15:47 GMT)
Learning Elementary Cellular Automata with Transformers [3.7] 本研究では,トランスフォーマーが基本セルオートマタを規定するルールを抽象化し,一般化することができることを示す。
我々の分析は、将来の状態や規則予測をトレーニング損失に含めることで、モデルがルールの内部表現を形成する能力を高めることを明らかにした。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:57:49 GMT)
Neural Network-Based Frequency Optimization for Superconducting Quantum Chips [3.7] 超伝導量子チップのためのニューラルネットワークに基づく周波数構成手法を提案する。
トレーニングされたニューラルネットワークモデルは、周波数設定エラーを推定し、中間最適化戦略は、チップのローカライズされた領域内の最適な構成を特定する。
また、変動量子固有解法のためのクロストーク対応ハードウェア効率アンサッツを設計し、改良されたエネルギー計算を実現する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:42:03 GMT)
Fast measurement of group index variation with ultimate precision using Hong-Ou-Mandel interferometry [3.6] ホン・ウー・マンデル干渉法は量子センシングアプリケーションに有用なツールとして登場した。
我々は時間効率で光遅延測定を最適化する。
測定は高速な検出と高い光子数を維持する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:10:38 GMT)
An overview of diffusion models for generative artificial intelligence [3.6] 本稿では拡散確率モデル(DDPM)を数学的に厳密に紹介する。
DDPMの詳細な数学的フレームワークを提供し、トレーニングおよび生成手順の背景にある主要なアイデアを説明します。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:55:38 GMT)
DYffCast: Regional Precipitation Nowcasting Using IMERG Satellite Data. A case study over South America [3.6] 降水量を正確に把握する能力は、社会を守るためにますます重要になっている。
本稿では,近年の降水時発生モデルの成功に触発されて,DYffusionフレームワークをこの課題に拡張する。
DYffusionフレームワークを改良し、降雨データをモデル化し、MSE、MAE、LPIPSの知覚スコアを組み合わせた新たな損失関数を導入する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 22:20:31 GMT)
Low-temperature Quantum Metrology Enhanced by Strong Couplings [3.5] 本稿では,強い結合効果を利用して誤差分割問題を解消する手法を提案する。
この結果は量子技術における非マルコビアン性の重要性を明らかにする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 01:22:08 GMT)
Unveiling and Mitigating Bias in Large Language Model Recommendations: A Path to Fairness [3.5] 本研究では,LLMに基づくレコメンデーションシステムとバイアスの相互作用について検討する。
音楽、歌、書籍のレコメンデーションなど、様々な民族や文化グループに重点を置いている。
我々の発見によると、これらのシステムのバイアスは深く根深いが、迅速なエンジニアリングのような単純な介入さえも、それを大幅に減らすことができる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:00:57 GMT)
SF-Loc: A Visual Mapping and Geo-Localization System based on Sparse Visual Structure Frames [3.5] 本稿では,軽量なビジュアルマッピングと地図支援型ローカライゼーションシステムであるSF-Locについて述べる。
マッピングフェーズでは,多センサ高密度バンドル調整(MS-DBA)を適用し,ジオレファレンスな視覚構造フレームを構築する。
ローカライズフェーズでは、多フレーム情報と地図分布を完全に統合した粗大な視覚に基づくローカライズを行う。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:51:58 GMT)
Physics-Informed Real NVP for Satellite Power System Fault Detection [3.4] 本稿では,AIに基づく障害検出手法を提案し,ADAPTデータセット上での性能評価を行う。
本研究では,物理インフォームド(PI)実数値非体積保存(Real NVP)モデルを宇宙システムにおける故障検出に適用することに焦点を当てた。
その結果,我々の物理インフォームド・アプローチは既存の故障検出方法よりも優れており,衛星EPSサブシステム障害の課題に対処できる可能性が示された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:08:41 GMT)
Programming Variational Quantum Circuits with Quantum-Train Agent [3.4] 可変量子回路(VQC)の効率的かつスケーラブルなプログラミングを容易にするQT-QFWP(Quantum-Train Quantum Fast Weight Programmer)フレームワークを提案する。
このアプローチは、量子と古典の両方のパラメータ管理を最適化することで、従来のハイブリッド量子古典モデルに対して大きな優位性をもたらす。
QT-QFWPは、関連モデルを効率性と予測精度の両方で上回り、より実用的で費用対効果の高い量子機械学習アプリケーションへの道筋を提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:26:09 GMT)
A Comprehensive Evaluation of Semantic Relation Knowledge of Pretrained Language Models and Humans [3.3] ハイポナミー, ホロナミー, メロニミー, アンソニミー, 同義語という5つの関係を包括的に評価する枠組みを導入する。
この結果から,人間とモデル間の有意な知識ギャップが明らかとなった。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:11:34 GMT)
Causal Discovery by Interventions via Integer Programming [3.3] 因果発見は、データ内の因果構造を明らかにするために、様々な科学分野において不可欠である。
従来の観測データに依存する手法には、変数の相違による制限がある。
本稿では,整数計画法(IP)を用いた最適化手法を提案し,因果構造識別性を確保するため,最小限の介入セットを設計する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:22:10 GMT)
Explore Reinforced: Equilibrium Approximation with Reinforcement Learning [3.2] RLとゲーム理論を融合したExp3-IXrlを導入し、RLエージェントの作用選択を平衡から分離する。
我々は,このアルゴリズムが平衡近似アルゴリズムを新しい環境に適用することを実証した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 22:37:59 GMT)
Geometry-aware PINNs for Turbulent Flow Prediction [3.2] NACA4桁翼の乱流場を予測するパラメトリックPINNサロゲートモデルが新たに作成されている。
モデルは未確認のレイノルズ数で未知のNACA翼で検証されている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:30:53 GMT)
Adaptive Traffic Element-Based Streetlight Control Using Neighbor Discovery Algorithm Based on IoT Events [3.2] インテリジェントな街灯システムは街灯ネットワークを複数のセクターに分割し、交通要素が通過するときに対応するセクターの街灯のみを活性化する。
この戦略は、各セクターの街灯のみを照らすために、近隣の関係を理解するために街灯を必要とする。
本稿では,街路灯網をソーシャルネットワークとしてモデル化し,近隣関係確率グラフを構築するための体系的アプローチを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 01:36:29 GMT)
A Versatile Influence Function for Data Attribution with Non-Decomposable Loss [3.2] 本稿では,非分解不能な損失を学習した機械学習モデルに対して,直接適用可能なVersatile Influence Function (VIF)を提案する。
VIFはデータ属性の大幅な進歩を表しており、幅広い機械学習パラダイムにまたがる効率的な影響関数ベースの属性を可能にする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:59:01 GMT)
Improving Object Detection by Modifying Synthetic Data with Explainable AI [3.1] 本稿では,合成画像に基づいて学習したコンピュータビジョンモデルの性能向上のための新しい概念的アプローチを提案する。
我々は、堅牢な説明可能なAI(XAI)技術を用いて、これらの画像を生成するために使用される3Dモデルの修正をガイドする。
合成データは、トレーニング中に見えない方向の車両の検出を4.6%改善できることを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:24:43 GMT)
Revisiting Absence withSymptoms that *T* Show up Decades Later to Recover Empty Categories [3.0] 我々は、言語文脈情報を利用したルールベースのアプローチを中国語に拡張することに注力する。
言語列列列モデルを用いてニューラル実験を行い、英語、中国語、韓国語のヌル要素を復元する。
著者の知識を最大限に活用するために、3つの異なる言語のヌル要素を探索し、初めて比較した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:30:09 GMT)
A comprehensive review of datasets and deep learning techniques for vision in Unmanned Surface Vehicles [2.9] 無人のSurface Vehicles (USV) は海上作戦における主要なプラットフォームとして登場した。
USVは、労働コストを削減し、安全性を高め、エネルギーを節約し、厳しい海洋環境下で困難な無人作業を可能にする。
USVの急速な発展に伴い、検出やセグメンテーションといった多くのビジョンタスクがますます重要になっている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:54:18 GMT)
Optimizing LoRa for Edge Computing with TinyML Pipeline for Channel Hopping [2.9] 我々は、IoTからエッジコンピューティングシステムにデータを送信するために、長距離LongRange(LoRa)通信ソリューションを統合することを提案する。
チャネル希望最適化モデルを提案し,LoRa伝送に基づくTinyMLに基づくチャネル希望モデルを適用した。
エッジとIoTデバイス間の自由チャネルを見つけるための高速予測アルゴリズムを実験的に検討する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:28:44 GMT)
BK-SDM: A Lightweight, Fast, and Cheap Version of Stable Diffusion [2.8] 安定拡散モデル(SDM)を用いたテキスト・ツー・イメージ(T2I)生成は高い計算要求を伴う。
近年の研究では、サンプリングのステップを減らし、元のアーキテクチャを維持しながらネットワーク量子化を適用している。
低コスト汎用T2Iにおけるブロックプレーニングと特徴蒸留の驚くべき可能性を明らかにする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:58:23 GMT)
Uncertainty quantification for fast reconstruction methods using augmented equivariant bootstrap: Application to radio interferometry [2.8] 次世代の電波干渉計であるSquare Kilometer Arrayは、我々の電波天文学能力に革命をもたらすと約束している。
これらのデバイスが生成する前例のない量のデータは、不適切な電波干渉画像の問題を解決するために、高速で正確な画像再構成アルゴリズムを必要とする。
高速な再構成手法における不確かさを定量化できるラジオ拡張同変ブートストラップ法の適合バージョンに基づく教師なし手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:51:10 GMT)
"Oh, sh*t! I actually opened the document!": An Empirical Study of the Experiences with Suspicious Emails in Virtual Reality Headsets [2.8] 本稿では,バーチャルリアリティー(VR)ヘッドセットをリアルな環境でアクセスする際に,不審なメールや関連警告によるユーザ体験を探索する研究について報告する。
私たちはURLか添付ファイルを含む"偽陽性"メールを送り、参加者がそれとどのようにやりとりするかを観察しました。
というのも、VRヘッドセットのハイパーセンシティブなクリックと、通常のメールソート作業中に人間工学的な精度が欠如しているからだ。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:20:23 GMT)
Class Distance Weighted Cross Entropy Loss for Classification of Disease Severity [2.8] クラス距離重み付きクロスエントロピー(クラス距離重み付きクロスエントロピー、CDW-CE、Class Distance Weighted Cross-Entropy、CDW-CE)は、クラスが遠く離れている場合に、誤分類をより厳しく罰する損失関数である。
本研究は,CDW-CEが日常的な画像分類タスクの性能を継続的に向上することを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:06:14 GMT)
Federated Block-Term Tensor Regression for decentralised data analysis in healthcare [2.8] BTTR(Block-Term Regression)は、多線形関係を利用して複雑な高次元データをモデリングするための強力なツールであることが証明されている。
我々はFBRの拡張であるFBTTR(Federated Block-Term Regression)を紹介した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:40:07 GMT)
ArtBrain: An Explainable end-to-end Toolkit for Classification and Attribution of AI-Generated Art and Style [2.7] 本稿では,10種類のアートスタイルにまたがる185,015のアートイメージを収録したデータセットであるAI-ArtBenchを紹介する。
125,015点のAI生成画像と6万点の人造アートワークが含まれている。
生成モデルの属性の精度は0.999に達する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:03:50 GMT)
The use of large language models to enhance cancer clinical trial educational materials [2.7] GPT4の生成した試用サマリーは読みやすく、包括的であった。
複数選択質問は、クラウドソースアノテータと高い精度と一致を示した。
両方のリソースタイプに対して、継続する人間の監視を必要とする幻覚が同定された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:31:27 GMT)
Enhancing Quantum Memories with Light-Matter Interference [2.6] 構成的な光・光干渉を利用して量子メモリプロトコルを拡張するための新しいアプローチを提案する。
我々は,この手法をセシウム蒸気中のラマン量子メモリに実装し,全効率を3倍以上に向上させる。
この新しいプロトコルは様々なメモリアーキテクチャに適用でき、スケーラブルで効率的で低ノイズで高帯域幅の量子メモリへの道を開く。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:08:22 GMT)
Integrative CAM: Adaptive Layer Fusion for Comprehensive Interpretation of CNNs [2.6] 統合型CAMは、畳み込みニューラルネットワーク(CNN)における機能の重要性の全体像を提供する。
Grad-CAMやGrad-CAM++のような従来の勾配ベースのCAMメソッドは、主に関心のある領域を強調するために最終層アクティベーションを使用する。
我々はGrad-CAM++からアルファ項を一般化し、どんなスムーズな関数にも適用し、CAMの適用範囲を広範囲に広げる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:33:34 GMT)
Multi-Agent Deep Reinforcement Learning for Distributed and Autonomous Platoon Coordination via Speed-regulation over Large-scale Transportation Networks [2.5] トラック小隊技術により、トラックのグループは、燃料を節約し、交通効率を向上し、安全性を向上させることができる。
本稿では,大規模輸送ネットワークにおける小隊調整の問題について考察し,トラック間の連携を促進し,全体の効率を最適化する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:21:40 GMT)
Smart Contract Vulnerabilities, Tools, and Benchmarks: An Updated Systematic Literature Review [2.5] スマートコントラクトはブロックチェーンプラットフォーム上でのセルフエグゼクティブプログラムであり、信頼性のないトランザクションと分散アプリケーションの運用を可能にして、分散金融に革命をもたらした。
その可能性にもかかわらず、スマートコントラクトのセキュリティは、悪意のあるアクターに公開する不変性と透明性のために、依然として重要な懸念事項である。
本稿では,スマートコントラクトの脆弱性を調査し,自動検出ツールとベンチマーク評価に焦点を当てた系統的な文献レビューを行う。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:08:48 GMT)
Indexing Economic Fluctuation Narratives from Keiki Watchers Survey [2.4] 我々は、以前提案した物語の枠組みを用いて、経済調査から経済変動の指標を設計する。
提案指標は,他の種類の拡散指標よりも累積ラギング拡散指数と強い相関が認められた。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:32:02 GMT)
Random Tree Model of Meaningful Memory [2.4] 本稿では,各ノードが木葉の圧縮された表現であるキーポイントの階層として物語を表現するために,ランダムツリーの統計的アンサンブルを導入する。
平均リコール長は物語長に比例して増加し,各リコール文では個人がより長いナラティブセグメントを要約するようになっている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:50:27 GMT)
Incompressibility and spectral gaps of random circuits [2.4] 可逆回路と量子回路は、交互群 $mathrmAlt (2n)$ とユニタリ群 $mathrmSU (2n)$ のランダムウォークを形成する。
ランダム可逆回路のギャップは、すべての$tgeq 1$に対して$Omega(n-3)$であり、ランダム量子回路のギャップは$Omega(n-3)$ for $t leq Theta(2n/2)$であることを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:47:22 GMT)
Embedded Machine Learning for Solar PV Power Regulation in a Remote Microgrid [2.3] 本稿では,遠隔地マイクログリッドにおける太陽インバータ電力制御の機械学習による研究について述べる。
アクティブおよびリアクティブな電力制御のための機械学習モデルは、それぞれアンサンブル学習法を用いて訓練される。
遠端制御センターの中央サーバで推論を行う従来の方式とは異なり、提案方式では、トレーニングされたモデルをインバータ近傍の組込みエッジ計算装置に展開し、通信遅延を低減する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 02:29:58 GMT)
Atari-GPT: Benchmarking Multimodal Large Language Models as Low-Level Policies in Atari Games [2.3] 本稿では,アタリゲームにおける低レベルポリシーとして,マルチモーダル LLM の創発的能力をテストするための新しいベンチマークを提案する。
本研究では,従来のRLエージェント,ヒトプレイヤー,ランダムエージェントに対するマルチモーダルLLMの性能評価を行った。
以上の結果から,これらのマルチモーダル LLM はゼロショットの低レベルポリシーをまだ実現できていないことが示唆された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:48:43 GMT)
Improving feature interactions at Pinterest under industry constraints [2.1] 機能間相互作用は、レコメンデーションシステムやオンライン広告におけるユーザの振る舞いを正確に予測するために重要である。
Criteoのようなベンチマークデータセット上での優れたパフォーマンスを示す数多くの新しいテクニックにもかかわらず、産業環境での直接的な適用は制約によって妨げられている。
本稿では,PinterestのHomefeedランキングモデルにおける機能インタラクションの改善から学んだことを,そのような制約の下で共有する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:29:16 GMT)
Improved Multi-Task Brain Tumour Segmentation with Synthetic Data Augmentation [2.1] 本稿では,BraTSチャレンジにおける課題1と第3位の課題3の勝利解について述べる。
治療後の治療シナリオにおいて,成人グリオーマのセグメンテーションを改善するための最先端のフレームワークをトレーニングするための合成データの利用,および放射線治療計画のための髄膜腫のセグメンテーションを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:48:28 GMT)
Brain Tumour Removing and Missing Modality Generation using 3D WDM [2.1] 本稿では,第8タスクのための第2の配置ソリューションとBraTS 2024タスク7タスクへの参加ソリューションを提案する。
臨床実践を支援するための自動脳分析アルゴリズムの採用が増加している。
これらのアルゴリズムの多くは、脳病変の存在や、特定のMRIモダリティの欠如に苦慮している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:47:17 GMT)
DGNN-YOLO: Dynamic Graph Neural Networks with YOLO11 for Small Object Detection and Tracking in Traffic Surveillance [2.1] 本稿では,動的グラフニューラルネットワーク(DGNN)をYOLO11と統合した新しいフレームワークであるDGNN-YOLOについて紹介する。
グラフ構造の構築と更新により、DGNN-YOLOはオブジェクトをノードとして、そのインタラクションをエッジとして効果的に表現し、複雑でダイナミックな環境で適応的で正確なトラッキングを保証する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:37:41 GMT)
Quantum computing of chirality imbalance in SU(2) gauge theory [2.1] 我々は1+1次元のSU(2)非アベリアゲージ理論におけるキラル凝縮の研究のために変分量子アルゴリズムを実装した。
古典的および実際の量子ハードウェア上の量子シミュレーションによる結果は、格子ハミルトンの正確な対角化とよく一致している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:10:27 GMT)
A deformation-based framework for learning solution mappings of PDEs defined on varying domains [2.0] 我々は、様々な領域で定義されたPDEの解写像を学習するための変形に基づくフレームワークを構築した。
このような計量とバナッハのマッピングはニューラルネットワークによって学習できるので、解のマッピングはそれに従って学習される。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:07:01 GMT)
Can LLMs plan paths in the real world? [2.0] 実世界の6つのパスプランニングシナリオを通じて,3つの大規模言語モデル(LLM)を検証した。
実験の結果,全てのLSMが複数の誤りを犯し,信頼できないパスプランナであることが判明した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 02:42:05 GMT)
Smart Parking with Pixel-Wise ROI Selection for Vehicle Detection Using YOLOv8, YOLOv9, YOLOv10, and YOLOv11 [2.0] この研究は、最新のYOLOモデルを使用して、モノのインターネット、エッジコンピューティング、ディープラーニングの概念を統合する新しいアプローチを導入している。
駐車場画像中の車両をカウントする関心領域を正確に識別するために,新しい画素単位のポストプロセッシングROI選択法を提案する。
提案システムは3,484枚の画像のカスタムデータセット上で99.68%の精度を達成し、費用対効果の高いスマートパーキングソリューションを提供した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:24:31 GMT)
Addressing Data Leakage in HumanEval Using Combinatorial Test Design [1.9] HumanEvalベンチマークは164の手作りタスクで構成されている。
HumanEvalのようなベンチマークを用いたLCMの公正な評価に対する大きな障壁は、データ汚染である。
本稿では,新しい具体的なタスクにインスタンス化可能なテンプレートタスクからなるベンチマーク構築手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:18:32 GMT)
Measuring topological invariants for higher-order exceptional points in quantum three-mode systems [1.9] 例外的位相不変量の実験的特徴づけは古典的あるいは半古典的システムにおいて2階のEPに制限されている。
本稿では,高次EPを持つNHマルチモードシステムを提案する。
我々の結果は、例外位相の研究を、多部が絡み合った固有状態を持つ完全量子力学モデルに拡張する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:40:36 GMT)
Kernel-Free Universum Quadratic Surface Twin Support Vector Machines for Imbalanced Data [1.9] 不均衡なクラスを持つバイナリ分類タスクは、機械学習において大きな課題となる。
本稿では,2次双立サポートベクトルマシンモデル内のマイノリティクラスをサポートするためにUniversumポイントを活用することで,この問題に対処する新しいアプローチを提案する。
本手法は,Universumの点を組み込むことで,不均衡なデータセットの分類精度と一般化性能を向上させる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:57:59 GMT)
Bluetooth Low Energy Dataset Using In-Phase and Quadrature Samples for Indoor Localization [1.9] 本稿では,Bluetooth低エネルギー(BLE)技術を用いて,到着角(AoA)を決定するために設計されたデータセットの収集と検証について概説する。
実験室で収集されたデータは、現実の工業シナリオを近似することを目的としている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:05:35 GMT)
Explaining the Unexplained: Revealing Hidden Correlations for Better Interpretability [1.8] Real Explainer(RealExp)は、Shapley値を個々の特徴と特徴相関の重要度に分解する、解釈可能性の手法である。
RealExpは、個々の特徴とそれらの相互作用を正確に定量化することで、解釈可能性を高める。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:50:50 GMT)
Regression Trees Know Calculus [1.8] 一般的な木学習ライブラリが公開する量を用いて効率的に計算できる勾配の簡単な推定値を求める。
これにより、ニューラルネットやガウシアンプロセスといった、微分可能なアルゴリズムのコンテキストで開発されたツールを、ツリーベースのモデルにデプロイすることができる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:03:51 GMT)
MambaU-Lite: A Lightweight Model based on Mamba and Integrated Channel-Spatial Attention for Skin Lesion Segmentation [1.8] 皮膚異常の早期発見は、皮膚がんの診断と治療において重要な役割を担っている。
ハイパフォーマンスを実現することは、高解像度画像が必要であり、個々の病変の境界が不明瞭であることから、依然として大きな課題である。
我々は,400K以上のパラメータと1Gフロップ以上の計算コストを備えた,MambaU-Liteと呼ばれる新しい軽量モデルを導入する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:49:49 GMT)
Towards Resource Efficient and Interpretable Bias Mitigation in Large Language Models [1.8] 大規模言語モデル (LLM) は、学習データにおいて望ましくないバイアスを持続させる。
本稿では,小さなバイアスとアンチバイアスのエキスパートモデルを利用してバイアスを緩和し,デバイアス信号を得る。
性別、人種、宗教の偏見を緩和する実験は、いくつかの地域および世界的な偏見指標に偏見を減少させる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:56:08 GMT)
HPRM: High-Performance Robotic Middleware for Intelligent Autonomous Systems [1.8] 決定論的協調言語Lingua Franca(LF)上に構築されたHPRM(High-Performance Robotic Middleware)について述べる。
HPRMは、大規模なペイロードの効率的なゼロコピー転送のためのインメモリオブジェクトストア、シリアライゼーションオーバーヘッドを最小限に抑えるアダプティブシリアライゼーション、ハンドシェイクレイテンシを低減するためにリアルタイムソケットを備えた熱心なプロトコルなどの最適化を採用している。
我々は、CARLAシミュレータとHPRMを統合し、オブジェクト検出作業とともに強化学習エージェントを実行することにより、HPRMの利点を実証する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:46:29 GMT)
SiTSE: Sinhala Text Simplification Dataset and Evaluation [1.8] 本稿では,Sinhala言語に対する人文レベルのテキスト単純化データセットを提案する。
我々は,テキスト単純化タスクを多言語言語モデルmT5とmBARTのゼロショットおよびゼロリソースシーケンス・ツー・シーケンス(seq-seq)タスクとしてモデル化する。
分析の結果,ITTL は以前提案したゼロリソース法よりもテキストの単純化に優れていた。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:08:06 GMT)
Energy preserving evolutions over Bosonic systems [1.7] 連続変数系で動作する量子力学半群の摂動について検討する。
量子力学半群のマルコフ摂動のエネルギー制約付き容量の連続性境界を導出する新しいスキームを提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:18:31 GMT)
CoVLA: Comprehensive Vision-Language-Action Dataset for Autonomous Driving [1.7] CoVLA(Comprehensive Vision-Language-Action)データセットは、80時間以上にわたる現実世界の運転ビデオで構成されている。
このデータセットは、堅牢で解釈可能で、データ駆動の自動運転システムのためのフレームワークを確立する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:31:40 GMT)
Observing the dynamics of quantum states generated inside nonlinear optical cavities [1.7] 光周波数における量子状態は、しばしば強い非線形相互作用を促進するためにキャビティ内で生成される。
非線形光学キャビティ内で発生した量子状態を再構成し,そのダイナミクスを観察するための枠組みを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:20:06 GMT)
Protecting Federated Learning from Extreme Model Poisoning Attacks via Multidimensional Time Series Anomaly Detection [1.6] FLANDERSは,大規模モデル中毒に対するFL耐性を示す新しいプレアグリゲーションフィルタである。
FLANDERSは、FLANDERSが標準およびロバストな既存のアグリゲーション手法と組み合わせることで、幅広い攻撃範囲にわたるロバスト性を大幅に向上することを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:01:58 GMT)
Chaos Engineering: A Multi-Vocal Literature Review [1.6] カオスエンジニアリングは、生産中のシステムが乱条件下でどのように振る舞うかを積極的にテストすることで、課題に対処する。
この研究ギャップを埋めるために、カオスエンジニアリングについてMultivocal Literature Review (MLR)を行った。
最初に選択したソースを使用して、カオスエンジニアリングの統一的な定義を導き、重要な機能、コンポーネント、採用ドライバを特定しました。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:57:24 GMT)
Quasi-optimal sampling from Gibbs states via non-commutative optimal transport metrics [1.6] 任意の次元の超立方体格子上での局所通勤ハミルトニアンの量子ギブス状態のサンプリングと準備の問題について検討する。
これらのギブス状態は、行列値の量子条件の相互情報の崩壊を、量子コンピュータ上で準最適に生成できるようなクラスタリング条件を満たすことを証明している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:25:24 GMT)
Two-Stage Approach for Brain MR Image Synthesis: 2D Image Synthesis and 3D Refinement [1.6] 腫瘍像を正確に表現することで,欠失モードの特異な特徴を反映したMRI画像の合成が重要である。
本稿では,2次元スライスからMR画像を合成する2段階の手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:27:39 GMT)
Improving Detail in Pluralistic Image Inpainting with Feature Dequantization [1.6] VQGANベースのモデルPUTは重要な課題に直面している。
本稿では,FDM(Feature Dequantization Module)を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 02:06:04 GMT)
The Design and Implementation of a Quantum Information Science Undergraduate Program [1.5] カナダのケベックにあるシェブルック大学(Universit'e de Sherbrooke)は、量子情報科学の革新的な学部を創設し、立ち上げた。
我々は、コヒーレントなカリキュラムにつながる創造的なプロセスと、ローカルなエコシステムがこれらの選択に繋がった理由を詳述する。
他の量子教育機関に刺激を与えるために、この学区間と学級間の開発で学んだ指導原則と教訓が共有される。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:24:35 GMT)
Blindfold: Confidential Memory Management by Untrusted Operating System [1.5] 既存の Confidential Computing (CC) ソリューションは、OSから機密メモリを隠蔽し、秘密性を達成するために暗号化する。
本稿では,Blindfold というCC設計で合成したこれらの制限を克服するための実験結果について述べる。
Blindfoldは、Guardianと呼ばれるカーネルよりも高い特権レベルで実行される、小さな信頼できるソフトウェアコンポーネントに依存している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 02:40:05 GMT)
Handwriting-based Automated Assessment and Grading of Degree of Handedness: A Pilot Study [1.5] 利き手の好みと利き手の程度(DoH)は、人間の行動の2つの異なる側面であり、しばしば1つと混同される。
本研究は, DoHを初めて評価するために, 支配的, 非支配的手書き特性を用いた。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:06:18 GMT)
Effectiveness of L2 Regularization in Privacy-Preserving Machine Learning [1.5] 業界が求める、優れたモデルは通常、大量のトレーニングデータに依存している。
このようなデータを使用することで、機密性の高い情報の漏洩の潜在的なリスクにより、深刻なプライバシー上の懸念が生じる。
本研究では,L2正則化と差分プライバシの有効性を,会員推論攻撃のリスクを軽減するために比較する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:31:11 GMT)
First numerical observation of the Berezinskii-Kosterlitz-Thouless transition in language models [1.4] 自然言語モデルの枠組みにおける不明瞭な相転移を数値的に示す。
我々は相転移をベレジンスキー-コステリッツ-トゥーレス転移の変種として同定する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:32:32 GMT)
ChatCollab: Exploring Collaboration Between Humans and AI Agents in Software Teams [1.4] ChatCollabの斬新なアーキテクチャは、エージェント(人間またはAI)が任意の役割でコラボレーションに参加することを可能にする。
ソフトウェアエンジニアリングをケーススタディとして使用することで、私たちのAIエージェントが彼らの役割と責任をうまく特定できることが分かりました。
ソフトウェア開発のための従来の3つのマルチエージェントAIシステムに関連して、ChatCollab AIエージェントはインタラクティブなゲーム開発タスクにおいて、同等またはより良いソフトウェアを生成する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:56:46 GMT)
The Vulnerability of Language Model Benchmarks: Do They Accurately Reflect True LLM Performance? [1.4] 大きな言語モデル(LLM)は、真の言語理解と適応性を示すのに失敗しながら、標準化されたテストで優れている。
NLP評価フレームワークの系統的解析により,評価スペクトルにまたがる広範囲にわたる脆弱性が明らかになった。
我々は、操作に抵抗し、データの汚染を最小限に抑え、ドメイン固有のタスクを評価する新しい評価方法の土台を築いた。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:49:21 GMT)
Enhancing Crop Segmentation in Satellite Image Time Series with Transformer Networks [1.3] 本稿では,衛星画像時系列(SITS)の収量分割に特化したトランスフォーマーベースSwin UNETRモデルの改訂版を提案する。
提案したモデルは大きな進歩を示し、検証精度96.14%、テスト精度95.26%をミュンヘンデータセットで達成している。
実験結果から,CNNと同等あるいは優れた精度を達成できると同時に,トレーニング時間を大幅に短縮できる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:08:22 GMT)
Covariance Matrix Adaptation Evolution Strategy for Low Effective Dimensionality [1.3] 我々はCMA-ES-LEDと呼ばれる高次元ブラックボックス最適化問題に対する新しい戦略を提案する。
共分散行列の固有ベクトルを用いて回転変換に取り組む。
実験の結果,CMA-ES-LEDはLEDを用いたベンチマーク関数においてCMA-ESよりも優れていた。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:56:17 GMT)
Scalable Kernel Logistic Regression with Nyström Approximation: Theoretical Analysis and Application to Discrete Choice Modelling [1.3] 本稿では,大規模なデータセット上でのKLR(Kernel Logistic Regression)に対するNystr"om近似を提案する。
基礎的一様サンプリング,k平均サンプリング戦略,およびレバレッジスコアを基礎とした2つの非一様抽出方法を含む,4つのランドマーク選択法が試験された。
これらの戦略の性能は,大規模トランスポートモード選択データセットを用いて評価する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:12:10 GMT)
Shadow of the (Hierarchical) Tree: Reconciling Symbolic and Predictive Components of the Neural Code for Syntax [1.2] 線形で予測的な「水平」プロセスで階層的な「垂直」構文のニューラルネットワークを再構築する可能性について論じる。
語彙・意味的統計特徴をコードするニューラルレジームに記号表現を注入する方法に関するニューロシンボリックな数学的モデルを提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:44:16 GMT)
Preserving Data Privacy for ML-driven Applications in Open Radio Access Networks [1.2] 本稿では,5G Open Radio Access Network (O-RAN)ネットワークにおける共有データベースシナリオのケーススタディとして,プライバシ問題に対処することを目的とする。
我々は、モデルとネットワーク性能を損なうことなく、スペクトル共有および干渉緩和アプリケーションのために機械学習(ML)モデルで使用できるデータを保護することに重点を置いている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:05:45 GMT)
Adaptive Lightweight Security for Performance Efficiency in Critical Healthcare Monitoring [1.2] IoT(Internet of Things, モノのインターネット)とその多様な技術は、将来の医療システムにとって不可欠なコンポーネントになっている。
進化する医療パラダイムは、IoTデバイスのさまざまなリソース制約に適応可能な、適応的なセキュリティ手順とテクノロジを必要とする。
この記事では、ユニークな医療監視要件を提起し、必要なセキュリティを提供するために、既存の暗号化ベースのセキュリティアプローチを研究します。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:20:38 GMT)
Arabic Handwritten Document OCR Solution with Binarization and Adaptive Scale Fusion Detection [1.2] テキスト行の正確な検出を保証するために,ラインセグメンテーションとAdaptive Scale Fusion技術から始まる完全なOCRパイプラインを提案する。
我々のシステムはアラビア多言語データセットに基づいて訓練され、7文字から10文字の単語サンプルに対して99.20%の文字認識率(CRR)と93.75%の単語認識率(WRR)を達成する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:21:09 GMT)
Punctuation Restoration for Singaporean Spoken Languages: English, Malay, and Mandarin [1.1] 本稿では,多言語 ASR システムにより生成された ASR 転写文の句読点復元作業について述べる。
英語、マンダリン語、マレー語がシンガポールで最も人気のある言語である。
我々の知る限りでは、これら3つの言語の句読点復元を同時に行うことができる最初のシステムである。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 00:57:32 GMT)
Correction to "Wasserstein distance estimates for the distributions of numerical approximations to ergodic stochastic differential equations" [1.1] Wasserstein-2距離におけるエルゴードSDEの数値離散化の非漸近的保証を解析する方法を示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:21:10 GMT)
Solving one-body ensemble N-representability problems with spin [1.0] 許容軌道1体還元密度行列の集合は、自然軌道占有数に対する線形スペクトル制約によって完全に特徴づけられることを示す。
この結果は、アンサンブル密度(行列)汎関数理論の重大な欠落基盤を提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:50:01 GMT)
Divergent Ensemble Networks: Enhancing Uncertainty Estimation with Shared Representations and Independent Branching [1.0] Divergent Ensemble Network (DEN)は、共有表現学習と独立分岐を組み合わせた新しいアーキテクチャである。
DENは共有入力層を使用して、すべてのブランチに共通する特徴をキャプチャし、続いて、アンサンブルを形成する独立したトレーニング可能な層を分離する。
この共有分岐構造は、アンサンブルの多様性を維持しながらパラメータの冗長性を低減し、効率的でスケーラブルな学習を可能にする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:52:45 GMT)
MATATA: a weak-supervised MAthematical Tool-Assisted reasoning for Tabular Applications [1.0] MATATAは、推論、計画、ツール使用を通じてデータ問題に対してLLMエージェントを訓練するコスト効率のよい方法である。
3.8B/8B SLM(Small Language Models)は、特にローカルホスティングとセンシティブなビジネスコンテキストに向いている。
実験により、MATATAはオープンソースモデルに基づく推論フレームワークのうち、FinQAとTAT-QAで最先端のパフォーマンスに達することが示された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:08:00 GMT)
Recurrent Neural Network on PICTURE Model [1.0] この研究は、XGBoostモデルのパフォーマンスをベンチマークするために、ディープラーニングモデルを実装することを目的としている。
このモデルは、緊急集中治療単位の転送、呼吸不全、死亡のリスクが高い患者とリスクの低い患者とを分離することにより、患者の劣化を予測する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:49:51 GMT)
Approximately Optimal Search on a Higher-dimensional Sliding Puzzle [1.0] 本稿では,高次元パズルの様々なシナリオを包括的に研究する。
正確なアルゴリズム(A*探索)と2つのほぼ最適な探索手法(EA)と強化学習(RL)を示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:59:06 GMT)
Dispersion Managed Elliptical Atomtronics for Interferometry [0.8] 楕円型原子線学では、物質波はその時間力学の間、半長辺に沿って蓄積する傾向にある。
適切な分散管理は、時間スケールを偏心性から切り離すことができると報告する。
我々は楕円導波路内で異なる分極性物質波を発生させることに焦点をあて、効率的な原子干渉法を実現する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:26:48 GMT)
Anticipating Object State Changes in Long Procedural Videos [0.8] 提案するフレームワークは、近い将来に発生するオブジェクトの状態変化を、まだ見つからない人間の行動によって予測する。
これは、最近の視覚情報を表す学習された視覚機能と、過去のオブジェクトの状態変化とアクションを表す自然言語(NLP)機能を統合する。
提案手法は,映像理解システムの予測性能を高めるために,映像と言語的手がかりを統合する可能性も示している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:16:09 GMT)
Identifying Key Nodes for the Influence Spread using a Machine Learning Approach [0.8] 本稿では、影響拡散問題に対する強化された機械学習ベースのフレームワークを提案する。
本稿では,一般的な参照手法である独立カスケードモデルのキーノードの同定に着目する。
次に,本手法は,与えられたノードの影響を予測できるだけでなく,拡散過程の他の特性も決定できることを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:17:44 GMT)
RGBDS-SLAM: A RGB-D Semantic Dense SLAM Based on 3D Multi Level Pyramid Gaussian Splatting [0.8] 本稿では,RGB-Dセマンティック・セマンティック・セマンティック・SLAMシステムであるRGBDS-SLAMを提案する。
マルチレベル画像ピラミッドを抽出してシーン詳細を復元する3次元マルチレベル・ガウス・スプラッティング法を提案する。
密結合型多機能再構成最適化機構を設計し、RGB, 深さ, 意味マップの再構成精度を相互に向上する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:36:30 GMT)
Command-line Risk Classification using Transformer-based Neural Architectures [0.8] コマンドインターセプションシステムは、損傷を起こす前に危険なコマンドラインインターフェース(CLI)コマンドをインターセプト、評価、ブロックするために使用される。
コマンドリスクアセスメントの従来のソリューションには、専門家の知識と、目に見えないコマンドを考慮に入れた定期的な人間の修正を必要とするルールベースのシステムが含まれる。
本稿では,Large Language Models (LLM) のパワーを活用し,高精度な分類と危険なコマンドを効果的に識別する能力を提供するトランスフォーマーベースのコマンドリスク分類システムを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:04:31 GMT)
Multi-task Learning To Improve Semantic Segmentation Of CBCT Scans Using Image Reconstruction [0.8] マルチタスク学習によるCBCTの自動セグメンテーションの改善を目指す。
まず,形態素に基づく正規化を加えるためにマルチタスク学習を行う。
第2に、この再構築タスクを使用して、最高のCBCTを再構築する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:40:59 GMT)
Resource-efficient loss-aware photonic graph state preparation using atomic emitters [0.7] マルチキュービット交絡フォトニックグラフ状態は、全フォトニック量子コンピューティング、リピータ、ネットワークにとって重要な要素である。
本研究では,エミッタ数CNOTを最小化しつつ,エミッタ数をグラフ状態深さと交換できるアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 01:40:37 GMT)
CSP-AIT-Net: A contrastive learning-enhanced spatiotemporal graph attention framework for short-term metro OD flow prediction with asynchronous inflow tracking [0.7] 現在のモデルでは、オリジン・デスティネーション(OD)の乗客フローデータの非同期離脱特性を捉えることができないことが多い。
本稿では,非同期なインフロートラッキングと高度なセマンティクスを組み込むことで,ODフローの予測を改善する新しいフレームワークを提案する。
この作業は、メトロの運用効率の向上、スケジューリングの精度の向上、システム全体の安全性の向上に寄与する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:00:06 GMT)
What Differentiates Educational Literature? A Multimodal Fusion Approach of Transformers and Computational Linguistics [0.7] 英語カリキュラムへの新しい文学の統合は、様々な教室のニーズに対して、読みやすさとテキストの適応を迅速に評価するスケーラブルなツールがしばしば欠如しているため、依然として課題である。
本研究は,変圧器を用いたテキスト分類と言語的特徴分析を組み合わせたマルチモーダル手法により,このギャップに対処することを提案する。
提案手法は、ステークホルダーが対象とするWebアプリケーションにカプセル化され、非技術ステークホルダーが、テキストの複雑さ、読みやすさ、カリキュラムのアライメント、学習年齢範囲に関するリアルタイムな洞察にアクセスできるようにする。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:43:20 GMT)
FathomVerse: A community science dataset for ocean animal discovery [0.7] FathomVerse v0データセットを提示し、深海の人間とめったに接触しない動物を探索することで、フィールドの限界を押し上げる。
データセットは3843枚の画像と、深海底の2箇所で記録された12の異なる形態群から8092個の箱で構成されている。
海星と交尾するタコや、吸血鬼のイカやクモの群れなど、視覚的に混乱するシナリオが特徴である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:49:20 GMT)
Hybrid Online Certificate Status Protocol with Certificate Revocation List for Smart Grid Public Key Infrastructure [0.7] Hsuらは、スマートグリッドメーターのセキュリティを強化するために、公開鍵インフラストラクチャ内の暗号スキームを提案した。
本稿では,Hybrid Online Certificate Status Protocol メカニズムを提案する。
我々のシミュレーションでは、メーターの挙動を模倣して効率を向上し、スマートグリッドメーターのランドスケープに合わせてより堅牢なアーキテクチャを構築しました。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:29:59 GMT)
Cross Domain Adaptation using Adversarial networks with Cyclic loss [0.7] 本研究では,一方のドメインから他方のドメインへの変換を行うジェネレータネットワークの精度向上を目的とした,一連の手法について検討した。
この研究は、制御されていない方法で合成入力からラベル付きデータを生成するようなドメイン適応ネットワークから導出できる無数のアプリケーションによって動機付けられている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:55:35 GMT)
Investigating the heterogenous effects of a massive content moderation intervention via Difference-in-Differences [0.7] 我々は,The Great Banの効果について,因果推論手法を適用した。
約34万のユーザーが共有した5300万のコメントを分析します。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:51:48 GMT)
Mutli-View 3D Reconstruction using Knowledge Distillation [0.7] 我々は,Dust3rを教師とする学生教師モデルを構築し,Dust3rが出力する3次元再構成点を用いて学習した学生モデルの複数のアーキテクチャを探索する。
我々のゴールは、シーン固有の表現を学習し、3DポイントをDust3rのような複製可能なパフォーマンスで出力できる学生モデルを作ることです。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 23:46:31 GMT)
Infinite quantum signal processing [0.7] 量子信号処理(QSP)は、次数$d$の真のスカラーを表す。
QSPは多種多様なポリノミカル関数を表現できることを示す。
解析の結果,対象関数の正則性と因子の減衰特性との間には,驚くべき関連性があることが判明した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 22:51:56 GMT)
An Enhanced Online Certificate Status Protocol for Public Key Infrastructure with Smart Grid and Energy Storage System [0.7] スマートグリッド環境におけるOCSPクエリコストを最適化するためのOCSPステープリング手法を提案する。
実験の結果,OCSPステープリングにより効率とセキュリティが向上し,スマートグリッドのより堅牢なアーキテクチャが実現された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:29:19 GMT)
How pure can we go with adiabatic state manipulation? [0.6] スペクトルギャップが$gamma$である純粋散逸系の遅い進化について検討する。
状態進化に対する非断熱的な補正は、デコヒーレンスを引き起こす。
本稿では,量子情報処理における速度制限について検討する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:28:59 GMT)
Self-Adaptive Quantum Kernel Principal Components Analysis for Compact Readout of Chemiresistive Sensor Arrays [0.6] 情報保持性を高めるために,自己適応型量子カーネル(SAQK) PCAを提案する。
その結果は、実世界のIoTアプリケーションでデータ処理に革命をもたらす、ノイズの多い中間スケール量子コンピュータの可能性を強調している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:25:47 GMT)
Microservice-based edge platform for AI services [0.6] 2つの大きな進化は、普及するアプリケーションの開発方法を変えつつある。
もうひとつは、これらのアプリケーションを構築するための機械学習テクニックの大量使用です。
スマートスペースにおけるそのようなアプリケーションの開発を可能にする新しいアーキテクチャとプラットフォームを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:50:51 GMT)
Spread complexity and the saturation of wormhole size [0.6] 最近の提案は、二重スケールSYK理論(DSSYK)の複雑さを拡大するために、JT重力におけるアインシュタイン・ローゼン橋の大きさを近似している。
これらの提案の補助コード基底''' は、拡散熱場二重状態の有限次元物理クリロフ基底の部分指数部分からの外挿であることを示す。
我々は、ER橋の大きさの同定を非摂動的に拡張し、ヒルベルト空間に複雑さを拡大し、それが後期に飽和していることを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 23:46:22 GMT)
GRDD: A Dataset for Greek Dialectal NLP [0.6] 現代ギリシア語方言の計算研究のためのデータセットを提示する。
データセットはかなりの大きさであり、不均衡であるにもかかわらず、このタイプの大規模な方言資源を現代ギリシア語の方言のために作成する最初の試みである。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:33:17 GMT)
The Data-Driven Censored Newsvendor Problem [0.6] データ駆動型ニューズベンダー問題の検閲版について検討する。
意思決定者は、検閲された販売データのみに基づいて、予想される過給と未成年コストを最小限に抑える注文量を選択する必要がある。
我々は、歴史的需要検閲のレベルに適応する、自然なロバストなアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:58:54 GMT)
IQA-Adapter: Exploring Knowledge Transfer from Image Quality Assessment to Diffusion-based Generative Models [0.5] 本稿では,画像と品質スコアの関係を学習することで,目標品質レベルの生成を条件付ける新しいアーキテクチャであるIQA-Adapterを紹介する。
IQA-Adapterは、主観的な研究によって確認されたように、複数の客観的指標に対して最大10%の改善が達成される。
我々の品質認識手法はまた、IQAモデルの対角的堅牢性に関する洞察を提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:40:19 GMT)
Uncertainty-Aware Artificial Intelligence for Gear Fault Diagnosis in Motor Drives [0.5] 本稿では,ベイジアンニューラルネットワーク(BNN)を用いたモータの故障診断の不確かさの定量化手法を提案する。
BNNはネットワーク重みを固定値ではなく確率分布として扱う。
ノイズの多いデータに対するロバスト性の改善、(b)モデル予測の解釈可能性の向上、(c)意思決定プロセスにおける不確実性を定量化する能力など、いくつかの利点がある。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:38:20 GMT)
The "LLM World of Words" English free association norms generated by large language models [0.5] 約12,000のcue語からなる人為的規範を「LLM World of Words」(LWOW)としてモデル化した「Small World of Words」(SWOW)
我々は人間とLLMが持つ概念的知識を表す意味記憶の認知ネットワークモデルを構築した。
これらのデータセットが、人間やLLMの暗黙の偏見を調査するためにどのように使用できるかを実証する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:54:14 GMT)
Exploring the Robustness of AI-Driven Tools in Digital Forensics: A Preliminary Study [0.5] 一部のツールは人工知能(AI)を利用して、検査されたデータを特定のカテゴリ(薬、武器、ヌードなど)に自動的にラベル付けする。
これにより、AIアルゴリズムが敵の攻撃に対して堅牢であることに対する深刻な懸念が持ち上がる。
我々は、X-Ways Forensicsが使用しているMagnetic AIとExcire Photo AIという、データ分類にAIを使用している最も重要な2つの法医学ツールを分析した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:48:53 GMT)
Plaquette-type valence bond solid state in the $J_1$-$J_2$ square-lattice Heisenberg model [0.5] J$-$J$正方格子ハイゼンベルクモデルにおけるバレンスボンド固相について検討する。
我々は,VBS相をPVBS型と同定し,VBS相に自発的な回転対称性の破れがないことを示す。
本研究は、二次元量子多体系の研究におけるFAMPSの能力を強調した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:01:20 GMT)
A Multi-Agent Reinforcement Learning Testbed for Cognitive Radio Applications [0.5] RFRL(Radio Frequency Reinforcement Learning)は、将来の無線通信システムにおいて重要な役割を果たす。
本稿では,RFRL Gym環境の更新について概説する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:49:59 GMT)
AI Benchmarks and Datasets for LLM Evaluation [0.5] EU AI Actは、2024年3月13日に欧州議会が提出したEUAIActを引用し、AIシステムの開発、配備、使用に関するEU全体の最初の包括的な要件を定めている。
AIシステムによって引き起こされる技術的課題に効果的に対処するために、この方法論を実用的なベンチマークで強化する必要性を強調している。
私たちは、AIベンチマークの収集と分類を目的とした、AI Safety Bulgariaイニシアチブ(citeAI_Safety_Bulgaria)の一部として、プロジェクトをローンチした。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 00:38:57 GMT)
Quantization of Visible Light by a Ni$_2$ Molecular Optical Resonator [0.4] ジニッケル錯体(Ni$$)は古典的な可視光をトラップして量子化し、個々の量子系またはジャイアンス・カミングス分子として振る舞う。
この結果は、環境条件下での量子光学現象のロバストなプラットフォームとしてNi$$を確立した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:34:15 GMT)
Quadruply Bonded Mo$_2$ Molecules: An Emitter-Resonator Integrated Quantum System in Free Space [0.4] 四重結合されたMo$$ユニットは、周囲の条件下で可視光の光子をトラップすることができることを示す。
この研究から得られた知見は、金属-金属結合化学、分子物理学、量子光学の理解を深めた。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:43:15 GMT)
GETAE: Graph information Enhanced deep neural NeTwork ensemble ArchitecturE for fake news detection [0.4] GETAEは、テキストコンテンツとソーシャルインタラクションを使って偽ニュースの検出を改善する新しいアンサンブルアーキテクチャである。
実際に公開されている2つのデータセットであるTwitter15とTwitter16で得られた実験結果は、このアプローチがフェイクニュースの検出を改善し、最先端モデルを上回ることを証明している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:59:50 GMT)
Dynamic Deep Learning Based Super-Resolution For The Shallow Water Equations [0.4] U-net型ニューラルネットワークによって頻繁に修正される20km分解能のシミュレーションは、10km分解能のシミュレーションの離散化誤差を達成できることを実証した。
このネットワークは、元々イメージベースの後処理の超解像のために開発されたもので、両方のメッシュ上のソリューションの違いを計算するために訓練されている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:17:21 GMT)
The Variant of Designated Verifier Signature Scheme with Message Recovery [0.4] 本稿では,メッセージ復元機構を組み込んだ強力なDesignated Verifier Signature(DVS)方式を提案する。
この研究は、UDVS(Universal Designated Verifier Signature)スキームの概念に触発されている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:27:43 GMT)
Enhancing the automatic segmentation and analysis of 3D liver vasculature models [0.4] 静脈木 - 門脈(開口)と肝(乾燥)の木は、肝解剖学と疾患状態を理解するのに重要である。
本研究の目的は, 血管の3次元分割, 骨格化, およびその後の解析を改善することである。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:06:32 GMT)
Language Models Benefit from Preparation with Elicited Knowledge [0.4] 言語モデル(LM)の2つのインスタンスを使用する単純なプロンプト技術であるPreprePを導入する。
PrePはドメイン固有のプロンプトエンジニアリングなしで様々なQAタスクに適用できる。
提案手法を,部品・材料分析データセットと3つの共感覚推論データセットで検証した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:10:37 GMT)
Phase transitions and remnants of fractionalization at finite temperature in the triangular lattice quantum loop model [0.3] 量子ループモデル (QLM) と量子二量体モデル (QDM) は局所的な制約を伴うアルテタイパル相関系である。
ここでは, 量子モンテカルロシミュレーションと場理論解析を通じて, 三角格子上のQLMの有限温度位相図について検討する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:55:29 GMT)
Estimating Treatment Effect under Additive Hazards Models with High-dimensional Covariates [0.3] 本稿では,治療効果推定と推定のための新しいスコア法を提案する。
本研究では,高次元付加的ハザードモデルに基づく条件付き治療効果の有効な推定法を提案する。
前立腺癌に対する根治的前立腺切除術の治療効果について検討した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:40:22 GMT)
Leverage Domain-invariant assumption for regularization [0.3] オーバーフィッティング(Overfitting)は、ニューラルネットワークがトレーニングセットとテストセットの間に顕著なパフォーマンスのギャップを示すとき、オーバーフィッティング(overfitting)と呼ばれる現象である。
textbfSamelossは、同じトレーニングセットのランダムなサブセットにまたがる特徴差を制約することで、モデルを正規化する適応的手法である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:21:31 GMT)
Hamiltonian characterisation of multi-time processes with classical memory [0.3] 開量子系の研究における中心的な問題は、非マルコフ過程の特徴付けである。
積固有状態を持つ時間依存ハミルトニアンは、常に特定の種類の古典記憶を生成することを示す。
また、最も一般的な古典記憶過程は量子回路によって生成可能であることを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 22:06:34 GMT)
The Future of Document Verification: Leveraging Blockchain and Self-Sovereign Identity for Enhanced Security and Transparency [0.3] 本稿では,ブロックチェーンや自己主権IDといった分散型技術を用いた新たな戦略を提案する。
従来のメソッドには、エンティティやリクエスタを検査するリアルタイムトラッキング機能が欠けている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:20:46 GMT)
A Survey on Deep Neural Networks in Collaborative Filtering Recommendation Systems [0.2] 本稿では、協調フィルタリング(CF)レコメンデーションシステムにおけるディープニューラルネットワーク(DNN)の利用について検討する。
DNNは、データ内の複雑な非線形関係を効果的にモデル化することができる。
本論文は、ディープラーニングによる協調フィルタリングシステムの強化における課題と今後の研究機会について論じる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:06:34 GMT)
Anomaly Detection in Medical Imaging -- A Mini Review [0.2] 本稿では,医療画像における関連異常検出論文の半発掘文献レビューを用いて,アプリケーションをクラスタリングする。
主な結果は、ラベル付きデータの必要性を減らすことで、現在の研究が主に動機付けされていることを示している。
また、脳MRI領域における多くの研究が成功し、OCTや胸部X線といったさらなる領域への応用の可能性を示している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:25:58 GMT)
Misalignments in AI Perception: Quantitative Findings and Visual Mapping of How Experts and the Public Differ in Expectations and Risks, Benefits, and Value Judgments [0.2] 本研究は,一般の公立および学術的AI専門家が,71のシナリオにおいてAIの能力と影響をどう認識するかを検討する。
参加者は、予測される確率、認識されるリスクと利益、全体的な感情(または価値)の4つの次元で各シナリオを評価した。
専門家は高い確率を予測し、低いリスクを知覚し、有用性を報告し、非専門家と比較してAIに対する好意的な感情を表現する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:51:45 GMT)
Object Tracking in a $360^o$ View: A Novel Perspective on Bridging the Gap to Biomedical Advancements [0.2] このレビューでは、オブジェクトトラッキングのテクニックを、伝統的、統計的、特徴ベース、機械学習のパラダイムに分類する。
本稿は,現在の手法の限界を考察し,次世代トラッキングシステムの開発を導く新たなトレンドを浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:43:50 GMT)
Classifying Simulated Gait Impairments using Privacy-preserving Explainable Artificial Intelligence and Mobile Phone Videos [0.2] 歩行障害を分類するための携帯電話ベースのプライバシ保護人工知能(AI)システムを提案する。
本データセットは, 正常歩行と6種類の病理歩行を模擬した訓練対象者の前頭・矢状視で構成する。
本システムでは,正面視と矢状視を併用して86.5%の精度を達成した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 02:35:40 GMT)
Sub-shot noise sensitivity via deformed four-headed kitten states [0.2] 本研究では,光子付加および減算操作によって誘導される2つのシュリンガー子猫状態の相空間における非古典的効果について検討した。
状態に多光子演算を適用すると、顕著なほぼ等方的な準プランク構造が得られる。
我々の状態におけるサブプランク構造の存在は、標準量子限界を超え、変位に対する感度を向上させる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:12:20 GMT)
Quantum steering for different types of Bell-like states in gravitational background [0.2] シュワルツシルトブラックホールの事象地平線付近のフェルミオンモードの4種類のベル様状態の量子ステアリングについて検討した。
最大の絡み合った状態のフェルミオン性は、ホーキング温度で突然死亡することを発見したのは興味深い。
従来の研究とは対照的に、この発見は、非最大絡み合った状態の量子ステアリングが、重力背景の量子タスクを処理するための最大絡み合った状態よりも有利であることを示している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 01:56:50 GMT)
Evaluation of Multi-Scale Multiple Instance Learning to Improve Thyroid Cancer Classification [0.2] 甲状腺癌は女性で5番目に多い悪性腫瘍である。
癌サブタイプの分化は治療および治療において重要であり、癌型のコンピュータ支援による自動分化は重要である。
バッチベースの複数のインスタンス学習アプローチと、bag-of-wordsのような集約を組み合わせたアプローチは、一般的なアプローチである。
この研究の貢献は、3つの異なるパッチ解決の特徴ベクトルを生成し、組み合わせることで、パッチベースの最先端メソッドを拡張することである。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:12:18 GMT)
Multimodal Medical Disease Classification with LLaMA II [0.1] 臨床報告に関連付けられた2次元胸部X線によるOpenIのテキストイメージペアデータセットを用いて検討した。
我々の焦点は、医療データセットから抽出したテキストと視覚情報を融合するための融合手法である。
新たに導入されたマルチモーダルアーキテクチャは、少ない労力で他のマルチモーダルデータセットに適用することができ、さらなる研究に容易に適応することができる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:18:07 GMT)
High-fidelity universal gates in the $^{171}$Yb ground state nuclear spin qubit [0.1] 単一キュービットゲートと2キュービットゲートを個別に制御し並列に適用した汎用高忠実ゲートセットを実証する。
これらの結果は、中性原子を用いた複雑で一般的な量子計算を実行するための重要なマイルストーンである。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:12:33 GMT)
Current, efficiency and entropic force of bosonic systems interacting with two thermal reservoirs [0.1] 本稿では,異なる温度で2つの貯水池と相互作用する中心系からなるボソニック系の電流と効率のダイナミクスについて検討する。
システム内のボソンの流れを表す電流を定量化し、その熱貯水池のパラメータと温度に依存することを解析する。
解析の結果,温度依存性や量子補正係数などの量子効果がエネルギー伝達効率に大きな影響を及ぼすことが示された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:58:41 GMT)
e-Fold Cross-Validation for Recommender-System Evaluation [0.1] e-fold Cross Validationは、電力使用量の削減を実現するために、フォールドの数を最小限にすることを目的としている。
平均e-foldクロスバリデーションでは10倍のクロスバリデーションに必要なエネルギーの41.5%しか必要とせず、その結果は1.81%しか変わっていない。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 00:05:20 GMT)
Enabling more efficient and cost-effective AI/ML systems with Collective Mind, virtualized MLOps, MLPerf, Collective Knowledge Playground and reproducible optimization tournaments [0.1] このホワイトペーパーでは、AI、ML、その他の新興ワークロードの実行方法を学ぶための、私の教育コミュニティイニシアチブを紹介します。
私は最小限の依存関係を持つ小型でポータブルなPythonパッケージとしてCollective Mindを作りました。
私は、学界と産業のコラボレーションを促進するために、CK、CM、CM4MLOpsをMLCommonsに寄付しました。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 00:12:35 GMT)
Revisiting MAE pre-training for 3D medical image segmentation [0.1] Self-Supervised Learning (SSL)は、未使用の膨大な臨床データセットの可能性を解放するエキサイティングな機会を提供する。
SSLは自然言語処理やコンピュータビジョンといった分野に革命をもたらし、その3D医療画像コンピューティングへの採用は、3つの重要な落とし穴によって制限されてきた。
本稿では,現在最先端のnnU-Netフレームワーク内の残留U-Netアーキテクチャを用いて,39kの脳MRIボリュームとiiの大規模データセットを活用することにより,これらの課題に対処する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:05:29 GMT)
My Voice, Your Voice, Our Voice: Attitudes Towards Collective Governance of a Choral AI Dataset [0.1] 15人の英国聖歌隊と共に、共同で作成したChoral AIデータセットのボトムアップデータガバナンスの機会を探る。
データを使用してトレーニングされた生成AIモデルに対する合唱的態度の調査によってガイドされた私たちは、オプトインを越えてオプトアウトする権限を持ったガバナンス構造を構築する機会を探ります。
私たちの発見が、データガバナンスのプラクティスを進化させ、生成的AIエコシステムにおける芸術コミュニティの創造的で強力な未来を形作る努力に貢献できることを願っています。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:14:20 GMT)
Variational formulation based on duality to solve partial differential equations: Use of B-splines and machine learning approximants [0.0] 流体力学における偏微分方程式(PDE)、固体における非弾性変形、過渡放物型方程式および双曲型方程式は、正確な原始的変動構造を持たない。
与えられたPDEを制約として扱うために、双対(ラグランジュ乗算器)場に基づく変分原理が提案された。
双対汎函数の最初の変項の消滅は、双対体上のディリクレ境界条件まで、原始PDE問題の弱形式である。
線形, 一次元, 過渡対流拡散方程式の二重弱形式を導出する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 07:53:47 GMT)
Variational autoencoders with latent high-dimensional steady geometric flows for dynamics [0.0] 我々はPDE型環境データに対する変分オートエンコーダ(VAE)の手法を開発し,幾何学的潜在力学を規則化する。
エンコーダとデコーダによって開発された中間ラテント空間において,幾何学的流れを考慮した多様体幾何学が学習されるようなVAEフレームワークを再開発する。
興味のあるデータセットで、我々の手法は、少なくとも従来のVAEと同様にパフォーマンスが良く、しばしばより良くなることを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:55:10 GMT)
Using text embedding models as text classifiers with medical data [0.0] 医療用テキストデータを用いてテキストのエンコーディングと分類を行う手段として,ベクトルデータベースと埋め込みモデルの利用について検討する。
しかし,データベース内の単純なデータによるクエリは性能に最適であった。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:35:55 GMT)
Universal on-chip polarization handling with deep photonic networks [0.0] 我々は、カスケードされたマッハ・ツェンダー干渉計の任意の機能を持つディープフォトニックネットワークのための新しい設計パラダイムを提案する。
広帯域な動作帯域で両偏光に対する干渉計アーム間の位相差を修正・訓練する。
ソフトウェア定義の物理インフォームドニューラルネットワークを用いて、3つの概念偏光処理装置を図示する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:31:31 GMT)
Unified framework for continuity of sandwiched Rényi divergences [0.0] サンドイッチした R'enyi の発散に関連するエントロピー量に対する連続性境界を証明した。
別個の寄与として、近似量子マルコフ鎖の安定性の研究にALAFF法を用いる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:21:34 GMT)
Unified Cramér-Rao bound for quantum multi-parameter estimation: Invertible and non-invertible Fisher information matrix [0.0] 量子多パラメータ推定において、未知のパラメータを推定する不確実性は、Cram'er-Rao bound (CRB)によって下界される。
これにより、分散量子センシングにおける推定の不確実性を束縛するために、CRBの弱い形式が用いられるようになった。
本研究では、制約パラメータに対するFIMのムーア-ペンローズ擬似逆数を用いた代替手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:40:50 GMT)
Two-Time Measurement of Entropy Transfer in Markovian Quantum Dynamics [0.0] いくつかの熱浴とのカップリングにより熱平衡から引き出された量子開系におけるエントロピー観測器の2回測定のためのプロトコルを検討する。
我々は、時間進化のマルコフ近似に集中し、そのような定義されたエントロピー変動の期待値と、レボリッツとスポンによるエントロピー生成のよく知られた表現を関連付ける。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 22:08:28 GMT)
Towards Type Agnostic Cyber Defense Agents [0.0] サイバー脅威は拡大を続けており、労働力不足とサイバーセキュリティのスキルギャップにつながっている。
多くのサイバーセキュリティ製品ベンダーやセキュリティ組織は、彼らの防衛を強化するために人工知能に目を向けてきた。
この研究は、サイバー防衛の自動化に対する一つのアプローチにおいて、攻撃者や防衛者を特徴づける方法について考察する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:32:18 GMT)
Towards Robust Interpretable Surrogates for Optimization [0.0] 最適化モデルの実践的実装において重要な要素は、意図したユーザによる受け入れである。
本研究では,不確実性をモデル化するための異なる変種に基づく適切なモデルと解法を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:31:48 GMT)
Topology Only Pre-Training: Towards Generalised Multi-Domain Graph Models [0.0] ノードとエッジの特徴排除に基づくグラフ事前学習手法であるトポロジー事前学習(ToP)を提案する。
事前学習データに存在しない領域を含む複数の領域から評価データセットを前向きに転送する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:44:25 GMT)
Thermalization of a Closed Sachdev-Ye-Kitaev System in the Thermodynamic Limit [0.0] 閉結合Majorana SYK系の力学を解析する。
最終定常状態はグリーンの機能とエネルギーに関して熱平衡に達する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:30:46 GMT)
The time-dependent quantum harmonic oscillator: a pedagogical approach via the Lewis-Riesenfeld dynamical invariant method [0.0] 我々は、ルイス=リースフェルト力学不変法を用いて、時間依存周波数を持つ量子調和振動子について、教育的アプローチで論じる。
例えば、その周波数でジャンプする高調波発振器に付随する遷移確率の計算と、ポールトラップ内の量子粒子のダイナミクスの解析を行う。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:59:01 GMT)
The First 50 Years of Software Reliability Engineering: A History of SRE with First Person Accounts [0.0] ソフトウェア信頼性(Software Reliability)は、ソフトウェア工学とともに、技術的規律として50年に及ぶマイルストーンを突破した。
本稿では、ソフトウェア信頼性工学のルーツを、ソフトウェア以前の歴史から分野の始まりまで遡る。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:33:07 GMT)
Text Clustering with Large Language Model Embeddings [0.0] テキストクラスタリングの有効性は、テキスト埋め込みとクラスタリングアルゴリズムの選択に大きく依存する。
大規模言語モデル(LLM)の最近の進歩は、このタスクを強化する可能性を秘めている。
LLM埋め込みは構造化言語の微妙さを捉えるのに優れていることを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:26:56 GMT)
Teaching Quantum Formalism and Postulates to First-Year Undergraduates [0.0] 唯一の前提条件はベクトルドット積に精通することである。
このアプローチにより、学生はディラック表記と量子力学のコア仮定を学術的キャリアのずっと早い段階で学べる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 22:39:34 GMT)
Task Adaptation of Reinforcement Learning-based NAS Agents through Transfer Learning [0.0] 異なるタスク間を移動させる強化学習エージェントの能力を評価する。
1つのタスクを除いて1つのタスクでエージェントを事前訓練することは、他のタスクにおけるエージェントのパフォーマンスに有益であることがわかった。
また、エージェントのトレーニング手順を、他のタスクで事前訓練することで、大幅に短縮できることを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:00:27 GMT)
Systematic review and characterisation of malicious industrial network traffic datasets [0.0] 本稿では,公開可能なネットワークトラフィックキャプチャに基づくデータセットを体系的にレビューする。
これには、含まれた攻撃タイプの分類、メタデータのレビュー、統計分析、複雑さ分析が含まれる。
研究者にメタデータを提供し、研究の質問に最適なデータセットを選択するのに使用できる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 22:30:22 GMT)
Superposing and gauging fermionic Gaussian projected entangled pair states to get lattice gauge theory groundstates [0.0] ゲージ付きガウスフェルミオン射影アンタングルペア状態(GGFPEPS)は格子ゲージ理論の基底状態に対する新しいタイプのアンザッツ状態を形成する。
本稿では,PEPS の非ガウス性がガウス的 PEPS の重ね合わせから従う場合において,観測可能量の効率的な計算のための枠組みを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:31:20 GMT)
Spin Qubit Performance at the Error Correction Threshold: Advancing Quantum Information Processing Above 700 mK [0.0] 本稿では,SiGeの6量子ドットアレイにおける2量子プロセッサの特性について述べる。
スピン量子ビットと集積極低温エレクトロニクスを組み合わせるため,300mKおよび740mKでの量子ビットの性能評価を行った。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:08:52 GMT)
Some mathematical issues regarding a new approach towards quantum foundation [0.0] 最も弱い可能性定理は、量子論のヒルベルト空間形式論の基礎を与えるものである。
必要な仮定は定式化され、数学は詳細に綴られる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:53:10 GMT)
Social Media Data Mining With Natural Language Processing on Public Dream Contents [0.0] 本研究では,Redditのr/Dreamsコミュニティで共有されている夢の内容を分析し,パンデミックがメンタルヘルスに与える影響について検討した。
先パンデミック期から後パンデミック期への夢の肯定性,否定性,中立性の変化を評価する。
本研究の目的は、ドリーム内容のパターンを明らかにすることであり、パンデミックの心理的影響についての洞察を提供することである。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 02:34:02 GMT)
Single-Photon Generation: Materials, Techniques, and the Rydberg Exciton Frontier [0.0] 単一光子エミッタは、バーストやストリームで個々の光子を生成する。
量子鍵分布、量子リピータ、測定ベースの量子コンピューティングなどの新興量子技術において最重要である。
本稿では, 決定論的, 制御された単一光子生成を伴う材料システムについて述べる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:56:19 GMT)
Simultaneously optimizing symmetry shifts and tensor factorizations for cost-efficient Fault-Tolerant Quantum Simulations of electronic Hamiltonians [0.0] フォールトトレラント量子コンピューティングにおいて、ハミルトニアン固有値を計算するコストは、ユニタリ回路で符号化されたハミルトニアン行列の一定のスケーリングに比例する。
電子ハミルトニアンのこのスケーリング定数をユニタリの線形結合として表現する手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:02:16 GMT)
Sample Complexity Bounds for Linear System Identification from a Finite Set [0.0] 我々は、真のシステムを特定するために、最大可能性推定器を使用する。
情報理論のツールを活用して、サンプルの複雑さを低くする。
得られたサンプル複雑性境界を解析的および数値的に解析する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:03:32 GMT)
SL-YOLO: A Stronger and Lighter Drone Target Detection Model [0.0] 本稿では,小型目標検出のボトルネックを解消する革命モデルSL-YOLO(Stronger and Lighter YOLO)を提案する。
本稿では,最も難易度の高い環境においても,非並列検出精度を確保することのできる,大規模機能融合の先駆的手法を提案する。
VisDrone 2019データセットの実験結果によると,mAP@0.5が43.0%から46.9%に向上した。
モデルパラメータは 11.1M から 9.6M に減少し、FPS は 132 に到達し、資源制約のある環境でのリアルタイムの小さな物体検出に理想的な解となる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:58:49 GMT)
Representation Learning for Time-Domain High-Energy Astrophysics: Discovery of Extragalactic Fast X-ray Transient XRT 200515 [0.0] 高エネルギーデータセットにおける異常検出や教師なし過渡分類といった下流タスクの表現学習手法を提案する。
このアプローチにより、チャンドラアーカイブに新しい高速X線トランジェント(FXT)、XRT 200515、ニードル・イン・ザ・ヘイスタックイベント、チャンドラFXTが発見された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:48:31 GMT)
Reducing PEC Overhead by Pauli Error Propagation [0.0] 量子エラー軽減は、短期的な量子ユーティリティへのパスとみなされる。
本稿では,クリフォード回路上でのPECのサンプリングオーバーヘッドを低減する手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:25:40 GMT)
Reconstructing shared dynamics with a deep neural network [0.0] 本稿では,時系列から隠れた共有ダイナミクスを2モジュールのフィードフォワードニューラルネットワークアーキテクチャにより同定する手法を提案する。
この手法は、実験的な介入が不可能な力学系の隠れた構成要素を明らかにする可能性がある。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:09:54 GMT)
Rashomon effect in Educational Research: Why More is Better Than One for Measuring the Importance of the Variables? [0.0] この研究は、決定木、ランダムな森林、軽いGBM、XGBoostアルゴリズムを用いてトレーニングされた、シンプルなyet-accurateモデルのRashomonセットを使用する。
その結果,Rashomonセットは予測精度を2~6%向上させることがわかった。
imd_band と highest_education が重要視されたが,その重要性はコースによって異なっていた。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:05:36 GMT)
Ranking by Lifts: A Cost-Benefit Approach to Large-Scale A/B Tests [0.0] 本研究は、偽発見率(FDR)制御を受ける利益を最大化する決定論的枠組みを開発する。
我々はこの問題に対する経験的ベイズ解をgreedy knapsackアプローチで構築する。
我々のオラクル決定ルールは大規模テストに有効で最適です。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:31:12 GMT)
Quasiparticle Picture for Entanglement Hamiltonians in Higher Dimensions [0.0] 我々は、流体力学スケールにおける平衡外絡ハミルトニアンの効果的な説明を得るために、絡み合い進化の準粒子図を用いている。
ボールスケールで有効なハミルトン交絡解析式を得る。
いくつかの初期構成から得られた量子クエンチを考慮し、精度よく結果を検証する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:28:36 GMT)
Quantum-critical and dynamical properties of the XXZ bilayer with long-range interactions [0.0] 反強磁性非フラストレーション長範囲相互作用を持つXXZ正方格子二層モデルについて検討した。
等方点における3d XY と Ising の2つの拡張領域と 3d Heisenberg 臨界指数を観察する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:43:25 GMT)
Quantum tensor network algorithms for evaluation of spectral functions on quantum computers [0.0] テンソルネットワークから導かれる量子アルゴリズムを用いて,量子多体系の静的および動的特性をシミュレートする。
量子コンピュータ上で基底状態と励起状態を作成し、分子ナノマグネット(MNM)に応用するアルゴリズムをパラダイムとして示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:10:22 GMT)
Quantum microwaves: stabilizing squeezed light by phase locking [0.0] マイクロ波空洞に結合したジョセフソン接合は、量子特性を持つマイクロ波の汎用的で単純な光源である。
この手法の欠点は、ジャンクションの位相を乱すバイアス電圧ノイズに悩まされることである。
そこで本稿では,dc-bias または空洞に直接小さな ac 参照信号を加えることで,システムの安定化とノイズに対する感度の抑制を図っている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:51:26 GMT)
Quantum criticality and universality in stationary state of long-range Kitaev model [0.0] 北エフ鎖の長期定常状態における量子臨界性のシグネチャについて検討する。
我々は、$alpha$の値に関係なく、臨界臨界クエンチが定常状態においても量子臨界性を示すことを示した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:29:27 GMT)
Quantum conformal symmetries for spacetimes in superposition [0.0] 我々は、明快な量子作用素を構築し、時空の重ね合わせに量子場を記述する状態と、ミンコフスキーの背景に質量の重ね合わせを持つ量子場を表す状態とをマッピングする。
曲がりくねった時空における粒子生成の現象を同値な同値な時空にインポートするために使用することができ、改良されたミンコフスキー時空における新しい特徴を明らかにすることができる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:14:52 GMT)
Quantum Teleportation Game -- A fun way to play and learn single qubit teleportation protocol [0.0] 我々は,Alice, Bob, *Quantum God*という3人の参加者がプレイできるシンプルなゲームの設計によって,単一量子ビットの量子テレポーテーションプロトコルをどのように理解できるかを実証する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:33:01 GMT)
Quantum Pointwise Convolution: A Flexible and Scalable Approach for Neural Network Enhancement [0.0] 本稿では,量子ニューラルネットワークフレームワークにポイントワイズ畳み込みを組み込んだ新しいアーキテクチャを提案する。
量子回路を用いてデータを高次元空間にマッピングし、より複雑な特徴関係を捉える。
実験では、FashionMNISTとCIFAR10データセットの分類タスクに量子ポイントワイズ畳み込み層を適用した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:03:59 GMT)
Prospects for quantum process tomography at high energies [0.0] 量子情報理論において、開量子系の進化は量子チャネルまたはより一般的には量子機器によって記述される。
我々は、コライダー実験におけるスピンと測定を量子機器として定式化する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:00:00 GMT)
Preserving Information: How does Topological Data Analysis improve Neural Network performance? [0.0] 本稿では,画像認識におけるトポロジカルデータ解析(TDA)と畳み込みニューラルネットワーク(CNN)の統合手法を提案する。
我々のアプローチは、ベクトルスチッチ(Vector Stitching)と呼ばれ、生画像データと追加のトポロジ情報を組み合わせたものである。
実験の結果は,追加データ解析の結果をネットワークの推論プロセスに組み込むことの可能性を強調した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:43:56 GMT)
Predicting the Impact of Scope Changes on Project Cost and Schedule Using Machine Learning Techniques [0.0] 本研究の目的は、機械学習技術を用いて、スコープ変更がプロジェクトコストやスケジュールに与える影響を推定する予測モデルを開発することである。
本研究は,プロジェクトタスクに関する詳細な情報を含む包括的データセットを利用する。
生産性率、スコープ変更の大きさ、タスク依存性、推定コスト、実際のコスト、期間、および特定のWBS要素が強力な予測因子であることが確認された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 23:54:00 GMT)
Overscreened spin-$\frac{1}{2}$ Kondo impurity and Shiba state at the edge of a one-dimensional spin-1 superconducting wire [0.0] 本研究では,超伝導がオーバースクリーンされた近藤効果と競合するシステムについて検討する。
コンドスクリーニングと超伝導の競合は、豊富な相構造をもたらす。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:20:11 GMT)
Optimizing Genetic Algorithms Using the Binomial Distribution [0.0] 実行速度はランダム性の実装方法に大きく依存する。
ビットフリップ突然変異、一様交叉、制御ループの最適化方法を示す。
我々はオープンソースのJavaライブラリChips-n-Salsaにアプローチを実装します。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 22:26:47 GMT)
Optimizing Domain-Specific Image Retrieval: A Benchmark of FAISS and Annoy with Fine-Tuned Features [0.0] 近似Nearest Neighborサーチは、多くのアプリケーションにおいて、高速なデータ検索性能の鍵の1つである。
我々は、カスタム画像データセット上でインデックス時間、メモリ使用量、クエリ時間、精度、リコール、F1スコア、リコール@5に関するシステムを評価する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:43:06 GMT)
Open Source Evolutionary Computation with Chips-n-Salsa [0.0] 本稿では,Chips-n-Salsaが現在提供している進化的アルゴリズムについて述べる。
Chips-n-Salsaの進化的アルゴリズムは適応突然変異と交叉率を持つ実装を含んでいる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 22:18:31 GMT)
On the Unknowable Limits to Prediction [0.0] ある種の誤りは差分速度で排除できると論じる。
我々は予測可能性が情報集合に依存し、予測不可能性の早期主張に注意を払っていることを論じる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:42:48 GMT)
Object-Size-Driven Design of Convolutional Neural Networks: Virtual Axle Detection based on Raw Data [0.0] 本研究では,橋梁上に任意に設置したセンサを用いた列車軸受のリアルタイム検出手法を提案する。
VADER(Virtual Axle Detector with Enhanced Receptive Field)の開発は、単線鉄道橋上で検証されている。
生データを入力として使用することで、最先端のスペクトログラムベースの手法をスピードとメモリ使用率の両方で99%向上させた。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 10:26:39 GMT)
Noise Injection Reveals Hidden Capabilities of Sandbagging Language Models [0.0] ノイズ注入による砂袋の挙動検出のための新しいモデル非依存手法を提案する。
我々は,この手法をモデルサイズおよび複数選択質問ベンチマーク(MMLU, AI2, WMDP)で検証する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:34:51 GMT)
Noise Classification in Three-Level Quantum Networks by Machine Learning [0.0] 小型量子ネットワークに作用する雑音の機械学習に基づく分類について検討する。
教師あり学習は,システムに影響を及ぼす古典的嫌悪音の種類を分類できることを示す。
この結果は、量子アーキテクチャにおけるノイズの空間的相関を分類する方法を舗装する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:13:36 GMT)
Network Simulation with Complex Cyber-attack Scenarios [0.0] ネットワーク侵入検知(NID)システムは、複雑なサイバー攻撃を検出する機械学習(ML)モデルの恩恵を受けることができる。
本稿では,複雑な攻撃シナリオを持つNIDデータセット作成のためのネットワークシミュレーションソリューションを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:00:53 GMT)
Multimodal Perception System for Real Open Environment [0.0] 提案システムには、組み込み計算プラットフォーム、カメラ、超音波センサー、GPS、IMUデバイスが含まれる。
従来のフレームワークとは異なり、私たちのシステムは複数のセンサーと高度なコンピュータビジョンアルゴリズムを統合し、ユーザーが確実に外を歩けるようにします。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:17:25 GMT)
Mitigating Bias in Queer Representation within Large Language Models: A Collaborative Agent Approach [0.0] 大きな言語モデル(LLM)は、しばしば代名詞の用法においてバイアスを持続させ、キーア個人を誤って表現したり排除したりする。
本稿では、LLM出力における偏り付き代名詞の使用の特定の問題、特に伝統的性別付き代名詞の不適切な使用について論じる。
本稿では,これらのバイアスを軽減するための協調的エージェントパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:36:45 GMT)
MiningGPT -- A Domain-Specific Large Language Model for the Mining Industry [0.0] マイニングGPTは,マイニングドメイン固有の命令追従 7B パラメータ LLM モデルであり,マイニングドメイン知識テストのスコアは親モデル Mistral 7B よりも14%高かった。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:47:59 GMT)
Methods for generating and evaluating synthetic longitudinal patient data: a systematic review [0.0] データ可用性の急激な成長は、研究と開発を促進するが、法律とプライバシーの制約により、すべての産業が平等に利益を得ているわけではない。
医療セクターは、データセキュリティと機密性に関する懸念から、患者データの利用において重大な課題に直面している。
これを解決するために、合成データ生成を含む様々なプライバシ保護手法が提案されている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:36:45 GMT)
Long-distance feedback to cold atoms coupled to an optical nanofiber [0.0] レーザー冷却原子試料が生成した自発発光光子の時間遅延後に同じ試料との相互作用について検討した。
光子は光ナノファイバーに放出され、従来の光ファイバの長さに接続され、ファイバーブラッググレーティングミラーを用いて反射される。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:15:17 GMT)
Learning General Representation of 12-Lead Electrocardiogram with a Joint-Embedding Predictive Architecture [0.0] 本稿では,12誘導ECG分析のための自己教師型学習モデルECG-JEPAを紹介する。
隠れた潜在空間で予測することで、ECGデータのセマンティック表現を学習する。
ECG-JEPAは、ECG分類や特徴予測を含む様々な下流タスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:16:19 GMT)
Learning Ensembles of Vision-based Safety Control Filters [0.0] 制御システムの安全フィルタは、安全制約に違反する名目制御を補正する。
この課題に取り組むためのディープラーニングベースのアプローチが最近提案されている。
本研究では,これらのフィルタの精度向上と分布外一般化におけるアンサンブルの有効性を実証的に検討する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 23:19:31 GMT)
LUMIA: Linear probing for Unimodal and MultiModal Membership Inference Attacks leveraging internal LLM states [0.0] メンバーシップ推論攻撃(MIAs)を検出する方法として線形プローブ(LP)を提案する。
LUMIAと呼ばれる我々の手法は、LPを層単位で適用し、モデル内動作の詳細なデータを取得する。
単調なMIAでは、LUMIAは以前の手法に比べて平均15.71%上昇している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:58:20 GMT)
Krylov Complexity in early universe [0.0] 我々は、放射支配期(RD)や物質支配期(MD)など、初期の宇宙の様々な段階におけるクリロフの複雑性について検討する。
スケール係数に関連する(r_k)と(phi_k)の進化方程式を最初に計算する。
この研究は、量子情報の観点から宇宙を探索する新たな洞察を提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:15:32 GMT)
Jacobian-Enforced Neural Networks (JENN) for Improved Data Assimilation Consistency in Dynamical Models [0.0] 機械学習ベースの天気モデルは正確な予測を生成する上で大きな可能性を示してきたが、データ同化タスクに適用した場合に苦労した。
本研究では、ニューラルネットワーク(NN)をエミュレートした力学系におけるDA整合性を高めるために設計された、Jacobian-Enforced Neural Network(JENN)フレームワークを紹介する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 00:12:51 GMT)
Improved Large Language Model Jailbreak Detection via Pretrained Embeddings [0.0] 本稿では,従来の機械学習分類アルゴリズムを用いた検索に適したペアリングテキスト埋め込みに基づくジェイルブレイクプロンプトの検出手法を提案する。
当社のアプローチは,オープンソースのLLMセキュリティアプリケーションから入手可能なすべてのメソッドを上回ります。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:35:43 GMT)
Imprecision plateaus in quantum steering [0.0] 測定精度のしきい値まで導入しても影響を受けないステアリングの不等式について報告する。
本稿では, インプレクション・プラトーがなぜ可能か, それらの存在の簡単な基準, それらの特性を解析するためのツールについて説明する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:00:52 GMT)
Implementing Semiclassical Szegedy Walks in Classical-Quantum Circuits for Homomorphic Encryption [0.0] 量子ホモモルフィック暗号化(QHE)は、基礎となる情報を明らかにすることなく、量子データのセキュアな計算を容易にする新興技術である。
我々は、古典量子回路を通してQHEスキームを解釈し、効率を向上し、鍵計算に関連する以前の制限に対処する。
提案手法は,シミュレーション中に鍵をリアルタイムに計算することで指数的鍵準備の必要性を排除し,古典的に制御されたゲートの線形複雑化につながる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:50:48 GMT)
If Eleanor Rigby Had Met ChatGPT: A Study on Loneliness in a Post-LLM World [0.0] 孤独感は、人の精神的および身体的健康に大きな影響を及ぼす。
これまでの研究では、大きな言語モデル(LLM)が孤独を和らげる可能性があることが示唆されている。
この目的のために設計されていないため、ChatGPTのような広範なLLMの使用はより一般的であり、リスクが高いと我々は主張する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:39:00 GMT)
Human-centred test and evaluation of military AI [0.0] REAIM 2024 Blueprint for Actionは、軍事領域におけるAIアプリケーションは倫理的かつ人間中心であるべきだと述べている。
AIシステムの開発と展開におけるTEVVは、ライフサイクルを通して人間のユーザを巻き込む必要がある。
従来の人間中心のテストと評価方法は、デプロイされたAIシステムに適応する必要がある。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:14:55 GMT)
Holevo bound and objectivity in the boson-spin model [0.0] 開量子系のボソンスピンモデルに量子チャネル理論を適用する。
我々は、リコイルレス近似とフロケ理論を用いて、チャネルの容量を束縛するホレボ量を計算する。
また, 温度, トンネルエネルギーなどのモデルパラメータの複雑な依存性も分析した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:11:21 GMT)
Hilbert space separability and the Einstein-Podolsky-Rosen state [0.0] ヒルベルト空間の非分離性を目撃するテストを提案する。
我々は、元のアインシュタイン-ポドルスキー-ローゼン状態(EPR)を、分離可能なヒルベルト空間内の任意の状態よりも強い非局所相関を持つ候補とみなす。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:00:03 GMT)
High-resolution, Wide-frequency-range Magnetic Spectroscopy with Solid-state Spin Ensembles [0.0] 我々は、高密度NVアンサンブルにおける量子周波数混合(QFM)効果とコヒーレント平均同期読み出し(CASR)を融合した高分解能磁気分光プロトコルを実験的に実証した。
我々は、このQFM-CASRプロトコルの感度を10$,$MHz から 4$,$GHz の周波数範囲で評価する。
狭帯域磁気分光のための最先端のNVダイアモンド技術と比較して、QFM-CASRプロトコルは検出可能な周波数範囲を大幅に拡張する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 23:53:24 GMT)
High-fidelity multipartite entanglement creation in non-Hermitian qubits [0.0] 非エルミート超伝導量子ビットにおける多重粒子の絡み合い特性について検討する。
我々の結果は、非エルミート量子ビット系におけるマルチパートエンタングルメント世代の新しい量子工学に光を当てることができる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:17:44 GMT)
Heisenberg-limited continuous-variable distributed quantum metrology with arbitrary weights [0.0] 任意の関数のDQMを達成するのに必要な最小の入力資源と線形ネットワークの完全な理解を提供する。
2つの非真空入力、1つの非古典的入力は、ハイゼンベルク極限において任意の重みを持つDQMを達成するのに必要な最小値であることを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:19:46 GMT)
Harnessing AI in Secondary Education to Enhance Writing Competence [0.0] ChatGPTは中等教育における筆記スキルの発展に重要な意味を持っている。
本研究は,AIが学生の筆記能力と個人音声に与える影響について検討する。
私たちは、教育におけるAIに対するバランスのとれたアプローチを提唱し、教師の指導に取って代わるのではなく、サポートすることを保証します。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:14:25 GMT)
HackSynth: LLM Agent and Evaluation Framework for Autonomous Penetration Testing [0.0] 本稿では,Large Language Model (LLM) をベースとした,自律的な浸透試験が可能なエージェントであるHack Synthを紹介する。
Hack Synthをベンチマークするために、人気のあるプラットフォームであるPicoCTFとOverTheWireを利用する2つの新しいCapture The Flag(CTF)ベースのベンチマークセットを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:28:18 GMT)
Generating non-Clifford gate operations through exact mapping between Majorana fermions and $\mathbb{Z}_4$ parafermions [0.0] 本稿では,Majorana fermions から $mathbbZ_4$parafermions への正確なマッピングを確立する。
マヨラナフェルミオンのブレイディングは、$mathbbZ_4$パラフェルミオンで囲まれた4次元のキュイト表現において、非クリフォード量子ゲートにつながる可能性がある。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:40:38 GMT)
Generalised second law beyond the semiclassical regime [0.0] 一般化された第二法則が半古典的極限を超える全ての順序に対して摂動重力を持つことを証明する。
我々の証明は代数的手法を用いており、ファウルクナーとスペランザの最近の研究に基づいている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:00:15 GMT)
Fair Mixed Effects Support Vector Machine [0.0] 機械学習の公正性は、トレーニングデータに存在するバイアスを緩和し、不完全性をモデル化することを目的としている。
これは、モデルが民族性や性的指向といった繊細な特徴に基づいて決定するのを防ぐことで達成される。
両問題を同時に処理できるベクターマシンアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:47:51 GMT)
Fair Generalized Linear Mixed Models [0.0] 機械学習の公正性は、データとモデルの不正確さのバイアスが差別的な決定に結びつかないことを保証することを目的としている。
両問題を同時に処理できるアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:49:26 GMT)
Eyes on the Road: State-of-the-Art Video Question Answering Models Assessment for Traffic Monitoring Tasks [0.0] 本研究では、非ベンチマーク合成および実世界のトラフィックシーケンスを用いて、最先端のビデオQAモデルの評価を行う。
VideoLLaMA-2は57%の精度で進行する。
これらの知見は、トラフィック監視におけるVideoQAの可能性を裏付けるだけでなく、多目的追跡、時間的推論、合成機能の改善の必要性も強調している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 05:15:32 GMT)
Estimation during Design Phases of Suitable SRAM Cells for PUF Applications Using Separatrix and Mismatch Metrics [0.0] 物理的に拘束不能な暗号関数(PUF)は、デバイス認証と秘密鍵作成において、低コストのプリミティブとして使用される。
パワーアップ過程における非決定論的ノイズ環境のため、PUFはチャレンジ応答の再現性が低い。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:47:37 GMT)
Erasure conversion in Majorana qubits via local quasiparticle detection [0.0] マヨラナ系量子ビットにおける準粒子中毒は、基礎となるトポロジカルな性質によって抑制されない。
本研究は, 局所準粒子検出に基づく消去変換法を開発することにより, 誤差に対処する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 23:56:53 GMT)
Equality of magnetization and edge current for interacting lattice fermions at positive temperature [0.0] 格子フェルミオンのモデルの大きなクラスに対して,磁化は熱力学的限界におけるエッジ電流と等しいことを証明した。
このようなバルクエッジ対応は、本質的にはギブス状態のバルクおよび局所性における均質性の結果であることを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:46:57 GMT)
Ensemble data assimilation to diagnose AI-based weather prediction model: A case with ClimaX version 0.3.1 [0.0] 本研究では,AIに基づく天気予報モデルの診断にアンサンブルデータ同化を用いた手法を提案する。
AIベースのモデルであるClimaXを用いた実験では、AIベースの天気予報モデルに対して、アンサンブルデータ同化が安定して周期化されることが実証された。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:27:06 GMT)
Enhancing Deep Learning Model Robustness through Metamorphic Re-Training [0.0] 本稿では,データにメタモルフィック関係を適用するメタモルフィック・リトレーニング・フレームワークを提案する。
このフレームワークは、FixMatch、FlexMatch、MixMatch、FullMatchなど、複数の半教師付きリトレーニングアルゴリズムを統合している。
結果から,ロバストネス指標では,各モデルに平均17%の平坦度が認められた。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:38:03 GMT)
Enhanced feature encoding and classification on distributed quantum hardware [0.0] 量子支援ベクトルマシン(QSVM)のための新しい特徴マップ最適化手法を提案する。
ノイズの多い量子デバイスにおいて重要な要素である、キュービット接続、ネイティブゲートセット、回路深さなど、バックエンド固有のパラメータを考慮に入れます。
この研究は、各量子処理ユニット(QPU)を同じトポロジを持つ複数のサブユニットに分割して、個別のQSVMインスタンスを実装した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:14:37 GMT)
Electrodynamics of Vortices in Quasi-2D Scalar Bose-Einstein Condensates [0.0] 準2次元(準2次元)スカラーボース・アインシュタイン凝縮体(BEC)における渦の双対性を導入する。
準2次元スカラーBECの渦を点渦近似を超えた2次元電磁力学にマッピングする方法を示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:05:26 GMT)
Electrically controlled focusing of de Broglie matter waves by Fresnel zone plate [0.0] フレネルゾーンプレート(FZP、Fresnel Zone Plates)は、当初は光の操作用に設計されていたが、現在では物質波の応用が拡大している。
FZPバイアスは、原子と表面の相互作用を誘起偏極ポテンシャルに変化させることにより、中性原子の回折焦点を変調する。
発見は、ヘリウム顕微鏡の性能向上など、原子光学の様々な新しい応用に役立ちます。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:11:31 GMT)
Dynamical Logical Qubits in the Bacon-Shor Code [0.0] Bacon-Shor符号(Bacon-Shor code)は、重み2チェック演算子からなる量子誤り訂正サブシステム符号である。
Floquetコードと見なすと、いくつかの動的論理量子ビットをホストできることを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:22:15 GMT)
Dynamic Evolution of Quantum Fisher and Skew Information under Decoherence in Three-Qubit X-States [0.0] 位相減衰と位相フリップチャネルは一般に脱分極よりもパラメータ推定が優れていることを示す。
本研究は,多ビット交絡状態を含む量子力学的タスクにおける精度を高めるために,雑音チャネルの最適選択に関する知見を提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:19:06 GMT)
Dynamic Estimation of Learning Rates Using a Non-Linear Autoregressive Model [0.0] 本稿では,モーメントの概念を取り入れた適応非線形自己回帰モデルを提案する。
本枠組みでは,学習率の異なる3つの推定器を提案し,その収束の理論的証明を提供する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:39:06 GMT)
Discovering influential text using convolutional neural networks [0.0] 本稿では,畳み込みニューラルネットワークを用いたテキストに対する人間の反応を予測可能な類似文句のクラスタを発見する手法を提案する。
提案手法を2つのデータセットに適用し,まず,結果の原因となるフレーズをモデルが検出する能力の直接検証を可能にする。
どちらの場合も、モデルはベンチマーク手法よりも多種多様なテキスト処理を学習し、これらのテキスト機能は、ベンチマーク手法が結果を予測する能力を定量的に満たしたり、超えたりすることができる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:31:59 GMT)
Digital Epidemiology: Leveraging Social Media for Insight into Epilepsy and Mental Health [0.0] ソーシャルメディアプラットフォーム、特にRedditのr/Epilepsyコミュニティは、てんかん(PWE)患者とその介護者の経験についてユニークな視点を提供している。
本研究は,57kの投稿と533kのコメントを分析し,年齢,性別,関係性などの重要テーマを探索する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:35:25 GMT)
Differentially Private Zeroth-Order Methods for Scalable Large Language Model Finetuning [0.0] プリトレーニング済みLLMのDP微調整は、タスク固有のデータセットのプライバシ保護に広く用いられている。
DP-SGDのスケーラビリティを限界まで押し上げたにもかかわらず、DP-SGDベースの微調整法は残念ながらSGD固有の非効率性によって制限されている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 12:29:47 GMT)
Detecting Memorization in Large Language Models [0.0] 大規模言語モデル(LLM)は自然言語処理において驚くべき結果を得たが、トレーニングデータの一部を記憶する傾向にある。
従来の暗記検出方法は出力確率や損失関数に依存している。
LLM内のニューロンの活性化を調べることによって,記憶を正確に検出する解析手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 00:17:43 GMT)
Det-SAM2:Technical Report on the Self-Prompting Segmentation Framework Based on Segment Anything Model 2 [0.0] 本報告では,Det-SAM2フレームワーク全体の構築と,SAM2に適用されたその後の工学的最適化について述べる。
我々は,Det-SAM2フレームワーク上に構築されたアプリケーションを実演する事例を提示する: ビジネスコンテキストから派生したビリヤードシナリオにおけるAIレファリング。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 02:01:05 GMT)
Designing Optically Addressable Nitrogen-Vacancy Centers in Ultra-Small Nanodiamonds: Insights from First-Principles Calculations [0.0] 超小型ナノダイヤモンド(USND)における色中心の第1原理電子構造計算について述べる。
ナノ粒子がフッ素, ヒドロキシル, エーテルによって停止した場合, 窒素空孔 (NV-) は負の電荷状態で安定化できることがわかった。
興味深いことに、配列中の単一粒子エネルギーレベルのフォノン再正規化は負電荷のNV中心の電荷安定性に寄与する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 21:09:15 GMT)
Deep Learning 2.0: Artificial Neurons That Matter -- Reject Correlation, Embrace Orthogonality [0.0] ヤット生産型ニューラルネットワークであるニューラルマターネットワーク(NMN)を導入する。
NMNは活性化機能のない非線形パターン認識を実現する。
Yat-MLPは、単純さと有効性を組み合わせたニューラルネットワーク設計の新しいパラダイムを確立する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:20:08 GMT)
Deep Guess acceleration for explainable image reconstruction in sparse-view CT [0.0] スパースビューCT(Sparse-view Computed)は、医療画像における放射線線量を減らすために設計された新しいプロトコルである。
従来のフィルタバックプロジェクションの復元は、スパースデータによる深刻なアーティファクトに悩まされている。
対照的に、モデルベース反復再建(MBIR)は、臨床的使用には計算コストがかかりすぎる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:49:42 GMT)
Deep Dynamics: Vehicle Dynamics Modeling with a Physics-Constrained Neural Network for Autonomous Racing [0.0] 本稿では,自律レースカーの車両動力学モデリングのための物理拘束型ニューラルネットワーク(PCNN)であるDeep Dynamicsを紹介する。
物理係数推定と力学方程式を組み合わせて、高速で車両状態を正確に予測する。
物理ベースのシミュレータとフルスケールの自律型インディレースカーデータを使用したオープンループとクローズドループのパフォーマンス評価は、ディープダイナミクスをレースカーのダイナミックをモデル化するための有望なアプローチとして強調する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 01:38:05 GMT)
Decoherence Implies Information Gain [0.0] 量子系の波動関数が、所望の可観測性に関連するデコヒーレンス基底における密度行列の対角要素が一定であるような任意のランダム変換を受けると、密度行列の対角要素は大きさ的に小さくなる。
その結果、システムと環境の相互作用がどのようにランダムな状態変換を生成するかの詳細には依存せず、情報損失ではなく、一般にデコヒーレンスが情報ゲインにつながることを示唆している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:25:34 GMT)
Cryptographic Keywords in NVD: Statistics and Visualization [0.0] 暗号キーワードを使用し、National Vulnerability Databaseに公開された脆弱性を分析するための予備的な試みが紹介されている。
ベーシックな統計と可視化が論文に含まれている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:06:53 GMT)
Counterfactual restrictions and Bell's theorem [0.0] 反事実的状況を考える能力はベルの定理の必要仮定であることを示す。
本稿では, 統計的独立性仮定から, 対実的確定性仮定が正式に生じるかを示す。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:49:18 GMT)
Conditional Independence of 1D Gibbs States with Applications to Efficient Learning [0.0] 熱平衡におけるスピン鎖は, 個々の領域が近傍に強く相関する相関構造を持つことを示す。
これらの測度が任意の正の温度で超指数的に崩壊することを証明している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:10:16 GMT)
Completeness Relation in Renormalized Quantum Systems [0.0] 量子力学の本質的な仮定である固有ベクトルの完全性関係は、離散スペクトルを持つ初期ハミルトニアンがデルタポテンシャルによって修正されるときにも真であることが示される。
定式化は、容易に$N$の中央ケースに拡張することができ、デルタ相互作用が平面や空間の曲線上で支持される場合である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:32:12 GMT)
Chirally-protected state manipulation by tuning one-dimensional statistics [0.0] 我々は,エノン・ハバードモデルにおける統計的パラメータを理論的に進化させる。
このキラル部分空間には非自明なベリー位相とホロノミーが存在する。
対応する状態は、N$粒子密度の定常チェッカーボードパターンを持つ。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:07:37 GMT)
Characterizing Jupiter's interior using machine learning reveals four key structures [0.0] 木星の内部構造は、NASAのジュノーミッションによる正確な重力場の測定、ガリレオの大気データ、ボイジャーの電波観測によって制限されている。
我々は,CMS法に基づく深層学習モデルを用いて,幅広い内部モデルを探索する。
木星の内部は、4つの特徴的な構造を明確に区別する2つの効果的なパラメータによって説明できる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:31:09 GMT)
CHIMA: Headline-Guided Extractive Summarization for Thai News Articles [0.0] タイ語ニュース記事の見出しの文脈情報を組み込んだ抽出要約モデルであるCHIMAを提案する。
我々のモデルは、事前訓練された言語モデルを用いて、複雑な言語意味をキャプチャし、要約に含まれる各文に確率を割り当てる。
公開されたタイのニュースデータセットの実験では、CHIMAはROUGE、BLEU、F1のスコアでベースラインモデルを上回っている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:43:10 GMT)
Bulk and boundary entanglement transitions in the projective gauge-Higgs model [0.0] 量子多体スピン系では、マルチキュービットパウリのエンタングリング効果と単一キュービットパウリの測定のアンタングリング効果との相互作用は2つの競合効果をもたらす可能性がある。
2+1)$d $mathbbZ$ Fradkin-Shenker Hamiltonianモデルに関連する測定ベースモデルを数値的に検討する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:24:59 GMT)
Bose-Hubbard model with power-law hopping in one dimension [0.0] パワーローホッピングが1/ralpha$で崩壊する1次元Bose-Hubbardモデルについて検討する。
1alphaleq 3$の全ての1アルファレクに対して、超流体と単位充填時のモットからの量子相転移は連続でスケール不変である。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:54:53 GMT)
Big data approach to Kazhdan-Lusztig polynomials [0.0] 我々は,ビッグデータからの計算的アプローチを活用することにより,対称群のカジュダン・ルシュティグの構造について検討する。
データは、11個の鎖までの対称群に対するトポロジーに適用される。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 08:55:44 GMT)
Automated Toll Management System Using RFID and Image Processing [0.0] 本実験は,RFIDタグとナンバープレートによる電子料金収集(ETC)の安全性向上に重点を置いている。
通知メールを各所有者に送信し、特定の時間枠内で料金支払いを行い、罰金を回避する。
このシステムは、料金支払いの待ち行列をなくし、遅延を減らし、利便性を向上させることで旅行者に利益をもたらす。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 17:19:42 GMT)
Automated Extraction of Acronym-Expansion Pairs from Scientific Papers [0.0] このプロジェクトは、デジタルテキストにおける略語や頭字語の普及によって引き起こされる課題に対処する。
本稿では,文書前処理,正規表現,および大規模言語モデルを組み合わせて,省略を識別し,対応する拡張にマッピングする手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:05:49 GMT)
Artificial intelligence contribution to translation industry: looking back and forward [0.0] 13220件がWoS、Scopus、Lensの3つの資料から回収された。
その結果、過去のAIによる翻訳産業への貢献は厳密ではなかったことが判明し、結果としてルールベースの機械翻訳と統計機械翻訳は、出力が満足できない結果となった。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 16:39:26 GMT)
Artificial Intelligence Mangrove Monitoring System Based on Deep Learning and Sentinel-2 Satellite Data in the UAE (2017-2024) [0.0] 2024年のUAEのマングローブ面積は約9,142.21ヘクタールであり、2017年と比較して2,061.33ヘクタール増加した。
アブダビのマングローブ面積は最大であり、UAEのマングローブ栽培において、2017年から2024年の間に1,855.6ヘクタール増加した。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 09:21:40 GMT)
Anomalous geometric transport signatures of topological Euler class [0.0] 二次元マルチギャップ位相の半古典的輸送特性における量子幾何学的構造について検討する。
特に、非線形ホール様バルク電流応答と、従って、トポロジカルオイラー不変量の存在によって誘導される運動の半古典方程式について検討する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 18:53:08 GMT)
Analytically exact solution of the Schrodinger equation for neutral helium in the ground state [0.0] 本報告では, 基底状態中の中性ヘリウムあるいはヘリウム様原子に対するシュロディンガー方程式の解析解とその対応する波動関数について述べる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 20:30:49 GMT)
An access model for quantum encoded data [0.0] ブロック符号化状態の生成と測定に満足するデータアクセスモデル(近似サンプルとクエリ)を導入,検討する。
これは構成的であり、計算能力があることを示す。
これらの結果を用いて, 分散内積推定における標本化と計算複雑性の両立を図った。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:00:00 GMT)
Algorithmic Discovery of Casimir-Polder forces: Repulsion in the Ground State [0.0] 所望のカシミール・ポルダー力を引き出す構造の自動生成のための汎用アルゴリズムを提案する。
実演として、基底状態原子上の反発性カシミール・ポルダー力をもたらす幾何学を開発するためにそれを用いる。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 13:34:47 GMT)
Agentic-HLS: An agentic reasoning based high-level synthesis system using large language models (AI for EDA workshop 2024) [0.0] ML Contest for Chip Design with HLS 2024の目的は、サイクルカウントの形でレイテンシーを予測することであった。
そこで我々は,大規模な言語モデルを用いたChain-of- Thought手法を用いて分類と回帰処理を行った。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 15:24:08 GMT)
Accuracy of time-dependent GGE under weak dissipation [0.0] ユニタリ可積分モデルは通常、定常一般化ギブズ・アンサンブル(GGE)に緩和する
本研究では、最近導入された時間依存型GGE(T-GGE)アプローチを用いて、原子の損失と利得を受けるボゾンの気体の開力学を記述する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 19:00:02 GMT)
AI in Education: Rationale, Principles, and Instructional Implications [0.0] ChatGPTのような生成AIは、人間のようなコンテンツを作り、その教育的役割について疑問を呈する。
この研究は、AIが真の認知的努力を補うのではなく、確実に補完する意図的な戦略を強調している。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 14:08:07 GMT)
A design of Convolutional Neural Network model for the Diagnosis of the COVID-19 [0.0] 患者の肺領域における新型コロナウイルス(COVID-19)の認識は、クリカルセンターや病院の基本的な必要不可欠なものの一つである。
胸部X線写真から新型コロナウイルスを正確に認識するために、19層CNNの新しい構造が推奨されている。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 06:22:54 GMT)
A cat qubit stabilization scheme using a voltage biased Josephson junction [0.0] 2対1の光子相互作用は、ビットフリップエラーが指数関数的に抑制される猫量子ビットを安定化することができる。
本研究は、ハミルトン工学に対する直流バイアスアプローチが猫の量子ビットにどのように貢献するかを考察する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 11:30:53 GMT)
A Note on Estimation Error Bound and Grouping Effect of Transfer Elastic Net [0.0] Transfer Elastic Netは線形回帰モデルの推定方法である。
我々は、推定器の非漸近$ell$ノルム推定誤差を導出し、転送弾性ネットが効果的に機能するシナリオについて議論する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 00:00:08 GMT)
A Hybrid Evolutionary Approach for Multi Robot Coordinated Planning at Intersections [0.0] 交差点での協調型マルチロボット運動計画は、道路、工場、倉庫における安全な移動の鍵となる。
本稿では,パラメトリック格子構造と離散的RRTを用いた新しい進化的アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 03:40:04 GMT)
A Hierarchical Heuristic for Clustered Steiner Trees in the Plane with Obstacles [0.0] ユークリッド・スタイナー木は、現実世界のアプリケーションでユビキタスに最小限のネットワークをモデル化するのに関係している。
本稿では,結合操作に組込み,複数および相互に結合するSteiner木を演算する手法の実現可能性について検討する。
論文参考訳(メタデータ) (Mon, 02 Dec 2024 04:10:14 GMT)