RedStone: Curating General, Code, Math, and QA Data for Large Language Models [134.5] 本研究では,大規模言語モデルを事前学習するための包括的かつ柔軟なリソースとして,Common Crawlの未完成の可能性を探る。
私たちは、Common Crawlからデータを抽出し、処理するために設計された、革新的でスケーラブルなパイプラインであるRedStoneを紹介します。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:27:39 GMT)
Prometheus 2: An Open Source Language Model Specialized in Evaluating Other Language Models [92.7] プロメテウス2は、人間とGPT-4の判断を密接に反映するより強力な評価器である。
ユーザ定義評価基準でグループ化された、直接評価とペアのランキングフォーマットの両方を処理できる。
4つの直接評価ベンチマークと4つのペアのランキングベンチマークで、Prometheus 2は人間と独自のLM判事との相関と合意を最も高く評価している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:23:17 GMT)
Diffusion for Natural Image Matting [88.6] DiffMatteは、画像マッチングの課題を克服するために設計されたソリューションである。
まず、DiffMatteはデコーダを複雑な結合されたマッティングネットワーク設計から切り離し、拡散プロセスのイテレーションで1つの軽量デコーダだけを含む。
第2に、均一な時間間隔を持つ自己整合トレーニング戦略を採用し、時間領域全体にわたるトレーニングと推論の間に一貫したノイズサンプリングを確保する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 05:56:29 GMT)
Knowledge Mechanisms in Large Language Models: A Survey and Perspective [88.5] 本稿では,知識利用と進化を含む新しい分類法から知識メカニズムの解析をレビューする。
LLMが学んだ知識、パラメトリック知識の脆弱性の理由、そして解決が難しい潜在的な暗黒知識(仮説)について論じる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:54:59 GMT)
Efficient Concertormer for Image Deblurring and Beyond [87.1] 本稿では,画像の劣化を抑えるための新しいCSA機構を提案する。
自己アテンション計算とは無関係な余剰次元の部分情報を保持することにより,画像サイズに線形な大域的文脈表現を効果的に取得する。
本研究の主な目的は, 単一像運動の劣化であるが, 定量的, 質的な評価により, 他の課題における最先端の手法に対して, より良好に行動できることが示されている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:48:02 GMT)
Urban4D: Semantic-Guided 4D Gaussian Splatting for Urban Scene Reconstruction [86.4] Urban4Dは、深い2Dセマンティックマップ生成の進歩に触発されたセマンティック誘導分解戦略である。
我々のアプローチは、信頼できるセマンティック・ガウシアンを通して潜在的に動的対象を区別する。
実世界のデータセットでの実験では、Urban4Dは従来の最先端の手法と同等または優れた品質を実現している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:59:49 GMT)
Imagine360: Immersive 360 Video Generation from Perspective Anchor [80.0] Imagine360は、360円から360ドル程度のビデオ生成フレームワークだ。
360ドル(約3万3000円)の限られたビデオデータから、細粒の球面と動きのパターンを学習する。
最先端の360ドル(約3万3000円)の動画生成方法では、グラフィック品質とモーションコヒーレンスに優れています。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:50:08 GMT)
MetaTool Benchmark for Large Language Models: Deciding Whether to Use Tools and Which to Use [79.9] 大規模言語モデル(LLM)は、その印象的な自然言語処理(NLP)能力のために大きな注目を集めている。
このベンチマークは、LLMがツールの使用意識を持ち、ツールを正しく選択できるかどうかを評価するためのものだ。
8つの人気のあるLCMを巻き込んだ実験を行い、その大半は依然として効果的にツールを選択するのに苦労していることがわかった。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:49:02 GMT)
Controlling Risk of Retrieval-augmented Generation: A Counterfactual Prompting Framework [77.5] 我々は、RAGモデルの予測が誤りであり、現実のアプリケーションにおいて制御不能なリスクをもたらす可能性がどの程度あるかに焦点を当てる。
本研究は,RAGの予測に影響を及ぼす2つの重要な潜伏要因を明らかにする。
我々は,これらの要因をモデルに誘導し,その応答に与える影響を解析する,反実的プロンプトフレームワークを開発した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 03:21:44 GMT)
ROSE: Revolutionizing Open-Set Dense Segmentation with Patch-Wise Perceptual Large Multimodal Model [75.8] 本稿では,高密度マスク予測とオープンカテゴリ生成が可能な,革命的オープンセット高密度セグメンテーションLMMであるROSEを提案する。
本手法は,各画像パッチを関心領域の独立領域として扱い,密集マスクとスパースマスクを同時に予測する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:40:30 GMT)
FreeSim: Toward Free-viewpoint Camera Simulation in Driving Scenes [75.5] FreeSimは、記録されたエゴ軌道を超えた視点から、高品質なレンダリングを強調している。
まず,一致したデータ構築戦略を用いた生成的拡張モデルを提案する。
そこで我々は,非記録ビューの生成画像を段階的に付加するプログレッシブ・コンストラクション・ストラテジーを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:58:21 GMT)
Evaluating Language Models as Synthetic Data Generators [74.8] AgoraBenchは、LMのデータ生成能力を評価するための標準化された設定とメトリクスを提供するベンチマークである。
6つのLMを使って126万のトレーニングインスタンスを合成し、99の学生モデルをトレーニングすることで、LMのデータ生成能力に関する重要な洞察を明らかにする。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:20:32 GMT)
VoxNeRF: Bridging Voxel Representation and Neural Radiance Fields for Enhanced Indoor View Synthesis [73.5] VoxNeRFは、ニューラル室内再構成と新しいビュー合成の質と効率を高めるための新しいアプローチである。
本稿では,最も関連性の高い領域に計算資源を割り当てる効率的なボクセル誘導サンプリング手法を提案する。
私たちのアプローチは、ScanNetとScanNet++に関する広範な実験で検証されています。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:32:57 GMT)
Self-Improvement in Language Models: The Sharpening Mechanism [70.9] 我々は、レンズを通して自己改善の能力について、新たな視点を提供する。
言語モデルは、正しい応答を生成する場合よりも、応答品質の検証が優れているという観察に感銘を受けて、後学習において、モデル自体を検証対象として、自己改善を形式化する。
SFTとRLHFに基づく自己改善アルゴリズムの2つの自然ファミリーを解析する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:20:21 GMT)
LLM as a Complementary Optimizer to Gradient Descent: A Case Study in Prompt Tuning [70.0] グラデーションベースとハイレベルなLLMは、協調最適化フレームワークを効果的に組み合わせることができることを示す。
本稿では,これらを相互に補完し,組み合わせた最適化フレームワークを効果的に連携させることができることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:20:35 GMT)
EgoPressure: A Dataset for Hand Pressure and Pose Estimation in Egocentric Vision [69.1] EgoPressureは、詳細なタッチ接触と圧力相互作用をキャプチャする、新しいエゴセントリックなデータセットである。
本データセットは,頭部に装着した1台のKinectカメラと静止した7台のKinectカメラで同時に捉えた21人の被験者からの5時間の対話を収録した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:24:43 GMT)
Fairer Analysis and Demographically Balanced Face Generation for Fairer Face Verification [69.0] 顔認識と検証は、深層表現の導入によって性能が向上した2つのコンピュータビジョンタスクである。
現実のトレーニングデータセットにおける顔データの繊細な性質とバイアスによる倫理的、法的、技術的な課題は、彼らの開発を妨げる。
公平性を向上する新しい制御された生成パイプラインを導入する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:30:19 GMT)
Navigation World Models [68.6] 本稿では,過去の観測とナビゲーション行動に基づいて,将来の視覚観測を予測できる制御可能な映像生成モデルを提案する。
慣れ親しんだ環境では、NWMはナビゲーションの軌道をシミュレートし、目的を達成するかどうかを評価することで計画することができる。
実験は、スクラッチからの軌道計画や、外部ポリシーからサンプリングされた軌道のランク付けにおいて、その効果を実証する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:59:45 GMT)
Social-Transmotion: Promptable Human Trajectory Prediction [65.8] Social-Transmotionは、多種多様な視覚的手がかりを利用して人間の行動を予測する、汎用トランスフォーマーベースのモデルである。
提案手法は,JTA,JRDB,歩行者,道路交通のサイクリスト,ETH-UCYなど,複数のデータセットで検証されている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 00:06:52 GMT)
PrefixKV: Adaptive Prefix KV Cache is What Vision Instruction-Following Models Need for Efficient Generation [65.4] キー値(KV)キャッシュは、長い入力シーケンスと出力シーケンスを必要とするが、特に高い推論コストに寄与する。
ここでは,すべてのレイヤのKVキャッシュサイズを決定するという課題を,最適なグローバルプレフィックス設定を探すタスクに再編成するPrefixKVを提案する。
本手法は他の手法と比較して最先端の性能を実現する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:48:59 GMT)
A Stitch in Time Saves Nine: Small VLM is a Precise Guidance for accelerating Large VLMs [65.0] 大規模視覚言語モデル(VLM)を加速するための有望なアプローチは、特定のレイヤからの注意マップのような部分的な情報を使用してトークンの重要性を評価し、重要度を低く抑えることである。
i) 重要な視覚的トークンを正確に識別するには,部分的注意情報は不十分であり,特に低トークン保持率において,最適なパフォーマンスをもたらす。 (ii) 全層に集約された注目マップのようなグローバルな注意情報は,より効果的に重要なトークンを保存し,攻撃的プルーニングの下で同等のパフォーマンスを維持する。 (iii) 小さなVLMから集約されたグローバルな注意マップは,大きなVLMとよく似ている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:56:44 GMT)
Number Cookbook: Number Understanding of Language Models and How to Improve It [64.0] 大規模言語モデル(LLM)は、基本的な数値的な理解と処理において予期せぬ誤りを犯しながら、複雑な推論タスクの増大を解決することができる。
本稿では,LLMの数値理解と処理能力(NUPA)について包括的に検討する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:39:04 GMT)
GWQ: Gradient-Aware Weight Quantization for Large Language Models [63.9] 大規模言語モデル(LLM)は、複雑な言語タスクの解決における優れたパフォーマンスを示している。
LLMを低ビットにすることで、リソース制約のあるデバイス上で動作することが可能になり、しばしばパフォーマンスの低下につながる。
低ビット重み量子化のための最初の量子化手法である勾配対応重み量子化(GWQ)を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:45:41 GMT)
DynamicControl: Adaptive Condition Selection for Improved Text-to-Image Generation [63.6] 多様な制御信号の動的組み合わせをサポートするDynamicControlを提案する。
様々な条件下での制御性,生成品質,構成性の観点から,DynamicControlは既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:54:57 GMT)
Facility Location Games with Scaling Effects [63.4] 古典的な施設配置問題を考慮し、各エージェントの個々のコスト関数が、スケーリング係数によって乗算された施設からの距離と等しくなる変動を考察する。
我々は,最適解の計算を記述し,総コストと最大コストの目標に焦点をあてる。
エージェントが単一話者の好みを持つことを保証するスケーリング関数の条件を特徴付ける。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:47:37 GMT)
Seeing Beyond Views: Multi-View Driving Scene Video Generation with Holistic Attention [61.3] 高品質なマルチビュー駆動ビデオの合成を目的とした,新しいネットワークであるCogDrivingについて紹介する。
CogDriving は Diffusion Transformer アーキテクチャと holistic-4D attention module を活用し、次元間の同時結合を可能にする。
CogDrivingは、nuScenesバリデーションセットで強力なパフォーマンスを示し、FVDスコア37.8を達成し、リアルなドライビングビデオを生成する能力を強調している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:02:49 GMT)
Cambrian-1: A Fully Open, Vision-Centric Exploration of Multimodal LLMs [61.1] 視覚中心のアプローチで設計したマルチモーダルLLM(MLLM)のファミリーであるCambrian-1を紹介する。
本研究は,様々な視覚表現を評価するためのインタフェースとして,LLMとビジュアルインストラクションチューニングを用いた。
モデルウェイト、コード、サポートツール、データセット、詳細なインストラクションチューニングと評価のレシピを提供しています。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:57:32 GMT)
MV-Adapter: Multi-view Consistent Image Generation Made Easy [60.9] 既存のマルチビュー画像生成手法は、事前訓練されたテキスト・ツー・イメージモデルに侵入的な修正を加えることが多い。
マルチビュー画像生成のための最初のアダプタと,汎用的なプラグアンドプレイアダプタであるMVAdapterを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:48:20 GMT)
MRGen: Diffusion-based Controllable Data Engine for MRI Segmentation towards Unannotated Modalities [59.6] 本稿では,医療応用における生成モデルを活用するための新しいパラダイムについて検討する。
本稿では,テキストプロンプトとマスクに条件付き生成を可能にするMRGenという拡散型データエンジンを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:34:22 GMT)
PUP 3D-GS: Principled Uncertainty Pruning for 3D Gaussian Splatting [59.3] 本研究では,視覚的忠実度と前景の細部を高い圧縮比で保持する原理的感度プルーニングスコアを提案する。
また,トレーニングパイプラインを変更することなく,事前訓練した任意の3D-GSモデルに適用可能な複数ラウンドプルーファインパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:00:28 GMT)
Towards Universal Soccer Video Understanding [58.9] 本稿では,サッカー理解のための包括的枠組みを開発することを目的とする。
これまでで最大のマルチモーダルサッカーデータセットである SoccerReplay-1988 を紹介する。
サッカー分野における最初の視覚言語基礎モデルであるMatchVisionについて述べる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:38:22 GMT)
Exploring Homogeneous and Heterogeneous Consistent Label Associations for Unsupervised Visible-Infrared Person ReID [57.5] 均質かつ不均一なインスタンスレベルの構造を同時に説明できるModality-Unified Label Transfer (MULT) モジュールを導入する。
提案したMULTは、生成した擬似ラベルがモダリティ間の整合性を維持しつつ、モダリティ内の構造的整合性を維持することを保証する。
実験の結果,提案手法は既存のUSL-VI-ReID法よりも優れていた。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 03:55:35 GMT)
Learning Prompt with Distribution-Based Feature Replay for Few-Shot Class-Incremental Learning [56.3] 分散型特徴再現(LP-DiF)を用いた学習プロンプト(Learning Prompt)という,シンプルで効果的なフレームワークを提案する。
新しいセッションでは,学習可能なプロンプトが古い知識を忘れないようにするため,擬似機能的リプレイ手法を提案する。
新しいセッションに進むと、古いクラスのディストリビューションと現在のセッションのトレーニングイメージを組み合わせて擬似フィーチャーをサンプリングして、プロンプトを最適化する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:36:46 GMT)
Video Quality Assessment: A Comprehensive Survey [55.7] 映像品質評価(VQA)は,映像の品質予測を目的とした重要な処理課題である。
ディープニューラルネットワークと大規模マルチモーダリティモデルの最近の進歩は、この問題の解決において大きな進歩をもたらした。
本稿では,VQAアルゴリズムの開発における最近の進歩と,それらを実現するためのベンチマーク研究とデータベースについて述べる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 05:25:17 GMT)
StructChart: On the Schema, Metric, and Augmentation for Visual Chart Understanding [54.5] 現在のチャート関連タスクは、ビジュアルチャートから情報を抽出するチャート認識か、抽出されたデータに基づいてチャート推論にフォーカスする。
我々はStructChartを紹介した。StructChartはStruct Triplet Representations(STR)を利用して、統一的でラベル効率のよいアプローチを実現する新しいフレームワークである。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:43:30 GMT)
From Language Models over Tokens to Language Models over Characters [54.1] 現代の言語モデルは、内部的、数学的には、エンファラクタ文字列ではなくトークン文字列上の分布である。
本稿では,トークンレベル言語モデルから文字レベル言語への変換アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 21:19:20 GMT)
Mimir: Improving Video Diffusion Models for Precise Text Understanding [53.7] テキストは、ナラティブな性質のため、ビデオ生成におけるキーコントロールシグナルとして機能する。
近年の大規模言語モデル(LLM)の成功はデコーダのみのトランスフォーマーのパワーを示している。
この作業は、慎重に調整されたトークンフィーザーを備えたエンドツーエンドのトレーニングフレームワークであるMimirによる、この課題に対処する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:26:44 GMT)
Breaking the Frame: Visual Place Recognition by Overlap Prediction [53.2] 本稿では,重なり合う予測に基づく新しい視覚的位置認識手法 VOP を提案する。
VOPは、Vision Transformerのバックボーンを使用してパッチレベルの埋め込みを取得することで、コビジュアブルなイメージセクションを進める。
提案手法では,データベース画像の重複点の評価に投票機構を用いる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:14:20 GMT)
Once-for-All: Controllable Generative Image Compression with Dynamic Granularity Adaption [52.8] 本稿では,制御生成画像圧縮フレームワークである制御-GICを提案する。
制御-GICは、高忠実度と一般性圧縮を確保しつつ、広帯域での微粒化適応を可能にする。
符号化符号に従って歴史的多粒度表現を検索できる条件デコーダを開発し、条件付き確率の形式化において階層的特徴を再構築する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:36:56 GMT)
Enhancing Supply Chain Visibility with Generative AI: An Exploratory Case Study on Relationship Prediction in Knowledge Graphs [52.8] 関係予測は、データ駆動技術を用いてサプライチェーンの可視性を高めることを目的としている。
既存の手法は関係を予測するのに成功しているが、これらの関係が埋め込まれているコンテキストを抽出するのに苦労している。
文脈の欠如により、実践者は取引関係と確立されたサプライチェーンの関係を区別することができない。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:19:01 GMT)
IMWA: Iterative Model Weight Averaging Benefits Class-Imbalanced Learning Tasks [52.6] 反復モデルウェイト平均化(IMWA)は、クラス不均衡学習タスクのための手法である。
バニラMWAと比較して、IMWAは同じ計算コストで高い性能向上を実現している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:47:10 GMT)
Testing Neural Network Verifiers: A Soundness Benchmark with Hidden Counterexamples [52.6] 本稿では,NN検証のための音響性ベンチマークを提案する。
私たちのベンチマークには、意図的に挿入された反例のインスタンスが含まれています。
我々のベンチマークでは、最先端のNN検証器のバグと合成バグの識別に成功している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:24:33 GMT)
Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizer [52.1] 人間の嗜好を学習する際の分布変化と不確実性の一形態として,不一致の原因を同定する。
過度な最適化を緩和するために、まず、逆選択された報酬モデルに最適なポリシーを選択する理論アルゴリズムを提案する。
報奨モデルとそれに対応する最適ポリシーの等価性を用いて、優先最適化損失と教師付き学習損失を組み合わせた単純な目的を特徴とする。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:15:35 GMT)
Monocular Lane Detection Based on Deep Learning: A Survey [51.2] 車線検出は自律運転認識システムにおいて重要な役割を果たす。
ディープラーニングアルゴリズムが普及するにつれて、それらに基づく単眼車線検出法は優れた性能を示した。
本稿では, 成熟度の高い2次元車線検出手法と開発途上国の3次元車線検出技術の両方を網羅して, 既存手法の概要を概説する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:17:31 GMT)
Is JPEG AI going to change image forensics? [50.9] 本稿では,ニューラル画像圧縮に基づくJPEGAI標準の反法医学的効果について検討する。
JPEG AIによって処理された真の内容を分析する際に,誤報の増加は,先導的な法医学的検知器の性能を損なうことを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:07:20 GMT)
Global MMLU: Understanding and Addressing Cultural and Linguistic Biases in Multilingual Evaluation [50.4] 多言語データセットの文化的バイアスは、グローバルベンチマークとしての有効性に重大な課題をもたらす。
MMLUの進歩は西洋中心の概念の学習に大きく依存しており、文化に敏感な知識を必要とする質問の28%がそうである。
改良されたMMLUであるGlobal-MMLUをリリースし,42言語を対象に評価を行った。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:27:09 GMT)
NVComposer: Boosting Generative Novel View Synthesis with Multiple Sparse and Unposed Images [50.4] NVComposerは、明示的な外部アライメントの必要性を排除する新しいアプローチである。
生成的マルチビューNVSタスクにおける最先端のパフォーマンスを実現し、外部アライメントへの依存を取り除く。
提案手法は, 入力ビュー数の増加に伴い, 合成品質が大幅に向上したことを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:58:03 GMT)
CryoFM: A Flow-based Foundation Model for Cryo-EM Densities [50.3] 生成モデルとして設計された基礎モデルであるCryoFMについて,高品質密度マップの分布を学習する。
フローマッチングに基づいて構築されたCryoFMは、生物分子密度マップの以前の分布を正確に捉えるために訓練されている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:58:26 GMT)
Align3R: Aligned Monocular Depth Estimation for Dynamic Videos [50.3] 動的ビデオの時間的一貫した深度マップを推定するために,Align3Rと呼ばれる新しいビデオ深度推定法を提案する。
我々のキーとなる考え方は、最近のDUSt3Rモデルを用いて、異なる時間ステップの単分子深度マップを整列させることである。
実験により、Align3Rは一貫したビデオ深度を推定し、カメラはベースライン法よりも優れた性能を持つ単眼ビデオのポーズを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:09:59 GMT)
Agri-LLaVA: Knowledge-Infused Large Multimodal Assistant on Agricultural Pests and Diseases [49.8] 農業分野における最初のマルチモーダル・インストラクション・フォロー・データセットを構築した。
このデータセットは、約40万のデータエントリを持つ221種類以上の害虫と病気をカバーしている。
本稿では,農業用マルチモーダル対話システムであるAgri-LLaVAを開発するための知識注入型学習手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:34:49 GMT)
FLAIR: VLM with Fine-grained Language-informed Image Representations [49.3] FLAIRは、局所的な画像埋め込みを学ぶために、長く詳細な画像記述を利用するアプローチである。
実験では,30M画像テキスト対を用いたFLAIRによる微細な視覚情報収集の有効性を実証した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:56:04 GMT)
DIVE: Taming DINO for Subject-Driven Video Editing [49.1] DINO-Guided Video Editing (DIVE) は、ソースビデオの主題駆動編集を容易にするために設計されたフレームワークである。
DIVEは、ソースビデオの運動軌跡に合わせるためにDINO機能を使用している。
正確な主題編集のために、DIVEは参照画像のDINO特徴を事前訓練されたテキスト・ツー・イメージモデルに組み込む。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:28:43 GMT)
Geometry-guided Cross-view Diffusion for One-to-many Cross-view Image Synthesis [48.9] 本稿では,対応する衛星画像から可視な地上画像を生成することを目的とした,クロスビュー合成のための新しいアプローチを提案する。
これらの課題を衛星間(Sat2Grd)と地上間(Grd2Sat)合成と呼ぶ。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:47:51 GMT)
Hyper: Hyperparameter Robust Efficient Exploration in Reinforcement Learning [48.8] textbfHyperは関数近似設定下では有効に有効であり、様々な環境でその魅力的な性能と堅牢性を実証的に示す。
textbfHyperは、探索の訪問を効果的に調整し、安定したトレーニングを確保するためにエクスプロイトを分離することで、問題を広範囲に緩和する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 23:12:41 GMT)
PaliGemma 2: A Family of Versatile VLMs for Transfer [48.7] PaliGemma 2 は Gemma 2 の言語モデルに基づいた PaliGemma Open Vision-Language Model (VLM) のアップグレードである。
私たちは、PaliGemmaが使用していたSigLIP-So400mビジョンエンコーダと、2Bモデルから27Bモデルまで、Gemma 2の全モデルを組み合わせています。
これらのモデルを複数の段階で3つの解像度(224px, 448px, 896px)でトレーニングし, 微調整による転送の知識を広く確保する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:50:42 GMT)
From Individual to Society: A Survey on Social Simulation Driven by Large Language Model-based Agents [47.9] 伝統的な社会学研究は、しばしば人間の参加に頼っているが、それは効果的だが、高価であり、スケールが困難であり、倫理的な懸念がある。
大規模言語モデル(LLM)の最近の進歩は、人間の振る舞いをシミュレートし、個々の反応の複製を可能にし、多くの学際的な研究を容易にする可能性を強調している。
シミュレーションは,(1)特定の個人や人口集団を模倣する個人シミュレーション,(2)複数のエージェントが協調して特定の状況における目標を達成するシナリオシミュレーション,(3)エージェント社会内の相互作用をモデル化して実世界のダイナミクスの複雑さや多様性を反映するシミュレーション社会の3種類に分類される。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:56:37 GMT)
Alignment at Pre-training! Towards Native Alignment for Arabic LLMs [47.8] 我々は、ネイティブアライメント(ネイティブアライメント)と呼ばれる事前トレーニングフェーズにおけるアライメントが、調査を保証していると主張している。
ネイティブアライメントは、ポストホック処理に頼るのではなく、アンアライメントのないコンテンツを最初から防止することを目的としている。
モデル性能とアライメント安定性に対するネイティブアライメントの影響を評価するため,包括的実験およびアブレーション研究を行った。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:52:03 GMT)
Simplified and Generalized Masked Diffusion for Discrete Data [47.7] 離散データの生成モデリングのための自己回帰モデルの代替として、マスケッド拡散(または吸収拡散)が積極的に研究されている。
本研究の目的は,マスク拡散モデルの潜在能力を最大限に活用する,シンプルで汎用的なフレームワークを提供することである。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 21:49:20 GMT)
Inductive Meta-path Learning for Schema-complex Heterogeneous Information Networks [46.3] Heterogeneous Information Networks (HIN) は、複数のノードとエッジを持つ情報ネットワークである。
メタパスの概念、すなわち2つのエンティティを接続するエンティティタイプと関係型のシーケンスは、様々なHINタスクのためのメタレベル説明可能なセマンティクスを提供するために提案される。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:25:18 GMT)
PopSweeper: Automatically Detecting and Resolving App-Blocking Pop-Ups to Assist Automated Mobile GUI Testing [46.2] PopSweeperは、GUIの自動テスト中にリアルタイムでアプリブロックのポップアップを検出し、解決するように設計されたツールである。
それは、ポップアップ検出とクローズボタンのローカライゼーションのためのディープラーニングベースのコンピュータビジョン技術を組み合わせている。
我々はPopSweeperを、アプリストアから収集された72K以上のアプリスクリーンショットと87の上位モバイルアプリで評価した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 01:05:44 GMT)
RLLTE: Long-Term Evolution Project of Reinforcement Learning [45.9] 本稿では,RLLTEについて紹介する。RLLTEは長期的進化であり,高度にモジュール化された,強化学習(RL)研究と応用のためのオープンソースフレームワークである。
トップノーチアルゴリズムの実装を提供するだけでなく、RLLTEはアルゴリズム開発のためのツールキットとしても機能する。
RLLTEは、RLエンジニアリングの基準を設定し、産業や学界に高い刺激を与えると期待されている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:27:58 GMT)
A Taxonomy of System-Level Attacks on Deep Learning Models in Autonomous Vehicles [45.8] 自動運転車に対するシステムレベルの攻撃の最初の分類を提示する。
私たちはまず8,831件の論文を集め、それから1,125件の候補者にフィルタリングすることで分類を構築しました。
その結果得られた分類には、上位12のカテゴリーといくつかのサブカテゴリが含まれる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:49:55 GMT)
CoRNStack: High-Quality Contrastive Data for Better Code Ranking [45.2] CoRNStackは、複数のプログラミング言語にまたがるコードのための、大規模で高品質なコントラストトレーニングデータセットです。
このデータセットは、ノイズ正の除去のために一貫性フィルタリングを用いてキュレートされ、さらに硬い負のマイニングによって濃縮される。
我々は、CoRNStackを用いた埋め込みモデルの対照的なトレーニングが、様々なコード検索タスクにおける最先端のパフォーマンスをもたらすことを実証した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 20:01:42 GMT)
Optimal Bell inequalities for qubit-qudit systems [45.0] 一般的なqubit-quditシステムにおけるベル違反の最大化について検討した。
より大きい次元のヒルベルト空間にキュディットを埋め込むことでベル違反量を改善することができないことを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:36:21 GMT)
Gauge-invariant projector calculus for quantum state geometry and applications to observables in crystals [45.0] 幾何のより複雑な側面は、光応答のような複数のバンドをリンクする性質に現れる。
射影演算子に基づく明示的なゲージ不変形式を用いて、新しい多状態幾何不変量を同定する。
結晶運動量の特定の値の近傍で生じる射影形式と幾何学的不変量についてより詳細に述べる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:00:00 GMT)
Diffusion in Zero-Shot Learning for Environmental Audio [45.0] ゼロショット学習により、セマンティック情報を活用することで、モデルは目に見えないクラスに一般化できる。
コンピュータビジョンで成功した生成手法は、環境オーディオゼロショット学習に特に欠落している。
本研究では環境オーディオゼロショット学習のための生成手法の最初のベンチマークを紹介する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 23:18:40 GMT)
Personalizing Multimodal Large Language Models for Image Captioning: An Experimental Analysis [44.0] 本稿では,様々な画像記述ベンチマークにおいて,従来の画像キャプションネットワークに代えて,マルチモーダルLLMが性能を評価できるかどうかを検討する。
これらのモデルのゼロショット機能と、細調整による異なるセマンティックドメインへの適応性の両方について検討する。
以上の結果から,マルチモーダル LLM はゼロショット性能に優れる一方で,特定の領域を微調整し,その一般化能力を保ち続けることは依然として困難であることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:01:06 GMT)
EAP-FIDO: A Novel EAP Method for Using FIDO2 Credentials for Network Authentication [43.9] EAP-FIDOは、WPA2/3エンタープライズ無線ネットワークやMACSec対応の有線ネットワークを使ってFIDO2のパスワードレス認証を利用することができる。
このアプローチの実現性をサポートするための総合的なセキュリティおよびパフォーマンス分析を提供する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:35:30 GMT)
DEL-Ranking: Ranking-Correction Denoising Framework for Elucidating Molecular Affinities in DNA-Encoded Libraries [43.5] DNAエンコードライブラリ(DEL)スクリーニングは、読み取りカウントによるタンパク質-リガンド相互作用の検出に革命をもたらした。
読み取りカウントのノイズは 特定の相互作用から生じる この探索プロセスを誤解させる可能性がある
DEL-Rankingは,これらの課題に対処する分布補正手法である。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:58:40 GMT)
End-to-end Triple-domain PET Enhancement: A Hybrid Denoising-and-reconstruction Framework for Reconstructing Standard-dose PET Images from Low-dose PET Sinograms [43.1] 低線量PETシングラムから標準線量PET画像の再構成を行うために,TripleTフレームワークを提案する。
提案したTriPLETは,最先端の手法と比較して,SPET画像と実データとの類似性と信号対雑音比が最も高い再構成を行うことができる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:47:27 GMT)
CLAP: Unsupervised 3D Representation Learning for Fusion 3D Perception via Curvature Sampling and Prototype Learning [42.9] 曲率sampLing と swapping Prototype assignment prediction の略である CLAP を提案する。
CLAPは従来のSOTA 3D事前学習法に比べて300%以上の性能向上を実現している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:26:12 GMT)
TrustOps: Continuously Building Trustworthy Software [42.8] 我々は、新しい信頼モデルを作成するには、ソフトウェア開発と運用の間に検証可能な証拠を集める必要があると論じる。
ソフトウェアライフサイクルのすべてのフェーズにおいて、検証可能な証拠を継続的に収集するアプローチであるTrustOpsを紹介します。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:41:01 GMT)
Genetic Algorithm Based System for Path Planning with Unmanned Aerial Vehicles Swarms in Cell-Grid Environments [42.7] 無人航空機(UAV)の群集を自律的に制御するための経路計画法が勢いを増している。
自律的な運用は労働コストを大幅に削減できるため、現在では複数のUAVを自律的に制御する必要があるシナリオが増えている。
しかし、これらのシナリオの多くは、パスプランニングを複雑にする電力線や木などの障害を含む。
本稿では, 遺伝的アルゴリズムを用いた進化的システムを用いて, 障害のある環境におけるこの問題に対処する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:24:41 GMT)
Revolve: Optimizing AI Systems by Tracking Response Evolution in Textual Optimization [42.6] 本稿では,大規模な言語モデル(LLM)において,反復的に「EVOLVE」を「R」で表現する手法であるREVOLVEを紹介する。
実験の結果、REVOLVEは競争ベースラインを上回り、迅速な最適化が7.8%向上し、ソリューションの改良が20.72%向上し、コード最適化が29.17%向上した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:44:35 GMT)
Short-reach Optical Communications: A Real-world Task for Neuromorphic Hardware [42.0] 専用のニューロモルフィックアクセラレーターにエミュレートされたスパイキングニューラルネットワーク(SNN)は、エネルギー効率のよい信号処理を提供する。
ここでは、データセンターで使用される高速光通信システムに関連する、強度変調、直接検出(IM/DD)タスクについて述べる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:46:55 GMT)
Yo'LLaVA: Your Personalized Language and Vision Assistant [41.5] 大規模マルチモーダルモデル(LMM)をパーソナライズする新しいタスクについて紹介する。
提案するYo'LLaVAは,パーソナライズされた被写体を潜在トークンの集合に埋め込むことを学習する。
定性的かつ定量的な分析により,Yo'LLaVAはより少ないトークンでより効率的に概念を学習できることが判明した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:59:56 GMT)
Streaming Detection of Queried Event Start [41.5] マルチモーダルビデオ理解ストリーミング検出のための新しいタスクを提案する。
SDQESの目標は、自然言語クエリによって記述された複雑なイベントの開始点を、高い精度と低レイテンシで識別することである。
Ego4Dデータセットに基づく新しいベンチマークと、多様なイベントのストリーミングマルチモーダル検出を研究するためのタスク固有のメトリクスを導入する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:58:27 GMT)
A Point-Neighborhood Learning Framework for Nasal Endoscope Image Segmentation [41.5] 本稿では,PNL(Point-Neighborhood Learning)フレームワークという,シンプルで効率的な半教師付き半教師付き手法を提案する。
PNLでは、モデルのトレーニングを明示的に指導する点近傍の監督損失と擬似ラベルスコアリング機構を提案する。
提案手法は,セグメンテーションニューラルネットワークのパラメータを増大させることなく,性能を著しく向上させる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:35:37 GMT)
Frequency-Guided Diffusion Model with Perturbation Training for Skeleton-Based Video Anomaly Detection [41.3] ビデオ異常検出は、コンピュータビジョンにおいて必須だが困難なオープンセットタスクである。
既存の再構築手法では,(1)開放シナリオに対するモデルロバストネスの制限,(2)詳細な動作再構成のための過剰な能力の制限,の2つの面で課題に直面する。
本稿では,摂動トレーニングによるモデルロバスト性を高めるために,摂動トレーニングを用いた新しい周波数誘導拡散モデルを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 05:43:53 GMT)
DataLab: A Unified Platform for LLM-Powered Business Intelligence [41.2] 我々は,ワンストップLLMベースのエージェントフレームワークと拡張計算ノートブックインターフェースを統合した統合BIプラットフォームであるDataLabを紹介する。
DataLabは、LLMアシストとユーザカスタマイズを単一の環境内で組み合わせることで、さまざまなデータロールに対して幅広いBIタスクをサポートする。
大規模な実験により、DataLabは人気のある研究ベンチマークでさまざまなBIタスクの最先端のパフォーマンスを達成している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:12:08 GMT)
Sibyl: Empowering Empathetic Dialogue Generation in Large Language Models via Sensible and Visionary Commonsense Inference [41.0] 感性とビジョンコモンセンス知識(Sibyl)という革新的な枠組みを提示する。
それは、より共感的な反応を引き出すことを目的として、すぐに続く対話に集中するように設計されている。
実験結果から,LLMにコモンセンス知識を習得するためのパラダイムを取り入れることで,その応答の質を総合的に向上することが示された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:08:49 GMT)
CGGM: A conditional graph generation model with adaptive sparsity for node anomaly detection in IoT networks [40.9] 本稿では,マイノリティクラスに属するサンプルを生成するために,CGGMと呼ばれる新しいグラフ生成モデルを提案する。
フレームワークは、条件付きグラフ生成モジュールとグラフベースの異常検出モジュールの2つのコアモジュールから構成される。
実験により、CGGMは精度とばらつきの点で最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 00:11:36 GMT)
Flow Matching with General Discrete Paths: A Kinetic-Optimal Perspective [40.8] 連続時間マルコフ連鎖に基づく離散生成モデルの構築に対して、全体論的アプローチをとる。
任意の確率経路に適用可能な速度公式を提案する。
複数のモダリティにまたがる新しいデザイン空間の有用性を実証的に検証する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:24:35 GMT)
Enhancing Perception Capabilities of Multimodal LLMs with Training-Free Fusion [40.6] マルチモーダルLLM (Multimodal LLMs) は、視覚エンコーダと言語モデルとの整合による視覚能力を備えた言語モデルである。
MLLMの視覚知覚を高める既存の方法は、しばしばより強力な視覚エンコーダを設計する。
市販のMLLMから複数の視覚エンコーダを効率的に活用する新しい統合フレームワークであるVisionFuseを紹介する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:51:16 GMT)
Pragmatic Metacognitive Prompting Improves LLM Performance on Sarcasm Detection [40.5] PMP(Pragmatic Metacognitive Prompting)を導入し,肉腫検出におけるLarge Language Models(LLMs)の性能向上を図る。
LLaMA-3-8B、GPT-4o、Claude 3.5 Sonnetのような最先端のLCMを用いて、PMPはGPT-4oの最先端の性能を達成する。
本研究は, 現実的推論とメタ認知戦略の統合により, LLMの肉腫検出能力が著しく向上することを示した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:16:30 GMT)
Stable Consistency Tuning: Understanding and Improving Consistency Models [40.3] 拡散モデルは、より優れた生成品質を達成するが、復調の反復的な性質により、生成速度が遅くなる。
新しいジェネレーティブファミリーである一貫性モデルは、非常に高速なサンプリングで競争性能を達成する。
本稿では,拡散モデルの分解過程をマルコフ決定過程(MDP)としてモデル化し,時間差分学習(TD)による値推定としてフレーミング一貫性モデルのトレーニングを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 05:04:42 GMT)
Provably Extending PageRank-based Local Clustering Algorithm to Weighted Directed Graphs with Self-Loops and to Hypergraphs [40.2] この研究はグラフ局所クラスタリングに重点を置いており、様々なモダリティの内部接続性のため、グラフ以外の幅広い応用がある。
非近似型Andersen-Chung-Lang(ACL)アルゴリズムを離散グラフを超えて拡張し、その二次最適性をより広い範囲のグラフに一般化する。
理論的には、2つの穏やかな条件下では、両方のアルゴリズムが少なくとも1/2確率のコンダクタンスの観点から2次最適局所クラスターを識別できることが証明される。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 03:56:14 GMT)
Boosting Weakly-Supervised Referring Image Segmentation via Progressive Comprehension [40.2] 本稿では、画像とテキストのペアから直接ターゲットのローカライゼーションを学習する、困難な設定に焦点を当てる。
そこで本研究では,対象対象対象の局所化にターゲット関連テキストキューを活用する新しいプログレッシブネットワーク(PCNet)を提案する。
本手法は3つのベンチマークでSOTA法より優れている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:47:11 GMT)
Is Foreground Prototype Sufficient? Few-Shot Medical Image Segmentation with Background-Fused Prototype [40.1] Few-shot Semantic(FSS)は、トレーニング済みモデルを新しいクラスに適応するために、クラス毎に1つのラベル付きトレーニングサンプルをラベル付けする。
医用画像におけるFSSのための新しいプラガブルバックグラウンドフューズプロトタイプ(Bro)を提案する。
Bro氏はこの背景を2つのピボット設計で組み込んでいる。具体的には、FeaC(FeaC)は、クエリイメージとのクロスアテンションを利用して、最初にサポートイメージのノイズを低減します。
チャネルグループに基づくアテンション機構によりこれを実現し、敵構造は粗大な核融合を促進する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:51:22 GMT)
3D Interaction Geometric Pre-training for Molecular Relational Learning [39.9] 3DMRLは2次元MRLモデルを訓練し、対照的な学習を通して分子間相互作用の全体的な3次元幾何学的情報を学ぶ。
3DMRLの有効性を実証するため,実世界のデータセットを用いた各種タスクの実験を行った。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:05:55 GMT)
Large Language Models show both individual and collective creativity comparable to humans [39.9] 大きな言語モデル(LLM)は人間に匹敵する創造性を示している。
我々は、LLMを個々の人間に対してベンチマークし、それらを人間の集団の創造性と比較することで、新しいアプローチをとる。
10回質問された場合、LCMの集団的創造性は8~10人の人間と同等である。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:18:54 GMT)
Domain-specific Question Answering with Hybrid Search [39.9] 本研究では,細調整された高密度検索器とキーワードベーススパース検索を併用したハイブリッド手法により,性能が著しく向上することを示す。
実験結果から, このハイブリッド方式は, シングルレトリバーシステムより優れていたことが示唆された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:04:13 GMT)
Orthogonal Adaptation for Modular Customization of Diffusion Models [39.6] 我々は、カスタマイズされたモデルを効率的にマージすることを目的として、Modular Customizationと呼ばれる新しい問題に対処する。
直交適応(Orthogonal Adaptation, Orthogonal Adaptation)は,微調整時に相互にアクセスできないカスタマイズモデルを支援する手法である。
提案手法は単純かつ汎用的であり,モデルアーキテクチャのほぼすべての最適化可能な重みに適用可能である。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:39:52 GMT)
ObjectFinder: Open-Vocabulary Assistive System for Interactive Object Search by Blind People [39.6] ObjectFinderはオープンな語彙で対話的なオブジェクト検索のプロトタイプです。
オブジェクト検出とシーン記述とナビゲーションを組み合わせる。
対象探索における課題をよりよく理解するために,ニーズ充足型インタビューを行った。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:38:45 GMT)
BGTplanner: Maximizing Training Accuracy for Differentially Private Federated Recommenders via Strategic Privacy Budget Allocation [39.5] DPFR訓練の各ラウンドのプライバシー予算を戦略的に配分するBGTplannerを開発する。
BGTplannerは、最先端のベースラインと比較して、トレーニングパフォーマンスが平均6.76%向上している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 01:07:04 GMT)
TREND: Unsupervised 3D Representation Learning via Temporal Forecasting for LiDAR Perception [39.4] TRENDは、教師なし3次元表現学習のための時間予測に関する最初の研究である。
我々は、NuScenes, Once, NuScenesを含む一般的なデータセット上で、下流3Dオブジェクト検出タスク上でTRENDを評価する。
実験の結果, TRENDは従来のSOTA教師なし3D事前学習法と比較して90%向上した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:17:24 GMT)
RoDyGS: Robust Dynamic Gaussian Splatting for Casual Videos [39.4] 本稿では,カジュアルビデオから動的ガウススプラッティングを最適化するRoDyGSを提案する。
動的プリミティブと静的プリミティブを分離することで、シーンの動きと下層の幾何学を効果的に学習する。
また,広視野カメラとオブジェクトモーションと同時マルチビューキャプチャを提供する,包括的なベンチマークであるKubric-MRigを導入している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:02:49 GMT)
Recommender Systems for Sustainability: Overview and Research Issues [39.1] 本稿では,サステナビリティ開発目標達成を支援するためにレコメンデーションシステムを適用する技術の現状を要約する。
具体的には、推奨システムは、定義された目標を達成するために、組織や個人をサポートすることができます。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:03:47 GMT)
AED-PADA:Improving Generalizability of Adversarial Example Detection via Principal Adversarial Domain Adaptation [38.6] 主対数領域適応(AED-PADA)による逆数例検出という新しい手法を提案する。
特に,本手法は主敵ドメイン(PAD)を同定する。
我々は、PADをソースドメインとして、逆例検出において、マルチソースのUnsupervised Domain Adaptationを利用する先駆者となった。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:18:35 GMT)
Characterising higher-order phase correlations in gain-switched laser sources with application to quantum key distribution [38.0] レーザー源における多光子放出は、量子鍵分布のセキュリティにとって深刻な脅威である。
出力パルスの位相確率分布を特徴付ける実験手法を提案する。
干渉測度に対する最適化タスクは任意の順序相関の影響を決定するのに十分であることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:06:13 GMT)
GenMix: Effective Data Augmentation with Generative Diffusion Model Image Editing [37.5] 本稿では、一般化可能なプロンプト誘導型生成データ拡張手法であるGenMixを紹介する。
本手法は、画像編集を利用して、カスタム条件付きプロンプトに基づく拡張画像を生成する。
提案手法は、非現実的な画像とラベルの曖昧さを緩和し、結果のモデルの性能と対角的堅牢性を向上する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:38:01 GMT)
Opt-Out: Investigating Entity-Level Unlearning for Large Language Models via Optimal Transport [37.2] 大規模言語モデルは不注意にも、ユーザに対してプライベートで機密性の高い情報を開示する。
最適なトランスポートベースのアンラーニング手法であるOpt-Outを導入する。
また、最初のエンティティレベルの未学習データセットも提示する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:30:06 GMT)
MIDI: Multi-Instance Diffusion for Single Image to 3D Scene Generation [37.2] 本稿では,単一の画像から合成3Dシーンを生成するための新しいパラダイムであるMIDIを紹介する。
MIDIの中核には、オブジェクト間の相互作用と空間的コヒーレンスを直接生成プロセス内で効果的にキャプチャする、新しいマルチインスタンスアテンション機構が組み込まれている。
合成データ,実世界のシーンデータ,テキスト・ツー・イメージ拡散モデルにより生成されたスタイリングされたシーン画像の評価により,画像からシーン生成までの最先端性能を実証する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:52:40 GMT)
Multi-Level Correlation Network For Few-Shot Image Classification [36.4] ベースクラスからラベル付き画像がほとんどない新規クラスを識別することを目的とした画像分類がほとんどない。
ローカル情報を効果的に取得してこの問題に対処するために,FSIC のためのマルチレベル相関ネットワーク (MLCN) を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:36:24 GMT)
DuoDiff: Accelerating Diffusion Models with a Dual-Backbone Approach [36.2] 近年,各サンプリングステップの難易度に基づいてデノナイジングネットワークの深さを適応させる手法が提案されている。
本稿では,初期サンプリングステップでより浅いデノナイジングネットワーク,後半ステップでより深いネットワークを用いることにより,より高速な生成を提案する。
両バックボーンアプローチであるDuoDiffは、推定速度と生成品質の両方で既存の早期拡散法より優れていることを実証的に実証する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:16:58 GMT)
Deferred Poisoning: Making the Model More Vulnerable via Hessian Singularization [36.1] 我々は、より脅迫的なタイプの毒殺攻撃(Dederred Poisoning Attack)を導入する。
この新たな攻撃により、モデルは通常、トレーニングと検証フェーズで機能するが、回避攻撃や自然騒音に非常に敏感になる。
提案手法の理論的および実証的な解析を行い、画像分類タスクの実験を通してその効果を検証した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:53:19 GMT)
Can In-context Learning Really Generalize to Out-of-distribution Tasks? [36.1] 本研究は,訓練中に遭遇したことのないアウト・オブ・ディストリビューション(OOD)課題に対する,イン・コンテクスト・ラーニング(ICL)のメカニズムについて検討した。
我々は、トランスフォーマーがICLを通してOODタスク機能を学ぶのに苦労していることを明らかにする。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:35:48 GMT)
Weighted-Reward Preference Optimization for Implicit Model Fusion [35.6] Weighted-Reward Preference Optimization (WRPO) は異種オープンソースLCMの融合手法である。
WRPOは語彙アライメントとマトリックス融合の必要性を排除している。
WRPOは既存の融合法や様々な微調整ベースラインより一貫して優れている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:15:12 GMT)
LLM-Based Multi-Hop Question Answering with Knowledge Graph Integration in Evolving Environments [35.4] 本稿では,大規模言語モデル(GMeLLo)のためのグラフメモリベースの編集について述べる。
これは、知識グラフの明示的な知識表現と、大規模言語モデルの言語的柔軟性を融合させる、単純で効果的な方法である。
以上の結果から,GMeLLoはマルチホップ質問応答ベンチマークであるMQuAKEにおいて,最先端の知識編集手法をはるかに上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:01:47 GMT)
Articulate-Anything: Automatic Modeling of Articulated Objects via a Vision-Language Foundation Model [35.2] Articulate-Anythingは、テキスト、画像、ビデオを含む多くの入力モダリティから、多種多様な複雑なオブジェクトの明瞭化を自動化する。
本システムでは,メッシュ検索機構を通じて既存の3Dデータセットを,反復的に提案,評価,洗練を行うアクタ・クリティカル・システムとともに活用する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:04:01 GMT)
WiS Platform: Enhancing Evaluation of LLM-Based Multi-Agent Systems Through Game-Based Analysis [34.6] 我々は、オープンでスケーラブルでリアルタイムに更新されたプラットフォームを導入し、ゲームに基づいてLLMベースのMASにアクセスし分析する(WiS)。
本プラットフォームには,(1)H Face上で利用可能なモデルをサポートする統一型モデル評価インタフェース,(2)モデル評価のためのリアルタイム更新型リーダーボード,(3)ゲーム勝利率,攻撃,防衛戦略,LLMの推論に関する総合的評価の3つが特徴である。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:45:09 GMT)
PatchDPO: Patch-level DPO for Finetuning-free Personalized Image Generation [34.5] ファインタニングのないパーソナライズされた画像生成は、テストタイムの微調整なしにカスタマイズされた画像を合成することができる。
本研究は,各画像内の画像パッチの品質を推定し,それに基づいてモデルをトレーニングするPatchDPOを提案する。
実験の結果,PatchDPOは複数の事前学習されたパーソナライズされた生成モデルの性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:59:43 GMT)
Pre-trained Multiple Latent Variable Generative Models are good defenders against Adversarial Attacks [34.1] 本稿では,MLVGM (Multiple Latent Variable Generative Models) が定義されている特定のジェネレータを提案する。
これらの特性を生かして、画像の自動符号化を行い、クラス関連情報を維持しながら、敵のノイズを含む詳細情報を破棄、再サンプリングする。
より小さなMLVGMはすでに従来の手法と競合しており、基礎モデルとして使用できることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:40:56 GMT)
SINGER: Vivid Audio-driven Singing Video Generation with Multi-scale Spectral Diffusion Model [34.0] 歌声ビデオ生成は 未発見のままです
高品質な現実世界の歌声フェースビデオの欠如は、歌声ビデオ生成コミュニティの発展を妨げている。
SINGERは、鮮やかな歌唱ビデオを生成し、客観的評価と主観評価の両方において最先端の手法より優れている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:19:47 GMT)
Variational quantum classifiers via a programmable photonic microprocessor [34.0] 変分量子アルゴリズム(VQA)は、量子優位性を達成するための実行可能な戦略を提供する。
この研究はシリコンベースの量子フォトニックマイクロプロセッサと古典コンピュータを用いてVQCを実装している。
3つのバイナリ分類タスクのアキュラティはそれぞれ87.5%、92.5%、85.0%であり、現実世界のアイリスデータセットでは98.8%である。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:04:51 GMT)
WithdrarXiv: A Large-Scale Dataset for Retraction Study [33.8] 本稿では,arXivから抽出した論文の大規模データセットであるWithdrarXivを紹介する。
我々は、致命的な誤りから政策違反まで10の異なるカテゴリーを識別し、削除理由の包括的分類を開発する。
重み付き平均F1スコアは0.96である。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 23:36:23 GMT)
BOSS: Blocking algorithm for optimizing shuttling scheduling in Ion Trap [33.7] イオントラップは量子ハードウェア技術の最先端に立ち、量子コンピューティングの非並列的な利点を提示している。
我々は,シャットリング効率を向上させるために,効率的なブロッキングアルゴリズムであるBOSSを開発した。
本手法は、ほとんどのアプリケーションにおいて、最大96.1%の削減で、シャトルの数を著しく削減する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:31:17 GMT)
Adaptive Dense Reward: Understanding the Gap Between Action and Reward Space in Alignment [33.6] Reinforcement Learning from Human Feedback (RLHF) は、Large Language Models (LLM) を人間の好みに合わせるのに非常に効果的であることが証明されている。
この制限は、RLHFが特定のトークンを強化または抑制すべきかどうかについての認識の欠如に起因している。
本稿では,様々なタスクに頑健に適用可能な適応的メッセージワイドRLHF'法を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:26:47 GMT)
MIGC++: Advanced Multi-Instance Generation Controller for Image Synthesis [33.5] マルチインスタンス生成(MIG)タスクを導入し、単一のイメージ内で複数のインスタンスを生成することに焦点を当てる。
MIGは、インスタンス間の属性リークを避けること、多様なインスタンス記述をサポートすること、反復生成における一貫性を維持することの3つの大きな課題に直面している。
これらの手法を評価するためにCOCO-MIGとMultimodal-MIGベンチマークを導入する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 05:06:12 GMT)
Deep Learning for Sea Surface Temperature Reconstruction under Cloud Occlusion [33.0] 大規模な海面温度(SST)モニタリングは、衛星の赤外線検出に依存している。
クラウドカバーは大きな課題を示し、広範な観察上のギャップを生み出します。
我々は、衛星画像の雲に覆われた部分を再構築するために、ディープニューラルネットワークを使用している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:49:49 GMT)
Does Safety Training of LLMs Generalize to Semantically Related Natural Prompts? [32.6] LLM(Large Language Models)は、敵の攻撃やジェイルブレイクの影響を受けやすい言語である。
安全調整されたLLMがアライメント後の安全応答を誘発する自然的プロンプトに対して安全かどうかを評価する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:36:37 GMT)
DiffStyleTTS: Diffusion-based Hierarchical Prosody Modeling for Text-to-Speech with Diverse and Controllable Styles [32.3] DiffStyleTTSは条件付き拡散モジュールに基づくマルチスピーカ音響モデルである。
階層的に音声韻律の特徴をモデル化し、韻律予測を導くために異なる韻律スタイルを制御する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:17:25 GMT)
PlanarSplatting: Accurate Planar Surface Reconstruction in 3 Minutes [32.0] PlanarSplattingはマルチビュー屋内画像のための超高速かつ高精度な表面再構成手法である。
PlanarSplattingは3分で室内のシーンを再構築し、幾何学的精度は大幅に向上した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:38:07 GMT)
AdvDreamer Unveils: Are Vision-Language Models Truly Ready for Real-World 3D Variations? [32.0] 言語モデル(VLM)は目覚ましい一般化能力を示してきたが、動的現実シナリオにおける堅牢性はほとんど探索されていない。
単視点画像から物理的に再現可能な3次元変換サンプルを生成する最初のフレームワークであるAdvDreamerを提案する。
AdvDreamerは、先進的な生成技術と2つの重要なイノベーションを統合し、自然画像から3Dバリエーションの最悪の分布を特徴づけることを目指している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 03:42:39 GMT)
Data-Efficient 3D Visual Grounding via Order-Aware Referring [32.0] 3Dビジュアルグラウンドティングは、自然言語記述によって参照される3Dポイントクラウドシーン内でターゲットオブジェクトを特定することを目的としている。
我々は、注文認識参照を介して、新しいデータ効率のよい3DビジュアルグラウンドフレームワークであるVigorを紹介した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:56:17 GMT)
MedAutoCorrect: Image-Conditioned Autocorrection in Medical Reporting [31.7] 医療報告では、人や機械学習アルゴリズムが生み出す放射線学的な報告の正確さが重要である。
本稿では,これらの報告における不正確な画像条件の自動補正という新たな課題に取り組む。
本稿では,これらの誤りを指摘し,修正を行い,テキスト自動補正プロセスをシミュレートする2段階のフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:32:53 GMT)
Time-Reversal Provides Unsupervised Feedback to LLMs [31.6] Time Reversed Language Models (TRLM) は、応答に条件付きでクエリをスコアし、生成することができる。
TRLMのスコアリングは,従来のクエリのフォワードスコアよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:45:34 GMT)
Rethinking Token Reduction in MLLMs: Towards a Unified Paradigm for Training-Free Acceleration [31.5] 本研究は,無訓練トークン還元研究の現況を再考する。
トークン還元を3つの異なる段階に分解する「フィルタ相関圧縮」パラダイムを提案する。
10のベンチマークでの実験結果から,本手法は最大82.4%のFLOP削減が可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:39:01 GMT)
Zero-Shot Relational Learning for Multimodal Knowledge Graphs [31.2] 多様なマルチモーダル情報と知識グラフ構造を統合するために, マルチモーダル学習者, 構造コンソリエータ埋め込みジェネレータという3つのコンポーネントからなる新しいエンドツーエンドフレームワークを提案する。
3つのマルチモーダル知識グラフの評価結果は,提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 01:47:08 GMT)
QuadricsReg: Large-Scale Point Cloud Registration using Quadric Primitives [30.6] 本稿では,シーンの表現に簡潔な2次プリミティブを活用する,新たなポイントクラウド登録手法であるQuadricsRegを紹介する。
象徴的な特徴として、二次表現はシーンの主幾何学的特徴を完全に捉え、大規模な点雲の複雑さを効率的に扱うことができる。
5つの公開データセットと、さまざまなLiDARセンサとロボットプラットフォームにまたがる自己コンパイルされた異種データセットをテストします。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 03:35:08 GMT)
Lightweight Multiplane Images Network for Real-Time Stereoscopic Conversion from Planar Video [29.2] 本稿では,Multi-plane Image(MPI)に基づくリアルタイム立体変換ネットワークを提案する。
暗黙的に深度認識機能を抽出するために、軽量な深度セマンティックブランチを使用している。
いくつかの最先端(SOTA)モデルに匹敵するパフォーマンスを実現し、2K解像度でのリアルタイム推論をサポートする。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:04:14 GMT)
Tight Lower Bounds and Improved Convergence in Performative Prediction [29.2] 過去のスナップショットから過去のデータセットを活用することで、繰り返しリスク最小化(RRM)フレームワークを拡張します。
データセットの最終イテレーションのみを使用するメソッドに対して,新たな上限を導入します。
様々な性能予測ベンチマークにおいて,安定点への高速収束を実証的に観察する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:06:19 GMT)
UniVAD: A Training-free Unified Model for Few-shot Visual Anomaly Detection [29.0] 本稿では,様々な領域にまたがる異常を検出できるVAD法であるUniVADを提案する。
UniVADは、これまで見つからなかったオブジェクトの異常を検出するために、テスト中の参照として通常のサンプルをほとんど必要としない。
産業、論理、医療の分野にまたがる9つのデータセットの実験を行い、UniVADが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:20:27 GMT)
Splats in Splats: Embedding Invisible 3D Watermark within Gaussian Splatting [28.8] WaterGSは、バニラ3DGSの属性を変更することなく、3DGS自体に3Dコンテンツを埋め込む最初の3DGS透かしフレームワークである。
テストの結果、WaterGSは既存の3Dステガノグラフィー技術を大きく上回り、シーンの忠実度は5.31%、レンダリング速度は3倍に向上した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:40:11 GMT)
Enhancing Biomedical Knowledge Discovery for Diseases: An Open-Source Framework Applied on Rett Syndrome and Alzheimer's Disease [28.7] 原文から直接特定の疾患に関する知識を構築するために設計されたオープンソースのフレームワークを紹介する。
疾患関連知識発見の研究を容易にするために、Rett症候群とアルツハイマー病に焦点を当てた2つの注釈付きデータセットを作成しました。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:05:02 GMT)
Unifying KV Cache Compression for Large Language Models with LeanKV [28.5] 大規模言語モデル (LLM) は例外的な性能を示すが、かなりのメモリ要求のために高いサービスコストがかかる。
量子化やプルーニングを含む既存のKVキャッシュ圧縮手法は、キーと値の均一な処理のような制限に直面している。
本稿では,LLM機能効率を向上するKVキャッシュ圧縮フレームワークであるLeanKVを紹介する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:51:23 GMT)
Good practices for evaluation of machine learning systems [28.3] 評価プロトコルの設計に関わる主な側面として,データ選択,メートル法選択,統計的意義について論じる。
本稿では, 音声処理分野から抽出した例と, それぞれの側面に共通する誤りの一覧を示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 20:30:16 GMT)
TDDSR: Single-Step Diffusion with Two Discriminators for Super Resolution [28.2] 本稿では,効率的な単一ステップ拡散に基づく超解像法であるTDDSRを提案する。
本手法は,教師の事前学習モデルから抽出し,拡散ネットワークに基づいて,単一ステップで超解像を行う。
実世界および顔固有のSRタスク間で有効性を示す実験結果が得られた。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:47:23 GMT)
Asymptotics of Linear Regression with Linearly Dependent Data [28.0] 共変数が線形依存を示すような環境下での線形回帰の計算について検討する。
試料数と寸法が増加する高次元状態における隆起時間回帰特性を解析した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 20:31:47 GMT)
STRIDE: Single-video based Temporally Continuous Occlusion-Robust 3D Pose Estimation [27.9] 本研究では,STIDE (Single-video based TempoRally contInuous Occlusion-Robust 3D Estimation Pose) を提案する。
筆者らのフレームワークは,モデルに依存しない柔軟性を示し,既製の3Dポーズ推定手法を用いて,堅牢性と時間的整合性を向上させる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:25:18 GMT)
Building Europe's first space-based Quantum Key Distribution system -- The German Aerospace Center's role in the EAGLE-1 mission [27.4] EAGLE-1ミッションは、ヨーロッパ初の主権を持つ、エンドツーエンドの量子鍵配布システムを開発することを目的としている。
本稿では,QKDペイロードの重要な部分であるQKD送信機の開発について報告する。
本ミッションにおける光学地上局Oberpfaffenhofen(OGS-OP)の主な展開について述べる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:17:22 GMT)
Universal Prompt Optimizer for Safe Text-to-Image Generation [27.3] ブラックボックスシナリオにおける安全なT2I(POSI)生成のための最初の普遍的プロンプトを提案する。
提案手法は,不適切な画像を生成する際の様々なT2Iモデルの可能性を効果的に低減することができる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:56:34 GMT)
MaterialPicker: Multi-Modal Material Generation with Diffusion Transformers [27.0] 本稿では,Diffusion Transformer (DiT) アーキテクチャを利用したマルチモーダル・マテリアル・ジェネレータを提案する。
本手法では, 被捕獲面が歪んだ場合でも, 試料の画像量に基づいて材料を生成することができる。
従来よりも多種多様な材料生成と歪み補正が可能であることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:23:15 GMT)
Seeing is Believing: Vision-driven Non-crash Functional Bug Detection for Mobile Apps [27.0] 本稿では,非クラッシュな機能的バグを検出するための,視覚駆動型多エージェント協調GUIテスト手法を提案する。
590の非クラッシュバグに対してTridentを評価し,12のベースラインと比較したところ,平均リコールと精度が14%-112%,108%-147%向上した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:00:42 GMT)
On Privacy, Security, and Trustworthiness in Distributed Wireless Large AI Models (WLAM) [26.9] 本稿では、分散無線大AIモデル(WLAM)におけるプライバシ、セキュリティ、信頼性に関する総合的な概要を提供する。
分散WLAMにおけるプライバシとセキュリティに関する分類と理論的知見について論じる。
分散WLAMを実装する上での信頼性と倫理について述べる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:11:07 GMT)
Mitigating Unsafe Feedback with Learning Constraints [26.9] 安全に配慮した大規模言語モデルは有害なテキストを生成することで、安全でない行動空間を探索できることを示す。
我々は、学習制約として有効であるかどうかを評価するために、有害な微調整防衛を「単純」と「明示」の両方に適応させる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 00:03:38 GMT)
Multimodal LLM Guided Exploration and Active Mapping using Fisher Information [26.6] 本稿では,3次元ガウススプラッティング表現を用いた長期探査目標と短期行動のためのアクティブマッピングシステムを提案する。
GibsonとHabitat-Matterportの3Dデータセットで行った実験は、提案手法の最先端の結果を示している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:03:08 GMT)
TokenFlow: Unified Image Tokenizer for Multimodal Understanding and Generation [26.3] TokenFlowは、マルチモーダル理解と生成のギャップを埋める、新しい統合イメージトークンである。
離散的な視覚入力がLLaVA-1.513Bを超える性能を初めて実証した。
我々はまた、256*256解像度のGenEvalスコア0.55の自己回帰画像生成における最先端性能を確立した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:46:55 GMT)
A Water Efficiency Dataset for African Data Centers [26.3] 本稿では,5つの異なる気候領域にわたる41のアフリカ諸国のデータセンターにおける水利用効率を推定するための,第1種データセットを提案する。
また、我々のデータセットを用いて、2つの大きな言語モデルにおける推論の水消費量を評価し、推定する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 21:09:45 GMT)
NARAIM: Native Aspect Ratio Autoregressive Image Models [26.3] NARAIMは自己回帰的対象を事前学習した視覚モデルである。
ネイティブアスペクト比を維持することにより、元の空間的コンテキストを保存し、視覚情報を解釈するモデルの能力を高める。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:21:36 GMT)
Marconi: Prefix Caching for the Era of Hybrid LLMs [26.3] 本稿では,Hybrid LLMを用いた効率的なプレフィックスキャッシングをサポートする最初のシステムであるMarconiを紹介する。
多様なワークロードとハイブリッドモデルにまたがって、Marconiは最大34.4$times$高いトークンヒットレートを達成した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:40:24 GMT)
Preserve or Modify? Context-Aware Evaluation for Balancing Preservation and Modification in Text-Guided Image Editing [26.1] 保存・修正の側面を適応的に調整するtextbfcontext-aware メトリックである textttAugCLIP を提案する。
textttAugCLIPは、人間の評価基準と著しく整合し、既存のメトリクスよりも優れています。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:35:20 GMT)
Sparse-view Pose Estimation and Reconstruction via Analysis by Generative Synthesis [25.9] 観察されたビューの少ないセットを考えると、その観察は完全な正確な3Dを得るのに十分な直接的な証拠を与えていないかもしれない。
a) 新規なビュー合成に基づく生成先行を光度目標と組み合わせて、推定された3Dの質を向上させる方法、(b) アウトレーヤを明示的に推論し、連続最適化に基づく戦略による離散探索を用いて補正する手法であるSparseAGSを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:59:24 GMT)
Distilling Diffusion Models to Efficient 3D LiDAR Scene Completion [25.5] 拡散モデルが3次元LiDARシーン完了に適用された。
本稿では,3次元LiDARシーン補完モデルに適した新しい蒸留法について提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:57:25 GMT)
TFS-NeRF: Template-Free NeRF for Semantic 3D Reconstruction of Dynamic Scene [25.2] 本稿では,スパースやシングルビューRGBビデオから撮影したダイナミックシーンのためのテンプレートレス3DセマンティックNeRFを提案する。
相互作用する物体の動きを遠ざけ, 濃度ごとのスキン厚みを最適化することにより, 高精度でセマンティックに分離可能なジオメトリを効率的に生成する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 05:36:57 GMT)
The Reality of AI and Biorisk [24.9] AIモデルやシステムがバイオリスクを増大させるための健全な理論的脅威モデルと、その脅威モデルをテストする堅牢な方法の両方を持つことが必要である。
本稿では,2つのAIおよびバイオリスク脅威モデルに関する既存の研究について分析する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:19:35 GMT)
Towards a Robust Soft Baby Robot With Rich Interaction Ability for Advanced Machine Learning Algorithms [24.6] 先進的な機械学習アルゴリズムを扱うために、スクラッチから設計された新しいロボット手足を提案する。
我々の設計は、ハイブリッドなソフトハード構造、リッチな非接触センサー(排他的カメラ)による高い冗長性、そして容易に交換可能な故障点を備えている。
このデザインは、汎用的で一般的に知的なロボットを実現するための、よりカスタマイズされたロボット設計に向けた具体的なステップであると考えています。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:45:23 GMT)
Fine-Grained Behavior Simulation with Role-Playing Large Language Model on Social Media [24.3] textbfFineRobは、新しいきめ細かい挙動シミュレーションデータセットである。
我々は3つのソーシャルメディアプラットフォームで1,866人の異なるユーザーの行動履歴を収集する。
機能向上を目的としたtextbfOM-CoT ファインチューニング手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:14:56 GMT)
Scalable Bayesian Tensor Ring Factorization for Multiway Data Analysis [24.0] 非パラメトリック乗算ガンマプロセス(MGP)を前もって組み込んだ新しいBTRモデルを提案する。
離散データを扱うために、クローズドフォーム更新のためのP'olya-Gamma拡張を導入する。
そこで我々は,従来のVIアルゴリズムの計算複雑性を2桁に減らした,一貫した後続シミュレーションのための効率的なギブスサンプリング器を開発した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:55:14 GMT)
Beyond Local Sharpness: Communication-Efficient Global Sharpness-aware Minimization for Federated Learning [23.7] フェデレートラーニング(FL)は、プライバシ保護と協調的なモデルトレーニングを可能にする。
近年のアプローチでは、クライアント側シャープネス認識最小化(SAM)を用いて、フラットな最小化を促進する。
この研究は、サーバ上のグローバルシャープネスの最適化を優先する、新しいFLアプローチであるFedGloSSを導入している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:46:06 GMT)
Distillation of Diffusion Features for Semantic Correspondence [23.5] 本稿では,効率の低下を克服する新しい知識蒸留手法を提案する。
本稿では,2つの大きな視覚基盤モデルを用いて,これらの補足モデルの性能を,計算コストの低減で高精度に維持する1つの小さなモデルに蒸留する方法を示す。
実験結果から,3次元データ拡張による蒸留モデルにより,計算負荷を大幅に削減し,セマンティックビデオ対応などの実世界のアプリケーションの実現性を向上させるとともに,現在の最先端手法よりも優れた性能が得られることが示された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:55:33 GMT)
Improving Linguistic Diversity of Large Language Models with Possibility Exploration Fine-Tuning [23.5] PEFT(Possibility Exploration Fine-Tuning)は、大規模言語モデル(LLM)のテキストの多様性を高めるためのタスクに依存しないフレームワークである。
PEFT は LLM 出力の多様性を著しく向上させる。
また、対話システムにおける人口統計バイアスを顕著に低減することができる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:23:16 GMT)
How to Correctly do Semantic Backpropagation on Language-based Agentic Systems [23.4] セマンティック・バックプロパゲーションの概念をセマンティック・グラデーションで定式化する。
これは、各コンポーネントの変更がシステムの出力をどのように改善するかについての方向性情報を計算する方法として機能する。
BIG-Bench Hard と GSM8K の2つの実験結果から,GASO 問題を解く上で,既存の最先端手法よりも優れた結果が得られた。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:52:03 GMT)
Revisiting Energy-Based Model for Out-of-Distribution Detection [23.4] Outlier Exposure by Simple Transformations (OEST)は、"peripheral-distribution"(PD)データを活用することで、OOD検出を強化するフレームワークである。
PDデータは単純なデータ変換によって生成されるサンプルであり、手動でキュレートされたアウトレイラに代わる効率的な代替手段を提供する。
OEST*は最先端の手法と比較して精度が良く、あるいは類似している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:25:26 GMT)
Progressive Vision-Language Prompt for Multi-Organ Multi-Class Cell Semantic Segmentation with Single Branch [23.3] 単一ブランクH(MONCH)を用いたマルチオルガNマルチクラスセルセマンティックセグメンテーション法
テキストと多粒度視覚特徴の相乗効果に着想を得て,マルチモーダル情報を調和させるプログレッシブプロンプトデコーダを導入する。
PanNukeデータセットの実験では、クラス不均衡と微妙な細胞サイズと形状の変化があり、MONCHは最先端の細胞分割法やビジョン言語モデルよりも優れていることを示した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:44:38 GMT)
Boosting Latent Diffusion with Flow Matching [22.7] フローマッチングは、高速なトレーニングと推論の相補的な特徴から魅力的なアプローチであるが、多種多様な合成は少ない。
凍結拡散モデルと畳み込みデコーダのフローマッチングを導入することにより,高分解能画像合成が可能となることを示す。
最先端の高解像度画像合成は、最小の計算コストで10242ドルのピクセルで達成される。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:58:35 GMT)
Semantic Segmentation Prior for Diffusion-Based Real-World Super-Resolution [22.7] 実世界の画像超解像(Real-ISR)は、大規模なテキスト・画像モデルを活用することで驚くべき飛躍を遂げた。
本稿では,拡散に基づく画像の超解像への追加制御条件としてセマンティックセグメンテーションを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:11:09 GMT)
Fairness without Demographics through Learning Graph of Gradients [22.3] 勾配と群間の相関がグループフェアネスの同定と改善に役立つことを示す。
提案手法はノイズに対して頑健であり,全体の精度を過度に低下させることなく,公平性を著しく向上させることができる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 20:35:50 GMT)
TASR: Timestep-Aware Diffusion Model for Image Super-Resolution [22.2] 制御ネットによる情報注入の時間的ダイナミクスについて検討する。
制御ネットと事前学習された安定拡散の両方の特徴を適応的に統合する新しい時間ステップ対応拡散モデルを提案する。
本手法は,拡散の初期におけるLR情報の透過性を高め,画像の忠実性を保証する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:39:54 GMT)
Open-TI: Open Traffic Intelligence with Augmented Language Model [22.1] Open-TIは、チューリング識別可能なトラフィックインテリジェンスを目標とする革新的なモデルである。
ゼロから徹底的な交通分析を行うことができる最初の方法である。
Open-TIは、トレーニングや交通信号制御ポリシーの適用といったタスク固有の実施を可能にする。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 20:18:30 GMT)
Long-context Language Models Are Not Good At Retrieval Without Enough Steps [21.7] Long-context Language Model (LCLM) はますます人気が高まっている。
しかし、標準の長文検索では完璧に近いが、実際にはそれらすべてに向いていない。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:03:49 GMT)
Beyond the Comfort Zone: Emerging Solutions to Overcome Challenges in Integrating LLMs into Software Products [21.5] 大規模言語モデル(LLM)は、様々な産業にまたがるソフトウェア製品にますます組み込まれています。
この研究では、ソフトウェア開発者が直面した課題をナビゲートするために採用している、新たなソリューションについて検討する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:20:40 GMT)
CleanDIFT: Diffusion Features without Noise [21.1] 大規模事前学習拡散モデルの内部特徴は、近年、幅広い下流タスクのための強力な意味記述子として確立されている。
このノイズは、異なるランダムノイズをアンサンブルすることで補うことができないこれらの特徴の有用性に重大な影響を与えることを示す。
拡散バックボーンが高品質でノイズのないセマンティックな特徴を提供するための軽量で教師なしの微調整手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:29:04 GMT)
Elephants Never Forget: Memorization and Learning of Tabular Data in Large Language Models [21.1] 大規模言語モデル (LLM) は様々なタスクに適用できるが、データ汚染と記憶の重大な問題はしばしば誇張される。
この研究は、トレーニング中に言語モデルがデータセットを見たかどうかを評価するためのさまざまなテクニックを導入している。
次に、トレーニング中に見られたデータセット上でのLLMの数発の学習性能と、トレーニング後にリリースされたデータセットのパフォーマンスを比較した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:33:18 GMT)
Artificial Intelligence without Restriction Surpassing Human Intelligence with Probability One: Theoretical Insight into Secrets of the Brain with AI Twins of the Brain [21.0] 人工知能(AI)は、将来的には人間の知性を上回るように進化するのか?
本稿では、理論上、神経科学のための新しい細胞レベルのAI技術を持つ新しいAIツインが、脳とその機能システムに近似できることを示す。
本稿では,70年前にFrank Rosenblatt氏がAIの可能性について行った予想の有効性を間接的に証明する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:17:44 GMT)
TOOL-ED: Enhancing Empathetic Response Generation with the Tool Calling Capability of LLM [20.9] 共感的会話は、個人間の日々の会話において重要な特徴である。
大規模言語モデル (LLM) は共感的応答を生成する上で優れた性能を示した。
本稿では,コモンセンス・ナレッジ・ベースを共感的ツールとしてカプセル化した感情的ナレッジ・ツール・コール(EKTC)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:50:17 GMT)
Defending Against Repetitive Backdoor Attacks on Semi-supervised Learning through Lens of Rate-Distortion-Perception Trade-off [20.7] 半教師付き学習(SSL)は、わずかなラベル付きデータで顕著なパフォーマンスを達成した。
信頼できないデータの大規模なプールは、データ中毒に極めて脆弱であり、バックドア攻撃につながる可能性がある。
トリガーパターンとターゲットクラスの関係を阻害する新しい手法であるunlabeled Data Purification (UPure)を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:28:18 GMT)
SALVE: A 3D Reconstruction Benchmark of Wounds from Consumer-grade Videos [20.7] 本稿では,消費者向けビデオからの3次元創傷再建について述べる。
SALVEデータセットを導入し、異なるカメラで捉えた現実的な創傷ファントムのビデオ記録を含む。
我々は,従来のフォトグラメトリーパイプラインから高度なニューラルレンダリングアプローチまで,最先端の3次元再構成手法の精度と精度を評価する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:44:18 GMT)
RFSR: Improving ISR Diffusion Models via Reward Feedback Learning [20.6] 報奨フィードバック学習を用いたタイムステップ対応トレーニング戦略を提案する。
In the initial denoising stage of ISR diffusion, we applied low- frequency constraints to super- resolution (SR) images。
後半の段階では、報奨フィードバック学習を用いて、SR画像の知覚的および審美的品質を改善する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:23:17 GMT)
PEMF-VVTO: Point-Enhanced Video Virtual Try-on via Mask-free Paradigm [20.4] Video Virtual Try-onは、ソースパーソンビデオ内のセマンティックに整列した試着領域に衣料イメージを流用することを目的としている。
以前の手法では、インペイントマスクを利用して、元のビデオの原着を除去していた。
新たなPEMF-VVTO(PEMF-VVTO)を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:24:15 GMT)
Hyperparameter Tuning Through Pessimistic Bilevel Optimization [20.4] 我々は、計算的に難解な悲観的二段階最適化問題を解くために、緩和に基づく新しい近似法を開発した。
悲観的なソリューションは、トレーニングデータや摂動テストデータに制限がある場合、楽観的な方法よりも優れた予測性能を示しています。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:01:20 GMT)
Large Pre-trained time series models for cross-domain Time series analysis tasks [20.2] Large Pre-trained Time-Series Models (LPTM) は、事前トレーニング中に最適なデータセット固有のセグメンテーション戦略を自動的に識別する適応セグメンテーションの新しい手法である。
LPTMは、最先端のベースラインに比べて最大40%データが少なく、トレーニング時間も50%少ない。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:32:56 GMT)
Coverage-Constrained Human-AI Cooperation with Multiple Experts [20.1] 本稿では,CL2DC法(Coverage-Constrained Learning to Defer and Complement with Specific Experts)を提案する。
CL2DCは、AI予測単独または特定の専門家に延期または補完することで、最終的な決定を行う。
最先端のHAI-CC法に比べて優れた性能を発揮する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:13:22 GMT)
ASR-EC Benchmark: Evaluating Large Language Models on Chinese ASR Error Correction [20.0] 本稿では,中国語におけるASR誤り訂正について検討する。
我々の知る限りでは、中国初のASRエラー訂正ベンチマークである。
近年の言語モデル(LLM)の進歩に触発されて,LLMのパワーを利用してASRの誤りを訂正する方法を検討する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:52:10 GMT)
Robust Multi-bit Text Watermark with LLM-based Paraphrasers [19.8] LLMでパラフレーズを埋め込んだ、知覚不能なマルチビットテキスト透かしを提案する。
透かしを埋め込むために、2つのパラフレーズを使って文レベルで定義済みのバイナリコードをエンコードします。
我々の透かしは、小さな(1.1B)テキストパラフレーズでAUCを99.99%以上検出できることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:43:12 GMT)
AIM: Adaptive Inference of Multi-Modal LLMs via Token Merging and Pruning [19.7] マルチモーダルLLMのための学習自由適応推論法を提案する。
最小限の設計により,本手法はビデオと画像の両方に応用できる。
同様の計算コストで,本手法は長いビデオ理解において最先端の手法よりも優れる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:47:57 GMT)
Deep Learning in Single-Cell and Spatial Transcriptomics Data Analysis: Advances and Challenges from a Data Science Perspective [19.7] 単一細胞および空間転写学の発展は、細胞の性質、機能、相互作用を研究する能力に革命をもたらした。
しかし,単一セル・空間オミクスデータの解析は依然として困難である。
ディープラーニングは、高次元の複雑なデータを処理し、意味のあるパターンを自動的に識別できる強力なツールとして登場した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:07:11 GMT)
A Survey of Wireless Sensing Security from a Role-Based View: Victim, Weapon, and Shield [19.6] 本稿では,ワイヤレスセンシングのセキュリティに関する,ロールベースの視点からの初の総合的な調査について述べる。
本稿では,既存の研究を,攻撃の犠牲者としての無線システム,攻撃の武器としての無線信号,セキュリティアプリケーションのためのシールドとしての無線信号の3つのクラスに体系的に分類する新しい分類フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:34:36 GMT)
Perception Tokens Enhance Visual Reasoning in Multimodal Language Models [19.3] 本稿では、言語が不十分なタスクの推論を支援するために設計された画像表現であるパーセプショントークンを紹介する。
知覚トークンは、言語モデルにおけるチェーン・オブ・シークレットのプロンプトに似た補助的推論トークンとして機能する。
AURORAトレーニング手法は、視覚入力に対する推論を改善するために知覚トークンを増強する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:45:35 GMT)
Volumetrically Consistent 3D Gaussian Rasterization [18.8] 点数が少ないビューワ内であっても,スプレイティングとその近似は不要であることを示す。
我々は3DGSよりも高精度なアルファ値の導出にこの分析透過率フレームワークを用いる。
提案手法は3DGSよりも精度が高く,点数が少ない不透明な面を表す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:05:43 GMT)
Task-driven Image Fusion with Learnable Fusion Loss [18.8] Task-driven Image Fusion (TDFusion)は、タスクロスによってガイドされる学習可能なフュージョンロスを組み込んだフュージョンフレームワークである。
核融合およびタスク関連アプリケーションにおけるTDFusionの性能を示す実験。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:42:17 GMT)
DynaMITE-RL: A Dynamic Model for Improved Temporal Meta-Reinforcement Learning [18.6] 本稿ではメタ強化学習(meta-RL)アプローチであるDynaMITE-RLを紹介する。
また,DynaMITE-RLは,サンプル効率と推論リターンにおいて,最先端のベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:48:43 GMT)
Composed Image Retrieval for Training-Free Domain Conversion [18.3] 本稿では,強力な視覚言語モデルにより,追加の訓練を伴わずに十分な記述力が得られることを示す。
クエリ画像をテキストインバージョンを用いてテキスト入力空間にマッピングする。
提案手法は,標準ベンチマークと新たに導入されたベンチマークにおいて,先行技術よりも優れた性能を示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:16:17 GMT)
Channel Reflection: Knowledge-Driven Data Augmentation for EEG-Based Brain-Computer Interfaces [18.0] 脳-コンピュータインターフェース(BCI)は、人間の脳と外部デバイスとの直接通信を可能にする。
EEGベースのBCIは現在、有能なユーザーにとって最も人気がある。
本稿ではパラメータフリーチャネルリフレクション(CR)データ拡張手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:21:30 GMT)
Analysis of Classifier-Free Guidance Weight Schedulers [18.0] CFGはテキストから画像への拡散モデルへの付着の質と条件を高める。
最近の研究は拡散過程を通じて重みが変化し、優れた結果が報告されるが、理性や分析は提供されない。
以上の結果から,単調な単調なウェイトスケジューラが常に性能改善につながることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:38:11 GMT)
AntLM: Bridging Causal and Masked Language Models [17.7] Causal Language Modeling (CLM) Masked Language Modeling (MLM) はトランスフォーマーネットワークに基づく2つの主流パラダイムである。
本稿では,CLMとtextを統合した新しい言語モデリングパラダイムである$bfAntLM$を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:34:15 GMT)
Force-Guided Bridge Matching for Full-Atom Time-Coarsened Dynamics of Peptides [17.6] 我々は、FBM(Force-Guided Bridge Matching)と呼ばれる条件付き生成モデルを提案する。
FBMはフル原子時間粗大化力学を学習し、ボルツマン制約分布を目標とする。
ペプチドからなる2つのデータセットの実験は、包括的メトリクスの観点から、我々の優位性を検証する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 03:24:18 GMT)
Medical SAM 2: Segment medical images as video via Segment Anything Model 2 [17.5] 医用SAM2(MedSAM-2)は,汎用的な2次元および3次元の医用画像セグメンテーションのための自動追跡モデルである。
われわれはMedSAM-2を5つの2Dタスクおよび9つの3Dタスク、例えば、白血球、視神経、網膜血管、下顎骨、冠動脈、腎臓腫瘍、肝腫瘍、乳癌、鼻咽喉頭癌、前庭シュワン、縦隔リンパ結節、大脳動脈、歯槽下神経、腹部臓器などについて評価した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 23:51:25 GMT)
On Approximability of $\ell_2^2$ Min-Sum Clustering [17.4] 本稿では、$ell2$ minsum $k$-clustering問題に対して、最初の強度近似結果を与える。
さらに、ジョンソン被覆仮説の均衡を仮定すると、その目的を1.327よりも良い因子に近似することはNPハードであることが示される。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:03:27 GMT)
When LLMs Meet Cybersecurity: A Systematic Literature Review [17.2] 大規模言語モデル(LLM)の急速な開発は、サイバーセキュリティを含む様々な分野に新しい道を開いた。
この研究領域の包括的概要は欠如している。
包括的概要は、サイバーセキュリティ指向のLSMの構築、様々なサイバーセキュリティタスクへのLSMの適用、この分野における課題とさらなる研究の3つの重要な研究課題に対処する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:27:06 GMT)
MILLION: A General Multi-Objective Framework with Controllable Risk for Portfolio Management [16.8] pOrtfolio maMILLION に対して controLLableIsk を用いた汎用 Multi-objectIve フレームワークを提案する。
リスクコントロールフェーズでは,ポートフォリオ適応とポートフォリオ改善という2つの手法を提案する。
その結果,提案手法の有効性と有効性を示した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 05:19:34 GMT)
HIIF: Hierarchical Encoding based Implicit Image Function for Continuous Super-resolution [16.7] 連続画像超解像のためのtextbfHIIF を提案する。
提案手法では,非局所的な情報を考慮した多頭部線形注意機構を暗黙の注意ネットワーク内に組み込む。
実験により、異なるバックボーンエンコーダと統合した場合、HIIFはPSNRの0.17dBまで、最先端の連続画像超解像法より優れることがわかった。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:35:20 GMT)
Black-Box Forgery Attacks on Semantic Watermarks for Diffusion Models [16.6] 攻撃者は、異なる潜在空間やアーキテクチャであっても、無関係なモデルを利用して、強力で現実的な偽造攻撃を行うことができることを示す。
第1は、対象の透かしを実画像に印字し、無関係のLCMにおいて任意の画像の潜在表現を操作する。
第2の攻撃は、透かし画像を反転させて任意のプロンプトで再生することにより、目標の透かしで新たな画像を生成する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:57:17 GMT)
Supporting Gig Worker Needs and Advancing Policy Through Worker-Centered Data-Sharing [16.5] 本研究では、労働者主導のデータ共有を通じて、労働者がそのようなコストを克服する可能性について考察する。
我々は米国の11の政策ドメインの専門家にインタビューを行い、4つのドメインで14人の活動的なギグワーカーと共同設計ワークショップを開催した。
本研究は、データ集合体に関する労働者の関心や欲求と、政策立案者の優先した取り組み、情報ニーズ、そして(ミス)調整について概説した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:34:38 GMT)
HO-Cap: A Capture System and Dataset for 3D Reconstruction and Pose Tracking of Hand-Object Interaction [16.4] ビデオ中の手や物体の3次元再構成とポーズトラッキングのためのデータキャプチャシステムと新しいデータセットHO-Capを導入する。
システムは複数のRGB-DカメラとHoloLensヘッドセットをデータ収集に利用し、高価な3Dスキャナーやモキャップシステムの使用を避ける。
ビデオ中の手や物体の形状やポーズをアノテートする半自動手法を提案し,手動ラベリングと比較してアノテーションの時間を大幅に短縮する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 21:05:00 GMT)
The Matrix: Infinite-Horizon World Generation with Real-Time Moving Control [16.1] The Matrixは、連続した720pのリアルタイム映像ストリームを生成することができる最初の基礎的現実的世界シミュレータである。
Matrixは、ユーザーが連続して1時間連続で様々な地形を横断することを可能にする。
Matrixは、BMW X3がオフィス設定で運転する環境をシミュレートすることができる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:59:05 GMT)
Survey of different Large Language Model Architectures: Trends, Benchmarks, and Challenges [15.9] 大規模言語モデル(LLMs)は、自然言語の理解に精通したディープラーニングモデルのクラスである。
これらのモデルの先進的なサブセットであるMultimodal Large Language Models (MLLM)は、複数のデータモダリティを処理および解釈するためにLLM機能を拡張している。
本調査は,LLMの最近の進歩を概観する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:14:06 GMT)
Synesthesia of Machines (SoM)-Enhanced ISAC Precoding for Vehicular Networks with Double Dynamics [15.8] 統合センシング・通信(ISAC)技術は車載ネットワークにとって不可欠である。
リアルタイムプリコーディング設計において,通信チャネルの時間変化とターゲットの迅速な移動は重要な課題となる。
本稿では、位置決めやチャネル情報といったモダリティを活用してこれらのダイナミクスに適応する、SoM(SoM)強化プリコーディングのシンセサイザを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 01:45:42 GMT)
Immersed figure-8 annuli and anyons [15.8] 本研究では, 背景物理系の基底状態と区別できない, 没入型8段丘上にアベリア国家が存在することを示す。
物理系における強同型をエノンで気にする理由を説明し、アベリアン・エノン理論の文脈で証明を与える。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:00:06 GMT)
Automated Test-Case Generation for REST APIs Using Model Inference Search Heuristic [15.6] EvoMasterは進化的アルゴリズム(EA)を使用して、REST APIのテストケースを自動的に生成するツールである。
本稿では、リアルタイム自動学習を用いて自動テストケース生成プロセスのガイドを行う新しい検索(MISH)を提案する。
MISHはシステム全体の振る舞いの表現を学び、推論される経路に基づいてテストケースの適合度を定義する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:00:14 GMT)
Topological quantum walk in synthetic non-Abelian gauge fields [15.4] トポロジカル量子ウォークのための合成非アベリアゲージ場を導入する。
SU(2)ゲージ場は、モータと準エネルギーの両方においてピエルス置換をもたらす。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 05:37:29 GMT)
StarVector: Generating Scalable Vector Graphics Code from Images and Text [15.3] 本稿では,SVG生成のための多モーダル大言語モデルであるStarを紹介する。
画像のセマンティクスを理解し、SVGプリミティブをコンパクトで正確な出力に使用することにより、画像ベクトル化を行う。
ベクトル化タスク間の一般化を可能にする2Mサンプルの多種多様なデータセットであるStarStackをトレーニングする。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:31:44 GMT)
Enhancing Function-Calling Capabilities in LLMs: Strategies for Prompt Formats, Data Integration, and Multilingual Translation [15.3] 大規模言語モデル(LLM)は、特に関数呼び出しにおいて、かなり高度な自律エージェントを持つ。
本研究は, LLMの機能呼び出し能力の向上を, 様々なアプローチを探求することによって研究している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 03:34:42 GMT)
Backdoor Attacks and Countermeasures in Natural Language Processing Models: A Comprehensive Security Review [15.2] 言語モデル(LM)は、現実世界のアプリケーションでますます人気が高まっている。
バックドア攻撃は、トリガーが存在するときに悪意のある動作が起動される深刻な脅威である。
この研究は、NLPコミュニティにバックドア攻撃と対策のタイムリーなレビューを提供することを目的としている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 05:04:46 GMT)
ODE: Open-Set Evaluation of Hallucinations in Multimodal Large Language Models [15.2] 大規模言語モデル(MLLM)における幻覚を評価するためのオープンセット動的プロトコルを提案する。
ODEは、現実世界のオブジェクト概念、それらの属性、それらの間の分布関係を表現するために、グラフベースの構造を用いる。
生成タスクと識別タスクの両方において幻覚を評価する構造化クエリのさまざまなサンプルを生成する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:44:57 GMT)
SPORTU: A Comprehensive Sports Understanding Benchmark for Multimodal Large Language Models [15.1] SPORTUはマルチレベルスポーツ推論タスク間でMLLM(Multimodal Large Language Models)を評価するために設計されたベンチマークである。
SPORTUは2つの重要なコンポーネントで構成されている。 SPORTU-textは900の多重選択質問と、ルール理解と戦略理解のための人間アノテーションによる説明を含む。
SPORTUビデオは、7つの異なるスポーツで1,701本のスローモーションビデオクリップと12,048本のQAペアで構成され、マルチレベル推論を評価するように設計されている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 00:43:57 GMT)
FCL-ViT: Task-Aware Attention Tuning for Continual Learning [15.0] 継続学習(CL)では、以前のディープニューラルネットワーク(DNN)の知識を、古い知識を忘れずに新しいタスクに適応させる。
本稿では、フィードバック機構を用いて、現在のタスクに合わせたリアルタイムな動的注意機能を生成する新しいフィードバック継続学習視覚変換器(FCL-ViT)を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:35:48 GMT)
Intent-driven In-context Learning for Few-shot Dialogue State Tracking [14.9] 対話状態追跡(DST)はタスク指向対話システムにおいて重要な役割を果たす。
IDIC-DSTは、MultiWOZ 2.1とMultiWOZ 2.4データセット上の数ショット設定で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:25:41 GMT)
Theoretical limitations of multi-layer Transformer [14.6] マルチ層デコーダのみの変換器に対して,最初の$textitunconditional$lowboundを証明した。
また、ある$textitindistinguishable$$textitde$すべての可能な入力を見つける新しい証明手法も導入します。
我々の新しい通信モデルと証明技術は、トランスの計算能力のさらなる理解に役立つと信じている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:37:31 GMT)
Controlling Counterfactual Harm in Decision Support Systems Based on Prediction Sets [14.5] 予測セットに基づく意思決定支援システムでは、正確性と因果的害との間にトレードオフがある。
自然で検証不能な単調な仮定の下では、システム自体が人間による予測を用いて、どれだけの頻度で害を引き起こす可能性があるかを推定することができる。
また, 仮説が弱く, 検証可能な場合, 人間による予測のみを用いて, システムが再び危害を引き起こす頻度を制限できることも示している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:04:07 GMT)
State Frequency Estimation for Anomaly Detection [14.3] 本稿では,状態訪問頻度を用いてスコアを動的に適用し,異常検出に適応させる新しい手法であるSEQUENTを提案する。
3つのNetFlowデータセットに対するSEQUENTの評価は,本手法が既存手法より優れていることを示すとともに,異常検出の有効性を示した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:30:35 GMT)
Validity-Preserving Delta Debugging via Generator Trace Reduction [14.2] GReduceは、削減された有効なテスト入力を出力するジェネレータ上の他の実行を検索する。
GReduceはPersesやT-PDDなど最先端の構文ベースのリデューサを大幅に上回っている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:09:31 GMT)
Dynamic Graph Neural Ordinary Differential Equation Network for Multi-modal Emotion Recognition in Conversation [14.2] 会話におけるマルチモーダル感情認識のための動的グラフニューラル正規微分方程式ネットワーク(DGODE)を提案する。
提案したDGODEは、感情の動的変化を組み合わせ、話者の感情の時間的依存を捉える。
2つの一般公開されたマルチモーダル感情認識データセットの実験により、提案したDGODEモデルは、様々なベースラインと比較して優れた性能を示した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 01:07:59 GMT)
RelCon: Relative Contrastive Learning for a Motion Foundation Model for Wearable Data [14.1] 本稿では,新しい自己指導型 *Rel*ative *Con*trastive Learning アプローチである RelCon を紹介する。
学習可能な距離測定は、モチーフの類似性とドメイン固有の意味情報をキャプチャする。
自己教師型モデルは、大規模なウェアラブルデータセットから87,376人の参加者から10億のセグメントでトレーニングされている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 01:56:07 GMT)
Who Brings the Frisbee: Probing Hidden Hallucination Factors in Large Vision-Language Model via Causality Analysis [14.0] 現実の応用における大きな課題は幻覚であり、LVLMは存在しない視覚要素を生成し、ユーザの信頼を損なう。
我々は、オブジェクト、コンテキスト、セマンティックフォアグラウンド・バックグラウンド構造といった隠れた要因が幻覚を引き起こすという仮説を立てた。
画像・テキスト・プロンプト・ネットワーク・サリエンシの因果関係を解析することにより,これらの要因をブロックするための介入を系統的に検討する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 01:23:57 GMT)
MLQM: Machine Learning Approach for Accelerating Optimal Qubit Mapping [14.0] 最適量子ビットマッピング(MLQM)の高速化のための機械学習手法を提案する。
まず,事前知識と機械学習に基づくグローバル検索空間の探索手法を提案する。
第2に,学習課題における有効サンプルの可用性の限界に対処するため,MLQMは新たなデータ拡張と改善手法を導入した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:49:09 GMT)
A path-norm toolkit for modern networks: consequences, promises and challenges [13.9] この研究は、一般的なDAG ReLUネットワークをバイアスで完全に包含するパスノルムに関する最初のツールキットを導入する。
これは、最も広く適用可能なパスノルムベースであるだけでなく、このタイプの最も鋭い既知の境界を回復または打ち負かすような、現代のニューラルネットワークの一般化境界を確立することを可能にする。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:04:02 GMT)
OpenDriver: An Open-Road Driver State Detection Dataset [13.8] 本稿では,運転状態検出のための大規模マルチモーダル運転データセット OpenDriver を提案する。
OpenDriverは合計3,278回の運転で、信号収集期間は約4,600時間である。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:43:10 GMT)
One Initialization to Rule them All: Fine-tuning via Explained Variance Adaptation [13.6] 最も一般的に使われている微調整法は、ローランク適応(LoRA)を介してトレーニング済みの重量を更新することである。
本稿では,アクティベーションベクトルのミニバッチ上での特異値分解(SVD)を計算することにより,新たな重み付けをデータ駆動方式で初期化することでLoRAを改善することを提案する。
このようにして、微調整プロセスの間、どの情報をメンテナンスするか、無視するかだけを学ぶ必要がある。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:18:17 GMT)
UTSD: Unified Time Series Diffusion Model [13.6] 多領域確率分布をモデル化するために、初めて統一時系列拡散モデルを確立する。
我々は、主要なベンチマークで広範な実験を行い、事前訓練されたUTSDは、すべてのデータドメインにおける既存の基礎モデルより優れています。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:42:55 GMT)
Semi-Supervised Transfer Boosting (SS-TrBoosting) [13.3] 半教師付きドメイン適応(SSDA)は、少ないラベル付きターゲットデータを用いて、ターゲットドメインの高性能モデルを訓練することを目的としている。
我々は、新しい微調整フレームワーク、半教師あり転送促進(SS-TrBoosting)を提案する。
より効率的なデータ伝送とデータプライバシ保護のために,SS-TrBoostingを半教師なしソースフリードメイン適応(SS-SFDA)に拡張するためのソースデータ生成手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:57:55 GMT)
Beyond Questions: Leveraging ColBERT for Keyphrase Search [13.3] キーワード検索は伝統的にウェブ検索の基盤となっている。
現在の高密度検索モデルは、しばしばキーフレーズのようなクエリで失敗する。
本稿では,キーフレーズクエリの文書ランキング向上にColBERTアーキテクチャを用いた新しいモデルを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:27:35 GMT)
Prediction-Powered Ranking of Large Language Models [13.3] 大規模な言語モデルは、しばしば人間の好みに合わせてランク付けされる。
このギャップを埋める統計フレームワークを開発します。
ペアワイズ比較のみを用いて構築されたランクセットは、人間のペアワイズ選好と(分布の)矛盾することが多いことを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:03:04 GMT)
Byte BPE Tokenization as an Inverse string Homomorphism [12.9] トークン化は文字列とトークンの間の逆準同型として作用することを示す。
これは、原言語の文字空間とトークン化された言語のトークン空間が同型であることを示唆している。
また、トークン化器から返されるあいまいなトークン化を指す固有トークン化の概念についても検討する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:38:11 GMT)
Multi-Branch Mutual-Distillation Transformer for EEG-Based Seizure Subtype Classification [12.9] てんかんの診断において, クロスオブジェクト脳波(EEG)に基づく発作サブタイプ分類が重要である。
ディープラーニングは、潜在パターンを自動的に抽出する能力のため、有望なソリューションである。
本稿では,クロスオブジェクト脳波に基づく発作サブタイプ分類のためのマルチブランチ相互蒸留変換器を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:31:23 GMT)
Surveying the Effects of Quality, Diversity, and Complexity in Synthetic Data From Large Language Models [12.9] データ品質,多様性,複雑性の観点から,各アルゴリズムが生成した合成データの構成によるアルゴリズムの評価を行った。
合成データパイプラインにおける各種成分が各データ特性に与える影響について検討する。
これらのトレードオフのバランスは、将来の自己改善アルゴリズムの開発に不可欠である、と我々は主張する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:47:45 GMT)
PICASSO: A Feed-Forward Framework for Parametric Inference of CAD Sketches via Rendering Self-Supervision [12.6] PICASSOは手書きと精密なスケッチ画像から2次元CADスケッチをパラメータ化するためのフレームワークである。
本フレームワークは,CADスケッチパラメータ化ネットワークの事前学習を可能にするために,自己スーパービジョンのレンダリングを活用する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:07:40 GMT)
ParetoFlow: Guided Flows in Multi-Objective Optimization [12.4] オフライン多目的最適化(MOO)では、関連するラベルのオフラインデータセットを同時に複数の目的に活用する。
最近のイテレーションは主に進化的最適化とベイズ最適化を採用しており、データに固有の生成能力に限定的に注意が向けられている。
本手法は,様々なタスクにおける最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 21:14:18 GMT)
Analytic Study of Text-Free Speech Synthesis for Raw Audio using a Self-Supervised Learning Model [12.3] 自己教師付き学習(SSL)モデルから得られた生音声のテキストフリー音声表現について検討する。
テキスト表現は意味情報を保存するのに有利である一方、離散的なシンボル表現は音響コンテンツを保存するのに優れていることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:52:03 GMT)
Pixel-level and Semantic-level Adjustable Super-resolution: A Dual-LoRA Approach [12.1] 本稿では,2つの LoRA モジュールを事前訓練した安定拡散(SD)モデルで学習し,改良および調整可能な SR 結果を実現する PiSA-SR を提案する。
デフォルト設定では、PiSA-SRは単一の拡散ステップで実行でき、実際のSRをリードすることで、品質と効率の両方を達成できる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:07:49 GMT)
InfinityDrive: Breaking Time Limits in Driving World Models [12.0] InfinityDriveは、例外的な一般化機能を備えた最初の駆動世界モデルである。
最先端のパフォーマンスを高忠実さ、一貫性、多様性で実現し、微細なビデオ生成を実現している。
複数のデータセットのテストは、複雑なさまざまなシナリオを生成するInfinityDriveの機能を検証する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:09:07 GMT)
A Distractor-Aware Memory for Visual Object Tracking with SAM2 [11.9] メモリベースのトラッカー(英: Memory-based tracker)は、最近追跡されたフレームをメモリバッファに連結し、現在の画像をバッファされたフレームに到達させることでターゲットをローカライズすることにより、ターゲットモデルを形成するビデオオブジェクトセグメンテーション手法である。
SAM2.1++はSAM2.1と関連するSAMメモリ拡張を7つのベンチマークで上回り、6つのベンチマークで新しい最先端を設定できる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:58:53 GMT)
FoundHand: Large-Scale Domain-Specific Learning for Controllable Hand Image Generation [11.8] 単手画像と双手画像のための大規模ドメイン固有拡散モデルFoundHandを提案する。
2Dキーポイントとセグメンテーションマスクアノテーションを備えた大規模ハンドデータセットであるFoundHand-10Mを使用している。
本モデルでは,手の動きを再現したり,手の動きを伝達したり,新しいビューを合成したりといった,中核的な機能を示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 20:51:17 GMT)
CamI2V: Camera-Controlled Image-to-Video Diffusion Model [11.8] 統合カメラポーズは、ビデオ拡散モデルにおけるユーザフレンドリーで物理インフォームド条件であり、正確なカメラ制御を可能にする。
重要な課題の1つは、幾何学的整合性とカメラ制御性を高めるために、ノイズの多いクロスフレーム相互作用を効果的にモデル化することである。
我々は,条件の品質と不確実性を低減し,ノイズのあるクロスフレーム特徴をノイズのある状態の形で解釈する能力とを革新的に関連付ける。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:54:44 GMT)
Winners with Confidence: Discrete Argmin Inference with an Application to Model Selection [11.6] 本研究では,ベクトル雑音観測の最小値の指標を求める問題について検討する。
この問題は、人口/政治比較、離散的最大可能性、モデル選択に関係している。
我々は,高次元設定においても,異常な正常なテスト統計を発達させる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:43:10 GMT)
Seamless Optical Cloud Computing across Edge-Metro Network for Generative AI [11.5] 本稿では,エッジ-メトロネットワーク上でシームレスにデプロイ可能な光クラウドコンピューティングシステムを提案する。
入力とモデルを光に変調することで、エッジ-メトロネットワークを介して、幅広いエッジノードが光コンピューティングセンターに直接アクセスすることができる。
実験による検証では、118.6 mW/TOP(テラ演算毎秒)のエネルギー効率を示し、従来の電子ベースのクラウドコンピューティングソリューションと比較して2桁のエネルギー消費を削減した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:49:13 GMT)
FocDepthFormer: Transformer with latent LSTM for Depth Estimation from Focal Stack [11.4] 本稿では,トランスフォーマーをLSTMモジュールとCNNデコーダと統合した新しいトランスフォーマーネットワークFocDepthFormerを提案する。
LSTMを組み込むことで、FocDepthFormerは大規模な単分子RGB深さ推定データセットで事前トレーニングすることができる。
我々のモデルは、複数の評価指標で最先端のアプローチより優れています。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 01:35:26 GMT)
A Performance Investigation of Multimodal Multiobjective Optimization Algorithms in Solving Two Types of Real-World Problems [11.3] 特徴選択と位置選択の2種類の実世界のマルチモーダル多目的最適化問題を定式化する。
この2つの現実世界の問題を解決するために,既存の7つのMMOAの性能評価を行った。
実験結果の分析では,MMOAの特徴を検証し,実世界のアプリケーションで適切なMMOAを選択するための洞察を提供する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:02:53 GMT)
Retrofitting XoM for Stripped Binaries without Embedded Data Relocation [10.9] 我々は、x86-64プラットフォーム上でXoMを削除したバイナリにシームレスに再適合させる実用技術であるPXoMを提案する。
我々は、Intelのハードウェア機能であるMemory Protection Keysを利用して、効率的なきめ細かいパーミッションコントロールを提供します。
PXoMは、必要なガジェットをすべて回収するために、小さなウィグルスペースを持つ敵を置き去りにしており、PXoMは現実世界の配備に実用的であることを示唆している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:47:40 GMT)
ChatTS: Aligning Time Series with LLMs via Synthetic Data for Enhanced Understanding and Reasoning [10.9] 本稿では,時系列解析用に設計された新しいMLLMであるChatTSを紹介する。
ChatTSは、視覚MLLMが画像を処理する方法と同様、時系列をモダリティとして扱う。
Time Series Evol-Instructは様々な時系列Q&Aを生成し、モデルの推論能力を高めます。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:06:15 GMT)
Rethinking Spectral Augmentation for Contrast-based Graph Self-Supervised Learning [10.8] スペクトル領域に関する一見矛盾する仮定に基づく手法は、学習性能の顕著な向上を示す。
このことは、高度なスペクトル拡大の計算オーバーヘッドが、それらの実用上の利点を正当化するものではないことを示唆している。
提案した洞察は,グラフ自己教師型学習の理解と実装を改良する可能性があり,この分野における飛躍的な進歩を示している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:41:49 GMT)
Beyond [cls]: Exploring the true potential of Masked Image Modeling representations [10.8] Masked Image Modeling (MIM) は視覚表現の自己監督学習(SSL)の一般的な手法として登場した。
ハイレベルな知覚タスクのために、MIMが事前訓練したモデルは、JEA(Joint-Embedding Architectures)よりも低品質のアウト・オブ・ボックス表現を提供する。
JEAが関連する画像断片の集合上に表現を構築するのに対して、MIMモデルは、ほぼ全ての画像コンテンツを集約する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:08:32 GMT)
Advanced Risk Prediction and Stability Assessment of Banks Using Time Series Transformer Models [10.8] 本稿では,時系列トランスモデルに基づく予測フレームワークを提案する。
モデルとLSTM, GRU, CNN, TCN, RNN-Transformerモデルを比較した。
実験結果から,Time Series Transformerモデルは平均二乗誤差(MSE)と平均絶対誤差(MAE)評価指標の両方において,他のモデルよりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:15:27 GMT)
Lightweight Stochastic Video Prediction via Hybrid Warping [10.4] ディープニューラルネットワークによる正確なビデオ予測、特に動的領域では、自律運転、リモートワーク、遠隔医療といった重要な応用において、コンピュータビジョンにおいて難しい課題である。
本稿では,ハイブリッド・ワープ・ストラテジーを用いて動的領域に着目した,新しい長期的複雑性ビデオ予測モデルを提案する。
リアルタイムの予測を考慮し、MobileNetベースの軽量アーキテクチャをモデルに導入する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:33:27 GMT)
Higher Order Transformers: Efficient Attention Mechanism for Tensor Structured Data [10.3] 高次変換器(英: Higher-order Transformer、HOT)は、高次テンソル(英語版)と呼ばれる2つ以上の軸を持つデータを処理するように設計されている。
高次テンソルアテンションに関連する計算問題に対処するために、新しいクロネッカー分解アテンション機構を導入する。
多変量時系列予測と3次元医用画像分類を含む2つの高次元課題に対するHOTの有効性を検証する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 00:10:47 GMT)
SAVER: A Toolbox for Sampling-Based, Probabilistic Verification of Neural Networks [10.1] ツールボックスは、所定の入力分布に対するニューラルネットワークの出力が所定のセットに含まれるかどうかを、ユーザが特定した信頼度で設定する。
ツールボックスは、符号付き距離関数の特性を利用して集合の包含を定義するサンプリングベースのアプローチで構成されている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 01:13:44 GMT)
ClusterKV: Manipulating LLM KV Cache in Semantic Space for Recallable Compression [10.0] ロングコンテキストは推論効率に重大な課題をもたらす。
本稿では,意味クラスタの粒度でトークンをリコールするClusterKVを紹介する。
実験結果から、ClusterKVは32kのコンテキスト長を持つ様々なタスクにおいて、無視可能な精度の損失が得られることがわかった。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:58:27 GMT)
Deep Variational Bayesian Modeling of Haze Degradation Process [10.0] 単一画像デハージングのための変分ベイズフレームワークを提案する。
ヘイズ劣化の物理モデルに基づいて,本フレームワークは新たな目的関数を導出する。
私たちのフレームワークは他の既存のデハジングネットワークにシームレスに組み込むことができます。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:24:37 GMT)
Preference-based Pure Exploration [9.9] ベクトル値の報酬を持つ包帯の選好に基づく純粋探索問題について検討する。
我々は、最も好まれるポリシーを特定するために、サンプルの複雑さに基づいた新しい低い境界を導出する。
我々は、最も好まれるポリシーを識別するPreference-based Track and Stop (PreTS)アルゴリズムの設計に利用する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 03:02:55 GMT)
Diffusion-VLA: Scaling Robot Foundation Models via Unified Diffusion and Autoregression [9.9] DiffusionVLAは、自己回帰モデルと拡散モデルとをシームレスに組み合わせ、ビジュモータポリシーを学習するフレームワークである。
自己推論によるポリシー学習を強化するために,新しい推論インジェクションモジュールを導入する。
複数の実ロボットを用いて広範に実験を行い,DiffusionVLAの有効性を検証した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:11:38 GMT)
Training-Free Mitigation of Language Reasoning Degradation After Multimodal Instruction Tuning [9.8] マルチモーダルモデルは通常、強力な大規模言語モデル(LLM)とビジョンエンコーダを組み合わせて、命令チューニングを通じてマルチモーダルデータで訓練される。
言語推論性能に対するマルチモーダル・インストラクション・チューニングの効果について検討する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:56:20 GMT)
Characterizing the Distinguishability of Product Distributions through Multicalibration [9.7] 我々は、$X_0otimes k$と$X_1otimes k$を効率的に区別するために必要となるサンプル数$k$の新しい厳密な特徴を証明した。
我々のフレームワークはGeier (TCC 2022) の結果の導出に利用できる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:56:19 GMT)
Remote Staking with Optimal Economic Safety [9.7] 我々は、最適経済安全を保証された最初のリモートステイキングプロトコルを提示する。
この作業の主要なユースケースは、プロバイダチェーンがBitcoinである場合であり、PoSチェーンを保護するために1.7兆米ドル以上の資産を利用可能にしている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 00:57:45 GMT)
Risk-aware Classification via Uncertainty Quantification [9.6] 本稿では,現実世界のリスク認識分類システムを開発するための3つの基礎的デシラタを紹介する。
これらの原則とEvidential Deep Learningの運用特性の統一性を実証する。
そして、不確実性やリスクが本質である場合、自律エージェントが構造化された意思決定中に判断を行なえるよう、EDLを増強する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:20:12 GMT)
A Measure of the System Dependence of Automated Metrics [9.6] メトリクスがすべてのシステムを公平かつ一貫して扱うようにすることが、同じように重要である、と私たちは主張する。
本稿では,この側面を評価する手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:21:46 GMT)
Accelerated Algorithms for Constrained Nonconvex-Nonconcave Min-Max Optimization and Comonotone Inclusion [9.6] 非コンケーブなmin-max最適化問題の構造化クラスであるコモノトンmin-max最適化について検討する。
最初のコントリビューションでは、extra Anchored Gradient (EAG)アルゴリズムを制約付きコモノトン min-max 最適化に拡張する。
第2のコントリビューションでは、FEG(Fast Extra Gradient)アルゴリズムを制約のないmin-max最適化に拡張する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 21:37:57 GMT)
NeRF and Gaussian Splatting SLAM in the Wild [9.5] 本研究は, カメラトラッキングの精度, 環境要因に対する堅牢性, 計算効率に焦点をあて, 異なるトレードオフを浮き彫りにしている。
ニューラルSLAM法は、特に低光のような困難な条件下では、高い計算コストで優れた堅牢性を達成する。
伝統的な手法は季節を通じて最高に機能するが、照明条件の変化に非常に敏感である。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:11:19 GMT)
EchoONE: Segmenting Multiple echocardiography Planes in One Model [9.5] 医用画像には多面的セグメンテーションが要求される。
本稿では,SAMベースのセグメンテーションアーキテクチャを用いた新しいソリューションであるEchoONEを提案する。
心臓面が異なるマルチソースデータセットに対して、一貫して最先端のパフォーマンスを実証する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 03:19:43 GMT)
Learning on One Mode: Addressing Multi-Modality in Offline Reinforcement Learning [9.4] オフライン強化学習は、環境と対話することなく、静的データセットから最適なポリシーを学習しようとする。
既存の方法は、しばしば一助的行動ポリシーを仮定し、この仮定が破られたとき、最適以下のパフォーマンスをもたらす。
行動方針の単一かつ有望なモードから学習することに焦点を当てた新しいアプローチであるLOM(Weighted Imitation Learning on One Mode)を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:57:36 GMT)
It is Giving Major Satisfaction: Why Fairness Matters for Developers [9.3] 本研究は,ソフトウェア実践者の仕事満足度に対する公正感の関連について検討する。
調査の結果,4つの公正度は全体の仕事の満足度と仕事のセキュリティに対する満足度に有意な影響を及ぼすことがわかった。
フェアネスと仕事の満足度の関係は、女性、民族的に劣る、経験の浅い実践者、仕事の制限のある者にとってより強くなっている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:56:08 GMT)
A Comparative Study of LLM-based ASR and Whisper in Low Resource and Code Switching Scenario [9.3] 大規模言語モデル(LLM)は、様々なNLPタスクにまたがる例外的なパフォーマンスを誇示している。
低リソース環境下での音声認識の課題に対処する可能性については、未検討のままである。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:23:40 GMT)
Style3D: Attention-guided Multi-view Style Transfer for 3D Object Generation [9.2] Style3Dは、コンテンツ画像とスタイル画像からスタイリングされた3Dオブジェクトを生成するための新しいアプローチである。
複数のビューにまたがる構造的特徴とスタイリスティックな特徴の相互作用を確立することにより,本手法は総合的な3Dスタイリゼーションプロセスを実現する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:59:38 GMT)
If CLIP Could Talk: Understanding Vision-Language Model Representations Through Their Preferred Concept Descriptions [9.2] 視覚言語モデル(VLM)の表現は、しばしば形状のような視覚的属性に基づいている。
本稿では,VLM にとって重要なテキスト特徴を特徴付ける新しい手法である Extract and Explore (EX2) を提案する。
この結果から,EX2は強化学習を用いて,大規模言語モデルとVLMの好みを一致させ,VLMにとって重要な特徴を組み込んだ記述を生成する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:37:07 GMT)
Searches for exotic spin-dependent interactions with spin sensors [9.1] 多くの理論は、粒子物理学の標準モデルを超えて、エキゾチックなスピン依存相互作用の存在を仮定している。
スピンベースの量子センサーは、測定精度を高めるためにスピンの量子特性を利用する。
スピンベースのセンサーは、超高感度、コンパクトなテーブルトップデザイン、費用対効果で際立っている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:02:53 GMT)
A Spatio-Temporal Representation Learning as an Alternative to Traditional Glosses in Sign Language Translation and Production [9.1] 本稿では,手話翻訳(SLT)と手話生成言語(SLP)におけるグロスの使用に関する課題について述べる。
テンポラリな手話をキャプチャするフレームワークUniGloR(UniGloR)を導入する。
キーポイントに基づく設定実験により、UniGloRは従来のSLT法やSLP法よりも性能が優れているか、一致していることが示された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:41:11 GMT)
Are Explanations Helpful? A Comparative Analysis of Explainability Methods in Skin Lesion Classifiers [8.9] 皮膚疾患モデルでは,Desiderataを説明として同定する。
以上の結果から,これらの手法がバイアスを明らかにする一方で,説明の包括性を改善する余地があることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:46:41 GMT)
LuxEmbedder: A Cross-Lingual Approach to Enhanced Luxembourgish Sentence Embeddings [8.8] 文の埋め込みモデルは並列データに大きく依存しており、多くの低リソース言語では不十分である。
この不足は、これらの言語に対する単言語および言語間文埋め込みモデルの最適部分性能をもたらす。
我々は、並列トレーニングデータセットに低リソース言語を含めることが、他の低リソース言語よりも有利であることを示す証拠を提示する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:02:12 GMT)
Pyramid Vector Quantization for LLMs [8.8] 大規模言語モデルのためのピラミッドベクトル量子化(PVQ)。
PVQは1次元球面に点を投影することで球面上の固定整数格子を用いており、メモリに明示的なコードブックを必要とせずに効率的な符号化と復号を行うことができる。
比較手法と比較した場合, 性能と重量当たりのビット, アクティベーション当たりのビット間でのパリト最適トレードオフにより, 最先端の量子化性能を実現する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:52:04 GMT)
Learning-based Sketches for Frequency Estimation in Data Streams without Ground Truth [8.6] より実践的な学習ベース推定フレームワークであるUCL-sketchを提案する。
根拠のない等価学習によるオンライントレーニングと、論理的推定バケットを備えた高度にスケーラブルなアーキテクチャ。
その結果,本手法はキーごとの精度と分布に関する既存のスケッチよりも優れていた。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:00:50 GMT)
Efficient and Green Large Language Models for Software Engineering: Literature Review, Vision, and the Road Ahead [8.5] 大規模言語モデル(LLM)は、様々なソフトウェアエンジニアリングタスクにおいて顕著な機能を示している。
本稿は,LLM4SEの効率性と緑化に向けた研究コミュニティの焦点を振り返ることを目的としている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:36:13 GMT)
Navigating Perplexity: A linear relationship with the data set size in t-SNE embeddings [8.5] 本稿では,パープレキシティとデータセットサイズとの線形関係を明らかにする。
パープレキシティが調整された場合,組込みはデータセットのサンプル間で構造的に整合性を維持したままであることを示す。
この線形関係に基づいて, t-SNEによる高次元データの可視化のためのいくつかの応用を概説する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:42:11 GMT)
SurvMamba: State Space Model with Multi-grained Multi-modal Interaction for Survival Prediction [8.5] 生存予測のための多層多モード相互作用(SurvMamba)を用いた状態空間モデルを提案する。
SurvMamba は階層的相互作用 Mamba (HIM) モジュールで実装されている。
インターフェクション・フュージョン・マンバ (IFM) モジュールは、モーダル間インタラクティブ・フュージョンのカスケードに使われ、生存予測のためのより包括的な特徴をもたらす。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:57:03 GMT)
Implicit Priors Editing in Stable Diffusion via Targeted Token Adjustment [8.2] テキスト・ツー・イメージ・モデルにおいて,暗黙の仮定や事前を効率的に調整する手法であるEmbedit(Embedit)を提案する。
エンコーダの最後に隠された状態を最適化するために、ターゲットオブジェクト(rose)のワードトークン埋め込み(WTE)のみを埋め込む。
提案手法は,XL の安定拡散 1.4 と 2048 の 768 個のパラメータを 1 つの編集で修正した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:31:30 GMT)
Nl2Hltl2Plan: Scaling Up Natural Language Understanding for Multi-Robots Through Hierarchical Temporal Logic Task Representation [8.2] Nl2Hltl2Planは自然言語コマンドを階層線形時間論理(LTL)に変換するフレームワーク
まず、LLMは命令を階層的なタスクツリーに変換し、論理的および時間的関係をキャプチャする。
次に、微調整されたLLMは、サブタスクをフラットな公式に変換し、階層的な仕様に集約する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:44:21 GMT)
Advancing Auto-Regressive Continuation for Video Frames [8.0] 本稿では,ビデオ継続に対する大規模言語モデル(LLM)の適用について検討する。
セマンティックトークンとRGBトークンを交互に生成するためのモデルをトレーニングするARCONというスキームを設計する。
特殊設計なしで生成したRGB画像とセマンティックマップに高い整合性を見出した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:53:56 GMT)
Biologically-inspired Semi-supervised Semantic Segmentation for Biomedical Imaging [7.9] セマンティックセグメンテーションアーキテクチャを訓練するための2段階半教師付き学習手法を提案する。
第1段階では、生物にインスパイアされたヘッブの原理を「一緒に発火し、繋ぎ合わせる」という局所的な学習規則を取り入れている。
第2段階では、モデルはラベル付きデータの小さなサブセットに対して標準的なバックプロパゲーションで微調整される。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:25:53 GMT)
Incorporating System-level Safety Requirements in Perception Models via Reinforcement Learning [7.8] 本稿では,システムレベルの安全目標を理解することにより,知覚要素を増強する訓練パラダイムを提案する。
このアプローチで訓練されたモデルは,システムレベルの安全性の観点から,ベースライン知覚モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 01:40:54 GMT)
How Many Ratings per Item are Necessary for Reliable Significance Testing? [7.8] 機械学習評価に対するほとんどのアプローチは、機械と人間の応答は、一元的権威を持つ「金の標準」応答を持つデータに対して測定できる程度に反復可能であると仮定している。
既存または計画された)評価データセットが、あるモデルの性能を他のモデルと確実に比較するのに十分な応答を持っているかどうかを判断する手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:31:28 GMT)
Optimizing Dense Visual Predictions Through Multi-Task Coherence and Prioritization [7.8] マルチタスク学習(MTL)は、複数のタスクの同時トレーニングを含む。
本稿では,高密度視覚タスクに特化して設計された高度MTLモデルを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:05:47 GMT)
DMP_AI: An AI-Aided K-12 System for Teaching and Learning in Diverse Schools [7.6] K-12教育における人工知能(AI)の利用は、まだ初期段階にある。
本システムの開発は,ユーザのプライバシを優先しながら慎重に行われている。
このシステムは、効果的かつ包括的なK-12教育を提供するための教育者を支援するための貴重なリソースとして機能する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:10:14 GMT)
Learning Networks from Wide-Sense Stationary Stochastic Processes [7.6] ここでの重要な推論問題は、ノード出力(ポテンシャル)からエッジ接続を学習することである。
我々はWhittleの最大可能性推定器(MLE)を用いて時間相関サンプルから$Last$のサポートを学習する。
MLE問題は厳密な凸であり、ユニークな解であることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 23:14:00 GMT)
Panoptic Diffusion Models: co-generation of images and segmentation maps [7.6] 本稿では,PDM(Panoptic Diffusion Model)を提案する。
PDMは画像とテキストのギャップを埋めるために、生成プロセス全体を通して詳細なビルトインガイダンスを提供するセグメンテーションレイアウトを構築する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 00:42:15 GMT)
Canonic Signed Spike Coding for Efficient Spiking Neural Networks [7.5] スパイキングニューラルネットワーク(SNN)は、生物学的ニューロンのスパイキング行動を模倣し、ニューラルコンピューティングと人工知能の進歩において重要な役割を果たすと期待されている。
ANN(Artificial Neural Networks)からSNN(SNN)への変換は最も広く使われているトレーニング手法であり、その結果のSNNが大規模データセット上でANNと同等に動作することを保証する。
現在のスキームは、通常、スパイクカウントまたはタイピングのタイミングを使用しており、これはANNのアクティベーションと線形に関連しており、必要な時間ステップの数を増やす。
我々は新しいCanononic Signed Spike (CSS) 符号化を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 03:11:59 GMT)
Human Multi-View Synthesis from a Single-View Model:Transferred Body and Face Representations [7.4] 人体と顔の表現を多視点合成に活用する革新的枠組みを提案する。
具体的には、大規模人間のデータセットに事前訓練された単一ビューモデルを用いて、多視点ボディ表現を開発する。
提案手法は現状の手法よりも優れており,多視点人間合成において優れた性能を発揮する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:02:17 GMT)
Can neural operators always be continuously discretized? [7.4] 我々は、スキップ接続を含む一般的なフレームワークにおいて、ヒルベルト空間間のニューラル作用素の離散化の問題を考える。
ビリプシッツニューラル作用素は、常に強い単調ニューラル作用素の交互組成の形で書けることを示す。
また、このタイプのニューラル作用素は有限ランク残留ニューラル作用素の合成によって近似できることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:22:54 GMT)
Quantitative AI Risk Assessments: Opportunities and Challenges [7.4] リスクを減らす最善の方法は、包括的なAIライフサイクルガバナンスを実装することです。
リスクは技術コミュニティのメトリクスを使って定量化できます。
本稿では,このようなアプローチの機会,課題,潜在的影響に焦点をあてて,これらの課題について考察する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:10:46 GMT)
Video LLMs for Temporal Reasoning in Long Videos [7.3] テンポラルVLM(TemporalVLM)は、ビデオ大言語モデルであり、時間的推論を効果的に行い、長いビデオにおいてきめ細やかな理解を可能にする。
我々のアプローチには、長期入力ビデオの時間認識機能へのマッピングと、ローカルおよびグローバルの両方のキューを含むビジュアルエンコーダが含まれる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 00:50:33 GMT)
A Multi-Source Data Fusion-based Semantic Segmentation Model for Relic Landslide Detection [7.1] 提案したHPCL-NetはLoess Plateau Relic地すべりデータセットを用いて評価した。
提案したHPCL-Netは,mIoUが0.620から0.651に増加し,Landslide IoUが0.334から0.394に改善され,F1scoreが0.501から0.565に向上した既存のモデルよりも大幅に優れている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 01:52:57 GMT)
Online Experimental Design With Estimation-Regret Trade-off Under Network Interference [7.1] ネットワーク干渉は因果推論の分野で大きな関心を集めている。
因果効果を推定する古典的な方法の1つは、実験的候補を異なるグループにランダムに割り当て、それらの差を比較することである。
本稿では,統合的干渉に基づくオンライン実験設計フレームワークを開発する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 21:45:35 GMT)
Enhancing Recommendation Systems with GNNs and Addressing Over-Smoothing [7.1] 本稿では、グラフニューラルネットワーク(GNN)を利用したレコメンデーションシステムの強化における重要な課題に対処する。
提案手法では、3つのGNNベースのレコメンデーションモデルを導入する。
この研究は、透明で正当化可能な提案を提供することを目的として、レコメンデーションシステムにおける解釈可能性の重要な必要性を強調している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:50:27 GMT)
Tight PAC-Bayesian Risk Certificates for Contrastive Learning [6.9] コントラスト表現学習のための非空白のPACベイズリスク証明書を開発した。
我々は、データ拡張や温度スケーリングを含むSimCLR固有の要因を取り入れ、対照的なゼロワンリスクのリスク証明書を導出する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:23:35 GMT)
On the generic increase of observational entropy in isolated systems [6.9] ランダムに選択されたユニタリ進化のシステムの観測エントロピーが、圧倒的な確率で増加する傾向を示す。
システムの初期状態に関わらず,システムの大きさが十分に粗い観察では,ランダムな進化によってその状態は事実上区別不能であることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:10:04 GMT)
Affordance-based Robot Manipulation with Flow Matching [6.9] 本稿では,ロボット操作支援のためのフレームワークを提案する。
第1に,大規模モデルを下流シーンの空き時間理解タスクに効果的に適用し,第2に,視覚的空き時間モデルに基づいて,効果的にロボット軌道を学習する。
本フレームワークは,ロボット操作のためのフローマッチングにより,相性モデル学習と軌道生成をシームレスに統合する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:39:07 GMT)
Real-Time AIoT for UAV Antenna Interference Detection via Edge-Cloud Collaboration [6.7] 第5世代(5G)では,通信干渉源の除去がネットワーク性能の維持に不可欠である。
本稿では,UAVのアンテナ干渉源を検出するコンピュータビジョンに基づくモノのAIを提案する。
システムは、我々のカスタムアンテナ干渉源データセットの平均平均精度(mAP)42.1%で、最先端(SOTA)性能を達成する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:20:36 GMT)
Freshness and Informativity Weighted Cognitive Extent and Its Correlation with Cumulative Citation Count [6.5] 我々は認知範囲を再考し、もともとはクォータ内のユニークなフレーズの数として定義されていた。
フレッシュネスとInformative Weighted Cognitive Extent(FICE)について紹介する。
FICEはクォータ内の平均累積引用数と強い相関を示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:52:32 GMT)
Learning Whole-Body Loco-Manipulation for Omni-Directional Task Space Pose Tracking with a Wheeled-Quadrupedal-Manipulator [6.3] 強化学習(RL)を用いた全身ロコ操作問題について検討する。
我々は,異なるタスクに対応する報酬項を非線形に体系的に統合する新しい報酬融合モジュール(RFM)を開発した。
特に、スムーズで正確な追跡性能を実現し、5cm未満の最先端追跡位置誤差と0.1rad未満の回転誤差を実現した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:02:38 GMT)
Variable-Speed Teaching-Playback as Real-World Data Augmentation for Imitation Learning [6.3] 本稿では、実世界のデータセットの利点を保ちながら、力制御に適用可能な新しいデータ拡張法を提案する。
位置力制御を備えた模擬学習法を用いて、双方向制御に基づく模擬学習実験を行った。
その結果, 実世界の反応速度の変化により, 成功率の最大55%が向上した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:51:50 GMT)
Mathematical Information Retrieval: Search and Question Answering [6.2] マルチモーダル検索エンジンと数学的質問応答システムは、数学関連の質問に答えるのに役立つ。
この本は、数学的情報を見つけ、利用するのに役立つシステムに興味を持つ学生、インストラクター、研究者を対象としている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:52:24 GMT)
Functionality understanding and segmentation in 3D scenes [6.2] Fun3DUは、3Dシーンで機能を理解するために設計された最初のアプローチである。
Fun3DUは言語モデルを使用して、Chain-of-Thought推論を通じてタスク記述を解析する。
我々はFun3DUをSceneFun3D上で評価する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:12:06 GMT)
STDCformer: A Transformer-Based Model with a Spatial-Temporal Causal De-Confounding Strategy for Crowd Flow Prediction [6.2] 本研究では,過去の観測を将来の観測に変換するために,関数をF$で学習するタスクとして時空間予測を分解する。
本研究では,空間空間を学習し,過去のデータの因果関係を推定する空間空間的バックドア調整戦略を提案する。
また、時空間マッピングを導くために、未来と過去の間の注意を問うクロスタイムアテンション機構を導入する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 01:20:43 GMT)
Sprite Sheet Diffusion: Generate Game Character for Animation [6.2] 拡散モデルのような生成モデルはスプライトシートの自動生成によってこのプロセスに革命をもたらす可能性がある。
拡散モデルは多様な画像を生成する能力で知られており、キャラクターアニメーションを作成するために適応することができる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:40:05 GMT)
Expanding Event Modality Applications through a Robust CLIP-Based Encoder [6.1] 本稿では,CLIPをイベントベースデータに転送する強力なエンコーダを提案する。
イベント埋め込みをイメージ埋め込みと整合させ、ゼロショット学習をサポートし、テキストアライメントを保存するために、CLIPsアーキテクチャを適用します。
我々のエンコーダは、ゼロショットおよび少数ショットの学習タスクにおいて、オブジェクト認識における強力な性能を達成する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:44:58 GMT)
Node Classification With Integrated Reject Option [6.0] 本稿では,グラフニューラルネットワーク(GNN)におけるノード分類の新しい手法であるNCwRを提案する。
我々は,Cora,Citeseer,Pubmedの3つの標準引用ネットワークデータセットを用いて実験を行った。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:22:34 GMT)
One Step Learning, One Step Review [6.0] OLOR(One Step Learning, One Step Review)と呼ばれる軽量ロールバックに基づくファインチューニング手法を提案する。
本稿では,OLOR(One Step Learning, One Step Review)と呼ばれる,ウェイトロールバックに基づくファインチューニング手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:09:46 GMT)
Self-test loss functions for learning weak-form operators and gradient flows [6.0] 未知のパラメータに依存するテスト関数を用いる自己テスト損失関数を導入する。
提案した自己テスト損失関数はエネルギー勾配を保存し、微分方程式の対数類似比と一致する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:48:38 GMT)
Reuse-Aware Compilation for Zoned Quantum Architectures Based on Neutral Atoms [6.0] ゾーンアーキテクチャのためのスケーラブルなコンパイラZACを提案する。
ZACは、クォービット再利用でゾーン間のデータの移動オーバーヘッドを最小限にする。
ZACはモノリシックアーキテクチャに比べて22倍の忠実性向上を実現している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 21:22:48 GMT)
How to Build an AI Tutor that Can Adapt to Any Course and Provide Accurate Answers Using Large Language Model and Retrieval-Augmented Generation [5.7] OpenAI Assistants APIにより、AI Tutorは、ファイルやチャット履歴を簡単に埋め込み、保存、検索、管理できる。
AI Tutorのプロトタイプは、ソースの引用で関連性があり正確な回答を生成する能力を示している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:33:55 GMT)
RetCompletion:High-Speed Inference Image Completion with Retentive Network [5.7] 時間コストは、高品質な多元画像補完を実現する上で大きな課題である。
画像からコンテキスト情報を統合する双方向シーケンス情報融合モデルであるBi-RetNetを導入する。
我々は一方向の画素単位の更新戦略を用いて、一貫した画像構造を復元し、高い再構成品質と高速な推論速度を実現する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 03:28:31 GMT)
Gesture Classification in Artworks Using Contextual Image Features [5.6] 歴史的美術品における匂いのジェスチャーを識別する手法を提案する。
ローカルな特徴とグローバルな画像コンテキストを組み合わせることで,特にバックボーンの分類性能が向上することを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:45:02 GMT)
ASIGN: An Anatomy-aware Spatial Imputation Graphic Network for 3D Spatial Transcriptomics [5.5] 本稿では3次元空間転写学モデリングのための解剖学的認識型空間インプットグラフネットワーク(ASIGN)を提案する。
ASIGNは、層間オーバーラップと類似性に基づく拡張を利用して、既存の2次元空間関係を3Dに拡張する。
ASIGNは2Dシナリオと3Dシナリオの両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:38:45 GMT)
Specification Generation for Neural Networks in Systems [5.5] 我々は、参照を用いてニューラルネットワークの仕様を生成するための自動フレームワーク、SpecTRAを開発した。
本稿では、適応ビットレートと渋滞制御アルゴリズムにおけるニューラルネットワークのためのSpecTRAによって生成された仕様について述べる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:45:36 GMT)
Convolutional Neural Networks and Mixture of Experts for Intrusion Detection in 5G Networks and beyond [5.5] 6G/NextGネットワークは、新たなセキュリティ脅威に対して脆弱になる可能性がある。
侵入検知タスクの既存の研究は、浅い機械学習分類器の列車に依存している。
悪意のあるトラフィックを特定するために,Mixture of Experts (MoE)を統合した最初の研究を行った。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:20:01 GMT)
Prompting Large Language Models for Clinical Temporal Relation Extraction [5.4] 本研究は臨床時間的関係抽出(CTRE)に4つの大言語モデル(LLM)を用いる。
We developed full (FFT) and parameter-efficient (PEFT) fine-tuning strategy and the these strategy on the 2012 i2b2 CTRE task。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:35:28 GMT)
End to End Collaborative Synthetic Data Generation [5.4] 合成データのパブリッシングのためのエンドツーエンド協調フレームワークを提案する。
我々は、このフレームワークをセキュア多党計算(MPC)プロトコルでインスタンス化し、白血病の合成ゲノムデータのプライバシー保護のためのユースケースとして評価する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 23:10:51 GMT)
HCC: A Language-Independent Hardening Contract Compiler for Smart Contracts [5.4] 我々は,HCCと呼ばれる,最初の実用的なスマートコントラクトコンパイラを提案する。
HCCは、新しい言語に依存しないコードプロパティグラフ(CPG)の表記に基づいて、ソースコードレベルでのセキュリティ強化チェックを挿入する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:32:53 GMT)
Simplified derivations for high-dimensional convex learning problems [5.3] 本研究では,高次元学習問題を解析するための空洞的手法を提案する。
これらの問題は共通の構造を共有し、統一的な分析を可能にする。
パーセプトロン・キャパシティ問題に対しては、Na" 法による正しいキャパシティの導出を可能にする対称性を同定する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:57:38 GMT)
Multi-view Image Diffusion via Coordinate Noise and Fourier Attention [5.3] 本稿では,新しい注意機構と横断的注意損失を有する特徴の時間依存性空間周波数に対応する拡散過程を提案する。
本手法は,多視点整合性に対する他の最先端手法と比較して,定性的に優れた結果が得られる数種類の定量的指標を用いてSOTAを改良する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:49:40 GMT)
Unveiling Higher-Order Topology via Polarized Topological Charges [5.2] 運動量空間におけるキラル対称HOTPを特徴付ける分極トポロジカル電荷の概念を提案する。
キャラクタリゼーション理論により,2次(3次)位相は全偏光位相電荷の4分の1(負の8)で決定されることが示された。
これらの偏極トポロジカル電荷は系の擬スピン構造によって測定できる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 01:56:01 GMT)
PerceiverS: A Multi-Scale Perceiver with Effective Segmentation for Long-Term Expressive Symbolic Music Generation [5.2] PerceiverS (Segmentation and Scale) はシンボリック音楽を作成するために設計された新しいアーキテクチャである。
本手法は,長期的構造的依存関係と短期的表現的詳細を同時に学習することにより,記号的音楽生成を促進する。
提案したモデルは,Maestroデータセットを用いて評価され,表現的ニュアンスによる従来の長さの音楽生成の改善を実証した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:02:25 GMT)
PBP: Post-training Backdoor Purification for Malware Classifiers [5.1] 近年、サイバーセキュリティにおける機械学習(ML)の台頭は、バックドア中毒の脅威の増加など、新たな課題をもたらしている。
ここでは,特定のバックドア埋め込み機構を仮定することなく,様々な種類のバックドア埋め込みを緩和するマルウェア分類器の訓練後防御であるPBPを紹介する。
提案手法は,2つのデータセット,2種類のバックドア手法,各種攻撃構成の実験により実証された,最先端の手法に対する大きな優位性を示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:30:03 GMT)
PV-VTT: A Privacy-Centric Dataset for Mission-Specific Anomaly Detection and Natural Language Interpretation [5.1] プライバシー侵害の特定を目的とした,ユニークなマルチモーダルデータセットであるPV-VTT(Privacy Violation Video To Text)を提案する。
PV-VTTは、シナリオ内のビデオとテキストの両方に詳細なアノテーションを提供する。
このプライバシー重視のアプローチにより、研究者はこのデータセットを、保護された機密性を保護しながら使用することができる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 23:15:45 GMT)
PolarBEVDet: Exploring Polar Representation for Multi-View 3D Object Detection in Bird's-Eye-View [5.0] カルテシアンBEV表現の代替として極性BEV表現を用いることを提案する。
nuScenesの実験では、PolarBEVDetは優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 03:15:44 GMT)
Topological Trajectory Classification and Landmark Inference on Simplicial Complexes [5.0] 単体複素数でモデル化された離散化された2次元多様体上の軌跡を分類する問題を考察する。
与えられた軌跡の集合を識別する「最適穴」を学習することを目的としたアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:11:33 GMT)
Enhancing IR-based Fault Localization using Large Language Models [5.0] 本稿では、プログラミングエンティティ、スタックトレース、自然言語テキストに基づいてバグレポートを分類することで、障害局所化(IRFL)を強化する。
クエリの不正確性に対処するため,LLmiRQ+と呼ばれるユーザと対話型クエリ再構成手法を導入する。
6,340件のバグ報告を含む46のプロジェクトの評価では、MRRは0.6770件、MAPは0.5118件であり、7つの最先端IRFL技術を上回っている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:47:51 GMT)
Unsupervised Network for Single Image Raindrop Removal [5.0] 本研究では,教師なし学習に基づく雨滴除去のためのディープニューラルネットワークを提案する。
提案モデルでは,サイクルネットワークアーキテクチャに基づく層分離を行う。
雨滴ベンチマークデータセットの実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:10:50 GMT)
A Constant Measurement Quantum Algorithm for Graph Connectivity [4.9] 定数数を用いてグラフ接続性を決定する新しい量子アルゴリズムを提案する。
これはZX計算から取られた非単位アーベルゲートに依存している。
このアルゴリズムは、アシラ量子ビットで修復できる状態崩壊を示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:30:42 GMT)
Teaching an Old Dog New Tricks: Verifiable FHE Using Commodity Hardware [4.9] Argosは、信頼できるハードウェアを使用した完全同型暗号化スキームに検証可能性を追加するための単純なアプローチである。
Argosは専用のハードウェア拡張を必要とせず、2008年以降はコモディティプロセッサでサポートされている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:47:11 GMT)
Security, Latency, and Throughput of Proof-of-Work Nakamoto Consensus [4.7] 本稿では,ブロックの安全性,確認待ち時間,動作証明プロトコルのトランザクションスループットの基本的なトレードオフについて検討する。
新しい上層と下層の境界は、正直かつ敵対的な鉱業率の関数として、ブロックセーフティ違反の確率で導出される。
この研究は、トランザクションスループットと確認レイテンシの基本的なトレードオフを明らかにし、最終的に所望のフォールトトレランスとブロックの伝搬遅延がブロックサイズとともに増加する速度によって決定される。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:17:03 GMT)
Entangling independent particles by path identity [4.6] 独立粒子は直接相互作用, 確立された絡み合い, ベル状態の測定を必要とせずに絡み合うことができることを示す。
基礎的な関心に加えて,この手法が量子ネットワークのリソース要求を減少させる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:27:28 GMT)
RGBDS-SLAM: A RGB-D Semantic Dense SLAM Based on 3D Multi Level Pyramid Gaussian Splatting [4.6] 本稿では,RGB-Dセマンティック・セマンティック・セマンティック・SLAMシステムであるRGBDS-SLAMを提案する。
マルチレベル画像ピラミッドを抽出してシーン詳細を復元する3次元マルチレベル・ガウス・スプラッティング法を提案する。
密結合型多機能再構成最適化機構を設計し、RGB, 深さ, 意味マップの再構成精度を相互に向上する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:19:50 GMT)
"Moralized" Multi-Step Jailbreak Prompts: Black-Box Testing of Guardrails in Large Language Models for Verbal Attacks [4.6] 本研究の目的は, GPT-4o, Grok-2 Beta, Llama 3.1 (405B), Gemini 1.5, Claude 3.5 Sonnetのガードレールの有効性を評価することである。
同種のマルチステッププロンプトを設計して倫理的攻撃を行い、「企業中間管理者が昇進を競う」シナリオをシミュレートする。
以上の結果から, 上記LLMのガードレールはバイパスされ, 口頭攻撃の内容が生成されることがわかった。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:21:17 GMT)
Granular Ball Twin Support Vector Machine with Universum Data [4.6] 大学データを用いた新しいグラニュラーボールツインサポートベクトルマシン(GBU-TSVM)を提案する。
提案したGBU-TSVMは,データインスタンスを特徴空間のポイントではなく,ハイパーボールとして表現する。
データポイントをグラニュラーボールにグループ化することにより、計算効率の向上、耐雑音性の向上、解釈可能性の向上を実現している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:02:28 GMT)
Generative Photography: Scene-Consistent Camera Control for Realistic Text-to-Image Synthesis [4.5] 本稿では、コンテンツ生成時のカメラ固有の設定を制御するためのフレームワーク、Generative Photographyを紹介した。
実験結果から,本手法は最先端モデルよりもシーン一貫性のあるフォトリアリスティック画像を生成することがわかった。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:58:01 GMT)
Intuitive Axial Augmentation Using Polar-Sine-Based Piecewise Distortion for Medical Slice-Wise Segmentation [4.5] 我々は,従来のデジタル画像とは別に,医用画像の特徴を再考し,認識する。
本稿では, より弾力性が高く, 放射線検査法に適合する医用別拡張アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:35:06 GMT)
Explainable fault and severity classification for rolling element bearings using Kolmogorov-Arnold networks [4.5] ベアリング故障は機械の故障の主な原因である。
本研究では,これらの課題に対処するためにKolmogorov-Arnold Networksを用いた。
説明可能な結果を提供する軽量モデルを生成する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:53:32 GMT)
Reactive Orchestration for Hierarchical Federated Learning Under a Communication Cost Budget [4.5] 本稿では,HFLパイプラインの適応的オーケストレーションのためのフレームワークを提案する。
本機構は,マルチレベル監視情報に基づいて,実行時にHFLアクションを発生させるイベントを特定し,反応する。
エコシステムを拡大することにより、我々のフレームワークは、運用環境の変化に対して迅速かつ効果的に反応する能力を示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:12:00 GMT)
MultiGO: Towards Multi-level Geometry Learning for Monocular 3D Textured Human Reconstruction [4.5] 本稿では, 単眼画像から3次元布体を再構築する研究課題について検討する。
既存のアプローチでは、事前訓練されたSMPL(-X)推定モデルや生成モデルを利用して、人間の再構築に補助情報を提供する。
技術的には,骨格レベルの強化,関節レベルの強化,輪郭レベルの改良モジュールの3つの重要なコンポーネントを設計する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:06:06 GMT)
A deep neural network approach to solve the Dirac equation [4.5] ディープニューラルネットワークと教師なし機械学習技術を用いてディラック方程式を解く。
低層励起状態に対しては、異なる性能と利点を持つ2つの方法が提案されている。
この方法の有効性はクーロンポテンシャルとウッズ・サクソンポテンシャルの計算によって検証される。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:38:34 GMT)
Community Detection with Heterogeneous Block Covariance Model [4.4] コミュニティ検出は、相互の関係に基づいてオブジェクトをクラスタリングするタスクである。
モデルベースのコミュニティ検出手法のほとんどは、バイナリ(yes/no)エッジを持つネットワーク用に設計されている。
共分散行列内のコミュニティ構造を定義するヘテロジニアスブロック共分散モデル(HBCM)を導入する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 23:53:08 GMT)
Xmodel-1.5: An 1B-scale Multilingual LLM [4.3] 2兆のトークンで事前訓練された多言語大言語モデルであるXmodel-1.5を紹介する。
Xmodel-1.5は65,280個のトークンを持つカスタムユニグラムトークンライザを採用し、効率と精度の両方を最適化している。
このモデルは、タイ語、アラビア語、フランス語、中国語、英語など、複数の言語で競合する結果をもたらす。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:49:04 GMT)
GVKF: Gaussian Voxel Kernel Functions for Highly Efficient Surface Reconstruction in Open Scenes [4.3] オープンシーンにおける効率的かつ効果的な3次元表面再構成法を提案する。
カーネルレグレッションによる離散3DGSに基づく連続的なシーン表現を提案する。
挑戦的なシーンデータセットの実験は、提案したGVKFの有効性と有効性を示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:16:32 GMT)
Evaluating Gender Bias Transfer between Pre-trained and Prompt-Adapted Language Models [4.3] 本研究では,迅速な適応の下でのバイアス伝達仮説(BTH)について検討する。
LLMが公正な行動や偏見を示すよう特別に促された場合でも, バイアス伝達は強く相関していることがわかった。
本研究は, プレトレーニングLDMにおける公平性の確保の重要性を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:32:42 GMT)
A Catalog of Micro Frontends Anti-patterns [4.3] 本報告では12種類のMFEアンチパターンのカタログについて述べる。
業界関係者と調査を行い、アンチパターンを洗練させるために貴重なフィードバックを集めました。
収集されたフィードバックは、アンチパターンカタログの改良版の開発につながった。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:56:20 GMT)
Fab-ME: A Vision State-Space and Attention-Enhanced Framework for Fabric Defect Detection [4.3] YOLOv8sをベースとした先進的なフレームワークであるFab-MEを提案し,20種類のファブリック欠陥を正確に検出する。
コントリビューションには2つのコンボリューション(C2F)ビジョン状態空間(C2F-VMamba)モジュールによるクロスステージ部分ボトルネックの導入が含まれている。
Tianchiファブリック欠陥検出データセットの実験結果から、Fab-MEは元のYOLOv8と比べてmAP@0.5が3.3%改善していることが示された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:40:17 GMT)
TRENDy: Temporal Regression of Effective Non-linear Dynamics [4.3] TRENDyは、低次元空間学習に対する方程式のないアプローチである。
我々はTRENDyをトレーニングし、物理科学と生命科学のあらゆる分野から、合成データと実データの効果的なダイナミクスを予測する。
我々は、我々のフレームワークが空間の見えない領域においてチューリングとホップの分岐の両方を自動的に見つけられるかを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:36:47 GMT)
LEP-QNN: Loan Eligibility Prediction Using Quantum Neural Networks [4.2] 我々は、量子ニューラルネットワーク(LEP-QNN)を用いたローン適性予測に量子機械学習(QML)を用いる新しいアプローチを提案する。
私たちの革新的なアプローチは、単一の包括的なデータセットからローンの適格性を98%の精度で予測します。
本研究は、金融予測におけるQMLの可能性を示し、QML技術の進歩のための基礎的なガイドを確立する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:35:03 GMT)
YT-30M: A multi-lingual multi-category dataset of YouTube comments [4.2] YT-30M(フル)とYT-100K(YT-30Mからランダムに選択された100Kサンプル)は、さらなる研究のために公開された。
YT-30M(YT-100K)には、YouTubeチャンネルが投稿した32236173のコメントが含まれている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:54:58 GMT)
RefExpo: Unveiling Software Project Structures through Advanced Dependency Graph Extraction [4.2] RefExpoは再利用可能なDG抽出ツールで、Java、Python、JavaScriptなどの複数の言語をサポートする。
この記事では、Java、Python、JavaScriptなどの複数の言語をサポートする再利用可能なDG抽出ツールであるRefExpoを紹介した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:48:18 GMT)
Towards Understanding and Quantifying Uncertainty for Text-to-Image Generation [4.1] テキスト・ツー・イメージ(T2I)生成モデルにおける不確かさの定量化は,モデル動作の理解と出力信頼性の向上に不可欠である。
我々はこのプロンプトに関して初めてT2Iモデルの不確実性を定量化し評価した。
本稿では,プロンプトをベースとしたT2Iモデル(PUNC)のUNCertainty Estimationを導入し,プロンプトと生成された画像のセマンティクスから生じる不確実性に対処する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:03:52 GMT)
tcrLM: a lightweight protein language model for predicting T cell receptor and epitope binding specificity [4.1] 抗がん免疫反応はT細胞受容体(TCR)と抗原の結合に依存しており、腫瘍細胞を除去するために適応免疫を誘導する。
本研究では,この課題に対処するために,tcrLMと呼ばれる軽量なマスキング言語モデルを提案する。
我々は,1億以上の異なる配列を持つ最大のTCR CDR3 配列を構築し,これらの配列上で tcrLM を事前訓練する。
その結果、tcrLMは既存のTCR-抗原結合予測法を上回るだけでなく、他の主要なタンパク質言語モデルよりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:33:44 GMT)
Mapping using Transformers for Volumes -- Network for Super-Resolution with Long-Range Interactions [4.1] ボリューム超解像は、2次元超解像に見られるトランスフォーマーモデルにおける最近の進歩を利用するのが困難である。
階層型アテンションブロックと複数のスケールのキャリアトークンを組み合わせたマルチスケールトランスフォーマーモデルを提案する。
提案手法であるMTVNetを、5つの3次元データセット上の最先端のボリューム超解像モデルと比較した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:06:39 GMT)
The Cooperative Network Architecture: Learning Structured Networks as Representation of Sensory Patterns [4.0] 本稿では、入力パターンを表現するためにネットワーク構造を学習し、ノイズ、変形、アウト・オブ・ディストリビューションデータに頑健に対処するモデルである協調ネットワークアーキテクチャ(CNA)を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:12:42 GMT)
2DGS-Room: Seed-Guided 2D Gaussian Splatting with Geometric Constrains for High-Fidelity Indoor Scene Reconstruction [3.9] 高忠実度屋内シーン再構築のための2次元ガウス平滑化手法である2DGS-Roomを導入する。
我々は2次元ガウス分布を制御するためにシード誘導機構を用い、適応的な成長と刈り取り機構によって動的に最適化されたシードポイントの密度を推定した。
幾何的精度をさらに向上するために,単眼深度と通常の先行値を組み合わせて,細部と無テクスチャ領域の制約をそれぞれ与える。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:17:47 GMT)
Curriculum-style Data Augmentation for LLM-based Metaphor Detection [3.9] オープンソースLLMの微調整によるメタファ検出手法を提案する。
本手法は,すべてのベースラインにおける最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:05:21 GMT)
Stain-aware Domain Alignment for Imbalance Blood Cell Classification [3.8] 染色ドメインアライメントによるSADAと呼ばれる新しい血液細胞分類法を提案する。
この研究の主な目的は、ドメインシフトとデータ不均衡の存在下で、ドメイン不変の特徴を掘り下げることである。
Sun Yat-sen大学附属第3病院から収集した4つの公開血液細胞データセットと1つのプライベートリアルデータセットの実験結果。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:37:53 GMT)
Anomalous wave-packet transport on boundaries of Floquet topological systems [3.8] 巻線数ゼロの二次元駆動系の境界にガウス波パケットを配置する。
ピドルギャップ内の異なる谷のエッジ状態は、バルクから完全に分離されたボウタイ型のエッジバンドをハイブリダイズし、形成することができる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:41:34 GMT)
Reinforcement Learning for Finite Space Mean-Field Type Games [3.8] 平均場型ゲームは、大連立間のナッシュ均衡を記述する。
有限空間設定でそのようなゲームに対する強化学習法を開発する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:18:17 GMT)
Equivariant Representation Learning for Augmentation-based Self-Supervised Learning via Image Reconstruction [3.7] 本稿では,拡張型自己教師型学習アルゴリズムにおいて,画像再構成タスクを補助的コンポーネントとして統合することを提案する。
提案手法は,2つの拡張ビューから学習した特徴をブレンドし,そのうちの1つを再構築するクロスアテンション機構を実装した。
結果は、標準強化に基づく自己教師あり学習法よりも大幅に改善されている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:47:37 GMT)
Optimal estimation of three parallel spins with genuine and restricted collective measurements [3.5] 我々は,制限された集団測定と,マルチパーティイト環境における真の集団測定の区別について検討した。
両分離可能な測定値の最大推定精度について解析式を導出する。
我々の研究は、量子状態ではなく、量子測定における多部非古典性の豊かな風景を明らかにしている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:11:07 GMT)
Quantitative convergence of trained quantum neural networks to a Gaussian process [3.5] 生成した関数が全量子ビットにわたる単一量子ビットオブザーバブルの和の期待値である量子ニューラルネットワークについて検討する。
このような関数の確率分布は、ランダムに生成されたパラメータと訓練されたネットワークを持つ未学習ネットワークの無限幅の極限でガウス過程に収束することが証明された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:09:56 GMT)
NODE-AdvGAN: Improving the transferability and perceptual similarity of adversarial examples by dynamic-system-driven adversarial generative model [3.5] NODE-AdvGANは,敵対的生成を連続的なプロセスとして扱う新しい手法である。
従来の勾配に基づく手法の反復性を模倣することにより、NODE-AdvGANはより滑らかでより正確な摂動を生成する。
また,ノイズパラメータを効果的に調整することにより,ブラックボックス攻撃の伝達性を高める新たなトレーニング戦略であるNODE-AdvGAN-Tを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:36:09 GMT)
Nonparametric Filtering, Estimation and Classification using Neural Jump ODEs [3.4] ニューラルジャンプODEは、ニューラルジャンプODEによる観測と新しい観測の到着時のジャンプの間の条件予測をモデル化する。
彼らは、不規則かつ部分的な観察を伴う設定において、完全なデータ駆動オンライン予測の有効性を実証した。
この作業は、フレームワークをインプット・アウトプット・システムに拡張し、オンラインフィルタリングと分類における直接的なアプリケーションを可能にする。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:31:15 GMT)
DragText: Rethinking Text Embedding in Point-based Image Editing [3.4] ポイントベースの画像編集は、コンテンツドラッグによる正確で柔軟な制御を可能にする。
編集過程におけるテキスト埋め込みの役割については,まだ十分に研究されていない。
そこで我々はDragTextを提案する。DragTextはドラッグ処理と同時にテキスト埋め込みを最適化し、修正された画像埋め込みと組み合わせる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:50:27 GMT)
Minimal Learning Machine for Multi-Label Learning [3.4] 最小限の学習マシンである距離に基づく教師付き手法は、データから予測モデルを構築する。
そこで我々は,そのコアコンポーネントである距離マッピングがマルチラベル学習にどのように適応できるかを,新しい手法を提案し,評価する。
提案手法は,距離マッピングと逆距離重み付けを組み合わせたものである。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:32:32 GMT)
Data Acquisition for Improving Model Fairness using Reinforcement Learning [3.4] 我々は、下流の機械学習モデルを訓練し、その公正性を迅速に改善するためのラベル付きデータポイントの獲得に重点を置いている。
データバリュエーションの考え方に基づいたデータ取得フレームワークであるDataSiftを紹介します。
いくつかの実世界および合成データセット上でDataSiftを実証的に評価し、いくつかのデータポイントを取得しながら、機械学習モデルの公平性を著しく改善できることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 03:56:54 GMT)
Preference-based opponent shaping in differentiable games [3.4] そこで我々は,エージェントの嗜好を協調に向けて形作ることによって,戦略学習プロセスを強化するためのPBOS法を提案する。
様々な異なるゲームにおいてPBOSアルゴリズムの性能を検証する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:49:21 GMT)
Predicting Pedestrian Crossing Behavior in Germany and Japan: Insights into Model Transferability [3.4] 4種類の機械学習モデルを用いて,ギャップ選択行動,ゼブラ交差利用,それらの軌道の予測を行う。
各国の差異を比較すると、日本の歩行者はドイツよりも大きなギャップを選択するため、より慎重である。
教師なしクラスタリング手法を用いて、ギャップ選択と軌道予測の予測精度を向上させるトランスファー可能なモデルを開発した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:55:40 GMT)
Online Physics-Informed Dynamic Mode Decomposition: Theory and Applications [3.3] 動的モード分解(DMD)は、複雑な力学系を解析・モデル化する能力により、研究の注目を集めている。
提案するオンライン物理インフォームドDMD(OPIDMD)は,新しいDMDの凸最適化フレームワークへの適応である。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:57:35 GMT)
MeDeT: Medical Device Digital Twins Creation with Few-shot Meta-learning [3.2] 本稿では,医療機器のデジタルツイン(DT)を生成し,進化するデバイスにDTを適用するメタラーニングに基づくアプローチを提案する。
我々は、現実世界の医療用IoTアプリケーションと統合された5つの広く使われている医療機器を用いて、OsloCityのコンテキストでMeDeTを評価する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:37:56 GMT)
IMPACT:InMemory ComPuting Architecture Based on Y-FlAsh Technology for Coalesced Tsetlin Machine Inference [3.2] 本稿では,Y-FlAsh技術に基づく IMPACT: InMemory Computing Architecture for Coalesced Tsetlin Machine Inference について述べる。
Y-Flashデバイスは近年、デジタルメモリやアナログメモリの用途で実証されており、高収率、非揮発性、低消費電力を実現している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:22:52 GMT)
Benchmarking terminology building capabilities of ChatGPT on an English-Russian Fashion Corpus [3.2] 本稿では,SketchEngine,TBXTools,ChatGPTを用いて抽出した用語の精度を比較した。
また、これらの用語に対してChatGPTによって生成される定義の質を評価する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:43:08 GMT)
AAVENUE: Detecting LLM Biases on NLU Tasks in AAVE via a Novel Benchmark [3.2] AAVENUE は、AAVE と Standard American English の NLU タスクにおける大きな言語モデル (LLM) のパフォーマンスを評価するためのベンチマークである。
AAVENUE と VALUE の翻訳を,5つの人気のある LLM と,フルーエンシ,BARTScore,品質,コヒーレンス,理解可能性などの総合的な指標を用いて比較した。
評価の結果, LLM は AAVE に翻訳されたバージョンよりも, SAE タスクで一貫した性能が向上し, 固有のバイアスが強調された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:43:28 GMT)
Control-Flow Attestation: Concepts, Solutions, and Open Challenges [3.0] 本稿では,制御フローの検証に関する最初の調査を行い,最先端のスキームにおける中核的な考え方と解決策について考察する。
この問題は、クラウドプラットフォーム、サイバー物理システム、IoTデバイスの信頼性評価など、さまざまな設定で検討されている。
2016~2024年の間に発行された30以上の論文を調査し、主要な特徴の統合と比較を行い、この分野における今後の研究にいくつかの課題とレコメンデーションを提起する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:14:31 GMT)
Less is More: A Stealthy and Efficient Adversarial Attack Method for DRL-based Autonomous Driving Policies [3.0] DRLに基づく自律運転ポリシーに対するステルスで効率的な敵攻撃手法を提案する。
我々は、ドメイン知識のない重要な瞬間に攻撃するための最適なポリシーを学ぶために、敵を訓練する。
本手法は3回の攻撃で90%以上の衝突率を達成する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:11:09 GMT)
Distributionally robust self-supervised learning for tabular data [2.9] エラースライスの存在下での堅牢な表現の学習は、高い濃度特徴とエラーセットの構築の複雑さのために困難である。
従来の堅牢な表現学習手法は、コンピュータビジョンにおける教師付き設定における最悪のグループパフォーマンスの改善に主に焦点をあてている。
提案手法は,Masked Language Modeling (MLM) の損失を学習したエンコーダ・デコーダモデルを用いて,頑健な潜在表現を学習する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:10:06 GMT)
A Granger-Causal Perspective on Gradient Descent with Application to Pruning [2.9] 本稿では,勾配降下の因果性について考察する。
勾配降下法は損失の減少とパラメータの変化との間に暗黙の粒径・因果関係があることが示される。
Pruning の応用による因果的アプローチの意義について述べる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 05:16:48 GMT)
Labrador: Exploring the Limits of Masked Language Modeling for Laboratory Data [2.8] ラブラドールとBERTは電子健康記録から1億の実験結果のコーパスで事前訓練された。
どちらのモデルも事前学習タスクの熟達を示すが、下流の教師付きタスクではXGBoostを一貫して上回らない。
我々のアブレーション研究は、転送学習がBERTに対して限られた有効性を示し、ラブラドールで限界的な成功を達成していることを示している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 23:09:53 GMT)
Benchmarking Pretrained Attention-based Models for Real-Time Recognition in Robot-Assisted Esophagectomy [2.8] 食道癌は世界中で最も多いがんの1つである。
近年,ロボットによる最小侵襲食道切除術が有望な代替手段として浮上している。
コンピュータ支援解剖学の認識は、手術ナビゲーションを改善することを約束する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:32:37 GMT)
Hybrid deep learning-based strategy for the hepatocellular carcinoma cancer grade classification of H&E stained liver histopathology images [2.8] 肝細胞癌(HCC)は肝癌の一種であり,早期診断が一般的である。
本稿では、トランスファーラーニングを用いて、事前学習された畳み込みニューラルネットワーク(CNN)モデルから特徴を抽出するハイブリッドディープラーニングベースのアーキテクチャを提案する。
提案したハイブリッドモデルでは,TCGA-LIHCおよびKMCデータベースの事前学習モデルよりも2%,4%の精度が向上した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:26:36 GMT)
Scorecards for Synthetic Medical Data Evaluation and Reporting [2.8] 医療応用のユニークな要件を満たすために設計された評価フレームワークについて概説する。
このカードは、合成データの品質を評価し、報告するための透過的で標準化されたフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 00:18:41 GMT)
Acquired TASTE: Multimodal Stance Detection with Textual and Structural Embeddings [2.8] スタンス検出は、談話解析から偽ニュースの拡散の追跡、科学的事実の否定まで、幅広い下流の応用を可能にする上で重要な役割を担っている。
TASTEは、トランスフォーマーベースのコンテンツ埋め込みと教師なし構造埋め込みを調和して融合する、スタンス検出のためのマルチモーダルアーキテクチャである。
TASTEは、一般的なベンチマークで最先端の結果を達成し、強力なベースラインの配列を著しく上回っている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:23:37 GMT)
A new fidelity of quantum channel evolution and its geometric interpretation [2.7] 我々は、量子情報理論における重要な量として$alpha$-$z$-fidelityを定義する。
本稿では, 有限の最大値と最小値の極限式を提案する。
量子状態間の距離を測定するための幾何学的解釈を提供する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:32:59 GMT)
Cross-View-Prediction: Exploring Contrastive Feature for Hyperspectral Image Classification [2.7] 本稿では,ハイパースペクトル画像分類のための自己教師付き特徴学習手法を提案する。
本手法は,クロス表現学習手法を用いて,生のハイパースペクトル画像の2つの異なるビューを構築することを試みる。
そして、コントラスト学習法により、生成したビューに対して意味論的に一貫した表現を学習する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:11:27 GMT)
The use of large language models to enhance cancer clinical trial educational materials [2.7] GPT4の生成した試用サマリーは読みやすく、包括的であった。
複数選択質問は、クラウドソースアノテータと高い精度と一致を示した。
両方のリソースタイプに対して、継続する人間の監視を必要とする幻覚が同定された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:25:04 GMT)
Leveraging Auxiliary Task Relevance for Enhanced Bearing Fault Diagnosis through Curriculum Meta-learning [2.6] 本稿では,RT-ACM強化故障診断フレームワークを提案する。
RT-ACMは補助センサ作業条件の関連性を考慮して訓練を改善する。
このアプローチは、メタラーナーが優れた収束状態を達成するのに役立つ。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:42:20 GMT)
A surprisal oracle for when every layer counts [2.6] Active Curriculum Language Modeling (ACLM)は、言語モデルをトレーニングするための学習者指向のアプローチである。
本稿では,BabyLM 2024タスクに対するACLMプロセスの更新を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:53:45 GMT)
Point-GR: Graph Residual Point Cloud Network for 3D Object Classification and Segmentation [2.5] 本稿では,非秩序な原点雲を高次元に変換するために設計された新しいディープラーニングアーキテクチャであるPoint-GRを提案する。
ネットワーク内の残差ベースの学習を導入し、ポイントクラウドデータの点置換問題を緩和する。
これは、S3DISベンチマークデータセットで73.47%の最先端のシーンセグメンテーション平均IoUを実現し、その有効性を示している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:12:19 GMT)
Explainable Malware Detection through Integrated Graph Reduction and Learning Techniques [2.5] 制御フローグラフと関数コールグラフは、プログラム実行の詳細な理解を提供する上で重要なものとなっている。
これらのグラフベースの表現は、グラフニューラルネットワーク(GNN)と組み合わせることで、高性能なマルウェア検出器の開発において有望であることが示されている。
本稿では,グラフサイズを削減し,GNN出力の解釈可能性を高めるために最先端のGNNExplainerを適用し,これらの問題に対処する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:59:45 GMT)
Few-Shot Learning with Adaptive Weight Masking in Conditional GANs [2.4] 本稿では,Residual Weight Masking Conditional Generative Adversarial Network (RWM-CGAN) をデータ拡張に用いることにより,少数ショット学習への新たなアプローチを提案する。
提案モデルは,ネットワーク深度とサンプル品質を向上させるため,ジェネレータ内の残留ユニットを統合し,識別器の重みマスク正則化手法と組み合わせて,小サンプルカテゴリの特徴学習を改善する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:10:48 GMT)
Interpreting Transformers for Jet Tagging [2.3] 本研究では, 注目熱マップと粒子対相関を$eta$-$phi$平面上で解析することによりParTの解釈に着目する。
同時に、ParTは崩壊に応じて重要な粒子やサブジェットに様々な焦点が当てられていることを示し、このモデルが従来のジェットサブ構造を学習していることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:06:40 GMT)
Relativistic EELS scattering cross-sections for microanalysis based on Dirac solutions [2.3] 電子エネルギー損失分光(EELS)は、複雑な非弾性散乱過程に由来する。
EELSを定量化するためには、エネルギーウィンドウに統合された断面を比較するのが一般的である。
これらのグラフ化されたGOSをオープンソースライセンスの下で利用可能にし、両方の学術的ユーザの利益と商用ソリューションへの統合を可能にします。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:34:06 GMT)
Fast Computation of Leave-One-Out Cross-Validation for $k$-NN Regression [2.3] その結果, 平均2乗誤差のLOOCV推定値は, トレーニングデータに基づく平均2乗誤差の$(k+1)$-NN回帰と同一であることがわかった。
LOOCVスコアを計算するには、一度だけ$(k+1)$-NNレグレッションを適合させ、トレーニングデータ数に対して$k$-NNレグレッションのトレーニングバリデーションを繰り返す必要はない。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:18:05 GMT)
Controlling the Mutation in Large Language Models for the Efficient Evolution of Algorithms [2.2] 本稿では、遺伝的アルゴリズムの理論に触発された進化的枠組みにおける突然変異制御の新しいアプローチを紹介する。
本研究では,突然変異率を適応的に調節する動的突然変異プロンプトを提案する。
実験により, これらのダイナミックレートの導入により, LLaMEAの収束速度と適応性が向上することが示された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:49:22 GMT)
U-MATH: A University-Level Benchmark for Evaluating Mathematical Skills in LLMs [2.2] 教材から得られた大学レベルの未発表問題1,100件の新規ベンチマークであるU-MATHを紹介する。
6つの中核領域でバランスが取れており、20%のマルチモーダル問題がある。
U-MATH問題のオープンな性質を考えると、生成した解の正しさを判断するために LLM を用いる。
その結果,LLMはテキストベースのタスクでは最大63%の精度しか得られず,視覚的問題では45%以下であった。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:44:50 GMT)
Learning Developmental Age from 3D Infant Kinetics Using Adaptive Graph Neural Networks [2.2] Kinetic Age(KA)は、運動パターンに基づいて幼児の年齢を予測することによって、神経発達の成熟度を定量化するデータ駆動の指標である。
本手法は乳児の3次元映像記録を利用してポーズ推定を行い,解剖学的ランドマークの抽出・時間的時系列を抽出する。
これらのデータは適応的なグラフ畳み込みネットワークを用いてモデル化され、幼児運動における検出時間依存性を捉えることができる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:44:26 GMT)
IRisPath: Enhancing Off-Road Navigation with Robust IR-RGB Fusion for Improved Day and Night Traversability [2.2] 従来の道路上での自律的な手法は、ダイナミックな地形に苦しむため、オフロードでの車両制御は貧弱である。
近年の深層学習モデルでは、知覚センサと審美的フィードバックを併用して、そのような地形のナビゲーションを行っている。
本稿では,LWIRとRGB画像を用いて動的気象や光条件に対する堅牢性を実現するマルチモーダル核融合ネットワークFuseIsPathを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:53:09 GMT)
Testing CPS with Design Assumptions-Based Metamorphic Relations and Genetic Programming [2.2] CPS(Cyber-Physical Systems)ソフトウェアは、物理的なシステムに望ましい振る舞いを強制するために使用される。
CPSの要件は、実際の物理的トレースがどの程度、所望のトレースを追跡するべきかを記述している。
本研究は,要求ではなく制御理論的な設計仮定を用いてCPSをテストする手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:59:48 GMT)
Bounds in Wasserstein distance for locally stationary processes [2.2] ナダラヤ-ワトソン型推定器を用いた局所定常過程(LSP)の条件確率分布の推定に対処する。
結果は、合成データセットと実世界のデータセットの両方で数値実験によって支持される。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:51:22 GMT)
EMOVOME: A Dataset for Emotion Recognition in Spontaneous Real-Life Speech [2.1] 音声感情認識(SER)のための自発的データセットは、実験室環境やステージ化されたシナリオからしばしば抽出される。
EMOVOME(Emotional Voice Messages)データセットを開発し、公開しました。
ベースラインモデルおよび変圧器モデルとして音響特性を用いた話者非依存SERモデルの評価を行った。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:08:13 GMT)
Coordinated Multi-Armed Bandits for Improved Spatial Reuse in Wi-Fi [2.1] 空間再利用(SR)の最適化を推進するためのオンライン学習に基づく協調型ソリューションについて検討する。
特に、複数の意思決定エージェントが既存のネットワークからSRパラメータを同時に設定するマルチエージェントマルチアーマッドバンド(MA-MAB)の設定に着目する。
協調MABによって実現されたAIネイティブSRは、現在のWi-Fi操作よりもネットワーク性能を向上させることができることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:53:59 GMT)
Privacy-Preserving Data Deduplication for Enhancing Federated Learning of Language Models (Extended Version) [2.0] 先駆的プロトコル, 効率的なプライバシ保護多人数重複(EP-MPD)を導入する。
EP-MPDはデータのプライバシを損なうことなく、複数のクライアントのデータセットからの重複を効率的に除去する。
本実験は,大規模言語モデルの連合学習における重複解消の意義を実証するものである。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:56:57 GMT)
Physics-Informed Deep Inverse Operator Networks for Solving PDE Inverse Problems [1.9] 偏微分方程式(PDE)に関する逆問題(英語版)は、測定データから未知の量への写像を発見するものであると見なすことができる。
既存の手法は一般に大量のラベル付きトレーニングデータに依存しており、ほとんどの現実世界のアプリケーションでは実用的ではない。
我々は,PDEに基づく逆問題に対して,ラベル付きトレーニングデータなしで解演算子を学習できる,Physical-Informed Deep Inverse Operator Networks (PI-DIONs) という新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:38:58 GMT)
MRNet: Multifaceted Resilient Networks for Medical Image-to-Image Translation [1.9] 我々は,MRI-to-CTおよびMRI-to-MRI変換における最先端の手法より優れた医用画像・画像翻訳のための新しいアーキテクチャを提案する。
このアーキテクチャは、強力なSAMイメージエンコーダを使用して、多様なデータセットから包括的なマルチスケール特徴を抽出し、解像度認識機能融合を実行する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 05:23:46 GMT)
System Test Case Design from Requirements Specifications: Insights and Challenges of Using ChatGPT [1.9] 本稿では,Large Language Models (LLMs) を用いてソフトウェア要件仕様 (SRS) 文書からテストケース設計を作成することの有効性について検討する。
生成したテストケースの約87%が有効で、残りの13%は適用不可能か冗長かのどちらかでした。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 20:12:27 GMT)
Leveraging LLMs for On-the-Fly Instruction Guided Image Editing [1.9] 本研究では,命令誘導画像編集をオンザフライで行うための準備不要な手法を提案する。
本手法は,MAGICBRUSHデータセットで評価した場合に,この課題に対する技術モデルの有効性と競争性を示すものである。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:35:25 GMT)
Dense Scene Reconstruction from Light-Field Images Affected by Rolling Shutter [1.9] 本稿では,2次元ガウススプラッティングをベースとした2段階の手法を提案し,点雲の定式化による「レンダリングと比較」の戦略を提案する。
第1段階では、サブアパーチャ画像のサブセットを用いて、シーンターゲット形状に関連するRS3D形状を動きまで推定する。
第2段階では、許容カメラ動作を推定して3次元形状の無知を算出する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:59:04 GMT)
DualAD: Dual-Layer Planning for Reasoning in Autonomous Driving [1.8] 運転中の人間の推論を模倣する新しい自動運転フレームワークであるDualADを提案する。
DualADは、ルールベースのモーションプランナとルールベースのテキストエンコーダを備えた上位レイヤの2つのレイヤで構成されている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:35:51 GMT)
A Review on Scientific Knowledge Extraction using Large Language Models in Biomedical Sciences [1.8] 本稿では,生物医学領域における大規模言語モデル(LLM)の最先端応用について概説する。
LLMは、幻覚、文脈理解、一般化する能力など、大きな可能性を秘めているが、大きな課題が残っている。
我々は、医療文献へのアクセスを改善し、医療における有意義な発見を促進することを目的としている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:26:13 GMT)
DiffuPT: Class Imbalance Mitigation for Glaucoma Detection via Diffusion Based Generation and Model Pretraining [1.8] 緑内障は、視神経頭の構造的損傷と視野の機能的変化を特徴とする進行性視神経症である。
本研究では, 緑内障の診断, 特に合成データ生成によるクラス不均衡に対処するために, 生成的枠組みを用いている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:39:44 GMT)
Automatically Interpreting Millions of Features in Large Language Models [1.8] スパースオートエンコーダ(SAE)は、活性化を高次元の潜在空間に変換するために用いられる。
SAEの機能に関する自然言語の説明を生成・評価するためのオープンソースのパイプラインを構築します。
我々の大規模分析は、SAE潜伏剤がニューロンよりもはるかに解釈可能であることを確認しています。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:03:13 GMT)
Generalized Diffusion Model with Adjusted Offset Noise [1.8] 本稿では,厳密な確率的枠組みの中で自然に付加的な雑音を取り入れた一般化拡散モデルを提案する。
我々は、ある調整でノイズを相殺する理論的等価性を確立し、証拠の低い境界に基づいて損失関数を導出する。
合成データセットの実験により、我々のモデルは輝度に関する課題に効果的に対処し、高次元シナリオにおいて従来の手法より優れていることが示された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:57:03 GMT)
Modular addition without black-boxes: Compressing explanations of MLPs that compute numerical integration [1.8] 非線形特徴写像を厳密に圧縮する最初のケーススタディを示す。
我々は、回路のパラメータ数において、ReLUの動作に非空き境界を線形に設定する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 23:29:07 GMT)
Tango*: Constrained synthesis planning using chemically informed value functions [1.7] 本稿では,教材制約による合成計画問題の解法を実現するための簡単なガイド付き探索手法を提案する。
Tango* のコスト関数は,双方向 DESP 手法の強い改善を触媒する。
提案手法は,経路品質の共通指標である類似長さの合成経路を提案しながら,壁面時計の時間短縮を実現する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:14:02 GMT)
Cluster Specific Representation Learning [1.7] 広く応用されているにもかかわらず、善の表象の定義は確立されていない。
本稿では,データに固有のクラスタが存在する場合,各クラスタに固有の表現が必要であるという,ダウンストリームに依存しない定式化を提案する。
そこで我々は,クラスタ固有の表現とクラスタ割り当てを共同で学習するメタアルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:59:37 GMT)
Generation of Tunable Correlated Frequency Comb via Four-Wave-Mixing in Optical fibers [1.7] 本報告では,光子対コムに相関する光子対コムを生成するための全繊維を用いた実験装置について報告する。
生成した光子の時間相関は, 同時測定により確認された。
HNLFによる非線形力学はシュル「オーディンガー」の伝播方程式を用いてモデル化された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:55:46 GMT)
Multi-Action Restless Bandits with Weakly Coupled Constraints: Simultaneous Learning and Control [1.7] 有限個のマルチアクションバンディット過程をもつシステムについて検討する。
本稿では,同時学習と制御が可能な効果的なスキームを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:57:20 GMT)
ELCC: the Emergent Language Corpus Collection [1.7] Emergent Language Corpus Collection (ELCC) は、緊急通信システムのオープンソース実装から生成されたコーパスのコレクションである。
各コーパスには、ソースコードの特徴を記述したメタデータと、コーパスの分析スイートが添付されている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:23:54 GMT)
Monogamy of entanglement inspired protocol to quantify bipartite entanglement using spin squeezing [1.6] 我々は,$N$ qubitsのシステムにおいて,二部交絡を検出するプロトコルを提案する。
スピンスクイーズを用いて個々のサブシステム内の絡み合いを定量化する。
本プロトコルでは,状態トモグラフィがアクセス不能なプラットフォームにおいて,絡み検出の代替手段を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 21:49:45 GMT)
Generalization Bounds and Model Complexity for Kolmogorov-Arnold Networks [1.6] Kolmogorov-Arnold Network (KAN)は、Liuらによって最近提案されたネットワーク構造である。
活性化関数を備えたカンの一般化境界を確立することにより、カンの厳密な理論的解析を提供する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:59:38 GMT)
GERD: Geometric event response data generation [1.5] イベントベースの視覚センサーは、その時間分解能、より高いダイナミックレンジ、低消費電力のために魅力的である。
また、従来のフレームベースのカメラと根本的に異なるデータも提供します。
制御された変換の下でイベントベースのデータを生成する方法を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:59:36 GMT)
Public Engagement in Action: Developing an Introductory Programming Module for Apprentices [1.5] 本稿では,イギリス・ワーウィック大学における導入プログラミングモジュールへの公的なエンゲージメントの統合について検討する。
モジュール設計は、伝統的なプログラミング教育とコミュニティの関わりを統合する'V'モデルに従っている。
アレンティスは、地元の中学生にアウトリーチ活動、プログラミング、Arduinoハードウェアを教えている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:55:59 GMT)
Blindfold: Confidential Memory Management by Untrusted Operating System [1.5] 既存の Confidential Computing (CC) ソリューションは、OSから機密メモリを隠蔽し、秘密性を達成するために暗号化する。
本稿では,Blindfold というCC設計で合成したこれらの制限を克服するための実験結果について述べる。
Blindfoldは、Guardianと呼ばれるカーネルよりも高い特権レベルで実行される、小さな信頼できるソフトウェアコンポーネントに依存している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:04:58 GMT)
Evaluating Single Event Upsets in Deep Neural Networks for Semantic Segmentation: an embedded system perspective [1.5] 本稿では,組み込みディープニューラルネットワーク(DNN)のロバスト性評価について述べる。
本研究は,様々なエンコーダデコーダモデルの層間およびビット間感度をソフトエラーに精査することにより,セグメント化DNNのSEUに対する脆弱性を徹底的に調査する。
本稿では,資源制約によるデプロイメントに適したメモリや計算コストを伴わない,実用的な軽量なエラー軽減手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:28:38 GMT)
Designing DNNs for a trade-off between robustness and processing performance in embedded devices [1.5] 機械学習ベースの組み込みシステムは、ソフトエラーに対して堅牢である必要がある。
本稿では,摂動に対するモデルロバスト性を改善するために有界AFを用いた場合の適合性について検討する。
自律運転におけるシーン理解のためのハイパースペクトル画像のセマンティックセグメンテーションタスクの実行を目的としたエンコーダ・デコーダの完全畳み込みモデルの解析を行う。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:34:33 GMT)
CIKAN: Constraint Informed Kolmogorov-Arnold Networks for Autonomous Spacecraft Rendezvous using Time Shift Governor [1.5] 我々は、時間シフトガウンタ(TSG)に対する制約付きインフォームドニューラルネットワーク(CINN)近似について検討する。
TSGに対する制約付きコルモゴロフ・アルノルドネットワーク(CIKAN)に基づく近似を提案する。
制約された宇宙船ランデブーミッションのシミュレーションにより,CIKANをベースとしたTSGの有効性を実証する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 20:58:06 GMT)
CBEval: A framework for evaluating and interpreting cognitive biases in LLMs [1.5] 大きな言語モデルは、認知過程において顕著なギャップを示す。
人間の生成したデータのリフレクションとして、これらのモデルは認知バイアスを継承する可能性がある。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 05:53:28 GMT)
Intelligent Spark Agents: A Modular LangGraph Framework for Scalable, Visualized, and Enhanced Big Data Machine Learning Workflows [1.5] 本稿では,ビッグデータにおけるAIと機械学習のためのビジュアルプロセスモデリングツールを紹介する。
このツールは、データ前処理、機能エンジニアリング、モデルトレーニング、評価といった、機械学習の重要なステージを表している。
アナリストは視覚的に設計でき、実行のために最適化されたSparkコードに自動的に変換される。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:44:33 GMT)
A Bidirectional Siamese Recurrent Neural Network for Accurate Gait Recognition Using Body Landmarks [1.4] 歩行認識に関わる課題に対処し、その精度と信頼性を改善するための新しいアプローチを提案する。
提案手法は,Mediapipeのポーズ推定モデルを用いて得られた連続歩行ランドマークを含む高度な手法を利用する。
大規模なクロスビューデータセットを用いて,アプローチの有効性を示す実験を行った。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:39:55 GMT)
Learning Semantic Association Rules from Internet of Things Data [1.4] アソシエーションルールマイニング(アソシエーションルールマイニング、ARM)は、データ中の共通点を論理的な意味として発見するタスクである。
ARMはIoT(Internet of Things)において、監視や意思決定などさまざまなタスクに使用されている。
動的センサデータと静的IoTシステムメタデータの両方を利用した,IoTデータのための新しいARMパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:53:45 GMT)
CredID: Credible Multi-Bit Watermark for Large Language Models Identification [1.3] 大規模言語モデル(LLM)は複雑な自然言語処理タスクで広く使われているが、プライバシやセキュリティ上の懸念が高まる。
本稿では、信頼できるサードパーティ(TTP)と複数のLPMベンダーが関与するマルチパーティ信頼できる透かしフレームワーク(CredID)を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:13:29 GMT)
A Scalable Quantum Neural Network for Approximate SRBB-Based Unitary Synthesis [1.3] この研究は、SRBB(Standard Recursive Block Basis)によるユニタリ進化を近似するためのスケーラブルな量子ニューラルネットワークを導入している。
CNOTの数を減少させるアルゴリズムが提案され、単一の近似層を必要とする新しい実装可能なスケーリングスキームが導出される。
近似の有効性は、2つの勾配法と異なるメトリクスで測定される。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:21:23 GMT)
PathletRL++: Optimizing Trajectory Pathlet Extraction and Dictionary Formation via Reinforcement Learning [1.3] トラジェクトリパスレット辞書は、モビリティ関連のアプリケーションを支援するために不可欠である。
本稿では,基本パスレットを段階的にマージして辞書を構築するボトムアップ戦略を提案する。
本研究では,Deep Q-Networks (DQN) を用いて実用関数を近似する深層強化学習フレームワークPathletRLを開発した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 21:09:43 GMT)
CLAS: A Machine Learning Enhanced Framework for Exploring Large 3D Design Datasets [1.3] 本稿では3次元オブジェクトの完全自動検索を可能にする機械学習(ML)拡張フレームワークCLASを提案する。
概念実証として,椅子の6,778個の3Dオブジェクトを検索するWebユーザインタフェース(UI)を備えた検索システムを作成した。
クローズセット検索では,平均相反位(MRR)が0.58,トップ1が42.27%,トップ10が89.64%となる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 03:29:56 GMT)
Linear Simple Cycle Reservoirs at the edge of stability perform Fourier decomposition of the input driving signals [1.3] 本稿では, 線形単純循環貯留層(SCR)の安定性の限界における表現構造について検討する。
状態空間に標準ドット積を付与することにより、対応するカーネルを元の時系列空間で動作させるリバースエンジニアリングを行う。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 00:43:16 GMT)
VidHalluc: Evaluating Temporal Hallucinations in Multimodal Large Language Models for Video Understanding [1.2] ビデオ理解タスクのためのMLLMの幻覚を調べるために設計された最大のベンチマークであるVidHallucを紹介する。
VidHallucは、(1)行動、(2)時間的シーケンス、(3)シーン遷移の3つの重要な次元にわたる幻覚を評価する。
DINO-HEALは,DINOv2からの空間的塩分度情報を推論時の視覚的特徴に組み込むことで幻覚を軽減できる訓練不要の手法である。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:03:19 GMT)
Language Model Meets Prototypes: Towards Interpretable Text Classification Models through Prototypical Networks [1.2] 論文は、LMをエンコーダとして使用する際に本質的に解釈可能なモデルを開発することに焦点を当てている。
ホワイトボックスのマルチヘッドグラフアテンションに基づくプロトタイプネットワークを開発した。
私は、解釈可能なグラフニューラルネットワークを再設計するために、コントラスト学習による注意ベースのプロトタイプネットワークの拡張に取り組んでいます。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:59:35 GMT)
Diverse methods and practical aspects in controlling single semiconductor qubits: a review [1.2] 量子制御は、分子物理学、核磁気共鳴、量子情報処理で使われる幅広い量子演算を可能にする。
半導体量子ドットにおける電子や核のスピンや電荷度自由度に量子情報が符号化される半導体量子ビットは、スケーラブルな固体量子技術の競争力の高い候補となっている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:58:49 GMT)
Fast and reliable uncertainty quantification with neural network ensembles for industrial image classification [1.1] ニューラルネットワーク(NN)を用いた画像分類は、産業プロセスで広く使われている。
NNは、アウト・オブ・ディストリビューション(OOD)データに直面すると、確実だが誤った予測をする傾向がある。
複数の独立したNNで構成されたディープアンサンブルは、強い性能を示すことが示されているが、計算コストが高い。
本研究では,産業プロセスの画像分類における効率的なNNアンサンブルの予測と不確実性について検討した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:48:28 GMT)
Boundary Flat Bands with Topological Spin Textures Protected by Sub-chiral Symmetry [1.1] キラル対称性は、トポロジカルな分類や、バルクあるいは境界平坦なバンドの起源の理解において欠かせない役割を果たす。
本研究では、キラル対称性を一般化し、サブキラル対称性と呼ばれる概念を導入する。
キラル対称性のない位相的ギャップ系やギャップレス系は準キラル対称性で境界平坦帯を支持できることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:56:10 GMT)
Assessing the performance of CT image denoisers using Laguerre-Gauss Channelized Hotelling Observer for lesion detection [1.1] 低放射線下で取得した雑音画像から難聴画像を取り出すための深層学習手法を提案する。
本研究では、視覚的知覚とデータ忠実度に基づくタスク非依存のメトリクスを用いて、ディープラーニングの認知アルゴリズムの画質を評価する。
通常のCT画像と比較すると,PSNR(2.4~3.8dB)やSSIM(0.05~0.11)などの測定値に基づいて,ディープラーニングデノイザーは低用量CTよりも優れていた。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 00:11:19 GMT)
Simulation of a Three-Nucleons System Transition on Quantum Circuits [1.0] 本研究は、核移行の完全なシミュレーションの実現可能性を示す。
2つの核子と3つの核子の間の強い相互作用の複雑さに取り組むために、状態はトリチウム上でモデル化される。
この研究は、デジタル量子コンピュータを活用して核物理学をシミュレートする第一歩となる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:14:29 GMT)
Algebraic law of local correlation in the dynamically tuned Ising model [1.0] 動的に調整したIsingモデルにおける反強磁性(AF)相関について検討した。
同じマンハッタン距離におけるAF相関の大きさは、全ての最短経路が寄与する相関の代数的和である。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:28:17 GMT)
An indoor DSO-based ceiling-vision odometry system for indoor industrial environments [1.0] 本稿では,DSO(Direct Sparse Odometry)に基づく天井監視システムであるCeiling-DSOを紹介する。
他の天井視システムとは異なり、シーリングDSOはDSOの汎用的な定式化を利用して、天井上の観測可能な形状やランドマークに関する仮定を避けている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 01:36:54 GMT)
Contextual Data Integration for Bike-sharing Demand Prediction with Graph Neural Networks in Degraded Weather Conditions [1.0] 本研究は,非定型気象条件下での自転車シェアリング(OD)フローを予測するために,天気などの文脈データを追加することの影響を解析する。
本研究は,自転車シェアリング需要の予測品質と道路交通流の関係を軽度に強調する一方で,導入した時間埋め込みにより,最先端の成果を達成できることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:29:52 GMT)
Parametric Enhancement of PerceptNet: A Human-Inspired Approach for Image Quality Assessment [1.0] 現在のアプローチでは、ほとんどすべてのパラメータを盲目的に最適化しています。
本稿では,ニューラルネットワーク層をパラメトリケートすることで,より生物学的な操作が可能となることを示す。
2つのパラメトリックモデル版を提示する。1つは生物学的に妥当なパラメータを持つもので、もう1つは人間の知覚実験データに適合する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:55:44 GMT)
Experience-driven discovery of planning strategies [1.0] メタ認知的強化学習によって新たな計画戦略が発見されることを示す。
人間のデータに合わせると、これらのモデルは人間よりも遅い発見率を示し、改善の余地を残している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:20:03 GMT)
Electrocardiogram-based diagnosis of liver diseases: an externally validated and explainable machine learning approach [1.0] 肝疾患は世界的な健康上の問題であり、しばしば資源集約的な方法を用いて診断される。
本研究は, 肝疾患診断のための心電図データに機械学習モデルを適用した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 21:11:34 GMT)
Conveying Emotions to Robots through Touch and Sound [0.9] タッチを通じてロボットに感情を届ける方法については理解されていない。
本研究は,触覚と聴覚の感覚読取を統合し,触覚に基づくロボットに対する感情表現の整合性について検討する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:17:42 GMT)
Integrating programmable plasticity in experiment descriptions for analog neuromorphic hardware [0.9] BrainScaleS-2のニューロモルフィックアーキテクチャは「ハイブリッド」可塑性をサポートするように設計されている。
シナプス間相関測定などの数値シミュレーションで高価な観測機器はシナプス回路に直接実装される。
我々は高レベルな実験記述言語でスパイキングニューラルネットワーク実験と塑性規則を記述するための統合フレームワークを導入する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:46:06 GMT)
Origin of Robust $\mathbb{Z}_2$ Topological Phases in Stacked Hermitian Systems: Non-Hermitian Level Repulsion [0.9] 非自明な$mathbbZ$位相を持つ量子スピンホール絶縁体は、20年間大きな注目を集めてきた。
一般に、量子スピンホール絶縁体の偶数の層が積み重なると、$mathbbZ$位相位相は$mathbbZ$自然により不安定になると考えられている。
我々は、ロバスト性は一般的に、ハーミティゼーションから派生した対応する非エルミティアン系におけるレベル反発から生じるという体系的な理解を提供する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:25:40 GMT)
Advancing Conversational Psychotherapy: Integrating Privacy, Dual-Memory, and Domain Expertise with Large Language Models [0.9] メンタルヘルスは、伝統的な会話精神療法の限界を明らかにする世界的な問題となっている。
心理療法へのアクセスを民主化するために設計されたLarge Language Model (LLM)対応チャットボットであるSoulSpeakを紹介する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 03:02:46 GMT)
Scalable learning of potentials to predict time-dependent Hartree-Fock dynamics [0.8] 我々は、TDHFの電子間ポテンシャルの3つのモデルを開発し、訓練し、テストする。
7つの異なる分子系にまたがって、より深い8倍の対称性を考慮すれば、最高の性能モデルが得られる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 01:18:02 GMT)
Nonlinear Optimal Control of Electron Dynamics within Hartree-Fock Theory [0.8] 時間依存型Hartree-Fock(TDHF)理論におけるこの問題の解を示す。
この問題を非線形TDHF方程式に制約された最適化問題とみなす。
3つの分子系に対して、制御の非常に小さなニューラルネットワークパラメトリゼーションにより、所望の目標を達成する解が得られることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:06:21 GMT)
YOLO based Ocean Eddy Localization with AWS SageMaker [0.8] この研究は、AWSクラウドサービス、特にSageMakerを使用して、海洋渦をピンポイントすることを目的としている。
主な目的は、衛星リモート画像から小型(20km)海洋渦を検出することである。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:16:01 GMT)
Typologie des comportements utilisateurs : {é}tude exploratoire des sessions de recherche complexe sur le Web [0.8] 本稿では,汎用IR変数(クエリ数など)に基づく類型論について述べるとともに,話題(検索文から定義した意味内容の異なる命題)についても述べる。
我々は多次元解析を行い、複雑な探索タスクの処理中の個人行動に基づく5種類の類型分類を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:32:14 GMT)
Chatting with Logs: An exploratory study on Finetuning LLMs for LogQL [0.8] ロギングは現代の分散アプリケーションでは重要な機能だが、ログクエリ言語やフォーマットの標準化が欠如していることは大きな課題となっている。
本稿では,これらの不整合に対処し,ログクエリ生成を支援するために,新しい自然言語インタフェースを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:06:24 GMT)
JPC: Flexible Inference for Predictive Coding Networks in JAX [0.8] 予測符号化を用いてニューラルネットワークをトレーニングするためのJAXライブラリであるJPCを紹介する。
JPCは、識別、生成、ハイブリッドモデルを含む様々なPCネットワーク(PCN)をトレーニングするための、シンプルで高速で柔軟なインターフェースを提供する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:15:34 GMT)
Partially Conditioned Patch Parallelism for Accelerated Diffusion Model Inference [0.8] 拡散モデルは画像生成のエキサイティングな能力を示しており、ビデオ作成にも非常に有望である。
1つのサンプルを生成するのに必要なシーケンシャルな記述ステップは、数十ないし数百のイテレーションを必要とする可能性がある。
本研究では,高分解能拡散モデルの推論を高速化する部分条件付きパッチ並列性を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:12:50 GMT)
Incorporating Memory into Propagation of 1-Electron Reduced Density Matrices [0.7] 我々は時間依存構成相互作用における1ドル電子還元密度行列のメモリ依存性に光を当てた。
提案手法は,TDCI密度行列を高精度に伝播する。
我々の導出は、基底集合、電子の数、波動関数におけるスレーター行列式の選択に関係なく、任意のTDCI系に適用される。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:02:17 GMT)
Counting collisions in random circuit sampling for benchmarking quantum computers [0.7] ランダムな量子回路の測定における衝突回数のカウントは、量子コンピュータの品質の実用的なベンチマークとなることを示す。
この量は、適切に正規化されている場合、「衝突異常」ベンチマークや「衝突容積」テストとして使用できることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:24:15 GMT)
Optimizing Container Loading and Unloading through Dual-Cycling and Dockyard Rehandle Reduction Using a Hybrid Genetic Algorithm [0.7] クレーンによる船のコンテナの降ろしと積載の両操作を包含する統一モデルを提案する。
本稿では,1次元と2次元のGA成分からなるハイブリッド遺伝的アルゴリズム (GA) QCDC-DR-GAを提案する。
我々のモデルは2サイクルの最大化と造船所再処理の最小化の4つの最先端手法を一貫して上回っている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:53:37 GMT)
Breast Cancer Classification Using Gradient Boosting Algorithms Focusing on Reducing the False Negative and SHAP for Explainability [0.7] 本研究は,乳がん予測のためのブースティングに基づく各種機械学習アルゴリズムの性能評価に焦点をあてる。
本研究の目的は,AdaBoost,XGBoost,CatBoost,LightGBMといった最先端の促進アルゴリズムを用いて乳癌の予測と診断を行うことである。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 00:26:21 GMT)
Dialectal Coverage And Generalization in Arabic Speech Recognition [0.7] 本研究は,事前学習における方言カバレッジの役割,方言固有の微調整の有効性,および未知の方言への一般化能力について検討した。
様々な方言の組み合わせにわたる広範な実験を通じて、我々の研究はアラビア語のような多中心言語のためのASRシステムの開発を進めるための重要な洞察を提供する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:56:13 GMT)
Non-Hermitian Semiclassical Rabi model: An analytical study [0.7] $mathcalPT$対称半古典的ラビモデルは、2レベル原子と古典場の間の基本的な相互作用を解明する。
我々は、回転波近似の形で有効ハミルトニアンを生成する単一の類似性変換を提案する。
この分析処理は、この非エルミート原子-場相互作用系の主物理を簡潔かつ正確に記述することができる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 00:08:45 GMT)
Solving Generalized Grouping Problems in Cellular Manufacturing Systems Using a Network Flow Model [0.6] 本稿では, セル製造システムにおける一般化グループ化問題に焦点をあてる。
本研究は,ネットワークフローアルゴリズムの広範かつ広範な利用に着想を得て,一般化グループ化のためのプロセス経路ファミリー形成を定式化した。
提案モデルでは, 生成する部品の数を事前に指定することなく, プロセス経路のファミリー形成問題を最適に解決する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 20:56:11 GMT)
Designing Cellular Manufacturing System in Presence of Alternative Process Plans [0.6] 本稿では, セル製造システムにおいて, 部品や機械をグループ化するための整数計画式を4つ提示する。
部品種別連続動作の最大回数を同一セル及び同一マシンに割り当てることにより、セル間移動及びセル内移動の最小化を実現する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 20:56:57 GMT)
Dynamic Consistent $k$-Center Clustering with Optimal Recourse [0.6] 我々は、$k$-centerクラスタリング問題において、決定論的定数係数近似を開発することにより、最適リコース境界を許容することを証明する。
当社のインクリメンタルアルゴリズムは,Charikar,Chekuri,Feder,Motwaniによる8ドルの近似アルゴリズムよりも改善されている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:39:03 GMT)
Passive polarization-encoded BB84 protocol using a heralded single-photon source [0.6] 単一光子源を用いた受動偏光符号化BB84プロトコルの実装について報告する。
我々の実装は、量子ビット誤り率7%、キーレート5kbpsを達成した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 01:22:16 GMT)
On the potential of quantum walks for modeling financial return distributions [0.6] 我々は、資産価格の進化をモデル化するための離散時間量子ウォークの可能性を探る。
量子ウォークアルゴリズムに基づくモデルから得られた帰属分布を古典的手法による帰属分布と比較する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:13:25 GMT)
Optimal probabilistic feature shifts for reclassification in tree ensembles [0.5] 所望のクラスに到達するための観測の最も実行可能な変化は、常に最も近い距離ポイントと一致しないことを示す。
個人には、それぞれの特徴を与えられた値に変更する確率が与えられ、ターゲットクラスに変更する全体的な確率が決定される。
また,木アンサンブルの最も重要な特徴をランク付けする手法も提案している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 21:28:24 GMT)
Benchmarking Attention Mechanisms and Consistency Regularization Semi-Supervised Learning for Post-Flood Building Damage Assessment in Satellite Images [0.5] 災害後の建物被害評価は、迅速な対応と災害後の復興計画に不可欠である。
現在の研究では、ニューラルネットワーク設計における変化検出(CD)から、災害評価(DA)の明確な要件を考慮できない。
本論文は,1) DA衛星画像における変化特徴の構築はCDよりも微妙である,2) DAデータセットはデータ不足とラベルの不均衡に直面する,という2つの重要な違いに焦点を当てる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:03:12 GMT)
You're (Not) My Type -- Can LLMs Generate Feedback of Specific Types for Introductory Programming Tasks? [0.5] 本稿では,Large Language Models (LLM) を用いたプログラミングタスクに対して,特定のタイプのフィードバックを生成することを目的とする。
既存のフィードバックを見直して、ランダム性、不確実性、変動度などの、生成されたフィードバックの特異性を捉える。
結果は、例えば、フィードバック効果や学習者の情報的ニーズに関する将来のフィードバック研究に影響を及ぼす。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:57:39 GMT)
Towards Time Series Reasoning with LLMs [0.4] 本稿では,ゼロショット性能の強い領域にまたがる一般化可能な情報を学習する,新しいマルチモーダル時系列LPM手法を提案する。
提案モデルでは,特定の時系列特徴を反映した潜時表現を学習し,ゼロショット推論タスクのセットにおいてGPT-4oより優れることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:45:14 GMT)
A Multi-Functional Web Tool for Comprehensive Threat Detection Through IP Address Analysis [0.4] 本研究は,高度IPアドレス特徴化のための包括的Webツールを導入する。
私たちのツールは、位置情報、ブロックリストチェック、VPN検出、プロキシ検出、ボット検出、Tor検出、ポートスキャン、正確なドメイン統計など、幅広い機能を提供します。
我々のツールはドメイン名とIPv4アドレスをサポートし、脅威インテリジェンスのための多機能で強力なIPアナライザツールである。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:29:12 GMT)
Learning How to Dynamically Decouple [0.4] 現在の量子コンピュータは、量子システムと環境の間の相互作用に起因するノイズに悩まされている。
回転ゲートを最適化して量子ハードウェアに調整することで,動的デカップリングの性能を向上させることができることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:06:08 GMT)
GaussianBeV: 3D Gaussian Representation meets Perception Models for BeV Segmentation [0.4] Bird's-eye View (BeV)表現は多視点カメラ画像からの3D知覚に広く用いられている。
本研究では,3次元空間上に配置・配向された3次元ガウスの集合を用いて,映像特徴をBeVに変換する手法を提案する。
実験の結果、提案した表現は極めて効果的であり、nuScenesデータセット上のBeVセマンティックセグメンテーションタスクにおいて、GaussianBeVを新たな最先端技術として位置づけている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:43:00 GMT)
Extracting Universal Corner Entanglement Entropy during the Quantum Monte Carlo Simulation [0.4] 量子臨界点(QCP)の普遍的特性を明らかにするために、エンタングルメントエントロピー(EE)における下降角対数補正が不可欠である
我々は計算コストを抑えてEEのコーナーコントリビューションを直接測定する新しい手法を開発した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:39:57 GMT)
Single photonic qutrit in a collective Rydberg polariton [0.4] 我々は,Rydbergアンサンブルにおける1つのフォトニッククエットのコヒーレントな生成,制御,読み出しについて報告する。
マイクロ波結合Rydberg状態を用いてマイクロ秒の時間スケールで単一フォトニッククォートを書き込み、処理し、読み取る能力は、クォートのハイヒルベルト空間間のコヒーレントな接続を実証する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:30:42 GMT)
Interpretable Hierarchical Attention Network for Medical Condition Identification [0.4] 本稿では,解釈可能な階層型注意ネットワーク(IHAN)を開発した。
IHANは階層的な注意構造を使用し、医療履歴データ構造と自然に一致し、患者が遭遇する(サービス開始日)順序を反映する。
本モデルは,慢性腎臓病3期(CKD)の発症予測に,医療アドバンテージ(MA)メンバーの3年間の医療歴を用いた。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 20:31:40 GMT)
Enhancing Fluorescence Lifetime Parameter Estimation Accuracy with Differential Transformer Based Deep Learning Model Incorporating Pixelwise Instrument Response Function [0.3] 蛍光ライフタイムイメージング(FLI)は、組織微小環境に関するユニークな情報を提供する。
近年のディープラーニングの進歩により、蛍光寿命パラメーターの推定が改善されている。
本稿では,実験的な光子時間ヒストグラムとともに,計装応答関数(IRF)を付加入力として統合した新しいDLアーキテクチャであるMFliNetを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:02:23 GMT)
Mixing It Up: The Cocktail Effect of Multi-Task Fine-Tuning on LLM Performance -- A Case Study in Finance [0.3] 本稿では,ドメイン固有タスクのための細調整型大規模言語モデル (LLM) の詳細な解析を行う。
ドメイン固有のケースでは、ターゲットタスクのみを微調整することが、必ずしも最も効果的な戦略ではないことが分かりました。
我々は、Phi-3-Miniのような小さなモデルが、どのようにして最先端の結果が得られるかを実証する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 20:57:05 GMT)
Segmentation-Free Outcome Prediction from Head and Neck Cancer PET/CT Images: Deep Learning-Based Feature Extraction from Multi-Angle Maximum Intensity Projections (MA-MIPs) [0.3] 頭頸部癌(HNC)患者の予後予測のための,革新的な,シンプルで効果的なセグメンテーションフリーアプローチを提案する。
PETボリュームに適用された深層学習に基づく特徴抽出技術と多角最大強度投影(MA-MIP)を活用することにより,手動セグメンテーションの必要性を解消する。
PETボリューム上で頭頸部領域の自動収穫を行うための最先端物体検出モデルを訓練する。
その後、事前訓練された深部畳み込みニューラルネットワークのバックボーンを用いて72乗から得られたMA-MIPから深部特徴を抽出する
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:37:40 GMT)
Beyond algorithm hyperparameters: on preprocessing hyperparameters and associated pitfalls in machine learning applications [0.3] 本稿では,予測モデルの生成と評価のための異なる手順について,実験的に考察する。
潜在的な落とし穴、特に誇張されたパフォーマンスクレームにつながる可能性のあるものを強調することで、このレビューはMLアプリケーションにおける予測モデリングの品質をさらに向上することを目的としている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:29:10 GMT)
How to Segment in 3D Using 2D Models: Automated 3D Segmentation of Prostate Cancer Metastatic Lesions on PET Volumes Using Multi-angle Maximum Intensity Projections and Diffusion Models [0.3] 本研究は,PSMA PET/CT 3Dボリューム画像における転移病変の自動分割のための新しいアプローチを提案する。
提案手法は,PSMA PET画像の多重角最大強度投影(MA-MIP)に病変を分割する。
提案法は, 微小転移性PCa病変の検出・分節における精度, 堅牢性の観点から, 最先端の3次元分節法に比べ, 優れた性能を示した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:42:04 GMT)
Exact steady state of quantum van der Pol oscillator: critical phenomena and enhanced metrology [0.3] 定常状態特性の急激な変化を伴う散逸相転移に対応する閾値を示す。
臨界挙動と有限サイズ効果は解析的定常状態を通して研究される。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:39:02 GMT)
Towards Size-Independent Generalization Bounds for Deep Operator Nets [0.3] 本研究は,DeepONetsのトレーニング中にサンプル外誤差を測定する理論を推し進めることを目的としている。
DeepONets のクラスでは、関係するネットの幅と明示的にスケールしない Rademacher の複雑性に制限があることを証明します。
We show how the Huber loss can be chosen to for these DeepONet class generalization error bounds can be obtained that have no explicit dependencies to the size of the nets。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:37:38 GMT)
From Words to Workflows: Automating Business Processes [0.3] ロボットプロセス自動化(RPA)の限界が明らかになっている。
人工知能(AI)の最近の進歩は、インテリジェントオートメーション(IA)の道を開いた。
本稿では,自然言語のユーザ要求から自動生成する新しい方法であるText2Workflowを紹介する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:34:35 GMT)
Techniques for learning sparse Pauli-Lindblad noise models [0.3] パウリ回転に基づくツイリングを導入し、単一量子学習訂正シーケンスを自動生成する。
また,グラフカラー化と一様被覆配列を利用して学習基地数を最小限に抑える基底選択手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:49:52 GMT)
Challenges in Guardrailing Large Language Models for Science [0.2] 科学領域に大規模言語モデル(LLM)を配置するためのガイドラインを提供する。
時間感受性、知識の文脈化、紛争解決、知的財産権の懸念など、特定の課題を特定します。
これらのガードレールの側面には、信頼性、倫理と偏見、安全性、法的側面が含まれる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:55:18 GMT)
Classical Shadows with Improved Median-of-Means Estimation [0.2] 古典的なシャドウプロトコルは、平均平均値(MoM)推定器を用いて、M$オブザーバブルの期待値を効率的に推定する。
我々はミンスカーが提案した修正MoM推定器について検討した。
本研究は,従来のシャドウプロトコルの性能を最適化するために,特定の測定設定に対する推定器の調整の重要性を強調した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:07:58 GMT)
Semi-decentralized Training of Spatio-Temporal Graph Neural Networks for Traffic Prediction [0.2] スマートモビリティ領域における時空間グラフ時間ニューラルネットワーク(ST-GNN)のための半分散トレーニング手法を探索し,適応する。
センサを複数のクラウドレットに近接してグループ化するシミュレーションフレームワークを実装した。
半分散的なセットアップは、パフォーマンスメトリクスの集中的なアプローチと同等であることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:20:21 GMT)
Domain-Agnostic Stroke Lesion Segmentation Using Physics-Constrained Synthetic Data [0.2] 合成定量的MRI(qMRI)画像を用いた2つの新しい手法を提案し,セグメンテーションモデルの堅牢性と一般化性を高める。
我々は,MPRAGE画像からqMRIマップを推定するために,qMRI推定モデルを訓練した。
2つ目のアプローチは、脳卒中病変のセグメンテーションのための合成データにおいて、組織ラベルのデータセットからqMRIマップを生成する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:52:05 GMT)
Securing RC Based P2P Networks: A Blockchain-based Access Control Framework utilizing Ethereum Smart Contracts for IoT and Web 3.0 [0.1] 本稿では、これらの課題に対処するためにスマートコントラクトを使用するブロックチェーンベースのアクセス制御フレームワークを提案する。
我々のフレームワークは、フレキシブルで透過的で分散化されたセキュリティソリューションを提供することで、既存のアクセス制御システムのギャップを埋めることを目的としています。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 20:56:52 GMT)
Leveraging Visibility Graphs for Enhanced Arrhythmia Classification with Graph Convolutional Networks [0.1] 本研究では,不整脈分類におけるVGとVVGの表現とGCNの併用について検討した。
以上の結果より,VGおよびVVGマッピングによりGCNは前処理やノイズ除去を必要とせず,生ECG信号から直接不整脈を分類できることがわかった。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 00:42:56 GMT)
Yankari: A Monolingual Yoruba Dataset [0.0] Yankariは、Yoruba言語のための大規模なモノリンガルデータセットである。
ヨルバは3000万人以上の人々に話されているにもかかわらず、NLPの研究や応用では非常に過小評価されている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:05:18 GMT)
What and why of entanglement [0.0] ここでは、バングラ(ベンガル)で、絡み合いとなぜそれが興味深いのかについて、簡単な議論を行う。
絡み合いとは何か、なぜ興味深いのか?
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:28:23 GMT)
Visual Error Patterns in Multi-Modal AI: A Statistical Approach [0.0] MLLM(Multi-modal large language model)は、テキストと視覚データの統合に優れるが、曖昧さや不完全な視覚刺激を解釈する際に体系的な課題に直面する。
本研究では3D、回転、顔と面の欠如といった特徴を特徴とする幾何的刺激のデータセットを用いて、統計モデルを用いてこれらの誤差を駆動する要因を分析する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 23:27:34 GMT)
Validity and efficiency of the conformal CUSUM procedure [0.0] 変更検出のためのCUSUMプロシージャのコンフォーマルバージョンの有効性と効率について検討した。
本稿では,CUSUM方式のコンフォメーションバージョンの有効性と有効性について検討する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:52:44 GMT)
Utilizing Machine Learning Models to Predict Acute Kidney Injury in Septic Patients from MIMIC-III Database [0.0] セプシス(Sepsis)は、体が感染に対して正しく反応しない重篤な疾患である。
敗血症患者では、約50%が急性腎障害(AKI)を発症する。
敗血症患者の特徴に基づいてAKIを正確に予測できるモデルは早期発見と介入に不可欠である。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:05:35 GMT)
Usefulness of Quantum Entanglement for Enhancing Precision in Frequency Estimation [0.0] 実験の各ランで使用されるプローブの数が固定された場合,周波数推定の精度の限界に達するための戦略について検討する。
この限界は量子クラム・ラオ境界(QCRB)によって設定され、これは最大絡み合うプローブの使用が独立プローブの使用と比較して推定精度を高めることを予測している。
提案手法は,従来の固定センシング時間戦略よりも,プローブの総数および総センシング時間で推定の不確かさのスケーリングをはるかに向上させることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:23:01 GMT)
Unveiling the Role of Artificial Intelligence and Stock Market Growth in Achieving Carbon Neutrality in the United States: An ARDL Model Analysis [0.0] 本稿では,2021年から2021年までの米国における炭素中性向上における先進技術の役割について検討する。
株式市場の成長、ICT利用、グロース国内総生産(GDP)、人口はSTIRPATモデルを用いてCO2排出量に影響を与える。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:07:04 GMT)
Universal distributed blind quantum computing with solid-state qubits [0.0] ブラインド量子コンピューティングは、分散量子システムの有望な応用である。
分散2ノードネットワーク上で,単一ビットと2ビットのブラインドゲートからなる普遍的な量子ゲートセットを実験的に実証した。
我々は、2ノードネットワークをまたいだ盲点演算による分散アルゴリズムを実行し、分散モジュールアーキテクチャにおける物質量子ビットを用いた盲点量子計算への道を開いた。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:13:46 GMT)
Unified Inductive Logic: From Formal Learning to Statistical Inference to Supervised Learning [0.0] 私は帰納論理に代わるピアセアンを開発します。
私はこれを、形式的学習理論、統計学、そして機械学習の重要な部分である教師あり学習を統一するために使います。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:31:31 GMT)
Transient Dynamics of the Quantum Stuart-Landau Oscillator [0.0] 量子極限サイクルと同期を示す量子系の過渡ダイナミクスについて検討する。
量子相空間におけるコヒーレント状態によって具現化された古典的な挙動を研究する。
We consider the evolution of the Wigner negativity as an indicator of quantumness。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:41:34 GMT)
Towards a Psychology of Machines: Large Language Models Predict Human Memory [0.0] 大規模言語モデル(LLM)は自然言語処理において顕著な能力を示している。
本研究では,LLMが庭道文や文脈情報を含むタスクにおいて,人間の記憶性能を予測できるかどうかを検討する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:01:43 GMT)
The Use of Artificial Intelligence in Military Intelligence: An Experimental Investigation of Added Value in the Analysis Process [0.0] AIが軍のデータ分析をどのように強化できるかは、まだはっきりしていない。
AIデモンストレーターのDeepCOMは、スタートアップのアレフ・アルファと共同で開発された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:56:10 GMT)
The Role of Text-to-Image Models in Advanced Style Transfer Applications: A Case Study with DALL-E 3 [0.0] 本研究はDALL-E 3と従来のニューラルスタイル転送技術の統合について検討する。
その結果,DALL-E 3はスタイリング画像の多様性と芸術的品質を著しく向上させることがわかった。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:41:25 GMT)
The Influence of Experimental Imperfections on Photonic GHZ State Generation [0.0] 我々は,光子損失,多光子項および光子識別性が,確立された核融合プロトコルによる光子3部GHZ状態の生成に及ぼす影響について検討した。
本研究は,不完全性および発生確率に関して,異なる種類の不完全性が支配的であることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:33:30 GMT)
The Dirac Vacuum in Discrete Spacetime [0.0] 我々は、フェルミオンの離散時空モデルにディラック海を導入することを検討する。
負のエネルギー状態を埋めようとすると、我々は問題に遭遇する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:55:50 GMT)
The Diagonal Approximation for Holographic Rényi Entropies [0.0] Dong, Rath と Kudler-Flam は、ホログラフィックシステムの R'enyi entropy $S_alpha$ を計算するための改良された宇宙ブレイン処方薬を提案した。
この処方薬は、すべての極端表面の面積を最初に測定した後、R'enyiエントロピーを計算する対角近似を仮定することによって発見された。
この対角近似を導出し、R'enyiエントロピーを正確に計算し、最大$O(log G)$補正することを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:03:38 GMT)
Tackling Decision Processes with Non-Cumulative Objectives using Reinforcement Learning [0.0] 我々は,非累積マルコフ決定過程を標準MDPに一般化したマッピングを導入する。
これにより、MDPがより大規模なNCMDPに直接適用されるための最適なポリシーを見つけるために開発されたすべての技術が利用可能となる。
我々は、古典的な制御、金融におけるポートフォリオ最適化、離散最適化問題など、様々なタスクのアプリケーションを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:46:04 GMT)
Symmetry protected topological phases under decoherence [0.0] 特に、様々な種類のデコヒーレンスの下で対称性保護トポロジカル位相(SPT)のクラスについて検討する。
本研究では,SPT基底状態からの非自明な位相情報をデコヒーレンスの下でも保持できることを実証する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:13:08 GMT)
Symmetry based efficient simulation of dissipative quantum many-body dynamics in subwavelength quantum emitter arrays [0.0] 順序配列における多数の量子エミッタの散逸ダイナミクスを数値シミュレーションする。
我々は,励起集団,総光子放出率,および2次強度相関関数を特徴付ける。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:13:49 GMT)
Study on quantum thermalization from thermal initial states in a superconducting quantum computer [0.0] 本稿では,熱状態の生成の難しさを間接的に解決するためのプロトコルを提案する。
我々は、IBMの量子デバイスを用いてプロトコルを実験的に検証し、異常なクエンチ緩和の結果を提供する。
この実証は、我々のプロトコルが熱状態物理学を研究するための代替手段を提供することができることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:22:19 GMT)
Strong hole-photon coupling in planar Ge for probing charge degree and strongly-correlated states [0.0] 高周波共振器におけるホール電荷量子ビットとマイクロ波光子との強い結合性を示す。
この研究は、平面Geにおけるリモートホール量子ビット間のコヒーレント量子接続への道を開く。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:23:22 GMT)
State preparation by shallow circuits using feed forward [0.0] 我々は,この4ステップ方式を用いて,フォールトトレラントな計算を行わず,短い,一定の深さの量子回路を強化する。
LAQCC回路は、一定の深さの量子回路では達成できない長距離相互作用を創出できることを示す。
我々は、任意の数の状態に対する一様重ね合わせのための3つの新しい状態準備プロトコルを作成する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:16:26 GMT)
Spontaneous Torque on an Inhomogeneous Chiral Body out of Thermal Equilibrium [0.0] 真空中の不均一体は、その環境と熱平衡がなければ自発的な力を受ける。
通常の(相互に)材料で作られた物体に対して2次に力が発生する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:09:54 GMT)
Speedup of thermodynamic entropy production via quantum dynamical criticality [0.0] エントロピー生成の幾何学的視点を通して, 熱力学への動的臨界点の接続を進展させる。
以上の結果から, 動的臨界がシステムに極めて複雑な力学をもたらすことが示唆され, 熱伝達経路の可能性が示唆された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:11:35 GMT)
Space-time correlations in monitored kinetically constrained discrete-time quantum dynamics [0.0] 我々は,Rydberg量子シミュレータに自然に実装された,運動的に制約された多体量子システムを示す。
非相関な無限温度平均定常状態を特徴とするにもかかわらず、ダイナミクスは高速かつ遅い時空領域の共存を示す。
我々の研究は、量子プロセッサやシミュレータにおける複雑な力学や集合現象を特徴づける手段として、離散時間オープン量子多体システムのための大規模な偏差フレームワークを確立する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:50:55 GMT)
Soft Checksums to Flag Untrustworthy Machine Learning Surrogate Predictions and Application to Atomic Physics Simulations [0.0] 本稿では,科学的機械学習のためのソフトの新しい技術を提案する。
精度のよいしきい値誤差は、IDとOODの予測を効果的に分離できることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:39:01 GMT)
Sinkhorn Algorithm for Sequentially Composed Optimal Transports [0.0] Sinkhornアルゴリズムは最適な輸送のためのデファクト標準近似アルゴリズムである。
本稿では,効率的な近似アルゴリズム,すなわち,逐次的に合成された最適輸送のためのシンクホーンアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:39:45 GMT)
Simultaneous ponderomotive squeezing of light by two mechanical modes in an optomechanical system [0.0] スクイージング光は、SiN膜と光力学的相互作用の波長に対する感度が相対的に低いため、幅広い波長で達成できる。
我々は,複数のメカニカルモードを活用することで,1オクターブ以上の光を1オクターブに拡張できることを実証した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:24:24 GMT)
Sensing and Control of Single Trapped Electrons Above 1 Kelvin [0.0] 超伝導コプラナー導波路共振器を用いて、ヘリウム表面下のゲート電極で定義された電子トラップの電荷状態を読み取る。
分散周波数シフトは、トラップが数十から1つの電子に電子を積んだときに観測される。
この敏感な電荷読み出し方式は、大規模量子プロセッサの開発に役立てることができる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:34:58 GMT)
Self-correcting GKP qubit in a superconducting circuit with an oscillating voltage bias [0.0] 本稿では,散逸誤差を補正した Gottesman-Kitaev-Preskill 量子ビットに対する簡単な回路アーキテクチャを提案する。
大きな駆動振幅の場合、回路はGKP安定化器ハミルトニアンによって効果的に記述される。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:00:01 GMT)
Scaling Inference-Time Search with Vision Value Model for Improved Visual Comprehension [0.0] 視覚価値モデル(VisVM)は、VLM推論時間探索をガイドして、より良い視覚的理解で応答を生成する。
本稿では、VLM推論時間探索をガイドし、視覚的理解を向上した応答を生成するVisVMを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 20:35:07 GMT)
SR+Codec: a Benchmark of Super-Resolution for Video Compression Bitrate Reduction [0.0] 圧縮ビデオのスケールアップのために,スーパーリゾリューションのキャパシティを解析するためのベンチマークを開発した。
我々のデータセットは5つの広く使われている圧縮標準に基づくビデオコーデックを用いていた。
いくつかのSRモデルと圧縮を組み合わせることで、品質を著しく損なうことなく動画を縮小できることがわかった。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:34:13 GMT)
Rules and Meaning in Quantum Mechanics [0.0] 物理学哲学と言語哲学の交点における研究を追求している。
標準的なQMの意味的事実の競合する説明を批判的に分析する。
1) アインシュタインの不完全性論の再構成は局所的、分離的、分類的 QM が存在しないと結論付ける。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:29:11 GMT)
Revisiting Atomic Patterns for Elliptic Curve Scalar Multiplication Revealing Inherent Vulnerability to Simple SCA [0.0] kP操作は、全ての楕円曲線ベースの暗号プロトコルの基本的な操作である。
本研究では,Longaの原子パターンを用いてハードウェアに実装したkPアルゴリズムの抵抗について検討した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:13:04 GMT)
Representation of Classical Data on Quantum Computers [0.0] 量子コンピューティングシステムに使用されるデータを表現することは必須である。
本報告では,ゲート型量子コンピュータ上でのこれらのデータ型表現方法の概要について述べる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:28:30 GMT)
Reducing Optimism Bias in Incomplete Cooperative Games [0.0] 協調ゲームにおける連立価値を明らかにするためのシーケンスの最適化を目的としたフレームワークを提案する。
筆者らのコントリビューションは3つある: (i) 個々のプレイヤーの楽観的な連立価値の達成と、より効率的な最適化を促進するための分析的特性について検討し、 (ii) オフライン・オンライン両方の方法で追加連立価値を開示し、このギャップを最小限に抑える方法、 (iii) 実践シナリオにおけるアルゴリズムの性能を実証的に示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:40:21 GMT)
Quantum thermometry with an optomechanical system [0.0] 光学場と機械共振器からなる光学系を用いた量子温度測定法を提案する。
プローブの量子フィッシャー情報を数値計算する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 20:18:18 GMT)
Quantum thermodynamic cycles in the forward and time-reversed regimes [0.0] 2つの熱貯水池で熱力学サイクルを行うn量子ビットの量子エンジンについて述べる。
我々は、状態の進化を統括する超作用素の性質により、純粋に量子レベルの記述において「極限サイクル」と呼ばれるものが存在することを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:52:05 GMT)
Quantum theory of non-Hermitian optical binding between nanoparticles [0.0] 近年の研究では、光結合による浮遊ナノ粒子間の高調整性非相互結合が示されている。
我々は、散乱したツイーザー光子によって誘起される力とトルクを介して相互作用する小さな誘電体物体の量子論を発展させる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:27:16 GMT)
Quantum control for the Zeno effect with noise [0.0] 量子ゼノ効果(英: quantum Zeno effect)は、量子力学において特徴的な現象であり、頻繁な射影測定が量子系の進化を妨げる非自明な効果を記述するものである。
本研究では、コヒーレント量子制御が、ノイズによって誘導される初期状態に留まる生存確率の低下を緩和する効果について検討する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:32:07 GMT)
Quantum circuit and mapping algorithms for wavepacket dynamics: case study of anharmonic hydrogen bonds in protonated and hydroxide water clusters [0.0] 任意の次元で量子核力学を実行するための基礎となる2つのアルゴリズムを提案する。
1つのアルゴリズムは3つの量子ビットに対して正確であり、実装されるとスピン状態のダイナミクスが核波束の力学をエミュレートする。
他方のアルゴリズムはより堅牢で、回路の複雑さを増大させるコストがかかるため、任意の量子ビットに対して正確である。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 23:01:24 GMT)
Quantum Optical Binding of Nanoscale Particles [0.0] 我々は、光結合の量子論を議論し、量子状態における相互作用のユニークなシグネチャを同定する。
これらのシグネチャは, 浮遊ナノ粒子を用いた近未来の実験で観測可能であることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:42:15 GMT)
Quantum Kernel Machine Learning With Continuous Variables [0.0] 量子カーネルを連続変数量子コンピューティングプラットフォームのための閉形式関数として表現する。
すべての核がガウス函数の積として表現され、特徴写像のパラメータの代数函数として表されることを示す。
我々は、GKP状態符号化のような無限星級数の特徴写像で定義されるカーネルを、有限星級数の特徴写像で定義されるカーネルによって任意に近似することができることを証明した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:31:38 GMT)
Quantum Information in Riemannian Spaces [0.0] 我々はリーマン空間における微分同相不変計算の微分エントロピーの定式化を開発する。
ウィグナーの準確率密度関数を一般化することにより、この定式化を量子レベルにまで拡張する。
一般化された量子エントロピーの不確実性関係を導出し、ビアリニコ・ビラとミセルスキーの不等式を曲線空間に拡張する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:45:05 GMT)
Quantum Correlations in Neutrino and Neutral Meson Oscillations [0.0] オープン量子系と量子情報のアイデアがニュートリノおよび中性中間子振動の様々な面に与える影響について論じる。
ニュートリノの場合、相関はニュートリノの生存と振動確率の産物の単純な関数であることが示されている。
中性中間子の量子相関は、安定な中間子と非自明に異なる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:05:35 GMT)
QCD evolution of entanglement entropy [0.0] エンタングルメントエントロピーは、非摂動的量子色力学を探索するための新しいツールとして登場した。
本研究では, 陽子内における速度依存性エンタングルメントエントロピーとその最終状態ハドロンへの関連について検討する。
解析の結果,QCD進化方程式から得られたフォン・ノイマンエントロピーの速さ依存性と,それに対応するハドロンエントロピーの実験データとの間には強い一致が認められた。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:38:31 GMT)
Propulsion force and heat transfer for nonreciprocal nanoparticles [0.0] 非相反ナノ粒子を含む熱伝達とカシミール力の解析を行った。
2つのナノ粒子の場合、1つの粒子は非相反し、もう1つの粒子は異方的である必要がある。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:57:20 GMT)
Promoting AI Literacy in Higher Education: Evaluating the IEC-V1 Chatbot for Personalized Learning and Educational Equity [0.0] プロプライエタリなシステムなしでも,有用なAIアプリケーションを学習状況に効果的に統合できることが示されている。
その結果,今後の学習者を支援するために,この技術をより深く研究することに関心があることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:33:17 GMT)
Port-Based State Preparation and Applications [0.0] 本稿では,Alice が目標状態の古典的記述を完全保持するテレポーテーションタスクである Port-Based State Preparation (PBSP) を紹介する。
応用として、近似Universal Hybrid Processors (UPHP)を導入する。
ここでの目標は、ユニタリを量子状態としてエンコードすることであり、UPHPはこのユニタリを古典的な記述を知る際に量子状態に適用することができる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:17:30 GMT)
Point-GN: A Non-Parametric Network Using Gaussian Positional Encoding for Point Cloud Classification [0.0] Point-GNは、効率的で正確な3Dポイントクラウド分類のための新しい非パラメトリックネットワークである。
我々は,ModelNet40とScanObjectNNの2つのベンチマークデータセット上でPoint-GNを評価し,それぞれ85.29%と85.89%の分類精度を達成した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:20:51 GMT)
Phases of quartic scalar theories and PT symmetry [0.0] この予想は基底状態エネルギーと励起状態エネルギーの実際の部分に対して真であることを示す。
時空次元ゼロにおける分割関数の類似関係は多くの場合において有効である。
予想が有効である可能性について、高次元時空における単一成分場理論について論じる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:34:12 GMT)
Pay Attention to the Robustness of Chinese Minority Language Models! Syllable-level Textual Adversarial Attack on Tibetan Script [0.0] テキストの敵対的攻撃は、中国の少数言語の情報処理における新たな課題である。
我々はTSAttackerと呼ばれるチベット語音節レベルのブラックボックステキスト対逆攻撃を提案する。
実験結果から,TSAttackerは有効であり,高品質な対向サンプルを生成することがわかった。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:08:45 GMT)
Pauli quantum computing: $I$ as $|0\rangle$ and $X$ as $|1\rangle$ [0.0] パウリ量子コンピューティングという新しい量子コンピューティング形式を提案する。
この形式主義では、密度行列の非対角ブロック上のパウリ基底$I$と$X$を使って情報を符号化する。
パウリ量子コンピューティングにおいて、想像上の時間進化を実現し、安定的な基底状態を作成するためにリンドブラディアンを設計する方法を示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:15:31 GMT)
Patient-specific prediction of glioblastoma growth via reduced order modeling and neural networks [0.0] グリオ芽腫は成人で最も致命的な脳腫瘍の1つである。
本研究では,精度オンコロジーの数学的枠組みに関する概念実証を提案する。
臨床的な意思決定を支援するために、堅牢で効率的な計算パイプラインを構築します。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:46:05 GMT)
Patience Is The Key to Large Language Model Reasoning [0.0] そこで我々は,モデルに患者推論スタイルを採用することを奨励する簡単な方法を提案する。
我々は、肯定的な例として詳細な推論プロセス、否定的な例として単純な回答を生成し、その結果、その反応の完全性を支持するようにモデルを訓練する。
この結果から,軽量データセット上でのトレーニングにより,GSM8kのパフォーマンスは最大2.1%向上した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 07:22:45 GMT)
PERL: Pinyin Enhanced Rephrasing Language Model for Chinese ASR N-best Error Correction [0.0] N-best 修正シナリオに特化して設計された Pinyin Enhanced Rephrasing Language Model (PERL) を提案する。
Aishell-1データセットと新たに提案したDoADデータセットについて実験を行った。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:28:52 GMT)
Numerical Study of Disordered Noninteracting Chains Coupled to a Local Lindblad Bath [0.0] 障害は多体量子系が熱平衡に達するのを防ぎ、多体局在相をもたらす。
近年の研究では、低障害の稀な領域によって引き起こされる非摂動効果が局所的な位相を不安定化する可能性が示唆されている。
ここでは, 境界付近のリンドブラッド浴に結合した非相互作用不規則スピン鎖の数値解析を行った。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:31:03 GMT)
Null device-independent prepare-and-prepare bipartite dimension test with a single joint measurement [0.0] 両部測定と2つの異なるパーティからの入力をヌル証人に基づくデバイス非依存の次元性テストを提案する。
その結果、両部測定のキュービット空間との相違を検出することができるテストの極端精度が示された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:37:09 GMT)
Nonlocality of Deep Thermalization [0.0] 深部熱化管理におけるグローバルシステムトポロジの役割について検討する。
深部熱化は、周期的または開境界条件のいずれかの存在下で指数関数的に迅速に達成される。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:34:04 GMT)
Noninvertible Symmetry-Resolved Affleck-Ludwig-Cardy Formula and Entanglement Entropy from the Boundary Tube Algebra [0.0] 1+1d共形場理論に対する Affleck-Ludwig-Cardy 公式の洗練されたバージョンを導出する。
これを用いて、単区間の非可逆対称性分解エントロピーに対する普遍的先行および部分誘導的寄与を決定する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 20:23:22 GMT)
Negative refraction of light in an atomic medium [0.0] 我々は, 人工メタマテリアルを使わずに, 原子媒体中での光の負の屈折を示す。
高透過性負屈折は、異なるレベル構造と格子定数の原子配列で達成される。
また, この現象は格子欠陥に対して頑健であり, サブラジオアンスにより著しく向上できることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:34:17 GMT)
NBM: an Open Dataset for the Acoustic Monitoring of Nocturnal Migratory Birds in Europe [0.0] この研究は、西太平洋の117種から13,359種の注釈付き発声を収集した夜行性鳥類移動データセットを提示する。
このデータセットには正確な時間と頻度のアノテーションが含まれており、フランス全土の何十人もの鳥愛好家によって集められている。
データセットの45の主種に対する認識モデルの精度は、はるかに大きなデータセットでトレーニングされた最先端のシステムと競合することを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:55:45 GMT)
Multimodal Sentiment Analysis Based on BERT and ResNet [0.0] BERTとResNetを組み合わせたマルチモーダル感情分析フレームワークが提案されている。
BERTは自然言語処理において強いテキスト表現能力を示しており、ResNetはコンピュータビジョンの分野で優れた画像特徴抽出性能を有している。
パブリックデータセットMAVA-singleの実験結果によると、BERTやResNetのみを使用するシングルモーダルモデルと比較して、提案されたマルチモーダルモデルは精度とF1スコアを改善し、74.5%の精度に達した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:55:20 GMT)
Mapping The Layers of The Ocean Floor With a Convolutional Neural Network [0.0] 既存の解法は、複雑で計算コストのかかる地震探査法や波動インバージョンを通したマッピングを含む。
海底から反射した地震写真に基づいて速度モデルを予測するための人工ニューラルネットワーク、特にUNetの導入は、このプロセスの最適化を約束している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:26:48 GMT)
Local Lesion Generation is Effective for Capsule Endoscopy Image Data Augmentation in a Limited Data Setting [0.0] そこで我々は, 局所病変生成手法を2つ提案し, 小型医用画像データセットの増大に対処する。
最初のアプローチでは、古典的な画像処理技術であるPoisson Image Editingアルゴリズムを使用して、リアルな画像合成を生成する。
第2のアプローチでは、微調整されたイメージインペインティングGANを利用して、現実的な病変を合成する新しい生成手法を導入している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:52:25 GMT)
Large spin measurements in an arbitrary two-qudit state [0.0] バイパルタイト量子状態によるCHSH不等式の振動は、現在では多くの量子応用で使われている。
スピン=s$相関行列の概念を導入し、すべての$dgeq2$に対して次元が 3,times3$ となる。
より高い絡み合いを持つ純粋な2量子状態の場合、CHSH期待値の最大値は、より低い絡み合いを持つ純粋な2量子状態よりも小さいことが判明した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:57:40 GMT)
LLMs Do Not Think Step-by-step In Implicit Reasoning [0.0] チェーン・オブ・ソートは複雑なタスクにおけるLCMの性能を著しく向上させることができる。
多くの研究は、中間ステップを明示的に生成するLLMを必要としない暗黙のCoTの使用を試みた。
本研究では,暗黙的にCoTを行う場合,モデルが隠蔽状態から中間段階の情報を探索する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 05:52:03 GMT)
LLM-Twin: A Generated-Persona Approach for Survey Pre-Testing [0.0] 統計的分布と個別意思決定パターンの両方を再現できるかどうかを検討する。
LLM-Twinが生成した回答と実際の個人調査の回答を比較することで、個々のレベルの結果の複製におけるその効果を評価する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:39:56 GMT)
Integrating Generative AI into Art Therapy: A Technical Showcase [0.0] 実証されたテキスト・ツー・イメージモデルを活用することで,アート・セラピーを補完する新しい技術設計を導入する。
結果として得られるAIベースのツールは、患者が自分の創造性を洗練し、カスタマイズし、新しい表現とアクセシビリティーの道を開くことを可能にする。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:58:55 GMT)
Integrated InP-based transmitter for Continuous-Variable Quantum Key Distribution [0.0] 本研究では,連続可変(CV)QKD用PIC送信機の設計,製造,特性評価を行う。
CV-QKDシステムをモノリシックプラットフォームに統合するInP技術の可能性を示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 10:46:41 GMT)
Insomnia Identification via Electroencephalography [0.0] 全世界で推定5000万人が不眠症に罹患していると考えられている。
本研究では、深層学習を用いて不眠症患者を自動的に識別する手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 06:36:28 GMT)
Improving Perturbation Theory with the Sum-of-Squares: Third Order [0.0] 摂動理論に対するウィグナーの2n+1$ルールの類似である一般的な方法を与え、与えられた2乗和のアンザッツにおける誤差の順序を計算する。
また、摂動的アンサッツと自己整合性法を組み合わせて、双対半定値プログラムの解を求める方法を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:56:44 GMT)
Impact of the exciton fine structure splitting and measurement orientations on the robustness of cryptographic keys generated via the quantum protocol E91 [0.0] 本研究は、E91量子鍵分配プロトコルの性能を2つの要素の変動下で評価することに焦点を当てる。
実験した位相と角度の関数として,プロトコルの秘密鍵レートとベルのパラメータの解析式を得る。
以上の結果から, 量子伝送の性能は, 励起子の寿命と量子ドットの微細構造分裂の間の生成物に大きく影響していることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:46:45 GMT)
Impact of the Hawking Effect on the Fully Entangled Fraction of Three-qubit States in Schwarzschild Spacetime [0.0] 我々は、ブラックホールのホーキング効果がシュワルツシルト時空のFEFを減少させ、増大させることを示した。
この結果から,ホーキング効果の影響下での多粒子系における量子テレポーテーションの考察が得られた。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 00:37:30 GMT)
Identifiable Representation and Model Learning for Latent Dynamic Systems [0.0] 本稿では,潜在力学系における表現とモデル学習の問題について検討する。
線形およびアフィン非線形潜時力学系にスパース入力行列を持つ場合、潜時変数をスケーリングまで同定できることを証明した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:14:15 GMT)
Human Variability vs. Machine Consistency: A Linguistic Analysis of Texts Generated by Humans and Large Language Models [0.0] 人文テキストと大言語モデル(LLM)で生成されたテキストとの有意な差異を同定する。
以上の結果から,人間は認知的要求の少ない文章を書けること,意味的内容の充実,感情的内容の充実などが示唆された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:38:35 GMT)
High-resolution, Wide-frequency-range Magnetic Spectroscopy with Solid-state Spin Ensembles [0.0] 我々は、高密度NVアンサンブルにおける量子周波数混合(QFM)効果とコヒーレント平均同期読み出し(CASR)を融合した高分解能磁気分光プロトコルを実験的に実証した。
我々は、このQFM-CASRプロトコルの感度を10$,$MHz から 4$,$GHz の周波数範囲で評価する。
狭帯域磁気分光のための最先端のNVダイアモンド技術と比較して、QFM-CASRプロトコルは検出可能な周波数範囲を大幅に拡張する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 21:44:37 GMT)
Harnessing Loss Decomposition for Long-Horizon Wave Predictions via Deep Neural Networks [0.0] 本稿では,損失を分離した位相成分と振幅成分に分解する新しい損失分解戦略を提案する。
この手法は、数値誤差を明示的に考慮し、波動伝播タスクにおけるニューラルネットワークの長期予測精度を向上させる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 00:27:54 GMT)
Hands-On Quantum: Teaching Core Quantum Concepts With Bloch Cubes [0.0] Bloch Cubeは、方程式なしで鍵となる量子概念を表現できる、ハンズオンの教育ツールだ。
ブロックキューブが量子測定、量子力学、純状態対混合状態、量子デコヒーレンスといった概念を教えるためにどのように使えるかを示すビデオが作成されている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 03:49:04 GMT)
Hamiltonian-based neural networks for systems under nonholonomic constraints [0.0] 非ホロノミック制約下でハミルトニアン系をモデル化できる改良型ハミルトニアンニューラルネットワークアーキテクチャを開発した。
システムのハミルトニアン,制約,および関連する乗算器を同時に学習するために,3ネットワーク並列アーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:08:51 GMT)
Grounded Language Design for Lightweight Diagramming for Formal Methods [0.0] 軽量なダイアグラム作成のための重要なドメイン情報をキャプチャする言語を開発する。
軽量なダイアグラムの重要な要素を小さなプリミティブのセットに蒸留する。
生成した図の有効性を評価し,推論に適していることを確認した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:37:59 GMT)
Graph Pooling by Local Cluster Selection [0.0] グラフプーリング(Graph pooling)は、グラフを入力として、縮小グラフを出力として生成する操作のファミリーである。
現代のグラフプーリング法は訓練可能であり、一般にグラフニューラルネットワーク(GNN)アーキテクチャに(ディープ)処理パイプラインに沿ったグラフ縮小演算子として挿入される。
本研究では,ノード中心のグラフプーリング演算子とともに,グラフをプールする新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 08:44:10 GMT)
Generalized coherent states for the harmonic oscillator by the J-matrix method with an extension to the Morse potential [0.0] 複素平面 C の点 z でラベル付けされたペレロモフ型の一般化コヒーレント状態 (GCS) の集合を、正の整数数 m に依存する。
我々はこの手順をモース発振器に拡張し、グラウバー型GCSを新たに構築する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 02:09:36 GMT)
Gaussian Processes for Probabilistic Estimates of Earthquake Ground Shaking: A 1-D Proof-of-Concept [0.0] 地球における地震波速度の推定値は、地動予測のための地震シミュレーションの重要な入力パラメータである。
本稿では,既存地震波速度モデルの不整合に起因する不確実性を考慮した概念実証について述べる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:16:57 GMT)
Gauge fields induced by curved spacetime on a lattice [0.0] 私は、周期的時空測度におけるディラックフェルミオン、ゲージ場における非相対論的フェルミオン、格子上の周期的スカラー場におけるディラックフェルミオンの間の拡張双対性(有理性)を発見した。
これは、格子上の時空測度、ゲージ場、スカラー場の間の予期せぬ等価性を示している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:00:01 GMT)
Frequency conversion in a hydrogen-filled hollow-core fiber using continuous-wave fields [0.0] 水素充填反共振中空コアファイバの偏光保存周波数変換について検討した。
このアプローチは光ファイバーネットワークへのシームレスな統合と単一エミッタへのインタフェースを約束する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:11:07 GMT)
Free-space model for a balloon-based quantum network [0.0] 長距離通信は、量子通信ネットワークの発展における主要なボトルネックの1つである。
衛星ノードは、現在、自由空間通信のために研究されている主要なデバイスであるが、高コストや低可用性といった欠点がある。
我々は,気球が,国立ネットワークアーキテクチャにおける自由空間通信のための衛星の現実的な代替手段であることを実証した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 14:39:56 GMT)
Free-Space Optical Modulation of Free Electrons in the Continuous-Wave Regime [0.0] 自由電子と光学場のコヒーレント相互作用は自由電子圧縮を生み出す。
本稿では, 材料構造による光散乱を伴わずに, 連続電子ビームの時間的大圧縮を実現するための実用的手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:49:03 GMT)
FlashAttention on a Napkin: A Diagrammatic Approach to Deep Learning IO-Awareness [0.0] FlashAttentionのようなメソッドは、不要なデータ転送を避けることによって、ネイティブのPyTorchよりもx6パフォーマンスの向上を実現している。
本稿では,学習モデルに対するダイアグラム的アプローチを提案する。
AmpereはSMあたり13個のワープに収まるが、Hopperはオーバーラップを改善し、1.22個のPFLOPを達成できる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 13:52:04 GMT)
Few-fermion resonant tunneling and underbarrier trapping in asymmetric potentials [0.0] 非対称な外部ポテンシャル下での格子中の少数フェルミオン系のトンネル力学について検討する。
この結果は, ダイオードやメムリスタなどの配向輸送特性を有するナノスケールデバイスの設計に応用できる。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:36:07 GMT)
Fast and Tunable Decoherence-Free Subspace Engineering [0.0] 本研究では,消散性原子空洞系における時間依存デコヒーレンスフリー部分空間(DFS)の設計と制御手法を提案する。
これらのスキームは3つの内部エネルギーレベルを持つ原子を使用し、DFSを多次元にすることができる。
我々は、外部駆動レーザーを用いて、系をコヒーレントスピン状態から高縮退DFSへ転送する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 00:14:18 GMT)
FANAL -- Financial Activity News Alerting Language Modeling Framework [0.0] FANAL(Financial Activity News Alerting Language Modeling Framework)は、リアルタイムの金融イベントの検出と分析のために開発されたBERTベースのフレームワークである。
GPT-4o, Llama-3.1 8B, Phi-3を含む主要言語モデルに対してFANALの性能を評価する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:15:41 GMT)
Exploring the Role of AI-Powered Chatbots for Teens and Young Adults with ASD or Social Anxiety [0.0] 高機能自閉症スペクトラム障害の人は、他の人口統計学の個人が単に自分達ではないようなナビゲーションの課題に直面していることが多い。
本稿では,これらの問合せに対処し,今後の議論への洞察を提供する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:10:58 GMT)
Exploring Machine Learning Models for Lung Cancer Level Classification: A comparative ML Approach [0.0] 本稿では,肺がんレベルを分類する機械学習(ML)モデルについて検討する。
オーバーフィッティングを減らし、パフォーマンスを最適化するために、最小の児童体重と学習率モニタリングを使用します。
投票やバッグングを含むアンサンブル手法も、予測精度と堅牢性を高めることを約束している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 04:18:32 GMT)
Exploration of Parameter Spaces Assisted by Machine Learning [0.0] 本稿では、回帰と分類による機械学習モデルによる2つのサンプリング手順を示す。
主な目的は、関心のある領域内の可能性のある点を提案するためにニューラルネットワークを使用することで、計算にかかる時間の評価回数を減らすことである。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:45:26 GMT)
Entanglement asymmetry in periodically driven quantum systems [0.0] 周期的に駆動される量子系における絡み合い非対称性のダイナミクスについて研究する。
我々は、周期的に駆動されるXY鎖を駆動可積分量子系のモデルとして使用する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:00:01 GMT)
Electrically controlled laser generation in a photonic crystal - liquid crystal - metal microcavity [0.0] このアプローチは、印加電圧による液晶構造の変化を考慮に入れている。
レーザー力学は、色素分極、人口密度、電磁場を結合した非線形微分方程式によって記述される。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:44:37 GMT)
Efficiency of neural quantum states in light of the quantum geometric tensor [0.0] ニューラル量子状態 (NQS) ans" はモンテカルロの変分アルゴリズムにおいて有望であることが示されている。
本研究では,スピン1双正弦波鎖の異なる相における基底状態を表現するための浅部ニューラルネットワークの効率について検討した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:39:47 GMT)
Directly measured squeeze factors over GHz bandwidth from monolithic ppKTP resonators [0.0] 実験室で構築した2つの平衡ホモダイン検出器とギガヘルツ帯域で測定したモノリシック偏極KTP(ppKTP)共振器の圧縮係数について述べる。
量子相関の直接測定は、一方のデバイス非依存QKDの鍵レートを増大させるのに適している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:16:06 GMT)
Detecting abnormal heart sound using mobile phones and on-device IConNet [0.0] 本稿では、携帯電話とオンデバイス推論に最適化された軽量ニューラルネットワークを利用して、異常な心臓音検出のためのユーザフレンドリーなソリューションを提案する。
解釈可能な畳み込みニューラルネットワークであるIConNetは、音声信号処理からの洞察を活用し、効率を向上し、生波形信号からニューラルネットワークを抽出する透明性を提供する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:18:21 GMT)
Deep Operator BSDE: a Numerical Scheme to Approximate the Solution Operators [0.0] 逆微分方程式(BSDE)によって与えられる解演算子を近似する数値計算法を提案する。
主な材料はウィナーカオス分解とBSDEの古典的オイラースキームである。
非常に穏やかな仮定の下でこのスキームの収束を示し、より制限的な場合の収束率を示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 15:36:20 GMT)
Decoherence due to the Casimir effect? [0.0] 本研究は, システム-環境相互作用の急激な切替により, 過去の研究で見いだされたデコヒーレンスが原因であることが示唆された。
この研究は、セットアップの重要な理論的側面を論じ、外部または画像電位によって誘導されるブレムシュトラルングによってコヒーレンスが失われる可能性があるが、プレート間の量子真空変動が単に存在するため、失われることができないことを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:30:37 GMT)
Data quality dimensions for fair AI [0.0] 我々は、データ品質の次元の観点から、AIシステムにおけるバイアスの問題を考察する。
我々は、精度戦略に基づくバイアス軽減ツールの限定モデル構築について強調する。
本稿では, 完全性, 一貫性, タイムライン, 信頼性の観点から, 分類タスクの公平性を再考する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:54:03 GMT)
Data Fusion of Semantic and Depth Information in the Context of Object Detection [0.0] 開始v2の領域ベース畳み込みニューラルネットワーク(R-CNN)を利用する。
コンピュータビジョンアルゴリズムのカットエッジ技術を用いて、関心領域の3D参照ポイントを生成する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 17:26:30 GMT)
Critical behavior of the Schwinger model via gauge-invariant VUMPS [0.0] 変分一様行列積状態(VUMPS)アルゴリズムとゲージ不変行列積 ansatz を組み合わせた格子シュウィンガーモデルについて検討した。
同時臨界・極限連続体におけるスケーリングを解析し、データの崩壊が顕著な精度でIsingクラスと一致していることを確認する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 18:59:18 GMT)
Chain-structured neural architecture search for financial time series forecasting [0.0] ニューラルネットワークを特定のタスクとデータセットに自動的に最適化する手段として、ニューラルネットワーク検索(NAS)が登場した。
画像や自然言語のNASに関する研究は多いが、時系列データに関する同様の研究は乏しい。
連鎖構造探索空間における3つの一般的な戦略(ベイズ最適化,ハイパーバンド法,強化学習学習)を比較した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:58:41 GMT)
Censorship of Quantum Resources in Quantum Networks [0.0] 我々は、悪意のあるユーザーを検閲違反から排除する要件について検討する。
このプロトコルは、想像力と絡み合いの破壊不可能な検閲を確立することができるが、量子不協和やベル非局所性に対してそのような検閲を行うことはできない。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 12:32:05 GMT)
COVID-19 Probability Prediction Using Machine Learning: An Infectious Approach [0.0] 本研究は、新型コロナウイルス感染確率を予測するための高度な機械学習(ML)技術の適用について検討する。
我々はXGBoost, LGBM, AdaBoost, Logistic Regression, Decision Tree, RandomForest, CatBoost, KNN, Deep Neural Networks (DNN) などのMLモデルの有効性について厳密な調査を行った。
以上の結果から,Deep Neural Networks (DNN) が最高性能モデルとして登場し,精度が向上し,リコール指標が得られた。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 01:20:16 GMT)
Automatic detection of diseases in Spanish clinical notes combining medical language models and ontologies [0.0] 医療用語と組み合わせた大きなモデルを用いて、最初の予約またはフォローアップ医療報告から、人が苦しむ可能性のある病理を予測します。
その結果,病理のタイプ,重症度,位置をモデルに教えるとともに,これらの3つの特徴をどの順番で学ばなければならないかが,精度を著しく向上させることがわかった。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 09:57:57 GMT)
Automatic Image Annotation (AIA) of AlmondNet-20 Method for Almond Detection by Improved CNN-based Model [0.0] 本稿では,アーモンドとその殻の分解過程の向上を目的とした,革新的な方法論を提案する。
最先端のDeep Convolutional Neural Networks(CNN)、特にAlmondNet-20アーキテクチャを活用して、これまでにない精度で99%以上を達成している。
本モデルでは,1000エポック以上の微妙な訓練を行った結果,99%の精度,0.0567の最小損失関数が得られた。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 23:50:05 GMT)
Assessing Foundation Models' Transferability to Physiological Signals in Precision Medicine [0.0] この研究は、基礎モデルの医療的文脈における伝達能力を評価するための体系的なパイプラインを導入している。
まず、生理シミュレーションソフトウェアを利用して、多様な臨床的シナリオを生成する。
第2に、パイプラインは基礎モデルを通してこれらのシミュレートされた信号を投影し、埋め込みを取得し、線形手法を用いて評価する。
第3に、パイプラインは特定の下流医療タスクを通じてこれらの表現を検証する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 16:17:09 GMT)
Assessing Changes in Thinking about Troubleshooting in Physical Computing: A Clinical Interview Protocol with Failure Artifacts Scenarios [0.0] 本研究の目的は,高校生の物理コンピューティング活動におけるトラブルシューティングの過程に関する説明において,障害アーティファクトシナリオを用いた臨床面接プロトコルがどのような変化を捉えることができるかを検討することである。
我々は「欠陥のあるアーティファクトシナリオ」クリニカルインタビュープロトコルを開発し、試験した。ユースにはビデオ通話よりもバグの多い物理コンピューティングプロジェクトがあり、実際のプロジェクトやコードにアクセスせずに修正する方法を提案された。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:48:56 GMT)
An Effective Framework to Help Large Language Models Handle Numeric-involved Long-context Tasks [0.0] 大きな言語モデル(LLM)は、長いテキストを扱う際、顕著な能力を示した。
長文の数値計算では,その性能は著しく低下する。
本稿では,数値型長文タスクを4つの低レベルサブタスクに分解するワークフローを提案する。
2つの数値付き長期コンテキストベンチマークの結果は、ワークフローが精度を向上できるだけでなく、API呼び出しのコストを大幅に削減できることを示している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 05:54:43 GMT)
A solvable model for strongly interacting nonequilibrium excitons [0.0] 本研究は,全ホッピングと非コヒーレントポンプおよび崩壊を考慮したBose-Hubbardモデルについて検討する。
我々はリンドブラッドジャンプ作用素を導出し、ある極限において、系が定常密度行列に対して閉形式表現を持つことを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 19:00:00 GMT)
A many-particle bosonic quantum Maxwell demon [0.0] 2つの同じ熱光線からなる多粒子フォトニック装置で量子デーモンを初めて実験的に実現したことを報告した。
単光子測定とフィードフォワード演算を組み合わせることで、エネルギー変動よりも高速に1本のビームの平均エネルギーを決定的に増大させることができることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 11:42:48 GMT)
A Semidefinite Programming-Based Branch-and-Cut Algorithm for Biclustering [0.0] 本稿では,二クラスタリング問題に対する分枝切断アルゴリズムを提案する。
提案アルゴリズムは汎用的な解法よりも20倍大きな解法を解くことができることを示す。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:36:32 GMT)
A Model-Constrained Discontinuous Galerkin Network (DGNet) for Compressible Euler Equations with Out-of-Distribution Generalization [0.0] 本稿では,モデル制約付き不連続なGalerkin Network (DGNet) アプローチを提案する。
DGNetの中核は、いくつかの重要な戦略のシナジーである。
1次元および2次元圧縮可能なオイラー方程式問題に対する包括的数値計算結果を提案する。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 21:54:56 GMT)
A Hybrid Deep-Learning Model for El Niño Southern Oscillation in the Low-Data Regime [0.0] エルニーニョ南部振動(en:El Nino Southern Oscillation,ENSO)予測は1年間前倒しできる。
ディープラーニングモデルは、何千年ものトレーニングデータを提供する気候モデルシミュレーションに基づいて、主にトレーニングされている。
これにより、LIMのモデストデータと、LIMのディープラーニング非マルコフ補正を組み合わせたハイブリッドなアプローチが実現される。
O(100 yr)データセットの場合、得られたHybridモデルはLIMよりも熟練しているが、完全なディープラーニングモデルのスキルを超えている。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 22:23:17 GMT)
A Contemporary Overview: Trends and Applications of Large Language Models on Mobile Devices [0.0] 大きな言語モデル(LLM)は、より自然でパーソナライズされたユーザーエクスペリエンスを提供する。
モバイルデバイスへのデプロイメントは、インテリジェントデバイス分野において、徐々に重要なトレンドになりつつある。
LLMは、音声アシスタント、リアルタイム翻訳、インテリジェントレコメンデーションなどの応用において、大きな可能性を実証している。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 23:25:03 GMT)
A Benchmark for Math Misconceptions: Bridging Gaps in Middle School Algebra with AI-Supported Instruction [0.0] 本研究では,中学代数学が人工知能ベースの教育プラットフォームで使用されるための評価ベンチマークを紹介する。
データセットは、代数、一般的な誤り、220の診断例に関する55の誤解を含む。
5人の教育者のうち4人は、学生の誤解の診断や教師の訓練にAIでデータセットを使用することに関心を示した。
論文参考訳(メタデータ) (Wed, 04 Dec 2024 23:10:29 GMT)