Altogether: Image Captioning via Re-aligning Alt-text [118.3] 画像に関連付けられた既存のalt-textを編集・修正する鍵となるアイデアに基づいて、Altogetherの原理的なアプローチについて検討する。
トレーニングデータを生成するために、アノテータは既存のalt-textから始まり、それを複数のラウンドで画像コンテンツにアライメントする。
我々は、このデータに基づいて、大規模にアルトテキストを再調整するプロセスを一般化するキャプタを訓練する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:26:45 GMT)
A Comprehensive Survey on Test-Time Adaptation under Distribution Shifts [117.7] テスト時間適応(TTA)は、事前訓練されたモデルをテスト中に、予測する前にラベルのないデータに適応する可能性がある。
TTAはテスト時間領域適応、テスト時間バッチ適応、オンラインテスト時間適応といったテストデータの形態に基づいて、いくつかの異なるグループに分類される。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:06:56 GMT)
Liquid: Language Models are Scalable Multi-modal Generators [112.7] Liquidは視覚的理解と生成をシームレスに統合する自動回帰生成パラダイムである。
従来のマルチモーダルな大言語モデル(MLLM)とは異なり、Liquidは単一の大言語モデルを用いてこの統合を実現する。
初めてLiquidは、ビジュアルタスクと言語タスクの統一トレーニングによって必然的にパフォーマンスが低下する、スケーリングの法則を明らかにした。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:08:56 GMT)
LiftImage3D: Lifting Any Single Image to 3D Gaussians with Video Generation Priors [107.8] シングルイメージの3D再構成は、コンピュータビジョンの根本的な課題である。
遅延ビデオ拡散モデルの最近の進歩は、大規模ビデオデータから学ぶ有望な3D事前情報を提供する。
本稿では,LVDMの生成先行情報を効果的にリリースするフレームワークであるLiftImage3Dを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:58:42 GMT)
InternLM-XComposer2.5-OmniLive: A Comprehensive Multimodal System for Long-term Streaming Video and Audio Interactions [104.9] 本研究は,ストリーミング映像とオーディオ入力とのリアルタイムインタラクションを実現するために,非絡み合いのストリーミング知覚,推論,メモリ機構を導入している。
このプロジェクトは人間のような認知をシミュレートし、多モーダルな大規模言語モデルが時間とともに継続的かつ適応的なサービスを提供できるようにする。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:58:30 GMT)
ViUniT: Visual Unit Tests for More Robust Visual Programming [104.6] モデルが正しく答えると、不正なプログラムを33%生成します。
自動単体テストを生成することで、視覚プログラムの信頼性を向上させるためのフレームワークであるVisual Unit Testing (ViUniT)を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:36:18 GMT)
Logic Query of Thoughts: Guiding Large Language Models to Answer Complex Logic Queries with Knowledge Graphs [102.4] LGOT(Logic-Query-of-Thoughts)は知識グラフ推論と大規模言語モデルを組み合わせた最初の方法である。
実験の結果,ChatGPTよりも20%向上した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:17:01 GMT)
Capturing the Temporal Dependence of Training Data Influence [100.9] 我々は、訓練中にデータポイントを除去する影響を定量化する、軌跡特異的な離脱の影響の概念を定式化する。
軌道固有LOOの効率的な近似を可能にする新しい手法であるデータ値埋め込みを提案する。
データバリューの埋め込みは、トレーニングデータの順序付けをキャプチャするので、モデルトレーニングのダイナミクスに関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:28:55 GMT)
OLA-VLM: Elevating Visual Perception in Multimodal LLMs with Auxiliary Embedding Distillation [95.8] 現代のMLLMを開発するための標準的な慣行は、視覚エンコーダ(s)からLLMに特徴を供給し、自然言語を監督する訓練を行うことである。
目的とする視覚表現の集合からLLMの隠れ表現に知識を抽出する最初の手法であるOLA-VLMを提案する。
OLA-VLMは様々なベンチマークで平均マージンを2.5%向上させ,CV-BenchのDepthタスクでは8.7%向上した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:55:18 GMT)
Towards Long-Horizon Vision-Language Navigation: Platform, Benchmark and Method [94.7] Long-Horizon Vision-Language Navigation (LH-VLN)は、連続したサブタスク間の長期計画と意思決定の一貫性を強調する新しいVLNタスクである。
我々のプラットフォーム、ベンチマーク、メソッドは、ロバストなデータ生成パイプライン、包括的なモデル評価データセット、合理的なメトリクス、新しいVLNモデルでLH-VLNを供給する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:08:13 GMT)
Imitate, Explore, and Self-Improve: A Reproduction Report on Slow-thinking Reasoning Systems [92.9] o1のような推論システムは、複雑な推論タスクを解く際、顕著な能力を示した。
本報告では,o1ライクな推論システムの実装に関する再生レポートについて述べる。
我々は、推論モデルをトレーニングするための主要な技術的アプローチとして、"類似、探索、自己改善"フレームワークを導入します。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:20:36 GMT)
Explore Theory of Mind: Program-guided adversarial data generation for theory of mind reasoning [88.7] 本研究では,多様で挑戦的な心的データ理論を大規模に生成するための最初のフレームワークであるExploreToMを紹介する。
我々のアプローチは、A*検索をカスタムドメイン特化言語に利用して、複雑なストーリ構造と、新しく、多様だが、もっともらしいシナリオを生成します。
評価の結果,Llama-3.1-70B や GPT-4o などの最先端 LLM はExploreToM 生成データに対して0%,9% の精度を示した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 21:29:00 GMT)
T-SVG: Text-Driven Stereoscopic Video Generation [87.6] 本稿では,テキスト駆動ステレオビデオ生成(T-SVG)システムを紹介する。
テキストプロンプトを使用してビデオ生成を合理化し、参照ビデオを作成する。
これらのビデオは、3Dポイントのクラウドシーケンスに変換され、微妙なパララックス差のある2つの視点からレンダリングされる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:48:46 GMT)
CoDeF: Content Deformation Fields for Temporally Consistent Video Processing [86.3] CoDeFは、標準コンテンツフィールドと時間変形フィールドからなる新しいタイプのビデオ表現である。
実験により,CoDeFは,映像から映像への変換とキーポイント検出をキーポイントトラッキングに,トレーニングなしで持ち上げることができることを示した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:08:32 GMT)
DrivingRecon: Large 4D Gaussian Reconstruction Model For Autonomous Driving [83.3] 光リアルな4次元ストリートシーンの再構築は、自動運転における実環境シミュレータの開発に不可欠である。
本稿では,汎用的な運転シーン再構築モデルであるLarge 4D Gaussian Reconstruction Model (DrivingRecon)を紹介する。
ドライビングレコンは既存の手法に比べてシーンの再現性や新しいビュー合成を著しく向上させる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:10:31 GMT)
GARLIC: GPT-Augmented Reinforcement Learning with Intelligent Control for Vehicle Dispatching [81.8] GARLIC: GPT拡張強化学習のフレームワーク。
本稿では,GPT強化強化学習とインテリジェント制御のフレームワークであるGARLICについて紹介する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:05:45 GMT)
A Graph-Based Synthetic Data Pipeline for Scaling High-Quality Reasoning Instructions [80.6] グラフベースのSynthetic Data Pipeline(GSDP)は、高品質な推論データ合成のための経済的かつスケーラブルなフレームワークである。
オープンソースモデルが主導するGSDPは、GPT-4-0613に匹敵する合成品質を達成しつつ、100ドル安いコストを維持できる。
最も困難な数学的推論課題に取り組むために,161万組以上の数学問題と解からなるGSDP-MATHデータセットを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:52:25 GMT)
Representing Long Volumetric Video with Temporal Gaussian Hierarchy [80.5] 本稿では,多視点RGBビデオから長いボリューム映像を再構成することの課題を解決することを目的とする。
本稿では,テンポラルガウス階層(Temporal Gaussian Hierarchy)と呼ばれる新しい4次元表現を提案する。
この研究は、最先端のレンダリング品質を維持しながら、ボリュームビデオデータの分を効率的に処理できる最初のアプローチである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:34 GMT)
Mojito: Motion Trajectory and Intensity Control for Video Generation [79.9] 本稿では、テキストからビデオ生成のための textbfMotion tratextbfjectory と textbfintensitextbfty contrtextbfol を組み合わせた拡散モデルであるMojitoを紹介する。
Mo Mojitoは、動画から生成された光学式フローマップを使って、さまざまなモーションインテンシティーをガイドする、方向運動制御モジュールとモーションインテンシティ・モジュレータを備えている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:26:43 GMT)
SnapGen: Taming High-Resolution Text-to-Image Models for Mobile Devices with Efficient Architectures and Training [77.7] T2I(Text-to-image)モデルは、大きなモデルサイズ、遅い、低品質なモバイルデバイス生成など、いくつかの制限に直面している。
本稿では,モバイルプラットフォーム上で高解像度かつ高画質な画像を生成する,超小型かつ高速なT2Iモデルを開発することを目的とする。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:53 GMT)
Benchmarking Large Vision-Language Models via Directed Scene Graph for Comprehensive Image Captioning [77.3] 本稿では、シーングラフビューから視覚的コンテキストを評価するために、CompreCapと呼ばれる詳細なキャプションベンチマークを導入する。
画像は、まず、共通オブジェクトの語彙に従って意味的に意味のある領域に手動で分割し、また、これらすべての領域内のオブジェクトの属性を識別する。
そして、これらのオブジェクトの方向関係ラベルに注釈を付け、画像のリッチな構成情報を十分にエンコードできる方向のシーングラフを構成する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:33:36 GMT)
Stereo4D: Learning How Things Move in 3D from Internet Stereo Videos [76.1] 本稿では,インターネットの立体視,広角ビデオから高品質な4D再構成をマイニングするシステムを提案する。
本研究では,この手法を用いて世界整合型擬似3次元点雲の形で大規模データを生成する。
DUSt3Rの変種をトレーニングし、実世界の画像対から構造と3次元運動を予測することで、このデータの有用性を実証する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:54 GMT)
TimeRefine: Temporal Grounding with Time Refining Video LLM [76.0] ビデオの時間的接地は、テキストのプロンプトが与えられたビデオの中で、関連する時間的境界をローカライズすることを目的としている。
我々は時間的接地タスクを時間的精錬タスクとして再構成する。
我々は、予測セグメントが基底真理からさらに逸脱した場合、モデルをよりペナルティ化する補助予測ヘッドを組み込む。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:11 GMT)
Model Developmental Safety: A Retention-Centric Method and Applications in Vision-Language Models [75.8] 本稿では,事前学習された視覚言語モデル,特にCLIPモデルの開発手法について検討する。
自律走行とシーン認識データセットにおける視覚知覚能力の向上に関する実験は,提案手法の有効性を実証するものである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:43:14 GMT)
Owl-1: Omni World Model for Consistent Long Video Generation [75.5] Omni World ModeL (Owl-1) を提案する。
Owl-1 は VBench-I2V と VBench-Long の SOTA メソッドと同等の性能を実現している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:01 GMT)
Omni-ID: Holistic Identity Representation Designed for Generative Tasks [75.3] Omni-IDは、様々な表現にまたがる個人の外観に関する全体的な情報をエンコードする。
様々な数の非構造化入力画像から情報を構造化表現に集約する。
様々な生成タスクにまたがる従来の表現よりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 19:21:20 GMT)
ProSparse: Introducing and Enhancing Intrinsic Activation Sparsity within Large Language Models [74.6] 活性化スパーシリティ(Activation sparsity)とは、活性化出力の間に弱い分散要素が存在することを指す。
本稿では,PLMを高活性化空間にプッシュするために,"ProSparse" という,シンプルで効果的なスペース化手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:29:32 GMT)
Olympus: A Universal Task Router for Computer Vision Tasks [74.1] MLLM(Multimodal Large Language Models)を統一フレームワークに変換する新しいアプローチであるOlympusを紹介する。
Olympusは、画像、ビデオ、および3Dオブジェクトにまたがる20以上の特別なタスクを専用のモジュールに委譲する。
Olympusは20のタスクで平均94.75%のルーティング精度を達成し、連鎖したアクションシナリオでは91.82%の精度を実現している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:40 GMT)
Neptune: The Long Orbit to Benchmarking Long Video Understanding [74.0] 本稿では,長編ビデオの理解に挑戦する質問応答デコイ集合を生成するための半自動パイプラインについて述べる。
我々のデータセットであるNeptuneは、幅広いビデオ推論能力をカバーし、マルチモーダル推論を強調するサブセットで構成されています。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:54:48 GMT)
ATPrompt: Textual Prompt Learning with Embedded Attributes [73.1] 本稿では,ATPrompt という名前の視覚言語モデルに対する属性埋め込み型テキスト・プロンプト学習手法を提案する。
テキストプロンプトをカテゴリ中心の形式から属性-カテゴリハイブリッド形式に変換する。
使いやすいプラグイン技術として、ATPromptは既存のプロンプトフォーマットをシームレスに置き換えることができる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:57:20 GMT)
Retinex-RAWMamba: Bridging Demosaicing and Denoising for Low-Light RAW Image Enhancement [71.1] 低照度画像の強化、特に生ドメインからsRGBドメインへのマッピングのようなクロスドメインタスクは、依然として大きな課題である。
RAWMambaと呼ばれる新しいMambaスキャニング機構を提案する。
また,Retinex の先行したRetinex Decomposition Module (RDM) も提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:52:56 GMT)
Arbitrary-steps Image Super-resolution via Diffusion Inversion [68.8] 本研究では,拡散インバージョンに基づく新しい画像超解像(SR)手法を提案する。
本研究では,拡散モデルの中間状態を構築するための部分雑音予測戦略を設計する。
トレーニングが完了すると、このノイズ予測器を使用して、拡散軌道に沿ってサンプリングプロセスを部分的に初期化し、望ましい高分解能結果を生成する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:24:13 GMT)
Direct Consistency Optimization for Robust Customization of Text-to-Image Diffusion Models [67.7] テキスト・ツー・イメージ(T2I)拡散モデルは、いくつかの個人画像に微調整された場合、高い一貫性で視覚を生成することができる。
本稿では,微調整モデルと事前学習モデルとの偏差を制御し,直接整合性最適化(Direct Consistency Optimization)と呼ばれる新たな微調整対象を提案する。
提案手法は, 通常の微調整モデルとのマージに最適化したモデルよりも, 高速な忠実度と主観的忠実度が得られることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:02:42 GMT)
Diffusion-Enhanced Test-time Adaptation with Text and Image Augmentation [67.4] IT3Aは、未知の新しいドメインから各テストサンプルをマルチモーダル拡張するために、事前訓練された生成モデルを利用する新しいテスト時間適応手法である。
事前学習された視覚と言語モデルからの強化されたデータを組み合わせることで、未知の新しいテストデータに適応するモデルの能力を高めることができる。
ゼロショット設定では、IT3Aは5.50%の精度で最先端のテスト時間プロンプトチューニング手法より優れている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 20:01:24 GMT)
DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction [67.1] そこで,Dual Point Maps (DualPM) では,同じ画像から一対の点マップを抽出し,一対の点マップをオブジェクト上の3D位置と関連付け,一対の点マップを静止時の標準バージョンに関連付ける。
3次元再構成と3次元ポーズ推定がDualPMの予測に比例することを示した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:26:07 GMT)
SynerGen-VL: Towards Synergistic Image Understanding and Generation with Vision Experts and Token Folding [66.7] 画像の理解と生成の両方が可能なシンプルだが強力なエンコーダのないMLLMであるSynerGen-VLを提案する。
トークンの折り畳み機構と,高分解能画像理解を効果的に支援するビジョンエキスパートベースのプログレッシブアライメント事前学習戦略を導入する。
コードとモデルはリリースされます。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:26 GMT)
LMAgent: A Large-scale Multimodal Agents Society for Multi-user Simulation [66.5] 大規模言語モデル(LLM)ベースのAIエージェントは、人間のような知性を達成するために、大きな進歩を遂げた。
LMAgentは,マルチモーダル LLM に基づく大規模かつマルチモーダルなエージェント社会である。
LMAgentでは、友人とチャットする以外に、エージェントは自動で商品を閲覧、購入、レビューしたり、ライブストリーミングのeコマースを行うこともできる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:47:09 GMT)
PVC: Progressive Visual Token Compression for Unified Image and Video Processing in Large Vision-Language Models [64.9] ビジュアルトークン圧縮は、視覚入力の相当なトークン長を減らすために利用される。
我々は,プログレッシブ・ビジュアル・トークン圧縮と呼ばれる統一的なトークン圧縮戦略を導入する。
本モデルは,様々なビデオ理解ベンチマークにおいて,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:40 GMT)
Unveiling the Impact of Coding Data Instruction Fine-Tuning on Large Language Models Reasoning [64.5] コーディングデータは、事前訓練中に推論能力を高めることで知られています。
IFTにおける内的推論能力の活性化におけるその役割はいまだ検討されている。
IFT段階におけるLLMの推論能力に及ぼす符号化データの影響について検討する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:45:33 GMT)
Doe-1: Closed-Loop Autonomous Driving with Large World Model [64.0] 統合された認識,予測,計画のための大規模駆動wOrld modEl(Doe-1)を提案する。
我々は自由形式のテキストを認識に使用し、画像トークンを用いてRGB空間内での予測を直接生成する。
計画には、アクションを離散トークンに効果的にエンコードするために、位置認識型トークン化器を用いる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:59 GMT)
DriveMM: All-in-One Large Multimodal Model for Autonomous Driving [63.9] DriveMMは、画像やマルチビュービデオなどの多様なデータ入力を処理するために設計された、大規模なマルチモーダルモデルである。
我々は、6つの公開ベンチマークで評価を行い、未確認のデータセットでゼロショット転送を行い、DriveMMはすべてのタスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:47:24 GMT)
MOS: Model Surgery for Pre-Trained Model-Based Class-Incremental Learning [62.8] CIL(Class-Incremental Learning)は、古いクラスを忘れずに、新しいクラスの知識を継続的に獲得するモデルを必要とする。
既存の作業は、モデルを調整するために軽量コンポーネントを活用することを目指している。
従来の知識を忘れないようにモデルを救うため, モーデル手術(MOS)を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:57:20 GMT)
LoRACLR: Contrastive Adaptation for Customization of Diffusion Models [62.7] LoRACLRは、複数のLoRAモデルを単一の統一モデルにマージする、マルチコンセプト画像生成の新しいアプローチである。
LoRACLRは、これらのモデルの重み空間を整列し、マージするために対照的な目的を使い、干渉を最小限にしながら互換性を確保する。
本結果は,複数の概念を正確にマージし,パーソナライズされた画像生成能力を向上する上で,LoRACLRの有効性を強調した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:55 GMT)
ExpRDiff: Short-exposure Guided Diffusion Model for Realistic Local Motion Deblurring [61.8] そこで本稿では,コンテキストベースの局所的ぼかし検出モジュールを開発し,さらにコンテキスト情報を加えて,ぼかし領域の識別を改善する。
最新のスマートフォンには、短時間露光画像を提供するカメラが備わっていることを考慮し、ぼやけたガイド付き画像復元法を開発した。
上記のコンポーネントを ExpRDiff という名前のシンプルで効果的なネットワークに定式化します。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:42:39 GMT)
Memory Layers at Scale [61.6] この研究はメモリ層を概念実証以上のものにし、現代の規模でその有用性を証明している。
ダウンストリームタスクでは、改善されたメモリ層で強化された言語モデルは、予算の2倍以上の高密度モデルよりも優れており、計算とパラメータの両方にマッチする場合の熟練モデルの混合も優れている。
最大128Bのメモリパラメータを持つスケーリング法則を1兆トークンまで事前訓練し,最大8Bパラメータを持つベースモデルと比較した,完全な並列化可能なメモリレイヤの実装を提供する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:56:57 GMT)
A Geometry-Aware Message Passing Neural Network for Modeling Aerodynamics over Airfoils [61.6] 空気力学は航空宇宙工学の重要な問題であり、しばしば翼のような固体物と相互作用する流れを伴う。
本稿では, 固体物体上の非圧縮性流れのモデル化について考察する。
ジオメトリを効果的に組み込むため,メッシュ表現に翼形状を効率よく,かつ効率的に統合するメッセージパッシング方式を提案する。
これらの設計選択は、純粋にデータ駆動の機械学習フレームワークであるGeoMPNNにつながり、NeurIPS 2024 ML4CFDコンペティションで最優秀学生賞を受賞し、総合で4位となった。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:05:39 GMT)
SimVPv2: Towards Simple yet Powerful Spatiotemporal Predictive Learning [61.4] 空間的・時間的モデリングにおけるUnetアーキテクチャの必要性を解消する合理化モデルであるSimVPv2を提案する。
SimVPv2はモデルアーキテクチャを単純化するだけでなく、性能と計算効率も改善する。
標準のMoving MNISTベンチマークでは、SimVPv2は、FLOPが少なく、トレーニング時間の半分、推論効率が60%速く、SimVPよりも優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:54:14 GMT)
A Flexible Plug-and-Play Module for Generating Variable-Length [61.1] Nested Hash Layer (NHL) は、既存の深い教師付きハッシュモデル用に設計されたプラグイン・アンド・プレイモジュールである。
NHLは、異なる長さのハッシュコードをネストした方法で同時に生成する。
NHLは、様々な深層ハッシュモデルに対して優れた検索性能を達成する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 04:13:09 GMT)
Motif Guided Graph Transformer with Combinatorial Skeleton Prototype Learning for Skeleton-Based Person Re-Identification [60.9] 3Dスケルトンデータによる人物再識別(re-ID)は多くのシナリオにおいて重要な価値を持つ課題である。
既存の骨格に基づく手法は、典型的には全ての関節間の仮想運動関係を仮定し、学習に平均的な関節またはシーケンス表現を採用する。
本稿では,Y Combinatorial skeleton prototype learning (MoCos)を用いた汎用Motifガイドグラフトランスフォーマを提案する。
MoCosは、構造特異的で歩行関連のある身体関係とスケルトングラフの特徴を利用して、人物のre-IDに効果的な骨格表現を学習する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:13:29 GMT)
BEACON: Benchmark for Comprehensive RNA Tasks and Language Models [60.0] 本稿では、最初の包括的なRNAベンチマークBEACON(textbfBEnchmtextbfArk for textbfCOmprehensive RtextbfNA Task and Language Models)を紹介する。
まずBEACONは、構造解析、機能研究、工学的応用を網羅した、これまでの広範囲にわたる研究から導かれた13のタスクから構成される。
第2に、CNNのような従来のアプローチや、言語モデルに基づく高度なRNA基盤モデルなど、さまざまなモデルについて検討し、これらのモデルのタスク固有のパフォーマンスに関する貴重な洞察を提供する。
第3に、重要なRNA言語モデルコンポーネントについて検討する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:00:59 GMT)
FreeSplatter: Pose-free Gaussian Splatting for Sparse-view 3D Reconstruction [59.8] スパースビュー画像から高品質な3Dガウス画像を生成することができるフィードフォワード再構築フレームワークであるFreeSplatterを提案する。
FreeSplatterは、シーケンシャルな自己アテンションブロックで構成される、合理化されたトランスフォーマーアーキテクチャ上に構築されている。
テキスト・画像・3Dコンテンツ作成など,下流アプリケーションの生産性を高めるFreeSplatterの可能性を示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:52:53 GMT)
SimAvatar: Simulation-Ready Avatars with Layered Hair and Clothing [59.4] テキストプロンプトからシミュレーション可能な3次元アバターを生成するためのフレームワークであるSimAvatarを紹介する。
提案手法は, 現実的で, 完全にシミュレーション可能な3Dアバターを製作し, 現行のアプローチの能力を上回った最初の手法である。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:35:26 GMT)
Video Creation by Demonstration [59.4] 我々は、条件付き将来のフレーム予測によってラベルなしビデオから学習する自己教師型トレーニングアプローチである$delta$-Diffusionを提案する。
映像基盤モデルと外観ボトルネック設計を併用して,実演映像から動作遅延を抽出し,生成プロセスの条件付けを行う。
実証的に、$delta$-Diffusionは人間の好みと大規模マシン評価の両方の観点から、関連するベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:41:20 GMT)
Inference-Time Diffusion Model Distillation [59.4] 本稿では,新しい推論時間蒸留フレームワークであるDistillation++を紹介する。
条件付きサンプリングの最近の進歩に触発されて,本手法は学生モデルサンプリングを近位最適化問題として再放送する。
逆サンプリング中の蒸留最適化を統合し,教師指導とみなすことができる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:07:17 GMT)
Learning Flow Fields in Attention for Controllable Person Image Generation [59.1] 制御可能な人物画像生成は、参照画像に条件付けされた人物画像を生成することを目的としている。
そこで本研究では,対象クエリに対して,適切な参照キーへの参照を明示的にガイドする学習フロー場(Leffa)を提案する。
Leffaは外観(仮想試行)とポーズ(目的移動)の制御における最先端のパフォーマンスを実現し、細かなディテール歪みを著しく低減する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:43:39 GMT)
GenEx: Generating an Explorable World [59.1] 我々は、その生成的想像力によって導かれる複雑なエンボディ世界探査を計画できるシステムGenExを紹介する。
GenExは、単一のRGB画像から3D一貫性のある想像環境全体を生成します。
GPT支援エージェントは、ゴールに依存しない探索とゴール駆動ナビゲーションの両方を含む複雑な実施作業を行う。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:57 GMT)
RuleArena: A Benchmark for Rule-Guided Reasoning with LLMs in Real-World Scenarios [58.9] RuleArenaは、大規模言語モデル(LLM)が推論において複雑な現実世界のルールに従う能力を評価するために設計された、新しくて挑戦的なベンチマークである。
航空会社の荷物手数料、NBA取引、税制の3つの実践的領域をカバーするルールアリーナは、複雑な自然言語命令を扱うのにLLMの習熟度を評価する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:08:46 GMT)
Falcon-UI: Understanding GUI Before Following User Instructions [57.7] インテリジェンスフリーなGUIナビゲーションデータセットであるInsight-UIデータセットを導入し、GUI環境のモデル理解を強化する。
Insight-UIデータセットはCommon Crawlコーパスから自動的に生成され、さまざまなプラットフォームをシミュレートする。
我々は、最初Insight-UIデータセットで事前訓練され、その後AndroidおよびWeb GUIデータセットで微調整されたGUIエージェントモデルFalcon-UIを開発した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:29:36 GMT)
Achieving Constant Regret in Linear Markov Decision Processes [57.3] 我々は不特定線形マルコフ決定過程(MDP)に対するアルゴリズムCert-LSVI-UCBを導入する。
Cert-LSVI-UCB は $tildemathcalO(d3H5/Delta)$ の累積後悔を高い確率で示し、不特定度 $zeta$ が $tildemathcalO(Delta / (sqrtdH2))$ 以下であることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:42:52 GMT)
Exploring Language Model Generalization in Low-Resource Extractive QA [57.1] ドメインドリフト下でのLarge Language Models (LLM) を用いた抽出質問応答(EQA)について検討する。
性能ギャップを実証的に説明するための一連の実験を考案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:48:44 GMT)
Lyra: An Efficient and Speech-Centric Framework for Omni-Cognition [57.1] Lyraはマルチモーダル能力を向上する効率的なMLLMであり、高度な長音声理解、音声理解、相互モダリティ効率、シームレスな音声対話などが含まれる。
Lyraは様々な視覚言語、視覚音声、音声言語のベンチマークで最先端のパフォーマンスを達成し、計算資源が少なく、訓練データも少ない。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:50:39 GMT)
ProSwitch: Knowledge-Guided Instruction Tuning to Switch Between Professional and Non-Professional Responses [56.9] 大規模言語モデル (LLM) は様々な言語応用において有効であることを示す。
本研究では,プロと非プロの回答を言語モデルで切り替える,ProSwitchという新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:22:14 GMT)
Enriching Multimodal Sentiment Analysis through Textual Emotional Descriptions of Visual-Audio Content [56.6] マルチモーダル・センティメント・アナリティクスは、テキスト、音声、視覚データを融合することで人間の感情を解き放つことを目指している。
しかし、音声やビデオの表現の中で微妙な感情的なニュアンスを認識することは、恐ろしい挑戦だ。
テキストの感情記述に基づくプログレッシブ・フュージョン・フレームワークであるDEVAを紹介する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:30:41 GMT)
Parallel simulation for sampling under isoperimetry and score-based diffusion models [56.4] データサイズが大きくなるにつれて、イテレーションコストの削減が重要な目標になります。
科学計算における初期値問題の並列シミュレーションの成功に触発されて,タスクをサンプリングするための並列Picard法を提案する。
本研究は,動力学に基づくサンプリング・拡散モデルの科学的計算におけるシミュレーション手法の潜在的利点を強調した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:48:18 GMT)
Is Contrastive Distillation Enough for Learning Comprehensive 3D Representations? [56.0] クロスモーダル・コントラスト蒸留は近年,有効3次元表現の学習のために研究されている。
既存の手法は主にモーダリティ共有の特徴に焦点を合わせ、事前学習過程におけるモーダリティ固有の特徴を無視している。
本稿では,これらの欠点に対処する新しいフレームワークCMCRを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:09:49 GMT)
Training LLMs over Neurally Compressed Text [55.1] 本稿では,高度に圧縮されたテキスト上での大規模言語モデル(LLM)の訓練について検討する。
テキストをブロックに分割し,それぞれが同じビット長に圧縮する新しい圧縮手法であるEqual-Info Windowsを提案する。
提案手法は, 大規模化により向上し, パープレキシティと推論速度のベンチマークにおいて, バイトレベルのベースラインをはるかに上回る, ニューラルネットワークによる効果的な学習を実演する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:03:54 GMT)
STORM: A Spatio-Temporal Factor Model Based on Dual Vector Quantized Variational Autoencoders for Financial Trading [55.0] 金融取引では、ファクターモデルが資産の価格設定や過大なリターンの獲得に広く利用されている。
双対ベクトル量子化変分オートエンコーダを用いた時空間ファクトラーモデルSTORMを提案する。
ストームは時間的および空間的な視点からストックの特徴を抽出し、これらの特徴を微細で意味的なレベルで融合し整列させ、その要素を多次元の埋め込みとして表現する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:15:49 GMT)
Can Modern LLMs Act as Agent Cores in Radiology~Environments? [54.4] 大規模言語モデル(LLM)は、様々な領域にわたる精度と解釈性の向上を提供する。
本論文は, コンクリートラジオロジー剤構築の前提条件について検討することを目的とする。
LLMをベースとしたエージェントのための総合的な総合的総合評価データセットRadABench-Dataを提案する。
第二にRadABench-EvalPlatは、プロンプト駆動ワークフローを特徴とするエージェントのための新しい評価プラットフォームである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:20:16 GMT)
TOP-Training: Target-Oriented Pretraining for Medical Extractive Question Answering [53.9] 医学領域における抽出的質問応答に関する研究(医学EQA)
この問題には、(i)ドメイン特異性と(ii)抽出に基づく回答スタイルの2つの主な課題がある。
対象指向の事前学習パラダイムであるTOP-Trainingを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:33:56 GMT)
Feat2GS: Probing Visual Foundation Models with Gaussian Splatting [53.9] ビジュアルファウンデーションモデル(VFM)は、広範囲なデータセットでトレーニングされるが、2D画像に制限されることが多い。
画像から抽出したVFM特徴から3Dガウス特性を読み取るFeat2GSを紹介する。
我々は,複数のVFMの3次元認識を探索する広範囲な実験を行い,VFMの3次元認識に繋がる成分について検討した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:28 GMT)
DiverseAgentEntropy: Quantifying Black-Box LLM Uncertainty through Diverse Perspectives and Multi-Agent Interaction [53.8] モデルの不確実性を評価する既存の手法は、元のクエリに対する自己整合性を評価することで、必ずしも真の不確実性を把握するわけではない。
マルチエージェントインタラクションを用いたモデルの不確実性評価のための新しい手法であるDiverseAgentEntropyを提案する。
提案手法は,モデルの信頼性をより正確に予測し,さらに幻覚を検知し,他の自己整合性に基づく手法よりも優れる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:52:40 GMT)
New keypoint-based approach for recognising British Sign Language (BSL) from sequences [53.4] 本稿では,イギリス手話(BSL)単語を連続署名シーケンス内で認識するキーポイントに基づく新しい分類モデルを提案する。
我々のモデルの性能はBOBSLデータセットを用いて評価され、キーポイントベースのアプローチが計算効率とメモリ使用量においてRGBベースのアプローチを上回ることが判明した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:20:27 GMT)
AgentTrek: Agent Trajectory Synthesis via Guiding Replay with Web Tutorials [53.4] Webチュートリアルを利用して高品質なGUIエージェントトラジェクトリを生成するスケーラブルなデータ合成パイプラインを提案する。
提案手法では,インターネットからチュートリアル的なテキストを自動的に収集し,ステップバイステップでタスク目標に変換し,視覚言語モデルエージェントを用いる。
VLMに基づく評価器は、生成された軌道の正確性を保証する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:27 GMT)
Diffusion Model with Representation Alignment for Protein Inverse Folding [53.1] タンパク質逆フォールディングはバイオインフォマティクスの基本的な問題であり、与えられたタンパク質のバックボーン構造からアミノ酸配列を復元することを目的としている。
表現アライメント(DMRA)を用いた拡散モデルを用いた新しい手法を提案する。
実験では,CATH4.2データセットを広範囲に評価し,DMRAが先行手法より優れていることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:47:59 GMT)
Newton-CG methods for nonconvex unconstrained optimization with Hölder continuous Hessian [53.0] 我々は、H"古いヘッセンによる2つの微分可能な目的関数を最小化する非制約非制約最適化問題を考える。
まずニュートン共役法(Newton-conjugate, Newton-CG)を提案する。
本稿では,パラメータフリーなNewtonCG法において,優れた実用性能を示すための予備的な数値計算結果を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:33:57 GMT)
STARC: A General Framework For Quantifying Differences Between Reward Functions [52.7] 我々は、STARCメトリックと呼ばれるすべての報酬関数の空間上の擬計量のクラスを提供する。
以上の結果から,STARCは最悪の後悔に対して上界と下界の両方を誘導することがわかった。
また、以前の研究によって提案された報酬指標に関するいくつかの問題も特定します。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:29:41 GMT)
Evolving Alignment via Asymmetric Self-Play [52.3] 本稿では、2人のプレーヤー間の非対称ゲームとしてアライメントをキャストする一般オープンエンドなRLHFフレームワークを提案する。
Asymmetric Self-Play (eva) によるアライメントの進化(Evolving Alignment)というこのフレームワークは、既存のRLHFアルゴリズムを拡張性のあるアライメントに利用できるシンプルで効率的なアプローチをもたらす。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:11:30 GMT)
GReaTer: Gradients over Reasoning Makes Smaller Language Models Strong Prompt Optimizers [52.2] 本稿では,タスク固有の推論よりも勾配情報を直接組み込む新しいプロンプト最適化手法であるGReaTerを紹介する。
GReaTerはタスク損失勾配を利用して、オープンソースの軽量言語モデルのためのプロンプトの自己最適化を可能にする。
GReaTerは、従来の最先端のプロンプト最適化手法を一貫して上回っている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 20:59:43 GMT)
Diffusion Predictive Control with Constraints [51.9] 制約付き拡散予測制御(DPCC)
トレーニングデータから逸脱可能な、明示的な状態と行動制約を持つ拡散制御アルゴリズム。
DPCCは,学習した制御タスクの性能を維持しつつ,新しいテスト時間制約を満たす上で,既存の手法よりも優れるロボットマニピュレータのシミュレーションを通して示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:10:22 GMT)
A Survey of Artificial Intelligence in Gait-Based Neurodegenerative Disease Diagnosis [51.1] 神経変性疾患(神経変性疾患、ND)は、伝統的に医学的診断とモニタリングのために広範囲の医療資源と人的努力を必要とする。
重要な疾患関連運動症状として、ヒトの歩行を利用して異なるNDを特徴づけることができる。
人工知能(AI)モデルの現在の進歩は、NDの識別と分類のための自動歩行分析を可能にする。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:02:17 GMT)
Do Multimodal Large Language Models See Like Humans? [50.9] MLLM(Multimodal Large Language Models)は、様々なビジョンタスクにおいて、近年の大規模言語モデルの進歩を生かして、印象的な成果を上げている。
MLLMは人間と同じような視覚情報を知覚しているか?
HVSBenchは、人間の視覚を反映する基本的な視覚タスクにおいて、MLLMと人間の視覚システム(HVS)の整合性を評価するために設計された大規模なベンチマークである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:25 GMT)
ResFlow: Fine-tuning Residual Optical Flow for Event-based High Temporal Resolution Motion Estimation [50.8] イベントカメラは、高時間分解能(HTR)モーション推定に重要な可能性を秘めている。
イベントデータを用いてHTR光流を推定するための残差に基づくパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:35:47 GMT)
LCFO: Long Context and Long Form Output Dataset and Benchmarking [50.4] LCFO(Long Context and Form Output)ベンチマークは、要約および要約拡張能力を評価するための評価フレームワークである。
LCFOは、長さの異なる3つの要約を持つ長い入力文書(平均長5k語)から構成される。
GPT-4o-miniは、要約および要約拡張タスクの両方において、自動システムの中で最高の人点を達成している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:32:23 GMT)
FreeScale: Unleashing the Resolution of Diffusion Models via Tuning-Free Scale Fusion [50.4] FreeScaleは、スケール融合による高解像度のビジュアル生成を可能にする、チューニング不要な推論パラダイムである。
画像モデルとビデオモデルの両方において高解像度の視覚生成機能を拡張する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:59 GMT)
MOPI-HFRS: A Multi-objective Personalized Health-aware Food Recommendation System with LLM-enhanced Interpretation [50.3] Yelpのような主要な食品レコメンデーションプラットフォームは、ユーザの選択した健康性よりも、ユーザの食事の好みを優先している。
我々はMOPI-HFRS(Multi-Objective Personalized Interpretable Health-Aware Food Recommendation System)を開発した。
ユーザの好み、パーソナライズされた健康、栄養の多様性の3つの目標と、大きな言語モデル(LLM)強化推論モジュールを共同で最適化することで、食品レコメンデーションを提供する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:02:09 GMT)
Accuracy Improvements for Convolutional and Differential Distance Function Approximations [50.2] 領域の内部点から領域の境界までの距離関数を推定する問題に対処する。
両方のスキームに対して,精度の向上を提案し,評価した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:53:19 GMT)
GEAL: Generalizable 3D Affordance Learning with Cross-Modal Consistency [50.1] 既存の3Dアベイランス学習手法は、注釈付きデータに制限があるため、一般化と堅牢性に苦慮している。
本稿では,大規模事前学習型2Dモデルを活用することで,3次元アベイランス学習の一般化と堅牢性を高めるための新しいフレームワークであるGEALを提案する。
GEALは、既存のメソッドと、新しいオブジェクトカテゴリ、および破損したデータにおいて、一貫して優れています。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:59:03 GMT)
Elevating Flow-Guided Video Inpainting with Reference Generation [50.0] ビデオインパインティング(VI)は、フレーム間で観測可能なコンテンツを効果的に伝播させながら、オリジナルビデオに存在しない新しいコンテンツを同時に生成する必要がある課題である。
本稿では,より進んだ画素伝搬アルゴリズムと組み合わせて,参照生成のための大規模な生成モデルを活用する,堅牢で実用的なVIフレームワークを提案する。
提案手法は,オブジェクト削除のためのフレームレベルの品質を著しく向上するだけでなく,ユーザが提供するテキストプロンプトに基づいて,欠落した領域の新たなコンテンツを合成する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:13:00 GMT)
NeuralFuse: Learning to Recover the Accuracy of Access-Limited Neural Network Inference in Low-Voltage Regimes [50.0] ディープラーニング(Deep Neural Network, DNN)は、機械学習においてユビキタスになったが、そのエネルギー消費は問題の多いままである。
我々は低電圧状態におけるエネルギー精度のトレードオフを処理する新しいアドオンモジュールであるNeuralFuseを開発した。
1%のビットエラー率で、NeuralFuseはアクセスエネルギーを最大24%削減し、精度を最大57%向上させることができる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:37:29 GMT)
PBR-NeRF: Inverse Rendering with Physics-Based Neural Fields [49.6] シーン形状,材料,照明を共同で推定できる逆レンダリング(IR)モデルを提案する。
本手法は, 材料推定を必要とする他の逆レンダリングおよび3次元再構成フレームワークに容易に適用可能である。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 19:00:21 GMT)
Evaluating GPT-4 at Grading Handwritten Solutions in Math Exams [49.0] 我々は、最先端のマルチモーダルAIモデル、特にGPT-4oを利用して、大学レベルの数学試験に対する手書きの応答を自動的に評価する。
確率論試験における質問に対する実際の学生の反応を用いて, GPT-4oのスコアと, 様々なプロンプト技術を用いて, 人間の学級のスコアとの整合性を評価する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:40:18 GMT)
If You Can't Use Them, Recycle Them: Optimizing Merging at Scale Mitigates Performance Tradeoffs [49.0] 異なるタスク間のトレードオフを示すチェックポイントをリサイクルすることで、大規模な(100B)モデルをマージすることを検討する。
良いマージは、ほとんどすべてのチェックポイントとゼロでない重みを含む傾向があり、一見して悪い初期チェックポイントでさえ、良い最終マージに寄与することを示している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 03:30:34 GMT)
MaskTerial: A Foundation Model for Automated 2D Material Flake Detection [48.7] MaskTerialと呼ばれる深層学習モデルを提案する。このモデルでは、インスタンスセグメンテーションネットワークを用いて、2D素材のフレークを確実に識別する。
このモデルは、ラベルのないデータからリアルな顕微鏡画像を生成する合成データ生成装置を用いて、広範囲に事前訓練されている。
六方晶窒化ホウ素などの低コントラスト材料の検出において,既存の技術よりも顕著な改善が認められた。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:01:39 GMT)
Video Seal: Open and Efficient Video Watermarking [47.4] ビデオ透かしは、認識不能な信号をビデオに埋め込むことによって、課題に対処する。
Video Sealは、ニューラルビデオ透かしのための包括的なフレームワークであり、競合するオープンソースモデルである。
提案手法の有効性を, 速度, 不受容性, 頑健性の観点から実験的に検証した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:41:49 GMT)
Slow Mixing of Quantum Gibbs Samplers [47.4] 一般化されたボトルネック補題を用いて、これらのツールの量子一般化を示す。
この補題は、古典的なハミング距離に類似する距離の量子測度に焦点を当てるが、一意に量子原理に根ざしている。
ポアソン・ファインマン・カック法を用いて古典的な緩やかな混合結果を持ち上げる方法を示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:51:32 GMT)
Exemplar Masking for Multimodal Incremental Learning [47.2] マルチモーダル・インクリメンタルな学習は、新しい知識を同時に学習しながら、複数のモーダルからの情報を消化する必要がある。
本稿では,従来の知識を効果的に再生するための模擬マスキングフレームワークを提案する。
我々は,従来のマスキングフレームワークが,同じメモリバッファ下での破滅的な忘れ込みに対して,より効率的で堅牢であることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:40:20 GMT)
Advancing Extended Reality with 3D Gaussian Splatting: Innovations and Prospects [47.1] 3D Gaussian Splatting (3DGS)は、3D表現、レンダリング、インタラクションに革命をもたらす可能性に対して大きな注目を集めている。
3DGS研究の急速な発展にもかかわらず、拡張現実(XR)への直接の応用はいまだに未調査である。
本稿では,XRの研究開発を進展させる具体的な可能性を示す3DGSのイノベーションを合成することを目的としている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:38:22 GMT)
Match, Compare, or Select? An Investigation of Large Language Models for Entity Matching [47.0] 我々は、複数の戦略と大規模言語モデル(LLM)の構成を利用する複合エンティティマッチングフレームワーク(ComEM)を設計する。
ComEMは、異なる側面の利点から恩恵を受け、効率性と効率性の両方の改善を実現します。
8つのERデータセットと10個のLLMによる実験結果から,選択戦略によるレコードインタラクションの優越性を検証した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:05:10 GMT)
Improving the Validity of Automatically Generated Feedback via Reinforcement Learning [46.7] 強化学習(RL)を用いた正当性と整合性の両方を最適化するフィードバック生成フレームワークを提案する。
具体的には、直接選好最適化(DPO)によるトレーニングのための拡張データセットにおいて、GPT-4のアノテーションを使用してフィードバックペアよりも好みを生成する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:26:04 GMT)
Perturb and Recover: Fine-tuning for Effective Backdoor Removal from CLIP [46.3] 本論文は, 微調整による潜在的有毒モデルのクリーニングに焦点を当てた。
BlendedやBadNetのバックドア攻撃で使用される単純な構造的トリガに対して,既存のクリーニング技術は有効ではないことを示す。
PAR、Perturb、Recoverは驚くほどシンプルで効果的なメカニズムで、CLIPモデルからバックドアを取り除きます。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:28:42 GMT)
Word Sense Linking: Disambiguating Outside the Sandbox [46.0] 我々は、入力テキストと参照センスのインベントリが与えられた場合、どの範囲を曖昧にするかを識別し、最も適切な意味にリンクする必要がある、Word Sense Linking (WSL) という新しいタスクを提案する。
我々は,このタスクのためのトランスフォーマーベースのアーキテクチャを提案し,WSLにスケールした最新のWSDシステムの性能と性能の両方を徹底的に評価した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:38:34 GMT)
Neural LightRig: Unlocking Accurate Object Normal and Material Estimation with Multi-Light Diffusion [45.8] 本稿では,2次元拡散先行から補助的な多照光条件を活用することにより,本質的な推定を促進する新しいフレームワークを提案する。
我々は、U-Netバックボーンで大きなGバッファモデルを訓練し、表面の正常さや材料を正確に予測する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:58:09 GMT)
Revolutionizing Finance with LLMs: An Overview of Applications and Insights [45.7] ChatGPTのような大規模言語モデル(LLM)はかなり進歩しており、様々な分野に適用されている。
これらのモデルは、財務報告の自動生成、市場のトレンド予測、投資家の感情分析、パーソナライズされた財務アドバイスの提供に利用されています。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 03:26:57 GMT)
On the Generation and Removal of Speaker Adversarial Perturbation for Voice-Privacy Protection [45.5] 近年の音声プライバシ保護の進歩は,話者の音声属性を隠蔽する同じ手法の肯定的な使用例を示している。
本稿では,逆方向の摂動を発生させるエンティティを除去し,元の音声を復元する可逆性について検討する。
同様の手法は、捜査員が音声保護されたスピーチを匿名化し、犯罪者の身元をセキュリティと法医学的分析で復元するためにも用いられる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:46:07 GMT)
Learning Visual Generative Priors without Text [45.4] I2I(Image-to-image)の生成について検討した。
我々のI2Iモデルは、より基礎的な視覚的先行として機能し、既存のT2Iモデルよりも高いパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:10:43 GMT)
FullStack Bench: Evaluating LLMs as Full Stack Coders [44.8] FullStack Benchは、幅広いアプリケーションドメインを含むフルスタックプログラミングに焦点を当てている。
FullStack Benchのマルチ言語プログラミング機能を評価するために,16の広く使用されているプログラミング言語から実世界の命令とそれに対応する単体テストケースを設計する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:59:55 GMT)
Vision CNNs trained to estimate spatial latents learned similar ventral-stream-aligned representations [44.5] 霊長類の腹側視覚ストリームの機能的役割の研究は、伝統的に対象の分類に焦点を当ててきた。
ここでは、別の仮説を探求する: 腹側流は空間的潜伏量の推定に最適化されるか?
数個の空間的遅延を推定するためにトレーニングされたモデルは、数百のカテゴリでトレーニングされたモデルに匹敵するニューラルアライメントスコアを達成できることがわかった。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:49:16 GMT)
VCA: Video Curious Agent for Long Video Understanding [44.2] VCAと呼ばれる自己探索機能を備えた好奇心駆動型ビデオエージェントを提案する。
VLM上に構築されたVCAは、ビデオセグメントを自律的にナビゲートし、複雑なビデオシーケンスの包括的な理解を効率的に構築する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:39:54 GMT)
CRVQ: Channel-relaxed Vector Quantization for Extreme Compression of LLMs [43.8] ポストトレーニング量子化(PTQ)は、この野心を達成するためのスターアプローチとして登場した。
本稿では,PTQベースラインの性能を大幅に向上させる新しい手法であるChannel-Relaxed Vector Quantization (CRVQ)を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:45:11 GMT)
MS2Mesh-XR: Multi-modal Sketch-to-Mesh Generation in XR Environments [42.8] MS2Mesh-XRは、マルチモーダルなスケッチ・ツー・メッシュ生成パイプラインである。
ユーザーは音声入力による手描きスケッチを使って、拡張現実環境でリアルな3Dオブジェクトを作成することができる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:20:32 GMT)
Test Case-Informed Knowledge Tracing for Open-ended Coding Tasks [42.2] オープンエンドコーディングタスクは、コンピュータサイエンス教育で一般的である。
応答の正しさのみを分析する伝統的な知識追跡(KT)モデルは、学生のコードから学生の知識のニュアンスを完全に捉えることはできない。
テストケース・インフォームド・ナレッジ・トレーシング・フォー・オープンエンド・コーディング(TIKTOC)は,オープンエンドの学生コードとテストケースを同時に分析・予測するフレームワークである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 22:56:26 GMT)
Assessing the Robustness of Retrieval-Augmented Generation Systems in K-12 Educational Question Answering with Knowledge Discrepancies [41.5] 大規模言語モデルにおける教科書とパラメトリック知識の相違がRAGシステムの有効性を損なう可能性があることを示す。
実アプリケーションにおける知識の相違をシミュレートする質問応答データセットであるEduKDQAを提案する。
その結果,ほとんどのRAGシステムは,知識の相違に対処する上で,大幅な性能低下に悩まされていることがわかった。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:38:40 GMT)
CGGM: A conditional graph generation model with adaptive sparsity for node anomaly detection in IoT networks [40.9] 本稿では,マイノリティクラスに属するサンプルを生成するために,CGGMと呼ばれる新しいグラフ生成モデルを提案する。
フレームワークは、条件付きグラフ生成モジュールとグラフベースの異常検出モジュールの2つのコアモジュールから構成される。
実験により、CGGMは精度とばらつきの点で最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:39:46 GMT)
On the Crucial Role of Initialization for Matrix Factorization [40.8] この研究は古典的低ランク行列分解問題を再考し、整合率の形成における初期化の重要な役割を明らかにする。
我々はNystrom NyGDを対称非対称行列分解タスクに導入し、ローランクアダプタ(LoRA)に拡張する。
提案手法は,大規模言語および拡散モデルにおいて,1Bから7Bパラメータに至るまで,様々なダウンストリームおよびモデルスケールで優れた性能を示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 19:54:41 GMT)
V2PE: Improving Multimodal Long-Context Capability of Vision-Language Models with Variable Visual Position Encoding [40.8] VLM(Vision-Language Models)は、様々なマルチモーダルタスクを扱う上で有望な能力を示しているが、長いコンテキストシナリオでは苦労している。
本稿では,視覚トークンに可変インクリメントを取り入れた新しい位置符号化手法を提案し,長いマルチモーダルシーケンスのより効率的な管理を実現する。
細調整されたモデルでは、標準タスクと長文マルチモーダルタスクの両方で高い性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:46 GMT)
Towards Open-Vocabulary Video Semantic Segmentation [40.6] オープン語彙ビデオセマンティック(OV-VSS: Open Vocabulary Video Semantic)タスクを導入する。
OV-VSSの性能を向上させるため,空間時間融合モジュールを統合したロバストベースラインOV2VSSを提案する。
我々のアプローチには、ビデオコンテキスト内のテキスト情報を解釈する能力を強化するビデオテキストエンコーディングも含まれている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:53:16 GMT)
Weighted Poisson-disk Resampling on Large-Scale Point Clouds [40.2] 本稿では,処理のユーザビリティと効率を向上させるために,重み付きポアソンディスク (WPD) 再サンプリング法を提案する。
実験により,本手法は大規模クラウド再サンプリングの性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:09:56 GMT)
InstanceCap: Improving Text-to-Video Generation via Instance-aware Structured Caption [40.1] トレーニングは、生成性能を高める上で重要な役割を果たすビデオキャプチャペアデータに依存している。
現在のビデオキャプションは、不十分な詳細、幻覚、不正確な動きの描写に悩まされることが多い。
本稿では,インスタンスレベルのきめ細かな動画キャプションを実現するために,新しいインスタンス対応構造化キャプションフレームワークであるインスタンスCapを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:48:40 GMT)
Forest-of-Thought: Scaling Test-Time Compute for Enhancing LLM Reasoning [40.1] 我々はフォレスト・オブ・サート(FoT)と呼ばれる新しい推論フレームワークを提案する。
FoTは複数の推論木を統合し、複雑な論理問題を解くために集合的な意思決定を活用する。
我々は,過去の誤りからリアルタイムの誤り訂正と学習を可能にする動的自己補正戦略を導入する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:01:18 GMT)
Limited but consistent gains in adversarial robustness by co-training object recognition models with human EEG [40.0] 分類と脳波予測の2つのタスクでResNet50-backboneモデルを訓練した。
ネットワークの脳波予測精度には有意な相関がみられた。
それぞれの脳波チャンネルからのデータを分解し,頭頂後頭頂部の電極からの最も強い寄与を観察した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 21:15:25 GMT)
An Interoperable Machine Learning Pipeline for Pediatric Obesity Risk Estimation [39.8] 現在、既存のMLモデルに基づく一般的な臨床診断支援ツールが存在しない。
本研究では,小児の肥満予測に特化して設計された新しいエンドツーエンドパイプラインを提案する。
私たちのパイプラインは、APIやユーザインターフェース経由でのデータ抽出、推論、通信のプロセス全体をサポートします。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:25:37 GMT)
Dipper: Diversity in Prompts for Producing Large Language Model Ensembles in Reasoning tasks [39.8] 大規模言語モデルの性能を高める推論時間法は、シーケンシャルなクエリに大きく依存しているが、過去の研究で有効であることが示されている。
本稿では,1つのモデルに最適化された多様なプロンプトを並列に供給する,新しい学習不要なLLMアンサンブルフレームワークを提案する。
実験により,本手法が算数推論タスク,例えばMATHにおいて有意な向上をもたらすことを実証した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:49:05 GMT)
Annotation-guided Protein Design with Multi-Level Domain Alignment [39.8] マルチモーダルなタンパク質設計フレームワークPAAGを提案する。
タンパク質データベースから抽出したテキストアノテーションを統合し、シーケンス空間で制御可能な生成を行う。
具体的には、PAAGは対応するドメインアノテーションに条件付けられた特定のドメインを含むタンパク質を明示的に生成することができる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:05:53 GMT)
Piecing It All Together: Verifying Multi-Hop Multimodal Claims [39.7] マルチホップマルチモーダルクレーム検証という新しいタスクを導入する。
このタスクは、テキスト、画像、テーブルなど、さまざまなソースから複数のエビデンスを推論するモデルに挑戦する。
我々は,マルチモーダルなエビデンスと組み合わせた15kのマルチホップクレームからなる大規模データセットMMCVを構築し,人間からのフィードバックを付加した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 19:23:28 GMT)
Loss-tolerant quantum key distribution with detection efficiency mismatch [39.6] 我々は、ソースと検出器の両方に不完全性を組み込んだ損失耐性P&MQKDプロトコルのセキュリティ証明を確立する。
具体的には、発光状態が理想的な状態から逸脱した場合に、このスキームの安全性を示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 19:01:56 GMT)
World knowledge-enhanced Reasoning Using Instruction-guided Interactor in Autonomous Driving [39.2] 本研究では,認識条件下での自律走行性能向上を目的としたフレームワークを提案する。
具体的には,モダリティギャップを埋めるプラグアンドプレイ方式の対話モジュールを提案する。
運転関連タスクと世界の知識をよりよく統合するために、我々は大規模なマルチモーダルデータセットを収集し、洗練しました。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:48:58 GMT)
EasyRef: Omni-Generalized Group Image Reference for Diffusion Models via Multimodal LLM [38.8] 本稿では,複数の参照画像とテキストプロンプトに拡散モデルを条件付けできる新しいプラグイン・アンド・プレイ適応手法であるEasyRefを紹介する。
我々は,マルチモーダル大言語モデル(MLLM)のマルチモーダル理解と命令追従機能を活用し,複数の画像内の一貫した視覚的要素を利用する。
実験の結果、EasyRefはIP-Adapterのようなチューニング不要の手法とLoRAのようなチューニングベース手法の両方を超越し、様々な領域で優れた美的品質と堅牢なゼロショットの一般化を実現している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:48 GMT)
MGM: Global Understanding of Audience Overlap Graphs for Predicting the Factuality and the Bias of News Media [38.1] 政治バイアスと事実性のレンズからニュースメディアをプロファイリングする際の分類問題について検討する。
事前学習言語モデル(PLM)やグラフニューラルネットワーク(GNN)といった従来のプロファイリング手法は有望な結果を示している。
本稿では,変分期待最大化(EM)フレームワークにおける有効解であるMediaGraphMind(MGM)を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:37:32 GMT)
Towards Foundation-model-based Multiagent System to Accelerate AI for Social Impact [37.7] 既存のAI4SI研究は、しばしば労働集約的かつリソース要求的である。
本稿では,このようなベースレベルのシステムの開発を加速するために,メタレベルのマルチエージェントシステムを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:08:30 GMT)
Efficient estimation of error bounds for quantum multiparametric imaging with constraints [37.7] 修正されたフィッシャー情報行列の近似構築のための実用的なアルゴリズムを提案する。
量子画像における1-, 2-, 多パラメータモデル問題に適用することで, 提案手法の有効性を実証する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:42:30 GMT)
Sail into the Headwind: Alignment via Robust Rewards and Dynamic Labels against Reward Hacking [36.7] 本稿では,プライオリティデータセットを用いた初期モデルの改善を目的とした,オフラインのプライオリティ最適化における報酬ハックについて検討する。
我々は,データセットの統計的変動から生じる報奨ハッキングの2つのタイプを同定した: 選択が不適切である場合のタイプI Reward Hackingと,適切な選択があまり好ましくない場合のタイプII Reward Hackingである。
多くの(主ストリームまたは理論的な)選好最適化手法が、どちらの種類の報奨ハッキングにも悩まされていることを証明している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:34:47 GMT)
LLMs are Highly-Constrained Biophysical Sequence Optimizers [36.3] 大規模言語モデル(LLM)は、最近、様々な生物学的タスクにおいて大きな可能性を示している。
本研究では,LLMを高度に制約された二レベル最適化として活用する可能性について検討する。
本稿では,報酬分布と基準分布を円滑に補間する新たなトレーニング目標であるMargin-Aligned expectation (MargE)を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:48:47 GMT)
Causal Graphical Models for Vision-Language Compositional Understanding [36.2] 提案手法は, 最先端の合成手法を大きなマージンで大幅に上回っていることを示す。
さらに、はるかに大きなデータセットを使用してトレーニングされたメソッドよりも改善されている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:22:03 GMT)
Federated Foundation Models on Heterogeneous Time Series [36.2] 主な目的は、Transformerアーキテクチャ上でモデルをトレーニングするためのトークンとして共有サブシーケンスを抽出するために、ドメイン間の時系列データセットを融合することである。
本稿では,時系列基礎モデルトレーニング(FFTS)における不均一性に対処する新しいフェデレーション学習手法を提案する。
新たに学習された時系列基礎モデルは、予測、計算、異常検出を含むクロスドメイン時系列解析タスクにおいて優れた一般化能力を達成する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 03:38:01 GMT)
DASK: Distribution Rehearsing via Adaptive Style Kernel Learning for Exemplar-Free Lifelong Person Re-Identification [36.1] 生涯人物再識別(LReID)は、破滅的な忘れ込みに苦しむ重要な課題であるが難しい課題である。
既存のLReIDアプローチは通常、この問題を軽減するためにデータ再生と知識蒸留に依存している。
本稿では,知識統合を強化するために,旧領域の分布をモデル化し,リハーサルする新しいパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:26:08 GMT)
Tailoring coherent charge transport in graphene by deterministic defect generation [36.1] 我々は、位相整合電荷キャリア波を可能にするグラフェンに格子欠陥を導入する。
複数の電子ファブリペロキャビティは、周期的に相反する欠陥およびプリスタンナノストリップを作成することによって形成される。
欠陥ストライプはミラーを部分的に反射し、原始領域内で電荷キャリア波を共鳴的に閉じ込め、ファブリー・ペロー共振モードを生じさせる。
これらのコヒーレントな現象は、従来の単極性静電法で作られたファブリー・ペロー干渉計とは対照的に、電荷キャリアの両極性に対して最大30Kまで生き残る。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:08:21 GMT)
Realization of strongly-interacting Meissner phases in large bosonic flux ladders [36.1] 我々は,48箇所をハーフフィリングした大規模ボソニックフラックスラグにおいて,強い相互作用を持つモット・マイスナー相を実験的に実現した。
本結果は,周期的に駆動される量子システムを大規模で強い相関の位相に拡張可能であることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:27:49 GMT)
ZigZagkv: Dynamic KV Cache Compression for Long-context Modeling based on Layer Uncertainty [35.9] 推論長が増加するにつれて、KVキャッシュの増加はメモリ外問題を引き起こす可能性がある。
本稿では,各層に予算規模を割り当てるために,層不確実性を利用した簡易かつ効果的なKVキャッシュ圧縮手法を提案する。
実験の結果,提案手法はフルKV推定と比較して,KVキャッシュのメモリ使用量を$sim$20%に削減できることがわかった。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:52:56 GMT)
Understanding the RoPE Extensions of Long-Context LLMs: An Attention Perspective [35.9] 本稿では,RoPE拡張の注意点から,直接的かつ詳細な理解を提供する。
RoPE拡張の長い継続事前トレーニング長を使用することで、注意の不確実性を低減し、外挿を著しく向上させることができる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:00:36 GMT)
Selective Visual Prompting in Vision Mamba [35.9] 事前訓練されたVision Mamba(Vim)モデルは、様々なコンピュータビジョンタスクで例外的な性能を示した。
既存の視覚プロンプト法は、視覚変換器(ViT)ベースのモデルに主に適合している。
本稿では,Vimの高効率微調整のための新しい選択型視覚プロンプティング(SVP)手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:24:06 GMT)
LLMPhy: Complex Physical Reasoning Using Large Language Models and World Models [35.0] そこで我々は,TraySimという物理推論タスクとデータセットを提案する。
私たちのタスクは、外部の影響を受けるトレイ上のいくつかのオブジェクトのダイナミクスを予測することです。
LLMの物理知識とプログラム合成能力を活用するゼロショットブラックボックス最適化フレームワークであるLLMPhyを提案する。
この結果から,LLMと物理エンジンの組み合わせにより,最先端のゼロショット物理推論性能が得られることがわかった。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 21:29:57 GMT)
Meshtron: High-Fidelity, Artist-Like 3D Mesh Generation at Scale [34.7] 提案するMeshtronは,最大64K面のメッシュを1024レベルの座標分解能で生成可能な,新しい自己回帰メッシュ生成モデルである。
メッシュトロンは、前例のない解像度と忠実度で、詳細で複雑な3Dオブジェクトのメッシュを生成する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:38:42 GMT)
EvoSampling: A Granular Ball-based Evolutionary Hybrid Sampling with Knowledge Transfer for Imbalanced Learning [34.7] 階級不均衡は、多数派を優先し、少数派を不利にする偏見のある階級化に繋がる。
本稿ではEvoSamplingと呼ばれる進化的多粒性ハイブリッドサンプリング手法を提案する。
20個の不均衡データセットの実験により、EvoSamplingは様々な分類アルゴリズムの性能を効果的に向上することを示した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:35:20 GMT)
Efficient and Comprehensive Feature Extraction in Large Vision-Language Model for Clinical Pathology Analysis [34.2] 病理診断は疾患の特徴の決定、治療指導、予後評価に不可欠である。
従来の純粋な視覚モデルは、冗長な特徴抽出の課題に直面している。
既存の視覚言語モデル(LVLM)は、入力解像度の制約によって制限され、その効率と精度を損なう。
課題誘導型機能拡張と課題誘導型詳細機能補完の2つの革新的戦略を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:07:23 GMT)
PhishIntel: Toward Practical Deployment of Reference-based Phishing Detection [34.0] PhishIntelは、現実世界のデプロイメントのためのエンドツーエンドのフィッシング検出システムである。
検出プロセスを、ローカルのブラックリストと結果キャッシュをチェックする高速タスクと、オンラインのブラックリスト検証、URLクローリング、Webページ分析を実行する遅いタスクの2つに分割する。
この高速スロータスクシステムアーキテクチャは、ゼロデイフィッシング脅威に対するRBPDの堅牢な検出能力を保ちながら、低応答レイテンシを保証する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:33:39 GMT)
GoHD: Gaze-oriented and Highly Disentangled Portrait Animation with Rhythmic Poses and Realistic Expression [33.9] GoHDは、非常にリアルで表現力があり、コントロール可能なポートレートビデオを作成するために設計されたフレームワークである。
潜時ナビゲーションを利用したアニメーションモジュールを導入し、目に見えない入力スタイルの一般化能力を向上させる。
コンホメータ構造付き条件拡散モデルは、韻律を意識した頭部ポーズを保証するように設計されている。
2段階のトレーニング戦略は、より時間依存的ではあるが、音声関連の少ない動きの発生から、頻繁でフレームワイドな唇運動蒸留を分離するために考案された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:12:07 GMT)
Learning to Solve Domain-Specific Calculation Problems with Knowledge-Intensive Programs Generator [33.7] 本稿では,知識集中型プログラム生成器を用いて,ドメイン固有の計算問題を解くパイプラインを提案する。
ドメイン固有の文書に従って知識集約型プログラムを生成する。
また、コードジェネレータは、新しい知識をトレーニングすることなく、他のドメインにも適用可能であることもわかりました。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:42:58 GMT)
SLAM3R: Real-Time Dense Scene Reconstruction from Monocular RGB Videos [33.6] SLAM3Rは、リアルタイムかつ高品質な高密度3D再構成のための、新規で効果的な単分子式RGB SLAMシステムである。
フィードフォワードニューラルネットワークを通じて、ローカルな3D再構成とグローバルな座標登録をシームレスに統合する。
SLAM3Rは、20FPS以上のリアルタイム性能を維持しながら、最先端の復元精度と完全性を達成することを示す実験が一貫して行われている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:08:03 GMT)
Gaze-LLE: Gaze Target Estimation via Large-Scale Learned Encoders [33.3] 本研究では,視覚目標推定の問題に対処する。
凍結したDINOv2エンコーダの特徴を活用して視線目標推定を効率化する新しいトランスフォーマフレームワークであるGaze-LLEを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:55:30 GMT)
AI-Press: A Multi-Agent News Generating and Feedback Simulation System Powered by Large Language Models [33.0] 本稿では,マルチエージェントコラボレーションとRetrieval-Augmented Generationに基づく自動ニュース起草・研磨システムであるAI-Pressを紹介する。
人口分布を考慮した公共フィードバックを生成するフィードバックシミュレーションシステムを開発した。
本システムは,ニュース生成能力の大幅な向上を示し,公開フィードバックシミュレーションの有効性を検証した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:47:05 GMT)
Cross-View Completion Models are Zero-shot Correspondence Estimators [32.7] クロスビューコンプリートモデル内のクロスアテンションマップは、エンコーダやデコーダの特徴から導かれる他の相関関係よりも、より効率的に対応をキャプチャすることを示した。
ゼロショットマッチングと学習ベース幾何マッチングと多フレーム深度推定の両方を用いて,クロスアテンションマップの有効性を検証する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:58:20 GMT)
From Generation to Judgment: Opportunities and Challenges of LLM-as-a-judge [32.6] 人工知能(AI)と自然言語処理(NLP)において、長い間、評価と評価が重要な課題であった。
大規模言語モデル(LLM)の最近の進歩は"LLM-as-a-judge"パラダイムを刺激している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 00:35:03 GMT)
Humans as Checkerboards: Calibrating Camera Motion Scale for World-Coordinate Human Mesh Recovery [32.4] 本稿では,Human as Checkerboard (HAC) を用いた最適化フリースケールキャリブレーションフレームワークを提案する。
HACは、人間のメッシュ回復モデルによって予測される人体をキャリブレーション基準として革新的に活用する。
提案手法は,グローバルなヒューマンメッシュ推定タスクに対して,最先端の性能を新たに設定する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:37:32 GMT)
Task-level Distributionally Robust Optimization for Large Language Model-based Dense Retrieval [32.1] 本稿では,大規模言語モデルに基づくDense Retrievalファインタニングのためのタスクレベル分散ロバスト最適化(tDRO)を提案する。
tDROはドメインの重みをパラメータ化し、拡張されたドメイン勾配で更新する。
実験では、大規模検索ベンチマークの最適改善と、最大30%のデータセット使用率の削減が示されている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 03:24:29 GMT)
ReFF: Reinforcing Format Faithfulness in Language Models across Varied Tasks [32.0] FormatBenchは,大規模言語モデル(LLM)のフォーマット関連ベンチマークである。
ベンチマーク実験によると、最先端のオープンソースおよびクローズドソースのLLMは、フォーマット忠実性の深刻な欠如に悩まされている。
本稿では,LLMが汎用品質を損なうことなく,形式化された出力を生成するのを支援するために,ReFF(Reinforce Format Faithfulness)を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:03:25 GMT)
From Intention To Implementation: Automating Biomedical Research via LLMs [32.0] 本稿では,バイオメディカル研究プロセス全体を合理化するために設計された,初のエンドツーエンド自動システムであるBioResearcherを紹介する。
複雑なタスクを論理的に関連するサブタスクに分解することで、BioResearcherは多分野要求と論理複雑性の課題を効果的に解決する。
BioResearcherは8つの未測定研究目標に対して平均実行成功率63.07%を達成している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:35:05 GMT)
How Likely Do LLMs with CoT Mimic Human Reasoning? [31.9] 大規模言語モデル(LLM)から推論能力を引き出すための有望な手法として思考の連鎖が出現する
我々は,LLMにおける問題指導,推論,解答の関係を理解するために因果解析を用いる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:01:43 GMT)
BayesAdapter: enhanced uncertainty estimation in CLIP few-shot adaptation [30.4] ベイズ推定を利用して1点ではなく全確率分布を推定するベイズアダプタを導入する。
本手法は, キャリブレーションと選択的分類において, 精度の高い不確実性推定値を得る。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 20:48:06 GMT)
Dynamic Prompt Allocation and Tuning for Continual Test-Time Adaptation [29.9] 連続的テスト時間適応(CTTA)は、最近、継続的に進行するターゲット分布に適応するために出現している。
既存の手法は通常、モデルパラメータの変動を制限するために明示的な正規化項を含む。
学習可能なドメイン固有のプロンプトを導入し、モデルが対応する対象ドメインに適応するように誘導する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:24:04 GMT)
Mixture of neural fields for heterogeneous reconstruction in cryo-EM [29.8] 我々は、コンフォメーションとコンフォメーションの不均一性の両方をモデル化するアプローチであるHydraを提示する。
我々は、新しい可能性に基づく損失関数を用いて、タンパク質の混合物からなる合成データセットに対するアプローチの有効性を実証した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:26:38 GMT)
Sensing for Space Safety and Sustainability: A Deep Learning Approach with Vision Transformers [29.8] 本稿では,衛星物体検出(SOD)タスクと搭載型ディープラーニング(DL)タスクについて論じる。
GELAN-ViTとGELAN-RepViTと呼ばれる2つの新しいDLモデルが提案されている。
これらのモデルは平均平均精度(mAP)と計算コストにおいて最先端のYOLOv9-tを上回っている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 03:51:50 GMT)
Dspy-based Neural-Symbolic Pipeline to Enhance Spatial Reasoning in LLMs [29.7] 大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な能力を示してきたが、しばしば空間的推論に苦しむ。
本稿では LLM と Answer Set Programming (ASP) の反復的フィードバックにより LLM の空間推論能力を高める新しいニューラルシンボリックフレームワークを提案する。
我々は、StepGameとSparQAという2つのベンチマークデータセットに対するアプローチを評価した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:03:30 GMT)
The rate of convergence of Bregman proximal methods: Local geometry vs. regularity vs. sharpness [29.6] 与えられた手法の収束率は、関連するルジャンドル指数に大きく依存することを示す。
特に、境界解はゼロとノンゼロのルジャンドル指数を持つ手法の分離を示すことを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:37:59 GMT)
Efficient Semantic Splatting for Remote Sensing Multi-view Segmentation [29.6] 本稿では,ガウススプラッティングに基づくセマンティックスプラッティング手法を提案する。
提案手法は,RGB画像とセマンティックセグメンテーション結果を同時にレンダリングし,画像平面上に点雲のRGB属性と意味的特徴を投影する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:04:06 GMT)
FastLGS: Speeding up Language Embedded Gaussians with Feature Grid Mapping [29.5] 我々は高解像度で3Dガウススプラッティング(3DGS)内でリアルタイムなオープン語彙クエリをサポートするアプローチであるFastLGSを提案する。
FastLGSはLERFより98倍、LangSplatより4倍速い。
実験により、FastLGSは3Dセグメンテーションや3Dオブジェクトのインペイントなど、多くの下流タスクに適応し、互換性があることが示されている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:40:08 GMT)
Exploring the Limitations of Detecting Machine-Generated Text [29.1] テキストスタイルの異なるテキストで評価することで,機械生成テキストの検出のための分類性能を監査する。
分類器は文体的変化やテキストの複雑さの違いに非常に敏感であることがわかった。
今後の作業は、人書きテキストや機械生成テキストの文体的要因や難読度に対応することを推奨する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:44:12 GMT)
Dynamic-VLM: Simple Dynamic Visual Token Compression for VideoLLM [28.6] プロプライエタリなモデルから生成された大規模合成データセットを紹介する。
また、計算効率と性能のバランスをとる動的ビジュアルトークン圧縮アーキテクチャについても検討する。
提案手法は,様々な映像タスクにまたがって最先端の成果を達成し,印象的な一般化を示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:20:41 GMT)
Score and Distribution Matching Policy: Advanced Accelerated Visuomotor Policies via Matched Distillation [28.4] 視覚的モビリティ学習のためのスコア・アンド・ディストリビューション・マッチング・ポリシー(SDM Policy)を提案する。
SDMポリシーは拡散ベースのポリシーを2段階最適化プロセスを通じて単一ステップジェネレータに変換する。
最先端のアクション品質を持ちながら、6倍の推論スピードアップを達成する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:22:02 GMT)
Towards joint graph and sampling set selection from data [27.5] グラフ構造が事前に定義されていないシナリオにおいて,グラフ信号をサンプリングする問題について検討する。
既存のアプローチは、2段階のプロセスに依存しており、まずグラフを学習し、次にサンプリングする。
この研究は、グラフ構造とサンプリングセットを共同最適化するための基礎的なステップを提供する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:05:40 GMT)
Universal Prompt Optimizer for Safe Text-to-Image Generation [27.3] ブラックボックスシナリオにおける安全なT2I(POSI)生成のための最初の普遍的プロンプトを提案する。
提案手法は,不適切な画像を生成する際の様々なT2Iモデルの可能性を効果的に低減することができる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:18:18 GMT)
Design2GarmentCode: Turning Design Concepts to Tangible Garments Through Program Synthesis [27.2] 大規模マルチモーダルモデル(LMM)に基づく新しい縫製パターン生成手法を提案する。
LMMは多様な設計インプットを解釈するための直感的なインタフェースを提供する。
パターン作成プログラムは、よく構造化され、意味的に意味のあるミシンパターンの表現として機能する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:04:09 GMT)
OmniDrag: Enabling Motion Control for Omnidirectional Image-to-Video Generation [27.0] 我々はOmniDragを提案する。OmniDragはシーンレベルのモーションコントロールとオブジェクトレベルのモーションコントロールを両立させる。
事前学習した映像拡散モデルに基づいて,時間的注意層を付加した一方向制御モジュールを導入する。
さらに,動作制御信号を正確に抽出する球面運動推定器を開発した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:56 GMT)
Respect the model: Fine-grained and Robust Explanation with Sharing Ratio Decomposition [26.2] SRD(Sharing Ratio Decomposition)と呼ばれる新しいeXplainable AI(XAI)手法を提案する。
また、アクティベーション・パタン・オンリー予測(APOP)と呼ばれる興味深い観察結果を導入し、不活性ニューロンの重要性を強調した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:56:34 GMT)
Golden Noise for Diffusion Models: A Learning Framework [26.1] テキスト・ツー・イメージ拡散モデルは、テキストプロンプトとランダムなガウスノイズを提供することでパーソナライズされた画像を合成する一般的なパラダイムである。
テキスト画像のアライメントが向上し、人の好みが向上する「黄金のノイズ」を人々は見ているが、これらの黄金のノイズを得るための機械学習フレームワークはいまだに欠如している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:39:16 GMT)
Hidden Biases of End-to-End Driving Datasets [25.9] 私たちは、CARLA Leaderboard 2.0のエンドツーエンドの運転を初めて試みます。
トレーニングデータセットを体系的に分析し、新たな洞察を得る。
我々のモデルは2024年のCARLA Challengeの地図とセンサーのトラックでそれぞれ第1位と第2位にランクされている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:13 GMT)
Multi-Scale Heterogeneous Text-Attributed Graph Datasets From Diverse Domains [25.6] 我々は,HTAG上での機械学習モデルの現実的かつ再現可能な評価のための,困難かつ多様なベンチマークデータセットのコレクションを紹介する。
私たちのHTAGデータセットは、マルチスケールで、長期間にわたって、映画、コミュニティの質問応答、学術、文学、特許ネットワークなど、幅広い領域をカバーしています。
ソースデータ、データセット構築コード、処理されたHTAG、データローダ、ベンチマークコード、評価設定はすべて、GitHubとHugging Faceで公開されている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 04:58:32 GMT)
Reinforcement Learning Within the Classical Robotics Stack: A Case Study in Robot Soccer [25.2] モデルフリー強化学習(RL)を古典的なロボットスタックに組み込んだ新しいアーキテクチャを開発する。
私たちのアーキテクチャは2024年のRoboCup SPL Challenge Shield Divisionで勝利しました。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:25:10 GMT)
Learning Camera Movement Control from Real-World Drone Videos [25.1] 既存のAIビデオ撮影手法は、シミュレーショントレーニングにおいて、外観の多様性が限られている。
実世界のトレーニングデータを収集するスケーラブルな手法を提案する。
本システムでは,カメラの動きを効果的に学習できることが示される。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:54 GMT)
Deep Learning Model Security: Threats and Defenses [25.1] ディープラーニングはAIアプリケーションを変えたが、重要なセキュリティ課題に直面している。
この調査は、これらの脆弱性を調べ、それらのメカニズムとモデル完全性と機密性への影響を詳細に示す。
この調査は、自動化された防御、ゼロトラストアーキテクチャ、大規模AIモデルのセキュリティ上の課題を強調し、今後の方向性を結論付けている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:04:20 GMT)
RatBodyFormer: Rodent Body Surface from Keypoints [25.0] ラット体表面の高密度3次元試料を受動的に回収するための2つの重要な貢献点を紹介した。
ひとつは、ラットの行動キャプチャーのための新しいマルチカメラシステムRatDomeと、それを使ってキャプチャした大規模なデータセットだ。
第二のRatBodyFormerは、検出されたキーポイントを3Dボディサーフェスポイントに変換する新しいネットワークだ。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:00 GMT)
Autonomous Goal Detection and Cessation in Reinforcement Learning: A Case Study on Source Term Estimation [25.0] 強化学習は動的環境における意思決定プロセスに革命をもたらした。
正確な環境情報がないため、明確なフィードバック信号の提供は困難である。
本研究では,タスク完了時の自律目標検出と停止のための自己フィードバック機構を開発する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:12:06 GMT)
Evaluating Pixel Language Models on Non-Standardized Languages [24.9] ピクセルベースのモデルは、テキストをパッチに分割されたイメージに変換し、連続的な語彙表現を可能にする。
ケーススタディとしてドイツ語を用いて,様々な構文的・意味的タスクにおける画素ベースモデルとトークンベースモデルの比較を行った。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:11:45 GMT)
Localizing Memorization in SSL Vision Encoders [24.7] SSLエンコーダにおけるメモリのローカライズのための2つの指標について,レイヤ単位(Layermem)とユニット単位単位(unitmem)について提案する。
SSLのメモリ化は層深度とともに増加するが、高いメモリ化ユニットはエンコーダ全体に分散している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:48:25 GMT)
DesignRepair: Dual-Stream Design Guideline-Aware Frontend Repair with Large Language Models [24.5] DesignRepairは、コードアスペクトとレンダリングページアスペクトの両方から設計品質の問題を調べ、修復する、新しいデュアルストリーム設計ガイドライン対応システムである。
提案手法の有効性と有効性を評価し, 設計ガイドライン, アクセシビリティ, ユーザエクスペリエンスの指標への適合性を著しく向上した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:27:30 GMT)
Uncommon Belief in Rationality [24.0] 本稿では,エージェントが他のエージェントの合理性について持つであろう高次信念をグラフベースで表現する言語を提案する。
2つの主な貢献は、与えられた信念構造に基づく推論過程をキャプチャする解の概念と、任意の信念構造をユニークな最小の形式に圧縮する効率的なアルゴリズムである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:12:40 GMT)
Causal Action Influence Aware Counterfactual Data Augmentation [23.9] 我々は,オンライン環境のインタラクションにアクセスすることなく,固定データセットから合成トランジションを生成可能なデータ拡張手法であるCAIACを提案する。
因果的影響を定量化するための原理的手法を利用することで、状態空間の$itaction$-unffected部分を交換することで、反ファクト的推論を行うことができる。
これにより、分散シフトに対するオフライン学習アルゴリズムの堅牢性が大幅に向上する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:39:06 GMT)
Pragmatist: Multiview Conditional Diffusion Models for High-Fidelity 3D Reconstruction from Unposed Sparse Views [23.9] スパースから3D構造を推定すると、制約のない性質のため、予期せぬ観測は困難である。
近年,データ駆動型入力から暗黙の表現を直接予測し,有望な結果を得る方法が提案されている。
本研究では,限られた入力ビューから完全な観測結果を生成し,再構成を容易にする条件付き新規なビュー合成を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:36:51 GMT)
SPRec: Leveraging Self-Play to Debias Preference Alignment for Large Language Model-based Recommendations [23.9] SPRecは、過剰勧告を緩和し、追加のデータや手動による介入を必要とせずに公平性を向上させるために設計された、新しいセルフプレイレコメンデーションフレームワークである。
各セルフプレイイテレーションにおいて、モデルはSFTステップに続いてDPOステップを実行し、オフラインインタラクションデータを正のサンプルとして扱い、前回のイテレーションからの予測出力を負のサンプルとして扱う。
これにより、モデルのロジットを使用してDPO損失関数を効果的に再重み付けし、偏りのある項目を適応的に抑制する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:53:30 GMT)
EVQAScore: Efficient Video Question Answering Data Evaluation [23.8] 本稿では,ビデオキャプションとビデオQAデータ品質の両方を評価するためにキーワード抽出を利用する参照フリー手法EVQAScoreを紹介する。
提案手法は,Kendall相関32.8,Spearman相関42.3,従来のPAC-S++よりも4.7,5.9,動画キャプション評価5.9)。
データ選択にEVQAScoreを用いることで、元のデータボリュームのわずか12.5%でSOTA結果を達成し、以前のSOTA手法であるPAC-Sと100%のデータより優れていた。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:40:54 GMT)
Adaptive Prompting for Continual Relation Extraction: A Within-Task Variance Perspective [23.8] 本稿では,連続関係抽出における破滅的忘れに対処する新しい手法を提案する。
提案手法では各タスクにプロンプトプールを導入し,タスク内の変動を捉えるとともに,タスク間の差異を増大させる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:10:43 GMT)
FovealNet: Advancing AI-Driven Gaze Tracking Solutions for Optimized Foveated Rendering System Performance in Virtual Reality [23.2] 本稿では,システム性能の最適化を目的とした高度なAI駆動型視線追跡フレームワークである textitFovealNet を紹介する。
FovealNetは、以前の方法に比べて少なくとも$1.42タイムのスピードアップを実現し、ファーベイドアウトプットの知覚品質は13%向上した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:03:54 GMT)
R2G: Reasoning to Ground in 3D Scenes [22.9] R2G(Reasoning to Ground)は、3Dシーン内の対象物を推論的にグラウンド化するニューラルネットワークのシンボルモデルである。
R2Gは、セマンティックな概念に基づくシーングラフで3Dシーンを明示的にモデル化し、オブジェクトエンティティ間での注意伝達を反復的にシミュレートする。
Sr3D/Nr3Dベンチマークの実験により、R2Gは解釈可能性の向上を維持しつつ、以前の研究と同等の結果を得ることが示された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:50:24 GMT)
Temporal Action Localization with Cross Layer Task Decoupling and Refinement [22.9] 時間的アクションローカライゼーション(TAL)は、ビデオ内のアクションを分類し、ローカライズする2つのタスクを含む。
CLTDR(Cross Layer Task Decoupling and Refinement)を用いた新しいTAL法を提案する。
提案手法は,THUMOS14,MultiTHUMOS,EPIC-KITCHENS-100,ActivityNet-1.3,HACSの5つのベンチマークにおいて,最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:56:24 GMT)
Foundational Large Language Models for Materials Research [22.8] 大規模言語モデル(LLM)は、自動分析と予測を通じて材料研究を加速する機会を提供する。
本稿では,LLaMAモデルの継続事前学習を通じて発達した材料科学の基礎モデルであるLLaMatについて述べる。
LLaMatは、一般的な言語能力を維持しつつ、材料固有のNLPと構造化情報抽出に優れることを示した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:46:38 GMT)
Does Representation Matter? Exploring Intermediate Layers in Large Language Models [22.7] 大規模言語モデル(LLM)における中間表現の品質について検討する。
中間層は、最終層よりも下流のタスクに対してより情報的な表現をもたらすことがよくあります。
本研究は,LLMの内部力学とアーキテクチャ最適化とトレーニングのためのガイド戦略を照らしたものである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:48:51 GMT)
Mining Word Boundaries from Speech-Text Parallel Data for Cross-domain Chinese Word Segmentation [22.2] 我々はモントリオール強制アリグナー (MFA) ツールキットを用いて文字レベルのアライメントを行う。
収集したポーズの分析に基づいて、信頼できない単語境界をフィルタリングする効果的な確率ベース戦略を提案する。
我々はAISHELL2の評価データとして約1000文を注釈付けした。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:13:32 GMT)
From Lived Experience to Insight: Unpacking the Psychological Risks of Using AI Conversational Agents [21.7] 我々の研究は、個人の生きた経験を通して収集されたAIを使用することの心理的リスクに焦点を当てた、新しいリスク分類を提示する。
我々の分類学は、19のAI行動、21のネガティブな心理的影響、および個人に関連する15の文脈を特徴としている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:19:29 GMT)
Video Summarization using Denoising Diffusion Probabilistic Model [21.4] 本稿では,確率分布の観点から要約を生成する方法を学ぶ,映像要約のための生成フレームワークを提案する。
具体的には、雑音予測によりトレーニングデータの確率分布を学習するDDPM(Denoising Diffusion Probabilistic Model)に基づく新しい拡散要約法を提案する。
提案手法は主観的アノテーションノイズに耐性があり,識別法よりも訓練データを過度に適合させる傾向が低く,高い一般化能力を有する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:33:55 GMT)
Neural Text Normalization for Luxembourgish using Real-Life Variation Data [21.4] ByT5 と mT5 アーキテクチャを用いた最初のシーケンス・ツー・シーケンス正規化モデルを提案する。
実生活変動データを用いたシーケンスモデルは,ルクセンブルク語におけるテーラーメイド正規化に有効な手法であることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:50:55 GMT)
Multimodal Music Generation with Explicit Bridges and Retrieval Augmentation [21.4] マルチモーダル音楽生成は、テキスト、ビデオ、画像を含む様々な入力モダリティから音楽を生成することを目的としている。
既存の方法は、マルチモーダル融合に共通の埋め込み空間を用いる。
本稿では,テキストと音楽の明示的なブリッジを多モードアライメントに用いることで,これらの問題に対処する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:33:21 GMT)
Speech-Forensics: Towards Comprehensive Synthetic Speech Dataset Establishment and Analysis [21.2] 本稿では,音声サンプルの真正性,合成性,部分的偽造性を広範囲に網羅し,音声・フォレンジスデータセットを提案する。
我々はまた、認証検出、複数の偽セグメントのローカライゼーション、アルゴリズム認識を同時に行うことを目的とした、TEST(TEmporal Speech LocalizaTion Network)を提案する。
平均mAPは83.55%,EERは5.25%である。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:48:17 GMT)
Filter-then-Generate: Large Language Models with Structure-Text Adapter for Knowledge Graph Completion [21.0] 大規模言語モデル(LLM)は、膨大な固有の知識と優れた意味理解能力を示す。
実証的な証拠は、LLMは従来の知識グラフ補完手法よりも一貫して性能が悪いことを示唆している。
これらの課題に対処するために,FtGという新しい命令チューニング手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:22:04 GMT)
All You Need in Knowledge Distillation Is a Tailored Coordinate System [20.8] 知識蒸留(KD)は、大きな教師から小さな学生ネットワークに暗黒の知識を移すのに不可欠である。
既存のKD手法は、ターゲットタスクに特化して訓練された大きな教師に依存しており、非常に柔軟で非効率である。
我々はSSLを前提としたモデルが教師として効果的に機能し、その暗黒知識を座標系で捉えることができると論じる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:56:20 GMT)
OFTSR: One-Step Flow for Image Super-Resolution with Tunable Fidelity-Realism Trade-offs [20.7] OFTSRはワンステップ画像超解像のためのフローベースフレームワークであり、可変レベルの忠実度とリアリズムで出力を生成することができる。
我々は,一段階画像の超高解像度化を実現するとともに,忠実現実主義のトレードオフを柔軟に調整できることを実証した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:14:58 GMT)
UFO: Enhancing Diffusion-Based Video Generation with a Uniform Frame Organizer [20.1] UFO(Uniform Frame Organizer)と呼ばれる非侵襲的なプラグインを提案する。
UFOはどんな拡散ベースのビデオ生成モデルとも互換性がある。
UFOのトレーニングはシンプルで効率的で、最小限のリソースを必要とし、スタイリングされたトレーニングをサポートする。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:56:26 GMT)
Move and Act: Enhanced Object Manipulation and Background Integrity for Image Editing [20.0] インバージョンと編集という2つの分岐しか持たないチューニング不要な手法を提案する。
このアプローチにより、ユーザはオブジェクトのアクションを同時に編集し、編集されたオブジェクトの生成位置を制御することができる。
印象的な画像編集結果と定量的評価により,本手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:28:20 GMT)
From Imitation to Refinement -- Residual RL for Precise Assembly [20.0] 近年のビヘイビア・クローン(BC)の進歩により、ロボットに新しいタスクを教えるのが容易になった。
しかし、教育の容易さは信頼性の低いパフォーマンスを犠牲にしている。
我々は,BCの教えやすさと長期的能力を維持しながら信頼性を克服する,シンプルで効果的な方法であるResiPを考案した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:40:16 GMT)
Student-Informed Teacher Training [19.9] 特権教師による模倣学習は,画像などの高次元入力から複雑な制御行動を学ぶのに有効であることが証明されている。
この枠組みでは、教師は特権的なタスク情報で訓練され、生徒はより限られた観察で教師の行動を予測しようとする。
本研究では,教師と生徒の政策を共同で学習する枠組みを提案し,学生が模倣できる行動を学ぶことを指導する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:34:26 GMT)
Efficient Exploration and Discriminative World Model Learning with an Object-Centric Abstraction [19.6] エージェントにオブジェクト中心のマッピング(アイテムとその属性のセットを記述する)を与えることで、より効率的な学習が可能になるかどうかを検討する。
この問題は、ピクセルへの高レベルの状態抽象化でアイテムをモデル化し、プリミティブアクションへの高レベルの時間抽象化で属性を変更することで、階層的に最もよく解決されている。
我々は,識別的世界モデルを学ぶ完全モデルに基づくアルゴリズムを提案し,数に基づく本質的な報酬のみを用いて効率的に探索し,その後に発見された(抽象的な)状態に到達する計画を立てる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 21:05:33 GMT)
Illusion3D: 3D Multiview Illusion with 2D Diffusion Priors [19.6] ユーザが提供するテキストプロンプトや画像に基づいて、3次元のマルチビューイリュージョンを作成するための,シンプルで効果的なアプローチを提案する。
本手法は,事前学習したテキスト・画像拡散モデルを用いて,ニューラル3次元表現のテクスチャと形状を最適化する。
我々は,生成した3次元マルチビューイリュージョンの品質を向上させるために,いくつかの手法を開発した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:59 GMT)
Towards modeling evolving longitudinal health trajectories with a transformer-based deep learning model [19.5] トランスフォーマーベースのディープラーニングモデルをトレーニングするための簡単なアプローチを導入し、個人の軌道が時間とともにどのように変化するかを分析できるようにします。
本稿では,将来予測区間における共通疾患の発症を予測するための一般的な課題に焦点をあてる。
このモデルは、基本的な予測性能の観点から、双方向トランスフォーマーモデルを含む他のモデルと相容れない性能を示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:13:53 GMT)
Hyperbolic-constraint Point Cloud Reconstruction from Single RGB-D Images [19.2] 我々は3次元点雲再構成に双曲空間を導入し、低歪みの点雲における複雑な階層構造を表現・理解できるようにする。
我々のモデルは既存のモデルよりも優れており、アブレーション研究は我々のモデルとその構成要素の重要性を実証している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:27:39 GMT)
Addressing Attribute Leakages in Diffusion-based Image Editing without Training [18.9] ALE-Editは、3つのコンポーネントによる属性リークを最小限に抑える新しいフレームワークである。
ALE-Benchは属性リークを評価するためのベンチマークであり、ターゲット外およびターゲット内リークのための新しい指標である。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 04:32:38 GMT)
Multi-Task Learning with LLMs for Implicit Sentiment Analysis: Data-level and Task-level Automatic Weight Learning [18.8] 暗黙の感情分析は、有能なキュー語が欠如していることによる重大な課題を呈する。
MT-ISAは,大規模言語モデルの生成と推論機能を活用することでISAを強化する新しいMTLフレームワークである。
データレベルとタスクレベルの自動重み付け学習(AWL)を導入し、関係を動的に識別し、信頼性の高いデータや重要なタスクを優先する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:15:16 GMT)
GaGA: Towards Interactive Global Geolocation Assistant [18.7] GaGAは大きな視覚言語モデル(LVLM)上に構築された対話型グローバルジオロケーションアシスタントである
画像中の地理的手がかりを発見し、LVLMに埋め込まれた広い世界知識と組み合わせて位置情報を決定する。
GaGAはGWS15kデータセットの最先端のパフォーマンスを達成し、国レベルでは4.57%、都市レベルでは2.92%の精度を向上している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 03:39:44 GMT)
TouchTTS: An Embarrassingly Simple TTS Framework that Everyone Can Touch [18.7] 最近のLSMベースのTSは、通常、高品質なトレーニングデータを得るために複雑なデータ処理パイプラインを使用する。
本研究では、ノイズローバストなオーディオ・トークンーザ(S3Tokenizer)を利用して、シンプルで効率的なTSデータ処理パイプラインを設計する。
このパイプラインはデータ品質を維持しながら、データ取得コストを大幅に削減し、データの保持率50%以上を達成する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:01:11 GMT)
Return of EM: Entity-driven Answer Set Expansion for QA Evaluation [18.3] 本稿では,QAモデルの評価にエンティティ駆動型回答セット拡張を用いたソフトEMを提案する。
本手法は, 表面形状が実体の種類によっては特定のパターンに従うことがしばしばあるという観察に基づいて, 多様な表面形状を含むように金の解集合を拡張する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:34:36 GMT)
Importance Weighting Can Help Large Language Models Self-Improve [18.2] 大規模言語モデル(LLM)は多くのタスクやアプリケーションで顕著な能力を示している。
外部監視下での高品質なデータセットを用いた微調整LPMは、違法に高価である。
本稿では,DS重み法に着想を得たDS重みをDSEに近似する手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:56:20 GMT)
Harnessing the Power of LLM to Support Binary Taint Analysis [18.1] LATTEは、大規模言語モデル(LLM)を利用した最初の静的バイナリ・テナント解析である。
まず、LATTEは完全に自動化されているが、以前の静的バイナリのテナントアナライザは、テナント伝搬ルールと脆弱性検査ルールを手動でカスタマイズするために、人間の専門知識に依存する必要がある。
第2に、LATTEは脆弱性検出に極めて有効であり、包括的評価によって実証された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:29:45 GMT)
ASER: Activation Smoothing and Error Reconstruction for Large Language Model Quantization [18.0] ASERは、SVDを白化して構築したLoRAスタイルの行列を用いた量子化誤差に対する低ランク補償からなるアルゴリズムである。
ASERは、典型的な外れ値を低ビットの値に量子化することができる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:41:45 GMT)
Residual Channel Boosts Contrastive Learning for Radio Frequency Fingerprint Identification [18.0] 本稿では、RFFI(Radio Frequency Fingerprint Identification)のための残留チャネルに基づくデータ拡張戦略を提案する。
提案手法は,より少ないサンプルと少ない時間で,特徴抽出能力と一般化能力の両方を著しく向上させることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:48:20 GMT)
Enhancing Modality Representation and Alignment for Multimodal Cold-start Active Learning [18.0] MMCSAL(Multi-Modal Cold-Start Active Learning)のための2段階の手法を開発した。
まず、モーダル間のペアリング情報のみを自己超越信号として用いる場合、異なるモーダルからの表現のセントロイド間の有意な距離であるモダリティギャップを観測する。
次に、正規化によるクロスモーダルアライメントの強化を提案し、MMCSALにおける選択したマルチモーダルデータペアの品質を向上させる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:03:46 GMT)
Learn To be Efficient: Build Structured Sparsity in Large Language Models [17.9] 大きな言語モデル(LLM)は、その10億レベルのパラメータで驚くべき成功を収めていますが、高い推論オーバーヘッドを引き起こします。
既存の方法は、訓練後の環境で自然に形成された活性化空間の利用にのみ焦点をあてる。
本稿では,Learning-To-Efficient (LTE) という学習学習アルゴリズムを導入する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:28:56 GMT)
HieraFashDiff: Hierarchical Fashion Design with Multi-stage Diffusion Models [17.7] ファッションデザインに適した,ヒエラファッシュディフ(HieraFashDiff)という新しい階層的拡散型フレームワークを提案する。
我々のモデルは、デノシングプロセスを2段階に展開することで、実用的なファッションデザインワークフローを模倣するように設計されている。
本モデルでは,ファッションデザイン生成と局所的なきめ細かい編集を一つのフレームワークでサポートする。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:36:14 GMT)
Deep Learning and Machine Learning, Advancing Big Data Analytics and Management: Unveiling AI's Potential Through Tools, Techniques, and Applications [17.6] 人工知能(AI)、機械学習、ディープラーニングは、ビッグデータ分析と管理において変革の力となっている。
この記事では、これらの分野における基礎概念と最先端の展開について論じる。
理論的基盤を実行可能な戦略でブリッジすることで、ビッグデータ管理に革命をもたらすAIとLLMの可能性を示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:29:41 GMT)
Pinpoint Counterfactuals: Reducing social bias in foundation models via localized counterfactual generation [17.5] 本稿では,画像コンテキストを保存した局所的反事実生成手法を提案する。
提案手法は,最先端の代替手段よりも視覚的・意味的忠実度が高い。
カウンターファクトで微調整されたモデルでは、複数のメトリクス間で測定可能なバイアスの低減が示される。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:46:14 GMT)
Agent-based Video Trimming [17.5] ビデオトリミング(VT)という新しいタスクを導入する。
VTは、無駄な映像を検出し、貴重なセグメントを選択し、それらをコヒーレントなストーリーで最終ビデオに構成することに焦点を当てている。
AVTは、ユーザスタディにおいてより好ましい評価を受け、YouTube Highlights、TVSum、および我々のデータセットにおいて、より優れたmAPと精度を示した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:59:28 GMT)
AdaStop: adaptive statistical testing for sound comparisons of Deep RL agents [17.5] 本稿では,一組のアルゴリズムの性能を比較するための理論的に健全な手法を提案する。
AdaStopは、複数のグループシーケンシャルテストに基づく新しい統計テストである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:03:39 GMT)
Dynamic Contrastive Knowledge Distillation for Efficient Image Restoration [17.3] 画像復元のための動的コントラスト知識蒸留(DCKD)フレームワークを提案する。
具体的には,学生の学習状態を知覚するために,動的コントラスト正規化を導入する。
また,教師モデルと学生モデルの画素レベルのカテゴリ分布を抽出・調整する分布マッピングモジュールを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:01:17 GMT)
When Text Embedding Meets Large Language Model: A Comprehensive Survey [17.3] テキスト埋め込みは、ディープラーニング時代に自然言語処理(NLP)の基礎技術となった。
大規模言語モデル(LLM)と3つの主題に埋め込まれたテキストの相互作用を分類する。
我々は,LLM 以前の言語モデル (PLM) を用いて,LLM 以前の未解決課題を強調し,LLM がもたらした新たな障害を探求する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:50:26 GMT)
LLM-Personalize: Aligning LLM Planners with Human Preferences via Reinforced Self-Training for Housekeeping Robots [17.3] 大型言語モデル (LLM) はロボット工学の応用に大きな可能性を示している。
これらのモデルの個々のユーザの好みに対するパーソナライズには、重要なギャップが残っている。
LLMプランナを家庭用ロボティクス向けにパーソナライズするための最適化パイプラインを備えた新しいフレームワークであるLLM-Personalizeを紹介した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:12:51 GMT)
Empathy Level Alignment via Reinforcement Learning for Empathetic Response Generation [17.2] 強化学習(EmpRL)を用いた共感応答生成フレームワークを提案する。
本フレームワークは、効果的な共感報酬機能を開発し、強化学習により期待される報酬を最大化することにより共感応答を生成する。
自動評価と人的評価は、提案したEmpRLフレームワークが生成した応答の質を大幅に向上することを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:52:51 GMT)
Interpretable Generalized Additive Models for Datasets with Missing Values [17.1] M-GAMは、不足度指標とその相互作用項を組み込んだスパースで一般化された付加的モデリング手法である。
我々は,M-GAMが従来の手法と類似あるいは類似した精度を提供するとともに,インプット変数の内包や内包に対する空間性を大幅に向上することを示した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 22:15:24 GMT)
TCM-FTP: Fine-Tuning Large Language Models for Herbal Prescription Prediction [17.0] 伝統的な中国医学(TCM)は、様々な症状や兆候を何千年も治療するために処方薬中のハーブの特定の組み合わせに依存してきた。
TCM処方薬の予測は、重要な実用上の意味を持つ、魅力的な技術的課題を生じさせる。
textitDigestDSは、消化器系疾患の経験者による医療記録を含む新しいデータセットである。
また、textitDigestDS上で教師付き微調整を行うことで、事前訓練された大規模言語モデル(LLM)を活用するためのTCM-FTP(TCM Fine-Tuning Pre-trained)を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:40:22 GMT)
From Bench to Bedside: A Review of Clinical Trialsin Drug Discovery and Development [17.0] 臨床試験は、薬物開発プロセスに欠かせない部分である。
本論文は, 倫理的問題, 対象採用困難, 多様性, 代表性の懸念など, 臨床試験で直面する主な課題について論じる。
本論は,臨床治験の将来,特に遺伝子治療や免疫療法が臨床設計に及ぼす影響を楽しみにしている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:46:43 GMT)
The Utility and Complexity of In- and Out-of-Distribution Machine Unlearning [16.9] 我々は、近似アンラーニングの基本的な有用性、時間、空間複雑さのトレードオフを分析する。
実用性を損なうことなく、学習時間の複雑さを確実に改善する、頑健でノイズの多い勾配降下変種を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:54:38 GMT)
FD2-Net: Frequency-Driven Feature Decomposition Network for Infrared-Visible Object Detection [16.8] 赤外線可視物体検出(IVOD)は、赤外線と可視画像の相補的な情報を活用する。
既存の手法は相補的な情報の周波数特性を無視することが多い。
本稿では、FD2-Netと呼ばれる新しい周波数駆動型IVOD特徴分解ネットワークについて紹介する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:19:05 GMT)
Motor Imagery Classification for Asynchronous EEG-Based Brain-Computer Interfaces [16.8] 運動画像(MI)ベースの脳-コンピュータインタフェース(BCI)は、身体部分の想像的な動きを通じて外部デバイスを直接制御することができる。
非同期BCIは、明示的なトリガなしでユーザのMIを検出することを目的としている。
本稿では,MIベースの非同期BCIに対するスライディングウィンドウ事前スクリーニングと分類(SWPC)手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:15:01 GMT)
Generative Ghosts: Anticipating Benefits and Risks of AI Afterlives [16.8] 私たちの人生では、人々が愛する人と対話するカスタムAIエージェントや、死後のより広い世界を作るのが一般的になるかもしれません。
なぜなら、そのようなエージェントは、創造者が生み出したコンテンツではなく、新しいコンテンツを生成することができるからです。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 20:17:54 GMT)
GaussianOcc: Fully Self-supervised and Efficient 3D Occupancy Estimation with Gaussian Splatting [16.5] 本研究では, ガウススプラッティングとガウススプラッティングの2つの利用法を提案する。
その結果,GussianOcc法では,計算コストの低い競合性能において,完全に自己監督された3次元占有率推定が可能となった。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:42:30 GMT)
Improving generative adversarial network inversion via fine-tuning GAN encoders [16.5] GAN(Generative Adversarial Network)は、高品質な(HQ)画像を合成することができる。
GANインバージョン(英: GAN inversion)は、与えられた画像を潜在空間に逆戻りする方法を発見する技術である。
本稿では,事前学習と微調整を行うための自己教師型GANエンコーダを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:28:39 GMT)
Controlled Evaluation of Syntactic Knowledge in Multilingual Language Models [16.4] 本研究では,3つの低リソース言語を対象とした構文評価試験を開発した。
オープンアクセス型多言語トランスフォーマーLMの5つのファミリーを評価する。
いくつかの構文的タスクは、LMにとって比較的容易であるのに対して、他のタスクは困難である。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:21:19 GMT)
Training on the Test Task Confounds Evaluation and Emergence [16.3] テストタスクのトレーニングは、相対モデル評価と創発的能力に関するクレームの両方に矛盾があることを示します。
ベンチマーク評価において,テストタスクに対するトレーニングの効果を効果的に調整する手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:45:33 GMT)
Bayesian Optimization via Continual Variational Last Layer Training [16.1] 我々は,これらのモデルのトレーニングとGPの正確な条件付けを結びつけるために,変分ベイズ最後の層(VBLL)を構築した。
我々は、この接続を利用して、条件付けと最適化をインターリーブする効率的なオンライントレーニングアルゴリズムを開発する。
以上の結果から,VBLLネットワークは複雑な入力相関を持つタスクにおいてGPやBNNアーキテクチャを著しく上回っていることが示唆された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:21:50 GMT)
A Comprehensive Multi-scale Approach for Speech and Dynamics Synchrony in Talking Head Generation [16.0] マルチスケール音声-視覚同期損失とマルチスケール自動回帰GANを提案する。
マルチモーダル入力ピラミッド上でシンセサイザーモデルのスタックをトレーニングし、これらのモデルをマルチスケールジェネレータネットワークのガイダンスとして利用する。
実験により、頭部運動の動的品質の最先端よりも顕著な改善が示された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:05:25 GMT)
DECOR:Decomposition and Projection of Text Embeddings for Text-to-Image Customization [15.9] 本研究では、テキスト埋め込み行列を分解し、埋め込み空間の幾何学を理解するためにコンポーネント分析を行う。
不要なトークンベクトルに対してベクトル空間にテキスト埋め込みを投影するDECORを提案する。
実験により、DECORは最先端のカスタマイズモデルよりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:59:44 GMT)
GANPrompt: Enhancing Robustness in LLM-Based Recommendations with GAN-Enhanced Diversity Prompts [15.9] 大規模言語モデル(LLM)は、素早い単語の影響を受けやすい。
本稿では,GAN(Generative Adversarial Networks)に基づく多次元LCMの多様性フレームワークであるGANPromptを提案する。
このフレームワークは,GAN生成技術とLLMの深い意味理解機能を統合することにより,多様なプロンプトに対するモデルの適応性と安定性を向上させる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:48:27 GMT)
Multimodal Industrial Anomaly Detection by Crossmodal Reverse Distillation [15.9] マルチブランチ設計に基づくクロスモーダル逆蒸留(CRD)を提案する。
独立分岐を各モードに割り当てることで、各モード内の異常をより細かく検出することができる。
本手法は,マルチモーダル異常検出および局所化における最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:26:50 GMT)
GTDE: Grouped Training with Decentralized Execution for Multi-agent Actor-Critic [15.7] グループ化された訓練分散実行(GTDE)の新しい訓練パラダイムを提案する。
GTDEはローカル情報のみに依存しており、大規模マルチエージェントシステムのトレーニング要件を効果的に満たしている。
495エージェントの協調環境では,GTDEはベースラインに比べて平均382%の報酬を増大させた。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 03:01:36 GMT)
Video Anomaly Detection with Motion and Appearance Guided Patch Diffusion Model [15.7] 本稿では,ビデオ異常検出のためのパッチベース拡散モデルを提案する。
モデルにシームレスに統合された革新的な動きと外観条件を導入する。
提案手法の有効性を裏付ける4つの挑戦的ビデオ異常検出データセットの実験結果を得た。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:42:50 GMT)
PediaBench: A Comprehensive Chinese Pediatric Dataset for Benchmarking Large Language Models [15.6] LLM評価のための中国初の小児科用データセットであるPediaBenchを構築した。
対象質問4,565件、主観的質問1,632件、小児疾患グループ12件。
LLMの熟練度を徹底的に評価するために、異なる難易度に基づいて総合的なスコアリング基準を採用する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:20:14 GMT)
CoDTS: Enhancing Sparsely Supervised Collaborative Perception with a Dual Teacher-Student Framework [15.5] 我々は,CoDTS(Dual Teacher-Student framework)のエンドツーエンド協調認識を提案する。
適応的な補完学習を用いて、高品質な擬似ラベルと高品質な擬似ラベルの両方を生成する。
CoDTSは、品質と量の両方において、擬似ラベルの最適バランスを効果的に保証する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:52:55 GMT)
Personalized Coupled Tensor Decomposition for Multimodal Data Fusion: Uniqueness and Algorithms [15.5] データ融合の課題に対処するパーソナライズされたCTDフレームワークを提案する。
各データセットを2つのコンポーネントの和として表現するフレキシブルモデルが提案されている。
共通成分と異なる成分を計算するための2つのアルゴリズムが提案されている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:08:13 GMT)
Learning Novel Skills from Language-Generated Demonstrations [15.5] 現在、新しいスキルを取得するためのロボット学習アルゴリズムは、しばしばデモデータセットや環境相互作用に依存している。
本研究では,ロボットが自然言語から新しいスキルを習得するためのスキル学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:56:36 GMT)
CAS-GAN for Contrast-free Angiography Synthesis [15.5] 本稿では「仮想コントラストエージェント」として機能する新しいGANフレームワークであるCAS-GANについて述べる。
本手法は,X線アンギオグラフィーを背景および血管成分に分解し,医学的先行知識を活用する。
CAS-GANのFIDは5.87,MDは0.016であった。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:45:30 GMT)
Espresso: High Compression For Rich Extraction From Videos for Your Vision-Language Model [15.3] エスプレッソ(Espresso)は、空間情報と時間情報を別々に抽出し、圧縮する手法である。
本研究では,エスプレッソにおける空間的・時間的圧縮が,長大な映像理解能力に肯定的な影響を与えることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:31:47 GMT)
Multi-Stage Segmentation and Cascade Classification Methods for Improving Cardiac MRI Analysis [15.2] 心磁気共鳴画像のセグメンテーションと分類における深層学習に基づく新しいアプローチを提案する。
その結果,左心室では0.974,右心室では0.947のDice係数が得られた。
分類には,肥大型心筋症,心筋梗塞,拡張型心筋症などの心疾患を識別するために,深層学習分類器のカスケードが用いられた。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:53:14 GMT)
OneAdapt: Fast Configuration Adaptation for Video Analytics Applications via Backpropagation [15.1] ビデオやLiDARフィードのオブジェクト検出など、ストリーミングメディアデータに対するディープラーニング推論が、今やユビキタスになっている。
これらのアプリケーションは一般的に、ディープニューラルネットワーク(DNN)を実行するために、高忠実度データと広範なGPUリソースを集めるために、大きなネットワーク帯域幅を必要とする。
本稿では,3つの要件を同時に満たすOneAdaptについて述べる。最小限のGPUや帯域幅のオーバーヘッドで構成を適応すること,データがどのように最終的なDNNの精度に影響するかに基づいて,ほぼ最適に決定すること,さまざまな構成ノブに対して実施すること,である。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 03:59:45 GMT)
FAMNet: Frequency-aware Matching Network for Cross-domain Few-shot Medical Image Segmentation [15.1] 既存の数発の医用画像分割(FSMIS)モデルは、様々な画像技術によって引き起こされる領域シフトという、医療画像の実践的な問題に対処できない。
本稿では、周波数対応マッチング(FAM)モジュールとマルチスペクトル融合(MSF)モジュールの2つの主要なコンポーネントを含む周波数対応マッチングネットワーク(FAMNet)を提案する。
我々のFAMNetは、既存のFSMISモデルと3つのクロスドメインデータセット上のクロスドメインFew-shot Semanticモデルを上回っています。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:44:05 GMT)
Beware of Metacognitive Laziness: Effects of Generative Artificial Intelligence on Learning Motivation, Processes, and Performance [15.1] ハイブリッドインテリジェンスの概念はまだ初期段階にある。
学習者が様々なエージェントとの共生関係からどのような恩恵を受けるかは、いまだ不明である。
ChatGPTは、学習者の技術への依存を促進し、メタ認知遅延を引き起こす可能性がある。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:32:39 GMT)
LLAVIDAL: A Large LAnguage VIsion Model for Daily Activities of Living [15.1] 現在のLarge Language Models(LLVM)は、一般的な理解ではよく機能するが、詳細な時間的詳細には耐えられない。
この制限は、特別なADLビデオの授業調整と、モダリティ統合の欠如に起因している。
本稿では,多視点マルチモーダル RGBS 命令チューニングデータセットである ADL-X を作成した ADL データセットの半きめ細かいフレームワークを提案する。
ADLの複雑な関係をモデル化するために,ビデオ,3Dスケルトン,HOIをLLVMに統合するLLAVIDALも導入した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:58:34 GMT)
Counting-Stars: A Multi-evidence, Position-aware, and Scalable Benchmark for Evaluating Long-Context Large Language Models [14.9] textbfCounting-Starsは、長文LLMのマルチエビデンス検索能力を評価するために設計されたマルチエビデンス、位置認識、スケーラブルなベンチマークである。
GPT-4 Turbo, Gemini 1.5 Pro, Claude3 Opus, GLM-4, Moonshot-v1 などの長文 LLM の評価実験を行った。
Gemini 1.5 Proは、GPT-4 Turboは、様々なタスクで最も安定したパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:45:29 GMT)
MiniScope: Automated UI Exploration and Privacy Inconsistency Detection of MiniApps via Two-phase Iterative Hybrid Analysis [14.8] より大きなSuperApps内で運用されているMiniAppsは、個々のアプリのダウンロードを必要とせずに、幅広いサービスを提供することによって、ユーザエクスペリエンスに革命をもたらした。
既存のプライバシー規制とプラットフォームガイドラインにもかかわらず、ユーザーのプライバシーを完全に保護するための効果的なメカニズムが欠如している。
我々は,MiniApp環境向けに設計された新しい2相ハイブリッド分析手法であるMiniScopeを紹介する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 04:01:03 GMT)
AlphaForge: A Framework to Mine and Dynamically Combine Formulaic Alpha Factors [14.8] 本稿では,アルファ因子マイニングと因子組み合わせのための2段階のアルファ生成フレームワークAlphaForgeを提案する。
実世界のデータセットを用いて行った実験により,我々の提案したモデルは,定式的アルファファクターマイニングにおいて,同時代のベンチマークより優れていることが示された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:28:17 GMT)
ViCaS: A Dataset for Combining Holistic and Pixel-level Video Understanding using Captions with Grounded Segmentation [14.5] ViCaSは、何千もの挑戦的なビデオを含む新しいデータセットだ。
本稿では、何千もの挑戦的なビデオを含む新しいデータセットViCaSを紹介する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:10:54 GMT)
Towards Secure and Private AI: A Framework for Decentralized Inference [14.5] 大規模マルチモーダル基盤モデルは、スケーラビリティ、信頼性、潜在的な誤用に関する課題を提示する。
分散システムは、ワークロードの分散と障害の中心的なポイントの緩和によるソリューションを提供する。
これらの課題に対処するためには、AI開発に責任を負うように設計された包括的なフレームワークを使います。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:10:51 GMT)
Distributed Intelligent System Architecture for UAV-Assisted Monitoring of Wind Energy Infrastructure [14.5] 本稿では、風力タービンの欠陥を検出するために、視覚データの動的収集とリアルタイム処理のために設計された新しいインテリジェントシステムアーキテクチャを提案する。
このシステムは、検査精度と効率を高めるために、分散フレームワーク内で高度なアルゴリズムを使用する。
ウクライナの "Staryi Sambir-1" 風力発電施設で実施された実験は、このシステムの有効性を実証している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:53:58 GMT)
Optimized 3D Point Labeling with Leaders Using the Beams Displacement Method [14.4] リーダーレーベルは、ポジション・コンフィギュレーションにおいて大きな自由を持っている。
我々は,地図変位問題の解法に類似したラベル位置の動的構成過程を概念化する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:03:20 GMT)
Zero-Shot Scene Change Detection [14.1] 本手法は,連続するフレームの代わりに参照画像とクエリ画像を入力することで,追跡モデルの変化検出効果を利用する。
我々は、シーン変化検出の性能を高めるために、リッチな時間情報を活用して、ビデオへのアプローチを拡張した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:12:13 GMT)
SEGT: A General Spatial Expansion Group Transformer for nuScenes Lidar-based Object Detection Task [14.0] 空間拡張群変換器 (SEGT) と呼ばれる, nuScenes lidar を用いたオブジェクト検出タスクのためのトランスフォーマーベースのフレームワークを提案する。
点雲の不規則でスパースな性質を効果的に扱えるように,一般空間展開戦略を用いて,ボクセルを異なる特殊順序場へ移行することを提案する。
本研究では,多様な拡張戦略を交互に適用することにより,異なる順序の分野にまたがる特徴表現を統合することにより,包括的空間情報を捕捉するモデルの能力を高める。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:23:07 GMT)
Dialogue Language Model with Large-Scale Persona Data Engineering [13.9] PPDSはオープンドメインのペルソナ対話システムであり、ペルソナの一貫性を高めるためにペルソナ対話データセットに広範囲な生成前トレーニングを利用する。
本研究では,自律的かつ高精度な対話データセット生成を目的としたペルソナ抽出モデルを提案する。
また、構築されたデータセットに固有の無効なペルソナバイアスに対処するために、先駆的なペルソナ拡張手法を公表した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:49:06 GMT)
Text-Video Multi-Grained Integration for Video Moment Montage [13.8] ビデオモーメント・モンタージュ(VMM)と呼ばれる新しいタスクは、事前に提案されたナレーションテキストに基づいて、対応するビデオセグメントを正確に見つけることを目的としている。
我々は,スクリプトからテキスト機能を効率的に融合させる新しいテキストテキスト-ビデオ多言語統合手法 (TV-MGI) を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:40:59 GMT)
MVC-VPR: Mutual Learning of Viewpoint Classification and Visual Place Recognition [13.7] 本稿では,視点的自己分類と視覚的位置認識の相互学習を紹介する。
データセットは、位置認識のための記述子抽出器を同時に訓練しながら、教師なしの方法で分割される。
提案手法は, 基底真理ラベルを用いてデータセットを分割する, 最先端(SOTA)手法を抽出する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:49:18 GMT)
Regulation of Language Models With Interpretability Will Likely Result In A Performance Trade-Off [13.5] 規制は、機械学習において最も重要で迫り強い関心事として、ますます引用されている。
本稿では,拡張可能な大言語モデル(LLM)を構築することにより,これらの疑問に答えようとする。
従来考慮されていなかった「規制性能トレードオフ」は,従来の7.34%の分類性能低下という形で明らかにされている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:11:06 GMT)
Language model driven: a PROTAC generation pipeline with dual constraints of structure and property [13.4] LM-PROTACパイプラインは、Wnt3aを阻害できるPRTAC分子を正常に生成する。
その結果, DCT は Wnt3a を標的とし加水分解する PROTAC を効率的に生成できることがわかった。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:15:12 GMT)
Alternating minimization algorithm with initialization analysis for r-local and k-sparse unlabeled sensing [13.4] 実験の結果,提案アルゴリズムは高速で,置換モデルにも適用でき,測定行列の選択にも頑健であることがわかった。
また,リンク線形回帰問題に対して,本アルゴリズムを複数の実データセット上で検証し,ベースライン法よりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:34:09 GMT)
Learning and Current Prediction of PMSM Drive via Differential Neural Networks [13.4] 本研究では,ディファレンシャルニューラルネットワーク(DNN)を用いた非線形システムのモデル化手法を提案する。
本手法の有効性は, 各種負荷乱れおよび無負荷条件下で行った実験により検証した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:43:27 GMT)
DisPose: Disentangling Pose Guidance for Controllable Human Image Animation [13.4] 本稿では、高密度入力を伴わずに、より汎用的で効果的な制御信号を抽出するDisPoseを提案する。
DisPoseは、人間の画像アニメーションにおけるスパーススケルトンポーズをモーションフィールドガイダンスとキーポイント対応に分解する。
既存のモデルにシームレスに統合するために,プラグイン・アンド・プレイハイブリッド・コントロールネットを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:15:59 GMT)
Foundation Models and Adaptive Feature Selection: A Synergistic Approach to Video Question Answering [13.3] 我々は,マルチモーダルな知識をよりよく統合する3つの主要なイノベーションを取り入れたローカル・グローバル質問意識ビデオ埋め込み(LGQAVE)を紹介した。
LGQAVEは、質問に関する最も関連性の高いフレームを正確に識別するクロスアテンション機構を利用することで、従来のアドホックフレームサンプリングを越えている。
追加のクロスアテンションモジュールは、これらのローカルおよびグローバルな埋め込みを統合して、最終ビデオ埋め込みを生成する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:39:07 GMT)
A second-order-like optimizer with adaptive gradient scaling for deep learning [13.2] INNApropは、INNA法とRMSprop適応勾配スケーリングを組み合わせた最適化アルゴリズムである。
InNAprop on CIFAR-10, Food101, ImageNet with ResNets, VGG, DenseNet, ViT, and on GPT-2 (OpenWebText) train from scratch and with LoRA fine-tuning (E2E)。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:07:07 GMT)
Dial-In LLM: Human-Aligned Dialogue Intent Clustering with LLM-in-the-loop [13.1] 我々は,大言語モデルの優れた言語理解能力を活用して,よりよい校正意図クラスタリングアルゴリズムを設計する。
本稿では,クラスタレベルの改善と高品質なクラスタの継続的な発見を容易にする反復クラスタリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:19:01 GMT)
Go With the Flow: Fast Diffusion for Gaussian Mixture Models [13.0] Schr"odinger Bridges (SB) は、適切なコスト関数を最小化しながら、有限時間で与えられた初期分布を他の最終状態に分配する拡散過程である。
本稿では,ある分布から別の分布へシステムをステアリングするための一組のSBポリシーの潜在メトリゼーションを提案する。
オートエンコーダの空間における画像から画像への変換のような低次元問題におけるこのアプローチの可能性を示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:40:22 GMT)
CLUE-MARK: Watermarking Diffusion Models using CLWE [13.0] 本稿では,拡散モデルに対する最初の検出不能な透かし方式であるCLUE-Markを紹介する。
CLUE-Markは、ウォーターマークされたモデルの変更を一切必要とせず、計算効率が良く、モデル出力の品質に影響を与えないことが保証されている。
CLUE-Markは、最近のステガノグラフィー攻撃では検出や除去ができない。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:31:18 GMT)
Accurate Link Prediction for Edge-Incomplete Graphs via PU Learning [12.9] エッジ不完全グラフが与えられたら、どのようにして不足するリンクを正確に見つけることができるのか?
本稿では, PULL (PU-Learning-based Link predictor) を提案する。
PULLは、エッジ不完全グラフのリンクを予測するベースラインを一貫して上回る。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:17:19 GMT)
Single-View Graph Contrastive Learning with Soft Neighborhood Awareness [12.7] グラフコントラッシブ・ラーニング(GCL)の手法の多くは、クロスビューコントラストに大きく依存している。
本稿では,新しいシングルビューグラフコントラスト学習フレームワークttSIGNAを提案する。
多様なノードレベルのタスクの実験は、我々の単純な単一ビューGCLフレームワークが21.74%(PPI)のマージンで既存のメソッドを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:20:23 GMT)
Distance-Adaptive Quaternion Knowledge Graph Embedding with Bidirectional Rotation [12.7] 四元数には1つの実部と3つの虚部が含まれており、知識グラフを学習するためのより表現豊かな超複素空間を提供する。
既存の四元数埋め込みモデルは、意味的マッチングまたは幾何距離スコアリング関数を通して三重項の妥当性を測定する。
そこで本研究では,意味マッチングと実体の幾何学的距離を組み合わせた四元数知識グラフ埋め込みモデルを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:04:39 GMT)
Evaluating Adversarial Attacks on Traffic Sign Classifiers beyond Standard Baselines [12.5] 交通標識分類モデルに対するアドリアック攻撃は、実世界で最初に成功した試みの1つであった。
モデルアーキテクチャをデータセットから切り離し、さらなるジェネリックモデルで評価し、公正な比較を行う。
その結果, LISA-CNN や GTSRB-CNN のような標準ベースラインは, 一般的なベースラインよりもはるかに感受性が高いことがわかった。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:36:26 GMT)
L-WISE: Boosting Human Image Category Learning Through Model-Based Image Selection And Enhancement [12.5] 本研究では,人間の視覚的学習を,テスト時に人間の分類精度を向上させる方法で強化することを提案する。
学習強化手法は, モデル推定による認識困難度に基づく画像選択と, (ii) 初心者の認識を支援する画像摂動を用いて構成する。
我々の知る限りでは、ANNがカテゴリー特化機能を強化して人間の視覚学習能力を高めるのはこれが初めてである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:57:01 GMT)
A Framework for Using LLMs for Repository Mining Studies in Empirical Software Engineering [12.5] 大規模言語モデル(LLM)は、ソフトウェアリポジトリを分析する革新的な方法を提供することで、ソフトウェア工学(SE)を変革した。
私たちの研究は、PRIMES(Prompt Refinement and Insights for Mining Empirical Software repository)というフレームワークをまとめています。
この結果,PRIMESの標準化により,LLMを用いた研究の信頼性と精度が向上することが示唆された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:52:19 GMT)
An Efficient Framework for Enhancing Discriminative Models via Diffusion Techniques [12.5] 画像分類のための拡散ベース識別モデル拡張フレームワーク(DBMEF)を提案する。
このフレームワークは、差別的および生成的モデルをトレーニング不要な方法でシームレスに統合する。
DBMEFは、プラグアンドプレイ方式で識別モデルの分類精度と能力を効果的に向上させることができる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:46:22 GMT)
MM-Tracker: Motion Mamba with Margin Loss for UAV-platform Multiple Object Tracking [12.3] 無人航空機プラットフォームからの複数の物体追跡(MOT)には、効率的なモーションモデリングが必要である。
本研究では,ローカル・グローバル両方の動作特徴を探索するMotion Mamba Moduleを提案する。
また,動きのぼやけた物体の検出精度を効果的に向上するために,運動マージンの損失を設計する。
Motion Mambaモジュールとモーションマージンの損失に基づいて、提案したMM-Trackerは、2つの広くオープンソースUAV-MOTデータセットで最先端のデータを上回ります。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:11:11 GMT)
Nearly Minimax Optimal Submodular Maximization with Bandit Feedback [12.3] 我々は、最大$f(S_*)$と$|S_*| = k$との近似について学習者の後悔を最小限に抑える。
この作業では、$tildeOmega(min_L le k(T2/3 + sqrtn choose k - LT)$ のようにスケールするこの設定に対して、最初の minimax lower bound を確立する。
わずかに制限されたアルゴリズムクラスに対して、$tildeOmega(min_L)の強い後悔の低い境界を証明する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:24:47 GMT)
A simple thinking about the application of the attention mechanism in medical ultrasound image segmentation task [12.3] 超音波画像中の病変や組織を分類または診断するためのベンチマーク注意適応フレームワーク(BAAF)を提案する。
BAAFは並列ハイブリッドアテンションモジュール(PHAM)と適応キャリブレーション機構(ACM)から構成される。
BAAFの設計は、CNNにおける「何」と「どこに」の焦点と選択の問題をさらに最適化し、医療用超音波画像における病変や組織のセグメンテーション精度を改善することを目指している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:42:35 GMT)
CAPrompt: Cyclic Prompt Aggregation for Pre-Trained Model Based Class Incremental Learning [12.2] 本稿では,タスクID予測への依存性を排除するために,新しいCAPromptアグリゲーション法を提案する。
凹凸条件下では、集約プロンプトは単一のタスク固有のプロンプトを選択するよりも低いエラーを達成する。
提案したCAPromptは最先端手法を2%-3%上回る性能を示した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 04:34:28 GMT)
TelApart: Differentiating Network Faults from Customer-Premise Faults in Cable Broadband Networks [12.2] 本稿では,ケーブルブロードバンドネットワークの故障診断システムであるTelApartを紹介する。
TelApartの設計と統合することは、同じ異常パターンを共有するケーブルデバイスをグループ化する教師なしの機械学習モデルである。
我々は,ケーブルISPが提供した実世界のデータを用いて,TelApartが様々な種類の障害を効果的に識別できることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 22:07:17 GMT)
Improving the Reliability of Cable Broadband Networks via Proactive Network Maintenance [12.2] ケーブルブロードバンドネットワークは、アメリカ合衆国で広く普及している数少ない「ラストマイル」ブロードバンド技術の一つである。
パブリックドメインの既存のツールは、高い偽陽性率を禁止しています。
PNMデータに機械学習技術を適用する最初のパブリックドメインシステムであるCableMonを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:49:11 GMT)
SAGED: A Holistic Bias-Benchmarking Pipeline for Language Models with Customisable Fairness Calibration [12.1] SAGED(bias)はこれらの問題に対処する最初の総合的なベンチマークパイプラインである。
私たちは、Gemma2、Llama3.1、Mistral、Qwen2など、人気のある8bレベルのモデルでG20諸国でSAGEDを使用しています。
感情分析により、MistralとQwen2はGemma2やLlama3.1よりも最大差とバイアス濃度が低いが、すべてのモデルがロシアや(Qwen2を除く)中国に偏っていることが判明した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:33:01 GMT)
UniBias: Unveiling and Mitigating LLM Bias through Internal Attention and FFN Manipulation [12.0] フィードフォワードニューラルネットワーク(FFN)とアテンションヘッドが大規模言語モデル(LLM)のバイアスをもたらすかを検討する。
これらのバイアスを軽減するために,推定のみの手法であるUniBiasを導入し,バイアス付きFFNベクトルとアテンションヘッドを効果的に識別・除去する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:46:44 GMT)
Disentangling Mean Embeddings for Better Diagnostics of Image Generators [12.0] 本稿では,平均埋め込みの余弦的類似性を,個々の画素クラスタに対する余弦的類似性(cosine similarity)の積に拡張する手法を提案する。
実世界の様々なユースケースにおいて、モデル誤動作の画素領域を識別する可能性や説明性をいかに向上させるかを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:21:03 GMT)
On the Workflows and Smells of Leaderboard Operations (LBOps): An Exploratory Study of Foundation Model Leaderboards [12.0] 本研究は、これらのFMリーダーボードが現実世界のシナリオでどのように動作するかを理解することに焦点を当てる("clainboard operations")。
最大1,045個のFMリーダーボードを5つのソースから収集し、ドキュメントを調べ、リーダーボードオペレーターと直接通信する。
次に、LBOpsの8つのユニークなタイプのリーダボード臭いを特定します。これらの臭いを緩和することで、SEチームは、現在のLBOpsプラクティスにおける透明性、説明責任、コラボレーションを改善することができます。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:59:23 GMT)
High-Rate Phase Association with Travel Time Neural Fields [11.9] HARPAは、深層生成モデルと走行時間ニューラルフィールドを活用することで波動物理学を取り入れた高速度アソシエーションフレームワークである。
これは、実際の地震データと複雑な合成モデルの両方において、最先端のアソシエーション手法より優れている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 00:56:29 GMT)
Explaining Model Overfitting in CNNs via GMM Clustering [11.9] 畳み込みニューラルネットワーク(CNN)はコンピュータビジョンの分野で顕著な進歩を見せている。
しかし、それらの不透明な意思決定プロセスは、実用的な応用に重大な課題をもたらす。
モデル内の個々のフィルタに対応する特徴マップをクラスタリングすることで,CNNフィルタを評価するための定量的指標を提供する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:13:18 GMT)
From Text to Trajectory: Exploring Complex Constraint Representation and Decomposition in Safe Reinforcement Learning [11.9] 手作業で設計したコスト関数を置き換えるために,T Trajectory-level Textual Constraints Translator (TTCT)を導入した。
実験の結果,TTCTはテキストの制約や軌道を効果的に理解しており,TTCTが訓練したポリシーは標準コスト関数よりも低い違反率が得られることがわかった。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 04:06:54 GMT)
HGCH: A Hyperbolic Graph Convolution Network Model for Heterogeneous Collaborative Graph Recommendation [11.7] 異種協調グラフに多様な側面情報を統合する協調フィルタリングのための改良されたHGCNモデルを提案する。
その結果,HGCHは競争的な結果が得られ,最上位のベースラインを上回る結果が得られた。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:21:44 GMT)
Shiksha: A Technical Domain focused Translation Dataset and Model for Indian Languages [11.5] 我々は、8つのインドの言語にまたがる280万行以上の英語とインデックスとインデックスの高品質な翻訳ペアを含む並列コーパスを作成します。
我々は、このコーパスを用いてNMTモデルを微調整し、評価し、ドメイン内のタスクで利用可能な他のすべてのモデルを超えます。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:40:55 GMT)
Multi-view Clustering via Unified Multi-kernel Learning and Matrix Factorization [11.5] マルチビュークラスタリングがますます重要になっているのは、実世界のデータのマルチソース特性のためである。
本稿では,マルチカーネル学習と行列分解を組み合わせたマルチビュークラスタリング手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:52:27 GMT)
EmbedGenius: Towards Automated Software Development for Generic Embedded IoT Systems [11.5] 本稿では,汎用IoTシステムのための,最初の完全自動化ソフトウェア開発プラットフォームであるEmbedGeniusを紹介する。
鍵となるアイデアは、Large Language Models(LLM)の推論能力と組み込みシステムの専門知識を活用して、ループ内ハードウェア開発プロセスを自動化することである。
71のモジュールと350以上のIoTタスクを備えた4つのメインストリームの組み込み開発プラットフォームで、EmbedGeniusのパフォーマンスを評価しました。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:34:12 GMT)
Reverse-type Data Processing Inequality [11.0] 量子データ処理の不等式(quantum data processing inequality)は、2つの量子状態がノイズチャネルを適用すると識別しにくくなることを主張する。
逆量子データ処理の不等式は、ノイズチャネルの適用後に識別可能性が保存されるかどうかを特徴付ける。
本研究では、量子チャネルの相対エントロピーの収縮係数と膨張係数を通してこれらの概念を探求する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:36:41 GMT)
Wait-Less Offline Tuning and Re-solving for Online Decision Making [11.0] LP法と1次LP法の長所を組み合わせた新しいアルゴリズムを提案する。
我々のアルゴリズムは、$mathscrO(log (T/f) + sqrtf)$ regretを達成し、「待機なし」オンライン意思決定プロセスを提供する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:58:14 GMT)
Enhancing Convergence of Decentralized Gradient Tracking under the KL Property [10.9] 我々は,分散勾配追跡に基づくアルゴリズムであるSONATAに対して,同じタイプの収束性を確立する。
これは、いつを除いて集中的な勾配アルゴリズムの収束挙動と一致する。
thetain (1/2,1)$, sub rate is confirmed; and
textbf(iii)$ if $thetain (1/2, 1)$, sub rate is certificate; and
textbf(iii)$ if $thetain (1/2,1)$, sub rate が認証される。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:44:36 GMT)
A Theoretical Analysis of Soft-Label vs Hard-Label Training in Neural Networks [10.8] ハードラベルを用いた小さなニューラルネットワークを直接トレーニングするよりも、ソフトラベルトレーニングがニューロンを必要としない理由が示されている。
まず、二項分類問題に対する単純なニューラルネットワークモデルによる実験結果の動機付けについて述べる。
次に、2層ニューラルネットワークモデルに基づく理論的貢献でこれらの観測を裏付ける。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:54:07 GMT)
Forecasting GPU Performance for Deep Learning Training and Inference [10.7] NeuSightは、トレーニングと推論の両方のために、実際の実行を必要とせずに、見えないGPU上で、さまざまなディープラーニングモデルのパフォーマンスを予測するフレームワークである。
NeuSightは、単一のディープラーニングカーネル予測をタイルと呼ばれる小さなワーキングセットに分解し、GPU上で独立して実行される。
121.4%と30.8%から2.3%に減少し、H100のトレーニングと推論のGPT3モデルの遅延を予測する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 03:21:13 GMT)
The Software Documentor Mindset [10.6] そこで、26人のボランティアドキュメンテーションコントリビュータ、すなわちドキュメンテーションコントリビュータにインタビューを行い、その理由と、それらのドキュメンテーションの作り方について聞いた。
ドキュメンテーションのコントリビューションプロセスにおいて,ドキュメンテーション担当者が持つ16の考察を,モチベーション,トピック選択技術,スタイリング目的の3つの側面に沿って特定した。
本稿では,ドキュメントのコントリビューションプロセスに関する推論の枠組みとして,考え方の構造とその3つの側面にわたる考察を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:28:08 GMT)
Predicting Emergency Department Visits for Patients with Type II Diabetes [10.5] 3000万人以上のアメリカ人がII型糖尿病(T2D)に罹患している。
本研究の目的は、機械学習(ML)技術を用いて、T2D患者の救急部門(ED)訪問を推定する予測モデルの開発と評価である。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:37:32 GMT)
HiRED: Attention-Guided Token Dropping for Efficient Inference of High-Resolution Vision-Language Models in Resource-Constrained Environments [10.5] High-Resolution Early Dropping (HiRED) は、大規模言語モデルの前に固定トークン予算内で機能するトークンドロップ方式である。
HiREDは既存の高解像度ビジョンランゲージモデルとプラグイン・アンド・プレイで統合することができる。
NVIDIA TESLA P40 GPU上のLLaVA-Next-7Bに適用されると、20%のトークン予算を持つHiREDはトークン生成スループットを4.7向上し、ファーストトーケン生成遅延を15秒短縮し、単一の推論のために2.3GBのGPUメモリを節約する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:51:26 GMT)
YingSound: Video-Guided Sound Effects Generation with Multi-modal Chain-of-Thought Controls [10.4] YingSoundは、ビデオ誘導音声生成のための基礎モデルである。
数ショット設定で高品質なオーディオ生成をサポートする。
本稿では,YingSoundが自動評価と人間の研究を通じて,高品質な同期音を効果的に生成できることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:55:57 GMT)
Tunable ultrahigh reflection with broadband via collective atom-atom interaction in waveguide-QED system [10.4] 本稿では,1次元導波路量子電磁力学(QED)系における原子-原子相互作用によるフォトニックバンドギャップの構築によりブロードバンド完全反射を実現する手法を提案する。
我々は,ブラッグ距離付近で分離した原子の数を増やし,原子間の勾配周波数変調を誘導するなど,超高反射窓をさらに拡張するためのいくつかの戦略を提案する。
この結果は導波管-QED系の多体物理を豊かにし、制御可能な方法で拡張された超高反射を実現するための経路を提供する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:43:12 GMT)
DomCLP: Domain-wise Contrastive Learning with Prototype Mixup for Unsupervised Domain Generalization [10.3] InfoNCEによるインスタンス識別タスクに基づく自己教師付き学習(SSL)手法は、目覚ましい成功を収めた。
UDGアプローチはInfoNCEと対照的な学習を利用して表現を生成する。
そこで我々は,DomCLP,ドメインワイドコントラスト学習とプロトタイプミックスアップを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:59:08 GMT)
RingFormer: A Ring-Enhanced Graph Transformer for Organic Solar Cell Property Prediction [10.3] RingFormerは、OSC分子の原子およびリングレベルの構造パターンをキャプチャするために特別に設計されたグラフトランスフォーマーフレームワークである。
5つのOSC分子データセット上でのRingFormerの有効性を広範囲な実験により評価した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:45:17 GMT)
Boundaries of the sets of quantum realizable values of arbitrary order Bargmann invariants [10.0] 任意の順序のバーグマン不変量に対する量子化可能値の境界について検討する。
我々の発見は、バーグマン不変量と虚性の間の複雑な関係を明らかにし、関連する境界曲線について統一的な視点を提供する。
これらの結果は量子力学における物理限界の理解を高め、量子情報処理におけるバーグマン不変量の新しい応用につながる可能性がある。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:54:11 GMT)
Towards Understanding the Robustness of LLM-based Evaluations under Perturbations [9.9] 大言語モデル(LLM)は、要約やダイアログベースのタスクにおいて、非標準化メトリクスの自動評価器として機能する。
人間の判断に比較して,LLMが品質評価指標としていかに優れているかを検討するために,複数のプロンプト戦略にまたがる実験を行った。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:31:58 GMT)
Towards a Multimodal Large Language Model with Pixel-Level Insight for Biomedicine [9.9] MedPLIBという名前のバイオメディカルドメインのための新しいエンド・ツー・エンド・マルチモーダル・大規模言語モデルを導入する。
視覚的質問応答(VQA)、任意のピクセルレベルのプロンプト(ポイント、バウンディングボックス、自由形式の形状)、ピクセルレベルの接地をサポートする。
その結果,MedPLIBは複数の医学的視覚言語タスクにおいて最先端の結果を得たことが示唆された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:41:35 GMT)
Goal-Driven Query Answering over First- and Second-Order Dependencies with Equality [9.9] 我々は、ゴール駆動型クエリ応答の第一の手法として、一階と二階の依存関係と等式推論を用いた手法を提示する。
提案手法は,入力の依存関係を変換し,クエリに無関係な多くの推論を避ける。
また、ゴール駆動型問合せ応答が全普遍モデルよりも桁違いに高速であることを示す広範な経験的評価の結果も提示する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:02:16 GMT)
Synthetic Potential Outcomes and Causal Mixture Identifiability [9.6] 異種性は、類似性の異なる概念に従って集団をグループ化することで、複数のレベルで解決することができる。
本稿では,システムに対する介入や摂動の因果反応に関するグループ化を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:12:17 GMT)
Opinion de-polarization of social networks with GNNs [9.5] そこで本研究では,適切なKユーザを識別する効率的なアルゴリズムを提案し,トピックに関する適度なスタンスを採用すると,偏極が最小となるようにした。
我々のアルゴリズムはグラフニューラルネットワークを採用しており、他の手法よりも大きなグラフを効果的に処理することができる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:09:50 GMT)
Missing Melodies: AI Music Generation and its "Nearly" Complete Omission of the Global South [9.2] 我々はAI音楽生成研究に使用される100万時間以上の音声データセットの分析を行った。
我々は,AI研究において,グローバル・サウスの音楽ジャンルの公平な表現と包括性において重要なギャップを見出した。
これらのデータセットの約40%には、西洋音楽以外の形態が含まれており、グローバル・サウスのジャンルは14.6%に過ぎない。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:12:03 GMT)
Radiology Report Generation via Multi-objective Preference Optimization [9.2] 本稿では,MPO(Multi-objective Preference Optimization)を用いた新しいRRG手法を提案する。
提案手法は,1つのモデルで異なる選好に適合するレポートを生成し,最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 03:25:13 GMT)
OpenNER 1.0: Standardized Open-Access Named Entity Recognition Datasets in 50+ Languages [9.1] オープンに利用可能なエンティティ認識(NER)データセットの標準化されたコレクションであるOpenNER 1.0を提示する。
我々は、元のデータセットを一様表現に標準化し、コーパス間でより一貫性のあるエンティティタイプ名をマップし、多言語マルチオントロジーNERの研究を可能にする構造でコレクションを提供する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:55:53 GMT)
Time-Series Foundation Model for Value-at-Risk [9.1] 広範囲で多様なデータセットで事前トレーニングされたファンデーションモデルは、比較的最小限のデータを持つゼロショット設定で使用できる。
TimesFMと呼ばれるGoogleのモデルの性能を従来のパラメトリックモデルと非パラメトリックモデルと比較する。
提案手法のバックテスト結果から,提案手法を改良したTimesFMモデルの方が従来手法より常に優れていたことが示唆された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:15:13 GMT)
Transfer Learning with Partially Observable Offline Data via Causal Bounds [9.0] 本稿では,部分的に観測可能なコンテキスト帯の移動学習について検討する。
エージェントは不完全な情報と隠れた共同設立者への限られたアクセスで操作する。
本稿では,未知分布の関数的制約を線形制約に識別する効率的な手法を提案する。
この手法は推定誤差を考慮し、強い収束特性を示し、堅牢で信頼性の高い因果境界を保証する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:22:48 GMT)
Learn How to Query from Unlabeled Data Streams in Federated Learning [9.0] フェデレートラーニング(FL)は、分散クライアント間の協調学習を可能にすると同時に、ローカルデータのプライバシ保護を可能にする。
FLに関する既存の研究は、トレーニングを開始すると、通常、各クライアントで利用可能なオフラインラベル付きデータを仮定する。
高価なアノテーションのコストを考えると、クライアントにラベルをつけるための情報的サンプルのサブセットを特定することが重要です。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:47:20 GMT)
Private Synthetic Data Generation in Small Memory [8.9] 資源効率を保ちながら差分プライバシーを確保する軽量な合成データ生成器を提案する。
$textsfPrivHP$は、入力ストリームの分布を保存するプライベートな合成データを生成する。
サイズ$n$ in $mathcalO((w+k)log (varepsilon n))$ space, $mathcalO(log (varepsilon n))$ update timeを処理し、$mathcalO(klog klog)でプライベートな合成データジェネレータを出力する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:24:05 GMT)
MoSLD: An Extremely Parameter-Efficient Mixture-of-Shared LoRAs for Multi-Task Learning [8.9] MoSLDは、ドロップアウト戦略を備えた混合共有LoRAモデルである。
MoSLDは、LoRAの上部プロジェクションマトリックスをさまざまな専門家の間で共有することで、課題に対処する。
本モデルは,シングルタスクシナリオとマルチタスクシナリオの両方において優れた性能を示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:22:49 GMT)
Image Generation Diversity Issues and How to Tame Them [8.9] 生成メソッドは、実際のデータとほとんど区別できない出力を生成するが、多くの場合、データの完全なキャプチャに失敗する。
本稿では、生成モデルにおける現在の多様性の欠如と、これを測定するための共通指標の欠如に留意する。
画像検索問題として多様性をフレーミングすることでこれを実現し、合成データを用いて実画像の検索回数をクエリとして測定する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:04:33 GMT)
Self-Explainable Graph Transformer for Link Sign Prediction [8.8] 符号付きグラフニューラルネットワーク(SGNN)は、正と負のリンクが共存する現実の状況において、複雑なパターンを分析するのに有効であることが示されている。
SGNNモデルは説明可能性の低さに悩まされており、予測の背後にある理論的根拠を理解する必要のある重要なシナリオでの採用を制限する。
本稿では,高い予測精度を確保しつつ説明可能な情報を出力するSelf-Explainable Signed Graph Transformer (SE-SGformer) フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 04:21:52 GMT)
From Noise to Nuance: Advances in Deep Generative Image Models [8.8] ディープラーニングに基づく画像生成は、2021年以来パラダイムシフトを続けてきた。
安定拡散, DALL-E, 一貫性モデルの最近の進歩は, 画像合成の能力と性能の境界を再定義している。
マルチモーダル理解とゼロショット生成能力の強化が,産業全体にわたる実践的応用をいかに変えつつあるかを検討する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:09:04 GMT)
Goal-Conditioned Supervised Learning for Multi-Objective Recommendation [8.6] 多目的学習は、一つのモデルを用いて複数の目的を同時に最適化する。
本稿では,オフラインシーケンシャルデータから複数の目標を自動学習する多目的目標定義型監視学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 03:47:40 GMT)
Enhancing Facial Consistency in Conditional Video Generation via Facial Landmark Transformation [8.5] 3次元形態素モデル(3DMM)に基づく顔のランドマーク変換法を提案する。
本研究では、3DMMパラメータを基準画像に合わせるように調整することで、対象の顔の特徴に整合する変換されたランドマークを得る。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:13:32 GMT)
Zero-Shot Pupil Segmentation with SAM 2: A Case Study of Over 14 Million Images [8.5] 本稿では、視線推定と視線追跡技術の進歩において、視基盤モデルSAM 2の変換可能性について検討する。
私たちはSAM 2を、VRセットアップやウェアラブルアイトラッカーを使用して記録された世界最大の統合データセットを含む、さまざまなデータセットから1400万以上のアイイメージでテストしました。
注目すべきは、瞳孔分割タスクにおいてSAM 2は、目の画像のみに基づいて訓練されたドメイン固有モデルのパフォーマンスと一致し、微調整なしで、最大93%の得点を達成していることである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:18:39 GMT)
CCxTrust: Confidential Computing Platform Based on TEE and TPM Collaborative Trust [8.5] 単一のハードウェアルートの信頼(RoT)への依存は、クラウドプラットフォームに対するユーザの信頼を制限します。
マルチクラウド環境での相互運用性の欠如と統一された信頼モデルにより、クロスプラットフォームでクロスクラウドな信頼チェーンが確立できない。
本稿では,TEE と TPM の相互信頼の根源を活用した秘密計算プラットフォームである CCxTrust を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:38:08 GMT)
Rumor Detection on Social Media with Temporal Propagation Structure Optimization [8.5] ソーシャルメディア上での噂を検知する従来の手法は、主にテキストコンテンツの分析に重点を置いている。
最近の研究は、噂の伝播中に出現する階層的な会話構造をモデル化するためにグラフニューラルネットワークを活用する方向に移行している。
重み付き伝搬木を構築することで時間情報を組み込んだ新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:18:37 GMT)
A Wander Through the Multimodal Landscape: Efficient Transfer Learning via Low-rank Sequence Multimodal Adapter [8.5] 本稿では,loW-rank sequence multimodal adapter (Wander)を提案する。
まず、外積を用いて異なるモダリティから情報を効果的に融合する。
効率を上げるために、CP分解を用いてテンソルをランク1成分に分解し、実質的なパラメータ還元を実現する。
Wander氏は、最先端の効率的なトランスファー学習法を一貫して上回り、様々なモダリティを持つデータセットに対して広範な実験を行った。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:26:02 GMT)
Dynamic Resource Allocation with Quantum Error Detection [8.4] パウリチェックを適用した新しい資源配分フレームワークを提案する。
本稿では,量子系の雑音特性を推定する可能性を強調する。
パウリチェックによる動的量子リソース割り当ては、最先端のマッピング技術より優れていることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:41:43 GMT)
Group & Reweight: A Novel Cost-Sensitive Approach to Mitigating Class Imbalance in Network Traffic Classification [8.4] 本稿では,厳密なクラス不均衡の存在下でのネットワークトラフィックの分類に焦点をあてる。
以前のクラス不均衡メソッドは、多数のマイノリティな悪意のあるクラスを扱うことはほとんどありません。
クラス不均衡を軽減するためのテキストグループとリウェイト戦略を設計する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 00:58:38 GMT)
Towards One Model for Classical Dimensionality Reduction: A Probabilistic Perspective on UMAP and t-SNE [8.1] 本稿では, MAP や t-SNE などの次元削減手法を, ProbDR で導入されたモデルに対応するMAP推論手法として概ね再キャスト可能であることを示す。
また、同様の次元減少法を研究できるツールについても紹介し、これらの解釈から生じる2つの研究分野を取り上げる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 20:07:57 GMT)
Unlearning or Concealment? A Critical Analysis and Evaluation Metrics for Unlearning in Diffusion Models [8.0] 本稿では,拡散モデルにおける未学習の5つの手法の理論的,実証的研究について述べる。
概念検索スコア(textbfCRS)と概念信頼スコア(textbfCCS)の2つの新しい評価指標を導入する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:13:19 GMT)
The Impact of Copyrighted Material on Large Language Models: A Norwegian Perspective [8.0] 本稿では,ノルウェーの大規模言語モデル(LLM)の性能に及ぼす著作権資料の影響を実証的に評価する。
ノルウェーの様々なベンチマークでモデルを評価した場合、書籍と新聞の両方が肯定的に寄与するが、フィクションの作業は性能を低下させる可能性がある。
我々の実験は、AI開発に貢献する著者のための補償スキームの作成を知らせる可能性がある。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:11:22 GMT)
FAWAC: Feasibility Informed Advantage Weighted Regression for Persistent Safety in Offline Reinforcement Learning [7.9] 安全なオフライン強化学習は、安全性の制約を守りながら累積報酬を最大化するポリシーを学ぶことを目的としている。
主な課題は安全性とパフォーマンスのバランスであり、特に政策がアウト・オブ・ディストリビューション状態や行動に直面する場合である。
本稿では,マルコフ決定過程における持続的安全性を優先するFAWAC(Feasibility Informed Advantage Weighted Actor-Critic)を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:28:50 GMT)
MAC-Ego3D: Multi-Agent Gaussian Consensus for Real-Time Collaborative Ego-Motion and Photorealistic 3D Reconstruction [7.9] 提案するMAC-Ego3Dは,マルチエージェント・ガウス・コンセンサスによるリアルタイム3次元再構成のための新しいフレームワークである。
MAC-Ego3Dは、エージェントが独立してローカルマップを構築し、調整し、反復的に洗練することを可能にする。
推定速度は15倍に向上し, 部分ケースの自我運動推定誤差のオーダー・オブ・マグニチュードが減少し, RGB PSNRは4~10dBとなった。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 21:04:53 GMT)
Doubly Robust Conformalized Survival Analysis with Right-Censored Data [7.9] 本稿では,右知覚データから生存時間に対する低い予測境界を構築するための共形推論手法を提案する。
この方法は、適切なモデルを用いて未観測の検閲時間をインプットし、重み付き共形推論を用いてインプットデータを解析する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 21:36:24 GMT)
Dinkel: Testing Graph Database Engines via State-Aware Query Generation [7.9] グラフデータベース管理システム(GDBMS)は、グラフデータを格納し、操作し、多くのデータ駆動アプリケーションの中核部分を形成する。
信頼性を確保するために、Cypherでクエリを生成することでGDBMSをテストするいくつかの方法が提案されている。
GDBMSのための複雑なCypherクエリを生成するための、新しい状態認識テスト手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:49:19 GMT)
Unifying AI Tutor Evaluation: An Evaluation Taxonomy for Pedagogical Ability Assessment of LLM-Powered AI Tutors [7.8] 我々は,現在最先端の大規模言語モデル (LLM) がAI家庭教師として有効かどうかを検討する。
本研究では,キーラーニング科学の原則に基づく8つの教育次元を持つ統一的な評価分類法を提案する。
MRBench -- 192の会話と1,596の回答を含む新しい評価ベンチマーク。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:24:35 GMT)
Text Generation Models for Luxembourgish with Limited Data: A Balanced Multilingual Strategy [7.6] 本稿では,Luxembourgishに着目した低表現言語のための言語モデル開発における課題について論じる。
本稿では,限定されたルクセンブルク語データと同等量のドイツ語とフランス語データを組み合わせた,T5アーキテクチャに基づく新しいテキスト生成モデルを提案する。
評価のために,Luxembourgishにとって最初のテキスト生成ベンチマークであるLuxGenを紹介する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:23:12 GMT)
Modeling Latent Non-Linear Dynamical System over Time Series [7.5] 本研究では,データから直接方程式を導出することにより時系列を与えられる非線形力学系をモデル化する問題について検討する。
本稿では、時間依存型モデリングを可能にする潜在状態を導入し、この問題を潜時状態の動的推定問題として定式化する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:49:17 GMT)
JuStRank: Benchmarking LLM Judges for System Ranking [7.5] 我々はLLM審査員をシステムランクラーとして大規模に調査した。
システムスコアは、複数のシステム出力に対して判定スコアを集約することで生成される。
我々の分析は、判断力や偏見を含む判断行動のきめ細かい特徴を提供する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:51:13 GMT)
Optimising TinyML with Quantization and Distillation of Transformer and Mamba Models for Indoor Localisation on Edge Devices [7.2] 本稿では,資源制約エッジデバイスのための小型かつ効率的な機械学習モデル(TinyML)を提案する。
この研究は、量子化と知識蒸留を含むモデル圧縮技術に焦点を当て、モデルサイズを大幅に削減する。
これらのTinyMLモデルの医療への応用は、患者のモニタリングに革命をもたらす可能性がある。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:59:21 GMT)
TorchCP: A Python Library for Conformal Prediction [7.2] コンフォーマル予測のユーザビリティを高めるため,PyTorchベースの総合ツールキットである torchcp を紹介する。
torchcpは、さまざまな機械学習タスクに対して、多種多様なポストホックと整合予測のトレーニング方法を実装している。
我々のTorchcpツールキットはPyTorchで構築されており、ディープラーニングモデルのための高速GPUアクセラレーションと大規模データセットでのミニバッチ計算を可能にします。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:19:43 GMT)
When Can Memorization Improve Fairness? [7.2] 集団のサブセットを記憶することで,多クラス分類問題において,付加的公平度指標がどの程度影響するかを検討する。
我々は、記憶されたデータセットのラベルとグループメンバーシップの分布の観点から、記憶から生じるバイアスを明示的に表現する。
検討した3つの指標のバイアスを排除した記憶データセットの特徴付けを行う。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:11:02 GMT)
CommonPower: A Framework for Safe Data-Driven Smart Grid Control [7.1] RLコントローラのフレキシブルでモデルベースの保護を可能にするPythonツールCommonPowerを紹介した。
CommonPowerは、単一エージェントRL、マルチエージェントRL、最適制御のための統一インターフェースを提供し、異なる予測メソッドをシームレスに統合する。
我々は、異なる安全ガードを特徴とするRLエージェントと、エネルギー管理のコンテキストにおけるモデル予測制御器を比較した数値ケーススタディにより、CommonPowerの汎用性を実証する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:37:14 GMT)
Flexible Physical Camouflage Generation Based on a Differential Approach [7.0] 本研究は、特に対向性カモフラージュに適したニューラルレンダリングに対する新しいアプローチを導入する。
我々の手法はFPAと呼ばれ、照明条件や材質の変化を忠実にシミュレートすることで従来の手法を超えています。
逆行性カモフラージュ法におけるFPAアプローチの有用性と有効性について検討した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 04:43:56 GMT)
Whom do Explanations Serve? A Systematic Literature Survey of User Characteristics in Explainable Recommender Systems Evaluation [7.0] ユーザ調査では,レコメンダシステムの説明が評価された124の論文を調査した。
本研究の結果は,主に特定のユーザを対象としていることが明らかとなった。
より包括的で再現可能な評価に向けた行動を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:01:30 GMT)
HYGENE: A Diffusion-based Hypergraph Generation Method [7.0] 本稿では, 局所展開の進展による課題に対処する拡散型ハイパーグラフ生成(HYGENE)手法を提案する。
実験では、ハイジェネの有効性を示し、ハイパーグラフの様々な特性を忠実に模倣する能力を示した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:02:18 GMT)
Annealing Flow Generative Model Towards Sampling High-Dimensional and Multi-Modal Distributions [7.0] Annealing Flowは、高次元およびマルチモーダル分布からサンプリングするために設計された、連続正規化フローベースのアプローチである。
AFは有効かつバランスの取れたモード探索を保証し、サンプルサイズと寸法の線形複雑さを達成し、非効率な混合時間を回避している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:11:07 GMT)
Perception-based multiplicative noise removal using SDEs [7.0] 乗法ノイズは合成開口レーダ(SAR)、レーザー、光学レンズによって生成された画像に影響を与える。
微分方程式に基づく拡散モデルを用いて乗法雑音に対処する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:33:03 GMT)
Watermarking Training Data of Music Generation Models [6.9] 本研究では,音声透かし技術を用いてコンテンツの不正使用を検知する方法について検討する。
非透かしデータでトレーニングされたモデルと非透かしデータでトレーニングされたモデルで生成された出力を比較した。
以上の結果から,人間には認識できないものを含む音声透かし技術が,モデル出力の顕著な変化を引き起こす可能性が示唆された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:49:10 GMT)
Clifford Perturbation Approximation for Quantum Error Mitigation [6.8] 量子エラー緩和(QEM)は、短期量子デバイスのポテンシャルを活用するために重要である。
我々はClifford Perturbation Data Regression (CPDR) と呼ばれる学習に基づく誤り軽減フレームワークを提案する。
CPDRは、小さな摂動を持つクリフォード回路によるトレーニングセットを構築する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:01:54 GMT)
Conditioned quantum-assisted deep generative surrogate for particle-calorimeter interactions [6.8] 本研究では,大型ハドロン衝突型加速器シミュレーションのための量子支援深部生成モデルを提案する。
このモデルでは,条件付き変分オートエンコーダ (VAE) と条件付き制限ボルツマンマシン (RBM) を統合する。
RBMノードと接続は、サンプリングのためにD-WaveのPegasus-structured textitAdvantage Quantum Annealer (QA)上でqubitsと couplerを使用するように慎重に設計されている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 22:09:25 GMT)
Training Free Guided Flow Matching with Optimal Control [6.7] 最適制御を用いたガイドフローマッチングのための学習自由フレームワークであるOC-Flowを提案する。
OC-Flowは,テキスト誘導画像操作,条件分子生成,全原子ペプチド設計において優れた性能を示した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:23:31 GMT)
Context Canvas: Enhancing Text-to-Image Diffusion Models with Knowledge Graph-Based RAG [6.7] 本稿では,グラフベースのRAGを組み込むことにより,テキスト・ツー・イメージ・モデルの能力を高める新しい手法を提案する。
本システムは知識グラフから詳細な文字情報と関係データを動的に取得し,視覚的・文脈的にリッチな画像の生成を可能にする。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:41 GMT)
Systematic Analysis of LLM Contributions to Planning: Solver, Verifier, Heuristic [6.7] 大規模言語モデル(LLM)が計画問題の解決にどのように貢献するかを系統的に分析する。
解析の結果,LLMは最適計画を生成するのが難しいが,中間/不完全解に対してフィードバック信号を提供するのがはるかに優れていることがわかった。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:16:46 GMT)
Quantitative Evaluation of Motif Sets in Time Series [6.7] 本稿では,時系列モチーフ発見手法の定量的評価のためのベンチマークであるPROMとTSMD-Benchを紹介する。
ProMは既存のメトリクスよりも包括的な評価を提供しており、TSMD-Benchは以前のメトリクスよりも難しいベンチマークである。
提案手法により,大規模かつ系統的な性能比較が可能となる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:13:34 GMT)
Training LayoutLM from Scratch for Efficient Named-Entity Recognition in the Insurance Domain [6.6] 一般的な事前訓練されたニューラルネットワークは、金融や保険といった専門分野において良い結果を出すのに苦労する可能性がある。
これは、トレーニングデータと下流タスクのドメインミスマッチに起因する。
保険関連財務文書の匿名化データセットを用いて、ドメイン関連文書を使用することで、匿名性認識問題の結果が向上することを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:09:44 GMT)
QueSTMaps: Queryable Semantic Topological Maps for 3D Scene Understanding [6.5] 計画やナビゲーションのようなロボットのタスクは、シーンの階層的な意味理解を必要とする。
この問題を解決するために2段階のパイプラインを導入します。
私たちは、CLIPに準拠した機能と、それを含むオブジェクトに基づいて、ルームインスタンス毎にセマンティックラベルを生成します。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:48:02 GMT)
Generalized Liénard systems with momentum-dependent mass: Isochronicity and bound states [6.4] 非線形リーナード方程式の古典的および量子的側面は $ddotx + k x dotx + omega2 x + (k2/9) x3 = 0$ である。
そのような方程式は、$ddotz + J(z) dotz2 + F(z) dotz + G(z) = 0$という形のLevinson-Smith型の方程式から導出できることを示した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:27:57 GMT)
Uncovering Hidden Subspaces in Video Diffusion Models Using Re-Identification [6.4] 我々は、特定の下流タスクのための合成データに基づいてトレーニングされたモデルが、実際のデータでトレーニングされたモデルよりも悪い性能を示すことを示した。
この違いは、トレーニングビデオのサブスペースであるサンプリングスペースが原因である可能性がある。
本稿では,潜在空間におけるプライバシ保護モデルのトレーニングが,計算効率が向上し,より一般化できることを最初に示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:10:19 GMT)
Computer-Aided Osteoporosis Diagnosis Using Transfer Learning with Enhanced Features from Stacked Deep Learning Modules [6.4] 膝関節症は膝関節の骨組織を弱め、骨折のリスクを増大させる。
X線画像による早期発見は、タイムリーな介入と患者の結果の改善を可能にする。
変形性膝関節症に対するコンピュータ支援診断システム(CAD)を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:59:10 GMT)
Few-Shot Domain Adaptation for Named-Entity Recognition via Joint Constrained k-Means and Subspace Selection [6.4] ラベル付きデータセットと大量のラベル付きデータを組み合わせた弱教師付きアルゴリズムを提案する。
このフレームワークは、いくつかの英語データセット上で、数ショットのNERで最先端の結果を達成する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:19:14 GMT)
Frame Representation Hypothesis: Multi-Token LLM Interpretability and Concept-Guided Text Generation [6.4] 解釈可能性(Interpretability)は、大規模言語モデルの信頼を促進する上で重要な課題である。
複数単語をモデル化してLLMを解釈・制御するためのフレーム表現仮説を提案する。
これらのツールをTop-k Concept-Guided Decodingで紹介する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:01:04 GMT)
Generative Densification: Learning to Densify Gaussians for High-Fidelity Generalizable 3D Reconstruction [6.3] 本稿では,フィードフォワードモデルにより生成されたガウスを高効率で一般化可能な手法であるジェネレーティブ・デンシフィケーションを提案する。
提案手法は, モデルサイズが同等あるいは小さく, 最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:17:36 GMT)
A Context-Enhanced Framework for Sequential Graph Reasoning [6.2] 本稿では,様々なトレンド分野の基本課題であるグラフ構造化データに対する逐次推論について検討する。
既存のニューラルネットワークアーキテクチャを一般化し、コンテキスト強化フレームワークを提案する。
このフレームワークは既存の手法と効果的に統合でき、推論能力を高めることができる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:27:51 GMT)
Magnetic Resonance Imaging Feature-Based Subtyping and Model Ensemble for Enhanced Brain Tumor Segmentation [6.1] 本稿では,最先端セグメンテーションモデルを統合する深層学習に基づくアンサンブル手法を提案する。
BraTSデータセットに存在する腫瘍の不均一性を考えると、この手法はセグメンテーションモデルの精度と一般化性を高める。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 22:13:21 GMT)
On the number of modes of Gaussian kernel density estimators [6.1] 実数直線上の期待されるモードの数は、$Theta(sqrtbetalogbeta)$ as $beta,ntoinfty$としてスケールする。
この調査の動機は、トランスフォーマーがメタスタブルな状態で描画されるクラスタの数を決定することである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:05:21 GMT)
Memory Proxy Maps for Visual Navigation [6.1] 視覚的なナビゲーションは人間からインスピレーションを受け、視覚を使って、詳細な環境マップを使わずに、これまで見えなかった環境をナビゲートする。
これに触発されて、封建的学習を用いた視覚ナビゲーションのための、No-RL、No-graph、No-odometryアプローチを導入し、3つのタイレッドエージェントを構築した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 21:52:20 GMT)
Feudal Networks for Visual Navigation [6.1] 封建的学習を用いた視覚ナビゲーションの新しいアプローチを提案する。
各レベルのエージェントはタスクの異なる側面を見て、異なる空間的および時間的スケールで操作する。
得られた封建的なナビゲーションネットワークは、SOTAの性能に近い。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 21:46:40 GMT)
The FLoRA Engine: Using Analytics to Measure and Facilitate Learners' own Regulation Activities [6.0] FLoRAエンジンは、学生、労働者、専門家が自己統制学習(SRL)のスキルを向上させるのを支援するために開発された。
このエンジンは学習中の学習者のSRL行動を追跡し、学習者が学習を効果的に制御するのに役立つ自動足場を提供する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:46:20 GMT)
Lexico: Extreme KV Cache Compression via Sparse Coding over Universal Dictionaries [6.0] Lexicoは、普遍辞書を用いたスパース符号化を利用する新しいKVキャッシュ圧縮手法である。
GSM8Kでは、複数のモデルファミリにまたがって、レキシコは元のパフォーマンスの90-95%を維持し、完全なKVキャッシュメモリの15-25%しか使用していない。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 03:00:29 GMT)
OG-RAG: Ontology-Grounded Retrieval-Augmented Generation For Large Language Models [6.0] 本稿では,ドメイン固有コンテキストにおけるプロセスのアンカー化による応答向上のためのオントロジー・グラウンド検索生成手法であるOG-RAGを提案する。
OG-RAGは、事実に基づく推論が不可欠である領域に適用される。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:21:03 GMT)
Trustful LLMs: Customizing and Grounding Text Generation with Knowledge Bases and Dual Decoders [5.9] 本稿では,RAGコンテキストにおける知識三重項を利用して幻覚を補正する後処理アルゴリズムを提案する。
また、RAGコンテキストを融合して生成プロセスを導出するデュアルデコーダモデルを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:02:11 GMT)
Detecting Cognitive Impairment and Psychological Well-being among Older Adults Using Facial, Acoustic, Linguistic, and Cardiovascular Patterns Derived from Remote Conversations [5.9] 高齢化社会では、認知の低下を監視し、認知症リスクを示す社会的・心理的要因を特定するためのスケーラブルな方法が緊急に求められている。
われわれの機械学習モデルは39人の顔、音響、言語、心血管の特徴を捉えた。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:42:46 GMT)
Brain-inspired AI Agent: The Way Towards AGI [5.9] 脳にインスパイアされたAIの研究者たちは、人間の脳の動作メカニズムからインスピレーションを求め、その機能的ルールをインテリジェントなモデルに再現することを目指している。
そこで我々は,脳にインスパイアされたAIエージェントの概念を提案し,比較的実現可能でエージェント互換な皮質領域機能を抽出する方法を分析した。
これらの構造をエージェントに実装することで、人間の能力に似た基本的な認知知性を実現できる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:15:48 GMT)
Taxonomy of Software Log Smells [5.8] この研究の目的は、開発者がより良いロギングコードを書くのに役立つログの臭いの分類を作ることだ。
我々は,学術文献の調査を行い,ロギング問題とツールを特定した。
本論文では,10個のログの匂いの分類について述べる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:54:17 GMT)
Bottlenecks in quantum channels and finite temperature phases of matter [5.8] 我々は、マルコフ量子チャネルの古典的マルコフ連鎖でよく知られる「ボトルネック定理」の類似性を証明した。
低温量子多体系では、準局所ギブスサンプリング器の性能を束縛するためにボトルネック定理を用いる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:58:47 GMT)
Video Repurposing from User Generated Content: A Large-scale Dataset and Benchmark [5.8] 1万本以上のビデオと12万本以上の注釈付きクリップからなる広範囲なデータセットであるRepurpose-10Kを提案する。
実世界のユーザ生成コンテンツからアノテーションを得るための2段階のソリューションを提案する。
この課題に対処するためのベースラインモデルとして,音声,視覚,キャプションの各側面を統合する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:27:46 GMT)
Vanilla Bayesian Optimization Performs Great in High Dimensions [5.8] 高次元問題はベイズ最適化アルゴリズムのアキレスのヒールと見なされてきた。
既存のアルゴリズムが、モデルの複雑さを下げるレンズを通して、これらの退化にどのように対処しているかを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:53:38 GMT)
CleanComedy: Creating Friendly Humor through Generative Techniques [5.7] 本稿では、英語とロシア語のジョークを部分的に注記した有毒度フィルタリングコーパスであるCleanComedyを提案する。
様々なジョークグループにおけるユーモアと毒性レベルの調査を通じて,データフィルタリング手法の有効性について検討した。
また,CreateComedyデータセットでトレーニングしたベースラインモデルを含め,人間によるジョークと生成ジョークの様々なグループを比較し,コンピュータユーモア生成の進歩について検討した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:57:59 GMT)
Conformal Prediction on Quantifying Uncertainty of Dynamic Systems [5.7] 力学系の不確実性評価に共形予測を導入する。
本稿では,コンフォメーション予測手法を用いて,ベンチマーク演算子学習手法による不確実性の評価を行う。
また、偏微分方程式データセットにおいてモンテカルロ・ドロップアウト法とアンサンブル法を比較した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:45:02 GMT)
An Algorithm-Centered Approach To Model Streaming Data [5.7] 概念の漂流は、基礎となる分布が時間とともに変化する現象が大きな課題となる。
これは、古典的な設定のように確率分布に匹敵する基礎となるオブジェクトがないことに起因する。
我々は,アルゴリズムの観点から,時間とともに新たなデータモデルを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:52:37 GMT)
CUAL: Continual Uncertainty-aware Active Learner [5.7] デプロイされたAIエージェントは、既知のクラスの未知のサンプルだけでなく、新しい(未知の)クラスからのサンプルを含む可能性のあるラベルのないデータを継続的に提供する。
我々は,この複雑な問題に対する包括的解決策を,我々のモデル "CUAL" (Continual Uncertainty-aware Active Learner) で提示する。
CUALは不確実性推定アルゴリズムを利用して、不明瞭(不確実)な予測された新しいクラスサンプルのアクティブなラベル付けを優先順位付けし、同時に各クラスの最も確実な予測を擬似ラベル付けする。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 19:49:09 GMT)
FedAA: A Reinforcement Learning Perspective on Adaptive Aggregation for Fair and Robust Federated Learning [5.6] Federated Learning (FL)は、分散デバイス間でのプライバシ保護モデルトレーニングのための有望なアプローチとして登場した。
我々はtextbfAdaptive textbfAggregation を通じてクライアントのコントリビューションを最適化する textbfFedAA という新しい手法を導入し、悪意のあるクライアントに対するモデルロバスト性を高める。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:40:37 GMT)
Soybean Maturity Prediction using 2D Contour Plots from Drone based Time Series Imagery [5.6] 植物育種プログラムは、適切な試験において、正確な選択とエントリの配置のために成熟までの日数を評価する必要がある。
伝統的に、育種品種の成熟度評価は、育種者が手動でフィールドを検査し、成熟度を視覚的に評価することを含む。
本研究では,UAVを用いた時系列画像を用いた大豆成熟度評価のための機械学習モデルを開発した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 19:23:50 GMT)
Training Physical Neural Networks for Analog In-Memory Computing [5.6] 本稿では,IMCの物理モデル構築のための物理ニューラルネットワーク(PNN)を提案する。
従来,デトリメンタルと見なされていたハードウェア非イデオロギーにより,学習性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:22:23 GMT)
Investigating the Impact of Balancing, Filtering, and Complexity on Predictive Multiplicity: A Data-Centric Perspective [5.5] ラショモン効果は、複数のモデルがデータセット上で同様のパフォーマンスを達成するが、異なる予測を生成し、予測的多重性をもたらす。
データ中心のAIアプローチは、データ最適化、特に前処理技術による優先順位付けによって、これらの問題を緩和することができる。
本稿では,データの複雑さを考慮し,バランスやフィルタリングといったデータ前処理手法が予測多重度やモデルの安定性にどのように影響するかを検討する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 20:14:45 GMT)
Towards Robust and Fair Vision Learning in Open-World Environments [5.5] この論文は、視覚学習における公平性と堅牢性に対する4つの重要な貢献を示している。
まず、大規模データ要求の問題に対処するために、この論文は、新しいフェアネス・ドメイン適応アプローチを提示している。
第二に、視覚学習のオープンワールドモデリングを可能にするために、この論文は、新しいオープンワールドフェアネス連続学習フレームワークを提示する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:50:52 GMT)
OriginPruner: Leveraging Method Origins for Guided Call Graph Pruning [5.4] OriginPrunerはメソッドの起源を利用する新しいコールグラフプルーニング手法である。
OriginPrunerは、局所性分析からの洞察を取り入れることで、これらのオリジンメソッドに関連するエッジを確実に識別し、プルースする。
本研究は,(1)Iterator.nextなどの原点法がCGサイズに大きな影響を与えること,(2)本手法の導出物が主に局所的であり,下流のプロデューラル解析に影響を与えずに安全に刈り取ることができること,(3)OriginPrunerはCGサイズを著しく低減するとともに,脆弱性の伝播解析などのセキュリティアプリケーションにおけるCGの健全性を維持しながら,CGサイズを著しく低減できることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:42:51 GMT)
A Plug-and-Play Algorithm for 3D Video Super-Resolution of Single-Photon LiDAR data [5.4] 単光子アバランシェダイオード(SPAD)は、個々の光子を検出し、ピコ秒分解能で到着時間を記録できる高度なセンサーである。
本研究では,SPADデータから移動シーンの3次元再構成を改善するための新しい計算画像処理アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:33:06 GMT)
LVMark: Robust Watermark for latent video diffusion models [5.3] 本稿では,ビデオ拡散モデルに透かしを埋め込むLVMarkという新しい透かし手法を提案する。
LVMarkの重要なコンポーネントは、ビデオ拡散モデルにウォーターマークメッセージを効率的に埋め込む選択的な重み変調戦略である。
本手法は,ビデオ生成モデルにおけるオーナシップ保護の有効性を高めるための貴重なツールとして,ビデオ生成モデル透かしの可能性を強調した最初の試みである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:57:20 GMT)
Transfer Learning of RSSI to Improve Indoor Localisation Performance [5.3] コンガN(Congureal Generative Adversarial Networks)をベースとしたAugmentationとT-ConGAN(Transfer Learning framework)を提案する。
我々はまず,BLE RSSIデータを異なる家庭間で共有できること,および情報の共有が屋内のローカライゼーション性能を向上させることを実証した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:06:37 GMT)
Beyond Reweighting: On the Predictive Role of Covariate Shift in Effect Generalization [5.3] 観測変数のシフトの調整は、一般化に不十分な場合が多いことを示す。
本稿では,2つの大規模マルチサイトレプリケーション研究から,一連の実証的証拠を提示する。
次に、この現象をランダム分布シフトモデルから理論的に導出可能な類似パターンに接続することで解釈する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:06:27 GMT)
Human vs. AI: A Novel Benchmark and a Comparative Study on the Detection of Generated Images and the Impact of Prompts [5.2] 本研究は,偽画像の検出性に対するプロンプトの細部レベルの影響について検討する。
私たちはCOCOデータセットの実際の写真とSDXLとFooocusで生成された画像からなる新しいデータセットCOCOXGENを作成します。
200人の被験者を対象に行ったユーザスタディでは,より長く,より詳細なプロンプトで生成された画像は,短いプロンプトで生成された画像よりもはるかに容易に検出できることが示されている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 20:37:52 GMT)
Physics-Driven Autoregressive State Space Models for Medical Image Reconstruction [5.2] 本稿では, 物理駆動型自己回帰状態空間モデル(MambaRoll)を導入し, 医用画像再構成における忠実度を高める。
MambaRollは物理駆動状態空間モジュール(PSSM)に基づく自己回帰フレームワークを使用しており、PSSMは与えられた空間スケールでコンテキスト特徴を効率的に集約する。
MambaRollは、畳み込み、トランスフォーマーおよび従来のSSMモジュールに基づいて、最先端のPD手法より優れている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:59:56 GMT)
"There Has To Be a Lot That We're Missing": Moderating AI-Generated Content on Reddit [5.2] ジェネレーティブAIは、私たちの働き方、学び方、コミュニケーション方、オンラインコミュニティへの参加方法を変え始めている。
我々は、AIGCによるオンラインコミュニティモデレーターの経験に焦点を当てる。
我々の研究によると、AIGCに関するルールは、コンテンツ品質、社会的ダイナミクス、ガバナンスの課題に対する懸念によって動機づけられている。
我々は、AIGCを検知するばかげたツールがないにもかかわらず、モデレーターは、コミュニティと協力して規範を明確にすることで、この新しい現象によって引き起こされる混乱を幾らか抑制することができた。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:54:12 GMT)
RAD: Region-Aware Diffusion Models for Image Inpainting [5.2] 本研究では,バニラ拡散モデルの簡易かつ効果的な再構成による塗装用領域認識拡散モデル(RAD)を提案する。
RADは、最先端のアプローチよりも100倍高速な推論時間を実現する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:38:46 GMT)
LV-CadeNet: Long View Feature Convolution-Attention Fusion Encoder-Decoder Network for Clinical MEG Spike Detection [5.1] 実世界の臨床シナリオにおけるMEGスパイク自動検出のためのLV-CadeNetを提案する。
また,長視野形態素入力データを構築することで,人間の専門家を模倣する手法を提案する。
LV-CadeNetはMEGスパイク検出の精度を大幅に改善し、新しい臨床データセットでは42.31%から54.88%に向上した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 03:19:44 GMT)
DQA: An Efficient Method for Deep Quantization of Deep Neural Network Activations [5.1] ディープニューラルネットワーク(DNN)のアクティベーションの量子化は、推論時の計算とメモリ要求を減らすために一般的に用いられる手法である。
DQA(Deep Quantization of DNN Activations)は,アクティベーションのサブ6ビット量子化に着目した新しい手法である。
直接量子化法と準6ビット量子化のための最先端のNoisyQuantと比較して、精度が(最大29.28%)大幅に向上した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 19:03:53 GMT)
Belted and Ensembled Neural Network for Linear and Nonlinear Sufficient Dimension Reduction [5.0] 十分な次元削減のための統一的でフレキシブルで実装が容易なフレームワークを導入します。
このフレームワークは、特別に構造化されたニューラルネットワークによって実現される。
ニューラルネットワークの利点により、この手法は非常に高速に計算できる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:48:34 GMT)
On Design Choices in Similarity-Preserving Sparse Randomized Embeddings [5.0] FlyHashアルゴリズムは類似性を保存するスパース埋め込みを生成する。
FlyHashには、入力データの事前処理など、いくつかの設計上の選択がある。
適切な設計選択の組み合わせは、検索性能に大きな違いをもたらす可能性がある。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:51:13 GMT)
Interpreting Graphic Notation with MusicLDM: An AI Improvisation of Cornelius Cardew's Treatise [4.9] 本研究はコーネリアス・カーデューの論文に触発された音楽の作曲と即興の手法を提示する。
OpenAIのChatGPTを利用して、論文の抽象的な視覚要素を解釈することにより、これらのグラフィカル画像を記述的テキストプロンプトに変換する。
これらのプロンプトは、音楽生成用に事前訓練された潜在拡散モデルであるMusicLDMに入力される。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:08:36 GMT)
Hypothetical Minds: Scaffolding Theory of Mind for Multi-Agent Tasks with Large Language Models [4.9] マルチエージェント強化学習(MARL)法はマルチエージェントシステムの非定常性に対処する。
ここでは、大きな言語モデル(LLM)を活用して、これらの課題に対処できる自律エージェントを作成します。
私たちのエージェントである仮説的マインドスは、認知にインスパイアされたアーキテクチャで構成されており、知覚、記憶、階層的な2段階の抽象化計画のためのモジュラーコンポーネントを備えています。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:41:28 GMT)
MultiEYE: Dataset and Benchmark for OCT-Enhanced Retinal Disease Recognition from Fundus Images [4.9] 眼疾患診断用マルチモーダル・マルチクラスデータセットであるMultiEYEについて述べる。
OCT画像から疾患関連知識を抽出するためのOCT支援概念蒸留アプローチ(OCT-CoDA)を提案する。
提案するOCT-CoDAは,臨床応用の可能性が高く,顕著な結果と解釈可能性を示した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:08:43 GMT)
Motion Generation Review: Exploring Deep Learning for Lifelike Animation with Manifold [4.9] 人間のモーション生成は、ゲーム、バーチャルリアリティ、人間とコンピュータの相互作用で広く使われている人間の身体のポーズの自然なシーケンスを作成することを含む。
これまでの研究は、動き、音楽、テキスト、シーンの背景といった信号に基づいて、モーション生成に重点を置いてきた。
マンデラ学習は、データ次元を減らし、効果的な動きのサブスペースをキャプチャすることで解決策を提供する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:27:15 GMT)
PowerInfer-2: Fast Large Language Model Inference on a Smartphone [4.8] スマートフォン上の大規模言語モデル(LLM)は、リアルタイムAIアシストとプライバシ保護、オフライン操作を可能にする。
本稿では,メモリ容量を超えるLCMの高速推論を可能にするスマートフォンベースのフレームワークであるPowerInfer-2を紹介する。
PowerInfer-2は、スマートフォン上で47B LLMを提供する最初のシステムであり、11.68トークン/秒を達成した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:24:18 GMT)
Data Efficient Prediction of excited-state properties using Quantum Neural Networks [4.7] 分子基底状態から励起状態特性を予測する量子機械学習モデルを提案する。
提案手法は完全にNISQ互換である。
本手法は古典的特徴のみに依存する様々な古典的モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:30:23 GMT)
FluxSpace: Disentangled Semantic Editing in Rectified Flow Transformers [4.7] 本稿では,整流トランスによって生成された画像の意味を制御できる領域に依存しない画像編集手法であるFluxSpaceを紹介する。
修正フローモデル内の変圧器ブロックで学習した表現を活用することで,幅広い画像編集作業を可能にする意味論的解釈可能な表現セットを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:59:40 GMT)
Archaeoscape: Bringing Aerial Laser Scanning Archaeology to the Deep Learning Era [4.6] アーカイオスケープ (Archioscape) は、カンボジアの888 km$2$の大規模な考古学的ALSデータセットである。
オープンアクセスデータ、アノテーション、モデルを備えた最初のALS考古学リソースである。
この問題に対する現代のビジョン技術の利点を示すために,近年のセグメンテーションモデルをいくつかベンチマークした。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:37:20 GMT)
Safe Active Learning for Gaussian Differential Equations [4.6] GPODEモデルトレーニングのためのデータ収集のための効率的なアルゴリズムを設計する方法は、まだオープンな研究分野である。
GPODEアルゴリズムのための新しいセーフアクティブラーニング(SAL)は、この課題に対処するために、効率的で非安全クリティカルなデータを収集するためのメカニズムを提案する。
本稿では,SAL GPODEの優位性を示すとともに,2つの関連事例において,新しいデータを測定する標準的な非アクティブな方法と比較する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:23:58 GMT)
What Makes Cryptic Crosswords Challenging for LLMs? [4.5] クリプティッククロスワード(英: Cryptic crosswords)は、一般的な知識と、解法が異なるレベルで言語を操作する能力に依存するパズルである。
従来の研究では、そのようなパズルを解くことは、Large Language Models (LLMs)を含む現代のNLPモデルにおいても難しいことが示唆されている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:23:52 GMT)
Geo-LLaVA: A Large Multi-Modal Model for Solving Geometry Math Problems with Meta In-Context Learning [4.5] 幾何学数学の問題は、大言語モデル(LLM)に重大な課題をもたらす
地理マス(GeoMath)と呼ばれる中国の高校教育Webサイトから,幾何学的データを抽出して,幾何学的質問応答データセットを収集する。
メタトレーニングと呼ばれる学習段階において、教師付き微調整(SFT)による検索強化を取り入れたGeo-LLaVAと呼ばれるLarge Multi-modal Model(LMM)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:34:09 GMT)
MPAX: Mathematical Programming in JAX [4.3] MPAX(Mathematical Programming in JAX)は、数学的プログラミングを機械学習に統合するための汎用的で効率的なツールボックスである。
MPAXは、一般的な機械学習タスクのためのリニアプログラミングと特殊なモジュールをサポートする。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 21:52:27 GMT)
Beyond Confusion: A Fine-grained Dialectical Examination of Human Activity Recognition Benchmark Datasets [4.2] HAR(Human Activity Recognition)のための機械学習アルゴリズムの研究は、公開データセットで大きく進歩した。
トランスフォーマーのような最近のモデルは、ベンチマーク指標から限られた成功を収めたHARデータセットに適用されている。
本稿では,6つの人気のあるHARベンチマークデータセットのきめ細かい検査を行うことで,これらのオープンな問題に対処することを目的とする。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:53:17 GMT)
Injectivity of ReLU networks: perspectives from statistical physics [4.2] 単一の層, $x mapto mathrmReLU(Wx)$, ランダムガウス$m×n$行列$W$ を考える。
最近の研究は、この問題を球形積分幾何に結び付け、あるランダム集合の期待されるオイラー特性を研究することによって$alpha = fracmn$に対する予想された鋭い射影しきい値を得る。
インジェクティビティは球面の基底状態の性質と同値であることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:15:42 GMT)
Certifying bipartite pure quantum states efficiently using untrusted devices [4.2] すべてのバイパーティライト純量子状態は、量子自己検定によって証明できることが知られている。
ここでは、基底ヒルベルト空間次元が事前に知られているとき、任意の$dtimes d$ bipartite純状態が完全に証明可能であることを証明する。
量子自己検定と比較して、我々のプロトコルは量子非局所性にヒンジせず、より効率的である。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:21:10 GMT)
Distribution-Level Feature Distancing for Machine Unlearning: Towards a Better Trade-off Between Model Utility and Forgetting [4.2] 本稿では,タスク関連特徴相関を保ちつつ,効率的にインスタンスを破棄する新しい手法である分散レベル特徴分散(DLFD)を提案する。
提案手法は, 特徴分布を忘れ試料と明確に異なるように最適化し, 単一の学習エポック内で有効結果を得る。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:17:46 GMT)
On the effectiveness of Rotation-Equivariance in U-Net: A Benchmark for Image Segmentation [4.2] 本稿では,広い範囲のタスクに対して,画像分割のための回転同変U-Netをより徹底的に評価することを目的とする。
我々は、標準的なU-Netアーキテクチャと比較し、性能と持続可能性の改善を評価した。
この研究の主な貢献は、セグメンテーションタスクにおける回転同値の統合のトレードオフと利点に関する洞察を提供することである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:25:32 GMT)
Uplift modeling with continuous treatments: A predict-then-optimize approach [4.1] アップリフトモデリングの目標は、どのエンティティが治療を受けるべきかを決定することで、特定の成果を最適化するアクションを推奨することである。
アップリフトモデリングは通常二項処理に重点を置いているが、現実の多くのアプリケーションは連続的に評価された処理によって特徴づけられる。
本稿では,揚力モデリングにおける連続的な処理を可能にする予測型最適化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:43:42 GMT)
Benchmarking LLMs for Mimicking Child-Caregiver Language in Interaction [4.1] LLMは人間のような対話を生成できるが、初期の子どもと大人の交流をシミュレートする能力はほとんど解明されていない。
現状のLSMは、単語と発話レベルにおいて、子どもと介護者の対話を近似することができるが、子どもと介護者の分散パターンの再現に苦慮し、アライメントを誇張し、人間によって示される多様性のレベルに到達できなかった。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:43:03 GMT)
Vision Transformers for Efficient Indoor Pathloss Radio Map Prediction [4.1] ビジョントランスフォーマー(ViT)は、様々な画像ベースのタスクで最先端のパフォーマンスを達成するのに顕著な成功を収めている。
本研究では,VTをベースとしたニューラルネットワークを用いて,屋内パスロス電波地図の予測問題に対処する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:55:00 GMT)
Measuring Sample Importance in Data Pruning for Language Models based on Information Entropy [4.1] 本稿では,情報エントロピーに基づくデータプルーニング手法を提案する。
トレーニングコーパスのサンプルを,その情報性の観点からランク付けすることを提案する。
実験の結果,提案した情報に基づくプルーニングは,様々な言語モデリングや下流タスクを改善することができることがわかった。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 00:55:45 GMT)
Exploring Large Language Models on Cross-Cultural Values in Connection with Training Methodology [4.1] 大規模言語モデル(LLM)は人間と密接に相互作用し、人間の社会の文化的価値を深く理解する必要がある。
分析の結果,LLMは人間に類似した社会文化的規範を判断できるが,社会システムや進歩には影響しないことが明らかとなった。
モデルサイズの増加は、社会的価値をよりよく理解するのに役立つが、より小さなモデルは、合成データを使用することで強化することができる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 00:52:11 GMT)
Does Low Spoilage Under Cold Conditions Foster Cultural Complexity During the Foraging Era? -- A Theoretical and Computational Inquiry [4.0] 本稿では, 失業率, 収量水準, 資源管理能力, 文化活動に関連する数学的枠組みを提案する。
我々は,低汚損率と適切な収量によって狩猟の頻度が減少し,文化的な追求にかなりの時間を費やすことを証明した。
我々は先史時代の社会現実を直接再現するとは主張していないが、我々の結果は、生態学的に安定なニッチが、文化的形態が発芽し進化するミリューを提供することを示唆している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:03:08 GMT)
Avoiding strict saddle points of nonconvex regularized problems [3.9] 第二項最適性条件は定常点の零点にのみ依存することを示す。
本稿では,反復再重み付き$ell_1$を含む2つの繰り返し重み付きアルゴリズムを提案する。
これらのアルゴリズムは、サドル点の性質が仮定されるときのみランダムに局所的なサドラーに収束することを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:53:10 GMT)
AFFAKT: A Hierarchical Optimal Transport based Method for Affective Facial Knowledge Transfer in Video Deception Detection [3.9] 本稿では,AFFAKTと呼ばれる新しい手法を提案する。この手法は,大規模な表情データセットから有用な知識と相関した知識を伝達することにより,分類性能を向上させる。
2つの偽造検出データセットの実験結果から,提案手法の優れた性能が示された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:57:59 GMT)
Building a Privacy Web with SPIDEr -- Secure Pipeline for Information De-Identification with End-to-End Encryption [3.9] SPIDErはエンドツーエンドの暗号化データ識別パイプラインである。
抑制、偽名化、一般化、集約をサポートする。
本稿では,TEE内の非識別操作をエンド・ツー・エンドでセキュアに実行するための制御フローの設計について述べる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:24:12 GMT)
A Novel Ensemble-Based Deep Learning Model with Explainable AI for Accurate Kidney Disease Diagnosis [3.8] 慢性腎臓病 (CKD) は, 腎機能低下が特徴である。
本研究は,CKDの早期検出のための最先端移動学習モデルの適用について検討した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:18:49 GMT)
Enhancing Implicit Neural Representations via Symmetric Power Transformation [3.8] Inlicit Neural Representation(INR)の能力を高めるための対称パワー変換を提案する。
本手法は,余分なストレージ消費を必要としない可逆操作を特徴とする。
我々は,本手法の有効性と適用性を示すために,1Dオーディオ,2D画像,3Dビデオフィッティングタスクを行う。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:08:27 GMT)
Let Curves Speak: A Continuous Glucose Monitor based Large Sensor Foundation Model for Diabetes Management [3.8] AIと継続的グルコースモニタリングを統合することは、近い将来のグルコース予測を約束する。
CGM-LSMは592人の糖尿病患者からの1596万のブドウ糖の記録に基づいて、近未来のグルコース予測のために事前訓練されている。
LSMは1型糖尿病患者29.81mg/dL、23.49mg/dLである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 21:35:13 GMT)
VLMs meet UDA: Boosting Transferability of Open Vocabulary Segmentation with Unsupervised Domain Adaptation [3.8] 本稿では、ビジョンランゲージ推論と教師なしドメイン適応(UDA)の鍵戦略を統合することにより、多様なドメイン間のセグメンテーション精度を向上させることを提案する。
提案したFROVSS(Foundational-Retaining Open Vocabulary)フレームワークにおいて,VLMの細粒度セグメンテーション機能の改善を,マルチスケールのコンテキストデータ,即時拡張による堅牢なテキスト埋め込み,レイヤワイズ微調整により実現した。
結果として生じるUDA-FROVフレームワークは、共有カテゴリを必要とせずにドメイン間で効果的に適応する最初のUDAアプローチである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:49:42 GMT)
A semiconcavity approach to stability of entropic plans and exponential convergence of Sinkhorn's algorithm [3.7] エントロピック最適輸送の枠組みにおける非有界体の安定性とシンクホーンのアルゴリズムの収束性について検討する。
新しい用途には、部分空間の弾性コスト、弱対数対数辺縁、軽い尾を持つ辺縁などがある。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:45:31 GMT)
A comprehensive interpretable machine learning framework for Mild Cognitive Impairment and Alzheimer's disease diagnosis [3.7] ミルド認知障害(MCI)とアルツハイマー病(AD)の診断を促進するための解釈可能な機械学習フレームワークが導入された。
使用するデータセットは、脳MRIからの体積測定と、健康な人やMCI/AD患者の遺伝データを含む。
最高のパフォーマンスモデルは87.5%の精度と90.8%のF1スコアを得た。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:45:21 GMT)
Detection of Non-recorded Word Senses in English and Swedish [3.7] 本研究は,英語とスウェーデン語における未知のセンス検出の課題に対処する。
このタスクの主な目的は、特定の単語使用の意味が辞書に記録されているかどうかを決定することである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:06:07 GMT)
Double-Exponential Increases in Inference Energy: The Cost of the Race for Accuracy [3.7] コンピュータビジョンにおけるディープラーニングモデルは、エネルギー消費と持続可能性に対する懸念を増大させる。
1200画像ネット分類モデルの推定エネルギー消費の包括的分析を行う。
我々は、エネルギー消費に寄与する重要な要因を特定し、エネルギー効率を向上させる方法を示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 21:44:08 GMT)
TOAP: Towards Better Robustness in Universal Transferable Anti-Facial Retrieval [3.7] 本稿では,プライベート画像の悪意ある検索を防止するために,TOAP(Three-in-One Adversarial Perturbation)を提案する。
ToAPは、現在の最先端メソッドを複数のメトリクスで大幅に上回る。
現実世界のシナリオでは、悪意のある検索からプライベートイメージを効果的に保護することができる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 19:14:52 GMT)
Non-Hermitian Topological Phase Transition of the Bosonic Kitaev Chain [3.6] このトポロジカル増幅のオンサイト消散に対する堅牢性について検討する。
いくつかの構成では、消散に対する顕著なレジリエンスが見られます。
我々の研究は、ボソニック・キタエフ連鎖がマルチモード量子センサーとして機能する能力に明確な制限を課している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 22:23:33 GMT)
Improvement in Sign Language Translation Using Text CTC Alignment [3.5] 本稿では,CTC/AttentionとTransfer Learningを組み合わせた新しい手法を提案する。
共同CTC/Attentionは階層的エンコーディングを導入し、デコード中の注意機構とCTCを統合する。
提案手法は,最先端技術に匹敵する結果を達成し,純アテンションベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:24:16 GMT)
Enhanced Low-Dose CT Image Reconstruction by Domain and Task Shifting Gaussian Denoisers [3.5] 低放射線線量 (LDCT) からのCTは, 投射データに高ノイズが伴うため困難である。
本稿では,2段階の手法と最先端の再現性を組み合わせた簡易性と効率性を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:15:41 GMT)
PowerInfer: Fast Large Language Model Serving with a Consumer-grade GPU [3.4] 本稿では,1つのコンシューマグレードGPUを備えたパーソナルコンピュータ(PC)上での高速大言語モデル(LLM)推論エンジンであるPowerInferを紹介する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:38:12 GMT)
Control Flow Adaption: An Efficient Simulation Method For Noisy Quantum Networks [3.1] ソフトウェアスタックとハードウェア実装レベルでの量子ネットワークの研究は、量子情報科学のエキサイティングな領域となっている。
本稿では制御フロー適応と呼ばれる新しい量子ネットワークシミュレーション手法を提案する。
我々は, ns-3 のモジュールとして, 量子ネットワークシミュレータ qns-3 を開発した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:37:55 GMT)
On the Precise Asymptotics and Refined Regret of the Variance-Aware UCB Algorithm [3.1] 我々は,MAB問題に対するアッパー信頼境界変動(UCB-V)アルゴリズムの挙動について検討した。
UCB-Vは、より複雑で高度な分散を考慮したオンライン意思決定アルゴリズムにおいて、これまで知られていなかった、洗練された後悔の限界を達成できることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 00:44:43 GMT)
Are Conditional Latent Diffusion Models Effective for Image Restoration? [3.0] CLDMは高いレベルの意味的相関を捉えるのに優れており、空間条件付きテキスト・ツー・イメージ生成のようなタスクに効果的である。
画像の知覚品質を高めることが目的であるIRにおいて、これらのモデルは劣化した画像と地上の真実画像の関係をモデル化することが困難である。
その結果, CLDMのスケーリングの利点にもかかわらず, 特に劣化の少ない場合には, 高い歪みや意味的偏差が生じることが明らかとなった。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:49:55 GMT)
AI Red-Teaming is a Sociotechnical System. Now What? [3.0] 生成AI技術は、ますます現実のアプリケーションを見つけ、そのパフォーマンスと安全性をテストすることの重要性が最重要であるように思える。
赤チーム化は、AI企業によって優先順位付けされた、AIモデルをテストするための主要なアプローチである。
我々は、レッドチームの背後にある価値と前提を理解することの重要性、関連する労力、レッドチームに対する心理的影響を強調します。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 22:48:19 GMT)
Non-IID data in Federated Learning: A Survey with Taxonomy, Metrics, Methods, Frameworks and Future Directions [2.9] フェデレートラーニング(FL)は、プライベートデータを共有せずにMLモデルを集合的にトレーニングすることを可能にする。
FLは、クライアントにまたがるデータが独立で、同一に分散された(非IID)データである場合に苦労する。
この技術調査は、非IIDデータ、パーティションプロトコル、メトリクスの詳細な分類を提供することで、このギャップを埋めることを目的としています。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:16:23 GMT)
How to Re-enable PDE Loss for Physical Systems Modeling Under Partial Observation [2.9] RPLPO(Re-enable PDE Loss)と呼ばれる新しいフレームワークを提案する。
RPLPOは学習可能な高解像度状態を再構築するための符号化モジュールと、将来の状態を予測するための遷移モジュールを組み合わせる。
各種物理系で実験を行い,RPLPOが疎外,不規則,ノイズ,PDEが不正確であっても,一般化において顕著に改善されていることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:51:18 GMT)
Oversight in Action: Experiences with Instructor-Moderated LLM Responses in an Online Discussion Forum [2.9] 本稿では,インストラクターが制御するボットモジュールの設計,展開,評価について述べる。
ボットは、学生の質問に対するドラフトレスポンスを生成し、リリース前にレビュー、修正、承認される。
我々は、オブジェクト指向プログラミングに関する12週間のソフトウェア工学コースで、このツールを使った経験を報告する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:17:33 GMT)
Neural Networks for Threshold Dynamics Reconstruction [2.9] 本稿では,2つの畳み込みニューラルネットワーク(CNN)アーキテクチャを導入し,ビデオデータから事前進化のためのしきい値ダイナミクスをモデル化し,学習する。
最初のモデルは(シングルダイナミックス)MBOネットワークと呼ばれ、新しいダイナミックスに適応することなく、入力ビデオごとに特定のカーネルとしきい値を学ぶ。
第2のメタラーニングMBOネットワークは、入力毎にパラメータを適用することで、多様なしきい値のダイナミクスを一般化する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:03:31 GMT)
AI-assisted Knowledge Discovery in Biomedical Literature to Support Decision-making in Precision Oncology [2.8] 我々は,バイオメディカル文献からの知識発見を支援するために,特定の自然言語処理ソリューションの潜在的貢献を評価する。
The Bidirectional Representations from Transformers (BERT) family, two Large Language Models, and PubTator 3.0 were test for their ability to support the named entity recognition (NER) and the relation extract (RE) tasks。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 03:24:49 GMT)
A Multi-Stage Framework for Joint Chest X-Ray Diagnosis and Visual Attention Prediction Using Deep Learning [2.6] 胸部X線検査における関節疾患診断のための新しい深層学習フレームワークを提案する。
具体的には、DenseNet201バックボーンとResidualおよびSqueeze-and-Excitationブロックベースのエンコーダの両方を活用する、新しいデュアルエンコーダマルチタスクUNetを導入する。
提案手法は胸部X線診断における既存の手法と視覚的注意マップの精度を大幅に上回ることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:06:47 GMT)
DISHONEST: Dissecting misInformation Spread using Homogeneous sOcial NEtworks and Semantic Topic classification [2.6] 新型コロナウイルス(COVID-19)のパンデミックにより、Twitterなどのオンラインプラットフォームに誤報が拡散した。
我々は、Twitterのリツイートネットワークを使って、ソーシャルインタラクションやトピックモデリングを研究し、ツイートコンテンツを調査しています。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:53:46 GMT)
Rainbow chains and numerical renormalisation group for accurate chiral conformal spectra [2.6] 指数的に減衰する項を持つ共形臨界鎖の絡み合いスペクトルは、関連するキラルCFTの共形塔からなることを示す。
これらの絡み合いスペクトルは、親ハミルトニアンにアクセスすることなく単一波動関数から詳細なCFTスペクトルを抽出する信頼性の高い方法を示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 19:02:49 GMT)
Growing Tiny Networks: Spotting Expressivity Bottlenecks and Fixing Them Optimally [2.4] 機械学習タスクでは、ある機能空間内で最適な関数を探索する。
この方法で、トレーニング中の機能の進化を、選択したアーキテクチャで表現可能な領域内に配置させます。
表現性ボトルネックによる望ましいアーキテクチャ変更に関する情報は,バックプロパゲーションから抽出可能であることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:36:19 GMT)
Predicting Quality of Video Gaming Experience Using Global-Scale Telemetry Data and Federated Learning [2.4] フレーム・パー・秒(FPS)はゲーム体験に大きな影響を与える。
グローバルスケールのデータセット上でゲームFPSに影響を与える可能性のある要因について検討する。
ユーザプライバシを確保するためのフェデレーション学習モデルを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:28:34 GMT)
Auto-Regressive Moving Diffusion Models for Time Series Forecasting [2.4] 時系列予測(TSF)は,様々な領域において不可欠であり,近年の拡散型TSFモデルの進歩は大きな可能性を示唆している。
本稿では,連続的な拡散に基づくTSFを実現するために,新しい自己回帰移動拡散(ARMD)モデルを提案する。
本稿では,未来系列を初期状態として,歴史系列を最終状態として,拡散過程を再解釈する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:51:48 GMT)
Toward Foundation Model for Multivariate Wearable Sensing of Physiological Signals [2.4] 我々はNormWearと呼ばれるウェアラブルセンシング生理信号の基礎モデルを提案する。
包括的評価のために、11のパブリックなウェアラブルセンシングデータセットの下流評価を行う。
我々は,NormWearが一般時系列基礎モデリングにおいて,競争ベースラインよりも優れた性能向上を実現していることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:35:18 GMT)
MMD-OPT : Maximum Mean Discrepancy Based Sample Efficient Collision Risk Minimization for Autonomous Driving [2.4] MMD-OPTは任意の予測分布下での衝突のリスクを最小限に抑えるための試料効率のよい手法である。
本稿では,これらの2つの概念を用いて衝突リスク推定のための効率的なサロゲートのサンプルを定義する方法について述べる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:57:10 GMT)
Engineering micromotion in Floquet prethermalization via space-time symmetries [2.2] 強共振駆動下でのフロケ予熱の系統的枠組みについて述べる。
提案手法は, 熱水性ハミルトニアンの射影的静的対称性群に対して, 時空対称性がどのように対応しているかを示すものである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:53:35 GMT)
Structurally Consistent MRI Colorization using Cross-modal Fusion Learning [2.1] 本稿では,構造的に一貫した色を音源MRIデータに伝達する新しいアーキテクチャを提案する。
本アーキテクチャは,MRI画像における種々の臓器の安定な色付けのための,葉状切片画像のセグメンテーション意味を融合させる。
我々の実験は、我々のアーキテクチャが既存の手法を超越し、より定量的で質的な結果をもたらすことを示した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:40:14 GMT)
Swin2-MoSE: A New Single Image Super-Resolution Model for Remote Sensing [2.1] 我々はSwin2SRの拡張版であるSwin2-MoSEモデルを提案する。
このモデルでは、すべてのTransformerブロック内のFeed-Forwardを置き換えるために、Mixture-of-Experts (MoE) を拡張したMoE-SMを導入している。
Swin2-MoSEは、最大0.377 - 0.958 dB (PSNR)を2x、3x、4xの解像度アップスケーリングで上回っている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:06:01 GMT)
VickreyFeedback: Cost-efficient Data Construction for Reinforcement Learning from Human Feedback [2.1] 本稿では,RLHF(Reinforcement Learning from Human Feedback)の費用対効果について述べる。
RLHFは大規模言語モデル(LLM)の出力よりも人間の好みのデータセットを活用する
本稿では,RLHFのコスト効率を高める上で,オークション機構の導入が重要な役割を担っていることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:18:36 GMT)
Neural Network Symmetrisation in Concrete Settings [2.1] Cornish (2024) はマルコフ圏の抽象的文脈におけるニューラルネットワーク対称性の一般理論を最近発表した。
本稿では、これらの結果の高レベルな概要と、決定論的関数とマルコフカーネルの対称性に対する具体的な意味について述べる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:16:41 GMT)
Towards Modeling Human-Agentic Collaborative Workflows: A BPMN Extension [2.0] 大規模言語モデル(LLM)は、自律的なインテリジェントエージェントの定義を促進する。
これらのエージェントのオーケストレーションと調整は、いまだに難しい。
現在のビジネスプロセスモデリング言語は、これらの新しい混合コラボレーティブなシナリオを規定することに関して不足しています。
私たちは、この新しいタイプのワークフローの定義を可能にするために、よく知られたプロセスモデリング言語(BPMN)を拡張します。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:10:32 GMT)
Veri-Car: Towards Open-world Vehicle Information Retrieval [2.0] 本稿では,この課題を支援するための情報検索統合手法であるVeri-Carを提案する。
教師付き学習技術を利用して、車のメイク、タイプ、モデル、年、色、ナンバープレートを正確に識別する。
このアプローチはまた、新しい車モデルやバリエーションが頻繁に現れるような、オープンワールドの問題を扱うという課題にも対処する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:21:16 GMT)
EmoSpeech: A Corpus of Emotionally Rich and Contextually Detailed Speech Annotations [2.0] 微妙な感情差を制御できるTTS(text-to-speech)システムの開発は、依然として困難な課題である。
既存の感情音声データベースは、広範囲の感情状態の取得に失敗する過度に単純化されたラベル付けスキームに悩まされることが多い。
本稿では,感情に富んだ音声セグメントを体系的に抽出し,それらに詳細な自然言語記述を付加することにより,データベース構築を目的とした新しいプロセスを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:14:26 GMT)
Advancing Music Therapy: Integrating Eastern Five-Element Music Theory and Western Techniques with AI in the Novel Five-Element Harmony System [2.0] 伝統的な医療実践において、音楽療法は様々な心理的・生理的障害の治療に有効であることが証明されている。
伝統的な中国医学に根ざした五要素音楽療法(FEMT)は、文化的に重要な意味を持つ。
音楽療法における5つの要素の理論を応用して,初めて音楽療法システムを開発した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:15:09 GMT)
Hierarchical Prompting Taxonomy: A Universal Evaluation Framework for Large Language Models Aligned with Human Cognitive Principles [1.9] 本稿では,人間の認知原理に基づく階層型確率分類(HPT)について述べる。
様々なタスクの認知的要求を調べることにより、大規模言語モデル(LLM)を評価するように設計されている。
タスクの複雑さを階層的プロンプト指数(HPI)で評価し、LLMの認知能力を示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:37:52 GMT)
The Unreasonable Effectiveness of Gaussian Score Approximation for Diffusion Models and its Applications [1.8] 学習したニューラルスコアと2種類の抽出可能な分布のスコアを比較した。
学習したニューラルスコアは、中等度から高雑音スケールに対する線形(ガウス)近似によって支配される。
その結果,試料品質を維持しつつ,最初の15~30%のサンプリングステップをスキップできることがわかった。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 21:31:27 GMT)
Probabilistic Unitary Formulation of Open Quantum System Dynamics [1.8] 開か閉かにかかわらず、すべての非相対論的量子過程がユニタリあるいは確率的ユニタリであることが示される。
開量子系では、その連続力学は常にリンドブラッド・マスター方程式によって記述され、すべてのジャンプ作用素はユニタリである。
この形式主義はすべての場合において完全であることが示され、密度行列の連続性と微分可能性以外の仮定に依存しない。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 21:08:48 GMT)
Distribution free uncertainty quantification in neuroscience-inspired deep operators [1.8] エネルギー効率の高いディープラーニングアルゴリズムは、持続可能な未来と実現可能なエッジコンピューティングのセットアップに不可欠である。
本稿では,従来型およびスパイク型ニューラル演算子の不確実性を定量化するために,CRP-O(Conformalized Randomized Prior Operator)フレームワークを提案する。
共形化したRP-VSWNOは,バニラRP-VSWNO,Quantile WNO(Q-WNO),コンフォーマル化されたQuantile WNO(CQ-WNO)と比較して,UQ推定を著しく向上させることを示した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:37:02 GMT)
Agtech Framework for Cranberry-Ripening Analysis Using Vision Foundation Models [1.6] 航空画像と地上画像を用いたクランベリー作物の熟成過程を特徴付ける枠組みを開発した。
この作品はこの種の最初のものであり、クランベリーやワインブドウ、オリーブ、ブルーベリー、トウモロコシなど他の作物に将来的な影響を及ぼす。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 22:03:33 GMT)
Evaluating the Potential of In-Memory Processing to Accelerate Homomorphic Encryption [1.6] ホモモルフィック暗号化(HE)は、復号化を必要とせずに計算を可能にする。
基礎となる暗号操作に関連する高い計算とメモリオーバーヘッドは、HEベースのソリューションの実用性を妨げている。
処理インメモリ(PIM)は、計算をデータに近づけることで、プロセッサメモリのデータ移動によるオーバーヘッドを低減することにより、この問題に対して有望な解決策を提供する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:28:58 GMT)
Enhancing key rates of QKD protocol by Coincidence Detection [1.5] 理論上、量子鍵分布(QKD)は無条件のセキュリティを提供する。
しかし、その実践的な実装は、悪用可能な脆弱性に影響を受けやすい。
本研究は,弱いコヒーレントパルスを用いたQKD実装の制約に対処する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:18:28 GMT)
Leveraging Medical Foundation Model Features in Graph Neural Network-Based Retrieval of Breast Histopathology Images [1.5] 本稿では,胸部組織像検索のための新しいアテンションベース逆正則変分グラフオートエンコーダモデルを提案する。
UNIの特徴でトレーニングされた当社のトップパフォーマンスモデルでは,平均mAP/mMVスコアが96.7%/91.5%,97.6%/94.2%,BACHデータセットが97.6%/94.2%であった。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:42:37 GMT)
Integrated trucks assignment and scheduling problem with mixed service mode docks: A Q-learning based adaptive large neighborhood search algorithm [1.5] 混合サービスモードドックは、倉庫内のトラックの荷積みと降ろしの両方を柔軟に扱い、効率を高める。
本稿では,ドッキングモードの決定,トラックの割り当て,スケジューリングを統合した新しいモデルを提案する。
統合問題に対処するために,Qラーニングに基づく適応型大規模近傍探索アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:17:35 GMT)
Dimensionality Reduction Techniques for Global Bayesian Optimisation [1.4] 減次元部分空間におけるBOの実行に次元還元を適用した潜在空間ベイズ最適化について検討する。
我々は、より複雑なデータ構造や一般的なDRタスクを管理するために、変分オートエンコーダ(VAE)を使用している。
そこで本研究では,分子生成などのタスク用に設計され,より広い最適化目的のためにアルゴリズムを再構成する実装において,いくつかの重要な補正を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:27:27 GMT)
The Cost of Replicability in Active Learning [1.3] アクティブラーニングは、当初ラベルなしのデータポイントのラベルを選択的にクエリすることで、機械学習アルゴリズムに必要なラベル付きデータを減らすことを目的としている。
アルゴリズムが常に異なる実行で同じ結果を生成する結果の複製性を保証することは、機械学習モデルの信頼性に不可欠である。
本報告では,古典的不一致に基づく能動学習手法であるCALアルゴリズムを用いて,能動学習における再現性のコストについて検討する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 19:03:31 GMT)
Labits: Layered Bidirectional Time Surfaces Representation for Event Camera-based Continuous Dense Trajectory Estimation [1.3] イベントカメラは、高時間分解能と低レイテンシで動的シーンをキャプチャする。
Labits: Layered Bidirectional Time Surfacesを紹介します。
提案手法は,従来のMultiFlowデータセットと比較して,トラジェクティブ終点誤差(TEPE)を49%削減する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:11:50 GMT)
STEAM: Squeeze and Transform Enhanced Attention Module [1.3] 本稿では,マルチヘッドグラフ変換器の概念を利用して,チャネルと空間の注意の両方をモデル化するグラフベースの手法を提案する。
STEAMは標準のResNet-50モデルよりも2%精度が向上し、GFLOPはわずかに増加した。
STEAMは、GFLOPの3倍の削減を達成しつつ、リードモジュールECAとGCTの精度で性能を向上する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:38:10 GMT)
Reasoning-Aware Query-Focused Summarization over Multi-Table Data [1.3] 大規模言語モデル(LLM)を利用したエンドツーエンド生成フレームワークであるQueryTableSummarizer++を提案する。
本手法では,中間シリアライズステップの必要性を排除し,クエリ関連要約を直接生成する。
ベンチマークデータセットの実験では、QueryTableSummarizer++がBLEU、ROUGE、F1スコアで最先端のベースラインを大幅に上回っていることが示されている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:04:31 GMT)
Unveiling the Importance of Non-Shortest Paths in Quantum Networks [1.3] 我々は、スケールフリーネットワーク上での強い接続の起源を明らかにするために、統計物理学モデル(コンカレンスパーコレーション)を適用した。
以上の結果から,QN設計における重要な原則が浮かび上がっている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:09:14 GMT)
Multi-client Functional Encryption for Set Intersection with Non-monotonic Access Structures in Federated Learning [1.3] クラウドサーバに基づくフェデレーション学習(FL)は、分散機械学習フレームワークである。
非単調なアクセス構造を持つ集合交差に対するマルチクライアント機能暗号方式を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:19:12 GMT)
First Train to Generate, then Generate to Train: UnitedSynT5 for Few-Shot NLI [1.3] We present UnitedSynT5, a Advanced extension of Entailment Few-Shot Learning (EFL)。
我々は、T5ベースのジェネレータを使用して、厳格にクリーン化され、トレーニングデータに統合された追加の前提-仮説ペアを合成する。
この拡張データセット上でGTR-T5-XLモデルをトレーニングし、SNLIデータセットで94.7%の精度、E-SNLIデータセットで94.01%の精度、MultiNLIデータセットで92.57%の精度を達成し、以前のSOTAモデルを上回った。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:21:09 GMT)
Modified Feature Selection for Improved Classification of Resting-State Raw EEG Signals in Chronic Knee Pain [1.3] 脳波による慢性膝痛を効果的に予測するコンパクトな接続機能セットを見つけるために, 自動的アプローチを用いることが示されている。
慢性的な痛みの研究に光を当て、将来の診断と治療のための臨床ソリューションに繋がるかもしれない。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 04:24:51 GMT)
Long-lived quantum correlation by cavity-mediated subradiance [1.3] 指向性低Q空洞に結合した複数の量子エミッタの中で長寿命のサブラジアント状態を示す。
亜ラジカル状態の重要な指標として、この系は大きな光子束と単光子崩壊を示す。
キャビティを介するサブラジオアンスを誘導するための我々のアプローチは、量子エミッタにおける量子相関の生成と利用の方法である。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:06:39 GMT)
The generalized CV conjecture of Krylov complexity [1.2] クリロフ複雑性は情報幾何学におけるフビニ・スタディ計量の体積と等しいと推測する。
変位演算子を用いることで、閉系に対する波動関数がよく知られた2モード圧縮状態に対応することが分かる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 04:23:29 GMT)
Merging versus Ensembling in Multi-Study Prediction: Theoretical Insight from Random Effects [1.2] データセット間の予測・出力関係における潜在的な不均一性の存在下での2つのマルチスタディ予測手法を比較した。
尾根回帰について解析的に検証し,融合による予測誤差がアンサンブルよりも低いことをシミュレーションにより確認する。
様々なシナリオにおける遷移点の解析式を提供し、その性質を考察し、遷移点理論をメタゲノミクスの応用と組み合わせて研究を決定する方法を説明する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:47:50 GMT)
Accurate Water Level Monitoring in AWD Rice Cultivation Using Convolutional Neural Networks [1.2] 気候変動により農業セクターは困難に陥り、特に地球規模の水資源はますます不足している。
バングラデシュでは、特にボローライスは栽培中にかなりの水を入れる必要がある。
伝統的に、農家は水位を手動で測定する。
本稿では,コンピュータビジョン,特に畳み込みニューラルネットワークを用いて水位測定を自動化する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:45:10 GMT)
Gradient descent inference in empirical risk minimization [1.2] 勾配降下法は、現代の統計学習において最も広く使われている反復アルゴリズムの1つである。
本稿では,多種多様な経験的リスク最小化問題における勾配降下の精度,非漸近的特性について述べる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:47:08 GMT)
Sequential Attack Impairs Security in Device-independent Quantum Key Distribution [1.0] デバイス独立量子鍵分布(DI-QKD)
非局所相関を用いて、2つの正直な当事者間の暗号鍵をセキュアに確立する。
ベル違反は観測された統計に固有の予測不可能性を保証する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:53:11 GMT)
NLPineers@ NLU of Devanagari Script Languages 2025: Hate Speech Detection using Ensembling of BERT-based models [1.0] 本稿では,ヒンディー語とネパール語に着目し,デバナガリ文字言語におけるヘイトスピーチの検出に焦点を当てた。
本研究では,様々なトランスフォーマーモデルを用いて,ヘイトスピーチと自由表現のニュアンス境界をナビゲートする効果について検討する。
この研究は、デバナガリ文字言語におけるヘイトスピーチ検出の必要性を強調し、さらなる研究の基盤を提供する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:42:11 GMT)
Guiding Vision-Language Model Selection for Visual Question-Answering Across Tasks, Domains, and Knowledge Types [0.9] 本稿では,タスクタイプ,アプリケーションドメイン,知識タイプを付加した,確立されたVQAベンチマークから得られた新しいデータセットについて,総合的な評価を行う。
また、GPT-4oを用いて開発されたマルチモーダル評価指標であるGoEvalを導入し、人間の判断と56.71%の相関係数を達成した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:26:09 GMT)
GainAdaptor: Learning Quadrupedal Locomotion with Dual Actors for Adaptable and Energy-Efficient Walking on Various Terrains [0.9] 深部強化学習(DRL)は、課題のある環境で脚のあるロボットを制御する革新的なソリューションとして登場した。
本稿では、地形適応性とエネルギー効率を向上させるために、共同PDゲインを自律的に調整する適応利得制御フレームワークGainAdaptorを提案する。
本手法の有効性を,Unitree Go1ロボットを用いた実験により検証し,様々な地形における移動性能の向上を実証した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:06:22 GMT)
Pulling the Carpet Below the Learner's Feet: Genetic Algorithm To Learn Ensemble Machine Learning Model During Concept Drift [0.8] 現実的でダイナミックな環境で機械学習(ML)モデルを使用する場合、ユーザーはしばしばコンセプトドリフト(CD)の課題に対処する必要がある。
本稿では,グローバルMLモデルとCD検出器を組み合わせた2段階のアンサンブルMLモデルを提案する。
提案手法は,CDアルゴリズムを用いた1つのMLパイプライン,特に未知のCD特性を持つシナリオにおいて,優れた性能を示すことを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:51:44 GMT)
Symmetry-Constrained Generation of Diverse Low-Bandgap Molecules with Monte Carlo Tree Search [0.8] 近赤外(NIR)感受性分子は、夜間視覚装置や生体医用イメージングにユニークな用途を持つ。
我々は、有機電子分子のドメインに焦点をあてた特許によるデータセットから構造的先行性を活用する。
提案手法は,特許データセットから対称性制約を保ちつつ,赤方偏移吸収を示す候補を生成する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:22:24 GMT)
Finite-PINN: A Physics-Informed Neural Network Architecture for Solving Solid Mechanics Problems with General Geometries [0.7] PINNモデルは、ほとんどの固体構造の典型的な有限境界と矛盾する無限領域上の解を生成する。
PINNが利用した解空間はユークリッド空間(英語版)であり、しばしば固体構造に存在する複素幾何学に対処するには不十分である。
Finite-PINNモデルは、応力場と変位場の近似を分離することでこれらの課題に対処する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:06:21 GMT)
Doc2Oracle: Investigating the Impact of Javadoc Comments on Test Oracle Generation [0.7] Javaでは、Javadocコメントは、ソースコードに直接埋め込まれた構造化された自然言語ドキュメントを提供する。
テストオラクル生成(TOG)に対するJavadocコメントの影響について詳しく調べる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:27:47 GMT)
Towards better social crisis data with HERMES: Hybrid sensing for EmeRgency ManagEment System [0.7] HERMESは,OSN利用者が災害の余波で自発的に開示した情報を豊かにするためのシステムである。
HERMESは、現実世界の緊急事態で評価され、利用可能な被害情報の量を増やすことが実証された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:55:19 GMT)
MRI to PET Cross-Modality Translation using Globally and Locally Aware GAN (GLA-GAN) for Multi-Modal Diagnosis of Alzheimer's Disease [0.7] 現実像を合成できるGAN(Generative Adversarial Network)は、標準的なデータ拡張手法の代替として大きな可能性を秘めている。
本稿では,グローバルな構造的整合性と局所的細部への忠実さを両立させるマルチパスアーキテクチャにより,グローバルかつ局所的に認識された画像間変換GAN(GLA-GAN)を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:30:36 GMT)
Stochastic Learning of Non-Conjugate Variational Posterior for Image Classification [0.7] 大規模ベイズ非パラメトリック(BNP)学習者は、大きなクラス番号と大きなトレーニングサイズを持つデータセットを分別コストで処理できる。
より難しい問題は、非共役後部における大規模学習を検討することである。
我々は,最近提案された変分最大化学習(VMM)に基づく新しい手法を開発し,非共役後部における大規模学習を実現する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:33:23 GMT)
Deep clustering using adversarial net based clustering loss [0.7] 我々は、従来の閉形式 KL の発散に対して、対角ネットとして深層クラスタリングを再構成する。
提案手法の性能をいくつかのよく引用されたデータセットで実証した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 04:51:05 GMT)
Deep Clustering using Dirichlet Process Gaussian Mixture and Alpha Jensen-Shannon Divergence Clustering Loss [0.7] オートエンコーダをベースとしたディープクラスタリングでは、クラスタリングとディメンションリダクションを共同で最適化する方法が課題である。
本稿では,ダイリクレ過程のガウス混合モデルを用いた無限クラスタ表現を導入し,潜在空間における連成クラスタリングとモデル選択について述べる。
我々は,MIT67 や CIFAR100 などの大規模クラス数データセットに対して,従来のモデル選択を用いた深層モデル選択手法の評価を行った。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:02:41 GMT)
TransferLight: Zero-Shot Traffic Signal Control on any Road-Network [0.6] TransferLightは、ロードネットワーク全体の堅牢な一般化のために設計された新しいフレームワークである。
階層的で、異質で、有向的なグラフニューラルネットワークアーキテクチャは、トラフィックの粒度の動態を効果的に捉えます。
我々は、ゼロショットを任意の道路ネットワークに再トレーニングせずにスケールする、単一の重み付けポリシーを開発した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 20:52:12 GMT)
Learning $k$-body Hamiltonians via compressed sensing [0.6] 我々は、必ずしも幾何学的に局所ではない、M$未知のパウリ項を持つ$k$ボディハミルトニアンを学習する問題を研究する。
ハミルトンの精度を$epsilon$と総進化時間で学習するプロトコルを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:20:28 GMT)
Flow-based Detection of Botnets through Bio-inspired Optimisation of Machine Learning [0.6] ボットネットは、ボットネット内の他のメンバーと自律的に感染し、伝播し、通信し、調整することができる。
従来の検出手法は、様々なネットワークベースの検出回避手法に不適合になってきている。
本研究では,ボットネットワーク活動のバイナリ分類を容易にするために,ネットワークフローに基づく行動モデルの適用について検討する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:49:49 GMT)
Emulating the Global Change Analysis Model with Deep Learning [0.6] グローバル・チェンジ・アナリティクス・モデル(GCAM)は、地球と人間システムの間の複雑な相互作用をシミュレートする。
我々は、エネルギー生産源の異なる相対的寄与に関連する様々なGCAM入力を探索する既存の大きなアンサンブルでニューラルネットワークを訓練する。
我々は、この既存のアンサンブルを補足し、補間された入力値とより広い出力選択を行い、時間、セクター、地域にわたって22,528個のGCAM出力を予測する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:12:55 GMT)
A Mathematical Structure for Amplitude-Mixing Error-Transparent Gates for Binomial Codes [0.6] エラー透明な操作は、操作中のエラー率を保存する方法のひとつです。
相ゲートのみが、二項符号化の明示的にエラー透過的な定式化を施されている。
修正可能な光子ジャンプのすべてに対する誤差透過性を示すが、ジャンプの誤りではない。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:06:48 GMT)
Differential learning kinetics govern the transition from memorization to generalization during in-context learning [0.6] トランスフォーマーはインコンテキスト学習(ICL: In-context Learning)を示す。
最近の研究は、モデルが十分に多様なタスクセットで訓練されたときにICLが出現することを示している。
記憶・一般化するサブ回路は,主に独立していると考えられる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:10:51 GMT)
Characterization of individual charge fluctuators in Si/SiGe quantum dots [0.5] 簡単な量子ドット輸送測定により,Si/SiGe量子ドット内の各2レベル変動器(TLF)を探索する。
TLFスイッチング時間はゲート電圧に敏感に依存し、温度は低下し、近くの量子ドットを通した電流に依存する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:21:14 GMT)
PickLLM: Context-Aware RL-Assisted Large Language Model Routing [0.5] PickLLMは、RL(Reinforcement Learning)を使用してオンザフライクエリを利用可能なモデルにルーティングする軽量フレームワークである。
学習速度の違いに対する収束の速度と,クエリ毎のコストや全体の応答遅延といったハードメトリクスの改善を実証する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:27:12 GMT)
Biology-inspired joint distribution neurons based on Hierarchical Correlation Reconstruction allowing for multidirectional neural networks [0.5] 低レベル差を除去できるHCR(Arnold correlation Reconstruction)に基づく新しい人工ニューロンが提案されている。
このような HCR ネットワークは $rho(y,z|x)$ のような確率分布(ジョイント)を伝播することもできる。
また、テンソル分解によるdirect $(a_mathbfj)$ Estimationのような追加のトレーニングアプローチも可能である。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:54:46 GMT)
Temporal Numeric Planning with Patterns [0.5] PDDL2.1レベル3で表される時間数値計画問題$Pi$を考える。
モデルが$Pi$の有効なプランに対応する$(i)$と$(ii)$は、最近提案された数値から時間ケースへのパターンアプローチによるプランニングの拡張を示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:28:34 GMT)
Robust Quantum Control via Multipath Interference for Thousandfold Phase Amplification in a Resonant Atom Interferometer [0.5] 本稿では,光パルス原子干渉計のパルス不均一性に対する堅牢性を高める新しい手法を提案する。
本手法を共振型原子干渉計に適用し,数千倍の位相増幅を実現する。
我々は,ダークマター,ダークエネルギ,重力波検出など,さまざまな用途において,物質波干渉計の性能向上が期待できる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:21:29 GMT)
An Optical Interconnect for Modular Quantum Computers [0.4] 量子コンピュータのスケールアップには 光学的相互接続が必要です
グループスイッチが計算終端ノードから出力される光子をルーティングする多群構造を提案する。
試作3ノードスイッチング配線を実装し,少なくとも0.6の忠実度を持つ2ホップ絡みを発生させる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:16:50 GMT)
CBCMS: A Compliance Management System for Cross-Border Data Transfer [0.4] クロスボーダーデータ転送のためのクロスボーダーコンプライアンス管理システム(CBCMS)を提案する。
PDLはデータ処理ポリシーの統一管理をサポートし、自然言語ポリシーと機械処理可能な表現のギャップを埋める。
CPGMは準拠データ処理ポリシーを高精度に生成し、F1スコアは25.16%向上した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:48:00 GMT)
Multi-objective Combinatorial Methodology for Nuclear Reactor Site Assessment: A Case Study for the United States [0.4] 原子力発電所(NPP)に伴う高資本コスト
石炭発電所の立地を含む既存のインフラのある場所は、建設済みの設備とユーティリティを提供している。
ブラウンフィールドの跡地は、以前は工業活動によってしばしば影響された、あるいは未利用の土地であった。
本研究は,米国における3万以上のNPPサイトを探索して評価する,新しい多目的最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:24:58 GMT)
Application of quantum annealing for scalable robotic assembly line optimization: a case study [0.4] ロボット組立ラインバランシング(RALB)の実世界の問題に対する量子コンピューティングの適用について検討する。
D-Wave Advantage 4.1量子コンピュータ上でのハイブリッド量子古典アルゴリズムを用いて、整数プログラミングの定式化を2次非制約バイナリ最適化問題に変換する。
ケーススタディでは、量子解は正確な解と比較され、量子コンピューティングが製造生産性を高めコストを削減できる可能性を示している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:49:34 GMT)
AI Predicts AGI: Leveraging AGI Forecasting and Peer Review to Explore LLMs' Complex Reasoning Capabilities [0.4] 2030年までに出現するAI(Artificial General Intelligence, AGI)の可能性を推定し, 最先端の大規模言語モデル16を課題とした。
これらの予測の質を評価するために,自動ピアレビュープロセス(LLM-PR)を実装した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:52:41 GMT)
Experimental implementation of dimension-dependent contextuality inequality [0.3] 量子システムの次元を認証するための既存の方法は、より大きな古典的システムを用いて不正にすることができる。
我々の手法は、古典的なシステムでは破れない文脈的不等式を使い、以前の抜け穴を閉じる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:59:43 GMT)
Quantum Kernel-Based Long Short-term Memory for Climate Time-Series Forecasting [0.2] 本稿では,量子カーネル法を従来のLSTMアーキテクチャに統合したQK-LSTM(Quantum Kernel-Based Long short-Memory)ネットワークを提案する。
QK-LSTMは、トレーニング可能なパラメータが少ない複雑な非線形依存と時間ダイナミクスをキャプチャする。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:16:52 GMT)
Combinatorial Amplitude Patterns via Nested Quantum Affine Transformations [0.2] 本稿では,量子回路にネストしたアフィン変換を実装するための,堅牢でスケーラブルなフレームワークを提案する。
提案手法は状態正規化を保ちながら逐次アフィン変換を体系的に適用する。
このフレームワークの実用性は、金融リスク評価と離散信号処理の2つの主要な応用を通して実証されている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 20:35:56 GMT)
Learned Compression for Compressed Learning [0.2] WaLLoCは、線形変換符号化と次元減少型オートエンコーダを組み合わせたニューラルネットワークである。
WaLLoCは非常に効率的で、モバイルコンピューティング、リモートセンシング、および圧縮データから直接学習するのに適している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:09:57 GMT)
The transfer of nonlocality between two- and three-qubit dissipative systems with counter-rotating-wave terms [0.1] 強い結合状態においては、反回転項は真の3つの相関関係の崩壊を加速する。
超強結合系では、非局所性が3量子ビットとそのサブシステム間で一貫して遷移する現象が観察される。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:25:16 GMT)
eCARLA-scenes: A synthetically generated dataset for event-based optical flow prediction [0.0] イベントベースのデータを処理する包括的なライブラリであるeWizを紹介する。
本稿では,光フロー予測タスクのための合成イベントベースデータセットとデータ生成パイプラインを提案する。
eCARLAシーンは、CARLAシミュレータを使用して、自動運転車のシナリオをシミュレートする。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:02:23 GMT)
algoTRIC: Symmetric and asymmetric encryption algorithms for Cryptography -- A comparative analysis in AI era [0.0] 本稿では、対称暗号(SE)と非対称暗号(AE)のアルゴリズムの比較分析を行う。
AI駆動環境におけるセンシティブな情報の確保における彼らの役割に焦点を当てている。
論文は、暗号化アルゴリズムがAIの時代に取り組む必要があるというセキュリティ上の懸念に対処することで締めくくっている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:25:39 GMT)
Writing Style Matters: An Examination of Bias and Fairness in Information Retrieval Systems [0.0] 本稿では,情報検索(IR)システム内の特定の文書やクエリ記述スタイルに対するテキスト埋め込みモデルの潜在的なバイアスについて検討する。
本研究により,異なる埋め込みモデルが文書作成スタイルの異なる好みを示すことが明らかとなった。
クエリ記述スタイルに関しては、多くの埋め込みモデルは、検索したドキュメントのスタイルとクエリのスタイルにマッチする傾向にあるが、特定のスタイルに対して一貫した好みを示すものもある。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:22:37 GMT)
Words of War: Exploring the Presidential Rhetorical Arsenal with Deep Learning [0.0] このプロジェクトは、米国の大統領レトリックの微妙なニュアンスと根底にあるパターンを解読するために、ディープラーニング技術を使用することを目的としている。
機械学習と歴史調査の学際的な融合を通じて、ニューラルネットワークの予測能力に関する洞察を掘り下げたいと考えています。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:04:09 GMT)
Vision-Language Models Represent Darker-Skinned Black Individuals as More Homogeneous than Lighter-Skinned Black Individuals [0.0] 視覚言語モデル(VLM)は、大言語モデル(LLM)機能と画像処理を組み合わせることで、画像キャプションやテキスト・ツー・イメージ生成といったタスクを可能にする。
浅黒い肌の個体は、より軽い肌の個体よりもネガティブなステレオタイピングに直面している皮膚のトーンバイアスは、社会科学において十分に文書化されている。
我々は、黒人男女のコンピュータ生成画像をサンプリングし、他の特徴を一定に保ちながら、肌の色の変化を制御した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:53:49 GMT)
Verification of single-photon path entanglement using a nitrogen vacancy center [0.0] ナノダイヤモンド中の窒素空孔中心から生成した単一光子を用いて,二部体経路の絡み合った状態の生成と検証を実験的に検討した。
連続波レーザー励起と新しい状態発生「タイムウインドウ」法を用いて実験を行う。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:38:35 GMT)
Understanding Opportunities and Risks of Synthetic Relationships: Leveraging the Power of Longitudinal Research with Customised AI Tools [0.0] 我々は,合成関係の機会とリスクを探索するために,AIツールをカスタマイズした縦型行動研究の利点について論じる。
これらの関係は、健康、教育、職場を改善する可能性があるが、微妙な操作やプライバシー、自律性への懸念も引き起こす。
我々は,詳細な行動情報と自己報告データを統合可能な,自己組織化されたAIエージェントを用いた縦型研究設計を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:13:43 GMT)
Ultrafast Quantum Optics and Communication [0.0] 我々は、0.33から0.73Hzの超高速でブロードバンドな量子光パルスの生成を実証した。
その結果、これらのパルスは、理論的予測と一致した振幅スクイーズを示すことが確認された。
この研究は、超高速量子光学、量子コンピューティング、次世代暗号化量子通信ネットワークの道を開いた。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:33:45 GMT)
Towards the phase diagram of fermions coupled with $SO(3)$ quantum links in $(2+1)$-D [0.0] 量子リンクモデル (QLMs) は、ウィルソンの格子ゲージ理論を有限次元ヒルベルト空間で定式化した一般化である。
モデルが初めて$(2+1)d$ディメンションに拡張し、最初の結果について報告します。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 19:13:05 GMT)
Towards the Structure and Mechanisms of Complex Systems, the Approach of the Quantitative Theory of Meaning [0.0] 本稿では,シャノンのコミュニケーション理論の範囲として開発された意味の量的理論を用いて,複雑なシステムの解析を行う。
システムのダイナミクスは、異種エージェント間の反射的な通信によって提供される。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:18:47 GMT)
Theory-independent randomness generation from spatial symmetries [0.0] 我々のシナリオにおける量子相関の集合は、回転対称性のみから導出できることが示される。
このことは、量子論の重要な予測が空間の構造から導かれることを示している。
空間対称性の破れに基づくセキュアな乱数生成のための半デバイス非依存プロトコルを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:34:04 GMT)
The Potential of Answer Classes in Large-scale Written Computer-Science Exams -- Vol. 2 [0.0] 中等教育の教員養成では、試験ごとに評価ガイドラインが義務付けられている。
この概念を462名の学生と41名の課題を持つ大学試験に適用する。
各タスクに対して、インストラクターは、期待された応答のクラスである回答クラスを開発した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:20:39 GMT)
The Parameters of Educability [0.0] 教育可能性モデルは、人間をユニークなものにする認知能力を記述するために最近提案された計算モデルである。
本稿では、教育可能なシステムの主要なパラメータのいくつかと、その存在のより広い意味について論じる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:27:03 GMT)
The Informational Role of Online Recommendations: Evidence from a Field Experiment [0.0] 映画推薦プラットフォーム上でフィールド実験を行い、オンラインレコメンデーションが消費選択にどう影響するかを調査する。
本実験は, 内装設計を用いて, 消費に対する勧告の因果効果を測定し, 2つの経済メカニズムの相対的重要性を分解する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:11:06 GMT)
The AI Assessment Scale Revisited: A Framework for Educational Assessment [0.0] ジェネレーティブ・人工知能(GenAI)の最近の進歩は、教育において大きな不確実性を生み出している。
我々は、2つの基本的な目的を持ったフレームワークであるAIAS(AI Assessment Scale)の更新版を提示する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:44:52 GMT)
Stellar parameter prediction and spectral simulation using machine learning [0.0] 本研究では,ESOの高精度放射速度惑星探索装置(HARPS)のデータ履歴全体に対して機械学習を適用した。
我々は、スペクトルパラメータを予測しスペクトルを生成するために、HARPSデータ上で標準および変分オートエンコーダを訓練した。
提案モデルでは, スペクトルパラメータの予測と実スペクトルの圧縮に優れ, 有効温度に対して約50Kの予測誤差を達成した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:09:42 GMT)
Speeding up approximate MAP by applying domain knowledge about relevant variables [0.0] 特定のクエリにどの変数が関係しているかの知識は、正確なMAPと近似MAPの両方を打ち負かすのに十分速くなることを示す。
我々の結果は決定的ではないが、おそらくMAPクエリの特異性、特にMAP変数の数に依存していることを示している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:22:01 GMT)
Search Strategy Generation for Branch and Bound Using Genetic Programming [0.0] GP2S(Genetic Programming for Search Strategy)は,B&B検索戦略を自動生成する機械学習手法である。
我々は、SCIPソルバの標準手法、最近のグラフニューラルネットワークに基づく手法、手工芸品との比較を行った。
我々の手法は最良基準よりも2%遅く、SCIPを一貫して上回り、平均速度は11.3%に達する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:57:46 GMT)
Scikit-fingerprints: easy and efficient computation of molecular fingerprints in Python [0.0] scikit-fingerprintsは、化学情報学の応用のための分子指紋の計算のためのPythonパッケージである。
当社のライブラリは業界標準のScikit-learnインターフェースを提供しており、直感的な使用と機械学習パイプラインとの統合が容易です。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:35:22 GMT)
Revocable Anonymous Credentials from Attribute-Based Encryption [0.0] 本稿では,Ciphertext-Policy Attribute-Based Encryptionを利用した認証プロトコルを提案する。
このプロトコルは、アキュムレータによる述語と取り消しの匿名の証明をサポートする。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:19:23 GMT)
Revisiting Gaussian genuine entanglement witnesses with modern software [0.0] 連続変数ガウスの絡み合いは量子情報理論において魅力的な概念である。
測定された非物理的行列から最も可能性の高い物理共分散行列を再構成する手法を提案する。
次に, 測定誤差が存在する場合でも, 異なる種類の分離性に対して再構成行列を試験する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:33:52 GMT)
Reversing the Damage: A QP-Aware Transformer-Diffusion Approach for 8K Video Restoration under Codec Compression [0.0] DiQPは8Kビデオ品質を圧縮によって劣化させる新しいトランスフォーマー拡散モデルである。
我々のアーキテクチャは、拡張されたウィンドウ機構で長距離依存関係をキャプチャするトランスフォーマーのパワーを組み合わせています。
我々のモデルは最先端の手法、特に4Kや8Kのような高精細度ビデオよりも優れています。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 03:49:22 GMT)
Regression and Classification with Single-Qubit Quantum Neural Networks [0.0] 我々は、回帰処理と分類処理の両方にリソース効率が高くスケーラブルなSQQNN(Single-Qubit Quantum Neural Network)を使用する。
分類にはTaylor級数にインスパイアされた新しいトレーニング手法を導入する。
SQQNNは、MNISTデータセットを含む回帰および分類タスクにおいて、事実上エラーのない、強力なパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:35:36 GMT)
Quench dynamics of entanglement from crosscap states [0.0] 長距離絡みを持つ初期状態からの両部絡み合いエントロピーと相互情報のダイナミクスについて検討する。
ダイナミクスの種類やシステムが統合可能かカオスかによって、振る舞いのパターンが異なることが分かりました。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:44:00 GMT)
Quantum stresses in the hydrogen atom [0.0] 私は、重力形因子をストレス分布として$D$と$barc$と解釈することは確かに適切であると考えています。
驚くべき結果として、$barc$は系を結合する力法則を定量化しており、これはコーシーの最初の運動法則を通して理解することができる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:13:31 GMT)
Quantum non-Gaussian coherences of an oscillating atom [0.0] 基底の最も基本的な二項重ね合わせや高次固有状態でさえ、量子センシング、熱力学、計算に非常に必要である。
古典的およびガウス的状態と演算によって達成される量子コヒーレンスに対する上限を導出する。
機械振動における量子非ガウスコヒーレンスの不明瞭な観察を実験的に実証した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:03:10 GMT)
Quantum inspired factorization up to 100-bit RSA number in polynomial time [0.0] 我々はシュノーアの数学的枠組みに基づくRSA因子化ビルディングを攻撃した。
我々は、量子システムにおける最適化問題を符号化する最大256ビットのRSA数を分解する。
結果は現在の通信インフラのセキュリティを損なうものではない。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:07:40 GMT)
Quantum information in Riemannian spaces [0.0] 我々は、物理空間における連続変数に対する微分同相不変な微分エントロピーの定式化を開発する。
ウィグナーの準確率密度関数を一般化することにより、この定式化を量子レベルにまで拡張する。
一般化された量子エントロピーの不確実性関係を導出し、ビアリニコ・ビラとミセルスキーの不等式を曲線空間に拡張する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:17:05 GMT)
Quantum evolution of mixed states and performance of quantum heat engines [0.0] 量子力学のハイゼンベルク表現の線に沿って密度演算子の時間発展を計算する手法を提案する。
これらの系は、エネルギー交換の過程で誘起される絡み合いとノイズ誘起コヒーレンスにより発振器が熱状態を交換する興味深い量子力学を示す。
その結果、より優れた性能で量子マシンを設計するのに有用な混合状態の量子進化の理解を深めることができた。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:40:20 GMT)
Quantum correlations via vector soliton interactions [0.0] 分散変調複屈折ファイバにおける量子相関パルス対の生成について考察した。
線形化量子ゆらぎ理論を用いて光子数相関とスクイージングを研究する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:01:26 GMT)
QFAM: Mitigating QUIC Handshake Flooding Attacks Through Crypto Challenges [0.0] ハンドシェイクプロトコルに暗号チャレンジの概念を導入することで,新しい防御機構を導入する。
クライアントは、サーバ側で高い優先度を受け取るために、ハンドシェイクプロセス中に暗号の問題を解決しなければなりません。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 04:56:53 GMT)
Putting the Count Back Into Accountability: An Analysis of Transparency Data About the Sexual Exploitation of Minors [0.0] まず、オンラインCSEの成長についてデータから何が分かるか。
われわれは過去25年間のCSEレポートの成長を分析し、ソーシャルメディアのユーザーアカウントの成長と相関している。
調査対象の組織の半分が意味があり、合理的に正確な透明性データをリリースする一方で、残りの半分は、重大な品質問題のある公開やリリースデータの提供に失敗する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:13:13 GMT)
Probability of Differentiation Reveals Brittleness of Homogeneity Bias in GPT-4 [0.0] LLM(Large Language Models)における均一性バイアス(英語版)とは、ある集団の表現を他と比較して均質化する傾向を指す。
このバイアスを文書化する以前の研究は、主にエンコーダモデルを使用しており、それは必然的にバイアスを導入した可能性がある。
本研究は、エンコーダモデルをバイパスして、モデル出力から均一性バイアスを直接評価する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:35:21 GMT)
Pre-trained Transformer Uncovers Meaningful Patterns in Human Mobility Data [0.0] 本研究では、国規模の未ラベルの人体移動データに基づいて事前訓練されたトランスフォーマーが、対象の地理の深い理解を深めることのできる埋め込みを学習することを示す。
我々は,人間の移動性に関する幅広い概念をカプセル化するために,事前学習した埋め込みの性能を評価する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 03:19:59 GMT)
Partial-immunity of two-photon correlation against wavefront distortion for spatially entangled photons [0.0] 光子の高次元量子絡み合いは、従来の量子ビット系よりも顕著な技術進歩をもたらす。
しかし、そのような高次元状態は複雑な乱雑な媒体による破壊に弱いため、実用化には重大な課題が生じる。
本稿では,遠距離場における任意の位相歪みに起因する2光子相関のランダム化について述べる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:31:20 GMT)
Orbital Optical Raman Lattice [0.0] 我々はラマン誘導型SOCとエキゾチックな高軌道ボース凝縮体を正方格子で研究した。
SOCとp軌道相互作用がボソンの凝縮状態に影響を与えることが判明した。
我々の発見は、光学格子におけるエキゾチックSOCと高軌道物理学の新たな道のりを刺激するかもしれない。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:04:51 GMT)
Optomechanical systems with nonlinear interactions: photon blockade, collapse and revival of optical oscillations [0.0] このような系における光子遮断、崩壊、光振動の再生の効果を実現することができる。
これらのクロスカーの非線形性の影響は、光学モードの減衰率の増加とともに消失し、またゼロ温度で完全に抑制される。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:59:29 GMT)
Operator formulation of Classical mechanics: Levi-Civita map and equivalence of central forces in 2-dimensions [0.0] 平面極座標を用いて古典ハミルトニアン作用素と古典波動関数を構成する。
これらの古典的ハミルトニアン作用素とそれに対応する古典的波動関数の言葉で書かれたシュル「オーディンガー」様方程式は、後者の方程式に写像される。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:00:38 GMT)
On the Robustness of Kolmogorov-Arnold Networks: An Adversarial Perspective [0.0] Kolmogorov-Arnold Networks (KAN) は関数近似の新しいアプローチとして登場した。
理論的な約束にもかかわらず、敵対的な条件下でのカンの堅牢性はまだ十分に検討されていない。
我々は,標準のホワイトボックスとブラックボックスの敵攻撃に対するカンの性能を評価する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:40:49 GMT)
On Round-Off Errors and Gaussian Blur in Superresolution and in Image Registration [0.0] 空間的に制限された1次元定数関数に対する超解像と離散像の登録について検討する。
その結果,他の種類のノイズがなくても,2組のサンプルから不連続点を決定することの難しさが示唆された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 22:08:53 GMT)
Omnidirectional shuttling to avoid valley excitations in Si/SiGe quantum wells [0.0] 本稿では,2次元シャットリングに基づくフルキュービットアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:53:13 GMT)
Observation as Physication. A single-world unitary no-conspiracy interpretation of quantum mechanics [0.0] 本稿では,観測対象の値とともに,操作者に対する物理的意味の割り当てが観測を通して広まることを提案する。
量子観測は、この割り当てに留まらず、一元的に行うことができると提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:54:05 GMT)
New Approach to Clustering Random Attributes [0.0] 本稿では,異なる属性をクラスタリングする新しいアルゴリズムを提案する。
符号化過程において、名目属性は数値形式で新しい表現を得る。
提案手法はいくつかのサンプルデータセットに対して検証された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 22:37:33 GMT)
Neural networks consisting of DNA [0.0] 近年、DNAに基づくニューラルネットワークの構築が始まっている。
この章は、生化学に精通していない聴衆を対象として、DNAニューラルネットワークの概念の非常に基本的な紹介を提供する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 21:33:25 GMT)
Negative Wigner function by decaying interaction from equilibrium [0.0] 負のウィグナー関数重畳状態を得るための概念的に異なる、より自律的な方法を提案する。
検出可能な負のウィグナー関数と量子コヒーレンスと、より多くの量子ビットを用いた定性的拡張を同時に示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:26:15 GMT)
Near-single-photon atto-watt detection at mid-infrared wavelengths by a room-temperature balanced heterodyne set-up [0.0] 単一光子検出は、量子通信および量子センシングアプリケーションのための基盤技術である。
ここでは,波長4.6$mu$mの室温検出システムについて述べる。
この結果は、2つのバランスの取れたヘテロダイン検出装置内で、市販の2つの光検出器を利用して得られた。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:12:57 GMT)
Multimodal Sentiment Analysis based on Video and Audio Inputs [0.0] 本研究の目的は,映像や音声の入力を受信する感情認識モデルのユーザビリティを証明することである。
モデルのトレーニングに使用されるデータセットは、オーディオ用のCREMA-Dデータセットとビデオ用のRAVDESSデータセットである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:42:10 GMT)
Multi-Layer Cycle Benchmarking for high-accuracy error characterization [0.0] 実効パウリ雑音モデルに関連する学習性を改善するために,MLCB(Multi-Layer Cycle Benchmarking)を導入する。
現実的なシナリオでは、MLCBは難解な自由度を最大75%まで低減し、スパースなパウリ・リンドブラッドノイズモデルの精度を向上させることができる。
以上の結果から,MLCBは精度の高いノイズ評価と量子計算の改善を目的とした,スケーラブルで実用的なツールとして注目されている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:00:31 GMT)
Minkowski vacuum entanglement and accelerated oscillator chains [0.0] リンドラー図では、ミンコフスキー真空はリンドラー光子の絡み合った対で満たされる。
ミンコフスキー真空を介して均一に加速される基底状態原子は、リンドラー光子を吸収することによって励起される。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:01:51 GMT)
Microwave Hall measurements using a circularly polarized dielectric cavity [0.0] 我々は、円偏光マイクロ波を発生できる高品質な素子を備えた円偏光空洞を開発した。
我々は,金属単結晶のマイクロ波ホール導電率を測定する新しい方法を確立した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:54:13 GMT)
Make Satire Boring Again: Reducing Stylistic Bias of Satirical Corpus by Utilizing Generative LLMs [0.0] 本研究では, 学習データにおけるバイアスの低減に焦点をあてた, 風刺検出のためのデバイアス化手法を提案する。
以上の結果から,デバイアス法はトルコ語と英語の風刺・皮肉検出作業におけるモデルの堅牢性と一般化性を高めることが示唆された。
この研究は、分類、偏見、説明可能性に関するケーススタディを含む詳細な人間のアノテーションでトルコのサティリカルニュースデータセットをキュレートし、提示する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:57:55 GMT)
MIMO Detection via Gaussian Mixture Expectation Propagation: A Bayesian Machine Learning Approach for High-Order High-Dimensional MIMO Systems [0.0] 効率的なアップリンク(UL)
MIMO検出アルゴリズムは、これらの信号を正確に復号し、堅牢な通信を保証するために重要である。
このアルゴリズムは、計算複雑性を低く保ちながら、アート検出アルゴリズムの状態を上回ります。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:53:23 GMT)
Loss function to optimise signal significance in particle physics [0.0] 我々は、粒子物理学で用いられる重要度を最適化するために、代理損失を構築する。
線形モデルを用いて、単純な事象分類タスクに対する損失関数を評価し、関連するプロセスの断面に応じて変化する決定境界を生成することを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:48:57 GMT)
Looking for the quantum aspects of gravity in the gravitational Aharonov-Bohm experiment [0.0] 我々は重力アハロノフ・ボーム効果の包括的な理論的枠組みを開発する。
このフレームワークは量子系の絡み合い力学とコヒーレンス特性に関する重要な洞察を明らかにする。
解析の結果,導出した重力AB相は古典的予測と一致することが示唆された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:29:04 GMT)
Local Description of Decoherence of Quantum Superpositions by Black Holes and Other Bodies [0.0] 我々は、アリスの研究室内の量子場の局所的な2点関数の観点から、デコヒーレンスを記述することができることを示す。
局所的な視点から、ウンルー真空中のシュワルツシルト時空におけるデコヒーレンスを明示的に計算する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:45:52 GMT)
Lifshitz tail states in non-Hermitian disordered photonic lattices [0.0] バンドエッジ付近のアンダーソン局在は、リフシッツ尾状態の形で異常に弱い局在を示す。
リフシッツの尾状態は、ほぼ同一のオンサイトエネルギーを持つ連続した部位の集合に対応する。
アンダーソン局所化が想像上のオンサイトポテンシャルの障害によって引き起こされるとき、リフシッツ尾状態がシステムの力学を支配し、実験的に観測可能であることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:36:04 GMT)
Life on a closed timelike curve [0.0] 軸対称宇宙における時相曲線上を走行する仮説宇宙船の内部力学について検討する。
我々は、宇宙船の内部のエネルギー準位が自然に離散化されなければならないことを証明した。
このようなエントロピーの減少は固有状態熱化仮説と一致している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:57:25 GMT)
Large language models as oracles for instantiating ontologies with domain-specific knowledge [0.0] ドメイン固有の知識を自動的にインスタンス化するドメインに依存しない手法を提案する。
提案手法は,複数回クエリを行い,その応答からクラスとプロパティのインスタンスを生成する。
実験により,本手法は最先端技術よりも最大5倍高い精度を実現した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:56:35 GMT)
Langevin Monte Carlo Beyond Lipschitz Gradient Continuity [0.0] Inexact Proximal Langevin Algorithm (IPLA) を導入する。
IPLAは、制御された計算コストを維持しながら、LCCが効果的に対処できる問題の範囲を広げる。
我々は、IPLAの超二次ポテンシャルへの適用性を拡張し、既存のアルゴリズムに対する収束率を改善した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 19:25:47 GMT)
Key Safety Design Overview in AI-driven Autonomous Vehicles [0.0] 高いレベルの機能的安全性と堅牢なソフトウェア設計を維持することが不可欠です。
本稿では,自動車用ソフトウェアとハードウェアに必要な安全アーキテクチャと系統的アプローチについて検討する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:48:45 GMT)
Kajal: Extracting Grammar of a Source Code Using Large Language Models [0.0] Kajalは、DSLコードスニペットから文法を自動的に推論する新しいアプローチである。
Kajalは、数ショットの学習で60%の精度を達成し、それなしで45%を達成している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 00:40:54 GMT)
Introduction of Additive Particle Theory for Path Integral Approaches [0.0] 経路積分アプローチは多ボソン系において成功している。
多重フェルミオン系では、符号問題のために経路積分アプローチは実現不可能である。
符号問題を回避する近似法を生成するために,加法粒子(AP)理論を導入する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:52:42 GMT)
Inhomogeneous SU(2) symmetries in homogeneous integrable U(1) circuits and transport [0.0] 近接するU(1)ゲートを持つ量子回路の対称性について検討し、新しい不均質スクリューSU(2)と$rm U_q(rm sl_2)$対称性を発見した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:39:01 GMT)
Good Grasps Only: A data engine for self-supervised fine-tuning of pose estimation using grasp poses for verification [0.0] ポーズ推定の自己教師型微調整のための新しい手法を提案する。
本手法により,手動ラベリングを使わずにトレーニングデータを自動的に取得できる。
私たちのパイプラインは、プロセス実行中にシステムを微調整し、学習フェーズの必要性を排除します。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:59:33 GMT)
Game4Loc: A UAV Geo-Localization Benchmark from Game Data [0.0] クロスビューペアデータの部分的マッチングを含む,より実用的なUAV測位タスクを提案する。
実験により,UAV測地のためのデータとトレーニング手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 11:06:40 GMT)
From spontaneous to explicit symmetry breaking in a finite-sized system: Bosonic bound states of an impurity [0.0] 不純物は均質状態から局所状態への遷移を引き起こす。
低ライディングモードは、ヒッグス・アンダーソンとナムブ・ゴールドストーンのようなモードの有限サイズの前駆体に似ている。
ボソン-ボソン反発の増大に伴う結合度の平均場予測値と,少数体の正対角化結果との一致性が改善された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:40:44 GMT)
Formal Languages and TQFTs with Defects [0.0] ブール1D TQFTの欠陥を有限状態オートマトンに割り当てる構造は、Gustafson, Im, Kaldawy, Khovanov, Lihnによって最近開発された。
構成は、変換子を射とする有限状態オートマトン(英語版)の圏に対して関手的であることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 19:07:31 GMT)
Follow the money: a startup-based measure of AI exposure across occupations, industries and regions [0.0] 既存のAIの職業曝露対策は、技術的実現可能性に基づいて人間の労働を代用または補うAIの理論的可能性に焦点を当てている。
我々は,O*NETとスタートアップが開発したAIアプリケーションからの職業的記述に基づく,新たな指標であるAISE(AI Startup Exposure)指標を紹介する。
我々の発見は、AIの採用は、AIアプリケーションの技術的実現可能性と同様に、社会的要因によって徐々に形成されていくことを示唆している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:47:16 GMT)
Fire Dynamic Vision: Image Segmentation and Tracking for Multi-Scale Fire and Plume Behavior [0.0] 野火は正確な火と羽ばたきの模型の必要性を強調している。
本研究では,様々な空間的・時間的スケールで火と煙の挙動を効果的に分離・追跡する手法を提案する。
提案手法は, 画像分割とグラフ理論を組み合わせることで, 火災前線と羽根境界を規定する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:37:28 GMT)
FLRONet: Deep Operator Learning for High-Fidelity Fluid Flow Field Reconstruction from Sparse Sensor Measurements [0.0] FLRONetは、空間と時間におけるスパースセンサー測定からフルステートフローフィールドを再構築するために設計された、新しい演算子学習フレームワークである。
FLRONetは真の演算子を近似する際の優れた性能を実現し、高忠実度離散化においてかなり高速な推論を示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:58:41 GMT)
Experimental Machine Learning with Classical and Quantum Data via NMR Quantum Kernels [0.0] 核磁気共鳴(NMR)プラットフォームで10ビットの星トポロジーレジスタ上に量子カーネルを実装した。
複数の量子コヒーレンス秩序の進化において、古典的なデータを実験的に符号化する。
量子カーネルは古典的および量子機械学習タスクにおいて強力な能力を示すことを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:44:38 GMT)
Exact Valence-Bond Solid Scars in the Square-Lattice Heisenberg Model [0.0] スピンス四角格子ハイゼンベルク模型は正確な多体傷を有することを示す。
これらの傷は、全くエネルギーがゼロの単純な価結合固体である。
我々の傷跡は、塔の一部ではなく、領域法的な絡み合いを持ち、翻訳対称性を破り、全てのスピンのハイゼンベルクモデルに存在しているため興味深い。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:15:16 GMT)
Exact Algorithms for Multiagent Path Finding with Communication Constraints on Tree-Like Structures [0.0] パラメータ化複雑性フレームワークを用いて,通信制約問題を用いたマルチエージェントパス探索について検討する。
我々の主な貢献は、入力ネットワークの特定の構造を考える際に効率的である3つの正確なアルゴリズムである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 09:51:26 GMT)
Entanglement measures of Majorana bound states [0.0] マヨナ境界状態は、空間的非局所性を示すゼロエネルギーエッジ状態として、トポロジカル超伝導体に現れる。
真にゼロエネルギーのマヨラナ境界状態は、初期絡み合った系を古典状態に変換することができる。
本システムは,Majorana非局所性を制御するだけで,MBSと量子ドット間の最大絡み合った状態を生成することができることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:22:15 GMT)
Enhanced feature encoding and classification on distributed quantum hardware [0.0] 量子支援ベクトルマシン(QSVM)のための新しい特徴マップ最適化手法を提案する。
ノイズの多い量子デバイスにおいて重要な要素である、キュービット接続、ネイティブゲートセット、回路深さなど、バックエンド固有のパラメータを考慮に入れます。
この研究は、各量子処理ユニット(QPU)を同じトポロジを持つ複数のサブユニットに分割して、個別のQSVMインスタンスを実装した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:26:32 GMT)
Enhanced Facial Feature Extraction and Recignation Using Optimal Fully Dispersed Haar-like Filters [0.0] 本稿では,顔の特徴抽出と再帰性を高めるために,完全分散Haarライクなフィルタを最適に同定するアルゴリズムを提案する。
従来のHaarライクなフィルターとは異なり、これらの新しいフィルターはピクセルを画像内に自由に移動させ、複雑な局所的な特徴をより効果的に捉えることができる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 04:55:41 GMT)
Embeddings are all you need! Achieving High Performance Medical Image Classification through Training-Free Embedding Analysis [0.0] 医療画像のための人工知能(AI)と機械学習(ML)モデルの開発は通常、大規模なデータセットに対する広範なトレーニングとテストを含む。
従来の訓練手順を埋め込み型アプローチで置き換える可能性について検討した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:59:37 GMT)
Efficient Reinforcement Learning for Optimal Control with Natural Images [0.0] 強化学習は特定の画像表現に対して効率的であることが示されている。
スパースコードは、低エネルギー要求と計算オーバーヘッドの低いデバイスによって生成される。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 03:14:47 GMT)
Echoes and defects in the Calogero model [0.0] 本研究では,時間的に変調された調和トラップのカロジェロモデルを用いて,1次元流体へのスケーリング対称性と統計量の相互作用について検討する。
トラップ周波数の隙間のない点を通る周期的変調と低速駆動の両方において, 相互作用の強化と排除が欠陥の増殖に有利であることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:38:20 GMT)
Early Detection of At-Risk Students Using Machine Learning [0.0] リスクの高い学生を対象としたスクリーニングにより,高等教育の継続と学生の退学率の持続的課題に取り組むことを目的とする。
この研究は、SVM(Support Vector Machines)、Naive Bayes、K-nearest neighbors(KNN)、決定木(Decision Trees)、ロジスティック回帰(Logistic Regression)、ランダムフォレスト(Random Forest)など、いくつかの機械学習モデルを検討する。
分析の結果,全てのアルゴリズムがリスクの高い学生の予測に許容できる結果をもたらすことが示唆された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:33:06 GMT)
Driven-Dissipative Dynamics of Ultracold Atoms Trapped in an Array of Harmonic Potentials [0.0] ハーモニックポテンシャルの配列に閉じ込められた超低温原子の気体の力学について検討する。
これらの閉じ込められた超低温原子の基底と励起エネルギーレベルは、切り離されたラマンレーザーによって互いに結合される。
ひとたびラマンレーザーで励起されると、これら閉じ込められた超低温の原子は地上のエネルギーレベルに戻るが、必ずしも元のトラップ位置に戻るわけではない。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:58:18 GMT)
Dissipative Dynamical Phase Transition as a Complex Ising Model [0.0] 局所的なユニタリ進化とクビット鎖の散逸の競合によって引き起こされる量子力学相転移について検討する。
ある種の非局所可観測体の動的挙動は、$textitcomplex$ transverse-field (cTFIM) を持つ量子イジングモデルによって予測されることを示す。
弱散逸限界は、想像上の横フィールドの大きいcTFIMに対応することを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:56:36 GMT)
Creative Loss: Ambiguity, Uncertainty and Indeterminacy [0.0] 本稿では、機械学習の創造的利用が、曖昧さ、不確実性、不確定性という3つの隣接する用語にどのように対処できるかを評価する。
これは、UCLのBartlett School of ArchitectureにあるUnit 21の研究で示された、クリエイティブパートナーとしての機械学習に対する野心の高まりを反映している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 19:22:20 GMT)
Cooperative Evolutionary Pressure and Diminishing Returns Might Explain the Fermi Paradox: On What Super-AIs Are Like [0.0] 物質資源へのアクセスの増加による利益の減少は、全体として、銀河全体を植民地化する動機がない可能性を示唆している。
適応されたアルゴリズムは、例えば銀河を素早く植民地化するアルゴリズム、減少するリターンの下での協調と公正性の進化のモデル、およびシグナル発生をシミュレートするソフトウェアである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:29:03 GMT)
Congruence-based Learning of Probabilistic Deterministic Finite Automata [0.0] 形式言語に対する古典的なミヒル・ネロデ合同を拡張した合同を導入する。
この新たな合同性は、言語モデルに対する規則性を定義する基盤となる。
本稿では,言語モデルが正規化されるたびに,この一致に関する商を計算する能動的学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 23:38:58 GMT)
Comparative Analysis of Mel-Frequency Cepstral Coefficients and Wavelet Based Audio Signal Processing for Emotion Detection and Mental Health Assessment in Spoken Speech [0.0] 本研究では、ウェーブレット抽出機能に対する畳み込みニューラルネットワーク(CNN)とLong Short-Term Memory(LSTM)モデルの応用と、Mel- frequency Cepstral Coefficients(MFCC)による音声音声からの感情検出について検討する。
データ強化技術,特徴抽出,正規化,モデルトレーニングを行い,感情状態の分類においてモデルの性能を評価する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 22:55:11 GMT)
Chatbots im Schulunterricht: Wir testen das Fobizz-Tool zur automatischen Bewertung von Hausaufgaben [0.0] 本研究では,ドイツのFobizz社によるAIによるグレーディングツール"AI Grading Assistant"について検討した。
ツールの数値グレードと定性的フィードバックは、しばしばランダムであり、提案が組み込まれても改善されない。
この研究は、教育における体系的な問題に対する迅速な修正としてAIを採用するというより広い傾向を批判している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:07:42 GMT)
Characterizing maximally many-body entangled fermionic states by using $M$-body density matrix [0.0] フェルミオン$N-粒子状態の多体絡み構造について検討した。
また、ランダム状態におけるフェルミオン多体絡みについても検討する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:53:28 GMT)
CSSDH: An Ontology for Social Determinants of Health to Operational Continuity of Care Data Interoperability [0.0] 我々は、社会決定因子の共通意味データモデル(CSSDH)を統合的オントロジモデルとして提案する。
CSSDHは、Continuity of Care Network内での相互運用性の実現を目指している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:25:33 GMT)
Benchmarking of GPU-optimized Quantum-Inspired Evolutionary Optimization Algorithm using Functional Analysis [0.0] 本稿では、進化最適化(QIEO)のGPU並列化実装の比較分析について述べる。
その結果,QIEOはGAよりも優れた性能を示した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 06:47:23 GMT)
Bad Crypto: Chessography and Weak Randomness of Chess Games [0.0] チェスの暗号方式は不正確で冗長であり、チェスゲームの複雑さに基づくセキュリティの主張は不当である。
また、最終チェスゲームポジションにおけるランダム性の不足も示しており、これは別の関心事である可能性がある。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 22:17:56 GMT)
Automatic Detection, Positioning and Counting of Grape Bunches Using Robots [0.0] Yolov3検出ネットワークは、ブドウ束の正確な検出を実現するために使用される。
局所追跡アルゴリズムは、再配置を排除するために追加される。
ブドウの束の数え上げが完了します。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 15:52:40 GMT)
Applying IRT to Distinguish Between Human and Generative AI Responses to Multiple-Choice Assessments [0.0] 評価に複数の選択質問が広く使用されているにもかかわらず、AI不正の検出はほとんど調査されていない。
本稿では,このギャップに対処するための項目応答理論の適用法を提案する。
我々のアプローチは、人工知能と人間の知性が異なる応答パターンを示すという仮定に基づいている。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:28:20 GMT)
Application of Neural Ordinary Differential Equations for ITER Burning Plasma Dynamics [0.0] トカマクの燃焼プラズマのダイナミクスは、制御熱核融合の進行に不可欠である。
本研究では, ITER重水素トリチウム(D-T)プラズマの複雑なエネルギー伝達過程をシミュレートするためにNeuralPlasmaODEを適用した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:01:44 GMT)
Analysis of Object Detection Models for Tiny Object in Satellite Imagery: A Dataset-Centric Approach [0.0] 本稿では,衛星画像におけるSOD(Small-Object-Detection)の領域について述べる。
従来のオブジェクト検出モデルは、コンテキスト情報やクラス不均衡が限られたため、小さなオブジェクトを検出するのに困難に直面している。
本研究の目的は,衛星画像における微小物体検出に関する貴重な知見を,最先端のモデルを用いて実証的に評価することである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:06:22 GMT)
An introduction to reservoir computing [0.0] 貯留層計算は高次元のリカレントネットワークを使用し、最終層のみを訓練する。
電子工学、フォトニクス、スピントロニクス、力学、生物学から来る重要な物理実装をいくつか紹介する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 21:19:52 GMT)
An approach to quasinormal modes of black hole based on reversed harmonic oscillator dynamics [0.0] シュワルツシルトブラックホールの準正規モード(QNM)の周波数について検討した。
伝送係数と反射係数はQNMの周波数に加えて研究される。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:35:44 GMT)
Align, Generate, Learn: A Novel Closed-Loop Framework for Cross-Lingual In-Context Learning [0.0] 言語間インコンテキスト学習(XICL)は、多言語タスクに対処するために大規模言語モデル(LLM)を活用するための変換パラダイムとして登場した。
タスク関連事例を内部的に選択・活用するために, LLMの生成能力を活用する, 自己管理型フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 05:36:51 GMT)
Advancing Attribution-Based Neural Network Explainability through Relative Absolute Magnitude Layer-Wise Relevance Propagation and Multi-Component Evaluation [0.0] 本稿では,レイヤワイド関連伝播による入力ニューロンの関連性を決定する新しい手法を提案する。
その結果,提案手法の利点が明らかとなった。
本研究では, 忠実性, 頑健性, コントラスト性の概念を組み合わせた新しい評価指標を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:25:56 GMT)
Addressing common misinterpretations of KART and UAT in neural network literature [0.0] This note address the Kolmogorov-Arnold Representation Theorem (KART) and the Universal Approximation Theorem (UAT)
我々の発言は、ニューラルネットワークの専門家の間でのKARTとUATのより正確な理解を支援することを目的としています。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 18:19:40 GMT)
AdaptiveMDL-GenClust: A Robust Clustering Framework Integrating Normalized Mutual Information and Evolutionary Algorithms [0.0] 我々は,最小記述長(MDL)原理と遺伝的最適化アルゴリズムを組み合わせたロバストクラスタリングフレームワークを提案する。
このフレームワークは、初期クラスタリングソリューションを生成するためのアンサンブルクラスタリングアプローチから始まり、MDL誘導評価関数を使用して洗練され、遺伝的アルゴリズムによって最適化される。
実験の結果,従来のクラスタリング手法を一貫して上回り,精度の向上,安定性の向上,バイアス低減を実現している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 02:41:04 GMT)
AI Adoption to Combat Financial Crime: Study on Natural Language Processing in Adverse Media Screening of Financial Services in English and Bangla multilingual interpretation [0.0] 本報告はNLPの有効性を94%の精度で測定する。
AMLとCFTの懸念はすでにAI技術によって対処されている。
この調査は、バングラデシュの金融犯罪を防ぐための強化努力において、AI主導のNLPソリューションの可能性を強調している。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:17:05 GMT)
A simple algorithm to reflect through eigenspaces of unitaries [0.0] 実装可能なユニタリの固有空間を反映する作業を考える。
同じサイズと深さのスケーリングを持つ単純なアルゴリズムを提案するが、すべての問題インスタンスに対して3つのアンシラ量子ビットしか必要としない。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 14:45:15 GMT)
A physics-informed transformer neural operator for learning generalized solutions of initial boundary value problems [0.0] 我々は物理インフォームド・トランスフォーマー・ニューラル演算子(PINTO)を開発し、初期条件と境界条件を効率的に一般化する。
PINTOアーキテクチャは、エンジニアリングアプリケーションで使われる重要な方程式の解をシミュレートするために用いられる。
我々のモデルは、トレーニングコロケーションポイントに含まれない時間ステップにおける対流とバーガースの方程式を正確に解くことができる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 07:22:02 GMT)
A novel ML-fuzzy control system for optimizing PHEV fuel efficiency and extending electric range under diverse driving conditions [0.0] 本研究では,プラグインハイブリッド電気自動車(PHEV)の革新的な制御システムについて紹介する。
機械学習技術を使用して、車両の純粋な電気モードにおけるエネルギー使用率を予測し、異なる運用モード間での電力割り当てを最適化する。
20kWhのバッテリパックを80%使用して約84kmの完全電界範囲を拡大する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:47:19 GMT)
A healthier semi-classical dynamics [0.0] 量子系のバックリアクションを古典的に研究する。
半古典物理学の出発点は、古典位相空間の点とヒルベルト空間の量子状態によって常に記述されるべきである。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 08:25:42 GMT)
A Systematic Review of Knowledge Tracing and Large Language Models in Education: Opportunities, Issues, and Future Research [0.0] 大規模言語モデル(LLM)は、広大な自然言語データセット上で事前訓練されている。
本研究は,KTモデルとLLMを教育的文脈で組み合わせる際の共通点,機会,課題について考察する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 13:00:50 GMT)
A Semi Black-Box Adversarial Bit-Flip Attack with Limited DNN Model Information [0.0] 本稿では,深層ニューラルネットワーク(DNN)に対する半ブラックボックス逆ビットフリップ攻撃であるB3FAを提案する。
半ブラックボックス設定における複数のDNNモデルに対するB3FAの有効性を示す。
例えば、B3FAはMobileNetV2の精度を69.84%から9%に下げることができる。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 17:04:57 GMT)
A Quasilinear Algorithm for Computing Higher-Order Derivatives of Deep Feed-Forward Neural Networks [0.0] $n$-TangentProp は指数時間ではなく、準線形の $dn/dxn f(x)$ を計算する。
物理インフォームドニューラルネットワークの文脈において,本手法が特に有用であることを示す。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 22:57:28 GMT)
A Quantum Approximate Optimization Algorithm for Local Hamiltonian Problems [0.0] 局所ハミルトン問題(Local Hamiltonian Problems、LHP)は、多体量子系において計算完全で物理的に関係のある重要な問題である。
我々は、ハミルトニアン量子近似最適化アルゴリズム(HamQAOA)と呼ばれる量子近似を提案し、解析する。
以上の結果から, 線形深度HamQAOAは, 1次元反強磁性ハイゼンベルクスピン鎖の正確な基底状態を決定論的に生成できることが示唆された。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 12:22:08 GMT)
A NotSo Simple Way to Beat Simple Bench [0.0] 本稿では,大規模言語モデル(LLM)における推論能力向上のための新しい枠組みを提案する。
モデル精度とロバスト性を改善するために,グローバルな整合性チェックと組み合わせたマルチステッププロンプト戦略を提案する。
クロードは論理的整合性を維持するのに優れ, GPT-4oは探索的創造性を示すが, 曖昧なプロンプトに苦しむ。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 16:04:31 GMT)
A Framework for testing Federated Learning algorithms using an edge-like environment [0.0] フェデレーテッド・ラーニング(FL)は、多くのクライアントが、データをプライベートかつ分散化しながら、単一の集中型モデルを協調的にトレーニングする機械学習パラダイムである。
グローバル集中型モデルアグリゲーションにおける局所モデルの貢献を正確に評価するのは簡単ではない。
これはFLにおける大きな挑戦の例であり、一般にデータ不均衡またはクラス不均衡として知られている。
本研究では,FLアルゴリズムをより容易かつスケーラブルに評価するためのフレームワークを提案し,実装した。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 21:05:20 GMT)
A Decomposition Modeling Framework for Seasonal Time-Series Forecasting [0.0] 時系列は複雑な長期依存関係を示す。
本稿では、時系列予測のためのMSSD(Multi-scale Seasonal Decomposition Model)を提案する。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 01:37:25 GMT)
A Brief Discussion on KPI Development in Public Administration [0.0] 本稿では,ランダムフォレストアルゴリズムと変数重要度解析を利用して,性能評価システム内に構築する革新的なフレームワークを提案する。
提案したアプローチでは,PAのパフォーマンスに大きく影響する重要な変数を特定し,組織の成功を導く重要な要因に関する貴重な洞察を提供する。
本研究は,機械学習技術の適用によるPAパフォーマンスの向上を目標とし,よりアジャイルで結果駆動型のアプローチを公共行政に導入することを目的とする。
論文参考訳(メタデータ) (Thu, 12 Dec 2024 10:27:55 GMT)