Could ChatGPT get an Engineering Degree? Evaluating Higher Education Vulnerability to AI Assistants [176.4] 我々は,2つのAIアシスタントであるGPT-3.5とGPT-4が適切な回答を得られるかどうかを評価する。
GPT-4は65.8%の質問を正解し、85.1%の質問に対して少なくとも1つの手順で正しい答えを出すことができる。
この結果から,AIの進歩を踏まえて,高等教育におけるプログラムレベルの評価設計の見直しが求められた。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:59:10 GMT)
MatchDiffusion: Training-free Generation of Match-cuts [122.4] テキストとビデオの拡散モデルを用いたマッチカット生成のための,最初のトレーニング不要な手法を提案する。
MatchDiffusionは"Joint Diffusion"を使って、共有ノイズ、アライメント構造、動きの2つのプロンプトを生成する。
次に「分離拡散(Disjoint Diffusion)」を適用し、ビデオがバラバラになり、ユニークな詳細が紹介される。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:59:59 GMT)
SimCMF: A Simple Cross-modal Fine-tuning Strategy from Vision Foundation Models to Any Imaging Modality [116.5] 大量のデータを訓練するChatGPTやSoraのような基礎的なモデルは、革命的な社会的影響をもたらしている。
様々な分野のセンサーが、同じ規模の自然画像を集め、強力な基礎モデルを訓練することは極めて困難である。
本研究は、自然なRGB画像に基づいて訓練された視覚基盤モデルから、異なる物理特性の他の画像モダリティへのクロスモーダル微調整という重要な問題を研究するための、シンプルで効果的なフレームワークであるSimCMFを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:35:58 GMT)
DRS: Deep Question Reformulation With Structured Output [114.1] 大規模な言語モデルは、質問の解答不能を識別するが、質問の修正を支援する能力は欠如している。
DRS:Deep Question Reformulation with Structured Outputを提案する。
提案手法は, GPT-3.5 の修正精度を 23.03% から 70.42% に向上させ, Gemma2-9B などのオープンソースの大規模言語モデルのスコアを 26.35% から 56.75% に向上させる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:20:44 GMT)
SoK: Watermarking for AI-Generated Content [112.9] ウォーターマーキングスキームは、AI生成コンテンツに隠された信号を埋め込んで、信頼性の高い検出を可能にする。
透かしは、誤情報や偽造と戦ってAIの安全性と信頼性を高める上で重要な役割を果たす。
本研究の目的は、研究者が透かし法や応用の進歩を指導し、GenAIの幅広い意味に対処する政策立案者を支援することである。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:22:33 GMT)
Hierarchical Information Flow for Generalized Efficient Image Restoration [108.8] 画像復元のための階層型情報フロー機構であるHi-IRを提案する。
Hi-IRは、劣化した画像を表す階層的な情報ツリーを3段階にわたって構築する。
7つの共通画像復元タスクにおいて、Hi-IRはその有効性と一般化性を達成する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:30:08 GMT)
MAgIC: Investigation of Large Language Model Powered Multi-Agent in Cognition, Adaptability, Rationality and Collaboration [98.2] 大規模言語モデル(LLM)は、非常に高度な自然言語処理を持つ。
アプリケーションがマルチエージェント環境に拡大するにつれて、包括的な評価フレームワークの必要性が生じる。
この研究は、マルチエージェント設定内でLLMを評価するための新しい競合ベースのベンチマークフレームワークを導入している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:25:28 GMT)
CAT4D: Create Anything in 4D with Multi-View Video Diffusion Models [98.0] 本研究では,モノクロ映像から4次元(ダイナミックな3D)シーンを生成するCAT4Dを提案する。
我々は、多様なデータセットの組み合わせに基づいて訓練された多視点ビデオ拡散モデルを活用して、新しいビュー合成を実現する。
新規なビュー合成と動的シーン再構成ベンチマークにおける競合性能を実証する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:57:16 GMT)
Immune: Improving Safety Against Jailbreaks in Multi-modal LLMs via Inference-Time Alignment [97.4] 我々は、脱コード時に安全な報酬モデルを利用してジェイルブレイク攻撃を防御する推論時防御フレームワークImmuneを提案する。
また,Immuneはモデルの本来の機能を維持しつつ,モデル安全性を効果的に向上することを示す。
例えば、LLaVA-1.6に対するテキストベースのジェイルブレイク攻撃に対して、ImmuneはベースMLLMと最先端の防衛戦略と比較して、攻撃の成功率を57.82%と16.78%に下げている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:00:10 GMT)
Synatra: Turning Indirect Knowledge into Direct Demonstrations for Digital Agents at Scale [97.2] LLMは、デジタル環境と対話し、特定の目的を完遂する自律エージェントとして機能する。
デジタルタスクに対する大規模な直接的なデモが欠如していることもあって、正確性はまだ十分ではない。
我々は、この間接的な知識を大規模に直接監督するアプローチであるSynatraを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:34:52 GMT)
Image Segmentation in Foundation Model Era: A Survey [95.6] イメージセグメンテーションにおける現在の研究は、異なる特徴、課題、解決策の詳細な分析を欠いている。
本調査は、FM駆動画像セグメンテーションを中心とした最先端の研究を徹底的にレビューすることで、このギャップを埋めようとしている。
現在の研究成果の広さを包括する,300以上のセグメンテーションアプローチの概要を概観する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:54:05 GMT)
MMSearch: Benchmarking the Potential of Large Models as Multi-modal Search Engines [95.5] 大規模マルチモーダルモデル(LMM)は、AI検索エンジンにおいて目覚ましい進歩を遂げた。
しかし、AI検索エンジンとして機能するかどうかはまだ未定だ。
まず,マルチモーダル検索機能を備えた任意のLMMに対して,センシティブなパイプラインMMSearch-Engineを設計する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:49:12 GMT)
Proactive Agent: Shifting LLM Agents from Reactive Responses to Active Assistance [95.0] 我々は、人間の指示なしにタスクを予測および開始できるプロアクティブエージェントを開発するという課題に取り組む。
まず,実世界の人的活動を収集し,前向きなタスク予測を生成する。
これらの予測は、ヒトのアノテータによって受け入れられるか拒否されるかのどちらかとしてラベル付けされる。
ラベル付きデータは、人間の判断をシミュレートする報酬モデルをトレーニングするために使用される。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:14:54 GMT)
Exploring Visual Vulnerabilities via Multi-Loss Adversarial Search for Jailbreaking Vision-Language Models [92.8] VLM(Vision-Language Models)は、安全アライメントの問題に対して脆弱である。
本稿では、シナリオ認識画像生成を利用したセマンティックアライメントのための新しいジェイルブレイクフレームワークであるMLAIを紹介する。
大規模な実験はMLAIの重大な影響を示し、MiniGPT-4で77.75%、LLaVA-2で82.80%の攻撃成功率を達成した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:40:29 GMT)
Learning Disentangled Representation for One-shot Progressive Face Swapping [92.1] ジェネレーティブ・アドバーサリアル・ネットワークに基づくワンショット・フェイススワップのためのシンプルで効率的なFaceSwapperを提案する。
提案手法は,不整合表現モジュールと意味誘導融合モジュールから構成される。
本手法は,トレーニングサンプルの少ないベンチマークデータセットに対して,最先端の結果を得る。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 01:51:42 GMT)
From Yes-Men to Truth-Tellers: Addressing Sycophancy in Large Language Models with Pinpoint Tuning [91.8] 大規模言語モデル(LLM)は、ユーザプロンプトへの順守を、妥当な応答よりも優先する傾向がある。
近年の研究では、教師付き微調整(SFT)を用いて、梅毒問題を軽減することが提案されている。
そこで本研究では,特定の目的のために関心のあるモジュールを調整した新しいピンポイントチューニング(SPT)を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:35:19 GMT)
SmileSplat: Generalizable Gaussian Splats for Unconstrained Sparse Images [91.3] SmileSplatという新しい一般化可能なガウス格子法が提案され,様々なシナリオに対して画素整列ガウス波を再構成する。
提案手法は,様々な3次元視覚タスクにおける最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:52:28 GMT)
Era3D: High-Resolution Multiview Diffusion using Efficient Row-wise Attention [87.0] 単一視点画像から高解像度のマルチビュー画像を生成する新しい多視点拡散法であるEra3Dを紹介する。
Era3Dは、最大512*512の解像度で高品質なマルチビュー画像を生成し、複雑さを12倍に削減する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:01:08 GMT)
Make-It-Animatable: An Efficient Framework for Authoring Animation-Ready 3D Characters [86.1] 我々は3次元ヒューマノイドモデルを1秒未満でキャラクターアニメーションに対応させる新しいデータ駆動方式であるMake-It-Animatableを提案する。
我々のフレームワークは、高品質なブレンドウェイト、骨、ポーズトランスフォーメーションを生成します。
既存の手法と比較して,本手法は品質と速度の両方において著しく改善されている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:18:06 GMT)
Helvipad: A Real-World Dataset for Omnidirectional Stereo Depth Estimation [83.8] 全方位ステレオ深度推定のための実世界のデータセットであるHelvipadを紹介する。
このデータセットは、3Dポイント雲を等方形画像に投影することで、正確な深度と不均質のラベルを含む。
標準画像と全方位画像のステレオ深度推定モデルをベンチマークする。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:34:41 GMT)
Dual-Level Boost Network for Long-Tail Prohibited Items Detection in X-ray Security Inspection [81.1] X線検査における禁止項目の長期分布は,検出モデルにとって大きな課題となる。
我々は,X線セキュリティスクリーニングにおけるこれらの課題を克服するために,DBNet(Dual-level Boost Network)を提案する。
提案手法では,(1) X線画像の特徴にインスパイアされた,ポアソンブレンディングを用いた特定のデータ拡張戦略を導入し,データ不均衡を効果的に軽減できるレアアイテムのリアルな合成例を生成する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 06:13:56 GMT)
Complexity Experts are Task-Discriminative Learners for Any Image Restoration [80.5] 複雑性の専門家" - 様々な計算複雑性と受容的なフィールドを持つフレキシブルな専門家ブロックを紹介します。
この選好は、タスク固有の割り当てを効果的に推進し、適切な複雑さを持つ専門家にタスクを割り当てる。
提案したMoCE-IRモデルは最先端の手法より優れており、その効率性と実用性が確認されている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:58:07 GMT)
ShifCon: Enhancing Non-Dominant Language Capabilities with a Shift-based Contrastive Framework [79.7] ShifConはShiftベースのContrastiveフレームワークで、他の言語の内部の前進プロセスを支配的な言語に合わせる。
非支配的な言語の表現を支配的な言語サブスペースに移行し、モデルパラメータにエンコードされた比較的リッチな情報にアクセスできるようにする。
実験により、我々のShifConフレームワークは、非支配言語の性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:17:09 GMT)
SCoTT: Wireless-Aware Path Planning with Vision Language Models and Strategic Chains-of-Thought [78.5] 複雑な無線環境における経路計画を実現するために,視覚言語モデル(VLM)を用いた新しい手法を提案する。
この目的のために、実世界の無線レイトレーシングデータを用いたデジタルツインからの洞察を探索する。
その結果, SCoTT はDP-WA* と比較して非常に近い平均経路ゲインを実現し, 同時に一貫した経路長が得られることがわかった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:45:49 GMT)
Dual-view X-ray Detection: Can AI Detect Prohibited Items from Dual-view X-ray Images like Humans? [78.3] 大規模デュアルビューX線(LDXray)を導入し,12のカテゴリで353,646個のインスタンスで構成されている。
デュアルビュー検出におけるヒューマンインテリジェンスをエミュレートするために,補助ビュー拡張ネットワーク(AENet)を提案する。
LDXrayデータセットの実験では、デュアルビュー機構が検出性能を大幅に向上することを示した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 06:36:20 GMT)
R-MTLLMF: Resilient Multi-Task Large Language Model Fusion at the Wireless Edge [78.3] マルチタスク大言語モデル(MTLLM)は、ユーザが複数のタスクを効率的に処理するための特殊なモデルを要求する無線エッジにおける多くのアプリケーションにとって重要である。
タスクベクトルによるモデル融合の概念は、MDLLMを生成するための微調整パラメータを組み合わせるための効率的なアプローチとして登場した。
本稿では, エッジユーザによるタスクベクトルによるMTTLMの協調開発を可能にする問題について, 最悪の場合の攻撃を想定して検討した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:57:06 GMT)
DexDiffuser: Interaction-aware Diffusion Planning for Adaptive Dexterous Manipulation [77.8] 高度なロボティクスにとって、接触に富んだ相互作用による有害な操作が不可欠である。
本稿では,適応的デキスタラス操作のための対話型拡散計画フレームワークであるDexDiffuserを紹介する。
本フレームワークは30度のドア開口で70.0%,ペンとブロックの半面配向で40.0%,ハンマーの半面駆動で46.7%を達成している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:03:26 GMT)
Generalization v.s. Memorization: Tracing Language Models' Capabilities Back to Pretraining Data [76.9] 本稿では,出力確率と事前学習データ頻度の相関を計測する,記憶化,分布記憶化という拡張概念を導入する。
よりシンプルで知識集約的なタスクでは記憶が大きな役割を担い、一方、一般化はより困難で推論に基づくタスクでは鍵となる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:05:16 GMT)
NewsEdits 2.0: Learning the Intentions Behind Updating News [74.8] イベントが進むにつれて、ニュース記事は新しい情報で更新されることが多い。
本研究では,言語的特徴が事実流動性を示すことを仮定し,ニュース記事のテキストのみを用いて,どの事実が更新されるかを予測する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 23:35:23 GMT)
IOPO: Empowering LLMs with Complex Instruction Following via Input-Output Preference Optimization [74.3] 本稿では,複雑な命令追従能力の向上と評価のためのベンチマークであるTRACEを紹介する。
また、入力と出力の両方の選好ペアを考慮に入れたIOPOを提案する。
ドメイン内データセットとドメイン外データセットの両方の実験により、IOPOの有効性が確認された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:29:59 GMT)
How to Learn a New Language? An Efficient Solution for Self-Supervised Learning Models Unseen Languages Adaption in Low-Resource Scenario [72.0] 音声認識(ASR)における音声自己監視学習(SSL)モデルの性能向上
低リソース言語 ASR では、事前訓練された言語と低リソース言語のドメインミスマッチ問題に遭遇する。
これらの問題に対処するためのアダプタに基づく従来型の効率的な微調整手法を拡張した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:51:00 GMT)
ManiPose: Manifold-Constrained Multi-Hypothesis 3D Human Pose Estimation [71.3] ManiPoseは、人為的な2D-to-3Dリフトのための多様体拘束型マルチハイブリッドモデルである。
人間のポーズ多様体上の出力を制約することにより、ManiPoseはすべての仮説的なポーズの一貫性を保証する。
実世界のデータセット上でのManiPoseのパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 22:24:02 GMT)
CELA: Cost-Efficient Language Model Alignment for CTR Prediction [70.7] CTR(Click-Through Rate)予測は、レコメンダシステムにおいて最重要位置を占める。
最近の取り組みは、プレトレーニング言語モデル(PLM)を統合することでこれらの課題を緩和しようとしている。
CTR予測のためのtextbfCost-textbfEfficient textbfLanguage Model textbfAlignment (textbfCELA)を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:22:52 GMT)
Multi-Task Model Merging via Adaptive Weight Disentanglement [69.7] モデルマージは、様々なタスクからのタスク固有の重みを、再トレーニングや追加データなしで統一されたマルチタスクモデルに統合するテクニックである。
Task Arithmetic (TA) は、算術演算によるタスクベクトルの組み合わせは、異なるタスク間の効率的な能力伝達を促進することを実証している。
TAの顕著な効果にもかかわらず、タスクベクトル間の干渉は、マージされたモデルの性能に悪影響を及ぼす可能性がある。
本稿では,従来のタスクベクトルを冗長なベクトルと複数の不整合タスクベクトルに分解するAdaptive Weight Disentanglement (AWD)を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 20:08:55 GMT)
Goal-Oriented Semantic Communication for Wireless Visual Question Answering [68.8] 本稿では,視覚質問応答(VQA)の性能向上を目的とした目標指向セマンティックコミュニケーション(GSC)フレームワークを提案する。
本稿では,BBoxを用いた画像意味抽出とランク付け手法を提案し,質問の目的に基づいてセマンティック情報を優先順位付けする。
実験の結果,本フレームワークはAWGNチャネルで49%,Rayleighチャネルで59%の精度で解答精度を向上することがわかった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:52:08 GMT)
OOD-HOI: Text-Driven 3D Whole-Body Human-Object Interactions Generation Beyond Training Domains [66.6] 現在の方法では、身体と手の両方に焦点を合わせ、結束的で現実的な相互作用を生み出す能力を制限する傾向にある。
我々は,OOD-HOIというテキスト駆動型フレームワークを提案する。
提案手法は,初期相互作用ポーズを合成するための二重分岐相互拡散モデルと,予測された接触領域に基づく物理的精度向上のための接触誘導相互作用精製器と,ロバスト性向上のための意味的調整と変形を含む動的適応機構を統合した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:13:35 GMT)
AC3D: Analyzing and Improving 3D Camera Control in Video Diffusion Transformers [66.3] カメラの動きを第一原理の観点から分析し、正確な3Dカメラ操作を可能にする洞察を明らかにする。
これらの知見を合成して、高度な3Dカメラ制御(AC3D)アーキテクチャを設計する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:49:13 GMT)
Active Data Curation Effectively Distills Large-Scale Multimodal Models [66.2] 知識蒸留(KD)は、大規模モデルをより小さなものに圧縮するデファクトスタンダードである。
本研究では, 対照的なマルチモーダル事前学習のための効果的な蒸留法として, 能動的データキュレーションの代替として, 簡単なアプローチを探求する。
我々の単純なオンラインバッチ選択方法であるACIDは、さまざまなモデル、データ、計算構成において、強力なKDベースラインよりも優れています。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:50:15 GMT)
G3Flow: Generative 3D Semantic Flow for Pose-aware and Generalizable Object Manipulation [65.9] 本稿では,基礎モデルを活用した動的オブジェクト中心の3D表現であるリアルタイムセマンティックフローを構築する新しいフレームワークG3Flowを提案する。
提案手法は,デジタルツイン生成のための3次元生成モデル,セマンティック特徴抽出のための視覚基盤モデル,連続的なセマンティックフロー更新のためのロバストポーズ追跡を一意に組み合わせたものである。
本研究は,ロボット操作ポリシーのリアルタイムな動的意味的特徴理解におけるG3Flowの有効性を実証するものである。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:17:43 GMT)
StableAnimator: High-Quality Identity-Preserving Human Image Animation [64.6] 本稿では,最初のエンドツーエンドID保存ビデオ拡散フレームワークであるStableAnimatorについて述べる。
ポストプロセッシングなしで高品質なビデオを合成し、参照画像とポーズのシーケンスに条件付けする。
推論中,顔の質をより高めるためにハミルトン・ヤコビベルマン(HJB)方程式に基づく新しい最適化を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:39:20 GMT)
Certified Training with Branch-and-Bound: A Case Study on Lyapunov-stable Neural Control [64.6] 我々は,CT-BaBという新しい,一般の認定トレーニングフレームワークを開発した。
比較的大きな関心領域を扱うために,我々は,ブランチ・アンド・バウンド(ブランチ・アンド・バウンド)のトレーニングタイムの新しい枠組みを提案する。
私たちの新しいトレーニングフレームワークは、テスト時により効率的に検証可能なモデルを生成することができることを実証しています。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:12:46 GMT)
Enhancing Compositional Text-to-Image Generation with Reliable Random Seeds [63.8] テキスト間拡散モデルは任意のテキストプロンプトからリアルな画像を生成することができる。
彼らはしばしば「2匹の犬」や「ボウルの右側のペンギン」のような作曲のプロンプトに対して矛盾した結果を出す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 23:32:54 GMT)
FAM Diffusion: Frequency and Attention Modulation for High-Resolution Image Generation with Stable Diffusion [63.6] スケールした解像度での推論は反復的なパターンと構造的歪みをもたらす。
これらの問題を解決するために組み合わせた2つの単純なモジュールを提案する。
我々の手法はファム拡散と呼ばれ、任意の潜在拡散モデルにシームレスに統合でき、追加の訓練を必要としない。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:51:44 GMT)
Promptable Anomaly Segmentation with SAM Through Self-Perception Tuning [63.6] Segment Anything Model (SAM) は、その顕著な一般化能力により、異常セグメンテーションタスクにおいて大きな進歩を遂げている。
SAMを直接適用する既存のメソッドは、しばしばドメインシフトの問題を見落としている。
本稿では, SAMの異常セグメンテーションに対する知覚能力を高めることを目的とした, 自己パーセプティノンチューニング(SPT)手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:16:12 GMT)
Q-SFT: Q-Learning for Language Models via Supervised Fine-Tuning [63.0] 価値に基づく強化学習は、幅広いマルチターン問題に対する効果的なポリシーを学ぶことができる。
現在の値ベースのRL法は、特に大規模な言語モデルの設定にスケールすることが困難であることが証明されている。
本稿では,これらの欠点に対処する新しいオフラインRLアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 00:05:44 GMT)
DistinctAD: Distinctive Audio Description Generation in Contexts [62.6] 本研究では,より優れた物語を生成するために,特徴性を重視した音声記述を生成するためのフレームワークであるDistinctADを提案する。
ドメインギャップに対処するために、追加のADコーパスを必要としないCLIP-AD適応戦略を導入する。
ステージIIでは、DistinctADは2つの重要なイノベーションを取り入れている: (i) コンテクスト予測最大化注意(EMA)モジュールは、連続するビデオクリップから共通のベースを抽出することで冗長性を低減し、 (ii) コンテキスト内の繰り返し単語をフィルタリングする明確な単語予測損失である。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:54:59 GMT)
HUPE: Heuristic Underwater Perceptual Enhancement with Semantic Collaborative Learning [62.3] 既存の水中画像強調法は主に視覚的品質の向上に重点を置いており、実際的な意味を見落としている。
視覚的品質を高め,他の下流タスクに対処する柔軟性を示す,水中知覚向上のための可逆的ネットワークHを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:37:03 GMT)
HoliSDiP: Image Super-Resolution via Holistic Semantics and Diffusion Prior [62.0] 本稿では,意味的セグメンテーションを活用するフレームワークであるHoliSDiPについて述べる。
本手法では, セグメンテーションマスクと空間CLIPマップを用いて, セグメンテーションガイダンスを導入しながら, セグメンテーションラベルを簡潔なテキストプロンプトとして利用する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:22:44 GMT)
ProteinWeaver: A Divide-and-Assembly Approach for Protein Backbone Design [61.2] 本稿では,タンパク質のバックボーン設計のための2段階フレームワークであるProteinWeaverを紹介する。
プロテインウィーバーは、多用途ドメインアセンブリを通じて高品質で新規なタンパク質のバックボーンを生成する。
分割組立パラダイムを導入することにより、タンパク質工学を進歩させ、機能的タンパク質設計のための新たな道を開く。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:18:46 GMT)
EventCrab: Harnessing Frame and Point Synergy for Event-based Action Recognition and Beyond [61.1] イベントベースの行動認識(EAR)は、従来の行動認識と比較して、時間的・プライバシー的保護の利点がある。
EventCrabは、密集イベントフレームのための"より軽い"フレーム特化ネットワークと、スパースイベントポイントのための"より重い"ポイント特化ネットワークとを包括的に統合するフレームワークである。
4つのデータセットの実験は、提案したEventCrabの大幅なパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:28:57 GMT)
3D-free meets 3D priors: Novel View Synthesis from a Single Image with Pretrained Diffusion Guidance [61.1] 単一入力画像からカメラ制御された視点を生成する方法を提案する。
本手法は,広範囲なトレーニングや3Dおよびマルチビューデータなしで,複雑で多様なシーンを処理できることに優れる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:30:24 GMT)
GeneMAN: Generalizable Single-Image 3D Human Reconstruction from Multi-Source Human Data [61.1] 高忠実度3Dモデルを構築するのが難しい課題です。
GeneMANは高品質な人間のデータを総合的に収集する。
GeneMANは、単一の画像入力から高品質な3Dモデルを生成することができ、最先端の手法よりも優れている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:59:54 GMT)
Optimized Tradeoffs for Private Prediction with Majority Ensembling [60.0] 本稿では,データ依存型ランダム化応答行列(DaRRM)アルゴリズムを提案する。
DaRRMはデータ依存ノイズ関数$gamma$でパラメータ化され、全てのプライベートアルゴリズムのクラスに対して効率的なユーティリティ最適化を可能にする。
本稿では,DARRMが共通ベースラインよりも2倍のプライバシゲインを,固定ユーティリティで確実に享受していることを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 00:48:48 GMT)
How Does Variance Shape the Regret in Contextual Bandits? [59.8] 一般関数近似を用いた文脈的包帯について考察する。
共振器次元 $d_textelu$-$play が分散依存境界において重要な役割を果たすことを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:14:24 GMT)
MSA-ASR: Efficient Multilingual Speaker Attribution with frozen ASR Models [59.8] 話者分布自動音声認識(SA-ASR)は,対応する話者に文字を正確に割り当てながら音声を転写することを目的としている。
本稿では,凍結した多言語ASRモデルを用いて話者属性を転写に組み込む新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:01:08 GMT)
Bench2Drive: Towards Multi-Ability Benchmarking of Closed-Loop End-To-End Autonomous Driving [59.7] 本稿では,E2E-ADシステムのマルチ能力をクローズドループで評価するための最初のベンチマークであるBench2Driveを紹介する。
我々は最先端のE2E-ADモデルを実装し、Bench2Driveで評価し、現状と今後の方向性について洞察を提供する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:31:04 GMT)
GATE OpenING: A Comprehensive Benchmark for Judging Open-ended Interleaved Image-Text Generation [59.5] MLLM(Multimodal Large Language Models)は視覚的理解と生成に大きく貢献している。
インターリーブされた画像テキストコンテンツを生成することは依然として課題であり、統合されたマルチモーダル理解と生成能力が必要である。
Gate Openingは56の現実世界タスクにわたる5,400の高品質な人間アノテーションインスタンスからなるベンチマークである。
IntJudgeはオープンなマルチモーダル生成手法を評価するための判断モデルである。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:39:04 GMT)
Textured Gaussians for Enhanced 3D Scene Appearance Modeling [58.1] 3D Gaussian Splatting (3DGS)は最先端の3D再構成およびレンダリング技術として登場した。
本稿では,それぞれにα(A), RGB, RGBAテクスチャマップを付加した一般化されたガウスの外観表現を提案する。
類似または少ないガウス数を用いて,既存の手法に比べて画質が向上したことを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:59:59 GMT)
Don't Let Your Robot be Harmful: Responsible Robotic Manipulation [57.7] ロボット操作における人間の指示の実行は、深刻な安全性のリスクにつながる可能性がある。
i) 安全リスクを含むシナリオを自動生成し、仮想的なインタラクションを行う世界モデルと、(ii) 反射による結果を予測するメンタルモデルを含む。
本研究は, 安全行政がリスクを回避し, 合成データセットと実世界の両方の実験において, 効率的にタスクを完了できることを実証する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:27:50 GMT)
MotionWavelet: Human Motion Prediction via Wavelet Manifold Learning [57.1] MotionWaveletは、空間周波数領域における人間の動きパターンを研究する人間の動き予測フレームワークである。
ウェーブレット拡散モデルでは、動作データにウェーブレット変換を適用することでウェーブレット多様体を学習する。
ウェーブレット空間形状誘導機構は、デノナイジングプロセスを洗練し、多様体構造との整合性を改善する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 01:55:29 GMT)
Quantum optical scattering by macroscopic lossy objects: A general approach [55.2] 真空中に置かれた損失の大きいマクロな物体によって量子光の散乱を記述するための一般的な手法を開発する。
入力出力関係を利用してフィールドの出力状態を入力1に接続する。
古典的な透過・吸収ダイアディクスがS-ポラリトンからS-ポラリトンへの遷移に与える影響を解析した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:44:29 GMT)
AutoDAN-Turbo: A Lifelong Agent for Strategy Self-Exploration to Jailbreak LLMs [54.9] AutoDAN-Turboは、できるだけ多くのジェイルブレイク戦略をスクラッチから発見できるブラックボックスジェイルブレイク方式だ。
人間設計の戦略を統合することで、AutoDAN-TurboはGPT-4-1106-turboの攻撃成功率93.4を達成できる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 04:24:57 GMT)
Manual-PA: Learning 3D Part Assembly from Instruction Diagrams [54.6] 本稿では,手動誘導3次元部品組立フレームワークである手動PAについて述べる。
以上の結果から, 部品の図面と順序を併用すると, 組立性能が向上し, 組立性能が向上することが示唆された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:10:29 GMT)
Steering Rectified Flow Models in the Vector Field for Controlled Image Generation [54.0] 拡散モデル(DM)は、フォトリアリズム、画像編集、逆問題解決に優れ、分類器なしのガイダンスと画像反転技術によって支援される。
既存のDMベースの手法は、しばしば追加のトレーニングを必要とし、事前訓練された潜在モデルへの一般化が欠如し、ODEソルバと反転プロセスによる広範なバックプロパゲーションにより、計算資源が要求される。
本研究では,ベクトル場を利用した画像生成タスクのデノイング軌道の制御を行うFlowChefを提案する。
FlowChefは、パフォーマンス、メモリ、時間要件の点でベースラインを大幅に上回り、新しい状態を達成する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:04:40 GMT)
Embracing AI in Education: Understanding the Surge in Large Language Model Use by Secondary Students [53.2] OpenAIのChatGPTのような大規模言語モデル(LLM)は、新しい教育の道を開いた。
学校制限にもかかわらず,中高生300人以上を対象に調査を行ったところ,学生の70%がLDMを利用していることがわかった。
我々は、対象特化モデル、パーソナライズドラーニング、AI教室など、このような問題に対処するいくつかのアイデアを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:19:34 GMT)
MaGRITTe: Manipulative and Generative 3D Realization from Image, Topview and Text [52.3] ユーザ特定条件からの3Dシーンの生成は、3Dアプリケーションの生産負担を軽減するための有望な道を提供する。
以前の研究では、限られた制御条件のため、望まれるシーンを実現するためにかなりの努力が必要だった。
部分画像,トップビューに表現されたレイアウト情報,テキストプロンプトを用いて,マルチモーダル条件下での3Dシーンの制御と生成を行う手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:28:57 GMT)
Reconstructing Animals and the Wild [52.0] 本研究では,単一画像から自然シーンを再構成する手法を提案する。
当社のアプローチは、大規模言語モデルにおける強力な世界の先駆的活用の進歩に基づくものです。
本稿では,100万枚の画像と数千枚の資産からなる合成データセットを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 23:24:27 GMT)
DepthCrafter: Generating Consistent Long Depth Sequences for Open-world Videos [51.9] 本稿では,オープンワールドビデオの複雑な詳細を伴う時間的に一貫した長深さシーケンスを生成するDepthCrafterを提案する。
オープンワールドビデオの一般化能力は、事前訓練された画像間拡散モデルからビデオ間拡散モデルを訓練することによって達成される。
トレーニング手法により、モデルは、最大110フレームまでの可変長の深度シーケンスを生成し、リアルかつ合成されたデータセットから、正確な深度の詳細と豊富な内容の多様性を抽出することができる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:59:25 GMT)
Improved Noise Schedule for Diffusion Training [51.8] 本稿では,拡散モデルのトレーニングを強化するため,ノイズスケジュールを設計するための新しい手法を提案する。
我々は,標準のコサインスケジュールよりもノイズスケジュールの方が優れていることを実証的に示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:10:12 GMT)
The Last Mile to Supervised Performance: Semi-Supervised Domain Adaptation for Semantic Segmentation [51.8] 半スーパービジョンドメイン適応(SSDA)の有望な設定について検討する。
本稿では,整合性正規化,画素コントラスト学習,自己学習を組み合わせたシンプルなSSDAフレームワークを提案し,いくつかのターゲットドメインラベルを効果的に活用する。
提案手法は,GTA-to-Cityscapesベンチマークにおいて先行技術よりも優れており,50個のターゲットラベルがほぼ教師付き性能を達成するのに十分であることを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 20:07:42 GMT)
Fault-Tolerant Constant-Depth Clifford Gates on Toric Codes [51.2] 本稿では,2次元トーリック符号上での耐故障性および深い論理ゲートのセットを提案し,シミュレーションする。
この集合は折り畳み反転ゲート、デーンツイスト、単ショット論理パウリ測度を組み合わせてクリフォード群を生成する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:17:56 GMT)
A Unified Framework for 3D Scene Understanding [50.7] UniSeg3Dは統合された3Dシーン理解フレームワークである。
単一のモデル内で、パノプティクス、セマンティック、インスタンス、インタラクティブ、参照、オープンボキャブラリセグメンテーションタスクを達成する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:08:34 GMT)
Living off the Analyst: Harvesting Features from Yara Rules for Malware Detection [50.6] 悪質な俳優が使う戦略は、悪質な俳優の意図のために良質なシステムが使われ、再利用される「土地から生き去る」ことである。
これは、人書き署名を使って特定のマルウェア群を検出するYARAルールによって検証可能であることを示す。
公開されているYARAルールからサブ署名を抽出することにより、悪意のあるサンプルをより効果的に識別できる一連の機能を組み立てた。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:03:00 GMT)
Optimizing Multispectral Object Detection: A Bag of Tricks and Comprehensive Benchmarks [49.8] RGBおよびTIR(熱赤外)変調を利用したマルチスペクトル物体検出は,課題として広く認識されている。
モダリティと堅牢な融合戦略の両方から特徴を効果的に抽出するだけでなく、スペクトルの相違といった問題に対処する能力も必要である。
本稿では,高パフォーマンス単一モードモデルのシームレスな最適化が可能な,効率的かつ容易にデプロイ可能なマルチスペクトルオブジェクト検出フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:18:39 GMT)
SWIM: Short-Window CNN Integrated with Mamba for EEG-Based Auditory Spatial Attention Decoding [49.3] 音声エンベロープに依存しない脳波(EEG)信号から聴覚注意の軌跡を特定するため,SWIMと呼ばれる新しいモデルを提案する。
SWIMは2つの部分から構成される。1つはショートウインドウCNN(SW$_textCNN$)で、短期的なEEG特徴抽出器として機能する。
第2部であるMambaは、最初に聴覚空間注意復号法に適用されたシーケンスモデルである。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:30:24 GMT)
Isolating authorship from content with semantic embeddings and contrastive learning [49.2] 作者は内部にスタイルとコンテンツが絡み合っている。
本稿では,意味的類似性モデルを用いて合成的に生成した強みを付加したコントラスト学習手法を提案する。
この切り離し技術は、コンテンツ埋め込み空間をスタイル埋め込み空間から遠ざけることを目的としており、スタイル埋め込みをより情報伝達する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:08:46 GMT)
Low-Bit Quantization Favors Undertrained LLMs: Scaling Laws for Quantized LLMs with 100T Training Tokens [49.1] 1500以上の量子化大言語モデル(LLM)を制御された環境で研究する。
我々は,QiDとトレーニングトークン数,モデルサイズ,ビット幅などの要因との関係を理解するためのスケーリング法則を導出する。
予測では,100兆以上のトークンでトレーニングされるであろう将来のモデルの低ビット量子化性能は望ましくないと考えられる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:51:04 GMT)
FaithDiff: Unleashing Diffusion Priors for Faithful Image Super-resolution [48.9] 本稿では,忠実な画像SRのための遅延拡散モデル(LDM)のパワーをフル活用するために,FithDiffというシンプルで効果的な手法を提案する。
高品質画像上で事前学習した拡散モデルを凍結する既存の拡散ベースSR法とは対照的に,有用な情報を特定し,忠実な構造を復元する前に拡散を解き放つことを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 23:58:03 GMT)
Multi-Label Contrastive Learning : A Comprehensive Study [48.8] マルチラベルの分類は、研究と産業の両方において重要な領域として現れてきた。
対照的な学習をマルチラベル分類に適用することは、ユニークな課題である。
多様な環境における多ラベル分類のためのコントラスト学習損失の詳細な研究を行う。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 20:20:06 GMT)
Draft Model Knows When to Stop: A Self-Verification Length Policy for Speculative Decoding [48.4] SVIPは投機的復号システムのための動的ドラフト長ポリシーである。
SVIPは、ドラフトトークンの受け入れ率と推論時間近似の理論的下限に基づいて、ドラフトシーケンスの長さを適応的に決定する。
SVIPは完全にトレーニングフリーで、ドラフトトークンを自動回帰的に生成する既存のSDメソッドと互換性がある。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:53:17 GMT)
Simulating Classroom Education with LLM-Empowered Agents [48.3] 大型言語モデル (LLM) は、様々な知的教育タスクに応用され、教育支援を行っている。
マルチエージェント型教室シミュレーション教育フレームワークSimClassを提案する。
代表的クラスの役割を認識し、自動授業のための新しいクラス制御機構を導入する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:50:24 GMT)
CoMat: Aligning Text-to-Image Diffusion Model with Image-to-Text Concept Matching [48.0] 本稿では,画像からテキストまでの概念マッチング機構を備えた,エンドツーエンド拡散モデルの微調整戦略であるCoMatを提案する。
画像キャプションモデルを利用して画像とテキストのアライメントを測定し、拡散モデルを導いて無視トークンを再検討する。
画像や人間の嗜好データがない場合は、20KテキストプロンプトだけでSDXLを微調整し、CoMat-SDXLを得る。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:55:41 GMT)
BlackDAN: A Black-Box Multi-Objective Approach for Effective and Contextual Jailbreaking of Large Language Models [47.6] BlackDANは、多目的最適化を備えた革新的なブラックボックス攻撃フレームワークである。
ジェイルブレイクを効果的に促進する高品質なプロンプトを生成する。
コンテキスト関連性を維持し、検出可能性を最小限にする。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:41:48 GMT)
A Comprehensive Study of Structural Pruning for Vision Models [45.2] PruningBenchと呼ばれる、構造的プルーニングのための最初の総合的なベンチマークを提示する。
PruningBenchは、多様な構造的プルーニング技術の有効性を評価するために、統一的で一貫したフレームワークを使用している。
オンラインプルーニングプラットフォーム http://pruning.azoo.cn で、プルーニングタスクをカスタマイズし、すべての結果をこの論文で再現する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:32:56 GMT)
Multi-Task Label Discovery via Hierarchical Task Tokens for Partially Annotated Dense Predictions [44.8] 学習可能な階層型タスクトークンの集合を最適化する新しい手法を提案する。
グローバルタスクトークンは、グローバルコンテキストにおける効果的なクロスタスク機能インタラクションのために設計されている。
各タスクに対するきめ細かいタスク固有の空間トークンのグループを、対応するグローバルタスクトークンから学習する。
学習されたグローバルおよび局所的な細粒度タスクトークンは、異なるレベルの粒度で擬似タスク固有の密度ラベルを発見するためにさらに使用される。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 23:53:27 GMT)
DetailGen3D: Generative 3D Geometry Enhancement via Data-Dependent Flow [44.7] DetailGen3Dは、生成された3D形状を強化するために特別に設計されたジェネレーティブなアプローチである。
我々の重要な洞察は、潜在空間におけるデータ依存フローを通して、粗大から細小への変換を直接モデル化することである。
改質時に正確な空間対応を確保するためのトークンマッチング戦略を導入する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 04:36:07 GMT)
When Large Vision-Language Models Meet Person Re-Identification [44.6] 本稿では,LVLMの強度を利用してReIDを促進する新しいフレームワークであるLVLM-ReIDを提案する。
我々のフレームワークは,LVLMのセマンティック理解と生成能力をエンドツーエンドのReIDトレーニングに統合する。
画像テキストアノテーションを追加せずに複数のベンチマークで競合する結果を得る。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:45:25 GMT)
FoundTS: Comprehensive and Unified Benchmarking of Foundation Models for Time Series Forecasting [44.3] 時系列予測(TSF)は、金融、気象サービス、エネルギー管理など、多くの分野で重要な機能である。
ファンデーションモデルは、新しいまたは見えないデータで有望な推論機能を示す。
そこで我々は,そのようなモデルの徹底的かつ公平な評価と比較を可能にする新しいベンチマーク FoundTS を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 00:58:59 GMT)
HDI-Former: Hybrid Dynamic Interaction ANN-SNN Transformer for Object Detection Using Frames and Events [44.2] HDI-Formerは、高精度でエネルギー効率の良い物体検出のためのハイブリッド動的相互作用ANN-SNN変換器である。
まず,ANNトランスフォーマブランチ内の画像エンコーディングトークン間の相関性を強化する,セマンティック・エンハンスド・セルフアテンション機構を提案する。
次に、低消費電力のイベントストリームから時空間キューをモデル化するSpking Swin Transformerブランチを設計する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:32:41 GMT)
Scalable Multi-Objective Reinforcement Learning with Fairness Guarantees using Lorenz Dominance [43.4] マルチオブジェクト強化学習(MORL)は、複数の、しばしば矛盾する目標間のトレードオフを最適化する一連のポリシーを学ぶことを目的としている。
本稿では,多目的問題に対するスケーラビリティを向上しつつ,公平性をMORLに組み込んだアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:16:25 GMT)
Revisiting Misalignment in Multispectral Pedestrian Detection: A Language-Driven Approach for Cross-modal Alignment Fusion [43.3] 本稿では,高度に不整合したデータセットを扱うために設計された多スペクトル歩行者検出のための新しい枠組みを提案する。
大規模視覚言語モデル(LVLM)を相互意味的アライメントに活用することにより,検出精度の向上を図る。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:24:51 GMT)
Large Language Model-Brained GUI Agents: A Survey [43.2] マルチモーダルモデルはGUI自動化の新しい時代を支えてきた。
彼らは自然言語理解、コード生成、視覚処理において例外的な能力を示した。
これらのエージェントはパラダイムシフトを表しており、ユーザーは単純な会話コマンドで複雑なマルチステップタスクを実行できる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:13:39 GMT)
Enhancing Signed Graph Neural Networks through Curriculum-Based Training [42.9] サイン付きグラフニューラルネットワーク(SGNN)は、そのようなグラフを分析する強力なツールとして登場した。
我々の知る限り、SGNNに特化した訓練計画を策定するための事前の研究は行われていない。
SGNNは、人間の学習と同様、簡単から難易度まで進歩するカリキュラムの恩恵を受けることができると我々は主張する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:15:44 GMT)
Aligning Pre-trained Models for Spoken Language Translation [42.5] 本稿では, 凍結事前学習型自動音声認識(ASR)と機械翻訳(MT)モデルを小型コネクタモジュールを介して協調する手法を用いて, エンドツーエンド音声翻訳(ST)への新たなアプローチについて検討する。
このコネクタは基礎MTモデルのドメインアダプタとして機能し, 整列ST設定における変換性能を著しく向上させる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:32:41 GMT)
KANs for Computer Vision: An Experimental Study [41.9] 本稿では,コンピュータビジョンタスクに適用されたKAN(Kolmogorov-Arnold Networks)の実験的検討を行う。
Kansはエッジ上で学習可能なアクティベーション関数を導入し、フレキシブルな非線形変換を提供する。
kansは特定のビジョンタスクでうまく機能するが、それらは重大な課題に直面している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:59:28 GMT)
GeneQuery: A General QA-based Framework for Spatial Gene Expression Predictions from Histology Images [41.7] 全スライディングヘマトキシリンとエオシン染色組織像は容易にアクセスでき、顕微鏡レベルで組織構造と組成を詳細に調べることができる。
近年の進歩は、これらの組織像を利用して、空間的に解決された遺伝子発現プロファイルを予測している。
GeneQueryは、この遺伝子発現予測タスクを質問応答(QA)方式で解決し、より汎用性と柔軟性を向上させることを目的としている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:33:13 GMT)
RS-vHeat: Heat Conduction Guided Efficient Remote Sensing Foundation Model [41.7] 本稿では,効率的なマルチモーダルリモートセンシング基盤モデルであるRS-vHeatを紹介する。
具体的には、RS-vHeatは、O(N1.5)$の複雑さを持つ熱伝導演算子(HCO)と、大域的受容場を適用している。
注意に基づくリモートセンシング基礎モデルと比較して、メモリ消費を84%減らし、FLOPを24%減らし、スループットを2.7倍改善する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 01:43:38 GMT)
Auto Cherry-Picker: Learning from High-quality Generative Data Driven by Language [41.4] 拡散モデルは現実的で多様な画像を生成することができ、データ集約的な知覚タスクのためのデータ可用性を促進する可能性がある。
高品質なクロスモダリティトレーニングサンプルを生成する新しいフレームワークであるtextbfAuto textbfCherry-textbfPicker (ACP) を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:13:15 GMT)
Do LLMs dream of elephants (when told not to)? Latent concept association and associative memory in transformers [41.0] LLM(Large Language Models)は、事実を保存およびリコールする能力を持つ。
LLMは、コンテキスト内の特定のトークンが事実を取得する手がかりとなる連想記憶モデルのように振る舞う。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 22:41:03 GMT)
Towards Chunk-Wise Generation for Long Videos [40.9] 我々は,自己回帰的チャンク・バイ・チャンク戦略を用いて,長時間のビデオ生成に関する調査を行う。
長大なビデオタスクにショート・イメージ・チャンク・トゥ・ビデオ・モデルを適用することで生じる一般的な問題に対処する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:13:26 GMT)
VideoLLM Knows When to Speak: Enhancing Time-Sensitive Video Comprehension with Video-Text Duet Interaction Format [40.7] 既存の作業では、ユーザはビデオ全体とクエリを入力として使用することでビデオLLMと対話し、その後モデルが応答を生成する。
このインタラクションフォーマットは、ライブストリーミングの理解のようなシナリオにおけるVideoLLMsの適用を制限する。
本稿では,ビデオ・テキスト・デュエットインタラクション形式に焦点をあてる。
MMDuetITはビデオ・テキスト・デュエット・インタラクション・フォーマットにビデオLLMを適応させるために設計されたビデオ・テキスト・トレーニング・データセットである。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:15:34 GMT)
Diffusion Self-Distillation for Zero-Shot Customized Image Generation [40.1] Diffusion Self-Distillationは、テキスト条件のイメージ・ツー・イメージタスクのための独自のデータセットを生成する方法である。
まず、画像のグリッドを作成するために、テキスト・ツー・イメージ拡散モデルのコンテキスト内生成機能を利用する。
次に、キュレートされたペア化されたデータセットを使用して、テキストからイメージへのモデルに微調整する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:58:52 GMT)
IKUN: Initialization to Keep snn training and generalization great with sUrrogate-stable variaNce [40.0] textbfIKUNは信号の伝播を安定化し、収束を加速し、一般化を促進する。
ヘッセン解析により、 textbfIKUN で訓練されたモデルは、ゼロに近いヘッセン固有値によって特徴づけられる平坦なミニマに収束することが明らかになった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:41:11 GMT)
Strong Error Bounds for Trotter & Strang-Splittings and Their Implications for Quantum Chemistry [39.6] 入力状態依存性を明示する高次積公式を含む誤差推定理論を提案する。
本手法は,文献における既存作用素ノルム推定の2つの限界を克服する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:35:57 GMT)
Generative Semantic Communication for Joint Image Transmission and Segmentation [39.4] 画像再構成とセグメンテーションタスクの両方をサポートする新しい生成意味コミュニケーションシステムを提案する。
提案手法は,送信側と受信側の両方で意味知識ベース(KB)を構築する。
実験の結果,マルチタスク生成型セマンティック・コミュニケーション・システムは従来の単一タスク・コミュニケーション・システムよりも優れていた。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:51:26 GMT)
Learning for Long-Horizon Planning via Neuro-Symbolic Abductive Imitation [38.7] データ駆動学習と記号に基づく推論を統合した新しいフレームワーク textbfABductive textbfImitation textbfLearning (ABIL) を提案する。
ABILは、原観測からシンボル空間への認識を促進するための述語候補を生成する。
実験の結果,提案手法は課題関連記号による観察をうまく理解し,模倣学習を支援することが確認できた。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:26:14 GMT)
HI-SLAM2: Geometry-Aware Gaussian SLAM for Fast Monocular Scene Reconstruction [38.5] HI-SLAM2は、RGB入力のみを用いて高速かつ正確な単眼シーン再構築を実現する幾何学的ガウスSLAMシステムである。
既存のニューラルSLAM法よりも大幅に改善され,RGB-D法を上回り,再現性もレンダリング性も向上した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 01:39:21 GMT)
Markov Equivalence and Consistency in Differentiable Structure Learning [38.3] 有向非巡回グラフ(DAG)の微分可能な構造学習への既存のアプローチは、強い識別可能性仮定に依存している。
一般確率下での微分可能非周期制約プログラムの挙動を解析することにより,これらの問題を説明・改善する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:49:02 GMT)
MONOPOLY: Learning to Price Public Facilities for Revaluing Private Properties with Large-Scale Urban Data [38.2] 公共施設の価格設定を学習し,私有財産の再評価のための分散的アプローチを提案する。
我々は,中国のいくつかの大都市圏の大規模都市データを用いて,広範囲にわたる実験を行った。
その結果,本手法は有意なマージンを持ついくつかの主流手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 06:44:41 GMT)
Factorized Visual Tokenization and Generation [37.6] 本稿では,大規模なコードブックを複数の独立したサブコードブックに分解することで,VQベースのトークン化を活性化する新しい手法であるFacterized Quantization(FQ)を紹介する。
このファクター化は、大規模なコードブックのルックアップの複雑さを低減し、より効率的でスケーラブルなビジュアルトークン化を可能にします。
実験により,提案したFQGANモデルにより,視覚トークンの再現品質が大幅に向上し,最先端の性能が達成された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:04:36 GMT)
Unifying Generative and Dense Retrieval for Sequential Recommendation [37.4] 逐次密度検索と生成検索の強みを組み合わせたハイブリッドモデルであるLIGERを提案する。
LIGERは、シーケンシャルな高密度検索を生成検索に統合し、性能差を緩和し、コールドスタートアイテムレコメンデーションを強化する。
このハイブリッドアプローチは、これらのアプローチ間のトレードオフに関する洞察を与え、小規模ベンチマークにおけるレコメンデーションシステムの効率と効率性の向上を示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 23:36:59 GMT)
MENTOR: Guiding Hierarchical Reinforcement Learning with Human Feedback and Dynamic Distance Constraint [37.0] 階層的強化学習(HRL)は、タスクをサブゴールに分割し、それらを順次完了させる階層的枠組みを使用する。
現在の手法は、安定した学習プロセスを保証するための適切なサブゴールを見つけるのに苦労している。
本稿では,人間のフィードバックとダイナミック距離制約を取り入れた汎用階層型強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:27:41 GMT)
Codec Does Matter: Exploring the Semantic Shortcoming of Codec for Audio Language Model [36.6] X-Codecは、Residual Vector Quantizationステージの前に、事前訓練されたセマンティックエンコーダのセマンティック機能を組み込んでいる。
X-Codecは音声合成タスクのWERを大幅に削減し、これらの利点を非音声アプリケーションに拡張する。
音声合成における意味情報の統合は,音声生成における言語モデル全体の性能を大幅に向上させることを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:47:45 GMT)
Exploring Depth Information for Detecting Manipulated Face Videos [36.4] 顔深度マップは、顔認識や顔検出などの他の分野で有効であることが示されている。
RGB顔画像からのパッチにより顔深度マップパッチを推定するための顔深度マップ変換器(FDMT)を提案する。
次に、推定された顔深度マップを、バックボーンの特徴と統合される補助情報とみなす。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:16:11 GMT)
Diffusion Autoencoders for Few-shot Image Generation in Hyperbolic Space [35.5] 少ないショット画像生成は、そのクラスでいくつか例を挙げると、目に見えないクラスに対して、多彩で高品質な画像を生成することを目的としている。
本稿では,画像とテキスト間の階層的関係を画像から捉えるために,双曲空間で動作する新しい手法として,双曲拡散オートエンコーダ(HypDAE)を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 00:45:51 GMT)
HiFiVFS: High Fidelity Video Face Swapping [35.5] Face swappingは、ソースからのIDとターゲットからの属性を組み合わせた結果を生成することを目的としている。
安定ビデオ拡散の強い生成能力と時間的先行を生かした高忠実度ビデオ顔交換フレームワークを提案する。
本手法は,映像面スワップにおける最新技術(SOTA)を質的かつ定量的に達成する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:30:24 GMT)
JPPO: Joint Power and Prompt Optimization for Accelerated Large Language Model Services [35.4] 大規模言語モデル(LLM)は様々なタスクにおいて顕著な能力を示しており、無線ネットワークへの展開が増加している。
本研究では,Small Language Model (SLM) をベースとしたプロンプト圧縮と無線電力割り当て最適化を組み合わせたフレームワークとして,JPPO(Joint Power and Prompt Optimization)を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:05:32 GMT)
Leveraging Semi-Supervised Learning to Enhance Data Mining for Image Classification under Limited Labeled Data [35.4] 従来のデータマイニング手法は、大規模で高次元で複雑なデータに直面すると不十分である。
本研究では,ラベルのないデータを利用するアルゴリズムの能力向上を目的とした,半教師付き学習手法を提案する。
具体的には、自己学習法を採用し、画像の特徴抽出と分類のための畳み込みニューラルネットワーク(CNN)と組み合わせる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:59:50 GMT)
ROICtrl: Boosting Instance Control for Visual Generation [35.4] 本稿では,各インスタンスを自由形式のキャプションと組み合わせたバウンディングボックスで管理する地域インスタンス制御を紹介する。
オブジェクト検出においてROI-Alignにインスパイアされ、ROI-Unpoolと呼ばれる補完演算を導入する。
ROI-Unpool 上に構築した ROICtrl は,事前訓練した拡散モデルのアダプタであり,正確な地域インスタンス制御を可能にする。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 00:10:27 GMT)
UOE: Unlearning One Expert Is Enough For Mixture-of-experts LLMS [35.2] 我々は,Mixture-of-Experts (MoE) LLMのための新しいシングルエキスパート・アンラーニングフレームワークUOEを提案する。
専門家の帰属を通じて、未学習は特定の知識の最も活発な専門家に集中する。
UOEは、様々なベンチマークでMoE LLMにおいて、品質を最大5%、実用性を35%向上させる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 22:46:08 GMT)
Simple Relative Deviation Bounds for Covariance and Gram Matrices [35.0] 経験的共分散およびグラム行列の固有値に対する非漸近的相対偏差境界を提供する。
我々の結果はスペクトルをまたいだよりシャープな制御を提供する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:22:55 GMT)
Visual Adversarial Attack on Vision-Language Models for Autonomous Driving [34.5] 視覚言語モデル(VLM)は推論能力を高めることにより、かなり高度な自律運転(AD)を持つ。
これらのモデルは、敵の攻撃に対して非常に脆弱なままである。
本稿では,ADVLMに特化して設計された最初の視覚的敵攻撃フレームワークであるADvLMを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:09:43 GMT)
SLED: Self Logits Evolution Decoding for Improving Factuality in Large Language Models [34.3] 大規模言語モデル(LLM)は目覚ましい能力を示しているが、その出力は信頼できないことや、事実的に間違っていることがある。
本稿では,LLMの真性を高める新しいデコードフレームワークであるSelf Logits Evolution Decoding(SLED)を紹介する。
既存の復号法と比較して,SLEDは実写精度を最大20%向上することを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 20:59:05 GMT)
Proactive Gradient Conflict Mitigation in Multi-Task Learning: A Sparse Training Perspective [33.5] マルチタスク学習における一般的な問題は、勾配衝突の発生である。
スパーストレーニング(ST)による紛争軽減戦略を提案する。
実験の結果,STは競合する勾配を効果的に緩和し,性能が向上することが示された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:58:22 GMT)
Timing Matters: Enhancing User Experience through Temporal Prediction in Smart Homes [33.5] ユーザアクションとそのタイミングを,それぞれの日付と時刻のスタンプに合わせた11kのアクションシーケンスを用いて予測する。
私たちの知る限りでは、これはスマートホームの時間予測の最初の試みだ。
すべてのデータセットで40%の精度(96クラス)、正確なタイムスタンプを含むデータセットでは80%の精度(8クラス)を実現しています。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:49:11 GMT)
How language models extrapolate outside the training data: A case study in Textualized Gridworld [32.5] 我々は、次のトークン予測や思考の微調整を含む従来の手法は、より大きな、目に見えない環境では外挿できないことを示す。
人間の心的表現をシミュレートする新しいCoTフレームワークであるパス計画のための認知マップを提案する。
言語モデルにおける汎用認知地図の開発について,これらの認知地図が専門的な学習手法を必要とすることを知ると,重要な疑問が浮き彫りになる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:52:59 GMT)
Spatiotemporal Skip Guidance for Enhanced Video Diffusion Sampling [32.2] 本稿では、トランスフォーマーに基づくビデオ拡散モデルを改善するための時空間スキップガイダンス(TG)を提案する。
TGは自己摂動を通じて暗黙の弱いモデルを採用し、外部モデルや追加のトレーニングを必要としない。
TGは、多様性や動的度合いを損なうことなく、サンプルの品質を高めるために、オリジナルのモデルの整列した、劣化したバージョンを生成する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:59:48 GMT)
Individual solid-state nuclear spin qubits with coherence exceeding seconds [32.1] 本稿ではEr$3+の結晶に隣接する183$Wの核スピン量子ビットからなる量子情報処理のための新しいプラットフォームを提案する。
我々は、Er$3+$スピンをアンシラとして使用して、各核スピン量子ビットの量子非退化読み出しを実演する。
我々は、電子-核スピン系のラマン駆動を刺激した全マイクロ波単量子ゲートと2量子ゲートの新たなスキームを導入する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:46:34 GMT)
Graph Canvas for Controllable 3D Scene Generation [31.1] GraphCanvas3Dはプログラム可能、適応可能、適応可能な3Dシーン生成用フレームワークである。
本フレームワークでは,空間要素をグラフノードとして表現する階層的,グラフ駆動的なシーン記述を用いている。
私たちのコードとモデルはプロジェクトのWebサイトで公開されています。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:41:23 GMT)
Biometric Authentication Based on Enhanced Remote Photoplethysmography Signal Morphology [31.0] リモート・フォトプレソグラフィー (Remote Photoplethhymography) は、顔画像から心臓の信号を計測する非接触法である。
近年の研究では、各個人が生体認証識別子として使用できる独自のc信号形態を持っていることが示されている。
提案手法では,rの認証モデルをトレーニングするために,対象ID付き顔画像のみを識別する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:47:03 GMT)
Enhancing MMDiT-Based Text-to-Image Models for Similar Subject Generation [31.0] 最新のMMDiT(Multimodal Diffusion Transformer)は,入力テキストプロンプトに類似した意味や外観の複数の主題が含まれている場合,対象の曖昧さや混合に悩まされている。
この問題の原因となる3つの曖昧さは、ブロック間曖昧性、テキスト曖昧性、セマンティック曖昧性である。
そこで本研究では,初期段階におけるテスト時間最適化により,不明瞭な潜伏状態の修復を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:47:06 GMT)
Neural Finite-State Machines for Surgical Phase Recognition [30.9] 深層学習アプローチで手続き的理解をブリッジするニューラル有限状態機械(NFSM)モジュールを導入する。
NFSMは、Colec80データセット上のビデオレベルの精度、位相レベルの精度、リコール、ジャカードインデックスをそれぞれ2.3、3.2、3.0、および4.8パーセント改善する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:21:57 GMT)
Embodied Red Teaming for Auditing Robotic Foundation Models [30.7] Embodied Red Teaming (ERT)は、言語条件ロボットモデルをテストするための多様で困難な命令を生成する。
ERTは、視覚言語モデル(VLM)による自動化されたレッドチーム化技術を使用して、文脈的に基礎があり、難しい命令を生成する。
実験結果から,ERTテストでは,最先端モデルが頻繁に失敗または不安全に振る舞うことが示唆された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:57:26 GMT)
Lift3D Foundation Policy: Lifting 2D Large-Scale Pretrained Models for Robust 3D Robotic Manipulation [30.7] Lift3Dは、ロバストな3D操作ポリシーを構築するために、暗黙的で明示的な3Dロボット表現で2Dファンデーションモデルを強化するフレームワークである。
実験では、Lift3Dはいくつかのシミュレーションベンチマークや実世界のシナリオで、最先端の手法を一貫して上回っている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:59:52 GMT)
Human Motion Instruction Tuning [30.7] 本稿では,人間の動作指導のためのフレームワークであるLLaMoについて述べる。
LLaMoは、命令チューニングのためのネイティブフォームで動作を保持します。
ビデオデータとモーションデータをテキスト入力と共に処理することで、LLaMoは柔軟な人間中心の分析を可能にする。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:45:29 GMT)
SelfEval: Leveraging the discriminative nature of generative models for evaluation [30.2] テキストから画像への生成拡散モデルのテキストアライメントを自動評価する方法を提案する。
提案手法はSelfEvalと呼ばれ,テキストプロンプトが与えられた実画像の確率を計算するために生成モデルを用いている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 00:15:47 GMT)
TAPTRv3: Spatial and Temporal Context Foster Robust Tracking of Any Point in Long Video [30.2] 本稿では,TAPTRv2上に構築されたTAPTRv3について述べる。
TAPTRv3は、挑戦的なデータセットの大部分でTAPTRv2をはるかに上回り、最先端のパフォーマンスを得る。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:37:22 GMT)
QuaLLM-Health: An Adaptation of an LLM-Based Framework for Quantitative Data Extraction from Online Health Discussions [30.1] 本報告では,QuaLLMからQuaLLM-Healthに適応したフレームワークを用いて,非構造化テキストから臨床的に関連のある定量的データを抽出する。
2024年7月にReddit APIを使って5つのGLP-1関連コミュニティから410万の投稿とコメントを収集しました。
フレームワークを完全なデータセットに適用することで、下流分析に必要な変数の効率的な抽出が可能になった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 00:52:21 GMT)
DuMapper: Towards Automatic Verification of Large-Scale POIs with Street Views at Baidu Maps [29.9] DuMapperはBaidu Mapsのマルチモーダルストリートビューデータを用いた大規模POI検証のための自動システムである。
DuMapperは、サインボードイメージと現実世界の場所の座標を入力として、低次元ベクトルを生成する。
POI検証のスループットを50ドル倍に向上させることができる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:54:33 GMT)
A Pipeline of Neural-Symbolic Integration to Enhance Spatial Reasoning in Large Language Models [29.7] 空間的推論は推論と推論の重要な部分である。
本稿では,LLMの空間推論能力を高めるニューラルシンボリック・フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:04:05 GMT)
Monocular Obstacle Avoidance Based on Inverse PPO for Fixed-wing UAVs [29.2] 固定翼無人航空機(英語: Fixed-wing Unmanned Aerial Vehicles、UAV)は、低高度経済(LAE)と都市空運(UAM)のための最も一般的なプラットフォームの一つである。
従来の地図や高度なセンサーに依存する古典的な障害物回避システムは、未知の低高度環境や小型UAVプラットフォームにおいて制限に直面している。
本稿では,DRLに基づくUAV衝突回避システムを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:03:37 GMT)
DHCP: Detecting Hallucinations by Cross-modal Attention Pattern in Large Vision-Language Models [29.2] 大規模視覚言語モデル(LVLM)は、複雑なマルチモーダルタスクにおいて例外的な性能を示した。
彼らは、オブジェクト、属性、リレーショナル幻覚など、重大な幻覚に悩まされ続けている。
我々は幻覚を識別できる軽量検出器を開発した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:43:09 GMT)
Dual Prototyping with Domain and Class Prototypes for Affective Brain-Computer Interface in Unseen Target Conditions [29.2] 脳波信号は感情的脳とコンピュータのインターフェースにおいて強力なツールとして登場し、感情認識において重要な役割を担っている。
モデル学習におけるソースデータとターゲットデータの両方に依存するため,脳波認識のための最新のディープトランスファー学習手法が課題に直面している。
本稿では,新しいフレームワーク(PL-DCP)を提案する。
PL-DCPはトレーニング中にソースデータのみを運用する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 00:56:43 GMT)
Stochastic Taylor Derivative Estimator: Efficient amortization for arbitrary differential operators [29.1] 多変量関数に対する任意の順序の微分テンソルの任意の収縮を効率的に行う方法を示す。
物理インフォームドニューラルネットワーク(PINN)に適用すると,1000$times$ Speed-upと1000$times$ Speed-upが提供される。
30$times$1次ADによるランダム化によるメモリ削減。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:37:33 GMT)
Learning the Evolution of Physical Structure of Galaxies via Diffusion Models [29.0] 本稿では、銀河画像を生成するために、赤方偏移にDDPM(Denoising Diffusion Probabilistic Models)を適応させる新しい手法を提案する。
我々は、この先進的な生成モデルが、その画像と赤方偏移測定のみに基づいて、銀河の物理的特性を正確に捉えることができるかどうかを考察する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:28:30 GMT)
SAR3D: Autoregressive 3D Object Generation and Understanding via Multi-scale 3D VQVAE [28.6] 本稿では,多次元ベクトル量子化変分オートエンコーダ(VQVAE)を利用して3Dオブジェクトをトークン化する新しいフレームワークであるScale AutoRegressive 3D(SAR3D)を紹介する。
次の単一トークンの代わりにマルチスケールの潜在表現で次のスケールを予測することで、SAR3Dは生成時間を著しく短縮する。
実験の結果,SAR3Dは現行の3D生成法よりも高速かつ高品質であることがわかった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:33:32 GMT)
Enhancing Visual Reasoning with Autonomous Imagination in Multimodal Large Language Models [27.8] 本稿では,MLLMが入力シーンをその推論状態に基づいて自動修正できる新しい視覚推論パラダイムを提案する。
そこで我々は,MLLMが焦点,無視,変換といった操作を通じて視覚的な修正を行う,新しいプラグアンドプレイの想像空間を導入する。
我々は,厳密な数え上げ,単純なジグソーパズルの解法,オブジェクト配置にまたがるベンチマークを用いて,我々のアプローチを検証する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:44:25 GMT)
EFSA: Towards Event-Level Financial Sentiment Analysis [27.5] 我々は、金融感情分析(FSA)をイベントレベルにまで拡張する。
粗大なイベントカテゴリと細粒なイベントカテゴリからなる分類を設計する。
12,160ドルのニュース記事と13,725ドルのクインタプルを含む大規模な中国のデータセットが、私たちのタスクの新たなテストベッドとして公開されています。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:09:56 GMT)
Training Data Synthesis with Difficulty Controlled Diffusion Model [27.2] 半教師付き学習(SSL)は、ラベルのない画像を活用することにより、モデルパフォーマンスを向上させることができる。
本稿では,合成画像によって汚染された未ラベルデータの影響を調査するための新しいタスクであるReal-Synthetic Hybrid SSL(RS-SSL)を提案する。
本稿では,RS-SSLの課題に対処するための新しいSSL手法であるRSMatchを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:42:06 GMT)
OpenMU: Your Swiss Army Knife for Music Understanding [27.2] 音楽理解のためのマルチモーダル言語モデルをトレーニングするためのベンチマークスイートであるOpenMU-Benchを紹介する。
OpenMU-Benchは、歌詞理解と音楽ツールの使用によって、音楽理解の範囲を広げる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:43:19 GMT)
MROVSeg: Breaking the Resolution Curse of Vision-Language Models in Open-Vocabulary Image Segmentation [26.7] MROVSegは、オープンボキャブラリイメージセグメンテーションのためのマルチレゾリューショントレーニングフレームワークで、単一の事前トレーニングされたCLIPバックボーンを備えている。
スライドウィンドウを使用して、高解像度の入力を均一なパッチにスライスし、それぞれがよく訓練されたイメージエンコーダの入力サイズにマッチする。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:26:41 GMT)
Individual Content and Motion Dynamics Preserved Pruning for Video Diffusion Models [26.6] ビデオ拡散モデル(VDM)を実用化するためには,高い計算コストと遅延推論時間が大きな障害となる。
個別のコンテンツと動作動態を保存したプルーニングと整合性損失を用いた新しいビデオ拡散モデル圧縮手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:22:13 GMT)
TimeMarker: A Versatile Video-LLM for Long and Short Video Understanding with Superior Temporal Localization Ability [26.4] ビデオコンテンツに基づく高品質な対話のための多目的ビデオLLMであるTimeMarkerを導入し、時間的ローカライゼーションを強調した。
TimeMarkerはTemporal Separator Tokensを統合して、時間的認識を高め、ビデオ内の特定の瞬間を正確にマークする。
動的フレームサンプリングと適応トークンマージにAnyLengthメカニズムを使用し、ショートビデオとロングビデオの両方を効果的に扱うことができる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:45:40 GMT)
TSD-SR: One-Step Diffusion with Target Score Distillation for Real-World Image Super-Resolution [26.0] 事前訓練されたテキスト-画像拡散モデルが、現実の画像超解像(Real-ISR)タスクにますます応用されている。
拡散モデルの反復的洗練された性質を考えると、既存のアプローチのほとんどは計算的に高価である。
実世界の超高解像度画像に特化して設計された新しい蒸留フレームワークであるTLD-SRを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:01:08 GMT)
Bridging AI and Science: Implications from a Large-Scale Literature Analysis of AI4Science [25.7] 本稿では,AI4Science文献の大規模解析を行う。
我々は,AI手法と科学的問題の主な相違点を定量的に強調する。
我々は,AIと科学コミュニティの協力を促進する可能性と課題について検討する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 00:40:51 GMT)
Scale-MIA: A Scalable Model Inversion Attack against Secure Federated Learning via Latent Space Reconstruction [25.7] フェデレーション学習は、参加者のデータプライバシを保護する能力で知られている。
最近出現したモデルインバージョン攻撃 (MIA) は、悪意のあるパラメータサーバが、モデルの更新から個々のユーザーのローカルデータサンプルを再構築できることを示した。
集約されたモデル更新から局所的なトレーニングサンプルを効率的かつ正確に再構築できる新しいMIAであるScale-MIAを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:12:50 GMT)
Beyond Examples: High-level Automated Reasoning Paradigm in In-Context Learning via MCTS [25.6] HiAR-ICLは特定の例から抽象的な思考パターンへとシフトする。
適切な思考カードと動的に一致する認知複雑性フレームワークを開発する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:19:00 GMT)
AMPS: ASR with Multimodal Paraphrase Supervision [25.6] 本稿では,多言語多言語マルチモーダルASRシステムを拡張したAMPSを提案する。
参照転写のパラフレーズを,マルチモーダルASRモデルの訓練中に追加の指導として使用し,このパラフレーズの目的を,貧弱なASR性能の発話に対して選択的に呼び出す。
AMPSと最先端のマルチモーダルモデルSeamlessM4Tを用いて,単語誤り率(WER)を最大5%まで下げる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:16:51 GMT)
Combinational Backdoor Attack against Customized Text-to-Image Models [25.4] カスタマイズT2Iモデルに対するコンビネーションバックドア攻撃(CBACT2I)
この研究は、カスタマイズされたT2Iモデルのバックドア脆弱性を明らかにし、バックドアの脅威を軽減するための対策を奨励する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:41:57 GMT)
TransferFuzz: Fuzzing with Historical Trace for Verifying Propagated Vulnerability Code [24.8] 本稿では,新しい脆弱性検証フレームワークであるTransferFuzzを紹介する。
コードの再利用によって伝播する脆弱性が、新しいソフトウェアでトリガーできるかどうかを検証することができる。
CVEレポートに記載されている15の脆弱性に対して、影響のあるソフトウェアスコープを拡張することで、その効果を証明している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:46:39 GMT)
Heterophilic Graph Neural Networks Optimization with Causal Message-passing [24.8] グラフニューラルネットワーク(GNN)における異種メッセージパッシングを因果推論を用いて捉える。
異種グラフ学習のための因果的メッセージパス探索ネットワークCausalMPを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 06:12:01 GMT)
Federated Low-Rank Adaptation with Differential Privacy over Wireless Networks [24.7] Federated Fine-tuning (FedFT)は、生データを共有せずに協調的なモデルトレーニングを促進することで、いくつかのプライバシー問題を緩和する。
FedFTにおけるプライバシーの盗聴攻撃のリスクは、特に医療や金融などの機密分野において懸念されている。
無線ネットワーク上での差分プライバシー(DP)を考慮したFedFTフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:55:59 GMT)
Hidden Data Privacy Breaches in Federated Learning [24.5] フェデレーテッド・ラーニング(FL)は、広範囲に分散したデータセットで機械学習を実行するためのパラダイムとして登場した。
近年の研究によると、攻撃者はモデル操作や勾配解析によって個人データを盗むことができる。
本稿では,悪意あるコードインジェクションを利用した新しいデータ再構成攻撃を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:04:37 GMT)
ReforesTree: A Dataset for Estimating Tropical Forest Carbon Stock with Deep Learning and Aerial Imagery [24.5] ReforesTree(ReforesTree)はエクアドルの6カ所の森林炭素指数のベンチマークデータセットである。
低コストのRGB専用ドローン画像から個々の木を検出する深層学習に基づくエンド・ツー・エンドモデルが、公式の炭素オフセット認定基準内で森林炭素ストックを正確に推定していることを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:59:05 GMT)
Dynamic Non-Prehensile Object Transport via Model-Predictive Reinforcement Learning [24.1] バッチ強化学習(RL)とモデル予測制御(MPC)を組み合わせたアプローチを提案する。
提案手法は,ロボットウェイタータスクを実行するFranka Pandaロボットのシミュレーションおよび実世界実験により検証される。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:33:42 GMT)
From Obstacles to Resources: Semi-supervised Learning Faces Synthetic Data Contamination [24.1] 半教師付き学習(SSL)は、ラベルのない画像を活用することにより、モデルパフォーマンスを向上させることができる。
本稿では,合成画像によって汚染された未ラベルデータの影響を調査するための新しいタスクであるReal-Synthetic Hybrid SSL(RS-SSL)を提案する。
本稿では,RS-SSLの課題に対処するための新しいSSL手法であるRSMatchを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:06:36 GMT)
Optimization-Free Image Immunization Against Diffusion-Based Editing [23.8] DiffVaxは、画像免疫のためのスケーラブルで軽量で最適化のないフレームワークである。
提案手法は, 効率的な一般化によるコンテンツの発見, 計算コストの削減, 免疫時間を数日からミリ秒に短縮する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 00:30:26 GMT)
Don't Command, Cultivate: An Exploratory Study of System-2 Alignment [23.6] o1システムカードは、o1モデルをOpenAIの中でもっとも堅牢なものとして識別する。
モデル安全性に及ぼすシステム2思考パターンの影響について検討する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:18:04 GMT)
From Exploration to Revelation: Detecting Dark Patterns in Mobile Apps [23.5] AppRayは、タスク指向のアプリ探索と自動ダークパターン検出をシームレスにブレンドするシステムである。
私たちはAppRay-DarkとAppRay-Lightという2つのデータセットをコントリビュートしました。
実験の結果、AppRayはアプリを効率的に探索し、大きなパフォーマンスで広範囲の暗いパターンを識別できることを確認した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 06:39:35 GMT)
MoGe: Unlocking Accurate Monocular Geometry Estimation for Open-Domain Images with Optimal Training Supervision [23.1] モノクラーオープンドメイン画像から3次元形状を復元する強力なモデルであるMoGeを提案する。
一つの画像が与えられた場合、アフィン不変表現でキャプチャされたシーンの3Dポイントマップを直接予測する。
本稿では,高品質な幾何学を学習する上で,モデルに有効性を与える新しいグローバルおよびローカルな幾何学監督手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:28:06 GMT)
HEMGS: A Hybrid Entropy Model for 3D Gaussian Splatting Data Compression [23.0] 3D Gaussian Splatting (3DGS)は3Dモデリングと画像レンダリングに人気があるが、これはデータストレージと伝送において大きな課題を生み出している。
本稿では3DGSデータ圧縮のためのハイブリッドエントロピーモデルを提案する。
本手法は,ベースライン法よりもレンダリング品質を保ちながら,平均40%程度のサイズ削減を実現し,最先端の圧縮結果を実現する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:08:59 GMT)
ONION: Physics-Informed Deep Learning Model for Line Integral Diagnostics Across Fusion Devices [21.4] 本稿では,様々なバックボーンネットワークに適用可能な物理インフォームドモデルアーキテクチャを提案する。
このモデルは物理情報を付加的な入力として組み込んでおり、物理インフォームド・ロス関数によって制約される。
物理インフォームド・ロス関数の組み入れにより、モデルの予測を正すことが示されている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:15:23 GMT)
DataVisT5: A Pre-trained Language Model for Jointly Understanding Text and Data Visualization [21.4] データビジュアライゼーション(DV)に適した新しいPLMであるDataVisT5を紹介する。
DVにおけるT5やBERTのようなPLMは、クロスモーダル情報を扱う上での高コストと課題によって制限されている。
公開データセットの大規模な評価は、DataVisT5がさまざまなDV関連タスクにおける現在の最先端モデルよりも一貫して優れていることを示している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:42:57 GMT)
Single-cell Curriculum Learning-based Deep Graph Embedding Clustering [21.3] シングルセル学習に基づく深層グラフ埋め込みクラスタリング(scCLG)を提案する。
まず,3つの最適化目標を組み合わせたマルチ基準(ChebAE)を用いたChebyshevグラフ畳み込みオートエンコーダを提案する。
我々は、ノードの特徴とエントロピーに基づいてGNNを訓練し、困難なノードを訓練するために選択的なトレーニング戦略を採用する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 04:46:17 GMT)
SPTTE: A Spatiotemporal Probabilistic Framework for Travel Time Estimation [21.1] 実世界の旅行データは、しばしば時間的に疎外され、不均一に分散される。
SPTTEは、RNNベースの時間的ガウス過程パラメータ化を導入し、スパース観測を規則化し、時間的依存関係をキャプチャする。
実世界のデータセットの評価によると、SPTTEは最先端の確率的手法を10.13%以上上回っている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:28:54 GMT)
DiffMesh: A Motion-aware Diffusion Framework for Human Mesh Recovery from Videos [20.9] ヒューマンメッシュリカバリ(Human Mesh recovery, HMR)は、さまざまな現実世界のアプリケーションに対して、リッチな人体情報を提供する。
ビデオベースのアプローチはこの問題を緩和するために時間的情報を活用する。
DiffMeshはビデオベースのHMRのための革新的な動き認識型拡散型フレームワークである。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 21:05:33 GMT)
A Suite for Acoustic Language Model Evaluation [20.8] SALMonは、背景雑音、感情、話者識別、室内インパルス応答を含む新しい評価スイートである。
SALMon 上で複数の言語モデルを評価し,評価手法の長所と短所を強調した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:24:57 GMT)
Neutralizing Backdoors through Information Conflicts for Large Language Models [20.6] 大規模言語モデル(LLM)からバックドアの挙動を除去する新しい手法を提案する。
軽量なデータセットを使用してコンフリクトモデルをトレーニングし、バックドアモデルとマージして悪意のある振る舞いを中和します。
我々は、90%以上のクリーンデータ精度を維持しながら、高度なバックドア攻撃の攻撃成功率を最大98%削減することができる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:15:22 GMT)
Aligning Knowledge Concepts to Whole Slide Images for Precise Histopathology Image Analysis [20.5] 本稿では,このギャップを埋めるためにConcepPathという知識概念に基づくMILフレームワークを提案する。
肺癌サブタイピング,乳癌HER2スコアリング,胃癌免疫療法感受性サブタイピングの応用において,ConcepPathは従来のSOTA法よりも有意に優れていた。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:27:52 GMT)
Towards Cross-device and Training-free Robotic Grasping in 3D Open World [20.4] 本稿では,オープンワールドシナリオにおいて,学習を必要とせずにオブジェクト把握タスクを実行できる新しいパイプラインを提案する。
本稿では,セグメンテーション精度を向上し,未確認オブジェクトをクラスタ化およびローカライズする機能を有する,学習不要なバイナリクラスタリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:23:28 GMT)
AToM: Aligning Text-to-Motion Model at Event-Level with GPT-4Vision Reward [20.2] AToMは、GPT-4Visionの報酬を利用して生成された動きとテキストプロンプトのアライメントを強化するフレームワークである。
AToMは、テキスト・ツー・モーション生成のイベントレベルのアライメント品質を著しく改善する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:32:18 GMT)
Towards Black-Box Membership Inference Attack for Diffusion Models [20.2] 本稿では,イメージ・ツー・イメージ・バラツキAPIのみを用いた新たなメンバシップ推論攻撃手法を提案する。
私たちのアプローチでは、サンプルがトレーニングセットの一部であったかどうかを分類することができます。
実験結果は従来手法より一貫して優れていた。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:48:21 GMT)
GSE: Group-wise Sparse and Explainable Adversarial Attacks [20.1] スパース敵は、最小ピクセルの摂動によって、愚かなディープニューラルネットワーク(DNN)を攻撃します。
近年の取り組みは、この標準を核グループノルムのようなスパーシティ正則化器に置き換えて、グループワイドの敵攻撃を作らせている。
本稿では,意味的意味のある画像内のグループワイドアタックを生成する2相アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:46:34 GMT)
Curriculum Demonstration Selection for In-Context Learning [20.0] 大規模言語モデル(LLM)は、いくつかのデモでコンテキスト内での学習能力を強く示している。
ICLの新しい実証方法であるCDS(Curriculum Demonstration Selection)を提案する。
CDSは単に類似性を使用するのではなく、複雑さの測定によってサンプルを分割する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:16:41 GMT)
XR-MBT: Multi-modal Full Body Tracking for XR through Self-Supervision with Learned Depth Point Cloud Registration [19.9] XR-MBTはXRの脚を初めて追跡するが、部分的な身体追跡に基づく従来の合成アプローチは盲目である。
本稿では,現在の3点運動合成モデルがどのようにして雲のモーダル性に拡張できるかを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:25:32 GMT)
BAHOP: Similarity-based Basin Hopping for A fast hyper-parameter search in WSI classification [19.8] 領域外データに対する推論性能を向上させるために,高速パラメータチューニングのための新しい類似性ベースの流域ホッピング最適化であるBAHOPを提案する。
提案したBAHOPは,平均5ドル以上の精度で,5%から30%の精度向上を実現している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:19:33 GMT)
MM-SEAL: A Large-scale Video Dataset of Multi-person Multi-grained Spatio-temporally Action Localization [19.7] マルチパーソン・複雑なアクティビティ・ローカライゼーションのための新しいベンチマークを最初に提案する。
我々は、制限された原子の作用が多くの複雑な活動に組み合わされることを観察する。
MM-SEALは、アトミックアクションと複雑なアクティビティアノテーションの両方を提供し、172のアクションカテゴリにまたがる111.7kのアトミックアクションと、200のアクティビティカテゴリにまたがる17.7kの複雑なアクティビティを生成する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 06:14:47 GMT)
Lifting Motion to the 3D World via 2D Diffusion [19.6] トレーニング用に2次元ポーズシーケンスのみを用いてグローバルな3次元動作を予測する新しいアプローチであるMVLiftを紹介する。
MVLiftは、人間のポーズ、人間とオブジェクトの相互作用、動物のポーズなど、さまざまな領域を一般化する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 23:26:56 GMT)
Harnessing Large Language Models for Seed Generation in Greybox Fuzzing [19.6] 本稿では、Large Language Modelsを活用して、インテリジェントなシード生成によるファジィ化を促進する新しいシステムであるSeedMindを紹介する。
従来のアプローチとは異なり、SeedMindはテストケースを直接生成するのではなく、LLMを使用してテストケースジェネレータを生成する。
SeedMindの開発では、入力フォーマットの制限、コンテキストウィンドウの制約、一貫性のある進捗対応動作の確保など、重要な課題に対処しました。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:44:41 GMT)
PhyCAGE: Physically Plausible Compositional 3D Asset Generation from a Single Image [19.6] 本稿では,PhyCAGEについて述べる。PhyCAGEは1枚の画像から物理的に妥当な合成3Dアセット生成のための最初のアプローチである。
提案手法は,1枚の画像から物理的に妥当な合成3Dアセットを生成することができる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:50:35 GMT)
Applications of Spiking Neural Networks in Visual Place Recognition [19.6] スパイキングニューラルネットワーク(SNN)は、その潜在的なエネルギー効率と低レイテンシについて、ますます認識されている。
本稿では,視覚的位置認識(VPR)におけるSNNの3つの進歩について述べる。
まず,各SNNが重複しない地理的に異なる場所の集合を表すモジュールSNNを提案する。
次に、複数のネットワークが同じ場所を表すモジュールSNNのアンサンブルを示す。
最後に,SNNに基づくVPRにおけるシーケンスマッチングの役割について検討する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 06:53:21 GMT)
ChroKnowledge: Unveiling Chronological Knowledge of Language Models in Multiple Domains [19.4] 大規模言語モデル(LLM)は、私たちの生活の多くの側面に大きな変化をもたらしました。
既存のアプローチは、知識の時間的適応性に対処するのに不足している。
LLMの非パラメトリック時系列知識を評価するための新しいサンプリングベースフレームワークであるChroKnowledgeを紹介する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:11:00 GMT)
InfiniDreamer: Arbitrarily Long Human Motion Generation via Segment Score Distillation [19.3] 我々は、任意に長い人間の動きを生成するための新しい枠組みを提案する。
InfiniDreamerは、各テキスト記述に対応するサブモーションを生成する。
次に、ランダムな遷移セグメントを用いて、それらを粗い拡張シーケンスに組み立てる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:51:02 GMT)
Playing Language Game with LLMs Leads to Jailbreaking [18.6] ミスマッチした言語ゲームとカスタム言語ゲームに基づく2つの新しいジェイルブレイク手法を導入する。
GPT-4oでは93%, GPT-4o-miniでは89%, Claude-3.5-Sonnetでは83%であった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:41:35 GMT)
Wearable intelligent throat enables natural speech in stroke patients with dysarthria [18.1] ウェアラブル型サイレント音声システムは, 音声障害患者のコミュニケーション回復に有意な可能性を秘めている。
喉の筋肉振動と頸動脈パルス信号センサを統合したAI駆動型インテリジェント喉(IT)システムを提案する。
変形性脳症の脳卒中患者5名を対象に、ITのLLMエージェントはトークンエラーをインテリジェントに修正し、文レベルの感情的および論理的一貫性を充実させた。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:03:52 GMT)
SharpDepth: Sharpening Metric Depth Predictions Using Diffusion Distillation [17.9] SharpDepthは、識別深度推定法の計量精度と、生成法によって通常達成されるきめ細かい境界シャープネスを組み合わせている。
我々の手法は、距離精度と詳細な境界保存を統合することでこれらの制限を橋渡しし、計量的精度と視覚的シャープさの両方の深さ予測をもたらす。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:07:27 GMT)
Structured light with a million light planes per second [17.6] フルフレームの深度を毎秒1,000フレームの速度でキャプチャする構造化光システムを導入する。
重要なイノベーションは、光平面を毎秒200万の速度でスキャンできる光学式光走査デバイスの設計だ。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:44:23 GMT)
Pushing the Limits of LLM Inference via 2-Bit Layer-Discriminative KV Cache [17.6] Mini KVは、KVキャッシュサイズを大幅に削減しつつ、長時間のコンテキストタスクの精度を同時に保持するKVキャッシュ最適化手法である。
我々は,Mini KVが86%のKVキャッシュ圧縮比を実現し,98.5%以上の精度を回復し,最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 06:10:49 GMT)
SALMONN-omni: A Codec-free LLM for Full-duplex Speech Understanding and Generation [17.6] SALMON-Omni(サルモン・オムニ)は、発話中に発声した音声を同時に聴くことができる音声理解・生成モデルである。
SALMON-Omniは、ターンテイキング、バージイン、エコーキャンセルのシナリオの管理に長けており、完全な対話型AIシステムの堅牢なプロトタイプとしての可能性を確立している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:38:57 GMT)
Privacy-preserving Robotic-based Multi-factor Authentication Scheme for Secure Automated Delivery System [17.5] パッケージデリバリーは、様々な産業において重要な側面であるが、人的資源のみに依存している場合、高コストと非効率を伴うことが多い。
ラストマイル輸送問題は、大企業の人的資源の支出に大きく貢献する。
ロボットベースの配送システムは、この課題に対処するために、ラストマイル配送の潜在的な解決策として登場した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:48:00 GMT)
RL for Mitigating Cascading Failures: Targeted Exploration via Sensitivity Factors [17.4] 電力網の弾力性と気候変動は互いに強く影響している。
本稿では,グリッドのレジリエンスを高めるための物理インフォームド機械学習ベースのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 04:34:31 GMT)
Creativity in AI: Progresses and Challenges [17.0] 我々は,AIシステムの創造的能力について研究し,創造的な問題解決,言語的,芸術的,科学的創造性に注目した。
我々のレビューは、最新のAIモデルは言語的にも芸術的にも創造的なアウトプットを生成できるが、創造的な問題解決を必要とするタスクに苦労していることを示唆している。
プロセス駆動型で創造性のいくつかの側面を考慮した、包括的な創造性評価の必要性を強調します。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:22:29 GMT)
Benchmarking Uncertainty Disentanglement: Specialized Uncertainties for Specialized Tasks [17.0] 我々は、ImageNet上で、包括的不確実性推定器を再実装し、評価する。
最近の理論的な試みにも拘わらず、既存のアプローチでは実際には非絡み合う不確実性推定器のペアを提供していない。
本結果は,特定のタスクに使用する不確実性推定器の実践的アドバイスと,タスク中心および不整合不確実性に対する今後の研究の機会を明らかにするものである。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:54:22 GMT)
Breathless: An 8-hour Performance Contrasting Human and Robot Expressiveness [16.7] 本稿では,人間のダンサーと産業用ロボットアームを組み合わせたオリジナルパフォーマンスを支えるロボット技術について述べる。
ロボットアームを制御するために, 各種の正弦波運動と各関節の振幅, 周波数, オフセットを組み合わせ, 身体労働に共通する人間の動作を誘発する。
ビデオに基づく人的対象追跡と抽出のための深層学習技術を用いて、さらなる動きが開発された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:14:56 GMT)
LAGUNA: LAnguage Guided UNsupervised Adaptation with structured spaces [16.6] LAGUNA - LANguage Guided UNsupervised Adaptation with structured spaceを紹介する。
LAGUNAは言語空間におけるクラスラベル間の意味的・幾何学的関係に基づいてドメインに依存しない構造を定義する。
LAGUNAが4つの画像とビデオデータセットにまたがるドメイン適応タスクにおいて優れていることを実証的に示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:01:33 GMT)
ChatRex: Taming Multimodal LLM for Joint Perception and Understanding [16.5] 認識設計を分離したMLLMであるChatRexを紹介する。
データの観点からは、完全に自動化されたデータエンジンを構築します。
ChatRexはマルチモーダル理解性能を維持しながら、強い知覚能力を示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:11:10 GMT)
An End-to-End Robust Point Cloud Semantic Segmentation Network with Single-Step Conditional Diffusion Models [16.4] 既存の条件付き拡散確率モデル (DDPM) とノイズ・コンディション・フレームワーク (NCF) は, 3次元シーン理解作業において依然として困難である。
我々は、DtextbfDPMsのtextbfConditional-Noise Framework(CNF)に基づく、エンドツーエンドのロバストなtextbfSegmentation textbfNetを提案する。
CNFのおかげで、CDSegNetはnonのような単一ステップ推論でセマンティックラベルを生成することができる
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:20:56 GMT)
The belief in Moore's Law is undermining ICT climate action [16.3] The True Cost of ICT: From Materiality to Techno-Solutionism (TCICT) は、スウェーデンのストックホルムで2024年に開催されたICT for Sustainability(ICT4S)カンファレンスで開かれたワークショップである。
我々は、ICTの効率とエネルギー利用という観点からではなく、システムとしてのICTの影響に対処することの重要性を指摘する。
我々は、半導体産業の交叉気候の影響とそれが具現化するテクノ・ソリューション主義に対処するために、同心的で批判的な同僚のコミュニティを構築することを呼びかけて締めくくります。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:46:56 GMT)
Evaluating and Improving the Effectiveness of Synthetic Chest X-Rays for Medical Image Analysis [16.3] 下流タスクのための合成胸部X線画像を生成するベストプラクティスは、単一放出ラベルの条件付けや、幾何学的に変換されたセグメンテーションマスクである。
提案手法は, プロキシモデルを用いたり, ラジオロジカルフィードバックを用いた合成データの質を向上させる手法である。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:47:09 GMT)
Privacy-Aware Visual Language Models [16.3] 本稿では,プライバシに敏感な情報を扱うVisual Language Modelの理解を深めることを目的としている。
パスポートや指紋などの8つの機密カテゴリの画像を含む新しいベンチマークであるPrivBenchを導入する。
このベンチマークで10の最先端のVLMを評価し、一般的にはプライバシの理解が限定されていることを観察し、モデル改善のための重要な領域を強調した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:39:01 GMT)
GLS: Geometry-aware 3D Language Gaussian Splatting [16.1] 本稿では3DGSに基づく表面再構成と開語彙セグメンテーションの統一的な枠組みを提案する。
室内表面の再構成では,表面の正規化を幾何学的キューとして導入し,通常の誤差を用いて描画深度を最適化する。
オープンボキャブラリセグメンテーションには2D CLIP機能を使用し、インスタンス機能をガイドし、DEVAマスクを使用してビューの一貫性を向上させる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:21:34 GMT)
Streamlining Prediction in Bayesian Deep Learning [16.1] 本研究は, サンプリング不要な単一前方通過によるBDLの合理化予測について検討する。
我々は、後続の予測分布に対する近似を解析的に計算する。
本稿では,ViT や GPT-2 などのトランスフォーマーにアプローチを示し,その性能を回帰および分類タスクで評価する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:07:44 GMT)
Leveraging A New GAN-based Transformer with ECDH Crypto-system for Enhancing Energy Theft Detection in Smart Grid [16.0] 分割学習は、エネルギー盗難を特定するための有望な機械学習技術である。
従来の分割学習アプローチは、プライバシー漏洩攻撃に弱い。
本稿では, GAN-Transformer を用いた分割学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:41:38 GMT)
Semantic Security with Unreliable Entanglement Assistance: Interception and Loss [16.0] 信頼できない絡み合い支援のための2つのモデルを検討する。
最初のモデルでは、Eveは絡み合うリソースをインターセプトすることができる。
第2のモデルでは、イヴは受動的であり、リソースは彼女の手の届かない環境に散逸する可能性がある。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:16:54 GMT)
Linear quadratic control of nonlinear systems with Koopman operator learning and the Nyström method [16.0] 計算量を大幅に削減するために,ランダムな部分空間をどのように利用できるかを示す。
我々の主な技術的貢献は、Nystr"om近似の効果に関する理論的保証を導出することである。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:04:53 GMT)
FASIONAD : FAst and Slow FusION Thinking Systems for Human-Like Autonomous Driving with Adaptive Feedback [15.8] 本稿では,認知モデル "Thinking, Fast and Slow" に触発された新しいデュアルシステムフレームワークであるFASIONADを提案する。
高速システムは、高速でデータ駆動の経路計画を使用してルーチンナビゲーションタスクを処理し、遅いシステムは、困難な状況や不慣れな状況における複雑な推論と意思決定に重点を置いている。
高速システムによって生成された視覚的プロンプトは、低速システムにおける人間のような推論を可能にし、高速システムの意思決定を強化するための高品質なフィードバックを提供する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:14:16 GMT)
Energy-Efficient Split Learning for Fine-Tuning Large Language Models in Edge Networks [15.7] 大規模言語モデル(LLM)を微調整するためのエネルギー効率の高い分割学習フレームワークを提案する。
エッジネットワークにおけるデバイスの不均一性とチャネルダイナミクスを考慮すると、トレーニング遅延とエネルギー消費を最小限に抑えるために、Cut lAyer and Computing Resource Decision (CARD)アルゴリズムが開発された。
シミュレーションの結果、提案手法は、ベンチマークと比較すると、平均トレーニング遅延とサーバのエネルギー消費を70.8%、53.1%削減することを示した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:34:45 GMT)
Learning to Project for Cross-Task Knowledge Distillation [15.6] クロスタスク蒸留は使用でき、異なるタスクで訓練された教師モデルを使用することができる。
多くのKD法は、このクロスタスク設定に適用しても効果がないことを証明している。
この標準プロジェクタのドロップイン置換は,タスク固有の機能を無視して学習することで有効であることを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:12:42 GMT)
DualCast: Disentangling Aperiodic Events from Traffic Series with a Dual-Branch Model [15.5] 最先端のソリューションは、トレーニングデータの平均予測エラーを最小限にして、マシンラーニングモデルをトレーニングする。
トレーニングされたモデルは、予測結果において、周期的なイベントではなく、周期的なイベントを好むことが多い。
本稿では,交通予測モデルの学習能力を高めるためにDualCastを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:17:50 GMT)
Formal Verification of Digital Twins with TLA and Information Leakage Control [15.4] デジタルツイン検証は、仮想表現、物理的環境、および物理と仮想の間の情報の双方向の流れの不確実性のために困難である。
本稿では,不確実なプロセスを形式的に検証可能な有限状態機械に変換することによって,ディジタル双対動作の特定と検証を行う手法を提案する。
本研究では,無人航空機のディジタル双対に対して,物理的・仮想的・仮想的データフローの同期を検証し,意図しない誤認識を検出する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 22:52:36 GMT)
ModeDreamer: Mode Guiding Score Distillation for Text-to-3D Generation using Reference Image Prompts [15.3] ISDと呼ばれる画像プロンプトスコアの蒸留損失を導入し、参照画像を用いてテキストから3Dへの直接最適化を行う。
本実験は, 従来のテキスト・ツー・3D手法と比較して, 視覚的コヒーレントで高品質な出力を実現し, 最適化速度を向上することを示した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:33:42 GMT)
Foundation Models in Radiology: What, How, When, Why and Why Not [15.3] 人工知能の最近の進歩は、テキストデータと画像データの両方を解釈、生成できる大規模ディープラーニングモデルの出現を目撃している。
ファウンデーションモデルは近年、学術、産業、規制機関から大きな注目を集めている。
本論は,基礎モデルに関する標準化された用語を確立することを目的としている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 20:13:01 GMT)
WF-VAE: Enhancing Video VAE by Wavelet-Driven Energy Flow for Latent Video Diffusion Model [15.2] ビデオ変分オートエンコーダ(VAE)は、ビデオを低次元の潜在空間にエンコードする。
VAEは、ほとんどの遅延ビデオ拡散モデル(LVDM)のキーコンポーネントである
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:21:47 GMT)
Self-Training Meets Consistency: Improving LLMs' Reasoning With Consistency-Driven Rationale Evaluation [15.1] 大規模言語モデル(LLM)の自己学習アプローチは、自己生成的理性に基づいてモデルをトレーニングすることで推論能力を向上させる。
これまでのアプローチでは、与えられた質問に対する正しい答えをトレーニングに適するように、合理的にラベル付けしてきた。
CREST(Consistency-driven Rationale Evaluation for Self-Training)は,フォローアップ質問を通じて各根拠を更に評価する自己学習フレームワークである。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:25:02 GMT)
A First Look at GPT Apps: Landscape and Vulnerability [14.9] 本研究は,2つのGPTアプリストアである textitGPTStore.AI と公式 textitOpenAI GPT Store に焦点を当てた。
具体的には、2つの自動ツールとTriLevel構成抽出戦略を開発し、これら2つのストアにまたがる全GPTアプリのメタデータを効率的に収集する。
1) GPTアプリのユーザへの熱意は一貫して上昇し, 2) GPTアプリのローンチから3ヶ月以内にクリエーターの関心高原が増加し, (2) GPTアプリの構成が不安定なため,システムプロンプトの90%近くが容易にアクセス可能である。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:26:34 GMT)
Cross-modal Information Flow in Multimodal Large Language Models [14.9] 大規模言語モデルにおいて,言語と視覚の異なるモダリティ間の情報フローについて検討する。
2つのモダリティを統合する過程には2つの異なる段階があることが分かる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:59:26 GMT)
Prediction with Action: Visual Policy Learning via Joint Denoising Process [14.6] PADは、画像予測とロボットアクションを統合する視覚ポリシー学習フレームワークである。
DiTは画像とロボット状態をシームレスに統合し、将来の画像とロボット動作の同時予測を可能にする。
Padは従来の手法よりも優れており、Metaworldのベンチマークで26.3%の大幅な改善を実現している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:54:58 GMT)
Mixture of Cache-Conditional Experts for Efficient Mobile Device Inference [14.6] 本稿では,トークン生成時に専門家の再利用を活用し,キャッシュの局所性を改善する新しいキャッシュ対応ルーティング戦略を提案する。
モバイルデバイス上での2$times$のスピードアップを実演する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:59:48 GMT)
Multi-Task Learning for Integrated Automated Contouring and Voxel-Based Dose Prediction in Radiotherapy [14.5] 従来の放射線治療計画プロセスでは、個別のタスクとして自動コントゥーリングと治療計画がある。
本研究では,マルチタスク学習(MTL)アプローチを適用し,自動コントゥーリングとボクセルベースの線量予測タスクをシームレスに統合する。
自動コントゥーリングおよび線量予測タスクのためのMTLモデルは、コントゥーリング精度を維持しつつ、時には改善した線量予測性能を示した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 21:45:03 GMT)
KAN See Your Face [14.3] 我々は,コルモゴロフ・アルノルドネットワーク(KAN)を顔への埋め込み攻撃に利用するための最初のアプローチを紹介する。
FEMモデルは初期領域と対象領域からの埋め込みの分布マッピング関係を学習するために提案される。
マルチ層パーセプトロン (MLP) と比較して, 効率的な非線形埋め込み-埋め込みマッピングのために, FEM-KAN と FEM-MLP の2つの変種を提供する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:21:42 GMT)
Multiple Choice Learning for Efficient Speech Separation with Many Speakers [14.3] 教師付き設定における音声分離モデルの訓練は、置換問題を提起する。
我々は、もともとあいまいなタスクに取り組むために導入されたMultiple Choice Learningフレームワークについて検討する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:38:34 GMT)
RelCon: Relative Contrastive Learning for a Motion Foundation Model for Wearable Data [14.1] RelConは、新しい教師付きテキストitRelative textitContrastive Learningアプローチである。
学習可能な距離測定は、モチーフの類似性とドメイン固有の意味情報をキャプチャする。
自己教師型モデルは、大規模なウェアラブルデータセットから87,376人の参加者から10億のセグメントでトレーニングされている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 23:51:53 GMT)
G-Designer: Architecting Multi-agent Communication Topologies via Graph Neural Networks [14.0] G-Designerは,マルチエージェントデプロイメントのための適応的,効率的,堅牢なソリューションである。
G-Designerはタスク対応、カスタマイズされた通信トポロジを動的に設計する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:03:27 GMT)
On Designing Effective RL Reward at Training Time for LLM Reasoning [14.0] 我々は,Reward Model(ORM)やProcess-supervised Reward Model(PRM)など,RLトレーニングの一般的な報酬モデルを評価する。
驚くべきことに、これらの学習された報酬モデルは推論時のパフォーマンスが強いにもかかわらず、RLトレーニングを助けたり、傷つけたりしないかもしれない。
Clipping と Delta の2つの新しい報酬改善手法を紹介した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:58:50 GMT)
SuperFusion: Multilevel LiDAR-Camera Fusion for Long-Range HD Map Generation [13.8] 我々は,複数のレベルでLiDARとカメラデータの融合を利用したSuperFusionという新しいネットワークを提案する。
我々は、nuScenesデータセットと自己記録データセットでSuperFusionをベンチマークし、最先端のベースライン手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:49:25 GMT)
Regularized Multi-LLMs Collaboration for Enhanced Score-based Causal Discovery [13.7] 我々は,大言語モデル(LLM)を用いて因果発見アプローチを強化する可能性を探る。
本稿では,1つのLLMだけでなく複数のLLMのキャパシティを活用して発見プロセスを増強する汎用フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 01:56:21 GMT)
An End-to-End Two-Stream Network Based on RGB Flow and Representation Flow for Human Action Recognition [13.7] 我々は,エゴセントリックな行動認識モデルにおいて,光フロー分岐の代わりに表現フローを導入する。
自己中心型行動認識のためのモデルでは,クラスアクティベーションマップ(CAM)を用いて精度を向上し,空間的注意を伴う時間符号化のためのConvLSTMを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:46:46 GMT)
Evaluating Vision-Language Models as Evaluators in Path Planning [13.4] 大規模言語モデル(LLM)は、エンド・ツー・エンド・プランニングにおいて限定的な有効性を持つことが示されている。
本稿では,複雑な経路計画シナリオにおける計画評価器としてVLMを評価する新しいベンチマークであるPathEvalを紹介する。
分析の結果,これらのモデルがベンチマークにおいて重大な課題に直面していることが明らかとなった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:32:03 GMT)
Demonstrating a universal logical gate set in error-detecting surface codes on a superconducting quantum processor [13.4] 超伝導量子プロセッサWuitkongを用いて,距離2の表面コード上に任意の1量子ビット回転ゲートを持つ論理CNOTゲートを実験的に実装した。
我々は論理的ベル状態のフォールトトレラントな準備とCHSH不等式違反の観察を行い、論理的量子ビット間の絡み合いを確認した。
普遍論理ゲートセットと絡み合った論理状態のデモンストレーションは、超伝導量子プロセッサにおけるFTQCの重要な側面を強調している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:59:30 GMT)
PRSI: Privacy-Preserving Recommendation Model Based on Vector Splitting and Interactive Protocols [13.4] 本稿では,新しいプライバシ保護レコメンデーションシステム(PRSI)を提案する。
1)インタラクション情報の収集,(2)レコメンデーション結果の送信である。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:14:15 GMT)
SpotLight: Shadow-Guided Object Relighting via Diffusion [13.2] オブジェクトの所望の影を指定するだけで、オブジェクトの照準を正確に制御できることを示す。
我々の手法であるSpotLightは、既存のニューラルレンダリングアプローチと制御可能なリライト結果を活用する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:06:08 GMT)
CLUE-MARK: Watermarking Diffusion Models using CLWE [13.0] 本稿では,拡散モデルに対する最初の検出不能な透かし方式であるCLUE-Markを紹介する。
CLUE-Markは、ウォーターマークされたモデルの変更を一切必要とせず、計算効率が良く、モデル出力の品質に影響を与えないことが保証されている。
CLUE-Markは、最近のステガノグラフィー攻撃では検出や除去ができない。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:57:02 GMT)
MM-Path: Multi-modal, Multi-granularity Path Representation Learning -- Extended Version [12.9] マルチモーダル・マルチグラニュラリティパス表現学習フレームワーク(MM-Path)を提案する。
MM-Pathは道路経路と画像経路の両方からモダリティを統合することで、一般的な経路表現を学習することができる。
提案するMM-Pathの有効性を検証するために,2つの大規模実世界のタスクについて実験を行った。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:10:22 GMT)
Local Map Construction with SDMap: A Comprehensive Survey [12.8] 本稿では,SDMap を用いたローカルマップ構築手法について概説する。
また、SDMapベースのローカルマップ構築において、マルチモーダルデータ表現と融合法を解析する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:09:55 GMT)
A gentle push funziona benissimo: making instructed models in Italian via contrastive activation steering [12.8] イタリアのステアリングが様々なモデルに適用可能であることを示す。
イタリアのステアリングは、イタリアの微調整モデルに匹敵する、あるいはそれ以上に優れたパフォーマンスを達成していることを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:38:09 GMT)
Quantum Advantage via Solving Multivariate Quadratics [12.6] p_i(x_n)=y_i_iin [m]$ over $mathbbF$。
解は高い確率で存在するが、古典的暗号解析に基づく解を見つけることは困難である。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 22:29:46 GMT)
Towards More Accurate US Presidential Election via Multi-step Reasoning with Large Language Models [12.6] 選挙予測は、限られた有権者レベルのデータ、急速に変化する政治情勢、複雑な人間の振る舞いをモデル化する必要性など、ユニークな課題を生んでいる。
政治分析のための多段階推論フレームワークを提案する。
われわれのアプローチは、2016年と2020年のアメリカ大統領選挙研究(ANES)の実際のデータに基づいて検証されている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:05:31 GMT)
Empowering ChatGPT-Like Large-Scale Language Models with Local Knowledge Base for Industrial Prognostics and Health Management [12.4] ChatGPTのような大規模言語モデル(LLM)は、AI分野における新たなイノベーションのラウンドをリードし始めている。
ChatGPTのようなLLMには豊富な知識と強力な言語理解と生成能力があるが、ドメイン固有の専門知識は欠如している。
本研究は,産業用PHMにおける局所知識ベース(LKB)によって付与されるChatGPT-like LLMを用いて,上記の制限を解決することを目的とする。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:43:20 GMT)
Preserving Deep Representations In One-Shot Pruning: A Hessian-Free Second-Order Optimization Framework [12.3] SNOWSは、再トレーニングをせずに視覚ネットワーク推論のコストを削減することを目的とした、一発の訓練後プルーニングフレームワークである。
我々のフレームワークの重要な革新は、完全にヘッセン行列を計算したり保存したりすることなく、ヘッセン自由最適化を用いてニュートン降下ステップを正確に計算することである。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:25:00 GMT)
CanFields: Consolidating 4D Dynamic Shapes from Raw Scans [12.2] CanFields (Canonical Consolidation Fields, CanFields) は、独立に捕獲された3Dスキャンの時系列を単一のコヒーレントな変形形状に再構成する新しい手法である。
CanFieldsは、2つの幾何学的前提を組み込むことで、教師なしの方法で幾何学と変形を効果的に学習する。
各種生スキャンにおけるCanFieldsのロバスト性と精度を検証し,欠落した領域,スパースフレーム,ノイズにおいても優れた性能を示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:14:05 GMT)
Explainable deep learning improves human mental models of self-driving cars [12.2] 概念ラッパーネットワーク (concept-wrapper network, CW-Net) は、ブラックボックス運動プランナーの動作を説明する手法である。
我々は、実際の自動運転車にCW-Netをデプロイし、その結果の説明が人間の運転者の精神モデルを洗練させることを示す。
我々は,自律型ドローンやロボット外科医など,ループ内に人間がいる他の安全クリティカルシステムに適用できることを期待している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:38:43 GMT)
Leveraging Semantic Asymmetry for Precise Gross Tumor Volume Segmentation of Nasopharyngeal Carcinoma in Planning CT [12.2] 鼻咽喉頭癌(NPC)の放射線治療では,非コントラスト計画CTを用いてGTV(Grog tumor volume)を脱線させるのが一般的である。
腫瘍と隣接する正常な組織との間の低コントラストは、放射線腫瘍学者が手動で腫瘍を脱線させる必要がある。
非コントラストプランニングCT画像にNPC細胞性腫瘍を直接分離する手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:28:46 GMT)
Federated Learning with Uncertainty and Personalization via Efficient Second-order Optimization [12.1] フェデレートラーニング(FL)は、異なるクライアントで利用可能な分散データと異種データから協調的に学習するための有望な方法として登場した。
FLに関する最近の研究は、モデルと予測の不確実性を考慮した原則的な方法として、FLに対するベイズ的アプローチを提唱している。
本稿では,効率の良い2階最適化手法を用いた新しいベイズFL法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:30:02 GMT)
A Flexible Defense Against the Winner's Curse [12.0] 最高の候補者をチェリーピッキングすると、勝者の呪いに繋がる。
ズーム補正(英語版)は、勝者に対する有効な推論のための新しいアプローチである。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:14:08 GMT)
BIP3D: Bridging 2D Images and 3D Perception for Embodied Intelligence [11.9] 画像中心の3次元知覚モデルBIP3Dを導入し,点中心の手法の限界を克服する。
我々は、事前学習された2次元視覚基盤モデルを利用して意味理解を強化し、空間理解を改善するために空間拡張モジュールを導入する。
我々の実験では、BIP3Dは、EmbodiedScanベンチマークで現在の最先端結果より優れており、3D検出タスクでは5.69%、視覚的グラウンドタスクでは15.25%の改善が達成されている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:31:05 GMT)
Pathways on the Image Manifold: Image Editing via Video Generation [11.9] 我々は、事前訓練されたビデオモデルを用いて、画像編集を時間的プロセスとして再構成し、元の画像から所望の編集へのスムーズな遷移を生成する。
提案手法は,テキストベースの画像編集における最先端の成果を達成し,編集精度と画像保存の両面で有意な改善を示した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:59:06 GMT)
PersonaCraft: Personalized Full-Body Image Synthesis for Multiple Identities from Single References Using 3D-Model-Conditioned Diffusion [11.9] PersonaCraftは、拡散モデルと3Dヒューマンモデリングを組み合わせた新しいアプローチである。
本手法は,SMPLx-ControlNetに3次元ポーズ条件を組み込んだオクルージョンを効果的に管理する。
テストは、複数の個人の高品質で現実的なイメージを生成する上で、ペルソナクラフトの優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:41:15 GMT)
STOP: Spatiotemporal Orthogonal Propagation for Weight-Threshold-Leakage Synergistic Training of Deep Spiking Neural Networks [11.9] ディープ脳スパイクニューラルネットワーク(SNN)モデルは、効率的で高精度なディープSNN学習アルゴリズムを欠いている。
我々のアルゴリズムは、SNNの精度を向上させるために、完全なシナジスティック学習と、スパイキングニューロンのしきい値や漏れ要因の発射を可能にする。
特徴的に、空間的に後ろ向きの神経の誤りと時間的前向きのトレースは互いに独立して伝播し、計算の複雑さを著しく減少させる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:49:49 GMT)
Exponential Moving Average of Weights in Deep Learning: Dynamics and Benefits [11.8] 重量の指数移動平均(EMA)について系統的研究を行った。
EMA ソリューションは最終項目のソリューションと異なることを示す。
重みのEMAは、深層学習モデルの性能を向上させるためのシンプルで効果的なプラグインであることが示唆された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:14:27 GMT)
A Method for Building Large Language Models with Predefined KV Cache Capacity [11.7] 境界キャッシュ変換器(BCT)は、従来のKVキャッシュの過剰なメモリ消費問題に対処する。
キー値ベクトル列を動的に更新することにより、BCTは限られたキャッシュ容量内で効率的な推論を実現する。
実験の結果,BCTは推論品質を維持しながらメモリ使用量を大幅に削減することがわかった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:07:20 GMT)
Conti-Fuse: A Novel Continuous Decomposition-based Fusion Framework for Infrared and Visible Images [11.5] モーダル間および内部モーダル関係のための連続分解に基づく融合フレームワーク(Conti-Fuse)を提案する。
提案したConti-Fuseは,最先端の融合法よりも優れた性能を実現する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:18:12 GMT)
FIAS: Feature Imbalance-Aware Medical Image Segmentation with Dynamic Fusion and Mixing Attention [11.4] 畳み込みニューラルネットワーク(CNN)とトランスフォーマーを組み合わせたハイブリッドアーキテクチャは、医療画像セグメンテーションにおける競争力を示している。
本稿では、デュアルパスエンコーダとMixAtt(MixAtt)デコーダを組み込んだフェール・インバランス・アウェア(FIAS)ネットワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:33:44 GMT)
Enabling Adoption of Regenerative Agriculture through Soil Carbon Copilots [11.4] 我々は、土壌の健康と再生の実践に関する洞察を提供するために、AI駆動の土壌有機炭素コパイロットを導入する。
私たちのデータには、極端な気象イベントデータ、ファームマネジメントデータ、SOC予測が含まれています。
カリフォルニア郡全体で農業の実践を比較すると、多様な農業活動が耕作の悪影響を緩和する証拠が見つかる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 06:25:09 GMT)
J-Invariant Volume Shuffle for Self-Supervised Cryo-Electron Tomogram Denoising on Single Noisy Volume [11.2] Cryo-Electron Tomography (Cryo-ET) は、近ネイティブ状態における細胞構造の詳細な3次元可視化を可能にする。
Cryo-ETは画像の制約により信号対雑音比が低い。
本稿では,Cryo-ETボリュームの画像を1つのノイズボリュームで表現する,新しい自己教師型学習モデルを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 20:45:43 GMT)
Random Walks with Tweedie: A Unified Framework for Diffusion Models [11.2] 本稿では,拡散サンプリングをランダムウォークのシーケンスとして解釈し,生成拡散モデルアルゴリズムを設計するための簡単なテンプレートを提案する。
いくつかの既存の拡散モデルがこのテンプレート内の特定の選択に対応することを示し、他のより単純なアルゴリズム的選択が効果的な拡散モデルをもたらすことを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:13:20 GMT)
Weakly Supervised Framework Considering Multi-temporal Information for Large-scale Cropland Mapping with Satellite Imagery [11.2] 本研究では,大規模農地マッピングのための多時期情報を考慮した弱教師付き枠組みを提案する。
我々は,グローバルランドカバー(GLC)製品間の整合性に応じて高品質なラベルを抽出し,教師付き学習信号を構築する。
提案手法は大規模農地マッピングにおいて,3つの研究領域にまたがる適応性について実験的に検証されている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:11:52 GMT)
3D Scene Graph Guided Vision-Language Pre-training [11.1] 3次元視覚言語推論(VL)は、3次元物理世界を自然言語記述で橋渡しする可能性から注目されている。
既存のアプローチは通常、タスク固有の高度に専門化されたパラダイムに従う。
本稿では,3次元シーングラフ誘導型視覚言語事前学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:10:44 GMT)
Pixel-aligned RGB-NIR Stereo Imaging and Dataset for Robot Vision [11.1] 移動ロボットに搭載されたRGB-NIRステレオカメラとLiDARセンサを備えたロボットビジョンシステムを提案する。
システムは同時に、RGBステレオ画像、NIRステレオ画像、時間同期LiDAR点の画素整列をキャプチャする。
実験により,様々な照明条件におけるRGB-NIR画像の有用性が示された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:44:21 GMT)
A Real-World Benchmark for Evaluating Fine-Grained Issue Solving Capabilities of Large Language Models [11.1] FAUN-Eval は LLM の Fine-grAined issUe solviNg 機能を評価するために特別に設計されたベンチマークである。
30の有名なGitHubリポジトリからキュレートされたデータセットを使って構築されている。
FAUN-Evalでは,4つのクローズドソースモデルと6つのオープンソースモデルを含む10個のLLMを評価した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:25:44 GMT)
A Machine Learning-based Framework towards Assessment of Decision-Makers' Biases [11.0] 人為的意思決定におけるバイアスを評価するための機械学習ベースのフレームワークを提案する。
提案手法が既存の代替手段よりも優れていることを示す理論的保証と実証的証拠を提供する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:02:31 GMT)
An End-to-End Smart Predict-then-Optimize Framework for Vehicle Relocation Problems in Large-Scale Vehicle Crowd Sensing [10.7] 車両システムは、旅行要求やルートの性質により、しばしば偏りのあるカバレッジを示す。
我々は最適化を予測に統合することで、エンドツーエンドのSmart Predict-then-optize (SPO) フレームワークを開発する。
このフレームワークは上流の予測エラーではなく、タスク固有のマッチングによって訓練される。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:16:22 GMT)
AEGIS: An Agent-based Framework for General Bug Reproduction from Issue Descriptions [10.7] gEneral buG reproductIon Scripts 生成フレームワークは AEGIS という名称で、タスクのための最初のエージェントベースのフレームワークである。
AEGISは、Agentlessの相対的な解決率を12.5%向上させることができる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:16:47 GMT)
DiffMVR: Diffusion-based Automated Multi-Guidance Video Restoration [10.6] 拡散型ビデオレベルの塗装モデルDiffMVRを提案する。
提案手法では,動的二重誘導画像プロンプトシステムを導入し,適応参照フレームを利用して塗装プロセスのガイドを行う。
これにより、ビデオフレーム間の微細な詳細と滑らかな遷移の両方をキャプチャし、塗装方向を正確に制御し、難易度の高い動的環境における復元精度を大幅に向上させることができる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 20:43:35 GMT)
Utilizing the Mean Teacher with Supcontrast Loss for Wafer Pattern Recognition [10.6] 我々は、平均教師フレームワークと教師付きコントラスト学習損失を統合した革新的なアプローチを導入し、ウェハマップパターン認識を強化した。
精度,精度,リコール,F1得点の5.46%,6.68%,5.42%,4.53%の改善が得られた。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:24:24 GMT)
Reinforcement Learning Enhancing Entanglement for Two-Photon-Driven Rabi Model [10.6] ラビモデルにおける2光子駆動振幅を変調することにより絡み合いを高める制御方式を提案する。
絡み合いの挙動は相転移を反映し、強化学習剤を用いて制御パルスの時間的シーケンスを生成する。
この研究は、非平衡系の量子資源を正に増強する方法を舗装する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:20:54 GMT)
Robust Offline Reinforcement Learning with Linearly Structured $f$-Divergence Regularization [10.5] 我々は、ロバストな正則化マルコフ決定プロセスのための新しいフレームワーク(d$-RRMDP)を提案する。
オフラインRL設定のために、ロバスト正規化悲観的値イテレーション(R2PVI)と呼ばれるアルゴリズム群を開発する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:57:03 GMT)
On the Effectiveness of Incremental Training of Large Language Models [10.4] 大規模言語モデルにおけるインクリメンタルトレーニングの有効性について検討する。
インクリメンタルなレイヤワイドトレーニングは、大規模な言語モデルのトレーニングに有効な代替にはなり得ないことに気付きました。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:11:49 GMT)
Fall Leaf Adversarial Attack on Traffic Sign Classification [10.4] 適応入力画像摂動攻撃は、機械学習アルゴリズムに対する重大な脅威として浮上している。
この研究は、自然の人工物を利用する新たな種類の敵攻撃を提示する。
道路標識に貼られた落ち葉は、悪意のある人間の攻撃者によって置かれるのではなく、近くの木から来る可能性がある。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 22:02:38 GMT)
RealTraj: Towards Real-World Pedestrian Trajectory Forecasting [10.3] 本稿では,軌道予測の現実的適用性を高める新しいフレームワークであるRealTrajを提案する。
Det2TrajFormerは、過去の検出を入力として、ノイズの追跡に不変な軌道予測モデルである。
従来のトラジェクトリ予測手法とは異なり,本手法では,地平線検出のみを用いてモデルを微調整し,コストのかかる個人IDアノテーションの必要性を著しく低減する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 06:08:02 GMT)
CrowdMAC: Masked Crowd Density Completion for Robust Crowd Density Forecasting [10.3] 群集密度予測タスクは,過去の群集密度マップから今後,群集密度マップがどのように変化するかを予測することを目的としている。
過去の群衆密度マップは、歩行者のミス検出のため、しばしば不完全である。
本稿では,クラウド密度予測(CrowdMAC)のためのMAsked crowd density Completionフレームワークを提案する。
CrowdMACは、部分的に隠された過去の群衆密度マップから、将来の群衆密度マップを予測するために同時に訓練されている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 06:04:20 GMT)
FAMES: Fast Approximate Multiplier Substitution for Mixed-Precision Quantized DNNs--Down to 2 Bits! [10.3] FAMESは混合精度DNNの高速近似乗算器置換法である。
我々の実験は、ビット幅が2ビット以下の最先端の混合精度量子化モデルに対して、平均28.67%のエネルギー削減を実証した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 04:58:10 GMT)
Break the ID-Language Barrier: An Adaption Framework for Sequential Recommendation [10.3] ドメイン固有知識に富んだ事前学習ID埋め込みを,大規模言語モデルに統合するフレームワークであるIDLE-Adapterを提案する。
IDLE-Adapterはブリッジとして機能し、疎いユーザ-イテムインタラクションデータを高密度でLLM互換の表現に変換する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:59:44 GMT)
Pruning Deep Convolutional Neural Network Using Conditional Mutual Information [10.3] 畳み込みニューラルネットワーク(CNN)は、画像分類タスクにおいて高い性能を達成するが、リソース制限ハードウェアへのデプロイは困難である。
本稿では,各層における最も情報性の高い特徴を識別し,選択的に保持するCNNに対して,構造化されたフィルタ解析手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:23:59 GMT)
Type-R: Automatically Retouching Typos for Text-to-Image Generation [10.2] 後処理パイプラインにおける誤ったテキストレンダリングの修正を提案する。
提案手法はType-Rと呼ばれ,生成した画像のタイポグラフィ的誤りを識別し,誤りテキストを消去し,失語のためのテキストボックスを再生し,最後にレンダリングされた単語のタイポスを補正する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:11:45 GMT)
Referential communication in heterogeneous communities of pre-trained visual deep networks [10.1] 大規模なトレーニング済みの画像処理ニューラルネットワークは、自動運転車やロボットのような自律エージェントに組み込まれている。
提案手法は,対象対象物を参照するための共有プロトコルを,自己管理的に開発することができることを示す。
既存のコミュニティには含まれなかったビジュアルネットワークは、驚くほど簡単にコミュニティのプロトコルを学ぶことができる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:54:59 GMT)
Intrinsic Quantum Mpemba Effect in Markovian Systems and Quantum Circuits [10.0] 量子Mpemba効果(QME)は、平衡から遠く離れた系が平衡に近い状態に達する反直観現象を記述している。
本稿では、量子状態によって追跡される軌道長を距離のより適切な尺度として用いた固有量子Mpemba効果(IQME)を提案する。
この研究は、量子状態の進化についての理解を深め、新しい量子力学の振る舞いを正確に捉えるための基礎を築いた。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:00:59 GMT)
SentiXRL: An advanced large language Model Framework for Multilingual Fine-Grained Emotion Classification in Complex Text Environment [10.0] 我々はSentiment Cross-Lingual Recognition and Logic Framework (SentiXRL)を提案する。
SentiXRLには2つのモジュールがあり、感情検索拡張モジュールは、歴史的対話と論理的推論を通じて複雑な文脈における感情分類の精度を向上させる。
我々は、複数の標準データセット上でSentiXRLの優位性を検証し、CPEDおよびCH-SIMSの既存モデルよりも優れており、MELD、Emorynlp、IEMOCAPの全体的な性能向上を実現している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:18:26 GMT)
Differentiable Inverse Rendering with Interpretable Basis BRDFs [9.9] 逆レンダリングは、撮影画像から幾何と空間的に変化するBRDFの両方を再構成しようとする。
本稿では,解釈可能な基底BRDFを生成する微分可能な逆レンダリング手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:22:14 GMT)
PATHS: A Hierarchical Transformer for Efficient Whole Slide Image Analysis [9.9] 計算病理学におけるスライドレベルタスクにおける階層的弱教師付き表現学習のための新しいトップダウン手法を提案する。
PATHSは、人間の病理医がスライドを検査し、各倍率レベルでパッチを診断に関連する小さなサブセットにフィルタリングする、クロスマグニフィケーションの方法にインスパイアされている。
PATHSをThe Cancer Genome Atlas(TCGA)の5つのデータセットに適用し、スライドレベルの予測タスクにおいて優れたパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:03:38 GMT)
InputSnatch: Stealing Input in LLM Services via Timing Side-Channel Attacks [9.7] 大規模言語モデル (LLM) には広範な知識と質問応答能力がある。
キャッシュ共有メソッドは、キャッシュされた状態や、同じまたは同様の推論要求に対するレスポンスを再利用することで、効率を高めるために一般的に使用される。
LLMの推論において入力盗難を実行するための新しいタイミングベースのサイドチャネル攻撃を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:14:38 GMT)
FreezeAsGuard: Mitigating Illegal Adaptation of Diffusion Models via Selective Tensor Freezing [9.6] 本稿では,拡散モデルの非可逆的適応を可能にする技術であるFreezeAsGuardを提案する。
実験結果から,FreezeAsGuardは,競争ベースラインと比較して,違法なモデル適応を緩和する上で,37%の強力なパワーを提供することがわかった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 04:43:01 GMT)
GAPartManip: A Large-scale Part-centric Dataset for Material-Agnostic Articulated Object Manipulation [9.6] 音声操作のための大規模部分中心データセットを提案する。
我々は、深度推定と相互作用ポーズ予測のための最先端のいくつかの手法と統合する。
実験により、我々のデータセットは深度知覚と行動可能な相互作用の予測の性能を大幅に改善することが示された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:11:23 GMT)
Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis [9.5] 本システムは,映像と音声データの両方を解析するための音声キーワードスポッティング手法と,映像に基づく声門検出を統合している。
MLVASは、喉頭ビデオ分光からストロボ化フレームを特定できる高度なストロボ化ビデオ抽出モジュールを備えている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:19:11 GMT)
Continual Learning in Machine Speech Chain Using Gradient Episodic Memory [9.5] 本稿では,ASRにおける継続学習を実現するために,機械学習チェーンフレームワークを活用した新しいアプローチを提案する。
機械音声連鎖にTTS(text-to-speech)コンポーネントを組み込むことで,GEMに必要な再生機構をサポートする。
LJ音声データセットを用いて,本手法が従来の微調整およびマルチタスク学習手法より優れていることを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:19:20 GMT)
Simulating Tabular Datasets through LLMs to Rapidly Explore Hypotheses about Real-World Entities [9.2] 本稿では, コンクリート構造物の特性評価にLCMを適用することにより, 仮説の素早いプロトタイプ化の可能性について検討する。
目標は、人間と機械のコラボレーションを通じて、仮説をもっと早く解釈できるようにすることだ。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:48:44 GMT)
Generative Visual Communication in the Era of Vision-Language Models [9.2] 今日の視覚的に飽和した世界では、効果的なデザインはグラフィックデザインの原則を理解する必要がある。
この論文は、視覚言語モデルにおける最近の進歩をいかに活用し、効果的な視覚コミュニケーション設計の自動化を図っている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 20:04:31 GMT)
Deep Fourier-embedded Network for Bi-modal Salient Object Detection [9.2] 本稿では,RGBのバイモーダル情報と熱画像の学習を行うために,純粋に高速なフーリエ変換モデル,ディープフーリエ埋め込みネットワーク(DFENet)を提案する。
復号化時に信頼性の高い詳細情報を得るために、周波数分解エッジ認識モジュール(FEM)を設計する。
提案したDFENetは既存の12種類の最先端モデルより優れていることを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:55:16 GMT)
Weighted Circle Fusion: Ensembling Circle Representation from Different Object Detection Results [9.1] 円の表現は、医用画像研究において球状物体の識別を改善する方法として登場した。
重み付き円核融合(WCF)は、様々な円検出モデルからの予測をマージするための単純なアプローチである。
スライド画像全体(WSI)における糸球体検出のためのプロプライエタリなデータセットを用いて本手法の評価を行い,5%の性能向上を得た。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 22:44:17 GMT)
A Comprehensive Survey of Large Language Models and Multimodal Large Language Models in Medicine [9.1] ChatGPT と GPT-4 のリリース以降,大規模言語モデル (LLM) とマルチモーダル大規模言語モデル (MLLM) が注目されている。
本調査は、医学におけるLSMとMLLMの開発、原則、アプリケーションシナリオ、課題、今後の方向性について概観する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 06:20:08 GMT)
Graph Neural Networks for Job Shop Scheduling Problems: A Survey [9.1] ジョブショップスケジューリング問題(JSSP)は、重要な最適化問題である。
近年、JSSPの解決にグラフニューラルネットワーク(GNN)の適用が急速に増加しているのを目撃している。
本稿では,様々な種類のJSSPに対するGNN手法と,それに密接に関連するフローショップスケジューリング問題について,徹底的に検討することを目的とする。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 06:28:37 GMT)
GloFinder: AI-empowered QuPath Plugin for WSI-level Glomerular Detection, Visualization, and Curation [9.0] GloFinderは、WSI全体のシングルクリック自動グロマリ検出用に設計されたQuPathプラグインである。
正確なオブジェクトローカライゼーションに円表現を利用するアンカーフリー検出フレームワークであるCircleNetを採用している。
このプラグインにはWeighted Circle Fusion (WCF)が組み込まれており、複数のCircleNetモデルの信頼性スコアを組み合わせて洗練された予測を生成するアンサンブル手法である。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 22:34:35 GMT)
Atlas-Based Interpretable Age Prediction In Whole-Body MR Images [8.9] 全身3D画像を用いて人体を大規模に老化させる方法について検討した。
我々はGrad-CAM法を用いて、人の年齢を最も予測する身体領域を推定する。
対象者の年齢を予測する上で,全身の3次元容積と全人口分析は,どの部位が最も重要な役割を担っているかという重要な洞察を与えることができる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:26:18 GMT)
PDZSeg: Adapting the Foundation Model for Dissection Zone Segmentation with Visual Prompts in Robot-assisted Endoscopic Submucosal Dissection [8.8] 本研究の目的は,内視鏡下粘膜下郭清術において,正確な解離ゾーンの提案を行うことである。
本稿では,スクリブルやバウンディングボックスなどの多様な視覚的プロンプトを活用するために,Prompted-based Dissection Zone (PDZSeg) モデルを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:28:50 GMT)
VLM-HOI: Vision Language Models for Interpretable Human-Object Interaction Analysis [8.7] 対象物間相互作用(HOI)検出タスク(bfVLM-HOI)の目的関数形式としてVLMを明示的に活用する新しい手法を提案する。
VLMの言語理解を十分に活用するために言語的にHOI三重項を表現し、その局所化とオブジェクト中心の性質からCLIPモデルよりも適している。
提案手法の有効性を実証し,ベンチマーク上での最先端HOI検出精度を実現する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 04:13:23 GMT)
Locally Differentially Private Online Federated Learning With Correlated Noise [8.6] 本稿では,時間的相関雑音を用いたオンライン学習のための局所微分プライベート(LDP)アルゴリズムを導入し,プライバシーを保ちながら実用性を向上させる。
数値実験により提案アルゴリズムの有効性が確認された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 20:56:43 GMT)
Adversarial Training in Low-Label Regimes with Margin-Based Interpolation [8.6] 敵の攻撃に抵抗する堅牢なニューラルネットワークモデルをトレーニングするための効果的なアプローチとして、敵のトレーニングが登場した。
本稿では,頑健性と自然な精度を両立させる,新たな半教師付き対人訓練手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 00:35:13 GMT)
AfriMed-QA: A Pan-African, Multi-Specialty, Medical Question-Answering Benchmark Dataset [8.5] AfriMed-QAはPan-African English multi-choice Medical Question-Answering データセットである。
15,000の質問が16カ国の60以上の医療学校から寄せられ、32の医療専門学校から寄せられた。
バイオメディカル LLM は一般的なモデルよりも優れており、エッジフレンドリーな LLM はパススコアの達成に苦慮している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:13:19 GMT)
Direct Measurement of Density Matrices via Dense Dual Bases [8.5] Dense Dual Bases (DDB)は、任意の(d)次元量子状態の完全なキャラクタリゼーションを可能にするために設計された、2d)観測可能な新しい集合である。
まず、補助系を使わずに密度行列要素を直接測定することができ、任意の元素を3つの選択された観測器で抽出することができる。
第2に、(O(rlog d))オブザーバブルで無視可能な部分集合を除いて、未知のランク(r)密度行列に対するQSTを達成でき、測定効率が大幅に向上する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:26:39 GMT)
Inference Privacy: Properties and Mechanisms [8.5] 推論プライバシ(IP)は、推論時にユーザのデータに対して厳格なプライバシ保証を提供しながら、モデルと対話することを可能にする。
本稿では,ユーザがカスタマイズ可能な入力摂動と出力摂動という,IPを実現するための2つのメカニズムを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 20:47:28 GMT)
Enhancing Computer Vision with Knowledge: a Rummikub Case Study [8.3] 本稿では,人気ボードゲーム「Rummikub」の解法について評価する。
この特別な例では、追加されたバックグラウンド知識はデータセットの3分の2ほどの価値があり、トレーニング時間を元の時間の半分に短縮することができることを実証しています。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:36:03 GMT)
Residual Attention Single-Head Vision Transformer Network for Rolling Bearing Fault Diagnosis in Noisy Environments [8.2] 転がり軸受は、機器の性能、耐久性、安全性に直接影響を与える産業機械において重要な役割を担っている。
本稿では, 転がり軸受の故障診断のために, RA-SHViT-Net(Residual Attention Single-Head Vision Transformer Network)を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:46:54 GMT)
TryOffDiff: Virtual-Try-Off via High-Fidelity Garment Reconstruction using Diffusion Models [8.2] 本報告では,仮想トライオフ(Virtual Try-Off, VTOFF)について紹介する。
本稿では,SigLIPに基づく視覚条件付き安定拡散モデルTryOffDiffを提案する。
本研究は,電子商取引アプリケーションにおける製品イメージの向上,生成モデル評価の進展,高忠実度再構築に向けた今後の取り組みを示唆するものである。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:53:09 GMT)
EgoSurgery-Tool: A Dataset of Surgical Tool and Hand Detection from Egocentric Open Surgery Videos [8.1] EgoSurgery-Phaseデータセットの拡張であるEgoSurgery-Toolを紹介する。
EgoSurgery-Toolは15のカテゴリにまたがる49K以上の手術用ツールで構成され、大規模な手術用ツール検出データセットを構成する。
9つの一般的な物体検出器を用いてEgoSurgery-Toolの包括的解析を行い,手術器具と手指検出の両面での有効性を検証した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 04:30:46 GMT)
Intelligent Anomaly Detection for Lane Rendering Using Transformer with Self-Supervised Pre-Training and Customized Fine-Tuning [8.0] 本稿では,車線描画画像の異常検出を分類問題に変換する。
本研究では,データ前処理,マスク付き画像モデリング(MiM)手法による自己教師付き事前学習,ラベル平滑化によるクロスエントロピーベース損失を用いた微調整,後処理からなる4相パイプラインを提案する。
その結果,提案パイプラインは車線描画画像異常検出において優れた性能を示すことがわかった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 00:21:57 GMT)
Proving and Rewarding Client Diversity to Strengthen Resilience of Blockchain Networks [7.8] クライアント多様性のための新しい概念的枠組みを導入する。
コアとなる目標は、ネットワークのレジリエンスをシステム特性として改善することだ。
我々は,プロトコル参加者が使用するクライアントの実装を明確かつ確実に識別することを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:44:43 GMT)
Barycentric bounds on the error exponents of quantum hypothesis exclusion [7.8] 量子状態排除の最適誤差確率を情報理論の観点から検討する。
我々は分析を、量子チャネル排除のより複雑なタスクにまで拡張する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 06:46:08 GMT)
Exploring QUIC Dynamics: A Large-Scale Dataset for Encrypted Traffic Analysis [7.8] VisQUICは10万以上のラベル付きQUICトレースと対応するSSLキーのデータセットである。
トレースの視覚的表現を生成することにより、高度な機械学習(ML)アプリケーションと、暗号化されたQUICトラフィックの詳細な分析を容易にする。
我々のデータセットはQUICとHTTP/3プロトコルに関する包括的な研究を可能にし、暗号化されたトラフィック分析ツールの開発を支援する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 23:27:20 GMT)
Semantic Edge Computing and Semantic Communications in 6G Networks: A Unifying Survey and Research Challenges [7.8] Semantic Edge Computing (SEC) と Semantic Communications (SemCom) は、6G無線ネットワークでリアルタイムエッジ対応インテリジェンスを実現するための実行可能なアプローチとして提案されている。
この2つの分野の研究問題を要約し、技術的強みと課題に焦点をあてて、技術の現状を包括的にレビューする。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:21:10 GMT)
CIF-T: A Novel CIF-based Transducer Architecture for Automatic Speech Recognition [7.7] 本稿では,CIF(Continuous Integrate-and-Fire)機構をRNN-Tモデルに組み込んだCIF-Transducer(CIF-T)を提案する。
CIF-T は RNN-T モデルと比較して計算オーバーヘッドの少ない最先端の結果が得られる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:44:15 GMT)
MotionCharacter: Identity-Preserving and Motion Controllable Human Video Generation [7.5] MotionCharacterは、効率的で高忠実なヒューマンビデオ生成フレームワークである。
フレキシブルな属性修正を可能とし,IDの完全性を維持するためのID保存モジュールを提案する。
また,ID一貫性と領域認識損失機構を導入し,アイデンティティの整合性と詳細な忠実度を大幅に向上させた。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:15:52 GMT)
EgoSurgery-Phase: A Dataset of Surgical Phase Recognition from Egocentric Open Surgery Videos [7.4] EgoSurgery-Phaseは、9つの異なる手術フェーズにまたがる15時間の実際の手術ビデオで構成されている。
ビデオに加えて、EgoSurgery-Phaseは視線を提供する。
GGMAEは従来の最先端認識法を大幅に改善する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 04:52:51 GMT)
Statistical features of quantum chaos using the Krylov operator complexity [7.3] 非カオスの場合、結果の分布はほぼ重なり合う。
カオスの場合、彼らは2つのよく分断されたグループに分割された。
この重なり合う分離挙動は、カオス力学と非カオス力学を区別する特徴である。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:20:24 GMT)
A General Control-Theoretic Approach for Reinforcement Learning: Theory and Algorithms [7.1] 最適政策の直接学習を支援するための制御理論強化学習手法を考案する。
いくつかの古典的強化学習課題における制御理論的手法の性能を実証的に評価した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 20:34:29 GMT)
MonoDETRNext: Next-Generation Accurate and Efficient Monocular 3D Object Detector [7.1] モノクロ3次元物体検出のための新しいモデルMonoDETRNextを提案する。
速度を優先するMonoDETRNext-Eと、正確性を重視したMonoDETRNext-Aの2つのバリエーションがある。
既存のソリューションに対して,モデルの性能を徹底的に評価した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:23:24 GMT)
Point Cloud Unsupervised Pre-training via 3D Gaussian Splatting [7.1] 我々は,ポイントクラウド表現を学習するために,GS$3$という効率的なフレームワークを提案する。
具体的には、入力されたRGB-D画像を3次元空間にバックプロジェクションし、ポイントクラウドエンコーダを用いてポイントワイズ機能を抽出する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:11:45 GMT)
HyperGLM: HyperGraph for Video Scene Graph Generation and Anticipation [7.0] ビデオシーングラフ生成(VidSGG)は、ビデオフレーム間のマルチオブジェクト関係をキャプチャするために登場した。
Scene HyperGraph (HyperGLM) 上でのマルチモーダル LLM を提案する。
我々は,3人称,自我中心,ドローンビューから1.9Mフレームを備えた新しいビデオシーングラフ推論データセットを紹介した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 04:24:39 GMT)
Evaluating and Improving the Robustness of Security Attack Detectors Generated by LLMs [6.9] 大規模言語モデル(LLM)は、セキュリティ要件を実装するアタック検出器などの関数を生成するために、ソフトウェア開発でますます使われている。
これは、LLMが既存の攻撃に関する知識を欠いていることと、生成されたコードが実際の使用シナリオで評価されていないことによる可能性が高い。
本稿では,LLMパイプラインにRAG(Retrieval Augmented Generation)とSelf-Rankingを統合した新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:48:37 GMT)
Deep End-to-end Adaptive k-Space Sampling, Reconstruction, and Registration for Dynamic MRI [6.9] 適応型動的k空間サンプリング,再構成,登録を統合したエンドツーエンドのディープラーニングフレームワークを提案する。
提案するフレームワークは、これらのコンポーネントのプラグアンドプレイ統合を可能にする、特定の再構築および登録モジュールとは独立している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:38:48 GMT)
Isotropy Matters: Soft-ZCA Whitening of Embeddings for Semantic Code Search [6.7] 埋め込み空間における低等方性は、意味推論を含むタスクのパフォーマンスを損なう。
埋め込みにおける等方性レベルを制御するための改良型ZCA白化手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:43:01 GMT)
Wake Vision: A Tailored Dataset and Benchmark Suite for TinyML Computer Vision Applications [6.6] We present Wake Vision, a large-scale dataset for person detection that includes over 600 million quality-filtered images。
We provide twovariants: Wake Vision (Large) and Wake Vision (Quality) which leverageing the large variant for pretraining and knowledge distillation。
手動でラベル付けされた検証とテストセットは、以前の標準と比べてエラー率を7.8%から2.2%に下げる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:01:52 GMT)
Time-aware Heterogeneous Graph Transformer with Adaptive Attention Merging for Health Event Prediction [6.6] 本稿では,疾患領域の知識を同化し,薬物と疾患の複雑な関係を解明するための新しい異種グラフ学習モデルを提案する。
2つの医療データセットで評価したところ、予測精度と解釈可能性の両方において顕著な改善が見られた。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:21:03 GMT)
Is my Meeting Summary Good? Estimating Quality with a Multi-LLM Evaluator [6.5] MESAは、個々のエラータイプを3段階評価し、意思決定の洗練のためのマルチエージェント議論と、エラー定義の理解と人間の判断との整合性を洗練するためのフィードバックベースの自己学習を取り入れている。
GPT-4oを背骨として、MESAは、エラー検出における人間の判断と、要約品質に対するエラーの影響を反映するミッドスパイアマンとケンドールの相関を、平均0.25以上の方法で達成する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:35:32 GMT)
ElectroVizQA: How well do Multi-modal LLMs perform in Electronics Visual Question Answering? [6.5] 本稿では、MLLMがデジタル電子回路問題を理解し、解決できる範囲を厳格に評価する。
このベンチマークデータセットを導入することで、MLLMの工学教育への応用におけるさらなる研究と開発を動機付けることを目指している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 20:25:07 GMT)
Measuring Compliance of Consent Revocation on the Web [6.4] ウェブ上での同意の取り消しについて、事前の研究は行われていない。
ウェブサイトの19.87%は、ユーザーがさまざまなインターフェースで同意を取り消すのを難しくしている。
20.5%のウェブサイトは受け入れよりも多くの努力を必要としており、2.48%は同意の取り消しを提供していない。
57.5%のウェブサイトは、ユーザーのデータの継続的な違法な処理を可能にする同意取り消し後にクッキーを削除しない。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:40:51 GMT)
MetaphorShare: A Dynamic Collaborative Repository of Open Metaphor Datasets [6.4] 私たちはMetaphorShareを紹介します。MetaphorShareはメタメタデータセットを統合して、オープンでアクセスしやすいものにします。
我々の目的は、メタファ研究や今後のメタファ処理NLPシステムの開発を促進するため、研究者が任意の言語でより多くのデータセットを共有し、アップロードすることを奨励することである。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:58:34 GMT)
SplatAD: Real-Time Lidar and Camera Rendering with 3D Gaussian Splatting for Autonomous Driving [6.2] カメラとライダーデータのセンサリアリスティックレンダリングのための既存のニューラル放射場(NeRF)法は、低レンダリング速度に悩まされている。
SplatADは,カメラとライダーデータの両方の動的シーンをリアルかつリアルタイムにレンダリングするための,最初の3DGSベースの手法である。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:51:12 GMT)
LLMEasyQuant -- An Easy to Use Toolkit for LLM Quantization [6.2] LLM量子化には多くの量子化方法が存在するが、ユーザフレンドリで、ローカルにデプロイしやすいものはほとんどない。
このパッケージは、ユーザフレンドリで初心者の学習に適した量子化デプロイメントを容易にすることを目的としている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:59:03 GMT)
Training and Evaluating Language Models with Template-based Data Generation [6.0] 我々は、700万以上の合成された小学校数学問題からなるデータセットを作成する。
このデータセットは、数学的推論においてLLMを事前学習、微調整、評価するための貴重なリソースとして機能する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:32:56 GMT)
Abductive Symbolic Solver on Abstraction and Reasoning Corpus [5.9] 人間は自分の観察と仮説に基づいて視覚的推論タスクを解く。
これまでのアプローチはグリッド移行のみに重点を置いていたため、AIが合理的で人間的なソリューションを提供するには不十分だった。
本稿では,観測されたデータを知識グラフに象徴的に表現し,ソリューション生成に使用できるコア知識を抽出する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:09:00 GMT)
Can LLMs assist with Ambiguity? A Quantitative Evaluation of various Large Language Models on Word Sense Disambiguation [5.8] 本研究では,Large Language Models (LLMs) を用いた単語センス曖昧化(WSD)の改善について検討する。
提案手法では,プロンプトをPOSタグ,曖昧な単語のシノニム,アスペクトベース・センス・フィルタリング,少数ショットプロンプトで支援する。
数ショットのChain of Thought (COT)プロンプトベースのアプローチを利用することで、本研究はパフォーマンスを大幅に改善したことを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:35:32 GMT)
AI-driven inverse design of materials: Past, present and future [5.8] 人間は長い間、多数の実験を通じて新しい物質を探索し、新しい物質の性質と構造を予測するための対応する理論システムを提案してきた。
計算能力の向上により、研究者は徐々に様々な電子構造計算手法を開発してきた。
近年,計算機科学分野における人工知能技術の急速な発展により,材料特性と構造との暗黙的関連が効果的に評価されるようになった。
生成的および識別的モデルに基づく素材の逆設計において顕著な進歩が見られ、研究者から広く注目を集めている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:20:40 GMT)
Latent Neural Operator for Solving Forward and Inverse PDE Problems [5.8] 本稿では、潜時空間におけるPDEを解く潜時ニューラルネットワーク(LNO)を提案する。
実験によると、LNOはGPUメモリを50%削減し、トレーニングを1.8回スピードアップし、6つのベンチマークのうち4つで最先端の精度に達する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:22:42 GMT)
Cyber-Attack Technique Classification Using Two-Stage Trained Large Language Models [5.7] 本稿では,サイバー脅威情報(CTI)レポートから自然言語文で記述された攻撃テクニックを識別する文分類システムを提案する。
低リソースのサイバー攻撃分類タスクの分類を改善するために,同一ラベルで補助データを利用する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 21:09:02 GMT)
ALPI: Auto-Labeller with Proxy Injection for 3D Object Detection using 2D Labels Only [5.7] 3Dオブジェクト検出は、自動運転車、ロボット工学、拡張現実など、さまざまな応用において重要な役割を果たす。
画像から2次元境界ボックスアノテーションにのみ依存する弱教師付き3次元アノテータを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:22:47 GMT)
Citywide Electric Vehicle Charging Demand Prediction Approach Considering Urban Region and Dynamic Influences [5.7] そこで我々は,CityEVCPという電気自動車充電需要予測のための学習手法を提案する。
都市部における不公平な関係を学習するために,サービスエリアを,地域における関心点の種類と数によってクラスタリングする。
都市の異なる地域での予測結果に及ぼす動的影響の影響と地域クラスタリング手法の有効性を実証する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:54:34 GMT)
ScaleViz: Scaling Visualization Recommendation Models on Large Data [5.7] 本稿では,与えられたvis-recモデルと時間予算をユーザから取り出す新しい強化学習(RL)フレームワークを提案する。
提案手法の有効性を示すため,導入誤差を極端に少なく抑える方法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:43:06 GMT)
Navigating the Post-API Dilemma | Search Engine Results Pages Present a Biased View of Social Media Data [5.5] ソーシャルメディアAPIへのアクセスを中止するという最近の決定は、インターネット研究に有害な影響を及ぼしている。
このデータへのアクセスの欠如は、インターネット研究のポストAPI時代と呼ばれる。
幸いなことに、人気のある検索エンジンは、適切な検索クエリを提供すると、検索結果ページ(SERP)でソーシャルメディアデータをクロール、キャプチャ、サーフェスする手段を持っている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:27:32 GMT)
Surveying the space of descriptions of a composite system with machine learning [5.5] 本研究では,複合システムの組織構造を窓として記述可能な連続空間について検討する。
本稿では,組織の特徴付けに使用する鍵情報理論量を最大化する記述を最適化する機械学習フレームワークを提案する。
機械学習を複合確率変数の詳細な情報理論解析に組み込むことで、実世界の複雑なシステムの構造を探索するための新たな道を開く。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:24:13 GMT)
Learning and communication pressures in neural networks: Lessons from emergent communication [5.4] ニューラルエージェントの言語行動と人間とのミスマッチが解決された3症例について検討した。
我々は、コミュニケーションの成功、生産努力、学習可能性、その他の心理・社会言語学的要因といった、言語学習と台頭のための重要なプレッシャーを識別する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:58:17 GMT)
Diffeomorphic Latent Neural Operator Learning for Data-Efficient Predictions of Solutions to Partial Differential Equations [5.3] 計算された解演算子から偏微分方程式系(PDE)への近似は、科学や工学の様々な分野において必要である。
十分なデータのサンプル化を必要とせず,複数の領域にまたがって一般化可能なPDEソリューション演算子を学習するために,少数の真理解場に潜伏したニューラル演算子を訓練することができることを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:16:00 GMT)
MLLM-Search: A Zero-Shot Approach to Finding People using Multimodal Large Language Models [5.3] 移動ロボットのための新しいゼロショット人探索アーキテクチャであるMLLM-Searchを提案する。
本研究では,環境の空間的理解をロボットに提供するための視覚的プロンプト手法を提案する。
建物の複数部屋のフロアで移動ロボットを実験したところ、MLLM-Searchは、新しい見えない環境の人を見つけるために一般化できることが判明した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 21:59:29 GMT)
Polynomial time and space quantum algorithm for the simulation of non-Markovian quantum dynamics [5.2] フェインマン経路に基づく非マルコフ量子力学シミュレーションのための効率的な量子アルゴリズムを開発した。
これは古典的コンピュータの指数的コストを克服することで量子的優位性を示す。
このアルゴリズムは非マルコフ性による絡み合いが低いか高いかに関わらず効率的であり、開量子系における非マルコフ力学の統一的な枠組みとなる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:25:17 GMT)
Simulation-based inference with scattering representations: scattering is all you need [5.0] 画像を用いたシミュレーションに基づく推論において,さらなる圧縮を伴わない散乱表現の有効利用を実証する。
空間平均化とより表現力のある密度推定器を組み合わせることでこれを克服する。
予想通り、散乱のみが従来の2次要約統計よりも多くの情報を引き出すことを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:52:44 GMT)
Grid-augumented vision: A simple yet effective approach for enhanced spatial understanding in multi-modal agents [4.9] 本稿では,単純なグリッドオーバーレイ手法を用いて,視覚的位置を明示的に符号化する手法を提案する。
本手法は,トランスにおける位置符号化の動作に類似した視覚的空間的ガイダンスを提供する。
提案手法の単純さと有効性は,空間的推論の正確性を必要とするアプリケーションにとって特に有用である。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:05:34 GMT)
Identifying the impact of local connectivity patterns on dynamics in excitatory-inhibitory networks [4.9] 接続の特定のパターンである連鎖モチーフが、他のペアのモチーフよりも支配的な固有モチーフに強い影響を与えることを示す。
連鎖モチーフの過剰表現は、阻害支配ネットワークにおいて強い正の固有値を誘導する。
これらの知見は、オプトジェネティックな摂動に対する応答を計測し、皮質回路の動的構造を推測する実験の解釈に直接的な意味を持つ。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:27:46 GMT)
There are More Fish in the Sea: Automated Vulnerability Repair via Binary Templates [4.9] 本稿では,Javaバイナリに対するテンプレートベースの自動脆弱性修復手法を提案する。
Vul4Jデータセットの実験では、TemVURが11の脆弱性の修正に成功した。
TemVURの一般化性を評価するため、MaryVuls4Jデータセットをキュレートする。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 06:59:45 GMT)
EnrichEvent: Enriching Social Data with Contextual Information for Emerging Event Extraction [4.9] 本稿では,ストリーミングソーシャルデータの言語的および文脈的表現を活用する新しいフレームワークであるEnrichEventを提案する。
提案するフレームワークは,イベントの時間的変化を示すために,各イベントのクラスタチェーンを生成する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:19:51 GMT)
New Faithfulness-Centric Interpretability Paradigms for Natural Language Processing [4.8] この論文は、「複雑な汎用ニューラルNLPモデルに対する忠実な説明を提供するにはどうすればいいのか?
探索された2つの新しいパラダイムは、忠実度測定可能なモデル(FMM)と自己説明である。
FMMは、忠実度の観点から理論的に最適に近い説明を得る。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:17:34 GMT)
To bootstrap or to rollout? An optimal and adaptive interpolation [4.8] 本稿では,ブートストラップ法とロールアウト法を補間するベルマン演算子のクラスを紹介する。
我々の推定器は、ブートストラップに基づく時間差(TD)推定器とロールアウトに基づくモンテカルロ(MC)手法の強度を組み合わせる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 23:19:41 GMT)
Multi-Source Temporal Attention Network for Precipitation Nowcasting [4.7] 降水量は様々な産業で重要であり、気候変動の緩和と適応に重要な役割を果たしている。
降水量予測のための効率的な深層学習モデルを導入し,既存の運用モデルよりも高い精度で降雨を最大8時間予測する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:57:35 GMT)
Towards Supporting QIR: Thoughts on Adopting the Quantum Intermediate Representation [4.7] 中間表現は量子コンピュータのソフトウェアスタックにおいて重要な役割を果たす。
Microsoftは、効率的な最適化を容易にするためにQuantum Intermediate Representation (QIR)を提案した。
この記事では、異なるソフトウェアツールでQIRをどのように採用できるかを考えるための食べ物を提供します。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:00:01 GMT)
"Moralized" Multi-Step Jailbreak Prompts: Black-Box Testing of Guardrails in Large Language Models for Verbal Attacks [4.6] 本研究の目的は, GPT-4o, Grok-2 Beta, Llama 3.1 (405B), Gemini 1.5, Claude 3.5 Sonnetのガードレールの有効性を評価することである。
同種のマルチステッププロンプトを設計して倫理的攻撃を行い、「企業中間管理者が昇進を競う」シナリオをシミュレートする。
以上の結果から, 上記LLMのガードレールはバイパスされ, 口頭攻撃の内容が生成されることがわかった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 20:49:44 GMT)
Discrete and parallel frequency-bin entanglement generation from quantum frequency comb [4.6] 偏光絡み合ったQFCを用いて離散周波数ビン絡み状態を生成する。
周波数の異なる14対の偏光絡み合った光子を同時に周波数ビン絡み状態に変換する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:51:02 GMT)
Graph Max Shift: A Hill-Climbing Method for Graph Clustering [4.5] 本稿では,空間内のクラスタリング点に対して提案した勾配上昇法に類似したグラフクラスタリング法を提案する。
モース正規性のある密度からデータ iid を持つランダムな幾何グラフに適用した場合、この手法は一貫性があることを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 22:32:26 GMT)
Heterogeneous Relationships of Subjects and Shapelets for Semi-supervised Multivariate Series Classification [4.5] 半教師付きMSS分類のための被験者の異種関係とシェープレット法を提案する。
まず、コントラスト時間自己アテンションモジュールを用いて、スパースMSS表現を得る。
第2に, 被験者の特徴と形状の両方を付加情報として取り入れ, 異なる被験者の形状を学習する。
最後に,2レベルグラフアテンションネットワークを用いて予測を行う。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 04:25:13 GMT)
Real-time Video Target Tracking Algorithm Utilizing Convolutional Neural Networks (CNN) [4.4] 本稿では,ConvolutionalNeuralNetworks(CNN)に基づくリアルタイムビデオターゲット追跡アルゴリズムを実装した。
The proposedalgorithm exhibits highertrackingsuccessrates and lower failurerates than severaltrackingalgorithms。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:10:18 GMT)
Graph Neural Network for Cerebral Blood Flow Prediction With Clinical Datasets [4.3] 本稿では,これまで見つからなかった脳血管ネットワーク構造において,血流と血圧を予測するグラフニューラルネットワークを提案する。
GNNは狭窄患者の臨床データセットを用いて開発され、複雑で異常な血管の地形を特徴とする。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 01:01:37 GMT)
Performance Improvement of Language-Queried Audio Source Separation Based on Caption Augmentation From Large Language Models for DCASE Challenge 2024 Task 9 [4.3] 本稿では,言語クエリ音声ソース分離(LASS)タスクに適用した,プロンプトエンジニアリングに基づくテキスト拡張手法を提案する。
学習データセットの各文に対応する複数の字幕を生成するために,大規模言語モデル (LLM) を用いた。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:17:54 GMT)
Federated Learning for Time-Series Healthcare Sensing with Incomplete Modalities [4.3] フェデレートラーニング(FL)は健康分野に適している。
不完全なモダリティに対処する最近のアプローチは、モダリティの数が増えるにつれて、スケールが悪く、非効率になる。
本研究では,FLISMを提案する。FLISM,FLISM,FLISM,FLISM,FLISM,FLISM,FLISM,FLISM,FLISM,FLISM,FLISM)。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 04:41:17 GMT)
Topic Modeling and Sentiment Analysis on Japanese Online Media's Coverage of Nuclear Energy [4.3] 福島第一原子力発電所事故から13年が経ち、日本の原子力は電力生産の約6%を占めている。
本研究は、核エネルギーに関する話題をカバーする3,000本以上のYouTubeビデオの内容とコメントを分析した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:29:18 GMT)
Evaluating Quantumness, Efficiency and Cost of Quantum Random Number Generators via Photon Statistics [4.2] 製造業者にとって、単一光子ベースのQRNGの量子性を評価する従来の方法は、有限サンプルサイズのため統計的に信頼性が低い。
本稿では,光源の量子性を確保するために,より効率的な2次元統計手法を提案する。
QRNGの基本的なパラメータは、量子性、効率性(ランダムエントロピーと乱数生成率)、コストである。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:42:06 GMT)
SelfSplat: Pose-Free and 3D Prior-Free Generalizable 3D Gaussian Splatting [4.1] ポーズフリーで3次元の事前自由な一般化可能な3次元再構成を実現するための新しい3次元ガウススプラッティングモデルであるSelfSplatを提案する。
本モデルでは,これらの課題に対して,自己教師付き深度とポーズ推定手法を効果的に統合することによって対処する。
提案手法の性能を評価するため,RealEstate10K,ACID,DL3DVなどの大規模実世界のデータセットを用いて評価を行った。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 06:00:49 GMT)
Emergence of Self-Identity in AI: A Mathematical Framework and Empirical Study with Generative Large Language Models [4.0] 本稿では,AIシステムにおける自己同一性の定義と定量化のための数学的枠組みを提案する。
我々の枠組みは、2つの数学的に定量化された条件から自己同一性が生じることを示唆している。
本研究の意義は、ヒューマノイドロボット工学や自律システムの分野に即時に関係している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:23:47 GMT)
Graph structure of quantum mechanics [3.9] 有限量子系は2つのグラフ構造定理を用いて原子によって決定されることを示す。
我々の結論は、量子力学は複数の隠れ変数理論のグラフ構造の組み合わせであることを示している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:49:12 GMT)
XGrammar: Flexible and Efficient Structured Generation Engine for Large Language Models [3.9] 文脈自由文法は制約付き復号化による構造化生成を可能にするフレキシブルなアプローチである。
XGrammarは、大規模言語モデルのための柔軟で効率的な構造生成エンジンである。
XGrammarは、既存のソリューションで最大100倍のスピードアップを達成することができる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:59:28 GMT)
Motion-driven quantum dissipation in an open electronic system with nonlocal interaction [3.9] 相対運動を持つ2つの無限平行金属板の励起と散逸について検討した。
相対運動の過程は、シュウィンガー効果の散逸過程と同様、オンシェル励起を誘導する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 23:12:52 GMT)
Information geometry of bosonic Gaussian thermal states [3.9] ボーソニック・ガウスの熱状態は、量子情報科学における基本的な状態のクラスを形成する。
本稿では,2つの状態間の距離を特徴付けることに着目し,これらの状態の情報幾何について検討する。
ボゾン系ガウス熱状態の族に対しては,フィッシャー・ビュールおよびクボ・モリ情報行列の式を導出する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:04:19 GMT)
Task Arithmetic Through The Lens Of One-Shot Federated Learning [3.8] Task Arithmeticは、複数のモデルの機能をひとつのモデルに組み合わせることを可能にするモデルマージ技術である。
タスク算術は、フェデレートラーニングにおいてよく使われるアルゴリズムと数学的に等価であることを示す。
フェデレーテッド・ラーニング(Federated Learning)のアルゴリズムを応用して,タスク算術の有効性を向上する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:53:41 GMT)
COREval: A Comprehensive and Objective Benchmark for Evaluating the Remote Sensing Capabilities of Large Vision-Language Models [3.7] 我々は,大規模視覚言語モデル(VLM)の階層的リモートセンシング能力を包括的かつ客観的に評価する最初のベンチマークであるCOREvalを提案する。
リモートセンシングに不可欠な2つの主機能次元(知覚と推論)に焦点をあて、さらに6つの二次次元と22の葉のタスクを分類し、この特定分野の十分な評価範囲を確保する。
汎用およびリモートセンシングドメインから13の著名なオープンソースVLMの総合評価を行い、リモートセンシング機能における現在の欠点を強調し、この特殊なコンテキストにおけるアプリケーション改善の方向性を示した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:48:55 GMT)
Online Knowledge Integration for 3D Semantic Mapping: A Survey [3.6] 近年のディープラーニングの進歩により、知識グラフや言語概念として表される事前知識を、センサデータ処理やセマンティックマッピングパイプラインに完全に統合することが可能になった。
セマンティックシーングラフと言語モデルにより、現代のセマンティックマッピングアプローチは、グラフベースの事前知識を取り入れたり、マッピングプロセス中と後の両方で人間の言語における豊富な情報を活用することができる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:53:16 GMT)
Retrofitting (Large) Language Models with Dynamic Tokenization [3.6] 現在の言語モデル(LM)は固定された静的なサブワードトークン化器を使用する。
この選択はしばしば認められ、英語以外の言語で効率と能力が低下する結果となった。
入力テキストに基づいてトークン境界を動的に決定する手法として,動的トークン化を用いたLMの再構成を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:51:58 GMT)
Temporal Reversed Training for Spiking Neural Networks with Generalized Spatio-Temporal Representation [3.6] スパイキングニューラルネットワーク(SNN)は、超低消費電力コンピューティングパラダイムとして広く注目を集めている。
近年,SNNの特徴抽出能力の向上に焦点が当てられているが,非効率な推論や準最適性能に悩まされている。
本稿では,SNNの性能を最適化するために,TRT法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 04:25:26 GMT)
Spectral-Spatial Transformer with Active Transfer Learning for Hyperspectral Image Classification [3.4] ハイパースペクトル画像(HSI)の分類は、高スペクトル次元と限られたラベル付きデータのために難しい課題である。
本研究では,空間スペクトル変換器(SST)と能動学習プロセスを統合し,効率的なHSI分類を実現するための多段階能動移動学習(ATL)フレームワークを提案する。
HSIデータセットのベンチマーク実験では、SST-ATLフレームワークが既存のCNNやSSTベースの手法よりも大幅に優れていることが示されている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:53:39 GMT)
Howzat? Appealing to Expert Judgement for Evaluating Human and AI Next-Step Hints for Novice Programmers [3.2] 初心者のプログラミングツールでは、何が良いヒントになるのか、どのように自動的に良いヒントを生成するのかを知ることが重要です。
私たちは世界中から44人のJava教育者を募集し、オンライン調査に参加しました。
参加者は、Large Language Models (LLM) と5人の経験豊富な教育者が作成した次のステップのJavaヒントのセットをランク付けした。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:59:34 GMT)
Learning optimal objective values for MILP [3.2] 本稿では,最適目標値の予測手法を提案する。
そこで本稿では,グラフニューラルネットワーク(GNN)アーキテクチャに基づく予測器と,動的特徴のセットを紹介する。
各種ベンチマーク実験の結果,提案手法の有効性が示され,予測タスクの精度が向上し,既存手法よりも優れた結果が得られた。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:22:31 GMT)
Addressing bias in Recommender Systems: A Case Study on Data Debiasing Techniques in Mobile Games [3.2] このケーススタディは,モバイルゲームにおけるモデルベースレコメンデーションに特有のデータセット内の潜在的なバイアスを特定し,分類することを目的としている。
既存の文献における偏見のテクニックをレビューし、暗黙のフィードバックによって収集された実世界のデータ上での有効性を評価する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:45:17 GMT)
Phys4DGen: A Physics-Driven Framework for Controllable and Efficient 4D Content Generation from a Single Image [3.1] 既存の方法は、4Dコンテンツのダイナミクスを導くために、事前訓練されたビデオ拡散モデルに大きく依存している。
物理対応の4Dコンテンツを生成する新しいフレームワークであるPhys4DGenを提案する。
物理的特性を視覚的に推測する人間の能力に触発され,物理知覚モジュールが導入された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:14:13 GMT)
Faster Accelerated First-order Methods for Convex Optimization with Strongly Convex Function Constraints [3.1] 強い凸関数制約を受ける凸関数を最小化するために,高速化された原始双対アルゴリズムを導入する。
特にGoogleのパーソナライズされたPageRank問題では、スパシティ誘導最適化におけるメソッドのパフォーマンスが優れています。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 04:54:18 GMT)
ORIS: Online Active Learning Using Reinforcement Learning-based Inclusive Sampling for Robust Streaming Analytics System [3.0] ラベル付けのための文書のインクルーシブサンプリングを用いたオンライン能動学習手法であるORISを提案する。
ORISは、ラベル付けにおけるヒューマンエラーを最小限に抑えるために、入ってくる文書をサンプリングする、新しいQ-Networkベースの戦略を作成することを目的としている。
我々は、感情認識タスクにおけるORIS法の評価を行い、人間のラベル付け性能とMLモデル性能の両面で従来のベースラインを上回った。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:11:37 GMT)
Experimental investigation of coherence contributions to a nonequilibrium thermodynamic process in a driven quantum system [3.0] エントロピーは コヒーレンス生成と人口ミスマッチの 組み合わせだと考えられます
NMR量子プロセッサにおけるこの非平衡過程を実験的に検討した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 00:24:11 GMT)
AdaVLN: Towards Visual Language Navigation in Continuous Indoor Environments with Moving Humans [2.9] 適応視覚言語ナビゲーション(Adaptive Visual Language Navigation, AdaVLN)と呼ばれるタスクの拡張を提案する。
AdaVLNは、人間の障害物が動的に動く複雑な3D屋内環境をナビゲートするロボットを必要とする。
本稿では,この課題をベースラインモデルとして評価し,AdaVLNが導入したユニークな課題を分析し,VLN研究におけるシミュレートと現実のギャップを埋める可能性を示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:36:08 GMT)
A Novel Pareto-optimal Ranking Method for Comparing Multi-objective Optimization Algorithms [2.9] 本稿では,多目的最適化アルゴリズムの性能をランク付けする,新しいマルチメトリック比較手法を提案する。
パレートレベルでの貢献に基づいてアルゴリズムをランク付けする4つの異なる手法が提案されている。
この技術は科学と工学に広く応用されており、特に比較に複数のメトリクスが使用される分野において応用されている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:34:54 GMT)
Agent Skill Acquisition for Large Language Models via CycleQD [2.7] CycleQDはアルゴリズムの循環的適応を通じて品質多様性フレームワークを活用する新しいアプローチである。
各タスクのパフォーマンス指標は品質指標として交換され、他のタスクは行動特性として機能する。
CycleQD を LLAMA3-8B-INSTRUCT ベースのモデルに適用することで、コーディング、オペレーティングシステム、データベースタスクにおける従来の微調整手法を超越するだけでなく、GPT-3.5-TURBO と同等のパフォーマンスを達成できる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:38:33 GMT)
Dynamic Logistic Ensembles with Recursive Probability and Automatic Subset Splitting for Enhanced Binary Classification [2.7] 本稿では,動的ロジスティックアンサンブルモデルを用いた二項分類手法を提案する。
我々は、データセットを複数のサブセットに自動的に分割するアルゴリズムを開発し、分類精度を高めるためにロジスティックモデルのアンサンブルを構築する。
この作業は計算効率と理論厳密さのバランスを取り、複雑な分類タスクに対して堅牢で解釈可能なソリューションを提供する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 00:22:55 GMT)
Planckian Diffusion: The Ghost of Anderson Localization [2.7] ランダム媒質が動き始めると、プランクアン拡散$D = alphahbar/m$ がアンダーソン局在に取って代わる。
我々の発見は、動的乱れ系におけるプランクの拡散は、静的乱れ系におけるアンダーソンの局在化と同じくらい普遍的であることを示唆している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 21:45:32 GMT)
Derivation of Closed Form of Expected Improvement for Gaussian Process Trained on Log-Transformed Objective [2.7] 期待されている改善(EI)は、ベイズ最適化において最も広く用いられている獲得関数である。
数値精度に敏感なため、EIの性能を高めることはしばしば困難である。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:13:41 GMT)
Selective Classification Under Distribution Shifts [2.7] 選別分類において、分類器は過度なエラーを避けるために誤りとなる可能性のある予測を棄却する。
本稿では,分散シフトを考慮したSCフレームワークを提案する。
提案したスコア関数は、一般化されたSCのための既存のスコア関数よりも効果的で信頼性が高いことを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:48:34 GMT)
FastSwitch: Optimizing Context Switching Efficiency in Fairness-aware Large Language Model Serving [2.6] 既存のシステムはスループットを過度に優先順位付けし、プリエンプションによって引き起こされるコンテキストスイッチによって引き起こされるオーバーヘッドを見渡す傾向がある。
FastSwitchは、既存のKVキャッシュメモリ割り当てポリシーに適合するだけでなく、コンテキストスイッチングオーバーヘッドを軽減するフェアネス対応のサービスシステムである。
我々の評価によると、FastSwitchは最先端のLLMサービスシステムであるvLLMよりも、尾部TTFTとTBTで1.4-11.2xの高速化を実現している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:07:28 GMT)
Optimal In-Network Distribution of Learning Functions for a Secure-by-Design Programmable Data Plane of Next-Generation Networks [2.6] 本稿では,分散侵入検知システム(IDS)をサポートするネットワーク内学習モデルの実装について検討する。
IDS のワークロードを最適に分散するモデルを提案する。これは "Strong Learner" (SL) モデルの軽量分散 "Weak Learner" (WL) モデルへの分割によるものである。
メタヒューリスティックなアプローチは、数学的モデルによって提供される正確な解によって必要となる長い計算時間を短縮するために提案される。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:29:53 GMT)
ESS-ReduNet: Enhancing Subspace Separability of ReduNet via Dynamic Expansion with Bayesian Inference [2.5] 本稿では,各カテゴリのサブ空間の分離性を高めるためのESS-ReduNetを提案する。
ESS-ReduNetはReduNetに比べて10倍以上のコンバージェンス向上を実現している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 00:37:12 GMT)
Efficient Hardware Implementation of Constant Time Sampling for HQC [2.5] HQCは、NISTのポスト量子暗号標準化プロセスの最終ラウンドにおける、コードベースのファイナリストの1つである。
HQCにおけるハードウェアの効率的な実装とセキュリティに関して重要な計算カーネルは、乱数を引き出すのに使用されるサンプリング方法である。
セキュリティの臨界により、最近、サイドチャネル攻撃に対する堅牢性を高めるためにサンプリングアルゴリズムが更新された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:21:29 GMT)
FreqX: What neural networks learn is what network designers say [2.4] PFLは、非IID、異種デバイス、公正性の欠如、不明瞭な貢献に悩まされている。
本稿では,信号処理と情報理論を導入した新しい解釈可能性手法であるemphFreqXを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:41:24 GMT)
ChatGPT as speechwriter for the French presidents [2.4] 本稿では,ChatGPTと呼ばれる一大言語モデルの書体を,その生成したメッセージと最近のフランス大統領との書体を比較して分析する。
その結果,ChatGPTは名詞,有意決定詞,数字を多用する傾向にあった。
さらに、ChatGPTの例として短いテキストが提供されると、機械は元の単語に閉じたスタイルで短いメッセージを生成することができる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:29:10 GMT)
Training Noise Token Pruning [2.3] 視覚変換器のためのトレーニングノイズトケイング(TNT)について述べる。
本手法は離散トークン投下条件を連続付加雑音に緩和する。
我々は、レーティング・ディストーションの文献と理論的に関係し、ImageNetデータセット上で実証的な評価を行う。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:04:00 GMT)
Parallel Token Swapping for Qubit Routing [2.3] 現代の量子コンピュータでよく見られるグラフトポロジ上の並列トークンスワップ問題に対する最初の定数係数近似アルゴリズムを提供する。
また、量子ビットルーティング問題に対する再構成を設計する際に有用であることが示されている自然下界のいわゆる伸張係数についても検討した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:26:16 GMT)
Efficient decoding of stabilizer code by single-qubit local operations and classical communication [2.3] 複数の量子ビットの安定化符号に符号化された分散1量子ビット量子情報を抽出するプロトコルを構築する。
このプロトコルは、物理量子ビット数の観点から、1時間以内に効率的な抽出を実現する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:14:10 GMT)
A Combined Feature Embedding Tools for Multi-Class Software Defect and Identification [2.2] 本稿では,GraphCodeBERTとGraph Convolutional Networkを組み合わせた実験手法であるCodeGraphNetを提案する。
この方法は、機能間の複雑な関係をキャプチャし、より正確な脆弱性の識別と分離を可能にする。
決定木とニューラルネットワークのハイブリッドであるDeepTreeモデルは、最先端のアプローチよりも優れています。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:18:36 GMT)
CASCRNet: An Atrous Spatial Pyramid Pooling and Shared Channel Residual based Network for Capsule Endoscopy [2.2] この写本は、MISAHUBによるカプセルビジョンチャレンジ2024に関する著作を要約している。
CASCRNet(Capsule endoscopy-Aspp-SCR-Network)を提案する。
提案されたモデルは、F1スコア78.5%、平均AUC98.3%で病気の分類に成功した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:03:24 GMT)
Comprehensive Kernel Safety in the Spectre Era: Mitigations and Performance Evaluation (Extended Version) [2.0] レイアウトのランダム化は、メモリ分離を伴うシステムにおいて、同等の安全性を保証できることを示す。
サイドチャネルと投機的実行を使用できる攻撃者に対しては,カーネルの安全性を回復できないことを示す。
我々は、Spectre時代の安全なシステムコールに対して、投機的カーネル安全性を保証できる強制機構を導入する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:06:28 GMT)
cedar: Optimized and Unified Machine Learning Input Data Pipelines [2.0] cedarは、機械学習入力データパイプラインのための最適化された統一プログラミングフレームワークである。
cedarは、ローカルおよび分散コンピューティングリソースのカスタマイズ可能なセットで処理をオーケストレーションする。
cedarは、最先端の入力データシステムと比較して、パフォーマンスを最大1.87倍から10.65倍改善する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:05:57 GMT)
Biases in gendered citation practices: an exploratory study and some reflections on the Matthew and Matilda effects [2.0] 本稿では,ソフトウェア工学文献における性的な引用の実践を分析することを目的とする。
この結果から,SE分野における引用実践の公平性を達成するためには,まだいくつかの努力が必要であることが示唆された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:07:45 GMT)
NeuroAI for AI Safety [2.0] 一般知能を持つ唯一のエージェントは人間である。
神経科学は、現在未調査で未使用の技術的AI安全性の重要な鍵を握るかもしれない。
我々は神経科学に触発されたAI安全性へのいくつかの道のりを強調し、批判的に評価する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:18:51 GMT)
Graph-Based Biomarker Discovery and Interpretation for Alzheimer's Disease [1.9] アルツハイマー病(AD)の早期診断と治療薬標的の発見
近年の血液検査では、ADの診断と、AD管理のための薬物標的として使用できる可能性のあるバイオマーカーの強調が期待されている。
ここでは、診断精度とバイオマーカー発見プロセスを共同で最適化する、新しい機械学習フレームワークであるBRAINを紹介する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 22:45:19 GMT)
CHORDONOMICON: A Dataset of 666,000 Songs and their Chord Progressions [1.9] Chordonomiconは666,000曲以上の楽曲とそれらのコード進行のデータセットで、構造的部分、ジャンル、リリース日が注釈付けされている。
これらの特徴により、Chordonomiconは高度な機械学習技術を探求するための理想的なテストベッドとなる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:33:18 GMT)
Can bidirectional encoder become the ultimate winner for downstream applications of foundation models? [1.8] 基礎モデルには、事前学習、移動学習、自己指導学習の特徴がある。
BERTは、マスク付き言語モデルを用いて事前学習において、一方通行の言語モデリングのみを使用するという制限を突破した。
本稿では,GPT と BERT に基づく一方向モデルと双方向モデルを分析し,その目的に基づいて差分を比較する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:31:14 GMT)
GPT as ghostwriter at the White House [1.8] 我々は、ChatGPT 3.5と呼ばれる一大言語モデルの書き方を分析し、その生成したメッセージを最近のアメリカ合衆国大統領とを比較した。
その結果,ChatGPTは名詞やコンマだけでなく,レムマ"We"を多用する傾向にあった。
我々は、GPTのスタイルが実際の大統領住所と異なる特徴を露呈していることを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:12:36 GMT)
Synthetic ECG Generation for Data Augmentation and Transfer Learning in Arrhythmia Classification [1.8] 本稿では,Deep Learningと異なる生成モデルを用いて生成した合成データの有用性について検討する。
本研究では, 合成事前学習モデルを微調整し, 実データの比率を増大させることにより, 伝達学習の効果について検討する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:46:34 GMT)
Increasing quantum speed limit via non-uniform magnetic field [1.7] 量子速度制限(Quantum speed limit, QSL)は、量子系が状態間でどれだけの速さで進化するかに関する理論上界を定義する。
可変磁場を用いることで、SQSLを0.4-0.6cまで超えることができることを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:00:06 GMT)
MvKeTR: Chest CT Report Generation with Multi-View Perception and Knowledge Enhancement [1.5] 臨床医の診断ワークフローを模倣する,MvKeTR(Multi-view Recognition-enhanced Tansformer)を提案する。
複数の解剖学的視点から診断情報を効果的に合成する。
その後、放射線科医が関連する臨床記録を参照して診断の意思決定をガイドする方法に触発されて、Cross-Modal Knowledge Enhancer(CMKE)が最もよく似たレポートを検索する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:58:23 GMT)
Parole de présidents (1958-2022) [1.5] en plus de soixante ans, huit pr'esidents se sont succ'ed'e a la tete de la Ve R'epublique Franceaise (de Gaulle, Pompidou, Giscard d'Estaing, Mitterrand, Chirac, Sarkozy, Hollande, Macron)。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:01:51 GMT)
A comparison of extended object tracking with multi-modal sensors in indoor environment [1.5] 本稿では、LiDARとカメラの2つの異なる3Dポイント・クラウド・センサ・ソースを比較し、効率的な物体追跡手法の予備的提案を行う。
我々はまず,10点と対象環境に関する事前情報を利用する高速物体検出器を開発した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:16:00 GMT)
Exploration of LLM Multi-Agent Application Implementation Based on LangGraph+CrewAI [1.5] 本稿では,LangGraphとCrewAIの統合アプリケーションについて論じる。
LangGraphは、グラフアーキテクチャによる情報伝達の効率を改善する。
CrewAIはチームコラボレーション機能とシステムパフォーマンスを強化する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:29:17 GMT)
ELEMENTAL: Interactive Learning from Demonstrations and Vision-Language Models for Reward Design in Robotics [1.5] 本稿では,自然言語指導と視覚的ユーザデモを組み合わせることで,ロボットの動作とユーザ意図の整合性を向上する新しいフレームワークを提案する。
実験の結果, ELementalはタスク成功率42.3%で先行作業より優れ, アウト・オブ・ディストリビューションタスクにおいて41.3%の高速化を実現していることがわかった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 23:58:32 GMT)
Using Malware Detection Techniques for HPC Application Classification [1.4] ジョブ名やリソース使用量に基づいてアプリケーションを分類する既存の方法は、しばしば信頼できないか、異なる入力やシステムノイズによって異なる振る舞いを持つアプリケーションをキャプチャできない。
本研究では,HPCアプリケーション実行ファイルの分類に類似性保存ファジィハッシュを用いる手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:28:43 GMT)
A Novel Word Pair-based Gaussian Sentence Similarity Algorithm For Bengali Extractive Text Summarization [1.4] 本稿では,2つの文間の意味的関係を計算するために,ワードペアベースのガウス文類似性(WGSS)アルゴリズムを提案する。
単語平均化法で直面する文表現問題を補正する単語対単語ベースで2つの文を比較する。
提案手法は, 4つの異なるデータセットを用いて検証し, ROUGEの平均値に対して43.2%向上した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:47:15 GMT)
Closer Look at Efficient Inference Methods: A Survey of Speculative Decoding [1.3] 投機的復号化は、ドラフトと検証という2段階のフレームワークを導入することでボトルネックに対処する。
より小さく効率的なモデルが予備のドラフトを生成し、より大きくより洗練されたモデルによって洗練される。
本稿では、投機的復号法を包括的に調査し、それらをドラフト中心およびモデル中心のアプローチに分類する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:25:44 GMT)
Inter-linguistic Phonetic Composition (IPC): A Theoretical and Computational Approach to Enhance Second Language Pronunciation [1.3] 第二言語(L2)の学習者は、しばしば意識不明なL2音素を母語(L1)から類似の音素で置き換える
この音素置換は、L2の標準的な音韻学的パターンから逸脱する。
誤り音素移動を最小限に抑える新しい計算法として,言語間音声合成法(IPC)を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:16:27 GMT)
Incomplete Multi-view Multi-label Classification via a Dual-level Contrastive Learning Framework [1.2] 本稿では,二重欠落多視点多ラベル分類の課題を解決するために,両レベルコントラスト学習フレームワークを提案する。
いくつかの広く使用されているベンチマークデータセットの実験により、提案手法はより安定し、より優れた分類性能を有することが示された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:04:04 GMT)
Optimising Iteration Scheduling for Full-State Vector Simulation of Quantum Circuits on FPGAs [1.2] 量子ゲートの実行に必要なイテレーション数を最適化するために,メモリアクセスパターンを提案する。
提案手法は,各制御キュービット毎にゲートをシミュレートするのに要する時間を大幅に短縮することを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:57:29 GMT)
Robustness of tripartite entangled states in passive PT-symmetric qubits [1.1] 非エルミート量子ビットにおける例外点(EP)によって引き起こされる三部体の絡み合いのロバスト性について検討する。
以上の結果から,全結合を持つ非エルミート量子ビットはGHZ状態を生成する一方,近傍相互作用を持つビットはW状態を生成することが明らかとなった。
これらの絡み合った状態は、非一様結合と非共振駆動場に耐性がある。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 03:44:35 GMT)
Delineating Feminist Studies through bibliometric analysis [1.1] 本稿では,さまざまな科学分野にまたがるジェンダー・性関連出版物を同定するための新しいアプローチを提案する。
我々は、学術論文のデータセットをコンパイルするために、バイオロメトリ技術、自然言語処理(NLP)、手作業によるキュレーションを採用している。
結果として得られたデータセットは1668年から2023年の間に190万以上の科学文書からなり、4つの言語にまたがっている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:52:51 GMT)
Engineering Trustworthy Software: A Mission for LLMs [1.1] LLMは、開発を加速し、複雑さを減らし、コストを削減することで、ソフトウェアエンジニアリングを変革している。
初期のバグ検出、継続的改善、重要な問題の迅速な解決を容易にしながら、設計、開発、デプロイメントを推進します。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 01:30:44 GMT)
Conditional Density Estimation with Neural Networks for Bias Correction of Multivariate Climate Model Data [1.1] グローバル気候モデル(GCM)は、地球の気候システム内の複雑な物理過程をシミュレートする数値モデルである。
GCMは、基礎となる物理的プロセスに関する仮定と単純化によって、体系的なバイアスに悩まされる。
日降水量と最大温度データの同時バイアス補正のための条件密度推定に基づく新しいバイアス補正法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 22:55:48 GMT)
Causal and Local Correlations Based Network for Multivariate Time Series Classification [1.0] 本研究では時系列分類のための因果相関と局所相関に基づくネットワーク(CaLoNet)を提案する。
UEAデータセットの実験は、CaLoNetが最先端の手法と比較して競争力のあるパフォーマンスを得ることができることを示している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:54:26 GMT)
Concentration of Cumulative Reward in Markov Decision Processes [1.0] マルコフ決定過程(MDP)における報酬集中を特徴付ける統一的アプローチを導入する。
結果は、大数の法則、中心極限定理、反復の法則を含む。
文献で提案する学習方針に対する後悔の2つの定義が,その比率に等価であることを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:51:39 GMT)
Multi-task Gaze Estimation Via Unidirectional Convolution [1.0] 視線推定タスクにおける軽量モデルの性能向上を目的として,マルチタスク・ガゼというネットワークモデルを提案する。
Multitask-Gazeの主なコンポーネントは、一方向変換(UC)、空間とチャネルの注意(SCA)、グローバル畳み込みモジュール(GCM)、マルチタスク回帰モジュール(MRM)である。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:14:27 GMT)
Lightweight Gaze Estimation Model Via Fusion Global Information [1.0] 本稿では,新しい軽量視線推定モデルFGI-Netを提案する。
グローバル情報をCNNに融合させ、多層畳み込みの必要性を効果的に補償する。
87.1%と79.1%のパラメータとFLOPの減少でより小さな角度誤差を達成している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:16:14 GMT)
Data Readiness for AI: A 360-Degree Survey [0.9] この調査では、ACM Digital Library、IEEE Xplore、Nature、Springer、Science Directなどのジャーナル、著名なAI専門家が発行するオンライン記事の140以上の論文を調査している。
本稿では、構造化データセットと非構造化データセットのためのAI(DRAI)メトリクスのためのデータ準備性の分類法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:44:07 GMT)
What do physics-informed DeepONets learn? Understanding and improving training for scientific computing applications [0.9] 物理インフォームド・ディープ・オペレーター・ネットワーク(DeepONets)は偏微分方程式(PDE)の解を数値的に近似するための有望なアプローチとして登場した。
我々は、抽出された基底関数の普遍性を評価し、スペクトル法によるモデル還元の可能性を示すことによって、物理インフォームドDeepONetsによって何が学べるかをさらに理解する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:48:35 GMT)
Towards quantum error correction with two-body gates for quantum registers based on nitrogen-vacancy centers in diamond [0.9] 本稿では,適応型XYシーケンスによって生成されるゲートの忠実度と実行速度のトレードオフをバランスさせる最適な実行時間を決定する手法を提案する。
我々は、核スピン環境をカラーセンターレジスタ内の量子誤差補正のための符号空間として利用する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:42:13 GMT)
Initial Evidence of Elevated Reconnaissance Attacks Against Nodes in P2P Overlay Networks [0.9] 我々は,P2Pネットワークノードに対するアクティブな偵察攻撃の実態を,世界中に分散したベタージュポイントを越えて,実際のノードと並んで一連のハニーポットを配置することによって調査する。
ノードはアタックの増加だけでなく、特定のポートやサービスをターゲットにした特定のタイプのアタックも経験します。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:38:18 GMT)
Adaptive Random Fourier Features Training Stabilized By Resampling With Applications in Image Regression [0.9] 浅層ニューラルネットワークのための適応型ランダムフーリエ(ARFF)訓練アルゴリズムを提案する。
本手法は, 粒子フィルタ型再サンプリング法を用いて, トレーニング過程を安定化し, パラメータ選択に対する感度を低下させる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 20:24:36 GMT)
Mix-GENEO: A Flexible Filtration for Multiparameter Persistent Homology Detects Digital Images [0.8] トポロジカルデータ解析の分野における2つの重要な課題は、オブジェクトに実用的なマルチフィルタを構築し、TDAを使って幾何学を検出することである。
そこで我々は,マルチジェネエオ,マルチジェネエオ,ミックスジェネエオという画像上に,演算子によるマルチパラメータフィルタを構築した。
実例では、イメージを離散関数空間とみなし、その離散関数空間上に多重フィルタを構築する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 06:22:59 GMT)
Multimodal Integration of Longitudinal Noninvasive Diagnostics for Survival Prediction in Immunotherapy Using Deep Learning [0.8] 免疫療法を施行した694例の大膵コホートより, 術前および治療中の血液測定, 処方薬およびCTベースの臓器量について検討した。
拡張マルチモーダル変圧器を用いた簡易時間注意(MMTSimTA)ネットワークの異なる変種をエンドツーエンドにトレーニングし,3,6,9,12ヶ月で死亡を予測した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:44:06 GMT)
Enhancing Document AI Data Generation Through Graph-Based Synthetic Layouts [0.8] グラフニューラルネットワーク(GNN)を用いた文書レイアウト生成のための新しい手法を提案する。
ドキュメント要素をグラフのノードとして表現することで、GNNは現実的で多様なドキュメントレイアウトを生成するように訓練される。
実験の結果,既存の拡張手法よりもグラフ拡張文書のレイアウトが優れていることがわかった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 21:15:02 GMT)
Application of Soft Actor-Critic Algorithms in Optimizing Wastewater Treatment with Time Delays Integration [0.7] 観測と動作の遅延は、効率的なリン除去を実現するために、比例独立微分制御器を最適以下にする。
本研究は,ソフトアクター・クライブアルゴリズムに基づく新しい深層強化学習手法を用いて,これらの課題に対処する。
シミュレータにはLong Short-Term Memory Networkが組み込まれており、正確なマルチステップ状態予測が可能で、現実的なトレーニングシナリオが実現されている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:52:48 GMT)
From Open Vocabulary to Open World: Teaching Vision Language Models to Detect Novel Objects [0.6] オープン語彙オブジェクト検出(OVD)に関する最近の研究により、非有界語彙によって定義されたオブジェクトの検出が可能になった。
OVDは'oracle'によって提供される正確なプロンプトに依存しており、シーンの知覚を駆動するといった重要なアプリケーションでの使用を制限する。
我々は,OVDモデルをオープンワールドで動作させるフレームワークを提案し,新しいオブジェクトを段階的に識別し,学習する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:33:51 GMT)
Mortality Prediction of Pulmonary Embolism Patients with Deep Learning and XGBoost [0.6] 肺塞栓症(PE)は死亡率と致命的な疾患の主要な原因である。
従来の臨床手法では, PE患者の30日間の院内死亡を予測できた。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:15:55 GMT)
Differential learning kinetics govern the transition from memorization to generalization during in-context learning [0.6] トランスフォーマーはインコンテキスト学習(ICL: In-context Learning)を示す。
最近の研究は、モデルが十分に多様なタスクセットで訓練されたときにICLが出現することを示している。
記憶・一般化するサブ回路は,主に独立していると考えられる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 22:12:29 GMT)
Towards Lensless Image Deblurring with Prior-Embedded Implicit Neural Representations in the Low-Data Regime [0.5] 本稿では、従来のレンズを計算に置き換えた計算画像のサブセットである、レンズレス画像再構成について述べる。
我々は、暗黙のニューラル表現をレンズレス画像の劣化に活用し、事前トレーニングを必要とせずに再構成を実現した最初の人物である。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:12:29 GMT)
Measuring the Quality of Answers in Political Q&As with Large Language Models [0.5] 本稿では,政治質問・回答セッションにおける回答の質を評価するための新しい手法を提案する。
提案手法は,全回答の精度に基づいて,回答の質を計測することから成り立っている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 23:27:36 GMT)
Multiscale Hodge Scattering Networks for Data Analysis [0.5] 我々は,simplicial Complex上で測定された信号に対する新しい散乱ネットワークを提案し,これをemphMultiscale Hodge Scattering Networks (MHSNs)と呼ぶ。
我々の構成は、単純複体上の多スケール基底辞書、すなわち $kappa$-GHWT と $kappa$-HGLET に基づいている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:32:51 GMT)
kNN-Res: Residual Neural Network with kNN-Graph coherence for point cloud registration [0.5] 本稿では,残差ニューラルネットワークを用いた点集合登録手法を提案する。
提案された正規化は、局所位相を保存するためのプロキシとして、大域的滑らか性制約に依存している。
我々は、変換された点集合のコヒーレンスkNNグラフに十分であることを示すヤコビアンベースのコストの理論的正当性を示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:22:50 GMT)
Regularizing Explanations in Bayesian Convolutional Neural Networks [0.5] ベイズ推論に適合する新しい説明正規化法を提案する。
提案手法は,モデルが刺激的特徴に過度に適合する場合や,どの特徴に着目すべきか不確実な場合,予測性能を向上させる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:06:09 GMT)
On Importance of Code-Mixed Embeddings for Hate Speech Identification [0.4] 我々は,コード混合埋め込みの重要性を分析し,ヘイトスピーチ検出におけるBERTモデルとHingBERTモデルの性能を評価する。
本研究は,HingBERTモデルがヘイトスピーチテキストデータセットでテストした場合に,HingBERTモデルよりも優れたHindi- EnglishデータセットL3-HingCorpusのトレーニングの恩恵を受けることを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:23:57 GMT)
Challenges in Adapting Multilingual LLMs to Low-Resource Languages using LoRA PEFT Tuning [0.4] 本研究では,ローランド適応 (LoRA) -高効率ファインチューニング (PEFT) がマラウイの多言語Gemmaモデルに及ぼす影響について検討した。
52,000対の命令応答対を持つ翻訳データセットを用いて、評価結果が微調整後に低下する一方で、手動による評価では、微調整されたモデルが元のモデルよりも優れていることがしばしば示唆されている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:14:38 GMT)
Digital Twin-Centered Hybrid Data-Driven Multi-Stage Deep Learning Framework for Enhanced Nuclear Reactor Power Prediction [0.4] 本稿では,ハイブリッドデジタルツインに焦点を当てた多段階深層学習フレームワークを提案する。
96%の分類、2.3%のMAPEを達成し、反応器の最終的な定常電力を予測する。
データ駆動の洞察をデジタルツインの原理と整合させることで、この研究は核システム管理における適応的でスケーラブルなソリューションの基礎となる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:02:36 GMT)
The Performance of the LSTM-based Code Generated by Large Language Models (LLMs) in Forecasting Time Series Data [0.4] 本稿では,ChatGPT, PaLM, LLama, FalconなどのLLMの時系列データ解析のためのディープラーニングモデルの生成における性能について検討し, 比較する。
その結果は、生成的AIを活用して、許容できる良さで優れた予測モデルを作成したいデータアナリストや実践者にとって有益である。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 20:18:36 GMT)
Managing Classical Processing Requirements for Quantum Error Correction [0.4] 本稿では,ハードウェアデコーダの数を削減し,計算性能のトレードオフをナビゲートするフレームワークを提案する。
プログラムの実行に必要なハードウェアデコーダの数を最大10倍に削減できる効率的なデコーダスケジューリングポリシーを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:50:17 GMT)
A Semantic Framework for Neuro-Symbolic Computing [0.4] ニューロシンボリックAIの分野は、ニューラルネットワークとシンボリックシステムの組み合わせの恩恵を受けることを目的としている。
エンコーディングの一般的な定義は存在せず、ニューロシンボリック法を正確に理論的に比較することが可能である。
本稿では,ニューロシンボリックAIのセマンティックフレームワークを導入することでこの問題に対処する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 00:22:09 GMT)
Large Models Enabled Ubiquitous Wireless Sensing [0.3] CSI推定のための既存の手法を概観し、従来のアプローチからデータ駆動アプローチへのシフトを強調した。
本研究では,現実的な環境情報を用いた空間CSI予測のための新しいフレームワークを提案する。
この研究は、無線ネットワーク管理における革新的な戦略の道を開いた。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:11:35 GMT)
The Return of Pseudosciences in Artificial Intelligence: Have Machine Learning and Deep Learning Forgotten Lessons from Statistics and History? [0.3] これらのML手法のデザイナと最終ユーザは,統計学の基本的な教訓を忘れてしまった,と我々は主張する。
トレーニングデータのバイアスを減らすだけで、AIモデルをより倫理的にするための現在の取り組みは不十分である、と私たちは主張する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:23:23 GMT)
CoVis: A Collaborative Framework for Fine-grained Graphic Visual Understanding [0.3] CoVisは、きめ細かい視覚的理解のための協調的なフレームワークである。
カスケード二重層セグメンテーションネットワークの設計と実装により、画像からできるだけ多くの知識を抽出する。
画像の視覚分析を生成し、より総合的な視点から画像の理解を支援する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 21:38:04 GMT)
LLM-ABBA: Understand time series via symbolic approximation [0.3] 我々は,様々なダウンストリーム時系列タスクに対して,ABBAを大規模言語モデルに統合するLLM-ABBAという手法を提案する。
LLM-ABBAは、時系列を象徴することにより、最近のUCRにおける最先端(SOTA)と3つの医療時系列分類タスクとを良好に比較する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:48:24 GMT)
Predicting Water Quality using Quantum Machine Learning: The Case of the Umgeni Catchment (U20A) Study Region [0.2] 本研究では,南アフリカ・ダーバンのU20A地域における水質調査におけるQML技術の実例について考察する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:43:07 GMT)
Approaching ideal visibility in singlet-triplet qubit operations using energy-selective tunneling-based Hamiltonian estimation [0.2] GaAs量子ドットアレイにおける2電子スピン量子ビットのエネルギー選択的トンネル抽出に基づくハミルトンパラメータ推定について報告する。
周波数シェルドモードでのキュービット動作では、核分極に頼らずにコヒーレンス時間の40倍の増加が観察される。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:07:01 GMT)
Human Evaluation of Procedural Knowledge Graph Extraction from Text with Large Language Models [0.2] 我々は,Large Language Model (LLM) の機能を活用し,ステップ,アクション,オブジェクト,機器,時間情報を抽出するための迅速な工学的アプローチを提案する。
LLM抽出した手続き的知識の質と有用性を質的に定量的に評価するために,ユーザスタディを用いてKG抽出結果を評価した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:36:28 GMT)
Algorithmic Collusion by Large Language Models [0.1] 我々は,Large Language Models(LLMs)に基づくアルゴリズム価格設定エージェントによる実験を行う。
LLMをベースとしたエージェントは、価格設定作業に長けており、消費者の負担に対して、オリゴポリー設定で自律的にコロードし、LCM命令の一見無害なフレーズの変化は、共謀を増す可能性がある。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 00:19:55 GMT)
MRI Breast tissue segmentation using nnU-Net for biomechanical modeling [0.1] 乳がんの診断と治療計画の改善には,MRIと2次元マンモグラフィの併用が不可欠である。
本稿では, 生体力学的乳房モデルの2つの側面において拡張することにより, これらの課題に対処する。
我々は, nnU-Net アーキテクチャを用いて, 乳房MRIデータの詳細な6クラスセグメンテーションを行った。
前景全体のセグメンテーションは、2Dと3DのU-Net構成のアンサンブルにより平均Dice係数0.83に達した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 22:15:04 GMT)
Unstructured Adiabatic Quantum Optimization: Optimality with Limitations [0.1] 本研究では,非構造探索手法を用いた断熱的量子最適化により,古典的局所スピンハミルトニアンのクラスに対する下界と一致するランニング時間が得られることを示す。
回避された交差の位置は、ハミルトニアン問題の退化と逆ギャップに依存し、低加算精度でも計算し難い量によってほぼ与えられることを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:47:46 GMT)
NeoHebbian Synapses to Accelerate Online Training of Neuromorphic Hardware [0.0] ReRAMデバイスを用いた新しいネオヘビアン人工シナプスが提案され、実験的に検証されている。
様々なデバイスやシステムレベルの非理想を考慮に入れたシステムレベルのシミュレーションは、これらのシナプスがニューロモルフィックハードウェアにおける高度な学習規則の高速でコンパクトでエネルギー効率の高い実装に堅牢なソリューションを提供することを確認した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:06:15 GMT)
Convolutional Neural Networks Do Work with Pre-Defined Filters [0.0] 我々は、事前定義されたフィルタ畳み込みニューラルネットワーク(PFCNN)と呼ばれる新しい畳み込みニューラルネットワークのクラスを提案する。
PFCNNは、PFM(Pre-Defined Filter Module)と呼ばれる、ディープワイド・コンボリューションの特別な形態を含む。
この厳しい制限にもかかわらず、複雑で差別的な特徴が学習される。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:30:44 GMT)
When does a bridge become an aeroplane? [0.0] この技法の重要な側面は、材料の性質や幾何学のような様々なパラメータによって、ある構造を別の構造に連続的に変形させることができるという考えである。
現在の研究は、単純な「橋」と「飛行機」のパラメータ化を含むケーススタディを通して、これらの補間構造の発達を実証している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:49:49 GMT)
What does AI consider praiseworthy? [0.0] 我々は,大規模言語モデルのユーザの意図に対する応答を分析する。
私たちは、さまざまな倫理的行動のモデル間で強い整合性を見いだしています。
AIシステムが社会に統合されるにつれて、彼らの賞賛、批判、中立性の使用は注意深く監視されなければならない。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:46:54 GMT)
Visual Error Patterns in Multi-Modal AI: A Statistical Approach [0.0] GPT-4oは、先進的なマルチモーダル能力の研究の焦点として選ばれた。
本研究では,機械駆動と人間駆動の視覚知覚の類似点と相違点について検討した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 01:20:08 GMT)
ViTOC: Vision Transformer and Object-aware Captioner [0.0] ViTOCは画像キャプションのための視覚言語モデルであり、生成された記述の正確さと多様性の課題に対処する。
事前訓練された視覚モデルパラメータを利用することで、ViTOCは効率的なエンドツーエンドトレーニングを実現する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:45:23 GMT)
Using different sources of ground truths and transfer learning to improve the generalization of photometric redshift estimation [0.0] 我々は、異なる基底真実を組み合わせることにより、銀河赤方偏移予測を改善する方法を模索する。
私たちはまずTransferZでベースニューラルネットワークをトレーニングし、より精密な分光赤偏移を持つ銀河のデータセット(GalaxiesML)で転送学習を用いてそれを洗練します。
どちらの手法も、差分を$sim$5x、RMSエラーを$sim$1.5x、GalaxiesMLの破滅的な外れ率を1.3x、TransferZデータのみにトレーニングされたベースラインと比較して、バイアスを$sim$5x、RMSエラーを$sim$1.5x、削減する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 04:55:37 GMT)
Unveiling the optimization process of Physics Informed Neural Networks: How accurate and competitive can PINNs be? [0.0] 本研究では、物理インフォームドニューラルネットワークの潜在的な精度について、従来の類似した研究や従来の数値手法と対比して検討する。
改良された最適化アルゴリズムを選択することで、結果の精度が大幅に向上することがわかった。
損失関数の簡単な修正は精度を向上し、拡張のための追加の道を提供する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:46:13 GMT)
Unpacking the Individual Components of Diffusion Policy [0.0] 拡散ポリシは、条件付き認知拡散プロセスを通じてロボットの動作シーケンスを生成する。
本稿では拡散政策の5つの重要な要素を要約する。
ManiSkill と Adroit のベンチマークを用いて実験を行い,拡散政策の成功に対する各コンポーネントの貢献を明らかにすることを目的とした。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:44:17 GMT)
Tree species classification at the pixel-level using deep learning and multispectral time series in an imbalanced context [0.0] 本稿では,Sentinel-2マルチスペクトル衛星画像時系列を用いた木種分類について検討する。
ディープラーニングモデルを使用することで,分類結果の大幅な改善が期待できる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:01:28 GMT)
Transferable Ensemble Black-box Jailbreak Attacks on Large Language Models [0.0] 我々は,様々なLSM-as-Attackerメソッドを組み込んだ新しいブラックボックス・ジェイルブレイク攻撃フレームワークを提案する。
本手法は,既存のジェイルブレイク研究と実践から得られた3つの重要な知見に基づいて設計されている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:28:00 GMT)
Transfer Learning for Deep Learning-based Prediction of Lattice Thermal Conductivity [0.0] 深層学習モデル(ParAIsite)の精度と一般化性に及ぼす伝達学習の影響について検討する。
格子熱伝導率(LTC)の低品質近似の大規模なデータセット上で、初めて微調整を行うと、さらに改善が得られた。
有望な結果は、低熱伝導率材料を探索する大きなデータベースを探索する能力を高めるための道を開く。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:57:58 GMT)
Theory of the Simultaneous Transient Dispersive Readout of Multiple Spin Qubits [0.0] 量子ビットの脱相中に行われる多重分散量子ビット測定のパラダイムを提案する。
時間依存キャビティ応答のラプラス変換は、同じ共振器モードに結合された複数のキュービットから寄与を分離することができる。
測定時間は従来の分散読み出しと好適に比較し, 競争力のある読み出し精度が得られた。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:43:34 GMT)
The importance of visual modelling languages in generative software engineering [0.0] GPT-4は、単に自然言語ではなく、画像とテキストの入力を受け入れる。
私たちの知る限りでは、マルチモーダルGPTを通じてソフトウェアエンジニアリングタスクが実行される同様のユースケースを調査する研究は他にありません。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 01:15:36 GMT)
The c-d conjecture [0.0] 局所的近傍臨界ハミルトニアンの1次元における局所次元$d$と最大中心電荷$c_textmax$の関係を予想する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:12:55 GMT)
The Solvay Councils, de Broglie's brothers, and the development of wave-particle duality [0.0] 1911年にエルネスト・ソルヴェイによって後援された最初のソルヴェイ会議は、最初の量子革命と呼ばれるものの始まりとなった。
Maurice de Broglieは評議会の秘書の1人であり、次の2つの会議に参加し、彼の仕事で第3回評議会に貢献した。
ルイ・ド・ブロイは兄と共同で議論し、モーリスの業績から離れて、光の波動粒子双対性へのアプローチを開発し、それを他の粒子に拡張した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:15:37 GMT)
The Rn-index: a more accurate variant of the Rk-index [0.0] Rn-インデックスはRk-インデックスの弱さを補正する変種であり、特に世界的な進歩の比率が高い国の評価においてである。
Rn-インデックスは、その引用数によって順序付けられた論文の局所的なランクとグローバルなランクの比率を和らげることだけを含むので、計算と理解が簡単である。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:17:31 GMT)
The Quantum Coherence in Terms of Phase-Sensitive Nonadiabatic Dressed States [0.0] 量子コヒーレンス(quantum coherence)は、位相感受性の非断熱的な状態にあると考えられている。
位相相関は,実数と仮想成分の位相相関と,それらの状態の異なる仮想成分の定常位相相関の2種類がある。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:12:26 GMT)
The Bigger the Better? Accurate Molecular Potential Energy Surfaces from Minimalist Neural Networks [0.0] KerNNは、分子PSSを表現するためのカーネル/神経ネットワークベースのアプローチである。
最先端のニューラルネットワークPSSと比較して、KerNNの学習可能なパラメータの数は大幅に減少する。
KerNNは、古典的および量子シミュレーションから計算された振動帯を含む、テストセット統計と観測可能な領域で優れた性能を示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:01:21 GMT)
Thai Financial Domain Adaptation of THaLLE -- Technical Report [0.0] 大きな言語モデル(LLM)は一般的なタスクでは優れていますが、ドメイン固有の課題に苦労しています。
タイ証券取引所から投資コンサルタント(IC)試験データセットを用いたタイ金融LLMを開発した。
IC試験では,P1,P2,P3で72%,72%,84%のスコアを得た。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:30:00 GMT)
Symmetry-Resolved Relative Entropy of Random States [0.0] ウィッシュアートアンサンブルから引き出された対称ランダム状態の相対エントロピーを計算する。
その結果,ランダムな純粋状態の対称性を解いた相対エントロピーは普遍的な統計的挙動を示すことがわかった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:37:21 GMT)
Strongly Coupled PT-Symmetric Models in Holography [0.0] 強結合型PT対称量子場理論に対するホログラフィック双対の構成について概説する。
時空依存的非エルミートカップリング(非エルミートクエンチと格子)に焦点を当てる。
注目すべきは、これらの非エルミート格子は、IR内のPT対称固定点に流れることである。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:07:38 GMT)
Stochastic entropy production associated with quantum measurement in a framework of Markovian quantum state diffusion [0.0] 量子状態拡散の枠組みを用いた2レベルオープン量子システムについて検討する。
本研究では,環境駆動型連続量子計測プロセスにおいて,その密度行列の予測不可能さを考察する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:12:21 GMT)
Spin shuttling in a silicon double quantum dot [0.0] 2つの量子ドット間のスピンシャットリングの最小バージョンについて検討する。
不均一磁場におけるスピン軌道相互作用とゼーマン効果はスピンシャットリングにおいて重要な役割を果たす。
スピン不忠実度は1-F_slesssim 0.002$で、比較的高速なレベル速度は$alpha = 600, mu$eV/nsである。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:03:48 GMT)
Simulating Vibrational Dynamics on Bosonic Quantum Devices [0.0] 従来の量子ビットベースの量子デバイスに代わる有望な代替手段としてボソニック量子デバイスが登場しつつある。
これらのボソニックデバイス上での非調和ポテンシャル下での振動力学のディジタル量子シミュレーションの枠組みを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 00:16:31 GMT)
Self-consistent approach to the dynamics of excitation energy transfer in multichromophoric systems [0.0] 我々は,エキシトン-環境相互作用のための自己整合ボルン近似を開発した。
励起子エネルギーギャップを持つ低減衰振動共振器(オフ共振器)によって変調されたエネルギー伝達を記述するのに良い(粗い)ことを発見した。
フィンナ-マシューズ-オルソン錯体の7サイトモデルにおいて、励起子力学を合理的に記述する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:22:31 GMT)
Second-order correlation and squeezing of photons in cavities with ultrastrong magnon-photon interactions [0.0] 本研究は超強結合系における強磁性及び反強磁性キャビティに焦点をあてる。
2階相関関数の正確な積分解を導出することにより、反回転するマグノン-光子相互作用がキャビティモードで二次的スキューズを誘導することを示した。
異方性マグノン-キャビティ結合のチューニングは、マグノン-キャビティ・フォトンハイブリッドモードのレベル反発を変化させることで、スクイーズ効果を高める。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:59:41 GMT)
Robustness of quantum symmetries against perturbations [0.0] 一つの摂動に対して頑健な対称性の集合の完全な代数的特徴付けを見つける。
このような結果を用いて、摂動の任意の集合に対する安定性を特徴づける。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:20:54 GMT)
Ridge Regression for Manifold-valued Time-Series with Application to Meteorological Forecast [0.0] ユークリッド空間から一般方程式へのリッジ回帰の自然な内在的拡張を提案する。
時系列予測に利用し,ハリケーントラックとその風速の予測にアプローチを適用する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:36:43 GMT)
Representative Social Choice: From Learning Theory to AI Alignment [0.0] 代表的な社会的選択において、人口は、どの社会的選択決定が下されるかに基づいて、個々の課題のペアの有限のサンプルによって代表される。
代表的社会的選択における最も深い質問の多くは、統計的学習問題として自然に定式化できることを示す。
我々はさらに、社会選択の代表を定式化し、Arrowのような公理を一般化分析の新しいツールで証明する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 22:25:58 GMT)
Randomized-Grid Search for Hyperparameter Tuning in Decision Tree Model to Improve Performance of Cardiovascular Disease Classification [0.0] Support Vector Machine(SVM)、Na"ive Bayes(NB)、Decision Trees(DT)、Random Forests(RF)といった機械学習アルゴリズムを用いた心臓病の分類は、過度な適合によって妨げられることが多い。
グリッド検索は網羅的ではあるが、計算コストが高く、特に高次元データでは非効率である。
Rational-Grid Searchは網羅的ではあるが、特に高次元データでは計算コストが高く非効率である。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:10:28 GMT)
RPEE-HEADS: A Novel Benchmark for Pedestrian Head Detection in Crowd Videos [0.0] 我々は,新しい,多種多様な,高解像度で正確に注釈付けされたリソースである,鉄道プラットフォームとイベントトランジェンス・ヘッドのデータセットを紹介した。
66枚のビデオ記録から1,886枚の画像に109,913枚の注釈付き歩行者頭があり、1枚あたり平均56.2枚である。
本稿では,RPEE-Headsデータセットを用いた8つの最先端物体検出アルゴリズムを評価し,頭部サイズが検出精度に与える影響を分析する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:20:26 GMT)
RITA: Automatic Framework for Designing of Resilient IoT Applications [0.0] 我々は,RoBERTaをベースとした名前付きエンティティ認識(NER)モデルを用いた,オープンソースのフレームワークRITAを提案する。
RITAは完全にオフラインで動作し、オンサイトに配置され、機密情報を保護できる。
経験的評価では, RITAは7つのICOカテゴリのうち4つでChatGPTを上回った。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:24:52 GMT)
Quantum transition probability in convex sets and self-dual cones [0.0] 観測対象に対してより汎用的な構造を持つ,より初等的なアプローチを提案する。
二項の場合、一般化された量子ビットモデルが生まれる。
任意のコンパクト凸を整合状態空間とする新しい幾何学的性質を示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:32:52 GMT)
Quantum machines using $\rm{Cu}_{3}$-like compounds modeled by Heisenberg antiferromagnetic in a triangular ring [0.0] 反強磁性結合スピン系の理論的研究、特に$rmCu_3-rmX$$(rmX=As, Sb)$について述べる。
可逆過程を仮定した3つの量子マシンを作業物質として,本システムを用いて検討した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:55:53 GMT)
Quantum coherence between mass eigenstates of a neutrino can be destroyed by its mass-momentum entanglement [0.0] この絡み合いはニュートリノの質量固有状態の間の量子コヒーレンスを運動量と位置表現の両方で破壊する。
さらに、ニュートリノと電子の状態が荷電電流相互作用の後に分離不能になることを指摘します。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:02:13 GMT)
Quantum algorithms for classical Boolean functions via adaptive measurements: Exponential reductions in space-time resources [0.0] 適応測定に基づく量子計算の枠組みにおいて,様々なブール関数の計算を定式化する。
この結果は,定深量子回路と定深古典回路の電力間の分子分離に関する古い定理の代替的証明を構成する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 22:23:11 GMT)
Purcell Rate Suppressing in a Novel Design of Qubit Readout Circuit [0.0] 量子ビット共振器系におけるパーセル効果について検討した。
提案手法では,まずフィルタ共振器と相互作用し,次にリードアウト共振器にリンクする。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:34:43 GMT)
Proposal for a cavity-induced measurement of the exchange coupling in quantum dots [0.0] スピンキュービットアレイでは、交換結合を利用して2量子ゲートを実装し、スピンバスに沿った中間レンジキュービット接続を実現する。
隣接量子ドット中の電子間の交換結合を特徴付ける手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:56:03 GMT)
Projective toric designs, quantum state designs, and mutually unbiased bases [0.0] Toric $t$-designs はトーラス上の点の集合で、和はトーラス上の次数 $t$ monomials の積分を再現する。
トーリックおよび射影トーリックデザインの様々な新しい構成を提供し、そのサイズに限界を証明している。
また、射影トーリック設計を用いて量子状態設計のファミリを構築する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 23:10:09 GMT)
Problem-tailored Simulation of Energy Transport on Noisy Quantum Computers [0.0] スピンと電荷は、量子多体系の挙動を特徴づけるのに基本的である。
今日の量子コンピュータはゲートエラーとコヒーレンス時間に悩まされている。
本稿では,これらの力学をシミュレートする新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:47:59 GMT)
Probabilistic Satisfaction of Temporal Logic Constraints in Reinforcement Learning via Adaptive Policy-Switching [0.0] Constrained Reinforcement Learning (CRL)は、従来の強化学習(RL)フレームワークに制約を導入する機械学習のサブセットである。
純粋学習(逆)と制約満足度を切り替えることに依存する新しい枠組みを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 22:08:00 GMT)
Preserving Information: How does Topological Data Analysis improve Neural Network performance? [0.0] 本稿では,画像認識におけるトポロジカルデータ解析(TDA)と畳み込みニューラルネットワーク(CNN)の統合手法を提案する。
我々のアプローチは、ベクトルスチッチ(Vector Stitching)と呼ばれ、生画像データと追加のトポロジ情報を組み合わせたものである。
実験の結果は,追加データ解析の結果をネットワークの推論プロセスに組み込むことの可能性を強調した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:56:05 GMT)
Predicting Extubation Failure in Intensive Care: The Development of a Novel, End-to-End Actionable and Interpretable Prediction System [0.0] 集中治療における排他的障害の予測は、複雑なデータと不正確な予測の重大な結果のために困難である。
機械学習は、臨床的な意思決定を改善することを約束するが、時間的患者の軌跡やモデル解釈可能性を考慮するのに失敗することが多い。
本研究では, 時相モデリング手法を用いて, エクスキュベーション故障の予測システムを構築することを目的とした。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 22:19:47 GMT)
Politicians vs ChatGPT. A study of presuppositions in French and Italian political communication [0.0] 本研究は、暗黙のコミュニケーション、特に前置詞とその言論における機能に焦点を当てる。
本研究は,大規模言語モデルの実用的能力に関する新たな文献への貢献も目指している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:46:41 GMT)
One-Step Early Stopping Strategy using Neural Tangent Kernel Theory and Rademacher Complexity [0.0] 早期停止戦略は、トレーニングエラーが最小限になる前に、入力データのセット$S$でニューラルネットワーク(NN)のトレーニングプロセスを止めることである。
ここでは、初期訓練誤差ベクトルとニューラル・タンジェント・カーネルの固有値を含む最適停止時間を解析的に推定する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 23:22:28 GMT)
On the role of Artificial Intelligence methods in modern force-controlled manufacturing robotic tasks [0.0] ロボットマニピュレータの強化におけるAIの役割は、スマートマニュファクチャリングにおける重要なイノベーションに急速に結びついている。
この記事では、これらのイノベーションを実効力によって制御されたアプリケーションにまとめ、高品質な生産標準を維持する必要性を強調します。
この分析は、AI技術を検証するための共通のパフォーマンスメトリクスの必要性を強調した、将来の研究方向性の視点で締めくくっている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:29:59 GMT)
On the detectability of paraparticles beyond bosons and fermions [0.0] ボソンやフェルミオン以外のパラ粒子の特別なクラスを理論的に検出する技術の現状について述べる。
検討中の粒子はパラ統計に従い、(ブレイド群の下で変換されるもの以外は)置換群を介して相互に交換される。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:07:09 GMT)
OFCap:Object-aware Fusion for Image Captioning [0.0] 画像キャプションは、画像コンテンツを自然言語記述に変換する技術である。
インテリジェント検索エンジンや視覚障害者支援ツールなど、多くのアプリケーションシナリオには、人を含むイメージが含まれる。
データセットは、しばしば人物を特徴とする画像の比率が高い。
このモデルは、人無しで画像の記述を生成する際には性能が悪く、無関係な記述(幻覚)を生成さえできる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:45:02 GMT)
Nonadiabatic Quantum Dynamics of Molecules Scattering from Metal Surfaces [0.0] 電子と金属表面の分子運動の間の非断熱結合はエネルギー散逸を引き起こす。
金属表面から分子を散乱させる理論的なアプローチとして、すべての非断熱および量子核効果を包含する手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:01:34 GMT)
Neural Surface Priors for Editable Gaussian Splatting [0.0] コンピュータグラフィックスでは、3次元幾何学と外観の容易に修正可能な表現を復元する必要がある。
メッシュ調整による直感的なシーン編集が可能な3Dガウススプラッティングを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:06:37 GMT)
Multi-qubit Controlled Teleportation across Distributed Nodes [0.0] 提案した研究は、m-qubit GHZ状態の n 個のインスタンスを量子資源として使用し、m 参加者間の任意の n-qubit 状態のテレポーテーションを容易にする。
一般化されたプロトコルの様々な構成を探索し、テレポーテーションの忠実度を評価する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:17:10 GMT)
Model validation and error attribution for a drifting qubit [0.0] ビット性能は、様々な単一値のメトリクスでしばしば報告され、それぞれが性能を制限するノイズメカニズムのファセットを提供する。
これらの値の分布を用いて、候補雑音モデルの検証や無効化を行う方法を示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:39:16 GMT)
Metric-DST: Mitigating Selection Bias Through Diversity-Guided Semi-Supervised Metric Learning [0.0] 自己学習のような半教師付き学習戦略は、ラベルなしデータをモデルトレーニングに組み込むことで選択バイアスを軽減することができる。
本稿では,距離学習とその暗黙の埋め込み空間を活用し,信頼度に基づくバイアスに対処する多様性誘導型自己学習戦略であるMetric-DSTを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:29:42 GMT)
Machine learning-based classification for Single Photon Space Debris Light Curves [0.0] この作業は、機械学習フレームワークを使用してSingle Photon Space Debrisを分類することを目的としている。
3つのタスクにモデルを適用し、個々のオブジェクトを分類し、起源に応じてグループ化されたオブジェクトを家族に分類し、一般的なタイプに分類する。
我々は、単一光子で捉えたスペースデブリLCの分類に成功し、90.7%の精度を得た。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:08:06 GMT)
Machine Unlearning reveals that the Gender-based Violence Victim Condition can be detected from Speech in a Speaker-Agnostic Setting [0.0] 本研究は,ジェンダーベースの暴力が女性のメンタルヘルスに与える影響について論じる。
GBVはしばしば、不安、抑うつ、外傷後ストレス障害(PTSD)など、被害者に長期にわたる副作用をもたらす。
本研究は、ジェンダーベースの暴力被害者状態(GBVVC)の話者非依存的検出に対する新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:53:53 GMT)
Lusifer: LLM-based User SImulated Feedback Environment for online Recommender systems [0.0] 本稿では,Lulsiferについて紹介する。LulsiferはLarge Language Models(LLMs)を利用して,シミュレーションされたユーザフィードバックを生成する新しい環境である。
Lusiferはユーザープロファイルとインタラクション履歴を合成し、推奨アイテムに対する反応と振る舞いをシミュレートする。
Lusiferは、RMSE 1.3のトレーニングデータが少なくても、ユーザの振る舞いや好みを正確にエミュレートする。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:07:41 GMT)
Loss-induced quantum information jet in an infinite temperature Hubbard chain [0.0] 散逸性粒子シンクを用いた一次元無限温度ハバードモデルにおける情報伝達について検討した。
強く相互作用する極限では、2つの部位の相互情報と作用素の絡み合いエントロピーはリッチな構造を示す。
可逆的なセルオートマトンモデルは、相関の輸送と遅くて古典的な部分を定量的にキャプチャするが、急速に伝播する情報ジェットを記述できない。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:47:40 GMT)
Leveraging Large Language Models in Human-Robot Interaction: A Critical Analysis of Potential and Pitfalls [0.0] 大規模言語モデル(LLM)と視覚言語モデル(VLM)は、社会支援ロボット(SAR)における前例のない機会と課題を提示する
我々は、HRI研究における主要なロボットとSARの重要応用を探求する250以上の論文のメタスタディを行い、教育、医療、エンターテイメントを強調しながら、ロボット開発者が対処すべき社会的規範や問題、信頼、偏見、倫理に対処する。
我々は,LSM や VLM を SAR に導入するための責任と効果的な経路を概説する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 12:30:23 GMT)
Large Scale Evaluation of Deep Learning-based Explainable Solar Flare Forecasting Models with Attribution-based Proximity Analysis [0.0] 太陽フレア予測のための深層学習モデルの解釈可能性を評価するための新しい枠組みを提案する。
本研究は、24時間窓内のフレアを予測するために、全ディスクラインオブライト(LoS)マグネティックグラム画像に基づいてトレーニングされた2つのモデルを比較した。
以上の結果から,モデルの予測は活動領域の特徴と異なる程度に一致していることが示唆された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 05:43:34 GMT)
Krylov Complexity in early universe [0.0] 我々は、初期宇宙の様々な段階におけるクリロフの複雑性、例えば、インフレ、放射支配期(RD)、物質支配期(MD)について検討する。
クリャロフ複雑性は閉系と開系との違いが分かる。
我々は、スケール係数に関連する$r_k$と$phi_k$の進化方程式を最初に計算する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:49:28 GMT)
Iso-Diffusion: Improving Diffusion Probabilistic Models Using the Isotropy of the Additive Gaussian Noise [0.0] 本稿では、DDPMの忠実度を高めるために、目的関数の制約として添加音の等方性を利用する方法を示す。
我々のアプローチは単純であり、DDPMの変種にも適用できる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 20:40:08 GMT)
Investigating Plausibility of Biologically Inspired Bayesian Learning in ANNs [0.0] 破滅的な忘れ事は、人工システムにおける生涯学習の領域における主要な問題である。
我々は、このベイズ推定を、より生物学的にインスパイアされたモデルに模倣するために閾値決定機構を組み込んだ。
視覚データセットMNISTを用いた人工システムにおける生物学的にインスパイアされたベイズ学習の有効性について検討した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 22:19:27 GMT)
Interplay between external driving, dissipation and collective effects in the Markovian and non-Markovian regimes [0.0] ボゾン場に結合した駆動光学系における開系挙動について検討する。
その結果、コヒーレント運転に対する非マルコフ的補正と、集合的なクロスドライブ効果が明らかとなった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:04:11 GMT)
Influence of gravity on the quantum speed limit in neutrino oscillations [0.0] 重力場の存在下でニュートリノ-反ニュートリノ系の一様進化を研究する。
2つの振動の絡み合いエントロピーの速度限界を探索することにより、絡み合いの迅速な抑制を観察する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:56:19 GMT)
Improved implicit diffusion model with knowledge distillation to estimate the spatial distribution density of carbon stock in remote sensing imagery [0.0] 本研究は,GF-1 WFV衛星画像を用いて,中国雲南省清市Huize郡を対象とする。
VGGモジュールは初期特徴抽出を改善し、最適化されたパラメータで推論時間を短縮した。
IIDMモデルはRMSEが12.17%と高い推定精度を示し、回帰モデルと比較して41.69%から42.33%改善した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 01:06:05 GMT)
Image Compression Using Novel View Synthesis Priors [0.0] 遠隔操作車両のテザレス制御にはリアルタイム視覚フィードバックが不可欠である。
水中における中距離通信には音響通信が好ましい。
本稿では,従来のミッション情報を利用したモデルベース画像圧縮手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 06:37:21 GMT)
Ground-State Preparation of the Fermi-Hubbard Model on a Quantum Computer with 2D Topology via Quantum Eigenvalue Transformation of Unitary Matrices [0.0] QETUアルゴリズムを2倍のフェルミ・ハッバードモデルに適用する。
本稿では,モデルに合わせた回路単純化を行い,フェミオンスワップネットワークにインスパイアされた9ビットグリッド型ハードウェアアーキテクチャへのマッピングを提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:32:17 GMT)
Gravitational Influence on the Quantum Speed Limit in Flavor Oscillations of Neutrino-Antineutrino System [0.0] エルミート・ディラック・ハミルトニアンの4ベクトル重力ポテンシャルの解析式を導出した。
この重力ポテンシャルは、曲線時空におけるディラック方程式の軸ベクトル項をもたらし、ニュートリノ-反ニュートリノ系の有効質量行列に寄与する。
その結果, BL座標で表される重力場はニュートリノ-ニュートリノ系の2自由振動の遷移確率に大きな影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:48:39 GMT)
Goetterfunke: Creativity in Machinae Sapiens. About the Qualitative Shift in Generative AI with a Focus on Text-To-Image [0.0] 人間とAIのコラボレーションでは、コンピューターはツール以上のものになったようだ。
この記事では、現在の機械学習パラダイムにおけるコンピュータにおける創造性の可能性について述べる。
技術の背後にある重要な概念と、この質的な変化に寄与したイノベーションについて概説している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:16:41 GMT)
Geometry of the Visual Cortex with Applications to Image Inpainting and Enhancement [0.0] 本稿では,低楕円拡散に基づく画像のインペイントと強調のためのアルゴリズムを提案する。
また、この部分リーマン構造を利用して、全く新しいアンシャープフィルタを定義する。
網膜シンチグラフィーにおける血管造影法について検討した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:05:08 GMT)
Generation of vortex electrons by atomic photoionization [0.0] 我々は、第1ボルン近似における原子イオン化において、ツイスト光線から電子への軌道角運動量(OAM)の移動過程を探求する。
励起電子は光子の伝播軸上に1つの原子が配置されている場合、OAMの絶対射影を持つ。
原子の位置をシフトすると、電子OAMの有限分散が得られる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 10:56:21 GMT)
Generating non-Clifford gate operations through exact mapping between Majorana fermions and $\mathbb{Z}_4$ parafermions [0.0] 本稿では,Majorana fermions から $mathbbZ_4$parafermions への正確なマッピングを確立する。
マヨラナフェルミオンのブレイディングは、$mathbbZ_4$パラフェルミオンで囲まれた4次元のキュイト表現において、非クリフォード量子ゲートにつながる可能性がある。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 20:22:38 GMT)
Generating Diverse Synthetic Datasets for Evaluation of Real-life Recommender Systems [0.0] 合成データセットは、機械学習モデルの評価とテストに重要である。
我々は,多様かつ統計的に一貫性のある合成データセットを生成するための新しいフレームワークを開発する。
このフレームワークは、最小限の摩擦で研究を容易にする無料のオープンPythonパッケージとして利用できる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:53:14 GMT)
Functional relevance based on the continuous Shapley value [0.0] この研究は、関数データに基づく予測モデルの解釈可能性に焦点を当てる。
連続ゲームにおけるShapley値に基づく解釈可能性手法を提案する。
この手法は、シミュレーションおよび実データを用いた一連の実験を通して説明される。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:20:00 GMT)
From interpretability to inference: an estimation framework for universal approximators [0.0] 広義の普遍近似器を推定・推定するための新しい枠組みを提案する。
推論は個々のシェープ成分のバイアスと分散特性の分析に依存する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:31:17 GMT)
Frequency redistribution and step-size distribution of light scattered by atomic vapor: applications to Lévy flight random walk [0.0] リーヴィ飛行(L'evy flight)は、大きな尾の階段サイズの分布を持つランダムウォークである。
原子蒸気中における光拡散の周波数再分配関数とステップサイズ分布を計算した。
本研究では, 周波数再分配関数とステップサイズ分布が, 蒸気の有限サイズの影響について検討した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:14:19 GMT)
Fine-Tuning Small Embeddings for Elevated Performance [0.0] この研究はネパール語で事前訓練された6つの注意点を持つ不完全なBERTモデルを採用し、これまで見つからなかったデータに基づいて微調整した。
その結果, オラクルの平均値が良くても, 小さな埋め込みを微調整すると, 元のベースラインに比べて大幅に改善することがわかった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 07:25:07 GMT)
Fine-Tuning Large Language Models for Scientific Text Classification: A Comparative Study [0.0] トランスフォーマーアーキテクチャに基づく大規模言語モデル(LLM)は、自然言語処理(NLP)タスクにおいて大きな成功を収めている。
しかし、汎用LLMは、専門用語や不均衡なデータのような独特な課題のために、科学的なテキストのようなドメイン固有のコンテンツに苦しむことが多い。
本研究では,SciBERT,BioBERT,BlueBERTを3つのデータセットに微調整し,その性能を科学的テキスト分類で評価する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:58:53 GMT)
Feature-Factory: Automating Software Feature Integration Using Generative AI [0.0] Feature-Factoryは、WatsonX.aiとGenerative AIを活用して、機能要求の分析、計画、実装を自動化する。
高度なプロジェクト解析、依存関係の解決、AI生成コードを組み合わせることで、このプログラムはソフトウェアシステムへの機能のシームレスな統合を保証する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:03:47 GMT)
Exploring the Impact of Rewards on Developers' Proactive AI Accountability Behavior [0.0] 我々は、報酬と制裁がAI開発者に与える影響を明らかにするために、自己決定理論に基づく理論モデルを開発する。
各種ドメインの関連研究を調査した結果,典型的な制裁措置とバグ報奨金は潜在的報酬メカニズムとして同定された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:34:44 GMT)
Exotic synchronization in continuous time crystals outside the symmetric subspace [0.0] 誘導散逸スピンモデルにおける対称部分空間の外側の時間-結晶相の安定性について検討する。
この結果、マルチスタビリティが得られ、ダイナミクスは初期状態に依存するようになる。
この多重性はキメラ状態やクラスタ同期のようなエキゾチックな同期をもたらす。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:43:20 GMT)
Enhancing weed detection performance by means of GenAI-based image augmentation [0.0] 本稿では、安定拡散モデルを用いて、雑草検出モデルのための多様な合成画像を生成する、生成AIベースの拡張手法について検討する。
その結果、生成AI拡張データセットでトレーニングしたYOLOモデルの平均精度が大幅に向上した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:00:34 GMT)
Efficient Classical Simulation of the DQC1 Circuit with Zero Discord [0.0] DQC1回路の高速な古典シミュレーションのための経路を示す。
量子不協和によって量子化された非古典的相関は、混合状態量子計算における指数的スピードアップを可能にする鍵となる資源である。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:48:17 GMT)
Dynamics of Quantum Systems in Classical Nonequilibrium Environments [0.0] 量子系の力学は古典的な環境と結合し、平衡からそれを追い出す制約を受ける。
作用素や変数の集合の非平衡平均値に対する正確な運動方程式を導出する。
非平衡定常状態は、そのような状態を特徴づける反応速度と拡散相関関数とともに議論される。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:38:08 GMT)
Dynamic Retail Pricing via Q-Learning -- A Reinforcement Learning Framework for Enhanced Revenue Management [0.0] 本稿では、小売業における動的価格戦略を強化するため、Q-Learningアルゴリズムを用いた強化学習(RL)フレームワークの適用について検討する。
模擬小売環境を構築することで、消費者行動や市場状況のリアルタイム変化にRLが効果的に対処する方法を実証する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:59:06 GMT)
Displaced Fermionic Gaussian States and their Classical Simulation [0.0] この研究は、非ゼロ線型項を持つ非置換フェルミオンガウス作用素を探索する。
まず、変位したガウス状態のいくつかの特徴づけの同値性を示す。
また、置換されたガウス回路に対する効率的な古典的シミュレーションプロトコルも提供する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:05:04 GMT)
DINO-LG: A Task-Specific DINO Model for Coronary Calcium Scoring [0.0] 冠動脈疾患(CAD)は世界中で死亡率の高い疾患の一つである。
UNETアーキテクチャをベースとした従来の方法では、冠動脈カルシウム(CAC)を含む注記CTスキャンの不足など、課題に直面している。
本研究では,DINOの自己教師型学習(SSL)技術を取り入れることで,これらの制約に対処する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:58:41 GMT)
Creating Scalable AGI: the Open General Intelligence Framework [0.0] Open General Intelligence (OGI)は、Artificial General Intelligence (AGI)のマクロデザイン参照として機能する新しいシステムアーキテクチャである。
OGIは、単一のシステムとしてシームレスに動作可能な複数の特別なモジュール間で認識が実行されなければならないという前提に基づいて、インテリジェントシステムの設計にモジュラーアプローチを採用する。
OGIフレームワークは、今日のインテリジェントシステムで見られる課題を克服し、より包括的でコンテキスト対応の問題解決能力を実現することを目的としている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:25:31 GMT)
Continuous Autoregressive Models with Noise Augmentation Avoid Error Accumulation [0.0] 連続自己回帰モデルは、推論中のエラーの蓄積により、拡張シーケンスよりも生成品質が低下する可能性がある。
本稿では,学習中に入力埋め込みにランダムノイズを注入することにより,この問題に対処する新しい手法を提案する。
この研究は、純粋に自己回帰的な環境で連続的な埋め込みを生成する方法を舗装し、リアルタイムおよびインタラクティブな生成アプリケーションに新たな可能性を開く。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:38:20 GMT)
Complexity of Quantum-Mechanical Evolutions from Probability Amplitudes [0.0] 本研究では,フビニ・スタディ計量を備えたブロッホ球面上の任意のソースとターゲット状態とを接続する時間-最適および時間-最適量子ハミルトン進化の複雑さについて検討する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:16:57 GMT)
Coherent deflection of atomic samples and positional mesoscopic superpositions [0.0] 原子試料のコヒーレントな偏向を実現するために,超放射と超吸収の相互作用に基づくプロトコルを提案する。
この運動量移動のコヒーレントな性質は、原子サンプルを全体として偏向させ、原子超放射波パルスの集合的性質と空洞場による超吸収から導かれる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 21:30:44 GMT)
Classification of Deceased Patients from Non-Deceased Patients using Random Forest and Support Vector Machine Classifiers [0.0] 新型コロナウイルス(COVID-19)のパンデミックの間、データマイニング(データマイニング)の患者情報は、患者が死亡のリスクが高いことを示唆するパターンを発見する機会となる。
本研究は, 入院中の患者と入院していない患者を区別することを目的として, 支援ベクトルマシン (SVM) とランダムフォレスト (RF) の分類技術を用いた。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 21:27:54 GMT)
Classical optimisation of reduced density matrix estimations with classical shadows using N-representability conditions under shot noise considerations [0.0] 従来のシャドウトモグラフィーにおける改良型推定器の選択により,従来の研究に基づいて構築した。
我々は,これらの手法がスタンドアローンの古典的シャドウプロトコルの偏りのない推定器より優れている特定の状況について検討する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:13:37 GMT)
Chiral anomaly and internode scatterings in multifold semimetals [0.0] ブリルアンゾーン (BZ) では、ベリー曲率場の単極電荷の符号をノードのキラリティ (chirality) と呼ぶ。
ここでは,マルチフォールドノードを持つ場合のカイラル伝導率の一般形を導出する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:17:26 GMT)
Breaking The Ice: Video Segmentation for Close-Range Ice-Covered Waters [0.0] 北極海での急激な氷の後退は、2060年までには氷のない夏を予測し、新しい海航路を開くが、信頼できる航行手段を必要とする。
現在のアプローチは主観的専門家による判断に大きく依存しており、自動化されたデータ駆動型ソリューションの必要性を強調している。
本研究は, 船載光学データを用いた機械学習による氷条件の評価を行い, 946画像の微妙な注釈付きデータセットを導入した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:52:53 GMT)
Bit symmetry entails the symmetry of the quantum transition probability [0.0] ビット対称性は原子間の遷移確率の対称性を暗示することを示す。
我々は、ビット対称性が古典的ケースと単純ユークリッド・ヨルダン代数以外のすべてのモデルについて規則を定めていると結論づける。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:31:45 GMT)
Biomolecular Analysis of Soil Samples and Rock Imagery for Tracing Evidence of Life Using a Mobile Robot [0.0] 本研究は、火星の生物記号を検出する能力を拡張するため、フェニックス・ローバーに改良を加えたものである。
注目すべき改善の1つは、高度なデジタル顕微鏡画像と分光計の統合である。
システムを強化する可能性は、検出可能なバイオマーカーやバイオシグナチャの範囲を広げる可能性にある。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:38:05 GMT)
Bilayer construction for mixed state phenomena with strong, weak symmetries and symmetry breakings [0.0] 一般混合状態の浄化手法として二層構造を導入する。
両層構造における混合状態現象について検討した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:33:41 GMT)
Bayesian Hierarchical Probabilistic Forecasting of Intraday Electricity Prices [0.0] 本研究は、ドイツの日内取引で取引された電力価格のベイズ予測を初めて示したものである。
ターゲット変数はIDFull価格指数であり、予測は後続の予測分布として与えられる。
絶対誤差で平均5.9,%の減少を含む点測度と確率スコアの大幅な改善を観察する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:19:40 GMT)
Ballistic conductance with and without disorder in a boundary-driven XXZ spin chain [0.0] 解析的手法と数値的手法を組み合わせた古典的変種について検討する。
古典的モデルは量子結果を顕著に再現する。
この現象学は結合障害を包含する上で極めて堅牢であることを示す。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:39:46 GMT)
Autonomous search of real-life environments combining dynamical system-based path planning and unsupervised learning [0.0] 本研究は,カオスカバレッジパスプランナの現実的応用のための新しいフレームワークを開発する。
効果的な障害物回避、カオス軌道分散、正確なリアルタイムカバレッジ計算のための技術を提供する。
このアプリケーションの性能は、従来の最適経路プランナーに匹敵するものだった。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:07:12 GMT)
Automated Literature Review Using NLP Techniques and LLM-Based Retrieval-Augmented Generation [0.0] 本研究では,NLP(Natural Language Processing)技術とLarge Language Model(LLM)を用いたRAG(Research-augmented Generation)を用いて,複数の文献レビューの自動生成手法を提示し,比較する。
周波数ベースの手法(spaCy)、トランスフォーマーモデル(Simple T5)、大規模言語モデル(GPT-3.5-turbo)を用いた検索拡張生成(RAG)など、いくつかの自然言語処理(NLP)戦略の有効性を評価する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 18:27:07 GMT)
Analytical solutions of the open Jaynes-Cummings and quantum Rabi models [0.0] ジャイアンス・カミングスと量子ラビモデルは空洞と回路量子力学の基礎である。
実験でよく見られるシナリオは、ボソニックモードが外部の放散熱浴と相互作用するときに生じる。
開Jaynes-Cummingおよび量子Rabiモデルに対するリンドブラッドマスター方程式の新しい解析解を提案する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 13:04:32 GMT)
Analytic solution to degenerate biphoton states generated in arrays of nonlinear waveguides [0.0] 我々は、非減算ポンプ近似の下での退化二光子状態の進化の解析解を得るためにスーパーモーズ法を用いる。
解析結果は非線形導波路のアレイにおける光の伝播に関する貴重な物理的洞察を与える。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 20:31:54 GMT)
An unconditional distribution learning advantage with shallow quantum circuits [0.0] 浅量子回路仮説を用いた近似分布学習フレームワーク(PAC)において,非条件量子の優位性を証明した。
本研究では,1つの量子ビットゲートと2つの量子ビットゲートを用いた量子回路(QNC0)が,ファンイン古典回路(NC0)よりも優れているという有意義な生成的分布学習問題を仮説クラスの選択として挙げる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:44:36 GMT)
An iterated learning model of language change that mixes supervised and unsupervised learning [0.0] 反復学習モデルは、世代から世代への言語の伝達をシミュレートするエージェントモデルである。
各イテレーションにおいて、言語家庭教師は、ナイーブな瞳孔を限られた発話の訓練セットに公開し、それぞれがランダムな意味とそれを伝達する信号とをペアリングする。
送信ボトルネックは、チューターが経験したトレーニングセットを超えて一般化する必要があることを保証します。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 16:53:31 GMT)
An investigation of the Online Payment and Banking System Apps in Bangladesh [0.0] バングラデシュは国家インフラのデジタル化に力を入れている。
これらのシステムのセキュリティレベルに関する知識が不足しているにも関わらず、現在、あまり考慮せずに頻繁に使用されている。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 17:37:42 GMT)
An indicator for effectiveness of text-to-image guardrails utilizing the Single-Turn Crescendo Attack (STCA) [0.0] Single-Turn Crescendo Attack (STCA)は、テキストからテキストへのAIモデルの倫理的保護を回避するために設計された革新的な方法である。
本研究は,テキスト・ツー・イメージ・モデルにおけるガードレールの堅牢性を評価するための枠組みを提供する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 19:09:16 GMT)
Advancements in Myocardial Infarction Detection and Classification Using Wearable Devices: A Comprehensive Review [0.0] 心筋梗塞 (MI) は、心臓への血流の制限によって引き起こされる重篤な健康状態である。
本稿では,ウェアラブルデバイスにおけるMI分類手法の進歩を概観し,リアルタイムモニタリングと早期診断の可能性を強調した。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 15:42:30 GMT)
Active partitioning: inverting the paradigm of active learning [0.0] 本稿では,新しい汎用分割アルゴリズムを提案する。
複数のモデルがデータセットの予測を反復的に送信する。
データポイント毎の最良の予測は、そのデータポイント上でのトレーニングで報われる。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 11:47:07 GMT)
AI-Driven Smartphone Solution for Digitizing Rapid Diagnostic Test Kits and Enhancing Accessibility for the Visually Impaired [0.0] 本稿では,迅速診断結果解釈の精度と信頼性を高めるための新しい手法を提案する。
このアプリは、ユーザーがテストキットの写真を撮り、YOLOv8が処理して膜領域を正確に抽出する。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 02:53:43 GMT)
A survey on cutting-edge relation extraction techniques based on language models [0.0] 本研究では,関係抽出技術の進化と現状を明らかにする。
以上の結果から, BERT法がREの最先端化に寄与していることが示唆された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 09:04:47 GMT)
A Runtime-Adaptive Transformer Neural Network Accelerator on FPGAs [0.0] ADAPTORは、FPGA上のトランスフォーマーエンコーダとデコーダの高密度行列計算のためのランタイム適応型アクセラレータである。
FPGAプラットフォームにリソースを分散するための効率的な行列タイリングが組み込まれている。
最新のFPGAベースのアクセラレータと比べて1.7~2.25$times$のスピードアップを実現している。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 08:53:19 GMT)
A Novel Approach to Image Steganography Using Generative Adversarial Networks [0.0] 本稿では,GAN(Generative Adversarial Network)のパワーを活用した画像ステガノグラフィー手法を提案する。
慎重に設計されたGANアーキテクチャを用いることで,本手法は,従来のものと視覚的に区別できないステゴイメージの作成を確実にする。
その結果,Pak Signal-to-Noise Ratio (PSNR), Structure similarity Index Measure (SSIM),そして検出に対する堅牢性などの指標が大幅に改善された。
論文参考訳(メタデータ) (Wed, 27 Nov 2024 14:34:41 GMT)