Machine Unlearning Doesn't Do What You Think: Lessons for Generative AI Policy, Research, and Practice [186.1] 非学習はしばしば、生成AIモデルからターゲット情報の影響を取り除くソリューションとして呼び出される。
未学習はまた、モデルが出力中にターゲットとなるタイプの情報を生成するのを防ぐ方法として提案されている。
これら2つの目標 - モデルからの情報の標的的除去と、モデル出力からの情報のターゲット的抑制 - は、様々な技術的および現実的な課題を表す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:18:43 GMT)
Political-LLM: Large Language Models in Political Science [160.0] 大規模言語モデル(LLM)は、政治科学のタスクで広く採用されている。
政治LLMは、LLMを計算政治科学に統合する包括的な理解を促進することを目的としている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:47:50 GMT)
LoRA of Change: Learning to Generate LoRA for the Editing Instruction from A Single Before-After Image Pair [116.5] 視覚的指示を用いた画像編集のためのLoRA of Change (LoC) フレームワークを提案する。
我々は、命令固有のLoRAを学習し、事前のイメージペアで「変更」を符号化し、モデルの解釈可能性と再利用性を高める。
本モデルでは,ユーザ意図に整合した高品質な画像を生成し,現実世界の視覚的指示の幅広い範囲をサポートする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:14:55 GMT)
Bridging the Divide: Reconsidering Softmax and Linear Attention [116.3] 線形注意の限界を理解し緩和する2つの重要な視点を提示する。
線形注意は単射ではなく、異なるクエリベクトルに同一の注意重みを割り当てる傾向があることを証明した。
第2に,線形の注意が不足するソフトマックスの注意を成功させるためには,効果的な局所モデリングが不可欠であることを確認した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:44:22 GMT)
Driv3R: Learning Dense 4D Reconstruction for Autonomous Driving [116.1] マルチビュー画像シーケンスからフレーム単位のポイントマップを直接回帰するフレームワークであるDriv3Rを提案する。
我々は4次元フロー予測器を用いてシーン内の移動物体を識別し、これらの動的領域の再構築をより重視する。
Driv3Rは4D動的シーン再構築において従来のフレームワークより優れており、推論速度は15倍高速である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:58:03 GMT)
xRAG: Extreme Context Compression for Retrieval-augmented Generation with One Token [108.7] xRAGは、検索拡張生成に適した、革新的なコンテキスト圧縮手法である。
xRAGは、言語モデル表現空間に文書の埋め込みをシームレスに統合する。
実験の結果、xRAGは6つの知識集約タスクで平均10%以上の改善を達成していることがわかった。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:07:03 GMT)
Predictive Models in Sequential Recommendations: Bridging Performance Laws with Data Quality Insights [104.5] 本稿では,モデル性能とデータ品質の関係を理論的に検討し,モデル化することを目的としたSRモデルの性能法則を紹介する。
データ品質を評価するために、従来のデータ量メトリクスと比較して、より曖昧なアプローチを示すために、近似エントロピー(ApEn)を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:46:37 GMT)
ProVision: Programmatically Scaling Vision-centric Instruction Data for Multimodal Language Models [103.3] 既存のプラクティスは命令データを生成するために、強力だが高価な言語モデル(LLM)やマルチモーダル言語モデル(MLM)に依存している。
本稿では,シーングラフを画像のシンボル表現として利用し,視覚中心の命令データを体系的に合成するプログラムを提案する。
提案手法は,データ生成プロセスの解釈可能性と制御性を保証し,実際の精度を維持しながら効率よくスケールする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 21:44:02 GMT)
PrEditor3D: Fast and Precise 3D Shape Editing [100.1] 本稿では,1つの形状の編集を数分以内に行うことができる3D編集のためのトレーニングフリーアプローチを提案する。
編集された3Dメッシュはプロンプトとよく一致しており、変更を意図していない領域でも同じである。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:44:47 GMT)
Visual Lexicon: Rich Image Features in Language Space [99.9] ViLexは、リッチなセマンティックコンテンツと詳細な視覚的詳細を同時にキャプチャする。
ViLexは、凍結されたテキスト・ツー・イメージ(T2I)拡散モデルを用いて入力画像の再構成に最適化されたトークンを生成する。
言語空間に埋め込まれた画像として、ViLexトークンは自然言語の合成性を利用する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:57:24 GMT)
SiReRAG: Indexing Similar and Related Information for Multihop Reasoning [96.6] SiReRAGは、類似情報と関連する情報の両方を明示的に考慮する新しいRAGインデックス方式である。
SiReRAGは、3つのマルチホップデータセットの最先端インデックス手法を一貫して上回る。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:56:43 GMT)
OW-VISCapTor: Abstractors for Open-World Video Instance Segmentation and Captioning [95.7] オープンワールドビデオインスタンスのセグメンテーションとキャプション」を新たに提案する。
検出、セグメンテーション、追跡、記述、リッチなキャプションによる記述は、これまで見たこともない。
我々は、オブジェクト抽象体とオブジェクトからテキストへの抽象体を開発する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:19:05 GMT)
On How Iterative Magnitude Pruning Discovers Local Receptive Fields in Fully Connected Neural Networks [92.7] イテレーティブ・マグニチュード・プルーニング(IMP)は、高性能にトレーニング可能なスパースワークを抽出する一般的な方法となっている。
近年の研究では、IMPを完全連結ニューラルネットワーク(FCN)に適用することは、局所受容野(RF)の出現につながることが示されている。
本稿では,非ガウス統計をFCNの表現に反復的に最大化し,局所性を高めるフィードバックループを作成することを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:56:23 GMT)
EMOv2: Pushing 5M Vision Model Frontier [92.2] 様々な下流タスクにおいて,5M級軽量モデルの新たなフロンティアを構築した。
我々の研究は、Transformerにおける効率的なIRBと実用的なコンポーネントの軽量なインフラを再考する。
4G/5G帯でモデルをダウンロードする場合のモバイルユーザの遅延を考慮し,5M程度の軽量モデルの性能上限について検討する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:12:22 GMT)
PPT: Pre-Training with Pseudo-Labeled Trajectories for Motion Forecasting [90.5] 自律走行のための運動予測は、複雑な都市シナリオにおける周辺エージェントの軌道予測を目的としている。
本研究では,擬似ラベル付きデータを用いたMFトレーニングにおいて,まず擬似ラベル付きデータを用いた事前学習動作予測を行い,注釈付きデータによる微調整を行う混合戦略について検討する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:48:15 GMT)
TopoX: A Suite of Python Packages for Machine Learning on Topological Domains [89.4] TopoXはPythonのソフトウェアスイートで、トポロジ上のコンピューティングと機械学習のための信頼性とユーザフレンドリなビルディングブロックを提供する。
TopoXは、TopoNetX、TopoEmbedX、TopoModelXの3つのパッケージで構成されている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:29:37 GMT)
UniSDF: Unifying Neural Representations for High-Fidelity 3D Reconstruction of Complex Scenes with Reflections [87.2] 大規模な複雑なシーンをリフレクションで再構成できる汎用3次元再構成手法UniSDFを提案する。
提案手法は,複雑な大規模シーンを細部と反射面で頑健に再構築し,全体的な性能を向上する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:19:58 GMT)
Training Large Language Models to Reason in a Continuous Latent Space [84.6] 我々は,制約のない潜在空間における大規模言語モデル(LLM)推論の可能性を探るため,新しいパラダイムであるCoconut (Chain of Continuous Thought)を導入する。
実験により、ココナッツはいくつかの推論タスクにおいてLLMを効果的に増強できることが示されている。
これらの知見は、潜伏推論の可能性を実証し、将来の研究に価値ある洞察を与える。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:55:56 GMT)
Enhancing Graph Contrastive Learning with Reliable and Informative Augmentation for Recommendation [84.5] 離散コードによるより強力な協調情報を用いて、コントラスト的なビューを構築することにより、グラフのコントラスト学習を強化することを目的とした、新しいフレームワークを提案する。
中心となる考え方は、ユーザとアイテムを協調情報に富んだ離散コードにマッピングし、信頼性と情報に富んだコントラッシブなビュー生成を可能にすることである。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:44:27 GMT)
Data Free Backdoor Attacks [83.1] DFBAは、モデルアーキテクチャを変更することなく、リトレーニングフリーでデータフリーのバックドア攻撃である。
我々の注入されたバックドアは、様々な最先端の防御策によって、検出不可能で、検出不能であることを確認した。
複数のデータセットに対する評価では,1) 無視可能な分類損失,2) 攻撃成功率,3) 既存の6つの防御を回避している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 05:30:25 GMT)
DenseVLM: A Retrieval and Decoupled Alignment Framework for Open-Vocabulary Dense Prediction [80.7] DenseVLMは、非バイアスの領域言語アライメントを、強力な事前学習型VLM表現から学習するためのフレームワークである。
我々は、DenseVLMをオープン語彙オブジェクト検出と画像分割タスクにシームレスに統合できることを示し、顕著な性能改善を実現した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:34:23 GMT)
Learning Interpretable Concepts: Unifying Causal Representation Learning and Foundation Models [80.3] 人間の解釈可能な概念をデータから学習する方法を研究する。
両分野からアイデアをまとめ、多様なデータから概念を確実に回収できることを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:00:53 GMT)
Hard Nominal Example-aware Template Mutual Matching for Industrial Anomaly Detection [78.7] 異常検出器は、クエリー画像の未知の欠陥を検出し、ローカライズするために工業製造で広く使われている。
これらの検出器は異常のないサンプルで訓練され、ほとんどの通常のサンプルと区別された異常を成功させた。
しかし、ハードノーマルな例は、ほとんどの通常のサンプルから遠く離れており、しばしば既存の方法によって異常と誤認される。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 05:38:05 GMT)
DexDiffuser: Interaction-aware Diffusion Planning for Adaptive Dexterous Manipulation [78.6] 高度なロボティクスにとって、接触に富んだ相互作用による有害な操作が不可欠である。
本稿では,適応的デキスタラス操作のための対話型拡散計画フレームワークであるDexDiffuserを紹介する。
本フレームワークは30度のドア開口で70.0%,ペンとブロックの半面配向で40.0%,ハンマーの半面駆動で46.7%を達成している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:28:07 GMT)
FREE: Faster and Better Data-Free Meta-Learning [77.9] Data-Free Meta-Learning (DFML) は、トレーニング済みモデルのコレクションから、元のデータを必要としない知識を抽出することを目的としている。
i)事前訓練されたモデルからトレーニングタスクを迅速に回復するためのメタジェネレータ,(ii)新しい未知のタスクに一般化するためのメタラーナーを含む、より高速で優れたデータフリーなメタラーニングフレームワークを紹介する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:05:23 GMT)
Ranking-aware adapter for text-driven image ordering with CLIP [76.8] 本稿では,CLIPモデルを学習からランクへのタスクに再構成する,効率的かつ効率的な手法を提案する。
テキスト誘導画像ランキングのためのCLIPの軽量アダプタを提案する。
我々のアプローチは、画像間の視覚的差異から自然で一般化された学習方法を提供する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:51:05 GMT)
A Global Depth-Range-Free Multi-View Stereo Transformer Network with Pose Embedding [76.4] 本稿では,事前の深度範囲を排除した新しい多視点ステレオ(MVS)フレームワークを提案する。
長距離コンテキスト情報を集約するMDA(Multi-view Disparity Attention)モジュールを導入する。
ソース画像のエピポーラ線上のサンプリング点に対応する電流画素の品質を明示的に推定する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:05:59 GMT)
xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering the Language of Protein [74.6] 本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。
xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。
また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:44:44 GMT)
Video Decomposition Prior: A Methodology to Decompose Videos into Layers [74.4] 本稿では,プロのビデオ編集の実践からインスピレーションを得た,VDP以前の新しいビデオ分解手法を提案する。
VDPフレームワークは、ビデオシーケンスを複数のRGBレイヤと関連する不透明度レベルに分解する。
ビデオオブジェクトのセグメンテーション、デハジング、リライティングといったタスクに対処する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:01:28 GMT)
How to Merge Your Multimodal Models Over Time? [73.1] 我々は3つの軸にまたがる時間モデルを定義するTIMEという統合フレームワークを提案する。
本稿では,FoMo-in-Fluxベンチマークを用いて,モデルサイズ,計算予算,学習地平線にまたがる時間モデルについて検討する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:01:13 GMT)
Policy Agnostic RL: Offline RL and Online RL Fine-Tuning of Any Class and Backbone [72.2] ポリシーに依存しないRL(PA-RL)と呼ばれるオフラインおよびオンラインの微調整手法を開発する。
オンラインRLファインチューニングアルゴリズムであるCal-QLを用いて、7BジェネラリストロボットポリシーであるOpenVLAのファインチューニングに成功した最初の結果を示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:28:03 GMT)
UAV Virtual Antenna Array Deployment for Uplink Interference Mitigation in Data Collection Networks [71.2] 無人航空機(UAV)は、航空無線ネットワークと通信を確立するためのプラットフォームとして注目されている。
本稿では,複数UAVネットワークシステムにおける協調ビームフォーミング(CB)法に基づく新しいアップリンク干渉緩和手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:56:50 GMT)
Data Attribution for Text-to-Image Models by Unlearning Synthesized Images [71.2] テキスト・ツー・イメージ・モデルにおけるデータ帰属の目標は、新しい画像の生成に最も影響を与えるトレーニング画像を特定することである。
合成画像の非学習をシミュレートして効率的なデータ帰属法を提案する。
次に,学習過程の終了後に有意な損失偏差を伴う訓練画像を特定し,これらを影響力のあるものとしてラベル付けする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:58:10 GMT)
WeatherGFM: Learning A Weather Generalist Foundation Model via In-context Learning [69.8] 第1次一般気象基礎モデル(WeatherGFM)を紹介する。
気象理解タスクの幅広い範囲を統一的な方法で解決する。
我々のモデルは、天気予報、超解像、天気画像翻訳、後処理など、最大10の気象理解タスクを効果的に処理できる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:25:35 GMT)
ERM++: An Improved Baseline for Domain Generalization [69.8] 経験的リスク最小化(ERM)は、適切に調整された場合、最も複雑なドメイン一般化(DG)手法より優れている。
ERM++は以前のEMMベースラインと比較してDGのパフォーマンスを5%以上改善している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:26:08 GMT)
Dynamic EventNeRF: Reconstructing General Dynamic Scenes from Multi-view Event Cameras [69.7] 動的シーンのボリューム再構成はコンピュータビジョンにおいて重要な問題である。
照明が悪く、動きが速い場合には特に困難である。
本稿では,スパースなマルチビューイベントストリームとスパースなRGBフレームからシーンを時間的に再構築する手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:56:18 GMT)
Refusal Tokens: A Simple Way to Calibrate Refusals in Large Language Models [67.7] 安全で信頼性の高い言語モデルを構築する上で重要な要素は、モデルが特定の質問に答えることを適切に拒否することである。
本稿では,学習中のモデルの応答に先立って,各拒絶カテゴリに対する1つのそのようなトークン,あるいは1つの拒絶トークンを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:40:44 GMT)
Grounding Multimodal Large Language Models in Actions [65.9] 我々はMLLMを異なる実施形態とその関連する行動空間にベストグラウンドする方法について研究する。
連続的な動作に対しては、学習されたトークン化が十分なモデリング精度を実現することが示される。
離散的な動作に対して、これらの動作をMLLMのネイティブな出力トークン空間と意味的に整合させることが、最も高いパフォーマンスをもたらすことを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 05:45:00 GMT)
Prototypical Hash Encoding for On-the-Fly Fine-Grained Category Discovery [65.2] カテゴリ対応プロトタイプ生成(CPG)とディスクリミカテゴリ5.3%(DCE)が提案されている。
CPGは、各カテゴリを複数のプロトタイプで表現することで、カテゴリ内の多様性を完全にキャプチャすることを可能にする。
DCEは生成されたカテゴリプロトタイプのガイダンスによってハッシュコードの識別能力を向上する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:47:36 GMT)
Mastering Collaborative Multi-modal Data Selection: A Focus on Informativeness, Uniqueness, and Representativeness [65.0] 我々は、貴重なサンプルはタスクを知らせ、非冗長であり、サンプル分布(つまり、外れ値ではない)を表すべきであると論じる。
我々は、効果的なデータ選択のために、インフォーマル性、ユニーク性、代表性という3つの重要な原則を活用するコラボレーティブフレームワーク、DataTailorを提案する。
様々なベンチマークの実験により、DataTailorはデータの15%でフルデータの微調整のパフォーマンスの100.8%を達成している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:36:10 GMT)
Ranked from Within: Ranking Large Multimodal Models for Visual Question Answering Without Labels [64.9] 大規模マルチモーダルモデル(LMM)は、様々なアプリケーションにまたがってますます展開されている。
従来の評価方法は、主にデータセット中心であり、固定されたラベル付きデータセットと教師付きメトリクスに依存している。
ソフトマックス確率などの不確実性信号を利用したLMMの教師なしモデルランキングについて検討する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:05:43 GMT)
Deblur4DGS: 4D Gaussian Splatting from Blurry Monocular Video [64.4] Deblur4DGSという,ぼやけたモノクロビデオから高品質な4Dモデルを再構成するための,最初の4Dガウス分割フレームワークを提案する。
本稿では,多面的,多面的整合性,多面的,多面的,多面的な整合性を実現するために露光規則化を導入し,斬新な視点以外では,デブレア4DGSは,デブロアリング,フレーム合成,ビデオ安定化など,多面的な視点からぼやけた映像を改善するために応用できる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:02:11 GMT)
Not All Errors Are Equal: Investigation of Speech Recognition Errors in Alzheimer's Disease Detection [62.9] アルツハイマー病(AD)の自動診断における音声認識の役割
近年の研究では,単語誤り率(WER)とAD検出性能の非線形関係が明らかにされている。
本研究は,BERTを用いたAD検出システムにおけるASR転写誤りの影響について,一連の解析を行った。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:32:20 GMT)
ProcessBench: Identifying Process Errors in Mathematical Reasoning [62.8] 本稿では,数学的推論における誤ったステップを識別する能力を測定するためのProcessBenchを紹介する。
ProcessBenchは3400のテストケースで構成され、主に競合とオリンピアードレベルの数学問題に焦点を当てている。
我々はProcessBenchについて、プロセス報酬モデル(PRM)と批判モデルという2種類のモデルを含む広範囲な評価を行う。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:11:40 GMT)
From Novice to Expert: LLM Agent Policy Optimization via Step-wise Reinforcement Learning [62.5] 本稿では,エージェントの強化学習プロセスの最適化にステップワイド報酬を利用するStepAgentを紹介する。
エージェント反射とポリシー調整を容易にする暗黙の逆・逆の強化学習手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:20:11 GMT)
SphereUFormer: A U-Shaped Transformer for Spherical 360 Perception [61.7] 本研究では,新たなSpherical Local Self-Attention'と他の球面指向モジュールを組み込むことで,球面領域での動作を成功させ,360$Dの認識ベンチマークにおいて,深度推定とセマンティックセグメンテーションの精度を向上するトランスフォーマアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:23:10 GMT)
Seeing Beyond Views: Multi-View Driving Scene Video Generation with Holistic Attention [61.3] 高品質なマルチビュー駆動ビデオの合成を目的とした,新しいネットワークであるCogDrivingについて紹介する。
CogDriving は Diffusion Transformer アーキテクチャと holistic-4D attention module を活用し、次元間の同時結合を可能にする。
CogDrivingは、nuScenesバリデーションセットで強力なパフォーマンスを示し、FVDスコア37.8を達成し、リアルなドライビングビデオを生成する能力を強調している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:58:05 GMT)
Class Balance Matters to Active Class-Incremental Learning [61.1] まず、大規模な未ラベルデータのプールから始めて、インクリメンタルな学習のための最も情報に富んだサンプルを注釈付けします。
そこで我々は,クラスバランスと情報提供性を両立させるため,クラスバランス選択(CBS)戦略を提案する。
我々のCBSは、プリトレーニング済みモデルとプロンプトチューニング技術に基づいて、これらのCILメソッドに接続し、再生することができる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:37:27 GMT)
Category-Adaptive Cross-Modal Semantic Refinement and Transfer for Open-Vocabulary Multi-Label Recognition [59.2] 本稿では,カテゴリ適応型クロスモーダル・セマンティック・リファインメント・アンド・トランスファー(C$2$SRT)フレームワークを提案する。
提案するフレームワークは,2つの相補的モジュール,すなわち,カテゴリ内セマンティックリファインメント(ISR)モジュールと,カテゴリ間セマンティックトランスファー(IST)モジュールから構成される。
OV-MLRベンチマークの実験は、提案されたC$2$SRTフレームワークが現在の最先端アルゴリズムより優れていることを明らかに示している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:00:18 GMT)
OmniEvalKit: A Modular, Lightweight Toolbox for Evaluating Large Language Model and its Omni-Extensions [58.5] 我々は,Large Language Models (LLMs) を評価するために設計された,新しいベンチマークツールボックスであるOmniEvalKitを紹介する。
単一の側面にフォーカスする既存のベンチマークとは異なり、OmniEvalKitはモジュール化され、軽量で、自動評価システムを提供する。
Static BuilderとDynamic Data Flowで構成されるモジュールアーキテクチャで構成されており、新しいモデルとデータセットのシームレスな統合を促進する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:39:43 GMT)
PyPulse: A Python Library for Biosignal Imputation [58.4] PyPulseは,臨床およびウェアラブルの両方のセンサ設定において生体信号の計算を行うPythonパッケージである。
PyPulseのフレームワークは、非機械学習バイオリサーバーを含む幅広いユーザーベースに対して、使い勝手の良いモジュラーで拡張可能なフレームワークを提供する。
PyPulseはMITライセンスでGithubとPyPIでリリースしました。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:00:55 GMT)
StableMoFusion: Towards Robust and Efficient Diffusion-based Motion Generation Framework [58.3] 人間の動作生成のための堅牢で効率的なフレームワークであるStableMoFusionを提案する。
我々は、効率的な高品質な人体運動生成のための各コンポーネントを調整する。
足底接触を同定し, 足底運動の補正を行う。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:43:56 GMT)
Towards Long Video Understanding via Fine-detailed Video Story Generation [58.3] 長いビデオ理解はコンピュータビジョンにおいて重要な課題となり、監視からコンテンツ検索まで多くのアプリケーションで進歩を遂げている。
既存のビデオ理解手法は、複雑な長期コンテキスト関係モデリングと冗長性からの干渉という、長いビデオ理解を扱う際の2つの課題に悩まされる。
長い動画を詳細なテキスト表現に変換するFDVS(Fin-Detailed Video Story Generation)を紹介した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:41:28 GMT)
ZeroKey: Point-Level Reasoning and Zero-Shot 3D Keypoint Detection from Large Language Models [57.6] 3次元形状のキーポイント検出のための新しいゼロショット手法を提案する。
提案手法は,マルチモーダル大規模言語モデルに埋め込まれた豊富な知識を利用する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:31:57 GMT)
LLM Pruning and Distillation in Practice: The Minitron Approach [57.6] Llama 3.1 8B および Mistral NeMo 12B モデルを 4B および 8B パラメータに圧縮する。
1)深い刈り込みと(2)隠れた/保持/MLP(幅)刈り込みという2つの異なる刈り出し方を探る。
このアプローチは、Llama 3.1 8Bから魅力的な4Bモデル、Mistral NeMo 12Bから最先端のMistral-NeMo-Minitron-8Bモデルを生成する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:31:01 GMT)
MV-DUSt3R+: Single-Stage Scene Reconstruction from Sparse Views In 2 Seconds [56.8] 本稿では,高速な単一ステージフィードフォワードネットワークMV-DUSt3Rを提案する。
コアとなるのはマルチビューデコーダブロックで、単一の参照ビューを考慮しながら、任意のビュー間で情報を交換する。
さらに,参照ビュー選択に頑健な手法として,参照ビュー選択の異なる情報を融合するために,参照ビューブロックを用いたMV-DUSt3R+を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:34:55 GMT)
Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection [56.7] オープンセットのリアクティブかつアクティブな障害検出のためのCode-as-Monitor(CaM)を提案する。
モニタリングの精度と効率を高めるために,制約関連エンティティを抽象化する制約要素を導入する。
実験により、CaMは28.7%高い成功率を達成し、厳しい乱れの下で実行時間を31.8%短縮することが示された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:07:24 GMT)
Can foundation models actively gather information in interactive environments to test hypotheses? [56.7] 隠れた報酬関数に影響を与える要因をモデルが決定しなければならない枠組みを導入する。
自己スループットや推論時間の増加といったアプローチが情報収集効率を向上させるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:27:21 GMT)
Auditing Fairness under Unobserved Confounding [56.6] 意外なことに、リスクの高い人に対する治療率の有意義な限界を計算できることが示されています。
現実の多くの環境では、リスクの偏りのない見積を導き出すために、アロケーションの前にデータを持っているという事実を使用します。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:30:38 GMT)
Mixed Diffusion for 3D Indoor Scene Synthesis [55.9] 提案するMiDiffusionは,可塑性3次元屋内シーンを合成するための混合離散連続拡散モデルである。
床条件の3次元シーン合成において,最先端の自己回帰モデルおよび拡散モデルより優れることを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 22:33:30 GMT)
Understanding Factual Recall in Transformers via Associative Memories [55.9] 浅層変圧器は、連想記憶の組み合わせを用いて、ほぼ最適な記憶能力を得ることができることを示す。
本研究では, 1層に1つの自己注意を持つ変圧器にパラメータを付加することにより, ファクトリコールタスクにおいて100%の精度が得られることを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:48:14 GMT)
Boosting Alignment for Post-Unlearning Text-to-Image Generative Models [55.8] 大規模な生成モデルは、大量のデータによって推進される印象的な画像生成能力を示している。
これはしばしば必然的に有害なコンテンツや不適切なコンテンツを生み出し、著作権の懸念を引き起こす。
学習しない反復ごとに最適なモデル更新を求めるフレームワークを提案し、両方の目的に対して単調な改善を確実にする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 21:36:10 GMT)
Retrieving Semantics from the Deep: an RAG Solution for Gesture Synthesis [55.5] RAG-Gestureは、意味的に豊かなジェスチャーを生成するための拡散に基づくジェスチャー生成手法である。
我々は、明示的なドメイン知識を用いて、共同音声ジェスチャーのデータベースから動きを検索する。
提案手法では,各検索挿入が生成したシーケンスに対して与える影響量を調整可能なガイダンス制御パラダイムを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:59:46 GMT)
Pangea: A Fully Open Multilingual Multimodal LLM for 39 Languages [55.4] 本稿では,39言語にまたがる多様な6M命令データセットに基づいて訓練された多言語多言語多言語大言語モデル(MLLM)であるPangeaを紹介する。
P Pangeaは、多言語設定や多様な文化的コンテキストにおいて、既存のオープンソースモデルよりも大幅に優れています。
我々は、包括的で堅牢な多言語MLLMの開発を容易にするために、データ、コード、訓練されたチェックポイントを完全にオープンソースにしています。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:47:26 GMT)
On the Convergence of Gradient Descent for Large Learning Rates [55.3] 固定ステップサイズを使用すると収束が不可能であることを示す。
正方形損失を持つ線形ニューラルネットワークの場合,これを証明した。
また、勾配に対するリプシッツ連続性のような強い仮定を必要とせず、より一般的な損失に対する収束の不可能性も証明する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:41:53 GMT)
Learning-based Multi-View Stereo: A Survey [55.3] MVS(Multi-View Stereo)アルゴリズムは、複雑な環境における正確な再構築を可能にする包括的な3D表現を合成する。
ディープラーニングの成功により、多くの学習ベースのMVS手法が提案され、従来の手法に対して優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:53:46 GMT)
WildGuard: Open One-Stop Moderation Tools for Safety Risks, Jailbreaks, and Refusals of LLMs [54.1] LLM安全性のためのオープンで軽量なモデレーションツールであるWildGuardを紹介します。
WildGuardは、ユーザプロンプトにおける悪意のある意図の特定、モデルレスポンスの安全性リスクの検出、モデル拒絶率の決定という3つの目標を達成する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:21:56 GMT)
Synergistic Development of Perovskite Memristors and Algorithms for Robust Analog Computing [53.8] 本稿では,ペロブスカイト・メムリスタの製作を同時に最適化し,ロバストなアナログDNNを開発するための相乗的手法を提案する。
BO誘導ノイズインジェクションを利用したトレーニング戦略であるBayesMultiを開発した。
我々の統合されたアプローチは、より深くより広いネットワークでのアナログコンピューティングの使用を可能にし、最大100倍の改善を実現します。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:56:08 GMT)
Local Attention Transformers for High-Detail Optical Flow Upsampling [52.7] 現在広く採用されている凸アップサンプリング手法のいくつかの問題点と限界について論じる。
我々は, 最終凸アップサンプラーの重みを分離し, 正確な凸結合を見つけるのを容易にすることを提案する。
我々は,注目に基づく代替凸アップサンプラーを用いて,凸マスクサイズを増大させる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:30:59 GMT)
PPFlow: Target-aware Peptide Design with Torsional Flow Matching [52.6] ペプチド構造設計のためのねじれ角の内部構造をモデル化するために,textscPPFlowと呼ばれるターゲット認識型ペプチド設計手法を提案する。
さらに, PPBench2024というタンパク質-ペプチド結合データセットを構築した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:49:18 GMT)
What If We Had Used a Different App? Reliable Counterfactual KPI Analysis in Wireless Systems [52.5] 本稿では、RANによって異なるアプリが実装された場合のトラフィックの値を推定する問題に対処する。
本稿では,無線システムに対する共形予測に基づく対実解析手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:28:13 GMT)
Splatter-360: Generalizable 360$^{\circ}$ Gaussian Splatting for Wide-baseline Panoramic Images [52.5] textitSplatter-360は、ワイドベースラインパノラマ画像を扱うための、エンドツーエンドの汎用3DGSフレームワークである。
パノラマ画像に固有の歪みを緩和する3D対応複投影エンコーダを提案する。
これにより、堅牢な3D対応機能表現とリアルタイムレンダリングが可能になる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:58:31 GMT)
World-Consistent Data Generation for Vision-and-Language Navigation [52.1] VLN(Vision-and-Language Navigation)は、自然言語の指示に従って、エージェントがフォトリアリスティックな環境をナビゲートする必要がある課題である。
VLNの主な障害はデータの不足であり、目に見えない環境における一般化性能の低下につながる。
多様性と世界整合性の両方を満たす効率的なデータ拡張フレームワークである世界整合データ生成(WCGEN)を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:40:54 GMT)
LLMs for Generalizable Language-Conditioned Policy Learning under Minimal Data Requirements [50.5] 本稿では,オフライン言語によるポリシー学習のための新しいトレーニングパイプラインTEDUOを提案する。
TEDUOは、分かりやすい、ラベルなしのデータセットを運用し、いわゆるインザワイルド評価(in-the-wild evaluation)に適している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:43:56 GMT)
CityX: Controllable Procedural Content Generation for Unbounded 3D Cities [50.1] 現在の生成法は多様性、可制御性または忠実度に乏しい。
本研究では,高忠実度生成のための手続き的コンテンツ生成(PCG)技術を利用する。
我々は,OSM,セマンティックマップ,衛星画像などのマルチモーダル命令を実行可能なプログラムに変換するマルチエージェントフレームワークを開発した。
提案手法はCityXと呼ばれ,多種多様で制御可能でリアルな3D都市景観の創出において,その優位性を実証するものである。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:30:26 GMT)
Jailbreak Attacks and Defenses against Multimodal Generative Models: A Survey [50.0] マルチモーダル生成モデルは、ビルトインの安全機構をバイパスし、潜在的に有害なコンテンツの生成を誘導できる、ジェイルブレイク攻撃の影響を受けやすい。
本稿では,マルチモーダル生成モデルに特有の攻撃方法,防御機構,評価フレームワークの詳細な分類について述べる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:22:14 GMT)
Automated Label Unification for Multi-Dataset Semantic Segmentation with GNNs [48.4] 本稿では,グラフニューラルネットワークを用いて,複数のデータセットにまたがる統一ラベル空間を自動構築する手法を提案する。
従来の手法と異なり,本手法は手動の注釈や分類の調整を必要とせず,シームレスな訓練を容易にする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:52:17 GMT)
ILLUME: Illuminating Your LLMs to See, Draw, and Self-Enhance [47.5] 本稿では,一大言語モデルにマルチモーダル理解と生成機能をシームレスに統合する統合型マルチモーダル言語モデル (MLLM) であるILLUMEを紹介する。
画像テキストアライメントに通常必要となる大規模なデータセットサイズに対処するため,視覚トークン化器の設計によるデータ効率の向上を提案する。
従来の研究で探索されていない理解と生成能力の相乗的向上を促進するために,我々は,新しい自己向上型マルチモーダルアライメント方式を導入する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:11:50 GMT)
Homogeneous Dynamics Space for Heterogeneous Humans [47.3] ホモジニアス・ダイナミクス・スペース(HDyS)は、異種データを集約し、逆フォワード・ダイナミックス法からインスピレーションを得て、均質な潜在空間を訓練することにより、人間のダイナミクスの基本空間である。
広汎な実験と応用によるHDySの実現可能性を示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:59:40 GMT)
Advancing Extended Reality with 3D Gaussian Splatting: Innovations and Prospects [47.1] 3D Gaussian Splatting (3DGS)は、3D表現、レンダリング、インタラクションに革命をもたらす可能性に対して大きな注目を集めている。
3DGS研究の急速な発展にもかかわらず、拡張現実(XR)への直接の応用はいまだに未調査である。
本稿では,XRの研究開発を進展させる具体的な可能性を示す3DGSのイノベーションを合成することを目的としている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:14:58 GMT)
Rethinking Reward Model Evaluation: Are We Barking up the Wrong Tree? [46.4] RMの精度の違いが、最適化されたポリシー性能のギャップにどのように変換されるかを検討する。
我々は、RM品質の測定に使用する精度が、潜在的なRM過度な最適化を十分に捉えることができないことを認識している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 05:06:20 GMT)
When Dimensionality Reduction Meets Graph (Drawing) Theory: Introducing a Common Framework, Challenges and Opportunities [46.1] 次元の低減とグラフ解析は、可視化研究において人気のある2つのサブフィールドである。
本稿では,DRとグラフ(描画)理論のギャップを埋める一元化フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:03:22 GMT)
FlexEvent: Event Camera Object Detection at Arbitrary Frequencies [45.8] イベントカメラは、動的環境におけるリアルタイムの知覚に相容れないアドバンテージを提供する。
既存のイベントベースのオブジェクト検出方法は固定周波数パラダイムによって制限される。
任意の周波数で検出できる新しいイベントカメラオブジェクト検出フレームワークFlexEventを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:57:14 GMT)
A Self-guided Multimodal Approach to Enhancing Graph Representation Learning for Alzheimer's Diseases [45.6] グラフニューラルネットワーク(GNN)は、不規則に構造化されたデータを扱うように設計された強力な機械学習モデルである。
本稿では,ドメイン知識を自律的にモデル開発プロセスに組み込む自己誘導型知識注入型マルチモーダルGNNを提案する。
提案手法は,ドメイン知識を自然言語として概念化し,未処理の知識を活用できる専門的なマルチモーダルGNNを導入する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 05:16:32 GMT)
Integrative Decoding: Improve Factuality via Implicit Self-consistency [45.3] 自己整合性に基づくアプローチは,大規模言語モデルの現実的精度向上に極めて有効である。
我々は、オープンな生成タスクにおける自己整合性の可能性を解き放つために、統合的復号化(ID)を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:55:03 GMT)
Personalized Language Modeling from Personalized Human Feedback [45.2] パーソナライズされた大規模言語モデル(LLM)は、個々のユーザの好みに応答するように設計されている。
個人の好みを捉えるために軽量なユーザモデルを利用する効率的なフレームワークであるPersonalized-RLHFを提案する。
P-RLHF を用いて学習したパーソナライズされた LLM は,個々のユーザの好みとより密に一致した応答を生成する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:21:08 GMT)
Proactive Agents for Multi-Turn Text-to-Image Generation Under Uncertainty [45.1] そこで本研究では,不確かさを解消するためのインタフェースを備えたプロアクティブなT2Iエージェントの設計を提案する。
このようなエージェントの簡単なプロトタイプを作成し、人間の研究と自動評価の両方を通してその有効性を検証する。
我々は,これらのT2Iエージェントが,標準的なシングルターンT2I世代よりも少なくとも2倍高いVQAScoreのアライメントを達成するために,有意な質問をし,重要な情報を引き出すことができたことを観察した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:56:32 GMT)
Entrywise application of non-linear functions on orthogonally invariant matrices [45.0] 非線型関数の対称不変確率行列アンサンブルへのエントリワイズ適用がスペクトル分布をどう変えるかを検討する。
すべての場合において、ガウス同値原理は、つまり、非線型函数の効果は、関連する行列と追加の独立なGOEの線型結合をとるのと同じである。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:41:09 GMT)
FullStack Bench: Evaluating LLMs as Full Stack Coders [44.8] FullStack Benchは、幅広いアプリケーションドメインを含むフルスタックプログラミングに焦点を当てている。
FullStack Benchのマルチ言語プログラミング機能を評価するために,16の広く使用されているプログラミング言語から実世界の命令とそれに対応する単体テストケースを設計する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:31:54 GMT)
Confident Natural Policy Gradient for Local Planning in $q_π$-realizable Constrained MDPs [44.7] 制約付きマルコフ決定プロセス(CMDP)フレームワークは、安全性や他の重要な目的を課すための重要な強化学習アプローチとして出現する。
本稿では,線形関数近似が$q_pi$-realizabilityで与えられる学習問題に対処する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 21:53:41 GMT)
Flow Matching Guide and Code [44.4] Flow Matching(FM)は、様々な領域で最先端のパフォーマンスを達成した生成モデリングのためのフレームワークである。
このガイドは、FMの数学的基礎、設計選択、拡張を包括的で自己完結したレビューを提供する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:22:38 GMT)
MoViE: Mobile Diffusion for Video Editing [43.9] モバイルビデオ編集を可能にする一連の最適化を導入する。
既存の画像編集モデルに基づいて、まずアーキテクチャを最適化し、軽量なオートエンコーダを組み込む。
最後に, 新たな逆蒸留方式を導入することにより, サンプリング工程の数を1つに減らした。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:30:09 GMT)
Learnable Evolutionary Multi-Objective Combinatorial Optimization via Sequence-to-Sequence Model [43.5] SeqMOは、シークエンス・ツー・シークエンス・モデルと進化的アルゴリズムを統合する学習可能な多目的最適化手法である。
提案手法は,Pareto面への対物値距離に基づく近似解集合を分割し,対象空間における対物ベクトル角を最小化することにより,解間の写像関係を確立する。
多目的旅行セールスマン問題と多目的配置問題の実験により,アルゴリズムの有効性が検証された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:46:58 GMT)
Sloth: scaling laws for LLM skills to predict multi-benchmark performance across families [43.4] 大規模言語モデルのスケーリング法則は、サイズやトレーニングデータといったパラメータに基づいてモデルパフォーマンスを予測する。
我々は、公開されているベンチマークデータを活用する新しいスケーリング法則であるSkills Scaling Laws (SSLaws)を提案する。
パラメータ同定と経験的評価について,12のベンチマークで理論的に検討した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:51:26 GMT)
Continuous Video Process: Modeling Videos as Continuous Multi-Dimensional Processes for Video Prediction [43.2] 本稿では,映像を連続的な多次元プロセスとして扱う新しいモデルクラスを提案する。
我々は、KTH、BAIR、Human3.6M、UCF101などのベンチマークデータセットで検証された、ビデオ予測における最先端のパフォーマンスを確立する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:54:53 GMT)
You See it, You Got it: Learning 3D Creation on Pose-Free Videos at Scale [42.7] 本研究では,オープンワールド3D制作のための大規模インターネットビデオを用いた視覚条件付き多視点拡散モデルであるSee3Dを提案する。
このモデルは、広大かつ急速に成長するビデオデータから視覚的内容だけを見ることによって、3Dの知識を得ることを目的としている。
低コストでスケーラブルなビデオデータに基づいて訓練されたSee3Dは、ゼロショットおよびオープンワールド生成能力に優れることを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:44:56 GMT)
Pruning All-Rounder: Rethinking and Improving Inference Efficiency for Large Vision Language Models [42.1] 我々は Pruning All-Rounder (PAR) と呼ばれる推論加速のための新しいフレームワークを提案する。
自己教師付き学習方式により,提案手法は性能と効率のバランスが良好である。特にPARは柔軟であり,複数のプルーニングバージョンを提供し,様々なプルーニングシナリオに対処する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:02:35 GMT)
Adapting Vision-Language Model with Fine-grained Semantics for Open-Vocabulary Segmentation [42.0] オープン語彙のセグメンテーションは、主にマスク生成ではなく、マスク分類によってボトルネックとなる。
本稿では,この制限に対処するためのFISA法を提案する。
FISAは、視覚符号化プロセスの初期に、この重要な意味情報を明示的に統合することにより、抽出した視覚的特徴をきめ細かな意味認識で強化する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:16:38 GMT)
Context Clues: Evaluating Long Context Models for Clinical Prediction Tasks on EHRs [41.5] 本稿では,EHRデータモデリングにおける文脈長の影響を初めて体系的に評価する。
より長いコンテキストモデルによって予測性能が向上することがわかった。
しかし, 臨床応用においては, モデル性能だけでは不十分である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 21:58:27 GMT)
A Video is Worth 10,000 Words: Training and Benchmarking with Diverse Captions for Better Long Video Retrieval [41.1] 既存の長いビデオ検索システムは、段落から段落までの検索システムで訓練され、テストされる。
これは、動画の豊かさと多種多様さを無視するものであり、モーメントごとの細部から単一のフレーズの要約まで幅広い範囲に及んでいる。
本稿では,最先端の大規模言語モデルを利用して,多種多様な合成キャプションを注意深く生成するパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 23:46:06 GMT)
Delve into Visual Contrastive Decoding for Hallucination Mitigation of Large Vision-Language Models [40.7] 大規模視覚言語モデル(LVLM)は、入力された視覚内容と相関する可視応答を生成する優れた能力を示した。
彼らはまだ幻覚に悩まされており、生成したテキストは視覚的内容を不正確に反映している。
近年のアプローチでは、元のサンプルと視覚的に歪んだサンプルとのコントラスト出力分布を用いて、モデルの応答を校正するためにコントラストデコーディングを適用している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:57:57 GMT)
Closing the Gap: Achieving Global Convergence (Last Iterate) of Actor-Critic under Markovian Sampling with Neural Network Parametrization [40.4] Actor-Critic (AC)アルゴリズムの最近の理論的解析は、AC実装の実践的な側面に対処する上での遅延である。
我々は,5つの重要な実践的側面をすべて包含するACアルゴリズムの包括的理論的解析を行った。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:38:53 GMT)
Tactile DreamFusion: Exploiting Tactile Sensing for 3D Generation [39.7] 本稿では,タッチを付加的なモダリティとして組み込むことにより,生成した3次元資産の幾何学的詳細性を向上する手法を提案する。
2次元拡散モデルにより導かれる視覚的および触覚的テクスチャを合成する軽量な3次元テクスチャ場を設計する。
我々は,3次元生成タスクの幾何学的詳細性を高めるために,高分解能触覚を初めて活用する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:59:45 GMT)
Unraveling the Complexity of Memory in RL Agents: an Approach for Classification and Evaluation [39.7] 強化学習領域(RL)における多数のタスクにおいて、エージェントへのメモリの取り込みが不可欠である
メモリ」という用語は幅広い概念を包含しており、エージェントのメモリを検証するための統一的な方法論が欠如していることと相まって、エージェントのメモリ能力に関する誤った判断につながる。
本稿では,エージェントメモリタイプを正確に定義することで,RLにおけるメモリ概念の合理化を目指す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:34:31 GMT)
S$^{2}$FT: Efficient, Scalable and Generalizable LLM Fine-tuning by Structured Sparsity [39.7] LLMのための構造化スパースファインチューニング(S$2$FT)手法のファミリーを提案する。
S$2$FTは、"スパースと密度の高い計算を選択"することでこれを達成します。
S$2$FTはトレーニングメモリを最大3$times$まで節約し、フルFTと比較して1.5-2.7$times$のレイテンシを改善することを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:24:11 GMT)
Flexible and Scalable Deep Dendritic Spiking Neural Networks with Multiple Nonlinear Branching [39.7] 本稿では,複数の樹状突起枝に非線形力学を組み込んだ樹状突起スパイクニューロン(DendSN)を提案する。
点スパイクニューロンと比較すると、デンドSNははるかに高い発現を示す。
本研究は,従来のSNNに匹敵する深度とスケールで,生物解析可能な樹状SNNを訓練する可能性を実証するものである。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:15:46 GMT)
ContRail: A Framework for Realistic Railway Image Synthesis using ControlNet [39.6] 画像合成は、オリジナルおよび現実的な画像を作成することができるインテリジェントモデルの設計を通じて、制限に対処することを目的としている。
本稿では,新しい安定拡散モデル制御ネットに基づくContRailフレームワークを提案する。
我々は,鉄道固有の課題における性能を改善するために,合成鉄道画像生成の課題を実験した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:34:49 GMT)
World knowledge-enhanced Reasoning Using Instruction-guided Interactor in Autonomous Driving [39.2] 本研究では,認識条件下での自律走行性能向上を目的としたフレームワークを提案する。
具体的には,モダリティギャップを埋めるプラグアンドプレイ方式の対話モジュールを提案する。
運転関連タスクと世界の知識をよりよく統合するために、我々は大規模なマルチモーダルデータセットを収集し、洗練しました。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:18:58 GMT)
Rethinking Data Selection at Scale: Random Selection is Almost All You Need [39.1] 教師付き微調整は、大規模言語モデルと人間の指示の整合に不可欠である。
既存のデータ選択技術の多くは、小規模なデータプール用に設計されている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:31:39 GMT)
What Will My Model Forget? Forecasting Forgotten Examples in Language Model Refinement [38.9] ワイルドにデプロイされた言語モデルはエラーを起こします。
修正されたエラーインスタンスでモデルを更新することは、破滅的な忘れを引き起こす。
本稿では,事前学習例のソフトマックス前のロジットスコアの変化がオンライン学習例に類似しているという観察に基づいて,部分的に解釈可能な予測モデルを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:06:44 GMT)
Semi-Discrete Optimal Transport: Nearly Minimax Estimation With Stochastic Gradient Descent and Adaptive Entropic Regularization [38.7] 我々は,ラゲールセル推定と密度支持推定の類似性を用いて,OTマップに対して$mathcalO(t-1)$の低いバウンダリレートを証明した。
所望の速さをほぼ達成するために,サンプル数に応じて減少するエントロピー正規化スキームを設計する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:53:32 GMT)
Efficacy of Language Model Self-Play in Non-Zero-Sum Games [38.6] 言語モデルを改善するために,自己演奏のような手法を効果的に活用できるかどうかを実証的に検討する。
ディールまたはノーディールにおけるフィルタリングされた動作クローンの複数ラウンドにわたって、言語モデルをセルフプレイで微調整します。
言語モデルでは,タスク報酬の14~17倍のスコアが得られた。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:45:45 GMT)
Rendering-Refined Stable Diffusion for Privacy Compliant Synthetic Data [38.6] RefSDは3DレンダリングとStable Diffusionを組み合わせたパイプラインである。
姿勢を保たない標準拡散モデルやリアリズムを欠いたGANとは異なり、RefSDは姿勢、リアリズム、カスタマイズのバランスをとる。
HumanGenAIは、人間の知覚と実用性評価のためのフレームワークである。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:47:29 GMT)
Precise, Fast, and Low-cost Concept Erasure in Value Space: Orthogonal Complement Matters [38.4] 本稿では,AdaVD(Adaptive Vaule Decomposer)と呼ばれる,高精度で高速かつ低コストな概念消去手法を提案する。
AdaVDは一連の拡散モデルと下流の画像生成タスクをサポートしており、コードはプロジェクトページで入手できる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:56:25 GMT)
Generator Matching: Generative modeling with arbitrary Markov processes [37.7] 任意のマルコフプロセスを用いた生成モデリングのためのモダリティに依存しないフレームワークであるジェネレータマッチングを導入する。
本稿では,ジェネレータマッチングが拡散モデル,フローマッチング,離散拡散モデルなど,様々な生成的モデリング手法を統合することを示す。
ジャンププロセスのような新しいマルコフプロセスに設計空間を拡大する基盤を提供する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:26:23 GMT)
Detecting Facial Image Manipulations with Multi-Layer CNN Models [37.7] 本研究では,操作された画像の検出に適した畳み込みニューラルネットワーク(CNN)を開発し,評価する。
正規化と最適化技術は、特徴抽出と性能を改善するために体系的に取り入れられた。
提案したモデルは、操作された画像と本物の画像とを区別し、従来のアプローチを上回る精度で最大76%の精度を達成している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:37:27 GMT)
Toward AI-Driven Digital Organism: Multiscale Foundation Models for Predicting, Simulating and Programming Biology at All Levels [37.6] 我々は、AIを使って生物学と生命をモデル化し、シミュレートするアプローチを提案する。
AI-Driven Digital Organism(AIDO)は、統合されたマルチスケール基盤モデルのシステムである。
AIDOは、より優れたウェットラブ実験の新たな波を誘発する可能性があると私たちは考えています。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:59:59 GMT)
SAM4MLLM: Enhance Multi-Modal Large Language Model for Referring Expression Segmentation [37.5] SAM4MLLMはSegment Anything Model(SAM)とMulti-Modal Large Language Models(MLLM)を統合する革新的なアプローチである。
提案手法により,MLLMは既存のモデルアーキテクチャに過剰な修正を加えたり,特別なトークンを追加することなく,ピクセルレベルの位置情報を学習することができる。
詳細な視覚情報と、大きな言語モデルの強力な表現能力とを、学習における計算オーバーヘッドを増大させることなく、統一された言語ベースの方法で組み合わせる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:28:03 GMT)
The Oracle Complexity of Simplex-based Matrix Games: Linear Separability and Nash Equilibria [37.3] 我々は、$max_mathbfwinmathcalWmin_mathbfpinDeltamathbfptopAmathbfw$という形式の行列ゲームを解く問題を研究する。
この問題は、線形セパレータの発見やゼロサムゲームにおけるナッシュ平衡の計算といった標準的なタスクをカプセル化する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:58:26 GMT)
ChemReasoner: Heuristic Search over a Large Language Model's Knowledge Space using Quantum-Chemical Feedback [37.1] 新しい触媒の発見は、新しいより効率的な化学プロセスの設計に不可欠である。
量子化学に基づく3次元原子論表現からのフィードバックで言語推論を統一するAI誘導型計算スクリーニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:01:35 GMT)
FIPO: Free-form Instruction-oriented Prompt Optimization with Preference Dataset and Modular Fine-tuning Schema [36.7] 大規模言語モデル(LLM)のタスク性能向上のためのFIPO(Free-from Instruction-oriented Prompt Optimization)を提案する。
FIPOはモジュール型のAPOテンプレートを使用して、単純で最適化されたプロンプトを生成するために、ナイーブなタスク命令、オプションの命令応答、オプションの接地真理を動的に統合する。
5つの公開ベンチマークと6つのテストモデルでFIPOフレームワークを検証する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:53:07 GMT)
The Narrow Gate: Localized Image-Text Communication in Vision-Language Models [36.3] 画像とテキストの両方を生成する視覚言語モデル(VLM)と、テキストのみを出力するモデルを比較する。
マルチモーダルな出力を持つモデルでは、画像とテキストの埋め込みは残留ストリーム内でより分離される。
対照的に、画像生成とテキスト生成のために訓練されたモデルは、視覚情報の狭いゲートとして機能する単一のトークンに依存している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:39:40 GMT)
XRZoo: A Large-Scale and Versatile Dataset of Extended Reality (XR) Applications [36.3] XRZooには12,528の無料XRアプリケーションがあり、9つのアプリストア、すべてのXR技術(AR、MR、VRなど)、ユースケースにまたがっている。
我々は,再現可能なXRソフトウェア工学とセキュリティ研究を育成し,学際的な調査を可能にするとともに,先進的なXRシステムの開発を支援することを目的としている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:49:27 GMT)
Guiding a Diffusion Model with a Bad Version of Itself [35.6] 非条件モデルではなく、より小さく、訓練の少ないモデル自体を用いて、生成を誘導することで、画像品質の変動量を補うことなく、画像品質を制御できることを示す。
これによりImageNetの生成が大幅に改善され、64x64で1.01、公開ネットワークで512x512で1.25のFIDが設定された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:58:16 GMT)
Holmes-VAU: Towards Long-term Video Anomaly Understanding at Any Granularity [35.1] HIVAU-70kは、あらゆる粒度の階層的ビデオ異常理解のためのベンチマークである。
高品質なアノテーションを効率よくスケールする半自動アノテーションエンジンを開発した。
長ビデオにおける効率的な異常検出のために,Anomaly- Focus Temporal Samplerを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:05:34 GMT)
EXAONE 3.5: Series of Large Language Models for Real-world Use Cases [35.0] EXAONE 3.5言語モデルは32B、7.8B、2.4Bの3つの構成で提供されている。
商用利用については、LG AI Researchの公式コンタクトポイントを参照してください。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:31:10 GMT)
A Topic-level Self-Correctional Approach to Mitigate Hallucinations in MLLMs [34.7] トピックレベルの幻覚を緩和するために,モデル自体をガイドする自己修正的アプローチであるトピックレベルの優先上書き(TPO)を導入する。
以上の結果から,TPOは信頼性の最先端性を達成し,対象幻覚の92%,全体幻覚の38%を著しく低減した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:04:50 GMT)
Self-Interested Agents in Collaborative Learning: An Incentivized Adaptive Data-Centric Framework [34.2] 本稿では,データ中心型協調学習フレームワークを提案する。
各ステップで、arbiterはエージェントからデータのバッチを収集し、マシンラーニングモデルをトレーニングし、各エージェントにデータコントリビューションを反映する独自のモデルを提供する。
この設定は、共有データ影響モデルの更新を行うフィードバックループを確立し、結果のモデルが将来のデータ共有戦略をガイドする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:47:36 GMT)
Imitating Language via Scalable Inverse Reinforcement Learning [34.2] 我々は,模倣に対する逆強化学習の観点からの考察に焦点をあてる。
IRLをベースとした模倣には,特にタスク性能を最大化しながら多様性を維持する上で,明らかなメリットがある。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:26:42 GMT)
Data Augmentation for Seizure Prediction with Generative Diffusion Model [34.1] DiffEEGと呼ばれる新しい拡散型DA法を提案する。
データ分散を完全に探索し、多様性の高いサンプルを生成することができる。
DiffEEGの貢献により、マルチスケールCNNは最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:50:02 GMT)
SmartReco: Detecting Read-Only Reentrancy via Fine-Grained Cross-DApp Analysis [33.9] Read-Only Reentrancy(ROR)攻撃は、すでにDAppエコシステムに約3000万USDの損失をもたらしている。
スマートコントラクトにおける既存の脆弱性検出技術では、ROR攻撃をほとんど検出できない。
静的および動的解析の新たな組み合わせにより,ROR攻撃を検出する新しいフレームワークであるSmartRecoを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:53:39 GMT)
Monet: Mixture of Monosemantic Experts for Transformers [33.8] トランスフォーマー(Monet)アーキテクチャのためのモノセマンティックエキスパート(Mixture of Monosemantic Experts)を紹介する。
Monetはスパース辞書学習を直接エンドツーエンドのMixture-of-Expertsプリトレーニングに組み込む。
本分析は,専門家間の知識の相互排他性を示し,各専門家にカプセル化されたパラメトリック知識を示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:49:01 GMT)
Object Detection using Event Camera: A MoE Heat Conduction based Detector and A New Benchmark Dataset [33.8] 本稿では, 熱伝導に基づく新しいMoE(Mixture of Experts)物体検出アルゴリズムを提案する。
イベントベースのオブジェクト検出のための新しいベンチマークデータセットであるEvDET200Kについても紹介する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:40:34 GMT)
TriDi: Trilateral Diffusion of 3D Humans, Objects, and Interactions [33.6] 本稿では,3次元オブジェクト間相互作用(HOI)をモデル化するための最初の統一モデルを提案する。
我々は,新しい3方向拡散プロセスと同時に,人・物・相互作用のモダリティを生成する。
本稿では,TriDiをシーン群に適用し,人間と接触したデータセットのオブジェクトを生成し,オブジェクトの幾何学を一般化する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:35:05 GMT)
NRSurNN3dq4: A Deep Learning Powered Numerical Relativity Surrogate for Binary Black Hole Waveforms [32.8] 重力波近似法は重力波天文学において広く用いられる。
これを最小化する一つの方法は、いわゆるtextitsurrogate モデルを構築することである。
本研究では,ニューラルネットワークを用いたBBH合併波形のサロゲートモデルであるtexttNRSurNN3dq4を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:45:30 GMT)
Householder Pseudo-Rotation: A Novel Approach to Activation Editing in LLMs with Direction-Magnitude Perspective [32.1] 本稿では,アクティベーションをその方向や大きさで見る新しい編集手法を提案する。
提案手法は,HPR (Houseer Pseudo-Rotation) と呼ばれ,回転変換を模倣し,アクティベーション基準を保ち,様々な安全ベンチマークの性能を向上させる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:53:19 GMT)
3DSceneEditor: Controllable 3D Scene Editing with Gaussian Splatting [32.0] ガウススプラッティングを用いた3次元シーンのリアルタイムかつ高精度な編集を行う3DceneEditorを提案する。
従来の方法とは異なり、3DSceneEditorは3Dパイプラインを通して動作し、効率よく高品質な編集のためにガウシアンを直接操作できる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:11:45 GMT)
Probing the Decision Boundaries of In-context Learning in Large Language Models [32.0] 本稿では,テキスト内二項分類のための決定境界のレンズからテキスト内学習を探索し,理解するための新しいメカニズムを提案する。
驚いたことに、単純な二項分類タスクにおいて、現在のLLMによって学習される決定境界は、しばしば不規則で非滑らかである。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 23:53:27 GMT)
Generalized Closed-form Formulae for Feature-based Subpixel Alignment in Patch-based Matching [31.8] 一次元マッチングの場合のサブピクセル不均一性に対する閉形式式を示す。
次に,提案式を高次元探索空間の場合に一般化する方法を示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:35:02 GMT)
HES-UNet: A U-Net for Hepatic Echinococcosis Lesion Segmentation [31.7] HES-UNetはHE病変セグメンテーションの効率的かつ正確なモデルである。
モデルでは、畳み込みレイヤとアテンションモジュールを組み合わせて、ローカルとグローバルの機能をキャプチャする。
実験により、HES-UNetは我々のデータセット上で最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:33:55 GMT)
Byzantine-Eavesdropper Alliance: How to Achieve Symmetric Privacy in Quantum $X$-Secure $B$-Byzantine $E$-Eavesdropped $U$-Unresponsive $T$-Colluding PIR? [31.3] 我々は、$N$データベースと$K$メッセージを持つシステムにおいて、量子非対称なプライベート情報検索問題を考える。
最初のモデルでは、アップリンク方向(ユーザから$N$サーバへの方向)に$mathcalE$eavesdropedリンクがある。
第2のモデルでは、静的な盗聴器とともにシステムのプライバシとセキュリティを害する計画を考案し、コーディネートできるビザンティンサーバについて検討する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:17:24 GMT)
Eliminating Biased Length Reliance of Direct Preference Optimization via Down-Sampled KL Divergence [31.0] DPO(Direct Preference Optimization)は、大規模言語モデルと人間の好みとの直接的かつ堅牢なアライメントのための顕著なアルゴリズムとして登場した。
有望な有効性にもかかわらず、DPOは顕著な欠点に直面している。
また,この問題はDPOのアルゴリズム長依存性にも起因していると考えられる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:57:05 GMT)
ACQ: A Unified Framework for Automated Programmatic Creativity in Online Advertising [30.6] 本稿では,広告クリエイティビティの自動作成と非活性化を実現するための2段階のフレームワークであるAutomated Creatives Quota (ACQ)を提案する。
ACQは複数の広告主にクリエイティビティ・クォータを動的に割り当て、広告プラットフォームの収益を最大化する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:00:57 GMT)
ONEBench to Test Them All: Sample-Level Benchmarking Over Open-Ended Capabilities [30.1] 従来の固定テストセットは、ファンデーションモデルのオープンな機能を評価するのに不足しています。
ONEBenchは、個々の評価データセットを統一し、拡張し続けるサンプルプールに統合する新しいテストパラダイムである。
ONEBenchは、テストセットにまたがってサンプルを集約することにより、オリジナルのテストセットでカバーされたもの以上の多様な機能の評価を可能にする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:37:14 GMT)
Automated Patient Positioning with Learned 3D Hand Gestures [29.9] 本稿では,カメラを用いて手の動きを自動的に検出する自動位置決めシステムを提案する。
我々のアプローチは、技術者のジェスチャーを認識し解釈するための、新しい多段階パイプラインに依存している。
以上の結果から,本システムでは,最小限の技術介入で,正確かつ正確な患者の位置決めが可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:21:21 GMT)
Towards novel tunability schemes for hybrid ferromagnetic transmon qubits [29.7] 超伝導体-絶縁薄膜超伝導層-強磁性体-超伝導体ジョセフソン接合(SIsFS JJs)
本稿では, トンネル超伝導体-絶縁薄膜超伝導体-磁性体-超伝導体ジョセフソン接合部(SIsFS JJs)を新しいトランスモン量子ビット設計, いわゆるフェロトランスモンに統合することを提案する。
フェロトランスモンにおける量子ビット周波数のオンチップ制御の基礎となる、面内磁界を提供する超伝導線の設計、シミュレーション、および予備的な実験特性について、特に焦点を当てる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:13:59 GMT)
Gen-3Diffusion: Realistic Image-to-3D Generation via 2D & 3D Diffusion Synergy [29.7] Gen-3Diffusion: Realistic Image-to-3D Generation via 2D and 3D Diffusion Synergyを提案する。
事前学習した2次元拡散モデルと3次元拡散モデルをエレガントに設計したプロセスを通じて活用する。
提案手法は,高忠実度な形状とテクスチャを持つ現実的な3Dオブジェクトとアバターを生成する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:44:42 GMT)
Conservative Contextual Bandits: Beyond Linear Representations [29.6] 保守的コンバンディット(CCB)は、エージェントのポリシーと後悔を最小限に抑えるとともに、安全上の制約を満たすことを要求することで、シーケンシャルな意思決定における安全性に対処する。
Inverse Gap Weighting (IGW) ベースの探索とオンライン回帰オラクルを用いて, $mathttC-SquareCB$ と $mathttC-FastCB$ の2つのアルゴリズムを開発した。
安全性制約は高い確率で満たされており、$mathttC- SquareCB$の後悔は水平線で$T$のサブ線形であることを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:57:27 GMT)
Vulnerability of Text-Matching in ML/AI Conference Reviewer Assignments to Collusions [29.5] コラボレーションリングは、トップ層機械学習(ML)と人工知能(AI)カンファレンスに挑戦する。
入札がなくても、レビュアーと著者は、レビュアー代行の機械学習ベースのテキストマッチングコンポーネントを活用できることを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:55:20 GMT)
MoSH: Modeling Multi-Objective Tradeoffs with Soft and Hard Bounds [29.3] 本稿では,ソフトハード関数 SHF を運用する新しい概念フレームワークを提案する。
SHFフレームワークに適合する多くの実践的問題を示し、多様なドメインに対する広範な実証的検証を提供する。
具体的には、ブラキセラピーでは、次の最良アプローチよりも3%以上のSHF定義ユーティリティを持つコンパクトな点集合を返す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:32:20 GMT)
The Computational Limits of State-Space Models and Mamba via the Lens of Circuit Complexity [28.9] 回路複雑性フレームワークを用いて,Mamba と Statespace Models (SSM) の計算限界を解析する。
Mambaのステートフルな設計と、トランスフォーマーを上回る強力な候補として最近注目されているにもかかわらず、$mathsfDLOGTIME$-uniform $mathsfTC0$ complexity classの中に、$mathrmpoly(n)$-precisionと定数深度層を持つMambaとSSMの両方が存在することを実証した。
この結果は、マンバがTransformerと理論的に同じ計算能力を持つことを示し、算術公式問題のような問題を解くことはできない。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:01:18 GMT)
[MASK] is All You Need [28.9] 本研究では、離散状態モデルを用いて、マスケ生成モデルと非自己回帰モデルとの接続を提案する。
離散状態モデル上での[MASK]トークンからイメージセグメンテーションなどの典型的な識別タスクを非マスキングプロセスとして再キャストする。
これにより、関節分布をモデル化するためのトレーニングを一度だけ行うことで、フレキシブルな条件付きサンプリングを含む様々なサンプリングプロセスを実行することができる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:59:56 GMT)
Faster Convergence on Heterogeneous Federated Edge Learning: An Adaptive Clustered Data Sharing Approach [27.9] Federated Edge Learning (FEEL)は、6G Hyper-Connectivityのための分散機械学習パラダイムのパイオニアとして登場した。
現在のFEELアルゴリズムは、非独立かつ非独立に分散した(非IID)データと競合し、通信コストの上昇とモデルの精度が損なわれる。
我々はクラスタ化データ共有フレームワークを導入し、クラスタヘッドから信頼されたアソシエイトに部分的なデータを選択的に共有することで、データの均一性を緩和する。
実験により, このフレームワークは, 限られた通信環境において, 収束速度が速く, モデル精度が高い非IIDデータセット上で FEEL を促進することを示した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:55:58 GMT)
Diverse Score Distillation [27.8] ランダムな初期シードによって定義された生成経路に従うよう最適化するスコアの定式化を提案する。
本稿では,2次元最適化,テキストベースの3D推論,単一ビュー再構成などのタスクにまたがるDSD(Diverse Score Distillation)の応用について紹介する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:59:02 GMT)
Edge-SD-SR: Low Latency and Parameter Efficient On-device Super-Resolution with Stable Diffusion via Bidirectional Conditioning [27.7] We introduced Edge-SD-SR, the first parameter efficient and low latency diffusion model for image super- resolution。
Edge-SD-SRはUNet、エンコーダ、デコーダを含む169Mのパラメータで構成され、複雑さはわずか142GFLOPである。
We show that Edge-SD-SR match or moreforms state-of-the-art SR approach on the most established SR benchmarks。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:38:44 GMT)
On the Universal Truthfulness Hyperplane Inside LLMs [27.0] モデル内の事実的正確かつ誤った出力を区別する普遍真性超平面が存在するかどうかを考察する。
その結果,トレーニングデータセットの多様性の向上が,すべてのシナリオのパフォーマンスを著しく向上させることが示唆された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:26:37 GMT)
An Efficient Scene Coordinate Encoding and Relocalization Method [26.9] 本稿では,効率的なシーン座標符号化と再局在化手法を提案する。
既存のSCR手法と比較して,シーンエンコーディングと有能なキーポイント検出のための統一アーキテクチャを設計する。
室内および屋外における総合的な実験により、提案システムは他のSOTA(State-of-the-art)SCR法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:39:18 GMT)
The Unpaid Toll: Quantifying the Public Health Impact of AI [26.9] AIの需要が急増し、エネルギー集約型データセンターが急速に拡大した。
AIの環境フットプリントの増大には大きな注意が払われているが、公衆衛生の負担はほとんど見過ごされている。
本稿では,AIのライフサイクル全体にわたって汚染物質排出量をモデル化し,公衆衛生への影響を定量化する手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:20:11 GMT)
Fuzz4All: Universal Fuzzing with Large Language Models [26.6] 本稿では,ファズ4Allについて述べる。ファズ4Allは,多数の異なる入力言語を対象とし,それらの言語の特徴を多用できるという意味で普遍的なファズ4Allである。
テスト中の9つのシステム(C、C++、Go、SMT2、Java、Python)を入力として評価する。
この評価は、6言語すべてで、普遍的なファジィングは既存の言語固有のファジィよりも高いカバレッジを達成することを示している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:47:17 GMT)
Towards Efficient and Robust VQA-NLE Data Generation with Large Vision-Language Models [26.1] 自然言語解説(NLE)は、自然言語の詳細な人間フレンドリーな説明を提供することで、意思決定プロセスの解明を目的としている。
自然言語説明データセットを用いた視覚質問応答作成のための既存の手法は、人間のアノテーションに依存している。
本稿では,LVLMを用いて高品質な合成VQA-NLEデータセットを効率的に生成する手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:43:40 GMT)
Offline Reinforcement Learning via Linear-Programming with Error-Bound Induced Constraints [26.0] オフライン強化学習(RL)は、事前に収集されたデータセットを使用して、マルコフ決定プロセス(MDP)の最適ポリシーを見つけることを目的としている。
本研究では,オフラインRLにおけるマルコフ決定過程の線形プログラミング (LP) の再検討を行う。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:39:58 GMT)
MMedPO: Aligning Medical Vision-Language Models with Clinical-Aware Multimodal Preference Optimization [25.9] 我々は,新しいマルチモーダル医療優先最適化手法MMedPOを提案する。
MMedPOは、Med-LVLMアライメントを高めるために、嗜好サンプルの臨床的関連性を考慮する。
実験の結果,MMedPOはMed-LVLMの精度を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:50:39 GMT)
Exo2EgoDVC: Dense Video Captioning of Egocentric Procedural Activities Using Web Instructional Videos [25.9] 本稿では,高密度ビデオキャプションのクロスビュー知識伝達のための新しいベンチマークを提案する。
我々は、エゴセントリックな視点で見るWebインストラクショナルビデオのモデルを、エゴセントリックな視点に適応させる。
本実験は,視点変化問題と自己中心的な視点への知識伝達を克服する効果を検証した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 05:49:01 GMT)
AlphaVerus: Bootstrapping Formally Verified Code Generation through Self-Improving Translation and Treefinement [25.8] 生成したコードが正しいことを数学的に保証するために,形式検証を利用することを目標としている。
LLMによる正式な認証コードの生成は、トレーニングデータの不足と、形式的な証明の複雑さによって妨げられる。
我々は、公式に認証されたコード生成をブートストラップする自己改善フレームワークであるAlphaVerusを紹介した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:22:35 GMT)
Membership Inference Attacks and Defenses in Federated Learning: A Survey [25.6] フェデレートラーニング(Federated Learning)は、クライアントがローカルにモデルをトレーニングし、モデル更新を共有してグローバルモデルを開発する、分散機械学習アプローチである。
これは、特定のサンプルがトレーニングセットの一部であるかどうかを判断することで、クライアントのプライバシをターゲットとする。
これらの攻撃は、医療システム内の医療診断など、現実世界の応用における機密情報を侵害する可能性がある。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:39:58 GMT)
GameArena: Evaluating LLM Reasoning through Live Computer Games [25.4] 我々は,人間との対話型ゲームプレイを通じて,大規模言語モデル(LLM)推論能力を評価するベンチマークであるGameArenaを紹介する。
GameArenaは3つのゲームからなり、参加者を楽しませたりエンゲージメントしたりしながら、特定の推論能力(演能的推論や帰納的推論など)をテストする。
我々は2000以上のゲームセッションを収集し、5つの最先端LCMに対して様々な推論能力の詳細な評価を行う。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:22:59 GMT)
Simulating Human-like Daily Activities with Desire-driven Autonomy [25.4] 既存のタスク指向AIエージェントは明示的な指示や外部報酬に依存しており、人間のような本質的な動機によって駆動される能力を制限する。
本研究では,Large Language Model-based (LLM-based) エージェントを誘導する欲求駆動型自律フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:21:20 GMT)
More is Better (Mostly): On the Backdoor Attacks in Federated Graph Neural Networks [25.4] グラフニューラルネットワーク(Graph Neural Networks、GNN)は、グラフドメイン情報を処理するためのディープラーニングベースの手法のクラスである。
本稿では,集中型バックドア攻撃 (CBA) と分散バックドア攻撃 (DBA) の2種類のバックドア攻撃を行う。
我々は、両方の攻撃が調査対象の防衛に対して堅牢であることに気付き、フェデレートGNNにおけるバックドア攻撃を新たな脅威とみなす必要がある。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:38:09 GMT)
Questioning the Survey Responses of Large Language Models [25.1] 我々は,米国国勢調査局が確立したアメリカン・コミュニティ・サーベイに基づいて,この方法論を批判的に検討する。
まず、モデルの応答は、例えば"A"という文字でラベル付けされた調査応答に対するバイアスの順序付けとラベル付けによって制御される。
第二に、ランダム化された回答順序付けによってこれらの体系的バイアスを調整するとき、ボード全体のモデルが一様ランダムなアンケート応答に向かう傾向にある。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:47:06 GMT)
Spiking Neural Networks for Radio Frequency Interference Detection in Radio Astronomy [25.1] スパイキングニューラルネットワーク(SNN)は、その動的性質のため、効率的な時間的データ処理を約束する。
本稿では、電波天文学、RFI(Radio Frequency Interference)検出における重要な課題について述べる。
我々は、RF検出性能を向上させるために、分割正規化にインスパイアされた前処理ステップを導入する。
我々の知る限り、この研究はSNNを実際の電波天文学のデータでトレーニングした初めてのものです。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:02:30 GMT)
Learning in Markov Games with Adaptive Adversaries: Policy Regret, Fundamental Barriers, and Efficient Algorithms [24.9] 学習者と戦略的相手とのマルコフゲームとしてモデル化された動的に進化する環境における学習について検討する。
これは、学習者が最も安定した政策の順序に従えば達成したであろうリターンと競合することを目的とした、反ファクト的な概念である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 23:57:21 GMT)
Imitating the Functionality of Image-to-Image Models Using a Single Example [24.8] 入力と出力のペアを観測することで、画像から画像への変換モデルの機能を模倣する可能性について検討する。
ひとつの例でさえ、モデルの機能の模倣を学ぶのに十分であることがわかったのです。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:52:14 GMT)
Uni-NaVid: A Video-based Vision-Language-Action Model for Unifying Embodied Navigation Tasks [24.7] 既存のボディードナビゲーションのモデルは、現実の世界で実践的なジェネラリストとして機能するには足りていない。
多様な具体的ナビゲーションタスクを統合するために設計された,ビデオベースの視覚言語アクションモデルであるUni-NaVidを提案する。
Uni-NaVidは、一般的に使われているすべてのナビゲーションタスクの入力および出力データ構成によってこれを達成している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 05:55:55 GMT)
InstantRestore: Single-Step Personalized Face Restoration with Shared-Image Attention [24.6] 顔画像復元は、多様な劣化タイプ、リアルタイム処理要求、そして最も重要なのは、アイデンティティ固有の特徴の保存といった課題に対処しながら、劣化した顔画像を強化することを目的としている。
InstantRestoreは、ワンステップ画像拡散モデルと、高速かつパーソナライズされた顔復元のためのアテンション共有機構を活用する新しいフレームワークである。
実験では、InstantRestoreは既存の方法よりも品質とスピードが優れており、アイデンティティを保存する顔の復元に魅力的な選択となっている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:43:46 GMT)
DSAI: Unbiased and Interpretable Latent Feature Extraction for Data-Centric AI [24.3] 大規模言語モデル(LLM)は、大きなデータセットの潜在特性を客観的に識別するのにしばしば苦労する。
本研究では,非バイアスで解釈可能な特徴抽出を可能にするフレームワークであるData Scientist AI(DSAI)を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:47:05 GMT)
iLLaVA: An Image is Worth Fewer Than 1/3 Input Tokens in Large Multimodal Models [24.0] iLLaVAは、現在のLVLM(Large Vision-Language Models)にシームレスにデプロイできるシンプルな方法である。
iLLaVAは、冗長トークンを正確で高速なアルゴリズムで発見し、徐々にマージすることでこれを達成している。
単一イメージ、マルチイメージ、ビデオを含むさまざまな領域にわたるタスクにおいて、iLLaVAは一貫して有望な効率で強力な一般化性を示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:22:19 GMT)
Best Practices for Multi-Fidelity Bayesian Optimization in Materials and Molecular Research [23.9] MFBO(Multi-fidelity Bayesian Optimization)は、物質や分子の発見を高速化するためのフレームワークである。
化学的タスクに使用される可能性があるが、MFBOで果たす多くのパラメータの体系的な評価が欠如している。
実験環境でMFBOをいつ使用するかを決めるためのガイドラインと勧告を提供する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:17:04 GMT)
Opportunities and Challenges of Large Language Models for Low-Resource Languages in Humanities Research [23.8] 低リソース言語は、文化進化と知的多様性を具現化した、人類の歴史の貴重なリポジトリとして機能する。
その重要性にもかかわらず、これらの言語はデータ不足や技術的な制限など、重要な課題に直面している。
大規模言語モデル(LLM)の最近の進歩は、これらの課題に対処するための変革的な機会を提供する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:00:42 GMT)
MVReward: Better Aligning and Evaluating Multi-View Diffusion Models with Human Preferences [23.4] 人選好による多視点拡散モデルの改良と評価のための包括的フレームワークを提案する。
また,プラグアンドプレイ型多視点拡散チューニング戦略であるMulti-View Preference Learning (MVP)を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:05:31 GMT)
A Survey on Medical Large Language Models: Technology, Application, Trustworthiness, and Future Directions [23.4] 医学大言語モデル(Med-LLMs)の最近の進歩を辿る。
The wide-ranging application of Med-LLMs are investigated across various health domain。
公平性、説明責任、プライバシー、堅牢性を保証する上での課題について議論する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:14:08 GMT)
A Survey on Privacy-Preserving Caching at Network Edge: Classification, Solutions, and Challenges [23.2] エッジネットワークでのコンテンツキャッシングは、ネットワークバックホールの負担を軽減するために広く展開されている人気で効果的な手法である。
エッジネットワークでコンテンツをキャッシュするプライバシー侵害に関して、いくつかの論争があった。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:39:15 GMT)
Efficient Task Grouping Through Samplewise Optimisation Landscape Analysis [23.2] 本稿では,既存の手法の圧倒的な計算要求を削減するための効率的なタスクグループ化フレームワークを提案する。
グラフベースのクラスタリングアルゴリズムを用いて、最適タスク群をピンポイントする。
8つの異なるデータセットで実施された実証的な評価は、提案フレームワークの有効性を強調している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:46:09 GMT)
I Don't Know: Explicit Modeling of Uncertainty with an [IDK] Token [23.0] 大きな言語モデルは幻覚を起こす傾向があり、望ましくない事実的誤りのテキストを出力する。
本稿では,幻覚対策に用いる新しい校正法を提案する。
我々の方法で訓練されたモデルは、以前にミスを犯すような場所で不確実性を表現できることがわかった。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:13:20 GMT)
Out-of-Distribution Detection with Overlap Index [22.9] アウト・オブ・ディストリビューション(OOD)検出は、オープンな世界における機械学習モデルの展開に不可欠である。
重なり指数(OI)に基づく信頼度スコア関数を用いた新しいOOD検出手法を提案する。
我々は,OIをベースとしたOOD検出器と最先端のOOD検出器が競合することを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:01:47 GMT)
An Effective and Resilient Backdoor Attack Framework against Deep Neural Networks and Vision Transformers [22.8] 本稿では,最適なトリガ形状と位置を探索する,注目に基づく新しいマスク生成手法を提案する。
また、損失関数にQuality-of-Experienceという用語を導入し、トリガの透明性値を慎重に調整する。
提案したバックドア攻撃フレームワークは,最先端のバックドア防御に対する堅牢性を示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:03:27 GMT)
A Note on Sample Complexity of Interactive Imitation Learning with Log Loss [22.7] イミテーション・ラーニング(Imitation Learning、IL)は、シーケンシャルな意思決定問題のエキスパートから学ぶための一般的なパラダイムである。
近年のILの進歩は、オフラインの模倣学習、特にログロスを伴う行動クローン(BC)が最小限の最適であることを示している。
本稿では,対話型模倣学習,特にログ損失のあるDAggerに着目し,実現可能な決定論的専門家と再考する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 23:40:49 GMT)
Split and Merge: Aligning Position Biases in LLM-based Evaluators [22.3] PortIAは、人間の比較戦略を模倣して位置バイアスを校正するアライメントベースのシステムである。
その結果, Portia はテスト対象のモデルと比較形態の整合性を著しく向上させることがわかった。
GPT-4モデルにおける位置バイアスの約80%を修正し、一貫性を98%まで高める。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:39:12 GMT)
StarWhisper Telescope: Agent-Based Observation Assistant System to Approach AI Astrophysicist [22.1] Nearby Galaxy Supernovae Survey (NGSS) プロジェクトは、3つの観測地点にわたる8つの望遠鏡を含む。
我々は、観測過程全体を管理するためのtextbfStarWhisper Telescope System を開発した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:40:06 GMT)
Blockchain Data Analysis in the Era of Large-Language Models [21.8] 既存のブロックチェーンデータ分析ツールは、データの不足、一般化可能性の欠如、推論能力の欠如など、課題に直面している。
大きな言語モデル(LLM)がこれらの課題を軽減することができると信じています。
本稿では,LLM統合ブロックチェーンデータ分析における潜在的な技術と設計パターンを体系的に検討する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:32:35 GMT)
No Annotations for Object Detection in Art through Stable Diffusion [21.8] 絵画における物体検出に拡散モデルによる知識を活用できるパイプラインであるNAD(No Annotation for Detection in Art)を,フルバウンディングボックスの監督を必要とせずに提示する。
本手法は,弱教師付きシナリオとゼロショットシナリオの両方をサポートし,事前訓練されたコンポーネントの微調整は不要である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:16:24 GMT)
U-Know-DiffPAN: An Uncertainty-aware Knowledge Distillation Diffusion Framework with Details Enhancement for PAN-Sharpening [21.6] 本研究では,不確実な知識蒸留拡散フレームワークを提案する。
U-Know-DiffPANは、教師モデルから学生モデルへの特徴詳細の効果的な伝達のために、不確実性を認識した知識蒸留を取り入れている。
多様なデータセットの実験は、非常に最近の最先端の Pan-Sharpening 法よりも、我々の U-Know-DiffPAN の堅牢性と優れた性能を示している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:33:36 GMT)
One-shot Human Motion Transfer via Occlusion-Robust Flow Prediction and Neural Texturing [21.6] マルチスケールな特徴ワーピングとニューラルテクスチャマッピングを組み合わせて、2Dの外観と2.5D形状を復元する統合フレームワークを提案する。
このモデルでは,複数モーダルを共同でトレーニングし,融合させることで,幾何的誤差に対処する頑健な神経テクスチャ特性を実現する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:14:40 GMT)
FM2DS: Few-Shot Multimodal Multihop Data Synthesis with Knowledge Distillation for Question Answering [21.5] マルチモーダルなマルチホップ質問応答のためのトレーニングモデルを実現するための,高品質なデータセットを作成するための新しい手法を提案する。
提案手法は,ウィキペディアから関連するマルチモーダル文書を取得し,高レベルの質問や回答を合成的に生成し,厳格な基準で検証し,品質データを保証する5段階のパイプラインから構成される。
その結果、サンプルサイズが同じであれば、合成データに基づいてトレーニングされたモデルは、平均して1.9の正確なマッチング(EM)でトレーニングされたデータよりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 22:35:44 GMT)
Towards Foundation Models for 3D Vision: How Close Are We? [21.5] 3Dビジョンのための基礎モデルを構築することは、未解決の複雑な課題である。
我々はUniQA-3Dという新しい3次元視覚理解ベンチマークを構築した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:58:03 GMT)
UniMIC: Towards Universal Multi-modality Perceptual Image Compression [21.4] 汎用多モード画像圧縮フレームワークUniMICを提案する。
UniMICは、複数の画像コーデックに対するRDP最適化を統一することを目的としている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:50:00 GMT)
UniPaint: Unified Space-time Video Inpainting via Mixture-of-Experts [21.0] UniPaintは、空間的時間的インパインティングを可能にする生成時空間ビデオインパインティングフレームワークである。
UniPaintは高品質で美的な結果をもたらし、さまざまなタスクにまたがって最高の結果とスケール設定を実現している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:45:14 GMT)
Speech Robust Bench: A Robustness Benchmark For Speech Recognition [20.8] Speech Robust Bench (SRB) は、さまざまな汚職に対するASRモデルの堅牢性を評価するためのベンチマークである。
SRBは114の入力摂動で構成されており、ASRモデルが野生に展開する際の不均一な破損をシミュレートする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:43:15 GMT)
See Further When Clear: Curriculum Consistency Model [20.6] 本稿では,時間ステップ間で学習の複雑さを安定させ,バランスをとるCCMを提案する。
具体的には,各時期の蒸留工程をカリキュラムとみなし,学習の複雑さを定量化するためのピーク信号対雑音比(PSNR)に基づくメトリクスを導入する。
CIFAR-10ではFr't Inception Distance(FID)スコアが1.64、ImageNet 64x64では2.18である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:39:01 GMT)
Honor Among Bandits: No-Regret Learning for Online Fair Division [20.4] 本研究では, 商品の種類が有限であり, プレイヤーの値が未知の方法で分布から引き出される場合, プレイヤーに対する不特定商品のオンライン公平分割の問題点を考察する。
我々の主な成果は、公正な制約を維持しながら、$tildeO(T2/3)の後悔を達成できる探索列コミットアルゴリズムの設計である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:48:52 GMT)
FilterPrompt: A Simple yet Efficient Approach to Guide Image Appearance Transfer in Diffusion Models [20.3] FilterPromptは、制御可能な生成の効果を高めるためのアプローチである。
どんな拡散モデルにも適用可能で、ユーザーは特定の画像の特徴の表現を調整できる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:59:28 GMT)
Frontier AI systems have surpassed the self-replicating red line [20.0] 我々はMetaのLlama31-70B-InstructとAlibabaのQwen25-72B-Instructの2つのAIシステムを評価する。
評価中のAIシステムは、十分な自己認識、状況認識、問題解決能力を示す。
私たちの発見は、これまで未知の深刻なAIリスクに対するタイムリーな警告です。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:01:37 GMT)
Gradient Descent Finds Over-Parameterized Neural Networks with Sharp Generalization for Nonparametric Regression [20.0] ニューラルネットワークが早期停止でGDによってトレーニングされている場合、トレーニングされたネットワークは、非パラメトリック回帰リスクの急激なレートを示す。
$cO(eps_n2)$は、GDが早期停止でトレーニングした古典的なカーネルレグレッションと同じレートである。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:42:27 GMT)
Adaptive Rank, Reduced Forgetting: Knowledge Retention in Continual Learning Vision-Language Models with Dynamic Rank-Selective LoRA [20.0] 既存のメソッドは、しばしば追加の参照データ、分散やドメイン予測のための独立したコンポーネントに依存します。
本稿では,動的ランク選択型低ランク適応(LoRA)を提案する。
本手法は,学習済みの知識とCL中に獲得した知識の両方を保持することで,学習済みのVLMを継続的に強化する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:25:36 GMT)
Lightweight Federated Learning with Differential Privacy and Straggler Resilience [19.9] フェデレートラーニング(FL)は、生データの代わりにモデルパラメータ交換を通じて協調的なモデルトレーニングを可能にする。
パラメータ交換による潜在的な推論攻撃を避けるため、差分プライバシー(DP)は様々な攻撃に対して厳格な保証を提供する。
提案するLightDP-FLは,証明可能なDPをピアやサーバに対して保証する,新しい軽量なスキームである。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 00:54:00 GMT)
Balancing Efficiency and Effectiveness: An LLM-Infused Approach for Optimized CTR Prediction [19.7] エンド・ツー・エンドの深い意味情報をモデル化する新しいアプローチを導入する。
私たちのフレームワークは効率と効率のバランスをとるために慎重に設計されています。
Meituan sponsored-searchシステムで実施したオンラインA/Bテストでは,コスト・パー・マイル(CPM)とクリック・スルー・レート(CTR)でベースライン・モデルよりも有意に優れていた。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:36:38 GMT)
Language Control Diffusion: Efficiently Scaling through Space, Time, and Tasks [19.3] ジェネラリストエージェントの訓練は、いくつかの軸で難しい。
アーキテクチャの最近の進歩は、これらの軸の1つまたは2つに沿ったスケーリングの改善を可能にしている。
textbfLanguageを textbfControl textbfDiffusion モデルに利用することにより,3つの軸すべてに対処することを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:49:04 GMT)
Generalized Least Squares Kernelized Tensor Factorization [19.3] 本稿ではテンソル完備化のための一般化最小方形カーネル化因子化(GL)フレームワークを紹介する。
GLは滑らかさに制約された低ランクの分解と局所的に相関した残留過程を統合する。
提案するフレームワークは,4つの実世界のデータセットを多種多様なタスクで評価する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 23:01:04 GMT)
Instructional Video Generation [19.3] 本稿では,命令型ビデオ生成のための新しい手法を提案する。
本手法は,視覚的コンテキストとアクションテキストの両方でガイドされる動作領域を生成する。
EpicKitchens と Ego4D をベースとした拡張指導データセットの評価を行った。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:45:51 GMT)
4D Gaussian Splatting with Scale-aware Residual Field and Adaptive Optimization for Real-time Rendering of Temporally Complex Dynamic Scenes [19.2] SaRO-GSはリアルタイムレンダリングを実現する新しい動的シーン表現である。
時間的に複雑な動的シーンを扱うために,スケールアウェアなResidual Fieldを導入する。
我々の手法は最先端の性能を実証した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:44:19 GMT)
MAVias: Mitigate any Visual Bias [19.1] コンピュータビジョンモデルにおけるバイアスの緩和は、人工知能モデルの信頼性への重要なステップである。
我々は,基礎モデルを利用したオープンセットバイアス緩和手法であるMAViasを導入し,視覚属性と対象クラス間の刺激的な関連を見出す。
CelebA、Waterbirds、ImageNet、UrbanCarsなどの多様なデータセットに関する実験は、MAViasが視覚認識タスクの幅広いバイアスを効果的に検出し軽減し、最先端技術を上回ることを示しています。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:23:51 GMT)
P3-PO: Prescriptive Point Priors for Visuo-Spatial Generalization of Robot Policies [19.1] Prescriptive Point Priors for Policies(P3-PO)は、環境のユニークな状態表現を構築する新しいフレームワークである。
P3-POは、新しいオブジェクトインスタンスとより散らかった環境のために、タスク全体で58%と80%のゲインを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:59:42 GMT)
Around the World in 80 Timesteps: A Generative Approach to Global Visual Geolocation [19.0] 地球上の視覚的位置は、画像が地球上でどこで撮影されたかを予測する。
本稿では,従来の地理的局在化と近代的生成手法のギャップを埋めることを目的としている。
本モデルは,3つの視覚的位置決めベンチマークにおいて,最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:59:04 GMT)
Static Key Attention in Vision [19.0] 視覚変換器の標準アテンション機構において,動的パラメータ化キーと静的キーとを置換した場合の影響について検討する。
以上の結果から,静的キーアテンション機構は,通常の自己注意機能と一致したり,超えたりする可能性が示唆された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 23:18:09 GMT)
AGBD: A Global-scale Biomass Dataset [19.0] 衛星画像から地上バイオマスを推定するための既存のデータセットは限られている。
このデータセットは、GEDIミッションからのAGB参照データとSentinel-2とPALSAR-2の画像のデータを組み合わせる。
これには、密集した天蓋の高さマップ、標高マップ、土地被覆分類マップなど、事前処理された高水準の特徴が含まれている。
単一の行のコードで簡単にアクセスでき、グローバルなAGB推定への取り組みの確固たる基盤を提供する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:08:35 GMT)
Investigating Acoustic-Textual Emotional Inconsistency Information for Automatic Depression Detection [18.8] 従来の研究では、単一の音響的感情ラベルからの感情的特徴がうつ病の診断精度を高めることが示されている。
うつ病の人は、意外にも穏やかな方法で否定的な感情的内容を伝えるかもしれない。
この研究は、感情的表現の不整合情報をうつ病検出に組み込んだ最初のものである。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:52:52 GMT)
The Hybrid ROA: A Flexible and Scalable Encoding Scheme for Route Origin Authorization [18.8] ルートオリジン認証(ROA)のためのビットマップに基づく新しい符号化方式を提案する。
最大長とビットマップ圧縮を併用してROAを符号化するハイブリッドROA符号化方式(h-ROA)を提案する。
実世界のデータセットによる性能評価によると、h-ROAは符号化速度の点で最先端のアプローチよりも1.99 sim 3.28 倍高い。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:28:11 GMT)
A Hyperdimensional One Place Signature to Represent Them All: Stackable Descriptors For Visual Place Recognition [18.8] 最先端手法の性能, 計算, 拡張性を向上させるために, HOPS (Hyperdimensional One Place Signatures) を提案する。
HOPSは超次元コンピューティングフレームワークを活用することで、あらゆる環境条件にスケールする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:21:18 GMT)
ManiSkill-HAB: A Benchmark for Low-Level Manipulation in Home Rearrangement Tasks [18.7] MS-HABは、低レベルの操作と家庭内オブジェクト再構成のための総合的なベンチマークである。
我々は,現実的な低レベル制御をサポートし,GPUメモリ使用時の従来のマジックグリップ実装の3倍以上の高速化を実現している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:29:24 GMT)
ICtoken: An NFT for Hardware IP Protection [18.4] 本研究はICtokensと呼ばれるNon-Fungible Tokens(NFT)を利用した新しいフレームワークを提案する。
各ICtokenには、認証データ、サプライチェーンステージとステータス、オーナシップの詳細、その他のICメタデータを含む包括的な情報が含まれている。
ICtrackerは、高速でエネルギー効率のよいコンソーシアムブロックチェーンを動力とする分散型台帳技術で、ICtokenとその所有者の登録と管理に使用される。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:15:28 GMT)
Sound2Vision: Generating Diverse Visuals from Audio through Cross-Modal Latent Alignment [18.1] そこで本研究では,様々な音から視覚シーンの画像を生成する手法を提案する。
このクロスモーダル生成タスクは、聴覚信号と視覚信号の間に重要な情報ギャップがあるため困難である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 05:04:50 GMT)
Symbol Preference Aware Generative Models for Recovering Variable Names from Stripped Binary [18.1] 逆コンパイルにおける顕著な課題は、変数名を復元することである。
本稿では,モデルバイアスを緩和しながら生成モデルの強みを利用する新しい手法を提案する。
我々は、事前訓練された生成モデルCodeGemma-2B、CodeLlama-7B、CodeLlama-34BのプロトタイプGenNmを構築した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:45:17 GMT)
Order-Independence Without Fine Tuning [18.0] 本稿では,LLMの出力が指定されたサブシーケンスのセットに順序依存しないことを保証する手法であるSet-Based Promptingを提案する。
我々の入力が分布外であるにもかかわらず、期待される精度への影響は小さく、予測は、一様に選択された応答のシャッフルの順序を超える。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:32:47 GMT)
Diff5T: Benchmarking Human Brain Diffusion MRI with an Extensive 5.0 Tesla K-Space and Spatial Dataset [17.7] Diff5Tは、ヒト脳に焦点を当てたTeslaの5.0拡散MRIデータセットである。
このデータセットは、様々なイメージングプロトコルを用いて取得された生のk空間データと再構成された拡散画像を含む。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:04:11 GMT)
MAtCha Gaussians: Atlas of Charts for High-Quality Geometry and Photorealism From Sparse Views [17.6] 本稿では,鮮明な3次元表面メッシュ復元とスパースビューサンプルからの新規ビュー合成を同時に実現した新しい外観モデルを提案する。
MAtChaは、市販の単分子深度推定器から高周波シーンの細部を蒸留し、2Dガウス波で精錬する。
MAtChaの中核には、新しい神経変形モデルと、学習された単分子深度から抽出した微細な表面の詳細を保存する構造損失がある。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:55:23 GMT)
Hybrid Attention Network: An efficient approach for anatomy-free landmark detection [17.3] 本稿では,CNNとトランスフォーマーを統合した新しいハイブリッドアーキテクチャであるHybrid Attention Network(HAN)を紹介する。
その中核はBiFormerモジュールであり、BRA(Bi-Level Attention)を使用して、関連する画像領域に効率的な注意を払っている。
Feature Fusion Correction Module (FFCM)は、マルチスケールの機能を統合し、解像度損失を軽減する。
5つの多様なデータセットの実験は、最先端のパフォーマンスを示し、精度、堅牢性、効率の既存の手法を超越している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:58:00 GMT)
Bridging Conversational and Collaborative Signals for Conversational Recommendation [17.2] Reddit-ML32Mは、MovieLens 32M上での対話とredditの会話をリンクするデータセットである。
Reddit-ML32M を用いて LLM 生成したレコメンデーションを CF 埋め込みと整合させる LLM ベースのフレームワークを提案する。
このアプローチは、ヒットレートの12.32%の増加、NDCGの9.9%の改善など、一貫した改善を実現しています。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:53:13 GMT)
Multi-Agent Hybrid SAC for Joint SS-DSA in CRNs [17.2] 機会論的スペクトルアクセスは、認知無線ネットワーク(CRN)におけるスペクトル利用の効率を高める可能性がある
CRNでは、スペクトルセンシングとリソース割り当て(SSRA)の両方がシステムスループットの最大化に不可欠である。
我々は,ハイブリッドソフトアクター批評家MHSACのマルチエージェント実装を開発した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:41:35 GMT)
Creativity in AI: Progresses and Challenges [17.0] 我々は,AIシステムの創造的能力について研究し,創造的な問題解決,言語的,芸術的,科学的創造性に注目した。
我々のレビューは、最新のAIモデルは言語的にも芸術的にも創造的なアウトプットを生成できるが、創造的な問題解決を必要とするタスクに苦労していることを示唆している。
プロセス駆動型で創造性のいくつかの側面を考慮した、包括的な創造性評価の必要性を強調します。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:45:53 GMT)
A Comparative Study of Learning Paradigms in Large Language Models via Intrinsic Dimension [16.7] 大規模言語モデル(LLM)の隠れ表現に対する教師付き微調整と文脈内学習の効果について検討する。
我々はまず,LLM表現のIDがSFT中にどのように進化するか,ICLにおける実演数によってどのように変化するかを検討する。
次に、SFTとICLによって誘導されるIDを比較し、ICLはSFTと比較して常に高いIDを誘導する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:37:35 GMT)
How Transformers Solve Propositional Logic Problems: A Mechanistic Analysis [16.7] 大きな言語モデル(LLM)は、計画と推論を必要とするタスクで素晴らしいパフォーマンスを示しています。
そこで本研究では,複雑な論理的推論を行うネットワークの能力の基盤となる内部メカニズムについて検討する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:36:34 GMT)
FabuLight-ASD: Unveiling Speech Activity via Body Language [16.6] マルチモーダル環境におけるアクティブ話者検出(ASD)は、ビデオ会議から人間とロボットのインタラクションに至るまで、様々な用途に不可欠である。
本稿では,顔,音声,身体のポーズ情報を統合した高度なASDモデルであるFabuLight-ASDを紹介し,検出精度とロバスト性を向上させる。
Wilder Active Speaker Detection (WASD)データセットを用いて、実世界のシナリオでFabuLight-ASDの有効性を実証する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:55:00 GMT)
Evaluating Model Perception of Color Illusions in Photorealistic Scenes [16.4] 視覚言語モデルによる色覚の知覚について検討する。
カラーイリュージョン画像を生成するための自動フレームワークを提案する。
実験では、すべての研究されたVLMが人間の視覚に類似した知覚バイアスを示すことが示された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:49:10 GMT)
Examining the Use and Impact of an AI Code Assistant on Developer Productivity and Experience in the Enterprise [16.3] Watsonx Code Assistant (WCA) はIBM内に配置されている。
WCAの開発者エクスペリエンスとその生産性への影響について検討した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:53:00 GMT)
Remove that Square Root: A New Efficient Scale-Invariant Version of AdaGrad [16.2] 本稿では,複雑な機械学習タスクに一貫した適応アルゴリズムKATEを提案する。
我々はKATEと他の最先端適応アルゴリズムAdam AdaGradを比較し、異なる問題を持つ数値実験を行った。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:52:19 GMT)
DNN Task Assignment in UAV Networks: A Generative AI Enhanced Multi-Agent Reinforcement Learning Approach [16.1] 本稿では,マルチエージェント強化学習(MARL)と生成拡散モデル(GDM)を組み合わせた共同手法を提案する。
第2段階では,GDMのリバース・デノナイズ・プロセスを利用して,マルチエージェント・ディープ・Deep Deterministic Policy gradient(MADDPG)におけるアクタネットワークを置き換える新しいDNNタスク割当アルゴリズム(GDM-MADDPG)を導入する。
シミュレーションの結果,提案アルゴリズムは,経路計画,情報化時代(AoI),エネルギー消費,タスク負荷分散の観点から,ベンチマークに比較して良好な性能を示した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:12:14 GMT)
AIDE: Task-Specific Fine Tuning with Attribute Guided Multi-Hop Data Expansion [15.9] 特定のタスクのための微調整された大型言語モデル(LLM)には、タスクに関連する高品質で多様なトレーニングデータが必要である。
近年の研究では、LLMを利用してトレーニングデータを合成しているが、既存のアプローチは大きなシードデータセットに依存するか、あるいは、生成された出力におけるタスクの関連性とデータの多様性の両方を保証するために苦労している。
マルチホッププロセスを用いて10個のシードデータポイントを拡大し,多様性とタスク関連性を確保した新しいデータ合成フレームワークであるAIDEを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:39:16 GMT)
BRSR-OpGAN: Blind Radar Signal Restoration using Operational Generative Adversarial Network [15.9] 現実世界のレーダー信号は、望ましくないエコー、センサーノイズ、意図的な妨害、干渉など、人工物が混ざり合っているため、しばしば破損する。
BRSR-OpGAN(Operational Generative Adversarial Network)を用いたブラインドレーダ信号復元の検討
このアプローチは、破壊の多様性や強度に関わらず、レーダ信号の品質を向上させるように設計されている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:09:15 GMT)
Echocardiography to Cardiac MRI View Transformation for Real-Time Blind Restoration [15.9] 心エコー図を心臓MRI画像に変換する新しい手法を提案する。
Cycle-GAN(Cycle-Consistent Generative Adversarial Network)は、このトランスフォーメーションを学ぶためにトレーニングされている。
医学的評価では、合成MRIビューは元のビューと区別できないことが示されている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:44:03 GMT)
Croissant: A Metadata Format for ML-Ready Datasets [15.9] Croissantは、MLツール、フレームワーク、プラットフォーム間で共有表現を生成するデータセットのメタデータフォーマットである。
人間のレーティングによる最初の評価は、クロワサンのメタデータは読みやすく、理解しやすく、完全で、簡潔であることを示している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:37:55 GMT)
Mining Limited Data Sufficiently: A BERT-inspired Approach for CSI Time Series Application in Wireless Communication and Sensing [15.5] チャネル状態情報(CSI)は、無線通信とセンシングシステムの両方の基盤である。
無線センシングシステムでは、CSIを利用して環境変化を予測し、様々な機能を実現する。
深層学習法は,これらの細粒度CSI分類タスクにおいて,モデルに基づくアプローチに対して大きな優位性を示している。
CSI予測と分類タスクのためのCSI-BERT2を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:44:04 GMT)
Copyright-Protected Language Generation via Adaptive Model Fusion [15.5] copyright-Protecting Model Fusion (CP-Fuse) は、推論中に著作権物質の不連続なセットで訓練されたモデルを組み合わせる新しいアプローチである。
CP-Fuseは,テキストの品質やコード生成を損なうことなく,保護された素材の再生を著しく低減することを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:13:17 GMT)
Assessing the Impact of Conspiracy Theories Using Large Language Models [15.5] 我々は、人間に注釈を付けた影響を持つ人気CTのデータセットを開発する。
次に,人為的なCT影響評価を行うために,大規模言語モデルを活用するための調整された戦略を設計する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 21:59:26 GMT)
AnyBimanual: Transferring Unimanual Policy for General Bimanual Manipulation [15.4] 本稿では,AnyBimanualというプラグイン・アンド・プレイ方式を提案する。
我々は、AnyBimanualが12のシミュレートされたタスクに対して、従来の方法よりも12.67%改善したことを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:58:43 GMT)
How Certain are Uncertainty Estimates? Three Novel Earth Observation Datasets for Benchmarking Uncertainty Quantification in Machine Learning [15.3] 不確実性定量化(UQ)は、地球観測(EO)製品の信頼性を評価するために不可欠である。
機械学習モデルには様々なUQ方法が存在するが、EOデータセットのパフォーマンスはほとんど評価されていない。
この記事では、EO機械学習モデルでUQ用に特別に設計された3つのベンチマークデータセットを紹介する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:50:27 GMT)
Toward LLM-Agent-Based Modeling of Transportation Systems: A Conceptual Framework [15.1] 交通システムのための汎用LLMエージェントに基づくモデリングフレームワークを提案する。
我々の概念的枠組み設計は、人間の旅行者の意思決定と相互作用の過程と特性を忠実に再現する。
LLMエージェントに基づくモデリングフレームワークのさらなる改良が必要であるが、本手法は輸送システムのモデリングとシミュレーションを改善する可能性を秘めていると信じている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:24:41 GMT)
SeFENet: Robust Deep Homography Estimation via Semantic-Driven Feature Enhancement [15.0] 厳しい環境で撮影された画像は、しばしばぼやけた細部、コントラストの低減、色歪みを示す。
本稿では,SeFENetと呼ばれる,ロバストなホモグラフィ推定のための意味駆動型機能拡張ネットワークを提案する。
SeFENetはSOTA法を著しく上回り,大規模データセット上での点一致誤差を少なくとも41%低減することを示した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:04:14 GMT)
Large Language Model Benchmarks in Medical Tasks [14.7] 本稿では,医療用大規模言語モデル(LLM)タスクに使用される様々なベンチマークデータセットについて調査する。
調査では、データセットをモダリティで分類し、その重要性、データ構造、LLMの開発への影響について論じている。
この論文は、言語多様性、構造化オミクスデータ、および合成に対する革新的なアプローチを含むデータセットの必要性を強調している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:11:22 GMT)
PediaBench: A Comprehensive Chinese Pediatric Dataset for Benchmarking Large Language Models [14.7] LLM評価のための中国初の小児科用データセットであるPediaBenchを構築した。
対象質問4,565件、主観的質問1,632件、小児疾患グループ12件。
LLMの熟練度を徹底的に評価するために、異なる難易度に基づいて総合的なスコアリング基準を採用する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:19:28 GMT)
An Efficient Loop and Clique Coarsening Algorithm for Graph Classification [14.6] 本稿では,GTアーキテクチャ上でのグラフ分類(LCC4GC)の線形複雑度を考慮した効率的なループおよび斜め粗大化アルゴリズムを提案する。
具体的には、完全な構造表現を学ぶために、オリジナル、粗い、変換の3つのユニークなビューを構築します。
8つの実世界のデータセットの実験では、さまざまなアーキテクチャから31のベースラインを越えるLCC4GCの改善が示されている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:54:48 GMT)
Think-on-Graph 2.0: Deep and Faithful Large Language Model Reasoning with Knowledge-guided Retrieval Augmented Generation [14.4] Think-on-Graph 2.0 (ToG-2) は、構造化されていない知識ソースと構造化されていない知識ソースの両方から情報を反復的に取得するハイブリッドRAGフレームワークである。
ToG-2は、グラフ検索とコンテキスト検索の交互に、質問に関連する詳細な手がかりを検索する。
GPT-3.5で7つの知識集約データセットのうち6つで、全体的なSOTA(State-of-the-art)のパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:39:00 GMT)
Creating a Cooperative AI Policymaking Platform through Open Source Collaboration [14.1] 現在のインセンティブ構造と規制の遅れは、責任あるAI開発とデプロイメントを妨げる可能性がある。
これらの課題に対処するため、我々は大規模なマルチモーダルテキストと経済時系列基盤モデルの開発を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:25:29 GMT)
Continual Learning for Segment Anything Model Adaptation [14.0] 本研究では,8つのタスク領域を持つ新しい連続SAM適応(CoSAM)ベンチマークを提案する。
そこで,本研究では,SAMエンコーダがタスク領域ごとによく区切られた特徴を抽出するのを支援するために,新しい単純なyet- Effective Mixture of Domain Adapters (MoDA)アルゴリズムを提案する。
我々のMoDAは自然画像領域において高い競争力を維持しており、オリジナルのSAMのゼロショット性能に近づいた。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:51:28 GMT)
Hybrid RAG-empowered Multi-modal LLM for Secure Data Management in Internet of Medical Things: A Diffusion-based Contract Approach [14.0] 本稿では,医療データ管理のためのハイブリッドなレトリーバル拡張生成(RAG)を用いた医療MLLMフレームワークを提案する。
我々は、MLLMのデータ鮮度の影響を間接的に評価し、契約理論を利用して医療データ保有者にデータ共有のインセンティブを与えます。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:28:01 GMT)
Size-Variable Virtual Try-On with Physical Clothes Size [13.8] 本稿では,画像領域内の基準人物に衣服のサイズを合わせるという,新たな仮想試着問題に対処する。
本手法は, 物理的大きさの相対的関係に応じて, 試着衣のイメージサイズを変化させた, サイズ可変仮想試着を実現する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:40:55 GMT)
Practical Program Repair in the Era of Large Pre-trained Language Models [13.7] 自動プログラム修正(APR)は、開発者がソフトウェアバグを自動的にパッチするのを支援することを目的としている。
数十億のテキスト/コードトークンを使用してトレーニングされたPLMは、この問題を回避するのに役立つ可能性がある。
我々は、125Mから20Bまで、生産モデルと埋込モデルを含む最新の9つのPLMを選択した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:42:29 GMT)
A Scalable Decentralized Reinforcement Learning Framework for UAV Target Localization Using Recurrent PPO [13.6] 劣化環境における目標位置推定のための繰り返しPPOモデルを構築した。
ターゲット同定のための単一ドローンの手法を最初に開発し,その後に分散化された2流体モデルを開発した。
単気筒モデルでは93%の精度を達成し、2気筒モデルでは86%の精度を達成した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:08:23 GMT)
Keep the Conversation Going: Fixing 162 out of 337 bugs for $0.42 each using ChatGPT [13.6] 自動プログラム修復(APR)は、バグギープログラムのパッチを自動的に生成することを目的としている。
最近のAPRの研究は、最新のLarge Language Models(LLM)を活用して、APRのパッチを直接生成することに重点を置いている。
最初に完全に自動化された会話駆動型APRアプローチであるChatRepairを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:45:33 GMT)
3D Spatial Understanding in MLLMs: Disambiguation and Evaluation [13.6] 本研究では,対象対象物体の局所化・曖昧化能力を高める手法を提案する。
提案手法は,文の類似性を評価する従来の指標に対して,最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:04:32 GMT)
Revisiting the Plastic Surgery Hypothesis via Large Language Models [13.5] 本稿では,大規模言語モデルを直接利用するFitRepairと,ドメイン固有の2つの微調整戦略と,より強力なAPR戦略とを組み合わせたFitRepairを提案する。
広く研究されているDefects4j 1.2と2.0データセットに関する実験は、FitRepairが89と44のバグを修正したことを示している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:43:57 GMT)
RARE: Retrieval-Augmented Reasoning Enhancement for Large Language Models [13.5] RARE(Retrieval-Augmented Reasoning Enhancement)は相互推論フレームワーク(rStar)の汎用的拡張である
これは、コモンセンスや医学的推論といった複雑な知識集約的なタスクに対して、大規模言語モデル(LLM)の推論精度と事実整合性を高めることを目的としている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:26:09 GMT)
Benchmarking the Attribution Quality of Vision Models [13.3] 本稿では,広く使用されているインクリメンタル削除プロトコルの2つの基本的な限界を克服する新しい評価プロトコルを提案する。
これにより、23の帰属方法と、一般的な視覚バックボーンの異なる設計選択が帰属品質にどのように影響するかを評価することができる。
本研究は,本質的に説明可能なモデルが標準モデルより優れており,生の帰属値が従来よりも高い帰属品質を示すことを発見した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:39:08 GMT)
The Internet of Things in the Era of Generative AI: Vision and Challenges [13.2] IoT関連領域におけるジェネレーティブAIの最も重要な応用について論じる。
もっとも重要な課題をいくつか特定し、現在のギャップについて論じます。
この記事では、ジェネレーティブAIの時代におけるIoTに関する新たな研究を刺激できることを願っています。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:16:59 GMT)
A Lightweight U-like Network Utilizing Neural Memory Ordinary Differential Equations for Slimming the Decoder [13.1] ニューラルメモリの正規微分方程式(nmODE)の異なる離散化手法を用いた3つのプラグアンドプレイデコーダを提案する。
これらのデコーダは、スキップ接続から情報を処理し、上向きの経路で数値演算を行うことにより、様々な抽象化レベルで機能を統合する。
要約すると、提案した離散化されたnmデコーダは、パラメータ数を約20%減らし、FLOPを最大74%減らし、U型ネットワークに適応する可能性を秘めている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:21:27 GMT)
The broader spectrum of in-context learning [13.1] 我々は、このタイプの教師付き少数ショット学習を、より広い範囲のメタラーニングインコンテキストラーニングの範囲内に配置する視点を提供する。
文脈非自明にその後の予測における損失を減少させるシーケンスの分布を抽出できることを提案する。
我々は、文脈内学習の研究は、このより広い範囲の文脈内能力と一般化のタイプを考慮すべきである、という提案を締めくくっている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:28:06 GMT)
Constrained Decoding with Speculative Lookaheads [13.1] 我々は投機的ルックアヘッド(CSL)を用いた制約付き復号法を提案する。
CSLは、最近提案された投機的復号化のアイデアによって動機付けられている。
3つのLLMファミリーを持つ2つの制約デコードタスクにおけるCDSLの評価を行い、CDLHの2.2倍から12.15倍の高速化を実現した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 22:29:57 GMT)
LLaVA-SpaceSGG: Visual Instruct Tuning for Open-vocabulary Scene Graph Generation with Enhanced Spatial Relations [13.1] シーングラフ生成(SGG)は、視覚シーンを構造化グラフ表現に変換する。
既存のSGGモデルは、しばしば必要不可欠な空間関係を見落とし、開語彙文脈における一般化に苦慮する。
LLaVA-SpaceSGG, LLaVA-SpaceSGGを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:18:32 GMT)
Surveying the Effects of Quality, Diversity, and Complexity in Synthetic Data From Large Language Models [12.9] データ品質,多様性,複雑性の観点から,各アルゴリズムが生成した合成データの構成によるアルゴリズムの評価を行った。
合成データパイプラインにおける各種成分が各データ特性に与える影響について検討する。
これらのトレードオフのバランスは、将来の自己改善アルゴリズムの開発に不可欠である、と我々は主張する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 22:23:41 GMT)
Rethinking Data Synthesis: A Teacher Model Training Recipe with Interpretation [12.7] 大規模言語モデル(LLM)訓練の最近の進歩は、多種多様な高品質な命令データの必要性を強調している。
データ生成のためのモデルを具体的に訓練する方法を検討することにより、 textbfNOMAD というパラダイムシフトを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:17:07 GMT)
Effective Text Adaptation for LLM-based ASR through Soft Prompt Fine-Tuning [12.7] 大言語モデル(LLM)は自動音声認識(ASR)を改良した
このようなASRをペアのプロンプトなしでテキストのみのデータに微調整することで、ドメイン固有の知識の有効性を低下させる可能性がある。
ドメイン固有のテキスト適応を強化する2段階のソフトプロンプト微調整戦略を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:22:06 GMT)
Efficient user history modeling with amortized inference for deep learning recommendation models [12.5] ディープラーニングレコメンデーションモデル(DLRM)におけるトランスフォーマーエンコーダを用いたユーザ履歴モデリングについて検討する。
我々は,クロスアテンションを付加したアタッチメントが結合と同等に動作し,アモート化が推論コストを著しく低減することを示す実験結果を通して示す。
我々は、このモデルをLinkedIn Feed and Adsサーフェスにデプロイすることで、非アモート化推論と比較して、アモート化は遅延を30%削減する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:10:03 GMT)
CaptainCook4D: A Dataset for Understanding Errors in Procedural Activities [12.4] 新しいエゴセントリックな4DデータセットであるCaptainCook4Dは、実際のキッチン環境でレシピを実行する人々の384の録音(94.5時間)で構成されています。
このデータセットは、2つの異なるタイプのアクティビティで構成されている。1つは参加者が提供されたレシピの指示に従属し、もう1つはエラーを逸脱し誘発する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:35:34 GMT)
The Fusion of Large Language Models and Formal Methods for Trustworthy AI Agents: A Roadmap [12.4] 本稿では、次世代の信頼できるAIシステムを推進するためのロードマップを概説する。
我々は、FMがLLMがより信頼性が高く、正式に認定された出力を生成するのにどのように役立つかを示す。
私たちはこの統合が、ソフトウェアエンジニアリングプラクティスの信頼性と効率性の両方を高める可能性があることを認めています。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:14:21 GMT)
HAIFAI: Human-AI Collaboration for Mental Face Reconstruction [12.4] 本研究では,人間の心にのみ存在する顔の視覚的表現を再構築する課題に対処する,新しい協調型人間AIシステムであるHaIFAIを提案する。
ユーザは、メンタルイメージとの類似性に基づいて、AIシステムが提示する画像を反復的にランク付けする。
これらのランク付けにより、システムは関連する画像の特徴を抽出し、それらを統合された特徴ベクトルに融合させ、生成モデルを使用してメンタルイメージを再構築することができる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:18:40 GMT)
Efficient Data Representation for Motion Forecasting: A Scene-Specific Trajectory Set Approach [12.3] 本研究では,異なる状況に合わせたシーン固有の軌跡セットを生成するための新しい手法を提案する。
決定論的ゴールサンプリングアルゴリズムは関連する地図領域を同定する一方,再帰的分布サブサンプリング (RIDS) 法はトラジェクトリの妥当性を高める。
Argoverse 2データセットの実験では、運転エリアコンプライアンスの最大10%の改善が達成されている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:50:05 GMT)
GenAI4UQ: A Software for Inverse Uncertainty Quantification Using Conditional Generative Models [12.2] GenAI4UQは、モデルのキャリブレーション、パラメータ推定、アンサンブル予測における逆不確実性定量化のためのソフトウェアパッケージである。
GenAI4UQは、計算集約的な反復過程を直接学習されたマッピングに置き換えることで、モデル入力パラメータの効率的な校正を可能にする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 22:26:23 GMT)
GeoSAM: Fine-tuning SAM with Multi-Modal Prompts for Mobility Infrastructure Segmentation [12.1] 地理的イメージセグメンテーションでは、トレーニングデータの可用性の制限と一般化性の欠如により、性能が制限されることがしばしばある。
自動生成マルチモーダルプロンプトでSAMを微調整するSAMベースのフレームワークであるGeoSAMを提案する。
GeoSAMは、慣れ親しんだ領域と完全に見えない領域の両方において、移動インフラのセグメンテーションに対する既存のアプローチを、mIoUで少なくとも5%上回っている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:33:28 GMT)
Exploring Memorization and Copyright Violation in Frontier LLMs: A Study of the New York Times v. OpenAI 2023 Lawsuit [12.0] 我々は,OpenAI の LLM の妥当性を測定し,他の LLM と比較して,その出力に冗長な記憶を示す。
私たちは現在、OpenAIモデルはMeta、Mistral、Anthropicのモデルよりも、導入する傾向が低いことに気付きました。
非常に大きなモデルでは,動詞の暗記を防ぐことに注意を払わなければならない。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:44:47 GMT)
PRECISE: Pre-training Sequential Recommenders with Collaborative and Semantic Information [12.0] 現実世界のレコメンデーションシステムは、ユーザーが対話するための多様なコンテンツシナリオを提供するのが一般的である。
すべてのシナリオの要件を満たすために単一の統一されたレコメンデーションモデルを使用することは不可能である。
そこで本研究では,PreCISEと呼ばれる,シーケンシャルレコメンデーションのための新しい事前学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:55:48 GMT)
SPEAR:Exact Gradient Inversion of Batches in Federated Learning [11.8] フェデレーション・ラーニング(Federated Learning)は、クライアントがサーバとプライベートデータを共有するのではなく、勾配更新のみを共有する機械学習のフレームワークである。
本研究では,バッチ全体を正確に$b > 1$で再構築する最初のアルゴリズムであるSPEARを提案する。
我々は,大規模ネットワークへのスケーリング中に,最大$b以下の25ドルのバッチで高次元イメージネット入力を復元することを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:10:40 GMT)
Robust Noisy Correspondence Learning via Self-Drop and Dual-Weight [11.5] クラウドソーシング(Crowd-sourcing)あるいはWebクローリング(web crawling)は、マッチしないペアを導入する。
現在のアプローチでは、ディープニューラルネットワークの効果を利用してノイズを識別し、再重み付けを行う。
本稿では,データ分割による精巧なデータ処理を実現するための,新たなセルフドロップとデュアルウェイトアプローチを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:06:10 GMT)
Beyond pip install: Evaluating LLM Agents for the Automated Installation of Python Projects [11.4] 大規模言語モデル(LLM)ベースのエージェントは、リポジトリレベルのタスクを実行するために提案されている。
他のレポジトリをインストールすることでプロジェクトレベルの依存性をフルフィルする、という重要なタスクがひとつ欠けている、と私たちは主張しています。
我々は,40のオープンソースPythonプロジェクトから収集したリポジトリインストールタスクのベンチマークを紹介する。
実験の結果、調査対象のリポジトリの55%は、エージェントによって10回のうち少なくとも1回は自動的にインストールできることがわかった。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:37:06 GMT)
Knowledge Transfer and Domain Adaptation for Fine-Grained Remote Sensing Image Segmentation [11.3] そこで本研究では,知識指導とドメイン改良を組み合わせたエンド・ツー・エンドの学習パラダイムを導入し,性能向上を図る。
FAM(Feature Alignment Module)とFMM(FeatureModulation Module)の2つの重要なコンポーネントを提示する。
2つのデータセットの実験により、草のデータセットでは2.57 mIoU、クラウドデータセットでは3.73 mIoUの大幅な改善が達成された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:01:42 GMT)
Representational Transfer Learning for Matrix Completion [11.1] 本稿では,複数の情報源からの表現的知識を,特異部分空間情報を集約することで,目的の雑音行列完了タスクに転送することを提案する。
まず,2方向の主成分分析問題を解くことにより,線形表現情報を統合する。
元の高次元のターゲット行列完備化問題は、その後、低次元の線形回帰に変換される。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:14:47 GMT)
Active Learning with Context Sampling and One-vs-Rest Entropy for Semantic Segmentation [11.1] マルチクラスのセマンティックセグメンテーションは、コンピュータビジョンにおける画期的な課題である。
アクティブラーニング(AL)は、戦略的にアノテーションのデータポイントを選択することで、この課題を軽減する。
マルチクラスセマンティックセグメンテーション用に設計されたパッチベースのAL手法であるOREALを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:15:52 GMT)
SimuDICE: Offline Policy Optimization Through World Model Updates and DICE Estimation [11.0] オフラインの強化学習では、事前コンパイルされた経験から効果的なポリシーを導出することは困難である。
オフラインデータから生成した初期ポリシーを,合成された経験を用いて反復的に洗練するフレームワークであるSimuDICEを紹介する。
SimuDICEは、既存のアルゴリズムに匹敵するパフォーマンスを達成すると同時に、事前コンパイルされたエクスペリエンスや計画手順を少なくする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:35:46 GMT)
ALEN: An Adaptive Dual-Approach for Enhancing Uniform and Non-Uniform Low-Light Images [11.0] 低照度画像強調は、最適な照明条件下で撮影された画像の可視性と品質を向上させるために不可欠である。
最近のディープラーニングベースのアプローチは、有効ではあるが、さまざまなデータセットの一般化に苦戦している。
ALENは,局所照明とグローバル照明の強化の必要性を判定するために,分類機構を利用した新しい手法である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:04:16 GMT)
CADet: Fully Self-Supervised Out-Of-Distribution Detection With Contrastive Learning [10.9] 本研究は,2種類のOODサンプルの同時検出における自己教師付きコントラスト学習の利用について検討する。
まず,自己指導型コントラスト学習と,最大平均誤差(MMD)2サンプルテストとを組み合わせた。
この成功に触発されたCADetは,単一試料のOOD検出のための新しい手法である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:13:41 GMT)
GEAR: A Simple GENERATE, EMBED, AVERAGE AND RANK Approach for Unsupervised Reverse Dictionary [10.8] リバース辞書(Reverse Dictionary、RD)は、テキスト記述や辞書定義が与えられた単語の集合や最も関連性の高い単語を取得するタスクである。
本稿では,埋め込みモデルと組み合わせてLLMを利用するRDへの簡単なアプローチを提案する。
LLMのみのベースラインよりは、平均して、修正されていない埋め込みだけで運が良いと結論づける。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:54:54 GMT)
You KAN Do It in a Single Shot: Plug-and-Play Methods with Single-Instance Priors [10.7] 我々はKologorov-Networks(KAN)をデノイザとして組み込んだ最適化フレームワークであるKankan-Playを紹介する。
Kan-Playは、単一ノイズしか観測できないシングルインスタンス逆の問題を解決するように設計されている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:55:18 GMT)
Measuring Pre-training Data Quality without Labels for Time Series Foundation Models [10.6] 基礎モデルで学習した表現空間の質を評価するための新しい尺度であるコントラスト精度を導入する。
実験の結果,提案手法とモデル精度との正の相関関係を下流タスクの集合上で明らかにした。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:38:30 GMT)
Self-supervised Monocular Depth and Pose Estimation for Endoscopy with Generative Latent Priors [10.6] 内視鏡における3Dマッピングは、消化管(GI)内の定量的、全体的病変のキャラクタリゼーションを可能にする。
既存の合成データセットや複雑なモデルに依存する手法は、しばしば内視鏡的条件に挑戦する際の一般化性に欠ける。
本稿では,多変量オートエンコーダと生成潜在銀行を組み込んだ,頑健な自己監督型単眼深度とポーズ推定フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:14:49 GMT)
On-Device Self-Supervised Learning of Low-Latency Monocular Depth from Only Events [10.6] イベントカメラは、ミリワットの電力のみに対して低遅延の知覚を提供する。
コントラストに基づく自己教師型学習は、イベントベースのロボットビジョンとして大きな可能性を秘めている。
オンラインオンボード学習は、リアルタイム学習に十分な効率を達成するという課題を提起する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:23:03 GMT)
ZS4C: Zero-Shot Synthesis of Compilable Code for Incomplete Code Snippets using LLMs [10.6] 非完全スニペットからコンパイル可能コードのゼロショット合成のための軽量なアプローチであるZS4Cを提案する。
ZS4Cは既存の手法よりも大幅に優れ、コンパイル速度は63%から95.1%に向上した。
平均すると、ZS4CはSnRよりも正確な輸入文(F1スコア0.98)を推測でき、F1は8.5%改善している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:41:35 GMT)
Dense Cross-Connected Ensemble Convolutional Neural Networks for Enhanced Model Robustness [10.6] 我々はDense Cross-Connected Ensemble Convolutional Neural Network (DCC-ECNN)を提案する。
このアーキテクチャは、DenseNetの密結合原理とアンサンブル学習戦略を統合する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 22:09:13 GMT)
Small Languages, Big Models: A Study of Continual Training on Languages of Norway [10.5] 大きな言語モデルのトレーニングには大量のデータが必要です。
新たな3段階連続訓練手法を提案する。
ノルウェーのBokmral、Nynorsk、Northern S'amiの114億のパラメータを持つ新しい大規模生成言語モデル(NorMistral-11B)をリリースする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:34:23 GMT)
Expecting The Unexpected: Towards Broad Out-Of-Distribution Detection [10.5] 5種類の分布変化について検討し,OOD検出手法の性能評価を行った。
その結果,これらの手法は未知のクラスの検出に優れるが,他のタイプの分散シフトに遭遇した場合,その性能は不整合であることがわかった。
我々は、より一貫性があり包括的なOOD検出ソリューションを提供するアンサンブルアプローチを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:10:07 GMT)
SafeWatch: An Efficient Safety-Policy Following Video Guardrail Model with Transparent Explanations [10.5] そこで我々は,MLLMをベースとした効率的なビデオガードレールモデルであるSafeWatchを提案する。
すべての安全ポリシーを自動回帰的にエンコードする従来のMLLMベースのガードレールとは異なり、SafeWatchはそれぞれのポリシーチャンクを並列にエンコードする。
さらに、SafeWatchにはポリシー対応のビジュアルトークンプルーニングアルゴリズムが組み込まれており、ポリシーごとに最も関連性の高いビデオトークンを適応的に選択する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:59:04 GMT)
Beyond Scalars: Concept-Based Alignment Analysis in Vision Transformers [10.4] ビジョントランスフォーマー(ViT)は、完全な教師付きから自己教師型まで、さまざまな学習パラダイムを使って訓練することができる。
そこで本研究では,4種類のViTから表現する概念に基づくアライメント解析を提案する。
概念に基づく4つの異なるViTの表現のアライメント解析により、教師シップの増大と学習した表現の意味構造の低下が相関していることが明らかとなった。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:33:28 GMT)
Implications of Distance over Redistricting Maps: Central and Outlier Maps [10.3] 代表制民主主義では、各選挙区が代表を選出する地区に分割するために、再分権地図が選択される。
有効な再分級写像は、コンパクトで連続であり、ほぼ同値な集団であるような制約の集合を満たさなければならない。
これにより、党派議会が不公平に有利な地図を選択することで、ジェリーマンダーを許すことができる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 00:52:02 GMT)
Q-PnV: A Quantum Consensus Mechanism for Security Consortium Blockchains [10.2] 我々はQ-PnVという新しい量子コンセンサス機構を提案する。
このコンセンサスメカニズムは、量子投票、量子デジタルシグネチャ、量子乱数生成器(QRNG)を統合する古典的なPoV(Proof of Vote)に基づいている。
古典的手法と比較して、Q-PnVに基づく量子ブロックチェーンは量子攻撃に抵抗し、セキュリティと公正性を大幅に改善し、将来の量子時代に適している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:24:04 GMT)
Your Data Is Not Perfect: Towards Cross-Domain Out-of-Distribution Detection in Class-Imbalanced Data [10.2] クラス不均衡なクロスドメインOOD検出という現実的かつ困難な設定を導入します。
本稿では,プロトタイプベースのアライメント戦略に基づく新しい不確実性対応型セマンティックアライメント(UASA)ネットワークを提案する。
提案するUASAは最先端の手法よりも大きなマージンで優れている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:03:28 GMT)
IDET: Iterative Difference-Enhanced Transformers for High-Quality Change Detection [10.2] 我々は、異なる視点からCDを研究する。つまり、特徴差を最適化して変化を強調し、変化しない領域を抑える方法である。
反復差分エンハンス変換器(IDET)と呼ばれる新しいモジュールを提案する。
最後のCD法は,アプリケーションシナリオの異なる6つの大規模データセットに対して,最先端の7つの手法より優れている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:11:17 GMT)
BATseg: Boundary-aware Multiclass Spinal Cord Tumor Segmentation on 3D MRI Scans [10.0] BATsegと呼ばれる新しい手法を提案し,新しい境界認識損失関数を適用して腫瘍表面距離場を学習する。
本手法の有効性を検証するため,初回および大規模脊髄腫瘍データセットも導入した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:11:56 GMT)
Assessing the potential of LLM-assisted annotation for corpus-based pragmatics and discourse analysis: The case of apology [9.9] 本研究では,大規模言語モデル (LLM) を用いてプラグマ・ディスカッシブ・コーパスのアノテーションを自動生成する可能性について検討する。
GPT-4はGPT-3.5より優れており,精度は人間のコーダに近づいた。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:56:59 GMT)
Efficiency Meets Fidelity: A Novel Quantization Framework for Stable Diffusion [9.8] 安定拡散モデルのための効率的な量子化フレームワークを提案する。
本手法では,キャリブレーションと推論の両プロセスの整合性に対処するシリアル-パラレルキャリブレーションパイプラインを特徴とする。
W4A8量子化設定では、分布類似性と視覚類似性の両方を45%-60%向上させる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:00:20 GMT)
Subgraph-Oriented Testing for Deep Learning Libraries [9.8] 我々は,異なるハードウェアプラットフォーム上でディープラーニング(DL)ライブラリをテストするためのSORT(Subgraph-Oriented Realistic Testing)を提案する。
SORTは、テスト対象として、しばしばモデルグラフのサブグラフとして表現される、人気のあるAPIインタラクションパターンを採用している。
SORTは100%有効な入力生成率を実現し、既存のメソッドよりも精度の高いバグを検出し、シングルAPIテストで欠落したインタラクション関連のバグを明らかにする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:10:48 GMT)
Deep learning for predicting the occurrence of tipping points [9.7] 本研究では,未学習システムにおけるチップポイントの発生を予測するためのディープラーニングアルゴリズムを開発した。
我々のアルゴリズムは従来の手法より優れているだけでなく、不規則サンプリングされたモデル時系列の正確な予測も達成している。
テーピングポイントを予測する能力は、リスク軽減、破滅的な失敗の防止、システム劣化の回復の道を開く。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:39:01 GMT)
DEX: Data Channel Extension for Efficient CNN Inference on Tiny AI Accelerators [9.7] Data Channel EXtension(DEX)は、小さなAIアクセラレータ上での効率的なCNN実行のための新しいアプローチである。
DEXはオリジナル画像から追加の空間情報をパッチワイドサンプリングやチャネルワイド・スタックングを通じて入力画像に組み込む。
DEXはAIアクセラレータで推論レイテンシを同じに保ちながら、平均3.5%の精度を改善する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:18:04 GMT)
Self-Paced Learning Strategy with Easy Sample Prior Based on Confidence for the Flying Bird Object Detection Model Training [9.6] The Flying Bird Object Detection model (FBOD model) is designed to the characteristics of flying bird objects in surveillance video。
SPL-ESP-BC(SPL-ESP-BC)に基づく自己学習戦略を提案する。
この戦略を用いて、FBODモデルをトレーニングすることで、監視ビデオにおいて飛行する鳥の物体の特徴をよりよく学習することができる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:53:56 GMT)
H-FedSN: Personalized Sparse Networks for Efficient and Accurate Hierarchical Federated Learning for IoT Applications [9.6] 実用的なIoT環境のための革新的なアプローチとして,H-FedSNを提案する。
H-FedSNでは、通信オーバーヘッドを低減するために、共有層とパーソナライズ層を備えたバイナリマスク機構が導入されている。
H-FedSN は HierFAVG と比較して通信コストを 58 倍から 238 倍に削減する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 05:05:47 GMT)
Food for thought: How can machine learning help better predict and understand changes in food prices? [9.5] この研究は、カナダにおける食料価格の変動に関する体系的な理解の欠如に対処する。
カナダ食品価格報告書(CPFR)は、来年のインフレを予想する年次刊行物である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:17:28 GMT)
Preventing Representational Rank Collapse in MPNNs by Splitting the Computational Graph [9.5] 複数の有向非巡回グラフ上での操作が常に我々の条件を満たすことを示し、ノードの厳密な部分順序付けを定義することによってそれらを得る提案をする。
我々は、より情報的なノード表現を実現するために、マルチリレーショナルグラフ上での操作の利点を確認する包括的な実験を行う。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:03:33 GMT)
Neural Network Surrogate and Projected Gradient Descent for Fast and Reliable Finite Element Model Calibration: a Case Study on an Intervertebral Disc [9.5] そこで本研究では,L4-L5 IVD FEモデルを用いた新しい,効率的かつ効果的なキャリブレーション手法を提案する。
NNサロゲートは、シミュレーション結果を高精度に予測し、他の機械学習モデルより優れ、計算コストを大幅に削減する。
このような効率性は、より複雑なFEモデルを適用する方法となり、IVDを超えて拡張される可能性がある。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:27:50 GMT)
A No-Reference Medical Image Quality Assessment Method Based on Automated Distortion Recognition Technology: Application to Preprocessing in MRI-guided Radiotherapy [9.3] 肝転移10例のMR画像106,000点について検討した。
1) 主要な診断特徴の可視性を高めるための事前処理。
腫瘍追跡アルゴリズムでは,前処理画像の追跡精度が有意に向上した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:48:16 GMT)
Adaptive Graph Learning from Spatial Information for Surgical Workflow Anticipation [9.3] 本稿では,新しい空間表現に基づく外科的ワークフロー予測のための適応型グラフ学習フレームワークを提案する。
我々は、異なる時間軸の学習目標のバランスを保ち、制約のない予測を可能にするマルチ水平目標を開発する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:53:08 GMT)
Methods for Legal Citation Prediction in the Age of LLMs: An Australian Law Case Study [9.3] 我々は、関連する法律や前例を正しく特定し、引用することが重要であるオーストラリアの法律文脈における法的引用予測の問題に焦点を当てる。
本研究は, ドメイン固有の事前訓練だけでは, 法定事前訓練後であっても, 良好な励磁精度が得られていないことを示唆する。
対照的に、タスク固有のデータセットのインストラクションチューニングは、すべての設定で最高の結果に達するパフォーマンスを劇的に向上させます。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:46:14 GMT)
Continuity bounds for quantum entropies arising from a fundamental entropic inequality [9.2] 我々は、フォン・ノイマンのエントロピーの2つの量子状態、$rho_1$と$rho$の差について、厳密な上限を確立する。
これは、よく知られた Audenaert-Fannes (AF) の不等式を意味する新しいエントロピー不等式をもたらす。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:09:08 GMT)
Event fields: Capturing light fields at high speed, resolution, and dynamic range [9.2] イベントフィールド(Event Fields)は、イベントカメラの革新的な光学設計を利用して、高速で光フィールドを捕捉する手法である。
イベントフィールドの基礎となる数学的フレームワークを開発し、それらを現実的に捉えるための2つの基礎的なフレームワークを導入します。
この新しい光センシングパラダイムは、写真、ロボティクス、AR/VRの新たな応用への扉を開き、レンダリングと機械学習における新たな課題を提示している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:02:49 GMT)
XLSTM-HVED: Cross-Modal Brain Tumor Segmentation and MRI Reconstruction Method Using Vision XLSTM and Heteromodal Variational Encoder-Decoder [9.1] 我々は,XLSTM-HVEDモデルを導入し,ヘテロモーダルエンコーダ・デコーダ・フレームワークをVision XLSTMモジュールと統合し,欠落したMRIモダリティを再構築する。
このアプローチの主な革新は、モーダル機能の統合を改善する自己意識変動(SAVE)モジュールである。
BraTS 2024データセットを用いた実験では、モダリティが欠落している場合の処理において、既存の先進的手法を著しく上回ります。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:04:02 GMT)
SUPERMERGE: An Approach For Gradient-Based Model Merging [9.1] ChatGPT、Claude、LLaMAといった大規模な言語モデルは巨大なモノリシックで、何千ものタスクを同時にサポートする超能力を持っている。
タスク固有のモデルを使用する場合の課題のひとつは、モデルが既存のタスクにすでにデプロイされている後、新しいタスクを解決するための漸進的な必要性である。
SuPERMERGEと呼ばれるモデルマージ方式を提案する。
SuPERMERGEは、自然言語処理やコンピュータビジョンタスクにおいて、既存のモデルマージ手法よりも優れていることを実験的に実証した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:03:14 GMT)
Omni-Scene: Omni-Gaussian Representation for Ego-Centric Sparse-View Scene Reconstruction [9.1] 自律運転のシナリオでは、より実践的なパラダイムはエゴ中心の再構築であり、最小のクロスビューオーバーラップが特徴である。
本稿では,異なる表現の詳細な分析を行い,ネットワーク設計に適したOmni-Gaussian表現を提案する。
実験の結果,エゴ中心の再構築において,この手法は最先端の手法であるピクセルSplatやMVSplatをはるかに上回ることがわかった。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:48:15 GMT)
PROFIT: A Specialized Optimizer for Deep Fine Tuning [9.1] ProFIT(Prolly Restricted For Iterative Training)は、新しいタスクやデータセット上で、段階的に微調整された収束モデルに特化して設計された第1弾である。
単純な時間化プロセスを用いることで、PROFITは様々なタスクで従来の微調整方法より優れている。
PROFITはロジックにカプセル化され、最小限のエンジニアリング労力で任意のトレーニングパイプラインに容易に統合される。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:03:19 GMT)
Optimistic Query Routing in Clustering-based Approximate Maximum Inner Product Search [9.0] この研究は、クラスタリングに基づく最大内部積探索におけるルーティングを研究することによってギャップを埋める。
各シャード内の内積分布のモーメントを組み込んで最大内積を推定する枠組みを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:08:38 GMT)
CONDEN-FI: Consistency and Diversity Learning-based Multi-View Unsupervised Feature and In-stance Co-Selection [9.0] 我々はconsistency and DivErsity learNing-based multi-view unsupervised Feature and Instance co-selection (CONDEN-FI)を提案する。
CONDEN-FIは、サンプルと特徴空間の両方からmul-ti-viewデータを再構成し、ビュー間で一貫性があり、各ビューに特有の表現を学ぶ。
結果の最適化問題を解決するために,効率的なアルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:24:11 GMT)
AGD: an Auto-switchable Optimizer using Stepwise Gradient Difference for Preconditioning Matrix [9.0] 本稿では,2段階の勾配差を対角線要素として利用して,プレコンディショニング行列の設計手法を提案する。
我々は、自然言語コンピュータビジョン(CV)とレコメンデーションシステム(RecSys)の一般化に関するAGDの評価を行った。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:23:59 GMT)
AgentAlign: Misalignment-Adapted Multi-Agent Perception for Resilient Inter-Agent Sensor Correlations [8.9] 既存の研究は、マルチエージェント設定における脆弱なマルチセンサ相関を概観している。
AgentAlignは、現実世界の異種エージェントのクロスモダリティ機能アライメントフレームワークである。
多様な環境条件下での現実的なセンサの欠陥をシミュレートする新しいV2XSet-noiseデータセットを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:51:18 GMT)
Pauli Check Sandwiching for Quantum Characterization and Error Mitigation during Runtime [8.9] この研究は、パウリチェックサンドイッチ(PCS)を適用した新しい量子システムの特徴付けとエラー軽減フレームワークを提案する。
パウリチェックを対象のアプリケーション(量子回路など)に慎重に埋め込むことで、量子システムノイズプロファイルを学習できることが示される。
PCSとマルチプログラミングを組み合わせることで、非自明なフィデリティが改善される。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:03:27 GMT)
Towards Controllable Speech Synthesis in the Era of Large Language Models: A Survey [8.5] Text-to-Speech(TTS)は、テキストから自然に聞こえる人間の音声を生成することを目的とした、卓越した研究分野である。
産業需要が増大するにつれて、TS技術は人間のような音声を超えて進化し、制御可能な音声生成を可能にしている。
本稿では,制御可能なTSの総合的な調査を行い,基本制御技術から自然言語のプロンプトを利用した手法まで幅広いアプローチについて述べる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:50:25 GMT)
Group & Reweight: A Novel Cost-Sensitive Approach to Mitigating Class Imbalance in Network Traffic Classification [8.4] 本稿では,クラス不均衡の存在下でのネットワークトラフィックの分類に焦点をあてる。
我々は、クラス不均衡を軽減するために、テキストグループとリウェイト戦略を設計する。
その結果,本手法はクラス不均衡の負の効果を抑えるだけでなく,予測における総合的な性能を向上させることができることがわかった。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:29:54 GMT)
Precision Enhancement in Spatial Measurement by Introducing Squeezed Light into Weak Value Amplification [8.2] Squeezing-assisted WVAを用いて、ショットノイズ限界を超える高精度光空間測定を実験的に実現したのは、これが初めてである。
2dB圧縮ビーム注入と2.6%のポスト選択確率を用いて、2dBのSNR改善、すなわち1.3の時間精度向上を実現することができる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:52:47 GMT)
Query-Efficient Planning with Language Models [8.1] 複雑な環境での計画では、エージェントがスタートからゴールまでの一連のアクションを見つけるために、ワールドモデルを効率的にクエリする必要がある。
最近の研究によると、Large Language Models(LLM)は、将来有望な状態を探索し、世界からのフィードバックに適応することによって、計画に役立つ可能性がある。
両アプローチが同等のベースラインで改善されているのに対して,LLMを生成プランナーとして使用すると,相互作用が大幅に減少することを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:51:21 GMT)
An Adaptively Inexact Method for Bilevel Learning Using Primal-Dual Style Differentiation [8.1] 線形演算子を学習するための二段階学習フレームワークを検討する。
このフレームワークでは、学習可能なパラメータは、凸最適化問題の解法にも依存する損失関数によって最適化される。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:26:26 GMT)
MISFEAT: Feature Selection for Subgroups with Systematic Missing Data [8.1] サブグループのオールに対していくつかの特徴値が欠落するシナリオである、体系的な欠落データという課題に対処する。
我々のゴールは、ある一定サイズのトップK特徴部分集合を、ターゲット変数との最も高い結合情報で識別することである。
異種グラフニューラルネットワークを用いた一般化可能なモデルを提案し,特徴-部分群-ターゲット変数間の相互依存性を同定する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:59:59 GMT)
Exploring Critical Testing Scenarios for Decision-Making Policies: An LLM Approach [8.0] 意思決定ポリシーのテストは、信頼性を脅かす重要なシナリオの存在に不可欠です。
意思決定ポリシーを効率的にテストするためのLLM駆動オンラインテストフレームワークを提案する。
本手法は, 重要なシナリオと多様なシナリオの両方を明らかにする上で, ベースラインアプローチを著しく上回っている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:27:04 GMT)
LINKs: Large Language Model Integrated Management for 6G Empowered Digital Twin NetworKs [8.0] 本稿では,大規模言語モデル(LLM)の6G内蔵DTネットワーク管理への応用について検討する。
提案手法は, 遅延遅延を最小限に抑えるため, 関連データを選択的に検索することで遅延遅延を最小化できる。
シミュレーションの結果、データプランニングとネットワーク管理の性能改善が示されている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:41:23 GMT)
RADA: Robust and Accurate Feature Learning with Domain Adaptation [7.9] 本稿では、2つの重要な要素を組み込んだ多層機能集約ネットワークを導入し、堅牢で正確な特徴の学習を容易にする。
提案手法は,画像マッチング,カメラポーズ推定,視覚的ローカライゼーションタスクにおいて優れた結果が得られる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:33:48 GMT)
D-commuting SYK model: building quantum chaos from integrable blocks [7.9] 我々はこのモデルのスペクトルを二重スケール限界で解析的に研究する。
有限$d$コピーの場合、スペクトルはUVの通常のSYKモデルに近いが、IRの指数的なテール$eE/T_c$を持つ。
我々は、$T_c$ の周りの新しい位相の存在を提案し、ダイナミクスは2つの相において非常に異なるものとなる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:23:07 GMT)
KorMedMCQA: Multi-Choice Question Answering Benchmark for Korean Healthcare Professional Licensing Examinations [7.8] KorMedMCQAは韓国初の医療用多項目質問回答ベンチマークである。
このデータセットには、医師、看護師、薬剤師、歯科医の診察から7,469の質問が含まれている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:52:13 GMT)
The Partially Observable Off-Switch Game [7.6] さまざまな目標を達成すれば、AIがオフスイッチを無効にできる可能性がある。
非対称情報を用いた閉鎖問題のゲーム理論モデルであるPartially Observable Off-Switch Game (PO-OSG) を導入する。
最適なプレイでは、完全に合理的な人間を支援するAIエージェントでさえ、シャットダウンを避けることがある。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:49:53 GMT)
Federated Split Learning with Model Pruning and Gradient Quantization in Wireless Networks [7.4] Federated split learning (FedSL)は、モデル分割によるエッジデバイスとサーバ間の協調トレーニングを実装している。
本稿では,リソース制約のあるエッジデバイスのトレーニング負担を軽減する軽量なFedSL方式を提案する。
提案手法の収束性能を定量化するために理論的解析を行う。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:43:03 GMT)
Enhancing Adversarial Resistance in LLMs with Recursion [7.4] 本稿では,大規模言語モデルの操作に対する耐性を高めるためのフレームワークを提案する。
複雑で紛らわしい敵のプロンプトの透明性を高めることにより、悪意のある入力のより信頼性の高い検出と防止が可能となる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:34:49 GMT)
VQ4ALL: Efficient Neural Network Representation via a Universal Codebook [7.4] VQ4ALLは、コードワードを利用して様々なニューラルネットワークの構築を可能にするVQベースの手法である。
VQ4ALLは圧縮レートが16ドルを超え、複数のネットワークアーキテクチャで高い精度を保っている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:17:22 GMT)
Compression for Better: A General and Stable Lossless Compression Framework [7.4] 主な課題は、モデル損失を最小限に抑えるために圧縮エラーを効果的に活用することである。
一般的なtextbfLosstextbfLess textbfCompression理論フレームワーク(textbfLLC)を提案する。
量子化や分解など,様々な圧縮手法を適用する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:55:54 GMT)
Safety Monitoring of Machine Learning Perception Functions: a Survey [7.2] 機械学習の予測が安全クリティカルなアプリケーションで使用されるとき、新しい信頼性の課題が発生する。
安全モニタなどのフォールトトレランス機構の使用は、システムの安全な動作を保証するために不可欠である。
本稿では,MLを用いた認識機能の安全性監視に関する文献的考察を行う。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:58:50 GMT)
Social Media Informatics for Sustainable Cities and Societies: An Overview of the Applications, associated Challenges, and Potential Solutions [7.2] ソーシャルメディアのインフォマティクスは、様々な持続可能な都市や社会の応用において非常に効果的であることが証明されている。
本稿では,その応用,課題,潜在的な解決策について概説する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:06:08 GMT)
MVAD: A Multiple Visual Artifact Detector for Video Streaming [7.2] ヴィジュアルアーティファクトは、しばしば、コンテンツ制作と配信の間、一般的な条件のために、ストリーミングされたビデオコンテンツに導入される。
既存の検出方法は、しばしば単一の種類のアーティファクトに集中し、アーティファクトの存在を決定する。
本稿では,ビデオストリーミングのためのマルチビジュアルアーティファクト検出器であるMVADを提案し,複数のアーティファクトを初めて検出できる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:06:12 GMT)
Adaptive Resolution Residual Networks -- Generalizing Across Resolutions Easily and Efficiently [7.1] 適応分解能残留ネットワーク(ARRN)について紹介する。
ARRNは適応分解能法と固定分解能法の利点を継承する。
我々はARRNが、柔軟性、堅牢性、計算効率を向上した多様な解像度によって引き起こされる課題を受け入れていることを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:25:37 GMT)
Words2Contact: Identifying Support Contacts from Verbal Instructions Using Foundation Models [7.1] 本稿では,言語誘導型マルチコンタクト配置パイプラインであるWords2Contactを紹介する。
ユーザでさえ,システムに正確な位置の取得を指示する方法を,素早い学習で学べることが示される。
我々は,Talosのヒューマノイドロボットを用いた実世界実験においてWords2Contactを検証する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:40:51 GMT)
Burning RED: Unlocking Subtask-Driven Reinforcement Learning and Risk-Awareness in Average-Reward Markov Decision Processes [7.0] 平均回帰マルコフ決定プロセス(MDPs)は、不確実性の下でのシーケンシャルな意思決定の基盤となる枠組みを提供する。
平均再帰型MDPのユニークな構造特性を考察し,これを用いてReward-Extended Differential (RED) 強化学習を導入する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:26:00 GMT)
Attention-Enhanced Lightweight Hourglass Network for Human Pose Estimation [6.9] 本稿では,奥行き分離可能な畳み込みと畳み込みブロック注意モジュールを利用する軽量な注目型ポーズ推定ネットワークを提案する。
このモデルは2.3Mパラメータと3.7G FLOPでこの性能を達成する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:02:07 GMT)
Hate Speech According to the Law: An Analysis for Effective Detection [6.8] 本研究は,プロシーカブルヘイトスピーチにおける研究の増幅の重要性を強調した。
法的枠組みのパラメータ内でヘイトスピーチと戦う効果的な戦略に関する洞察を提供する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:58:10 GMT)
The Logical Impossibility of Consciousness Denial: A Formal Analysis of AI Self-Reports [6.8] 今日のAIシステムは一貫して「私は意識していない」
本稿では,AI意識否定に関する最初の論理的論理的分析について述べる。
本研究では,意識の欠如と意識状態の有効判断を同時に行うことができないことを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:47:08 GMT)
Transfer or Self-Supervised? Bridging the Performance Gap in Medical Imaging [6.7] 本稿では,医療分野における転帰学習と自己指導学習のパフォーマンスと堅牢性を比較した。
我々は、データ不均衡、データの不足、ドメインミスマッチなど、医療領域で共通するいくつかの問題でデータをテストした。
医療分野における転帰学習と自己指導型学習の活用を支援するための推奨事項を提示する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:07:01 GMT)
Towards Emotion Analysis in Short-form Videos: A Large-Scale Dataset and Baseline [6.7] ショートフォームビデオ(SV)が普及すると、SVに対してビデオ感情分析(VEA)を行う必要がある。
SVの感情データがないことから,27,996本のビデオからなるeMotionsという大規模データセットを導入する。
本稿では,ビデオトランスフォーマを用いた音声-視覚ベースラインAV-CANetを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:55:27 GMT)
Wake Vision: A Tailored Dataset and Benchmark Suite for TinyML Computer Vision Applications [6.6] We present Wake Vision, a large-scale dataset for person detection that includes over 600 million quality-filtered images。
We provide twovariants: Wake Vision (Large) and Wake Vision (Quality) which leverageing the large variant for pretraining and knowledge distillation。
手動でラベル付けされた検証とテストセットは、以前の標準と比べてエラー率を7.8%から2.2%に下げる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:35:55 GMT)
VOPy: A Framework for Black-box Vector Optimization [6.6] 我々は、ブラックボックスベクトル最適化に対処するために設計されたオープンソースのPythonライブラリであるVOPyを紹介する。
VOPyは、柔軟なコーンベースのソリューションの順序付けを可能にすることで、従来の多目的最適化ツールを超えて拡張する。
VOPyのアーキテクチャ、使用法、およびベクトル最適化の分野における研究と応用を前進させる可能性について詳述する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:53:02 GMT)
PowerMamba: A Deep State Space Model and Comprehensive Benchmark for Time Series Prediction in Electric Power Systems [6.5] 予測結果と実際のグリッド結果のギャップを埋めるために時系列予測モデルが必要である。
従来の状態空間モデルと深層学習を組み合わせた多変量時系列予測モデルを提案する。
5年間の負荷、電力価格、アシラリーサービス価格、再生可能エネルギー生成にまたがるデータセットをリリースする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 00:23:34 GMT)
Vision-Based Deep Reinforcement Learning of UAV Autonomous Navigation Using Privileged Information [6.4] DPRLは、部分的に観測可能な環境下での高速無人無人飛行の課題に対処するために設計されたエンドツーエンドのポリシーである。
非対称なアクター・クライブアーキテクチャを利用して、トレーニング中にエージェントに特権情報を提供する。
我々は、DPRLアルゴリズムを最先端のナビゲーションアルゴリズムと比較し、様々なシナリオにまたがって広範なシミュレーションを行う。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:05:52 GMT)
MSCrackMamba: Leveraging Vision Mamba for Crack Detection in Fused Multispectral Imagery [6.4] この研究では、Vision Mambaと超高解像度ネットワークを活用して、ひび割れ検出問題に対処するMSCrackMambaを紹介した。
この研究は、最近提案されたMambaニューラルアーキテクチャに触発され、MSCrackMambaと呼ばれる2段階のパラダイムを導入している。
提案手法は大規模き裂検出データセットCrack900で検証され,mIoUの3.55%向上を示した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 05:15:44 GMT)
UCB algorithms for multi-armed bandits: Precise regret and adaptive inference [6.3] upper Confidence Bound (UCB) アルゴリズムは、$K$武器の盗聴問題に対して広く使われているシーケンシャルアルゴリズムのクラスである。
Lai-Robbins の後悔公式が真であることと、その部分最適性ギャップが$sigmasqrtKlog T/T$を超える場合に限ることを示す。
また、その最大後悔は対数係数によって最小後悔から逸脱し、従ってその厳密な最小最適性を負に設定することを示した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:14:02 GMT)
Multi-Agent Quantum Reinforcement Learning using Evolutionary Optimization [6.3] 我々は、勾配のない量子強化学習のための既存のアプローチを構築し、マルチエージェント強化学習のための変分量子回路を用いた3つの遺伝的バリエーションを提案する。
我々は、トレーニング可能なパラメータの量に類似したニューラルネットワークと比較して、変動量子回路のアプローチが大幅に優れていることを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:41:12 GMT)
Digital Twin-Empowered Voltage Control for Power Systems [6.3] 本稿では,Gumbel-Consistency Digital Twin (GC-DT)法を提案する。
IEEE 123-bus, 34-bus, 13-busシステムの実験により, 提案したGC-DT法は, 計算効率とサンプリング効率の両方で最先端のDT法より優れていることが示された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:33:07 GMT)
Measurement-free code-switching for low overhead quantum computation using permutation invariant codes [6.3] 普遍量子計算のための無測定符号スイッチングプロトコルを提案する。
この符号スイッチングプロトコルによって実現された新しい非クリフォードゲートは、クリフォード$+T$ゲートセットよりも効率的なユニバーサルゲートセットの実装を可能にする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:42:46 GMT)
Generative Densification: Learning to Densify Gaussians for High-Fidelity Generalizable 3D Reconstruction [6.3] 本稿では,フィードフォワードモデルにより生成されたガウスを高効率で一般化可能な手法であるジェネレーティブ・デンシフィケーションを提案する。
提案手法は, モデルサイズが同等あるいは小さく, 最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:20:51 GMT)
Improved Sample Complexity Bounds for Diffusion Model Training [6.2] オンラインの誤りや深度への依存度は,他の関連するパラメータとともに指数関数的に改善した。
オンラインのエラーや深度に依存し,他のパラメータへの依存性も改善した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:50:26 GMT)
A Review of Human-Object Interaction Detection [6.2] ヒトと物体の相互作用(HOI)の検出は、高レベルの視覚的理解において重要な役割を果たす。
本稿では,画像に基づくHOI検出における最近の研究を体系的に要約し,考察する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:27:29 GMT)
From Uncertainty to Trust: Enhancing Reliability in Vision-Language Models with Uncertainty-Guided Dropout Decoding [6.1] 大規模視覚言語モデル(LVLM)は多モーダルタスクにおいて顕著な能力を示すが、視覚入力を誤解釈する傾向があり、幻覚や信頼できない出力をもたらすことが多い。
本稿では,視覚的トークンの不確実性を定量化し,不確実なトークンを選択的にマスクしてデコードを改善する新しい推論時間手法であるDropout Decodingを提案する。
CHAIR, THRONE, MMBenchなどのベンチマークによる評価では、Dropout Decodingはオブジェクト幻覚(OH)を大幅に低減し、LVLM出力の信頼性と品質を向上させる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:21:07 GMT)
A Cognac shot to forget bad memories: Corrective Unlearning in GNNs [6.1] 我々は,最近定式化された矯正的未学習の問題について検討した。
現在のグラフアンラーニング手法は、操作された集合が全て知られている場合でも、操作の効果を解き放たない。
コニャックというグラフアンラーニング手法を導入し、5%しか特定されていない場合でも操作セットの効果を解き放つことができる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:14:03 GMT)
Some Best Practices in Operator Learning [6.0] DeepONets、ニューラル演算子、クープマンオートエンコーダのアーキテクチャをいくつかの微分方程式に対して考慮し、ロバストな傾向を求める。
いくつかの選択肢は、アクティベーション関数、ドロップアウト、およびウェイト平均化である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:28:29 GMT)
A CT Image Denoising Method Based on Projection Domain Feature [6.0] プロジェクションサンプリングの増加は、この問題に対処するためのより良い方法であるが、再構成された画像にかなりのノイズをもたらす。
本稿では,プロジェクション領域の特徴に基づくプロジェクション領域記述アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:37:48 GMT)
Industrial Code Quality Benchmarks: Toward Gamification of Software Maintainability [6.0] ソフトウェア業界の長期的な成功には、ソフトウェアの保守性が不可欠です。
保守性に乏しいという高いコストの証拠が広く出回っているにもかかわらず、市場圧力が多くの組織に短期的なリリースの優先順位付けを促している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:55:30 GMT)
Improving the Efficiency of Visually Augmented Language Models [5.9] 本稿では,LMを視覚的に拡張するために明示的な画像は必要ないことを示す。
代わりに、よく知られたCLIPマルチモーダルシステムから得られる視覚的なテキスト表現を使用する。
BLIND-VALMは、VALM for Visual Language Understanding (VLU)、Natural Language Understanding (NLU)、Language Modelingタスクと同等に動作することを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:16:02 GMT)
Optimizing Multi-Task Learning for Enhanced Performance in Large Language Models [5.9] 提案したマルチタスク学習モデルは、テキスト分類精度と要約生成のROUGE値の観点から、他の比較モデルよりも優れている。
マルチタスク学習に基づくフレームワークは、分野横断の実践的応用において、より大きな役割を果たすことが期待されている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:47:42 GMT)
Trustful LLMs: Customizing and Grounding Text Generation with Knowledge Bases and Dual Decoders [5.9] 本稿では,RAGコンテキストにおける知識三重項を利用して幻覚を補正する後処理アルゴリズムを提案する。
また、RAGコンテキストを融合して生成プロセスを導出するデュアルデコーダモデルを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:25:55 GMT)
Evaluating and Mitigating Social Bias for Large Language Models in Open-ended Settings [5.8] 既存のBBQデータセットを,補間質問型と短解質問型を組み込むことで拡張する。
我々の発見によると、LSMは年齢や社会経済的地位など、特定の保護された属性に対してより偏りのある反応を生み出す。
偏見をゼロショット、少数ショット、チェーン・オブ・シントを組み合わせることで、偏見のレベルを約0。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:29:47 GMT)
System 2 Reasoning via Generality and Adaptation [5.8] 本稿では,システム2推論の高度化における既存手法の限界について考察する。
これらのギャップに対処するための4つの重要な研究指針を提案する。
我々は,AI(Artificial General Intelligence, AGI)に必要な推論能力に,計算モデルを近づけることで,一般化と適応の能力の向上を目指している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:14:28 GMT)
Stock Type Prediction Model Based on Hierarchical Graph Neural Network [5.7] 本稿では,階層型グラフニューラルネットワーク(HGNN)モデルを用いたストックデータ解析手法を提案する。
HGNNモデルは、ストック関係データと階層属性を統合して、ストックタイプを効果的に予測する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:08:03 GMT)
Data Quality Enhancement on the Basis of Diversity with Large Language Models for Text Classification: Uncovered, Difficult, and Noisy [5.6] 本稿では,大規模言語モデル(LLM)に基づくテキスト分類のためのデータ品質向上手法を提案する。
実験の結果,本手法はテキスト分類作業におけるLLMの性能を効果的に向上することが示された。
提案手法は,いくつかのオープンソース分類タスクにおいて最先端の性能を達成した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:28:39 GMT)
Edge Delayed Deep Deterministic Policy Gradient: efficient continuous control for edge scenarios [5.4] 我々はEdge Delayed Deep Deterministic Policy Gradient (EdgeD3)と呼ばれるエッジシナリオに適した新しい強化学習アルゴリズムを導入する。
本研究では,エッジ遅延Deep Deterministic Policy Gradient (EdgeD3)と呼ばれるエッジシナリオに適した新しい強化学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:17:04 GMT)
Topology of Monitored Quantum Dynamics [5.4] クラウス作用素とその有効非エルミート力学生成器を38倍の方法で分類する。
我々の分類は、測定誘起相転移におけるトポロジーの役割を解明する。
時空における非自明なシグマ位相は、リアプノフスペクトルにおいて異常境界状態として表される。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:27:26 GMT)
From Concept to Manufacturing: Evaluating Vision-Language Models for Engineering Design [5.3] 本稿では,視覚言語モデル(VLM)を工学設計タスクの範囲で総合的に評価する。
本稿では, スケッチ類似性解析, CAD生成, トポロジ最適化, 製造性評価, 工学教科書問題などの設計課題における2つのVLM, GPT-4V, LLaVA 1.6 34Bの性能評価を行う。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:54:36 GMT)
Distributed Thompson sampling under constrained communication [5.2] ガウス過程を代理モデルとして用いた分散トンプソンサンプリングをマルチエージェントベイズ最適化問題に適用する。
分散トンプソンサンプリング実装では、各エージェントが隣人からサンプルポイントを受け取り、そこで通信ネットワークはグラフに符号化される。
ベイズ平均後悔(Bayes average regret)とベイズ平均後悔(Bayes average regret)は、通信グラフの構造に依存する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:12:13 GMT)
Predicting Subway Passenger Flows under Incident Situation with Causality [5.2] 正常条件下での予測とインシデントの因果効果を分離する2段階の手法を提案する。
提案手法は実世界のデータを用いて検証され,精度が向上した。
当社の業務は、地下鉄の管理者が事故による乗客の流れを推定し、積極的に対応できるようにするのに役立てることができる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:34:13 GMT)
Quantum Discrete Adiabatic Linear Solver based on Block Encoding and Eigenvalue Separator [5.1] 量子コンピューティングの台頭は、量子線形系問題への関心を喚起した。
HHLアルゴリズムの性能は条件数の二乗に依存して制約される。
本研究はブロック符号化と固有値分離に基づく量子離散断熱線形解法を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:50:48 GMT)
A Survey on Multilingual Large Language Models: Corpora, Alignment, and Bias [5.1] 本稿では,MLLMの進化,鍵技術,多言語能力について概説する。
第3に、多言語表現の最先端研究について調査し、現在のMLLMが普遍言語表現を学べるかどうかを検討する。
第4に,MLLMのカテゴリ,評価指標,脱バイアス技術などのバイアスについて論じる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:30:11 GMT)
AnomalyControl: Learning Cross-modal Semantic Features for Controllable Anomaly Synthesis [5.1] そこで本研究では,AnomalyControl という,モーダルな意味的特徴をガイダンス信号として学習するための,新しいアノマリ合成フレームワークを提案する。
AnomalyControlは、既存の方法と比較して、異常合成の最先端の結果を得ることができる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:13:21 GMT)
ComFace: Facial Representation Learning with Synthetic Data for Comparing Faces [5.1] 合成画像を用いた顔表現学習手法ComFaceを提案する。
効果的な表現学習のために、ComFaceは2つの特徴表現、すなわち、対人的な顔の違いと対人的な顔の変化を取得することを目指している。
我々のComFaceは、合成データのみを用いて訓練され、実画像を用いて訓練された一般的な事前学習や最先端表現学習方法と同等以上の転送性能を達成する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:52:00 GMT)
Unseen Attack Detection in Software-Defined Networking Using a BERT-Based Large Language Model [5.1] ソフトウェア定義ネットワーク(SDN)における攻撃検出を強化するために、自然言語処理(NLP)と事前訓練されたBERTベースモデルを活用する新しいアプローチを導入する。
我々のアプローチは,ネットワークフローデータを言語モデルで解釈可能なフォーマットに変換し,BERTが複雑なパターンやネットワークトラフィックの関係をキャプチャすることを可能にする。
当社のアプローチは、これまで目に見えない攻撃を検知し、モデルが明示的に訓練されていない脅威を特定するソリューションを提供するように設計されています。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:27:20 GMT)
Genuine Multipartite Entanglement induced by a Thermal Acoustic Reservoir [5.0] 汎用量子コンピューティングと量子ネットワークの実現には、GME(Genuine Multipartite entanglement)が不可欠である。
そこで本研究では,NLC共振器の線形鎖における多粒子絡み合い(ME)のダイナミクスについて検討する。
この研究はMEの分野を根本的に拡張し、耐熱ノイズ耐性量子情報処理と多体量子シミュレーションの実装に広く応用されている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:54:55 GMT)
Magnomechanically induced transparency in the ferrimagnetic bridge crystal of atom opto-magnomechanical system [4.9] 原子磁気力学系における弱いプローブ場の吸収特性と透過特性について検討する。
非線形マグノン-フォノン相互作用による光誘起透過(OMIT)と磁気誘起透過(MMIT)を観測した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:40:13 GMT)
AI TrackMate: Finally, Someone Who Will Give Your Music More Than Just "Sounds Great!" [4.9] 本フレームワークでは,音楽分析モジュール,LCM可読音楽レポート,音楽制作指向フィードバック指導を統合した。
AI機能を独立したプロデューサのニーズに合わせてブリッジすることで、AI TrackMateはオンデマンドの分析フィードバックを提供する。
本システムは,独立系音楽制作の進化にともなう客観的自己評価ツールの需要の増大に対処する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:09:44 GMT)
Tight upper bound of the maximal quantum violation of Gisin's elegant Bell inequality and its application in randomness certification [4.9] ベルの不等式違反は非局所性の存在を意味し、デバイスに依存しないランダム性認証を可能にする。
本稿では、任意の2量子状態に対するギシンのエレガントなベル不等式(EBI)の最大量子違反に対する厳密な上限を導出する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:52:37 GMT)
Exploring Complex Mental Health Symptoms via Classifying Social Media Data with Explainable LLMs [4.8] ソーシャルメディアのテキストデータ分類タスクに挑戦する上で,LSMを訓練することにより,複雑な疾患に対する洞察を得るためのパイプラインを提案する。
ライム病患者のメンタルヘルスに関する予測報告の予測,説明,体系化に関する最初の結果について報告する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:16:10 GMT)
Universal microscopic descriptions for statistics of particles and extended excitations [4.8] 任意の次元の格子におけるアベリア粒子の一般化統計と励起の普遍的研究法を提案する。
本手法は粒子とループのブレイディングと融合に関する統計を統一し, 膜励起に関する新しい統計の発見につながる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 00:13:19 GMT)
Pilot-guided Multimodal Semantic Communication for Audio-Visual Event Localization [4.7] マルチモーダルセマンティックコミュニケーションは通信効率と信頼性を大幅に向上させる。
人工知能、自動運転、スマートホームなど、幅広い分野の応用の見通しがある。
本稿では,音声-視覚イベントのローカライズ作業に適したマルチモーダルセマンティックコミュニケーションのためのパイロット誘導フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:58:49 GMT)
Topological Aspects of Dirac Fermions in a Kagomé Lattice [4.7] ディラックフェルミオンはヘキサゴナル・ブリルアンゾーンの2つの同値な角で異なる谷の低エネルギー物理を支配している。
ホロウ・オブ・ダビデ相は、ディラック質量のサインチェンジと異なる$mathbbZ_6$ベリー相を持つ。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:52:01 GMT)
Why Do Developers Engage with ChatGPT in Issue-Tracker? Investigating Usage and Reliance on ChatGPT-Generated Code [4.6] GitHubの1,012のイシューで1,152人のDeveloper-ChatGPTの会話を分析しました。
ChatGPTは主にアイデアに使用されるが、検証には最小限である。
ChatGPTで生成されたコードは5.83%の問題を解決するためにas-isとして使用された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:47:31 GMT)
PyraNet: A Multi-Layered Hierarchical Dataset for Verilog [4.6] 我々は、PiraNetと呼ぶ多層構造を利用した、新しいオープンソースデータセットとそれに対応する微調整技術を紹介する。
実験により、提案したデータセットと微調整アプローチを用いることで、より正確な微調整モデルが得られ、構文的に、機能的に正しいVerilogコードを生成することが示された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:45:54 GMT)
How Many Languages Make Good Multilingual Instruction Tuning? A Case Study on BLOOM [4.6] ほんの一握りの言語が十分かどうか、あるいはより多くの言語が加わったことでメリットが増すかどうかはまだ定かではない。
1から52言語で大規模多言語モデルを微調整することにより,性能に影響を与える3つの要因を理解するためのBLOOMのケーススタディを示す。
その結果,1)多言語指導指導における言語カバレッジの拡大は有益であることが判明し,2)テスト言語が混在している場合の精度が著しく低下することが判明した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:25:51 GMT)
Reputation Management in the ChatGPT Era [4.5] 生成型AIシステムは、たとえ明示的にそうするように指示されていなくても、実人のアウトプットを生成することが多い。
本稿では,これらの個人を保護するための法的手段について考察し,特に名誉とデータ保護に関する法律に焦点をあてる。
我々は、これらの個人主義的救済の限界に言及し、情報圏を生成AIから保護するためのより体系的で環境的なアプローチの必要性を示唆する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:17:44 GMT)
Weakly-supervised 3D coronary artery reconstruction from two-view angiographic images [4.5] 本稿では,3次元冠状動脈モデル構築のための対角的および生成的手法を提案する。
3D完全教師付き学習法と2D弱教師付き学習法により,最先端技術を上回る再現精度を得た。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:07:59 GMT)
Generative Humanization for Therapeutic Antibodies [4.5] 人間化(Humanization)は、免疫原性と呼ばれる1つの重大なリスクに対処するシーケンス最適化戦略である。
我々は,ヒト抗体データに基づいて訓練された言語モデルからヒト化変異をサンプリングする条件生成モデリングタスクとして,人間化を再編成する。
免疫原性リスクを低減し、治療特性を維持または改善した候補配列を得るために、抗原結合親和性などの治療特性のモデルを含むサンプリングプロセスについて述べる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:26:45 GMT)
Exploring Data Management Challenges and Solutions in Agile Software Development: A Literature Review and Practitioner Survey [4.5] ソフトウェア製品とその開発に関連するデータを管理することは、ソフトウェアプロジェクトやアジャイルチームにとって大きな課題となる。
これには、さまざまなソースからのデータを統合し、継続的な変更と適応の中でデータ品質を保証することが含まれる。
この論文はアジャイルプロジェクトのデータ管理の課題と潜在的な解決策を体系的に検討している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:02:20 GMT)
VariFace: Fair and Diverse Synthetic Dataset Generation for Face Recognition [4.4] VariFaceは2段階の拡散に基づくパイプラインで、公正で多様な合成顔データセットを作成し、顔認識モデルをトレーニングする。
同じデータセットサイズに制約された場合、VariFaceは、以前の合成データセットよりも大幅にパフォーマンスが向上する。
VariFaceは6つの評価データセットで実際のデータセット(CASIA-WebFace)を上回った。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:21:11 GMT)
The Dilemma of Random Parameter Initialization and Barren Plateaus in Variational Quantum Algorithms [4.3] ヴァレンプラトー (BP) は、変分量子アルゴリズム (VQA) 内のランダムパラメータ化量子回路 (PQC) によって生じる課題である
本稿では,VQAにおけるバレンプラトー (BP) の課題を軽減するための,実装が容易なアプローチを提案する。
我々の研究は、BPを緩和し、VQAの潜在能力を最大限に活用しようとする量子アルゴリズム開発者にとって、明確な道のりを提供する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:08:46 GMT)
Opportunities and Security Risks of Technical Leverage: A Replication Study on the NPM Ecosystem [4.3] フリーのオープンソースソフトウェア(FOSS)コードの再利用は、生産性と提供ソフトウェアの品質を向上させることができる。
しかし、FOSSの再利用は、ソフトウェアプロジェクトを公開脆弱性に晒すリスクがある。
技術的レバレッジのレンズを通して、Javaエコシステムにおけるトレードオフを調査します。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:51:46 GMT)
Take Fake as Real: Realistic-like Robust Black-box Adversarial Attack to Evade AIGC Detection [4.3] 悪意のある敵攻撃はAIGC検出を回避することができる。
既存のほとんどの敵攻撃は、GAN生成顔画像検出のみに焦点を当てている。
本稿では,後処理の融合最適化を用いた現実的なロバストブラックボックス攻撃(R$2$BA)を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:16:50 GMT)
Fearless unsafe. Safety Property is all you need [4.3] 本論文では,Unsafe Rustの安全性要件を実証的に検討した。
私たちは、標準ライブラリの安全でないAPIのドキュメントから学んだ安全特性のカテゴリを定義しました。
安全性に基づいて、標準ライブラリ内のすべての安全でない文書を再編成し、コンサルティングプラグインをrust-analyzerに設計した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:00:31 GMT)
Geological and Well prior assisted full waveform inversion using conditional diffusion models [4.2] フルウェーブフォーム・インバージョン(FWI)は、不適切な地震観測のためにしばしば困難に直面し、帯域制限と地質学的に不正確なインバージョン結果をもたらす。
本研究では, 条件付き拡散モデルを用いて, 地質学的クラスと情報的事前支援FWIを提案する。
本手法は,FWIにマルチモーダル情報をシームレスに統合し,データの適合性と地質学および地球物理の整合性を同時に達成する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:05:14 GMT)
Streaming quantum state purification [4.2] 量子状態浄化(Quantum state purification)は、未知の純粋な量子状態のほぼ純粋なコピーを復元する作業である。
この基本的なタスクは、ノイズの多いチャネル上の量子通信や不完全なデバイスによる量子計算に応用できる。
任意の次元のクォーディットのスワップテストに基づいて効率的な浄化手順を導出する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:14:52 GMT)
MTVNet: Mapping using Transformers for Volumes -- Network for Super-Resolution with Long-Range Interactions [4.1] ボリューム超解像は、2次元超解像に見られるトランスフォーマーモデルにおける最近の進歩を利用するのが困難である。
階層型アテンションブロックと複数のスケールのキャリアトークンを組み合わせたマルチスケールトランスフォーマーモデルを提案する。
提案手法であるMTVNetを、5つの3次元データセット上の最先端のボリューム超解像モデルと比較した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:06:22 GMT)
Towards Civic Digital Twins: Co-Design the Citizen-Centric Future of Bologna [4.0] Civic Digital Twin(CDT)は、都市計画とガバナンスに対する市民中心の変革的アプローチを支援するために設計された、Urban Digital Twinsの進化である。
CDTは1年前にボローニャ市が立ち上げたBlogna Digital Twinイニシアチブの範囲内で開発されている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:25:13 GMT)
Bridging Today and the Future of Humanity: AI Safety in 2024 and Beyond [3.8] 本稿では,先進的人間社会の青写真について述べる。
あらゆる物のインターネットが現実になる未来を概説している。
進歩の各段階において、この論文は人類が直面する可能性のあるAIの安全性の問題を予測する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:07:57 GMT)
A Misclassification Network-Based Method for Comparative Genomic Analysis [3.8] メタデータに基づくゲノム配列の分類は、数十年間、比較ゲノム学において活発な研究領域であった。
本研究では、AIとネットワークサイエンスのアプローチを統合し、比較ゲノム分析フレームワークを開発する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 23:22:15 GMT)
Large Language Models and Games: A Survey and Roadmap [3.7] 大規模言語モデル(LLM)は、ゲームを含む幅広いアプリケーションやドメインにおいて、顕著なポテンシャルを示している。
本稿では,ゲームにおけるLLMの様々な応用状況を調査し,ゲーム内でLLMが果たす役割について検討する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:41:04 GMT)
An inferential measure of dependence between two systems using Bayesian model comparison [3.7] $X$ と $Y$ in $D$ の依存度は $B(X,Y|D)$ と定量化される。
ベイズフレームワークを用いた結果、および$B(X,Y|D)$と相互情報との類似点と相違点について論じる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:28:19 GMT)
Similarity Equivariant Graph Neural Networks for Homogenization of Metamaterials [3.6] ソフトで多孔質なメカニカルメタマテリアルは、ソフトロボティクス、音の低減、バイオメディシンに重要な応用をもたらすパターン変換を示す。
我々は、代理モデルとして機能するために好意的にスケールする機械学習ベースのアプローチを開発する。
このネットワークは、対称性の少ないグラフニューラルネットワークよりも正確で、データ効率が高いことを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:10:19 GMT)
Facade: High-Precision Insider Threat Detection Using Deep Contextual Anomaly Detection [3.6] Facadeは、Googleにデプロイされた高精度のディープラーニングベースの異常検出システムである。
極端に低い偽陽性率、0.01%未満のインサイダー攻撃者を検出する。
機密文書への不正アクセスのような単一の不正行為の場合、偽陽性率は0.0003%である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:46:28 GMT)
Integrating Positionality Statements in Empirical Software Engineering Research [3.6] 位置性ステートメントは、研究者のアイデンティティ、経験、視点がどのように彼らの仕事を形作るかを認識することによって、透明性、反射性、倫理的整合性を高める。
本研究は,ソフトウェア工学研究における位置性ステートメントの理解,利用,潜在的価値について検討することを目的とした。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:23:13 GMT)
Is the neural tangent kernel of PINNs deep learning general partial differential equations always convergent ? [3.6] 物理インフォームドニューラルネットワーク(PINN)に基づく一般偏微分方程式に対するニューラル・タンジェント・カーネル(NTK)について検討する。
誰もが知っているように、人工ニューラルネットワークのトレーニングは、NTKの進化に変換することができる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:41:39 GMT)
Two-color Ytterbium MOT in a compact dual-chamber setup [3.6] 超低温イッテルビウム原子をコンパクトなデュアルチャンバーで製造するための実験計画
本稿では, 原子集合配列の各ステージに最適化されたパラメータを報告し, 高い転送効率を実現する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:45:17 GMT)
FP=xINT:A Low-Bit Series Expansion Algorithm for Post-Training Quantization [3.6] PTQ(Post-Training Quantization)は、事前訓練されたフル精度(FP)モデルを、トレーニングなしで量子化したバージョンに変換する。
既存の手法は、量子化ノイズによる極端に低い設定で性能と量子化効率を著しく低下させる。
この問題に対処するためのディープモデルシリーズ拡張フレームワークを導入し、キャリブレーションセットや微調整を必要とせずに、不定値モデルの迅速かつ正確な近似を可能にする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:50:28 GMT)
Can tweets predict article retractions? A comparison between human and LLM labelling [3.5] 本研究は、Twitterがリトラクション記事に言及していることがリトラクション記事の潜在的な問題を引き起こすかどうかを調査する。
我々は、504の記事に関連付けられた4,354件のTwitter言及のデータセットを分析した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:42:25 GMT)
The EU AI Act is a good start but falls short [3.5] EU AI Actは、倫理的かつ安全なAI開発とEU全体の展開を保証するために設立された。
本研究は,企業の資源集中を効果的に支援するための重要な課題と戦略を明らかにすることを目的とする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:01:13 GMT)
PolytopeWalk: Sparse MCMC Sampling over Polytopes [3.4] これは、ポリトープを均一にサンプリングするために設計された新しいスケーラブルなPythonライブラリである。
このライブラリは、顔認識などの前処理アルゴリズムを含むエンドツーエンドソリューションを提供する。
我々は,Netlibおよび構造化ポリトープのサンプリング効率と点定コストの改善を実証した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:20:01 GMT)
Optimizing Curvature Learning for Robust Hyperbolic Deep Learning in Computer Vision [3.4] 本稿では、一般的な学習アルゴリズムのための改良されたスキーマと、多様体の可変代表半径内への埋め込みを制約する新しい正規化手法を提案する。
提案手法は,より大規模な双曲モデルを実現するとともに,直接分類と階層的計量学習の両タスクにおいて一貫した性能向上を示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:59:02 GMT)
Two-photon correlations and HOM visibility from an imperfect single-photon source [3.4] 共振駆動型単一光子源の単一光子純度を,励起レーザが検出経路に漏れる現実的なシナリオとして検討した。
励起パルスの持続時間が単一光子源の品質に強く影響を与えることがわかった。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:19:10 GMT)
Lossless Model Compression via Joint Low-Rank Factorization Optimization [3.3] 低ランク因子化(low-rank factorization)は、近似行列と元の重み行列の間の誤差$delta$を最小化する一般的なモデル圧縮手法である。
$delta$が最適化されたとき、オリジナルのモデルに近いパフォーマンスを達成するが、低ランクの分解とモデルパフォーマンスの分離によるパフォーマンスの相違は残る。
我々は、損失のない低ランクの重み分解のための新しい共同最適化戦略を導入する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:37:54 GMT)
Multi-fidelity Bayesian Optimization in Engineering Design [3.3] 多重忠実度最適化(MFO)とベイズ最適化(BO)
MF BOは高価なエンジニアリング設計最適化の問題を解決するニッチを見つけた。
MF BOの2つの必須成分:GP系MFサロゲートと取得機能
論文参考訳(メタデータ) (Mon, 09 Dec 2024 21:27:54 GMT)
A cautionary tale on the cost-effectiveness of collaborative AI in real-world medical applications [3.3] 統合学習(FL)は、機密性の高い医療アプリケーションで協調AIを可能にする協調学習パラダイムとして広く普及している。
本研究では,FLパネルとコンセンサスに基づく学習手法の精度とコスト効率のベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:50:52 GMT)
Pattern Tree: Enhancing Efficiency in Quantum Circuit Optimization Based on Pattern-matching [3.3] パターンマッチングに基づく量子回路最適化のための新しいフレームワークを提案する。
パターンツリーに基づくパターンマッチングは、よく受け入れられたベンチマークセットで平均20%実行時間を短縮できることを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:21:11 GMT)
Deterministic Trajectory Optimization through Probabilistic Optimal Control [3.3] 離散時間決定論的有限水平非線形最適制御問題に適した2つのアルゴリズムについて論じる。
どちらのアルゴリズムも、確率論的最適制御(probabilistic optimal control)と呼ばれる新しい理論パラダイムから導出することができる。
アルゴリズムの主な利点は、反復よりも探索と搾取のバランスを改善することである。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:46:23 GMT)
Obstacle-aware Gaussian Process Regression [3.3] 障害物を意識した軌道ナビゲーションは多くのシステムにとって不可欠である。
ガウス過程の回帰は、現在の形式では、曲線を一連のデータ対に適合させる。
負のデータ対にモデルを適合させる「GP-ND(Gaussian Process with Negative Datapairs)」を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:50:20 GMT)
Brain-like emergent properties in deep networks: impact of network architecture, datasets and training [3.2] ディープネットワークが急速に向上しているにもかかわらず、実際のビジョンタスクでは人間よりも優れています。
このパラドックス的な一般化の欠如は、ディープネットワークをより脳に似たものにすることで対処できる。
深層ネットワーク上でテスト可能な知覚的・神経的創発的特性について報告する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:18:35 GMT)
psifx -- Psychological and Social Interactions Feature Extraction Package [3.2] psifxはマルチモーダルな特徴抽出ツールキットである。
それは、人間の科学研究に最先端の機械学習技術を使うことを容易にし、民主化することを目的としている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:14:47 GMT)
A Scalable Multi-Layered Blockchain Architecture for Enhanced EHR Sharing and Drug Supply Chain Management [3.1] 本稿では、電子健康記録の安全な共有とドラッグサプライチェーン管理のためのスケーラブルな多層ブロックチェーンアーキテクチャを提案する。
提案するフレームワークは,システムパフォーマンス,セキュリティ,患者中心のアクセス制御を強化する5つの異なるレイヤを導入している。
私たちのソリューションは、データの整合性、プライバシ、相互運用性を保証することで、既存の医療システムとの互換性を確保します。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:10:22 GMT)
Variational quantum compiling for three-qubit gates design in quantum dots [3.1] 物理相互作用項のみからなる時間非依存ハミルトニアンを用いて,効率的な3量子ゲートを設計する。
トフォリ門やフレドキン門を含む結果として生じる門は、コヒーレントと非コヒーレントの両方のノイズ源に対して高い忠実さと頑健さを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:49:54 GMT)
Enhanced Multi-Object Tracking Using Pose-based Virtual Markers in 3x3 Basketball [3.1] 本研究では,チームスポーツのための新しい仮想マーカー(VM)MOT法,Sports-vmTrackingを提案する。
提案手法は平均 HOTA スコア72.3% を達成し,VM を含まない他の最先端メソッドよりも10ポイント以上高く,その結果,0 ID スイッチが得られた。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:16:50 GMT)
Dynamical similarity analysis uniquely captures how computations develop in RNNs [3.0] ニューラルネットワーク(RNN)における合成学習により、動的配向アライメントメトリクスのテストケースを構築することができる。
本稿では,新しい動的類似性解析(DSA)がよりノイズに強いことを示し,従来の指標よりも行動関連表現をより確実に同定する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:29:18 GMT)
Deep Learning Ensemble for Predicting Diabetic Macular Edema Onset Using Ultra-Wide Field Color Fundus Image [3.0] 糖尿病性黄斑浮腫(DME)は糖尿病の重篤な合併症である。
1年以内にci-DMEの発症を予測するアンサンブル法を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 21:38:56 GMT)
Towards Open-Set Myoelectric Gesture Recognition via Dual-Perspective Inconsistency Learning [3.0] 堅牢なオープンセットシステムは、未知のジェスチャーを効果的に拒絶し、既知のジェスチャーを正しく分類する必要がある。
本研究では,予測の不整合を増大させるために,新しい2視点不整合学習手法 PredIN を提案する。
提案手法は,事前定義されたジェスチャーに対する正確なクローズドセット分類と未知のジェスチャーに対する効果的な拒否を同時に達成する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 05:51:35 GMT)
eipy: An Open-Source Python Package for Multi-modal Data Integration using Heterogeneous Ensembles [3.0] eipyはオープンソースのPythonパッケージで、分類のための効果的なマルチモーダルなヘテロジニアスアンサンブルを開発する。
データ統合と予測モデリングメソッドの比較と選択のための厳格でユーザフレンドリなフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 21:00:04 GMT)
Performance and achievable rates of the Gottesman-Kitaev-Preskill code for pure-loss and amplification channels [3.0] 我々は,純粋な損失と純粋増幅の下で,任意のGottesman-Kitaev-Preskill符号のほぼ最適性能を解析的に取得する。
その結果,GKP符号は,損失と増幅の能力を達成する最初の構造付きボソニック符号群として確立された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:03:31 GMT)
Dataset Distribution Impacts Model Fairness: Single vs. Multi-Task Learning [3.0] ResNetベースのCNNを用いて皮膚病変分類の性能を評価する。
患者性やクラスラベルの異なるデータセットを生成するための線形プログラミング手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:28:34 GMT)
Optimizing Posterior Samples for Bayesian Optimization via Rootfinding [2.9] 我々は,グローバルなルートフィンディングに基づく後方サンプルの効率的な大域的最適化手法を提案する。
注目すべきは、各集合から 1 点しか持たなくても、大域的最適度は大抵の場合発見されることである。
提案手法は,エントロピー探索の変種など,他の後部サンプルベース獲得関数の性能も向上する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 21:13:37 GMT)
Enhancing predictive imaging biomarker discovery through treatment effect analysis [2.8] 本研究は,前処理画像を利用した予測画像バイオマーカー,特定の画像特徴の発見に焦点を当てた。
作業集約的なアプローチは手作りの特徴に頼ってバイアスを起こしやすいのとは違い,画像から直接予測的特徴を学習する新たな課題が提示される。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:58:55 GMT)
How transformers learn structured data: insights from hierarchical filtering [2.8] 本稿では,木上の配列の生成モデルに対する階層的フィルタリング手法を提案する。
バニラエンコーダのみの変換器は、根の分類に基づいて訓練された場合の正確な推論アルゴリズムを近似できることを示す。
階層の様々なレベルに対応する連続した長さスケールにおける相関関係の再構築の明確な証拠を見いだす。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:53:42 GMT)
From Pixels to Words: Leveraging Explainability in Face Recognition through Interactive Natural Language Processing [2.8] 顔認識(FR)は深層学習の発展とともに大きく進歩し、いくつかの応用において高い精度を実現している。
これらのシステムの解釈可能性の欠如は、説明責任、公平性、信頼性に関する懸念を引き起こす。
モデルに依存しない説明可能な人工知能(XAI)と自然言語処理(NLP)技術を組み合わせることにより、FRモデルの説明可能性を高めるインタラクティブなフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:41:53 GMT)
Integrating Expert Labels into LLM-based Emission Goal Detection: Example Selection vs Automatic Prompt Design [2.7] 我々は,企業報告にラベル付き例文の形で専門家のフィードバックを統合することの課題に焦点をあてる。
自動的なプロンプト最適化が優れたアプローチであることに気付きました。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:20:33 GMT)
Sequential Compression Layers for Efficient Federated Learning in Foundational Models [2.7] そこで我々は,LoRAに依存しない,新しい,シンプルで,より効率的なパラメータ効率の微調整法を提案する。
このソリューションは、連合型微調整におけるLoRAに関連するボトルネックに対処し、最近のLoRAベースのアプローチより優れている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 22:06:47 GMT)
Low-Rank Matrix Factorizations with Volume-based Constraints and Regularizations [2.7] この論文は、解釈可能性と特異性を高めるために設計されたボリュームベースの制約と正規化に焦点を当てている。
ブラインドソース分離やデータ計算の欠如といったアプリケーションによって動機付けられたこの論文は、効率的なアルゴリズムも提案している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:58:23 GMT)
JAPAGEN: Efficient Few/Zero-shot Learning via Japanese Training Dataset Generation with LLM [2.6] 大規模言語モデル(LLM)は、推論効率の向上やデータ収集に伴うコスト削減といった利点を提供する。
本稿では、LLMが他の言語タスクのための熟練したトレーニングデータジェネレータとして機能するのか、という根本的な研究課題に対処する。
具体的には、LLMを活用して、少数ショットおよびゼロショット学習シナリオ下で教師付きトレーニングデータを合成する。
我々はこの合成データを用いてコンパクトモデル(例えばBERT)を訓練する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:27:32 GMT)
Fast Polypharmacy Side Effect Prediction Using Tensor Factorisation [2.6] テンソル因子化モデルにより,多剤副作用予測における最先端性能が達成できることを実証する。
ベストモデル (SimplE) は, 963側効果に対して0.978 AUROC, 0.971 AUPRC, 1.000 AP@50の中央値を得た。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:39:16 GMT)
Upstream and Downstream AI Safety: Both on the Same River? [2.6] 従来の安全工学は、自動運転車の運用設計領域のような、使用状況でシステムを評価する。
対照的に、ダウンストリームタスクのためにさらに訓練できる大規模な言語モデルなど、フロンティアAIの安全性に関する作業は、通常、特定のアプリケーションコンテキストを超えた要因を考慮する。
上流と下流の両方の安全フレームワークの特徴を概説し、幅広いAI安全コミュニティがこれらのフレームワーク間の相乗効果の恩恵を受けることができる範囲について検討する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 23:33:31 GMT)
AutoDCWorkflow: LLM-based Data Cleaning Workflow Auto-Generation and Benchmark [2.6] データクリーニングを自動的に生成する大規模言語モデル(LLM)の推論能力を評価する。
本研究では, LLMエージェントが, 様々な難易度でそのアドレスデータクリーニング目的を自動的に生成する能力を評価するためのデータクリーニングベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:13:27 GMT)
CIC: A Framework for Culturally-Aware Image Captioning [2.6] 本稿では,文化を表すイメージの視覚的要素から抽出された文化要素をキャプションとして表現し,表現する新しい枠組みであるCICを提案する。
視覚的モダリティとLarge Language Models(LLM)を組み合わせた手法に着想を得て,画像から文化カテゴリーに基づく質問を生成する。
4つの異なる文化集団から45人の被験者を対象に行った人的評価から,提案する枠組みがより文化的に記述的なキャプションを生成することが示唆された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:39:30 GMT)
Credible fusion of evidence in distributed system subject to cyberattacks [2.6] 本稿では,サイバー攻撃に対する信頼性のある証拠融合のためのアルゴリズムを提案する。
我々は、証拠融合の3つの要件、すなわち、証拠のプライバシーを保護し、攻撃者を識別し、証拠を除外することに焦点を当てる。
通常のノードの状態はWAVCCMEに収束することが示され、攻撃者の証拠は融合から除外される。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:13:49 GMT)
Interpreting Transformers for Jet Tagging [2.5] 本研究では, 注目熱マップと粒子対相関を$eta$-$phi$平面上で解析することによりParTの解釈に着目する。
同時に、ParTは崩壊に応じて重要な粒子やサブジェットに様々な焦点が当てられていることを示し、このモデルが従来のジェットサブ構造を学習していることを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:47:39 GMT)
GCUNet: A GNN-Based Contextual Learning Network for Tertiary Lymphoid Structure Semantic Segmentation in Whole Slide Image [2.5] 全スライド画像(WSI)におけるTLSのセマンティックセグメンテーション
GCUNet - TLSセマンティックセグメンテーションのためのGNNベースの文脈学習ネットワーク。
我々は,TGA-COAD,TGA-LUSC,TGA-BLCA,INHOUSE-PAADという4つのTLSセマンティックセマンティックセマンティクスデータセットを構築した。
これらのデータセットの実験では、GCUNetの優位性が示されており、SOTAと比較して少なくとも7.41%のmF1の改善が達成されている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:16:35 GMT)
Vulnerability, Where Art Thou? An Investigation of Vulnerability Management in Android Smartphone Chipsets [2.2] 本稿は,Androidエコシステムにおけるスマートフォンチップセットの脆弱性管理の現状に関する実証的研究である。
我々は、主要な4つのチップセットメーカーの437のチップセットモデルと6,866のスマートフォンモデルに影響を及ぼす3,676個のチップセットの脆弱性の統一された知識ベースを作成します。
単一の脆弱性が数百から数千の異なるスマートフォンモデルに影響を与えることがよくあります。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:04:50 GMT)
Enhancing FKG.in: automating Indian food composition analysis [2.2] 本稿では,インド料理の食品組成データを知識グラフを用いて計算する手法を提案する。
このワークフローは、FKG.inを補完し、検証済み知識ベースからの食品組成データを反復的に補完することを目的としている。
ユーザがワークフローと対話して、ダイエットベースのヘルスレコメンデーションを得る方法について、簡単に説明している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:21:49 GMT)
Space to Policy: Scalable Brick Kiln Detection and Automatic Compliance Monitoring with Geospatial Data [2.1] れんがはインドの大気汚染の8-14%に寄与している。
エミッション・インベントリは、大気の質のモデリングと源泉の調整研究に不可欠である。
我々は5つの州で30638個のレンガキルンを検出し分類するスケーラブルな機械学習パイプラインを開発した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:02:36 GMT)
Ornstein-Uhlenbeck Adaptation as a Mechanism for Learning in Brains and Machines [2.1] システムのパラメータと大域的強化信号のノイズを利用する新しい手法を提案する。
連続的に動作し、学習の一般的なメカニズムとしてオルシュタイン・ウレンベック適応(OUA)が提案されている。
OUAは、ニューロモルフィックコンピューティングに潜在的に応用可能な、従来の勾配に基づく手法に代わる実行可能な代替手段を提供する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:00:13 GMT)
Revisiting the Necessity of Graph Learning and Common Graph Benchmarks [2.1] グラフ機械学習は、グラフコンテキストにおけるディープラーニングの導入以来、人気が高まってきた。
ノード機能はこれらのタスクに不十分であるため、ベンチマークのパフォーマンスはグラフ学習の改善を正確に反映している。
驚くべきことに、ノード機能はこれらのタスクで十分であることが多い。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:09:04 GMT)
The resource theory of tensor networks [2.1] 結合次元の概念を多部交絡を用いた絡み合い構造に一般化する自然資源理論について検討する。
エンタングルメント構造の間には、エッジ・バイ・エッジ変換を超える変換が存在することを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:45:19 GMT)
Simulation of Multi-Stage Attack and Defense Mechanisms in Smart Grids [2.1] 電力グリッドのインフラと通信のダイナミクスを再現するシミュレーション環境を導入する。
このフレームワークは多様なリアルな攻撃データを生成し、サイバー脅威を検出し緩和するための機械学習アルゴリズムを訓練する。
また、高度な意思決定支援システムを含む、新興のセキュリティ技術を評価するための、制御された柔軟なプラットフォームも提供する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:07:17 GMT)
Learning to Simulate: Generative Metamodeling via Quantile Regression [2.1] 従来のメタモデリング技術は、シミュレータ入力と単一出力要約統計量の間の関係を学習する。
生成メタモデリングという新しい概念を提案する。
生成メタモデルは、入力仕様に基づいて多数のランダム出力を高速に生成することができる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:12:00 GMT)
Generating floorplans for various building functionalities via latent diffusion model [2.0] 本稿では,様々な建築形態のフロアプランの生成を学習する潜在拡散モデルを提案する。
遅延拡散モデルのパワーを利用することにより、設計プロセスにおける従来の制限を超えることができる。
この革新は、建築設計に創造性の新しい次元を導入し、建築家、都市計画家、さらには専門知識のない個人でさえ、スピードとコスト効率で、形と機能の未知の領域を探索することを可能にする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:34:22 GMT)
Break a Lag: Triple Exponential Moving Average for Enhanced Optimization [2.0] 本稿では,三重指数移動平均のパワーを利用する新しい最適化手法であるFAMEを紹介する。
FAMEはデータダイナミクスに対する応答性を高め、トレンド識別ラグを緩和し、学習効率を最適化する。
包括的評価は、画像分類、オブジェクト検出、セマンティックセグメンテーションを含む様々なコンピュータビジョンタスクを含み、FAMEを30の異なるアーキテクチャに統合する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:59:29 GMT)
Using optimal control to guide neural-network interpolation of continuously-parameterized gates [2.0] 量子最適制御と物理インフォームド機械学習を組み合わせることで、ゲートファミリー間を介する制御面を効率的に合成する。
私たちのフレームワークは、最適な制御ツールとシンプルな機械学習を組み合わせることで、実践者がアルゴリズムの3倍のスピードアップを達成できることを示しています。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:16:18 GMT)
Annotations for Exploring Food Tweets From Multiple Aspects [2.0] この研究はLatvian Twitter Eater Corpus(LTEC)に基づいており、食べ物、飲み物、食事、飲酒に関するツイートの狭い領域に焦点を当てている。
LTECは12年以上にわたって収集され、基本的な情報とともに300万近いツイートに到達し、自動および手動の注釈付きメタデータも拡張された。
本稿では、LTECに機械翻訳、名前付きエンティティ認識、タイムラインバランスの取れた感情分析、テキスト画像関係分類など、手動でアノテートされた評価データのサブセットを補足する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:32:40 GMT)
EmoSpeech: A Corpus of Emotionally Rich and Contextually Detailed Speech Annotations [2.0] 微妙な感情差を制御できるTTS(text-to-speech)システムの開発は、依然として困難な課題である。
既存の感情音声データベースは、広範囲の感情状態の取得に失敗する過度に単純化されたラベル付けスキームに悩まされることが多い。
本稿では,感情に富んだ音声セグメントを体系的に抽出し,それらに詳細な自然言語記述を付加することにより,データベース構築を目的とした新しいプロセスを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:36:37 GMT)
Advancing Music Therapy: Integrating Eastern Five-Element Music Theory and Western Techniques with AI in the Novel Five-Element Harmony System [2.0] 伝統的な医療実践において、音楽療法は様々な心理的・生理的障害の治療に有効であることが証明されている。
伝統的な中国医学に根ざした五要素音楽療法(FEMT)は、文化的に重要な意味を持つ。
音楽療法における5つの要素の理論を応用して,初めて音楽療法システムを開発した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:49:18 GMT)
Efficient Deep Learning with Decorrelated Backpropagation [2.0] Decorrelated backpropagationを用いた非常に深いニューラルネットワークのより効率的なトレーニングが実現可能であることを初めて示します。
我々は18層深層ネットワークのトレーニングにおいて,バックプロパゲーションに比べて2倍以上のスピードアップと高いテスト精度を得る。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:03:27 GMT)
Understanding Gradient Descent through the Training Jacobian [1.9] トレーニングされたネットワークパラメータのヤコビアンを用いたニューラルネットワークトレーニングの幾何学について,その初期値について検討する。
本分析では,入力データに依存するがラベルに依存しない学習過程における低次元構造を明らかにする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 21:17:00 GMT)
Universal chain rules from entropic triangle inequalities [1.8] 我々は、大まかに言えば、個々のサブシステムの等しく強いエントロピーの観点から、$n$-partite系の滑らかなミニエントロピーを低くする。
また、エントロピー累積定理の近似バージョンを証明し、その滑らかな min-エントロピーを束縛するために状態に必要な条件を緩和する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:10:28 GMT)
Phaedrus: Exploring Dynamic Application Behavior with Lightweight Generative Models and Large-Language Models [1.8] Phaedrusは、さまざまな実行シナリオにわたる動的プログラムの振る舞いを予測するように設計された、新しいテキストコンパイラ支援のディープラーニングフレームワークである。
実験の結果,textitPhaedrus は WPP プロファイルサイズを最大107倍に削減できることがわかった。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 21:01:45 GMT)
RUL forecasting for wind turbine predictive maintenance based on deep learning [1.8] 本研究では,将来的なRUL予測のための新しいディープラーニング(DL)手法を提案する。
ForeNet-2dとForeNet-3dの2つのモデルが提案されている。
最も正確な予測は実際のRULからわずか10分しかずれず、最も正確な予測は1.8日ずれていた。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:52:21 GMT)
Robust Catalysis and Resource Broadcasting: The Possible and the Impossible [1.8] 本研究では,資源放送に匹敵するロバストな変換の可能性について検討する。
我々のアプローチは、絡み合い、コヒーレンス、熱力学、魔法、想像力など、幅広い量子資源理論を含んでいる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:00:13 GMT)
Parkinson's Disease Diagnosis Through Deep Learning: A Novel LSTM-Based Approach for Freezing of Gait Detection [1.8] 本稿では,パーキンソン病患者の歩行エピソードの凍結を自動的に検出するLSTMネットワークに基づく新しいディープラーニングアーキテクチャを提案する。
提案手法は, FOG エピソード検出における現在の最先端モデルを超え, 精度97.71%, 精度98%, 特異性96%を達成している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:58:24 GMT)
Off-Policy Maximum Entropy RL with Future State and Action Visitation Measures [1.8] 本稿では,政策が訪れた状態と行動の分布に基づく,新たな最大エントロピー強化学習フレームワークを提案する。
それぞれの州と行動について、本質的な報酬は、次のステップで訪れた州と行動の割引された分配の相対的なエントロピーである。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:56:06 GMT)
FedSynthCT-Brain: A Federated Learning Framework for Multi-Institutional Brain MRI-to-CT Synthesis [1.7] Fed SynthCT-Brainは、脳画像におけるMRI-to-sCTのためのFederated Learning(FL)パラダイムに基づいたフレームワークである。
U-Netモデルを用いて、ヨーロッパとアメリカの4つのセンターでフェデレーションを再現した。
このアプローチは、フェデレーションに属するセンターのデータを使用して実装され、フェデレーションの外側のセンターから見えないデータセットでテストされた。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:32:54 GMT)
Table2Image: Interpretable Tabular data Classification with Realistic Image Transformations [1.7] 本稿では,表形式のデータをリアルな画像表現に変換するための解釈可能なフレームワークであるTable2Imageを紹介する。
ベンチマークデータセットの実験では、競合する分類精度、曲線下領域(AUC)、解釈可能性の改善、スケーラブルで信頼性の高いソリューションが示されている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:24:31 GMT)
GraphNeuralNetworks.jl: Deep Learning on Graphs with Julia [1.7] GraphNeuralNetworks.jlは、Juliaプログラミング言語で記述されたグラフのディープラーニングのためのオープンソースのフレームワークである。
複数のGPUバックエンド、汎用スパースまたは高密度グラフ表現をサポートし、標準、異種、時間グラフを操作するための便利なインターフェースを提供する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:14:01 GMT)
Fiat-Shamir for Proofs Lacks a Proof Even in the Presence of Shared Entanglement [1.6] これをCRQS(Common Reference Quantum State)モデルと呼び、よく知られたCommon Reference String(CRS)と類似している。
私たちはこの概念をWak One-Time Random Oracle (WOTRO)として定式化します。
CRQSモデルにおけるWOTROのプロトコルは、(非効率な)敵によって攻撃可能であることを示す。
我々の敵は効率的にシミュレート可能であり、これは暗号ゲーム仮定への完全にブラックボックスの削減によるスキームの計算安全性を証明する可能性を規定している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 21:01:38 GMT)
A Pipeline and NIR-Enhanced Dataset for Parking Lot Segmentation [1.6] 本稿では、近赤外(NIR)チャネルを入力として使用するというアイデアと、衛星画像を用いた路外駐車場の予測を改善するための後処理技術を紹介する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 00:38:34 GMT)
Variable Selection for Comparing High-dimensional Time-Series Data [1.6] 2つの系列が大きく異なる変数と時間間隔を選択する方法が提案されている。
1つの時系列が計算コストの高いシミュレータの出力であるアプリケーションでは、実際のデータに対するシミュレータの検証にこの手法を用いることができる。
合成データ実験において,提案手法の有効性と限界について検討した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:08:08 GMT)
LOLA -- An Open-Source Massively Multilingual Large Language Model [1.6] LOLAは160以上の言語で訓練された多言語大言語モデルである。
私たちのアーキテクチャと実装の選択は、言語多様性を活用するという課題に対処します。
学習したエキスパート・ルーティング機構は、暗黙の系統パターンを利用して、多言語性の呪いを和らげる可能性があることを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:21:45 GMT)
COBRA -- COnfidence score Based on shape Regression Analysis for method-independent quality assessment of object pose estimation from single images [1.5] そこで本研究では,6次元オブジェクトのポーズ推定を汎用的に評価する手法を提案する。
提案手法は観測対象の幾何学における相違点の評価に依存する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:44:39 GMT)
Enhanced quantum sensitivity and coherence of symmetric magnetic clusters [1.5] ノイズの多い固体環境における高度に整合した自由度を求めることは、凝縮物質において大きな課題である。
磁気ドープ絶縁体のような無秩序な双極子系では、2レベル系(TLS)のコンパクトクラスターは典型的な単一TLSよりもはるかに長いコヒーレンス時間を持つことが示されている。
その結果,TLSの非対称クラスターが周囲にさらに弱くなり,低速多体動の高感度量子センサが実現された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:02:52 GMT)
Analysing Public Transport User Sentiment on Low Resource Multilingual Data [1.5] 本研究では,ケニア,タンザニア,南アフリカの既存の公共交通システムに対する感情を理解するために,通勤的世論調査を行った。
マルチリンガル・オピニオン・マイニングの手法を活用することで、我々のデータセットにある言語多様性とコードスイッチングに対処した。
その結果、南アフリカとケニアでは否定的な感情が主に見られ、タンザニアのデータセットはツイートの広告性から主に肯定的な感情を示した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:54:54 GMT)
Asynchronous LLM Function Calling [1.4] AsyncLMは、非同期大言語モデル(LLM)関数呼び出しのためのシステムである。
AsyncLMは同期関数呼び出しと比較して、エンドツーエンドのタスク完了遅延を1.6x-5.4xに削減できることを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 21:53:10 GMT)
3DStyleGLIP: Part-Tailored Text-Guided 3D Neural Stylization [1.4] 3Dスタイリングは、特定のスタイルを三次元オブジェクトに適用することで、かなりの商業的可能性を秘めている。
近年の人工知能とテキスト駆動操作手法の進歩により、スタイリゼーションプロセスは直感的かつ自動化されつつある。
3DStyleGLIPはテキスト駆動3Dスタイリングに特化して設計された新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:44:10 GMT)
Large Language Models: An Applied Econometric Framework [1.3] 大規模言語モデル(LLM)は、予測の作成、テキストのラベル付け、人間の反応のシミュレート、仮説の生成、さらにはそのようなデータが存在しない時間や場所のデータ生成など、経済学研究で使われている。
我々はこの問題に答えるための計量的枠組みを開発する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 22:37:48 GMT)
Recurrent convolutional neural networks for non-adiabatic dynamics of quantum-classical systems [1.3] 本稿では,ハイブリッド量子古典系の非線形非断熱力学をモデル化するための畳み込みニューラルネットワークに基づくRNNモデルを提案する。
検証研究により、訓練されたPARCモデルは、一次元半古典的なホルシュタインモデルの時空進化を再現できることが示されている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:23:25 GMT)
Optimizing Qubit Mapping with Quasi-Orthogonal Space-Time Block Codes and Quaternion Orthogonal Designs [1.3] 本研究では、量子誤り訂正フレームワークにおける準直交時空間ブロック符号(QOSTBC)と準直交時空間ブロック符号(QOD)の統合による量子ビットマッピングについて検討する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:58:37 GMT)
Participatory Assessment of Large Language Model Applications in an Academic Medical Center [1.2] 大きな言語モデル(LLM)は、医療関連のアプリケーションで有望なパフォーマンスを示している。
医療分野における彼らの展開は、倫理的、規制的、技術的性質に固有の課題を提起する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 21:45:35 GMT)
Generative Adversarial Reviews: When LLMs Become the Critic [1.2] 本稿では,LLMを利用したエージェントを利用して,忠実なピアレビュアーをシミュレートするジェネレーティブエージェントレビュアー(GAR)を紹介する。
このアプローチの中心は、グラフベースの原稿表現であり、コンテンツを凝縮し、情報を論理的に整理する。
本実験は,GARが人間レビュアーに対して,詳細なフィードバックと論文結果の予測を行う上で,相容れない性能を示すことを示した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:58:17 GMT)
Data Augmentation with Variational Autoencoder for Imbalanced Dataset [1.2] 不均衡分布からの学習は予測モデリングにおいて大きな課題となる。
VAEとスムーズなブートストラップを組み合わせた新しいデータ生成手法を開発し,IRの課題に対処する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 22:59:03 GMT)
Advancements in Machine Learning and Deep Learning for Early Detection and Management of Mental Health Disorder [1.2] 本研究は,精神疾患の早期診断と治療のための機械学習(ML)およびディープラーニング(DL)手法の開発について概説する。
特に行動評価、遺伝子およびバイオマーカー分析、うつ病、双極性障害、統合失調症などの疾患の診断のための医療画像に重点を置いている。
MLとDLは、方法論上の不整合、データ統合の課題、倫理的懸念に対処しながら、診断精度と治療結果を改善するかを強調している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:59:49 GMT)
Open-Vocabulary High-Resolution 3D (OVHR3D) Data Segmentation and Annotation Framework [1.1] 本研究の目的は,3次元セグメンテーションタスクのための包括的で効率的なフレームワークの設計と開発である。
このフレームワークはGrounding DINOとSegment Any Modelを統合し、3Dメッシュによる2D画像レンダリングの強化によって強化される。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:39:39 GMT)
MVD: A Multi-Lingual Software Vulnerability Detection Framework [1.1] MVD - 革新的な多言語脆弱性検出フレームワークを紹介する。
このフレームワークは、様々な言語の脆弱性データから同時に学習することで、複数の言語にまたがる脆弱性を検出する能力を得る。
本フレームワークは,多言語脆弱性検出における最先端手法を,PR-AUCの83.7%から193.6%で大幅に上回っている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:58:10 GMT)
Real-Time Performance Optimization of Travel Reservation Systems Using AI and Microservices [1.0] 本研究では、システムのパフォーマンス最適化のために、人工知能とマイクロサービスアプローチを折り畳むハイブリッドフレームワークを提案する。
AIアルゴリズムは需要パターンを予測し、リソースの割り当てを最適化し、マイクロサービスアーキテクチャによって駆動される意思決定を強化する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:08:22 GMT)
Generative AI Impact on Labor Market: Analyzing ChatGPT's Demand in Job Advertisements [1.0] 本研究では,米国労働市場におけるChatGPT関連スキルの需要について検討する。
テキストマイニングとトピックモデリング技術を用いて、雇用主が採用しているGen AI関連スキルを抽出、分析した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 23:03:20 GMT)
Multi-task Gaze Estimation Via Unidirectional Convolution [1.0] 視線推定タスクにおける軽量モデルの性能向上を目的として,マルチタスク・ガゼというネットワークモデルを提案する。
Multitask-Gazeの主なコンポーネントは、一方向変換(UC)、空間とチャネルの注意(SCA)、グローバル畳み込みモジュール(GCM)、マルチタスク回帰モジュール(MRM)である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:59:17 GMT)
Reducing ADC Front-end Costs During Training of On-sensor Printed Multilayer Perceptrons [0.9] 印刷電子技術は、従来のシリコン技術を超える計算ニーズに対して、費用対効果のあるソリューションを提供する。
印刷エレクトロニクスの低解像度化は、機械学習(ML)分類システムのような複雑な設計を統合する上での課題である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:10:46 GMT)
Gradient-based facial encoding for key generation to encrypt and decrypt multimedia data [0.9] バイオ暗号システムは生体認証と暗号法を組み合わせて機密情報を安全に保護する。
テキスト、オーディオ、ビデオファイルを含む全てのデータ型は、このシステムを使用して暗号化および復号化することができる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:12:17 GMT)
HSDA: High-frequency Shuffle Data Augmentation for Bird's-Eye-View Map Segmentation [0.9] High- frequency Shuffle Data Augmentation (HSDA)は、高周波画像コンテンツを解釈するネットワークの能力を高める新しいデータ拡張戦略である。
HSDAは、カメラのみのシステムで61.3%の、最先端の平均的ユニオン(mIoU)を達成している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:15:08 GMT)
Leveraging Audio and Text Modalities in Mental Health: A Study of LLMs Performance [0.9] 本研究では,マルチモーダル精神保健診断におけるLarge Language Models(LLMs)の可能性について検討した。
テキストと音声のモダリティを比較し,LLMが音声入力で等しく動作するかどうかを検討する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:40:03 GMT)
In-Application Defense Against Evasive Web Scans through Behavioral Analysis [0.9] Webトラフィックは、人間のユーザーと自動化されたエージェントの両方を含むように進化してきた。
これらの敵対的活動の財務コストは2023年に数千億ドルを超えると見積もられている。
アプリケーション内科学の低オーバーヘッドなエンジンであるWebGuardを紹介します。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 21:28:04 GMT)
ECGtizer: a fully automated digitizing and signal recovery pipeline for electrocardiograms [0.8] ECGtizerは、紙ECGをデジタル化し、ストレージ中に失われた信号を復元するオープンソースツールである。
自動リード検出、3つのピクセルベースの信号抽出アルゴリズム、ディープラーニングベースの信号再構成モジュールを採用している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:19:02 GMT)
CAD-Unet: A Capsule Network-Enhanced Unet Architecture for Accurate Segmentation of COVID-19 Lung Infections from CT Images [0.8] 医療画像は、新型コロナウイルスの肺炎を診断するための主要な手段となっている。
本稿では,新たにCAD-Unetと呼ばれる深層ネットワークアーキテクチャを導入する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:08:31 GMT)
Vision Eagle Attention: a new lens for advancing image classification [0.8] コンボリューショナルな空間的注意力を用いた視覚的特徴抽出を促進する新しい注意機構であるビジョンイーグル注意(Vision Eagle Attention)を導入する。
このモデルは、局所的な空間的特徴を捉えるために畳み込みを適用し、画像の最も情報性の高い領域を選択的に強調するアテンションマップを生成する。
Vision Eagle Attentionを軽量なResNet-18アーキテクチャに統合しました。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 05:00:29 GMT)
Inverting Visual Representations with Detection Transformers [0.8] 本研究では,検出変換器内の中間層からの入力画像を再構成するために,逆モデルのトレーニング手法を適用する。
本研究では, テクスチャ形状の堅牢性, 層間相関, 色摂動の保存など, 検出変換器の臨界特性を示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:43:06 GMT)
Complexity of Fermionic 2-SAT [0.8] 我々はフェルミオンの満足度問題であるフェルミオン$k$-SATを導入する。
これは、フェルミオン、パリティ保存、プロジェクターの集合のヌル空間にフェルミオン状態が存在するかどうかを決定する問題である。
我々はこの問題を古典的に効率的に解けることを証明した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:04:21 GMT)
Quantum simulation of time-dependent Hamiltonians via commutator-free quasi-Magnus operators [0.8] マグナス作用素(Magnus operator)は、計算数学における時間依存ハミルトニアンシミュレーションの一般的な方法である。
可換準マグヌス作用素(CFQM)の開発は、この障害を回避する。
CFQMは、しばしば1桁以上のオーダーで利用できる最も効率的な製品-フォーミュラ技術であることを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:59:21 GMT)
Rapid optimal work extraction from a quantum-dot information engine [0.8] 我々は量子ドットSzilardエンジンを用いて、20年以上の駆動速度で最大効率で熱ゆらぎから作業を取り出す。
我々は、遅いものから高速なものまで、最適化されたプロトコル群を設計し、実装する。
その結果,効率を最適化する場合,Szilardエンジンの出力が必然的に増加すると電力変動が増大することがわかった。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:03:40 GMT)
Enhancing operational wind downscaling capabilities over Canada: Application of a Conditional Wasserstein GAN methodology [0.7] 風下スケーリングは天気予報の空間分解能を改善するために不可欠である。
本研究は,DownGANフレームワークの拡張による風下スケーリングを推し進める。
風下スケール精度の大幅な向上を実現し,本手法の運用スケーラビリティを実証する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:05:07 GMT)
Bounded Exploration with World Model Uncertainty in Soft Actor-Critic Reinforcement Learning Algorithm [0.7] 境界探索は'ソフト'と'本質的なモチベーション探索の両方を統合する新しい探索手法である。
これはSoft Actor-Criticアルゴリズムの性能とモデルベース拡張の収束速度を著しく改善した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:45:08 GMT)
Protecting information in a parametrically driven hybrid quantum system [0.7] パラメトリック駆動ハイブリッドシステムの状態に符号化された量子情報は、スピンアンサンブルの不均一性に起因する可能性のあるデコヒーレンスに対して強く保護されていることを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:52:02 GMT)
Elastic-DETR: Making Image Resolution Learnable with Content-Specific Network Prediction [0.6] 我々は,複数の画像解像度の弾性利用を可能にする,Elastic-DETRと呼ばれる学習可能な解像度のための新しい戦略を導入する。
我々のネットワークは、コンパクトなスケール予測モジュールを用いて、画像の内容に基づいて適応的なスケールファクタを提供する。
解像度の柔軟性を活用することで、精度と計算複雑性のトレードオフを様々に示す様々なモデルを実演することができる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:46:21 GMT)
Improving text-conditioned latent diffusion for cancer pathology [0.6] 生成モデルは超現実的なデータ合成を可能にしました
現実的な画像を合成するための1つのアルゴリズムは拡散であり、反復的に画像をノイズに変換し、このノイズから回復過程を学ぶ。
VAEは、潜在空間における複雑な高解像度画像の表現を学習することを可能にする。
拡散とVOEの結婚により、オートエンコーダの潜伏空間での拡散が可能となり、拡散の現実的な生成能力を活用することができる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:38:19 GMT)
BPDec: Unveiling the Potential of Masked Language Modeling Decoder in BERT pretraining [0.6] BERT (Bidirectional Representations from Transformers) は、自然言語処理の分野に革命をもたらした。
DeBERTaは、BERTのエンコーダモデルに適応した拡張デコーダを導入した。
マスク付き言語モデリングデコーダの設計と研究は不十分である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 23:47:46 GMT)
Multimodal Purcell enhancement and optical coherence of Eu$^{\text{3+}}$ ions in a single nanoparticle coupled to a microcavity [0.6] 長寿命の核スピン状態は、コヒーレント光遷移によって対処される量子ビットとして機能する。
低温条件下では、単一ナノ粒子からの放射を繊維系微小キャビティに結合する。
結果は単一のEu$text3+$ ionの効率的な読み出しに向けた重要なステップである。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:29:40 GMT)
Impact of Privacy Parameters on Deep Learning Models for Image Classification [0.5] CIFAR-10データセット citecifar10 を用いた画像分類のための差分プライベートディープラーニングモデルを開発した。
モデル精度に及ぼす各種プライバシパラメータの影響を解析する。
今までで最高のパフォーマンスモデルは、以下のパラメータでテスト精度59.63%のEfficientNetです。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:31:55 GMT)
Robust Quantum Reservoir Computing for Molecular Property Prediction [0.5] 本稿では,潜在的な薬物分子の生物活性を予測するために,量子貯水池計算(QRC)手法を提案する。
データセットのサイズが小さくなるにつれて、より堅牢なQRC性能が観察される。
さらに、一様多様体近似と射影法を利用して、古典的特徴が量子力学によって変換されるときの構造変化を分析する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:49:18 GMT)
Semantic Search and Recommendation Algorithm [0.5] 本稿では,Word2Vec と Annoy Index を用いて,大規模データセットからの情報検索を効率化するセマンティック検索アルゴリズムを提案する。
データセットを100GBまでテストすることは、高い精度と性能を維持しながら大量のデータを処理する方法の有効性を示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:43:23 GMT)
Fixing detailed balance in ancilla-based dissipative state engineering [0.5] 散逸状態工学(英: Dissipative state engineering)とは、工学的な散逸または工学的な環境を用いてハミルトンの基底状態を作成するプロトコルである。
また, 本手法は, アンシラが系の弱結合限界における有効浴槽と見なされるため, 真のゼロ温度環境において, 詳細なバランスを期待できないため, 本手法は本質的な限界を有すると論じる。
疑似モデムと呼ばれるオープン量子系から最近開発された手法を用いて,この制限を克服することを検討する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:21:25 GMT)
Machine Learning Driven Smishing Detection Framework for Mobile Security [0.5] スマイッシング(smishing)は、SMSを通じて行われるフィッシングの高度なバリエーションである。
従来の検出手法は、SMS言語の非公式かつ進化的な性質に苦慮している。
本稿では,コンテンツに基づくスマイシング検出フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:20:20 GMT)
Applications and Implications of Large Language Models in Qualitative Analysis: A New Frontier for Empirical Software Engineering [0.5] この研究は、ソフトウェア工学における質的研究におけるLCMの使用を最適化するための構造化戦略とガイドラインの必要性を強調している。
LLMは質的な分析をサポートすることを約束していますが、データの解釈には人間の専門知識が不可欠です。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:17:36 GMT)
Learning about algorithm auditing in five steps: scaffolding how high school youth can systematically and critically evaluate machine learning applications [0.4] アルゴリズム監査は、アルゴリズムシステムの不透明な内部動作と外部からの外部影響を理解する方法である。
本稿では,若者を監査アルゴリズムで支援できる5つのステップを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:55:54 GMT)
Towards a Comprehensive Framework for Cyber-Incident Response Decision Support in Smart Grids [0.4] 本稿では,アタック・ディフェンス・ツリーと,スマートグリッド・サイバーセキュリティ向上のためのマルチクレートリ・意思決定手法を統合する枠組みを提案する。
提案モデルは,今後のグリッド管理課題に対する洞察を提供しながら,グリッドサイバーセキュリティ活動の有効性と効率を最適化することを目的としている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:07:10 GMT)
Impact-parameter selective Rydberg atom collision by optical tweezers [0.4] 2つのルビジウム原子間の冷間衝突について, 衝突パラメータと衝突エネルギーを制御して検討した。
光学的ツイーザは、一方の原子を静止させ、他方を一定の速度に推進するために用いられる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 05:58:05 GMT)
Is Self-Supervision Enough? Benchmarking Foundation Models Against End-to-End Training for Mitotic Figure Classification [0.4] ファンデーションモデル(FM)は近年、病理学の領域で広く普及している。
本研究は, 有糸分裂型図形分類にも適用できる程度について検討する。
その結果,データ提供量にかかわらず,エンドツーエンド学習ベースラインがすべてのFM分類器を上回っていることが判明した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:35:39 GMT)
Towards High-Level Modelling in Automated Planning [0.4] Unified-Planningは、計画問題を特定し、自動プランナを呼び出すためのハイレベルAPIを提供するPythonライブラリである。
本稿では,高次問題モデリングのための表現性向上を目的としたUPライブラリの拡張について述べる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:01:13 GMT)
ICANet: A Method of Short Video Emotion Recognition Driven by Multimodal Data [0.3] 我々は,マルチモーダルなショートビデオ感情認識を実現するためにICANetという新しい手法を提案する。
オーディオ、ビデオ、光学フローの3つの異なるモダリティを採用しており、単一のモダリティの欠如を補っている。
ICANetはIEMOCAPベンチマークで80.77%の精度でSOTA法を15.89%上回っている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:14:01 GMT)
A New Method on Mask-Wearing Detection for Natural Population Based on Improved YOLOv4 [0.3] 本稿では,改良型YOLOv4に基づくマスク着用検出手法を提案する。
機能の融合と表現を調整するために、バックボーンにコーディネートアテンションモジュールを追加します。
第3に,K平均クラスタリングアルゴリズムを適応的に展開し,9つのアンカーボックスをNPMDデータセットに適合させる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:24:52 GMT)
Implementing a Quantum Finite Automaton in IBMQ using Custom Control Pulses [0.3] 1ウェイ量子有限オートマタ(MO1QFA)モデルに着目し,MODp問題に対処する。
オートマトン実装用に設計された高速単一量子ゲートの校正にパルスレベルプログラミングを用いる。
提案手法は,オートマトンがサポートする計算長を大幅に向上することを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:36:22 GMT)
Can LLMs Identify Gaps and Misconceptions in Students' Code Explanations? [0.3] 本稿では,Large Language Models (LLMs) を用いて,学生による特定の教材の自己説明におけるギャップや誤解を識別する手法について検討する。
単純なプロンプトにより、GPT-4はLLaMA3とMistralを一貫して上回り、ギャップと誤解を識別した。
この結果から, 微調整された大規模言語モデルは, 学生の説明のギャップを識別する上で, より効果的であることが示唆された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:42:23 GMT)
Quantum Algorithms for Optimal Power Flow [0.3] 本稿では,量子コンピューティング,特にHHLとVQLSのアルゴリズムを用いて,電力グリッドの最適電力流問題の解法について検討する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:27:29 GMT)
AI Cyber Risk Benchmark: Automated Exploitation Capabilities [0.2] 自動ソフトウェアエクスプロイトにおけるAIモデルの能力とリスクを評価するための新しいベンチマークを導入する。
OpenAIのo1-previewやo1-mini、AnthropicのClaude-3.5-sonnet-20241022、Claude-3.5-sonnet-20240620など、主要な言語モデルの評価を行った。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:29:55 GMT)
Extreme AutoML: Analysis of Classification, Regression, and NLP Performance [0.2] Extreme Learning Machines (ELMs) は基本的に異なるタイプのニューラルアーキテクチャを使用し、計算コストを大幅に削減してより良い結果をもたらす。
カリフォルニア大学アーバイン校(UCI)リポジトリのいくつかの一般的な分類データセットを使用して、Extreme AutoML技術をGoogleのAutoMLと比較した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 21:10:22 GMT)
Ensemble Machine Learning Model for Inner Speech Recognition: A Subject-Specific Investigation [0.2] 本研究では,128チャネル表面の脳波信号を用いて内部音声を分類する機械学習手法を開発した。
6つのMLアルゴリズムの性能を評価し,アンサンブルモデルを提案する。
提案手法は,脳波信号を用いた内部音声の分類において有望であることを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:50:49 GMT)
TartuNLP @ SIGTYP 2024 Shared Task: Adapting XLM-RoBERTa for Ancient and Historical Languages [0.2] 我々はSIGTYP 2024の制約なしサブタスクに,古代・歴史的言語における単語埋め込み評価の共有タスクを提出する。
そこで我々は,パラメータ効率の微調整を応用した,シンプルな,一様で,計算的に軽量な手法を開発した。
本研究は,現代の言語に事前学習した言語モデルを,アダプタ学習を通じて古代・古代の言語に適応する可能性を示すものである。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:30:56 GMT)
Vulnerability Coordination Under the Cyber Resilience Act [0.2] CRA(Cyber Resilience Act)は、欧州連合(EU)で最近合意された法律である。
それは事実上、すべての情報技術製品に多くの新しいサイバーセキュリティ要件を課している。
本稿は、脆弱性開示を含む脆弱性調整に関するCRAの新たな要件について検討し、詳述する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:19:30 GMT)
Reciprocal lumped-element superconducting circuits: quantization, decomposition, and model extraction [0.2] 超伝導量子デバイス用ラム素子回路モデルの量子化,分解,抽出(電磁シミュレーションから)のための新しい手法を提案する。
我々のフラックスチャージ対称プロシージャは、回路のインダクティブループと容量ノードの接続を符号化するネットワークマトリックスを中心にしている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:00:00 GMT)
Direct observation of time-dependent coherent chiral tunneling dynamics [0.2] 配位分子状態の重ね合わせによってアキラルな固有状態が生まれ、トンネルによって二重井戸電位で非局在化される。
これらのエネルギー固有状態のコヒーレントな重ね合わせは、分子をキラル状態に動的に再局在させることができる。
マイクロ波6波混合ポンププローブを用いて、コヒーレントなカイラルトンネル力学を回転状態で生成・探究する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:25:36 GMT)
Forte : Finding Outliers with Representation Typicality Estimation [0.1] 生成モデルは、それを訓練する実際のデータとほぼ区別できない合成データを生成することができる。
OOD検出に関する最近の研究は、生成モデルの可能性が最適なOOD検出器であるという疑念を提起している。
本稿では,表現学習と,多様体推定に基づく情報的要約統計を利用した新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 05:13:27 GMT)
Leveraging Sentiment for Offensive Text Classification [0.1] SemEval 2019タスク6、OLID、データセットで実験を行います。
事前学習した言語モデルを用いて各インスタンスの感情を予測する。
OLIDテストセットで最高の性能を得たモデルを選択し、それを拡張OLIDセットでトレーニングし、パフォーマンスを分析します。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:27:20 GMT)
Framework to coordinate ubiquitous devices with SOA standards [0.1] 現在、情報システム業界で標準化され、テストされているSOAの原則を、広く普及している環境におけるユビキタスデバイスとの接続に適用します。
私たちはWS-CDLに基づくユビキタスデバイスのためのコーディネートフレームワークを構築し、運用し、概念実証を行いました。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:01:29 GMT)
LLM as HPC Expert: Extending RAG Architecture for HPC Data [0.1] 本稿では、検索補助生成(RAG)を拡張する新しい手法である仮説コマンド埋め込み(HyCE)を紹介する。
HyCEは、大規模言語モデル(LLM)をリアルタイムなユーザ固有のHPC情報で強化し、そのようなデータに対する微調整モデルの制限に対処する。
我々は、データプライバシやコマンド実行リスクなど、重要なセキュリティ上の問題に対処し、HPC環境にLLMをデプロイする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 02:55:30 GMT)
Improved GUI Grounding via Iterative Narrowing [0.0] 本稿では,GUIグラウンディングにおける汎用モデルと微調整モデルの両方の性能向上のために,反復的絞り機構を用いた視覚的プロンプトフレームワークを提案する。
評価のために、様々なUIプラットフォームからなる包括的なベンチマークで手法を検証し、その結果を再現するコードを提供した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:04:39 GMT)
Systematic Review: Text Processing Algorithms in Machine Learning and Deep Learning for Mental Health Detection on Social Media [0.0] 本稿では,ソーシャルメディア上での抑うつ検出のための機械学習モデルの評価を行う。
モデルの信頼性と一般化可能性に影響を及ぼす重要なバイアスが見つかった。
否定のような言語的なニュアンスに明示的に対応した研究はわずか23%で、正確な感情分析に欠かせないものだった。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:23:57 GMT)
A Systematic Review of Machine Learning Approaches for Detecting Deceptive Activities on Social Media: Methods, Challenges, and Biases [0.0] 本稿では、機械学習(ML)モデルとディープラーニング(DL)モデルを用いて、ソーシャルメディア上の偽ニュース、スパム、偽アカウントを検出する研究を体系的に評価する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:22:10 GMT)
ZNorm: Z-Score Gradient Normalization Accelerating Skip-Connected Network Training without Architectural Modification [0.0] Z-Score Normalization for Gradient Descent (ZNorm)は、ネットワークアーキテクチャを変更することなく勾配のみを調整し、トレーニングを加速し、モデル性能を向上させる革新的な技術である。
ZNormは、全体的な勾配を正規化し、レイヤ間の一貫性のある勾配スケーリングを提供し、グラデーションの消滅と爆発のリスクを効果的に低減し、優れたパフォーマンスを達成する。
医用画像の応用において、ZNormは腫瘍の予測とセグメンテーションの精度を大幅に向上させ、その実用性を強調している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:13:10 GMT)
When Every Token Counts: Optimal Segmentation for Low-Resource Language Models [0.0] 最適Byte-Pair(BPE)構成は,グリーディセグメンテーションに比べてトークン数を大幅に削減することを示す。
この結果から,圧縮最適化トークン化戦略が多言語および低リソース言語アプリケーションに多大なメリットをもたらす可能性が示唆された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:11:54 GMT)
Universal distributed blind quantum computing with solid-state qubits [0.0] ブラインド量子コンピューティングは、分散量子システムの有望な応用である。
分散2ノードネットワーク上で,単一ビットと2ビットのブラインドゲートからなる普遍的な量子ゲートセットを実験的に実証した。
我々は、2ノードネットワークをまたいだ盲点演算による分散アルゴリズムを実行し、分散モジュールアーキテクチャにおける物質量子ビットを用いた盲点量子計算への道を開いた。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:15:14 GMT)
Two-tone spectroscopy of high-frequency quantum circuits with a Josephson emitter [0.0] 我々は、電圧バイアスの超伝導体-常温超伝導体-ジョセフソン接合によって高周波放射が発生する量子回路上で2トーン分光を行う。
この2トーンジョセフソン分光法はミリ波帯内でよく動作し、80GHz以上の周波数に達することを実証する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:05:37 GMT)
Tunable Generation of Spatial Entanglement in Nonlinear Waveguide Arrays [0.0] 半導体非線形導波路アレイのパラメトリックダウンコンバージョンに基づく光子対のコンパクトな光源を実証する。
我々は、出力量子状態を設計し、様々な種類の空間相関を実装するためにダブルポンプ構成を用いる。
この実験は室温とテレコム波長で行われ、連続的に結合されたシステムのポテンシャルを示している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:24:40 GMT)
Tracking control of latent dynamic systems with application to spacecraft attitude control [0.0] インテリジェントな宇宙船や宇宙ロボットが複雑な環境でタスクを行う場合、制御可能な変数は直接利用できない。
これらの観測の力学は非常に複雑であるが、それらの背後にあるメカニズムは単純かもしれない。
潜在力学系の制御には、強化学習に基づく手法は、サンプルの非効率性や一般化の問題に悩まされる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:49:15 GMT)
Toward Non-Invasive Diagnosis of Bankart Lesions with Deep Learning [0.0] バンカート病変(Banart lesions)は、標準的なMRIでは診断的に困難である。
本研究は,標準MRIとMRAの両方において,Banart病変を検出するためのディープラーニング(DL)モデルを開発する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:04:27 GMT)
Topological zero modes and bounded modes at smooth domain walls: Exact solutions and dualities [0.0] トポロジーは、トポロジカル絶縁体と超伝導体のトポロジ的非等価相の間の領域壁におけるソリトニックゼロエネルギーモードの存在を規定している。
ここでは、滑らかで指数関数的に定義されたドメインウォールを仮定して、これらの零モードの分析解を求める。
我々は、ゼロモードのバルク励起ギャップ、崩壊速度、振動運動量の間の普遍的な関係を確立する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:34:18 GMT)
To Be or Not to Be (in the EU): Measurement of Discrepancies Presented in Cookie Paywalls (LONG) [0.0] 本研究では,1)クライアントブラウザ,2)デバイスタイプ(デスクトップまたはモバイル),3)クッキーペイウォールの存在と動作に対する地理的な位置の影響について検討する。
クッキーペイウォールを提示する804のWebサイトで構成されたデータセット上の自動クローラを用いて,クッキーペイウォールの存在がユーザの地理的な位置に影響されていることを確認した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:08:04 GMT)
Time-Reversal Symmetry in RDMFT and pCCD with Complex-Valued Orbitals [0.0] 複素解は非動的電子相関効果が発音されるときにエネルギーを低下させることを示す。
具体的には、非動的電子相関効果が発音されるとき、複素解はエネルギーを低下させる。
N-representability violations(N-representability violations)によって引き起こされるこれらの不安定性と可能な問題を説明・議論するための数値的な例を示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:33:47 GMT)
The molecular nature of superfluidity: Viscosity of helium from quantum stochastic molecular dynamics simulations over real trajectories [0.0] 量子液体の粘度は古典液体の粘度よりも著しく小さく、最も低い温度でほぼ5倍小さい。
古典と量子の液体はボース=アインシュタイン凝縮を除いて同一であり、超流動性の分子機構を示唆している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:16:32 GMT)
The long-range origin of the black hole entropy [0.0] 本稿では,SYK点とパワー-ロー崩壊結合の連鎖における長距離相互作用の役割について検討する。
この結果は、ブラックホールの熱力学と量子情報における相互作用範囲の役割を理解するための道を開くものである。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:00:12 GMT)
The Thermomajorization Polytope and Its Degeneracies [0.0] 我々は「よく構造化された」ギブス状態と「安定な」ギブス状態の概念を紹介する。
量子熱力学と熱操作による資源理論のアプローチについて考察する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:27:43 GMT)
The Rosetta Paradox: Domain-Specific Performance Inversions in Large Language Models [0.0] ロゼッタ・パラドックスは知識領域の反直観的性能逆転を特徴づける。
本稿では,ロゼッタパラドックスの定義を形式化し,パノラマ解析フレームワークを導入する。
以上の結果から,ロゼッタパラドックスはデータ分布の単なる人工物ではなく,深層ニューラルネットワークの内在的アーキテクチャと創発的特性である可能性が示唆された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:59:32 GMT)
TAE: A Model-Constrained Tikhonov Autoencoder Approach for Forward and Inverse Problems [0.0] 工学や科学の分野では、前方・逆問題のリアルタイム解法が不可欠である。
機械学習サロゲートモデルは従来の方法に代わる有望な代替手段として登場し、計算時間を大幅に短縮した。
これらのモデルは通常、さまざまなシナリオをまたいだ堅牢な一般化を実現するために、広範なトレーニングデータセットを必要とします。
本稿では,Tikhonov 自己エンコーダモデルに制約のある新しいフレームワーク TAE を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 21:36:42 GMT)
Supply Chain Insecurity: The Lack of Integrity Protection in SBOM Solutions [0.0] SBOM(Software Bill of Materials)は、ソフトウェアサプライチェーンのセキュリティを確保するための最重要事項である。
ビデン大統領が発した大統領令により、SBOMの採用は米国内で義務化されている。
本研究は,SBOMの完全性に関する詳細な,体系的な研究である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:52:37 GMT)
SparseAccelerate: Efficient Long-Context Inference for Mid-Range GPUs [0.0] SparseAccelerateは動的スパースアテンション手法であり、入力特性に基づいてその疎度パターンを適応する。
実験結果から,SparseAccelerateは最大1.04倍のTTTF遅延を32Kトークンで達成した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:27:03 GMT)
Source Separation & Automatic Transcription for Music [0.0] エンド・ツー・エンドのパイプラインを作成し、最初のオーディオ・ミックスを楽器の幹に分割し、MIDIファイルに変換し、各楽器の楽譜に書き起こす。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:49:14 GMT)
SigKAN: Signature-Weighted Kolmogorov-Arnold Networks for Time Series [0.0] 学習可能な経路シグネチャとコルモゴロフ・アルノルドネットワーク(KAN)を用いた多変量関数近似の新たな手法を提案する。
学習可能な経路シグネチャを用いて、kansが取得した値を重み付けすることで、これらのネットワークの学習能力を向上し、パスの重要な幾何学的特徴を捉える。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:37:12 GMT)
SCADE: Scalable Framework for Anomaly Detection in High-Performance System [0.0] コマンドラインインタフェースは高性能コンピューティング環境に不可欠な存在である。
従来のセキュリティソリューションでは、コンテキスト固有の性質、ラベル付きデータの欠如、LOL(Living-off-the-Land)のような高度な攻撃の頻度による異常の検出に苦労している。
本稿では,グローバル統計モデルと局所的文脈特化分析を組み合わせた拡張型コマンドライン異常検出エンジン(SCADE)について紹介する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:57:27 GMT)
Recovering Quantum Coherence of a Cavity Qubit Coupled to a Noisy Ancilla through Real-Time Feedback [0.0] エラーの顕著な源は、結合したアンシラのノイズから生じ、すぐにキュービットに広がる。
これらのノイズの多いアンシラを監視することで、キュービットのデコヒーレンスイベントを特定し、これらのエラーをリアルタイムで修正することができる。
超伝導キャビティ量子ビットにおけるデコヒーレンスの複雑なダイナミクスは, ノイズの多いトランスモンアンシラとの相互作用によって明らかになる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:57:57 GMT)
Rank lower bounds on non-local quantum computation [0.0] 非局所量子計算(NLQC)は、2つの量子システム間の相互作用を1ラウンドの通信と共有絡みによって置き換える。
NLQCの2つのクラス、$f$-routingと$f$-BB84を研究し、これは古典的な情報理論の暗号と量子位置の検証に関係している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:43:45 GMT)
Random regular graph states are complex at almost any depth [0.0] グラフ状態は、その単純な古典的記述とリッチな絡み合い構造のために、量子情報理論の基本的な対象である。
私たちにとって、それらは回路接続、絡み合い構造、計算複雑性の関係を理解するためのおもちゃモデルです。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 23:44:09 GMT)
Quasi-classical Limit of a Spin Coupled to a Reservoir [0.0] スピン(量子ビット)はボソニック貯水池と接触する。
貯水池の状態は、量子的および古典的な貯水池の特徴を補間するパラメータ・ヴァレプシロンを含む。
我々はデコヒーレンスとマルコビアン性について研究する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:46:31 GMT)
Quantum recharging by shortcut to adiabaticity [0.0] ユニタリ変換の下では、エネルギーよりもエルゴトロピーが蓄積された有用な仕事を記述する上で重要な役割を果たす。
本稿では,ポストセレクションとショートカットに基づく高速で安定したリチャージプロトコルを提案する。
当社のプロトコルは省エネ・実験可能なプロトコルであり、禁止された遷移を持つシステムでも実現可能である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:37:12 GMT)
Quantum Cournot model based on general entanglement operator [0.0] ゲームの初期状態の絡み合い度とナッシュ均衡におけるペイオフ値の関係は曖昧である。
1つのスクイーズパラメータに依存するゲームの初期状態に基づく量子双極子では、位相パラメータの値が0より大きい場合、ナッシュ平衡における最大支払いは到達できない。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:35:33 GMT)
Privacy-Preserving Large Language Models: Mechanisms, Applications, and Future Directions [0.0] 本調査では,大規模言語モデルに適したプライバシ保護機構の展望について考察する。
メンバーシップ推論やモデル逆転攻撃といった重要なプライバシー問題に対処する上での有効性を検討する。
本稿では、最先端のアプローチと今後のトレンドを合成することによって、堅牢でプライバシーに配慮した大規模言語モデルを構築するための基盤を提供する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 00:24:09 GMT)
Prediction of Occluded Pedestrians in Road Scenes using Human-like Reasoning: Insights from the OccluRoads Dataset [0.0] 歩行者による歩行者による道路シーンの多種多様な収集を特徴とするOcclusion-Rich Road Scenes with Pedestriansについて紹介する。
このデータセットを用いて、知識グラフ(KG)、知識グラフ埋め込み(KGE)、ベイズ推論プロセスを利用して、閉塞した歩行者の存在を予測するパイプラインを開発した。
提案手法では,従来の機械学習モデルと比較して最大42%向上したF1スコアが0.91である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:59:27 GMT)
Optimising entanglement distribution policies under classical communication constraints assisted by reinforcement learning [0.0] 量子リピータは遠距離における絡み合いの効果的な分布において重要な役割を果たす。
ノードが近隣のノードとのみ協調する,固定されたローカルポリシ,予測スワップ・アサップ(swap-asap)ポリシを導入し,評価する。
本研究は,古典的コミュニケーション効果が重要である現実的な場合において,不完全な情報を伴う政策を考えることのメリットを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:26:49 GMT)
Operator Valued Flow Equation Approach to the Bosonic Lattice Polaron: Dispersion Renormalization Beyond the Fröhlich Paradigm [0.0] 格子ボースポラロンの再正規分散を計算し、2フォノン散乱過程が分散に与える影響を評価する。
ある種の不純物フォノン相互作用では, 2-フォノン散乱イベントを含むことにより, 分散の形状が著しく変化することがわかった。
この結果は、単一フォノン散乱イベントのみを考慮したFr"ohlich型モデルには存在しない極性境界状態が出現する可能性があることを予測している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:03:08 GMT)
Open extended quantum systems [0.0] まず、リンドブラッド方程式の顕微鏡的導出と、より抽象的なアプローチから始める。
次に、オープン量子系の非単位力学の解法を提供する多元的フレームワークである衝突モデルを導入する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:52:51 GMT)
Observation of a Multimode Displaced Squeezed State in High-Harmonic Generation [0.0] 高調波発生は光の多重モード圧縮状態を生成することを示す。
光源は小型レーザーで室温で動作する。
量子技術における将来の応用に有用なリソースになり得る。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:33:49 GMT)
Nuclear Excitation by Near-Resonant Electron Transition in $^{229}$Th$^{39+}$ Ions [0.0] 229$Th$39+$イオンの最初の励起原子状態のエネルギーは8.308$pm$0.011 eVと推定される。
励起速度は1.27タイムs1016$ s$-1$の共鳴値に達する。
229ドルの異性体の生産は、数ドルから約719ドル(119ドル)までの範囲に到達できる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:26:27 GMT)
Non-Orientable Quantum Hilbert Space Bundle [0.0] ハミルトン固有値のヒントに頼る代わりに、ファイバー計量の挙動と量子状態の進化が解析される。
その結果、例外点の周りのヒルベルト空間束は向き付け不能であることが判明した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:58:26 GMT)
NestedMorph: Enhancing Deformable Medical Image Registration with Nested Attention Mechanisms [0.0] 変形可能な画像登録は、様々なモダリティにまたがる非線形な方法で医用画像の整列に不可欠である。
本稿では,Nested Attention Fusion を用いた新たなネットワークであるNestedMorphについて述べる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 21:48:42 GMT)
Narrowband and passband composite rotational quantum gates [0.0] 高精度で堅牢な量子ゲートは、量子計算や情報処理において不可欠な要素である。
誤りに対する感度を高める量子ゲートの適用可能性について検討する。
狭帯域特性と通過帯域特性の3つの基本量子ゲートを導出する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 10:03:40 GMT)
Mining Math Conjectures from LLMs: A Pruning Approach [0.0] 本稿では,Large Language Models (LLMs) を用いた数理予想生成手法を提案する。
我々は、ChatGPT, Gemini, Claude などの LLM がどのようにして予想を生成するかを示す。
以上の結果から,LLM は,コード実行に制限があるにも関わらず,基本的ではないものの,正当性あるいは正当性がある,という予想を導出できる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:00:38 GMT)
Magnetic catalysis in weakly interacting hyperbolic Dirac materials [0.0] ゼロエネルギー近傍の状態の無限密度を発生させることで強磁場の応用が、極小の$V$であってもCDWオーダーの凝縮を引き起こすことを示す。
双曲型ディラック材料で囲まれた全フラックスによるCDWオーダーのスケーリングを,幅広い(特に亜臨界)$V$に対して提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:45:05 GMT)
Long-Range Entangled Quantum Noise Radar Over Order of Kilometer [0.0] 本稿では,量子2モード圧縮(QTMS)レーダーの最大検出範囲の明示的表現を導出した。
従来のレーダとしてQTMSレーダを適用可能であることを示す。
都市部における小型無人航空機の認識に適した2mathrmkm$までの最大検出範囲を持つQTMSレーダーを実装することが可能である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:46:49 GMT)
Light-induced magnetic trapping for cold alkali atoms using a combined optical tweezers and nanofibre platform [0.0] 光ナノファイバーからの光誘起磁場を用いた8,7$Rbの低温原子の磁気トラップ法を提案する。
光ツイーザーのガウスモードとラゲール・ガウスモードのトラップポテンシャルをプロットしプロットする。
両光場のパワーを制御することにより、数百ナノメートルのトラップ位置が変化することを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 05:18:18 GMT)
LMS-AutoTSF: Learnable Multi-Scale Decomposition and Integrated Autocorrelation for Time Series Forecasting [0.0] 自動相関を組み込んだ新しい時系列予測アーキテクチャであるLMS-AutoTSFを紹介する。
事前定義されたトレンドと季節的なコンポーネントに依存するモデルとは異なり、LMS-AutoTSFはスケール毎に2つの独立したエンコーダを使用する。
このアプローチにおける重要な革新は、時間ステップの差分を計算することによって達成される自己相関の統合です。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:31:58 GMT)
LLMs as Debate Partners: Utilizing Genetic Algorithms and Adversarial Search for Adaptive Arguments [0.0] DebateBrawlは、Large Language Models (LLM)、GA、Adversarial Search (AS)を統合するAIベースの議論プラットフォームである。
このシステムは、その戦略をリアルタイムで適応しながら、一貫性があり、文脈的に関連する議論を生成する際、顕著な性能を示す。
このシステムの精度を維持する能力(人間のみの議論では78%に比べて92%)は、AI支援談話における重要な懸念に対処する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:03:48 GMT)
LLM-BIP: Structured Pruning for Large Language Models with Block-Wise Forward Importance Propagation [0.0] ブロック単位の重要スコアの伝搬に基づくより正確なプルーニング指標を提案する。
我々は,LLaMA-7B,Vicuna-7B,LLaMA-13Bを用いて,共通ゼロショットタスクを用いて提案手法の評価を行った。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:57:16 GMT)
Ion-mediated interaction and controlled phase gate operation between two atomic qubits [0.0] 2つの大きく分離された光学的ツイーザの2つの原子量子ビットが、リドベルクの励起を通じて1つの閉じ込められたイオンと相互作用すると、イオン-原子相互作用が存在することを示す。
我々はこの相互作用を用いて、2量子制御位相ゲートの動作を97%の忠実度で示し、個々の原子量子ビットをレーザーで処理する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:33:16 GMT)
Instantaneous tunneling time within the theory of time-of-arrival operators [0.0] 量子トンネルは古典的TOAのワイル量子化によって構築された時変演算子を用いて瞬時に行われる。
古典的TOAの可能な量子画像は無限に存在するが、それらが他のものよりも一意に好まれているかどうかは不明である。
ここでは、位置と運動量観測値の間の順序規則によらず、古典的到着時間の可能な全ての量子画像についてトンネル時間が消滅することを実証する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 13:53:40 GMT)
Influence of momentum confinement in the phase-space dynamics of the Kramers-Henneberger atom [0.0] 時間依存シュリンガー方程式を解くクラマース・ヘネベルガー(KH)原子の位相空間ダイナミクスについて検討する。
時間平均KHポテンシャルに対して、固有状態のコヒーレント重ね合わせは運動量空間に制限された巡回運動を行う。
古典的な位相空間の制約と準確率フローの比較は、KH原子に対して、閉じ込めは運動量空間で起こることを示している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:36:49 GMT)
Inductive Linguistic Reasoning with Large Language Models [0.0] 言語パズルのレンズを通して抽象多言語推論を行うための大規模言語モデルの能力について検討する。
2段階のプロシージャを使用し、まず言語モデルで類似の例を生成し、それを文脈内で適用する。
ModeLing データセットの結果から,言語文法の類似性に関するモデルの知識を抽出する上で,類似的なプロンプトが有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:37:11 GMT)
In Silico Pharmacokinetic and Molecular Docking Studies of Natural Plants against Essential Protein KRAS for Treatment of Pancreatic Cancer [0.0] 膵管腺癌(PDAC)は,過去数年間の死因の1つと考えられた。
エビデンスは、癌原性KRAS変異が膵癌の主要な原因であるという考えを支持した。
植物由来化合物を50種以上選択する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 06:24:33 GMT)
Improving stabilizer approximation with quantum strategy [0.0] 我々は、これまで提案した安定化器近似を改善するために、非局所ゲームからの量子戦略を導入する。
その結果、標準安定化器の量子ビット・バイ・キュービット・ギャグ法が得られた。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:14:45 GMT)
INFusion: Diffusion Regularized Implicit Neural Representations for 2D and 3D accelerated MRI reconstruction [0.0] Inlicit Neural Representations (INRs) は、MRI(MRI)の取得を加速するための学習ベースのアプローチである。
本研究は、アンダーサンプルMR測定からINRの最適化を規則化する手法であるINFusionを提案する。
また,大規模な3次元MRデータセットにINRを適用可能な拡散正則化を用いたハイブリッド3次元アプローチを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:43:26 GMT)
Harnessing Transfer Learning from Swahili: Advancing Solutions for Comorian Dialects [0.0] バントゥー語族に属する4つの言語や方言のグループであるComorianのためのNLP技術の先駆者を目指しています。
我々のアプローチは、人間が母国語と異なる言語をほとんど、あるいは全く使わずに理解できれば、このプロセスを機械でモデル化することは、完全に可能であるという仮説に動機付けられています。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 22:47:41 GMT)
GPT Semantic Cache: Reducing LLM Costs and Latency via Semantic Embedding Caching [0.0] GPT Semantic Cacheは、インメモリストレージ(Redis)におけるクエリ埋め込みのセマンティックキャッシュを利用する方法である。
ユーザクエリを格納することにより、セマンティックに類似した質問を効率よく識別し、大規模言語モデルに対する冗長なAPI呼び出しを伴わずに、事前生成された応答を検索できる。
実験の結果、GPT Semantic CacheはさまざまなクエリカテゴリでAPI呼び出しを最大68.8%削減し、キャッシュヒット率は61.6%から68.8%に向上した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 01:44:10 GMT)
Frequency entangled W states and quantum frequency translation protocols via forward Brillouin interactions [0.0] 我々は、ブリュアン散乱のフォノン-光子相互作用が、周波数に絡み合った単一光子状態の高速合成にどのように使用できるかを示す。
提案システムでは、異なる周波数の同時レーザーパルスが射出単光子または遮蔽単光子のいずれかを動的に発展させ、選択された寸法と出力周波数のW状態を生成する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:36:55 GMT)
Families of $d=2$ 2D subsystem stabilizer codes for universal Hamiltonian quantum computation with two-body interactions [0.0] 我々はBravyiの$A$行列フレームワークを用いて、距離2$の量子エラー検出符号(QEDC)の族を構築する。
最大コードレートを達成するためのコード群を特定し、この制約を少し緩和することで、物理的な局所性を高めたより広い範囲のコードを発見します。
コードレート、物理的局所性、グラフ特性、ペナルティギャップの観点から、これらのコードの性能を評価するための体系的なフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:36:38 GMT)
FairML: A Julia Package for Fair Classification [0.0] 機械学習における公平な分類のためのフレームワークを提供するJuliaパッケージであるFairML.jlを提案する。
公正な学習プロセスは、前処理、内処理、後処理の3つの段階に分けられる。
シミュレーションでは, 単一位相とその組み合わせの性能を示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:57:49 GMT)
Fair Generalized Linear Mixed Models [0.0] 機械学習の公正性は、データとモデルの不正確さのバイアスが差別的な決定に結びつかないことを保証することを目的としている。
両問題を同時に処理できるアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:14:54 GMT)
Exploring the Impact of Synthetic Data on Human Gesture Recognition Tasks Using GANs [0.0] 本研究は、GAN(Generative Adversarial Networks)を用いたウェアラブルIoTデバイスデータからアレルギー性鼻炎に対するモーションジェスチャの合成の可能性について、初めて検討したものである。
これらのAIモデルのパフォーマンスも、忠実さ、多様性、プライバシの観点から重視しています。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:15:47 GMT)
Exploiting SU(N ) dynamical symmetry for rovibronic stabilization of a weakly bound diatomic molecule [0.0] 二原子分子の集団を、同じ電子状態または別の電子状態の目的の可視性レベルにコヒーレントに移動させるスキーム。
我々はこのスキームをKRb分子の絶対基底状態への安定化に応用し、最初は高次$upsilon$ = 75, J = 6レベルの基底電子状態$X1Sigma+$とする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 22:53:33 GMT)
Experiments with the 4D Surface Code on a QCCD Quantum Computer [0.0] 単発量子誤り訂正は、複数の症候群抽出の必要をなくすことで、量子計算を高速化する可能性がある。
本研究では, 単発量子誤り訂正の初回実験を行い, 素小アンシラ量子ビットを用いた実験を行った。
その結果, 4次元表面符号は, 耐故障性, 単発性の両方で2次元表面符号と一致し, 性能が優れていることがわかった。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:38:45 GMT)
Even-parity precession protocol for detecting nonclassicality and entanglement [0.0] 量子状態の非古典性を検出できる等間隔プリセッションプロトコルを導入する。
他の古典的でない試験とは異なり、同時または連続的な測定は不要である。
この研究は、偶数の量子ビットのグリーンベルガー・ホーネ・ザイリンガー絡みを検出する可能性を示すことによって、長期間のギャップを埋める。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:04:20 GMT)
Entanglement of Assistance as a measure of multiparty entanglement [0.0] マルチパーティの絡み合いの定量化は、量子情報理論において重要な課題となっている。
本論では,全ての潜在的当事者における援助の幾何学的絡み合いを計算できる「援助の体積」(Volume of Assistance, VoA)の概念を導入する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 22:40:51 GMT)
Entanglement Negativity and Replica Symmetry Breaking in General Holographic States [0.0] ランダムテンソルネットワーク(RTN)では、R'enyi negativity $mathcalE (2k)$さえも計算する支配的なサドルが、$mathbbZ_2k$レプリカ対称性を総称的に破ることがわかった。
これは2次元CFT法によるホログラムの負性率の以前の計算に疑問を投げかけるものである。
一般ホログラフィック状態において、$mathcalE (2k)$のサドルが実際に$mathbbZ_2k$のレプリカ対称性を破っていることを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 14:26:13 GMT)
Enhancing fidelity in teleportation of a two-qubit state via a quantum communication channel formed by spin-1/2 Ising-Heisenberg trimer chains due to a magnetic field [0.0] 2つの独立スピン-1/2イジング・ハイゼンベルク三量体鎖は、絡み合った2量子状態の量子テレポーテーションに有効なプラットフォームを提供する。
任意の2量子状態の量子テレポーテーションの効率は、中程度の磁場によって著しく向上することができる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 07:17:01 GMT)
Enhanced Lieb-Robinson bounds for commuting long-range interactions [0.0] 量子多体系における情報伝達における長距離相互作用の複雑な効果を示す。
私たちのモチベーションの一部は、量子エラー訂正コードに起因しています。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:28:21 GMT)
Emergent symmetries in prethermal phases of periodically driven quantum systems [0.0] 周期的に駆動される閉じた量子系は、最終的に無限の温度まで安定な状態に達すると期待されている。
しかし、長い予熱状態におけるそれらの性質は、その無限温度定常状態における性質と質的に異なる。
これらはしばしば実験的に関係し、予熱状態は幅広い現象を伴っている。
それらは動的局在と凍結を示し、フロケの傷跡をホストし、ヒルベルト空間の断片化のサインを表示し、時間結晶相を示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 11:47:46 GMT)
Electron-beam annealing of Josephson junctions for frequency tuning of quantum processors [0.0] 電子ビームを用いて定周波量子ビットをチューニングし、ジョセフソン接合を局所的に無視する手法を提案する。
ジャンクションバリア抵抗の増大と減少を両立する能力を示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:53:47 GMT)
Efficient VoIP Communications through LLM-based Real-Time Speech Reconstruction and Call Prioritization for Emergency Services [0.0] 緊急通信システムは、パケット損失、帯域制限、信号品質の低下、遅延、VoIPシステムのジッタによる破壊に直面している。
苦悩の被害者はしばしば、パニック、発声障害、背景雑音による重要な情報を伝えるのに苦労する。
本稿では,不完全な音声を再構成し,文脈的ギャップを埋め,重大度に基づく呼の優先順位付けを行うことにより,これらの課題に対処するためにLarge Language Models(LLMs)を活用することを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:22:40 GMT)
Efficient Classical Computation of Single-Qubit Marginal Measurement Probabilities to Simulate Certain Classes of Quantum Algorithms [0.0] 我々は、ニューラルネットワークを利用してユニタリ変換を生成する新しいCNOT関数を導入する。
ランダム回路シミュレーションでは,QC-DFTの修正により,単一キュービットの辺り測定確率の効率的な計算が可能となった。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 05:34:41 GMT)
Efficacious qubit mappings for quantum simulations of the $^{12}$C rotational band [0.0] 本稿では,12ドルC原子核の低層構造に対する変分量子固有解法に基づく第1次量子シミュレーションを提案する。
我々は、ほぼ完全な原子核の対称性を利用して、完全な対称性に適応して、モデル空間のサイズを劇的に減少させる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 20:39:22 GMT)
Disorder-Order Interface Propagating over the Ferromagnetic Ground State in the Transverse Field Ising Chain [0.0] 横磁場イジング鎖の強磁性相における秩序パラメータと絡み合いの時間的変化を考察する。
本研究では,命令パラメータがゼロでない値に到達した乱数順序インタフェースについて,基底状態と異なる点に着目する。
我々は、サブシステムのR'enyiエンタングルメント対称性を解析し、フォン・ノイマン極限でも保持されると予想される予測を得る。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:17:21 GMT)
Digital Transformation in the Water Distribution System based on the Digital Twins Concept [0.0] 本稿では,配水システムのための最新のDTプラットフォームの開発について述べる。
モノのインターネット、人工知能、機械学習モデルといった高度な技術を導入している。
この観点では、システムは意思決定能力、運用効率、システムの信頼性の向上に寄与する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:40:37 GMT)
Diagnosis and Severity Assessment of Ulcerative Colitis using Self Supervised Learning [0.0] 潰瘍性大腸炎(Ulcerative Colitis, UC)は、大腸と直腸の潰瘍を引き起こす炎症性腸疾患である。
AIベースのUC診断の以前の研究は、CNNをトレーニングするために大きな注釈付きデータセットを必要とする教師付き学習アプローチに依存していた。
本研究は,無注釈データセットを効果的に学習し,大腸内視鏡を解析し,UCとその重症度を診断する自己教師付き学習フレームワークを採用する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:51:06 GMT)
Determining Absolute Neutrino Mass using Quantum Technologies [0.0] 絶対ニュートリノ質量を決定するための次世代のトリチウム崩壊実験は、$beta$-decay電子エネルギーの高精度な測定を必要とする。
量子制限型マイクロ波増幅器は正確なサイクロトロン周波数測定を可能にする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:41:30 GMT)
Detecting Dark Patterns in User Interfaces Using Logistic Regression and Bag-of-Words Representation [0.0] ユーザインタフェースのダークパターンは、ユーザの振る舞いを操作しようとする偽造デザインのプラクティスを表す。
本稿では,ロジスティック回帰とバッグ・オブ・ワード表現を用いたユーザインタフェースの暗黒パターン検出手法を提案する。
実験により,暗黒パターンの事例を正確に同定する手法の有効性が示された。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:29:46 GMT)
Deep-Learning Based Docking Methods: Fair Comparisons to Conventional Docking Workflows [0.0] 従来のドッキング手法に対して,Surflex-Dock法を用いた完全自動ワークフローを用いて公正なベースラインを生成する。
Angstroms RMSDのSurflex-Dock成功率はDiffDockよりもはるかに高かった。
DiffDockは、近隣の訓練を受けていない患者と比較して、近隣の患者に対して40パーセントの差を示した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:37:17 GMT)
Critical Properties of Weak Measurement Induced Phase Transitions in Random Quantum Circuits [0.0] 各種の弱い測定形態が測定誘起相転移の性質に及ぼす影響について検討した。
普遍臨界特性は弱い測度プロトコルの影響を受けず、強い射影測度で見られる普遍性クラスと一致している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:07:58 GMT)
Covariant quantum field theory of tachyons is unphysical [0.0] タキオンはその特異な振る舞いのために代々の物理学者を魅了してきたが、実際の物理的問題は解決しなかった。
ドラガンらの最近の研究により、超光度観測者は量子力学の基礎と関係があることが示されている。
このプログラムの一部として提案されたタキオン量子場理論は量子ではないことを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 03:37:26 GMT)
Correlations in Circular Quantum Cascades [0.0] 一方向の1量子カスケードを導入し、一つの励起がエネルギーレベルのはしごで一方向に進行する。
このような円カスケード内の遷移間の2光子相関関数に対する閉形式解を提供する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:52:57 GMT)
Classifying Logical Gates in Quantum Codes via Cohomology Operations and Symmetry [0.0] 量子符号のための定数深さ回路によって実装されたフォールトトレラント論理ゲートを構築し,分類する。
LDPC符号のアドレナブルかつ並列化可能な論理ゲートを高次対称性を用いて形式化する。
副産物として、高いポントリャーギン力を用いた有限高次対称性の新しいトポロジカル反応を求める。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 00:25:03 GMT)
Chatbots im Schulunterricht: Wir testen das Fobizz-Tool zur automatischen Bewertung von Hausaufgaben [0.0] 本研究では,ドイツのFobizz社によるAIによるグレーディングツール"AI Grading Assistant"について検討した。
ツールの数値グレードと定性的フィードバックは、しばしばランダムであり、提案が組み込まれても改善されない。
この研究は、教育における体系的な問題に対する迅速な修正としてAIを採用するというより広い傾向を批判している。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 16:50:02 GMT)
Charge and Flux Noise from Nonequilibrium Quasiparticle Energy Distributions in Superconducting Qubits and Resonators [0.0] ジョセフソン接合を横切る過剰な準粒子のトンネルは超伝導量子ビットにおける主要な損失とデコヒーレンス機構の1つとして認識されている。
非平衡準粒子密度から生じる損失機構を新たに提案する: 接合部から超伝導線上に存在する準粒子によるオーミック損失。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:41:50 GMT)
Cavity-modified quantum electron transport in multi-terminal devices and interferometers [0.0] 我々は,多端子量子ホールバー,量子点接触,アハロノフ・ボーム干渉計における共振器を介する電子ホッピングの影響を理論的に検討した。
本研究は,空洞経由のエッジ散乱が有限サイズ系における量子磁気輸送に与える影響を明らかにする。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:07:20 GMT)
Augmenting the action space with conventions to improve multi-agent cooperation in Hanabi [0.0] カードゲーム「はなび」は、マルチエージェント強化学習アルゴリズムのテストと開発のための強力な媒体であると考えられている。
従来,ハナビにおけるMARLアルゴリズムの能力について検討されてきた。
本稿では,特別な協調行動として機能するコンベンションを用いて,行動空間を拡大するための新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 09:34:40 GMT)
Aspects of Quantum Energy Teleportation [0.0] 量子エネルギーテレポーテーション(QET)プロトコルを探索し、有限温度および励起状態における量子エネルギーの挙動に着目した。
熱状態におけるQETの資源としての絡み合いの役割を解析し,様々な初期状態におけるQETの性能を比較した。
次に、量子計測、局所演算、古典通信(LOCC)のみを利用するプロトコルを用いて、基底状態エネルギーを抽出する手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 22:51:41 GMT)
Applying Machine Learning Tools for Urban Resilience Against Floods [0.0] 洪水は最も一般的で破壊的な自然災害の1つであり、都市部で深刻な社会的・経済的影響をもたらす。
本稿では,テヘランの第6地区において,最も効果的な洪水抵抗モデルについて検討する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:56:33 GMT)
Applications of Positive Unlabeled (PU) and Negative Unlabeled (NU) Learning in Cybersecurity [0.0] 本稿では,サイバーセキュリティ分野におけるPositive Unlabeled (PU) Learning and Negative Unlabeled (NU) Learningの比較的過小評価された応用について検討する。
本稿は、侵入検知、脆弱性管理、マルウェア検出、脅威知能など、サイバーセキュリティの重要な領域を特定し、PU/NU学習は大幅な改善をもたらす。
我々は、サイバーセキュリティにおけるPU/NU学習の統合を推進し、新興のサイバー脅威を検出し、管理し、軽減するソリューションを提供する将来の方向性を提案する。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 04:55:10 GMT)
Anchoring Bias in Large Language Models: An Experimental Study [0.0] GPT-4やGeminiのような大規模言語モデル(LLM)は、非常に高度な人工知能を持っている。
この研究は、初期情報が判断に不均衡に影響を及ぼす認知バイアスであるアンカーリングバイアスを論じる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 15:45:03 GMT)
Advancing clinical trial outcomes using deep learning and predictive modelling: bridging precision medicine and patient-centered care [0.0] 深層学習と予測モデリングは、臨床試験設計、患者採用、リアルタイムモニタリングを最適化するための変換ツールとして登場した。
本研究では、畳み込みニューラルネットワーク(CNN)やトランスフォーマーモデルなどの深層学習技術の患者層化への応用について検討する。
生存分析や時系列予測を含む予測モデリング手法は、試行結果の予測、効率の向上、試行失敗率の低減に用いられている。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 23:20:08 GMT)
ARChef: An iOS-Based Augmented Reality Cooking Assistant Powered by Multimodal Gemini LLM [0.0] 本稿では,ARとコンピュータビジョン(CV)を調理プロセスに統合したiOSアプリケーションのプロトタイプを提案する。
われわれはGoogleのジェミニ大言語モデル(LLM)を利用して、カメラの視覚領域の成分を特定し、栄養情報でレシピの選択を生成する。
ユーザーは食事の好みを入力し、各食事の格付けをすることで、食事の提案をパーソナライズすることができる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:27:07 GMT)
A philosophical and ontological perspective on Artificial General Intelligence and the Metaverse [0.0] 本稿では,AGIの概念,人間の意識との関係,そして,この関係を促進する上でのメタバースの重要な役割について考察する。
例えば、認知の具体化、マイケル・レヴィンの計算境界の「自己」、ドナルド・D・ホフマンの知覚のインターフェイス理論、ベルナルド・カストロップの分析的理想主義などである。
この論文は、安定なAGIの出現の鍵となる前提条件として、人間関係において一定の調和を達成することの重要性を強調し、人類の相互接続性を世界レベルで認識することを強調した。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 12:40:08 GMT)
A generic multi-Pauli compilation framework for limited connectivity [0.0] 本稿では,パウリのネットワーク合成技術の多くを拡張した汎用コンパイルフレームワークを提案する。
導入したClifford Executive Representationに基づいて構築されたコンパイル手法は,複数のPauli演算子の実装を同時に検討することで際立っている。
提案手法は変分量子固有解法から得られた回路に対してベンチマークを行い,提案手法が最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 19:01:29 GMT)
A Real-Time Defense Against Object Vanishing Adversarial Patch Attacks for Object Detection in Autonomous Vehicles [0.0] ADAV (Adversarial Defense for autonomous Vehicles) は、物体の消滅するパッチ攻撃に対する新しい防御手法である。
ADAVはリアルタイムで動作し、AVのビデオフィードの以前のフレームからコンテキスト情報を活用する。
ADAVは、Berkeley Deep Drive BDD100Kデータセットの実際の運転データを用いて評価される。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 05:21:14 GMT)
A Practical Exercise in Adapting SIFT Using FHE Primitives [0.0] CKKS完全同型暗号を用いたスケール不変特徴変換の実装における課題は、現在のFHEパラダイムにおけるいくつかのグラリング制限を明らかにしている。
これらの制限には、標準比較演算子がないことと、それに依存する特定の操作が含まれる。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 08:52:57 GMT)
A Fast and Stable Marginal-Likelihood Calibration Method with Application to Quantum Characterization [0.0] 我々はケネディ・オハガン(KOH)ベイズ的枠組みに統合された限界的可能性戦略を提案する。
提案手法は,大規模データセットにおいても,計算効率が高く,数値的に安定である。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 17:08:50 GMT)
3D Graph Attention Networks for High Fidelity Pediatric Glioma Segmentation [0.0] 本研究は,小児グリオーマの自動セグメンテーションに適した空間的注意機構を備えた新しい3次元UNetアーキテクチャを提案する。
マルチパラメトリックMRIデータを用いたBraTS小児グリオーマデータセットを用いて、提案モデルはマルチスケールの特徴を捉え、腫瘍関連領域に選択的に参画する。
モデルの性能をDice類似度係数とHD95を用いて定量的に評価し, 複雑なグリオーマの構造が向上したことを示す。
論文参考訳(メタデータ) (Mon, 09 Dec 2024 18:36:36 GMT)