LoRA of Change: Learning to Generate LoRA for the Editing Instruction from A Single Before-After Image Pair [116.5] 視覚的指示を用いた画像編集のためのLoRA of Change (LoC) フレームワークを提案する。
我々は、命令固有のLoRAを学習し、事前のイメージペアで「変更」を符号化し、モデルの解釈可能性と再利用性を高める。
本モデルでは,ユーザ意図に整合した高品質な画像を生成し,現実世界の視覚的指示の幅広い範囲をサポートする。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:55:06 GMT)
Instruction Pre-Training: Language Models are Supervised Multitask Learners [116.0] 本稿では,事前学習言語モデル(LM)に対して,命令応答対を用いた大規模生コーパスを付加するフレームワークを提案する。
実験では,40以上のタスクカテゴリをカバーする2億の命令応答ペアを合成し,インストラクション事前学習の有効性を検証する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:51:20 GMT)
ObjectRelator: Enabling Cross-View Object Relation Understanding in Ego-Centric and Exo-Centric Videos [105.4] Ego-Exoオブジェクト対応タスクは、オブジェクトをエゴ中心およびエゴ中心のビューにマップすることを目的としている。
我々は,この課題に対処するための新しい手法であるObjectRelatorを紹介する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:01:03 GMT)
Exploring Visual Vulnerabilities via Multi-Loss Adversarial Search for Jailbreaking Vision-Language Models [92.8] VLM(Vision-Language Models)は、安全アライメントの問題に対して脆弱である。
本稿では、シナリオ認識画像生成を利用したセマンティックアライメントのための新しいジェイルブレイクフレームワークであるMLAIを紹介する。
大規模な実験はMLAIの重大な影響を示し、MiniGPT-4で77.75%、LLaVA-2で82.80%の攻撃成功率を達成した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:19:55 GMT)
GenView: Enhancing View Quality with Pretrained Generative Model for Self-Supervised Learning [90.1] GenViewは、ポジティブなビューの多様性を強化するコントロール可能なフレームワークである。
我々は、正のペアの品質を評価する品質駆動のコントラスト損失を導入する。
肯定的なビュー品質の改善と品質主導のコントラスト損失のおかげで、GenViewは自己教師型学習を大幅に改善した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 07:33:16 GMT)
Identifiable Latent Polynomial Causal Models Through the Lens of Change [82.1] 因果表現学習は、観測された低レベルデータから潜在的な高レベル因果表現を明らかにすることを目的としている。
主な課題の1つは、識別可能性(identifiability)として知られるこれらの潜伏因果モデルを特定する信頼性の高い保証を提供することである。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 21:55:33 GMT)
AgentGen: Enhancing Planning Abilities for Large Language Model based Agent via Environment and Task Generation [81.3] 大規模言語モデルに基づくエージェントが注目され、ますます人気が高まっている。
計画能力は LLM ベースのエージェントの重要な構成要素であり、通常は初期状態から望ましい目標を達成する必要がある。
近年の研究では、専門家レベルの軌跡を指導訓練用LLMに活用することで、効果的に計画能力を向上させることが示されている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:19:29 GMT)
Safe + Safe = Unsafe? Exploring How Safe Images Can Be Exploited to Jailbreak Large Vision-Language Models [80.8] Safety Snowball Agent (SSA) は、エージェントの自律的およびツール使用能力をジェイルブレイクLVLMに活用する新しいエージェントベースのフレームワークである。
我々の実験では、ほぼすべての画像を用いてLVLMを誘導し、安全でないコンテンツを生成し、最新のLVLMに対して高いジェイルブレイク率を達成できることを示した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:07:46 GMT)
Sparse Attention Vectors: Generative Multimodal Model Features Are Discriminative Vision-Language Classifiers [79.5] 生成型大規模マルチモーダルモデル(LMM)は、画像キャプションや視覚的質問応答など、様々な視覚言語(VL)タスクに優れる。
本稿では,LMMを識別タスクに効果的に活用する手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:55:41 GMT)
WorldCuisines: A Massive-Scale Benchmark for Multilingual and Multicultural Visual Question Answering on Global Cuisines [74.3] 視覚言語モデル(VLM)は、特に英語以外の言語において、文化特有の知識に苦しむことが多い。
我々は多言語および多文化の視覚的理解のための大規模ベンチマークであるWorld Cuisinesを紹介した。
このベンチマークには、30の言語と方言にまたがるテキストイメージペアを備えた、視覚的質問応答(VQA)データセットが含まれている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 22:47:21 GMT)
DGE: Direct Gaussian 3D Editing by Consistent Multi-view Editing [72.5] オープンな言語命令に基づいて3Dオブジェクトやシーンを編集する際の問題点を考察する。
この問題に対する一般的なアプローチは、3D編集プロセスをガイドするために2Dイメージジェネレータまたはエディタを使用することである。
このプロセスは、コストのかかる3D表現の反復的な更新を必要とするため、しばしば非効率である。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:00:31 GMT)
Advancing Generalization in PINNs through Latent-Space Representations [71.9] 物理インフォームドニューラルネットワーク(PINN)は、偏微分方程式(PDE)によって支配される力学系のモデリングにおいて大きな進歩を遂げた。
本稿では,多種多様なPDE構成を効果的に一般化する物理インフォームドニューラルPDE解法PIDOを提案する。
PIDOは1次元合成方程式と2次元ナビエ・ストークス方程式を含む様々なベンチマークで検証する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:16:20 GMT)
A Survey on Vision-Language-Action Models for Embodied AI [71.2] 視覚言語アクションモデル(VLA)はロボット学習の基盤となっている。
汎用性、デキスタリティ、一般化可能性など、様々な手法が提案されている。
VLAは、長い水平タスクを実行可能なサブタスクに分解できるハイレベルなタスクプランナとして機能する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 09:18:10 GMT)
DeepInception: Hypnotize Large Language Model to Be Jailbreaker [70.3] 大規模言語モデル(LLM)は様々な用途で大きく成功しているが、相変わらず敵のジェイルブレイクの影響を受けやすい。
LLMのパーソナライズ機能を活用して$textita仮想ネストシーンを構築する手法を提案する。
経験的に,本手法によって引き起こされた内容は,従来と異なる有害度率を達成することができる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:43:50 GMT)
Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.9] 顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:04:45 GMT)
Video Set Distillation: Information Diversification and Temporal Densification [68.9] Video textbfsetsは2次元の冗長性を持つ: サンプル内およびサンプル間冗長性。
我々は,まず,サンプル内およびサンプル間冗長性に対処して,最適化された映像データを合成するビデオセット蒸留について検討する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:37:54 GMT)
Way to Specialist: Closing Loop Between Specialized LLM and Evolving Domain Knowledge Graph [67.0] Way-to-Specialist(WTS)フレームワークは、知識グラフによる検索拡張生成を相乗化する。
LLM$circlearrowright$KG"パラダイムは、特殊LLMとドメイン知識グラフの双方向化を実現する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 11:24:43 GMT)
Shortcuts Everywhere and Nowhere: Exploring Multi-Trigger Backdoor Attacks [64.7] ディープニューラルネットワーク(DNN)の事前トレーニングとデプロイに対して、バックドア攻撃は重大な脅威となっている。
本研究では,マルチトリガーバックドア攻撃(MTBA)の概念について検討し,複数の敵が異なる種類のトリガーを利用して同一のデータセットを毒する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:28:22 GMT)
SVP: Style-Enhanced Vivid Portrait Talking Head Diffusion Model [64.3] トーキングヘッドジェネレーション(THG)は、デジタル人間、映画制作、バーチャルリアリティーなど様々な分野の幅広い応用分野において重要な課題である。
本稿では,THGのスタイル関連情報をフル活用したSVP(Style-Enhanced Vivid Portrait)を提案する。
我々のモデルは、本質的なスタイルを柔軟に制御できる多様な、鮮明で高品質なビデオを生成し、既存の最先端の手法より優れています。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 09:53:01 GMT)
GRAPE: Generalizing Robot Policy via Preference Alignment [60.4] GRAPE: 優先度アライメントによるロボット政策の一般化について述べる。
GRAPEはドメイン内および未確認操作タスクにおいて,それぞれ51.79%,60.36%の増加率を示した。
GRAPEは、安全性と効率、衝突速度を44.31%、ロールアウト期間を11.15%削減するなど、様々な目的に合わせることができる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:30:10 GMT)
Large language models surpass human experts in predicting neuroscience results [60.3] 大きな言語モデル(LLM)は、人間の専門家よりも新しい結果を予測する。
BrainBenchは神経科学の結果を予測するためのベンチマークだ。
我々のアプローチは神経科学に特有ではなく、他の知識集約的な取り組みに伝達可能である。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:49:00 GMT)
Counting Stacked Objects from Multi-View Images [57.7] 本稿では,タスクを2つの相補的なサブプロブレムに分解する新しい3Dカウント手法を提案する。
幾何学的再構成と深層学習に基づく深度解析を組み合わせることで,コンテナ内の同一物体を正確にカウントすることができる。
多様な実世界および大規模合成データセット上での3Dカウントパイプラインの検証を行う。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:51:16 GMT)
Taming Rectified Flow for Inversion and Editing [57.4] FLUXやOpenSoraのような定流拡散変換器は、画像生成やビデオ生成の分野で優れた性能を発揮している。
その堅牢な生成能力にもかかわらず、これらのモデルは不正確さに悩まされることが多い。
本研究では,修正流の逆流過程における誤差を軽減し,インバージョン精度を効果的に向上する訓練自由サンプリング器RF-rを提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:39:13 GMT)
Were RNNs All We Needed? [55.8] 本研究では、リカレントニューラルネットワーク(RNN)に着目し、歴史的観点からのシーケンスモデリングを再考する。
これらのモデルを簡単にすることで、従来のモデルよりも少ないパラメータを使用する最小バージョン(minLSTMとminGRU)を導出でき、トレーニング中に完全に並列化可能であり、トランスフォーマーを含む最近のモデルに対抗して、様々なタスクにおいて驚くほど競争力のあるパフォーマンスを達成することができることを実証した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 07:10:33 GMT)
Timestep Embedding Tells: It's Time to Cache for Video Diffusion Model [55.6] Timestep Embedding Aware Cache (TeaCache)は、タイムステップ間のモデルアウトプットの変動を推定し、活用する、トレーニング不要なキャッシュアプローチである。
TeaCacheはOpen-Sora-Plan上で最大4.41倍の高速化を実現している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:50:05 GMT)
Challenges in Human-Agent Communication [55.5] これらのシステムがもたらす12の重要なコミュニケーション課題を特定し分析する。
これには、エージェントからユーザへの情報伝達の課題、ユーザからエージェントへの情報伝達の課題、すべての人間とエージェントのコミュニケーションで考慮すべき課題の概略が含まれる。
私たちの発見は、これらのシステムの透明性と制御を支援するために、新しいデザインパターン、原則、ガイドラインを緊急に呼び出すのに役立ちます。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 01:21:26 GMT)
How far can bias go? -- Tracing bias from pretraining data to alignment [54.5] 本研究では, 事前学習データにおける性別占有バイアスと, LLMにおける性別占有バイアスの相関について検討した。
その結果,事前学習データに存在するバイアスがモデル出力に増幅されることが判明した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:20:25 GMT)
EARBench: Towards Evaluating Physical Risk Awareness for Task Planning of Foundation Model-based Embodied AI Agents [53.7] EAI(Embodied AI)は、高度なAIモデルを現実世界のインタラクションのための物理的なエンティティに統合する。
高レベルのタスク計画のためのEAIエージェントの"脳"としてのファンデーションモデルは、有望な結果を示している。
しかし、これらのエージェントの物理的環境への展開は、重大な安全性上の課題を呈している。
本研究では,EAIシナリオにおける身体的リスクの自動評価のための新しいフレームワークEARBenchを紹介する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:28:02 GMT)
Provably Reliable Conformal Prediction Sets in the Presence of Data Poisoning [53.4] コンフォーマル予測は、モデルに依存しない、分布のない不確実性定量化を提供する。
しかし、敵が訓練データと校正データを操作した場合の毒殺攻撃では、共形予測は信頼性が低い。
信頼性予測セット (RPS): 汚染下での信頼性保証を証明可能な共形予測セットを構築するための最初の効率的な方法を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:55:54 GMT)
Devising a Set of Compact and Explainable Spoken Language Feature for Screening Alzheimer's Disease [52.5] アルツハイマー病(AD)は高齢化社会において最も重要な健康問題の一つとなっている。
我々は,大言語モデル(LLM)とTF-IDFモデルの視覚的機能を活用する,説明可能な効果的な機能セットを考案した。
当社の新機能は、自動ADスクリーニングの解釈可能性を高めるステップバイステップで説明し、解釈することができる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:23:22 GMT)
Parameter-Efficient Transfer Learning for Music Foundation Models [51.6] 音楽基礎モデルのパラメータ効率変換学習(PETL)について検討する。
PETL法は、音楽の自動タグ付けにおいて、探索と微調整の両方に優れる。
PETL法は、トレーニングコストを大幅に削減し、微調整と同様の結果を得る。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 20:50:40 GMT)
SuperGaussians: Enhancing Gaussian Splatting Using Primitives with Spatially Varying Colors [51.5] 空間的に異なる色と不透明度を1つのガウスプリミティブに利用して表現能力を向上するSuperGaussianと呼ばれる新しい手法を提案する。
我々は、空間的に異なる機能として、バイリニア、可動カーネル、さらには小さなニューラルネットワークを実装した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 07:36:22 GMT)
Can Encrypted Images Still Train Neural Networks? Investigating Image Information and Random Vortex Transformation [51.5] 画像変換時の情報内容の変化を評価するために,画像情報量を測定する新しい枠組みを構築した。
また,Random Vortex Transformationと呼ばれる新しい画像暗号化アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 09:35:08 GMT)
View-Consistent 3D Editing with Gaussian Splatting [50.6] View-Consistent Editing (VcEdit)は、3DGSをシームレスに画像編集プロセスに組み込む新しいフレームワークである。
一貫性モジュールを反復パターンに組み込むことで、VcEditはマルチビューの不整合の問題を十分に解決する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:23:52 GMT)
SPAgent: Adaptive Task Decomposition and Model Selection for General Video Generation and Editing [50.1] セマンティック・プランニング・エージェント(SPAgent)を利用した新しい映像生成・編集システムを提案する。
SPAgentは、多様なユーザ意図と既存の生成モデルの有効利用の間のギャップを埋める。
実験結果は、SPAgentが効果的にモデルをコーディネートしてビデオの生成や編集を行うことを示した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:07:32 GMT)
Gaussians-to-Life: Text-Driven Animation of 3D Gaussian Splatting Scenes [49.3] ガウススティング表現における高品質な3Dシーンの一部をアニメーションする手法を提案する。
従来の作業とは対照的に、複雑な既存の3Dシーンのリアルなアニメーションを可能にする。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:01:58 GMT)
Open-Sora Plan: Open-Source Large Video Generation Model [48.5] Open-Sora Planは,さまざまなユーザ入力に基づいて,望まれる高解像度ビデオを生成するための,大規模な生成モデルの提供を目的としたオープンソースプロジェクトである。
本プロジェクトは,Wavelet-Flow Variational Autoencoder,Joint Image-Video Skiparse Denoiser,各種コンディションコントローラなど,ビデオ生成プロセス全体のコンポーネントで構成されている。
我々のOpen-Sora Planは、効率的な思考から恩恵を受け、質的および定量的な評価において、印象的なビデオ生成結果を達成する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:07:45 GMT)
Headache to Overstock? Promoting Long-tail Items through Debiased Product Bundling [47.6] 本稿では,ユーザフィードバック機能による人気バイアスに対処するため,DieT(Distilled Modality-Oriented Knowledge Transfer)フレームワークを提案する。
2つの実世界のデータセットに対する大規模な実験は、長い尾のバンドルシナリオにおけるSOTAメソッドのリストよりもDieTの方が優れていることを示した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:44:56 GMT)
Paralinguistics-Aware Speech-Empowered Large Language Models for Natural Conversation [46.9] 本稿では,広範な音声テキストLLMフレームワークである統一音声対話モデル(USDM)を紹介する。
USDMは、与えられた入力音声に関連する自然な韻律的特徴を持つコヒーレントな音声応答を生成するように設計されている。
提案手法は,従来のベースラインとカスケードベースラインを超越した自然な音声応答を効果的に生成する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 01:10:49 GMT)
UrbanCAD: Towards Highly Controllable and Photorealistic 3D Vehicles for Urban Scene Simulation [46.5] 自律走行シミュレーションとデータ拡張には,高可制御性光現実性3次元車両モデルが不可欠である。
都市画像から高度に制御可能で光リアルな3D車両のデジタルツインを生成するフレームワークであるUrbanCADを紹介する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:51:08 GMT)
Connecting classical finite exchangeability to quantum theory [45.8] 交換性は確率論と統計学の基本的な概念である。
観測順序が重要でない状況のモデル化を可能にする。
両定理が有限交換可能な列に対して成り立たないことはよく知られている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 11:08:20 GMT)
Number it: Temporal Grounding Videos like Flipping Manga [45.5] Number-Prompt (NumPro) は、Vid-LLMに時間的接地による視覚的理解をブリッジする手法である。
NumProは動画をフレーム画像のシーケンスとして扱い、VTGを直感的なプロセスに変換します。
実験により、NumProは計算コストを伴わずに最上位のVid-LLMのVTG性能を大幅に向上することが示された。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:57:24 GMT)
Pilot Contamination Aware Transformer for Downlink Power Control in Cell-Free Massive MIMO Networks [45.5] 本稿では,パイロット汚染対応電源制御(PAPC)トランスニューラルネットワークを提案する。
PAPCはパイロットアロケーションデータをネットワークに統合し、パイロット汚染シナリオを効果的に処理する。
PAPCは教師なし学習フレームワークで訓練され、加速近位勾配(APG)アルゴリズムに対して評価される。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 09:48:52 GMT)
ICLERB: In-Context Learning Embedding and Reranker Benchmark [45.4] In-Context Learning (ICL)により、大規模言語モデルでは、関連する情報でプロンプトを条件付けすることで、新しいタスクを実行できる。
従来の検索手法は意味的関連性を重視し,検索を探索問題として扱う。
ICLタスクの効用を最大化する文書を選択することを目的としたレコメンデーション問題として、ICLのリフレーミング検索を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:28:45 GMT)
Extending choice assessments to choice functions: An algorithm for computing the natural extension [45.2] 選択関数の枠組みを用いて、選択前の選択から新しい選択を推測する方法を研究する。
特に、与えられた選択評価の自然(最も保守的な)拡張をコヒーレントな選択関数に定義する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:53:51 GMT)
Lost & Found: Updating Dynamic 3D Scene Graphs from Egocentric Observations [44.1] 静的なセマンティックマップは、環境と人間またはロボットエージェントの間の相互作用を捉えることができない。
我々はこの制限に対処するアプローチを提案する。エゴセントリックな記録のみに基づいて、動く物体の6DoFのポーズを追跡することができる。
提案手法は,移動マニピュレータの教示と繰り返しによる操作を可能とし,先行操作に関する情報によって移動マニピュレータがドローカに隠された物体を検索できることを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:05:07 GMT)
Talking to DINO: Bridging Self-Supervised Vision Backbones with Language for Open-Vocabulary Segmentation [43.7] 本稿では,DINOv2の空間的精度とCLIPの言語理解を組み合わせた,新しいハイブリッドアプローチであるTalk2DINOを提案する。
本研究では,Talk2DINOの強力なセマンティック・ローカライゼーション能力によってセグメンテーションのプロセスが強化されることを示す。
実験の結果、Talk2DINOは教師なしのOVSベンチマークで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:00:03 GMT)
Large Language Model-Brained GUI Agents: A Survey [42.8] マルチモーダルモデルはGUI自動化の新しい時代を支えてきた。
彼らは自然言語理解、コード生成、視覚処理において例外的な能力を示した。
これらのエージェントはパラダイムシフトを表しており、ユーザーは単純な会話コマンドで複雑なマルチステップタスクを実行できる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:40:09 GMT)
COMPrompter: reconceptualized segment anything model with multiprompt network for camouflaged object detection [42.2] カモフラーグ型物体検出(COD)のための新しいマルチプロンプトネットワークComprompterを提案する。
我々のネットワークはSAMにおける単一プロンプト戦略をマルチプロンプト戦略に拡張することを目的としている。
画像埋め込みから高周波特徴を抽出するために離散ウェーブレット変換を用いる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 01:58:28 GMT)
CoCoGesture: Toward Coherent Co-speech 3D Gesture Generation in the Wild [42.1] CoCoGestureは、目に見えない人間の音声プロンプトから鮮明で多様なジェスチャー合成を可能にする新しいフレームワークである。
私たちの重要な洞察は、カスタム設計のトレーニングパラダイムに基づいています。
提案するCoCoGesture は,ゼロショット音声・ジェスチャー生成における最先端手法よりも優れる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 07:33:45 GMT)
KANs for Computer Vision: An Experimental Study [41.9] 本稿では,コンピュータビジョンタスクに適用されたKAN(Kolmogorov-Arnold Networks)の実験的検討を行う。
Kansはエッジ上で学習可能なアクティベーション関数を導入し、フレキシブルな非線形変換を提供する。
kansは特定のビジョンタスクでうまく機能するが、それらは重大な課題に直面している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:00:33 GMT)
RED: Effective Trajectory Representation Learning with Comprehensive Information [41.6] トラジェクティブ表現学習(TRL)は、様々な下流タスクに使用できるベクトルにトラジェクトリをマッピングする。
本稿では,複数のトラジェクトリ情報を効果的に活用する自己教師型TRLフレームワークREDを提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:40:17 GMT)
Spiking GS: Towards High-Accuracy and Low-Cost Surface Reconstruction via Spiking Neuron-based Gaussian Splatting [41.3] 3Dガウシアン・スプレイティングは、数分で3Dシーンを再構築することができる。
表面再構成精度の進歩にもかかわらず、再建された結果は依然としてバイアスを示し、保存とトレーニングの非効率さに悩まされている。
本稿は,低効率部品の統合に起因する非効率性の原因と復元バイアスについて,異なる観察結果を提供する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 11:55:06 GMT)
MVFormer: Diversifying Feature Normalization and Token Mixing for Efficient Vision Transformers [41.2] マルチビュー正規化(MVN)と呼ばれる正規化モジュールと、マルチビュートークンミキサー(MVTM)と呼ばれるトークンミキサーを提案する。
MVNは、学習可能な重み付け和を使用して、バッチ、レイヤ、インスタンス正規化という3つの異なる正規化機能を統合する。
MVTMは、局所フィルタ、中間フィルタ、グローバルフィルタを備えた畳み込みベースのマルチスケールトークンミキサーである。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:49:11 GMT)
SemantiCodec: An Ultra Low Bitrate Semantic Audio Codec for General Sound [40.8] SemantiCodecは、様々なオーディオタイプで毎秒100トークン未満にオーディオを圧縮するように設計されている。
本稿では,セマンティコーデックが再現性に関する最先端の記述を著しく上回っていることを示す。
また,SemantiCodecは,評価されたすべての最先端オーディオコーデックよりもはるかにリッチな意味情報を含んでいることも示唆した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:31:04 GMT)
Bayesian Deconvolution of Astronomical Images with Diffusion Models: Quantifying Prior-Driven Features in Reconstructions [40.1] 天体画像のデコンボリューションは、天体の固有の性質を回復する鍵となる側面である。
本稿では,拡散モデル (DM) と拡散後サンプリング (DPS) アルゴリズムを用いた逆問題解法を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:00:00 GMT)
SADG: Segment Any Dynamic Gaussian Without Object Trackers [39.8] SADG(Segment Any Dynamic Gaussian Without Object Trackers)は、オブジェクトIDに依存しない動的ガウス分割表現と意味情報を組み合わせた新しいアプローチである。
我々は,Segment Anything Model(SAM)から生成されるマスクを活用し,ハードピクセルマイニングに基づく新しいコントラスト学習目標を活用することで,意味論的特徴を学習する。
提案したベンチマーク上でSADGを評価し,動的シーン内のオブジェクトのセグメンテーションにおけるアプローチの優れた性能を示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:47:48 GMT)
Revealing Key Details to See Differences: A Novel Prototypical Perspective for Skeleton-based Action Recognition [39.4] 骨格に基づく行動認識において、重要な課題は関節の類似した軌跡を持つ行動の区別である。
グラフ畳み込みネットワーク(GCN)ベースのモデルであるProtoGCNを導入する。
プロトタイプの再構築とは対照的に、ProtoGCNは類似したアクションの識別的表現を効果的に識別し、強化することができる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:18:31 GMT)
TAMT: Temporal-Aware Model Tuning for Cross-Domain Few-Shot Action Recognition [39.1] クロスドメイン行動認識(CDFSAR)は近年研究の関心を集めている。
本稿では,CDFSARのための簡易かつ効果的なベースラインであるTemporal-Aware Model Tuning (TAMT)を提案する。
我々のTAMTは、ソースデータと微調整対象データで事前トレーニングを行うことで、複数のターゲットデータに対する単一のソースによる再トレーニングを回避することで、デカップリングパラダイムを含む。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:38:05 GMT)
TimeGPT in Load Forecasting: A Large Time Series Model Perspective [38.9] 機械学習モデルは、負荷予測に大きな進歩を遂げているが、過去の負荷データが不足している場合に、その予測精度は制限されている。
本稿では,負荷予測における時系列モデルの可能性について考察する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:30:24 GMT)
Data Augmentation with Diffusion Models for Colon Polyp Localization on the Low Data Regime: How much real data is enough? [38.6] 局所化アノテーションと共同で大腸内視鏡画像を生成する様々な拡散モデルを訓練する実験を行った。
生成されたデータは、低データ状態のYOLO v9に基づくモデルを用いて、ポリプローカライゼーションのタスクにおいて、様々な転送学習実験で使用される。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:25:33 GMT)
A transfer learning framework for weak-to-strong generalization [38.6] LLMを超人的能力と整合させることが、その能力を劣化させることなく可能であるかどうかは不明である。
これは弱強一般化問題の例である。
我々は、事前学習されたLLMから潜在知識を引き出すことにより、弱強一般化が可能であることを証明した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:58:34 GMT)
Zero-Forget Preservation of Semantic Communication Alignment in Distributed AI Networks [38.5] セマンティック・コミュニケーションのアライメントを維持するため,ゼロ・オブジェクト・ドメイン適応フレームワークを提案する。
提案するフレームワークは,DA性能がほとんど失われることなく,SCアライメントを完全に維持する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 21:28:18 GMT)
MaskRIS: Semantic Distortion-aware Data Augmentation for Referring Image Segmentation [38.3] Referring Image Code (RIS)は、画像内のオブジェクトの識別とセグメンテーションを含む高度な視覚認識タスクである。
我々はMasked Referring Image Code (MaskRIS)と呼ばれる新しいトレーニングフレームワークを提案する。
MaskRISは画像とテキストのマスキングの両方を使用し、次にContextual Learningを使用してマスキング戦略の利点を完全に活用する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 11:27:56 GMT)
Event-based Tracking of Any Point with Motion-Robust Correlation Features [38.0] 任意の点の追跡(TAP)は、最近、局所的なテンプレートで個々の有意点に着目し、グローバルな画像コンテキストで任意の点を追跡するように、動き推定パラダイムをシフトした。
この研究は、最初のイベントカメラベースのTAP方式でこの問題に対処する。
これは、高時間分解能と高ダイナミックレンジのイベントカメラを活用して、堅牢な高速トラッキングと、非同期かつスパースなイベント計測を扱うTAPメソッドのグローバルコンテキストを利用する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:13:24 GMT)
Any-Resolution AI-Generated Image Detection by Spectral Learning [36.6] 我々は、実画像のスペクトル分布が、AI生成画像検出のための不変パターンと高識別パターンの両方を構成するというキーとなる考え方を構築した。
提案手法は, これまでの13の世代的アプローチと比較して, AUCの絶対的な改善を5.5%達成している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 23:55:19 GMT)
Joint RGB-Spectral Decomposition Model Guided Image Enhancement in Mobile Photography [36.4] 拡張を導いたRGBスペクトル分解モデルを提案する。
我々は,RGBと低分解能マルチスペクトル画像(Lr-MSI)のセナリティを活用し,シェーディング,反射率,物質意味の先行を予測した。
これらの事前情報は、ダイナミックレンジ拡張、カラーマッピング、グリッドエキスパート学習を促進するために、確立されたHDRNetにシームレスに統合される。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:34:08 GMT)
Diode effect in Fraunhofer patterns of disordered multi-terminal Josephson junctions [36.1] 広いジョセフソン接合のフラウンホーファーパターンにおける超伝導ダイオード効果の出現条件の生成における異なる空間的不均一性の役割について検討した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:20:27 GMT)
Video Depth without Video Models [34.1] ビデオ深度推定は、各フレームに濃密な深度を推定することにより、単眼のビデオクリップを3Dに引き上げる。
単一画像潜在拡散モデル(LDM)を最先端のビデオ深度推定器にする方法を示す。
このモデルはRollingDepthと呼ばれ、(i)シングルイメージのLCMから派生したマルチフレーム深度推定器と、非常に短いビデオスニペットを深度スニペットにマッピングする。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:50:14 GMT)
Pralekha: An Indic Document Alignment Evaluation Benchmark [34.1] 文書レベルのアライメント評価のための大規模ベンチマークであるPralekhaを紹介する。
Pralekhaには200万以上のドキュメントがあり、一致しないペアの1:2の割合で、11のインド語と英語をカバーしている。
文とチャンクレベルのアライメントを用いた文書のアライメントの課題に対処する文書アライメント係数を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:17:24 GMT)
On the effectiveness of discrete representations in sparse mixture of experts [33.8] VQMoE(Vector-Quantized Mixture of Experts)と呼ばれる新しいアーキテクチャを提案する。
VQMoEは計算コストを増大させることなく、モデルキャパシティをスケールアップするための効果的なソリューションである。
VQMoEは,他のSMoEルーティング方式と比較して,ルータの28%の改善を実現している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 22:32:01 GMT)
Sneaking Syntax into Transformer Language Models with Tree Regularization [33.7] 構文的帰納バイアスの導入は、トランスフォーマー言語モデルにおけるより堅牢でデータ効率のよい学習を解放する可能性がある。
このような構造を組み込む既存の方法は、モデルを大幅に制限する。
TreeRegは、逆NLIベンチマークのパフォーマンスを41.2ポイント削減する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 03:27:48 GMT)
Face2QR: A Unified Framework for Aesthetic, Face-Preserving, and Scannable QR Code Generation [33.6] Face2QRは、美学、顔のアイデンティティ、スキャナビリティをブレンドするパーソナライズされたQRコードを生成するための、新しいパイプラインである。
第一に、IDを精製したQR統合は、背景スタイリングと顔 IDをシームレスに連動させる。
第二に、IDを意識したQR ReShuffle(IDRS)は、顔IDとQRパターンの衝突を効果的に修正する。
第三に、ID保存Scannability Enhancement(IDSE)は遅延コードの最適化を通じてスキャニングを大幅に強化する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:35:16 GMT)
Extracting Training Data from Unconditional Diffusion Models [32.2] 拡散確率モデル(DPM)は、生成人工知能(GenAI)の主流モデルとして採用されている。
本研究では,非条件のDPMからトレーニングデータを抽出するために,生成したデータに対する時間依存型トレーニングデータ抽出(SIDE)を代理条件として活用する新しいデータ抽出手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:54:10 GMT)
Efficient Track Anything [32.0] Segment Anything Model 2 (SAM2)は、ビデオオブジェクトのセグメンテーションと追跡のための強力なツールとして登場した。
多段画像エンコーダとメモリモジュールの複雑さは、実世界のタスクにおける応用を制限している。
本稿では,低レイテンシとモデルサイズで高品質な結果をもたらすモデルを軽量に追跡する,効率的なTAMを提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:52:10 GMT)
Refine Large Language Model Fine-tuning via Instruction Vector [32.0] 微調整された大きな言語モデルは、一般的な能力を失う可能性がある。
本稿では,そのような忘れ物の背後にある本質的なメカニズムについて考察する。
我々は,原図の保存を目的としたIV誘導学習を開発し,破滅的な忘れを緩和する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:26:28 GMT)
NERsocial: Efficient Named Entity Recognition Dataset Construction for Human-Robot Interaction Utilizing RapidNER [31.3] RapidNERは、名前付きエンティティ認識システムの迅速なデプロイ用に設計されたフレームワークである。
一般的な知識グラフからドメイン固有のサブグラフとトリプルを抽出し、さまざまなソースからテキストを収集し、活用してNERsocialデータセットを構築する。
人間のアノテーションによって検証されたNERsocialには、6つのエンティティタイプ、153Kトークン、99.4K文が含まれており、データセット生成を高速化するRapidNERの機能を示している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 03:24:49 GMT)
Video-Guided Foley Sound Generation with Multimodal Controls [30.5] MultiFoleyは、ビデオ誘導音声生成用に設計されたモデルである。
テキスト、オーディオ、ビデオによるマルチモーダルコンディショニングをサポートする。
私たちのモデルの重要な新規性は、低音質のインターネットビデオデータセットを共同でトレーニングすることにあります。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:25:04 GMT)
Dockformer: A transformer-based molecular docking paradigm for large-scale virtual screening [29.9] ディープラーニングアルゴリズムは、ドッキングプロセスのスピードを高めるために、データ駆動リサーチと開発モデルを提供することができる。
本研究では,Dockformerという,ディープラーニングに基づくドッキング手法を紹介する。
実験の結果、DockformerはPDBbindコアセットとPoseBustersベンチマークで90.53%と82.71%の成功率を達成した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:46:01 GMT)
SOWing Information: Cultivating Contextual Coherence with MLLMs in Image Generation [29.5] 拡散生成モデルは、デノイング軌道に沿ったデータ空間におけるランダムウォークをシミュレートする。
これにより、情報は地域間で拡散し、結果をもたらす。
しかし、拡散モデルにおける情報拡散のカオス的・乱れた性質は、しばしば画像領域間の望ましくない干渉を引き起こし、劣化した詳細保存と文脈的矛盾を引き起こす。
画像全体を通して視覚的・意味的コヒーレンスを維持しつつ、画素レベルの条件忠実性を達成するために、乱れた拡散をテキストビジョン・画像生成(TV2I)タスクの強力なツールとして再定義する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:35:25 GMT)
SAMa: Material-aware 3D Selection and Segmentation [29.3] Select Any Materials (SAMa) は,様々な3次元表現のための素材選択手法である。
モデル間の整合性を利用して、3D一貫性のある中間物質相似表現を生成する。
提案手法は任意の3次元表現に作用し、選択精度と多視点整合性の観点から、いくつかの強いベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:59:02 GMT)
SceneTAP: Scene-Coherent Typographic Adversarial Planner against Vision-Language Models in Real-World Environments [29.1] 本稿では,先進的な視覚言語モデルに誤解をもたらすような,シーンコヒーレントな対角攻撃を生成するための最初のアプローチを提案する。
提案手法は,どのテキストを生成するか,どのテキストをシーンに配置するか,どのようにシームレスに統合するかという,3つの重要な問題に対処する。
実験の結果,我々のシーンコヒーレントな敵対的テキストは,最先端のLVLMを誤解させることに成功した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:55:13 GMT)
PP-SSL : Priority-Perception Self-Supervised Learning for Fine-Grained Recognition [28.9] 自己教師付き学習は、将来性のある結果とともに、きめ細かい視覚認識において出現している。
既存の自己教師型学習手法は、自己教師型タスクにおける無関係なパターンに影響を受けやすい。
本稿では,PP-SSL と表記される新しい優先度知覚自己監視学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:47:41 GMT)
RIGI: Rectifying Image-to-3D Generation Inconsistency via Uncertainty-aware Learning [27.5] マルチビュースナップショットの不整合は、しばしばオブジェクト境界に沿ってノイズやアーティファクトを導入し、3D再構成プロセスを損なう。
3次元ガウススプラッティング(3DGS)を3次元再構成に利用し,不確実性認識学習を再現プロセスに統合する。
適応的な画素単位の損失重み付けを適用してモデルを正規化し、不確実領域における再構成強度を低減させる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:19:28 GMT)
QuantAttack: Exploiting Dynamic Quantization to Attack Vision Transformers [27.4] 我々は、量子化されたモデルの可用性を目標とする、新しい攻撃であるQuantAttackを紹介する。
オペレーティングシステムのリソースを無駄にするために設計された、慎重に構築された敵の例は、最悪のパフォーマンスを引き起こす可能性があることを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:05:08 GMT)
CrossTracker: Robust Multi-modal 3D Multi-Object Tracking via Cross Correction [27.2] CrossTrackerは、オンラインマルチモーダル3DMOTのための新しい2段階パラダイムである。
われわれの実験は、CrossTrackerが18の競合相手よりも優れていることを実証している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 01:36:29 GMT)
Alleviating Distortion in Image Generation via Multi-Resolution Diffusion Models and Time-Dependent Layer Normalization [26.9] 本稿では,新しいマルチレゾリューションネットワークと時間依存層正規化を統合することで,拡散モデルの革新的拡張を提案する。
提案手法の有効性は,ImageNet 256 x 256で1.70,ImageNet 512 x 512で2.89の新しい最先端FIDスコアを設定することで,クラス条件のImageNet生成ベンチマークで実証される。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:35:23 GMT)
OMNI-DC: Highly Robust Depth Completion with Multiresolution Depth Integration [26.7] 深度完備化(DC)は、RGB画像から深度マップを推定し、スパース深度観測を行うことを目的としている。
既存のDCの手法は、新しいデータセットや未知のスパース深度パターンをうまく一般化する。
OMNI-DCは,様々なシナリオにまたがってよく一般化される,非常に堅牢なDCモデルである。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:20:04 GMT)
Length Desensitization in Direct Preference Optimization [26.7] DPOは冗長性に対して過度に最適化される傾向があり、パフォーマンスとユーザエクスペリエンスの両方に有害に影響を及ぼす可能性がある。
LD-DPO(LD-DPO)と呼ばれるDPOの時間依存性改善手法を提案する。
提案手法は,他の暗黙の選好から比較的重要でない明示的な長さ選好を分離することにより,DPOをデータ長に脱感化することを目的としている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:53:40 GMT)
Scalable Exploration via Ensemble++ [26.5] トンプソンサンプリングの実用的な近似であるアンサンブルサンプリングは広く採用されているが、しばしば性能劣化に悩まされている。
アーキテクチャとアルゴリズムの革新を通じてこれらの課題に対処する新しい方法であるEnsemble++を紹介します。
本研究では,Ensemble++が線形コンテキスト帯域における正確なトンプソンサンプリングの残差と一致し,拡張性のあるステップ毎の計算複雑性を維持していることを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:25:44 GMT)
Towards Million-Scale Adversarial Robustness Evaluation With Stronger Individual Attacks [26.4] 本稿では,ロジット空間ではなく,確率空間における対角的マージン・アタック(Probability Margin Attack, PMA)を提案する。
我々は、百万スケールのデータセットCC1Mを作成し、それを用いて、敵に訓練されたImageNetモデルの最初の百万スケールの対角ロバスト性評価を行う。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:21:07 GMT)
A Unified Platform for At-Home Post-Stroke Rehabilitation Enabled by Wearable Technologies and Artificial Intelligence [26.4] 我々は,ウェアラブルセンサ,環境モニタリング,大規模言語モデル(LLM)を活用した支援を統合するスマートホームプラットフォームを導入する。
LLMのエージェントであるAuto-Careは、健康リマインダーや環境調整などのリアルタイムな介入を提供し、ユーザの満足度を29%向上させる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 09:04:39 GMT)
Marconi: Prefix Caching for the Era of Hybrid LLMs [26.3] 本稿では,Hybrid LLMを用いた効率的なプレフィックスキャッシングをサポートする最初のシステムであるMarconiを紹介する。
多様なワークロードとハイブリッドモデルにまたがって、Marconiは最大34.4$times$高いトークンヒットレートを達成した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 21:10:20 GMT)
T2SG: Traffic Topology Scene Graph for Topology Reasoning in Autonomous Driving [26.0] 交通トポロジシーングラフ(Traffic Topology Scene Graph)は、路面を明示的にモデル化し、異なる路面信号で制御し、ガイドする統一されたシーングラフである。
T2SGの生成のために,新たに2つのレイヤが設計された新しいトポロジーシーングラフトランスフォーマーであるTopoFormerを提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 03:55:50 GMT)
Improving Batch Normalization with TTA for Robust Object Detection in Self-Driving [26.0] 本稿では、自律運転における物体検出のためのTTAによるバッチ正規化を改善するための2つの新しいロバスト手法を提案する。
本稿では,一般探索エントロピー最小化法(GSEM)に基づく学習可能なBN層を提案する。
本稿では,モデルが最適解を反復的に探索することを奨励する,セマンティック一貫性に基づく2段階適応戦略を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 01:59:34 GMT)
Exo2EgoDVC: Dense Video Captioning of Egocentric Procedural Activities Using Web Instructional Videos [25.9] 本稿では,高密度ビデオキャプションのクロスビュー知識伝達のための新しいベンチマークを提案する。
我々は、エゴセントリックな視点で見るWebインストラクショナルビデオのモデルを、エゴセントリックな視点に適応させる。
本実験は,視点変化問題と自己中心的な視点への知識伝達を克服する効果を検証した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:37:37 GMT)
Improving Multi-Subject Consistency in Open-Domain Image Generation with Isolation and Reposition Attention [25.7] トレーニングフリー拡散モデルは、オープンドメインシナリオ内で一貫した画像を生成する際、顕著な進歩を遂げた。
これらの手法の鍵となる考え方は、参照対象情報を注目層に組み込むことである。
既存の手法は、多くの主題を扱う際にも、依然として準最適性能が得られる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:50:30 GMT)
Detailed Object Description with Controllable Dimensions [25.3] 本研究では,オブジェクト記述におけるユーザ指定の詳細を強化するために,トレーニング不要なキャプションリファインメントパイプラインであるtextbf Dimension Tailorを提案する。
このパイプラインには、ディメンション抽出、消去、サプリメントという3つのステップが含まれており、記述を事前に定義されたディメンションに分解する。
制御可能なオブジェクト記述に対する次元タイラーの有効性を示すため,広範囲な実験を行った。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:42:14 GMT)
Z-STAR+: A Zero-shot Style Transfer Method via Adjusting Style Distribution [24.9] スタイル転送は重要な課題であり、主に適切なスタイル表現を特定することに焦点を当てている。
既存の手法とは対照的に,バニラ拡散モデルにおける潜在的特徴が自然的スタイルや内容分布を本質的に含んでいることが判明した。
提案手法では,コンテンツ参照とスタイル参照を遅延空間で表現するために,デュアル・デノナイズ・パスを採用し,その後,スタイル遅延符号を用いたコンテントイメージ・デノナイズ・プロセスの導出を行う。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:56:17 GMT)
PhysMotion: Physics-Grounded Dynamics From a Single Image [24.1] 本稿では、物理シミュレーションを利用した新しいフレームワークであるPhysMotionを紹介し、一つの画像と入力条件から生成された中間3次元表現をガイドする。
我々のアプローチは、従来のデータ駆動生成モデルの限界に対処し、より一貫した物理的に妥当な動きをもたらす。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:49:59 GMT)
DESIRE: Dynamic Knowledge Consolidation for Rehearsal-Free Continual Learning [23.9] 連続学習は、人間のような以前に学習された知識を保持する能力をモデルに装備することを目的としている。
既存の手法は通常、実験データが事前訓練されたモデルで使用されているという事実によって引き起こされる情報漏洩の問題を見落としている。
本稿では,ロラをベースとした新たなリハーサルフリー手法DESIREを提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:54:01 GMT)
Don't Command, Cultivate: An Exploratory Study of System-2 Alignment [23.6] o1システムカードは、o1モデルをOpenAIの中でもっとも堅牢なものとして識別する。
モデル安全性に及ぼすシステム2思考パターンの影響について検討する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 03:13:04 GMT)
Towards Data-centric Machine Learning on Directed Graphs: a Survey [23.5] 本稿では,有向グラフ学習研究のための新しい分類法を提案する。
我々はこれらの手法をデータ中心の観点から再検討し、データ表現の理解と改善に重点を置いている。
我々はこの分野における主要な機会と課題を特定し、有向グラフ学習における将来の研究と開発を導く洞察を提供する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:09:12 GMT)
DIESEL -- Dynamic Inference-Guidance via Evasion of Semantic Embeddings in LLMs [23.4] DIESELは軽量な推論技術であり、任意の自己回帰LDMにシームレスに統合することができる。
LLMの提案したトークンを、潜在空間における定義済みの負の概念と類似性に基づいて再分類することで、応答安全性を向上させる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:33:11 GMT)
Strategic Prompting for Conversational Tasks: A Comparative Analysis of Large Language Models Across Diverse Conversational Tasks [23.3] Llama, OPT, Falcon, Alpaca, MPTの5大言語モデルの性能と限界を評価する。
この研究は、予約、共感反応生成、メンタルヘルス、法的カウンセリング、説得、交渉など様々な会話的タスクを含む。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 01:04:40 GMT)
Robust 3D Shape Reconstruction in Zero-Shot from a Single Image in the Wild [22.8] 本研究では,3次元形状復元に特化して設計された分割と再構成を統合した統合回帰モデルを提案する。
また、オブジェクト、オクローダ、バックグラウンドの幅広いバリエーションをシミュレートするスケーラブルなデータ合成パイプラインも導入しています。
我々の合成データのトレーニングにより,提案モデルは実世界の画像に対して最先端のゼロショット結果が得られる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:53:55 GMT)
Differentially-Private Collaborative Online Personalized Mean Estimation [22.4] プライバシー制約下での協調的パーソナライズされた平均推定の問題を考える。
2つのプライバシ機構と2つのデータ分散推定方式を提案する。
コラボレーションが完全に局所的なアプローチよりも早く収束することを示します。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:21:53 GMT)
CLIP meets DINO for Tuning Zero-Shot Classifier using Unlabeled Image Collections [22.3] ラベル付き画像を用いたCLIPに基づく画像分類性能を向上させるためのラベルフリーなプロンプトチューニング手法を提案する。
私たちのフレームワークであるNoLA(No Labels Attached)は、11の多様な画像分類データセットに対して、最先端のLaFterよりも平均3.6%の絶対的な増加を実現しています。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:48:54 GMT)
Libra: Leveraging Temporal Images for Biomedical Radiology Analysis [21.8] 放射線医学報告生成(RRG)は、医用画像の徹底的な理解を必要とするため、難しい課題である。
時間画像を用いたCXRレポート生成に適した時間認識MLLMであるLibraを紹介する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 21:07:22 GMT)
Do Automatic Factuality Metrics Measure Factuality? A Critical Evaluation [21.7] 「本研究は、要約文の表面的属性が事実性を予測するのに十分であるかどうかを考察する。」
そして, 実測値が矛盾した要約の事実的訂正にどのように反応するかを評価し, 有意義な改善を示すものはごくわずかであることを確認した。
これらの知見に触発されて、生成した要約に無害な文を付加することにより、(最も)自動的事実性指標、すなわち、確実に事実性スコアをインフレーションすることができることを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:33:53 GMT)
MSEMG: Surface Electromyography Denoising with a Mamba-based Efficient Network [21.6] 表面筋電図(sEMG)記録は、監視された筋肉が心臓に閉じているときに心電図(ECG)信号によって汚染される。
我々は,Mamba State Space Modelと畳み込みニューラルネットワークを統合し,軽量なsEMG復調モデルとして機能する新しいシステムであるMSEMGを紹介する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 04:25:28 GMT)
Orthus: Autoregressive Interleaved Image-Text Generation with Modality-Specific Heads [21.6] 自動回帰変換(AR)変換器であるOrthusを導入し,テキストプロンプトによる画像生成に優れる。
Orthusは、ARモデリング原則の下で、個別のテキストトークンと連続したイメージ機能に同時に対処する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:00:38 GMT)
Random Sampling for Diffusion-based Adversarial Purification [21.4] Denoising Diffusion Probabilistic Models (DDPMs) は敵の浄化において大きな注目を集めている。
Denoising Diffusion Implicit Model (DDIM) の安定性にインスパイアされ、ランダムサンプリングと呼ばれる反対のサンプリングスキームを提案する。
簡単に言えば、各拡散過程中にランダムノイズ空間からランダムサンプリングがサンプリングされ、DDPMとDDIMサンプリングは隣接するまたは元のノイズ空間から継続的にサンプリングされる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 07:04:09 GMT)
Trajectory Attention for Fine-grained Video Motion Control [21.0] 本稿では,細粒度カメラモーション制御のための画素トラジェクトリに沿って注目を行う新しい手法であるトラジェクトリ・アテンションを紹介する。
また,本手法は,第1フレーム誘導映像編集など,他の動画モーションコントロールタスクにも適用可能であることを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:59:51 GMT)
On Evaluating The Performance of Watermarked Machine-Generated Texts Under Adversarial Attacks [21.0] まず、メインストリームのウォーターマーキングスキームと、機械生成テキストに対する削除攻撃を組み合わせます。
8つの透かし(5つのプレテキスト、3つのポストテキスト)と12のアタック(2つのプレテキスト、10のポストテキスト)を87のシナリオで評価した。
その結果、KGWとExponentialの透かしは高いテキスト品質と透かしの保持を提供するが、ほとんどの攻撃に対して脆弱であることが示唆された。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 11:28:39 GMT)
3D-WAG: Hierarchical Wavelet-Guided Autoregressive Generation for High-Fidelity 3D Shapes [20.7] 本研究では,非条件形状生成が可能な3次元暗黙距離場のためのARモデルである3D-WAGを紹介する。
3次元AR生成タスクを次のスケールの予測として再定義することにより、生成の計算コストを削減できる。
以上の結果から,3D-WAGはCoverageやMDといった重要な指標において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:33:01 GMT)
ScratchEval: Are GPT-4o Smarter than My Child? Evaluating Large Multimodal Models with Visual Programming Challenges [20.3] LMMの視覚的プログラミング推論能力を評価するための新しいベンチマークであるScratchEvalを提案する。
ScratchEvalは、子どものプログラミング教育で広く使われているブロックベースのビジュアルプログラミング言語である。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:51:45 GMT)
Representation Shattering in Transformers: A Synthetic Study with Knowledge Editing [20.3] 知識編集(KE)アルゴリズムは、モデルの重みを変更して、不正、時代遅れ、その他の望ましくない事実関連付けに対するターゲット更新を実行する。
近年の研究では、KEの適用がモデルの事実的リコール精度に悪影響を及ぼし、一般的な推論能力を低下させることが示されている。
我々は,KEが対象物以外の実体の表現に不注意に影響を与えていることを示し,対象物に関する未知の知識をモデルが推測できるような関連構造を歪めている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:10:47 GMT)
AGS-Mesh: Adaptive Gaussian Splatting and Meshing with Geometric Priors for Indoor Room Reconstruction Using Smartphones [19.4] 室内シーンの正確な3次元再構成のためのガウススメッティング法における接合面深度と正規化のアプローチを提案する。
我々のフィルタリング戦略と最適化設計は、メッシュ推定と新規ビュー合成の両方において大きな改善を示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:04:32 GMT)
Active Learning for Level Set Estimation Using Randomized Straddle Algorithms [19.0] 本稿では,関数が与えられたしきい値の上(または下)に値を取る入力点の集合を同定する新しい手法を提案する。
提案手法の信頼性パラメータは,反復数や候補点に依存しず,保守的でないという利点がある。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 00:33:04 GMT)
VL-Uncertainty: Detecting Hallucination in Large Vision-Language Model via Uncertainty Estimation [18.9] 本稿では,大規模な視覚言語モデルにおける幻覚を検出するための,最初の不確実性に基づくフレームワークであるVL-Uncertaintyを紹介する。
意味論的に等価だが摂動的プロンプト間の予測分散を分析して不確実性を測定する。
LVLMは信頼性が高く、意味論的に等価なクエリに対して一貫した応答を提供する。
しかし、不確実な場合には、目標LVLMの応答はよりランダムになる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:35:56 GMT)
Global Tensor Motion Planning [18.7] グローバルモーションプランニング(GTMP)は、サンプリングに基づく動作計画アルゴリズムである。
ランダムな多部グラフとして表現される新しい離散化構造を導入し,効率的なベクトル化サンプリング,衝突チェック,探索を可能にした。
ライダースキャンされた占有マップとMotionBenchMarkerデータセットの実験は、ベースラインに比べてバッチ計画におけるGTMPの計算効率を実証している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 22:07:46 GMT)
Wearable intelligent throat enables natural speech in stroke patients with dysarthria [18.4] ウェアラブル型サイレント音声システムは, 音声障害患者のコミュニケーション回復に有意な可能性を秘めている。
喉の筋肉振動と頸動脈パルス信号センサを統合したAI駆動型インテリジェント喉(IT)システムを提案する。
変形性脳症の脳卒中患者5名を対象に、ITのLLMエージェントはトークンエラーをインテリジェントに修正し、文レベルの感情的および論理的一貫性を充実させた。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:57:42 GMT)
USTCCTSU at SemEval-2024 Task 1: Reducing Anisotropy for Cross-lingual Semantic Textual Relatedness Task [17.9] 言語間セマンティックテキスト関連性タスクは,言語間コミュニケーションやテキスト理解における課題に対処する重要な研究課題である。
これは、機械翻訳、多言語情報検索、言語間テキスト理解といった下流タスクに不可欠な、異なる言語間のセマンティックな接続を確立するのに役立つ。
当社のアプローチでは、スペインで2位、インドネシアで3位、そしてトップ10の複数のエントリーが、コンペティションのトラックCで行われます。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:40:14 GMT)
Auto-Encoded Supervision for Perceptual Image Super-Resolution [17.7] この研究は知覚超解像(SR)における忠実度目標に取り組む
GANベースのSRフレームワークにおけるピクセルレベルの$L_textp$損失の欠点に対処する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 11:19:04 GMT)
BPQP: A Differentiable Convex Optimization Framework for Efficient End-to-End Learning [17.7] 本稿では、効率的なエンドツーエンド学習のための微分可能な凸最適化フレームワークBPQPを紹介する。
効率を向上させるため、単純化された2次プログラミング問題として後方パスを再構成する。
シミュレーションと実世界の両方のデータセットに対する大規模な実験は、BPQPが効率を大幅に向上することを示した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:31:15 GMT)
MiniKV: Pushing the Limits of LLM Inference via 2-Bit Layer-Discriminative KV Cache [17.6] Mini KVは、KVキャッシュサイズを大幅に削減しつつ、長時間のコンテキストタスクの精度を同時に保持するKVキャッシュ最適化手法である。
我々は,Mini KVが86%のKVキャッシュ圧縮比を実現し,98.5%以上の精度を回復し,最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:01:50 GMT)
InstanceGaussian: Appearance-Semantic Joint Gaussian Representation for 3D Instance-Level Perception [17.5] 3Dシーンの理解は、自動運転、ロボティクス、拡張現実の応用において重要な研究領域となっている。
本稿では,インスタンスを適応的に集約しながら外観や意味的特徴を共同学習する InstanceGaussian を提案する。
提案手法は,カテゴリーに依存しないオープンボキャブラリ3次元点分割における最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:08:36 GMT)
Unleashing the Power of Data Synthesis in Visual Localization [17.2] クェリ画像からカメラがポーズする手法は高速な推論のために注目されている。
我々は、ポーズ回帰の一般化を促進するために、データ合成の力を解き放つことを目的としている。
両腕共同訓練パイプラインを構築し, 対角分離器を用いて, 合成と現実のギャップを埋める。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:58:10 GMT)
AMO Sampler: Enhancing Text Rendering with Overshooting [17.1] 本稿では,テキストのレンダリング品質を大幅に向上させる,最小限の計算オーバーヘッドのトレーニング不要な手法を提案する。
AMOはSD3とFluxのテキストレンダリング精度を32.3%と35.9%改善した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 23:45:45 GMT)
Act Now: A Novel Online Forecasting Framework for Large-Scale Streaming Data [17.1] 既存のオンライン予測手法には次のような問題がある。
彼らはストリーミングデータの更新頻度を考慮していない。
情報漏洩の除去はコンセプトドリフトを悪化させる可能性がある。
既存のGPUデバイスは、大規模なストリーミングデータのオンライン学習をサポートできない。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 01:39:45 GMT)
Automatic Prompt Generation and Grounding Object Detection for Zero-Shot Image Anomaly Detection [17.1] マルチモーダル機械学習パイプラインを用いた産業画像の自動異常検出のためのゼロショットトレーニングフリーアプローチを提案する。
提案モデルにより, 工業生産環境における効率, スケーラブル, 客観的品質管理が可能となる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:42:32 GMT)
Comprehensive Performance Evaluation of YOLOv11, YOLOv10, YOLOv9, YOLOv8 and YOLOv5 on Object Detection of Power Equipment [17.0] YOLOv5, YOLOv8, YOLOv9, YOLOv10および最先端のYOLOv11法の性能評価を行った。
YOLOv11モデルは、電源機器の物体検出に信頼性が高く効果的なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:47:16 GMT)
Mitigating the Human-Robot Domain Discrepancy in Visual Pre-training for Robotic Manipulation [16.8] そこで本研究では,容易に利用可能な人間ロボットのビデオデータを利用して,ドメインギャップを埋める新しい適応パラダイムを提案する。
提案手法では,人間とロボットのビデオのセマンティクスを整列させるために,人間ロボットのアライメント損失を用いて,事前学習したモデルをパラメータ効率よくロボット領域に適応させる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:40:32 GMT)
Towards Robust Federated Analytics via Differentially Private Measurements of Statistical Heterogeneity [16.7] 差分プライバシーの研究において、統計的に異質なデータセットを使用することで精度が著しく低下することはよくある問題である。
統計的不均一性を測る最も有望な3つの方法を探索し、その正確性について公式を与える。
我々は,ルート探索手法を組み込んだ分析機構を用いて,最適プライバシーパラメータを求める。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 23:02:05 GMT)
Faster randomized partial trace estimation [16.7] 部分的トレースを推定するためのランダム化行列フリーアルゴリズムを開発した。
我々のアルゴリズムは[T. Chen and Y-C. Cheng, emphNumerical compute of the equilibrium-reduced density matrix for strong coupled open quantum systems, J. Chem. Phys. 157, 064106 (2022)。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 00:20:24 GMT)
Personalized Federated Fine-Tuning for LLMs via Data-Driven Heterogeneous Model Architectures [16.3] 大規模言語モデルの性能を高めるためには,大量の指導用テキストデータが必要不可欠である。
FedAMoLEは軽量なパーソナライズされたファインチューニングフレームワークである。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:20:38 GMT)
Shortcut Learning in In-Context Learning: A Survey [16.3] ショートカット学習(英: Shortcut learning)とは、モデルが実践的なタスクにおいて、単純で非破壊的な決定ルールを採用する現象を指す。
In-Context Learning(ICL)におけるショートカット学習に関する関連研究をレビューするための新しい視点を提供する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 11:00:19 GMT)
OMuleT: Orchestrating Multiple Tools for Practicable Conversational Recommendation [16.2] 現実的な会話推薦システム(CRS)の設計、評価、実装のための体系的な取り組みを提案する。
本システムの目的は,ユーザが自由形式のテキストを入力してレコメンデーションをリクエストし,関連する,多様な項目のリストを受信できるようにすることである。
そこで本研究では,大規模言語モデル(LLM)に10以上のツールを組み,内部知識ベースと実運用で使用されるAPIコールへのアクセスを可能にする,新たなアプローチを提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:53:39 GMT)
A smoothed-Bayesian approach to frequency recovery from sketched data [16.2] 計算機科学と情報理論の交わりにおける古典的問題に関する新しい統計的視点を提供する。
ランダムハッシュを用いて得られた圧縮表現やスケッチのみを用いて,大規模な離散データセットにおけるシンボルの実証周波数を復元する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:46:38 GMT)
VLG-CBM: Training Concept Bottleneck Models with Vision-Language Guidance [16.2] 概念ボトルネックモデル(CBM)は、中間概念ボトルネック層(CBL)を導入して解釈可能な予測を提供する
本稿では,VLG-CBM(Vision-Language-Guided Concept Bottleneck Model)を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:59:21 GMT)
Mars-PO: Multi-Agent Reasoning System Preference Optimization [16.1] 大規模言語モデル(LLM)の数学的推論能力を改善するための新しいフレームワークであるMars-POを提案する。
複数のエージェントからの高品質な出力をハイブリッドな正のサンプルセットに組み合わせ、エージェント固有の負のサンプルと組み合わせて、トレーニングのための堅牢な選好ペアを構築する。
個々の弱点に対処しながら、エージェントを共有陽性のサンプルと整列させることで、Mars-POは数学的推論ベンチマークで大幅なパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:35:16 GMT)
Control incompatibility in multiparameter quantum metrology [15.9] 量子センシングや量子イメージングのような実践的な応用では、複数のパラメータを同時に推定する必要があることが多い。
これは主に、異なるパラメータ、特に最適制御に関連するパラメータを推定するための最適戦略の固有の非互換性に起因する。
我々の研究は、制御の非互換性によって引き起こされるトレードオフを最小化し、精度を高める方法に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 04:00:56 GMT)
PCDreamer: Point Cloud Completion Through Multi-view Diffusion Priors [15.7] PCDreamerは、ポイントクラウド補完のための新しい方法である。
我々は、大モデル内での相対的なビュー一貫性を持つ多視点拡散先を利用して、所望の形状の新たなビューを生成する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:31:59 GMT)
Towards a Mechanistic Explanation of Diffusion Model Generalization [15.7] 局所復調演算は最適な拡散復調器を近似するために用いられる。
本研究では,拡散モデルデノイザの前方および逆拡散過程に対する一般化挙動を近似したデノイザを構築する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:22:17 GMT)
Generalized Gaussian Model for Learned Image Compression [15.3] 学習画像圧縮において、確率モデルは潜伏変数の分布を特徴づける上で重要な役割を果たす。
より柔軟な潜在分布モデリングのために、ガウスモデルを一般化ガウスモデルに拡張する。
提案した一般化されたガウスモデルと改良されたトレーニング手法を組み合わせることで,ガウスとガウスの混合モデルを様々な学習画像圧縮法で優れることを示した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:51:55 GMT)
Distributed, communication-efficient, and differentially private estimation of KL divergence [15.3] 分散された機密性の高いデータを管理する上で重要なタスクは、分散の変化の度合いを測定することである。
差分プライバシの下で,計算のフェデレーションモデル間でのKL分散を推定するための新しいアルゴリズムアプローチについて述べる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 23:06:29 GMT)
Neural Window Decoder for SC-LDPC Codes [15.2] 空間結合型低密度パリティチェック(SC-LDPC)符号のためのニューラルウインドウデコーダ(NWD)を提案する。
NWDの重みをトレーニングするために,2つの新しいトレーニング戦略を導入する。
また、SC-LDPC符号に固有の誤り伝搬問題を補足重みを配置することで解決する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:13:29 GMT)
MetaMetrics: Calibrating Metrics For Generation Tasks Using Human Preferences [14.6] メタメトリクス(MetaMetrics)は,様々なモダリティにまたがる生成タスクを教師付きで評価するメタメトリクスである。
我々の測定基準は、言語と視覚の両方の下流タスクにおける柔軟性と有効性を示し、様々な多言語および多ドメインのシナリオにおいて大きな利点を示します。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 23:46:52 GMT)
Puzzle: Distillation-Based NAS for Inference-Optimized LLMs [14.6] 大規模言語モデル(LLM)は目覚ましい能力を示しているが、その採用は推論時に高い計算コストによって制限されている。
本稿では,特定のハードウェア上でLLM推論を高速化するフレームワークであるPuzzleについて述べる。
Nemotron-51Bは、バッチサイズが大きい単一のGPU上で推論できる最も正確な言語モデルである。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:45:42 GMT)
Supervised Learning-enhanced Multi-Group Actor Critic for Live-stream Recommendation [14.5] 強化学習(Reinforcement Learning, RL)は、ユーザの長期的なエンゲージメントを捉えるためのレコメンデーションシステムに広く応用されている。
従来のRLアルゴリズムは、しばしばばらつきと不安定な問題に直面している。
SL-MGAC(Supervised Learning-enhanced Multi-Group Actor Critic Algorithm)を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 04:06:02 GMT)
Deliberate Reasoning for LLMs as Structure-aware Planning with Accurate World Model [14.5] 大規模言語モデル(LLM)のためのSWAP(Structure-Aware Planning)を提案する。
SWAPは、世界モデルによる推論プロセスのガイドとして構造情報を導入し、ステップ上のソフト検証メカニズムを提供する。
SWAPは,数理推論,論理推論,コーディングタスクなど,多種多様な推論集約型ベンチマークで評価される。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:47:26 GMT)
Sensing Based on Quantum Correlation of Photons in the Weak Nonlinear Regime [14.1] 量子干渉に基づく光子の量子相関は、弱い非線形状態において単一光子源を実現するために広く研究されている。
本稿では,量子干渉に基づく光子の量子相関による感度センシングを実現する手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:39:25 GMT)
NeuroLifting: Neural Inference on Markov Random Fields at Scale [14.0] 大規模なマルコフランダムフィールド(MRFs)での推論は、批判的だが難しい課題である。
本稿では,グラフニューラルネットワーク(GNN)を利用した新しい手法であるNeuroLiftingを紹介する。
従来のリフト技術を非パラメトリックニューラルネットワークフレームワークに拡張することで、NeuroLiftingはニューラルネットワークのスムーズなロスランドスケープから恩恵を受けることができる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:50:47 GMT)
Universal Reconstruction of Complex Magnetic Profiles with Minimum Prior Assumptions [13.9] 計測された磁場から磁場量を再構成するための,新しい,効率的なGPUベースの手法を提案する。
現実的な実験条件下での多種多様な磁性構造をシミュレーションし,本手法の有効性を検証した。
本研究では,月の岩盤からの磁場マップの探索に本手法を適用した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 03:15:54 GMT)
Integration of Contextual Descriptors in Ontology Alignment for Enrichment of Semantic Correspondence [13.7] 包括的知識モデルを作成するために、本質的および文脈的記述子の統合を可能にする形式化が開発された。
セマンティックアプローチの階層構造と概念間の潜在的な衝突を分析する数学的装置を実証する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:59:32 GMT)
SiamSeg: Self-Training with Contrastive Learning for Unsupervised Domain Adaptation Semantic Segmentation in Remote Sensing [13.5] 教師なしドメイン適応(Unsupervised domain adapt, UDA)は、ラベル付けされたソースドメインデータを活用しながら、ラベル付けされていないターゲットドメインデータからモデルを学習することを可能にする。
対照的な学習を UDA に統合し,対象領域における意味情報を捕捉するモデルの能力を高めることを提案する。
我々の手法であるSimSegは既存の手法より優れ、最先端の結果が得られます。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:38:11 GMT)
Aggregating Data for Optimal and Private Learning [13.3] Multi Instance Regression (MIR)とLearning from Label Proportions (LLP)は、学習フレームワークである。
我々は,MIR と LLP の様々な損失関数について検討し,データセットをバッグに分割する最適な方法について検討した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:44:00 GMT)
Enhancing Consistency-Based Image Generation via Adversarialy-Trained Classification and Energy-Based Discrimination [13.2] 本稿では,一貫性に基づく画像の生成を後処理する新しい手法を提案し,その知覚的品質を向上させる。
本手法では,両部位を逆向きに訓練する共同分類器-識別器モデルを用いる。
このジョイントマシンの指導の下で、サンプル特異的な投影勾配を用いることで、合成画像を洗練し、ImageNet 64x64データセット上でFIDスコアを改良した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:01:11 GMT)
MM-Path: Multi-modal, Multi-granularity Path Representation Learning -- Extended Version [12.9] マルチモーダル・マルチグラニュラリティパス表現学習フレームワーク(MM-Path)を提案する。
MM-Pathは道路経路と画像経路の両方からモダリティを統合することで、一般的な経路表現を学習することができる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:53:30 GMT)
FonTS: Text Rendering with Typography and Style Controls [12.7] 本稿では,テキストレンダリングにおけるタイポグラフィとスタイルの制御性を向上させるための2段階のDiTパイプラインを提案する。
タイポグラフィー制御(TC)ファインタニング,効率的なパラメータファインタニング法,およびタイポグラフィー制御トークン(ETCトークン)の囲い込みについて紹介する。
スタイル制御をさらに強化するために,テキストプロンプトに依存しない画像入力を通じてスタイル情報を注入するスタイル制御アダプタ(SCA)を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:19:37 GMT)
Perspective of Software Engineering Researchers on Machine Learning Practices Regarding Research, Review, and Education [12.7] 本研究は、機械学習(ML)とソフトウェア工学(SE)の相乗効果に関する知識への貢献を目的とする。
ML に精通した SE 研究者,あるいは ML を用いた SE 記事の執筆者,および記事自体を分析した。
データ収集、モデルトレーニング、評価に重点を置くさまざまなプラクティスを見つけました。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:21:24 GMT)
Streamlined Federated Unlearning: Unite as One to Be Highly Efficient [12.5] 「忘れられる権利」法や規制は、連邦学習(FL)に新たなプライバシー要件を課している。
本研究では,モデルの性能を劣化することなく保持データに保存しながら,対象データの影響を効果的に除去することを目的とした,合理化アンラーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:52:48 GMT)
STANet: A Novel Spatio-Temporal Aggregation Network for Depression Classification with Small and Unbalanced FMRI Data [12.3] 時間的特徴と空間的特徴の両方を捉えるために,CNNとRNNを統合してうつ病を診断するための時空間アグリゲーションネットワーク(STANet)を提案する。
実験の結果、STANetは82.38%の精度と90.72%のAUCでうつ病診断性能に優れていた。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:58:06 GMT)
LaNMP: A Language-Conditioned Mobile Manipulation Benchmark for Autonomous Robots [12.3] 本稿ではLanguage, Navigation, Manipulation, Perception (LaNMP)データセットを提案する。
LaNMPは、自然言語で指定された長時間の部屋と部屋のピック・アンド・プレイスタスクのための574のトラジェクトリから構成される。
シミュレーションで2つのモデルを微調整してテストし、物理ロボットで3分の1の評価を行い、ベンチマークが開発・評価に有効であることを実証した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:31:50 GMT)
CleanVul: Automatic Function-Level Vulnerability Detection in Code Commits Using LLM Heuristics [12.1] 本稿では,Large Language Model (LLM) を用いて,VFCからの脆弱性修正変更を自動的に識別する手法を提案する。
VulSifterは大規模な調査に適用され、GitHubで127,063のリポジトリをクロールし、5,352,105のコミットを取得しました。
LLM拡張手法を用いて11,632個の関数からなる高品質なデータセットであるCleanVulを開発した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 03:52:23 GMT)
Dance Any Beat: Blending Beats with Visuals in Dance Video Generation [12.0] 音楽によってガイドされた個人の画像から直接ダンスビデオを生成するという新しいタスクを導入する。
我々のソリューションであるDance Any Beat Diffusion Model (DabFusion)は、参照画像と楽曲を使用してダンスビデオを生成する。
AIST++データセットを用いてDabFusionの性能評価を行い,映像品質,オーディオ・ビデオ同期,モーション・ミュージックアライメントに着目した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:30:14 GMT)
CityWalker: Learning Embodied Urban Navigation from Web-Scale Videos [11.9] 我々は,人間のような都市ナビゲーションのためのスケーラブルでデータ駆動型アプローチを提案する。
われわれは何千時間もの間、何千時間もの街を歩きながらウェブから動画を流すエージェントを訓練している。
我々のモデルは、多様な課題や重要なシナリオを扱うために洗練されたナビゲーションポリシーを学びます。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:49:22 GMT)
A Pontryagin Perspective on Reinforcement Learning [11.6] 固定アクションシーケンスを代わりに学習するオープンループ強化学習のパラダイムを導入する。
1つの頑健なモデルベース法と2つのサンプル効率なモデルフリー法という3つの新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:13:52 GMT)
How to Collaborate: Towards Maximizing the Generalization Performance in Cross-Silo Federated Learning [11.4] フェデレートクラスタリング(FL)は、プライバシを保存する分散学習フレームワークとして、鮮明な注目を集めている。
本研究では、クライアントがFLデータの後、モデルオーナーとなるクロスサイロFLに焦点を当てる。
我々は、より多くのトレーニングデータを持つ他のクライアントと協調することで、クライアントのパフォーマンスを改善できると定式化します。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:29:41 GMT)
FiRe: Fixed-points of Restoration Priors for Solving Inverse Problems [11.4] ニューラルネットワークの認知に基づく暗黙の先行は、Plug-and-Playアルゴリズムのような広く使われているフレームワークの中心となっている。
本稿では,前兆の概念を拡大するための新しい枠組みとして,前兆の固定点(FiRe)を導入する。
一般的な復元モデルを 従来の妄想モデルを超えたものにしました
論文参考訳(メタデータ) (Thu, 28 Nov 2024 07:40:16 GMT)
Beyond Scaling Laws: Understanding Transformer Performance with Associative Memory [11.3] Transformerのサイズが大きくなると、パフォーマンスが向上するとは限らない。
本稿では,変圧器を用いた言語モデルの事前学習において,記憶に光を当てる理論的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 03:20:49 GMT)
Patch Ranking: Efficient CLIP by Learning to Rank Local Patches [11.2] ViT効率を向上する現在の戦略はパッチトークンのプルーニングに重点を置いているが、CLIPのマルチモーダルな性質に対処するには不足している。
我々は「黄金ランキング」を確立するための欲求探索手法を提案し、このランキングを近似するために特別に訓練された軽量な予測器を導入する。
CLIPのViTではパッチトークンの40%を削減できたが、7つのデータセットの平均精度損失は0.3に過ぎなかった。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 20:38:53 GMT)
Information upper bounds in composite quantum systems [11.0] 量子状態を分解し、法定量子状態を構成する成分に含まれる情報の総量に焦点を当てる。
解析により、量子純状態の後方情報内容の上限は、正確には 2 に等しいことを証明した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:10:11 GMT)
A Machine Learning-based Framework towards Assessment of Decision-Makers' Biases [11.0] 人為的意思決定におけるバイアスを評価するための機械学習ベースのフレームワークを提案する。
提案手法が既存の代替手段よりも優れていることを示す理論的保証と実証的証拠を提供する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:30:20 GMT)
Semi-Supervised Neural Processes for Articulated Object Interactions [10.8] 本稿では,少数のオブジェクトのみにラベル付きインタラクションデータが存在するシナリオを対象とした適応型報酬予測モデルであるSemi-Supervised Neural Process (SSNP)を紹介する。
両方のタイプのデータを共同でトレーニングすることで、モデルはより効果的に一般化可能な機能に集中することができる。
SSNPの有効性は、ドアオープンタスクを通じて示され、他の半教師付き手法よりも優れた性能を示し、他の適応型モデルと比較して、わずかなデータしか使用しない。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 21:20:06 GMT)
360Recon: An Accurate Reconstruction Method Based on Depth Fusion from 360 Images [10.6] 360度画像は、従来のピンホールカメラに比べてはるかに広い視野を提供する。
これにより、VR、AR、および関連分野のアプリケーションにとって重要である。
ERP画像のための革新的MVSアルゴリズムである360Reconを提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:30:45 GMT)
On the Convergence Rates of Set Membership Estimation of Linear Systems with Disturbances Bounded by General Convex Sets [10.5] 本稿では、(ロバスト制約のある)制御文献でよく用いられる手法であるセットメンバーシップ推定(SME)に焦点を当てる。
システム障害が境界付けられた場合、中小企業はLSEの信頼性境界よりも経験的なパフォーマンスを享受する傾向にある。
本研究の主な貢献は、外乱支援に関する仮定を緩和し、一般凸支援のための中小企業の収束率を確立することである。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:41:43 GMT)
A Novel Unified Architecture for Low-Shot Counting by Detection and Segmentation [10.5] ローショットオブジェクトカウンタは、注釈付き例題をほとんどあるいは全く使用せずに画像内のオブジェクト数を推定する。
既存のアプローチは、しばしば過一般化と偽陽性検出につながる。
本稿では,オブジェクト検出,セグメンテーション,カウント推定を行う新しいローショットカウンタであるGeCoを紹介する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:32:39 GMT)
Fight Fire with Fire: How Much Can We Trust ChatGPT on Source Code-Related Tasks? [10.4] 近年の研究では、ChatGPTを開発者とテスターの両方に活用することを提案した。
コード生成,コード補完,プログラム修復におけるChatGPTの自己検証能力を評価するための総合的な実証的研究を行う。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 09:48:51 GMT)
ETSM: Automating Dissection Trajectory Suggestion and Confidence Map-Based Safety Margin Prediction for Robot-assisted Endoscopic Submucosal Dissection [10.2] ESD Trajectory and Confidence Map-based Safety (ETSM)データセットを1849ドルの短いクリップで作成し、デュアルアームロボットシステムによる粘膜下剥離に焦点を当てた。
また、最適解離軌道予測と信頼マップに基づく安全マージンを組み合わせたフレームワークも導入する。
提案手法は, 予測精度の向上と解離プロセスの安全性の向上により, 現在の研究におけるギャップを埋めるものである。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 03:19:18 GMT)
Neural Shadow Art [10.2] シャドウアートの可能性を拡大するために暗黙の関数表現を活用するニューラルシャドウアートを導入する。
提案手法では,入力されたバイナリ画像を様々な照明方向と画面方向で一致させることができる。
本手法は, 工業用途に有用であり, 材料使用量が少なく, 幾何学的滑らかさが向上している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:03:30 GMT)
Coherent Optical Modems for Full-Wavefield Lidar [10.1] コヒーレント光モデムは、光ファイバーケーブルを通じて、毎秒1テラビットを超えるデータレートでデータを送信する。
本研究では, 深度, 軸速度, 偏光を同時に測定するランダム変調連続波ライダーの一種であるフルウェーブフィールドライダーを紹介する。
既存のライダーと比較して、フルウェーブフィールドライダーは、短時間、マイクロ秒の露光時間、信頼性の高い速度測定、周囲の光や他のライダー信号からの干渉に対する堅牢性から、mmスケールの精度を向上させることを約束している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:27:58 GMT)
JoyVASA: Portrait and Animal Image Animation with Diffusion-Based Audio-Driven Facial Dynamics and Head Motion Generation [10.0] JoyVASAは、音声駆動型顔アニメーションにおける顔の動きと頭部の動きを生成する拡散法である。
本研究では,静的な3次元顔表現から動的表情を分離する分離された顔表現フレームワークを提案する。
第2段階では、拡散変圧器を訓練し、文字の同一性によらず、オーディオキューから直接動作シーケンスを生成する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:04:06 GMT)
Refrence-Frame-Independent Quantum Key Distribution over 250 km of Optical Fiber [9.8] 我々は、150MHzの繰り返し速度でRFI QKDシステムを開発することにより、250kmの光ファイバー距離にセキュアな鍵ビットを分散する。
我々は200kmの距離で49.65bit/sの有限鍵秘密鍵レートを達成し、これは最先端システムより3倍以上高い。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:18:59 GMT)
Leveraging Hardware Power through Optimal Pulse Profiling for Each Qubit Pair [9.7] 既存のキャリブレーション法では、デバイス間の2量子ゲートの同じパルス波形を利用して、物理量子ビット間のハードウェア差を見落としている。
本稿では、2ビットゲートのパルス候補を3つのパルス波形に拡大し、細粒度キャリブレーションプロトコルを導入する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:29:59 GMT)
HOT3D: Hand and Object Tracking in 3D from Egocentric Multi-View Videos [9.5] 我々は,自我中心手と物体追跡のためのデータセットであるHOT3Dを3Dで導入する。
データセットはマルチビューRGB/モノクローム画像ストリームの833分以上(3.7M画像以上)を提供し、33の多様な剛体オブジェクトと対話する19人の被験者を示している。
実験では,3Dハンドトラッキング,6DoFオブジェクトポーズ推定,未知のインハンドオブジェクトの3次元持ち上げという3つの一般的なタスクに対して,マルチビュー・エゴセントリックデータの有効性を実証した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:09:42 GMT)
Monaural Speech Enhancement with Complex Convolutional Block Attention Module and Joint Time Frequency Losses [9.4] 本稿では,複雑な畳み込みブロックアテンションモジュール(CCBAM)を提案する。
CCBAMは軽量で汎用的なモジュールで、複雑な値の畳み込み層に簡単に統合できる。
本稿では、時間周波数(TF)領域と時間領域の両方において、複雑なモデルを協調的に最適化する混合損失関数を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:26:24 GMT)
Unifying Self-Supervised Clustering and Energy-Based Models [9.3] 自己教師付き学習と生成モデルとの間には,原則的な関連性を確立する。
シンボル接地問題の単純かつ非自明なインスタンス化に対処するために,我々の解法をニューロシンボリックな枠組みに統合できることが示される。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:34:27 GMT)
I Dream My Painting: Connecting MLLMs and Diffusion Models via Prompt Generation for Text-Guided Multi-Mask Inpainting [8.9] 塗装は、画像の欠落した領域や破損した領域を埋めて、周囲のコンテンツやスタイルとシームレスにブレンドすることに焦点を当てている。
本稿では,異なるプロンプトを用いて複数の領域を同時に塗布するマルチマスク塗装の新たな課題を紹介する。
私たちのパイプラインは、創造的で正確なインペイント結果を提供します。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:55:09 GMT)
Maximal Steered Coherence in Accelerating Unruh-DeWitt Detectors [8.8] 最大操舵コヒーレンス(MSC)の進化に及ぼすウンルー温度とエネルギーレベルの影響について検討する。
MSCはアンルー温度に強く依存しており、初期状態パラメータに依存するモノトニック低下から非モノトニック回復までの挙動を示す。
これらの発見は、相対論的効果と量子コヒーレンスの間の複雑な関係に関する貴重な洞察を与え、非慣性環境のための堅牢な量子技術開発に潜在的に応用する可能性がある。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:43:26 GMT)
Balancing Molecular Information and Empirical Data in the Prediction of Physico-Chemical Properties [8.6] 本稿では,分子記述子と表現学習を組み合わせた一般的な手法を提案する。
提案したハイブリッドモデルは,グラフニューラルネットワークを用いた化学構造情報を利用する。
構造に基づく予測が信頼できない場合を自動的に検出し、表現学習に基づく予測によって修正する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:31:54 GMT)
PEFT-as-an-Attack! Jailbreaking Language Models during Federated Parameter-Efficient Fine-Tuning [8.6] 本稿では,PEFT-as-an-Attack(PaaA)と呼ばれる新たなセキュリティ脅威をFedPEFTに導入する。
PaaAの評価では、モデルのパラメータの1%未満がトレーニング可能であり、クライアントの少数のサブセットが悪意を持って行動しているため、LoRAなどの代表PEFT手法を用いて攻撃成功率が約80%に達することが判明した。
この結果から,FedPEFTパラダイムの安全性確保と性能維持を同時に行う,より効果的な防衛機構の必要性が示唆された。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:05:01 GMT)
Contractive Unitary and Classical Shadow Tomography [8.4] 完全な量子状態トモグラフィーでは、システムサイズを指数関数的に測定する必要がある。
この研究は、ランダム-決定論的ハイブリダイゼーションプロトコルが完全なランダムな測定よりも効率的であることを示している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:59:12 GMT)
On the Black-box Explainability of Object Detection Models for Safe and Trustworthy Industrial Applications [7.8] 本稿では,物体検出モデルに対するモデルに依存しない説明可能性手法に着目し,形態的フラクタル摂動ピラミッド(P)法の拡張としてD-Pを提案する。
これらの手法を実世界の産業用・ロボット用データセット上で評価し,マスク数,モデルサイズ,画像解像度などのパラメータが説明の質に及ぼす影響について検討した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:09:26 GMT)
Non-iterative Optimization of Trajectory and Radio Resource for Aerial Network [7.8] 航空IoTネットワークにおける比例フェアネスを最大化するために,共同軌道計画,ユーザアソシエーション,資源割り当て,電力制御の問題に対処する。
我々のフレームワークは、遺伝的、木探索、強化学習といった様々な軌道計画アルゴリズムを組み込むことができる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 03:37:15 GMT)
A Computational Framework for Behavioral Assessment of LLM Therapists [7.7] ChatGPTのような大規模言語モデル(LLM)は、精神的な健康問題に対処するためのセラピストとしての使用に対する関心が高まっている。
LLMセラピストの会話行動を体系的に評価するための概念実証フレームワークBOLTを提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 22:01:57 GMT)
An open source Multi-Agent Deep Reinforcement Learning Routing Simulator for satellite networks [7.6] 本稿では,低軌道衛星コンステレーション(LSatC)におけるパケットルーティングのためのオープンソースシミュレータを提案する。
Pythonで実装されたシミュレータは、従来のDijkstraベースのルーティングと、より高度な学習ソリューションをサポートする。
その結果、Reinforcement Learning(RL)ベースのルーティングポリシを使用して、エンドツーエンド(E2E)のレイテンシを大幅に改善した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:46:42 GMT)
Structured Object Language Modeling (SoLM): Native Structured Objects Generation Conforming to Complex Schemas with Self-Supervised Denoising [7.6] 私たちは、言語モデリング問題(構造化オブジェクト言語モデリング)として問題を枠組み化します。
本稿では,そのようなオブジェクトの既存のデータセットからモデルを学習するための自己教師付きデノベーション手法を提案する。
実験結果から,提案手法は即時駆動型汎用LCMと一致し,性能が良くなることがわかった。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:16:41 GMT)
VARCO-VISION: Expanding Frontiers in Korean Vision-Language Models [7.3] 本稿では,VLM(VARCO-VISION)をオープンソースとして導入する。
我々は、モデルが言語情報と視覚情報の両方を学ぶことができるステップバイステップのトレーニング戦略を取り入れた。
VARCO-VISIONは、その用途と潜在的な応用を拡大し、接地、参照、OCRを行うことができる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:38:42 GMT)
MPQ-Diff: Mixed Precision Quantization for Diffusion Models [7.3] 固定ビット幅でのトレーニング拡散モデル(例えば、重みの4ビットとアクティベーションの8ビット)の定量化はサンプリング時間の短縮に有効である。
重み付けと活性化に異なるビット幅を割り当てる混合精度量子化スキームMPQ-Diffを提案する。
我々はLSUNとImageNetの混合精度を評価し、FIDは65.73から15.39、52.66から14.93に大きく改善した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:38:26 GMT)
Is Oracle Pruning the True Oracle? [7.2] Oracleのプルーニングは、35年以上にわたって、ほとんどのニューラルネットワークプルーニングメソッドの基礎とされてきた。
本稿では, 経験的相関解析を用いて, 現代の深層モデルに対する妥当性について検討する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:00:28 GMT)
GMS-VINS:Multi-category Dynamic Objects Semantic Segmentation for Enhanced Visual-Inertial Odometry Using a Promptable Foundation Model [7.1] 我々は、強化SORTアルゴリズムと堅牢な多カテゴリセグメンテーションフレームワークを統合したGMS-VINSを視覚慣性オドメトリー(VIO)に導入する。
拡張SORTアルゴリズムは、複数の動的オブジェクトを追跡する信頼性を大幅に向上する。
提案手法は,複数のシナリオにおいて,他の最先端手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:41:33 GMT)
DreamBlend: Advancing Personalized Fine-tuning of Text-to-Image Diffusion Models [6.7] 本研究では,初期チェックポイントからの素早い忠実度と,後続チェックポイントからの主観的忠実度を組み合わせたDreamBlendを提案する。
これにより、被験者の忠実度が向上し、挑戦的なプロンプトに対する忠実度と多様性が向上し、最先端の微調整方法よりも優れる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 21:49:31 GMT)
Fast quantum control of cavities using an improved protocol without coherent errors [6.6] SNAPゲートは量子ゲートの強力なクラスを形成する。
短パルスの場合、コヒーレントエラーは性能を制限する。
パルス時間が特定の限界を超えると、そのような誤差を完全に抑制できることを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:03:57 GMT)
A fast neural hybrid Newton solver adapted to implicit methods for nonlinear dynamics [6.6] 本稿では,厳密な時間進化非線形方程式に対する非線形時間ステップシステムのこの解を高速化する,新しいディープラーニングに基づくハイブリッドニュートン法を提案する。
ニュートン法における量的改善率を示し、教師なし学習戦略の一般化誤差の上限を解析する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 07:24:53 GMT)
Fairness-enhancing mixed effects deep learning improves fairness on in- and out-of-distribution clustered (non-iid) data [6.6] フェア・ミックスド・エフェクト・ディープ・ラーニング(Fair MEDL)フレームワークを提案する。
本フレームワークは,1)不変なFEを学習するためのクラスタ逆効果,2)REのためのベイズニューラルネットワーク,3)最終的な予測のためにFEとREを組み合わせた混合関数,を通じて,クラスタ不変な固定効果(FE)とクラスタ固有ランダムエフェクト(RE)を定量化する。
公正なMEDLフレームワークは、年齢で86.4%、人種で64.9%、性で57.8%、結婚で36.2%の公正性を向上し、堅牢な予測性能を維持している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 04:00:30 GMT)
TEA: Trajectory Encoding Augmentation for Robust and Transferable Policies in Offline Reinforcement Learning [6.5] 本稿では,シーケンスエンコーダから得られる環境力学の潜在表現を統合することで,状態空間を拡張するトラジェクトリ拡張(TEA)を提案する。
以上の結果から,これらのエンコーディングをTAAに組み込むことで,新しい環境への単一ポリシーの伝達性が向上することが示唆された。
これらの結果は,TAAが重要な環境特性を捉え,エージェントが動的条件を越えて効果的に一般化できることを示唆している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:34:15 GMT)
SurgeMOD: Translating image-space tissue motions into vision-based surgical forces [6.4] 最小侵襲ロボット手術における視覚に基づく力推定の新しい手法を提案する。
呼吸や心臓循環といった自然なプロセスによって生じる内部運動を用いて、周波数領域の運動の空間的基盤を推測する。
本研究では,シリコーンファントムおよび前バイブオ実験において,点接触力を確実に推定できることを実証した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 11:25:54 GMT)
Linear combinations of Gaussian latents in generative models: interpolation and beyond [6.4] 我々は,潜伏変数の線形結合を形成する汎用手法として,ガウス変数(COG)の組み合わせを提案する。
COGは簡単に実装できるが、最近の変数形成の洗練された手法よりも優れている。
潜在空間の部分空間の構築など、新たな能力が提供される。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:13:24 GMT)
Exchangeable Sequence Models Quantify Uncertainty Over Latent Concepts [6.3] 事前学習されたシーケンスモデルは、交換可能なデータポイントよりも確率論的推論が可能であることを示す。
シーケンスモデルは、典型的なベイズモデルとは異なる観測間の関係を学習する。
シーケンス予測損失が不確実性定量化の品質を制御することを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:48:55 GMT)
Quantum Cellular Automata on Symmetric Subalgebras [6.2] 完全局所作用素環の部分代数上定義された一次元スピン系上の量子セルオートマトンについて検討する。
各サイトが$G$の正規表現を持つシステムに対して、そのような部分代数 QCA の完全な分類を確立する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:22:50 GMT)
SPDIM: Source-Free Unsupervised Conditional and Label Shift Adaptation in EEG [6.0] 非定常脳波(EEG)は、領域間での分布変化(例えば、日と被験者)をもたらす
対象ドメインに対するラベル付きキャリブレーションデータがない場合、問題はソースフリーな教師なしドメイン適応(SFUDA)問題である。
本稿では,ラベルシフトを含む特定の分布シフトの下でのSFUDA問題に対する幾何学的深層学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 20:49:48 GMT)
Controlling Participation in Federated Learning with Feedback [6.0] FedBackは、ADMMベースのフェデレーション学習におけるクライアントの参加を管理するための決定論的アプローチである。
フェデレーション画像分類に関する数値実験は、FedBackが最大50%の通信改善と計算効率を達成することを示した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:26:13 GMT)
MAG-V: A Multi-Agent Framework for Synthetic Data Generation and Verification [6.0] MAG-Vは、顧客のクエリを模倣する質問のデータセットを生成するフレームワークである。
我々の合成データは、実際の顧客クエリにおけるエージェントのパフォーマンスを向上させることができる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:36:11 GMT)
VIPaint: Image Inpainting with Pre-Trained Diffusion Models via Variational Inference [5.9] 我々のVIPaint法は,提案手法の妥当性と多様性の両方において,従来の手法よりも優れていることを示す。
我々のVIPaint法は,提案手法の妥当性と多様性の両方において,従来の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:35:36 GMT)
Plots Unlock Time-Series Understanding in Multimodal Models [5.8] 本稿では,マルチモーダルファウンデーションモデルの既存のビジョンエンコーダを利用して,プロットを介して時系列データを"見る"方法を提案する。
実験により,本手法は生の時系列データをテキストとして提供する方法よりも優れていることが示された。
より複雑で現実的なシナリオへの明確な推論ステップによる合成タスクからの一般化性を実証するために、我々のアプローチを消費者健康タスクに適用する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:01:47 GMT)
Improving Accuracy and Generalization for Efficient Visual Tracking [5.4] 我々は,OODシークエンスにおいてもトラッキング性能を大幅に向上させる,高効率なSiameseトラッカーであるSiamABCを紹介する。
SiamABCは、ターゲットの動的変動を橋渡しする新しいアーキテクチャ設計と、トレーニングにおける新たな損失を生かしている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 01:51:46 GMT)
Bridging the Gap: Aligning Text-to-Image Diffusion Models with Specific Feedback [5.4] フィードバックからの学習は、テキスト間拡散モデルにおけるテキストプロンプトと画像の整合性を高めることが示されている。
本稿では,3段階を含む特定の報酬目標を持つ効率的な微動法を提案する。
このベンチマークによる実験結果から,本モデルはアライメントと忠実度の両方において,他のSOTA法よりも優れていることがわかった。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 09:56:28 GMT)
FAN-Unet: Enhancing Unet with vision Fourier Analysis Block for Biomedical Image Segmentation [5.3] 本稿では,Fourier Analysis Network(FAN)ベースのビジョンバックボーンとU-Netアーキテクチャの長所を組み合わせた,新しいアーキテクチャであるFAN-UNetを提案する。
提案したVision-FANレイヤは、FANレイヤと自己アテンションメカニズムを統合し、Fourier分析を活用して、モデルが長距離依存関係と周期的関係の両方を効果的にキャプチャすることを可能にする。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 07:53:47 GMT)
Differentiable Topology Estimating from Curvatures for 3D Shapes [5.1] 本稿では,3次元形状のグローバルトポロジを正確に推定するための,新しい微分可能アルゴリズムを提案する。
高い精度、効率、GPUとの互換性のあるインスタント計算を実現する。
実験結果から,様々なデータセットにまたがる手法の優れた性能が示された。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:14:35 GMT)
Dynamic Attention and Bi-directional Fusion for Safety Helmet Wearing Detection [5.1] 本稿では,検出ヘッドに動的注意を取り入れた安全ヘルメット着用のための新しいアルゴリズムを提案する。
MAP@[.5:.95]は最良ベースラインに比べて1.7%改善され、GFLOPは11.9%縮小された。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 11:33:51 GMT)
Intrinsic Wrapped Gaussian Process Regression Modeling for Manifold-valued Response Variable [5.1] 回帰関数の後方分布は正則フレームの選択に不変であることを示す。
シミュレーションや実例を含む数値実験により,提案手法は高い性能を示すことが示された。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:27:59 GMT)
Unpicking Data at the Seams: VAEs, Disentanglement and Independent Components [5.1] データのゆがみ(disentanglement)、あるいは統計的に独立な要因を特定することは、機械学習と統計学の多くの分野に関心がある。
分散は、変分オートエンコーダ(VAE)、生成逆数ネットワーク(Generative Adversarial Networks)、拡散モデルなど、いくつかの生成パラダイムで観察される。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:14:44 GMT)
Automating Energy-Efficient GPU Kernel Generation: A Fast Search-Based Compilation Approach [5.0] エネルギー効率の良いGPUカーネルを生成するための新しい検索ベースコンパイル手法を提案する。
提案手法は,最大21.69%の省エネでGPUカーネルを生成可能であることを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:51:54 GMT)
Beautimeter: Harnessing GPT for Assessing Architectural and Urban Beauty based on the 15 Properties of Living Structure [5.0] Beautimeterは、GPT(Generative Pre-trained Transformer)技術を利用した新しいツールである。
アレクサンドロスは、生物構造を特徴づけるスケールや太い境界などの15の基本的な性質を特定した。
GPTの高度な自然言語処理機能を統合することで、Beautimeter氏は、構造がこれらの15のプロパティを具体化する範囲を評価する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:14:24 GMT)
Guardians of the Ledger: Protecting Decentralized Exchanges from State Derailment Defects [4.9] 本研究は,DECプロジェクトにおける脱線欠陥に関する最初の系統的研究である。
本稿では,DeXスマートコントラクトにおける状態脱線欠陥を検出するための,新しいディープラーニングベースのフレームワークStateGuardを提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:55:25 GMT)
Deep Neural Network-Based Prediction of B-Cell Epitopes for SARS-CoV and SARS-CoV-2: Enhancing Vaccine Design through Machine Learning [4.7] B細胞の正確な予測は、SARSやCOVID-19などの感染症に対するワクチン開発を導く上で重要である。
従来のシーケンスベースの手法は、大きな複雑なデータセットに苦しむことが多いが、ディープラーニングは予測精度を有望に改善する。
その結果、新型コロナウイルスの陰性および陽性の症例の予測では82%の総合的精度を示し、陽性サンプルの検出には改善の余地があった。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 01:54:43 GMT)
An Integrated Artificial Intelligence Operating System for Advanced Low-Altitude Aviation Applications [4.6] 本稿では,低高度航空用途に適した包括的人工知能オペレーティングシステムを提案する。
OrinFlight OS、UnitedVision、UnitedSense、UnitedNavigator、UnitedMatrix、UnitedInSightの6つのコアコンポーネントで構成されている。
このシステムは現代の航空における複雑な課題に対処し、ナビゲーション、知覚、共同作業のための堅牢なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 01:24:16 GMT)
Rational Silence and False Polarization: How Viewpoint Organizations and Recommender Systems Distort the Expression of Public Opinion [4.4] オンライン談話の観察者がコミュニティの見解を信じるようになると、プラットフォームがどう影響するかを示す。
我々は,イデオロギー組織からのシグナルが修辞的強度の増大を促し,中程度の利用者の「合理的な沈黙」につながることを示す。
我々は、イデオロギー組織からの信号への露出を減らすなど、実装可能な実践的な戦略を特定できる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 21:44:06 GMT)
Diffusion MRI with Machine Learning [4.3] 脳の拡散強調磁気共鳴イメージング(dMRI)には、ユニークな機能がある。
機械学習は、dMRI分析の難しいタスクのいくつかに取り組むのに非常に適しているかもしれない。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 21:05:04 GMT)
Perception of Visual Content: Differences Between Humans and Foundation Models [4.3] 本研究では、多様な社会経済的文脈を表す画像の人為的およびML的アノテーションを比較した。
私たちのデータセットは、さまざまな地理的地域の人々の画像と、手を洗う収入レベルで構成されています。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 07:37:04 GMT)
Extracting Information in a Low-resource Setting: Case Study on Bioinformatics Workflows [4.2] 16のエンティティをアノテートした52の新たなコーパスであるBioToFlowを使用して、SciBERTベースのNERモデルは、アノテータ間の合意に匹敵する70.4F尺度を達成した。
バイオインフォマティクスのための高性能情報抽出が実現可能であることを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:04:31 GMT)
Mechanical Wannier-Stark Ladder of Diamond Spin-Mechanical Lamb Wave Resonators [4.2] ダイヤモンドラム波共振器のワニエ・スタークはしごは、超低減衰率の機械的圧縮モードを特徴とする。
メカニカル・ワニエ・スターク・はしごの局在度は、スピン量子ビット間のフォノン媒介結合の有効範囲を設定する。
長距離接続を持つスピン量子ビットの量子ネットワークの開発は、固体系において新たに開発された量子低密度パリティチェック符号の実装への扉を開くことができる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 21:38:57 GMT)
SoftED: Metrics for Soft Evaluation of Time Series Event Detection [4.1] 時系列イベント検出法は,検出精度にのみ焦点をあてた標準分類基準によって評価される。
事象を検出する不正確さは、しばしば、隣り合う検出に反映される先行または遅延効果によって生じる。
本稿では,イベント検出手法のソフトアセスメントのために設計された,新しいメトリクスセットであるSoftEDメトリクスを紹介する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 11:46:04 GMT)
SelfSplat: Pose-Free and 3D Prior-Free Generalizable 3D Gaussian Splatting [4.1] ポーズフリーで3次元の事前自由な一般化可能な3次元再構成を実現するための新しい3次元ガウススプラッティングモデルであるSelfSplatを提案する。
本モデルでは,これらの課題に対して,自己教師付き深度とポーズ推定手法を効果的に統合することによって対処する。
提案手法の性能を評価するため,RealEstate10K,ACID,DL3DVなどの大規模実世界のデータセットを用いて評価を行った。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 04:44:33 GMT)
CovidLLM: A Robust Large Language Model with Missing Value Adaptation and Multi-Objective Learning Strategy for Predicting Disease Severity and Clinical Outcomes in COVID-19 Patients [4.1] コロナウイルス病2019(COVID-19)は世界中で何百万人もの死者を出した。
これらの疾患の重症度と臨床症状の早期発見は, 予後不良の予防に不可欠である。
本研究は,専門的なプロンプトの構築と多目的学習戦略の採用に重点を置いている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 11:27:38 GMT)
Pre-Training Graph Contrastive Masked Autoencoders are Strong Distillers for EEG [4.0] ラベルなし/ラベル付き/高密度のEEGデータ間のギャップを埋めるグラフコントラスト型マスク付きオートエンコーダディストレータを提案する。
高密度から低密度脳波データへの知識蒸留のために,グラフトポロジー蒸留損失関数を提案する。
2つの臨床脳波データセットにおける4つの分類課題に対する本手法の有効性を実証する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:53:32 GMT)
Scale Invariance of Graph Neural Networks [4.0] グラフニューラルネットワーク(GNN)における2つの基本的な課題に対処する。
本研究では,4つの同好性および2つの異好性ベンチマークデータセットにまたがって,最先端のパフォーマンスを実現する統一ネットワークアーキテクチャであるScaleNetを提案する。
ダイグラフに対する別の一般的なGNNアプローチとして、Hermitian Laplacian法とGraphSAGEと入射正規化の等価性を示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 22:06:06 GMT)
Control-oriented Clustering of Visual Latent Representation [4.0] ビヘイビアクローンから学習した画像ベース制御パイプラインにおける視覚表現空間の幾何学について検討する。
神経崩壊現象に触発されて、視覚表現空間におけるクラスタリングの同様の法則を示す。
このようなクラスタリングの法則を,テスト時間性能を改善するアルゴリズムツールとして活用できることを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 01:38:14 GMT)
Multi-modal graph neural networks for localized off-grid weather forecasting [3.9] 機械学習や数値気象モデルによる天気予報製品は、現在、グローバル・レギュラー・グリッドで作成されている。
本研究では、異種グラフニューラルネットワーク(GNN)をエンドツーエンドにトレーニングし、グリッド化された予測をダウンスケールして、関心のある場所をオフグリッドする。
提案手法は,グローバルな大規模気象モデルと局所的高精度な予測とのギャップを橋渡しして,局所的な意思決定に役立てることができることを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:36:27 GMT)
Beyond Logit Lens: Contextual Embeddings for Robust Hallucination Detection & Grounding in VLMs [3.8] LMMの中間層からのコンテキストトークンの埋め込みを利用した改良手法を提案する。
このアプローチは、行動やOCRを含む様々なカテゴリーにおける幻覚の検出と接地を著しく改善する。
我々の貢献は、より信頼性が高く解釈可能なマルチモーダルモデルへの道を開いた。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:47:55 GMT)
Proceedings of the 2024 XCSP3 Competition [3.8] 2024年XCSP3コンペティションの結果は、CP'24(第30回国際制約プログラミングの原則と実践に関する会議)で発表された。
この文書は2024年のXCSP3コンペティションの手続きを表している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:16:40 GMT)
Training Multi-Layer Binary Neural Networks With Local Binary Error Signals [3.8] バックプロパゲートされた完全精度勾配の計算を必要としないBNN(Binary Neural Networks)のための多層学習アルゴリズムを提案する。
提案アルゴリズムは, 局所的二進誤差信号と二進重み更新に基づいて, シナプス的メタ可塑性機構として機能する整数値の隠蔽重みを用いる。
BMLPのマルチクラス画像分類ベンチマークにおいて、バイナリネイティブで勾配のない方法で完全に訓練された実験結果は、+13.36%の精度向上を示している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 09:12:04 GMT)
Knowledge Database or Poison Base? Detecting RAG Poisoning Attack through LLM Activations [3.7] Retrieval-Augmented Generation (RAG) は、大規模言語モデル(LLM)の限界に対処するために設計された最先端のアプローチである。
RAG中毒は、悪意のあるテキストを知識データベースに注入し、最終的に攻撃者の標的応答(毒殺反応とも呼ばれる)を発生させる。
本稿では, LLMの活性化を利用したフレキシブルかつ自動化された検出パイプラインであるRevPRAGを紹介した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:29:46 GMT)
MOLA: Enhancing Industrial Process Monitoring Using Multi-Block Orthogonal Long Short-Term Memory Autoencoder [3.7] 産業プロセスの高精度かつ信頼性の高い故障検出を行うために,MOLA: Multi-block Orthogonal Long short-term memory Autoencoder パラダイムを導入する。
本稿では,プロセス変数を専門的なプロセス知識を活用することで,複数のブロックに分類するマルチブロック監視構造を提案する。
テネシー・イーストマン・プロセスに適用することで,MOLAフレームワークの有効性と有効性を示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 01:38:54 GMT)
Offline Reinforcement Learning and Sequence Modeling for Downlink Link Adaptation [3.7] リンク適応(LA)は、現代の無線通信システムにおいて欠かせない機能である。
LAは、通信リンクの伝送速度を時間変化および周波数変化の無線リンク条件に合わせるように動的に調整する。
近年の研究では、より一般的なルールベースのアルゴリズムの代替として、オンライン強化学習アプローチが導入されている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 23:00:31 GMT)
On Moving Object Segmentation from Monocular Video with Transformers [3.7] モノクラーモーションセグメンテーションのための新しい融合アーキテクチャ M3Former を提案する。
この問題に対する2次元および3次元の動作表現の解析とセグメンテーション性能の重要性について述べる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:42:35 GMT)
SCB-dataset: A Dataset for Detecting Student Classroom Behavior [3.6] 学生クラスルーム行動データセット(SCBデータセット)には、11,248のラベルと4,003のイメージが含まれている。
データセットには11,248のラベルと4,003のイメージが含まれており、手作り行動に焦点を当てている。
YOLOv7アルゴリズムを用いてデータセットを評価し,平均精度(マップ)を85.3%まで向上させた。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 04:19:15 GMT)
LD-EnSF: Synergizing Latent Dynamics with Ensemble Score Filters for Fast Data Assimilation with Sparse Observations [3.6] フルダイナミックス進化を完全に回避する新しい方法論であるLatent Dynamics EnSF(LD-EnSF)を紹介した。
また,Long Short-Term Memory (LSTM) ネットワークを用いて,スパース観測を潜在空間に符号化する手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:27:11 GMT)
CovHuSeg: An Enhanced Approach for Kidney Pathology Segmentation [3.6] 腎糸球体セグメンテーションの問題を解決するために,CovHuSegアルゴリズムを提案する。
この単純な後処理法は球形異常のセグメンテーションに適応するように規定されている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 03:54:09 GMT)
GDPR-Relevant Privacy Concerns in Mobile Apps Research: A Systematic Literature Review [3.5] データ主体の権利は、個人データよりも個人データの権利に不可欠である。
データ主体の権利のような概念は、個人の個人データよりも基本的だが、ランドスケープでは過小評価されている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:42:46 GMT)
The Multiple Dimensions of Spuriousness in Machine Learning [3.5] データからの相関学習は、今日の機械学習(ML)と人工知能(AI)研究の基礎となる。
このようなアプローチは、ビッグデータコーパス内のパターン付き関係の自動発見を可能にするが、意図しない相関が捕捉された場合、障害モードの影響を受けやすい。
この脆弱性は、しばしば、パフォーマンス、公平性、堅牢性をモデル化する障害として批判される、急進性の尋問への関心を拡大した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:00:41 GMT)
I See, Therefore I Do: Estimating Causal Effects for Image Treatments [3.4] NICE (Network for Image Treatments Causal Effect Estimation) というモデルを提案する。
NICEは、画像治療におけるリッチな多次元情報を利用する効果的な方法を示し、因果効果の推定を改善するのに役立つ。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 04:40:15 GMT)
On Consistency of Signature Using Lasso [3.4] 署名は連続および離散時間プロセスの反復経路積分である。
本稿では,ラッソ回帰を用いたシグネチャの整合性について検討する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 03:36:17 GMT)
Adaptive control of reaction-diffusion PDEs via neural operator-approximated gain kernels [3.3] PDEバックステッピングにおけるゲインカーネルのニューラル演算子近似は、リアルタイムでコントローラを実装するための実行可能な方法として現れている。
本稿では,ハイパーボリックPDEの適応制御からベンチマークパラボリックPDEの適応制御まで,ニューラル演算子手法を拡張した。
パラメータ適応のリアプノフ設計のためのプラント状態のグローバルな安定性と制御を証明した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 07:35:35 GMT)
GSurf: 3D Reconstruction via Signed Distance Fields with Direct Gaussian Supervision [3.3] マルチビュー画像からの表面再構成は3次元視覚における中核的な課題である。
近年, ニューラル・レージアンス・フィールド(NeRF)内のサイン付き距離場(SDF)を探索し, 高忠実な表面再構成を実現している。
本稿では,ガウス原始体から直接符号付き距離場を学習する新しいエンドツーエンド手法であるGSurfを紹介する。
GSurfは、VolSDFやNeuSといったニューラルな暗黙的表面法に匹敵する3D再構成品質を提供しながら、高速なトレーニングとレンダリングの速度を達成する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:11:16 GMT)
Waterfall Transformer for Multi-person Pose Estimation [3.3] We propose the Waterfall Transformer Architecture for Pose Estimation (WTPose)。
WTPoseは、多人数のポーズ推定のために設計された、シングルパスでエンドツーエンドのトレーニング可能なフレームワークである。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:24:40 GMT)
Using Images to Find Context-Independent Word Representations in Vector Space [3.3] 本稿では,辞書の意味や画像の描写を用いて,文脈に依存しない単語ベクトルを見つける手法を提案する。
本手法は,学習時間を大幅に削減しつつ,文脈に基づく手法と相容れない動作を行う。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:44:10 GMT)
Large width penalization for neural network-based prediction interval estimation [3.2] 予測間隔(PI)は、信頼度に関連する予測の上下境界を示す。
高品質PIは高いPIカバレッジ確率(PICP)と狭いPI幅によって特徴づけられる。
本研究では,大径PI幅の平均値のペナルティ化を図った新しいPI損失関数を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:34:32 GMT)
Contrastive representations of high-dimensional, structured treatments [3.2] 多くの実世界の環境では、処理は構造化され、テキスト、ビデオ、オーディオなどの高次元のオブジェクトを処理できる。
本稿では,そのような構造を用いることで因果効果の偏りを推定できることを示す。
我々は,高次元治療の表現を学習するための新しい対照的なアプローチを考案し,根底にある因果的要因を特定し,非因果的要因を捨てることを証明する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:33:31 GMT)
NexusSplats: Efficient 3D Gaussian Splatting in the Wild [3.1] そこで本研究では,NexusSplatsと呼ばれるネクサスカーネルによる3次元シーン再構築手法を提案する。
この結果から,NexusSplatsは最先端のレンダリング品質を実現すると同時に,現在の最高の品質に比べて,再構築時間を最大70.4%削減できることがわかった。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:34:39 GMT)
PREBA: A Hardware/Software Co-Design for Multi-Instance GPU based AI Inference Servers [3.1] PreBA(プレバ)は、MIG推論サーバをターゲットにしたハードウェア/ソフトウェアの共同設計である。
3.7倍のスループット、テールレイテンシの3.4倍の削減、エネルギー効率の3.5倍の改善、コスト効率の3.0倍の改善を提供する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:02:41 GMT)
Neural Operators for Predictor Feedback Control of Nonlinear Delay Systems [3.0] 本稿では,予測器の定式化を演算子学習問題として再キャストすることで,予測器設計の新しい視点を導入する。
我々は、予測演算子の任意の精度のニューラル演算子近似の存在を証明した。
近似予測器の下では閉ループ非線形系の半言語的実用安定性を実現する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 07:30:26 GMT)
Stein transport for Bayesian inference [3.0] 我々は,ベイズ推論のための新しい手法である$textitStein transport$を紹介した。
駆動ベクトル場は再生カーネルヒルベルト空間から選択され、適切なカーネルリッジ回帰定式化またはスタイン幾何学における無限小最適輸送写像として導出することができる。
SVGDと比較して,Stein輸送は計算予算を大幅に削減した上で,より正確な後方近似に到達するだけでなく,SVGDでよく見られる分散崩壊現象を効果的に緩和することを示した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:16:30 GMT)
An explainable three dimension framework to uncover learning patterns: A unified look in variable sulci recognition [3.0] 我々は、高精度で低複雑さなグローバルな説明を提供することができる説明可能な人工知能(XAI)3Dフレームワークを開発した。
本フレームワークは,統計的特徴(Shape)とXAI法(GradCamとSHAP)を次元的還元と統合し,モデル学習とコホート固有変数の両方を反映した説明を確実にする。
これらの堅牢な説明は、後側頭頂部と内頭頂部を含む重要な亜領域の同定を促進した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 22:52:14 GMT)
Quantum State Preparation via Free Binary Decision Diagram [2.9] 我々は、量子状態の古典的な記述が重み付きエッジを持つFBDDによって与えられるとき、QSPのための量子アルゴリズムを構築する。
重み付きFBDDで表される任意の量子状態が、$O(N)$サイズの量子回路で作成可能であることを示す。
また、$n=O(mathrmpoly(n))$ node, $O(n2)$ ancillary qubitsで重み付けされたFBDDで表現できる$n$-qubit状態の例を示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 04:01:50 GMT)
Scaling Enhancement of Photon Blockade in Output Fields [2.8] 非線形共振器と補助共振器(線形共振器)の混合出力場において,光子遮断を大きく向上させることができることを示す。
出力場におけるこの光子遮断の増大は、2つの光子が2つの空洞を通過するときの2つの経路間の破壊的干渉によって引き起こされる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:41:56 GMT)
Moving-Horizon Estimators for Hyperbolic and Parabolic PDEs in 1-D [2.8] 観測者PDEの数値解の必要性をリアルタイムに除去するために,PDEの移動水平推定器を導入する。
我々は、双曲型PDEと放物型PDEの両方のクラスに対して、移動水平状態推定を明示的に生成するPDEバックステッピング法を用いてこれを実現する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 07:33:04 GMT)
GRU-PFG: Extract Inter-Stock Correlation from Stock Factors with Graph Neural Network [2.8] 株式や産業の複雑さは 株価予測の課題を提示します
GRUとALSTMで表される1つのカテゴリは、予測のためのストックファクタのみに依存しており、有効性は限られている。
他のカテゴリーは、HISTとTRAが代表し、株価だけでなく、業界情報、業界財務報告、世論、その他の予測のためのインプットも含んでいる。
本稿では,2種類のモデルの現状と限界を考慮し,GRU-PFGモデルを提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:50:55 GMT)
Concept-driven Off Policy Evaluation [2.8] 我々は、概念に基づくOPE推定器のファミリーを開発し、それらが偏りのないままであり、概念が知られ、事前定義されたときにばらつきを減らすことを証明した。
合成および実世界のデータセットを用いた実験により、既知のおよび学習された概念ベース推定器の両方がOPE性能を著しく向上させることが示された。
他のOPE法とは異なり、概念ベースの推定器は容易に解釈可能であり、特定の概念に対する標的的介入を可能にし、これらの推定器の品質をさらに向上させる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 22:15:06 GMT)
Memorization of Named Entities in Fine-tuned BERT Models [2.8] 細調整BERTモデルにおける名前付きエンティティ記憶の程度について検討する。
細調整されたBERTは、事前訓練されたBERTモデルよりも、細調整されたデータセットに特有の名前付きエンティティを生成できないことを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:06:32 GMT)
Noninvertible Symmetry-Enriched Quantum Critical Point [2.5] 一次元の非可逆Rep($D_8$)対称性を持つ臨界格子モデルについて検討する。
これにより、新しい量子臨界点(QCP)、非可逆対称性強化QCPへと導かれる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:29:24 GMT)
On the Ethical Considerations of Generative Agents [2.4] 本稿では, 生成剤と類似の生成ツールに関する倫理的考察を評価する文献について論じる。
生成要因に関連する倫理的問題やシステム的リスクを緩和するためのガイドラインと今後の研究を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:31:49 GMT)
Event-based Sensor Fusion and Application on Odometry: A Survey [2.4] イベントカメラは、高速モーション、低照度、広ダイナミックレンジを特徴とする環境において利点がある。
これらの特性は、特にロボット工学とコンピュータビジョンにおけるセンサー融合に有効なイベントカメラをレンダリングする。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 09:18:48 GMT)
Distribution-Free Calibration of Statistical Confidence Sets [2.3] 本研究では,TRUSTとTRUST++という2つの新しい手法を導入する。
我々は,本手法が既存のアプローチ,特に小サンプル方式よりも優れていることを実証した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 20:45:59 GMT)
How Are Quantum Eigenfunctions of Hydrogen Atom Related To Its Classical Elliptic Orbits? [2.3] 高励起エネルギー固有関数 $psi_nlm(vecr)$ の水素原子は、古典楕円軌道の等重量重ね合わせとして近似できることを示す。
重力中心に向かって落下する点質量の古典特異点問題を再検討する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 03:32:06 GMT)
Comprehensive Survey of Reinforcement Learning: From Algorithms to Practical Challenges [2.2] 強化学習(RL)は人工知能(AI)の強力なパラダイムとして登場した。
本稿では,多種多様なアルゴリズムを巧みに分析するRLの包括的調査を行う。
我々は、RLアルゴリズムの選択と実装に関する実践的な洞察を提供し、収束、安定性、探索-探索ジレンマといった共通の課題に対処する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 03:53:14 GMT)
Genuine N-partite entanglement in Schwarzschild-de Sitter black hole spacetime [2.2] シュワルツシルト・ド・シッター時空における質量を持たないディラック場の真のN-粒子絡みについて検討する。
真のN粒子の絡み合いはブラックホールの質量の減少とともに単調に減少する。
真のN-粒子の絡み合いが宇宙定数の非単調関数であることは興味深い。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:13:53 GMT)
A Versatile and Differentiable Hand-Object Interaction Representation [2.2] Coarse Hand-Object Interaction Representation (CHOIR) は、HOIモデリングのための新しい、多目的で完全な微分可能な分野である。
CHOIRは離散符号のない距離を利用して連続的な形状とポーズの符号化を行う。
Joint Diffusionは、雑音のある手-物体の相互作用を条件としたグリップ分布を学習するための拡散モデルである。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 20:15:21 GMT)
A Matrix Factorization Based Network Embedding Method for DNS Analysis [2.2] 受動的ネットワークトラフィックログにDNSエンティティを特徴付けるネットワーク埋め込みの可能性について検討する。
本稿では,MF-DNS-E (underlineMatrix-underlineFactorization-based UnderlineDNS underlineEmbedding)法を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:10:25 GMT)
Enhancing Privacy in Federated Learning through Local Training [2.1] 我々は,(i)高価なコミュニケーションと(ii)プライバシー保護の課題を克服するために,フェデレート学習アルゴリズムであるFed-PLTを提案する。
i) 中央コーディネータと計算機エージェント間の通信回数を大幅に削減し, 部分的参加と局所訓練の両立を可能にした。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:19:51 GMT)
Bounds for Quantum Circuits using Logic-Based Analysis [2.1] 量子回路の検証をスケールするための2つの主要な戦略を提案する。
本稿では,ハミング量保存の実証にこれらのアイデアを応用した2つの例を示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:32:35 GMT)
Stochastic Neural Network Symmetrisation in Markov Categories [2.1] 我々は、群準同型に沿ってニューラルネットワークをシンメトリする問題を考察する。
これをマルコフ圏の項で定式化する。
シンメトリションのためのフレキシブルで構成的な枠組みを得る。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:43:01 GMT)
Enhancing the Expressivity of Temporal Graph Networks through Source-Target Identification [2.1] 我々は、TGNの定式化は、メッセージ上での予測や移動平均を表現できないことを示した。
本稿では,各インタラクションイベントメッセージにソースターゲット識別を追加することで,TGNの表現性を高めることを提案する。
提案手法であるTGNv2は,時間グラフベンチマーク(TGB)の動的ノード親和性予測データセットにおいて,TGNと現在のTGモデルを著しく上回っている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 23:35:56 GMT)
Measuring Risk of Bias in Biomedical Reports: The RoBBR Benchmark [2.1] 本稿では,バイオメディカルペーパーの方法論的強度を測定するためのベンチマークを提案する。
500以上の論文から得られたベンチマークタスクは、研究手法の分析と、バイアスのリスクの評価をカバーしている。
ベンチマークの結果,これらのモデルが専門家レベルの性能にかなり劣っていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 00:21:31 GMT)
Quantum computing of chirality imbalance in SU(2) gauge theory [2.1] 我々は1+1次元のSU(2)非アベリアゲージ理論におけるキラル凝縮の研究のために変分量子アルゴリズムを実装した。
古典的および実際の量子ハードウェア上の量子シミュレーションによる結果は、格子ハミルトンの正確な対角化とよく一致している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:27:35 GMT)
Stochastic Resetting Mitigates Latent Gradient Bias of SGD from Label Noise [2.0] 本稿では,チェックポイントからのリセットにより,ディープニューラルネットワーク(DNN)をノイズラベルでトレーニングする際の一般化性能が大幅に向上することを示す。
ノイズの多いラベルが存在する場合、DNNはまずデータの一般的なパターンを学習するが、徐々に破損したデータを記憶し、過度に適合する。
勾配降下(SGD)のダイナミクスを分解することにより,雑音ラベルによる遅延勾配バイアスの挙動を同定し,一般化を損なう。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:23:36 GMT)
The Method of Critical AI Studies, A Propaedeutic [2.0] 批判的AI研究の分野における一般的な方法論的問題を概説する。
我々は、文化的対象の人文的密接な分析における既存の強みを考慮に入れた、将来的な方法論のセットを、呼び、そして、指し示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 00:41:01 GMT)
An Extensive Evaluation of Factual Consistency in Large Language Models for Data-to-Text Generation [1.9] 大規模言語モデル(LLM)は、様々なデータ・テキスト生成(DTG)タスクで例外的なパフォーマンスを示している。
DTGで事実上一貫したテキストを生成することは、LLMにとって依然として困難である。
本稿では,DTG 用 LLM の事実整合性について広範囲に評価する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:23:12 GMT)
Bayesian Neural Networks: A Min-Max Game Framework [1.8] ディープラーニングでは、ベイジアンニューラルネットワーク(BNN)がロバストネス分析の役割を担っている。
ミニマックス法を用いて保守的BNNを研究し,決定論的ニューラルネットワークの$f$と閉ループニューラルネットワークの$f+rxi$の2プレーヤゲームを定式化する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:59:46 GMT)
Adult learners recall and recognition performance and affective feedback when learning from an AI-generated synthetic video [1.8] この研究は500人の参加者を募集し、大人の学習者のリコールと認識のパフォーマンス、AI生成合成ビデオに対する感情的なフィードバックについて調査した。
その結果,リコールおよび認識性能の条件間で統計的に有意な差は認められなかった。
しかし、成人の学習者はテキストではなくビデオ形式から学ぶことを好んだ。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 21:40:28 GMT)
EfficientMorph: Parameter-Efficient Transformer-Based Architecture for 3D Image Registration [1.7] 教師なし3次元画像登録のためのトランスフォーマーベースのアーキテクチャであるnameを提示する。
nameは、平面ベースのアテンションメカニズムを通じて3Dボリュームのローカルとグローバルのアテンションをバランスさせ、Hi-Resトークン化戦略とマージ操作を使用する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:47:37 GMT)
Locally-Focused Face Representation for Sketch-to-Image Generation Using Noise-Induced Refinement [1.7] 本稿では,初歩的な顔スケッチの高忠実度カラー画像への変換を著しく向上させる新しいディープラーニングフレームワークを提案する。
提案手法は,エンコーダ・デコーダアーキテクチャ内のブロックアテンション機構により,顔の特徴を効果的に捉え,強化する。
このモデルは、スケッチ・ツー・イメージ生成における新しい最先端の状態を設定し、スケッチの型を一般化し、法執行機関における犯罪識別のようなアプリケーションに対して堅牢なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 09:12:56 GMT)
On-chip Hyperspectral Image Segmentation with Fully Convolutional Networks for Scene Understanding in Autonomous Driving [1.7] 可視スペクトルを超えた運転シーンにおける異なる物体のスペクトル反射は、追加情報を与えることができる。
本研究では、高度運転支援システム(ADAS)におけるスナップショット、ビデオレートハイパースペクトルイメージング(HSI)カメラの利用について検討する。
標準の完全畳み込みネットワーク(FCN)モデルによって符号化された空間的特徴が,HSIセグメンテーションシステムの性能をどの程度向上させるかを分析する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:10:50 GMT)
Cross-Spectral Attention for Unsupervised RGB-IR Face Verification and Person Re-identification [1.7] 可視光(RGB)や赤外線(IR)バンドからの顔や人の画像のマッチングなどの分光バイオメトリクスは、過去10年間で急速に進歩してきた。
本稿では,(1)新しい擬似三重項損失とクロススペクトル投票,(2)複数の部分空間を利用した新しいクロススペクトルアテンションネットワーク,(3)より識別性の高いクロススペクトルクラスタリングを実現するための構造化された空間性を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:38:15 GMT)
Graphical Calculus for Non-Gaussian Quantum States [1.7] ハイパーグラフフレームワークを用いて非ガウス量子状態を記述・解析するグラフィカルな方法を提案する。
我々は、これらのグラフに基づく形式主義に根ざした非ガウス状態の準備に関する説明例を示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:27:19 GMT)
EzSQL: An SQL intermediate representation for improving SQL-to-text Generation [1.6] 我々は、自然言語のテキストシーケンスと整合するEzと呼ばれる新しいモデルを開発した。
Ezは演算子とキーワードを変更することで、クエリを自然言語テキストに近づける。
ウィキやスパイダーのデータセットのクエリからテキスト記述を生成する手法として,本モデルが有効であることを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:24:46 GMT)
VeCoGen: Automating Generation of Formally Verified C Code with Large Language Models [1.6] VeCoGenは、LLM(Large Language Models)と形式検証を組み合わせた新しいツールで、公式に認証されたCプログラムを自動生成する。
VeCoGenは、自然言語仕様であるISO/ISO C Specification Language (ACSL) の正式な仕様と、プログラムの生成を試みるテストケースのセットを採っている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:12:21 GMT)
Gender Bias in LLM-generated Interview Responses [1.6] 本研究は, モデル, 質問タイプ, 職種にまたがって, LLM生成面接応答の多面的監査を行うための3つのLCMを評価した。
その結果,男女の偏見は一貫しており,性別のステレオタイプや仕事の優位性と密接に一致していることが判明した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:54:09 GMT)
Publication Trends in Artificial Intelligence Conferences: The Rise of Super Prolific Authors [1.6] 我々は過去10年間に11のAIカンファレンスから87,137件の論文を分析し、出版トレンドを調査した。
論文数も著者数も一貫して増加しており、AI研究への関心の高まりを反映している。
この分析を踏まえて、AI研究コミュニティは、著者政策の見直し、株式問題への対処、若手研究者の作業負荷の評価を検討すべきである。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:56:49 GMT)
Self-Supervised Learning for Graph-Structured Data in Healthcare Applications: A Comprehensive Review [1.6] このレビューは、医療におけるグラフ構造化データに自己教師付き学習(SSL)を活用することを目指す研究者と実践者の両方にとって、貴重なリソースになることを目的としている。
私たちの知る限りでは、この研究は、医療におけるグラフデータに適用されたSSLに関する文献の包括的なレビューとして、初めてのものである。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:51:12 GMT)
Co-Learning: Towards Semi-Supervised Object Detection with Road-side Cameras [1.5] 半教師付き学習(SSL)はラベル付きおよびラベルなしのデータを使用してオブジェクト検出器を訓練することができる。
SSLは、擬似ターゲットの不整合、分類と回帰タスクの不整合、豊富なラベルなしデータの効率的な使用など、いくつかの課題に直面している。
我々は,相互学習とアノテーションアライメント戦略を用いて,これらの複雑さを効果的にナビゲートする教師学生ベースのSSLフレームワークであるCo-Learningを開発した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:42:55 GMT)
Self-Cross Diffusion Guidance for Text-to-Image Synthesis of Similar Subjects [1.4] 本稿では,クロスアテンションマップとアグリゲートされた自己アテンションマップの重なり合いを罰する自己クロース拡散誘導法を提案する。
我々の指導は、最も差別的なものを超えた、主題のすべての関連するパッチの混合に対処する。
本手法はトレーニング不要であり,任意の変圧器を用いた拡散モデルの性能を向上させることができる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:58:03 GMT)
Swarm Intelligence-Driven Client Selection for Federated Learning in Cybersecurity applications [1.4] 本研究では,Federated Learning (FL)におけるクライアント選択におけるSwarm Intelligence Optimization (SI)アルゴリズムの利用に関する文献上の重要なギャップについて論じる。
既存の研究では、主に集中型機械学習の最適化技術について検討しており、クライアントの分散性、非IIDデータ分散、および対向ノイズの独特な課題は、ほとんど検討されていない。
我々は,9つのSIアルゴリズム,Grey Wolf Optimization (GWO), Particle Swarm Optimization (PSO), Cuckoo Search, Bat Algorithm, Bee Colony, Ant Colony Optimization, Fish Swarm, Glow Worm, Intelligent Water Droplet-across four experimentsを評価した。
結果よりGWOは優れた強靭性を示すことが明らかとなった。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 03:05:15 GMT)
Analyzing political stances on Twitter in the lead-up to the 2024 U.S. election [1.3] 我々は2024年アメリカ合衆国大統領選挙に関するツイートのイデオロギー的位置について検討する。
我々は、イデオロギー的スタンスを、民主派、反共和派、反共和派、反民主派、中立派に分類する。
共和党の候補者は、民主党とその候補者に対する批判の中で、その逆よりもはるかに多くのツイートを投稿している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 07:05:34 GMT)
Algorithms for Sparse LPN and LSPN Against Low-noise [1.2] ノイズ問題を伴う古典的学習パリティの2種類のスパース変種に対する学習アルゴリズムについて検討した。
我々は,幅広いパラメータに対する技術状況を改善するための新しいアルゴリズムフレームワークを提供する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:39:41 GMT)
Universal approximation of continuous functions with minimal quantum circuits [1.2] 単一キュービットと固定生成子パラメトリゼーションのみを用いて任意の多変量関数を近似する構成的手法を提案する。
また、独立した関心を持つ可能性のある固定符号化戦略のいくつかについては、普遍性も証明する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:52:43 GMT)
HJ-Ky-0.1: an Evaluation Dataset for Kyrgyz Word Embeddings [1.2] 本研究はキルギス語で単語ベクトル表現を構築するための最初の「銀標準」データセットを紹介する。
対応するモデルをトレーニングし、品質評価指標を通じてデータセットの適合性を検証します。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 22:37:57 GMT)
Enhancing Sketch Animation: Text-to-Video Diffusion Models with Temporal Consistency and Rigidity Constraints [1.2] 本稿では,記述的テキストプロンプトに基づいて与えられた入力スケッチをアニメーションする手法を提案する。
スケッチのストロークの動きを誘導するために、SDS損失を伴う事前訓練されたテキスト・ビデオ拡散モデルを利用する。
本手法は, 定量評価と定性評価の両方において, 最先端性能を上回っている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 21:15:38 GMT)
Using a Feedback Loop for LLM-based Infrastructure as Code Generation [1.1] インフラ・アズ・コード(Infrastructure as Code, IaC)パラダイムを用いて, LLMエージェントがインフラを構築する能力について検討する。
ループの各イテレーションにおいて、その効果は指数関数的に減少し、ある時点でプラトー化し、非効率になる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:40:55 GMT)
Redesigning the ensemble Kalman filter with a dedicated model of epistemic uncertainty [1.0] 本稿では、この設定のために設計された確率アンサンブルカルマンフィルタを導入し、その特性の一部を特徴付ける。
小さなサンプルサイズで優れた性能を示し、真のアレタリック不確実性を扱う場合であっても、所定のサンプルサイズで標準アンサンブルカルマンフィルタより優れる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:11:23 GMT)
Machine learning the Ising transition: A comparison between discriminative and generative approaches [1.0] 分類問題は、識別法または生成法のいずれかを通してアプローチすることができる。
古典的2次元2次元格子強磁性イジングモデルにおける熱相転移に関する数値解析ケーススタディを行う。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 20:50:26 GMT)
Improved simulation of quantum circuits dominated by free fermionic operations [1.0] 本稿では,FLOゲートと非ガウスゲートの「自由」近傍マッチゲートと等価なフェルミオン線形光学(FLO)ゲートからなる普遍量子回路をシミュレーションするアルゴリズムを提案する。
我々の重要な貢献は、FLO回路をシミュレートする新しい位相感受性アルゴリズムの開発である。
任意のFLOユニタリーと$k$制御Zゲートを含む量子回路に対して、先行技術よりも指数関数的に$k$O(4.5k)$Oを得る。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:29:03 GMT)
MATATA: a weak-supervised MAthematical Tool-Assisted reasoning for Tabular Applications [1.0] MATATAは、推論、計画、ツール使用を通じてデータ問題に対してLLMエージェントを訓練するコスト効率のよい方法である。
3.8B/8B SLM(Small Language Models)は、特にローカルホスティングとセンシティブなビジネスコンテキストに向いている。
実験により、MATATAはオープンソースモデルに基づく推論フレームワークのうち、FinQAとTAT-QAで最先端のパフォーマンスに達することが示された。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:12:17 GMT)
Training the parametric interactions in an analog bosonic quantum neural network with Fock basis measurement [1.0] 本稿では, ボソニックモードの活用とFockベース測定の実施を提案し, モード数に対する指数関数的な特徴の抽出を可能にした。
これらのパラメータは、物理次元が異なるにもかかわらず、複雑さを増すようなベンチマークタスクを解決するために凝集的に訓練できることを実証する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:59:19 GMT)
Analytical lower bound on query complexity for transformations of unknown unitary operations [0.8] 単元反転の問合せ複雑性に対する解析的下界を確立する。
フレームワークを確率的設定にまで拡張し、ある確率で変換を成功させなければなりません。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:07:31 GMT)
Eden: An Provably Secure, Ultra-Fast, and Fully Decentralized Blockchain Interoperability Protocol [0.8] 本稿では,SparkleXを利用した並列検証メッセージングプロトコルであるEdenを紹介する。
Edenは、ゼロ知識MapReduceフレームワーク上に構築された、弾力的で分散化された送信ネットワークである。
Edenの設計、堅牢なセキュリティモデル、弾力性と弾力性を保証する革新的なメカニズムについて検討する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:34:33 GMT)
Making Quantum Collision Models Exact [0.7] 量子衝突(Quantum collision)は、粗い粒度の環境との繰り返し相互作用を通して開かれた量子系を記述する。
システムオブザーバブルのシミュレーションに関する完全なエラー境界は確立されていない。
連鎖写像法を用いてマルコフ衝突モデルと非マルコフ衝突モデルを解析的に復元できることが示される。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:56:41 GMT)
Enhancing Software Maintenance: A Learning to Rank Approach for Co-changed Method Identification [0.7] 本稿では、ソースコードの特徴と変更履歴を組み合わせて、プル-リクエストレベルで共変更したメソッドを予測・ランク付けする学習 to-rankアプローチを提案する。
150のオープンソースプロジェクトの実験では、合計4150万行のコードと634,216のプルリクエストがあり、Random ForestモデルはNDCG@5で2.5から12.8%、他のモデルを上回っている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:23:02 GMT)
Model, Analyze, and Comprehend User Interactions within a Social Media Platform [0.7] ソーシャルメディアデータからユーザインタラクショングラフを構築し,それを解析し,コミュニティダイナミクスの洞察を得る。
本研究は,オンラインコミュニティの理解と管理のための包括的枠組みを提供する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:29:32 GMT)
Accelerating two-dimensional electronic spectroscopy simulations with a probe qubit protocol [0.7] 2次元電子分光法(2DES)は、光合成系内のエネルギー輸送における量子効果を探索するための強力なツールである。
本稿では、量子デバイス上での2DESの量子シミュレーションのためのプローブ量子ビットプロトコル(PQP)を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 09:30:03 GMT)
Confidential Prompting: Protecting User Prompts from Cloud LLM Providers [0.7] 当社の作業は,クラウドホスト型大規模言語モデル(LLM)サービスにおけるユーザインプットの確保という課題に対処する。
秘密計算を利用してユーザプロンプトを信頼できる実行環境に閉じ込めるセキュアなマルチパーティデコーディング(SMD)を導入する。
提案手法は, 迅速な秘密保持とLCM機能効率の両立を実証する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 20:20:23 GMT)
ArEEG_Words: Dataset for Envisioned Speech Recognition using EEG for Arabic Words [0.7] 本稿では,22歳以上の被験者から得られた新しい脳波データであるArEEG_Wordsデータセットを紹介する。
合計352個の脳波記録が収集され、各記録は複数の250ms信号に分割され、合計15,360個の脳波信号が得られた。
私たちの知る限りでは、ArEEG_WordsデータはアラビアのEEGドメインで最初のデータです。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 03:31:12 GMT)
3D Wasserstein generative adversarial network with dense U-Net based discriminator for preclinical fMRI denoising [0.7] 機能的磁気共鳴イメージング(fMRI)は、脳機能の研究に臨床および前臨床で広く用いられている。
デノイングは、あらゆるfMRI分析パイプラインにおける主要な前処理ステップの1つである。
本稿では,3次元高密度U-netを用いた3次元WGANを用いた3次元ワッサースタイン生成逆数ネットワークに基づく構造保存アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:47:43 GMT)
Effective temperature in approximate quantum many-body states [0.6] 量子多体系の基底状態を数値的に同定するために、近似量子波動関数のアンサーゼが一般的に用いられる。
本研究は、これらの近似量子多体状態のスペクトル分解を、ターゲットハミルトニアンの正確な固有状態に変換することに焦点を当てる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:23:05 GMT)
Assessing biomedical knowledge robustness in large language models by query-efficient sampling attacks [0.6] 大規模言語モデル(LLM)におけるパラメトリックドメイン知識の深化は、現実世界のアプリケーションへの迅速な展開を加速させている。
近年、自然言語処理タスクの逆例として命名されたエンティティが発見され、事前訓練されたLLMの知識の堅牢性に対するそれらの潜在的な影響に関する疑問が提起されている。
バイオメディカル知識のロバスト性を評価するために,パワースケール距離重み付きサンプリングに基づく埋め込み空間攻撃を開発した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:23:42 GMT)
On latent dynamics learning in nonlinear reduced order modeling [0.6] 本稿では,パラメータ化非線形時間依存PDEの次数モデリングのための潜在力学モデル(LDM)の数学的枠組みを提案する。
フルオーダーモデル (FOM) 解の LDM 近似に対する誤差と安定性の推定を導出するために, 時間連続的な設定を用いる。
ディープニューラルネットワークは離散LDM成分を近似し、FOMに関して有界近似誤差を提供する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 11:53:43 GMT)
Habit Coach: Customising RAG-based chatbots to support behavior change [0.6] Habit Coachは、パーソナライズされたインタラクションを通じて、ユーザの習慣の変化をサポートするように設計されている。
本研究では,言語モデルを再学習することなく,行動のパーソナライズを可能にするRAG(Retrieval-Augmented Generation)システムを開発した。
開発プロセスにおける重要な課題は、宣言的知識を効果的な相互作用行動に変換することの難しさだった。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:53:27 GMT)
Talking to oneself in CMC: a study of self replies in Wikipedia talk pages [0.6] 本研究では,ウィキペディアのトークページにおける自己応答の質的分析を提案する。
ディスカッションの最初の2つのメッセージは、同じユーザによって書かれています。
この特定のパターンは、2つのメッセージ以上のスレッドの10%以上で発生します。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 09:14:58 GMT)
Performance of a Superconducting Quantum Battery [0.6] 本研究では, 超伝導量子電池モデルを導入し, 実験生産が可能でありながら, 量子的優位性を示す。
このモデルは、2つの結合した超伝導量子ビットで構成され、これは単体充電プロセス中に熱貯水池と平衡のまま相互作用する。
我々は、ジョセフソンエネルギーの集合効果と量子ビット間の結合エネルギーを利用することで、最適化が可能となり、エネルギーの再分配が向上し、充電効率が大幅に向上することを示した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:35:16 GMT)
Quantum Neural Networks in Practice: A Comparative Study with Classical Models from Standard Data Sets to Industrial Images [0.6] 本研究では,2値画像分類の課題に対して,ランダム化された古典ニューラルネットワークと量子ニューラルネットワークの性能を比較した。
本研究は,実用的な画像分類タスクのための量子機械学習の展望について,産業的な視点を提供する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:13:45 GMT)
A Survey on Automatic Online Hate Speech Detection in Low-Resource Languages [0.6] ソーシャルメディアとインターネットのアクセシビリティはヘイトスピーチの普及を促している。
本稿は、世界中の低リソース言語におけるヘイトスピーチ検出に関する詳細な調査である。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 09:42:53 GMT)
Scaling Particle Collision Data Analysis [0.6] BBT-Neutronは,テキストと大規模数値実験データの混合による事前学習を容易にするために,バイナリトークン化方式を用いたタスク非依存アーキテクチャである。
高エネルギー物理学における重要な分類問題であるJet Origin Identification (JoI) へのBBT-Neutronの適用を実証する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:32:56 GMT)
AI Readiness in Healthcare through Storytelling XAI [0.5] 我々は,マルチタスク蒸留と解釈可能性技術を組み合わせて,聴衆中心の説明可能性を実現する手法を開発した。
我々の手法は、責任あるAIを実現するために、ドメインエキスパートと機械学習エキスパートの両方の信頼を高める。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 09:08:40 GMT)
Boundary-Decoder network for inverse prediction of capacitor electrostatic analysis [0.5] 境界条件に対するパラメータ変化をモデル化するためのエンドツーエンドのディープラーニング手法を提案する。
提案手法は, 動的境界条件下でのバニラ深層学習 (NN) と物理情報ニューラルネット (PINN) の両方を著しく上回り得ることを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:51:00 GMT)
Towards Agentic AI on Particle Accelerators [0.5] 本稿では,大規模言語モデル(LLM)を用いたアクセラレータ制御のための分散マルチエージェントフレームワークを構想する。
本稿では,知的エージェントがハイレベルなタスクやコミュニケーションを処理し,各エージェントが個別のアクセラレーターコンポーネントを制御できる自己改善型分散システムを提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 22:19:48 GMT)
BiPO: Bidirectional Partial Occlusion Network for Text-to-Motion Synthesis [0.5] BiPOは、テキスト間合成を強化する新しいモデルである。
パートベースの生成と双方向の自己回帰アーキテクチャを統合する。
BiPOはHumanML3Dデータセット上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:42:47 GMT)
Spin Phonon Relaxation Dynamics from a Conical Intersection of Trapped Rydberg Ions [0.5] 円錐交差近くの非断熱過程は、電子と核の自由度の強い結合に根ざしている。
我々は、リドベルク状態の有限寿命が円錐交叉周りの振動力学に与える影響について研究する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 11:33:50 GMT)
A Review on Digital Pixel Sensors [0.5] デジタルピクセルセンサー(DPS)は、現代のイメージングシステムにおいて重要なコンポーネントとして進化してきた。
しかし、ADC回路の調節に起因する各画素に固有の複雑さは、画素ピッチを大幅に増加させる。
本稿では,DPS技術の広範な領域について概観する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:10:05 GMT)
Virtual Sensing to Enable Real-Time Monitoring of Inaccessible Locations \& Unmeasurable Parameters [0.5] エネルギーシステムの安全かつ効率的な運用には、重要なパラメータのリアルタイムモニタリングが不可欠である。
従来のセンサーはしばしば物理的センサーを配置できない厳しい環境で故障し、劣化する。
本研究では,物理センサの展開が不可能な場所でのモニタリングを可能にすることで,リアルタイムモニタリング手法の限界に対処する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 00:58:29 GMT)
Improvement and Implementation of a Speech Emotion Recognition Model Based on Dual-Layer LSTM [0.4] 本稿では,LSTM層を追加することで,既存の音声感情認識モデルを構築する。
2層LSTMネットワークを介して音声シーケンス内の長期的依存関係をキャプチャすることで、複雑な感情パターンをより正確に認識し分類することができる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:28:50 GMT)
Thermal noise cancellation for optomechanically induced nonreciprocity in a whispering-gallery-mode microresonator [0.4] 光学的非相互性に対する量子干渉による熱ノイズキャンセリングを実現する方法を示す。
本研究は, メカニカルモードを基底状態に前冷却することなく, 数光子レベル, 単光子レベルの非相互効果を実現する効果的な方法を提供する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:39:04 GMT)
Enhancing Parameter-Efficient Fine-Tuning of Vision Transformers through Frequency-Based Adaptation [0.4] 本稿では、モデル適応性を高めるために、VTブロック間の新しい周波数ファインチューニングモジュールであるFreqFitを紹介する。
FreqFitは、1%から16%のパフォーマンス向上で、元のPEFTメソッドよりも一貫してパフォーマンスを改善している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:09:49 GMT)
Tensor networks and efficient descriptions of classical data [0.3] サブリージョンとその補集合間の相互情報はサブシステムサイズ$L$とどのようにスケールするかを検討する。
テキストでは、相互情報は、ボリューム法指数に近い$Lnu$のパワーローとしてスケールする。
画像の場合、スケーリングは領域法則に近く、PEPSのような2次元テンソルネットワークが適切な表現性を持つ可能性があることを示唆している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 20:14:28 GMT)
Convex Regularization and Convergence of Policy Gradient Flows under Safety Constraints [0.3] 本稿では, ほぼ安全制約のある無限水平動的決定過程における強化学習について検討する。
我々は、報酬とパラメータの正規化を組み合わせた2つの規則化されたRLフレームワークを、連続的な状態-作用空間内でこれらの制約に対処するために検討する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:04:43 GMT)
ABROCA Distributions For Algorithmic Bias Assessment: Considerations Around Interpretation [0.2] 本研究では, 絶対地域間距離の統計特性について検討する。
その結果,ABROCA分布は標本サイズ,AUC差,クラス不均衡に大きく依存することがわかった。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:05:58 GMT)
Mapping Public Perception of Artificial Intelligence: Expectations, Risk-Benefit Tradeoffs, and Value As Determinants for Societal Acceptance [0.2] ドイツからの1100人の参加者の代表的サンプルを用いて,AIの精神モデルについて検討した。
参加者はAIの将来能力に関する71のステートメントを定量的に評価した。
我々は、これらの予測のランキングを、公共のリスクと利益のトレードオフを示す視覚マッピングと共に提示する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 20:03:01 GMT)
Tunable quantum router with giant atoms, implementing quantum gates, teleportation, non-reciprocity, and circulators [0.1] 巨大原子系は、革新的な量子光学現象と応用を探求するための新しいパラダイムを提供する。
本研究では,2重レール導波路に埋め込まれた巨大原子配置について検討し,散乱挙動を4ポートモデルに基づいて解析的に導出した。
本稿では,量子ストレージ,パス符号化量子ゲート,量子テレポーテーション,量子サーキュレータなどの量子応用を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:29:22 GMT)
How quantum computing can enhance biomarker discovery for multi-factorial diseases [0.1] 量子アルゴリズムは、特に機械学習において、バイオマーカー発見における重要な応用にマップされる。
アルゴリズムとアプリケーションに関連する機会と課題について論じる。
オープンな研究課題に関する見通しが提示されている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:36:00 GMT)
Knowledge-Augmented Explainable and Interpretable Learning for Anomaly Detection and Diagnosis [0.1] この章は、理解可能性、透明性、そして究極的には計算的センスメイキングを強化するために、知識に富んだ説明可能で解釈可能な学習に焦点を当てている。
異常検出と診断の領域における様々なアプローチと手法を実証する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 23:42:46 GMT)
Rephrasing Electronic Health Records for Pretraining Clinical Language Models [0.1] LLMを用いて既存の臨床ノートを書き換えて, 合成プレトレーニングコーパスを作成した。
異なるLSMから合成コーパスを付加したオリジナル臨床ノートの増補により,少額のトークン予算においても性能が向上することが判明した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:12:28 GMT)
Improved GUI Grounding via Iterative Narrowing [0.0] 本稿では,GUIにおける汎用モデルと微調整モデルの両方の性能を最大61%向上させるために,反復的絞り機構を用いた視覚的プロンプトフレームワークを提案する。
評価のために、様々なUIプラットフォームからなる包括的なベンチマークで手法を検証し、その結果を再現するコードを提供した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:24:27 GMT)
An Adversarial Learning Approach to Irregular Time-Series Forecasting [0.0] 本稿では,不規則な時系列のニュアンスをよりよく捉えるために,逆成分を深く分析した逆学習フレームワークを提案する。
本研究は、モデルと評価指標を改善するための実践的な洞察を提供し、不規則な時系列予測のドミアンにおける逆学習の適用の先駆者となる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:28:07 GMT)
Zero-shot Slot Filling in the Age of LLMs for Dialogue Systems [0.0] 本稿ではスロット誘導とブラックボックスの知識蒸留による自動データアノテーションの戦略を提案する。
コールセンター製品設定のための効率的なシステムアーキテクチャを導入し、市販の抽出モデルを34%の相対的なF1スコアで上回ります。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:02:25 GMT)
Zero Casimir Force in Axion Electrodynamics and the Search for a New Force [0.0] Weyl 半金属を包含する具体的な構成を考察し,電磁気学にアクシオン様の効果を呈する。
我々の装置は金属間のゼロカシミール力を実現し、微小スケールの光粒子を媒介する新しい力の探索に有用かもしれない。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:50:35 GMT)
Two-dimensional correlation propagation dynamics with a cluster discrete phase-space method [0.0] 高度に制御された量子系の非平衡力学は、統計物理学において難しい問題である。
一般SU($N$)スピン系に対する離散位相空間アプローチを開発する。
最近の実験では,クラスタの離散トラッピングウィグナー近似が重要な結果を再現できることを数値的に示している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:25:26 GMT)
Tracking Progress Towards Sustainable Development Goal 6 Using Satellite Imagery [0.0] 国連の持続可能な開発目標6は、清潔な水と衛生への普遍的なアクセスを目標としている。
データカバレッジとオープン性は、多くの国における進捗追跡の障害のままである。
本研究では,アフロバロメーターサーベイデータ,衛星画像,深層学習技術を活用し,管水・下水システムへのアクセスを評価するためのモデリングフレームワークを開発した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:13:46 GMT)
The role of data-induced randomness in quantum machine learning classification tasks [0.0] 平均ランダムネスと分類マージンの概念を融合させることにより、二項分類タスク(クラスマージン)の計量を導入する。
この計量は、与えられたデータ埋め込みマップの分類精度と、データ誘導ランダムネスを解析的に結合する。
我々は、クラスマージンを通じてデータ埋め込み戦略をベンチマークし、データ誘発ランダム性が分類性能に制限を与えることを示した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:26:35 GMT)
The Impact of Example Selection in Few-Shot Prompting on Automated Essay Scoring Using GPT Models [0.0] 本研究は,サンプル選択がAES(Au-tomated essay score)の性能に及ぼす影響を,GPTモデルを用いた少数ショットプロンプトを用いて検討する。
GPT-3.5 モデルと GPT-4 モデルの複数バージョンにおいて, 実例の選択と順序が, 実例選択に与える影響について検討した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 05:24:51 GMT)
The Hermeneutic Turn of AI: Are Machines Capable of Interpreting? [0.0] 本稿では、ディープラーニング(人工ニューラルネットワーク)によってコンピューティングのアプローチが破壊されていることを実証することを目的としている。
また、この運動と平行な点を強調し、人間のようなAIの考え方を軽視するために、ハーメニューティクスの哲学的伝統を論じている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 09:24:06 GMT)
Textured As-Is BIM via GIS-informed Point Cloud Segmentation [0.0] 本稿では,鉄道プロジェクトにおけるGISインフォームドとBIM対応のビルディング情報モデルの自動生成の概念実証について述べる。
その結果、コスト削減の可能性が高く、GISデータの非失業資源が内部に浮かび上がっていることが判明した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 04:13:08 GMT)
Supertrust foundational alignment: mutual trust must replace permanent control for safe superintelligence [0.0] 人類はいつか、私たちよりもはるかにインテリジェントなAIシステムを作るだろうと広く期待されています。
永続的な制御を確保するための現在の戦略は、超知能AIが人類を信用せず、我々を脅威と見なすであろうことを効果的に保証している。
コントロールの意図を継続するか、長期的な安全な共存に必要な基本的相互信頼を意図的に作り出すか。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:16:47 GMT)
Solving the Nonlinear Vlasov Equation on a Quantum Computer [0.0] ここでは (1 + 1) 次元格子上で離散化されたKrook型衝突作用素を用いた非線形静電ブラソフ方程式の写像について述べる。
プラズマパラメータが非物理値を取る場合にのみ量子アルゴリズムが収束することが保証されていることを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:32:30 GMT)
Solving coupled Non-linear Schrödinger Equations via Quantum Imaginary Time Evolution [0.0] 核ハートリー・フォック方程式の場合、そのような方程式の解として量子想像時間進化(ITE)アルゴリズムを提案する。
単純化されたスカイム相互作用モデルの下で、酸素-16核の基底状態エネルギーを計算し、その結果が古典的ITTアルゴリズムと一致することを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:40:10 GMT)
SmartLLMSentry: A Comprehensive LLM Based Smart Contract Vulnerability Detection Framework [0.0] 本稿では,大規模言語モデル(LLM)を利用したスマートコントラクト脆弱性検出手法であるSmartLLMSentryを紹介する。
モデルトレーニングと評価のために、ランダムに選択された5つの脆弱性の特別なデータセットを作成しました。
その結果, GPT-4 はルール生成における GPT-3 と比較して, 精度が 91.1% であることがわかった。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:02:01 GMT)
Skeleton Detection Using Dual Radars with Integration of Dual-View CNN Models and mmPose [0.0] 本研究は2つのmmWaveレーダを用いて、PointNetとmmPoseを組み合わせた3つのDual ViewCNNモデルを提案する。
提案モデルでは,無作為歩行に対する準最適結果を示すが,アームスイングの場合の方が優れている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:40:58 GMT)
Sharing the Path: A Threshold Scheme from Isogenies and Error Correcting Codes [0.0] 2022年、SIDHと呼ばれる顕著な超特異な等質性に基づく暗号スキームが、キーリカバリ攻撃によって妥協された。
本稿では,このツールと符号化技術を組み合わせて,新しいしきい値スキームを構築する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 01:21:44 GMT)
Shallow Quantum Scalar Products with Phase Information [0.0] 位相情報を持つスカラー積を演算するための2つの代替量子回路を導入する。
提案手法は,多数の量子ビットに対するゲート数を大幅に削減することを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 11:38:20 GMT)
Semidefinite relaxations for high-dimensional entanglement in the steering scenario [0.0] 高次元ステアリングシナリオにおける絡み合い特性のベンチマークのための半定値プログラミング階層を導入する。
本研究では,高次元システムにおける実験を直接的に解析できる手法の有用性を実証する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:05:23 GMT)
Self-guided tomography of time-frequency qudits [0.0] 高次元時間周波数符号化は、量子情報科学を著しく進歩させる可能性がある。
多出力量子パルスゲートを用いた時間周波数状態の推定に自己誘導トモグラフィーを適用した。
キャリブレーションや後処理を必要とせず, 3次元および5次元状態に対して99%以上の忠実度を実現した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:18:44 GMT)
Second-order correlation and squeezing of photons in cavities with ultrastrong magnon-photon interactions [0.0] 本研究は超強結合系における強磁性及び反強磁性キャビティに焦点をあてる。
2階相関関数の正確な積分解を導出することにより、反回転するマグノン-光子相互作用がキャビティモードで二次的スキューズを誘導することを示した。
異方性マグノン-キャビティ結合のチューニングは、マグノン-キャビティ・フォトンハイブリッドモードのレベル反発を変化させることで、スクイーズ効果を高める。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:17:01 GMT)
Road User Classification from High-Frequency GNSS Data Using Distributed Edge Intelligence [0.0] 現実世界の交通は、歩行者から重トラックまで多様な道路利用者を含んでいる。
従来のアプローチは、しばしば侵入型または高価な外部センサーに依存している。
本研究の目的は,高周波数(1-2Hz)の位置列を用いて,道路利用者分類の非侵襲的で費用対効果の高い代替手段を検討することである。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:51:02 GMT)
Relaxation dynamics in the (double) sine-Gordon model: An open-system viewpoint [0.0] 本研究では, 可積分性破壊が(二重)正弦-ゴルドンモデルの緩和力学に及ぼす影響について検討した。
本研究は,積分可能性破壊摂動の存在下では,緩和ダイナミクスが著しく高速であることを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:17:16 GMT)
Quantum-Optimal Frequency Estimation of Stochastic AC Fields [0.0] 周波数セントロイドと分離の正確な上限を求める。
この研究はAC信号センシングのための堅牢な枠組みを確立し、任意の周波数まで拡張することができる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 23:34:41 GMT)
Quantum feedback control with a transformer neural network architecture [0.0] 教師付き学習手法を用いて量子フィードバック制御におけるトランスフォーマーの利用を実証する。
本稿では,2段階システムの状態安定化の例を例に,我々のbespoke transformer アーキテクチャが短時間で目標状態への単位忠実性を達成できることを数値的に示す。
我々の手法は、量子誤差補正、色付きノイズの存在下での量子状態の高速制御、リアルタイムチューニング、量子デバイスの特性評価に利用できる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:42:30 GMT)
Quantum Correlations in One Parameter Mixed Quantum States [0.0] 混合状態 $(rhol,rhon,rhom)$ の比較力学を、外部磁場に曝露された二部晶イジング・ハミルトニアンの下で検討する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 04:56:55 GMT)
Proposal for simulating quantum spin models with the Dzyaloshinskii-Moriya interaction using Rydberg atoms and the construction of asymptotic quantum many-body scar states [0.0] 我々は、Rydberg原子量子シミュレータを用いて、Dzyaloshinskii-Moriya相互作用(DMI)を用いて量子スピンモデルをシミュレートする手法を開発した。
我々のアプローチは、2光子ラマン転移とスピン回転フレームへの変換を含む。
我々の設定ではシミュレートできるが固体系ではできないモデルとして、ゼーマンエネルギーからなるハミルトニアンを持つS=frac12$スピン鎖を考える。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:17:46 GMT)
Problem-tailored Simulation of Energy Transport on Noisy Quantum Computers [0.0] スピンと電荷は、量子多体系の挙動を特徴づけるのに基本的である。
今日の量子コンピュータはゲートエラーとコヒーレンス時間に悩まされている。
本稿では,これらの力学をシミュレートする新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 03:32:29 GMT)
Presenting a new approach in security in inter-vehicle networks (VANET) [0.0] 車両間ネットワークは、日々の作業に大きく貢献する、実行可能なコミュニケーションシナリオである。
そのため、車間ネットワークは情報技術の新たな形態として開発されている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 09:07:49 GMT)
Parallel and Mini-Batch Stable Matching for Large-Scale Reciprocal Recommender Systems [0.0] 相互推薦システム(RRS)は、オンラインの双方向マッチングプラットフォームにおいて不可欠である。
本稿では,並列およびミニバッチ計算を用いた相互レコメンデーションモデルのための新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:36:55 GMT)
Open-Source Molecular Processing Pipeline for Generating Molecules [0.0] 我々は、生成分子モデルを構築するためのオープンソースのインフラを広く使われているDeepChemライブラリに導入する。
特に、PyTorch [Paszke et al., 2019] に、MolGAN ( Molecular Generative Adversarial Networks) と正規化フローの高性能な実装を追加します。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 20:40:53 GMT)
On the matching arrangement of a graph,improper weight function problem and its application [0.0] 不適切な重み関数問題を示し、そのNP完全性の証明を示す。
不適切な重み関数問題に基づいて、knapsackのような公開鍵暗号システムを構築する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:53:25 GMT)
On the characterization of Schmidt number breaking and annihilating channels [0.0] シュミット数は量子状態の絡み合い次元を定量化する。
いくつかの量子チャネルはシュミット数を減らすことができる。
我々は、シュミット数消滅チャネルと呼ばれる新しい量子チャネルのクラスを導入する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:41:16 GMT)
On the Unknowable Limits to Prediction [0.0] ある種の誤りは差分速度で排除できると論じる。
我々は予測可能性が情報集合に依存し、予測不可能性の早期主張に注意を払っていることを論じる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:48:02 GMT)
OSPtrack: A Labeled Dataset Targeting Simulated Execution of Open-Source Software [0.0] このデータセットには9,461のパッケージレポートが含まれており、そのうち1,962が悪意のあるものである。
データセットには、ファイル、ソケット、コマンド、DNSレコードなどの静的および動的機能が含まれている。
このデータセットは実行時検出をサポートし、検出モデルトレーニングを強化し、エコシステム間の効率的な比較分析を可能にする。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:17:05 GMT)
Neural Networks-based Random Vortex Methods for Modelling Incompressible Flows [0.0] 本稿では,(2D)非圧縮性ナビエ-ストークス方程式に対する解を近似するためのニューラルネットワークに基づく新しい手法を提案する。
我々のアルゴリズムはニューラルネットワーク(NN)を用いており、ランダム渦ダイナミクスの計算効率の良い定式化を利用する損失関数に基づいて渦性を近似している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 17:53:41 GMT)
Multi-product Zeno effect with higher order convergence rates [0.0] 量子ゼノ効果は、希望部分空間に収束する任意の量子演算により、投影されたハミルトンあるいはリンドブラディアンの力学を近似する。
我々は多積式を用いて収束率を改善し、1/nK+1$の任意のパワーを達成し、Chernoff Lemmaの修正、Dunford-Segal近似の修正、および正則関数計算を用いた。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 23:03:05 GMT)
Monitoring Human Dependence On AI Systems With Reliance Drills [0.0] 人間は、自分自身でより良い決断を下すであろうとしても、AIが生み出すアドバイスに過信している。
本稿では,AIによるアドバイスにおいて,人間が誤りを認識できるかどうかを判定する演習を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:37:24 GMT)
Metric-DST: Mitigating Selection Bias Through Diversity-Guided Semi-Supervised Metric Learning [0.0] 自己学習のような半教師付き学習戦略は、ラベルなしデータをモデルトレーニングに組み込むことで選択バイアスを軽減することができる。
本稿では,距離学習とその暗黙の埋め込み空間を活用し,信頼度に基づくバイアスに対処する多様性誘導型自己学習戦略であるMetric-DSTを提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:34:30 GMT)
MSG score: A Comprehensive Evaluation for Multi-Scene Video Generation [0.0] 本稿では,連続シナリオに基づくマルチシーンビデオの生成に必要なメトリクスについて述べる。
ビデオ生成では、単一の画像とは異なり、フレーム間の文字の動きは歪みや意図しない変化のような潜在的な問題を引き起こす。
本稿では,このプロセスを自動化するスコアベース評価ベンチマークを提案し,これらの複雑さをより客観的かつ効率的に評価する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:11:50 GMT)
Loss induced collective mode in one-dimensional Bose gases [0.0] 本研究では, 2体損失は, 調和に閉じ込められた1次元ボース気体の集合励起を誘導することを示した。
また, ガスの位相空間四重極モードだけでなく, 位置, 急速空間においても, 気体の幅の明確なコヒーレント振動が観測された。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:33:46 GMT)
Limitations of Quantum Approximate Optimization in Solving Generic Higher-Order Constraint-Satisfaction Problems [0.0] 量子近似最適化アルゴリズムの最適化問題に対する量子優位性を実現する能力はまだ不明である。
ランダムなMax-$k$XOR上でのQAOAの性能を$k$の関数と節対変数比として解析する。
満足度の高いレベルに達するには、非常に大きな$p$が必要であり、変動コンテキストと短期デバイスの両方において、かなり難しいとみなす必要がある。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 21:39:58 GMT)
Learning to Embed Distributions via Maximum Kernel Entropy [0.0] 固有データは、確率分布の集合からのサンプルと見なすことができる。
カーネルメソッドは、これらの分布を分類する学習の自然なアプローチとして現れてきた。
データ依存分散カーネルの教師なし学習のための新しい目的を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:20:26 GMT)
Laser writing and spin control of near infrared emitters in silicon carbide [0.0] 炭化ケイ素の近赤外放射は量子技術、特に単一光子放出とスピン量子ビットに関係している。
直接レーザーライティングと熱焼鈍は, 室温での空孔のスピンコヒーレンス時間を保ちながら, テレコム近傍の発光を明るくすることができることを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:25:06 GMT)
Introducing Three New Benchmark Datasets for Hierarchical Text Classification [0.0] 研究出版分野において,HTCのベンチマークデータセットを新たに3つ導入する。
本稿では,データセットの信頼性とロバスト性を改善するために,それらの分類を組み合わせるアプローチを提案する。
クラスタリングに基づく分析によって作成した3つのデータセットを評価し,提案手法が高品質なデータセットを実現することを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:06:48 GMT)
Integrating Transit Signal Priority into Multi-Agent Reinforcement Learning based Traffic Signal Control [0.0] 本研究では,交通信号優先性(TSP)をマルチエージェント強化学習(MARL)に基づく交通信号制御に統合する。
2つのエージェントは、各交差点毎に、価値分解ネットワーク(VDN)アーキテクチャを用いて集中的に訓練される。
訓練されたエージェントは、0.95のv/cでの全体的な交差点遅延に基づいて、調整された作動信号制御よりも若干性能が向上した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 20:09:12 GMT)
Integrating SPARQL and LLMs for Question Answering over Scholarly Data Sources [0.0] 本稿では,SPARQLクエリを合成し,アルゴリズムを分割・征服する手法と,事前学習した抽出質問応答モデルについて述べる。
まずSPARQLクエリからデータを収集し、次に分割と分割を適用してさまざまな質問タイプとソースを管理し、モデルを使用して個人的な著者の質問を処理する。
Exact MatchとFスコアのメトリクスで評価されたこの手法は、学術的な文脈におけるQAの精度と効率を改善することを約束している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 20:29:44 GMT)
Integrating Functionalities To A System Via Autoencoder Hippocampus Network [0.0] ポリシー関数のパラメータに対するオートエンコーダに基づく記憶法を提案する。
オートエンコーダのエンコーダはポリシー関数のパラメータをスキルベクトルにマッピングし、デコーダはこのスキルベクトルを介してパラメータを検索する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:25:25 GMT)
Injectivity of ReLU-layers: Tools from Frame Theory [0.0] インジェクティビティ(英: Injectivity)とは、情報を失うことなく、その出力から任意の入力を再構成できるマッピングの定義特性である。
本稿では,この問題にアプローチするためのフレーム理論的視点を確立する。
本稿では,ReLU層中の3つの成分を総合的に解析し,そのインジェクティビティ特性について考察する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:18:42 GMT)
Improving sub-seasonal wind-speed forecasts in Europe with a non-linear model [0.0] 本研究では,500hPaの地磁気高度(Z500)と表面風速との非線形関係を利用して,ヨーロッパにおけるサブシーズン風速予測技術を向上する可能性について検討した。
提案するフレームワークは、MLR(Multiple Linear Regression)またはCNN(Convolutional Neural Network)を用いて、表面風速をZ500から推算する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 11:53:59 GMT)
Impact of leakage to the dynamic of a ST$_0$ qubit implemented on a Double Quantum Dot device [0.0] 二重量子ドットデバイスに符号化されたスピン量子ビットのゲート時間進化における漏れの影響について検討する。
我々は、弱い相互作用状態において、漏洩が時間進化作用素の位相変化をもたらすことを証明した。
これはフォールトトレラントアルゴリズムの実行に不可欠であり、量子エラー除去技術に有用である。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:34:23 GMT)
Harden Deep Neural Networks Against Fault Injections Through Weight Scaling [0.0] そこで本研究では,DNNの重み付けを一定値に乗じてハード化する手法を提案する。
本手法は,ビットフリップからの誤差が付加雑音に類似した特性を持つことを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:47:23 GMT)
Generating Sets of Stochastic Matrices [0.0] 行列の文脈で可視性を形式化するフレームワークを開発する。
分割不可能な要素を指定することにより、次元に対する生成集合を2ドルと3ドルに構成する。
半群全体の生成に必要な因子の数について上限を与える。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:27:49 GMT)
Fast, accurate, and error-resilient noise spectroscopy via basis optimization [0.0] 本稿では、一般に実行される動的デカップリングに基づくコヒーレンス測定を処理する方法を提案する。
ダイヤモンド中の窒素空孔センサのノイズスペクトルを再構成するために,本手法を用いた。
提案手法のノイズスペクトル再構成により,従来考えられていなかった構造が明らかとなり,前例のない精度が得られた。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 00:35:05 GMT)
Fast pulsed photoemission from a double quantum well on a dielectric substrate as a dynamic process of inverse LEED leading to the generation of a charge and current density wave [0.0] 基板上に二重量子井戸で形成された平らな薄膜フォトエミッタからのパルス光電子放出について検討した。
漸近的な推定は、波状パケットの進化と極端位相パケットの概念と最速降下という観点から行われる。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 07:10:49 GMT)
Examining Multimodal Gender and Content Bias in ChatGPT-4o [0.0] ChatGPT-4oは、暴力や薬物使用に対する寛容さを示しながら、性的内容とヌードを一貫して検閲する。
女性特有のコンテンツは、男性固有のコンテンツよりも厳格な規制に直面している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:41:44 GMT)
Entanglement dynamics of two modes coupled through a dissipative movable mirror in an optomechanical system [0.0] 損失がない場合には、コヒーレント状態の積からなる分離可能な状態が絡み合った状態へと進化する。
2モードのSchr"odinger-cat状態の生成は、オプティメカルカップリングに依存することを示す。
その結果,鏡の機械的損失はシステム全体の絡み合いを減少させることがわかった。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 11:55:09 GMT)
Enhancing weed detection performance by means of GenAI-based image augmentation [0.0] 本稿では、安定拡散モデルを用いて、雑草検出モデルのための多様な合成画像を生成する、生成AIベースの拡張手法について検討する。
その結果、生成AI拡張データセットでトレーニングしたYOLOモデルの平均精度が大幅に向上した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 09:33:06 GMT)
Enhancing Neural Network Robustness Against Fault Injection Through Non-linear Weight Transformations [0.0] 本研究は飽和活性化関数(SAF)の適用によるDNN重みの制約に焦点を当てる。
SAFは、DNN重みが過大に大きくなる原因となる欠陥を防ぎ、モデル故障を引き起こす可能性がある。
本稿では,FP32 ResNet18とImageNet 2012のビット誤り率0.00001で動作し,精度を低下させる手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:01:39 GMT)
Enhanced Lieb-Robinson bounds for commuting long-range interactions [0.0] 量子多体系における情報伝達における長距離相互作用の複雑な効果を示す。
私たちのモチベーションの一部は、量子エラー訂正コードに起因しています。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:20:52 GMT)
Electroweak parameters from mixed SU(2) Yang-Mills Thermodynamics [0.0] 純SU(2)量子ヤン・ミルズ理論の熱相構造に基づいて、静止中の電子を拡張粒子として記述する。
この滴は圧力を消し、温度がT_c=7.95$ keVでバルク内にモノポールをトラップする。
モノポールはBogomolny-Prasad-Sommerfield(BPS)極限である。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 22:25:11 GMT)
Electricity Price Prediction Using Multi-Kernel Gaussian Process Regression combined with Kernel-Based Support Vector Regression [0.0] 本稿では,ドイツの電力価格を予測するためのハイブリッドモデルを提案する。
このアルゴリズムはガウス過程回帰(GPR)とサポート回帰ベクトル(SVR)を組み合わせたものである。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 10:32:50 GMT)
Efficient Learning Content Retrieval with Knowledge Injection [0.0] そこで本研究では,学習者の学習コンテンツ提供を支援するために,Phi言語モデルのバージョンを利用して,限られたリソースを必要とするドメイン固有アプリケーションを提案する。
微調整に必要なデータはHuaweiタレントプラットフォームから取得した。
RAGシステムは500対のQ&Aペアによって微調整されたモデルをサポートするために使用された。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 12:06:14 GMT)
Dynamic Taint Tracking using Partial Instrumentation for Java Applications [0.0] 動的テイント追跡はアプリケーションを計測することで達成される。
本稿では,動的テナント追跡を適切なランタイムオーバーヘッドで実現するための部分的計測法を提案する。
Dacapoベンチマークのいくつかのテスト実行では、完全なインスツルメンテーションを実行するPhosphorバージョンよりも大幅にパフォーマンスが向上している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 19:58:54 GMT)
Det-SAM2:Technical Report on the Self-Prompting Segmentation Framework Based on Segment Anything Model 2 [0.0] 本報告では,Det-SAM2フレームワーク全体の構築と,SAM2に適用されたその後の工学的最適化について述べる。
我々は,Det-SAM2フレームワーク上に構築されたアプリケーションを実演する事例を提示する: ビジネスコンテキストから派生したビリヤードシナリオにおけるAIレファリング。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 07:58:30 GMT)
Designer gapped and tilted Dirac cones in lateral graphene superlattices [0.0] グラフェン中の平面型バイポーラ導波路は電子バンド構造内のギャップと傾斜した2次元ディラック円錐の工学に利用できることを示す。
本論文は,側方グラフェン超格子におけるゲート可変デバイス応用におけるディラックコーンの傾きとギャップ工学の促進を期待する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:51:58 GMT)
Descriptions of women are longer than that of men: An analysis of gender portrayal prompts in Stable Diffusion [0.0] われわれは、Discordで男女を描写した180万件以上のプロンプトを分析している。
ストロングやラグドといった支配的な特徴を用いて男性が記述される古典的なステレオタイプを見いだす。
女性は身体や提出に関する概念で表現される:「美人」「美人」など。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:48:05 GMT)
Demographic Predictability in 3D CT Foundation Embeddings [0.0] 自己組織化基礎モデルはCT画像の符号化に成功している。
これらの埋め込みが年齢、性別、人種などの人口統計情報をキャプチャするかどうかを評価する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 04:26:39 GMT)
Deformed algebraic structure of angular momenta: GUP perspective [0.0] 一般化不確実性原理(GUP)の起源を考察し,高次モデルについて検討する。
極小長の概念を極小角分解へ拡張し、角運動量とその関連代数を変更する上で重要な役割を果たす。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 04:25:11 GMT)
Deep Plug-and-Play HIO Approach for Phase Retrieval [0.0] 位相探索問題では、強度のみの測定から未知の画像の復元が目的である。
最近の学習に基づくアプローチは、いくつかの逆問題に対する分析手法の強力な代替手段として現れている。
学習ベースとe!cientの更新ステップを活用する,新しいプラグイン・アンド・プレイアプローチが紹介されている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 07:36:29 GMT)
Deep Learning for GWP Prediction: A Framework Using PCA, Quantile Transformation, and Ensemble Modeling [0.0] 本研究は, 完全連結ニューラルネットワークを用いた単成分冷媒の100年間の温暖化ポテンシャル(GWP 100)を推定する。
RDKitベースのモデルは481.9のRoot Mean Square Error(RMSE)と0.918のR2スコアで最高のパフォーマンスを達成した。
因子分析により, 分子量, 脂肪分解能, ニトリルやアリルオキシドなどの官能基などの重要な分子的特徴がGWP値に重要な寄与因子として同定された。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:16:12 GMT)
Convergence of bipartite open quantum systems stabilized by reservoir engineering [0.0] 開量子系をモデル化したリンドブラッドマスター方程式の一般族について検討する。
我々は,多光子放出吸収法を応用したリンドブラッドマスター方程式モデルに適用した。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 18:04:55 GMT)
Consolidating and Developing Benchmarking Datasets for the Nepali Natural Language Understanding Tasks [0.0] 8つの新しいデータセットを導入し、新しいベンチマーク、ネパール言語理解評価(NLUE)ベンチマークを作成します。
このベンチマークでは、さまざまな自然言語理解(NLU)タスクでモデルのパフォーマンスを評価するために、合計12のタスクがカバーされている。
追加タスクを用いたモデルの評価では、既存のモデルでは複雑なNLUタスクを効果的に処理できないことが観察される。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 16:32:02 GMT)
Capstone Experiences in Developing Augmented Reality Tables for Community Organizations [0.0] 本稿では,過去2年間に拡張現実テーブルとして開発された2つの上級キャップストーン体験について検討する。
最初のプロジェクトは天文学センターで展開され、ハワイ島の土地利用と生態学的側面の相互作用に焦点を当てた。
第2のプロジェクトは、同じ島の史跡に重点を置いている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:02:30 GMT)
Boundary Condition and the Auxiliary Phase in Feynman Path Integral [0.0] 補助的なフェーズは、各サマンドの重みとして含まなければならないことが多い。
種々の境界条件の位相因子の性質について考察する。
線形セグメントに閉じ込められた自由粒子に対して、プロパゲータの結果として得られる公式は、シュロディンガー方程式から生じる粒子と一致することを検証する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 06:10:53 GMT)
Bone: Block-Affine Adaptation of Large Language Models [0.0] Low-Rank Adaptation (LoRA)は、オリジナルの重量を凍結し、低ランクの行列のみを訓練することで、優れたトレーニング結果を得た。
多くのロラ型が登場したが、LLMの重量に合わせた設計が欠けている。
LoRAとは異なる新しいPEFT技術であるBlock-Affine Adaptation (Bone)を提案する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 08:15:05 GMT)
Artificial intelligence and cybersecurity in banking sector: opportunities and risks [0.0] 機械学習(ML)により、システムは巨大なデータセットに適応し、学習することができる。
この研究は、悪意のあるユーザーが使用できるAIツールのデュアルユース性を強調している。
この論文は、セキュリティ、信頼、レジリエンス、堅牢性といった重要な特徴を持つ機械学習モデルを開発することの重要性を強調している。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 22:09:55 GMT)
Applying IRT to Distinguish Between Human and Generative AI Responses to Multiple-Choice Assessments [0.0] 評価に複数の選択質問が広く使用されているにもかかわらず、AI不正の検出はほとんど調査されていない。
本稿では,このギャップに対処するための項目応答理論の適用法を提案する。
我々のアプローチは、人工知能と人間の知性が異なる応答パターンを示すという仮定に基づいている。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 09:43:06 GMT)
ANDHRA Bandersnatch: Training Neural Networks to Predict Parallel Realities [0.0] この研究は、同じ入力信号を各レイヤで並列ブランチに分割する、新しいニューラルネットワークアーキテクチャを導入している。
分岐されたレイヤはマージされず、別々のネットワークパスを形成し、出力予測のために複数のネットワークヘッドが生成される。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:36:34 GMT)
A spiking photonic neural network of 40.000 neurons, trained with rank-order coding for leveraging sparsity [0.0] ニューロンレベルでの加法的および乗法的なガウスホワイトノイズがネットワークの精度に与える影響を考察する。
我々はいくつかのノイズ低減手法を分類タスクの基本設定に適用する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 15:28:30 GMT)
A Trade-Off Between Path Entanglement and Quantum Sensitivity [0.0] 絡み合いはしばしば量子測定スキームの感度を高める。
単一モード位相シフトの測定におけるエンタングルメントエントロピーと感度の逆関係を証明した。
経路間の絡み合いを最小化することは、ゼロ平均ガウス状態入力を持つN$モード系の位相感度を最大化することを示す。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 00:33:13 GMT)
A Lean Dataset for International Math Olympiad: Small Steps towards Writing Math Proofs for Hard Problems [0.0] IMO 2022と2023の3つの余分な問題とともに、Leanの残りの13のIMO問題に対する完全な、オリジナルの公式な証明を書いています。
論文の目的は、MiniF2F以降のすべてのIMO問題の正式な証明を自動で書けるAIモデルを開発するための道を開くことである。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 02:50:42 GMT)
A Game-Theoretic Approach to the Study of Blockchain's Robustness [0.0] この論文はブロックチェーンプロトコルの堅牢性、特にProof-of-Stakeに注目している。
ブロックチェーンが永続的な競合ブロックを持たないことを保証するSafetyと、新しい信頼性のあるブロックを継続的に追加することを保証するLivenessという2つの重要な特性で堅牢性を定義しています。
我々の研究は、エージェントを正直またはビザンツのどちらかに分類する従来の分散システムアプローチと、インセンティブによって駆動される合理的なエージェントを考慮したゲーム理論モデルとのギャップに対処する。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 14:29:14 GMT)
A Comparative Analysis of Vulnerability Management Tools: Evaluating Nessus, Acunetix, and Nikto for Risk Based Security Solutions [0.0] 本稿では,Nessus,Acunetix,Niktoの3つの広く利用されている脆弱性管理ツールの比較分析を行った。
各ツールは、検出精度、CVSS(Common Vulnerability Scoring System)を使用したリスクスコア、使いやすさ、自動化とレポート機能、パフォーマンスメトリクス、コスト効果に基づいて評価される。
論文参考訳(メタデータ) (Thu, 28 Nov 2024 13:14:24 GMT)