Ego-Exo4D: Understanding Skilled Human Activity from First- and
Third-Person Perspectives [194.5] Ego-Exo4Dは、熟練した人間の活動を同時に捉えたエゴセントリックでエゴセントリックなビデオを中心にしている。
世界の13都市から800人以上の参加者が131の異なる自然シーンでこれらの活動を行った。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 05:21:07 GMT)
In-Context Pretraining: Language Modeling Beyond Document Boundaries [145.4] In-Context Pretrainingは、言語モデルが関連するドキュメントのシーケンスで事前トレーニングされる新しいアプローチである。
本稿では, 近接探索を効率的に行うための近似アルゴリズムを提案する。
より複雑なコンテキスト推論を必要とするタスクの顕著な改善が見られます。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 23:26:35 GMT)
EXIM: A Hybrid Explicit-Implicit Representation for Text-Guided 3D Shape
Generation [124.3] 本稿では,3次元形状を生成するための新しいテキスト誘導手法を提案する。
我々は,明示的表現と暗黙的表現の強みを組み合わせたハイブリッド3D表現,すなわちEXIMを活用する。
テキスト誘導型3次元形状を用いた室内シーンを一貫したスタイルで生成する手法の適用性を示した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:02:57 GMT)
CLOMO: Counterfactual Logical Modification with Large Language Models [113.7] 本稿では,新しいタスク,CLOMO(Counterfactual Logical Modification)と高品質な人間アノテーションベンチマークを紹介する。
生成モデルのカウンターファクトの能力を効果的に評価するために,革新的な評価指標であるLogicAware Counterfactual Scoreを提案する。
分析の結果,提案手法は人間の好みとよく一致していることがわかった。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 04:23:58 GMT)
X-InstructBLIP: A Framework for aligning X-Modal instruction-aware
representations to LLMs and Emergent Cross-modal Reasoning [113.6] 視覚言語による事前学習と指導訓練は、2次元視覚推論タスクにおいて汎用的な機能を示した。
凍結した大言語モデル(LLM)上に構築された、シンプルで効果的で効果的なクロスモダリティフレームワークを紹介します。
オーディオ用24KQAサンプルと3D用250KQAサンプルからなる,高品質な命令チューニングデータを自動,スケーラブルに収集する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:43:51 GMT)
Diffusion Models Without Attention [110.6] Diffusion State Space Model (DiffuSSM) は、よりスケーラブルな状態空間モデルバックボーンで注目メカニズムを置き換えるアーキテクチャである。
拡散訓練におけるFLOP効率の高いアーキテクチャへの注力は、大きな前進となる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 05:15:35 GMT)
Uncertainty in Graph Contrastive Learning with Bayesian Neural Networks [101.6] 変分ベイズニューラルネットワークは不確実性推定を改善するために有効であることを示す。
比較学習における不確実性の新たな尺度を提案するが、これは異なる正のサンプルによる可能性の相違に基づくものである。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 22:32:24 GMT)
Deep Equilibrium Based Neural Operators for Steady-State PDEs [100.9] 定常PDEに対する重み付けニューラルネットワークアーキテクチャの利点について検討する。
定常PDEの解を直接解くFNOアーキテクチャの深い平衡変種であるFNO-DEQを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 22:34:57 GMT)
Grammatical Gender's Influence on Distributional Semantics: A Causal
Perspective [100.5] 言語間のジェンダーの割り当てにどの程度の意味が影響するかは、現代言語学と認知科学における活発な研究分野である。
我々は、名詞の文法的性別、意味、形容詞選択の間の相互作用を共同で表現する、新しい因果的グラフィカルモデルを提供する。
文法的ジェンダーが形容詞選択にほぼゼロ効果があることに気付き、ネオ・ヴォルフの仮説を疑問視する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:58:13 GMT)
AlignBench: Benchmarking Chinese Alignment of Large Language Models [100.3] 中国語大言語モデルのアライメントを評価するための総合ベンチマークであるAlignBenchを紹介する。
筆者らのベンチマークでは,多次元LCM-as-JudgeとChain-of-Thoughtを用いて,説明と最終評価を評価として用いた。
また, GPT-4の評価能力の95%を回復する専用コンパニオン評価器であるCritiqueLLMを開発した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:41:30 GMT)
ART$\boldsymbol{\cdot}$V: Auto-Regressive Text-to-Video Generation with
Diffusion Models [99.8] ART$boldsymbolcdot$Vは拡散モデルを用いた自動回帰ビデオ生成のための効率的なフレームワークである。
隣接するフレーム間の単純な連続的な動きしか学ばない。
様々なプロンプトで調整された、任意に長いビデオを生成することができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:59:47 GMT)
DocPedia: Unleashing the Power of Large Multimodal Model in the
Frequency Domain for Versatile Document Understanding [98.4] 本研究は, OCRフリー文書理解のための新しい大規模マルチモーダルモデル(LMM)であるDocPediaを提案する。
既存の作業では高解像度のドキュメントで苦労したり、大きな言語モデルを捨てたり、視覚や言語能力に制約があったりするのに対して、DocPediaでは、ピクセル空間ではなく、周波数領域の視覚入力を直接処理しています。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 08:27:38 GMT)
MotionEditor: Editing Video Motion via Content-Aware Diffusion [96.8] MotionEditorはビデオモーション編集のための拡散モデルである。
新たなコンテンツ対応モーションアダプタをControlNetに組み込んで、時間的モーション対応をキャプチャする。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:59:33 GMT)
VIDiff: Translating Videos via Multi-Modal Instructions with Diffusion
Models [96.6] Video Instruction Diffusion (VIDiff) は、幅広いビデオタスク用に設計された統合基盤モデルである。
我々のモデルは,ユーザの指示に基づいて,所望の結果を数秒以内に編集し,翻訳することができる。
様々な入力ビデオや書き起こしに対して,質的かつ定量的に,説得力のある生成結果を提供する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:59:52 GMT)
SMaRt: Improving GANs with Score Matching Regularity [94.8] GAN(Generative Adversarial Network)は通常、その基礎となる多様体が複雑である非常に多様なデータから学ぶのに苦労する。
スコアマッチング規則性(SMaRt)を用いたGANの最適化を提案する。
提案手法は,実世界のデータセット上で,様々な最先端のGANの合成性能を一貫して向上させることができることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:05:14 GMT)
Exploiting Diffusion Prior for Generalizable Pixel-Level Semantic
Prediction [93.4] 我々は、画素レベルのセマンティック予測タスクの先行として、事前訓練されたT2Iモデルを導入する。
我々は一連の実験を通して拡散過程を再構成し、入力されたRGB画像と出力予測分布との決定論的マッピングを確立する。
限られたドメインのトレーニングデータにもかかわらず、この手法は任意の画像に対して忠実に推定し、既存の最先端のアルゴリズムを超越する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:59:44 GMT)
DNS SLAM: Dense Neural Semantic-Informed SLAM [92.4] DNS SLAMは、ハイブリッド表現を備えた新しいRGB-DセマンティックSLAMアプローチである。
本手法は画像に基づく特徴抽出と多視点幾何制約を統合し,外観の細部を改良する。
実験により, 合成データと実世界のデータ追跡の両面において, 最先端の性能が得られた。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 21:34:44 GMT)
On Context Utilization in Summarization with Large Language Models [91.6] 大言語モデル(LLM)はゼロショット抽象的な要約タスクに優れる。
本稿では,これらのモデルがどのようにそれらの入力を抽象的な要約に活用するかを検討する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:37:20 GMT)
CritiqueLLM: Scaling LLM-as-Critic for Effective and Explainable
Evaluation of Large Language Model Generation [89.8] 我々は、CrytiqueLLMと呼ばれる新しい批評生成モデルを提案する。
実験結果から,GPT-4に匹敵する評価性能が得られた。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:52:42 GMT)
Extensible Prompts for Language Models on Zero-shot Language Style
Customization [89.2] X-Promptは、自然言語(NL)を超えた大きな言語モデル(LLM)を指示する
新しい想像的単語を登録することで、LLMにNL単語で記述するのが難しい概念を理解するよう指示することができる。
これらの虚構語は、様々なプロンプトでNL語のように(再)使用できるように、分布外頑健であるように設計されている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 20:11:14 GMT)
CoDi-2: In-Context, Interleaved, and Interactive Any-to-Any Generation [88.3] CoDi-2は汎用的でインタラクティブなマルチモーダル言語モデル(MLLM)である
複雑なマルチモーダルなインターリーブ命令に従うことができ、ICL(In-context Learning)、理性、チャット、編集などを実行することができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:21:25 GMT)
Predicting Emergent Abilities with Infinite Resolution Evaluation [88.2] 本稿では,デコードフェーズにおける大規模なサンプリングを通じて,理論的に無限の分解能を持つ評価戦略であるPassUntilを紹介する。
トレーニング開始前に0.05%の偏差でコード生成における2.4Bモデルの性能を予測する。
スケーリング曲線が標準スケーリング法則関数に適合できないような,高速化された出現の種を同定する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 08:58:50 GMT)
DifAugGAN: A Practical Diffusion-style Data Augmentation for GAN-based
Single Image Super-resolution [88.1] 本稿では,DifAugGAN として知られる GAN ベースの画像超解像法(SR) のための拡散型データ拡張手法を提案する。
それは、訓練中の判別器の校正を改善するために、生成拡散モデルに拡散過程を適用することを含む。
我々のDifAugGANは、現在のGANベースのSISR手法のプラグ・アンド・プレイ戦略であり、判別器の校正を改善し、SR性能を向上させることができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:37:53 GMT)
Dichotomy of Early and Late Phase Implicit Biases Can Provably Induce
Grokking [86.4] Powerらによる最近の研究は、算術のタスクを学習する際の驚くべき"グロキング"現象を強調した。
ニューラルネットワークはまずトレーニングセットを“記憶”し、完全なトレーニング精度を持つが、ほぼランダムなテスト精度を実現する。
本論文は, 理論設定におけるグルーキング現象を考察し, 初期および後期の暗黙バイアスの2分法により誘導可能であることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:55:38 GMT)
TaskBench: Benchmarking Large Language Models for Task Automation [85.4] タスク自動化における大規模言語モデルの能力を評価するためにTaskBenchを導入します。
高品質な評価データセットを生成するために,ツールグラフの概念を導入する。
また,タスク分解,ツールの実行,パラメータ予測など,さまざまな側面からLCMの能力を評価するためのTaskEvalを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:02:44 GMT)
Match me if you can: Semantic Correspondence Learning with Unpaired
Images [82.1] 制限された画像対とスパース点対の両方を補完する、ラベルのないペアでトレーニングを行う、単純で効果的な方法を提案する。
簡単な教師/学生の枠組みを用いて,学生ネットワークに信頼性の高い擬似通信を機械の監督を通じて提供する。
我々のモデルは,セマンティック対応ベンチマークの最先端手法を含む,マイルストーンベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:22:15 GMT)
Domain Adaptation: Learning Bounds and Algorithms [80.9] 本稿では,任意の損失関数を持つ適応問題に適した分布距離,差分距離を新たに導入する。
広い損失関数族に対する領域適応のための新しい一般化境界を導出する。
また、正規化に基づくアルゴリズムの大規模クラスに対する新しい適応境界も提示する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 22:47:15 GMT)
Editing 3D Scenes via Text Prompts without Retraining [80.6] DN2Nはテキスト駆動編集方式であり、普遍的な編集機能を備えたNeRFモデルの直接取得を可能にする。
本手法では,2次元画像のテキストベース編集モデルを用いて3次元シーン画像の編集を行う。
本手法は,外観編集,天気変化,材質変化,スタイル伝達など,複数種類の編集を行う。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:59:28 GMT)
Beyond Two-Tower Matching: Learning Sparse Retrievable
Cross-Interactions for Recommendation [80.2] 2-towerモデルは、産業アプリケーションに広くデプロイされている推奨のための一般的なマッチングフレームワークである。
機能間相互作用の制限と、オンラインサービスにおける精度の低下など、主な課題が2つある。
我々は,高度な機能相互作用だけでなく,効率的な検索もサポートするSparCodeという新しいマッチングパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:13:36 GMT)
TCP:Textual-based Class-aware Prompt tuning for Visual-Language Model [78.8] 本稿では,テキストベースのクラス認識型Promptチューニング(TCP)を提案する。
TCPは、トレーニング時間の短縮を要求しながら、常に優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:59:23 GMT)
Towards Safer Generative Language Models: A Survey on Safety Risks,
Evaluations, and Improvements [76.8] 本調査では,大規模モデルに関する安全研究の枠組みについて述べる。
まず、広範囲にわたる安全問題を導入し、その後、大型モデルの安全性評価手法を掘り下げる。
トレーニングからデプロイメントまで,大規模なモデルの安全性を高めるための戦略について検討する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:39:19 GMT)
Initializing Models with Larger Ones [76.4] 事前訓練された大モデルから重みのサブセットを選択することにより、より小さなモデルを初期化する手法である重み選択を導入する。
実験により, 重量選択は小型モデルの性能を著しく向上し, トレーニング時間を短縮できることが示された。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:58:26 GMT)
Language Model Agents Suffer from Compositional Generalization in Web
Automation [74.8] 言語モデルエージェント(LMA)は、ミューティステップ決定タスクにおける有望なパラダイムとして登場した。
約束にもかかわらず、現実世界のアプリケーションでの彼らのパフォーマンスはまだ過小評価されている。
既存のLMAはベースタスクで平均94.0%の成功率を達成したが、その性能は構成タスクで平均24.9%に低下した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:50:47 GMT)
Multi-Modal Video Topic Segmentation with Dual-Contrastive Domain
Adaptation [74.5] ビデオトピックセグメンテーションは、ビデオの基礎となる粗い粒度のセマンティック構造を明らかにする。
ビデオの書き起こしとフレームの両方を利用するマルチモーダルなビデオトピックセグメンタを提案する。
提案手法は, 精度と転送性の両方の観点から, ベースライン法をはるかに上回っている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 21:59:05 GMT)
mPLUG-PaperOwl: Scientific Diagram Analysis with the Multimodal Large
Language Model [73.4] 本研究はマルチモーダルLLMのマルチモーダルダイアグラム解析機能を強化することに焦点を当てる。
高品質な論文のLatexソースファイルを解析することにより、マルチモーダルなダイアグラム理解データセットM-Paperを慎重に構築する。
M-Paperは、画像やラテックス符号のフォーマットの数字や表を含む、複数の科学的図の合同理解をサポートする最初のデータセットである。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 04:43:26 GMT)
Caterpillar: A Pure-MLP Architecture with Shifted-Pillars-Concatenation [72.3] Shifted-Pillars-Concatenation (SPC)モジュールは、より優れたローカルモデリングパワーとパフォーマンス向上を提供する。
我々は、SMLPNetのハイブリッドモデルにおいて、畳み込み層をSPCモジュールに置き換えることで、Caterpillarと呼ばれる純粋なMLPアーキテクチャを構築します。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:06:42 GMT)
Continual Diffusion with STAMINA: STack-And-Mask INcremental Adapters [72.2] 近年の研究では、テキストから画像への拡散モデルを複数の微細な概念に逐次的にカスタマイズできることが示されている。
我々は、新しいタスクを学習する能力が、長いシーケンスで飽和に達することを示す。
本稿では,低ランクの注意マーク付きアダプタとカスタマイズトークンからなるSTAMINA(STack-And-Mask Incremental Adapters)を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:04:21 GMT)
TLControl: Trajectory and Language Control for Human Motion Synthesis [72.2] 本稿では,人間のリアルな動き合成のための新しい手法であるTLControlを提案する。
まず、VQ-VAEをトレーニングし、ボディパーツによって構成されたコンパクトな潜伏運動空間を学習する。
そこで我々は,関節の完全な軌跡の粗い初期予測を行うMasked Trajectories Transformerを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 20:36:16 GMT)
TransXNet: Learning Both Global and Local Dynamics with a Dual Dynamic
Token Mixer for Visual Recognition [71.7] 本稿では,グローバルな情報と局所的な詳細を入力依存の方法で集約する軽量なDual Dynamic Token Mixer (D-Mixer)を提案する。
我々は、新しいハイブリッドCNN-TransformerビジョンバックボーンネットワークであるTransXNetを設計するために、基本的なビルディングブロックとしてD-Mixerを使用している。
ImageNet-1Kの画像分類タスクでは、TransXNet-TはSwing-Tを0.3%上回り、計算コストの半分以下である。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 01:48:03 GMT)
Scaffold-GS: Structured 3D Gaussians for View-Adaptive Rendering [71.4] 最近の3次元ガウス散乱法は、最先端のレンダリング品質と速度を達成している。
局所的な3Dガウス分布にアンカーポイントを用いるScaffold-GSを導入する。
提案手法は,高品質なレンダリングを実現しつつ,冗長なガウスを効果的に削減できることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:58:57 GMT)
OmniMotionGPT: Animal Motion Generation with Limited Data [70.4] 最初のテキストアニマルモーションデータセットであるAnimalML3Dを紹介した。
我々は,動物データに基づくヒトの動き生成ベースラインのトレーニング結果よりも定量的かつ質的に,高い多様性と忠実さで動物の動きを生成することができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:14:00 GMT)
HOLD: Category-agnostic 3D Reconstruction of Interacting Hands and
Objects from Video [70.1] HOLD - 単分子インタラクションビデオから手とオブジェクトを共同で再構成する最初のカテゴリーに依存しない方法。
我々は,3次元手と物体を2次元画像から切り離すことができる構成的明瞭な暗黙モデルを開発した。
本手法は,3次元手オブジェクトアノテーションに頼らず,組込みと組込みの両面において,完全教師付きベースラインに優れる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:50:35 GMT)
Cancer-Net PCa-Gen: Synthesis of Realistic Prostate Diffusion Weighted
Imaging Data via Anatomic-Conditional Controlled Latent Diffusion [68.5] カナダでは、前立腺がんは男性でもっとも一般的ながんであり、2022年のこの人口統計では、新しいがん症例の20%を占めている。
拡散強調画像(DWI)データを用いた前立腺癌診断,予後,治療計画のためのディープニューラルネットワークの開発には大きな関心が寄せられている。
本研究では,解剖学的条件制御型潜伏拡散戦略の導入により,現実的な前立腺DWIデータを生成するための潜伏拡散の有効性について検討した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:11:03 GMT)
ReCEval: Evaluating Reasoning Chains via Correctness and Informativeness [67.5] ReCEvalは2つの重要な特性(正確性と情報性)を通じて推論チェーンを評価するフレームワークである。
本稿では、ReCEvalが様々なエラータイプを効果的に識別し、従来の手法と比較して顕著な改善をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 23:33:07 GMT)
Language Models as Black-Box Optimizers for Vision-Language Models [66.0] Webスケールデータセットで事前トレーニングされた視覚言語モデル(VLM)は、最小限のデータで微調整された場合、下流タスクに顕著な機能を示す。
我々は,自然言語のプロンプトを通じてVLMを最適化するブラックボックスアプローチを開発し,モデルパラメータや機能埋め込み,さらには出力ロジットへのアクセスを回避した。
難易度の高い1ショット画像分類設定では、ImageNetを含む11データセットの平均1.5%のホワイトボックス連続プロンプト法(CoOp)を超過する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:35:40 GMT)
Motion-Conditioned Image Animation for Video Editing [65.9] MoCAは動画編集のためのモーションコンディション・イメージ・アニメーション・アプローチである。
提案するベンチマークでは,MoCAとともに最新の映像編集手法の総合的評価を行う。
MoCAは新たな最先端技術を確立し、人間の嗜好の勝利率を高め、最近の顕著なアプローチよりも優れています。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:59:06 GMT)
Learning Robust Precipitation Forecaster by Temporal Frame Interpolation [65.5] 本稿では,ロバストな降水予測モデルの開発について検討する。
時間的フレーム補間(TFI)は,空間的不一致に対して予測モデルを強化するための革新的な手法である。
また、降雨強度の順序性を利用してモデル性能をさらに改善する、新しい多段サイコロ損失も統合する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 08:22:08 GMT)
Data-Agnostic Model Poisoning against Federated Learning: A Graph
Autoencoder Approach [65.3] 本稿では,フェデレートラーニング(FL)に対するデータに依存しないモデル中毒攻撃を提案する。
この攻撃はFLトレーニングデータの知識を必要とせず、有効性と検出不能の両方を達成する。
実験により、FLの精度は提案した攻撃の下で徐々に低下し、既存の防御機構では検出できないことが示された。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:19:10 GMT)
X-Dreamer: Creating High-quality 3D Content by Bridging the Domain Gap
Between Text-to-2D and Text-to-3D Generation [64.1] X-Dreamerは高品質なテキストから3Dコンテンツを作成するための新しいアプローチである。
テキスト対2D合成とテキスト対3D合成のギャップを埋める。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:23:00 GMT)
StructRe: Rewriting for Structured Shape Modeling [63.8] 本稿では,構造化形状モデリングの新しいアプローチとして,構造書換えシステムであるStructReを提案する。
ポイントとコンポーネントで表される3Dオブジェクトが与えられたら、StructReはそれを上向きに、より簡潔な構造に書き直すか、より詳細な構造に書き直すことができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 04:26:05 GMT)
Ranni: Taming Text-to-Image Diffusion for Accurate Instruction Following [63.6] 画像にテキストのデコードとして意味パネルを導入する。
パネルは、入力テキストから解析された視覚概念をアレンジすることで得られる。
我々は,実用的なシステムを開発し,連続生成とチャットベースの編集の可能性を示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:30:19 GMT)
MicroCinema: A Divide-and-Conquer Approach for Text-to-Video Generation [63.3] MicroCinemaは高品質でコヒーレントなテキスト・ビデオ生成のためのフレームワークである。
本稿では,テキスト・ツー・ビデオ生成と画像・テキスト・ツー・ビデオ生成という2段階のプロセスに分割するDivide-and-Conquer戦略を提案する。
MSR-VTTではUCF-101では342.86、MSR-VTTでは377.40のSOTAゼロショットFVDを達成した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:59:30 GMT)
Leveraging Low-Rank and Sparse Recurrent Connectivity for Robust
Closed-Loop Control [63.3] 繰り返し接続のパラメータ化が閉ループ設定のロバスト性にどのように影響するかを示す。
パラメータが少ないクローズドフォーム連続時間ニューラルネットワーク(CfCs)は、フルランクで完全に接続されたニューラルネットワークよりも優れています。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:50:46 GMT)
Unsupervised Discovery of Interpretable Directions in h-space of
Pre-trained Diffusion Models [63.2] 本稿では,事前学習した拡散モデルのh空間における解釈可能な方向を特定するための,教師なしおよび学習に基づく最初の手法を提案する。
我々は、事前訓練された拡散モデルのh-スペースで動作するシフト制御モジュールを用いて、サンプルをシフトしたバージョンに操作する。
それらを共同で最適化することで、モデルは自然に絡み合った、解釈可能な方向を発見する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:03:01 GMT)
PathLDM: Text conditioned Latent Diffusion Model for Histopathology [63.0] そこで我々は,高品質な病理像を生成するためのテキスト条件付き遅延拡散モデルPathLDMを紹介した。
提案手法は画像とテキストデータを融合して生成プロセスを強化する。
我々は,TCGA-BRCAデータセット上でのテキスト・ツー・イメージ生成において,SoTA FIDスコア7.64を達成し,FID30.1と最も近いテキスト・コンディショナブル・コンペティタを著しく上回った。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 20:20:23 GMT)
What Do Llamas Really Think? Revealing Preference Biases in Language
Model Representations [62.9] 大規模言語モデル(LLMs)は、応答を辞退しても、社会的な偏見を示すか?
本研究は,文脈的埋め込みを探索し,このバイアスが潜在表現にエンコードされているかどうかを探索することによって検討する。
単語の隠れベクトルからLLMの単語ペア選好を予測するロジスティックなBradley-Terryプローブを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:53:13 GMT)
Reasoning with the Theory of Mind for Pragmatic Semantic Communication [62.9] 本稿では,実用的な意味コミュニケーションフレームワークを提案する。
2つの知性エージェント間の効果的な目標指向情報共有を可能にする。
数値的な評価は、少ないビット量で効率的な通信を実現するためのフレームワークの能力を示している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:36:19 GMT)
Lasagna: Layered Score Distillation for Disentangled Object Relighting [62.7] 直感的なテキスト誘導型リライト制御を実現する手法であるLasagnaを提案する。
ラダーイングは、スコア蒸留サンプリングを用いて、拡散モデルの先行を蒸留することにより、照明を事前に学習する。
Launderingは、入力画像の他の側面を保持しながら現実世界の画像をリライトし、最先端のテキストガイド画像編集方法より優れている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 22:54:41 GMT)
LasTGL: An Industrial Framework for Large-Scale Temporal Graph Learning [61.5] 本稿では,共通時間グラフ学習アルゴリズムの統一的および統一的な実装を統合する産業用フレームワークであるLasTGLを紹介する。
LasTGLは、詳細なチュートリアルとともに、包括的な時間グラフデータセット、TGNNモデル、ユーティリティを提供する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:19:39 GMT)
Locally Differentially Private Document Generation Using Zero Shot
Prompting [61.2] 本稿では,DP-Prompt と呼ばれる局所的に異なるプライベートなメカニズムを提案し,作者の匿名化攻撃に対処する。
DP-PromptをChatGPT(gpt-3.5)のような強力な言語モデルで使用すると、匿名化攻撃の成功率の顕著な低下が観察される。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:13:01 GMT)
Layered Rendering Diffusion Model for Zero-Shot Guided Image Synthesis [60.3] 本稿では,テキストクエリに依存する拡散モデルにおける空間制御性向上のための革新的な手法を提案する。
視覚誘導(Vision Guidance)とレイヤーレンダリング拡散(Layered Rendering Diffusion)フレームワーク(Layered Diffusion)という2つの重要なイノベーションを提示します。
本稿では,ボックス・ツー・イメージ,セマンティック・マスク・ツー・イメージ,画像編集の3つの実践的応用に適用する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:36:19 GMT)
Few-shot Image Generation via Style Adaptation and Content Preservation [60.1] 我々は、GAN転送に画像翻訳モジュールを導入し、モジュールはジェネレータにスタイルとコンテンツを分離するように教える。
我々の手法はショット設定がほとんどない状態で、常に最先端の手法を超越している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 01:16:53 GMT)
Real-World Light Field Image Super-Resolution via Degradation Modulation [59.7] 本稿では,実世界のLF画像 SR の簡易かつ効果的な手法を提案する。
実際のLF画像の劣化過程を定式化するために,実用的なLF劣化モデルを開発した。
畳み込みニューラルネットワークは、SRプロセスの前に分解を組み込むように設計されている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:28:20 GMT)
InstructSeq: Unifying Vision Tasks with Instruction-conditioned
Multi-modal Sequence Generation [59.2] InstructSeqは命令条件付きマルチモーダルモデリングフレームワークである。
柔軟な自然言語制御と視覚データとテキストデータの扱いにより、多様な視覚タスクを統一する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:59:51 GMT)
Can semi-supervised learning use all the data effectively? A lower bound
perspective [58.7] 半教師付き学習アルゴリズムはラベル付きデータを利用して教師付き学習アルゴリズムのラベル付きサンプル複雑性を改善することができることを示す。
我々の研究は、SSLアルゴリズムのパフォーマンス向上を証明することは可能だが、定数の注意深く追跡する必要があることを示唆している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:48:50 GMT)
Point-DAE: Denoising Autoencoders for Self-supervised Point Cloud
Learning [58.5] 我々は、より一般的なポイントクラウド学習用オートエンコーダ(Point-DAE)について、マスキング以外の多くの種類の汚職を調査して検討する。
具体的には、特定の破損を入力としてポイントクラウドを分解し、エンコーダ・デコーダモデルを学び、元のポイントクラウドを破損したバージョンから再構築する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:18:14 GMT)
Fantastic Weights and How to Find Them: Where to Prune in Dynamic Sparse
Training [58.5] 本研究では,プルーニング基準が動的スパーストレーニング(DST)性能に及ぼす影響について検討する。
その結果,研究手法のほとんどが同様の結果をもたらすことがわかった。
最高のパフォーマンスは、最も単純なテクニックであるマグニチュードベースのプルーニングによって主に与えられる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:44:26 GMT)
SELF: Language-Driven Self-Evolution for Large Language Models [57.9] SELF(Self-Evolution with Language Feedback)は、大規模言語モデルを進化させる新しいアプローチである。
LLMは、人間の学習プロセスと同様、自己回帰を通じて自己改善を可能にする。
数学および一般タスクにおける実験により,SELFは人間の介入なしにLLMの能力を高めることができることが示された。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:18:10 GMT)
CatVersion: Concatenating Embeddings for Diffusion-Based Text-to-Image
Personalization [56.9] CatVersionは、いくつかの例を通してパーソナライズされた概念を学ぶ、反転ベースの方法である。
ユーザはテキストプロンプトを使って、パーソナライズされたコンセプトを具現化した画像を生成することができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:42:07 GMT)
Learning Radio Environments by Differentiable Ray Tracing [56.4] 本稿では, 材料特性, 散乱, アンテナパターンの微分パラメトリゼーションによって補う, 勾配式キャリブレーション法を提案する。
提案手法は,MIMO(分散マルチインプットマルチインプット・マルチアウトプット・チャネル・サウンドア)を用いて,合成データと実世界の屋内チャネル計測の両方を用いて検証した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:50:21 GMT)
LMRL Gym: Benchmarks for Multi-Turn Reinforcement Learning with Language
Models [56.3] 本稿では,LMRL-Gymベンチマークを用いて,大規模言語モデル(LLM)のマルチターンRLの評価を行う。
我々のベンチマークは8つの異なる言語タスクで構成されており、複数ラウンドの言語相互作用が必要であり、オープンエンド対話やテキストゲームにおける様々なタスクをカバーする。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:59:31 GMT)
HiFi Tuner: High-Fidelity Subject-Driven Fine-Tuning for Diffusion
Models [56.1] 我々は、パーソナライズされた画像生成におけるオブジェクトの外観保存を強化するために、HiFi Tunerという革新的なアルゴリズムを導入する。
主要な機能強化には、マスクガイダンスの利用、新しいパラメータ正規化手法、ステップワイドな主題表現の導入などがある。
提案手法を,テキスト操作による画像中の被写体置換という,新しい画像編集タスクに拡張する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:33:29 GMT)
Generating More Pertinent Captions by Leveraging Semantics and Style on
Multi-Source Datasets [56.0] 本稿では,データソースの非一様結合をトレーニングすることで,流動的な記述を生成するタスクに対処する。
ノイズの多い画像とテキストのペアを持つ大規模データセットは、サブ最適の監視源を提供する。
本稿では,検索コンポーネントから抽出したスタイルトークンとキーワードを組み込むことにより,セマンティクスと記述スタイルを活用・分離することを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:47:36 GMT)
DreamAvatar: Text-and-Shape Guided 3D Human Avatar Generation via
Diffusion Models [55.7] 高品質な3Dアバターを作成するためのテキスト・アンド・シェイプ・ガイドフレームワークであるDreamAvatarについて紹介する。
SMPLモデルを利用して、生成のための形状とポーズのガイダンスを提供する。
また、全体とズームインした3Dヘッドから計算した損失を共同で最適化し、一般的なマルチフェイス「Janus」問題を緩和する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:40:51 GMT)
FS-BAND: A Frequency-Sensitive Banding Detector [55.6] バンディング・アーティファクト(Banding artifact)は、階段のような輪郭(contour)として知られ、圧縮や伝達などで発生する一般的な品質の不快さである。
周波数感度バンディング検出器 (FS-BAND) と呼ばれる,帯状アーティファクトを捕捉・評価するための非参照帯状検出モデルを提案する。
実験結果から,FS-BAND法は画像品質評価(IQA)手法よりもバンドリング分類タスクの精度が高い結果を得た。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:20:42 GMT)
RaDialog: A Large Vision-Language Model for Radiology Report Generation
and Conversational Assistance [53.2] 会話型AIツールは、所定の医療画像に対して臨床的に正しい放射線学レポートを生成し、議論することができる。
RaDialogは、ラジオロジーレポート生成と対話ダイアログのための、初めて徹底的に評価され、公開された大きな視覚言語モデルである。
本手法は,報告生成における最先端の臨床的正確性を実現し,報告の修正や質問への回答などのインタラクティブなタスクにおいて,印象的な能力を示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:28:40 GMT)
DREAM: Diffusion Rectification and Estimation-Adaptive Models [53.2] DREAM(Diffusion Rectification and Estimation-Adaptive Models)を提案する。
DREAMには2つのコンポーネントがある。DREAMは、サンプリングプロセスの反映のためにトレーニングを調整する拡散補正と、歪みに対する知覚のバランスをとる推定適応である。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 21:44:39 GMT)
A Continual Learning Paradigm for Non-differentiable Visual Programming
Frameworks on Visual Reasoning Tasks [51.1] 様々な視覚的推論タスクにまたがって,VisProgの継続的学習パラダイムを提案する。
我々のCLVPは、よく訓練されたタスク固有モデルの視覚的サブモジュールに、段階的に、そして、アンチフォッゲッティングな方法で蒸留する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:31:59 GMT)
PoseGPT: Chatting about 3D Human Pose [50.5] 本稿では,大規模言語モデル(LLM)を用いて画像やテキスト記述から3次元人間のポーズを理解し,推論するフレームワークであるPoseGPTを紹介する。
我々の研究は、一つの画像や簡単な説明から姿勢を直感的に理解する能力によって動機付けられています。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:59:52 GMT)
One-step Diffusion with Distribution Matching Distillation [50.5] 本稿では,拡散モデルを1ステップ画像生成器に変換する手法である分散マッチング蒸留(DMD)を紹介する。
約KLの発散を最小化することにより,拡散モデルと分布レベルで一致した一段階画像生成装置を強制する。
提案手法は,イメージネット64x64では2.62 FID,ゼロショットCOCO-30kでは11.49 FIDに到達した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:59:20 GMT)
SimpleX: A Simple and Strong Baseline for Collaborative Filtering [50.3] 協調フィルタリング(CF)は、リコメンデータシステムにおいて広く研究されている研究トピックである。
損失関数の選択と負のサンプリング比が同等に重要であることを示す。
我々は、コサインコントラスト損失(CCL)を提案し、これをSimpleXと呼ばれる単純な統合CFモデルに組み込む。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:38:32 GMT)
Quantifying measurement-induced quantum-to-classical crossover using an
open-system entanglement measure [49.2] 本研究では, 連続測定による単一粒子の絡み合いについて検討した。
中間時間スケールでの絡み合いは測定強度の関数と同じ定性的挙動を示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:41:26 GMT)
Language Models as a Service: Overview of a New Paradigm and its
Challenges [47.8] 現在最も強力な言語モデルはプロプライエタリなシステムであり、(典型的には制限のある)Webやプログラミングでのみアクセス可能である。
本稿では,LMインタフェースのアクセシビリティ,複製性,信頼性,信頼性の障害となる課題について述べる。
一方で、現在のメジャーなLMに関する既存の知識の総合的なリソースとして機能し、インターフェースが提供するライセンスと機能の概要を総合的に提供する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:59:26 GMT)
Heterogeneous Graph-based Trajectory Prediction using Local Map Context
and Social Interactions [47.1] 本稿では,3つの重要な情報源を活用することにより,欠点に対処するベクトルベース軌道予測手法を提案する。
まず,その関係の性質と重要な特徴を考慮に入れたセマンティックシーングラフを用いて,トラフィックエージェント間のインタラクションをモデル化する。
第2に,ローカルマップコンテキストをモデル化するために,エージェント中心の画像中心マップの特徴を抽出する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:46:05 GMT)
Benchmarking Robustness of Text-Image Composed Retrieval [47.0] テキスト画像合成検索は、合成されたクエリを通してターゲット画像を取得することを目的としている。
近年,情報に富む画像と簡潔な言語の両方を活用する能力に注目が集まっている。
しかし、現実世界の腐敗やさらなるテキスト理解に対するこれらのアプローチの堅牢性は研究されていない。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:14:48 GMT)
Solving the Team Orienteering Problem with Transformers [46.9] 本稿では,チームオリエンテーリング問題を高速かつ高精度に解決できる多エージェント経路計画システムを提案する。
提案システムは,シナリオの符号化を学習可能な集中型トランスフォーマーニューラルネットワークに基づいている。
提示されたシステムが、最先端の作業の多くをスピードの観点から上回ることができることを示すために、いくつかの実験が実施されている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:10:35 GMT)
GraphDreamer: Compositional 3D Scene Synthesis from Scene Graphs [45.7] シーングラフから合成3Dシーンを生成するための新しいフレームワークを提案する。
シーングラフにおけるノード情報とエッジ情報を活用することにより,事前学習したテキスト・画像拡散モデルをよりよく活用する。
GraphDreamerの有効性を検証するために,定性的および定量的な実験を行った。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:59:58 GMT)
MV-CLIP: Multi-View CLIP for Zero-shot 3D Shape Recognition [45.6] 大規模な事前訓練モデルでは、オープンワールドシナリオにおける視覚と言語タスクのパフォーマンスが著しく向上している。
近年の手法では、ゼロショット3次元形状認識を実現するために、言語画像事前学習を採用している。
本稿では、ビュー選択と階層的プロンプトによる信頼性の向上を目的とする。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:51:53 GMT)
An Exponential Reduction in Training Data Sizes for Machine Learning
Derived Entanglement Witnesses [45.2] 本稿では,3,4,5キュービットの絡み目を生成するために,線形支援ベクトルマシンを訓練する改良手法を提案する。
SVMは局所可観測物の期待値の重み付き和で表される超平面を生成する。
また、同じトレーニングステートを使用して、4および5キュービットのW状態証人を生成します。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 00:45:04 GMT)
Mol-Instructions: A Large-Scale Biomolecular Instruction Dataset for
Large Language Models [44.4] Mol-Instructionsは、生体分子ドメイン用に設計された包括的な命令データセットである。
各コンポーネントは、生体分子の特徴や行動に関するLCMの理解と予測能力を改善することを目的としている。
生体分子研究の複雑な領域における大規模モデルの性能向上におけるモールインストラクションの有効性を実証する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:29:58 GMT)
Improving the Robustness of Transformer-based Large Language Models with
Dynamic Attention [44.0] BERTやGPTといったトランスフォーマーベースのモデルは、自然言語処理(NLP)において広く採用されている。
近年の研究では、テキスト入力を意図的に操作することで、モデルの出力を誤認できるような、テキストの敵対攻撃に対する脆弱性が示されている。
本稿では,トランスアーキテクチャに適した動的アテンション(動的アテンション)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:08:24 GMT)
ID-Pose: Sparse-view Camera Pose Estimation by Inverting Diffusion
Models [43.9] 本稿では,2つの入力画像が与えられた相対的なポーズを推定するために,デノナイズ拡散過程を逆転するID-Poseを提案する。
我々は2つ以上の画像を扱うためにID-Poseを拡張し、三角関係から複数の画像対で各ポーズを推定する。
その結果,ID-Poseは最先端手法よりも有意に優れていた。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:33:12 GMT)
Control4D: Efficient 4D Portrait Editing with Text [43.9] テキスト命令を用いて動的4Dポートレートを編集する革新的なフレームワークであるControl4Dを紹介する。
提案手法は, 既存の4次元表現の非効率性や, 拡散型編集装置による非一貫性な編集効果など, 4次元編集における課題に対処する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:46:37 GMT)
Rethinking FID: Towards a Better Evaluation Metric for Image Generation [43.7] Inception Distanceは、実画像のInception-v3特徴分布とアルゴリズムによって生成された画像の距離を推定する。
インセプションの貧弱な表現は、現代のテキスト・画像モデルによって生成されるリッチで多様なコンテンツ、不正確な正規性仮定、そしてサンプルの複雑さによって引き起こされる。
よりリッチなCLIP埋め込みとガウスRBFカーネルとの最大平均差距離に基づく代替のCMMDを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:11:01 GMT)
A Video is Worth 10,000 Words: Training and Benchmarking with Diverse
Captions for Better Long Video Retrieval [43.6] 既存の長いビデオ検索システムは、段落から段落までの検索システムで訓練され、テストされる。
これは、ビデオのリッチさと多種多様な有効な記述を無視している。
本稿では,最先端の大規模言語モデルを利用して,多種多様な合成キャプションを注意深く生成するパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:59:45 GMT)
VTimeLLM: Empower LLM to Grasp Video Moments [43.5] 大規模言語モデル(LLM)は、顕著なテキスト理解能力を示している。
ビデオLLMはビデオ全体の粗い記述しか提供できない。
微細な映像モーメント理解のためのビデオLLMであるVTimeLLMを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:49:56 GMT)
Label-efficient Training of Small Task-specific Models by Leveraging
Vision Foundation Models [43.4] 大規模なデータセットに事前訓練された大規模ビジョンファウンデーションモデル(VFM)は、さまざまな下流タスクで素晴らしいパフォーマンスを示す。
高いメモリと計算要求のため、これらのモデルはリソース制約のある設定ではデプロイできない。
そこで本研究では,タスク特化モデルの効果的なトレーニングに,事前学習型VFMを活用するための,シンプルで効果的なタスク指向知識伝達手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 04:07:44 GMT)
Do text-free diffusion models learn discriminative visual
representations? [43.1] 本稿では,タスクの両ファミリーを同時に扱うモデルである統一表現学習者の可能性について検討する。
生成タスクの最先端手法である拡散モデル(拡散モデル)を素数候補として開発する。
拡散モデルはGANよりも優れており、融合とフィードバック機構により、差別的タスクのための最先端の教師なし画像表現学習手法と競合することができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:02:58 GMT)
Dispersed Structured Light for Hyperspectral 3D Imaging [42.9] 分散構造光(DSL)は、高精度なハイパースペクトル3次元イメージングのためのコスト効率が高くコンパクトな方法である。
DSLは18.8nmの半ミリのスペクトル精度と1mmの深さ誤差を達成している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:45:52 GMT)
LL3DA: Visual Interactive Instruction Tuning for Omni-3D Understanding,
Reasoning, and Planning [42.6] LL3DA(Large Language 3D Assistant)は、ポイントクラウドを直接入力とし、テキストインストラクションとビジュアルプロンプトの両方に応答する。
実験の結果,LL3DAは3Dキャプションと3D質問応答の両方において,様々な3次元視覚言語モデルを上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:00:23 GMT)
Curvature Explains Loss of Plasticity [42.4] 可塑性の喪失は、ニューラルネットワークが新しい経験から学ぶ能力を失う現象である。
我々は、ニューラルネットワークがトレーニング中に曲率の方向を失うという主張に基づいて、塑性損失について一貫した説明を提供する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 23:24:45 GMT)
Communication-Efficient Federated Optimization over Semi-Decentralized
Networks [42.1] 通信効率は、大規模ネットワークにおいて最も困難なボトルネックの1つである。
本稿では,エージェント間通信とエージェント間通信の両方を行う半分散通信プロトコルの通信効率について検討する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:37:15 GMT)
Merlin:Empowering Multimodal LLMs with Foresight Minds [41.7] MLLM(Multimodal Large Language Models)の既存の学習フレームワークへの将来のモデリングの統合について紹介する。
本稿では,MLLMをフォレスト・マインドで強化する2つの革新的な手法を提案する。
FPTはトラジェクトリを中心とした様々なタスクを共同で訓練し、MLLMは与えられた初期観測からトラジェクトリ全体への参加と予測の仕方を学ぶことができる。
FITはMLLMに対して、まず関連するオブジェクトの軌道を予測し、それに基づいて将来の事象を推論する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:57:34 GMT)
Learning for Semantic Knowledge Base-Guided Online Feature Transmission
in Dynamic Channels [41.6] 本稿では,エンドツーエンド通信システムにおける動的チャネル条件とデバイスモビリティの課題に対処する,オンライン最適化フレームワークを提案する。
提案手法は,多レベル特徴伝達を駆動するための意味的知識ベースを活用することによって,既存の手法に基づいている。
オンライン最適化の課題を解決するために,リアルタイム意思決定のための報酬関数を慎重に設計した,ソフトアクターに基づく深層強化学習システムの設計を行った。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:35:56 GMT)
A Survey on Deep Learning for Polyp Segmentation: Techniques, Challenges
and Future Trends [41.3] 大腸癌予防・治療におけるポリープの早期検出と評価
昔は、色、テクスチャ、形などの手作業で抽出した下品な特徴に頼っていた。
ディープラーニングの出現に伴い、より優れた医療画像分割アルゴリズムが出現している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:14:37 GMT)
CAT-DM: Controllable Accelerated Virtual Try-on with Diffusion Model [40.4] 画像ベースの仮想試行において,GAN(Generative Adversarial Networks)が研究分野を支配している。
近年の拡散モデルでは,様々な画像生成タスクにおいて驚くべき性能がみられた。
CAT-DMと呼ばれる拡散モデルを用いた制御可能な仮想トライオンを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:56:17 GMT)
Multi-turn Response Selection using Dialogue Dependency Relations [40.0] マルチターン応答選択は対話エージェントを開発するために設計されたタスクである。
本稿では,対話履歴を依存関係に基づいてスレッドに変換する対話抽出アルゴリズムを提案する。
我々のモデルは、D7とDSTC8*の両方で最先端のベースラインを上回り、Ubuntu上での競合的な結果です。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:44:57 GMT)
Overcoming Label Noise for Source-free Unsupervised Video Domain
Adaptation [39.7] 自己学習に基づくソースフリーなビデオドメイン適応手法を提案する。
ソース事前学習モデルを用いて、対象ドメインサンプルの擬似ラベルを生成する。
我々は,教師の学習フレームワークを実装することにより,適応性能をさらに向上する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:06:27 GMT)
Unifying flavors of fault tolerance with the ZX calculus [39.6] トポロジカルなフォールトトレランス(特に表面コード)のモデルに焦点を当てる。
これらのモデルは全て、基盤となる安定化器の耐故障構造の異なるフレーバーと見なすことができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:29:37 GMT)
Effective Backdoor Mitigation Depends on the Pre-training Objective [39.6] より強い事前学習目標を使用する場合,CreateCLIPは有効ではないことを示す。
この洞察は、より強力な事前訓練目標とバックドア攻撃に対するセキュリティとのトレードオフのバランスを求める実践者にとって重要なものだ。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 01:58:33 GMT)
Dataset Distillation via the Wasserstein Metric [39.3] 本稿では, 最適輸送理論に根ざした計量であるワッサーシュタイン距離を利用して, データセット蒸留における分布整合性を高める手法を提案する。
提案手法は分散マッチング手法の計算上の利点を保ちながら,いくつかのベンチマークで新たな最先端性能を実現している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:15:28 GMT)
Positional Information Matters for Invariant In-Context Learning: A Case
Study of Simple Function Classes [39.1] インコンテキストラーニング(In-context Learning, ICL)とは、新しいクエリ入力に対する応答を生成するために、いくつかのインコンテキストデモでモデルに条件を付ける能力である。
LLMの印象的なICL能力にもかかわらず、LSMのICLは入力デモに敏感であり、短い文脈長に限定されている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:26:55 GMT)
Med-Tuning: Parameter-Efficient Transfer Learning with Fine-Grained
Feature Enhancement for Medical Volumetric Segmentation [39.0] 本稿では,医療用ボリュームセグメンテーションのためのパラメータ効率変換学習について述べる。
我々は,段階内特徴強調と段階間特徴相互作用に基づくMed-Tuningという新しいフレームワークを提案する。
本手法は,従来のセグメンテーションタスクにおけるパラメータ効率のよい移動学習法よりも優れた結果が得られる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:10:39 GMT)
JARVIS-1: Open-World Multi-task Agents with Memory-Augmented Multimodal
Language Models [38.8] マルチモーダル入力(視覚観察と人間の指示)を知覚できるオープンワールドエージェントJARVIS-1を紹介する。
我々は,JARVIS-1をマルチモーダルメモリで構成し,事前学習した知識と実際のゲームサバイバル体験の両方を用いたプランニングを容易にする。
JARVIS-1はマインクラフトで最も一般的なエージェントであり、人間に似た制御と観測空間を用いて200以上のタスクを完了することができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:39:48 GMT)
Periodic Vibration Gaussian: Dynamic Urban Scene Reconstruction and
Real-time Rendering [38.7] 周期振動ガウスモデル(PVG)を提案する。
PVGは、当初静的シーン表現のために設計された効率的な3Dガウススプラッティング技術に基づいている。
PVGは動的シーンと静的シーンの両方に対して、再構築と新規ビュー合成の両方において最先端の代替手段を超越していることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:53:50 GMT)
W-HMR: Human Mesh Recovery in World Space with Weak-supervised Camera
Calibration and Orientation Correction [38.7] 我々は,W-HMRを提案する。W-HMRは,大域的な身体回復をカメラキャリブレーション,局所的な身体回復,大域的な身体配向補正に分解する。
我々は、焦点距離ラベルへの依存をなくし、身体の歪みを抑えるための第1の弱教師付きカメラキャリブレーション法を設計する。
本研究では,再建された人体が世界空間で正常に保たれるような新しい配向補正モジュールを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:58:17 GMT)
Event-based Continuous Color Video Decompression from Single Frames [38.6] 本研究では,イベントカメラを用いて,単一の静的RGB画像から連続映像を生成する新しい手法であるContinuityCamを提案する。
提案手法は、連続した長距離動きモデリングと特徴平面に基づくニューラル統合モデルを組み合わせることで、イベント内の任意のタイミングでフレーム予測を可能にする。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:59:23 GMT)
Unified Segment-to-Segment Framework for Simultaneous Sequence
Generation [38.3] 同時シーケンス生成のための統合セグメント・ツー・セグメンテーション・フレームワーク(Seg2Seg)を提案する。
Seg2Segは適応的で統一された方法でマッピングを学習する。
複数の同時生成タスクの実験は、Seg2Segが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 08:26:16 GMT)
Robust Concept Erasure via Kernelized Rate-Distortion Maximization [38.2] KRaM(Kernelized Rate-Distortion Maximizer)を提案する。
KRaMは、修正レート歪み関数を用いて指定された距離測度(ラベル付き概念で定義され消去される)と一致するように表現の変換に適合する。
KRaMは、データ表現からカテゴリ変数、連続変数、ベクトル値変数など、さまざまな種類の概念を効果的に消去する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 21:10:44 GMT)
Towards Accurate Differential Diagnosis with Large Language Models [37.5] LLM(Large Language Models)を利用した対話型インタフェースは、差分診断の側面をアシストし、自動化する新たな機会を提供する。
20人の臨床医が、ニューイングランド・ジャーナル・オブ・メディカル(New England Journal of Medicine)から入手した、302の挑戦的な現実世界の医療事例を評価した。
我々のLSMは,難治性症例の診断的推論と精度を向上させる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:55:51 GMT)
FreMIM: Fourier Transform Meets Masked Image Modeling for Medical Image
Segmentation [37.5] 本稿では,医療画像のセグメンテーション作業の効率化を目的として,FreMIMというMIMベースの新しいフレームワークを提案する。
FreMIMは一貫してモデルパフォーマンスに大幅な改善をもたらす可能性がある。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:07:48 GMT)
MD-Splatting: Learning Metric Deformation from 4D Gaussians in Highly
Deformable Scenes [37.2] MD-Splatting(MD-Splatting)は3次元トラッキングと新しいビュー合成を同時に行う手法である。
MD-スプレイティング(MD-Splatting)は、非計量的、従って正準的な性質を持つガウスの集合を計量空間に射影する変形関数を学習する。
最先端技術と比較して平均23.9%の3Dトラッキングを向上し,同時に高品質なノベルビュー合成を実現した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:53:03 GMT)
Fingerprint Matching with Localized Deep Representation [36.9] LDRFと呼ばれる指紋の局所的な深部表現を提案する。
LDRFは、様々な可視領域を持つ指紋に対して、より堅牢で正確な固定長表現を提供する。
非常に小さな重複領域の場合の不確実性を軽減するために,一致するスコア正規化手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:15:39 GMT)
Image retrieval outperforms diffusion models on data augmentation [36.6] 拡散モデルは、分類などの下流タスクのためのトレーニングデータセットを強化するために提案されている。
強化のために事前学習プロセスの追加データを直接利用して、改善を十分に一般化するかどうかは不明だ。
ターゲットデータに対する拡散モデルのパーソナライズは、より単純なプロンプト戦略より優れている。
しかし,拡散モデルの事前学習データのみを用いることで,より強力な下流性能が得られる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:14:49 GMT)
Continual Self-supervised Learning: Towards Universal Multi-modal
Medical Data Representation Learning [36.3] 自己教師付き学習は、医用画像解析のための効率的な事前学習方法である。
マルチモーダル医療データに対する継続的自己教師型学習手法であるMedCoSSを提案する。
我々は、大規模マルチモーダルなラベルなしデータセット上で、継続的自己教師付き事前学習を行う。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:06:13 GMT)
Charting New Territories: Exploring the Geographic and Geospatial
Capabilities of Multimodal LLMs [35.9] MLLM(Multimodal large language model)は、幅広いタスクにおいて顕著な能力を示しているが、地理的および地理空間領域におけるその知識と能力はまだ研究されていない。
我々はこれらの領域におけるMLLMの様々な視覚能力を探索する一連の実験を行い、特にフロンティアモデル GPT-4V に注目した。
我々の手法は、視覚的なタスクからなる小さなベンチマークでこれらのモデルに挑戦し、その能力を様々な複雑さでテストする。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:56:42 GMT)
Learning Disentangled Identifiers for Action-Customized Text-to-Image
Generation [35.8] 本研究では,テキスト・ツー・イメージ(T2I)生成における新しいタスク,すなわちアクション・カスタマイズに焦点を当てた。
この課題の目的は、限られたデータから既存の行動を学び、それを見えない人間や動物に一般化することである。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:51:47 GMT)
Synthesize, Diagnose, and Optimize: Towards Fine-Grained Vision-Language
Understanding [35.8] テキストと視覚の両方の観点から視覚言語モデル(VLM)を評価することの重要性を強調した。
他のすべての面において一貫性を確保しつつ、特定の属性で異なる画像を合成するプログレッシブパイプラインを導入する。
ゼロショット性能を損なうことなくSPECの大幅な改善を実現し,精細な理解でVLMを最適化する手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:20:37 GMT)
Enhanced Spectral Density of a Single Germanium Vacancy Center in a
Nanodiamond by Cavity-Integration [35.8] ダイヤモンド中の色中心、中でも負電荷のゲルマニウム空孔(GeV$-$)は、多くの量子光学の応用に有望な候補である。
開孔ファブリ・ペロト微小キャビティに優れた光学特性を有する1つのGeV中心を含むナノダイアモンドの移動を実証した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:20:00 GMT)
DynMF: Neural Motion Factorization for Real-time Dynamic View Synthesis
with 3D Gaussian Splatting [35.7] 動的シーンの点当たりの運動は、明示的あるいは学習的な軌跡の小さなセットに分解することができると論じる。
我々の表現は解釈可能であり、効率的であり、複雑な動的シーンの動きのリアルタイムなビュー合成を提供するのに十分な表現力を持っている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:59:11 GMT)
Fast-ParC: Capturing Position Aware Global Feature for ConvNets and ViTs [35.4] 本稿では,位置認識型円形畳み込み(ParC)と呼ばれるニューラルネットワーク演算子と,その高速化バージョンであるFast-ParCを提案する。
我々のFast-ParCは、Fast Fourier Transformを使用してParCのO(n2)時間をO(n log n)に短縮する。
実験の結果,ParC opは従来のConvNetの受容領域を効果的に拡大できることがわかった。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:05:34 GMT)
LLaFS: When Large-Language Models Meet Few-Shot Segmentation [35.3] 本稿では,LLaFSを提案する。LLaFSは,大規模言語モデル(LLM)を数発のセグメンテーションで活用するための最初の試みである。
LLLaFSは、LLMが獲得した膨大な事前知識を効果的なサプリメントとして利用し、LLMを使って画像を数ショットで分割する。
LLaFSは複数のデータセットで最先端の結果を達成し、数ショットのコンピュータビジョンタスクにLLMを使用する可能性を示している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 08:20:02 GMT)
DiffCAD: Weakly-Supervised Probabilistic CAD Model Retrieval and
Alignment from an RGB Image [35.2] 本稿では,RGB画像からのCAD検索とアライメントに対する,最初の弱教師付き確率的アプローチであるDiffCADを提案する。
我々はこれを条件付き生成タスクとして定式化し、拡散を利用して画像中のCADオブジェクトの形状、ポーズ、スケールをキャプチャする暗黙の確率モデルを学ぶ。
提案手法は, 合成データのみを用いて学習し, 単眼深度とマスク推定を利用して, 種々の実対象領域へのロバストなゼロショット適応を実現する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:10:21 GMT)
BIOCLIP: A Vision Foundation Model for the Tree of Life [35.1] TreeOfLife-10Mは,生物画像のML対応データセットとして最大かつ多種多様である。
次に,生命樹の基礎モデルであるBioCLIPを開発した。
様々な微細な生物分類タスクに厳格にアプローチをベンチマークする。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:49:43 GMT)
Spectral and Polarization Vision: Spectro-polarimetric Real-world
Dataset [34.5] 三色Stokes画像と高スペクトルStokes画像の2つの分光偏光モデルを提案する。
提案したデータセットは、データ駆動分光偏光分光画像と視覚研究の基礎を約束する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 05:37:24 GMT)
Universal representation by Boltzmann machines with Regularised Axons [34.3] 正規化されたボルツマンマシンは任意の分布を表現できることを示す。
また、正規化されたボルツマンマシンは、任意の相関した多くの可視パターンを完全検索で指数関数的に保存できることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 23:14:44 GMT)
Rethinking Domain Generalization: Discriminability and Generalizability [34.3] ドメイン一般化(DG)は、優れた識別可能性を維持しつつ、強力な一般化性を持つ堅牢なモデルを開発する。
DMDA(Distriminative Microscopic Distribution Alignment)という新しいフレームワークを提案する。
DMDAはSelective Channel Pruning(SCP)とMicro-level Distribution Alignment(MDA)の2つのコアコンポーネントを組み込んでいる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:47:46 GMT)
ANPL: Towards Natural Programming with Interactive Decomposition [33.6] 我々は,ユーザが常に生成したコードを洗練できるように,対話型ANPLシステムを導入する。
ANPLプログラムは、それが満たさなければならない入力出力のセットで構成される。
ユーザは、スケッチを変更し、穴を記述するのに使用される言語を変更したり、特定の穴に追加の入力出力を提供することで、ANPLプログラムを更新する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:08:54 GMT)
Supporting Human-AI Collaboration in Auditing LLMs with LLMs [33.6] 大きな言語モデルは偏見があり、無責任に振る舞うことが示されている。
これらの言語モデルを厳格に監査することは重要である。
既存の監査ツールは、人間とAIの両方を活用して失敗を見つける。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:30:09 GMT)
Unnatural Error Correction: GPT-4 Can Almost Perfectly Handle Unnatural
Scrambled Text [33.4] GPT-4は、スクランブルされた文から元の文をほぼ完全に再構築することができる。
LLMが入力トークン化を著しく破壊しているにもかかわらず、そのようなレジリエンスを示すことは直感的ではない。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:51:38 GMT)
Hessian-Aware Bayesian Optimization for Decision Making Systems [32.7] 我々は,多数のパラメータでパラメータ化された多層アーキテクチャを効率的に最適化するために,ヘシアン対応ベイズ最適化を導入する。
実験の結果,提案手法は資源制約と不正なフィードバック設定の下で,複数のベンチマークで効果的に動作することが示された。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:07:05 GMT)
A density estimation perspective on learning from pairwise human
preferences [32.6] 選好行動分布方程式を用いて定義された生成過程の族に対して、ペアの選好に対して報酬関数を訓練することにより、アノテータの暗黙の選好分布を効果的にモデル化できることが示される。
アノテーションの誤用(annotator misspecification) - アノテーションの振る舞いに関する誤ったモデリング仮定が作成され、不適応なモデルが生じる、失敗事例について議論し、提示する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 21:44:40 GMT)
Detecting Anomalous Network Communication Patterns Using Graph
Convolutional Networks [32.3] GCNetOmalyはグラフ畳み込みネットワーク(GCN)ベースの変動オートエンコーダ(VAE)異常検出器である。
GCNetOmalyは、Carbon Blackがログした実際の大規模データに基づいて評価された。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:03:49 GMT)
MaXTron: Mask Transformer with Trajectory Attention for Video Panoptic
Segmentation [31.8] MaXTronは、ビデオパノプティクスセグメンテーションに取り組むために、Trajectory AttentionでMask XFormerを利用するフレームワークである。
MaXTronは、トラジェクティブアテンションを効率的に活用し、インバークリップとクロスクリップトラッキングモジュールを使用している。
MaXTronはビデオセグメンテーションベンチマークで最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:20:09 GMT)
Dataset Distillation in Large Data Era [31.8] 従来の224$times$224の入力解像度で、フルイメージNet-1K/21Kなどの大規模データセットを蒸留する方法を示す。
提案手法は,ImageNet-1K/21Kにおいて,現在の最先端技術よりも4%以上精度が高いことを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:59:56 GMT)
Seg2Reg: Differentiable 2D Segmentation to 1D Regression Rendering for
360 Room Layout Reconstruction [31.6] 2次元分割マップから1次元レイアウト深度を回帰するSeg2Regを提案する。
具体的には,入力正方形360度画像のフロアプラン密度を推定する。
一般化を改善するために,レイアウト上の新しい3Dワープ拡張を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:42:24 GMT)
Focused Transformer: Contrastive Training for Context Scaling [31.4] コントラスト学習にインスパイアされたトレーニングプロセスを利用するFoT(FoT)を導入する。
FoTは(key, value)空間の構造を強化し、コンテキスト長の拡張を可能にする。
提案手法では,既存の大規模モデルを微調整して有効コンテキストを延長することができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:15:34 GMT)
CosAvatar: Consistent and Animatable Portrait Video Tuning with Text
Prompt [31.0] テキスト誘導デジタルポートレート編集のためのフレームワークであるCosAvatarを提案する。
モノクロ映像とテキストの指示のみを入力として、時間的および3次元の整合性を持ったアニマタブルなポートレートを生成することができる。
提案手法は,テキストの指示に基づいて肖像画やローカル属性を正確に編集するだけでなく,ソースビデオによって駆動される表現的アニメーションもサポートする。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:48:01 GMT)
PRS: Sharp Feature Priors for Resolution-Free Surface Remeshing [30.3] 本稿では,自動特徴検出とリメッシングのためのデータ駆動方式を提案する。
提案アルゴリズムは,Fスコアの26%,知覚値の42%がtextRMSE_textv$である。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:15:45 GMT)
Temporal Information Extraction by Predicting Relative Time-lines [30.1] 本稿では,(抽出された)時間関係の集合から線形時間線を構築するための新しい手法を提案する。
本パラダイムでは,線形複雑性を予測する2つのモデルと,TimeMLスタイルのアノテーションを用いた新たなトレーニング損失を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:58:01 GMT)
Navigating Privacy and Copyright Challenges Across the Data Lifecycle of
Generative AI [30.1] データライフサイクルにおけるプライバシーと著作権保護の多面的課題について論じる。
我々は、技術的革新と倫理的展望を組み合わせた統合的なアプローチを提唱する。
この作業は、より広範な議論のきっかけとなり、ジェネレーティブAIにおけるデータのプライバシと著作権の整合性に対する継続的な取り組みを促進することを目的としている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 05:03:08 GMT)
BARS-CTR: Open Benchmarking for Click-Through Rate Prediction [30.0] クリックスルー率(CTR)予測は多くのアプリケーションにとって重要なタスクである。
近年、CTR予測は学術と産業の両方で広く研究されている。
CTR予測研究には、標準化されたベンチマークと一様評価プロトコルがまだ欠けている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:01:41 GMT)
Learning One-Shot 4D Head Avatar Synthesis using Synthetic Data [29.1] 大規模合成データを用いてワンショット4Dヘッド合成を学習する手法を提案する。
3次元再構成と再現の学習プロセスを切り離して、実画像への一般化性を高めるために、新しい学習戦略が実施される。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:26:33 GMT)
A Lightweight Clustering Framework for Unsupervised Semantic
Segmentation [28.9] 教師なしセマンティックセグメンテーションは、注釈付きデータを用いることなく、画像の各ピクセルを対応するクラスにラベル付けすることを目的としている。
教師なしセマンティックセグメンテーションのための軽量クラスタリングフレームワークを提案する。
我々のフレームワークは教師なしセマンティックセマンティックセグメンテーションにおいて大きな可能性を証明し、PASCAL VOCおよびMSデータセットの最先端結果を達成する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:33:42 GMT)
Consensus, dissensus and synergy between clinicians and specialist
foundation models in radiology report generation [28.9] 我々は,胸部X線写真のための最新のレポート生成システムであるFlamingo-CXRを構築し,放射線学データに基づく視覚言語基礎モデルを微調整した。
AI生成レポートの品質を評価するため、16人の認定放射線学者のグループが、AI生成レポートと人文レポートの詳細な評価を行っている。
これは、レポート作成のための臨床医とAIのコラボレーションの最初のデモンストレーションであり、その結果報告は、少なくとも1人の放射線学者が同等または好んで評価する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 05:38:34 GMT)
Towards Generalizable Multi-Camera 3D Object Detection via Perspective
Debiasing [28.9] マルチカメラ3Dオブジェクト検出(MC3D-Det)は,鳥眼ビュー(BEV)の出現によって注目されている。
本研究では,3次元検出と2次元カメラ平面との整合性を両立させ,一貫した高精度な検出を実現する手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:06:20 GMT)
Steering Deep Feature Learning with Backward Aligned Feature Updates [28.2] 特徴学習を予測,測定,制御するための重要な概念として,機能更新と後方パスの整合性を提案する。
広帯域領域におけるReLUとResNetについて検討する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:19:18 GMT)
SimulFlow: Simultaneously Extracting Feature and Identifying Target for
Unsupervised Video Object Segmentation [28.2] 教師なしビデオオブジェクトセグメンテーション(UVOS)は、人間が介在することなく、所定のビデオシーケンス内の一次オブジェクトを検出することを目的としている。
既存のほとんどの手法は、ターゲットを識別してオブジェクトマスクを生成する前に、外観と動き情報を別々に符号化する2ストリームアーキテクチャに依存している。
特徴抽出とターゲット識別を同時に行うSimulFlowと呼ばれる新しいUVOSモデルを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:44:44 GMT)
Causal Fairness under Unobserved Confounding: A Neural Sensitivity
Framework [28.0] 本研究では, 因果フェアネスの非観測的コンバウンディングに対する感度分析を行った。
公正な予測を学習するための新しいニューラルネットワークフレームワークを提案する。
我々の知識を最大限に活用するために、我々の研究は、観測されていない発見の下で因果フェアネスを研究する最初の研究である。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:11:26 GMT)
Is Underwater Image Enhancement All Object Detectors Need? [27.9] 全ての物体検出器が前処理として水中画像の強化を必要とするかどうかは不明である。
我々は18の最先端水中画像強調アルゴリズムを用いて水中物体検出データを前処理する。
我々は,異なるアルゴリズムで強化された結果を用いて,一般的な深層学習型物体検出装置7点を再学習し,126個の水中物体検出モデルを得た。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:54:08 GMT)
Corrupting Convolution-based Unlearnable Datasets with Pixel-based Image
Transformations [27.3] 学習不能なデータセットは、トレーニングされたモデルの一般化性能を劇的に低下させる。
多くの既存のディフェンス、例えばJPEG圧縮や敵の訓練は、標準制約の付加雑音に基づいてUDを効果的に対抗させる。
Interpolation操作によるランダムな乗算変換を利用して、畳み込み型UDに対する防御を成功させる新しい画像コラプションを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:55:46 GMT)
ShapeGPT: 3D Shape Generation with A Unified Multi-modal Language Model [27.1] 本稿では,複数の形状関連タスクに対処するために,強力な事前学習言語モデルを活用する形状関連マルチモーダルフレームワークであるShapeGPTを提案する。
具体的には、ShapeGPTは、連続した形状を形語に識別するための単語文パラグラフフレームワークを使用し、さらにこれらの単語を形文のために組み立て、複数段落の指示文に統合する。
実験により、ShapeGPTは、テキスト・トゥ・シェイプ、シェイプ・トゥ・テキスト、シェイプ・コンプリート、形状編集など、形状関連タスクに匹敵する性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 08:46:05 GMT)
Improving Adversarial Transferability via Model Alignment [27.0] 本稿では,トランスファー可能な逆方向摂動を生成するためのモデルアライメント手法を提案する。
さまざまなモデルアーキテクチャを用いたImageNetデータセットの実験では、アライメントされたソースモデルから発生する摂動が、転送可能性を大幅に向上することを示した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:15:49 GMT)
MMOTU: A Multi-Modality Ovarian Tumor Ultrasound Image Dataset for
Unsupervised Cross-Domain Semantic Segmentation [26.8] 卵巣癌は最も有害な婦人科疾患の1つである。
近年の特筆すべき方法は, 単品性超音波卵巣腫瘍の分節または認識に焦点をあてることである。
我々は1469個の2次元超音波画像と170個の造影超音波画像を含むMMOTU画像データセットを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:05:07 GMT)
KOPPA: Improving Prompt-based Continual Learning with Key-Query
Orthogonal Projection and Prototype-based One-Versus-All [26.5] 本稿では,新しいキークエリ学習戦略を導入し,マッチング効率を向上し,機能変更の課題に対処する。
提案手法は,現在の最先端手法を最大20%の差で超えた結果を達成するためのモデルである。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:26:20 GMT)
Pre-registration for Predictive Modeling [26.1] 予測モデル分野に事前登録を導入する可能性と可能性について検討する。
予測モデリングにおける現在のベストプラクティスとその制限について議論し、軽量な事前登録テンプレートを導入し、機械学習研究者による質的研究を紹介する。
我々は,事前登録が予測モデルで対処できる問題の範囲を探索し,その文脈内での限界を認識することで結論付ける。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:52:10 GMT)
ParrotTTS: Text-to-Speech synthesis by exploiting self-supervised
representations [25.9] ParrotTTSは、モジュール化されたテキスト音声合成モデルである。
単一の話者からの書き起こしを使って、効果的にマルチスピーカーの変種を訓練することができる。
低リソース設定で新しい言語に適応し、自己管理バックボーンのトレーニング中に見えない言語に一般化する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 20:50:03 GMT)
Aggregated f-average Neural Network for Interpretable Ensembling [25.8] 本稿では,弱い学習者の予測を最適に集約するために,異なる種類の平均をモデル化し,組み合わせる,集約されたf平均(AFA)浅部ニューラルネットワークを提案する。
我々は、その解釈可能なアーキテクチャと単純なトレーニング戦略を強調し、その優れたパフォーマンスを、数発のクラスインクリメンタルラーニングの問題に立証する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:16:00 GMT)
ArcMMLU: A Library and Information Science Benchmark for Large Language
Models [25.4] 本稿では,中国語のライブラリ・アンド・インフォメーション・サイエンス(LIS)ドメインに適したベンチマークであるArcMMLUを紹介する。
このベンチマークは、考古学、データ科学、図書館科学、情報科学の4つの重要なサブドメインにおいて、LLMの知識と推論能力を測定することを目的としている。
総合評価の結果,ほとんどのLLMはArcMMLUで50%以上の精度を達成するが,性能差は顕著であることがわかった。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:08:04 GMT)
Dodging DeepFake Detection via Implicit Spatial-Domain Notch Filtering [25.3] 画像の品質を損なうことなく、偽画像のアーティファクトパターンを低減するための、シンプルながら強力なパイプラインを提案する。
まず、周波数領域のノッチフィルタは、ノッチフィルタに必要な手動設計のため、手作業では不可能であることを示す。
次に、ノッチフィルタリング効果を再現するための学習に基づくアプローチを、空間領域にのみ適用する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:37:22 GMT)
Anomaly Detection via Learning-Based Sequential Controlled Sensing [25.3] 本稿では,学習に基づく制御センシングによるバイナリプロセス間の異常検出の問題に対処する。
異常を識別するために、意思決定エージェントは、各時点でプロセスのサブセットを観察することができる。
我々の目標は、どの過程を観察するかを動的に決定するシーケンシャルな選択ポリシーを設計することである。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:49:33 GMT)
Cycle Invariant Positional Encoding for Graph Representation Learning [25.2] そこで我々はCycleNetと呼ばれる構造符号化モジュールを提案する。
すべてのサイクルの空間を効率的に符号化するために、入力グラフの1次元ホッジ・ラプラシアンの核を介して計算するサイクル基底(つまり、サイクル空間を生成する最小のサイクルの集合)から始める。
我々は、CycleNetモジュールによって強化されたネットワークが、既存のSOTAモデルと比較して、様々なベンチマークでより優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 08:39:27 GMT)
FedEmb: A Vertical and Hybrid Federated Learning Algorithm using Network
And Feature Embedding Aggregation [24.8] Federated Learning(FL)は、分散クライアント上の機械学習モデルの分散トレーニングのための新興パラダイムである。
本稿では,垂直およびハイブリッド学習をモデル化するための一般化アルゴリズムであるFedEmbを提案する。
実験結果から,FedEmbは特徴分割と対象空間分散の両問題に対処する有効な方法であることがわかった。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:01:51 GMT)
Advances in 3D Neural Stylization: A Survey [24.5] 本稿では,3次元データに対するニューラルスタイリゼーションの最近の進歩について報告する。
いくつかの重要な設計選択を考慮し、ニューラルスタイリゼーションのための分類法を提供する。
調査から得られた知見に基づいて、オープンな課題、将来の研究、潜在的な応用について議論する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:58:54 GMT)
Check, Locate, Rectify: A Training-Free Layout Calibration System for
Text-to-Image Generation [24.4] そこで本研究では,フライ時の生成過程に介入する,トレーニング不要なレイアウト校正システムSimMを提案する。
具体的には、"チェック位置修正"パイプラインに従って、システムはまずターゲットレイアウトを生成するプロンプトを分析し、中間出力と比較してエラーを自動的に検出する。
そして、位置したアクティベーションを移動させ、マップ内およびマップ間調整を行うことで、補正処理を無視可能な計算オーバーヘッドで行うことができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:14:28 GMT)
A-Scan2BIM: Assistive Scan to Building Information Modeling [24.1] 本稿では,大規模クラウドをビルディングインフォメーション・モデリング・アプリケーションの標準化されたデジタル表現に変換するアーキテクト支援システムを提案する。
本稿では, 再建作業の順序がいかに自然であるかを計測する新しい指標を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 01:07:14 GMT)
Diffusion Models for Imperceptible and Transferable Adversarial Attack [24.0] 本稿では,拡散モデルの生成的および識別的パワーを両立させることにより,新たな非受容的かつ伝達可能な攻撃を提案する。
提案手法であるDiffAttackは,対向攻撃場に拡散モデルを導入する最初の方法である。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:40:54 GMT)
Do pretrained Transformers Really Learn In-context by Gradient Descent? [23.9] 自然データに基づく言語モデル(LLaMa-7B)におけるインコンテキスト学習(ICL)の出現について検討する。
ICL と Gradient Descent (GD) は言語モデルの出力分布を異なる方法で変更する。
これらの結果は、ICLとGDの同値性は未解決の仮説であり、さらなる研究を求めていることを示している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 01:34:31 GMT)
TrafficMOT: A Challenging Dataset for Multi-Object Tracking in Complex
Traffic Scenarios [23.8] トラヒックビデオにおける多目的追跡は、交通監視の精度を高め、道路安全対策を促進する大きな可能性を秘めている。
トラヒックビデオにおけるマルチオブジェクトトラッキングのための既存のデータセットは、制限されたインスタンスや単一のクラスにフォーカスすることが多い。
複雑なシナリオを持つ多様なトラフィック状況をカバーするために設計された、広範なデータセットであるTrafficMOTを紹介する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:59:56 GMT)
CADTalk: An Algorithm and Benchmark for Semantic Commenting of CAD
Programs [23.7] 本稿では,CADプログラムのセマンティックコメント問題を紹介する。
目標は、入力プログラムを意味論的に意味のある形状の部分に対応するコードブロックに分割することである。
プログラム解析とビジュアル・セマンティック・アナリティクスを組み合わせることでこの問題を解決する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:35:09 GMT)
A Unified Framework for Connecting Noise Modeling to Boost Noise
Detection [23.4] ノイズラベルはモデルパフォーマンスを損なう可能性がある。
従来の2つの手法はノイズモデリングとノイズ検出である。
本稿では,ノイズモデリング,情報源の同定,ノイズ検出の強化という,3つの重要なブロックを持つ相互接続構造を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:24:47 GMT)
S2ST: Image-to-Image Translation in the Seed Space of Latent Diffusion [23.1] 複雑な画像におけるグローバルI2ITを実現するための新しいフレームワークであるS2STを紹介する。
S2STは遅延拡散モデルのシード空間内で動作し、後者が学習した強力な画像の先行処理を利用する。
S2STは、複雑な自動車シーンに対して、最先端のGANベースのI2IT手法、および拡散ベースのアプローチを超越していることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:59:49 GMT)
Applying Large Language Models and Chain-of-Thought for Automatic
Scoring [23.1] 本研究では,大規模言語モデル(LLM)の学生による科学評価に対する応答の自動評価への適用について検討した。
我々は、アクセシビリティ、技術的な複雑さ、以前は自動アセスメントツールの使用を制限していた説明可能性の欠如といった課題を克服することに注力した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 21:22:43 GMT)
How Much Is Hidden in the NAS Benchmarks? Few-Shot Adaptation of a NAS
Predictor [22.9] 我々は,メタラーニングの豊富な分野から借用し,これらの手法のNASへの適用性について検討する。
我々のメタラーニングアプローチは、クロスバリデーション実験において優れた(あるいは一致した)性能を示すだけでなく、新しい検索空間とタスクへの外挿に成功した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:51:46 GMT)
Towards Scalable 3D Anomaly Detection and Localization: A Benchmark via
3D Anomaly Synthesis and A Self-Supervised Learning Network [22.8] 本稿では,既存の大規模3次元モデルに適応して3次元異常検出を行うための3次元異常合成パイプラインを提案する。
Anomaly-ShapeNetは、40カテゴリ以下の1600点のクラウドサンプルで構成され、リッチで多様なデータ収集を提供する。
また、3次元異常局所化のためのスケーラブルな表現学習を可能にする自己教師型マスク再構成ネットワーク(IMRNet)を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 04:13:59 GMT)
Joint Detection Algorithm for Multiple Cognitive Users in Spectrum
Sensing [22.8] 本稿ではまず,3つの論理回路決定基準をハードな決定に導入し,その決定厳密性を解析する。
そこで本研究では,ソフトな決定に基づくマルチユーザスペクトルセンシング手法を提案する。
このアプローチは、アイドル期間中に占有されていないスペクトル資源を効果的に検出し、時間分割多重化の概念を活用する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:50:32 GMT)
BAM-DETR: Boundary-Aligned Moment Detection Transformer for Temporal
Sentence Grounding in Videos [22.8] 時間文の接頭辞は、言語記述に関連するモーメントをローカライズすることを目的としている。
モーメントセンタ固有のあいまいさによって引き起こされる中心的不整合の問題を克服するために,新しい境界指向モーメント定式化を導入する。
この考え方に基づいて、デュアルパス・デコード処理を備えた境界アラインメント検出変換器(BAM-DETR)を設計する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:16:11 GMT)
Prompt-Based Exemplar Super-Compression and Regeneration for
Class-Incremental Learning [22.7] 超圧縮再生法であるESCORTは、その量を大幅に増加させ、模範者の多様性を高める。
生成した例と実画像の領域ギャップを最小限に抑えるために,部分圧縮と拡散に基づくデータ拡張を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 05:59:31 GMT)
Situating the social issues of image generation models in the model life
cycle: a sociotechnical approach [22.5] 本稿では,画像生成モデルに関連する社会問題の包括的分類について報告する。
データ問題,知的財産権,バイアス,プライバシ,情報,文化,自然環境など,画像生成モデルから生じる7つのイシュークラスタを特定します。
画像生成モデルによって引き起こされるリスクは、大きな言語モデルによってもたらされるリスクと重大であると主張する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 08:32:32 GMT)
Which way is `right'?: Uncovering limitations of Vision-and-Language
Navigation model [22.4] VLN(Vision-and-Language Navigation)は、目標の位置やオブジェクトに到達するために、自然言語命令に従うための具体的エージェントを必要とする。
エージェントがこのタスクを成功させるためには、インストラクションに参照されたオブジェクトを視覚的なシーンにグラウンドできる必要があります。
ナビゲーションモデルの判断に空間的および指向性のある言語的手がかりはどの程度の程度か?
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:16:11 GMT)
Controlling Pre-trained Language Models for Grade-Specific Text
Simplification [22.2] 本研究では,異なる制御機構がテキスト単純化システムの妥当性と簡易性に与える影響について検討する。
本稿では,インスタンス単位のインスタンス単位で,特定のグレードレベルのテキストを簡略化するために必要な編集操作を簡易に予測する手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:14:31 GMT)
Channel-Feedback-Free Transmission for Downlink FD-RAN: A Radio Map
based Complex-valued Precoding Network Approach [22.1] 本稿では,物理層フィードバックに頼ることなく,新しい伝送方式を提案する。
具体的には,無線地図に基づく複合値プリコーディングネットワーク(RMCPNet)モデルを設計し,ユーザ位置に基づいて基地局プリコーディングを出力する。
提案手法をパブリックなDeepMIMOデータセット上で評価し,RMCPNetが16%,76%の性能改善を実現可能であることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:41:04 GMT)
Mixture of Experts with Uncertainty Voting for Imbalanced Deep
Regression Problems [22.0] 本研究では,不均衡な回帰問題に対するエキスパートの混合手法を提案する。
従来の回帰損失を負の対数類似度に置き換え、サンプルワイドのアレタリックな不確実性も予測する。
このような損失が不均衡をうまく扱えることを示した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:29:22 GMT)
TrustMark: Universal Watermarking for Arbitrary Resolution Images [21.7] 非受容性デジタル透かしは著作権保護、誤情報防止および責任ある生成GANにおいて重要である。
本稿では,新しい設計のアーキテクチャを用いたGANベースの透かし手法を提案し,透かし除去法であるTrustMark-RMを提案する。
本手法は任意の符号化画像からなる3つのベンチマーク上での最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:03:36 GMT)
Learning active tactile perception through belief-space control [21.7] 本稿では,創造的世界モデルを開発することにより,触覚探索政策を自律的に学習する手法を提案する。
本手法は,目的が所望のオブジェクト特性を推定することである3つのシミュレーションタスクに対して評価する。
提案手法は, 所望のプロパティに関する情報を直感的に収集するポリシーを発見できることがわかった。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 21:54:42 GMT)
FFT: Towards Harmlessness Evaluation and Analysis for LLMs with
Factuality, Fairness, Toxicity [21.5] 生成的人工知能の普及により、AI生成テキストによる潜在的な害に対する懸念が高まっている。
これまでの研究者は、生成言語モデルの無害性を評価するために多くの努力を払ってきた。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:18:47 GMT)
Grounding Foundation Models through Federated Transfer Learning: A
General Framework [20.9] GPT-4のような基礎モデル(FM)は、様々な自然言語処理やコンピュータビジョンタスクにおいて顕著な成功を収めている。
FMをドメイン固有のタスクに適応させたり、ドメイン固有の知識で拡張することで、FMの潜在能力を最大限に活用することができる。
近年,フェデレート・トランスファー・ラーニング(FTL)を活用したFMの基盤化の必要性が,学術と産業の両面で強く現れている。
FTL-FM研究の強い成長と、FTL-FMが産業応用に与える影響を動機として、FTL-FMフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:16:41 GMT)
Probabilistic Speech-Driven 3D Facial Motion Synthesis: New Benchmarks,
Methods, and Applications [20.8] 音声信号から3次元顔形状を推定する作業について検討する。
既存の作業は主に決定論的であり、限られた話者を持つ小さなデータセット上で、音声信号から3D顔メッシュへの1対1のマッピングを学ぶことに集中している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 01:14:43 GMT)
Improving Scene Text Image Super-resolution via Dual Prior Modulation
Network [20.7] Scene Text Image Super- resolution (STISR) はテキスト画像の解像度と可視性を同時に向上することを目的としている。
既存のアプローチは、シーンテキストのセマンティックな決定性の境界であるテキストのグローバルな構造を無視している。
我々の研究はDPMN(Dual Prior Modulation Network)と呼ばれるプラグイン・アンド・プレイ・モジュールを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:27:49 GMT)
The Gift of Feedback: Improving ASR Model Quality by Learning from User
Corrections through Federated Learning [20.6] フェデレートラーニング(FL)を通じてデバイス上でのユーザ修正から継続的に学習することを目指す。
我々は、モデルがこれまで遭遇していなかった新しい用語をターゲットとして、長い尾の単語を学習し、破滅的な忘れ事をする手法を探究する。
実験により,提案手法は,言語分布全体の品質を保ちながら,新しい用語のモデル認識を改善することが確認された。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 21:05:43 GMT)
LocoMuJoCo: A Comprehensive Imitation Learning Benchmark for Locomotion [20.5] 模倣学習は、エンボディエージェントでアジャイルの移動を可能にするための大きな約束を持っています。
本稿では,ILアルゴリズムの厳密な評価と比較を容易にするための新しいベンチマークを提案する。
このベンチマークは四足歩行、二足歩行、筋骨格人体モデルを含む多様な環境を含む。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:47:04 GMT)
TimeGNN: Temporal Dynamic Graph Learning for Time Series Forecasting [20.0] 時系列予測は、科学と工学における重要な現実世界の応用の核心にある。
動的時間グラフ表現を学習するTimeGNNを提案する。
TimeGNNは、他の最先端のグラフベースの手法よりも4倍から80倍高速な推論時間を実現している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:18:50 GMT)
Targeted Reduction of Causal Models [20.0] 因果機械学習は、シミュレーションにおける因果関係の関連性および解釈可能なパターンの発見に科学者を支援する可能性がある。
本稿では、複雑なモデルを特定の目標現象を説明するための簡潔な要因のセットに変換する方法であるTCR(Targeted Causal Reduction)を紹介する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:46:22 GMT)
Prompt-based Context- and Domain-aware Pretraining for Vision and
Language Navigation [19.8] 本稿では,これらの問題に対処する新しい Prompt-bAsed coNtext- and Domain-Aware (PANDA) プレトレーニングフレームワークを提案する。
ドメイン認識の段階では、低コストのプロンプトチューニングパラダイムを適用して、ドメイン内のデータセットからソフトな視覚的プロンプトを学習する。
文脈認識の段階では、シーケンスレベルのセマンティクスをキャプチャし、文脈外知識と文脈的知識の両方を具現化するハードコンテキストプロンプトを設計する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:25:33 GMT)
DAP: Domain-aware Prompt Learning for Vision-and-Language Navigation [19.8] VLNタスクのための新しいモデルに依存しないドメイン・アウェア・プロンプト・ラーニング(DAP)フレームワークを提案する。
DAPは、ドメイン内の画像意味論を抽出するためのソフトな視覚的プロンプトを学習するために、低コストのプロンプトチューニングパラダイムを適用している。
R2RとREVERIEの両方の実験結果は、既存の最先端手法と比較して、DAPの優位性を示している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:28:59 GMT)
Hy-Tracker: A Novel Framework for Enhancing Efficiency and Accuracy of
Object Tracking in Hyperspectral Videos [19.7] 本稿では,ハイパースペクトルデータと最先端オブジェクト検出のギャップを埋めるHy-Trackerという新しいフレームワークを提案する。
このフレームワークには、YOLOv7上に洗練されたトラッキングモジュールが組み込まれている。
ハイパースペクトルベンチマークデータセットの実験結果から,Hy-Trackerの有効性が示された。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:38:45 GMT)
NeRF: Neural Radiance Field in 3D Vision, A Comprehensive Review [19.7] ニューラル・ラジアンス・フィールド(NeRF)は近年,コンピュータビジョンの分野で重要な発展を遂げている。
NeRFモデルは、ロボット工学、都市マッピング、自律ナビゲーション、仮想現実/拡張現実など、さまざまな応用を見出している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 21:20:08 GMT)
Towards Calibrated Robust Fine-Tuning of Vision-Language Models [19.4] そこで本研究では, 学習前視覚言語モデル(VLM)のキャリブレーションに悪影響を及ぼす要因として, 素質な微調整法と最先端の頑健な微調整法を示す。
私たちは、キャリブレーションされたロバスト微調整(CaRot)と呼ばれる単純なアプローチを提供し、IDとOODデータセットのキャリブレーションとロバスト性にインセンティブを与える。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 00:07:54 GMT)
PDB-Struct: A Comprehensive Benchmark for Structure-based Protein Design [19.3] 我々は、リフォールダビリティベースのメトリクスと安定性ベースのメトリクスの2つの新しい指標を紹介した。
ByProt、ProteinMPNN、ESM-IFはベンチマークで非常によく機能しますが、ESM-DesignとAF-Designは不足しています。
提案するベンチマークは,タンパク質設計手法の公平かつ包括的な評価方法である。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:37:55 GMT)
Fast ODE-based Sampling for Diffusion Models in Around 5 Steps [19.1] 本稿では, 高速サンプリングのための平均方向を直接学習することにより, トランケーション誤差を解消する近似平均方向解法(AMED-r)を提案する。
CIFAR-10で7.14 FID、ImageNet 64$times$64で13.75 FID、LSUN Bedroomで12.79 FIDを達成した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:07:19 GMT)
Beyond the Field-of-View: Enhancing Scene Visibility and Perception with
Clip-Recurrent Transformer [19.0] FlowLensアーキテクチャは、光学フローを明示的に採用し、特徴伝達のための新しいクリップリカレントトランスフォーマーを暗黙的に組み込んでいる。
FlowLensは、信頼性のあるコンテキストを提供することで、視野内での認識を高めることも示しています。
オフラインおよびオンラインビデオのインペイントを含む実験とユーザスタディ、さらにはFo-Vの知覚タスクは、Flowsが最先端のパフォーマンスを達成することを実証している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:56:19 GMT)
MultiResFormer: Transformer with Adaptive Multi-Resolution Modeling for
General Time Series Forecasting [19.0] トランスフォーマーベースのモデルは、最近時系列予測の境界を大きく押し上げている。
既存のメソッドは通常、時系列データを$textitpatches$にエンコードする。
最適パッチ長を適応的に選択することで時間変動を動的にモデル化するMultiResFormerを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:24:33 GMT)
AnyText: Multilingual Visual Text Generation And Editing [18.8] 拡散型多言語視覚テキスト生成・編集モデルであるAnyTextを紹介する。
AnyTextは複数の言語で文字を書くことができます。
我々は、OCRアノテーションと300万の画像テキストペアを複数言語で含む、最初の大規模多言語テキスト画像データセットであるAnyWord-3Mをコントリビュートする。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:54:05 GMT)
Motion-DVAE: Unsupervised learning for fast human motion denoising [18.4] 本研究では,人間の動作の短期的依存を捉えるための動きであるMotion-DVAEを紹介する。
我々は、Motion-DVAEとともに、回帰と最適化に基づくアプローチを統一する教師なし学習型復調手法を導入する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:42:04 GMT)
Compact3D: Compressing Gaussian Splat Radiance Field Models with Vector
Quantization [18.4] 3D Gaussian Splattingは3次元放射場をモデリング・レンダリングするための新しい手法である。
NeRFに比べてストレージの需要がずっと大きいのに欠点がある。
パラメータを定量化するために,kmeansアルゴリズムに基づく単純なベクトル量子化法を提案する。
提案手法は,従来の3次元ガウス・スメッティング法において,レンダリング画像の品質を非常に低下させることなく,約20倍のコストで保存コストを削減できることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 00:29:13 GMT)
ZeST-NeRF: Using temporal aggregation for Zero-Shot Temporal NeRFs [18.3] 本稿では,新たなシーンに時間的NeRFを生成できるZeST-NeRFを提案する。
我々は,様々な分野からの最先端のアプローチが,この新たな課題を適切に解決できないことを実証し,本ソリューションの有効性を実証する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:06:15 GMT)
SparseDC: Depth Completion from sparse and non-uniform inputs [18.2] 我々はスパース深度入力と非一様深度入力の深度補完モデルであるスパースDCを提案する。
まず、スパース入力時のロバスト性を改善するため、SFFMと呼ばれる単純な戦略を設計する。
第2に,深度値の可能な領域の正確な局所的幾何と深度のない領域の正確な構造を予測できる2分岐機能埋め込み器を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:36:27 GMT)
Enhancing Point Annotations with Superpixel and Confidence Learning
Guided for Improving Semi-Supervised OCT Fluid Segmentation [17.9] Superpixel and Confident Learning Guide Point s Network (SCLGPA-Net)。
Superpixel-Guided Pseudo-Label Generation (SGPLG)モジュールは擬似ラベルとピクセルレベルのラベル信頼マップを生成する。
CLGLR(Confident Learning Guided Label Refinement)モジュールは、擬似ラベル内のエラー情報を識別し、さらなる改善につながる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:10:34 GMT)
Predictable Reinforcement Learning Dynamics through Entropy Rate
Minimization [17.8] 強化学習(RL)では、エージェントは予測可能な行動を示すインセンティブを持たない。
予測可能性を考慮したRL(Predictability-Aware RL)と呼ばれるRLエージェントの予測可能な振る舞いを誘導する新しい手法を提案する。
平均報酬目標としてエントロピー率を定式化する方法を示し,そのエントロピー報酬関数は政策依存であるため,アクション依存のサロゲートエントロピーを導入する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:53:32 GMT)
DQSSA: A Quantum-Inspired Solution for Maximizing Influence in Online
Social Networks (Student Abstract) [17.8] 影響の最大化は、ソーシャルネットワークに広がる影響を最大化する最適なノードを選択するタスクである。
本研究では、ソーシャルネットワークにおける影響拡散を最適化するための離散量子ベースのSalp Swarm Algorithm (DQSSA)を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:23:44 GMT)
TLDR: Text Based Last-layer Retraining for Debiasing Image Classifiers [17.7] グループバランスデータセットを用いたLast Layer Retraining (LLR)は、分類器の素早い相関を緩和するのに効率的であることが知られている。
汎用画像分類器のための大規模言語モデルで構築されたテキストデータセットに基づいてLLRを実行することを提案する。
提案手法は,グループバランスの画像データセットを用いて再トレーニングを行うLLR手法に匹敵する性能を実現する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:51:48 GMT)
Recent Advances of Continual Learning in Computer Vision: An Overview [17.6] 継続的な学習は、異なる時間ステップでやってくる新しい知識を学習し、融合し、蓄積する能力を持つ人間の学習プロセスと似ている。
本稿では,コンピュータビジョンにおける連続学習の最近の進歩を概観する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:51:31 GMT)
Test-Time Adaptation for Nighttime Color-Thermal Semantic Segmentation [17.5] 夜間RGBTセマンティックセマンティックセグメンテーションの問題に対処するため,Night-TTAと呼ばれる最初のテスト時適応フレームワークを提案する。
提案手法は,mIoUが13.07%向上し,最先端(SoTA)性能を実現する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:04:02 GMT)
Local Low-light Image Enhancement via Region-Aware Normalization [17.4] 本稿では,ローカルLLIEの要件を体系的に定義する。
RANLENと呼ばれる局所的拡張のための地域対応正規化について紹介する。
我々の戦略は、様々な構造を持つ既存のグローバルLLIEネットワークに適用できる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:45:28 GMT)
Towards Assessing and Benchmarking Risk-Return Tradeoff of Off-Policy
Evaluation [17.3] Off-Policy Evaluation (OPE) は、オフラインログデータのみを使用して、反ファクトポリシーの有効性を評価することを目的としている。
OPE推定器の既存の評価指標は、主にOPEの「正確性」や下流政策の選択に焦点を当てている。
我々は、OPE推定器によって形成される政策ポートフォリオのリスク・リターントレードオフを測定するSharpeRatio@kと呼ばれる新しい指標を開発する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:56:49 GMT)
SCOPE-RL: A Python Library for Offline Reinforcement Learning and
Off-Policy Evaluation [17.3] SCOPE-RLは、オフライン強化学習(オフラインRL)、オフポリシー評価(OPE)、選択(OPS)のために設計されたPythonソフトウェアである。
SCOPE-RLはOPEモジュールに特に重点を置いており、様々なOPE推定器と堅牢なOPEプロトコルを提供している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:56:43 GMT)
Multi-scale Iterative Refinement towards Robust and Versatile Molecular
Docking [17.3] 分子ドッキング(英: molecular docking)は、小分子のタンパク質標的への結合コンホメーションを予測するために使われる重要な計算ツールである。
我々は、効率的な分子ドッキング用に設計された堅牢で汎用的なフレームワークであるDeltaDockを紹介する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:09:20 GMT)
Accurate Segmentation of Optic Disc And Cup from Multiple Pseudo-labels
by Noise-Aware Learning [17.3] 本稿では,光ディスクとカップセグメンテーションの精度向上を目的として,MPNN(Multiple Pseudo-labels Noise-aware Network)のラベルデノベーション手法を提案する。
具体的には、MPNNは、真のラベルに基づいて訓練された複数の異なるネットワークと、これらの擬似ラベルガイドから抽出された画素レベルのコンセンサス情報によって擬似ラベルを生成する。
MPNNのトレーニングフレームワークは、清潔なピクセルとノイズの多いピクセルからセグメンテーションを学ぶための教師/学生アーキテクチャによって構築されている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:17:16 GMT)
On the Interplay Between Stepsize Tuning and Progressive Sharpening [17.2] ステップサイズチューナー,Armijo linesearch,Polyak stepsizesを用いて,シャープネスがどのように進化するかを検討する。
古典的Armijo行探索の驚くほど貧弱な性能は、目的の鋭さを増す傾向によってよく説明できるかもしれない。
一方、Polyakは概して安定の端で、あるいはわずかに超越して動作し、Armijoを上回り、一定のステップ化を行う。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 21:42:15 GMT)
Categorical Traffic Transformer: Interpretable and Diverse Behavior
Prediction with Tokenized Latent [17.1] 本稿では、連続的な軌道予測とトークン化されたカテゴリー予測の両方を出力する交通モデルであるカテゴリー交通変換器(CTT)を提案する。
CTTの最も顕著な特徴は、完全に解釈可能な潜伏空間であり、基底真理から潜伏変数を直接監督することができる。
その結果、CTTは、予測精度でSOTAを叩きながら意味のある異なる潜伏モードで条件付けられた多様な振る舞いを生成できる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:25:24 GMT)
SACReg: Scene-Agnostic Coordinate Regression for Visual Localization [16.9] 本稿では,新しいテストシーンで1回トレーニングされた一般化SCRモデルを提案する。
我々のモデルは、シーン座標をネットワーク重みに符号化する代わりに、スパース2Dピクセルのデータベースイメージを3D座標アノテーションに入力する。
画像のデータベース表現とその2D-3Dアノテーションは,局所化性能を損なうことなく,高度に圧縮できることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:22:53 GMT)
CHeart: A Conditional Spatio-Temporal Generative Model for Cardiac
Anatomy [16.8] 心臓画像解析における2つの重要な疑問は、画像から心臓の解剖と運動を評価することである。
本研究では,心臓の4次元時間解剖と非画像的臨床因子との相互作用を記述する条件生成モデルを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:20:37 GMT)
Compositor: Bottom-up Clustering and Compositing for Robust Part and
Object Segmentation [16.5] 関節部と物体のセグメンテーションに対する頑健なアプローチを提案する。
ボトムアップ方式で,画素,部分,オブジェクトレベルの埋め込みを含む階層的な特徴表現を構築した。
このボトムアップ相互作用は、より低いセマンティックレベルからより高いセマンティックレベルへの情報の統合に有効であることが示されている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:16:13 GMT)
Perception of Misalignment States for Sky Survey Telescopes with the
Digital Twin and the Deep Neural Networks [16.2] 本研究では,異なる視野で連続的に変化する点拡散関数から,不整合状態を抽出するディープニューラルネットワークを提案する。
我々は、不整合データを格納し、不整合状態と対応する点拡散関数の間の複雑な関係を探索する。
この方法は、アクティブ光学系と光学系アライメントの事前情報を提供するために使用できる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:16:27 GMT)
MDSC: Towards Evaluating the Style Consistency Between Music and Dance [16.1] MDSCは、ダンスと音楽の一致の度合いを評価する最初の評価指標である。
生成したダンス・モーション・シーケンスとコンディショニング・ミュージック・シーケンスがいかにスタイリスティックに相関するかの尺度。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:12:22 GMT)
Learning Deep O($n$)-Equivariant Hyperspheres [16.0] 私たちの主な貢献は理論であり、幾何学的深層学習における大きな課題に取り組みます。
我々は、最近開発された3次元球状ニューロンの理論を、そのニューロンを$n$Dに拡張することで強化する。
我々は理論的貢献を実験的に検証し、我々のアプローチがベンチマークデータセットの競合手法よりも優れていることを発見した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:04:57 GMT)
Each Test Image Deserves A Specific Prompt: Continual Test-Time
Adaptation for 2D Medical Image Segmentation [15.8] ドメイン間の分散シフトは、実世界のアプリケーションに事前訓練されたセマンティックセグメンテーションモデルをデプロイする上で重要な障害である。
テスト時間適応は、推論中にドメイン間の分布シフトに取り組むのに有効であることが証明されている。
本稿では,各テスト画像に対する特定のプロンプトをトレーニングし,バッチ正規化レイヤの統計値を調整するために,Visual Prompt-based Test-Time Adaptation (VPTTA)法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:03:47 GMT)
E2PNet: Event to Point Cloud Registration with Spatio-Temporal
Representation Learning [15.7] イベント・ツー・ポイント・クラウド登録のための最初の学習手法であるE2PNetを提案する。
E2PNetのコアはEvent-Points-to-Tensor (EP2T)と呼ばれる新しい特徴表現ネットワークで、イベントデータを2Dグリッド型の特徴テンソルにエンコードする。
E2PNetは、イベントデータの使用により、極端な照明や高速な動きに対してより堅牢である。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:33:49 GMT)
DFU: scale-robust diffusion model for zero-shot super-resolution image
generation [15.7] 複数の解像度で空間情報とスペクトル情報を組み合わせることでスコア演算子を近似する新しいディープラーニングアーキテクチャDual-FNO UNet(DFU)を提案する。
本稿では,FIDをFFHQの最大トレーニング解像度の1.66倍の1.66倍の1.3倍の精度で達成し,ゼロショット超解像画像生成能力をさらに高めるための微調整戦略を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 23:31:33 GMT)
Operator Learning with Neural Fields: Tackling PDEs on General
Geometries [15.7] 偏微分方程式を解くための機械学習アプローチは、関数空間間の学習写像を必要とする。
新しいコーラル法は、いくつかの一般的な制約に基づいてPDEのための座標ベースのネットワークを利用する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:59:53 GMT)
Sketch Input Method Editor: A Comprehensive Dataset and Methodology for
Systematic Input Recognition [15.5] 本研究の目的は,プロフェッショナルなC4Iシステム用に設計されたSketch Input Method Editor(SketchIME)を作成することである。
このシステム内では、スケッチは標準化されたシンボルを推奨する低忠実なプロトタイプとして利用される。
少数ショットのドメイン適応とクラス増分学習を取り入れることで、ネットワークの新規ユーザへの適応能力は大幅に向上する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 05:05:38 GMT)
Mixture of Gaussian-distributed Prototypes with Generative Modelling for
Interpretable Image Classification [15.3] 本稿では,Gaussian Mixed Model(GMM)で表されるMGProtoという,プロトタイプ分布の新たな生成学習について述べる。
CUB-200-2011、Stanford Cars、Stanford Dogs、およびOxford-IIIT Petsデータセットに関する実験は、MGProtoが最新技術分類とOoD検出性能を達成し、解釈可能性の向上を図っていることを示している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:01:37 GMT)
Semantic-Aware Frame-Event Fusion based Pattern Recognition via Large
Vision-Language Models [15.2] セマンティックラベル,RGBフレーム,イベントストリームを統合した新しいパターン認識フレームワークを提案する。
セマンティックなラベルを扱うために,素早い工学を通して言語記述に変換する。
マルチモーダルトランスフォーマーネットワークを用いたRGB/Event機能とセマンティック機能を統合する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:35:51 GMT)
Multilevel Saliency-Guided Self-Supervised Learning for Image Anomaly
Detection [15.2] 異常検出(AD)はコンピュータビジョンの基本課題である。
そこで我々は,サリエンシガイダンスを活用して意味的手がかりを付加するCutSwapを提案する。
CutSwapは、2つの主流ADベンチマークデータセット上で最先端のADパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 08:03:53 GMT)
MDCS: More Diverse Experts with Consistency Self-distillation for
Long-tailed Recognition [15.0] 本稿では,従来手法が残っていたギャップを埋めるために,MDCS (Consistency Self-distillation) を用いた多種多様な専門家を提案する。
MDCSのアプローチは,2つの中核的コンポーネント – 多様性損失(DL)と一貫性自己蒸留(CS) – から構成される。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:58:12 GMT)
Perceptual Group Tokenizer: Building Perception with Iterative Grouping [14.8] 本稿では,視覚的特徴を抽出し,自己指導型表現学習を行うためにグループ化操作に依存するパーセプチュアル・グループ・トケナイザを提案する。
提案モデルは,最先端のビジョンアーキテクチャと比較して,競争力のある計算性能を実現することができることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:00:14 GMT)
A Compact Implicit Neural Representation for Efficient Storage of
Massive 4D Functional Magnetic Resonance Imaging [14.5] Inlicit Neural Representation (INR)に基づくfMRIデータに適した新しい圧縮パラダイムについて報告する。
本手法はfMRIデータの特徴を適切に組み込んだもので,提案手法の有効性を示す。
本稿では,fMRIデータを低帯域・高忠実度で共有する方法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 05:54:37 GMT)
ESG Accountability Made Easy: DocQA at Your Service [14.5] 本アプリケーションは,質問応答型会話アシスタントによる文書からの情報抽出を可能にする。
このシステムは、文書変換から機械可読フォーマットを含む、さまざまなAI分野のいくつかの技術を統合する。
ユーザーは2000以上の企業から1万以上の環境、社会、ガバナンス(ESG)の開示を調査することができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:47:50 GMT)
Detailed Human-Centric Text Description-Driven Large Scene Synthesis [14.4] DetText2Sceneはテキスト駆動による新しい大規模画像合成であり、忠実さ、制御性、自然性を備えている。
私たちのDetText2Sceneは、テキストから大規模合成において、質的かつ定量的に、先行技術よりも大幅に優れています。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:04:30 GMT)
Brainformer: Modeling MRI Brain Functions to Machine Vision [14.3] 我々はまず,人間の知覚システムにおけるfMRIのパターンを機械学習の観点から解析するために,シンプルで効果的なBrainformerアプローチを提案する。
第2に,人間の脳活動を表すfMRIをマシンビジョンモデルに取り入れた新しいメカニズムを導入する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 22:39:23 GMT)
Reconstructing the normal and shape at specularities in endoscopy [14.2] 本稿では,3次元知覚の手がかりとして特異性を用いることを提案する。
具体的には、観察された組織の正常な方向と形状を各特異度で再構成する新しい方法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:09:46 GMT)
Non-Cross Diffusion for Semantic Consistency [14.2] 常微分方程式(ODE)モデルを学習するための生成モデリングにおける革新的アプローチであるNon-Cross Diffusionを導入する。
提案手法は,2つの分布からサンプリングされた点を非交差経路で効果的に接続する,入力の上昇次元を戦略的に組み込む。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 05:53:39 GMT)
Evaluating the Rationale Understanding of Critical Reasoning in Logical
Reading Comprehension [13.9] 論理的読解データセットから、なぜ解答オプションを選択するか、あるいは排除すべきかを説明する、合理的テキストをクラウドソースします。
実験の結果、最近の大規模言語モデル(例えば、インストラクションGPT)は、たとえ主要な疑問に正しく答えられるとしても、要求に答えることに苦慮していることがわかった。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 08:44:55 GMT)
Generalisable Agents for Neural Network Optimisation [13.9] ニューラルネットワーク最適化のための汎用エージェント(GANNO)の枠組みを提案する。
GANNOは、ニューラルネットワークの最適化を改善するために学習するマルチエージェント強化学習(MARL)アプローチである。
私たちの研究は、このパラダイムがニューラルネットワークのトレーニングにもたらす機会と、克服すべき重要な課題の概要を示します。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:45:51 GMT)
TrTr: A Versatile Pre-Trained Large Traffic Model based on Transformer
for Capturing Trajectory Diversity in Vehicle Population [13.8] 本研究では,トランスフォーマーアーキテクチャを交通タスクに適用し,車内における軌道の多様性を学習することを目的とした。
我々は、注意機構に合わせてデータ構造を作成し、繰り返しの時間的要求に対応する一連のノイズを導入する。
設計した事前学習モデルは,車両の空間分布を捉える上で優れた性能を示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:20:58 GMT)
Exploring Smart Commercial Building Occupants' Perceptions and
Notification Preferences of Internet of Things Data Collection in the United
States [13.7] スマートな商業ビルで働くことを報告した米国内の参加者492名を対象に,オンライン調査を実施している。
参加者の約半数が、IoTのデータ収集と運用を十分に認識していないことが分かりました。
参加者の大多数は、スマートな建物におけるデータプラクティスを通知したいと考えており、Webサイトや物理的な兆候といった受動的なものへのプッシュ通知を好んでいる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 08:03:23 GMT)
Evaluating Large Language Model Creativity from a Literary Perspective [13.7] 本稿では,大規模言語モデルが創造的記述プロセスにおいて補助ツールとして機能する可能性を評価する。
我々は,背景記述をインターリーブする対話的かつ多声的なプロンプト戦略,構成を案内する指示,対象スタイルのテキストのサンプル,与えられたサンプルの批判的議論を開発する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:46:25 GMT)
Persistent Test-time Adaptation in Episodic Testing Scenarios [13.5] 現在のテスト時間適応アプローチは、継続的に変化する環境に適応することを目的としています。
これらの手法の適応性が長期にわたって維持されているかどうかは不明である。
本研究は, エピソードTTAと呼ばれる新しいテスト環境を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:24:44 GMT)
Identify ambiguous tasks combining crowdsourced labels by weighting
Areas Under the Margin [13.4] 曖昧なタスクは専門家の労働者を騙しかねない。
我々は、クラウドソースの学習シナリオにおいて、誤ってラベル付けされたデータを識別するために、AUM(Area Under the Margin)を適用する。
WAUMは、トレーニングセットからあいまいなタスクを捨てるのに役立ち、一般化性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:10:47 GMT)
Matrix Product State Fixed Points of Non-Hermitian Transfer Matrices [13.1] テンソルネットワークの仮想指標におけるゲージ自由度の影響について検討する。
ゲージ変換が伝達行列の固有状態の絡み合い構造に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:28:30 GMT)
Dimension Mixer: A Generalized Method for Structured Sparsity in Deep
Neural Networks [13.1] CNN、Transformers、Fourier-Mixersは、類似点と相違点を探す動機になりました。
結合流とバタフライ変換の研究は、部分的および階層的な信号混合スキームが効率的な近似に十分であることを示している。
グループワイズ,非線形,多線形,学習可能な混合方式について検討し,それらが多くの標準的なニューラルネットワークアーキテクチャに相補的であることを発見した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:30:45 GMT)
New Perspectives on the Evaluation of Link Prediction Algorithms for
Dynamic Graphs [13.0] 本稿では,予測性能と時間ネットワークのダイナミックスに関する洞察を得られる新しい可視化手法を提案する。
我々は、最近のベンチマークから抽出されたデータセットに対して、エラーが通常、異なるデータセグメントに均等に分散されていないことを実証的に検証する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:57:07 GMT)
ViC-MAE: Self-Supervised Representation Learning from Images and Video
with Contrastive Masked Autoencoders [12.8] ViC-MAEはMasked AutoEncoders(MAE)とコントラスト学習を組み合わせたモデルである。
ViC-MAEで学習した視覚表現は、映像分類と画像分類の両方によく当てはまる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:53:00 GMT)
PERFOGRAPH: A Numerical Aware Program Graph Representation for
Performance Optimization and Program Analysis [12.8] 最新の機械学習メソッドを採用する上で重要な課題は、プログラミング言語の表現である。
本稿では,現在のプログラム表現の限界と課題を克服するため,PERFOGRAPHと呼ばれるグラフベースのプログラム表現を提案する。
PerFOGRAPHは、新しいノードとエッジを導入することで、数値情報と集約データ構造をキャプチャできる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 00:31:29 GMT)
An Effective Universal Polynomial Basis for Spectral Graph Neural
Networks [12.7] スペクトルグラフニューラルネットワーク(GNN)はヘテロフィリーグラフの出現率を高めている。
グラフヘテロフィリー次数を導入して適応的なヘテロフィリー基底を開発する。
そして、このヘテロフィ基底をホモフィ基底と統合し、普遍基底UniBasisを作成する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 01:48:42 GMT)
RandoMix: A mixed sample data augmentation method with multiple mixed
modes [12.5] RandoMixは、堅牢性と多様性の課題に対処するために設計された、混合サンプルデータ拡張手法である。
我々は,CIFAR-10/100,Tiny-ImageNet,ImageNet,Google Speech Commandsなど,さまざまなデータセットに対するRandoMixの有効性を評価する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 05:32:33 GMT)
Optimal Attack and Defense for Reinforcement Learning [12.4] 敵RLでは、外部攻撃者は、環境との相互作用を操作できる。
我々は、攻撃者が予想される報酬を最大化するステルス攻撃を設計する際の問題を示す。
被害者に対する最適な防衛方針は,Stackelbergゲームに対する解決策として計算できる,と我々は主張する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 21:21:47 GMT)
JPPF: Multi-task Fusion for Consistent Panoptic-Part Segmentation [12.2] パーシャル・アウェア・パノプティック・セグメンテーション(Part-Aware Panoptic segmentation)は、複数のレベルの粒度でシーンの意味的理解を提供することを目的としたコンピュータビジョンの問題である。
本研究は,3つの分割を効果的に組み合わせてパン光学部分分割を得るJPPF(Joint Panoptic Part Fusion)について述べる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:17:46 GMT)
Can Protective Perturbation Safeguard Personal Data from Being Exploited
by Stable Diffusion? [12.1] 元の画像構造を保ちながら保護された摂動を除去できる浄化方法を提案する。
実験により、安定拡散は、すべての保護方法において、精製された画像から効果的に学習できることが判明した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:17:43 GMT)
On Exact Inversion of DPM-Solvers [12.0] 拡散確率モデル(DPM)は、現代の生成モデルにおいて重要な要素である。
DPMはレイテンシの低減と品質の大幅な向上を実現しているが、正確な逆の発見には困難が伴っている。
そこで本研究では, DPM解法に対する正確な逆変換について検討し, それらを実行するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:30:15 GMT)
LucidDreaming: Controllable Object-Centric 3D Generation [12.0] 我々は3次元生成をきめ細かな制御が可能な効果的パイプラインとしてLucidDreamingを提案する。
単純なテキストプロンプトから推論できる3Dバウンディングボックスの最小限の入力しか必要としない。
本稿では,本手法が主流のScore Distillation Smplingベースの3D生成フレームワークのスペクトルに対して顕著な適応性を示すことを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:55:23 GMT)
Fast and Practical Quantum-Inspired Classical Algorithms for Solving
Linear Systems [11.9] 線形系を解くための高速で実用的な量子インスパイアされた古典的アルゴリズムを提案する。
我々の主な貢献は、線形系を解くために量子に着想を得た古典的アルゴリズムへの重球運動量法の適用である。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:33:24 GMT)
Classification, Challenges, and Automated Approaches to Handle
Non-Functional Requirements in ML-Enabled Systems: A Systematic Literature
Review [11.9] 非機能要件は、機械学習の巨大なポテンシャルを脅かす。
本稿では,3つの重要な側面を対象とする体系的な文献レビューを提案する。
調査では、30の異なる非機能要件を特定し、6つの主要なクラスに分類できる。
さらなる研究が考慮すべき23以上のソフトウェアエンジニアリング課題のカタログを提供しています。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:34:05 GMT)
Unclonable Cryptography with Unbounded Collusions [11.8] 量子非閉定理は、量子コピー保護の興味深い可能性をもたらす。
プログラムを量子状態に符号化し、そのような状態のユーザが k + 1 個の動作コピーを生成できないようにする。
秘密鍵が無拘束の共謀に対してコピー保護された公開鍵暗号および機能暗号方式を構築する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:36:42 GMT)
INarIG: Iterative Non-autoregressive Instruct Generation Model For
Word-Level Auto Completion [11.7] Word-Level Auto Completion (WLAC)は、ソース文、翻訳コンテキスト、人型文字シーケンスが与えられた対象単語を予測する。
InarIG(Iterative Non-autoregressive Instruct Generation)モデルを提案する。
我々のモデルは低周波単語を扱うのに優れており、WMT22およびベンチマークデータセットの最先端結果が得られ、最大10%以上の予測精度が向上する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:39:38 GMT)
Developer Experiences with a Contextualized AI Coding Assistant:
Usability, Expectations, and Outcomes [11.5] この研究は、コンテキスト化されたコーディングAIアシスタントであるStackSpot AIを制御された環境で使用した62人の参加者の初期体験に焦点を当てる。
アシスタントの使用は、大幅な時間を節約し、ドキュメントへのアクセスを容易にし、内部APIの正確なコードを生成する結果となった。
コーディングアシスタントが、複雑なコードを扱う際の変数応答や制限と同様に、よりコンテキスト情報にアクセスできるようにするために必要な知識ソースに関連する課題が観察された。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:52:28 GMT)
Certified algorithms for equilibrium states of local quantum
Hamiltonians [11.5] 局所量子ハミルトニアンの平衡状態における可観測物の期待値を計算するアルゴリズムを開発した。
無限格子の熱力学的極限において、これは局所可観測体の期待値が有限時間で近似できることを示している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:59:59 GMT)
DKiS: Decay weight invertible image steganography with private key [11.4] 新規な秘密鍵を用いた画像ステガノグラフィー手法を提案する。
このアプローチは、アクセスに対応する秘密鍵を必要とする、隠された情報のセキュリティを保証する。
本手法の有効性を実証する実験的な証拠を提示する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 04:21:10 GMT)
Learning Part Segmentation from Synthetic Animals [11.4] 本稿では,Skinned Multi-Animal Linear(SMAL)モデルを用いて,合成動物からの学習部分のセグメンテーションに焦点を当てた。
我々は,SAPからPartImageNetへのSyn-to-Real動物部分分割,すなわちSynRealPartを,既存のセマンティックセマンティクス領域適応法でベンチマークした。
第3の貢献は、合成トラと馬の学習部品がPartImageNetの四足歩行で移動可能であることを明らかにすることです。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:10:04 GMT)
EpiTESTER: Testing Autonomous Vehicles with Epigenetic Algorithm and
Attention Mechanism [11.3] 本稿では,重要なシナリオを効率的に見つけるための新しいテスト手法であるEpiTESTERを提案する。
EpiTESTERは、遺伝子サイレンシングをエピジェネティックなメカニズムとして採用し、特定の遺伝子の発現を防ぐために遺伝子発現を調節する。
本研究では,自動運転研究のためのオープンソースシミュレータであるCARLAと,エンドツーエンドのAVコントローラであるInterfuserの4つの初期環境を用いて,EpiTESTERを評価した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 21:40:14 GMT)
GNNFlow: A Distributed Framework for Continuous Temporal GNN Learning on
Dynamic Graphs [11.3] 本稿では,効率的な時間的グラフ表現学習のための分散フレームワークであるGNNFlowを紹介する。
GNNFlowは、負荷バランスを確保するために、静的スケジューリングを備えた複数のマシンでの分散トレーニングをサポートする。
実験の結果,GNNFlowは既存のシステムに比べて最大21.1倍高速な継続的学習を実現することがわかった。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:48:24 GMT)
S-T CRF: Spatial-Temporal Conditional Random Field for Human Trajectory
Prediction [11.3] 軌道予測はコンピュータビジョンにおいて重要である。
本研究では,textbfS-Tjectory CRF: textbfSpatial-textbfTemporal textbfConditional textbfRandom textbfFieldを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:33:01 GMT)
Distributed Global Structure-from-Motion with a Deep Front-End [11.2] 我々は,グローバルSfMがSOTAインクリメンタルSfMアプローチ(COLMAP)と同等に機能するかどうかを検討する。
我々のSfMシステムは、分散計算を活用するためにゼロから設計されており、複数のマシン上で計算を並列化し、大規模なシーンにスケールすることができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:47:18 GMT)
Balancing Summarization and Change Detection in Graph Streams [11.2] 我々は,グラフ要約における圧縮速度と変化検出における精度との間にはトレードオフがあると主張している。
本稿では,このトレードオフのバランスを保ち,信頼性の高いグラフ要約と変更検出を同時に実現するための新しい定量的手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:39:46 GMT)
Top-Down Knowledge Compilation for Counting Modulo Theories [11.1] 入力式が決定論的分解可能な否定正規形(d-DNNF)である場合、仮説モデルカウントは効率的に解ける。
トップダウン知識コンパイルは#SAT問題を解決する最先端技術である。
我々は,DPLL(T)探索の痕跡に基づくトップダウンコンパイラを提唱する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:21:18 GMT)
Raising the Bar of AI-generated Image Detection with CLIP [11.1] われわれはCLIP機能に基づいた軽量な検出戦略を開発した。
単一の生成モデルからのサンプル画像のみを使用することで、CLIPベースの検出器は驚くほどの一般化能力を示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 21:11:20 GMT)
TIDE: Test Time Few Shot Object Detection [11.0] Few-shot Object Detection (FSOD) は、対象ドメイン内の新しいカテゴリの限られたオブジェクトインスタンスから意味的知識を抽出することを目的としている。
FSODの最近の進歩は、メタ学習やデータ拡張を通じて、いくつかのオブジェクトに基づいてベースモデルを微調整することに焦点を当てている。
我々は、新しいFSODタスクを定式化し、TIDE(Test TIme Few Shot Detection)と呼ぶ。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:00:44 GMT)
Efficient Pauli channel estimation with logarithmic quantum memory [11.0] a protocol can estimated the eigen values of a Pauli channel to error $epsilon$ using only $O(log n/epsilon2)$ ancilla qubits and $tildeO(n2/epsilon2)$ Measurement。
我々の知識によれば、量子メモリの対数的に多くの量子ビットが指数統計上の優位性のために十分である最初の量子学習タスクである。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:11:59 GMT)
Seam-guided local alignment and stitching for large parallax images [11.0] そこで本研究では,シーム品質評価による局所的アライメントと縫合法を提案する。
まず,既存の画像アライメントとシームカット法を用いて初期シームを計算する。
低画質の画素に対しては、アライメントされた画像に囲むパッチを分離し、局所的にアライメントする。
最後に,アライメントパッチをシームカットにより合成し,元のアライメント結果にマージして最終モザイクを生成する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:55:29 GMT)
Quantum Phase Processing and its Applications in Estimating Phase and
Entropies [10.9] 量子位相処理」は、任意の三角変換をユニタリ作用素の固有位相に直接適用することができる。
量子位相処理は、単にアンシラ量子ビットを測定することで、量子システムの固有情報を取り出すことができる。
本稿では,量子フーリエ変換を必要としない量子位相推定アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:35:19 GMT)
ClustML: A Measure of Cluster Pattern Complexity in Scatterplots Learnt
from Human-labeled Groupings [10.7] ビジュアル品質測定(VQM)は、視覚化のパターンを自動的に検出し、定量化することにより、アナリストを支援するように設計されている。
ClustMLと呼ばれる,これまでに収集した被験者の判断に基づいて学習した,散在する人物の視覚的グルーピングパターンのための新しいVQMを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:16:06 GMT)
Moving Object Detection and Tracking with 4D Radar Point Cloud [10.6] レーダベースのトラッキングに適した革新的なソリューションであるRaTrackを紹介します。
本手法は,動き推定モジュールによって強化された動き分割とクラスタリングに焦点を当てる。
RaTrackは移動物体の追跡精度が優れており、最先端の技術をはるかに上回っている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 00:01:09 GMT)
Toward the Tradeoffs between Privacy, Fairness and Utility in Federated
Learning [10.5] Federated Learning(FL)は、新しいプライバシー保護分散機械学習パラダイムである。
本稿では,クライアントモデルのプライバシを保護するために,プライバシ保護フェアネスFL法を提案する。
プライバシーと公正性と実用性の関係を結論付け、これらの間にはトレードオフがある。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:19:35 GMT)
Exploring the Temperature-Dependent Phase Transition in Modern Hopfield
Networks [10.4] トランスフォーマーとモダンホップフィールドネットワークの接続が最近発見されたことで、物理的エネルギーベースの観点からニューラルネットワークの研究が再燃した。
本稿では,MHN のエネルギー最小値分布に対する逆温度ハイパーパラメータ $beta$ のピボット効果に着目した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:34:29 GMT)
SPiC-E : Structural Priors in 3D Diffusion Models using Cross-Entity
Attention [10.4] 本研究では,3次元拡散モデルに構造的ガイダンスを加えるニューラルネットワークSPiC-Eを提案する。
提案手法は,3次元スタイリゼーション,意味的形状の編集,テキスト条件の抽象化-to-3Dなど,様々なアプリケーションをサポートする。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:59:21 GMT)
Communication-Efficient Heterogeneous Federated Learning with
Generalized Heavy-Ball Momentum [10.3] 最先端のアプローチは、通信コストの増加で収束を保証するか、あるいは極端に異質な局所分布を扱うのに十分な堅牢性を持っていないかのどちらかである。
本稿では,重球運動量の新たな一般化を提案し,通信オーバーヘッドを伴わずにFLの統計的不均一性を効果的に解くためのFedHBMを提案する。
我々は、一般的なFLビジョンとNLPデータセットに対して広範な実験を行い、FedHBMアルゴリズムは、特に病的非イドシナリオにおいて、より優れたモデル品質とより高い収束速度を経験的に得ることを示した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:17:57 GMT)
Automated interpretation of congenital heart disease from multi-view
echocardiograms [10.2] 先天性心疾患(CHD)は、中国で最も多い出生障害であり、新生児死亡の原因となっている。
本研究では,多視点心エコー図を実用的エンドツーエンドのフレームワークで自動解析する手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:37:21 GMT)
Relating graph auto-encoders to linear models [10.0] 線形埋め込みモデルはグラフ畳み込みネットワークに基づくグラフオートエンコーダの少なくとも表現力を有することを示す。
1つの理由は、線形解空間を積極的に制限することは、学習と一般化を改善するのに役立つ帰納的バイアスをもたらす可能性があるからである。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:01:17 GMT)
CAST: Cross-Attention in Space and Time for Video Action Recognition [9.9] 空間時間におけるクロスアテンション(CAST)と呼ばれる新しい2ストリームアーキテクチャを提案する。
CASTは、バランスの取れた入力のみを使用して、ビデオの時間的バランスの取れた理解を実現する。
提案手法により,空間的・時間的専門家モデルによる情報交換と相乗的予測が可能となる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:58:51 GMT)
FoundPose: Unseen Object Pose Estimation with Foundation Features [9.8] FoundPoseは、単一のRGB画像から見えない剛体物体の6次元ポーズ推定法である。
この方法は、オブジェクトの3Dモデルが利用可能であるが、オブジェクト固有のトレーニングを必要としないと仮定する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:52:29 GMT)
On the Adversarial Robustness of Graph Contrastive Learning Methods [9.7] 本稿では,グラフコントラスト学習(GCL)モデルのロバスト性を評価するために,包括的評価ロバストネスプロトコルを提案する。
我々はこれらのモデルを,グラフ構造をターゲットとした適応的敵攻撃,特に回避シナリオに適用する。
本研究は,GCL手法の堅牢性に関する知見を提供することを目標とし,今後の研究方向の道を開くことを期待する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:03:33 GMT)
Just Add $\pi$! Pose Induced Video Transformers for Understanding
Activities of Daily Living [9.4] PI-ViTはビデオトランスフォーマーが学習したRGB表現を2Dと3Dのポーズ情報で拡張する手法である。
$pi$-ViTは、3つの著名なADLデータセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:59:56 GMT)
Meta-Prior: Meta learning for Adaptive Inverse Problem Solvers [9.4] 現実のイメージングの課題は、しばしば真実のデータを欠いているため、従来の監督されたアプローチは効果がない。
本手法では,様々な画像処理タスクに対してメタモデルを訓練し,特定のタスクに対して効率的に微調整を行う。
簡単な設定で、このアプローチはベイズ最適推定器を復元し、我々のアプローチの健全性を示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:02:27 GMT)
Dual-stream contrastive predictive network with joint handcrafted
feature view for SAR ship classification [9.3] 本稿では,新しいデュアルストリームコントラスト予測ネットワーク(DCPNet)を提案する。
最初のタスクは正のサンプルペアを構築し、コアエンコーダにより一般的な表現を学習させることである。
第2の課題は, 深部特徴と手話特徴との対応を適応的に把握し, モデル内での知識伝達を実現し, 特徴融合による冗長性を効果的に改善することである。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:45:11 GMT)
Automatic Implementation of Neural Networks through Reaction Networks --
Part I: Circuit Design and Convergence Analysis [9.1] 本論文は, 物質動態を考慮したプログラム型生化学反応ネットワーク (BCRN) の導入を目的とする。
第1部では、フィードフォワード伝播計算、バックプロパゲーション成分、およびFCNNのすべてのブリッジ処理を、特定のBCRNモジュールとして創発的に設計する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:31:36 GMT)
An HCAI Methodological Framework: Putting It Into Action to Enable
Human-Centered AI [9.1] 人間中心AI(HCAI)は、インテリジェントシステムの設計、開発、デプロイにおいて人間を優先することを提唱する。
HCAIの実装における方法論に関するガイダンスの欠如は、その採用を困難にしている。
本稿では,7つのコンポーネントを統合した総合的・学際的なHCAI方法論フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 23:30:38 GMT)
Multimodal Learning for Crystalline Materials [8.9] 液晶材料のための多モード学習(MLCM)は,多モードアライメントによる結晶材料の基礎モデルをトレーニングするための新しい手法である。
MLCMは、挑戦的なMaterial Projectデータベース上での材料特性予測のための最先端性能を実現する。
私たちの研究は、進行中のAI革命のイノベーションを材料科学の領域に持ち込み、素材を次世代AIのテストベッドとして特定します。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:35:29 GMT)
TeG-DG: Textually Guided Domain Generalization for Face Anti-Spoofing [8.8] 既存の方法は、様々な訓練領域からドメイン不変の特徴を抽出することを目的としている。
抽出された特徴は、必然的に残差スタイルの特徴バイアスを含んでおり、その結果、一般化性能が劣る。
本稿では,テキスト情報をドメイン間アライメントに有効活用するテキストガイド型ドメイン一般化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:13:46 GMT)
Extending Explainable Boosting Machines to Scientific Image Data [8.8] 本稿では,科学的画像データにEBM(Explainable Boosting Machines)を用いることを提案する。
量子技術の発展を支える重要な応用から着想を得て,ESMを低温原子ソリトン画像データに適用する。
我々は,本手法が人間の直観と一致していることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:57:59 GMT)
SCA-PVNet: Self-and-Cross Attention Based Aggregation of Point Cloud and
Multi-View for 3D Object Retrieval [8.7] 大規模データセットを用いた多モード3Dオブジェクト検索はめったに行われない。
本稿では,3次元オブジェクト検索のための点群と多視点画像の自己・横断的アグリゲーションを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:24:29 GMT)
Automatic Detection of Alzheimer's Disease with Multi-Modal Fusion of
Clinical MRI Scans [8.7] 1500万人のアメリカ人が2060年までに臨床ADまたは軽度認知障害を発症する。
我々は2種類の脳MRIで疾患のステージを予測することを目的としている。
我々は、T1とFLAIRのMRIスキャンから相補的な情報の相乗効果を学習するAlexNetベースのディープラーニングモデルを設計する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 04:32:28 GMT)
OST: Refining Text Knowledge with Optimal Spatio-Temporal Descriptor for
General Video Recognition [8.7] 我々は、一般化可能なビデオ認識を容易にするために、テキスト知識の洗練を優先する。
カテゴリー名の区別の少ない意味空間の限界に対処するため、我々は大規模言語モデル (LLM) を推し進める。
我々の最良のモデルは、Kinetics-600で最先端のゼロショット精度75.1%を達成する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:32:43 GMT)
Fair Community Detection and Structure Learning in Heterogeneous
Graphical Models [8.6] 確率的グラフィカルモデルにおけるコミュニティ構造の推定は、ノードが人口統計特性を持つ場合の公平性制約とは一致しないかもしれない。
本稿では、公平なグラフィカルモデル選択のための新しい$ell_$-regularized pseudo-likelihoodアプローチを定義する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:04:52 GMT)
Learning by Aligning 2D Skeleton Sequences in Time [8.6] 本稿では,人間の行動理解作業の微粒化に有用な,自己監督型時間的ビデオアライメントフレームワークを提案する。
3Dスケルトン座標の配列を入力として直接取り込む最先端の手法であるCASAとは対照的に、我々のキーアイデアは2Dスケルトン熱マップのシーケンスを入力として使用することである。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:32:32 GMT)
Anomalous Electromagnetic Induction Engendered by Singular Gauge
Transformation [8.6] 本研究では,Berry曲率による突発的電磁誘導について,その電界線がループ,リンク,結び目を形成することを検討した。
ファラデーの法則とは対照的に、交互磁場は平均値0の交流電場を生じると定めているため、交互ベリー曲率によって指向性電磁誘導が引き起こされる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:27:03 GMT)
CoRec: An Easy Approach for Coordination Recognition [8.6] パイプラインモデル座標RECognizer(CoRec)を提案する。
コーディネータと共役境界検出器の2つの構成要素から構成される。
実験によると、CoRecは下流タスクに肯定的な影響を与え、最先端のOpen IEモデルの収量を改善する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:11:27 GMT)
Monocular Camera Localization for Automated Vehicles Using Image
Retrieval [8.6] 本研究では,1台のカメラを用いて,自動運転車の現在位置と方向角をリアルタイムで検出する問題に対処する。
リアルタイムにLiDARと高精細3Dマップを必要とする手法と比較して,提案手法はスケーラブルで計算効率がよい。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:15:06 GMT)
Ignore This Title and HackAPrompt: Exposing Systemic Vulnerabilities of
LLMs through a Global Scale Prompt Hacking Competition [8.6] 大規模な言語モデルは、インジェクションとジェイルブレイクの即時実行に対して脆弱である。
われわれはグローバルなプロンプト・ハッキング・コンペティションを開催する。
我々は,600K以上の逆のプロンプトを,最先端の3つのLDMに対して提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 23:15:04 GMT)
Automatic Functional Differentiation in JAX [8.5] JAXを高階関数(機能や演算子)を自動的に区別する機能で拡張します。
関数を配列の一般化として表現することにより、JAXの既存のプリミティブシステムを使って高階関数を実装します。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:23:40 GMT)
Stochastic Vision Transformers with Wasserstein Distance-Aware Attention [8.4] 自己教師付き学習は、限られたラベル付きデータから知識を得るための最も有望なアプローチの1つである。
我々は、不確実性と距離認識を自己教師付き学習パイプラインに統合する新しいビジョントランスフォーマーを導入する。
提案手法は,多種多様なデータセットを対象とした多種多様な実験において,自己教師付きベースラインを超える精度とキャリブレーションを実現する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:53:37 GMT)
Introducing Rhetorical Parallelism Detection: A New Task with Datasets,
Metrics, and Baselines [8.4] parallelism$は、同じ言語的特徴を持つ句の並置である。
並列性の多様さにもかかわらず、自然言語処理の分野は滅多に研究されていない。
我々は、その公式な定義を構築し、新しいラテンデータセットと適応した中国語データセットを1つ提供し、その上でのパフォーマンスを評価するためのメトリクスのファミリーを確立します。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:24:57 GMT)
Data-driven prediction of tool wear using Bayesian-regularized
artificial neural networks [8.2] 工具摩耗の予測は、製造におけるコストの最小化と製品品質の向上に役立つ。
ベイジアン正規化ニューラルネットワーク(BRANN)を用いて,加工工具の摩耗を正確に予測する新しいデータ駆動モデルを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:22:20 GMT)
Large Language Models for Travel Behavior Prediction [8.1] 我々は,大規模言語モデルを用いて,データに基づくパラメータ学習を必要とせずに,迅速なエンジニアリングで旅行行動を予測することを提案する。
具体的には,1)タスク記述,2)旅行特性,3)個人属性,および4)ドメイン知識による思考のガイドなど,私たちのプロンプトを慎重に設計する。
その結果、トレーニングサンプルは提供されていないが、LLMに基づく予測は競争精度が高く、F1スコアは標準教師あり学習法であることがわかった。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 04:35:55 GMT)
Convergence of Nonconvex PnP-ADMM with MMSE Denoisers [8.0] マルチプライヤのプラグ・アンド・プレイ交互方向法 (ADMM) は, 物理測定に広く用いられている。
しかし、そのことが観察されている。
ADMMはしばしば、拡張CNNに対しても経験的に収束する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:52:47 GMT)
Cascaded Interaction with Eroded Deep Supervision for Salient Object
Detection [7.9] 既存のモデルは、アップサンプリングとダウンサンプリングによって引き起こされる情報歪みに悩まされる。
本稿では,グローバル・ローカル・アライメント・アライメント・アライメントと呼ばれるガイダンス・モジュールを用いた,新たなケースケード・インタラクション・ネットワークを提案する。
側方出力に対するラベルの負のガイダンスを低減するため,エッジ侵食に基づく深い監視戦略を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:20:54 GMT)
Quantification of cardiac capillarization in single-immunostained
myocardial slices using weakly supervised instance segmentation [7.9] AutoQCは、免疫蛍光画像中のCMや毛細血管を自動的に識別し、分割する画像解析ツールである。
AutoQCは、事前訓練されたセグメンテーションモデルのパワーを活用することで、弱教師付きインスタンスセグメンテーションアルゴリズムを備えている。
AutoQCのトレーニングでは,ピクセル単位のアノテーションではなく,バウンディングボックスアノテーションを備えた小さなデータセットのみが必要だった。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 01:36:34 GMT)
Some Intriguing Aspects about Lipschitz Continuity of Neural Networks [7.8] リプシッツ連続性は任意の予測モデルの重要な機能特性である。
ニューラルネットワークのリプシッツ挙動を調べた。
リプシッツ下界の顕著な忠実さを示し、リプシッツ上界と下界の両方で顕著な二重発振傾向を同定し、ラベルノイズが関数の滑らかさと一般化に与える影響を説明する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:27:46 GMT)
A Gell-Mann & Low Theorem Perspective on Quantum Computing: New Paradigm
for Designing Quantum Algorithm [7.7] この研究は、ゲルマン・アンド・ロー定理に基づく変分量子コンピューティングの新しい概念的視点を提供する。
我々は、正規化されたS行列を明示的に展開するために革新的な数学的手法を採用し、従順に量子コンピュータ上でダイソン級数の体系的な再構成を可能にする。
シミュレーションにより,この手法はダイソン級数を取り戻すだけでなく,頑健で安定な収束を示すことが示された。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:18:24 GMT)
AI in Pharma for Personalized Sequential Decision-Making: Methods,
Applications and Opportunities [7.6] 人工知能(AI)の利用は、過去10年間で一貫した成長を遂げてきた。
AIを活用した治療領域としては、腫瘍学(27%)、精神医学(15%)、胃腸学(12%)、神経学(11%)が有力である。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:23:17 GMT)
Exploring the hierarchical structure of human plans via program
generation [7.5] 階層的表現を観測可能な実験パラダイムを用いて、人々が階層的に構造化されたプランを構築する方法について検討する。
人間は2つの確立された人間の行動原理に敏感であるが、どちらも人間が作成したプログラムの質的な特徴を予測できない。
我々は、生成的アカウントを生成的プログラムに拡張し、行動上の文法の帰納として階層選択をモデル化することで、再利用のためのこの嗜好を定式化する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:53:02 GMT)
Handwriting recognition and automatic scoring for descriptive answers in
Japanese language tests [7.5] 本報告では, 大学入試試験における手書き記述回答の自動評価実験について述べる。
すべての答えは人間の検査官によって採点されているが、手書き文字はラベル付けされていない。
我々は、ラベル付き手書きデータセットで訓練されたディープニューラルネットワークベースの手書き文字認識器を、このラベル付き回答セットに適応させようと試みる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:51:24 GMT)
A Survey of Learning Criteria Going Beyond the Usual Risk [7.3] グッドパフォーマンス」は、テストデータのランダムな引き分けに乗じて、十分に小さな平均損失という観点で記述されるのが一般的である。
平均的なパフォーマンスを最適化することは直感的であり、理論上は解析しやすく、実際は容易に実装できるが、そのような選択はトレードオフをもたらす。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 00:09:25 GMT)
Consensus-based construction of high-dimensional free energy surface [7.3] 主な課題は、エネルギー障壁と次元の出現である。
既存のアプローチは、フルフェーズ空間の効率的な探索を確立するための洗練されたサンプリング手法に基づいていることが多い。
本稿では,関数表現とトレーニングセットを同時に最適化し,サンプリングに基づくアプローチを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 01:10:11 GMT)
Packrat: Automatic Reconfiguration for Latency Minimization in CPU-based
DNN Serving [7.2] Packratは、最適なインスタンス数をアルゴリズムで選択する、オンライン推論のための新しいサービスシステムである。
Packratは、バッチサイズの範囲で平均化され、一般的に使用されるDNNの範囲で、推論遅延を1.43$times$から1.83$times$に改善する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 01:36:46 GMT)
Direct Manipulation of quantum entanglement from the non-Hermitian
nature of light-matter interaction [7.1] 我々は、光原子相互作用を自然の非エルミート系として測定することで、双光子における例外点(EP)の実証を報告する。
このような双光子相関は、ラビ振動から反バンチング指数デカイまで、前例のない広い範囲で調整される。
本結果は, 人工フォトニック構造を介さずに, 自然非エルミート過程の制御性を実現するためのユニークな方法である。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:52:11 GMT)
Differentiable matrix product states for simulating variational quantum
computational chemistry [7.0] 本稿では,変分量子固有解法(VQE)の並列化可能な古典シミュレータを提案する。
我々のシミュレーターは量子回路の進化を古典的自己微分フレームワークにシームレスに統合する。
応用として、我々のシミュレーターを用いて、一般的なHF、LiH、H$Oなどの小分子と、最大40ドルの量子ビットを持つより大きな分子であるCO$$、BeH$、H$_4$を研究する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:59:06 GMT)
Zero Bubble Pipeline Parallelism [6.7] 実験により,本手法は1F1Bのスループットを23%まで向上させることを示した。
パイプライン並列化の真の可能性を活用する上で、我々の結果は大きな一歩だと信じています。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:40:34 GMT)
Towards Comparable Active Learning [6.6] 近年の文献で報告されているリフトは、他の領域にあまり一般化せず、アクティブラーニング研究の不確定な状況に繋がることを示す。
本稿では,様々なタスクや領域にまたがるアルゴリズムを公平に比較するためのアクティブラーニングフレームワークと,評価のための高速で実行可能なオラクルアルゴリズムを提供することにより,これらの課題に対処する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 08:54:32 GMT)
EFormer: Enhanced Transformer towards Semantic-Contour Features of
Foreground for Portraits Matting [6.5] 本稿では,低周波セマンティクスと高周波輪郭特徴の両方に対するモデルの注意力を高めるためにEFormerを提案する。
我々は,低周波な意味的特徴と高周波な輪郭特徴の両方を正確に捉えるために,意味的・輪郭検出装置(SCD)を構築した。
そして,輪郭端抽出部と意味抽出部を設計し,改良された高周波輪郭特徴と完全低周波意味情報を抽出する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 08:59:34 GMT)
Combined Scheduling, Memory Allocation and Tensor Replacement for
Minimizing Off-Chip Data Accesses of DNN Accelerators [6.4] 本稿では,Deep Neural Networks を専用ハードウェアアクセラレータにマッピングする COSMA という最適化フレームワークを提案する。
COSMAは、データアクセスを最小化する最適な演算子スケジュール、メモリ割り当て、テンソル置換を見つける。
既製のICPソルバを用いてCOSMAは,異なるアプリケーションに対して,多種多様な最先端DNNに対して,数秒で最適解が得られることを示した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 04:36:25 GMT)
ECNR: Efficient Compressive Neural Representation of Time-Varying
Volumetric Datasets [6.3] 圧縮型ニューラル表現は、大量のデータセットを管理する従来の圧縮方法に代わる有望な代替手段として登場した。
本稿では、時間変化データ圧縮のための効率的なニューラル表現(ECNR)ソリューションを提案する。
複数のデータセットでECNRの有効性を示し、それを最先端の圧縮手法と比較する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 00:51:38 GMT)
Semi-supervised Semantic Segmentation via Boosting Uncertainty on
Unlabeled Data [6.3] トレーニングデータセットにおけるラベル付き分布とラベルなし分布の分析を行う。
本稿では2つの戦略を提案し,特に半教師付きセマンティックセグメンテーションのための不確実性ブースターアルゴリズムを設計する。
提案手法は,従来の半教師付きセマンティックセグメンテーション法と比較して,最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:01:03 GMT)
Knowledge Pursuit Prompting for Zero-Shot Multimodal Synthesis [6.2] 意味的詳細が不十分な不正確なプロンプトによる幻覚と不信な合成は、マルチモーダル生成モデルで広く観察されている。
我々は、外部知識を反復的に組み込んだゼロショットフレームワークであるKPP(Knowledge Pursuit Prompting)を提案する。
KPPは多様な視覚領域にまたがって忠実でセマンティックにリッチなコンテンツを生成することができ、マルチモーダル生成モデルを改善するための有望なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:59:01 GMT)
Controlgym: Large-Scale Safety-Critical Control Environments for
Benchmarking Reinforcement Learning Algorithms [6.2] 我々は,36の安全クリティカルな産業制御設定と10の無限次元偏微分方程式(PDE)に基づく制御問題からなるライブラリである制御ギームを導入する。
controlgymはOpenAI Gym/Gymnasiumフレームワークに統合されている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:34:05 GMT)
Data-efficient Deep Reinforcement Learning for Vehicle Trajectory
Control [6.1] 強化学習(RL)は、古典的なアプローチよりも優れた制御性能を達成することを約束する。
SAC(Soft-actor critic)のような標準RLアプローチでは、大量のトレーニングデータを収集する必要がある。
近年開発されたディープRL法を車両軌道制御に適用した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:38:59 GMT)
Learning Triangular Distribution in Visual World [6.1] 畳み込みニューラルネットワークは、ラベル分布学習を含む広汎な視覚タスクで成功している。
本研究では,特徴量とそのラベル間の数学的関連性について検討し,ラベル分布学習のための汎用的でシンプルな枠組みを提案する。
特徴とラベルの間に射影関数を構築するためのいわゆる三角分布変換(TDT)を提案し、対称的特徴差がラベルの違いを線形に反映することを保証する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:02:13 GMT)
Probing and Mitigating Intersectional Social Biases in Vision-Language
Models with Counterfactual Examples [6.1] 我々は、テキスト・ツー・イメージ拡散モデルを用いて、大規模に侵入する社会的バイアスを探索する対実例を作成する。
SocialCounterfactualsは、性別、人種、身体的特徴に関連する交叉バイアスを求めるために、171k以上の画像テキストペアを含む高品質なデータセットである。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:32:14 GMT)
FediOS: Decoupling Orthogonal Subspaces for Personalization in
Feature-skew Federated Learning [6.1] パーソナライズド・フェデレーションド・ラーニング(pFL)では、クライアントは異種データ(非IIDとも呼ばれる)を持つことがある。
FediOSでは、デカップリングを2つの特徴抽出器(ジェネリックとパーソナライズ)と1つの共有予測ヘッドに再構成する。
さらに、共有予測ヘッドは、推論中のジェネリック機能とパーソナライズ機能の重要性のバランスをとるために訓練される。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:50:38 GMT)
Scalable Bayesian uncertainty quantification with data-driven priors for
radio interferometric imaging [6.0] 次世代の電波干渉計は、前例のない角分解能と感度のおかげで、科学的発見を解き放つ可能性がある。
潜在的な可能性を解き放つ鍵の1つは、受信データの希薄さと複雑さを扱うことである。
本研究では,ラジオインターフェロメトリイメージングにおける不確実性定量化に対処するQuantifAIという手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:00:02 GMT)
COVID-19 Vaccine Misinformation in Middle Income Countries [5.9] 本稿では、中所得国であるブラジル、インドネシア、ナイジェリアの3カ国からの注釈付きツイートからなる、新型コロナウイルスワクチン誤報の多言語データセットについて紹介する。
データセットには、5,952ツイートのアノテーション、新型コロナウイルスワクチンとの関連性、誤情報の存在、誤情報のテーマなどが含まれている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:27:34 GMT)
RainAI -- Precipitation Nowcasting from Satellite Data [5.9] 本稿では,Weather4 2023コンペティションに対する解決策を提案する。
目標は、低解像度の衛星放射率画像を用いて8時間のリードタイムで高解像度の降水を予測することである。
本稿では,2次元U-Netモデルを用いた簡易かつ効果的な特徴学習法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:49:16 GMT)
SmartChoices: Augmenting Software with Learned Implementations [5.7] 我々は、機械学習を成熟したソフトウェアスタックに組み込む新しいアプローチであるSmartChoicesを紹介します。
本稿では,SmartChoicesを大規模産業システムに応用した重要な設計決定とケーススタディを紹介する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:16:04 GMT)
Autonomous Agents in Software Development: A Vision Paper [5.7] 大規模言語モデル(LLM)とGPT(Generative Pre-trained Transformer)がソフトウェア工学(SE)の分野を変えつつある
このビジョンペーパーは、SEにおけるGPTベースのエージェントの役割について尋ねる。
我々のビジョンは、複数のGPTエージェントがSEタスクに貢献する能力を活用し、将来の作業のための初期ロードマップを提案することである。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:42:43 GMT)
Planning Reliability Assurance Tests for Autonomous Vehicles [5.6] AI技術の1つの重要な応用は、自動運転車(AV)の開発である。
保証テストの計画を立てるには、どのくらいのAVをテストする必要があるか、テストに合格する基準を定める必要がある。
本稿では,連続イベントデータに基づくAV信頼性保証試験の統計的手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 20:48:20 GMT)
DRM-IR: Task-Adaptive Deep Unfolding Network for All-In-One Image
Restoration [5.6] 本研究は,効率的な動的参照モデリングパラダイム(DRM-IR)を提案する。
DRM-IRはタスク適応型劣化モデリングとモデルベースの画像復元で構成されている。
複数のベンチマークデータセットの実験は、DRM-IRがAll-In-One IRで最先端のIRを達成することを示している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:19:34 GMT)
HKUST at SemEval-2023 Task 1: Visual Word Sense Disambiguation with
Context Augmentation and Visual Assistance [5.6] 本稿では,事前学習したビジョンランゲージモデルを最大限活用するマルチモーダル検索フレームワークを提案する。
当社のシステムは,SemEval-2023 Task 1では最も競争力のある成果を上げていませんが,チームの半分近くを破ることが可能です。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:23:15 GMT)
Preference and Concurrence Aware Bayesian Graph Neural Networks for
Recommender Systems [5.5] グラフベースのコラボレーティブフィルタリング手法はレコメンダシステムの性能向上に寄与した。
本稿では,ユーザの好みや項目の一致,重要なグラフ構造情報などを共同で検討する効率的な生成モデルを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:49:33 GMT)
Spacewalk-18: A Benchmark for Multimodal and Long-form Procedural Video
Understanding in Novel Domains [5.4] 本研究では,(1)ステップ認識と(2)宇宙遊泳記録のデータセット上での映像内検索の2つのタスクを含むベンチマークであるSpacewalk-18を紹介する。
現状の手法が我々のベンチマークでは不十分であることが分かり、一般化可能な手続き型ビデオ理解モデルの目標がはるかに外れていることが証明された。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:19:23 GMT)
MCI Detection using fMRI time series embeddings of Recurrence plots [5.3] 本研究では,耳障りな利害の地域(ROI)において,その構造や欠如を理解するために基礎となるダイナミクスについて検討する。
この差動行動は、神経変性の理解や、健常者と軽度認知障害者(MCI)の分類の鍵となる可能性がある。
本研究では,ドセンバッハテンプレートから得られる160ROIを超える6つの脳ネットワークについて検討した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 05:57:50 GMT)
REF$^2$-NeRF: Reflection and Refraction aware Neural Radiance Field [5.3] 本稿では,ガラスケースを含むシーンのNeRFモデリング手法を提案する。
リフレクションとリフレクションは、視聴者の視点に依存して独立な要素を用いてモデル化される。
既存の手法と比較して,ガラス屈折率と全体像のより正確なモデリングが可能である。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:30:28 GMT)
Weak Alignment Supervision from Hybrid Model Improves End-to-end ASR [5.3] 我々は、音声認識のエンドツーエンドモデリングを支援するために、既存のハイブリッドシステムから弱いアライメントの監督を作成する。
次に、導出したアライメントを用いてエンコーダの特定の層にクロスエントロピー損失を生成する。
一般的な1ホットクロスエントロピー損失とは対照的に,ラベル平滑化パラメータを持つクロスエントロピー損失を用いて監督を規則化する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 20:18:56 GMT)
TransCORALNet: A Two-Stream Transformer CORAL Networks for Supply Chain
Credit Assessment Cold Start [5.0] このモデルは、履歴データに制限のある新規サプライチェーン借入者に対して、正確な信用評価予測を提供することを目的としている。
提案モデルは、ドメインシフト、コールドスタート、不均衡クラス、解釈可能性の4つの重要なサプライチェーンクレジットアセスメント課題に対処する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:47:02 GMT)
How does spatial structure affect psychological restoration? A method
based on Graph Neural Networks and Street View Imagery [5.0] 都市部における空間構造と復元品質の関係を明らかにするために,空間依存型グラフニューラルネットワーク(GNN)を提案する。
道路のトポロジ的関係を非ユークリッド的なデータ構造としてモデル化した都市レベルのグラフは、復元の質を測定するために用いられた。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:18:36 GMT)
Less is More -- Towards parsimonious multi-task models using structured
sparsity [4.9] この作業は、パラメータが少ない複数のタスクに最適化されたスパースモデルを作成することに焦点を当てている。
マルチタスク学習モデルの共有畳み込み層パラメータ(あるいは重み付け)にチャネルワイズl1/l2グループ間隔を導入する。
広範に使用されている2つのマルチタスク学習(MTL)データセットにおいて,シングルタスクとマルチタスク設定の両方においてグループ間隔が生じた結果を分析した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:26:54 GMT)
On the convergence of adaptive first order methods: proximal gradient
and alternating minimization algorithms [4.8] AdaPG$pi,r$は、より大きな段階的なポリシーと改善された下位境界を提供することで、既存の結果を統一し、拡張するフレームワークである。
パラメータ $pi$ と $r$ の異なる選択について論じ、数値シミュレーションにより結果の有効性を示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:29:43 GMT)
Analyzing Semantic Faithfulness of Language Models via Input
Intervention on Question Answering [4.8] 本研究では,意味的忠実性の概念を定式化し,テキストの意味的内容が質問応答におけるモデルの推論を因果的に判断する。
削除介入と否定介入という2つのセマンティック介入を実行すると、トランスフォーマーモデルは意味的に忠実でないことが示される。
本稿では,削除介入に対する望ましくない効果を,かなりのマージンで軽減できる介入ベーストレーニング体制を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:42:26 GMT)
Perturbation-based Analysis of Compositional Data [4.7] 合成データ解析のための仮説データ摂動に基づくフレームワークを提案する。
摂動依存再パラメータ化を導出することにより, 摂動効果の平均を効率的に推定できることを示す。
本研究は,米国国勢調査および微生物叢データにおけるシミュレーションデータと既存手法の利点を実証的に分析する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:27:15 GMT)
Class Distribution Shifts in Zero-Shot Learning: Learning Robust
Representations [4.6] 本稿では,ゼロショット検証タスクにおけるクラス分布シフトに頑健なデータ表現を学習するアルゴリズムを提案する。
本稿では,階層的なデータサンプリングと分布外一般化技術を組み合わせることで,シミュレーションと実世界のデータセットの両方において,多様なクラス分布への一般化を向上することを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:14:31 GMT)
Clustering Inductive Biases with Unrolled Networks [4.5] 本稿では,2部グラフのラプラシア二次形式を通してスペクトルクラスタリングを行うために,潜在表現を暗黙的に局所的に整理したオートエンコーダアーキテクチャ(WLSC)を提案する。
我々の正規化は、ある種の刺激のクラスに対する受容野の早期特殊化と解釈できることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:02:30 GMT)
Benchmarking and Enhancing Disentanglement in Concept-Residual Models [4.2] 概念ボトルネックモデル (CBM) は、まず意味論的に意味のある一連の特徴を予測する解釈可能なモデルである。
CBMの性能はエンジニアリングされた機能に依存しており、不完全な概念のセットに苦しむことがある。
本研究は,情報漏洩を解消するための3つの新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 21:07:26 GMT)
Efficient Preparation of Nonabelian Topological Orders in the Doubled
Hilbert Space [4.1] すべての量子二重モデルの基底状態は、二重ヒルベルト空間において効率的に準備できることが示される。
アーベル的かつ非アーベル的である非自明なエノンブレイディング効果は、双対ヒルベルト空間において実現可能である。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:17:51 GMT)
Action Recognition in Video Recordings from Gynecologic Laparoscopy [4.0] 行動認識は腹腔鏡画像解析における多くの応用の前提条件である。
本研究では,CNN-RNNアーキテクチャと,カスタマイズしたトレーニング推論フレームワークの設計と評価を行う。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:15:46 GMT)
Turbulent dynamics in two-dimensional paraxial fluid of light [3.9] 光学における量子乱流を研究するための新しいシステムを提案する。
運動量空間における等方性の発生と、非圧縮性運動エネルギースペクトルにおける異なるスケーリング則の存在を示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:59:07 GMT)
ClothCombo: Modeling Inter-Cloth Interaction for Draping Multi-Layered
Clothes [3.8] 人間の3次元モデルに任意の服の組み合わせを描画するパイプラインであるClathComboを提示する。
本手法は,GNNに基づくネットワークを用いて,異なる階層の衣服間の相互作用を効率的にモデル化する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:00:56 GMT)
PyDCM: Custom Data Center Models with Reinforcement Learning for
Sustainability [3.8] PyDCMは、Pythonで実装されたカスタマイズ可能なデータセンターモデルである。
ベクトル化熱計算を用いることで、PyDCMのオーダーは現在のEnergy Plusのモデリング実装よりも桁違いに速い(30倍)。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 00:58:43 GMT)
Experimental realization of universal high-dimensional quantum gates
with ultra-high fidelity and efficiency [3.8] 4次元の単一光キューディットに対して、普遍的な量子ゲートの集合を提案、実験的に示す。
超高平均ゲート忠実度99.73%$と効率99.47%$は、フォールトトレラント量子計算の誤差しきい値よりも高い。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 01:51:51 GMT)
DEVIAS: Learning Disentangled Video Representations of Action and Scene
for Holistic Video Understanding [3.6] 本稿では,Distangled VIdeo representations of Action and Scene (DEVIAS) を提案する。
提案手法は,ベースラインと比較して,異なるデータセット間で良好な性能を示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:58:44 GMT)
Adapter is All You Need for Tuning Visual Tasks [3.6] 本稿では,新しい適応型チューニング手法であるマルチ認知型ビジュアルアダプタ(Mona)チューニングを提案する。
まず、視覚信号の処理能力を高めるために、複数の視覚フレンドリーなフィルタをアダプタに導入する。
次に,適応器に拡張正規化層を追加し,視覚フィルタの入力特徴の分布を調節する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:57:30 GMT)
Convolutional Neural Networks for Segmentation of Malignant Pleural
Mesothelioma: Analysis of Probability Map Thresholds (CALGB 30901, Alliance) [3.6] 深層学習を用いた自動セグメンテーション手法を用いてボリュームを取得する。
本研究の目的は,畳み込みニューラルネットワーク(CNN)を用いて発生したMPM腫瘍像に対する確率マップ閾値の影響を評価することである。
CNNアノテーションは、放射線医の輪郭よりも腫瘍の体積が小さい。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 22:07:07 GMT)
GlycoNMR: Dataset and benchmarks for NMR chemical shift prediction of
carbohydrates with graph neural networks [3.5] 分子表現学習(MRL)は、機械学習と化学科学のギャップを埋めるための強力なツールである。
MRLはタンパク質と一般的な生体分子のデータセットで大きな成功を収めた。
グリコNMRには、2,609の炭水化物構造と211,543のアノテート核磁気共鳴(NMR)化学シフトがある。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:06:29 GMT)
Calibration-free online test-time adaptation for electroencephalography
motor imagery decoding [3.5] 我々は,オンラインテスト時間適応(OTTA)の概念を考察し,推論時間中に教師なしの方法でモデルを継続的に適応させる。
提案手法では,適応プロセス中にソースデータにアクセスする必要がなくなることにより,プライバシの保護が保証される。
我々は、アライメント、適応バッチ正規化、エントロピー最小化といった様々なOTTA技術とともに、軽量なアーキテクチャを用いて、脳波(EEG)運動画像デコーディングの課題について検討する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:53:43 GMT)
Non-uniform Online Learning: Towards Understanding Induction [3.5] 非一様オンライン学習の概念を導入し、帰納的推論の原理とより密接に一致していると主張している。
実現可能な設定では、有限誤差で学習可能性の完全な特徴づけを提供する。
結果をより現実的な設定にまで拡張し、Littlestoneクラスの可算和が後悔して学習できることを示します。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 20:02:25 GMT)
Fool the Hydra: Adversarial Attacks against Multi-view Object Detection
Systems [3.5] Adrial patchは、現実のシナリオにおける機械学習(ML)モデルに対する敵対的な攻撃によって引き起こされる脅威の、明白な顕在化を実証するものだ。
マルチビューオブジェクトシステムは、複数のビューからのデータを組み合わせて、困難な環境でも信頼性の高い検出結果を得ることができる。
現実の視覚アプリケーションにおいて重要であるにもかかわらず、マルチビューシステムの敵パッチに対する脆弱性は十分に調査されていない。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 20:11:44 GMT)
Quantum fidelity kernel with a trapped-ion simulation platform [3.5] 量子カーネル法は、入力情報を量子系のヒルベルト空間に埋め込むことによって計算されたカーネル関数を利用する。
本稿では,量子カーネルを計算し,バイナリ分類タスクの有効性を実証する手段として,トラップイオンシミュレーションプラットフォームを提案する。
その結果,イオントラッププラットフォームは量子カーネル計算に適しており,数量子ビットで高い精度が得られることがわかった。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:19:52 GMT)
A Comparison Between Invariant and Equivariant Classical and Quantum
Graph Neural Networks [3.5] グラフニューラルネットワーク(GNN)のような深層幾何学的手法は、高エネルギー物理学における様々なデータ解析タスクに活用されている。
典型的なタスクはジェットタグであり、ジェットは異なる特徴とそれらの構成粒子間のエッジ接続を持つ点雲と見なされる。
本稿では,古典的グラフニューラルネットワーク(GNN)と,その量子回路との公平かつ包括的な比較を行う。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:19:13 GMT)
Adiabatic-Passage Based Parameter Setting Method for Quantum Approximate
Optimization Algorithm on 3-SAT Problem [3.4] 断熱経路に基づくパラメータ設定法を提案し, 3SAT に適用した。
シミュレーションでは、最適化コストはQAOAの深さ$p$のサブ線形と対数の間で大幅に削減される。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 01:06:41 GMT)
Probing Quantifier Comprehension in Large Language Models: Another
Example of Inverse Scaling [3.4] 我々は,大言語モデル (LLM) が否定や量化器の理解のための単純な言語テストで失敗することを示す。
我々は,人間の心理言語実験に反する,最多型量化器理解のための逆スケーリングを観察する。
この評価は125M-175Bパラメータのモデルで行われており、LLMは量子化器では期待通りには行わないことを示唆している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 01:01:32 GMT)
Enhancing Ligand Pose Sampling for Molecular Docking [3.3] ディープラーニングは分子ドッキングのスコアリング機能を劇的に改善する。
GLOW (auGmented sampLing with sOftened vdW potential) と IVES という新しい手法について述べる。
評価の結果,提案手法が正確なポーズをサンプリングする可能性の向上に有効であることが示された。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 21:02:37 GMT)
LLVMs4Protest: Harnessing the Power of Large Language and Vision Models
for Deciphering Protests in the News [3.3] 本稿では,テキストと画像データを用いて,新聞記事における潜在的な抗議を推測するために,長変圧器と斜変圧器v2を含む2つの大きな事前訓練型変圧器モデルを微調整した方法について述べる。
本報告は,LLVMを用いたテキストおよび画像データにおける抗議行動の推測に関心のある社会運動学者を対象とした,短い技術的報告である。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 04:17:30 GMT)
A Compilation Scheme for Suppressing Crosstalk and Decoherence in
Superconducting Quantum Chips with Tunable Coupling and Tunable Qubits [3.3] 量子コンピューティングにおけるクロストーク緩和とデコヒーレンス抑制のための最適化された量子ビットマッピングとゲートスケジューリング手法を提案する。
本手法は,アディベートゲート系と可変カプラ系,可変キュービット系の両方でクロストークを遮断できるパルス補償法に基づく。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 00:31:03 GMT)
Technical Debt Management Automation: State of the Art and Future
Perspectives [3.2] TDM(Technical debt management)とは、TDを扱うための一連の活動を指す。
TDM自動化における現在のアプローチを要約する研究が不足している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:51:12 GMT)
Applying an Evolutionary Algorithm to Minimize Teleportation Costs in
Distributed Quantum Computing [3.2] 量子通信ネットワークは、古典的および量子チャネルを介して複数の量子コンピュータ(QC)を接続することによって形成することができる。
分散量子コンピューティングでは、QCは集合的に量子計算を行う。
本稿では,この問題に対する進化的アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:10:28 GMT)
Polarization compensation methods for quantum communication networks [3.2] ポーラライゼーションに基づく絡み合い分散ネットワークは、スケーラビリティと信頼されたノードの欠如により、有望なアプローチである。
偏光補償の4つの方法を提案し,検討する。
複雑性、労力、ネットワーク操作の破壊レベル、パフォーマンスに基づいてそれらを比較します。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:26:36 GMT)
DroidDissector: A Static and Dynamic Analysis Tool for Android Malware
Detection [3.2] DroidDissectorは静的機能と動的機能の両方を抽出するツールである。
静的解析モジュールは、マニフェストファイルとアプリケーションのソースコードの両方から機能を抽出し、幅広い機能の配列を取得する。
動的解析モジュールは最新バージョンのAndroidで動作し、アプリケーションの完全な振る舞いを分析する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:28:38 GMT)
DeepEn2023: Energy Datasets for Edge Artificial Intelligence [3.1] 我々は、エッジAIのための大規模エネルギーデータセットDeepEn2023を提案し、幅広いカーネル、最先端のディープニューラルネットワークモデル、一般的なエッジAIアプリケーションをカバーする。
DeepEn2023は、デバイス上でのディープラーニングにおける持続可能性の透明性を、さまざまなエッジAIシステムやアプリケーションにわたって改善することを期待しています。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:54:36 GMT)
Navigating News Narratives: A Media Bias Analysis Dataset [3.1] ニュースナラティブをナビゲートする:メディアバイアス分析データセット"は、メディアバイアスを検出し分析するツールの緊急ニーズに対処する包括的なデータセットである。
このデータセットは幅広いバイアスの範囲を含み、メディア研究と人工知能の分野でユニークな価値ある資産となっている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:59:19 GMT)
A PSO Based Method to Generate Actionable Counterfactuals for High
Dimensional Data [3.0] 粒子群最適化(PSO)に基づく効率的で実用的な逆ファクトアル(CF)生成法について述べる。
これらの特徴を組み込んだアルゴリズムが提案され、生成されたCFの近接特性と疎性特性をより制御できる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:12:38 GMT)
Choosing the parameter of the Fermat distance: navigating geometry and
noise [2.9] Fermat distanceは、実践者が自然距離を直接利用できない場合、機械学習タスクに有用なツールである。
この距離は、その後のタスクのパフォーマンスに大きな影響を与えるパラメータ$alpha$に依存する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:11:12 GMT)
Precipitation Prediction Using an Ensemble of Lightweight Learners [2.9] 降水分布の多様なパターンを捉えるために,複数の学習者を利用したアンサンブル学習フレームワークを提案する。
提案手法は複雑な降雨パターンを効果的にモデル化することができる。
2023年のWeather4Castコンペティションでは、コアテストで1位を獲得した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:20:16 GMT)
Cascade Learning Localises Discriminant Features in Visual Scene
Classification [2.9] 階層的な学習戦略,すなわちカスケード学習(CL)がより局所的な特徴をもたらすことを示す。
ローカライゼーションの精度を考慮すると、CLがE2Eより優れているだけでなく、領域を予測するための有望な方法であることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:07:23 GMT)
Multi-scale MRI reconstruction via dilated ensemble networks [2.9] 拡張畳み込みを用いた高効率なマルチスケール再構成ネットワークを導入し,分解能の維持を図る。
並列拡張フィルタにインスパイアされた複数の受容場は、大きな構造的アーティファクトときめ細かい局所的特徴の両方を見る分岐とともに同時に処理される。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:00:06 GMT)
Structured Pruning for Deep Convolutional Neural Networks: A survey [2.8] これにより、ストレージと計算コストを効果的に削減するため、ニューラルネットワークのプルーニングが関心を集めている。
本稿では, 深部CNNの構造化プルーニングに向けた最近の進展を概観する。
本稿では,フィルタランキング手法,正規化手法,動的実行,ニューラルネットワーク探索,抽選チケット仮説,プルーニングの応用について,最先端の構造化プルーニング手法を要約して比較する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:39:30 GMT)
Handling Cost and Constraints with Off-Policy Deep Reinforcement
Learning [2.8] 政治外学習の最も一般的な方法は、学習された状態アクション(Q$)値関数が選択されたデータのバッチに対して最大化されるポリシー改善ステップである。
我々は、この戦略を「混合符号」報酬関数を持つ環境で再考する。
この2つ目のアプローチは、混合符号の報酬を持つ連続的な行動空間に適用した場合、リセットによって拡張された最先端の手法よりも一貫して、著しく優れる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:31:04 GMT)
VREM-FL: Mobility-Aware Computation-Scheduling Co-Design for Vehicular
Federated Learning [2.8] 本稿では,車載フェデレート学習のための計算スケジューリング協調設計であるVREM-FLを提案する。
提案アルゴリズムは、無線リソース使用のためのトレードモデルトレーニング時間に調整することができる。
VREM-FLは、線形回帰モデル(学習時間を28%削減)と、セマンティックイメージセグメンテーションタスクのためのディープニューラルネットワークの両方のベンチマークより優れている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:38:54 GMT)
Flexible polar encoding for information reconciliation in QKD [2.6] 量子鍵分配(QKD)は、情報理論的に安全な共通秘密鍵を確立する。
一般に量子チャネルに対する敵の誘惑に起因すると考えられるエラーは、公開チャネル上の古典的な通信を用いて修正する必要がある。
信頼性シーケンスを導出し,デコーダの選択に依存しないエンコーダの設計に利用できることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:01:10 GMT)
Matched Pair Calibration for Ranking Fairness [2.6] マッチングペアキャリブレーションと呼ばれるスコアベースランキングシステムにおける公平性テストを提案する。
本稿では,2進分類設定からランク付けまで,キャリブレーションの公平さの直観を一般化する方法について述べる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:22:59 GMT)
Language Embedded 3D Gaussians for Open-Vocabulary Scene Understanding [2.5] オープン語彙クエリタスクのための新しいシーン表現であるLanguage Embedded 3D Gaussiansを紹介する。
我々の表現は、現在の言語埋め込み表現において、最高の視覚的品質と言語クエリの精度を達成する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:50:07 GMT)
A Pedestrian's Way to Baxter's Bethe Ansatz for the Periodic XYZ Chain [2.4] 固定数のキンクを持つキラルベクトルの集合を構築する。
ユニタリ条件の根の下では、ヒルベルト空間は不変部分空間を持つ。
カイラルベクトルに対するハミルトニアンの作用に基づくベーテアンサッツを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:48:23 GMT)
CLIP-QDA: An Explainable Concept Bottleneck Model [2.4] 本稿では,高速かつ説明可能な画像分類を行うマルチモーダル基礎モデルから設計した説明可能なアルゴリズムを提案する。
我々の説明は計算を高速化しながら既存のXAI手法と競合する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:19:47 GMT)
Assessment of Deep Learning Segmentation for Real-Time Free-Breathing
Cardiac Magnetic Resonance Imaging [2.4] 心臓MRI(CMR)セグメンテーションのために設計された、あるいは訓練されたディープラーニング手法は、リアルタイムCMRでよく機能する。
リアルタイムな自由呼吸型CMRでは、ディープラーニングメソッドのパフォーマンスは、cine CMRのサーバ間変動に匹敵する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:34:14 GMT)
Evaluating the Impact of Flaky Simulators on Testing Autonomous Driving
Systems [2.3] シミュレーションに基づく自律運転システム(ADS)のテストにおけるフレキネスの検討
ADSにおけるテストフレキネスは一般的な現象であり,ランダム化アルゴリズムにより得られたテスト結果に大きな影響を及ぼす可能性が示唆された。
我々の機械学習(ML)分類器は、単一のテスト実行のみを使用して、脆弱なADSテストを効果的に識別する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:08:02 GMT)
Lessons from Building CodeBuddy: A Contextualized AI Coding Assistant [2.3] 大規模言語モデル上に構築された新しいタイプのツールが登場しつつある。
これらのツールは、微調整やコンテキスト情報によるユーザプロンプトの強化といった手法を用いて、欠点を軽減することを目的としている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:51:26 GMT)
Differentiable JPEG: The Devil is in the Details [2.2] 従来の制限を克服する新しいdiff. JPEGアプローチを提案する。
我々のアプローチは、入力画像、JPEG品質、量子化テーブル、色変換パラメータなど、微分可能である。
提案したdiff. JPEGは(非diff.)参照実装に最もよく似ており、最近のbest diff.アプローチを平均$3.47$dB (PSNR) で大幅に上回っている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:23:21 GMT)
MRFP: Learning Generalizable Semantic Segmentation from Sim-2-Real with
Multi-Resolution Feature Perturbation [2.2] 本稿では,ドメイン固有の細粒度特徴と粗い特徴の摂動スタイルをランダム化するための,MRFP(Multi Resolution Feature Perturbation)手法を提案する。
MRFPは最先端のディープニューラルネットワークで、シミュレーションから実際のセマンティックセグメンテーションのための堅牢なドメイン不変機能を学ぶのに役立つ。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 08:02:49 GMT)
Minimal-noise estimation of noncommuting rotations of a spin [2.2] 2スピン圧縮状態を用いてスピンの回転を測定するために,$textSU (1,1)$interferometry の類似体を提案する。
特定の方向と強度について、古典的境界上のすべての赤道回転軸に対する感度の利点を示す。
この結果から,同じ最適化初期状態を持つ$x$-$y$平面の任意の方向の磁場を測定する方法が得られた。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:40:18 GMT)
Advancements and Trends in Ultra-High-Resolution Image Processing: An
Overview [2.2] 本稿では,2つの視点からUHD画像強調の現状を紹介する。
1つはアプリケーション分野、もう1つは技術です。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 23:47:37 GMT)
Finding emergence in data by maximizing effective information [2.2] 創発的な現象を特定し、利用可能なデータを使用してマクロレベルで創発的なダイナミクスをキャプチャするフレームワークを開発することが重要です。
本稿では,因果発生理論(CE)にヒントを得て,創発的潜在空間におけるマクロ力学を学習するための機械学習フレームワークを提案する。
シミュレーションおよび実データによる実験結果から,提案手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:56:01 GMT)
Leveraging cache to enable SLU on tiny devices [2.1] 小型デバイスのための音声キャッシュXYZを提案する。
音声入力は、2つのレベルの表現で一致します。まずは生音ユニットのクラスタ化されたシーケンス、次に音素のシーケンスです。
市販のSTM32マイクロコントローラにXYZを実装した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:15:07 GMT)
Global Convergence of Online Identification for Mixed Linear Regression [1.9] 混合線形回帰(MLR)は非線形関係を特徴づける強力なモデルである。
本稿では,MLRの2つの基本クラスにおけるオンライン識別とデータクラスタリングの問題について検討する。
期待最大化原理に基づく新しいオンライン識別アルゴリズムを2つ導入する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:30:42 GMT)
Qutrit codes within representations of SU(3) [1.9] 本稿では,SU(3)の既約表現内に埋め込まれた量子誤り検出符号と誤り訂正符号について述べる。
これらの論理クォートリットは、小さなSU(3)変位から保護しながら、表現によって誘導されるHe(3)対称性を継承する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:48:31 GMT)
Tree-based Forecasting of Day-ahead Solar Power Generation from Granular
Meteorological Features [1.9] このような予測を生成するには、最先端のツリーベース機械学習手法を用いる。
ベルギーのデータと1時間の解像度で日毎のPV発電を予測しています。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 08:47:37 GMT)
Towards Unsupervised Representation Learning: Learning, Evaluating and
Transferring Visual Representations [1.8] 我々は3つの視点から教師なし(視覚的)表現学習の分野に貢献する。
我々は、教師なし、バックプロパゲーションのない畳み込み自己組織型ニューラルネットワーク(CSNN)を設計する。
我々は、プリテキストとターゲットオブジェクトに依存しないメトリクスを定義するために、広く使われている(非)線形評価プロトコルの上に構築する。
CARLANEは,2次元車線検出のための最初の3方向sim-to-realドメイン適応ベンチマークであり,自己教師付き学習に基づく手法である。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:57:55 GMT)
Subspace methods for electronic structure simulations on quantum
computers [1.8] 量子サブスペース法(Quantum subspace method、QSM)は、量子コンピューティングアルゴリズムの一種。
我々はQSMを自己完結的に導入し、分子の電子構造への応用に重点を置いている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 20:40:06 GMT)
DiffusionAvatars: Deferred Diffusion for High-fidelity 3D Head Avatars [1.8] DiffusionAvatarsは人の高忠実度3Dヘッドアバターを合成し、ポーズと表情の両方を直感的に制御する。
表現と頭部ポーズの粗い誘導のために、ターゲット視点からニューラルパラメトリックヘッドモデル(NPHM)を描画する。
我々は,NPHMから得られた表現コードに直接DiffusionAvatarsを挿入する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:43:13 GMT)
Compression of end-to-end non-autoregressive image-to-speech system for
low-resourced devices [1.8] 低リソースデバイス上での表示内容の小さなセグメントから音声を生成するための,効率的なエンドツーエンドニューラルアーキテクチャを開発した。
人的および自動評価の結果から,本手法は性能の低下を最小限に抑え,推論時間を22%高速化できることがわかった。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 20:13:10 GMT)
ADA-GP: Accelerating DNN Training By Adaptive Gradient Prediction [1.7] 本稿では、勾配予測を適応的に利用して深層ニューラルネットワーク(DNN)トレーニングを高速化するADA-GPを提案する。
ADA-GPは、バックプロパゲート勾配を用いたDNNトレーニングと予測勾配を用いたDNNトレーニングを交互に行う。
実験の結果,ADA-GPはベースラインモデルと同等あるいはそれ以上の精度で平均1.47倍の速度を達成できることがわかった。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:01:55 GMT)
Deep Double Descent for Time Series Forecasting: Avoiding Undertrained
Models [1.7] 公開時系列データセットでトレーニングしたトランスフォーマーモデルの深度二重降下について検討する。
72ベンチマークの70%近くで時系列時系列の予測を行う。
これは、文献の多くのモデルが未解決の可能性を秘めていることを示唆している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:51:26 GMT)
Search Still Matters: Information Retrieval in the Era of Generative AI [1.7] この視点は、IRプロセスのモチベーション、考慮、結果の文脈における生成的AIの使用を探求する。
このようなシステムのユーザ、特に学者は、信頼性、タイムライン、検索の文脈化に関する懸念を持っている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:36:21 GMT)
Beyond Entropy: Style Transfer Guided Single Image Continual Test-Time
Adaptation [1.6] BESTTAは,スタイル転送によって導かれる新しい単一画像連続テスト時間適応法である。
我々は,BESTTAが連続的に変化するターゲット環境に効果的に適応できることを示し,単一の画像のみを活用する。
注目すべきは、BeIN層で最小メモリを消費するパラメータが2つしかないにもかかわらず、BESTTAはパフォーマンス面で既存の最先端メソッドよりも優れていることだ。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:14:24 GMT)
Likelihood-based Sensor Calibration using Affine Transformation [1.6] 本稿では,1973年に発表されたGlacier Researchによる改良された解について述べる。
この結果は,様々な応用に適用可能であることを示す。
シミュレーションや,8つの同一センサを持つマルチセンサボードの実測データを用いて,本研究を評価した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:37:16 GMT)
Improving the Robustness of Quantized Deep Neural Networks to White-Box
Attacks using Stochastic Quantization and Information-Theoretic Ensemble
Training [1.6] ディープニューラルネットワーク(DNN)を使用する現実世界のほとんどのアプリケーションは、計算ニーズを減らすためにそれらを低精度で量子化する。
ホワイトボックス攻撃に対する量子化DNNのロバスト性を改善する手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:15:58 GMT)
Online Change Points Detection for Linear Dynamical Systems with Finite
Sample Guarantees [1.6] 本研究では,未知の力学を持つ線形力学系に対するオンライン変化点検出問題について検討する。
我々は,誤報を発生させる確率に基づいて,予め指定された上限を達成できるデータ依存しきい値を開発する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:08:16 GMT)
Two-step reinforcement learning for model-free redesign of nonlinear
optimal regulator [1.6] 強化学習(Reinforcement Learning, RL)は、非線形力学系のための最適制御系をモデル無しで再設計できる、有望なアプローチの1つである。
未知の非線形システムに対する最適レギュレーション再設計問題において,RLの過渡学習性能を向上させるモデルフリー2段階設計手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:07:34 GMT)
Extending Rely-Guarantee thinking to handle Real-Time Scheduling [1.6] リアルタイムシステムには、進捗を必要とする方法と、その進捗を時間の概念に関連付ける方法の両方が必要です。
本稿では,リアルタイムスケジューラの仕様と仮定に対処するために,信頼度保証の考え方を拡張した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 20:04:30 GMT)
HeTriNet: Heterogeneous Graph Triplet Attention Network for
Drug-Target-Disease Interaction [1.5] 我々は、新しい異種グラフトリプルト注意ネットワーク(textttHeTriNet)を開発した。
textttHeTriNetは、この異種グラフ構造の中に新しい三重項注意機構を導入している。
実世界のデータセットの実験結果から、texttHeTriNetはいくつかのベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 20:55:57 GMT)
Crypto Wash Trading: Direct vs. Indirect Estimation [1.5] 近年の研究では、中央集権暗号取引所のような取引価値の約70%が、洗浄取引として特徴づけられると推定されている。
トランザクション透過性により,より正確な直接推定が可能となる。
NFTボリュームの約30%と取引された価値の45-95%は、洗剤取引に関係している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:19:08 GMT)
A Natural Gas Consumption Forecasting System for Continual Learning
Scenarios based on Hoeffding Trees with Change Point Detection Mechanism [1.4] 本稿では,変化点検出統合による天然ガス消費の予測について紹介する。
提案手法に基づく予測モデルの性能を実世界の複雑なユースケースで評価する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:48:13 GMT)
A Compositional Approach to Verifying Modular Robotic Systems [1.4] 本稿では,ロボットオペレーティング・システム(ROS)を用いたロボットシステムにおけるノードの特定のための構成的アプローチについて述べる。
我々は,これらのノードレベルの契約の構成を容易にする推論ルールを導入し,システムレベルの特性を導出する。
また、ノードのFOL仕様をキャプチャし、この契約を実装にリンクする新しいDomain-Specific Language、ROS Contract Languageも提示します。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:02:05 GMT)
Table Detection in the Wild: A Novel Diverse Table Detection Dataset and
Method [1.4] テーブル検出のための大規模データセットを7万以上のサンプルで紹介する。
また、文書中のテーブル構造を検出する畳み込みニューラルネットワークを用いたベースライン結果も提示する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:55:36 GMT)
The Stochastic Dynamic Post-Disaster Inventory Allocation Problem with
Trucks and UAVs [1.4] 人道的物流事業は、災害地域における援助の需要の高まりにより困難が増している。
本報告では, 被災地域における空き地供給の動的配分について, 時間とともに検討する。
これは、トラックや無人航空機が救援物資を配達する際の、新しい動的事後在庫配分問題を導入している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:03:04 GMT)
Multiple Disciplinary Data Work Practices in Artificial Intelligence
Research: a Healthcare Case Study in the UK [1.3] 医療のための人工知能(AI)ツールの開発は、データサイエンティスト、臨床医、患者、その他の分野をまとめる複数の学際的な取り組みである。
我々は、AI開発ワークフローと、参加者が規律を越えて知識を共有し、生成する課題と緊張をナビゲートする方法を探求する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:19:33 GMT)
Efficient Baseline for Quantitative Precipitation Forecasting in
Weather4cast 2023 [1.3] 計算資源の環境への影響を考慮しつつ,正確な降水予測の必要性に対処する。
本稿では,今後の天気予報イニシアチブのベースラインとして使用される最小限のU-Netアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:51:50 GMT)
Automating lookahead planning using site appearance and space
utilization [1.2] 提案手法は建設資材条件(外観)と現場空間利用を用いて作業完了率を予測する。
GRU(Gated Recurrent Unit)ベースのRecurrent Neural Network(RNN)モデルを建設プロジェクトタイムラインのセグメントを用いてトレーニングした。
その結果,提案手法は自動ルックアヘッド計画の開発に有効であることが示唆された。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:02:02 GMT)
A causal modelling analysis of Bell scenarios in space-time:
implications of jamming non-local correlations for relativistic causality
principles [1.1] ベルのシナリオは、複数のパーティによって行われた宇宙のような分離された測定を含む。
非シグナリング制約は提案されており、非局所理論を妨害することとして知られる量子後理論のクラスを許容している。
ベルのシナリオにおいてジャミング相関を生成する理論は、因果微調整や超光因果関係の影響によって必然的にそれを行う必要があることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:17:49 GMT)
Stable Linear Subspace Identification: A Machine Learning Approach [1.0] 本稿では,離散線形多段階状態空間SI法であるSIMBaを紹介する。
SIMBaが従来の線形状態空間SI法より一般的に優れていることを示す。
この新たなSIパラダイムは、データから構造化された非線形モデルを特定するための大きな拡張ポテンシャルを示すと仮定する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:52:31 GMT)
RNA-KG: An ontology-based knowledge graph for representing interactions
involving RNA molecules [1.0] RNA-KGは、50以上の公開データベースから集められたRNAに関する生物学的知識を含む知識グラフである。
RNA-KGは異なるフォーマットでダウンロードでき、SPARQLエンドポイントでクエリすることもできる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 20:46:20 GMT)
Transfer Learning across Different Chemical Domains: Virtual Screening
of Organic Materials with Deep Learning Models Pretrained on Small Molecule
and Chemical Reaction Data [1.0] 薬物のような小さな分子や化学反応データベースは、有機物質の仮想スクリーニングのためにBERTモデルを事前訓練するために用いられる。
USPTO-SMILESプレトレーニングされたBERTモデルは2つのタスクに対してR2 > 0.90と1つのタスクに対してR2 > 0.82を有していた。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:20:24 GMT)
Low latency optical-based mode tracking with machine learning deployed
on FPGAs on a tokamak [0.9] 本研究ではFPGAを用いた高速カメラデータ取得・処理システムについて述べる。
リアルタイムの機械学習ベースのトカマク診断と制御、および他の科学分野の潜在的な応用を可能にする。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:00:03 GMT)
The Sliding Regret in Stochastic Bandits: Discriminating Index and
Randomized Policies [0.8] バンディットのためのノンレグレットアルゴリズムのワンショット動作について検討する。
一定長さが無限に滑り落ちるタイムウインドウ上で最悪の擬似回帰を測定するスライディング後悔(slide regret)という新しい概念を導入する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:37:03 GMT)
Understanding the interplay of entanglement and nonlocality: motivating
and developing a new branch of entanglement theory [0.8] ローカルオペレーションと共有ランダムネス(LOSR)は、非局所性の異常の解決を提供する。
LOSRは真の多部交絡と非局所性という新たな概念を必要とすることを示す。
本研究は,新しい絡み合い理論の分野としてのLOSR絡み合いの研究を動機づけるものである。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 01:55:11 GMT)
An integrated framework for developing and evaluating an automated
lecture style assessment system [0.8] 提案アプリケーションは,表情,身体活動,発話速度と抑揚,手の動き,顔のポーズなど,特定の計測可能な生体特性を利用する。
その結果,本アプリケーションは新規で,講義品質に関するフィードバックの自動化に有用であることが示唆された。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 21:31:21 GMT)
Harnessing graph state resources for robust quantum magnetometry under
noise [0.8] 本研究は, 量子磁気学における対称グラフ状態資源を用いた測定精度の向上に焦点をあてる。
その結果, 単発および複数発のラーモア周波数の推定において有意な改善が認められた。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:38:35 GMT)
Unconditionally secure quantum commitments with preprocessing [0.7] 量子補助入力の助けを借りて計算的にセキュアなコミットメントスキームを構築する方法を示す。
量子補助入力は、(1)古典的な共通乱数列モデルと同様の信頼された設定により効率的に作成することができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 01:22:01 GMT)
Squashed quantum non-Markovianity: a measure of genuine quantum
non-Markovianity in states [0.7] 真の量子非マルコビアン性(英語版)を定量化する尺度を導入する。
この測度はsquashed quantum non-Markovianity (sQNM)と呼ばれる。
量子通信と真QNMの相互関係について検討する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:48:32 GMT)
Gated Ensemble of Spatio-temporal Mixture of Experts for Multi-task
Learning in Ride-hailing System [0.7] 本研究では,各都市のタスクを同時に予測するために,専門家ネットワーク(GESME-Net)と繰り返しニューラルネットワーク(NNNNN)のアンサンブルを開発する。
提案アーキテクチャは、北京の需給ギャップを予測するためのDidi Chuxingのデータと、ChengduとXianの需要を同時に予測するためのテストである。
どちらも、提案されたアーキテクチャのモデルはシングルタスクのベンチマークとマルチタスクの学習ベンチマークよりも優れていた。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:40:48 GMT)
Cirquo: A Suite For Testing and Debugging Quantum Programs [0.7] 我々は、量子回路テストおよびデバッグスイート(Cirquo)を設計、実装した。
Cirquoは、ユーザが回路を垂直または水平に分割し、スライスと呼ばれる小さなチャンクに分割することを可能にする。
Cirquoはまた、開発者は回路全体とチャンク内のゲートを追跡でき、それぞれの動作をよりよく理解することができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:42:58 GMT)
Vacuum-Induced Symmetry Breaking of Chiral Enantiomer Formation in
Chemical Reactions [0.6] 内部に対称性の破れがある物質は、真空電磁揺らぎによって対称性の破れをその近傍に伝達することができる。
真空量子揺らぎがパリティ対称性を破る物質に近づき、キラル分子のキラリティー依存性のスペクトルシフトを引き起こすことを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:09:13 GMT)
Online Influence Maximization: Concept and Algorithm [0.6] まず、オフラインIM問題を明確に定義する。
次に、オンラインIM問題と基本的なコンビニアル・マルチアーメッド・バンディット・フレームワークCMAB-Tの標準定義について述べる。
これはオンライン学習手法を用いてオンラインIM問題を解決する方法である。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:24:05 GMT)
Self-similarity of Communities of the ABCD Model [0.5] The Artificial Benchmark for Community Detection (ABCD) graph is a random graph model with community structure and power-law distribution for both degrees and community sizes。
ABCDモデルは興味深い自己相似行動を示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 22:52:39 GMT)
Classifying patient voice in social media data using neural networks: A
comparison of AI models on different data sources and therapeutic domains [0.5] ソーシャルメディアプラットフォームとメッセージボードは、患者体験情報の適切な情報源と考えられている。
本稿では,全てのオンライン患者体験情報を同じように扱うことはできないという仮説を検証した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:35:24 GMT)
A Fully Unsupervised Instance Segmentation Technique for White Blood
Cell Images [0.5] 白血球 (leukocytes) または白血球 (leukocytes) は、正常な免疫系細胞として機能する不均一に核化された細胞群である。
白血球は、ファゴサイトーシスを通じて人体に侵入するバクテリア、ウイルス、その他の病原体を殺傷する。
白血球数を検出すると、カモフラージュ感染や慢性的な医療状況について医師に警告することができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:28:43 GMT)
Women Are Beautiful, Men Are Leaders: Gender Stereotypes in Machine
Translation and Language Modeling [0.4] GESTは、マスク付きLMと英語-to-X機械翻訳システムにおいて、ジェンダーステレオタイプ推論を測定するための新しいデータセットである。
GESTには、9つのスラヴ語と英語で男女16のステレオタイプに対応するサンプルが含まれている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:06:00 GMT)
Multi-task learning with cross-task consistency for improved depth
estimation in colonoscopy [0.3] 我々は、共有エンコーダと2つのデコーダ、すなわち表面正規デコーダと深度推定器を備えた新しいマルチタスク学習(MTL)アプローチを開発する。
比較誤差は14.17%、$delta_1$精度は10.4%改善した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:13:17 GMT)
Can training neural language models on a curriculum with developmentally
plausible data improve alignment with human reading behavior? [0.3] 本稿では,より発達的に妥当なデータを用いたモデル学習により,経験的行動とモデル予測行動の相違が最小化できる範囲について検討する。
我々は,BabyLMの「限定小」データセットを用いて教師言語モデルを訓練し,これらの教師モデルからの文レベル推定を用いてカリキュラムの作成を行った。
モデルが学習データから言語知識を習得し易いという仮の証拠が得られた。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:03:58 GMT)
Low-Latency ML Inference by Grouping Correlated Data Objects and
Computation [0.2] アプリケーション固有のデータアクセス相関を簡単に表現できる新しい相関グルーピング機構を提案する。
レイテンシに敏感なMLベースのアプリケーションに基づく実験は、標準手法の限界を確認する。
提案するメカニズムは,作業負荷の増加とスケールアウトの増加に伴い,レイテンシの大幅な低減,ノード利用率の向上を実現している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:02:04 GMT)
STL4IoT: A Statechart Template Library for IoT System Design [0.2] 我々は、IoTシステムの異質な側面をモデル化するアトミックステートチャートコンポーネントを開発した。
複数のIoTシステム間のインタラクションを制御し、消費電力を管理するスマートハブテンプレートも提案されている。
スマートホームシミュレータは、ステートチャートからコントローラコードを生成し、ユーザインターフェースに統合することで開発されている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 01:40:09 GMT)
Hierarchical Joint Graph Learning and Multivariate Time Series
Forecasting [0.2] 本稿では,相互依存を示すエッジを持つグラフにおいて,多変量信号をノードとして表現する方法を提案する。
我々はグラフニューラルネットワーク(GNN)とアテンションメカニズムを活用し、時系列データ内の基礎となる関係を効率的に学習する。
提案モデルの有効性を,長期予測タスク用に設計された実世界のベンチマークデータセットで評価した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:44:21 GMT)
A data-science pipeline to enable the Interpretability of Many-Objective
Feature Selection [0.1] 多目的特徴選択(MOFS)アプローチは、4つ以上の目的を用いて、教師付き学習タスクにおける機能のサブセットの関連性を決定する。
本稿では,MOFS結果の解釈と比較においてデータサイエンティストを支援する手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:44:22 GMT)
Who can help me? Reconstructing users' psychological journeys in
depression-related social media interactions [0.1] うつ病に関するいくつかのメンタルヘルス関連Redditボードを調査した。
ユーザの心理的・言語的プロファイルを社会的相互作用とともに再構築する。
我々のアプローチは、ソーシャルメディアを通じてメンタルヘルス問題に対処する、データインフォームドな理解への道を開く。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:09:29 GMT)
A knowledge-driven framework for synthesizing designs from modular
components [0.1] 実装手順を自動化するためのユースケース知識駆動フレームワークを提案する。
特に、フレームワークは獲得した知識と設計概念をカタログ化する。
我々はCADソフトウェアAutodesk Fusion 360のプラグインとしてフレームワークを実装した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:16:47 GMT)
Lewis and Berry phases for a gravitational wave interacting with a
quantum harmonic oscillator [0.1] 横トラスレスゲージにおける量子調和振動子と相互作用する重力波を考える。
重力波は、最初はプラス偏光とクロス偏光の両方のシグネチャを持っている。
次に、系のハミルトニアン全体の分離可能部分に対応する2つのルイス不変量を得る。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 20:05:06 GMT)
Identifying quantum many-body integrability and chaos using eigenstates
trace distances [0.1] 量子多体積分性とカオスの代替指標を提案する。
最寄りのサブシステムトレース距離による固有状態の統計に基づく。
これは、広範囲な数値シミュレーションを通じて、忠実な分類を提供することを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:21:07 GMT)
Use of explicit replies as coordination mechanisms in online student
debate [0.0] 会話中の人々は、自発的なアライメントメカニズムを通じて言語行動の訓練を行う。
CMCでは、言語的拘束が起こるメカニズムの1つは、明示的な応答によって行われる。
対話において発話が果たす役割のいくつか、特に明示的な応答に関する調整機構について検討する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:18:45 GMT)
Upper limit on the acceleration of a quantum evolution in projective
Hilbert space [0.0] 任意の有限次元のヒルベルト空間における輸送速度の変化率の上限を導出する。
射影空間における量子進化の加速二乗は、ハミルトニアン作用素の時間変化率のばらつきによって上界であることが示される。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:22:59 GMT)
Unsupervised textile defect detection using convolutional neural
networks [0.0] 教師なし繊維異常検出のためのモチーフに基づく新しい手法を提案する。
従来の畳み込みニューラルネットワークの利点と教師なし学習パラダイムの利点を組み合わせる。
パターンファブリクスベンチマークデータセットに対するアプローチの有効性を示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 22:08:06 GMT)
Unsupervised learning architecture based on neural Darwinism and
Hopfield networks recognizes symbols with high accuracy [0.0] 本稿では,ジェラルド・エデルマンの神経群選択理論(ニューラルダーウィン主義)に触発された新しい教師なし学習パラダイムを紹介する。
提示されたオートマトンは、任意の記号(例えばアルファベットの文字)を、子供が読むことを学ぶときのように繰り返し表示されるときに認識することを学ぶ。
シミュレーションでは、格子上に二進パターンとして表されるラテンアルファベットの文字を学習する際の精度が高い。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:39:20 GMT)
Understanding Sample Generation Strategies for Learning Heuristic
Functions in Classical Planning [0.0] 本研究では,従来の計画課題において,コスト・ツー・ゴールの推定値で表されるサンプルに基づいて,ネットワークを用いた優れた機能学習の課題について検討する。
我々の主なゴールは、グリージーな最優先のニューラルサーチアルゴリズムの性能に対するサンプル生成戦略の影響をよりよく理解することである。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:20:25 GMT)
Ultrafast Excitation Exchange in a Maxwell-Fish-Eye Lens [0.0] Maxwell-Fish-Eyeレンズは、2つの離れた量子エミッタ間のパルス励起交換を実装するために使用できる。
この周期的な交換は単一光子パルスによって媒介され、2つの原子アンサンブル間の光子交換に拡張することができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:48:45 GMT)
Two-photon absorption cross sections of pulsed entangled beams [0.0] 絡み合った2光子吸収(ETPA)は非線形量子分光の基礎を形成することができる。
量子増幅断面積は、非常に大きな光子数でも持続可能であることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:57:41 GMT)
Transition to chaos in extended systems and their quantum impurity
models [0.0] カオスは量子情報処理スキームに根本的な制限を課す。
量子光学デバイスに関連する空間的に拡張された量子多体系におけるカオスの発生について検討する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:38:47 GMT)
Training a HyperDimensional Computing Classifier using a Threshold on
its Confidence [0.0] 本稿では,HDCモデルで正しく分類されたサンプルだけでなく,信頼性の低いサンプルも考慮して,HDCのトレーニング手順を拡張することを提案する。
提案手法は,UCIHAR,CTG,ISOLET,HANDのデータセットを用いて,ベースラインと比較して連続的に性能が向上することを確認した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:54:59 GMT)
Towards Responsible Governance of Biological Design Tools [0.0] 生成機械学習の最近の進歩は、生物設計ツール(BDT)の急速な進歩を可能にした
前例のないBDTの予測精度と新規設計能力は、新しい重要な二重利用リスクをもたらす。
他のデュアルユースAIシステムと同様、BDTも悪質な問題を抱えている。
我々は、責任ある開発、リスクアセスメント、透明性、アクセス管理、サイバーセキュリティ、レジリエンスへの投資などにおいて、BDTが誤用されるリスクを軽減するためのさまざまな手段を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:54:38 GMT)
Towards A Foundation Model For Trajectory Intelligence [0.0] 実世界のユーザチェックインデータを用いて,大規模軌跡モデルのトレーニング結果を示す。
提案手法は,マスク付き軌道モデルを用いてベースモデルを事前学習する,事前学習と微調整のパラダイムに従う。
私たちの経験分析では、600万人以上のユーザーが生成した20億以上のチェックインの包括的データセットを利用しています。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 00:34:09 GMT)
The role of interface design on prompt-mediated creativity in Generative
AI [0.0] 2つのジェネレーティブAIプラットフォームから145,000以上のプロンプトを分析します。
その結果,利用者は以前訪れた概念の活用よりも,新たなトピックを探求する傾向にあることがわかった。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 22:33:34 GMT)
The quartic Blochnium: an anharmonic quasicharge superconducting qubit [0.0] 本稿では、クォート超インダクタを用いた新しい設計を提案し、スペクトルに十分な不調和性を与える。
クォート状態は、最小の量子ゆらぎを示すジョセフソン接合ループの適切に設計された連鎖によって達成される。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:28:25 GMT)
The Role of Visual Features in Text-Based CAPTCHAs: An fNIRS Study for Usable Security [0.0] 機能的近赤外分光法を用いて,CAPTCHAにより誘発される前頭前皮質の血行動態について検討した。
視覚効果の体系的な付加は、行動的および前頭前酸素化対策に非線形効果を導入し、CAPTCHAの全体像の知覚に影響を及ぼした可能性のある効果の出現を示唆した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:36:45 GMT)
The Multiverse of Dynamic Mode Decomposition Algorithms [0.0] 動的モード分解(Dynamic Mode Decomposition, DMD)は、複雑で非線形なシステムをモードに分解するために使われる一般的なデータ駆動分析技術である。
このレビューでは、複雑な非線形力学を線形フレームワークに変換する上でのクープマン作用素の役割を強調した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:00:50 GMT)
The Many-Worlds Calculus [0.0] 本稿では,バイプロダクティビティを持つコンパクトなカテゴリをベースとした,量子計算のための新しい型付きグラフィカル言語を提案する。
我々の言語は、量子制御をサポートする自然なフレームワークを提供しながら、ZX計算や量子回路のような既存のアプローチを一般化する。
この言語は線形応用に基づく意味論と方程式理論を備えている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:27:51 GMT)
Textual-Knowledge-Guided Numerical Feature Discovery Method for Power
Demand Forecasting [0.0] 本稿では,短期電力需要予測のためのテキスト知識誘導数値特徴探索(TKNFD)手法を提案する。
TKNFDは、定性的なテキスト知識を広範囲に蓄積し、それを候補となる特徴集合に拡張し、これらの特徴の数値データを収集し、最終的に4DM-STDを構築する。
世界中の2つの地域におけるベンチマーク実験は、TKNFDが発見した特徴の予測精度が、SoTAの特徴スキームの予測精度を16.84%から36.36%で確実に上回っていることを示した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 13:17:22 GMT)
Tensor network renormalization: application to dynamic correlation
functions and non-hermitian systems [0.0] 本稿では,動的相関関数の計算を可能にするLoop-TNRアルゴリズムの実装について述べる。
また,非エルミート系の臨界特性を調べるためにLoop-TNRアルゴリズムが適用可能であることも強調した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:34:32 GMT)
Talking Head(?) Anime from a Single Image 4: Improved Model and Its
Distillation [0.0] Talking Head Anime 3 (THA3)は、この問題に対処しようとするオープンソースプロジェクトである。
1)アニメキャラクタの上半身の画像と(2)45次元ポーズベクトルとを入力として、指定されたポーズを取る同一キャラクタの新しいイメージを出力する。
システムは、通常のPC上でリアルタイムにアニメーションを生成するには遅すぎるため、画質が向上する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 02:18:31 GMT)
Symbolic Learning for Material Discovery [0.0] SyMDisは記号学習に基づく効率的な最適化手法である。
SyMDisは最先端のオプティマイザと互換性があり、物理的および化学的検証を支援するための解釈可能なルールを学習する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:56:00 GMT)
Self-gravitational dephasing of quasi-classical Stern-Gerlach
trajectories [0.0] Schr"odinger-Newton方程式は、Stern-Gerlach干渉計における粒子の2つのzスピン固有値に対応する2つの軌道間の重力自己力を予測する。
局所波動関数を持つ球状粒子の実験的な場合、その近似と簡潔さの両面において厳密な位相を導出し、単純かつ正確な実験的予測を可能にする。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:17:45 GMT)
Sculpting ultrastrong light-matter coupling through spatial matter
structuring [0.0] 我々は超強多重モード結合を彫刻するための新しい戦略を実験的に実装した。
我々は,光物質結合モードの数,オクターブ散乱周波数スペクトル,および磁気チューニングに対する応答を制御する。
これは、散逸を制御する新しい経路、量子光源の調整、非線形性、相関、および量子情報処理における絡み合いを提供する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:31:56 GMT)
Redefining Recon: Bridging Gaps with UAVs, 360 degree Cameras, and
Neural Radiance Fields [0.0] 小型無人機(UAV)の機能を相乗化する革新的なアプローチを導入する。
特殊なニューラルネットワークであるNeRFは、2D画像を使用して任意のシーンの3D表現を推論し、要求に応じて様々な角度から合成することができる。
我々は、最近の火災後のシナリオを通じて、挑戦的な屋外環境においても、NeRFの有効性を概説し、我々のアプローチを検証した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:21:29 GMT)
Reconstructing Historical Climate Fields With Deep Learning [0.0] 我々は,最近導入されたFourier畳み込みに基づく深層学習手法を,数値的な気候モデル出力に基づいて訓練し,歴史的気候分野の再構築に利用した。
我々は、大きな、不規則な欠落したデータの領域を現実的に再構築し、強力なエルニーノやラニーナのような既知の歴史的出来事を、ほとんど情報を持って再構築することができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 08:34:12 GMT)
Quantum dynamics of a fully-blockaded Rydberg atom ensemble [0.0] 我々は、置換対称性を持つ強い相互作用を持つ原子のアンサンブルを研究する。
任意の置換不変量子状態を作成するために、この形式を用いて効率的なパルス列を導出する。
我々の結果は、大規模相互作用と非可積分量子系の実験的および理論的研究のための新たな機会を生み出した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:15:46 GMT)
Quantum Simulations for Strong-Field QED [0.0] 強磁場QED(SFQED)の3+1$次元での量子シミュレーションを行う。
ブライト・ウィーラー対生成に関連する相互作用は量子回路に変換される。
ヌルダブルスリット」実験の量子シミュレーションは古典シミュレーションとよく一致している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:05:26 GMT)
Quantum Simulation of an Open System: A Dissipative 1+1D Ising Model [0.0] 我々は、IBMデバイス上でのオープンまたは複雑なカップリング量子場理論のシミュレーションのために量子アルゴリズムを実装した。
移行の成功は、現在のハードウェアに対する非自明なテストを表している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:25:48 GMT)
Quantum Instrumentation Control Kit -- Defect Arbitrary Waveform
Generator (QICK-DAWG): A Quantum Sensing Control Framework for Quantum
Defects [0.0] 量子計測制御キット - Defect Arbitrary Waveform Generator (QICK-DAWG) のソフトウェアおよびファームウェア拡張について述べる。
QICK-DAWGは、RFSoC FPGAを用いたダイヤモンドや他の量子欠陥の完全な量子制御と窒素空孔欠陥の測定をサポートする。
我々は、QICK-DAWGがオープンソースの量子ハードウェアの強力な新しいパラダイムであり、量子センシングの参入障壁とコストを大幅に低下させることを示した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 05:03:40 GMT)
Process Mining for Unstructured Data: Challenges and Research Directions [0.0] 非構造化データに対するプロセスマイニングの適用は、非構造化データが共通のデータ形式である分野に対する新たな洞察を著しく高める可能性がある。
プロセスマイニングによる非構造化データを効率的に解析し、解析結果に信頼性を持たせるためには、複数の課題をブリッジする必要がある。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:09:14 GMT)
Pose Estimation and Tracking for ASIST [0.0] Aircraft Ship Integrated Secure and Traverse (ASIST) は、ヘリコプターを安全にかつ効率的に捕獲するシステムである。
PETA (Pose Estimation and Tracking for ASIST) は、ASISTシステムオペレータのハードウェアインストールを必要とせずに、ヘリコプター追跡システムのプロトタイプを開発するための研究である。
PETAは、最先端のコンピュータビジョンアルゴリズムである高速R-CNNとHRNetを使ってヘリコプターの姿勢をリアルタイムで推定する可能性を実証した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:15:29 GMT)
Perturbative Construction of Coherent States [0.0] 我々は、圧縮されたコヒーレント状態の非ガウス的変化が必要であることを示す。
我々が提案するコヒーレント状態の修正は$hbar$で摂動的であり、コヒーレンスを非線形に再定義され、背景に依存した自由度で見る必要があることを示すものかもしれない。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:59:13 GMT)
Performance Analysis of Multi-Angle QAOA for p > 1 [0.0] マルチアングルQAOAのスケーラビリティを,QAOA層数の観点から検討する。
その結果,MA-QAOAはQAOA回路の深さを最大4倍に削減できることがわかった。
しかし、MA-QAOAは総QPU時間の最小化には最適ではない。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 21:29:17 GMT)
PAUNet: Precipitation Attention-based U-Net for rain prediction from
satellite radiance data [0.0] 本稿では,衛星放射データから降水を予測するディープラーニングアーキテクチャPAUNetを提案する。
PAUNetはU-NetとRes-Netの亜種であり、マルチバンド衛星画像の大規模コンテキスト情報を効果的にキャプチャするために設計された。
PAUNetは、ヨーロッパ各地のデータセットに基づいてトレーニングされており、ベースラインモデルよりも高い臨界成功指数(CSI)スコアで顕著な精度を示している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:22:55 GMT)
Optimizing ZX-Diagrams with Deep Reinforcement Learning [0.0] ZXダイアグラムは量子過程を記述するための強力なグラフィカル言語である。
本稿では,ZX-ダイアグラムと強化学習を組み合わせた機械学習手法を提案する。
エージェントのポリシを符号化するグラフニューラルネットワークを使用することで、トレーニングフェーズで見られるよりもはるかに大きなダイアグラムへの一般化が可能になる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:29:18 GMT)
Optimized General Uniform Quantum State Preparation [0.0] 我々は,任意のN状態の均一な重ね合わせを調製し,奥行きを最小化し,アシラリー量子ビットを使わずに最適化された回路の一般解法を開発した。
このアルゴリズムは、特に2つのワイヤゲートの使用において効率的であり、IonQ量子コンピュータ上で検証され、量子非構造探索アルゴリズムに応用されていることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 22:40:33 GMT)
On the role of the optical phase and quantum coherence in high harmonic
generation [0.0] 非コヒーレントな古典的および非古典的な強光場による高調波発生のプロセスの推進について検討する。
駆動場の位相が完全に未決定の場合においても,高調波発生が可能であることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:03:11 GMT)
On the Robustness of Decision-Focused Learning [0.0] 決定焦点学習(Decision-Focused Learning, DFL)は、機械学習(ML)モデルを訓練し、不完全な最適化問題の欠落パラメータを予測するための新興学習パラダイムである。
DFLは、予測と最適化タスクを統合することで、エンドツーエンドシステムでMLモデルをトレーニングし、トレーニングとテストの目的の整合性を向上させる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:56:06 GMT)
On the Convergence of the ELBO to Entropy Sums [0.0] 変分下界は、すべての定常的な学習点においてエントロピーの和に等しいことを示す。
非常に大きな生成モデルのクラスでは、変分下界は全ての定常的な学習点である。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:23:29 GMT)
Observing coherence in an incoherent paramagnetic nitrogen spin bath [0.0] 常磁性窒素欠陥(P1中心)のコヒーレンスを測定するためにダイヤモンド中の窒素空孔中心を用いる。
我々は、P1中心と13ドルCの核スピンの局所浴の間のコヒーレント相互作用を検出する。
我々の研究は、光暗黒のP1スピンが非偏光であるにもかかわらず、どのようにして局所環境から情報を引き出すことができるかを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 01:52:59 GMT)
Observing a Changing Hilbert-Space Inner Product [0.0] 現在の量子論は、準備と測定の間の間隔で変化する内部積の結果を公式には解決していない。
この変化は、トモグラフィ的に観測可能な量子チャネルによって説明される。
量子ビットの内部積の変化を、ユニタリチャネルを持つキュートプロトコルを用いて実験的に実現する方法を説明する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:58:53 GMT)
Negotiated Representations to Prevent Forgetting in Machine Learning
Applications [0.0] 破滅的な忘れは、機械学習の分野で重要な課題である。
本稿では,機械学習アプリケーションにおける破滅的忘れを防止する新しい方法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 22:43:50 GMT)
Mavericks at NADI 2023 Shared Task: Unravelling Regional Nuances through
Dialect Identification using Transformer-based Approach [0.0] 我々は,国レベルの方言識別を扱うサブタスク1の方法論を強調した。
このタスクは、マルチクラス分類問題に対する18の方言を含むTwitterデータセット(TWT-2023)を使用する。
テストデータセットでF1スコア76.65 (11位)を達成した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:37:56 GMT)
Mavericks at BLP-2023 Task 1: Ensemble-based Approach Using Language
Models for Violence Inciting Text Detection [0.0] ソーシャルメディアは、社会における憎しみや暴力的な発言の伝播を加速させてきた。
少ない研究と少ないデータにより、低リソース環境では、暴力を誘発するテキストを検出する問題がさらに悪化する。
本稿では,バングラ語処理に関する第1回ワークショップにおいて,Volence Inciting Text Detection共有タスクについて紹介する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:23:38 GMT)
Mavericks at ArAIEval Shared Task: Towards a Safer Digital Space --
Transformer Ensemble Models Tackling Deception and Persuasion [0.0] 本稿では,各課題のタスク1-Aとタスク2-Aのアプローチについて述べる。
タスクは、与えられたバイナリ分類問題に対して、ツイートとニュース記事のマルチジャンルスニペットを使用する。
タスク1-A(8位)では0.742、タスク2-A(7位)では0.901のマイクロF1スコアを達成した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:26:57 GMT)
Markovian Embeddings of Non-Markovian Quantum Systems: Coupled
Stochastic and Quantum Master Equations for Non-Markovian Quantum Systems [0.0] この研究は、より大きなマルコフ量子系に埋め込まれる非マルコフ主量子系を考える。
結果は、連続時間非マルコフシステムの(オープンループとフィードバック)制御に対する関心が期待されている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:00:10 GMT)
Liouvillian Dynamics of the Open Schwinger Model: String Breaking and
Kinetic Dissipation in a Thermal Medium [0.0] シュウィンガーモデル内の弦破れ力学を考察し, 熱媒体内部の変形について検討する。
我々はリンドブラッド方程式のリウヴィリアンギャップと系のフォン・ノイマンエントロピーの時間依存性を分析する。
オープンシュウィンガーモデルのリウヴィリア動力学が量子コンピュータ上でどのようにシミュレートできるかを論じる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:26:45 GMT)
Karush-Kuhn-Tucker conditions for non-commutative optimization problems [0.0] 多くの古典的最適化問題で満たされるKa-Kuhn-Tucker最適条件の非可換な類似を導入する。
我々は、多体スピン系の基底状態の局所的性質を計算し、非可換KKT条件のパワーをテストする。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:00:06 GMT)
Infinite dimensional analogues of Choi matrices [0.0] チェ行列は、地図の正の度合いと完全正の度合いを特徴づけるのに有用である。
そのような対応は、すべての通常の完全有界写像に対して可能であり、その因子がタイプ I である場合に限る。
また、$k$-super positive map という概念も定義し、これは $k$-partially entanglement break の性質と同値であることが判明した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 04:15:29 GMT)
Identifying tourist destinations from movie scenes using Deep Learning [0.0] 本稿では,映画に登場する観光地を識別する手法を提案する。
映画視聴中にこれらの位置を認識できる深層学習モデルの開発を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 14:09:17 GMT)
How to Build an AI Tutor that Can Adapt to Any Course and Provide
Accurate Answers Using Large Language Model and Retrieval-Augmented
Generation [0.0] 本稿では,最先端のLarge Language Model (LLM)を用いて,どの科目でもパーソナライズされた学習を提供する,革新的なWebアプリケーションであるAI Tutorを紹介する。
学生が質問を行うと、最も関連性の高い情報を取得し、証拠を引用して詳細な会話応答を生成する。
私たちは、AI Tutorの汎用性をさまざまなテーマに示す、フル機能のWebインターフェースとビデオデモを紹介します。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:28:22 GMT)
Hierarchy Representation of Data in Machine Learnings [0.0] いくつかのデータポイントに対して明確な判断結果を持つモデルが存在する場合、ほとんどのモデルは、あるターゲットを正しく判断するなら、別のターゲットを正しく判断する関係を示す可能性がある。
本稿では,この階層をターゲット間で可視化する手法を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 01:49:52 GMT)
Generative Models for Anomaly Detection and Design-Space Dimensionality
Reduction in Shape Optimization [0.0] 本研究は,グローバルアルゴリズムの効率向上と高品質な設計の促進を目的として,新たな形状最適化手法を提案する。
これは、幾何学的分散を最大化する新しい縮小部分空間を定義する元の設計変数の数を減らすことで達成される。
計算結果から,グローバル最適化アルゴリズムの収束性を改善するとともに,高品質な幾何学的特徴を持つ設計のみを生成する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:21:47 GMT)
Generative Artificial Intelligence in Learning Analytics:
Contextualising Opportunities and Challenges through the Learning Analytics
Cycle [0.0] ジェネレーティブ人工知能(GenAI)は、教育を変革し、人間の生産性を高める大きな可能性を秘めている。
本稿では,GenAIが学習分析(LA)にもたらす可能性と課題について述べる。
我々は、GenAIが非構造化データの解析、合成学習データの生成、マルチモーダル学習者相互作用の強化、対話的・説明的分析の進展、パーソナライゼーションと適応的介入の促進において重要な役割を果たすことを示唆する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:25:34 GMT)
Galaxy Classification: A machine learning approach for classifying
shapes using numerical data [0.0] 我々は,Galaxy Zooプロジェクトの数値データを用いて,銀河分類のための機械学習モデルを提案する。
我々のモデルは銀河の分類において高い精度を達成し、銀河の形成と進化の理解を著しく向上させる可能性を持っている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 20:47:16 GMT)
From the classical Frenet-Serret apparatus to the curvature and torsion
of quantum-mechanical evolutions. Part II. Nonstationary Hamiltonians [0.0] 非定常ハミルトニアンの下で進化する状態ベクトルによって追跡される量子曲線の曲がりとねじれの定量化方法を示す。
時間変化の設定は、統計的観点からよりリッチな構造を示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:17:37 GMT)
From the classical Frenet-Serret apparatus to the curvature and torsion
of quantum-mechanical evolutions. Part I. Stationary Hamiltonians [0.0] ヒルベルト空間における量子軌道に対するフレネット・サーレット装置の量子バージョンを提案する。
提案した定数曲率係数は,状態ベクトルに対する接ベクトルの共変微分の大きさ2乗によって与えられる。
提案した定数ねじれ係数は, 接ベクトルの共変微分の射影の大きさ2乗で定義される。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:09:49 GMT)
Flow Matching Beyond Kinematics: Generating Jets with Particle-ID and
Trajectory Displacement Information [0.0] 我々はJetClassデータセットでトレーニングされた最初の生成モデルを紹介する。
本モデルでは, 構成レベルでジェットを発生させ, 流れマッチング法でトレーニングした変分同変連続正規化流(CNF)である。
また,ジェット部品の運動特性を超越した生成モデルも導入した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:00:02 GMT)
First-order coherent quantum Zeno dynamics and its appearance in
tight-binding chains [0.0] この結果から,コヒーレントQZDは,ゼロ階数型のみが研究されている順序によって初めて分類できることが判明した。
我々は、FC-QZDを驚くほど非局所的なエンドツーエンドの個体群遷移という形で確立する強結合モデルによって記述された鎖状システムを構築した。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 20:43:58 GMT)
Enhancing the sensitivity of atom-interferometric inertial sensors using
robust control [0.0] 実際の環境での運用は、外部からの干渉、プラットフォームノイズ、サイズ、重量、電力に対する制約によって困難である。
本研究では,ロバスト制御技術を用いて設計した調整光パルスが原子間干渉加速度計において重要な誤差源を緩和することを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 23:49:24 GMT)
Enhancing the security of image transmission in Quantum era: A
Chaos-Assisted QKD Approach using entanglement [0.0] 量子コンピューティングは、従来の暗号システムに前例のないセキュリティ課題をもたらした。
本研究は、量子鍵分布(QKD)とロジスティックカオスマップを革新的に組み合わせ、安全な画像伝送方式を確立することで、これらの課題に対処する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 11:26:38 GMT)
Effective algorithms for calculation of quasiprobability distributions
of bright "banana'' states [0.0] 非ガウス量子状態は、負の値を持つウィグナー関数によって記述され、量子物理学の基礎的なテストと新しい量子情報技術の両方において重要である。
非ガウス状態を生成する有望な方法の1つは、立方体(Kerr)光学的非線形性(英語版)の使用である。
本研究では,これらの非ガウス状態のフシミおよびウィグナー準確率関数をKerr非線形性を用いて高速に計算するアルゴリズムを開発する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:39:48 GMT)
Dynamical simulation of the injection of vortices into a Majorana edge
mode [0.0] トポロジカル超伝導体のキラルエッジモードは、アベリア交換統計を用いてフェルミオン準粒子を輸送することができるが、非アベリア電子を輸送することもできる。
そのようなエッジ渦の対は、ジョセフソン接合上の$h/2eフラックスバイアスの適用によって注入される。
我々のシミュレーションは、フライングトポロジカルキュービットの実装に必要とされるジョセフソン接合の特性に光を当てる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:45:15 GMT)
Dynamical relaxation of a long-range XY chain [0.0] クエンチに続く長距離量子XY鎖の普遍的リアルタイム緩和挙動について検討する。
非臨界クエンチの場合、初期状態もポストクエンチハミルトニアンも平衡相転移の臨界点にはならない。
臨界クエンチの場合、初期状態またはポストクエンチハミルトニアンは平衡相転移の臨界点である。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:57:10 GMT)
Dynamical Magic Transitions in Monitored Clifford+T Circuits [0.0] エンタングルメントを超えるシミュラビリティ遷移を研究する。
我々はTゲートでドープされたランダム監視クリフォード回路に着目した。
魔法と絡み合いの遷移が一致する場合も見出され、また、非常に(量的な)絡み合いの段階で魔法とシミュラビリティの遷移がある場合もあります。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 19:00:05 GMT)
Distributional PAC-Learning from Nisan's Natural Proofs [0.0] Lambda-circuitsを学習するために、$Lambdaの回路境界の自然な証明は効率的なアルゴリズムを暗示する。
我々は、この意味を$Lambda notsupseteq AC0[p]$、ランダムな例のみを用いて任意の例分布を学習する学習アルゴリズムに一般化できるかどうか検討する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 21:01:06 GMT)
Distinguishing erbium dopants in Y$_2$O$_3$ by site symmetry: \textit{
ab initio} theory of two spin-photon interfaces [0.0] エルビウム(Er)をドープしたイットリア(Y$4$O$_3$)の欠陥形成と電子構造に関する第一原理的研究を示す。
これは、量子情報科学におけるスピン光子インターフェースの新たな材料であり、Erドーパントからの細い光線幅の放出によるものである。
我々は、中性、負、正電荷のErドーパントの生成エネルギーを計算し、電荷中性配置が最も安定であることを示す。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 22:02:20 GMT)
Detection of Iron in Nanoclustered Cytochrome C Proteins Using
Nitrogen-Vacancy Magnetic Relaxometry [0.0] 我々はNV-T1緩和法を用いてCナノクラスター中のFeを検出する。
Cyt-Cは1つのヘム基を含む水溶性タンパク質であり、ミトコンドリアの電子輸送鎖において重要な役割を果たす。
機能性ダイヤモンドチップ上でNV-T1リラクサメトリーを行い,Cyt-C濃度を6 uMから54 uMに変化させ,T1濃度を1.2 msから150 usに低下させた。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 00:14:12 GMT)
Detecting nitrogen-vacancy-hydrogen centers on the nanoscale using
nitrogen-vacancy centers in diamond [0.0] 窒素空孔-水素複合体(NVH)は、窒素空孔(NV)の欠陥を1桁以上の大きさで上回り、密度の高いスピン浴を生成する。
スピン浴のモニタリングと制御は、量子応用のための高NV濃度のダイヤモンド材料の製造と理解に不可欠である。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:30:36 GMT)
DSeg: Direct Line Segments Detection [0.0] この手法は線形カルマンフィルタを用いて勾配画像上のセグメントを漸進的に検出する。
結果の質を高めるためにピラミッド的アプローチを利用するアルゴリズムの拡張を提案する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 08:31:49 GMT)
Convergence Analysis of Fractional Gradient Descent [0.0] 最適化のためには、線型整数階微分の収束を理解することが重要である。
本稿では,スムーズな凸関数および凸関数における分数降下の変動を分析することを目的とする。
比例勾配勾配降下の確率について 実験結果が提示されます
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:24:07 GMT)
Constrained HRT Surfaces and their Entropic Interpretation [0.0] 我々は、サブリージョン$A$のR'enyiエントロピーを、サブリージョン$B$の固定領域状態において研究する。
この結果は,標準ランダムネットワークを用いて時間依存測地を記述しようとする試みに関連するいくつかの問題に関係している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 06:50:40 GMT)
Combining deep generative models with extreme value theory for synthetic
hazard simulation: a multivariate and spatially coherent approach [0.0] GAN(Generative Adversarial Network)は、高次元設定でデータの分布を暗黙的に学習する能力のため、このような問題に適している。
我々は,ベンガル湾に面した日最大風速,波高,総降水量の依存構造をモデル化するために,GANを用いた。
一度訓練すれば、このモデルは何千もの現実的な複合危険事象を効率的に生成することができる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:55:51 GMT)
Color-Emotion Associations in Art: Fuzzy Approach [0.0] 本稿では,ファジィセットを用いたアートにおける感情の分類手法を提案する。
広範にファジィな色と広い感情スペクトルは、絵画に固有の感情をより人間と一貫性があり、文脈を意識した探索を可能にする。
例えば、感謝は緑、茶色、オレンジと強く関連している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:49:11 GMT)
Coarse-Graining Hamiltonian Systems Using WSINDy [0.0] そこで,WSINDy は大規模内在系の存在下でハミルトン系を小さくすることに成功した。
WSINDy は、ハミルトンベクトル場の試行基底に制限を加えることにより、ハミルトン構造を自然に保存する。
また、ベクトル場のレベルでの1次平均化は、ほぼ周期的なハミルトン系におけるハミルトン構造を保存することを証明して平均化理論に寄与する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 04:10:19 GMT)
CLS-CAD: Synthesizing CAD Assemblies in Fusion 360 [0.0] 我々は,CADソフトウェアパッケージであるFusion 360のプラグインを開発し,この問題に対処した。
このプラグインはFusion 360にいくつかのグラフィカルなインターフェイスを追加し、型でアノテートできる部分、サブタイプ階層の管理、アセンブリーのアセンブリープログラムの合成を要求する。
CADソフトウェアに携わるエンジニアが、デザイン部品を再利用し、さまざまなデザイン代替品と製品ライン全体を自動生成できることを期待している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:07:27 GMT)
Bayesian CART models for insurance claims frequency [0.0] 分類と回帰木(CART)とそのアンサンブルは、アクチュアリ文学で人気を博している。
本稿では,保険価格に関するベイジアンCARTモデルについて紹介する。
これらのモデルの適用可能性を説明するため、いくつかのシミュレーションと実際の保険データについて論じる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 16:50:05 GMT)
Axionlike Dark Matter Model Involving Two-Phase Structure and
Two-Particle Composites (Dimers) [0.0] 我々は、超軽量ボソンの軸状自己相互作用が、(ドワーフ)銀河のDMハローコアに希薄で密度の高い位相の存在を保証していると論じる。
正エネルギーが低く、寿命が有限の2粒子複合体を作製するため、開水路から閉水路への対の1つの自由粒子の共振遷移に訴える。
フェシュバッハ共鳴の概念を用いて、2チャネル量子力学の問題は、外部の影響が小さい場合に解決される。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 17:22:49 GMT)
Automatic Construction of a Korean Toxic Instruction Dataset for Ethical
Tuning of Large Language Models [0.0] 39Kの非倫理的命令出力ペアからなるKoToxを提案する。
この自動生成された有毒な命令の収集は、大規模言語モデルの訓練を洗練させる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:19:45 GMT)
Attaining near-optimal Dicke superradiance in a large spatial scale [0.0] エプシロン-ネアゼロ(ENZ)材料は、その無限の有効波長のため、長距離相互作用の自然なメディエーターである。
ENZ材料は空間的拡張性, ほぼ最適Dicke超放射能を実現する大きな可能性を秘めている。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 08:01:57 GMT)
ArthModel: Enhance Arithmetic Skills to Large Language Model [0.0] この作業は、さまざまな思考方法、トレーニング方法、言語モデルの使用方法を提供します。
コードとモデルはurlhttps://www.eteced.com/eteced/arithmetic_finetuning_v1でリリースされる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:06:50 GMT)
Are All Events Created At-Once in Relational Quantum Mechanics? [0.0] この論文は、相対性理論との矛盾を避けるために、RQMにおける事象は全対一で発生したに違いないというAdlamとRovelliの主張を批判的に検証する。
この分析は、事象の集合を絶対的で観測者に依存しないものとして考慮しないことで、時間的生成が可能であることを示している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:17:58 GMT)
Applying Bayesian Ridge Regression AI Modeling in Virus Severity
Prediction [0.0] 医療専門家に最先端ウイルス分析をもたらすAIモデルであるBayesian Ridge Regressionの長所と短所をレビューする。
モデルの精度評価は有望な結果を示し、改善の余地があった。
さらに、重症度指数は、患者のケアニーズを概観するための貴重なツールとして機能する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 03:19:03 GMT)
Anisotropic Neural Representation Learning for High-Quality Neural
Rendering [0.0] 本稿では、学習可能なビュー依存機能を利用してシーン表現と再構成を改善する異方性ニューラル表現学習法を提案する。
我々の手法は柔軟であり、NeRFベースのフレームワークにプラグインできる。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 07:29:30 GMT)
Anatomy and Physiology of Artificial Intelligence in PET Imaging [0.0] この記事では、PETイメージングで最も遭遇しそうな側面に特に焦点をあてて、現代のAIの中核となる原則を解説したガイドを提供する。
本稿では、畳み込みニューラルネットワーク、アルゴリズムトレーニング、セグメンテーションと画像合成によく使われるU-Netの構成要素について説明する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 15:12:57 GMT)
All-microwave and low-cost Lamb shift engineering for a fixed frequency
multi-level superconducting qubit [0.0] ラムシフトは量子電磁力学(QED)における重要な現象である
回路QEDにおけるラムシフトを制御するための従来のアプローチでは、回路設計のオーバーヘッドやシステムの固有基底の非摂動的再正規化が要求されていた。
固定周波数トランスモンのラムシフトを制御するための効率よく費用効率の良い手法を提案し,実証する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 12:52:10 GMT)
Age Effects on Decision-Making, Drift Diffusion Model [0.0] トレーニングは人間の意思決定能力を改善する。
本研究では,ランダム・ドット・モーション(RDM)タスクの完了時に,異なる年齢グループのパフォーマンスを向上させるためのトレーニング方法を検討する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:19:12 GMT)
Advancing Medical Education through the cINnAMON Web Application [0.0] cINnAMON EUREKA 屋内照明の位置と監視に革命をもたらす伝統的なプロジェクト。
現在のインテリジェンス電球のプロトタイプは、プロジェクトの電球と市販の電球の比較分析を提供している。
最初のスマートブレスレットのプロトタイプは、内蔵センサーの配列からデータを収集して分析する機能を披露している。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:49:51 GMT)
Active Learning and Bayesian Optimization: a Unified Perspective to
Learn with a Goal [0.0] 本稿では,適応サンプリング,アクティブラーニング,ベイズ最適化の膨大なファミリー間の類似点と相違点を明らかにするために,適応サンプリング手法の一般的な分類を提案する。
様々なベンチマーク問題に対するベイズスキームの性能を調査する学習基準を適用するためのガイドラインを提供する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 20:43:25 GMT)
A relation between Krylov and Nielsen complexity [0.0] Krylov複雑性とNielsen複雑性には関連性があることが示されている。
状態進化のクリロフ複雑性の時間平均は、ある行列のトレースとして表すことができる。
クリロフ基底に適応した特定のカスタマイズされたペナルティスケジュールを持つNielsen複雑性の上限は、同じ行列によって制御される。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 09:51:22 GMT)
A machine-learning approach to thunderstorm forecasting through
post-processing of simulation data [0.0] 雷雨は社会や経済に大きな危険をもたらし、信頼できる雷雨予報が求められている。
数値天気予報データから雷雨の発生を識別するためのフィードフォワードニューラルネットワークモデルであるSALAMAを紹介する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 22:18:26 GMT)
A Type $I$ Approximation of the Crossed Product [0.0] 私は通常の$I$トレースを別の方法で書き直し、それを再正規化します。
私は、タイプ $II_infty$ とタイプ $II_1$ の両方を復元できます。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 10:22:46 GMT)
A Comparative Study of Text Embedding Models for Semantic Text
Similarity in Bug Reports [0.0] 既存のデータベースから同様のバグレポートを取得することは、バグを解決するのに必要な時間と労力を削減するのに役立つ。
我々はTF-IDF(Baseline)、FastText、Gensim、BERT、ADAなどの埋め込みモデルについて検討した。
本研究は, 類似のバグレポートを検索するための埋め込み手法の有効性について考察し, 適切なバグレポートを選択することの影響を明らかにする。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 23:43:47 GMT)
A Baseline Analysis of Reward Models' Ability To Accurately Analyze
Foundation Models Under Distribution Shift [0.0] 我々は、分配シフトによる報酬モデルの性能への影響を評価する。
OODプロンプトと応答による新しい校正パターンと精度低下を示す。
我々は,これらの分布変化をプロンプトや応答で検出するために,分類によく用いられるOOD検出手法を報酬モデル設定に適用する。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:48:24 GMT)
$\epsilon$-Uniform Mixing in Discrete Quantum Walks [0.0] 量子ウォークは任意の弧上でシュル四角形が一定である状態に任意に近づくことができる。
グラフの隣接スペクトルを用いて、この現象を非二部グラフ上で特徴づける。
論文参考訳(メタデータ) (Thu, 30 Nov 2023 18:43:38 GMT)