OPERA: Alleviating Hallucination in Multi-Modal Large Language Models
via Over-Trust Penalty and Retrospection-Allocation [124.9] OPERA(Over-trust PenaltyとRetrospection-Allocation戦略に基づく新しいMLLM復号法)を提案する。
私たちのアプローチは、ほとんどの幻覚は、自己注意行列に現れる知識集約パターンと密接に結びついているという興味深い観察から始まります。
この観察に基づいて、OPERAは、ビーム探索復号時にモデルロジットにペナルティ項を導入し、オーバートラスト問題を緩和する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:57:07 GMT)
MM-Narrator: Narrating Long-form Videos with Multimodal In-Context
Learning [121.0] GPT-4を利用した音声記述生成のためのマルチモーダルインコンテキスト学習システムMM-Narratorを提案する。
MM-Narratorは、時間を超えても、何時間も経過したビデオの正確な音声記述を自動回帰的に生成することに長けている。
逐次テキスト生成のための最初のセグメントベース評価器を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:27:00 GMT)
CLOMO: Counterfactual Logical Modification with Large Language Models [113.7] 本稿では,新しいタスク,CLOMO(Counterfactual Logical Modification)と高品質な人間アノテーションベンチマークを紹介する。
生成モデルのカウンターファクトの能力を効果的に評価するために,革新的な評価指標であるLogicAware Counterfactual Scoreを提案する。
分析の結果,提案手法は人間の好みとよく一致していることがわかった。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:29:54 GMT)
VIM: Probing Multimodal Large Language Models for Visual Embedded
Instruction Following [109.0] MLLM(Multimodal Large Language Models)の機能に追従する視覚的命令を評価するための新しいフレームワークであるVISUAL EMBEDEDED INSTRUCTION (VIM)を紹介した。
VIMは、命令を視覚シーンに埋め込むことでMLLMに挑戦し、指示に従うために強力な視覚的解釈スキルを要求する。
我々は、VQAv2、MME、MM-Vet、RefCOCOシリーズなどの様々なベンチマークにVIMを適用し、VIMベンチを作成し、Zero Shot、One Shot、Pair Shotという3つの異なるコンテキスト内学習環境にまたがる多様なMLLMを探索する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:08:53 GMT)
Meaning Representations from Trajectories in Autoregressive Models [106.6] 入力テキストを拡張可能なすべてのトラジェクトリの分布を考慮し,自己回帰言語モデルから意味表現を抽出する。
この戦略はプロンプトフリーであり、微調整は必要とせず、事前訓練された自己回帰モデルにも適用できる。
我々は,大規模なモデルから得られた表現が人間のアノテーションとよく一致し,意味的類似性タスクにおける他のゼロショットおよびプロンプトフリーメソッドよりも優れており,標準埋め込みが扱えないより複雑なエンタテインメントや包含タスクの解決に使用できることを実証的に示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:32:24 GMT)
A Minimal Approach for Natural Language Action Space in Text-based Games [103.2] 本稿では,テキストベースのゲーム(TG)におけるアクション空間の探索という課題を再考する。
我々は,許容行動を利用する最小限のアプローチである$epsilon$-admissible Exploringをトレーニングフェーズに提案する。
本稿では,テキストベースのアクタ・クリティカル(TAC)エージェントを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 23:25:19 GMT)
Learning Stackable and Skippable LEGO Bricks for Efficient,
Reconfigurable, and Variable-Resolution Diffusion Modeling [102.9] 拡散モデルはフォトリアリスティックな画像を生成するのに優れるが、トレーニングとサンプリングの両方においてかなりの計算コストがかかる。
現在のオプションであるU-NetやVision Transformerはリソース集約型のディープネットワークに依存していることが多い。
本研究は,ローカル・フィーチャー・エンリッチメントとグローバル・コンテント・オーケストレーションをシームレスに統合したLEGOブロックを紹介した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:09:08 GMT)
Distill Gold from Massive Ores: Efficient Dataset Distillation via
Critical Samples Selection [101.8] 情報伝達の文脈内でデータセット蒸留タスクをモデル化する。
我々は、データユーティリティー推定器のファミリーと、最も価値のあるサンプルを利用する最適なデータ選択方法を導入し、検証する。
提案手法は, より大規模で異種なデータセットであっても, 蒸留アルゴリズムを一貫して強化する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:46:19 GMT)
VBench: Comprehensive Benchmark Suite for Video Generative Models [100.4] VBenchは、"ビデオ生成品質"を特定の、階層的、そして非絡み合ったディメンションに分解するベンチマークスイートである。
我々は、人間の知覚とベンチマークの整合性を検証するために、人間の嗜好アノテーションのデータセットを提供する。
VBenchは、すべてのプロンプト、評価方法、生成されたビデオ、人間の好みのアノテーションを含むオープンソースとして公開します。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:39:01 GMT)
StructRe: Rewriting for Structured Shape Modeling [99.8] 本稿では,構造化形状モデリングの新しいアプローチとして,構造書換えシステムであるStructReを提案する。
ポイントとコンポーネントで表される3Dオブジェクトが与えられたら、StructReはそれを上向きに、より簡潔な構造に書き直すか、より詳細な構造に書き直すことができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:35:00 GMT)
SmoothLLM: Defending Large Language Models Against Jailbreaking Attacks [99.2] SmoothLLMは,大規模言語モデル(LLM)に対するジェイルブレーキング攻撃を軽減するために設計された,最初のアルゴリズムである。
敵が生成したプロンプトが文字レベルの変化に対して脆弱であることから、我々の防衛はまず、与えられた入力プロンプトの複数のコピーをランダムに摂動し、対応する予測を集約し、敵の入力を検出する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:39:37 GMT)
VideoAssembler: Identity-Consistent Video Generation with Reference
Entities using Diffusion Model [98.0] VideoAssemblerは、アイデンティティ一貫性のあるビデオ生成のためのエンドツーエンドフレームワークである。
VideoAssemblerは、入力参照エンティティに対してフレキシブルなビデオを作成することに長けている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 03:36:07 GMT)
Towards Real-World Focus Stacking with Deep Learning [97.3] 焦点ブラケットを用いた94個の高解像度原画像のバーストからなる新しいデータセットを提案する。
このデータセットは、現実世界のアプリケーションに十分な長さのバーストを処理できるフォーカススタックのための最初のディープラーニングアルゴリズムをトレーニングするために使用される。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:49:33 GMT)
Diffusion-TTA: Test-time Adaptation of Discriminative Models via
Generative Feedback [97.1] 生成モデルは、識別モデルのための優れたテストタイムアダプタになり得る。
提案手法であるDiffusion-TTAは,事前学習した判別モデルを,テストセットの各未学習例に適応させる。
拡散-TTAは,様々な大規模事前学習型判別モデルの精度を著しく向上させることを示した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:12:28 GMT)
Gaussian Shell Maps for Efficient 3D Human Generation [96.3] 3次元生成敵ネットワーク(GAN)は、生成資産の最先端(SOTA)品質と多様性を実証している。
しかし、現在の3D GANアーキテクチャはレンダリングが遅いボリューム表現に依存しており、GANのトレーニングを妨害し、マルチビュー非一貫性の2Dアップサンプラーを必要とする。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:04:07 GMT)
4D-fy: Text-to-4D Generation Using Hybrid Score Distillation Sampling [95.1] 現在のテキストから4Dの手法は、シーンの外観の質、立体構造、動きの3方向のトレードオフに直面している。
本稿では,複数の事前学習拡散モデルからの監視信号をブレンドする交互最適化手法であるハイブリッドスコア蒸留法を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:58:05 GMT)
Exploring Human-Like Translation Strategy with Large Language Models [93.5] 大規模言語モデル(LLM)は、一般的なシナリオにおいて印象的な機能を示している。
本研究は,マルチアスペクト・プロンプトと選択のためのMAPSフレームワークを提案する。
品質推定に基づく選択機構を用いて,ノイズや不ヘッピーな知識を抽出する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:52:23 GMT)
Zero-shot Retrieval: Augmenting Pre-trained Models with Search Engines [83.7] 大規模で事前訓練されたモデルは、問題を解決するのに必要なタスク固有のデータの量を劇的に削減するが、多くの場合、ドメイン固有のニュアンスを箱から取り出すのに失敗する。
本稿では,NLPとマルチモーダル学習の最近の進歩を活用して,検索エンジン検索による事前学習モデルを強化する方法について述べる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:33:28 GMT)
Revisiting Single Image Reflection Removal In the Wild [83.4] 本研究は,実環境におけるシングルイメージリフレクション除去(SIRR)の問題に焦点をあてる。
我々は,様々な現実世界のリフレクションシナリオに高度に適用可能な,高度なリフレクション収集パイプラインを考案した。
野生での反射除去(RRW)と呼ばれる大規模で高品質な反射データセットを開発する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:31:10 GMT)
To See is to Believe: Prompting GPT-4V for Better Visual Instruction
Tuning [82.3] LVIS-Instruct4Vには220Kの視覚的アライメントとコンテキスト認識の命令が含まれている。
LLaVA-InstructをLVIS-Instruct4Vに置き換えることで、最も難しいLMMベンチマークでLLaVAよりも優れた結果が得られる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:37:24 GMT)
Betrayed by Attention: A Simple yet Effective Approach for
Self-supervised Video Object Segmentation [82.3] 自己教師型ビデオオブジェクトセグメンテーション(VOS)のための簡易かつ効果的なアプローチを提案する。
我々の重要な洞察は、DINO-pretrained Transformerに存在する構造的依存関係を利用して、ビデオ内の堅牢な時間分割対応を確立することである。
提案手法は,複数の教師なしVOSベンチマークにまたがる最先端性能を実証し,複雑な実世界のマルチオブジェクトビデオセグメンテーションタスクに優れることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:47:17 GMT)
Training-Free Layout Control with Cross-Attention Guidance [81.5] 最近の拡散型ジェネレータはテキストプロンプトから高品質な画像を生成することができる。
彼らはしばしば、構成の空間的レイアウトを指定するテキスト命令を無視している。
本稿では,イメージジェネレータの訓練や微調整を必要とせずに,ロバストなレイアウト制御を実現するシンプルな手法を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:21:48 GMT)
D-CIPHER: Discovery of Closed-form Partial Differential Equations [80.5] D-CIPHERは人工物の測定に頑健であり、微分方程式の新しい、非常に一般的なクラスを発見できる。
さらに,D-CIPHERを効率的に探索するための新しい最適化手法であるCoLLieを設計する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:23:57 GMT)
COVIDx CXR-4: An Expanded Multi-Institutional Open-Source Benchmark
Dataset for Chest X-ray Image-Based Computer-Aided COVID-19 Diagnostics [79.9] 我々は,胸部X線画像を用いたコンピュータ支援型COVID-19診断のための,多施設のオープンソースベンチマークデータセットであるCOVIDx CXR-4を紹介する。
COVIDx CXR-4は、患者の総コホートサイズを2.66倍に増やすことで、前回のCOVIDx CXR-3データセットで大幅に拡大する。
患者人口、画像メタデータ、および疾患分布の多様性について広範な分析を行い、潜在的なデータセットバイアスを明らかにする。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:40:31 GMT)
Learning Spatial Features from Audio-Visual Correspondence in Egocentric
Videos [78.4] 本稿では,エゴセントリックビデオにおける空間的音声・視覚対応に基づく表現の自己教師付き学習法を提案する。
本手法では,マスク付き(マルチチャネル)音声を音声と視覚の相乗効果により合成するために,マスク付き自動符号化フレームワークを用いる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:35:26 GMT)
Object-based (yet Class-agnostic) Video Domain Adaptation [78.3] 我々はODAPT(Object-based (yet Class-Agnostic) Video Domain Adaptation)を提案する。
ODAPTは、既存のアクション認識システムを新しいドメインに適応するための、シンプルで効果的なフレームワークである。
我々のモデルは、Epic-Kitchensのキッチン間で適応する場合の+6.5の増加と、Epic-KitchensとEGTEAデータセット間の適応率の+3.1の増加を実現している。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 01:17:38 GMT)
HandRefiner: Refining Malformed Hands in Generated Images by
Diffusion-based Conditional Inpainting [78.3] 拡散モデルは現実的な画像の生成において顕著な成功を収めた。
しかし、不正確な指数や不規則な形など、正確な人間の手を生成することに苦しむ。
本稿では,HandRefinerという軽量な後処理ソリューションを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:52:08 GMT)
Unveiling the Implicit Toxicity in Large Language Models [77.9] 大きな言語モデル(LLM)のオープンエンドネスと、その優れた機能を組み合わせることで、悪意のある使用のために悪用された場合、新たな安全性上の問題が発生する可能性がある。
LLMは、単純なゼロショットプロンプトによる検出が極めて困難である様々な暗黙的な有毒な出力を生成することができることを示す。
我々は,LLMの暗黙的毒性をさらに誘発する強化学習(RL)に基づく攻撃法を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 06:42:36 GMT)
SelfOcc: Self-Supervised Vision-Based 3D Occupancy Prediction [77.2] 本稿では,ビデオシーケンスのみを用いて,自己指導型3D習熟学習手法を提案する。
まず、画像を3D空間(例えば鳥の目視)に変換し、シーンの3D表現を得る。
そして、前と将来のフレームの2D画像を自己超越信号として描画し、3D表現を学習する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:19:38 GMT)
SODA: Bottleneck Diffusion Models for Representation Learning [75.7] 本稿では,表現学習のための自己教師付き拡散モデルSODAを紹介する。
このモデルには、ソースビューをコンパクトな表現に蒸留するイメージエンコーダが組み込まれており、関連する新規ビューの生成を導く。
エンコーダと復調復調復調復調復調復調復調復調復号器の密集ボトルネックを付与することにより,拡散モデルを強力な表現学習器に変換することができることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:53:34 GMT)
ZoomNeXt: A Unified Collaborative Pyramid Network for Camouflaged Object
Detection [75.2] 本稿では,不明瞭な画像や映像を観察する際の人間の行動を模倣する,効果的な統合型ピラミッドネットワークを提案する。
具体的には、差別的な混合スケールのセマンティクスを学習するために、ズーム戦略を用いる。
我々のタスクフレンドリーなフレームワークは、画像とビデオのCODベンチマークにおいて、既存の最先端の手法よりも一貫して優れています。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:33:30 GMT)
CoSeR: Bridging Image and Language for Cognitive Super-Resolution [74.2] 本稿では,低解像度画像の理解能力を備えたSRモデルを実現するCoSeR(Cognitive Super-Resolution)フレームワークを提案する。
画像の外観と言語理解を組み合わせることで、認知的な埋め込みを生成する。
画像の忠実度をさらに向上させるため、「オール・イン・アテンション」と呼ばれる新しい条件注入方式を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:00:42 GMT)
LALM: Long-Term Action Anticipation with Language Models [74.1] 言語モデル(LALM)を用いた長期的行動予測のための新しいアプローチを提案する。
本手法は,従来の行動系列を追跡する行動認識モデルと,関連する環境の詳細を記述するための視覚言語モデルを含む。
実験の結果、LALMは長期的な行動予測のタスクにおいて最先端の手法を超越していることが示された。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:17:27 GMT)
Evaluating VLMs for Score-Based, Multi-Probe Annotation of 3D Objects [73.5] ラベルのない3Dオブジェクトは、様々なアノテーションタスクで事前訓練された視覚言語モデル(VLM)を利用する機会を提供する。
提案手法は, VLM のスコアをサンプル応答に用いて, VLM の問合せ毎に異なる因子を疎外する手法である。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:54:22 GMT)
Universal Self-Consistency for Large Language Model Generation [72.7] CoT(Self-Consistency with chain-of- Thought prompting)は、困難なタスクにおいて顕著なパフォーマンス向上を示す。
本稿では,大規模言語モデル(LLM)を活用し,最も一貫した回答を選択するユニバーサル自己整合性(USC)を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:07:09 GMT)
Leveraging Graph Diffusion Models for Network Refinement Tasks [72.5] 本稿では,グラフ拡散に基づく新しいグラフ生成フレームワークSGDMを提案する。
我々のフレームワークはグラフ拡散モデルのスケーラビリティと忠実度を向上するだけでなく、逆プロセスを利用して新しい条件付き生成タスクを実行する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:02:29 GMT)
Back to 3D: Few-Shot 3D Keypoint Detection with Back-Projected 2D
Features [72.4] 3次元形状のキーポイント検出には意味的および幾何学的認識が必要である。
我々はキーポイント候補最適化モジュールを用いて,その形状上のキーポイントの平均分布を一致させる。
結果として得られたアプローチは、KeyPointNetデータセットで数ショットのキーポイント検出のための新しい状態を実現する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:58:41 GMT)
ChatGPT's One-year Anniversary: Are Open-Source Large Language Models
Catching up? [71.1] ChatGPTは、AIのランドスケープ全体において、地震的な変化をもたらした。
モデルは人間の質問に答え、幅広いタスクのパネルで指示に従うことができることを示した。
クローズドソースのLLMは一般的にオープンソースよりも優れていますが、後者の進歩は急速に進んでいます。
これは研究だけでなく、ビジネスにも重要な意味を持つ。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:00:05 GMT)
AvatarStudio: High-fidelity and Animatable 3D Avatar Creation from Text [71.1] アバターストゥディオ(AvatarStudio)は、アニマタブルな人間のアバターのために、明瞭なテクスチャ化された3Dメッシュを生成する粗大で微細な生成モデルである。
調音メッシュ表現とDensePose条件拡散モデルとの相乗効果を効果的に活用することにより、AvatarStudioは高品質なアバターを作成することができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:59:32 GMT)
Generative Hierarchical Temporal Transformer for Hand Action Recognition
and Motion Prediction [70.9] 本稿では,手の動き認識と3次元手の動き予測を同時に行う新しいフレームワークを提案する。
我々のフレームワークは複数のデータセットにまたがって訓練されており、異なる品質のポーズアクションアノテーションを完全に活用するために、ポーズブロックとアクションブロックを個別に訓練する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:28:39 GMT)
Corner-to-Center Long-range Context Model for Efficient Learned Image
Compression [70.0] 学習された画像圧縮のフレームワークでは、コンテキストモデルは潜在表現間の依存関係をキャプチャする上で重要な役割を果たす。
本研究では,textbfCorner-to-Center 変換器を用いたコンテキストモデル (C$3$M) を提案する。
また,解析および合成変換における受容場を拡大するために,エンコーダ/デコーダのLong-range Crossing Attention Module (LCAM) を用いる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:40:28 GMT)
Coloring the Past: Neural Historical Buildings Reconstruction from
Archival Photography [69.9] 本稿では, ボリュームレンダリング技術を用いて, 歴史的建造物の形状を復元する手法を提案する。
我々は,高密度点雲を幾何学的先行として利用し,カラー画像に制限のある建物の色を復元するために,色相の埋め込み損失を導入する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:59:45 GMT)
Paragraph-to-Image Generation with Information-Enriched Diffusion Model [67.9] パラディフュージョン(英: ParaDiffusion)は、パラディフュージョンモデルである。
これは、大きな言語モデルの広範囲な意味理解能力を画像生成のタスクに移すことを念頭に置いている。
コードとデータセットは、長文アライメントに関するコミュニティの研究を促進するためにリリースされます。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:01:35 GMT)
Self-Chained Image-Language Model for Video Localization and Question
Answering [66.9] ビデオ上での時間的ローカライゼーションとQAに対処するために,SeViLA(Se-Chained Video-Answering)フレームワークを提案する。
SeViLAフレームワークはLocalizerとAnswererの2つのモジュールで構成されている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:24:35 GMT)
Spherical Frustum Sparse Convolution Network for LiDAR Point Cloud
Semantic Segmentation [66.8] LiDARポイントクラウドセマンティックセグメンテーションにより、ロボットは周囲の環境のきめ細かいセマンティック情報を得ることができる。
多くの研究が2Dイメージ上にポイントクラウドを投影し、LiDARポイントクラウドセマンティックセグメンテーションに2D畳み込みニューラルネットワーク(CNN)を採用する。
本稿では,情報損失の定量化を回避するために,新しい球状フラストラム構造を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:55:13 GMT)
GeoDream: Disentangling 2D and Geometric Priors for High-Fidelity and
Consistent 3D Generation [66.5] そこで,GeoDreamは,2次元拡散プリエントを持つ明示的な一般化された3Dプリエントを組み込んだ新しい手法である。
具体的には,まず多視点拡散モデルを用いてポーズ画像を生成し,予測画像からコスト容積を構築する。
さらに,3次元の幾何学的先行性を利用して,不整合設計による2次元拡散先行性における3次元認識の大きな可能性を解き放つことを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:48:48 GMT)
Do LLMs exhibit human-like response biases? A case study in survey
design [66.2] 本研究では,「プロンプト」の単語の置換による人間の反応バイアスが研究されている事例研究として,サーベイデザインを用いた。
9つのモデルに対する総合的な評価は、一般のオープンかつ商用のLCMは、一般的に人間のような振る舞いを反映しないことを示している。
これらの矛盾は、微調整されたモデルでは顕著である傾向にある。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 22:00:12 GMT)
Dynamic DAG Discovery for Interpretable Imitation Learning [65.2] 得られた知識を有向非巡回因果グラフの形で公開することを提案する。
また、この因果発見プロセスを状態依存的に設計し、潜在因果グラフのダイナミクスをモデル化する。
提案するフレームワークは,動的因果探索モジュール,因果符号化モジュール,予測モジュールの3つの部分から構成され,エンドツーエンドで訓練される。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 01:48:10 GMT)
Alternate Diverse Teaching for Semi-supervised Medical Image
Segmentation [64.4] そこで我々は,教師-学生の枠組みにおける多様な教育手法であるAD-MTを提案する。
一人の生徒モデルと2つの訓練不可能な教師モデルがあり、それは定期的に、ランダムに、別の方法で、モーメントを更新する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:44:54 GMT)
Building Open Knowledge Graph for Metal-Organic Frameworks (MOF-KG):
Challenges and Case Studies [63.6] 金属有機フレームワーク(MOF)は、ガス貯蔵、分子分離、化学センシング、結晶および薬物のデリバリーといった応用に革命をもたらす大きな可能性を持っている。
ケンブリッジ構造データベース(CSD)は10,636個のMOF結晶を報告しており、これには114,373個のMOF構造が含まれる。
本稿では,MOF予測,発見,合成を容易にする知識グラフ手法の活用に向けた取り組みについて述べる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:20:33 GMT)
Cinematic Behavior Transfer via NeRF-based Differentiable Filming [63.2] 既存のSLAM手法は動的シーンの制限に直面し、人間のポーズ推定はしばしば2次元投影に焦点を当てる。
まず,逆撮影行動推定手法を提案する。
次に,新しい2Dビデオや3D仮想環境に様々な撮影タイプを転送できる映像転送パイプラインを導入する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:56:58 GMT)
ALSTER: A Local Spatio-Temporal Expert for Online 3D Semantic
Reconstruction [62.6] 本稿では,RGB-Dフレームのストリームから3次元セマンティックマップを段階的に再構成するオンライン3次元セマンティックセマンティックセマンティクス手法を提案する。
オフラインの手法とは異なり、ロボット工学や混合現実のようなリアルタイムな制約のあるシナリオに直接適用できます。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:30:18 GMT)
Operationalizing Counterfactual Metrics: Incentives, Ranking, and
Information Asymmetry [62.5] このような平均的な治療結果の指標から生じるインセンティブのずれを分析した。
本稿では,患者が対象とするランキングシステムにおいて,対物メトリクスを合理的に振る舞うように修正する方法を示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:56:41 GMT)
CoLA: Exploiting Compositional Structure for Automatic and Efficient
Numerical Linear Algebra [62.4] 機械学習における大規模線形代数問題に対して, CoLA という, 単純だが汎用的なフレームワークを提案する。
線形演算子抽象と合成ディスパッチルールを組み合わせることで、CoLAはメモリと実行時の効率的な数値アルゴリズムを自動的に構築する。
偏微分方程式,ガウス過程,同変モデル構築,教師なし学習など,幅広い応用で有効性を示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:17:26 GMT)
DeepEMplanner: An End-to-End EM Motion Planner with Iterative
Interactions [62.1] モーションプランニングは、他のエージェントの意図や遭遇する環境に応じて、エージェントが次の動きを継続的に計画するゲームと見なすことができる。
本稿では,DeepEMplannerという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:53:47 GMT)
A Unified Approach for Text- and Image-guided 4D Scene Generation [61.6] 本研究では,テキストから4Dへの新たな2段階合成手法であるDream-in-4Dを提案する。
提案手法は,画像の画質,3次元整合性,テキスト・ツー・4次元生成におけるテキストの忠実度を著しく向上することを示す。
本手法は,テキストから4D,画像から4D,パーソナライズされた4D生成タスクに対して,初めて統一されたアプローチを提供する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:56:38 GMT)
AnyLens: A Generative Diffusion Model with Any Rendering Lens [60.3] 最終シーンの外観に対する異なる光学系の影響は、しばしば見過ごされる。
本研究では,画像レンダリングに使用される特定のレンズとテキスト画像拡散モデルを密接に統合するフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:06:48 GMT)
When StyleGAN Meets Stable Diffusion: a $\mathscr{W}_+$ Adapter for
Personalized Image Generation [60.3] テキストと画像の拡散モデルは、多種多様で高品質でフォトリアリスティックな画像を生成するのに優れている。
本稿では,拡散モデルのための拡張されたアイデンティティ保存とアンタングル化を実現するために,StyleGAN 埋め込み空間 $mathcalW_+$ の新たな利用法を提案する。
提案手法は,即時記述に適合するだけでなく,一般的なスタイルGAN編集方向に対応可能なパーソナライズされたテキスト・ツー・イメージ出力を生成する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:05:14 GMT)
A Comprehensive Survey on Distributed Training of Graph Neural Networks [59.8] グラフニューラルネットワーク(GNN)は、幅広いアプリケーション分野において強力なアルゴリズムモデルであることが示されている。
GNNトレーニングを大規模かつ継続的なグラフにスケールアップするために、最も有望なソリューションは分散トレーニングである。
分散GNNトレーニングに関する研究の規模は、非常に広範であり、出版のペースは極めて速い。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:11:23 GMT)
Introduction to Transformers: an NLP Perspective [59.0] 本稿では、トランスフォーマーの基本概念と、これらのモデルの最近の進歩を形作る重要な技術を紹介する。
これには、標準のTransformerアーキテクチャ、一連のモデル改良、一般的なアプリケーションの記述が含まれる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:51:04 GMT)
Neural Fields with Thermal Activations for Arbitrary-Scale
Super-Resolution [58.9] 本稿では,ASSRの分解能を横切るときのアンチエイリアスとして機能するガウスPSFを用いて点を問うことができるような,新しい設計手法を提案する。
我々のフレームワークでガウスPSFで点を問うことは、画像領域のフィルタリングとは異なり、計算コストに影響しない。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:01:28 GMT)
Symbol-LLM: Leverage Language Models for Symbolic System in Visual Human
Activity Reasoning [58.6] 本稿では,広い範囲のシンボルと合理的なルールを持つ新しい記号体系を提案する。
我々は,LLMの最近の進歩を2つの理想的な性質の近似として活用する。
本手法は,広範囲な活動理解タスクにおいて優位性を示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:27:14 GMT)
Learning to Estimate Without Bias [57.8] ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:01:05 GMT)
CG3D: Compositional Generation for Text-to-3D via Gaussian Splatting [57.1] CG3Dは、スケーラブルな3Dアセットを合成的に生成する手法である。
ガンマ放射場は、オブジェクトの合成を可能にするためにパラメータ化され、意味的および物理的に一貫したシーンを可能にする能力を持っている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:55:38 GMT)
SUR-adapter: Enhancing Text-to-Image Pre-trained Diffusion Models with
Large Language Models [56.9] 本研究では,事前学習拡散モデルに対するセマンティック・アダプタ (SUR-adapter) と呼ばれる簡易なパラメータ効率の良い微調整手法を提案する。
ユーザエクスペリエンスの向上により,テキストから画像への拡散モデルの使いやすさが向上する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:18:14 GMT)
Knockoffs-SPR: Clean Sample Selection in Learning with Noisy Labels [56.8] 雑音ラベルを用いた学習のための,理論的に保証されたクリーンサンプル選択フレームワークを提案する。
Knockoffs-SPRは、標準的な教師付きトレーニングパイプラインのサンプル選択モジュールと見なすことができる。
さらに、ラベルなしデータとしてノイズデータのサポートを利用する半教師付きアルゴリズムと組み合わせる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:10:04 GMT)
Modular Quantization-Aware Training: Increasing Accuracy by Decreasing
Precision in 6D Object Pose Estimation [56.8] エッジアプリケーションは、リソース制約された組み込みプラットフォーム上で効率的な6Dオブジェクトのポーズ推定を要求する。
本稿では,適応的かつ高精度な量子化学習戦略であるMQAT(Modular Quantization-Aware Training)を紹介する。
MQATは、モジュール固有のビット精度を導出し、モジュール固有の量子化シーケンスを導出し、最先端の均一および混合精度の量子化技術によって生成されたものより優れた量子化モデルをもたらす。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 01:17:18 GMT)
Driving into the Future: Multiview Visual Forecasting and Planning with
World Model for Autonomous Driving [56.4] Drive-WMは、既存のエンド・ツー・エンドの計画モデルと互換性のある世界初のドライビングワールドモデルである。
ドライビングシーンで高忠実度マルチビュー映像を生成する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:59:47 GMT)
Loose lips sink ships: Mitigating Length Bias in Reinforcement Learning
from Human Feedback [55.8] 人間のフィードバックからの強化学習は、大きな言語モデルと人間と社会的価値を整合させる重要な橋として機能する。
報酬モデルが意図した目的を回避できるショートカットを見つけることがよくあります。
本稿では、報酬モデリングとシーケンス長の影響を分離するために、Product-of-Experts技術を適用した革新的なソリューションを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:45:53 GMT)
Is Inverse Reinforcement Learning Harder than Standard Reinforcement
Learning? [55.4] 逆強化学習(逆強化学習、英: Inverse Reinforcement Learning、英: Inverse Reinforcement Learning、英: Inverse Reinforcement Learning)は、インテリジェントシステム開発において重要な役割を担う。
本報告では, オフラインおよびオンライン環境におけるIRLの有効利用について, サンプルを用いて検討した。
アプリケーションとして、学習した報酬関数が適切な保証で他のターゲットMDPに転送可能であることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 00:09:01 GMT)
DeepSpeed-VisualChat: Multi-Round Multi-Image Interleave Chat via
Multi-Modal Causal Attention [55.3] DeepSpeed-VisualChatは、マルチモーダル機能を組み込むことで、LLM(Large Language Models)を最適化するように設計されている。
筆者らのフレームワークは,(1)マルチラウンド・マルチイメージ対話のオープンソースサポート,(2)革新的なマルチモーダル因果注意機構の導入,(3)既存のデータセットにデータブレンディング技術を活用してシームレスな対話を実現すること,などが特徴である。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:52:18 GMT)
Algorithmic Persuasion Through Simulation: Information Design in the Age
of Generative AI [55.0] 生成AIが経済エージェントをシミュレートできることを示す研究によって動機付けられ、私たちはオラクルを用いて情報デザインを研究する。
我々は,受信者の信念に先立って,送信者が2階に先行するベイズ的説得について検討する。
技術的貢献として、問い合わせが受信者の知識を定量化するために使用できる受信者の信念の空間の分割を形成することを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 23:01:33 GMT)
One-Shot Open Affordance Learning with Foundation Models [54.2] 私たちは、モデルがベースオブジェクトカテゴリ毎に1つの例でトレーニングされる、ワンショットのオープンアフォーダンスラーニング(OOAL)を紹介します。
本稿では,視覚的特徴と手頃なテキスト埋め込みとの整合性を高める,シンプルで効果的な設計の視覚言語フレームワークを提案する。
2つのアベイランスセグメンテーションのベンチマーク実験により、提案手法はトレーニングデータの1%未満で最先端のモデルより優れていることが示された。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:23:06 GMT)
Diffusion Glancing Transformer for Parallel Sequence to Sequence
Learning [52.7] モーダリティ拡散プロセスと残差グランシングサンプリングを併用した拡散グランシング変換器を提案する。
DIFFGLATは、自己回帰モデルと非自己回帰モデルの両方と比較して、高速な復号速度を維持しながら、より優れた生成精度を実現する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:30:34 GMT)
DiffInDScene: Diffusion-based High-Quality 3D Indoor Scene Generation [52.6] DiffInDSceneは高品質な屋内シーン生成問題に取り組むための新しいフレームワークである。
KinectFusionのインクリメンタルアライメントとローカルTSDFボリュームの融合に着想を得て,拡散型SDF融合法を提案する。
生成した結果から,3次元空間で高品位な部屋生成を実現することが可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 03:55:48 GMT)
Discovering Failure Modes of Text-guided Diffusion Models via
Adversarial Search [52.5] テキスト誘導拡散モデル(TDM)は広く応用されているが、予期せず失敗することがある。
本研究は,TDMの障害モードについて,より詳細に研究し,理解することを目的としている。
本稿では,TDM上での最初の逆探索手法であるSAGEを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:50:06 GMT)
19 Parameters Is All You Need: Tiny Neural Networks for Particle Physics [52.4] 本稿では,ローレンツ型および置換対称型アーキテクチャPELICANの低遅延ニューラルネットワークへの応用の可能性を示す。
トップクォークジェットタグのバイナリ分類タスクと比較すると,最大19のトレーニング可能なパラメータで,数万のパラメータでジェネリックアーキテクチャを上回る性能を示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 22:13:24 GMT)
BAND-2k: Banding Artifact Noticeable Database for Banding Detection and
Quality Assessment [52.2] バンディングは階段のような輪郭としても知られ、圧縮または量子化アルゴリズムによって処理された画像やビデオの平坦な領域で頻繁に発生する。
これまでに2000枚のバンド化画像からなるBanding Artifact Noticeable Database (BAND-2k) という,最大のBanding IQAデータベースを構築した。
デュアル畳み込みニューラルネットワークを用いて、高周波および低周波マップから特徴表現を同時に学習する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:56:31 GMT)
Language Models: A Guide for the Perplexed [51.9] このチュートリアルは、言語モデルを学ぶ人と、興味を持ち、もっと学びたいと思う人とのギャップを狭めることを目的としています。
実験を通して学ぶことができる質問に焦点を当てた科学的視点を提供する。
言語モデルは、現在、その開発に繋がる研究の文脈に置かれています。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 01:19:02 GMT)
TaskWeaver: A Code-First Agent Framework [51.8] TaskWeaverは、LLMで動く自律エージェントを構築するためのコードファーストフレームワークとして提案されている。
ユーザ要求を実行可能なコードに変換し、ユーザ定義プラグインを呼び出し可能な関数として扱う。
リッチなデータ構造、フレキシブルなプラグイン利用、動的プラグイン選択のサポートを提供する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:23:42 GMT)
MagicBrush: A Manually Annotated Dataset for Instruction-Guided Image
Editing [51.7] MagicBrushは、命令誘導の実画像編集のための、手動で手動の大規模データセットである。
人による評価により,新しいモデルによりより優れた画像が生成できることが示される。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:59:11 GMT)
Improving embedding of graphs with missing data by soft manifolds [51.4] グラフ埋め込みの信頼性は、連続空間の幾何がグラフ構造とどの程度一致しているかに依存する。
我々は、この問題を解決することができる、ソフト多様体と呼ばれる新しい多様体のクラスを導入する。
グラフ埋め込みにソフト多様体を用いることで、複雑なデータセット上のデータ解析における任意のタスクを追求するための連続空間を提供できる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:48:33 GMT)
NeISF: Neural Incident Stokes Field for Geometry and Material Estimation [50.6] 多視点逆レンダリングは、異なる視点で撮影された一連の画像から形状、材料、照明などのシーンパラメータを推定する問題である。
本稿では,偏光手がかりを用いた曖昧さを低減する多視点逆フレームワークNeISFを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:22:11 GMT)
ChatIllusion: Efficient-Aligning Interleaved Generation ability with
Visual Instruction Model [50.3] MLLM(Advanced Generative Multimodal Large Language Model)であるChatIllusionを紹介する。
ChatIllusionは、安定拡散XLとLlamaを統合している。
ChatIllusionの中心的なコンポーネントは"GenAdapter"である。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:30:33 GMT)
Arabic Sentiment Analysis with Noisy Deep Explainable Model [48.2] 本稿では,アラビア語の感情分類フレームワークを提案する。
提案フレームワークは,局所的な代理説明可能なモデルをトレーニングすることで,特定の予測を説明することができる。
アラビアサデータセットの公開ベンチマーク実験を行った。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:52:58 GMT)
DSS: Synthesizing long Digital Ink using Data augmentation, Style
encoding and Split generation [47.9] このタスクでよく使われるモデルは、長文データへの一般化に失敗することを示す。
これらの手法は対照的な学習技法を用いており、特に筆跡領域に特化している。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:33:19 GMT)
Cross-Scope Spatial-Spectral Information Aggregation for Hyperspectral
Image Super-Resolution [47.1] 超高分解能超高分解能画像の長距離空間およびスペクトル類似性を調べるために,新しいクロススコープ空間スペクトル変換器(CST)を提案する。
具体的には,長距離空間スペクトル特性を包括的にモデル化するために,空間次元とスペクトル次元のクロスアテンション機構を考案する。
3つの超スペクトルデータセットに対する実験により、提案したCSTは他の最先端手法よりも定量的にも視覚的にも優れていることが示された。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 03:38:56 GMT)
DSText V2: A Comprehensive Video Text Spotting Dataset for Dense and
Small Text [46.2] 我々は,DSText V2というビデオテキスト読解ベンチマークを構築し,DenseとSmallテキスト読解の課題に焦点を当てた。
提案したデータセットは、以前のデータセットと比較すると、主に3つの新しい課題を含んでいる。
ビデオのぼやけや歪みと相まって、高頻度の小さなテキストは、さらなる課題をもたらすだろう。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:13:27 GMT)
Real-time error mitigation for variational optimization on quantum
hardware [45.9] VQCを用いた量子チップ上の関数の適合を支援するために,RTQEM(Real Time Quantum Error Mitigation)アルゴリズムを定義する。
我々のRTQEMルーチンは、損失関数の破損を減らすことにより、VQCのトレーニング性を向上させることができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:48:13 GMT)
ChatTraffic: Text-to-Traffic Generation via Diffusion Model [45.8] 従来の交通予測手法は、交通トレンドを予測するために、過去の交通データに依存している。
本研究では,交通システムを記述するテキストと生成モデルを組み合わせることで,交通生成にどのように応用できるかを考察する。
本稿では,テキスト・トラフィック生成のための最初の拡散モデルChatTrafficを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 01:53:46 GMT)
GaussianShader: 3D Gaussian Splatting with Shading Functions for
Reflective Surfaces [45.2] 反射面を持つシーンにおけるニューラルレンダリングを強化するために, 簡易シェーディング機能を3次元ガウスに応用する新しい手法を提案する。
実験の結果、ガウシアンシェーダーは効率と視覚的品質のバランスを保っていることがわかった。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:22:26 GMT)
Emergence of noise-induced barren plateaus in arbitrary layered noise
models [45.0] 変分量子アルゴリズムでは、パラメータ化された量子回路のパラメータは、問題の解を符号化するコスト関数を最小限に抑えるために最適化される。
層状雑音モデルを用いたパラメータ化量子回路において,ノイズ誘起バレンプラトー現象がどのように出現するか,その意味について論じる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:40:35 GMT)
Beyond Invariance: Test-Time Label-Shift Adaptation for Distributions
with "Spurious" Correlations [45.0] テスト時のデータ分散の変化は、予測モデルのパフォーマンスに有害な影響を及ぼす可能性がある。
本研究では,未ラベルサンプルに適用したEMを用いて,共同分布の$p(y, z)$の変化に適応するテストタイムラベルシフト補正を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:42:18 GMT)
Erasing the Ephemeral: Joint Camera Refinement and Transient Object
Removal for Street View Synthesis [44.9] 本研究では,屋外シナリオにおけるビュー合成の課題に対処する手法を提案する。
我々はニューラルポイント光のシーン表現を採用し、動的物体を戦略的に検出・マスクアウトし、アーティファクトなしで新しいシーンを再構築する。
都市景観の新たなビューを合成する上での最先端の成果を実証する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:51:12 GMT)
An Interventional Perspective on Identifiability in Gaussian LTI Systems
with Independent Component Analysis [44.9] ガウス線形時間不変 (LTI) システムでは, 多様な干渉信号を導入することで, システムパラメータを同定できることが示されている。
隠れマルコフモデルと(ガウス) LTI 系が連続パラメータを持つコーサル・デ・フィネッティの定理を一般化することを示した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:51:35 GMT)
Focus on Query: Adversarial Mining Transformer for Few-Shot Segmentation [44.8] Few-shot segmentation (FSS) は、注釈付きサンプルのみを与えられた新しいカテゴリのオブジェクトを分割することを目的としている。
我々は新しいクエリ中心FSSモデルAdrial Mining Transformer (AMFormer)を提案する。
AMFormerは、粗いサポートガイダンスや弱いサポートラベルだけで、正確なクエリイメージセグメンテーションを実現する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:39:18 GMT)
Weakly-Supervised Emotion Transition Learning for Diverse 3D Co-speech
Gesture Generation [44.3] 本稿では,仮想アバターにおける鮮明で感情的な3次元音声合成手法を提案する。
本稿ではまず,ChatGPT-4と音声インペインティング手法を用いて,高忠実度感情遷移音声の構築を行う。
また,権威のジェスチャー移行を促進するために,弱教師付きトレーニング戦略を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:10:40 GMT)
Latent Alignment with Deep Set EEG Decoders [44.1] 本稿では,脳波伝達学習大会のベンチマークで優勝した潜在アライメント手法を紹介する。
我々は,その定式化を,与えられた被験者の試行セットに適用したディープセットとして提示する。
実験の結果,深層学習モデルにおける後段の統計的分布アライメントの実行は,分類精度に有益であることが示唆された。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:40:45 GMT)
Improving the Robustness of Transformer-based Large Language Models with
Dynamic Attention [44.0] BERTやGPTといったトランスフォーマーベースのモデルは、自然言語処理(NLP)において広く採用されている。
近年の研究では、テキスト入力を意図的に操作することで、モデルの出力を誤認できるような、テキストの敵対攻撃に対する脆弱性が示されている。
本稿では,トランスアーキテクチャに適した動的アテンション(動的アテンション)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:09:13 GMT)
Most discriminative stimuli for functional cell type identification [43.9] 網膜では、機能型は慎重に選択された刺激によって識別できるが、これは専門的なドメイン知識を必要とする。
視覚野では、どのような機能型が存在するのか、どのように識別するかはまだ分かっていない。
本稿では,ニューロンの機能的クラスタを得るために,深部予測モデルを用いた最適化に基づくクラスタリング手法を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:58:42 GMT)
SVDinsTN: A Tensor Network Paradigm for Efficient Structure Search from
Regularized Modeling Perspective [43.7] ネットワーク(TN)表現はコンピュータビジョンと機械学習の強力な技術である。
TN構造探索(TN-SS)は、コンパクトな表現を実現するためにカスタマイズされた構造を探すことを目的としている。
SVD-インスパイアされたTN分解(SVDinsTN)と呼ばれる新しいTNパラダイムを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:34:36 GMT)
MarkovGen: Structured Prediction for Efficient Text-to-Image Generation [43.7] マルコフランダム場(MRF)モデルを用いて、画像の異なる領域間の互換性を実現するための軽量なアプローチを提案する。
MRFによる推論は非常に安価で、そのパラメータはバックプロパゲーションによって素早く学習することができる。
私たちのフルモデルであるMarkovGenは、提案したMRFモデルを使用して、Museを1.5倍高速化し、望ましくない画像アーティファクトを減らして高品質な画像を生成する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 22:39:40 GMT)
Do text-free diffusion models learn discriminative visual
representations? [43.1] 本稿では,タスクの両ファミリーを同時に扱うモデルである統一表現学習者の可能性について検討する。
生成タスクの最先端手法である拡散モデル(拡散モデル)を素数候補として開発する。
拡散モデルはGANよりも優れており、融合とフィードバック機構により、差別的タスクのための最先端の教師なし画像表現学習手法と競合することができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:59:59 GMT)
Improving Faithfulness for Vision Transformers [42.9] ビジョントランスフォーマー(ViT)は、様々なビジョンタスクに対して最先端のパフォーマンスを達成した。
ViTは、彼らの焦点が敵の攻撃に対して脆弱であるため、説明の忠実さに関する問題に悩まされる。
本稿では、Fithful ViTs(FViTs)を導入してこれらの問題を緩和するための厳格なアプローチを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:51:21 GMT)
Intelligent Robotic Sonographer: Mutual Information-based Disentangled
Reward Learning from Few Demonstrations [42.7] この研究は、インテリジェントなロボットソノグラフィーによって、自律的に標的解剖を発見」し、専門家から学ぶことによって、米国のプローブを関連する2D平面にナビゲートすることを提案する。
専門家による基礎となる高レベルの生理的知識は神経報酬関数によって推測される。
提案した高度なフレームワークは、生き生きとしたヒトの頸動脈データだけでなく、さまざまな幻影や見えない幻影を強く扱うことができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:11:49 GMT)
Understanding and Improving In-Context Learning on Vision-language
Models [42.7] In-context Learning (ICL) on large language model (LLMs) に大きな注目を集めており、この手法は視覚言語モデル (VLMs) に適用できる。
本研究では,視覚情報と言語情報の両方の重要性について検討する。
我々は、Mixed Modality In-Context Example Selection (MMICES)と呼ばれるシンプルだが効果的なアプローチを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:08:11 GMT)
HumanNorm: Learning Normal Diffusion Model for High-quality and
Realistic 3D Human Generation [41.8] 我々は,高品質でリアルな3Dヒューマンジェネレーションのための新しいアプローチであるHumanNormを提案する。
モデルの主な考え方は、正規適応拡散モデルと正規整合拡散モデルを学ぶことによって、3次元幾何学の2次元知覚を強化することである。
HumanNormは、テクスチャとテクスチャの質の両方において、既存のテキストから3Dメソッドよりも優れています。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:23:33 GMT)
Contextualized Policy Recovery: Modeling and Interpreting Medical
Decisions with Adaptive Imitation Learning [41.4] 解釈可能な政策学習は、観察された行動から無知な決定ポリシーを推定しようとする。
既存のモデルは、正確性と解釈可能性の間のトレードオフを強制することによって、不足する。
本稿では,複雑な意思決定プロセスのモデル化の問題を再検討する文脈的政策回復(CPR)を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:52:48 GMT)
Implicit-explicit Integrated Representations for Multi-view Video
Compression [40.9] マルチビュービデオ圧縮のための暗黙的・明示的統合表現を提案する。
提案するフレームワークは,暗黙的なニューラル表現と明示的な2Dデータセットの長所を組み合わせたものだ。
提案するフレームワークは,最新のマルチビュービデオ圧縮標準MIVに匹敵する,あるいはさらに優れた性能を実現することができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 04:15:57 GMT)
GeoAdapt: Self-Supervised Test-Time Adaptation in LiDAR Place
Recognition Using Geometric Priors [40.4] ディープラーニングに基づくLiDAR位置認識アプローチは、トレーニングデータセットとテストデータセットの分布にシフトがある場合、大幅なパフォーマンス低下に悩まされる。
そこで,GeoAdaptは,未知の環境の再学習のための擬似ラベルを自己教師型で生成するための,新たな補助的分類ヘッドを提案する。
GeoAdaptは、適度なドメインシフトから厳しいドメインシフトにおける位置認識性能を大幅に向上させ、完全に教師付きテスト時間適応アプローチと競合する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:07:32 GMT)
Multi-turn Response Selection using Dialogue Dependency Relations [40.0] マルチターン応答選択は対話エージェントを開発するために設計されたタスクである。
本稿では,対話履歴を依存関係に基づいてスレッドに変換する対話抽出アルゴリズムを提案する。
我々のモデルは、D7とDSTC8*の両方で最先端のベースラインを上回り、Ubuntu上での競合的な結果です。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:54:21 GMT)
Two Scalable Approaches for Burned-Area Mapping Using U-Net and Landsat
Imagery [39.9] 本研究では,U-Netモデルに基づくバーン・エリアマッピングプロセスの自動化と最適化のための2つのアプローチを提案する。
研究領域の195の代表的な画像に基づくテストでは、ASモデルを用いたデータセットのバランスの向上により、より良いパフォーマンスが得られることが示された。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:42:25 GMT)
GenZI: Zero-Shot 3D Human-Scene Interaction Generation [39.9] 我々は3次元人間とシーンの相互作用を生成するための最初のゼロショットアプローチであるGenZIを提案する。
GenZIの鍵となるのは、大きな視覚言語モデル(VLM)による相互作用先行の蒸留です。
既存の学習ベースのアプローチとは対照的に、GenZIはキャプチャされた3Dインタラクションデータに対する従来のニーズを回避している。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:40:11 GMT)
Analyzing and Explaining Image Classifiers via Diffusion Guidance [39.9] ディープラーニングは、ImageNetのような複雑な画像分類タスク、予期せぬ障害モード、例えばスプリアス機能などに大きな進歩をもたらした。
本稿では、ガイド画像生成のためのフレームワークを用いて、分類器由来の目的を最適化した画像を生成することにより、これらの問題に対処する。
視覚的対実的説明(VCE)による画像分類器の動作と決定、分類器が最大に一致しない画像の解析による系統的誤りの検出、潜在的な刺激的特徴の検証のためのニューロンの可視化について分析する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:35:29 GMT)
Invisible Women in Digital Diplomacy: A Multidimensional Framework for
Online Gender Bias Against Women Ambassadors Worldwide [39.7] 本稿では,ソーシャルメディア上での女性の外交官の扱いに関する世界的分析について紹介する。
それは、性的な言語、外交官に向けられたツイートにおける否定性、女性外交官の可視性という3つの重要な要素に焦点を当てている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:39:58 GMT)
Echoes in the Noise: Posterior Samples of Faint Galaxy Surface
Brightness Profiles with Score-Based Likelihoods and Priors [39.6] 画像デコンボリューションのベイズ解析を行うために,近年のスコアベース確率推定モデルと拡散モデルを組み合わせたフレームワークを提案する。
EmphHubble Space Telescope(emphHST)データに適用されたこの手法は、次世代のEmphJames Webb Space Telescope(emphJWST)イメージングでしか見えない構造を復元する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:00:03 GMT)
AutArch: An AI-assisted workflow for object detection and automated
recording in archaeological catalogues [39.6] 我々のソフトウェアは、オブジェクト検出ニューラルネットワークとさらなる分類ネットワークを組み合わせて、レガシーリソースからのデータ収集をスピードアップし、自動化し、標準化します。
AI支援ワークフローは、墓、骨格、陶器、装飾品、石器、地図など、考古学的カタログにある一般的な物体を検出する。
手では達成できないランドマークに基づく幾何学的形態計測の代替として,輪郭検出による幾何学的全体アウトラインを記録する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:24:04 GMT)
Wireless Network Digital Twin for 6G: Generative AI as A Key Enabler [39.3] 本稿では、メッセージレベルとポリシーレベルの両方で、階層的生成型AI対応無線ネットワークディジタルツインを提案する。
6G時代の無線ネットワークディジタル双生児のオープンな研究課題について論じる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:48:26 GMT)
Discovering Predictable Latent Factors for Time Series Forecasting [39.1] 我々は,観測可能な時系列によって示唆される本質的な潜伏因子を推定するための新しい枠組みを開発する。
予測可能性,充足性,識別性という3つの特性を導入し,これらの特性を強力な潜伏力学モデルを用いてモデル化する。
複数の実データに対する実験結果から, 時系列予測の手法の有効性が示唆された。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:44:00 GMT)
DreamSync: Aligning Text-to-Image Generation with Image Understanding
Feedback [38.8] テキスト・ツー・イメージ・モデル(T2I)は、ユーザの入力テキストに対して審美的で忠実なイメージを作成するのに依然として苦労している。
本稿では,テキスト入力に忠実なT2Iモデルを改善する設計によるモデルに依存しないトレーニングアルゴリズムであるDreamSyncを紹介する。
その単純さにもかかわらず、DreamSyncは2つの拡散ベースのT2Iモデルのセマンティックアライメントと美的魅力の両方を改善している。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 03:42:16 GMT)
W-HMR: Human Mesh Recovery in World Space with Weak-supervised Camera
Calibration and Orientation Correction [38.7] 我々は,W-HMRを提案する。W-HMRは,大域的な身体回復をカメラキャリブレーション,局所的な身体回復,大域的な身体配向補正に分解する。
我々は、焦点距離ラベルへの依存をなくし、身体の歪みを抑えるための第1の弱教師付きカメラキャリブレーション法を設計する。
本研究では,再建された人体が世界空間で正常に保たれるような新しい配向補正モジュールを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:02:07 GMT)
Privacy Measurement in Tabular Synthetic Data: State of the Art and
Future Research Directions [38.1] 合成データ(SD)はプライバシー向上技術として注目されている。
プライバシー保護の程度を定量化する基準はない。
本稿では,提案手法の定量化について論じる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:51:40 GMT)
Continual Learning for Image Segmentation with Dynamic Query [38.1] インクリメンタル・ダイナミック・クエリー(CISDQ)を用いた簡易かつ効果的な連続画像法を提案する。
CISDQは、軽量なクエリ埋め込みによって、古い知識と新しい知識の両方を分離する。
2つのタスクのための3つのデータセットの実験を行い、CISDQが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:46:46 GMT)
Identifying and Mitigating Vulnerabilities in LLM-Integrated
Applications [37.3] LLM統合アプリケーションのバックエンドとして,大規模言語モデル(LLM)がますます多くデプロイされている。
本研究では,ユーザとLLMがLLM統合アプリケーションを介して,中間で対話する環境について考察する。
悪意のあるアプリケーション開発者や外部からの脅威から生じる可能性のある潜在的な脆弱性を特定します。
我々は、内部の脅威と外部の脅威の両方を緩和する軽量で脅威に依存しない防御を開発する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 03:43:03 GMT)
A quasi-polynomial time algorithm for Multi-Dimensional Scaling via LP
hierarchies [37.3] 多次元スケーリング(MDS)は、$n$オブジェクト間のペアワイドな相似性を低次元空間に埋め込む方法のファミリーである。
準多項式依存のMDSに対する最初の近似アルゴリズムは$Delta$である。
我々の分析は、低次元ユークリッド空間の幾何学を利用して、アスペクト比$Delta$への指数的依存を避けることができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:42:05 GMT)
The Falcon Series of Open Language Models [36.9] さまざまな高品質コーパスで訓練された因果デコーダのみのモデルとして,7B,40B,180Bというファルコンシリーズを紹介した。
最大のモデルであるFalcon-180Bは3.5兆個のテキストトークンで訓練されている。
Falcon-180B は PaLM や Chinchilla などのモデルよりも優れており、LLaMA 2 や Inflection-1 のような同時開発モデルでも改善されている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:45:10 GMT)
SigFormer: Sparse Signal-Guided Transformer for Multi-Modal Human Action
Segmentation [36.7] 信号誘導変換器(SigFormer)を導入し,高密度信号とスパース信号を組み合わせた。
スパース信号は離散的であるため、時間的作用境界に関する十分な情報がない。
SigFormerは、実産業環境からのマルチモーダルアクションセグメンテーションデータセットにおける最先端のアプローチよりも優れています。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:09:01 GMT)
Query-Relevant Images Jailbreak Large Multi-Modal Models [36.4] 我々は、クエリ関連画像を利用して、オープンソースのLMMをジェイルブレイクする新しい視覚的プロンプトアタックを提案する。
本手法は,拡散モデルにより生成された画像と,テキストをタイポグラフィとして表示する画像から合成画像を生成する。
大規模言語モデルが安全に一致していても, LLM は我々のアプローチによって容易に攻撃できることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:49:45 GMT)
Continual Self-supervised Learning: Towards Universal Multi-modal
Medical Data Representation Learning [36.3] 自己教師付き学習は、医用画像解析のための効率的な事前学習方法である。
マルチモーダル医療データに対する継続的自己教師型学習手法であるMedCoSSを提案する。
我々は、大規模マルチモーダルなラベルなしデータセット上で、継続的自己教師付き事前学習を行う。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:47:42 GMT)
Bayesian Imaging for Radio Interferometry with Score-Based Priors [36.1] 提案手法は, 未特定銀河であるにもかかわらず, 可塑性後部試料を作製することを示す。
提案手法は既存の電波干渉画像アルゴリズムと競合する結果が得られることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:01:05 GMT)
Navigating Cultural Chasms: Exploring and Unlocking the Cultural POV of
Text-To-Image Models [36.0] 本稿では,3つの階層(文化次元,文化領域,文化概念)にまたがる文化を特徴付けることによって,テキスト・トゥ・イメージ・モデルに埋め込まれた文化的知覚を探求する。
本稿では,CLIP空間を用いた内在的評価,ビジュアルクエスト・アンサー(VQA)モデルによる外在的評価,人的評価など,総合的な評価手法を提案する。
我々の実験は、TTIモデルにおける文化的エンコーディングの性質について、Do、What、What、Howおよび研究に関する洞察を提供し、異文化的な応用への道を開いた。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:11:02 GMT)
SpeechAct: Towards Generating Whole-body Motion from Speech [35.5] 本稿では,音声から全身の動きを生成する問題に対処する。
本稿では,高精度かつ連続的な動き生成を実現するために,新しいハイブリッド・ポイント表現を提案する。
また,モデルがより独特な表現を生成することを奨励するコントラッシブ・モーション・ラーニング手法を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:57:30 GMT)
The Devil is in the Data: Learning Fair Graph Neural Networks via
Partial Knowledge Distillation [35.2] グラフニューラルネットワーク(GNN)は、多くのハイテイクタスクでますます利用されている。
GNNは特定の人口集団に対して差別的な決定をする傾向があるため、不公平であることが示されている。
本稿では,知識蒸留,すなわちFairGKDを用いて,公正なGNNを学習するための人口統計学的手法を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:54:58 GMT)
Uncertainty in Additive Feature Attribution methods [34.8] 本稿では,付加的特徴帰属説明法のクラスに焦点をあてる。
特徴の属性と不確実性との関係を考察し,相関関係をほとんど観察しない。
このようなインスタンスに対して"stable instance"という用語を作り、インスタンスを安定させる要因を診断します。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:40:46 GMT)
DisCGen: A Framework for Discourse-Informed Counterspeech Generation [34.8] 本稿では,言論理論に基づく枠組みを提案し,反声と憎しみのあるコメントを結びつける推論リンクについて検討する。
本稿では,Reddit から現在地にある反音声のデータセットを収集するプロセスを提案する。
提案するデータセットとフレームワークを用いて,大規模言語モデルを用いて,談話理論に基づいて文脈的に接地した対音声を生成することができることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 23:20:17 GMT)
Towards Higher Ranks via Adversarial Weight Pruning [34.6] 逆方向のスパース重みのランクを維持するために,ランクベースのPruninG(RPG)手法を提案する。
RPGは、ResNet-50のImageNetで1.13%の精度で最先端のパフォーマンスを98%で上回っている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:04:39 GMT)
Spectral and Polarization Vision: Spectro-polarimetric Real-world
Dataset [34.5] 三色Stokes画像と高スペクトルStokes画像の2つの分光偏光モデルを提案する。
提案したデータセットは、データ駆動分光偏光分光画像と視覚研究の基礎を約束する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 06:53:23 GMT)
PillarNeSt: Embracing Backbone Scaling and Pretraining for Pillar-based
3D Object Detection [33.0] 柱型3次元物体検出器における2次元バックボーンスケーリングと事前学習の有効性を示す。
提案する柱型検出器であるPillarNeStは、既存の3Dオブジェクト検出器よりも、nuScenesとArgoversev2データセットのマージンが大きい。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:11:33 GMT)
FisherRF: Active View Selection and Uncertainty Quantification for
Radiance Fields using Fisher Information [32.7] 本研究では、放射場領域におけるアクティブビュー選択と不確実性定量化の問題に対処する。
NeRFは画像のレンダリングと再構成が大幅に進歩しているが、2D画像の可用性の限界は不確かである。
水産情報を活用することにより,地上の真理データを使わずに,レージアンスフィールド内の観測情報を効率的に定量化する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:20:16 GMT)
Unsupervised Keypoints from Pretrained Diffusion Models [32.5] 我々は、テキストから画像への拡散モデルにおける創発的な知識を、より堅牢な教師なしキーポイントに活用する。
私たちの中核となる考え方は、生成モデルが画像のコンパクトな領域に一貫して従う原因となるテキスト埋め込みを見つけることです。
CelebA、CUB-200-2011、Tai-Chi-HD、DeepFashion、Human3.6mのデータセットでパフォーマンスを検証する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:43:38 GMT)
Unified Binary and Multiclass Margin-Based Classification [32.2] 本稿では,多くの人気関数を含む多クラス損失関数を,相対的マージン形式で表現できることを示す。
次に、Fenchel-Young の損失のクラスを分析し、これらの損失の集合を分類校正(class-calibrated)として拡張する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:24:32 GMT)
Look Before You Leap: Unveiling the Power of GPT-4V in Robotic
Vision-Language Planning [32.0] 本稿では,ロボットビジョン・ランゲージ計画(ViLa)について紹介する。
ViLaは、知覚データを推論と計画プロセスに直接統合する。
実ロボットとシミュレーション環境の両方で実施した評価は,既存のLCMプランナよりもViLaの方が優れていることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:46:25 GMT)
A Trichotomy for Transductive Online Learning [32.0] 我々は,Ben-David, Kushilevitz, Mansour (1997) のオンライン学習環境における学習者の誤り数に関する,新たな上限と下限を提示する。
この設定は標準的なオンライン学習と似ているが、敵はゲームの開始時にラベル付けされる一連のインスタンスを修正し、このシーケンスは学習者に知られている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 23:37:43 GMT)
Fair Text-to-Image Diffusion via Fair Mapping [32.0] 本稿では,事前訓練されたテキスト・ツー・イメージ・モデルに対して,公平な画像生成を実現するプロンプトを制御することによって,汎用的でモデルに依存しない軽量なアプローチを提案する。
まず,テキスト誘導拡散モデルにおける言語バイアスによる生成結果のバイアス問題を示す。
提案手法は,人間の顔に関する記述を刺激することで,画像生成性能を著しく向上することを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:02:01 GMT)
Taiwan LLM: Bridging the Linguistic Divide with a Culturally Aligned
Language Model [31.7] 本稿では,台湾のLLM(Large Language Model)について紹介する。
我々は,伝統的な中国語の複雑さだけでなく,台湾の文化的文脈を具現化したモデルを開発した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:48:34 GMT)
Zooming Out on Zooming In: Advancing Super-Resolution for Remote Sensing [31.4] リモートセンシングのための超解像は、惑星の監視に大きな影響を与える可能性がある。
多くの注意を払っているにもかかわらず、いくつかの矛盾や課題により、実際にデプロイされるのを妨げている。
この研究は、従来の測定値よりも人間の判断にはるかによく対応している、超高解像度のCLIPScoreのための新しい測定基準を示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:06:45 GMT)
Contrastive Vision-Language Alignment Makes Efficient Instruction
Learner [31.3] 本研究では,大規模言語モデル(LLM)を視覚言語命令追従モデルに拡張する作業について検討する。
既存の方法では、視覚アダプタを訓練して、前訓練された視覚変換器(ViT)とLLMの間の表現を、生成的な画像キャプション損失によって整列させるのが一般的である。
比較的および生成的アライメントの目的を適用し, ViT と LLM の表現を効果的に整合させる CG-VLM を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 03:29:46 GMT)
Probabilistic Copyright Protection Can Fail for Text-to-Image Generative
Models [31.2] 我々は,新しいオンラインアタックフレームワークであるVirtually Assured Amplification Attack (VA3)を紹介する。
VA3は、生成モデルとの持続的な相互作用において、侵害するコンテンツを生成する確率を増幅する。
提案手法の有効性を理論的および実験的に検証した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:10:00 GMT)
TimeBench: A Comprehensive Evaluation of Temporal Reasoning Abilities in
Large Language Models [31.1] 階層的時間的推論ベンチマークであるTimeBenchを提案する。
TimeBenchは、大規模な言語モデルの時間的推論能力を調べるための徹底的な評価を提供する。
実験結果から, 最先端のLDMと人間の間には, 顕著な性能差があることが示唆された。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:30:16 GMT)
Enhancing the Performance of Neural Networks Through Causal Discovery
and Integration of Domain Knowledge [30.7] 本研究では,観測変数間の階層的因果構造をニューラルネットワークに符号化し,予測性能を向上させる手法を開発した。
提案手法は、因果性インフォームドニューラルネットワーク(CINN)と呼ばれ、構造因果的知識をニューラルネットワークの層間設計にマッピングする3つのコヒーレントなステップを活用する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 01:25:00 GMT)
Non-Visible Light Data Synthesis and Application: A Case Study for
Synthetic Aperture Radar Imagery [30.6] 非可視光領域における安定拡散やイメージnのような大規模事前学習画像生成モデルの「隠れ」能力について検討する。
2段階の低ランク適応法を提案し,これを2LoRAと呼ぶ。
第1段階では、構造がSARと一致する空中視正則画像データを用いてモデルを適応させ、続いて第1段階からのベースモデルをSARモダリティデータによりさらに適応させる第2段階とする。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:48:01 GMT)
Accelerating Neural Field Training via Soft Mining [30.1] 本稿では,サンプリング位置を効率よく選択することで,ニューラルネットワークの訓練を加速する手法を提案する。
そこで本研究では,重要サンプリングに基づくソフトマイニング技術により,コンバージェンスの改善と最終トレーニング品質の実現が可能であることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 23:48:46 GMT)
CADS: Unleashing the Diversity of Diffusion Models through
Condition-Annealed Sampling [29.8] Condition-Annealed Diffusion Sampler (CADS) は任意の事前学習モデルとサンプリングアルゴリズムで使用することができる。
本研究では,様々な条件生成タスクにおける拡散モデルの多様性を向上することを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:55:37 GMT)
DPSUR: Accelerating Differentially Private Stochastic Gradient Descent
Using Selective Update and Release [29.8] 本稿では,Selective Updates and Releaseに基づく差分プライベートトレーニングフレームワークを提案する。
主な課題は、プライバシに関する懸念と、モデル更新のための勾配選択戦略の2つの側面にある。
MNIST,FMNIST, CIFAR-10, IMDBデータセットを用いて行った実験により, DPSURは収束速度において従来よりも大幅に優れていたことがわかった。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:43:45 GMT)
Maximum Entropy Model Correction in Reinforcement Learning [29.6] 本稿では,強化学習における近似モデルを用いた計画手法の提案と理論的解析を行う。
モデル補正値イテレーション(MoCoVI)アルゴリズムとそのサンプルベース変種MoCoDynaを紹介する。
従来のモデルベースアルゴリズムとは異なり、MoCoVIとMoCoDynaは近似モデルを有効に利用し、依然として正しい値関数に収束する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:00:41 GMT)
RSPrompter: Learning to Prompt for Remote Sensing Instance Segmentation
based on Visual Foundation Model [29.4] 本稿では,Segment Anything Model (SAM) のための適切なプロンプトの生成を学習する手法を提案する。
これによりSAMはリモートセンシング画像に対して意味的に識別可能なセグメンテーション結果を生成することができる。
また,SAMコミュニティ内での最近の進歩を図り,その性能をRSPrompterと比較する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:47:59 GMT)
VITATECS: A Diagnostic Dataset for Temporal Concept Understanding of
Video-Language Models [28.5] VITATECS, 診断用VIdeo-Text dAtasetについて述べる。
まず、異なる時間的側面を理解するためのVidLMの能力を診断するために、自然言語における時間的概念のきめ細かい分類法を導入する。
特定の時間的側面においてのみ、オリジナルと異なる反実的な映像記述を生成する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:15:34 GMT)
LLM-State: Expandable State Representation for Long-horizon Task
Planning in the Open World [28.4] 本研究では,Large Language Model (LLM) を用いたオープンワールド家庭環境における長期タスクプランニングの問題に対処する。
既存の作業は、キーオブジェクトと属性を明示的に追跡することができない。
本稿では,オブジェクト属性の連続的な拡張と更新を提供する,新しい拡張可能な状態表現を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:23:22 GMT)
Topology-Preserving Adversarial Training [28.1] 逆行訓練は、自然な精度劣化問題に悩まされている。
本稿では,この問題を緩和するためのトポロジ-pserving Adversarial training (TRAIN)を提案する。
提案手法は, 自然精度が最大8.78%向上し, 頑健さが4.50%向上した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:05:06 GMT)
ROBBIE: Robust Bias Evaluation of Large Generative Language Models [27.9] 異なるプロンプトベースのデータセットを使用して、複数のテキストドメインと人口統計軸にわたる社会的バイアスを測定することができる。
我々は,12の人口動態軸と5のジェネレーションLLMの家系の6つの異なるプロンプトベースのバイアスと毒性の指標を比較した。
3つのバイアス/毒性の緩和技術が、我々の一連の測定においていかにうまく機能するかを包括的に研究する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 23:03:04 GMT)
Composition of Nondeterministic and Stochastic Services for LTLf Task
Specifications [27.8] 我々は、サービスが非決定論的であり、Logicf仕様が正確に満たされる場合の問題を調査する。
このフレームワークには、Smart ManufacturingやDigital Twinsなど、いくつかの興味深いアプリケーションがある。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:58:42 GMT)
LEOD: Label-Efficient Object Detection for Event Cameras [27.7] ラベル効率の高いイベントベース検出のための最初のフレームワークであるLEODを開発した。
まず、限定ラベルで事前訓練された検出器を用いて、ラベルのない事象に対して擬似基底真理を生成する。
追跡に基づく後処理を擬似ラベルの品質向上に適用する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 00:09:45 GMT)
Federated Online and Bandit Convex Optimization [27.6] 適応的相手に対する分散オンラインおよび帯域幅凸最適化の問題点について検討する。
機械がクエリポイントの1階勾配情報にアクセスできる場合、協調は有益ではないことを示す。
私たちの研究は、限られたフィードバックでフェデレートされたオンライン最適化を体系的に理解するための最初の試みです。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:29:54 GMT)
A Simple Recipe for Language-guided Domain Generalized Segmentation [27.5] トレーニング中に見えない新しいドメインへの一般化は、ニューラルネットワークを現実世界のアプリケーションにデプロイする上での長年の目標と課題の1つだ。
本稿では,言語をランダム化の源とすることで意味分節ネットワークを一般化するシンプルなフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:59:59 GMT)
Are ensembles getting better all the time? [27.5] アンサンブル法は、いくつかのベースモデルの予測を組み合わせる。
アンサンブルが常に改善されていることは、考慮された損失関数が凸である場合に限る。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:32:37 GMT)
GROOT: Learning to Follow Instructions by Watching Gameplay Videos [27.3] 本研究では,オープンワールド環境におけるオープンエンドインストラクションを追従できるコントローラを構築する際の課題について検討する。
我々は,表現力のある目標仕様を提供する指示として,参照ビデオに従うことを提案する。
ゲームプレイビデオからこのような命令追従コントローラを学習するための新しい学習フレームワークが導出されている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 01:07:39 GMT)
Exo2EgoDVC: Dense Video Captioning of Egocentric Procedural Activities
Using Web Instructional Videos [27.2] 本稿では,高密度ビデオキャプションのクロスビュー知識伝達のための新しいベンチマークを提案する。
我々は、エゴセントリックな視点で見るWebインストラクショナルビデオのモデルを、エゴセントリックな視点に適応させる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 06:01:34 GMT)
Foundation Model for Endoscopy Video Analysis via Large-scale
Self-supervised Pre-train [27.2] 本研究では,大規模な内視鏡映像データを用いた基礎モデルであるEndo-FMを提案する。
私たちのデータセット全体は、最大500万フレームの33Kビデオクリップで構成されており、さまざまなプロトコル、対象臓器、疾患タイプが含まれています。
我々のEndo-FMは、現在最先端(SOTA)の自己指導型事前学習とアダプタベースのトランスファー学習を、かなりの差で上回っている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:54:44 GMT)
Guided Prompting in SAM for Weakly Supervised Cell Segmentation in
Histopathological Images [27.1] 本稿では、セグメンタを誘導するために、関連するタスクからのアノテーションである弱い監視を使用することに焦点を当てる。
SAM(Segment Anything)のような最近の基礎モデルは、推論中に追加の監視を活用するためにプロンプトを使用することができる。
すべてのSAMベースのソリューションは、既存の弱教師付きイメージセグメンテーションモデルを大幅に上回り、9~15 ptのDiceゲインを得る。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:18:48 GMT)
ShapeGPT: 3D Shape Generation with A Unified Multi-modal Language Model [27.1] 本稿では,複数の形状関連タスクに対処するために,強力な事前学習言語モデルを活用する形状関連マルチモーダルフレームワークであるShapeGPTを提案する。
具体的には、ShapeGPTは、連続した形状を形語に識別するための単語文パラグラフフレームワークを使用し、さらにこれらの単語を形文のために組み立て、複数段落の指示文に統合する。
実験により、ShapeGPTは、テキスト・トゥ・シェイプ、シェイプ・トゥ・テキスト、シェイプ・コンプリート、形状編集など、形状関連タスクに匹敵する性能を発揮することが示された。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:26:29 GMT)
CESAR: Automatic Induction of Compositional Instructions for Multi-turn
Dialogs [27.1] 本稿では,多数のダイアログタスクを同じ形式で統一する新しいフレームワークであるCESARを提案する。
命令ベースのダイアログタスクのベンチマークであるInstructDialにCESARを適用する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 06:02:16 GMT)
Impact of Indoor Mobility Behavior on the Respiratory Infectious
Diseases Transmission Trends [26.8] 呼吸器感染症の伝染動態における室内人体移動の重要性が認識されている。
本研究は, 一般シナリオにおける人々の移動行動について考察し, 群集行動, 空間的側面, 停止行動, 時間的側面の2つのカテゴリにまとめる。
本研究では,これらの移動行動が伝染病伝播に与える影響について検討した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:16:06 GMT)
MMA-Diffusion: MultiModal Attack on Diffusion Models [26.8] MMA-Diffusionは、T2Iモデルのセキュリティに顕著で現実的な脅威をもたらす。
オープンソースモデルと商用オンラインサービスの両方において、現在の防御措置を回避している。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:39:53 GMT)
Making Self-supervised Learning Robust to Spurious Correlation via
Learning-speed Aware Sampling [26.4] 自己教師付き学習(SSL)は、ラベルのないデータからリッチな表現を学ぶための強力なテクニックとして登場した。
現実の環境では、いくつかの属性(例えば、人種、性別、年齢)と下流タスクのラベルの間に急激な相関関係がしばしば存在する。
学習速度に逆相関する確率でトレーニングデータをサンプリングする学習速度対応SSL(LA-SSL)アプローチを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 23:19:30 GMT)
Synchronizing Vision and Language: Bidirectional Token-Masking
AutoEncoder for Referring Image Segmentation [26.3] Referring Image (RIS)は、自然言語で表現されたターゲットオブジェクトをピクセルレベルのシーン内でセグメントすることを目的としている。
マスク付きオートエンコーダ(MAE)に触発された新しい双方向トークンマスキングオートエンコーダ(BTMAE)を提案する。
BTMAEは、画像と言語の両方に欠けている機能をトークンレベルで再構築することで、画像から言語、言語へのイメージのコンテキストを学習する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:33:38 GMT)
Generalized Large-Scale Data Condensation via Various Backbone and
Statistical Matching [26.2] Generalized Various Backbone and Statistical Matching (G-VBSM) は、小規模なデータセットと大規模データセットの両方で高い性能を得るアルゴリズムである。
G-VBSMは、CIFAR-100で38.7%、128インチのConvNetで47.6%、ResNet18でTiny-ImageNetで47.6%、ResNet18で224x224 ImageNet-1kで31.4%のパフォーマンスを達成した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 06:25:59 GMT)
SAMPro3D: Locating SAM Prompts in 3D for Zero-Shot Scene Segmentation [26.2] ゼロショット3D屋内シーンセグメンテーションのためのSAMPro3Dを提案する。
提案手法は,事前訓練されたセグメンション任意のモデル(SAM)を2次元フレームに適用することにより,3次元シーンをセグメント化する。
提案手法は,従来のゼロショットや完全教師付きアプローチよりも高品質で多様なセグメンテーションを実現する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:11:03 GMT)
SentMix-3L: A Bangla-English-Hindi Code-Mixed Dataset for Sentiment
Analysis [26.1] SentMix-3Lは3つの言語間のコード混合データを含む感情分析のための新しいデータセットである。
GPT-3.5は,SentMix-3L上でのトランスフォーマーモデルよりも優れていた。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:33:26 GMT)
Are Large Language Models Good Fact Checkers: A Preliminary Study [26.0] 大規模言語モデル(LLM)は、その卓越した推論能力と広範な知識リポジトリによって、大きな注目を集めている。
本研究の目的は,特定のファクトチェックサブタスクに対処する上で,様々なLSMを包括的に評価することである。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:04:52 GMT)
Exploring Large Language Models for Human Mobility Prediction under
Public Events [25.9] 我々は,Large Language Models(LLMs)に基づく公共イベントにおける人体移動予測の枠組みを導入する。
LLMはテキストデータを処理し、最小限の例から学び、人間が読める説明を生成する。
ニューヨーク市のバークレイズセンターで、公開イベント情報とタクシー旅行データに基づいてケーススタディが実施されている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 04:25:15 GMT)
360Loc: A Dataset and Benchmark for Omnidirectional Visual Localization
with Cross-device Queries [25.8] 本稿では,視覚的ローカライゼーションのための地平線ポーズを持つ360$circ$画像からなる新しいベンチマークデータセットである360Locを紹介する。
360$circ$画像から低FoVクエリフレームを生成するための仮想カメラ手法を提案する。
一方向の視覚的ローカライゼーションは、対称性と繰り返し構造を持つ大規模シーンに挑戦する上で、より堅牢であることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 06:42:12 GMT)
SyncTalk: The Devil is in the Synchronization for Talking Head Synthesis [25.5] ライフライクな話しの頭は、主題のアイデンティティ、唇の動き、表情、頭ポーズを同期的に調整する必要がある。
従来のGAN(Generative Adversarial Networks)は、一貫した顔認証を維持するのに苦労している。
音声ヘッド合成における主観的同一性, 同期性, リアリズムを効果的に維持する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:35:34 GMT)
Action-slot: Visual Action-centric Representations for Multi-label
Atomic Activity Recognition in Traffic Scenes [25.4] Action-Slotは、視覚的なアクション中心の表現を学ぶスロットアテンションベースのアプローチである。
私たちのキーとなるアイデアは、原子活動が起こる領域に注意を払うことができるアクションスロットを設計することです。
この制限に対処するため,OATSより4倍大きいTACOという合成データセットを収集した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:28:05 GMT)
Natural & Adversarial Bokeh Rendering via Circle-of-Confusion Predictive
Network [25.3] Bokeh効果は被写界深度が浅い現象で、写真では焦点がぼやけている。
我々は、全く新しい問題、すなわち自然と敵対的なボケのレンダリングについて研究する。
本稿では,データ駆動方式と物理認識方式のそれぞれの利点を生かして,ハイブリッドな代替案を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:15:29 GMT)
MoMask: Generative Masked Modeling of 3D Human Motions [25.2] MoMaskはテキスト駆動型3Dモーション生成のための新しいフレームワークである。
階層的な量子化スキームは、人間の動きを離散的な動きトークンとして表現するために用いられる。
MoMaskは、テキスト・ツー・モーション生成タスクにおける最先端メソッドよりも優れています。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:04:10 GMT)
TCDM: Transformational Complexity Based Distortion Metric for Perceptual
Point Cloud Quality Assessment [24.9] 客観的クラウド品質評価(PCQA)研究の目標は、ポイントクラウド品質を一貫した方法で測定するメトリクスを開発することである。
歪んだ点雲を基準に戻す複雑さを計測することで点雲の質を評価する。
提案手法の有効性を,5つのパブリッククラウド品質評価データベース上で行った広範囲な実験を通じて評価した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:20:22 GMT)
SuGaR: Surface-Aligned Gaussian Splatting for Efficient 3D Mesh
Reconstruction and High-Quality Mesh Rendering [24.9] 本稿では,3次元ガウス格子から高精度かつ極めて高速なメッシュ抽出を可能にする手法を提案する。
しかし、これらのガウス人は最適化後に非組織化される傾向があるため、何百万もの小さな3Dガウスからメッシュを抽出することは困難である。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:49:41 GMT)
LanGWM: Language Grounded World Model [24.9] 我々は,世界モデル学習を強化するために,言語による視覚的特徴を学習することに注力する。
提案手法は,人間とロボットの相互作用モデルを改善する可能性を秘めている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:41:55 GMT)
MuLER: Detailed and Scalable Reference-based Evaluation [24.8] そこで本研究では,テキスト生成のための基準ベース評価基準を細粒度解析ツールに変換する手法を提案する。
システムとメートル法が与えられたとき、MulERは選択されたメートル法が特定のエラータイプをどれだけ罰するかを定量化する。
我々は,MulERの有効性を実証し,その有用性を示すために,合成的および自然主義的な設定の両方で実験を行う。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:47:58 GMT)
Receler: Reliable Concept Erasing of Text-to-Image Diffusion Models via
Lightweight Erasers [24.4] テキストから画像への拡散モデルにおける概念消去は、対象概念に関連する画像の生成から事前学習された拡散モデルを無効にすることを目的としている。
本稿では,ライトウェイトエキサイザー(Receler)による信頼性概念消去を提案し,そのコンセプト消去を行う軽量エキサイザーを学習する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:19:49 GMT)
Human Choice Prediction in Language-based Non-Cooperative Games:
Simulation-based Off-Policy Evaluation [24.1] 我々は,言語に基づく説得ゲームにおける非政治的評価の問題に取り組む。
そこで本研究では,人間とロボットのインタラクションデータを組み合わせた新しい手法を提案する。
本結果は,費用対効果と拡張性を有するソリューションとして,実際の相互作用とシミュレーションの混合の可能性を示すものである。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:46:53 GMT)
Clinical Risk Prediction Using Language Models: Benefits And
Considerations [23.8] 本研究は,語彙内で構造化された記述を用いて,その情報に基づいて予測を行うことに焦点を当てた。
構造化された EHR を表すために LM を用いると、様々なリスク予測タスクにおいて、改善または少なくとも同等のパフォーマンスが得られます。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 04:32:19 GMT)
Self-Supervised Learning for Large-Scale Preventive Security Constrained
DC Optimal Power Flow [23.7] SCOPF(Security-Constrained Optimal Power Flow)は、電力グリッドの安定性において重要な役割を果たすが、システムが成長するにつれてますます複雑になる。
本稿では,大規模SCOPF問題に対する準最適解を生成するための,自己教師付きエンドツーエンドのPDL-SCOPFについて紹介する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:36:35 GMT)
Towards Scalable 3D Anomaly Detection and Localization: A Benchmark via
3D Anomaly Synthesis and A Self-Supervised Learning Network [22.8] 本稿では,既存の大規模3次元モデルに適応して3次元異常検出を行うための3次元異常合成パイプラインを提案する。
Anomaly-ShapeNetは、40カテゴリ以下の1600点のクラウドサンプルで構成され、リッチで多様なデータ収集を提供する。
また、3次元異常局所化のためのスケーラブルな表現学習を可能にする自己教師型マスク再構成ネットワーク(IMRNet)を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:14:19 GMT)
Benchmarking Robustness to Adversarial Image Obfuscations [22.8] 悪意あるアクターは、機械学習モデルが正しい決定に達するのを防ぐために、イメージを侵害するポリシーを難なくすることができる。
ImageNetに基づくこのベンチマークは、悪意のあるアクターによって生成される難読化のタイプをシミュレートする。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:33:43 GMT)
Resolved Raman sideband cooling of a single optically trapped cesium
atom [22.6] 単一超微細状態における2つの最外ゼーマン準位の間の2光子ラマン過程を適用し、フォノン数を減少させる。
我々のスキームは一般的に使用されるスキームよりも磁場の変動に敏感ではない。
50msの冷却プロセスの後、Cs原子の82%が3次元基底状態に凝集する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:05:07 GMT)
Group-wise Sparse and Explainable Adversarial Attacks [22.6] スパース敵は、最小ピクセルの摂動によって、愚かなディープニューラルネットワーク(DNN)を攻撃します。
近年の取り組みは、この標準を核対逆法則としてスパーシティ正則化器に置き換えている。
画像のスパース的に意味のある領域内でグループワイズ攻撃を同時に生成するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:26:18 GMT)
GeoDeformer: Geometric Deformable Transformer for Action Recognition [22.5] 視覚トランスフォーマーは、近年、行動認識のための畳み込みネットワークの効果的な代替品として登場した。
本稿では,幾何学的理解を直接ViTアーキテクチャに組み込むことで,アクションビデオに固有の変動を捉えるための新しいアプローチであるGeoDeformerを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:55:55 GMT)
Intellectual Property Protection of Diffusion Models via the Watermark
Diffusion Process [22.4] 本稿では,タスク生成時に透かしを印字せずに拡散モデルに新しい透かし手法であるWDMを紹介する。
タスク生成のための標準的な拡散プロセスと並行して、透かしを埋め込むための透かし拡散プロセス(WDP)を同時に学習するモデルを訓練する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:10:59 GMT)
The Rise of the AI Co-Pilot: Lessons for Design from Aviation and Beyond [22.3] 我々は、AIが単なるツールではなく、人間の指導の下で働く共同パイロットと見なされるパラダイムを提唱する。
本稿では,AIパートナーシップにおけるアクティブな人間の関与,制御,スキル向上を重視したデザインアプローチを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:52:34 GMT)
Bounds on $k$-Uniform Quantum States [22.3] 我々は、$(mathbbCd)otimes N$における$k$-uniform状態の存在に対するパラメータ$k$の新しい上限を提供する。
a $k$-uniform state in $(mathbbCd)otimes N$ は純 $(N,1,k+1)_d$ 量子誤り訂正符号に対応するため、最小距離 $k+1$ of pure $(N,1,k+1))_d$ 量子誤り訂正符号にも新たな上限を与える。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:38:11 GMT)
Learning End-to-End Channel Coding with Diffusion Models [22.3] 我々は、生成モデル、特に、画像ベースタスクにおける生成の質の向上を示す拡散モデルと呼ばれる新しい有望な手法に焦点を当てた。
無線E2Eシナリオでは拡散モデルが利用可能であり,Wasserstein GANと同等に動作すると同時に,より安定したトレーニング手順と,テスト時の一般化能力も向上することを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:54:04 GMT)
Chameleon: a heterogeneous and disaggregated accelerator system for
retrieval-augmented language models [21.8] 検索言語モデル(Retrieval-Augmented Language Model)は、外部データベースからコンテキスト固有の知識を取得することによって、生成言語モデルを拡張する。
ALMは、LM推論と検索の間に様々なワークロード特性があるため、ユニークなシステム設計の課題を提起する。
異種加速器であるChameleonを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:34:49 GMT)
HUGS: Human Gaussian Splats [21.7] HUGS(Human Gaussian Splats)を紹介する。
本手法は,少数の(50-100)フレームのモノクロ映像のみを撮影し,30分以内に静止シーンと完全にアニメーション可能な人間のアバターを自動で切り離すことを学習する。
我々は60FPSのレンダリング速度で最先端のレンダリング品質を実現し、従来の作業よりも100倍高速なトレーニングを実現した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:56:32 GMT)
An Ultra-fast Quantum Random Number Generation Scheme Based on Laser
Phase Noise [21.7] レーザー位相ノイズに基づく量子乱数生成器は、一般的に速度と実装の複雑さに制限される。
本稿では、量子エントロピー源の潜在的な帯域幅を利用して、対応する量子エントロピー源の帯域幅を20GHzまで実験的に増強する。
超高速な218Gbpsの生成速度が示され、レーザー位相ノイズに基づくスキームの1桁の新たな記録が樹立された。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 06:15:51 GMT)
Transfer Learning in Robotics: An Upcoming Breakthrough? A Review of
Promises and Challenges [21.5] トランスファーラーニング(Transfer Learning)は、真にインテリジェントなエンボディエージェントを追求する概念的なパラダイムである。
ロボット,タスク,環境といった重要な概念を考慮に入れた最初の分類法を提供する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:40:10 GMT)
Cam4DOcc: Benchmark for Camera-Only 4D Occupancy Forecasting in
Autonomous Driving Applications [21.3] Cam4DOccは、カメラのみの4D占有率予測のための新しいベンチマークで、近い将来、周囲の変化を評価する。
私たちは、nuScenes、nuScenes-Occupancy、Lyft-Level5など、複数の公開データセットに基づいて、ベンチマークを構築しています。
このベンチマークを総合的な比較による将来の研究のために確立するために、様々なカメラベースの認識と予測の実装から4つのベースラインタイプを導入する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:25:46 GMT)
Fast and Expressive Gesture Recognition using a Combination-Homomorphic
Electromyogram Encoder [21.3] 筋電図を用いたジェスチャー認識の課題について検討する。
方向成分と変調器成分を組み合わせたジェスチャーを定義する。
新しい被験者は単一のコンポーネントジェスチャしか示さない。
実際の単一のジェスチャーの特徴ベクトルを組み合わせて合成学習データを生成することで、見知らぬ組み合わせのジェスチャーに外挿する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:19:16 GMT)
RACE-IT: A Reconfigurable Analog CAM-Crossbar Engine for In-Memory
Transformer Acceleration [21.2] Transformer ModelはDeep Neural Networks(DNN)の最先端を表現している。
これらのモデルを処理するには、かなりの計算資源が必要で、結果としてかなりのメモリフットプリントが要求される。
本稿では,トランスフォーマ内で様々な非MVM操作を行うことのできる新しいAnalog Content Addressable Memory(ACAM)構造を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 22:45:39 GMT)
Transformer-empowered Multi-modal Item Embedding for Enhanced Image
Search in E-Commerce [20.9] マルチモーダルアイテム埋め込みモデル(MIEM)は、製品に関するテキスト情報と複数の画像の両方を利用して、意味のある製品機能を構築することができる。
MIEMはShopeeイメージ検索プラットフォームの一部となっている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:09:50 GMT)
DifFlow3D: Toward Robust Uncertainty-Aware Scene Flow Estimation with
Diffusion Model [20.9] 拡散確率モデルを用いた不確実性を考慮したシーンフロー推定ネットワーク(DifFlow3D)を提案する。
提案手法は,KITTIデータセット上での前例のないミリレベルの精度(EPE3Dで0.0089m)を達成する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:56:24 GMT)
Grounding Foundation Models through Federated Transfer Learning: A
General Framework [20.9] GPT-4のような基礎モデル(FM)は、様々な自然言語処理やコンピュータビジョンタスクにおいて顕著な成功を収めている。
FMをドメイン固有のタスクに適応させたり、ドメイン固有の知識で拡張することで、FMの潜在能力を最大限に活用することができる。
近年,フェデレート・トランスファー・ラーニング(FTL)を活用したFMの基盤化の必要性が,学術と産業の両面で強く現れている。
FTL-FM研究の強い成長と、FTL-FMが産業応用に与える影響を動機として、FTL-FMフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:21:42 GMT)
PEAN: A Diffusion-based Prior-Enhanced Attention Network for Scene Text
Image Super-Resolution [20.7] シーンテキスト画像スーパーレゾリューション(STISR)は,低解像度のシーンテキスト画像の解像度と可読性を同時に向上することを目的としている。
シーンテキスト画像における2つの要因、意味情報と視覚構造が認識性能に大きな影響を及ぼす。
本稿では,これらの要因による影響を軽減するために,事前注意ネットワーク(PEAN)を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:11:20 GMT)
Modern Bayesian Experimental Design [20.5] ベイズの実験設計(BED)は、実験の設計を最適化するための強力で一般的なフレームワークを提供する。
その展開は、しばしばその実用性を損なうような重大な計算上の課題を引き起こす。
近年の進歩は、これらの課題を克服し、BEDを効果的に活用する能力に変化をもたらした。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:20:19 GMT)
Animatable 3D Gaussian: Fast and High-Quality Reconstruction of Multiple
Human Avatars [19.9] 入力画像とポーズから人間のアバターを学習するAnimatable 3D Gaussianを提案する。
新規なビュー合成と新規ポーズ合成の両タスクにおいて,本手法はトレーニング時間,レンダリング速度,再現性において既存手法よりも優れる。
本手法は,25秒のトレーニングで10人のシーンにおいて,複数のシーンに容易に拡張可能であり,それと同等の新規なビュー合成結果が得られる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:02:47 GMT)
DAP: Domain-aware Prompt Learning for Vision-and-Language Navigation [19.8] VLNタスクのための新しいモデルに依存しないドメイン・アウェア・プロンプト・ラーニング(DAP)フレームワークを提案する。
DAPは、ドメイン内の画像意味論を抽出するためのソフトな視覚的プロンプトを学習するために、低コストのプロンプトチューニングパラダイムを適用している。
R2RとREVERIEの両方の実験結果は、既存の最先端手法と比較して、DAPの優位性を示している。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:03:37 GMT)
Continual Learning with Low Rank Adaptation [19.8] 連続学習におけるローランク適応(LoRA)の適用性について検討した。
ドメインインクリメンタルな学習ベンチマークでは、LoRAベースのソリューションであるCoLoRが最先端のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:53:32 GMT)
Gotcha: Real-Time Video Deepfake Detection via Challenge-Response [19.2] 本稿では,ライブ環境での信頼性を確立するための課題応答手法を提案する。
本稿では,RTDF生成パイプラインに固有の制約を特に対象とする課題の分類について述べる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 22:33:00 GMT)
Smooth Video Synthesis with Noise Constraints on Diffusion Models for
One-shot Video Tuning [19.0] ワンショットビデオチューニング手法は、不整合と不整合によってマージされたビデオを生成する。
本稿では,ビデオフレーム間の簡易かつ効果的なノイズ制約を提案する。
既存のワンショットビデオチューニング手法にロスを適用することで、生成されたビデオの全体的な一貫性と滑らかさを大幅に改善する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:14:43 GMT)
Attribute Descent: Simulating Object-Centric Datasets on the Content
Level and Beyond [17.9] 合成と現実の間には、コンテンツレベルと外観レベルを含む2段階のドメインギャップが存在する。
本稿では,エンジン属性を自動的に最適化し,実世界のデータに近い合成データを実現する属性降下手法を提案する。
画像分類とオブジェクト再同定の実験により、適応された合成データが3つのシナリオで効果的に利用できることを確認した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 23:39:40 GMT)
Rigorous dynamical mean field theory for stochastic gradient descent
methods [17.9] 一階勾配法の一家系の正確な高次元に対する閉形式方程式を証明した。
これには勾配降下(SGD)やネステロフ加速度などの広く使われているアルゴリズムが含まれる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:00:42 GMT)
Adaptive Early Exiting for Collaborative Inference over Noisy Wireless
Channels [17.9] コラボレーション推論システムは、無線ネットワークエッジにディープニューラルネットワーク(DNN)をデプロイする新たなソリューションの1つである。
本研究では,特定の試料のエッジデバイスにおける推定結果の取得を可能にする共同推論の文脈における早期退避について検討する。
システムの中心となるのは送信決定機構(TD)であり、早期終了予測を維持するか、エッジサーバにデータを送信してさらなる処理を行うかを決定する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:31:59 GMT)
Guided Slot Attention for Unsupervised Video Object Segmentation [17.7] 本研究では,空間構造情報を強化し,より優れた前景分離を実現するためのガイド付きスロットアテンションネットワークを提案する。
提案モデルは,2つの一般的なデータセット上での最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:48:02 GMT)
Mixed-Precision Quantization for Federated Learning on
Resource-Constrained Heterogeneous Devices [17.6] 本稿では,資源不均一なFLシステムに混合精度量子化を導入する新しいFLアルゴリズムであるFedMPQを提案する。
具体的には、ビット幅制約を満たすために量子化された局所モデルは、目的関数を最適化することによって訓練される。
ローカルトレーニングの次のラウンドを初期化するために、サーバは、異なるクライアントに配信されるモデルのビット幅割り当てをカスタマイズするために、前回のトレーニングラウンドで学んだ情報に依存する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 22:43:40 GMT)
Large Language Model is a Good Policy Teacher for Training Reinforcement
Learning Agents [17.4] 大規模言語モデル(LLM)は、高レベルな命令を提供することで、複雑なシーケンシャルな意思決定タスクの解決に利用できる。
しかし, LLMをベースとしたエージェントは, 特定の目標問題の解法における特殊化の欠如により, リアルタイムな動的環境の制約に直面している。
LLMをベースとした教師エージェントからの指示を用いて、小規模の特化学生エージェントを訓練することで、これらの課題に対処する新しい枠組みを導入する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:39:37 GMT)
Long-tailed multi-label classification with noisy label of thoracic
diseases from chest X-ray [17.4] 胸部X線(CXR)はしばしば稀な疾患を呈し、正確な診断を必要としている。
胸部疾患と胸部疾患の両方をカプセル化したCXRの長期多ラベル分類のための新しいベンチマークを提案する。
我々のアプローチには、26の稀な疾患を伴うMIMIC-CXRの強化である"LTML-MIMIC-CXR"データセットの開発が含まれる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 03:21:34 GMT)
Improving Stability during Upsampling -- on the Importance of Spatial
Context [17.3] カーネルサイズを増大させる畳み込みアップサンプリング操作を用いて、アップサンプリング中のコンテキストの関連性を検討する。
カーネルサイズが大きくなると、画像復元や画像分割といったタスクの予測安定性が向上する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:53:05 GMT)
SpacePulse: Combining Parameterized Pulses and Contextual Subspace for
More Practical VQE [16.9] パラメータ化量子パルスと文脈部分空間法の統合について検討する。
パルスで作業することで、CNOTベースの回路分解ではアクセスできないヒルベルト空間の領域にアクセスすることができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:55:31 GMT)
Fast algorithms for classical specifications of stabiliser states and
Clifford gates [16.8] 安定化器形式は、量子コンピューティング、エラー修正、フォールトトレランスにおいて中心的な役割を果たす。
ベクトルが安定化状態であることを検証し、その仕様を振幅、二次形式、チェック行列として相互変換する高速な方法を提案する。
提案手法は,量子ビット数で指数関数的な指数的改善を施し,最もよく知られたブライト力法よりある程度の精度で性能を向上する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 06:03:17 GMT)
Bases for optimising stabiliser decompositions of quantum states [16.8] 我々は、$n$-qubit 安定化状態の線型依存のベクトル空間を導入し、研究する。
定数サイズ3の線形依存のエレガントな基底を構築する。
我々は,魔法状態の安定化度合いを向上するための潜在的な将来的応用を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 06:30:05 GMT)
Synergizing Human-AI Agency: A Guide of 23 Heuristics for Service
Co-Creation with LLM-Based Agents [16.6] この研究は、に関心のあるサービスプロバイダが、その実践者やより広範なコミュニティに対して、Large Language Models(LLM)技術が統合されるかどうかを判断するための原動力となる。
LLMをベースとしたサービス共同作成ツールであるCoAGentを通じて,非AI専門家とAIの相互学習の旅について検討する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 22:37:21 GMT)
AgentAvatar: Disentangling Planning, Driving and Rendering for
Photorealistic Avatar Agents [16.5] 我々のフレームワークはLLMを利用してアバターエージェントの顔の動きを詳細に記述する。
これらの記述はタスク非依存の駆動エンジンによって連続的な動作埋め込みに処理される。
我々の枠組みは、モナディックとディヤディックの両方において、様々な非言語アバター相互作用に適応する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:13:00 GMT)
Towards Efficient Hyperdimensional Computing Using Photonics [16.4] 超次元コンピューティング(Hyperdimensional Computing、HDC)は、脳にインスパイアされた機械学習技術である。
本稿では,フォトニックコンピューティングとHDCが,フォトニックコンピューティングとディープニューラルネットワーク(DNN)よりも補完的であることを論じる。
我々は、HDCトレーニングと推論のための最初の電子フォトニック加速器であるPhotoHDCを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:51:21 GMT)
U-Net v2: Rethinking the Skip Connections of U-Net for Medical Image
Segmentation [16.2] 医用画像分割のための新しい堅牢で効率的なU-Net変種であるU-Net v2を紹介する。
セマンティックな情報を低レベルの機能に注入し、同時に細かな詳細で高レベルの機能を改善することを目的としている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:35:24 GMT)
UFOGen: You Forward Once Large Scale Text-to-Image Generation via
Diffusion GANs [16.1] 我々は,超高速でワンステップのテキスト・ツー・イメージ合成を目的とした新しい生成モデルUFOGenを提案する。
従来のアプローチとは異なり、UFOGenはGANの目的と拡散モデルを統合するハイブリッド手法を採用している。
UFOGenは、1ステップでテキスト記述に条件付けされた高品質な画像を効率よく生成する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:55:16 GMT)
UFOGen: You Forward Once Large Scale Text-to-Image Generation via
Diffusion GANs [16.1] 我々は,超高速でワンステップのテキスト・ツー・イメージ合成を目的とした新しい生成モデルUFOGenを提案する。
従来のアプローチとは異なり、UFOGenはGANの目的と拡散モデルを統合するハイブリッド手法を採用している。
UFOGenは、1ステップでテキスト記述に条件付けされた高品質な画像を効率よく生成する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:55:16 GMT)
NeRFTAP: Enhancing Transferability of Adversarial Patches on Face
Recognition using Neural Radiance Fields [15.8] 本稿では、FRモデルへの転送可能性と被害者の顔画像の両方を考慮し、新たな敵攻撃法を提案する。
我々は,敵パッチの転送可能性を高めるために,ソースと対象対象のための新しいビューフェイス画像を生成する。
本研究は, FRシステムの強靭性向上に有用な知見を提供する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 03:17:14 GMT)
Discovering Communication Pattern Shifts in Large-Scale Labeled Networks
using Encoder Embedding and Vertex Dynamics [15.7] ソーシャルメディアや電子メール通信などの大規模時系列ネットワークデータを分析することは、大きな課題となる。
本稿では,大規模グラフデータの効率的な埋め込みを可能にする時間エンコーダ埋め込み手法を提案する。
我々は,大規模組織から匿名化された時系列通信ネットワークを解析することによって,我々のアプローチを実証する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:05:22 GMT)
CD-GAN: a robust fusion-based generative adversarial network for
unsupervised remote sensing change detection with heterogeneous sensors [15.3] 本稿では、異種光センサが取得した画像を対象とした、教師なしの変更検出手法を提案する。
これは、変更検出タスクを堅牢な融合フレームワークに定式化する最近の進歩に乗じている。
最先端の変更検出手法との比較により,提案手法の有効性と有効性を示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:17:09 GMT)
LayerCollapse: Adaptive compression of neural networks [15.2] 本稿では,新しい適応モデル圧縮手法であるLayerCollapseを紹介する。
LayerCollapseは、ネットワーク内の非線形性を排除し、2つの連続した完全に接続されたレイヤを1つの線形変換に分解する。
以上の結果から,LayerCollapseの効率よい圧縮および正規化機能を,複数のきめ細かい分類ベンチマークで示すことができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 01:23:41 GMT)
FairTune: Optimizing Parameter Efficient Fine Tuning for Fairness in
Medical Image Analysis [15.2] 医用診断などの倫理的に敏感な応用分野において,頑健なグループフェアネス特性を持つトレーニングモデルが重要である。
高容量のディープラーニングモデルは、すべてのトレーニングデータをほぼ完璧に適合させることができる。
公平性に関してPEFTパラメータの選択を最適化するフレームワークであるFairTuneを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:59:20 GMT)
Towards Learning Monocular 3D Object Localization From 2D Labels using
the Physical Laws of Motion [15.2] 本稿では,1枚のキャリブレーションカメラからの1枚の画像における2次元ラベルのみを用いた高精度な3次元物体位置決め手法を提案する。
3Dラベルを使う代わりに、我々のモデルは、物体の動きの物理的知識とともに、容易に注釈付けできる2Dラベルで訓練される。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:33:28 GMT)
Quality and Quantity: Unveiling a Million High-Quality Images for
Text-to-Image Synthesis in Fashion Design [15.1] Fashion-Diffusion データセットは,多年にわたる厳格な努力の成果である。
データセットは100万以上の高品質なファッションイメージで構成されており、詳細なテキスト記述と組み合わせている。
T2Iに基づくファッションデザイン分野の標準化を促進するために,ファッションデザインモデルの性能評価のための新しいベンチマークを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:08:25 GMT)
TARGET: Template-Transferable Backdoor Attack Against Prompt-based NLP
Models via GPT4 [15.0] GPT4によるTARGET(Template-trAnsfeRable backdoor attack aGainst prompt-basEd NLP model)の新たなアプローチを提案する。
具体的には、まずGPT4を用いて手動テンプレートを再構成し、トーンストロングとノーマルテンプレートを生成し、前者はトレーニング前段階でバックドアトリガとしてモデルに注入する。
そして、ダウンストリームタスクで上記のテンプレートを直接使用するだけでなく、GPT4を使用して上記のテンプレートと似たトーンでテンプレートを生成し、転送可能なアタックを実行します。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:12:09 GMT)
Dynamic Dense Graph Convolutional Network for Skeleton-based Human
Motion Prediction [14.8] 本稿では,高密度グラフを構築し,動的メッセージパッシングを実装した動的Dense Graph Convolutional Network (DD-GCN)を提案する。
そこで本研究では,データから動的に学習し,ユニークなメッセージを生成する動的メッセージパッシングフレームワークを提案する。
ベンチマークによるHuman 3.6MとCMU Mocapデータセットの実験は、DD-GCNの有効性を検証する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:25:49 GMT)
Image Clustering Conditioned on Text Criteria [14.7] 本稿では,ユーザが指定したテキスト基準に基づいて画像クラスタリングを行う手法を提案する。
テキスト基準に基づく画像クラスタリング条件 (IC|TC) と呼ぶ。
IC|TCは人間の介入を最小限かつ実用的に必要としており、ユーザーはクラスタリングの結果に対してかなりの制御を行うことができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:51:36 GMT)
Pose Anything: A Graph-Based Approach for Category-Agnostic Pose
Estimation [14.5] カテゴリに依存しないポーズ推定(CAPE)は、任意のオブジェクトカテゴリに対するキーポイントのローカライゼーションを単一のモデルで実現することを目的としている。
本稿では,新たに設計されたグラフトランスフォーマーデコーダを用いて,キーポイント間の固有幾何学的関係を利用したCAPEに対する新しいアプローチを提案する。
提案手法は, 従来の最先端技術よりもかなり優れており, 1ショットおよび5ショット設定で2.16%, 1.82%の大幅な改善を実現している。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:44:12 GMT)
Tailored Visions: Enhancing Text-to-Image Generation with Personalized
Prompt Rewriting [14.2] 本稿では,3115名のユーザから300万以上のプロンプトを収集した大規模テキスト画像データセットに基づいて,ユーザプロンプトを書き換える新たなアプローチを提案する。
我々の書き換えモデルは、ユーザプロンプトの表現力とアライメントを意図した視覚的出力で向上させる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:08:14 GMT)
Gene-MOE: A Sparsely-gated Framework for Pan-Cancer Genomic Analysis [14.0] そこで我々は、Pan-Cancerデータセットの一般的な特徴表現を学習するために、Gene-MOEと呼ばれる新しい事前学習モデルを提案する。
Gene-MOEは、エキスパート層の混合物をフル活用して、高次元遺伝子のリッチな特徴表現を学習する。
Gene-MOEを用いた癌分類と生存分析実験を行った。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:09:25 GMT)
Improving Open-Set Semi-Supervised Learning with Self-Supervision [13.9] オープンセット半教師あり学習(OSSL)は、半教師あり学習における実践的なシナリオを具現化する。
我々は,自己スーパービジョンを通じて,ラベルのないすべてのデータから学習を容易にするOSSLフレームワークを提案する。
提案手法は, 評価されたベンチマーク問題の多くに対して, 最先端の結果をもたらす。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 23:02:49 GMT)
HiDiffusion: Unlocking High-Resolution Creativity and Efficiency in
Low-Resolution Trained Diffusion Models [13.8] HiDiffusionは、レゾリューション対応U-Net(RAU-Net)と修正シフトウィンドウマルチヘッド自己注意(MSW-MSA)で構成されるチューニング不要フレームワークである。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:01:38 GMT)
LEAP: LLM-Generation of Egocentric Action Programs [13.8] 本稿では,Large Language Model (LLM) を用いたビデオグラウンドアクションプログラム生成手法であるLEAPを紹介する。
本手法は,RGB入力に制限されたネットワークの中で,11月17日現在,EPIC Kitchens Action Recognitionのリーダーボードで1位を獲得している。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 04:25:52 GMT)
RADAP: A Robust and Adaptive Defense Against Diverse Adversarial Patches
on Face Recognition [13.6] ディープラーニングを利用した顔認識システムは、敵の攻撃に対して脆弱である。
多様な敵パッチに対する堅牢かつ適応的な防御機構であるRADAPを提案する。
RADAPの有効性を検証するための総合的な実験を行った。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 03:37:14 GMT)
MicroGlam: Microscopic Skin Image Dataset with Cosmetics [13.6] 化粧品特有の皮膚画像データセットを提案する。
皮膚画像は45ドル(約4,800円)のパッチ(9ドル(約9,800円))で、3種類の化粧品の下に8mm*8mmのサイズ。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 04:23:54 GMT)
Rethinking Image Editing Detection in the Era of Generative AI
Revolution [13.6] GREデータセットは、以下の利点を持つ大規模な生成地域編集データセットである。
提案する3つの課題として,編集画像分類,編集手法属性,編集領域ローカライゼーションの3つの実験を行った。
GREデータセットは、生成領域編集検出の分野におけるさらなる研究と探索を促進することを期待する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:35:35 GMT)
The Effects of Overparameterization on Sharpness-aware Minimization: An
Empirical and Theoretical Analysis [13.5] 我々は、パラメータ化の度合いの異なるシャープネス認識最小化(SAM)を解析する。
SAMにより発見された線形安定なミニマは,SGDに比べてより平坦であり,より均一に分布するヘッセンモーメントを有することを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:19:50 GMT)
Slot-Mixup with Subsampling: A Simple Regularization for WSI
Classification [13.3] 全スライド画像 (WSI) の分類は, がんの診断に関係のある症例は少ないが, 病理医には繰り返しズームイン, アウトが必要である。
パッチレベルのラベルがないため、多重インスタンス学習(MIL)はWSI分類器をトレーニングするための一般的なプラクティスである。
MIL for WSIsの課題の1つは、スライドレベルのラベルから来る弱い監督力であり、しばしば過度なオーバーフィッティングをもたらすことである。
我々のアプローチは、元のスライドの基盤となるセマンティクスを著しく変更することなく、WSIのパッチのサブセットをサンプリングすることで、トレーニングデータセットを強化します。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:18:39 GMT)
On the Complexity of Winner Determination and Strategic Control in
Conditional Approval Voting [13.2] 条件最小 (Conditional Minisum, CMS) は、優先的な依存関係を持つ多問題選挙の投票規則である。
我々は,CMSを表現性と計算効率の良好なトレードオフを実現するソリューションとみなすことができることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:32:29 GMT)
Mitigating Source Bias for Fairer Weak Supervision [13.1] 弱監督は、基底的真理ラベルの必要性を減らすことにより、トレーニングセットの効率的な開発を可能にする。
本手法は, 人口格差を82.5%削減しつつ, 弱監督基準の精度を最大32%向上させることを示す。
WRENCHベンチマークの10つのデータセットのうち5つにおいて,性能の最大化を目的とした簡単な拡張を行った。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:10:41 GMT)
Efficient In-Context Learning in Vision-Language Models for Egocentric
Videos [13.1] 本稿では,エゴセントリックなビデオのための大規模視覚言語モデル(VLM)において,コンテキスト内学習を取り入れた新しい学習手法を提案する。
$mathbbEILEV$は、モデルがビデオクリップとナレーションでインターリーブされたコンテキストを処理できるように、アーキテクチャおよびトレーニングデータアダプションを伴います。
我々の評価では、$mathbbEILEV$-trained モデルは、文脈内学習において、大量の自然主義的データに基づいて訓練されたより大きな VLM よりも優れていた。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:52:55 GMT)
Vulnerability of Automatic Identity Recognition to Audio-Visual
Deepfakes [13.0] 本稿では, ディープフェイクSWAN-DFの音声・映像データベースとして初めて, 唇と音声をよく同期させる手法を提案する。
我々は,SpeechBrainのECAPA-TDNNモデルなど,アート話者認識システムの脆弱性を実証する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:18:04 GMT)
A proposal to characterize and quantify superoscillations [13.0] 本稿では,従来の提案問題に支障をきたさない区間における超振動関数の形式的定義について述べる。
定義のよい振る舞いをいくつかの例で説明します。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:08:20 GMT)
AnyLoc: Towards Universal Visual Place Recognition [12.9] 視覚的位置認識(VPR)は、ロボットのローカライゼーションに不可欠である。
ほとんどの性能の高いVPRアプローチは環境に特化しており、タスクに特化している。
私たちは、VPRの普遍的なソリューションを開発します -- 幅広い構造化された、非構造化された環境にわたって機能するテクニックです。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 04:44:30 GMT)
Volumetric Cloud Field Reconstruction [12.9] 雲や霧などの体積現象は、3次元再構成システムにとって重要な課題である。
本稿では,数個のステレオペアからボリュームを再構成する手法を提案する。
深層ステレオモデルと3次元畳み込みニューラルネットワーク(3D CNN)と対流モジュールを組み合わせた新しいディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:19:40 GMT)
Direction-oriented Multi-objective Learning: Simple and Provable
Stochastic Algorithms [12.8] 本稿では,方向近傍の共通降下方向を正規化することにより,新たな方向指向多目的問題を提案する。
マルチタスク型教師付き学習と強化学習の一連の課題において,提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:19:00 GMT)
Q-learning Based Optimal False Data Injection Attack on Probabilistic
Boolean Control Networks [12.8] 本稿では,ネットワークにおける最適な偽データ注入攻撃問題を解決するための強化学習(RL)手法を提案する。
具体的には、この問題に対処するために、Q-learning(QL)アルゴリズムを使用します。
次に、学習効率を向上するだけでなく、大規模ネットワークに対する最適な攻撃戦略を得る改良型QLアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:45:07 GMT)
Uncertainty-aware Traffic Prediction under Missing Data [12.4] 実際のシナリオでは、予算の制限とインストールの可用性のために、センサーのデプロイが制限される可能性がある。
本研究では,(1)過去の記録のない場所まで予測を拡張できる不確実性を考慮したフレームワークを提案し,その空間的範囲を著しく拡張する。
また,本モデルにより,輸送分野におけるセンサ配置タスクを支援することができ,センサ配置予算を限定して高精度化できることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:38:49 GMT)
Consistent Video-to-Video Transfer Using Synthetic Dataset [12.3] テキストベースのビデオ・ビデオ編集のための,新しい,効率的なアプローチを提案する。
私たちのアプローチの核心は、ビデオ間転送タスクに適した合成ペアビデオデータセットです。
Instruct Pix2Pix's image transfer by editing instruction, we adapt this paradigm to the video domain。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:21:58 GMT)
On Sparse Modern Hopfield Model [12.3] 現代のホップフィールドモデルのスパース拡張として、スパース近代ホップフィールドモデルを導入する。
スパースなホップフィールドモデルが、その密度の強い理論的性質を保っていることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 22:45:39 GMT)
Classification, Challenges, and Automated Approaches to Handle
Non-Functional Requirements in ML-Enabled Systems: A Systematic Literature
Review [11.9] 非機能要件は、機械学習の巨大なポテンシャルを脅かす。
本稿では,3つの重要な側面を対象とする体系的な文献レビューを提案する。
さらなる研究が考慮すべき23以上のソフトウェアエンジニアリング課題のカタログを提供しています。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:45:41 GMT)
An Internet-wide Penetration Study on NAT Boxes via TCP/IP Side Channel [11.6] ネットワークアドレス変換(NAT)は、内部のローカルエリアネットワーク内のデバイスを公共のインターネットから直接の悪意あるアクセスから保護する上で重要な役割を担っている。
本稿では,NATボックス上でのインターネット全体の浸透試験を実施することを目的とする。
我々は,インターネット全体のスキャンを5日間で,非攻撃的に達成できる適応型スキャナを開発した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 06:43:02 GMT)
TimelyGPT: Recurrent Convolutional Transformer for Long Time-series
Representation [11.5] 時間生成型事前学習型トランスフォーマー(モデル)アーキテクチャを導入する。
モデルは、繰り返し注意と時間的畳み込みモジュールを統合して、長いシーケンスでグローバルな時間的依存関係をキャプチャする。
実験により, モデリングにおけるモデルエクセルは, 生体信号と不規則サンプリング時系列データとを連続的に監視していることがわかった。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:09:28 GMT)
GNNFlow: A Distributed Framework for Continuous Temporal GNN Learning on
Dynamic Graphs [11.3] 本稿では,効率的な時間的グラフ表現学習のための分散フレームワークであるGNNFlowを紹介する。
GNNFlowは、負荷バランスを確保するために、静的スケジューリングを備えた複数のマシンでの分散トレーニングをサポートする。
実験の結果,GNNFlowは既存のシステムに比べて最大21.1倍高速な継続的学習を実現することがわかった。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:30:32 GMT)
Federated Fine-Tuning of Foundation Models via Probabilistic Masking [11.2] ファンデーションモデル(FM)は、タスク間の適応性とハイパフォーマンスで機械学習に革命をもたらした。
フェデレートラーニング(FL)への統合は、広範囲なパラメータ化による通信オーバーヘッドが大きいため、難しい。
FLのFMを1bpp以下で効率よく微調整する新しい手法であるDeltaMaskを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 01:10:39 GMT)
Addressing Membership Inference Attack in Federated Learning with Model
Compression [11.1] 機械学習のプライバシ保護ソリューションとしてフェデレートラーニング(FL)が提案されている。
クライアントに対するメンバシップ攻撃の有効性は,クライアントデータセットのサイズやモデルの複雑さと負の相関関係があることが示される。
本稿では,クライアント上でのモデル圧縮を活用しながら,サーバ上にモデルを完全に保持する,新たなプライバシ対応FLアプローチを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:54:15 GMT)
Low-overhead pieceable fault-tolerant construction of logical
controlled-phase circuit for degenerate quantum code [11.1] 我々は、量子コードのための論理制御相ゲートの非可逆かつフォールトトレラントな構成を探索する。
この符号には3ピースのフォールトトレラントな論理CZ回路がある。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:26:34 GMT)
Evaluating Trustworthiness of AI-Enabled Decision Support Systems:
Validation of the Multisource AI Scorecard Table (MAST) [11.0] Multisource AI Scorecard Table (MAST)は、信頼できるAIシステムの設計と評価を通知するチェックリストツールである。
我々は、AI対応意思決定支援システムにおいて、MASTが人々の信頼感と関連しているかどうかを評価する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:34:15 GMT)
Applying HCAI in developing effective human-AI teaming: A perspective
from human-AI joint cognitive systems [10.7] 研究と応用は、AIシステムを開発するための新しいパラダイムとして、HAT(Human-AI Teaming)を使用している。
我々は,人間とAIの協調認知システム(HAIJCS)の概念的枠組みについて詳しく検討する。
本稿では,HATを表現・実装するためのヒューマンAI共同認知システム(HAIJCS)の概念的枠組みを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:51:21 GMT)
GC-MVSNet: Multi-View, Multi-Scale, Geometrically-Consistent Multi-View
Stereo [10.7] 本稿では,学習中の複数のソースビューにまたがる参照ビュー深度マップの幾何的整合性を明確に促進する新しいアプローチを提案する。
この幾何整合性損失を加えることで、幾何学的に矛盾したピクセルを明示的にペナル化することで学習を著しく加速することがわかった。
実験の結果,本手法はDTUおよびBlendedMVSデータセットの新たな最先端化を実現し,Turts and Templesベンチマークの競争結果が得られた。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:33:09 GMT)
Learning-Based Relaxation of Completeness Requirements for Data Entry
Forms [10.7] LACQUERはベイジアンネットワークモデルを構築し、ユーザーが無意味な値を満たさなければならない条件を自動的に学習する。
異なるデータセットで0.76から0.90の範囲の精度で、必要なフィールドの完全性要件を正確に緩和することができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:56:01 GMT)
SPiC-E : Structural Priors in 3D Diffusion Models using Cross Entity
Attention [10.4] 本研究では,3次元拡散モデルに構造的ガイダンスを加えるニューラルネットワークSPiC-Eを提案する。
提案手法は,3次元スタイリゼーション,意味的形状の編集,テキスト条件の抽象化-to-3Dなど,様々なアプリケーションをサポートする。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:36:49 GMT)
A Survey on Design Methodologies for Accelerating Deep Learning on
Heterogeneous Architectures [10.0] 効率的なハードウェアアクセラレーターの必要性は、ヘテロジニアスなHPCプラットフォームの設計にますます強くなっている。
ディープラーニングのためのアクセラレータを設計するために、いくつかの方法論とツールが提案されている。
この調査は、ディープラーニングアクセラレータを実装するために近年提案されている最も影響力のある設計方法論とEDAツールの総括的なレビューを提供する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:10:16 GMT)
Experimental Generation of Spin-Photon Entanglement in Silicon Carbide [9.9] 炭化ケイ素中のシリコン空孔欠陥とゼロフォノン線中の散乱単光子との絡み合いを実験的に生成する。
フォトニック量子ビットは自由度でエンコードされ、不均衡なマッハ・ツェンダー干渉計を用いて測定される。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:52:18 GMT)
Non Linear Software Documentation with Interactive Code Examples [9.9] Casdocドキュメントはプログラマのためのコード例を中心としたインタラクティブなリソースである。
コード要素の説明は、読者が必要に応じて明らかにするアノテーションとして提示される。
インタラクティブな文書は、読者に気を散らすことなく、静的な文書よりも多くの情報を含むことができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:08:46 GMT)
Backdiff: a diffusion model for generalized transferable protein
backmapping [9.8] BackDiffは、タンパク質のバックマッピング問題における一般化と信頼性を実現するために設計された新しい生成モデルである。
本手法は,エンド・ツー・エンドのトレーニングを容易にするとともに,リトレーニングを必要とせず,異なるタンパク質および多様なCGモデルを効率的にサンプリングすることができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 03:43:56 GMT)
Image Blending Algorithm with Automatic Mask Generation [9.8] マスク自動生成による画像ブレンディング手法を提案する。
セマンティックオブジェクトの検出とセグメンテーションとマスク生成を組み合わせることで、深いブレンド画像を実現する。
その結果,本手法は従来の画像ブレンディングアルゴリズムよりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 06:49:12 GMT)
Soulstyler: Using Large Language Model to Guide Image Style Transfer for
Target Object [9.8] Soulstylerを使えば、ユーザーは簡単なテキスト記述を通じて画像中の特定のオブジェクトのスタイル化をガイドできる。
テキストを解析し、スタイル化の目標と特定のスタイルを特定するために、大きな言語モデルを導入する。
また,特定の対象オブジェクトに対してのみスタイル転送が行われることを保証する,新たなローカライズされたテキストイメージブロックマッチング損失を導入する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:24:35 GMT)
Propagate & Distill: Towards Effective Graph Learners Using
Propagation-Embracing MLPs [9.7] 教師グラフニューラルネットワーク(GNN)による知識蒸留による学生の訓練
機能変換を$T$から分離したGNNにインスパイアされた私たちは、蒸留プロセスを再構成して、学生に$T$と$Pi$の両方を学ぶようにしました。
本稿では, 蒸留前の教師の出力を伝搬するプロパゲート・アンド・ディスティル (P&D) を提案し, 逆伝播の近似過程として解釈できる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:26:24 GMT)
Stable Online and Offline Reinforcement Learning for Antibody CDRH3
Design [9.7] 本稿では,この領域の独特な課題に対処するための新しい強化学習手法を提案する。
本手法は, オンラインインタラクションやオフラインデータセットを用いて, サイリコの複数ターゲットに対する高親和性抗体の設計を学習できることを実証する。
私たちの知る限りでは、私たちのアプローチは、Absolut!データベースでテストされたすべての抗原に対して、その種類の最初の方法であり、既存の方法よりも優れています。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:09:36 GMT)
On the Adversarial Robustness of Graph Contrastive Learning Methods [9.7] 本稿では,グラフコントラスト学習(GCL)モデルのロバスト性を評価するために,包括的評価ロバストネスプロトコルを提案する。
我々はこれらのモデルを,グラフ構造をターゲットとした適応的敵攻撃,特に回避シナリオに適用する。
本研究は,GCL手法の堅牢性に関する知見を提供することを目標とし,今後の研究方向の道を開くことを期待する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:59:18 GMT)
Making Data Work Count [9.6] 我々は、データアノテーション作業の編成における数え方や定量化の役割に焦点を当てる。
我々は、数え上げの実践とその関連するロジックが日々のアノテーション活動の不可欠な部分であることを観察する。
AIサプライチェーンとデータワークの中で、カウンティングレジームがAIクライアントによる権威の主張を支援することが分かっています。
我々は、特定の利益によって形作られ、限られた方法でしか説明できない、部分的(partial)として数えられる見解を論じる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:45:14 GMT)
Evolution equation for quantum coherence [9.5] 量子状態のコヒーレンス進化方程式は、完全かつ厳密な非コヒーレント演算 (FSIO) チャネルを通して導かれる。
クーディ状態の全コヒーレンスを定量化するために、GコヒーレンスとGコヒーレンスの凸屋根を定義する。
FSIOチャネル下での任意の$d$次元量子純および混合状態に対するコヒーレンス進化方程式を証明した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:21:23 GMT)
Microscopy Image Segmentation via Point and Shape Regularized Data
Synthesis [9.5] 合成学習データを用いた顕微鏡画像セグメンテーションのための統一パイプラインを構築した。
本フレームワークは,濃密なラベルを持つ高精度な顕微鏡画像で訓練されたモデルと同等の結果が得られる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:20:48 GMT)
TSDF-Sampling: Efficient Sampling for Neural Surface Field using
Truncated Signed Distance Field [9.5] 本稿では,シーンのTrncated Signed Distance Field (TSDF) を組み込むことにより,サンプリング回数を大幅に削減する新しい手法を提案する。
実験の結果, 性能を損なうことなく, 推論速度は11倍に向上した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:23:18 GMT)
Elo Uncovered: Robustness and Best Practices in Language Model
Evaluation [9.5] 評価手法が従うべき2つの公理:信頼性と推移性について検討する。
これらの公理は、LLMの現在の比較評価の信頼性について、常に疑問を呈しているわけではない。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 00:45:23 GMT)
Correlated two-photon scattering in a one-dimensional waveguide coupled
to two- or three-level giant atoms [9.1] 本研究では, 1次元導波路中の2光子散乱過程を, 2レベルあるいは3レベルの巨大原子にそれぞれ結合させた。
2つの結合点間の累積位相シフトを利用して散乱過程を変化させることができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:19:30 GMT)
Towards Top-Down Reasoning: An Explainable Multi-Agent Approach for
Visual Question Answering [9.1] 視覚言語モデル(VLM)は、様々なタスクにおいて顕著な進歩を見せている。
本稿では,Large Language Models (LLMs) に組み込んだ多言語協調フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 03:10:42 GMT)
The devil is in the fine-grained details: Evaluating open-vocabulary
object detectors for fine-grained understanding [9.1] 本研究では,動的語彙生成に基づく評価プロトコルを導入し,モデルがオブジェクトに対して正確な粒度記述を検出し,識別し,割り当てるかどうかを検証する。
提案プロトコルを用いて,最先端のオープンボキャブラリオブジェクト検出器を複数評価することにより,研究をさらに強化する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:40:52 GMT)
Multiple Toddler Tracking in Indoor Videos [9.0] 複数の幼児追跡(MTT)は、ビデオ映像中の幼児の識別と識別を含む。
従来のマルチオブジェクト追跡(MOT)アルゴリズムは多様なオブジェクトの追跡に適しているが、幼児には固有の課題がある。
本稿では,DeepSortアルゴリズムに基づくカスタマイズ手法MTTSortを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:19:14 GMT)
S-TLLR: STDP-inspired Temporal Local Learning Rule for Spiking Neural
Networks [8.9] スパイキングニューラルネットワーク(SNN)は生物学的に妥当なモデルであり、エッジにエネルギー効率の良いインテリジェンスをデプロイするための候補として特定されている。
本稿では,S-TLLRを提案する。S-TLLRはスパイク・タイミング依存塑性(STDP)機構にインスパイアされた新しい3要素時間的局所学習法である。
S-TLLRは、メモリと時間の複雑さが低く、時間ステップの数に依存しないように設計されており、低消費電力エッジデバイス上でのオンライン学習に適している。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:51:39 GMT)
BertRLFuzzer: A BERT and Reinforcement Learning based Fuzzer [8.9] 本稿では,BERT と Reinforcement Learning (RL) ベースのファジィザである BertRLFuzzer を提案する。
BertRLFuzzer は次のように機能する: 一組のシード入力が与えられた場合、ファザーは文法順守および攻撃誘発突然変異操作を行い、候補攻撃ベクトルを生成する。
攻撃開始までの時間(54%)、新たな脆弱性(17件)、攻撃率(4.4%)において、最も近い競合ツールと比較して、大幅な改善が見られた。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:43:29 GMT)
A Good Feature Extractor Is All You Need for Weakly Supervised Learning
in Histopathology [8.7] この研究は、現在までのSSL特徴抽出器の最も包括的な評価である。
汚れの正規化や画像の増大を省略することは下流の性能を損なうものではない。
本研究は,前処理の必要性を最小化し,特徴抽出器の選択を通知することで,デジタル病理の合理化を図っている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 00:06:13 GMT)
LGFCTR: Local and Global Feature Convolutional Transformer for Image
Matching [8.5] 局所的文脈とグローバル構造の両方を捉えるために,新しい畳み込み変換器を提案する。
普遍的なFPNライクなフレームワークは、トランスフォーマーによるクロスデコーダと同様に、自己エンコーダ内のグローバル構造をキャプチャする。
新たなレグレッションベースのサブピクセルリファインメントモジュールは、微粒なウィンドウ特徴を微粒な位置ずれレグレッションに活用する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:06:19 GMT)
LM-Cocktail: Resilient Tuning of Language Models via Model Merging [8.5] 本稿では,細調整モデルが汎用的な視点で弾力性を維持することができるLM-Cocktailを提案する。
本手法はモデルマージの形で実施する。
LLamaモデルとBGEモデルを用いて、一般的なベンチマークで包括的な実験を行う。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:18:38 GMT)
Exploring the Carbon Footprint of Hugging Face's ML Models: A Repository
Mining Study [8.4] この研究には、炭素排出量に関するHugging Face Hub APIに関する最初のリポジトリマイニング研究が含まれている。
本研究は,(1)MLモデル作成者がHugging Face Hub上でどのように二酸化炭素を計測し,報告するか,(2)トレーニングMLモデルの二酸化炭素排出量にどのような影響があるのか,という2つの研究課題に答えようとしている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 23:07:15 GMT)
LibSignal: An Open Library for Traffic Signal Control [8.3] 本稿では,信号制御タスクにおける強化学習モデルのクロスシミュレータ比較のためのライブラリを提案する。
このシステムは、Urban Mobility(SUMO)やCityFlowなどの交通信号制御タスクで一般的に使用されるシミュレータをサポートする。
これらの手法が、異なるシミュレーターで同じデータセットでかなり比較されたのは、これが初めてである。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:45:05 GMT)
Hierarchical Relationships: A New Perspective to Enhance Scene Graph
Generation [8.3] 本稿では,ラベル間の階層構造を関係やオブジェクトに活用することにより,シーングラフ生成システムの性能を大幅に向上させることができることを示す。
一対のオブジェクトインスタンス間の関係のスーパーカテゴリを共同で予測するために、ベイズ予測ヘッドを導入する。
Visual Genomeデータセットの実験は、特に述語分類とゼロショット設定において、その強力なパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:32:33 GMT)
Hierarchical Relationships: A New Perspective to Enhance Scene Graph
Generation [8.3] 本稿では,ラベル間の階層構造を関係やオブジェクトに活用することにより,シーングラフ生成システムの性能を大幅に向上させることができることを示す。
一対のオブジェクトインスタンス間の関係のスーパーカテゴリを共同で予測するために、ベイズ予測ヘッドを導入する。
Visual Genomeデータセットの実験は、特に述語分類とゼロショット設定において、その強力なパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:32:33 GMT)
A Bag of Receptive Fields for Time Series Extrinsic Predictions [8.2] 高次元時系列データは、そのダイナミックな性質、様々な長さ、欠落した値の存在のために課題を提起する。
本稿では,時系列畳み込みと1D-SAXの概念を取り入れたBag-Of-Receptive-FieldsモデルであるBORFを提案する。
BORF on Time Series Classification and Time Series Extrinsic Regression task using the full UEA and UCR repository。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:13:10 GMT)
Compilation for Surface Code Quantum Computers [8.1] 表面符号を実装した量子コンピュータにおける量子回路のコンパイル問題について検討する。
問題となるのは、(1)回路キュービットをデバイスキュービットにマッピングし、(2)相互作用するキュービットのペア間で実行経路をルーティングすることである。
例えば,ノード不連続経路の問題を解くために,グリーディアルゴリズムを利用してSCMRを効率的に緩和する手法を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:36:19 GMT)
Simple and Tighter Derivation of Achievability for Classical
Communication over Quantum Channels [7.9] 本研究は, 良質な測定値が, 結合境界として自然に果たす役割を示すものであることを示す。
古典量子 (c-q) チャネル符号化におけるワンショット達成可能性の導出は、エレガントな3行証明によって大幅に単純化される。
提案手法は,量子側情報を用いた古典的データ圧縮のワンショット達成性,量子チャネル上のエンタングルメント支援型古典的通信,および様々な量子ネットワーク情報処理プロトコルを導出する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:53:19 GMT)
Adaptive Circuit Learning of Born Machine: Towards Realization of
Amplitude Embedding and Data Loading [7.9] 本稿では,ACLBM(Adaptive Circuit Learning of Born Machine)という新しいアルゴリズムを提案する。
我々のアルゴリズムは、ターゲット状態に存在する複雑な絡み合いを最もよく捉える2ビットの絡み合いゲートを選択的に統合するように調整されている。
実験結果は、振幅埋め込みによる実世界のデータの符号化における我々のアプローチの習熟度を裏付けるものである。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:47:31 GMT)
Deepfakes, Misinformation, and Disinformation in the Era of Frontier AI, Generative AI, and Large AI Models [7.8] ディープフェイクとm/disinformationの拡散は、世界中の情報エコシステムの整合性に対する恐ろしい脅威として現れている。
我々は,大規模モデル(LM-based GenAI)をベースとした生成AIの仕組みを強調した。
我々は、高度な検出アルゴリズム、クロスプラットフォームのコラボレーション、ポリシー駆動のイニシアチブを組み合わせた統合フレームワークを導入する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 06:47:58 GMT)
Dynamical phase transition in quantum neural networks with large depth [7.8] 量子ニューラルネットワークの遅延学習力学は一般化されたロトカ・ボルテラ方程式によって記述できることを示す。
コスト関数の目標値が上から下まで達成可能な最小値を超えた場合、ダイナミクスはフリーズカーネルからフリーズエラーフェーズへと進化する。
どちらの位相においても、固定点への収束は指数関数であり、臨界点では指数関数となる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 23:14:33 GMT)
Are we going MAD? Benchmarking Multi-Agent Debate between Language
Models for Medical Q&A [7.7] 大規模言語モデル(LLM)の真正性を高めるための重要な戦略として,マルチエージェント討論(MAD)が登場した。
我々は、オープンソース実装とともに、医療Q&AのためのMAD戦略のベンチマークを提供する。
我々はこれらの知見に基づいて、以前公表されたQ&Aタスクの戦略より優れたエージェント合意に基づく、新たな議論促進戦略を提供する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:54:41 GMT)
Understanding Your Agent: Leveraging Large Language Models for Behavior
Explanation [7.6] 本研究では,状態や行動の観察のみに基づいて,エージェントの行動に関する自然言語説明を生成する手法を提案する。
提案手法は,人間ドメインの専門家が作成したものと同じくらい役立つ説明を生成する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:16:23 GMT)
Explaining CLIP's performance disparities on data from blind/low vision
users [7.6] 大型マルチモーダルモデル(LMM)は、視覚障害者(BLV)のための視覚支援の新たな時代を後押しする可能性を秘めている
しかし、これらのモデルはBLVユーザーが取得したデータに基づいて体系的に評価されていない。
ゼロショット分類タスクにおいて25のCLIP変種をテストし、その精度がWebcrawled画像よりもBLVユーザが取得した画像の平均15パーセント低いことを確認する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:10:31 GMT)
Zero-shot Conversational Summarization Evaluations with small Large
Language Models [7.5] 大きな言語モデル(LLM)は強力な要約能力を示す。
我々は,会話要約におけるLLMの評価を行い,その性能を様々なプロンプトで示す。
また、人間の評価によるモデルの評価を行い、会話要約におけるモデルの限界について議論する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:34:34 GMT)
GELDA: A generative language annotation framework to reveal visual
biases in datasets [7.3] バイアス分析は、コンピュータビジョンモデルのトレーニングと評価のための公正なデータセットを作成するプロセスにおける重要なステップである。
本稿では,GELDAを提案する。GELDAは大規模生成言語モデルを利用して,ドメインに対する様々な属性の提案とラベル付けを行うフレームワークである。
実際のデータセットの結果から、GELDAは正確で多様な視覚的属性の提案を生成し、クラスラベルと背景特徴の一致などのバイアスを明らかにすることができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:27:58 GMT)
Understanding the Effects of Using Parsons Problems to Scaffold Code
Writing for Students with Varying CS Self-Efficacy Levels [7.3] 本研究では,CS自己効力のレベルが異なる学生を対象に,Parsons問題をコード記述の足場として利用することの影響について検討した。
CS自己効力レベルが低い学生では,足場を受講した学生は,実践的パフォーマンスと実践的問題解決効率が有意に向上した。
このトピックに関する事前実践的な知識を持つ学生は、パーソンズの足場を効果的に活用する傾向があった。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 22:02:46 GMT)
LoCoMotif: Discovering time-warped motifs in time series [7.3] 時系列モチーフディスカバリ(英: Time Series Motif Discovery、TSMD)とは、時系列で何回も発生するパターンを識別するタスクである。
既存のTSMDの手法には以下の制限がある。
制限のないLoCoMotifという新しい方法を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:18:46 GMT)
Student Classroom Behavior Detection based on Spatio-Temporal Network
and Multi-Model Fusion [7.2] 生徒の授業行動を自動的に検出する深層学習手法は,授業成績を分析し,授業効果を向上させる上で有望なアプローチである。
しかし、学生の行動に関する公開データセットの欠如と、そのようなデータセットを手作業でラベル付けするコストは、この分野の研究者にとって大きな課題となっている。
学生教室シナリオデータセットを画像・時間的行動データセットを通じて拡張する手法を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 01:00:36 GMT)
Magnon squeezing by two-tone driving of a qubit in cavity-magnon-qubit
systems [7.1] ハイブリッドキャビティ-マグノン-量子ビット系におけるマグノン圧縮状態の生成手法を提案する。
生成された圧縮状態は1018ドル以上のスピンとマクロ量子状態を含むマグノンモードである。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 03:54:53 GMT)
Discovering Galaxy Features via Dataset Distillation [7.1] 多くのアプリケーションにおいて、ニューラルネット(NN)は、人間の能力以上の分類性能を持つ。
ここでは、このアイデアを銀河分類の非常に難しい課題に適用する。
ニューラルネットワークのレンズを通して原型銀河形態を要約し視覚化する新しい方法を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:39:31 GMT)
eMotions: A Large-Scale Dataset for Emotion Recognition in Short Videos [7.0] 短いビデオ(SV)が普及すると、SVにおける感情認識の必要性が生じる。
SVの感情データがないことから,27,996本のビデオからなるeMotionsという大規模データセットを導入する。
本稿では,ビデオトランスフォーマを用いて意味的関連表現をよりよく学習する,エンドツーエンドのベースライン方式AV-CPNetを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 03:24:30 GMT)
Differentiable matrix product states for simulating variational quantum
computational chemistry [7.0] 本稿では,変分量子固有解法(VQE)の並列化可能な古典シミュレータを提案する。
我々のシミュレーターは量子回路の進化を古典的自己微分フレームワークにシームレスに統合する。
応用として、我々のシミュレーターを用いて、一般的なHF、LiH、H$Oなどの小分子と、最大40ドルの量子ビットを持つより大きな分子であるCO$$、BeH$、H$_4$を研究する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:51:50 GMT)
B-LSTM-MIONet: Bayesian LSTM-based Neural Operators for Learning the
Response of Complex Dynamical Systems to Length-Variant Multiple Input
Functions [6.8] マルチインプットディープニューラル演算子(MIONet)は、異なるバナッハ空間における複数の入力関数を可能にするためにDeepONetを拡張した。
MIONetは、出力位置の制約なしにデータセットグリッド間隔をトレーニングする柔軟性を提供する。
この作業はMIONetを再設計し、Long Short Term Memory(LSTM)を統合して、時間依存のデータからニューラル演算子を学ぶ。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:38:17 GMT)
Boundary sensitive Lindbladians and relaxation dynamics [6.8] 2つの$U(1)$対称リンドブレディアンについて調べる: 1つは定常状態の電流を持ち、もう1つはそうではない。
その結果,両リンドブラディアンにおけるリウビリアスペクトル,固有モード,緩和時間の有意な変化が示唆された。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:52:47 GMT)
GraspCaps: A Capsule Network Approach for Familiar 6DoF Object Grasping [6.7] 本稿では、親しみのあるオブジェクトに対して、ポイントあたりの6Dグリップ構成を生成する新しいアーキテクチャであるGraspCapsを提案する。
また,シミュレートアニールを用いた大規模オブジェクトグラスピングデータセットの生成手法も提案した。
実験結果から,提案手法の全体的なオブジェクトグラスピング性能は,選択したベースラインよりも有意に優れていた。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:27:58 GMT)
A novel decomposed-ensemble time series forecasting framework: capturing
underlying volatility information [6.6] 本稿では, 時系列予測のパラダイムを提案する。このパラダイムは, 分解と, 時系列の揺らぎ情報を取得する能力を統合するものである。
各サブモードの数値データとボラティリティ情報の両方を利用してニューラルネットワークを訓練する。
このネットワークはサブモデムの情報予測に長けており、全てのサブモデムの予測を集約して最終的な出力を生成する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 01:41:23 GMT)
CommunityAI: Towards Community-based Federated Learning [6.5] コミュニティベースフェデレーション学習のための新しいフレームワークであるCommunityAIを提案する。
CommunityAIは、参加者の関心や専門知識、データ特性に基づいて、参加者をコミュニティにまとめることを可能にする。
我々は,解決すべき概念的アーキテクチャ,システム要件,プロセス,今後の課題について議論する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:31:52 GMT)
Enhancing Adversarial Attacks: The Similar Target Method [6.3] 敵対的な例は、ディープニューラルネットワークのアプリケーションに脅威をもたらす。
ディープニューラルネットワークは敵の例に対して脆弱であり、モデルのアプリケーションに脅威を与え、セキュリティ上の懸念を提起する。
我々はSimisal Target(ST)という類似の攻撃手法を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:58:16 GMT)
Improving Self-supervised Molecular Representation Learning using
Persistent Homology [6.3] 自己教師付き学習(SSL)は、分子表現学習に大きな可能性を秘めている。
本稿では,複数のスケールにまたがるデータのトポロジ的特徴をモデル化するための数学的ツールである永続ホモロジー(PH)に基づくSSLについて検討する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:58:30 GMT)
Knowledge Pursuit Prompting for Zero-Shot Multimodal Synthesis [6.2] 意味的詳細が不十分な不正確なプロンプトによる幻覚と不信な合成は、マルチモーダル生成モデルで広く観察されている。
我々は、外部知識を反復的に組み込んだゼロショットフレームワークであるKPP(Knowledge Pursuit Prompting)を提案する。
KPPは多様な視覚領域にまたがって忠実でセマンティックにリッチなコンテンツを生成することができ、マルチモーダル生成モデルを改善するための有望なソリューションを提供する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:51:46 GMT)
Unsupervised approaches based on optimal transport and convex analysis
for inverse problems in imaging [6.2] 本稿では,画像逆問題の解法として理論的に原理化された教師なし学習手法について検討する。
最適な輸送と凸解析に根ざした手法に着目する。
本稿では,確率収束型学習最適化アルゴリズムに関する最近の研究の概要について述べる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:57:06 GMT)
Variational Bayes image restoration with compressive autoencoders [6.2] 逆問題の正規化は、計算イメージングにおいて最重要となる。
本稿では,変分ベイズ潜時推定(VBLE)アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:49:31 GMT)
Estimates on Learning Rates for Multi-Penalty Distribution Regression [6.0] 本研究では,学習理論の枠組みに基づく分散回帰のためのマルチペナルティ正規化アルゴリズムについて検討する。
Hilbert 空間 $mathcalH_K$ と Mercer カーネル $K$ を平均埋め込み技術により再現する。
この研究は、既存の文献では研究されていない非標準設定$f_rhonotinmathcalH_K$における分布回帰の学習率も導出している。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 04:20:33 GMT)
Meta-Learning with a Geometry-Adaptive Preconditioner [6.0] 本稿では,モデルに依存しないメタ学習アルゴリズムの限界を克服するために,GAP(Geometry-Adaptive Preconditioned gradient descent)を提案する。
GAPはタスク固有のパラメータに依存するプレコンディショナーを効率的にメタ学習することができ、そのプレコンディショナーはリーマン計量であることを示すことができる。
実験結果から,GAPは最先端のMAMLファミリーとプレコンディショニング・グラデーション・マML(PGD-MAML)ファミリーを多種多様なショット学習タスクで上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 06:40:01 GMT)
KL-Divergence Guided Temperature Sampling [5.7] 温度が上がると、予測は多様になるが、幻覚にも弱い。
幻覚を緩和するための一般的なアプローチは、ソース/グラウンドのドキュメントを提供することである。
本稿では,デコードステップよりも温度が一定であることの制約を緩和すると共に,その発生源との関係に応じて動的温度を誘導する機構を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 23:57:03 GMT)
Description Generation using Variational Auto-Encoders for precursor
microRNA [5.7] 本稿では、Vari Auto-Encodersによる生成モデリングを利用して、pre-miRNAの潜伏因子を明らかにする新しいフレームワークを提案する。
フレームワークを分類に適用し、高い再構成と分類性能を得るとともに、正確な記述も開発する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:41:45 GMT)
Learning-driven Zero Trust in Distributed Computing Continuum Systems [5.6] ZT(Zero Trust)を学習技術と組み合わせることで、分散コンピューティング連続システムにおけるさまざまな運用およびセキュリティ上の課題を解決することができる。
我々はDCCS用に設計された新しい学習駆動型ZT概念アーキテクチャを提案する。
学習プロセスが要求を検出してブロックし、リソースアクセス制御を強化し、ネットワークオーバーヘッドを低減する方法を示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:41:06 GMT)
AART: AI-Assisted Red-Teaming with Diverse Data Generation for New
LLM-powered Applications [5.5] 大規模言語モデル(LLM)のアドバイザリテストは、安全で責任のあるデプロイメントに不可欠である。
本稿では,新しい下流アプリケーション上でのLCM生成の安全性をテストするために,逆評価データセットの自動生成のための新しいアプローチを提案する。
AI支援のレッドチーム(AART)と呼ばれています。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 23:18:16 GMT)
Effective Quantization for Diffusion Models on CPUs [5.4] 量子化(Quantization)は、ディープラーニングモデルを圧縮して効率を向上させる手法で、拡散モデルに適用する際の課題を提示する。
量子化学習と蒸留の両方を活用することで拡散モデルを定量化する新しい手法を提案する。
提案手法は,CPU上での推論効率を実証しながら,高画質な画像が得られることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:24:57 GMT)
Distributed AI in Zero-touch Provisioning for Edge Networks: Challenges
and Research Directions [5.4] ゼロタッチネットワークは、インテリジェントで柔軟なリソース供給戦略の創出を期待されている。
この記事では、エッジネットワークのための分散人工知能(DAI)とゼロタッチプロビジョニング(ZTP)を組み合わせる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:28:33 GMT)
Rethinking Attention: Exploring Shallow Feed-Forward Neural Networks as
an Alternative to Attention Layers in Transformers [5.4] 本研究は,従来のトランスフォーマーモデルにおけるアテンション機構の動作を模倣するために,標準の浅層フィードフォワードネットワークを用いることの有効性について分析した。
我々はトランスフォーマーの注意機構の重要な要素を簡単なフィードフォワードネットワークで置き換え、知識蒸留により元のコンポーネントを用いて訓練する。
IWSLT 2017データセットで実施した実験では,これらの“アテンションレストランスフォーマー(attentionless Transformers)”の能力が,オリジナルのアーキテクチャのパフォーマンスに匹敵することを示した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:41:36 GMT)
TransOpt: Transformer-based Representation Learning for Optimization
Problem Classification [5.3] 本稿では,トランスを用いたニューラルネットワークアーキテクチャを用いて,最適化問題インスタンスの表現を提案する。
本研究では,異なる問題次元に対して70%~80%の範囲で精度の高い問題クラスを認識できるように,トランスフォーマーに基づく手法を訓練可能であることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:20:47 GMT)
AnonPSI: An Anonymity Assessment Framework for PSI [5.3] Private Set Intersection (PSI) は、2つのパーティが共有データセットの切断された部分上で関数を安全に計算できるプロトコルである。
最近の研究は、Set Membership Inference Attacks(SMIA)の脆弱性を強調している。
本稿では,PSIにおける匿名性の評価について検討する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 22:13:53 GMT)
Comparing the Decision-Making Mechanisms by Transformers and CNNs via
Explanation Methods [5.2] 本稿では,データセット全体に対して深い説明アルゴリズムを適用する手法を提案する。
我々は、説明の量と性質から得られた統計を比較し、異なるモデルの意思決定に関する洞察を得る。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:13:37 GMT)
CLiSA: A Hierarchical Hybrid Transformer Model using Orthogonal Cross
Attention for Satellite Image Cloud Segmentation [5.2] ディープラーニングアルゴリズムは画像セグメンテーション問題を解決するための有望なアプローチとして登場してきた。
本稿では,Lipschitz Stable Attention NetworkによるCLiSA - Cloudセグメンテーションという,効果的なクラウドマスク生成のためのディープラーニングモデルを提案する。
Landsat-8, Sentinel-2, Cartosat-2sを含む複数の衛星画像データセットの質的および定量的な結果を示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:31:31 GMT)
Varying quench dynamics in the transverse Ising chain: the Kibble-Zurek,
saturated, and pre-saturated regimes [5.0] Kibble-Zurek機構によれば、欠陥密度とクエンチレートとの間には普遍的なパワー・ロー関係がある。
様々なクエンチのダイナミクスを観察し、飽和状態とキブルズールク状態の間に位置する飽和状態を特定する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:29:56 GMT)
How does spatial structure affect psychological restoration? A method
based on Graph Neural Networks and Street View Imagery [5.0] 都市部における空間構造と復元品質の関係を明らかにするために,空間依存型グラフニューラルネットワーク(GNN)を提案する。
道路のトポロジ的関係を非ユークリッド的なデータ構造としてモデル化した都市レベルのグラフは、復元の質を測定するために用いられた。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:20:10 GMT)
LiveNVS: Neural View Synthesis on Live RGB-D Streams [4.7] 本稿では,ライブRGB-D入力ストリーム上でニューラルノベルビューを合成するシステムLiveNVSを提案する。
LiveNVSは、キャプチャ中に未知のシーンの最先端のニューラルネットワークレンダリング品質を達成する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:29:45 GMT)
DTW+S: Shape-based Comparison of Time-series with Ordered Local Trend [4.6] そこで,同時期に発生し,容易に解釈可能な類似の傾向を求める尺度を開発した。
本稿では,時系列の解釈可能な「閉鎖性保存」行列表現を生成する新しい尺度DTW+Sを提案する。
DTW+Sは,ベースラインと比較して優れたクラスタリングを実現できる唯一の尺度であることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:21:52 GMT)
Mukhyansh: A Headline Generation Dataset for Indic Languages [4.6] Mukhyanshは、インド語の見出し生成に適した、広範囲にわたる多言語データセットである。
ムハーンシュ語は3億3900万以上の記事の見出しから成り、8つの著名なインドの言語にまたがっている。
Mukhyanshは、他のすべてのモデルより優れており、平均ROUGE-Lスコアは8言語すべてで31.43である。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:49:24 GMT)
Interpreting Differentiable Latent States for Healthcare Time-series
Data [4.6] 本稿では,高関係な入力特徴を用いて潜時状態の解釈を可能にする簡潔なアルゴリズムを提案する。
本手法により、実世界の医療データセットにおける夜間行動を予測するために、昼間の行動パターンを識別できることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:48:16 GMT)
Zero-Shot Self-Supervised Learning for MRI Reconstruction [4.5] そこで本研究では,ゼロショット型自己教師型学習手法を提案する。
提案手法は、単一のスキャンから利用可能な測定値を3つの解離集合に分割する。
画像特性の異なるデータベース上に事前学習されたモデルが存在する場合,提案手法は変換学習と組み合わせることで,より高速な収束時間と計算複雑性の低減を実現することができることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 03:43:13 GMT)
Hausdorff Distance Matching with Adaptive Query Denoising for Rotated
Detection Transformer [4.5] 回転物体検出におけるDETRの適用は、確立された指向性物体検出器と比較して、最適以下の性能を示す。
ハンガリーのマッチングに対するハウスドルフ距離に基づくコストを導入し、予測と地上の真実との相違をより正確に定量化する。
本稿では,モデル改善に寄与しない過剰なノイズクエリを選択的にフィルタリングするために,ハンガリー語マッチングを用いた適応型クエリ記述手法を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:56:29 GMT)
Linear normalised hash function for clustering gene sequences and
identifying reference sequences from multiple sequence alignments [4.3] 線形マッピングハッシュ関数と多重シーケンスアライメント(MSA)を組み合わせた新しい手法を開発した。
本手法は,ノカルディア属の16S rRNA遺伝子配列と高度に変異した(エンテロウイルス71のVP1ゲノム領域)配列を用いて評価した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:51:05 GMT)
Equivariant Parameter Sharing for Porous Crystalline Materials [4.3] 既存の結晶特性予測法は、制限的すぎる制約を持つか、単位細胞間で対称性を組み込むのみである。
我々は、結晶の単位セルの対称性をアーキテクチャに組み込んだモデルを開発し、多孔質構造を明示的にモデル化する。
提案手法は, 既存の結晶特性予測法よりも優れた性能を示し, 対称性の包含によりより効率的なモデルが得られることを確認した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:46:36 GMT)
The impact of responding to patient messages with large language model
assistance [4.2] ドキュメンテーションの負担はクリニックのバーンアウトに大きく貢献する。
多くの病院が電子カルテシステムに積極的に統合している。
我々は,患者の質問に対する臨床医の回答作成を支援するために,大規模言語モデルの有用性を初めて検討する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:10:58 GMT)
Hyperpolyglot LLMs: Cross-Lingual Interpretability in Token Embeddings [4.2] 言語間移動学習は多言語大言語モデル(LLM)の重要な特性である
1)事前学習とモデルアーキテクチャが言語表現に与える影響,2)言語モデルに埋め込まれた言語間表現の応用について検討する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:20:14 GMT)
TransNAS-TSAD: Harnessing Transformers for Multi-Objective Neural
Architecture Search in Time Series Anomaly Detection [4.2] 本稿では,トランスナS-TSADについて紹介する。トランスナS-TSADはニューラルアーキテクチャサーチ(NAS)でトランスフォーマーアーキテクチャをシナジする新しいフレームワークである。
評価の結果,TransNAS-TSADは従来の異常検出モデルを超え,多様なデータシナリオにおいて顕著な改善が見られた。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:13:32 GMT)
TurkishBERTweet: Fast and Reliable Large Language Model for Social Media
Analysis [4.2] 約9億のツイートを使って構築されたトルコのソーシャルメディアのための、最初の大規模な事前訓練された言語モデルであるTurrkBERTweetを紹介します。
このモデルは、BERTモデルと同じアーキテクチャで、入力長が小さく、BERTurkより軽量である。
TurkBERTweetは、汎用性において他の選択肢よりも優れており、推論時間が低いことは、大規模なデータセットを処理する上で大きな利点をもたらすことを実証する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:22:44 GMT)
A Probabilistic Method to Predict Classifier Accuracy on Larger Datasets
given Small Pilot Data [4.1] 分類器を構築する実践者は、多くの場合、より小さなパイロットデータセットから始まり、近い将来、より大きなデータに成長する計画である。
このようなプロジェクトには,データサイズが2倍,10倍,50倍の精度で向上するツールキットが必要だ。
本稿では,データセットのサイズが大きくなるにつれて,精度や類似のパフォーマンス指標の確率論的外挿を求めるプロセスモデルを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:10:15 GMT)
Meta Co-Training: Two Views are Better than One [4.1] 本稿では,Meta Pseudo Labelsアプローチを複数ビューに拡張したMeta Co-Trainingを提案する。
提案手法は,ImageNet-10%のトレーニングリソースをほとんど必要とせずに,新たな最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:11:58 GMT)
AviationGPT: A Large Language Model for the Aviation Domain [4.0] AviationGPTはオープンソースのLLaMA-2とMistralアーキテクチャ上に構築されており、慎重にキュレートされた多くの航空データセットで継続的に訓練されている。
さまざまな自然言語処理(NLP)問題に対処する汎用性など、ユーザにはさまざまなメリットがある。
また、航空領域内で正確かつ文脈的に関連する応答も提供する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:49:31 GMT)
Q-PAC: Automated Detection of Quantum Bug-Fix Patterns [4.0] 量子ソフトウェアの品質向上のための研究課題(Q-Repair)を提案する。
最終的な目標は、機械学習技術を使用して、既存の量子バグの修正パターンを自動的に予測することだ。
本フレームワークでは,抽象構文木,構文フィルタ,意味チェックを用いた7つのバグフィックスパターン検出器を開発した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:09:32 GMT)
Generation of a Compendium of Transcription Factor Cascades and
Identification of Potential Therapeutic Targets using Graph Machine Learning [4.0] 我々は、STRINGデータベースから抽出したデータを用いて、グラフ機械学習を用いてTFカスケードのコンペディションを作成する。
TFカスケード(TF Cascade)は、TFネットワークにおいて相互に制御し、直接経路を形成するTFのシーケンスである。
我々は,62個のTFからなる最も長いカスケードを持つ81,488個のTFカスケードの知識グラフを構築した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:31:58 GMT)
Mostly Beneficial Clustering: Aggregating Data for Operational Decision
Making [4.0] 本稿では,クラスタ構造を利用したクラスタ型シュランケンSAA手法を提案する。
問題の数が増えるにつれて、問題間で既知のクラスタ構造を活用することで、さらなるメリットが得られます。
提案手法は, 軽度条件下での一般的なコスト関数に拡張することができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:53:32 GMT)
PatchBMI-Net: Lightweight Facial Patch-based Ensemble for BMI Prediction [3.9] 健康度モニタリングのための自己診断型顔画像に基づくBMI予測手法を提案する。
これらの手法は、主に畳み込みニューラルネットワーク(CNN)ベースの回帰ベースライン(VGG19、ResNet50、Efficient-NetB0)を使用している。
本稿では,BMI予測のための軽量な顔パッチベースのアンサンブル(PatchBMI-Net)を開発し,スマートフォンによる展開と重量モニタリングを容易にすることを目的とする。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:39:24 GMT)
Realization of edge states along a synthetic orbital angular momentum
dimension [3.9] フォトニック軌道角運動量は適切な合成次元として機能する。
我々は、合成OAM次元に沿って鋭い境界を作り、空洞内の光学素子にピンホールを穴を開けることで、近似半無限格子を形成する。
我々の研究は、エッジ効果を観察し、実用的なフォトニクスツールを探索する新しい視点を提供する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:31:23 GMT)
CLIPC8: Face liveness detection algorithm based on image-text pairs and
contrastive learning [3.9] 画像テキストペアとコントラスト学習に基づく顔の生存度検出手法を提案する。
提案手法は,特定のシナリオにおいて,特定の生きた攻撃行動を効果的に検出することができる。
また、印刷写真攻撃やスクリーンリメイク攻撃などの従来の生きた攻撃方法の検出にも有効である。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:21:42 GMT)
Photo-induced charge carrier dynamics in a semiconductor-based ion trap
investigated via motion-sensitive qubit transitions [3.9] 本稿では,トラップイオンと光誘起層場との系統的相互作用により,半導体の光誘起帯電モデルを提案する。
イオンの熱運動から生じる不整合誤差とは対照的に、コヒーレント誤差は、イオンの量子制御中に顕著に印加される成層場によって引き起こされる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:19:55 GMT)
Uncertainty Guided Global Memory Improves Multi-Hop Question Answering [3.7] 本稿では,まず文書全体からメモリに関連情報を収集し,それをローカルコンテキストと組み合わせてタスクを解く2段階の手法を提案する。
実験結果から, メモリ拡張入力を用いた事前学習モデルの微調整により, モデルの性能が向上することが示唆された。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 23:45:57 GMT)
A novel feature selection method based on quantum support vector machine [3.7] 特徴の選択は、次元を減らし、モデルの精度と効率を改善するために機械学習において重要である。
本稿では,量子支援ベクトルマシンと遺伝的アルゴリズムを統合した量子支援ベクトルマシン特徴選択法(QSVMF)を提案する。
乳がんデータセットの特徴選択にQSVMFを適用し、QSVMFの性能と古典的アプローチを比較した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:08:26 GMT)
Towards out-of-distribution generalization in large-scale astronomical
surveys: robust networks learn similar representations [3.7] ニューラルネットワーク表現の類似度尺度である Centered Kernel Alignment (CKA) を用いて、表現類似度と性能の関係について検討する。
モデルが分散シフトに対して堅牢である場合、OODデータ上に層間でかなり異なる表現を生成することが分かりました。
本稿では,CKAを誘導バイアスとして取り入れることで,モデル設計,トレーニング戦略,OOD問題を緩和する上での類似性表現の可能性について論じる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:00:05 GMT)
A Nystr\"om method with missing distances [3.6] 本研究では、アンカーノードと呼ばれる固定点をペアで$m$にすることで、モバイルノードと呼ばれる$n$ポイントの設定を決定する問題について検討する。
標準設定では、アンカー間(アンカーアンカー)とアンカー間(アンカーアンカー)と移動ノード間(アンカーアンカーモービル)の距離に関する情報があるが、移動ノード間(モービルモービル)は分かっていない。
このセットアップのために、Nystr"omメソッドは移動ノードの位置を推定するための実行可能なテクニックである。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:43:49 GMT)
SICKLE: A Multi-Sensor Satellite Imagery Dataset Annotated with Multiple
Key Cropping Parameters [3.5] SICKLEと呼ばれるファースト・オブ・ザ・キンドのデータセットを導入する。
ランドサット8、センチネル1、センチネル2の3つの異なる衛星からの多重解像度画像の時系列を構成する。
我々はSICKLEを作物の種類、作物の表現学(播種、移植、収穫)、収量予測の3つのタスクでベンチマークした。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:20:58 GMT)
Using Ornstein-Uhlenbeck Process to understand Denoising Diffusion
Probabilistic Model and its Noise Schedules [3.4] 拡散確率モデルDDPMを時相連続マルコフ過程で表現できることを示す。
驚いたことに、この連続時間マルコフ過程はよく知られ、よく研究されているオルンシュタイン・オレンベック過程である。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:36:33 GMT)
Dynamic interactive group decision making method on two-dimensional
language [3.4] 本稿では,2次元言語情報に基づく動的グループ意思決定手法を提案する。
動的対話型グループ意思決定手法と2次元言語評価情報を組み合わせる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 22:22:55 GMT)
LiDAR-based Outdoor Crowd Management for Smart Campus on the Edge [3.1] エッジコンピューティングを活用した屋外クラウドマネージメントを実現するために,安価な光検出・測光技術(LiDAR)を用いて検討する。
ライトポールにLiDARセンサーを配置し、キャンパスの群衆からデータを収集し、エッジアクセラレータを利用してデータをローカルに処理します。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:45:33 GMT)
Experimental graybox quantum system identification and control [2.9] 我々は、量子システムの物理モデルを構築し、最適制御の設計に利用する「グレーボックス」アプローチを実験的に実証した。
提案手法は,物理原理と高精度な機械学習を組み合わせることで,必要な制御量を直接測定できないような問題に対して有効である。
この方法は自然に時間依存的かつオープンな量子システムに拡張され、量子ノイズ分光とキャンセルへの応用がある。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:22:01 GMT)
Algorithmic Assistance with Recommendation-Dependent Preferences [2.9] 共同意思決定における主エージェントモデルを提案する。
我々は、レコメンデーションに依存した選好が、意思決定者がレコメンデーションに過度に反応する非効率性を生み出すことを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:57:23 GMT)
Adaptive Smooth Activation for Improved Disease Diagnosis and Organ
Segmentation from Radiology Scans [2.8] 本稿では,適応平滑化ユニット (ASAU) と呼ばれる新しいアクティベーション関数を提案する。
医学画像解析において, ASAU は, CT と MRI における自動疾患診断と臓器分割という, 重要かつ一般的に用いられる2つの一般的な課題に適用する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:16:55 GMT)
The density-functional theory of quantum droplets [2.8] 量子滴では、平均場エネルギーはリー=フン=ヤン(LHY)エネルギーに匹敵する。
本稿では,量子滴の密度汎関数理論について述べる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 06:48:57 GMT)
The density-functional theory of quantum droplets [2.8] 量子滴では、平均場エネルギーはリー=フン=ヤン(LHY)エネルギーに匹敵する。
本稿では,量子滴の密度汎関数理論について述べる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 06:48:57 GMT)
Weakly-semi-supervised object detection in remotely sensed imagery [2.7] リモートセンシング画像を用いた弱半教師付き物体検出(WSSOD)モデルを構築した。
我々は,FAIR1Mのバウンディングボックスラベル画像と風車検出データセットを用いて,大量の点ラベル付き画像を使用するWSSODモデルを訓練する。
2-10倍少ない境界ボックスラベル付き画像でトレーニングされたWSSODモデルは、フルセットの有界ボックスラベル付き画像でトレーニングされた完全教師付きモデルと同様に、または性能が良くなることがわかった。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:43:04 GMT)
SAIBench: A Structural Interpretation of AI for Science Through
Benchmarks [2.6] 本稿では,構造解釈として知られる新しいベンチマーク手法を提案する。
それは2つの重要な要件に対処する: 問題空間における信頼された操作範囲を特定し、エラーを計算コンポーネントにトレースする。
構造解釈の実用性と有効性は、3つの異なるAI4Sワークロードへの適用を通じて説明される。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:17:35 GMT)
A natural language processing-based approach: mapping human perception
by understanding deep semantic features in street view images [2.6] 本研究では,人間の知覚とシーンの関係を理解するために,事前学習型自然言語モデルに基づく新しいフレームワークを提案する。
以上の結果から, 深い意味的特徴による人間の知覚評価は, 浅い特徴を持つ機械学習手法による従来の研究よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:00:43 GMT)
The perpetual motion machine of AI-generated data and the distraction of
ChatGPT-as-scientist [2.6] ChatGPTがうまく機能しているので、私たちはAIで科学を解こうとしているのだろうか?
AlphaFold2は、生物学や科学におけるLLMのポテンシャルは無限だと示唆していますか?
AI自体を使って、科学におけるデータの欠如を埋めて、AIを訓練できるだろうか?
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:52:34 GMT)
Turn Down the Noise: Leveraging Diffusion Models for Test-time
Adaptation via Pseudo-label Ensembling [2.5] テスト時間適応の目標は、ソースデータに頼ることなく、継続的に変化するターゲットドメインにソース予測モデルを適用することである。
本稿では,事前学習した拡散モデルを用いて,対象領域の画像がソース領域に近づくように投影する手法を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:35:32 GMT)
Effective Learning with Node Perturbation in Deep Neural Networks [2.3] バックプロパゲーション(BP)は、ディープニューラルネットワークモデルのパラメータをトレーニングするための支配的かつ最も成功した手法である。
node perturbation (NP) は、ネットワークアクティベーションにノイズを注入することで学習を提案する。
NPは、非誘導ノイズに基づく探索プロセスのため、データ非効率で不安定である。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:13:35 GMT)
Dynamic Neighborhood Construction for Structured Large Discrete Action
Spaces [2.3] 大規模離散行動空間(LDAS)は、強化学習における中心的な課題である。
既存のソリューションアプローチでは、最大数百万のアクションで非構造化LDASを処理できる。
本研究では, SLDAS の新たな活用パラダイムである Dynamic Neighborhood Construction (DNC) を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:58:05 GMT)
Accelerating DNN Training With Photonics: A Residue Number System-Based
Design [2.3] フォトニックコンピューティングはディープニューラルネットワーク(DNN)における高効率行列乗算を実現するための魅力的な道である
本研究では、アナログ領域でモジュラー演算を行うRSSベースのフォトニックテンソルコアに対して、新しいマイクロアーキテクチャとデータフローを提案する。
RNS推論とフォトニクスを組み合わせることで、ミラージュは精度を損なうことなく高い効率を提供する。
我々の研究では、シストリックと比較して、MirageはいくつかのDNNで平均23.8時間以上のトレーニングと32.1時間以下をアイソエネルギーのシナリオで達成している。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:40:12 GMT)
Guarantees for Self-Play in Multiplayer Games via Polymatrix
Decomposability [2.3] セルフプレイ(Self-play)は、学習アルゴリズムが自分自身のコピーと対話して学習するマルチエージェントシステムにおける機械学習のテクニックである。
両プレイヤーの定数ゲームでは、ナッシュ均衡に達するセルフプレイが保証され、ポストトレーニング中の対戦相手に対して良好に機能する戦略が作成できることを示す。
本研究は,マルチプレイヤーゲームの構造的特性を初めて同定し,多種多様なセルフプレイアルゴリズムによって生成される戦略の性能保証を実現する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:39:17 GMT)
Learning to Simulate: Generative Metamodeling via Quantile Regression [2.3] 我々は「シミュレーターの高速シミュレータ」を構築することを目的とした、生成メタモデリングと呼ばれる新しいメタモデリング概念を提案する。
一度構築すると、生成メタモデルは入力が特定されるとすぐに大量のランダム出力を生成することができる。
本稿では,QRGMM(quantile-regression-based generative metamodeling)という新しいアルゴリズムを提案し,その収束率と収束率について検討する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:46:24 GMT)
A sparse coding approach to inverse problems with application to
microwave tomography [2.2] 哺乳類の視覚系に触発された自然画像に対して,現実的でコンパクトで効果的な生成モデルを提案する。
これにより、大量の画像の集合上でモデルをトレーニングすることで、不測の線形逆問題に対処することができる。
マイクロ波トモグラフィー画像における非線形および不適切な問題に対するスパース符号化の適用を拡大する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:20:59 GMT)
An Attribution Method for Siamese Encoders [2.1] 本稿では,複数の入力を持つモデルに対する積分勾配の原理を一般化することにより,シームズエンコーダの局所帰属法を導出する。
パイロットスタディでは、STでは少数のトークンペアが多くの予測を説明でき、名詞や動詞に焦点を絞っていることが示されている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:12:00 GMT)
RoKEPG: RoBERTa and Knowledge Enhancement for Prescription Generation of
Traditional Chinese Medicine [2.1] 漢方薬の処方生成のためのRoBERTaと知識強化モデル(RoKEPG)を提案する。
RoKEPGは、アテンションマスクマトリックスを通して、TCMの知識の4つのクラスを導入することで、TCM処方薬を生成するためにガイドされる。
一般に公開されているTCM処方データセットの実験結果から、RoKEPGはベースラインモデルよりも約2%改善していることがわかった。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 01:59:38 GMT)
Supervising the Centroid Baseline for Extractive Multi-Document
Summarization [2.0] セントロイド法は抽出多文書要約の簡単な方法である。
文選択にビームサーチプロセスを加えて改良し、さらにセントロイド推定アテンションモデルを適用して改善した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:11:45 GMT)
The performance of random bosonic rotation codes [2.0] ボゾン回転符号はウィグナー関数の離散回転対称性によって特徴づけられる。
我々は、損失や軽蔑に対する彼らのパフォーマンスを数値的に探求する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:54:26 GMT)
Issue Report Validation in an Industrial Context [2.0] 我々は、トルコ語で書かれた銀行部門で、ランダムに選択された1200の発行報告に取り組んでいる。
手動でこれらのレポートに妥当性をラベル付けし、それらが無効であることを示す関連パターンを抽出する。
提案する特徴抽出器を用いて,機械学習による課題報告の妥当性の予測を行い,0.77F1スコアを実行する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:24:13 GMT)
A trainable manifold for accurate approximation with ReLU Networks [2.0] 本稿では,ReLU活性化ニューラルネットワークの重み制御を高速化する新しい手法を提案する。
我々は、これらの新しいネットワークの出力が指数関数的に多くの断片的線形セグメントを利用するような重みの多様体を導出する。
我々はこれらのネットワークを、必ずしも多様体上にあるとは限らない近似関数に訓練し、従来のアプローチよりも誤差値の顕著な減少を示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:09:48 GMT)
GLiDR: Topologically Regularized Graph Generative Network for Sparse
LiDAR Point Clouds [1.9] 希少なLiDAR点雲は、静的構造の細部が著しく失われ、ナビゲーションに利用可能な静的点の密度が低下する。
本稿では,0次元永続ホモロジー(PH)制約を用いてトポロジカルに正規化されたグラフ生成ネットワークGLiDRを提案する。
GLiDRは32xスペーサーダイナミックスキャンを使用して正確な静的点を生成し、3つのデータセットのベースラインよりもパフォーマンスがよい。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:59:00 GMT)
Exploring the Relationship between Samples and Masks for Robust Defect
Localization [1.9] 本稿では,モデルプロセスなしで欠陥パターンを直接検出する一段階フレームワークを提案する。
欠陥の位置を示す可能性のある明示的な情報は、直接マッピングを学ぶことを避けるために意図的に除外される。
その結果,提案手法はF1-ScoreのSOTA法よりも2.9%高い値を示した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 04:00:00 GMT)
A Comprehensive Augmentation Framework for Anomaly Detection [1.9] 本稿では,再構成ネットワークのトレーニングに寄与するシミュレーション異常の重要な特徴を解析する。
我々は、このフレームワークを再構築ベースのアプローチと統合し、同時に分割トレーニング戦略を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 03:33:51 GMT)
FedAgg: Adaptive Federated Learning with Aggregated Gradients [1.8] フェデレートラーニング(FL)は、分散モデルトレーニングの新たな標準となっている。
本稿では,局所パラメータと大域パラメータの偏差を考慮した適応学習率反復アルゴリズムを提案する。
提案手法は,IIDおよび非IIDデータ分布を持つ実世界のデータセットにおけるモデル精度と収束率の両方において,最先端のFLスキームよりも優れている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:41:33 GMT)
Aggregation Model Hyperparameters Matter in Digital Pathology [1.8] デジタル病理学は、ギガピクセル全スライディング画像(WSI)の解析を通じて、疾患検出と病理学の効率を著しく向上させた
表現学習の急速な進化に伴い、多くの新しい特徴抽出モデルが登場した。
従来の評価手法は、結果にバイアスを与える可能性のあるフレームワークである、固定集約モデルハイパーパラメータに依存しています。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:54:25 GMT)
Light ray fluctuation and lattice refinement of simplicial quantum
gravity [1.7] 格子幅の異なる3次元および4次元の光線揺らぎ確率を計算する。
結果は、光のゆらぎによって反射される量子時空のゆらぎが自然に顕微鏡的に始まり、微視的に穏やかになるという直感に適合する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:55:12 GMT)
A Feasibility Study on Indoor Localization and Multi-person Tracking
Using Sparsely Distributed Camera Network with Edge Computing [1.7] 本研究では,大規模屋内空間内のエッジコンピューティングデバイスに実装されたカメラによる屋内位置推定と多人数追跡システムを提案する。
パイプラインでは,平均位置推定誤差が1.41m,多目的追跡精度が88.6%,絶対絶対方位誤差が29度であった。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:23:09 GMT)
Biomedical knowledge graph-enhanced prompt generation for large language
models [1.7] 大規模言語モデル(LLM)はAIの進歩を前例のない速度で加速させてきたが、バイオメディシンのような知識集約ドメインでは依然として課題に直面している。
本稿では,既存の知識に根ざした有意義なバイオメディカルテキストを生成するために,タスク非依存の知識グラフに基づく検索用RAG(Retrieval Augmented Generation)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 03:07:00 GMT)
Fusion of Single and Integral Multispectral Aerial Images [1.6] 本稿では,従来の空中画像から最も重要な特徴を抽出するための,新しいハイブリッド(モデルと学習に基づく)アーキテクチャを提案する。
環境の空間的参照と、排除されていないターゲットの特徴を組み合わせる。
提案手法は,手動で調整したパラメータを必要とせず,任意の数とスペクトルチャネルの組み合わせに拡張可能であり,異なるユースケースに対処するために再構成可能である。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:38:42 GMT)
PKU-I2IQA: An Image-to-Image Quality Assessment Database for AI
Generated Images [1.6] 我々はPKU-I2IQAという人間の知覚に基づく画像から画像へのAIGCIQAデータベースを構築した。
本研究では,非参照画像品質評価法に基づくNR-AIGCIQAとフル参照画像品質評価法に基づくFR-AIGCIQAの2つのベンチマークモデルを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:16:08 GMT)
On Double Descent in Reinforcement Learning with LSTD and Random
Features [1.6] 時間差分法(TD)アルゴリズムは深層強化学習(RL)において広く用いられている
本稿では,ネットワークサイズと$l$-regularizationが性能に与える影響を理論的に分析する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:54:05 GMT)
Does Hawking effect always degrade fidelity of quantum teleportation in
Schwarzschild spacetime? [1.6] シュワルツシルト時空のユーザ間におけるディラック場の量子テレポーテーションの忠実性について検討する。
ホーキング温度の上昇に伴い、量子テレポーテーションの忠実度は単調に増加する。
また、量子ステアリングはシュワルツシルト時空における量子テレポーテーションの完全性を保証することはできない。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:37:00 GMT)
Analyzing the Domain Shift Immunity of Deep Homography Estimation [1.5] CNNによるホモグラフィー推定モデルは、ドメインシフトに対する特異な免疫性を示す。
本研究は,ドメインシフトに対する様々な深層ホモグラフィ推定モデルのレジリエンスについて検討する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:25:28 GMT)
An ab initio framework for understanding and controlling quantum
fluctuations in highly multimoded light-matter systems [1.4] 光と物質の多モード系における量子ノイズを記述するための新しい理論的枠組みを導入,実験的に検証した。
超高速マルチモードシステムの量子ノイズ力学において、我々の理論の未解明側面をテストする実験を開発する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:29:12 GMT)
The Forecastability of Underlying Building Electricity Demand from Time
Series Data [1.4] ビルのエネルギー消費予測は、ビルのエネルギー管理システムにおいて有望な解決策となっている。
建物の将来的なエネルギー需要を予測するデータ駆動のアプローチは、科学文献で見ることができる。
このような建物のエネルギー需要を予測するために利用できる最も正確な予測モデルの同定は依然として困難である。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:47:47 GMT)
Predicting breast cancer with AI for individual risk-adjusted MRI
screening and early detection [1.3] 本稿では,現在のMRIに基づいて1年以内に乳癌の発症リスクを予測することを提案する。
検診・診断を施行した12,694例の乳房53,858例を対象にAIアルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:52:53 GMT)
Nonlinear time-reversal interferometry with arbitrary quadratic
collective-spin interaction [1.2] 任意の2次集団-スピン相互作用によって生じるスピンスクイーズに基づいて,高ロバスト性およびメロジカルゲインを有する時間反転干渉法を提案する。
本研究は,原子間非線形干渉法において高精度かつロバスト性を達成するためのベンチマークを定めている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:31:36 GMT)
A model of quantum gravity on a noisy quantum computer [1.2] 我々は、IBMの超伝導量子ビット量子コンピュータ上で、量子重力の重要な玩具モデルであるSachdev-Ye-Kitaev(SYK)モデルについて研究する。
N$ Majorana fermions for $mathcalO(N5 J2t2/epsilon)$$J$ is the dimensionful coupling parameter, $t$ is the evolution time, $epsilon$ is the desired accuracy。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:00:00 GMT)
An Efficient High-Dimensional Gene Selection Approach based on Binary
Horse Herd Optimization Algorithm for Biological Data Classification [1.2] Horse Herd Optimization Algorithm (HOA)は、異なる年齢の馬の行動に基づく新しいメタヒューリスティックアルゴリズムである。
本稿では、離散的な問題を解くためにHOAのバイナリバージョンを提案し、特徴部分集合を選択する。
提案手法 (MRMR-BHOA) は, 精度, 最小選択特性において優れた性能を示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:02:39 GMT)
Inference of CO2 flow patterns -- a feasibility study [1.1] 本研究の目的は, 坑井および地震探査データから正規流および不規則流の流動パターンを推定できる定式化を開発することである。
推測の不確実性は、観測された誤差とよく相関しているので妥当であると確信している。
この不確実性は、地震データにおけるノイズと、貯水池の流動特性に関する正確な知識の欠如に起因する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 01:55:38 GMT)
Upper bounds on key rates in device-independent quantum key distribution
based on convex-combination attacks [1.1] 上界DIQKDキーレートの効率的かつ使いやすい手法として凸結合攻撃を提案する。
最先端プロトコルのキーレートの低いバウンダリの精度を検証することができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:18:37 GMT)
Detecting genuine multipartite entanglement via machine learning [1.1] 3ビット状態の真の多部絡み検出のための教師付きおよび半教師付き機械学習について検討する。
我々は,予測サンプルのグループ化を最適化し,反復予測を行うS4VMの訓練方法を改善する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:31:22 GMT)
When Mei-Gu Guan's 1960 Postmen Get Empowered with Bell's 1964 Nonlocal
Correlations, or, Nonlocal Advantage in Vehicle Routing Problem [1.0] 車両ルーティング問題は、車両の効率的なスケジューリングとルーティングのための戦略的および戦術的な意思決定を必要とする。
非局所的相関は、通信しないポストメンのコストを最適化する利点を提供し、トラフィックルーティング問題における量子絡みの突発的利用を確立する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:15:15 GMT)
RACED: Routing in Payment Channel Networks Using Distributed Hash Tables [1.0] ペイメントチャネルネットワーク(PCN)のようなオフチェーンの金融メカニズムは、ブロックチェーンに各トランザクションを記述することなく、マイクロペイメントトランザクションを含むさまざまな量のトランザクションを処理するのに役立つ。
本稿では,分散ハッシュテーブル(DHT)の考え方を利用して,PCN内のトランザクションを高速かつセキュアにルーティングするルーティングプロトコル RACED を提案する。
実世界のトランザクションデータセットに関する我々の実験によると、RASDは平均トランザクション成功率98.74%、平均パスフィニング時間は31.242秒、平均パスフィニング時間は1.65*103$、1.8*103$、および4.4である。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:31:15 GMT)
Enhancing Answer Selection in Community Question Answering with
Pre-trained and Large Language Models [0.9] まず,質問応答型クロスアテンションネットワーク(QAN)を提案する。
次に,大規模言語モデル(LLM)を用いて,知識拡張による回答選択を行う。
実験の結果、QANモデルが2つのデータセット、SemEval2015とSemEval 2017の最先端のパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:24:50 GMT)
FASER: Binary Code Similarity Search through the use of Intermediate
Representations [0.9] クロスアーキテクチャバイナリコード類似性検索は、多くの研究で研究されている。
本稿では,Function as a String Encoded Representation (FASER)を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:30:29 GMT)
Toward a Surgeon-in-the-Loop Ophthalmic Robotic Apprentice using
Reinforcement and Imitation Learning [0.9] 眼内白内障手術における外科医中心の自律エージェントに対するシミュレーションに基づく画像誘導アプローチを提案する。
本研究は,外科医の行動と嗜好をトレーニングプロセスに組み込むことで,ロボットが個別の外科医の独特なアプローチを暗黙的に学習し適応することを可能にする。
我々のアプローチは、他の眼科手術に拡張する可能性があり、新しい世代の手術ロボットへの扉を開く。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:00:06 GMT)
Adapting Sentence Transformers for the Aviation Domain [0.8] 本稿では,航空分野における文変換器の適応手法を提案する。
本手法は,事前学習と微調整を併用した2段階のプロセスである。
本研究は,航空などの専門産業における高品質なNLPソリューション開発におけるドメイン固有適応の重要性を強調した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:45:46 GMT)
Anomalous Behavior Detection in Trajectory Data of Older Drivers [0.8] 本稿では,時間的詳細トラジェクトリデータセットの重要な特性を表現できるエッジ属性行列を提案する。
実世界のデータセットを用いた実験により,本手法は異常運転行動を認識することを示した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:22:28 GMT)
Using Stochastic Gradient Descent to Smooth Nonconvex Functions:
Analysis of Implicit Graduated Optimization with Optimal Noise Scheduling [0.8] 本稿では、バッチ最適化の非ファミリー関数を定義する。
学習率の低下と学習規模の増加が、固定学習率よりも優れている理由に関する理論的洞察を提供する。
また、崩壊する学習率と増大するサイズを使用する、新しい累積バッチ最適化フレームワークも提供する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 03:12:00 GMT)
Cascade: A Platform for Delay-Sensitive Edge Intelligence [0.8] Cascadeは、このパズルを解き放つためのAI/MLホスティングプラットフォームだ。
評価の結果,カスケードはスループットを損なうことなく,桁違いに遅延を低減できることがわかった。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 03:03:21 GMT)
Understanding the interplay of entanglement and nonlocality: motivating
and developing a new branch of entanglement theory [0.8] ローカルオペレーションと共有ランダムネス(LOSR)は、非局所性の異常の解決を提供する。
LOSRは真の多部交絡と非局所性という新たな概念を必要とすることを示す。
本研究は,新しい絡み合い理論の分野としてのLOSR絡み合いの研究を動機づけるものである。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 00:46:57 GMT)
Eden: An Ultra Fast, Provably Secure, and Fully Decentralized Blockchain Interoperability Protocol [0.8] 我々は,超高速でセキュアなクロスチェーン通信を実現するために,ゼロ知識MapReduceフレームワークを活用した弾力的な分散型送信ネットワークであるEdenを紹介する。
我々は、Edenの設計選択、包括的セキュリティモデル、そして、困難なネットワーク条件下であっても、弾力性とレジリエンスを確保するために組み込まれている革新的なメカニズムについて詳述する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:52:07 GMT)
Continuous optimization by quantum adaptive distribution search [0.7] 量子適応分布探索(QuADS)を導入する。
QuADSはGrover Adaptive Search(GAS)と共分散行列適応-進化戦略(CMA-ES)を統合した。
数値実験により、QuADSはGASとCMA-ESの両方に優れていた。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 04:48:09 GMT)
Self-Driving Telescopes: Autonomous Scheduling of Astronomical
Observation Campaigns with Offline Reinforcement Learning [0.7] 我々は、ストーンエッジ天文台(SEO)の観測スケジュールを最適化するために、シミュレーションデータを用いてDeep Q-Network(DQN)の複数の実装をテスト、比較する。
DQNは,テストセットの各状態における達成可能な最大報酬の87%以上-6%の報酬を得られることを示す。
これは、特定の天文学的課題に対するオフラインRLアルゴリズムの最初の比較であり、そのような比較と評価を行うための最初のオープンソースフレームワークである。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:23:30 GMT)
End-to-end complexity for simulating the Schwinger model on quantum
computers [0.7] シュウィンガーモデルハミルトニアンのブロック符号化の効率的な実装を提案する。
エンド・ツー・エンドのアプリケーションとして、真空永続振幅を計算する。
本研究は,FTQC時代の量子コンピュータの性能予測に関する知見を提供する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 06:36:11 GMT)
Robust Correlated Equilibrium: Definition and Computation [0.7] 本研究は,N-player 有限ゲームにおいて,基本システムにおける時間的変動によるコストの変動について検討する。
相関平衡の定義を一般化するロバスト相関平衡の概念を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:41:17 GMT)
Transform, Contrast and Tell: Coherent Entity-Aware Multi-Image
Captioning [0.7] コヒーレントエンティティを意識したマルチイメージキャプションは、ニュース文書に隣接する画像のコヒーレントキャプションを生成することを目的としている。
本稿では,コヒーレンス関係を利用して,コヒーレントな実体認識型マルチイメージキャプションモデルを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:31:42 GMT)
Subsystem CSS codes, a tighter stabilizer-to-CSS mapping, and Goursat's
Lemma [0.5] 本研究では,2つの基本となる古典符号のデータのみを用いて,Steane型デコーダを開発する。
サブシステムの安定化コードを2倍にすることで,物理数,論理数,ゲージ数,コード距離の最大2倍のサブシステムCSSコードが得られることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:00:04 GMT)
Social AI Improves Well-Being Among Female Young Adults [0.5] ChatGPTのような言語モデルの台頭は、新しいエンターテイメントの形式としてSocial AIを導入した。
本稿では,これらの相互作用がユーザの社会的・精神的健康に及ぼす影響について検討する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 01:11:00 GMT)
Improving the Performance of Digitized Counterdiabatic Quantum
Optimization via Algorithm-Oriented Qubit Mapping [0.5] 本稿では,ディジタル化された反断熱量子最適化アルゴリズムの性能向上戦略を提案する。
提案手法は,誤差軽減を伴わない平均4.49$times$の近似比を増大させる。
本研究は,量子ビットマッピングとアルゴリズムパラメータの最適化に適したアルゴリズム実装の符号設計に関する貴重な知見を提供する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:12:45 GMT)
Efficient Computation of Sparse and Robust Maximum Association
Estimators [0.5] 高次元経験例は、この手順の有用性を裏付けるものである。
ラグランジアンアルゴリズムとスパース降下の組み合わせはスパース空間の誘導に適した制約を含むように実装されている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:57:50 GMT)
Active learning for data streams: a survey [0.5] オンラインアクティブな学習は機械学習のパラダイムであり、データストリームからラベルに最も情報のあるデータポイントを選択することを目的としている。
それぞれの観測に注釈をつけるのは時間と費用がかかり、大量のラベル付きデータを得るのが難しくなる。
本研究の目的は、データストリームから最も情報性の高い観測をリアルタイムで選択するための、最近提案されたアプローチの概要を提供することである。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:07:15 GMT)
SenTest: Evaluating Robustness of Sentence Encoders [0.4] 本研究は文エンコーダの堅牢性を評価することに焦点を当てる。
我々はその堅牢性を評価するためにいくつかの敵攻撃を用いる。
実験結果は文エンコーダの堅牢性を強く損なう。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:21:35 GMT)
Modular Neural Networks for Time Series Forecasting: Interpretability
and Feature Selection using Attention [0.4] 本稿では,構築によって解釈可能な時系列予測のための新しいモジュール型ニューラルネットワークモデルを提案する。
リカレントニューラルネットワークはデータ内の時間的依存関係を学習し、アテンションベースの特徴選択コンポーネントは最も関連性の高い特徴を選択する。
モジュール型のディープネットワークは、選択した機能から独立してトレーニングされ、ユーザーが機能がどのように結果に影響を与えるかを示し、モデルを解釈できる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:23:42 GMT)
Collaborative software design and modeling in virtual reality [0.4] 本研究の目的は,バーチャルリアリティ(VR)における分散ソフトウェア設計活動を支援することである。
非VRソフトウェア設計環境と比較して,VRソフトウェア設計環境を用いた場合のコラボレーション効率と設計情報のリコールを評価した。
非VR環境と比較して,VRを用いた場合,設計情報の効率性やリコールに有意な差は認められない。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:34:15 GMT)
Defining Reference Sequences for Nocardia Species by Similarity and
Clustering Analyses of 16S rRNA Gene Sequence Data [0.3] ノカルディアの364種の16S rRNA遺伝子配列を調べた。
LMアルゴリズムは最高性能を達成し、364の16S rRNA配列を80のクラスタに分類した。
単純なkNN機械学習は最高性能を示し、92.7%の精度でNocardia種を分類した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:09:02 GMT)
sec-certs: Examining the security certification practice for better vulnerability mitigation [0.3] 致命的な脆弱性は保証レベルの高い認定製品で発見される。
このような脆弱性によって認定された製品が影響を受けるかを評価するのは、非構造化の認定関連データが大量にあるため、複雑である。
既存の認定製品にどのような脆弱性が影響するか、認定された製品が相互に参照する方法を学ぶために、教師なしのモデルをトレーニングしました。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:55:16 GMT)
Fundamental accuracy-resolution trade-off for timekeeping devices [0.3] 我々は,これらの事象の時間的確率集中とみなすことのできる,最も基本的な熱化現象に注目した。
我々は、このクロック精度と分解能の基本的なトレードオフに対処し、基本的な熱化イベントがメモリレスである全てのクロックの普遍的な境界を証明した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:31:57 GMT)
Fault-Tolerant Quantum Memory using Low-Depth Random Circuit Codes [0.2] 低深さランダム回路符号は、量子誤り訂正に望ましい多くの特性を有する。
1次元ランダム回路符号の符号化状態を作成するための耐故障性蒸留プロトコルを設計する。
数値シミュレーションにより,提案プロトコルはエラー率を最大2%の誤差率で補正できることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:00:00 GMT)
A Multivariate Unimodality Test Harnenssing the Dip Statistic of
Mahalanobis Distances Over Random Projections [0.2] 線形ランダムプロジェクションとポイント・ツー・ポイント・ディスタンシングにより、一次元の一様性原理を多次元空間に拡張する。
我々の手法は$alpha$-unimodalityの仮定に根ざし、泥ッドと呼ばれる新しい一様性試験を提示する。
理論的および実証的研究は,多次元データセットの一様性評価における本手法の有効性を確認した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:34:52 GMT)
Who can help me? Reconstructing users' psychological journeys in
depression-related social media interactions [0.1] うつ病に関するいくつかのメンタルヘルス関連Redditボードを調査した。
ユーザの心理的・言語的プロファイルを社会的相互作用とともに再構築する。
我々のアプローチは、ソーシャルメディアを通じてメンタルヘルス問題に対処する、データインフォームドな理解への道を開く。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:45:11 GMT)
LLMs for Science: Usage for Code Generation and Data Analysis [0.1] 大規模言語モデル (LLMs) は、今日の作業環境の多くの領域で生産性の向上を図っている。
LLMのポテンシャルが研究の実践においてどのように実現されるのかは、いまだ不明である。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:16:00 GMT)
Emergent Outcomes of the veToken Model [0.0] 投票支援トークン(veToken)モデルでは、投票重量と引き換えに、投票者が長期にわたって価値のトークンをエスクローまたはロックする必要がある。
投票行動は,高レベルのプロトコルが設定した収賄に追従し,その取得方法によって投票ごとのコストが変化することを示す。
我々は、Votiumのような投票市場が、コンベックス・ファイナンス(Convex Finance)が開催する2週間の投票結果を大きく決定していることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:33:45 GMT)
Van der Waals coefficients for interactions of dysprosium and erbium
atoms with alkali-metal and alkaline-earth-metal atoms [0.0] 我々は、ジスプロシウムまたはエルビウム原子間のファンデルワールス相互作用を特徴付ける等方および異方的な$C_6$係数を計算した。
これらの係数は、ヘテロ核量子混合物の衝突特性のモデル化に不可欠である。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:49:48 GMT)
VINNA for Neonates -- Orientation Independence through Latent
Augmentations [0.0] 本稿では,Voxel-size Independent Neural Network framework, VINNを用いて,分解能独立性の概念を紹介する。
我々は、全ての剛性変換を4自由度変換モジュール(4-DOF)でネットワークアーキテクチャにシフトすることで、この概念を拡張し、分解能を考慮した内部拡張(VINNA)を可能にする。
VINNAは最先端の外部拡張アプローチを著しく上回り、様々な解像度 (0.5-1.0 mm) で高いセグメンテーション精度を維持している。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:28:26 GMT)
Utilizing Model Residuals to Identify Rental Properties of Interest: The
Price Anomaly Score (PAS) and Its Application to Real-time Data in Manhattan [0.0] 2023年9月現在、マンハッタンで利用可能なすべての不動産のデータを収集し、モデル残高の理解を深めることを目的としている。
これらの知見を活用するために、不規則に予測される価格のバウンダリを捕捉できる指標であるPrice Anomaly Score(PAS)を導入する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 00:14:30 GMT)
Uncertainty Quantification in Neural-Network Based Pain Intensity
Estimation [0.0] 異なる個人が異なる痛みを経験するため、痛みの強さの評価は困難である。
本研究では,主観的痛覚間隔推定のためのニューラルネットワークを用いた手法を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:20:53 GMT)
Two-Step Reinforcement Learning for Multistage Strategy Card Game [0.0] 本研究では,「指輪のロード:カードゲーム(LOTRCG)」に適した2段階強化学習(RL)戦略を紹介する。
本研究は,段階学習アプローチを採用することにより,従来のRL手法から分岐する。
また,異なるRLエージェントがゲームにおける様々な意思決定に使用されるマルチエージェントシステムについても検討した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 01:31:21 GMT)
Tunable phonon-photon coupling induces double MMIT and enhances slow
light in an atom-opto-magnomechanics [0.0] 我々は、フォノン-光子結合強度を利用して、プローブ出力スペクトルに二重マグノメカニカル誘導透過(MMIT)を示す。
この結果は量子情報処理と通信に潜在的な応用をもたらす可能性がある。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:36:03 GMT)
Transformer Based Model for Predicting Rapid Impact Compaction Outcomes:
A Case Study of Utapao International Airport [0.0] 本稿では,Rapid Impact Compaction (RIC) により改良された地盤の工学的特性を予測するための新しい深層学習手法を提案する。
RICは、ドロップハンマーを使って土壌をコンパクト化し、層を埋める地上改良技術である。
提案手法では,入力特徴間の複雑な非線形関係を解析するために,トランスフォーマーに基づくニューラルネットワークを用いる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:56:02 GMT)
Theoretical Developments in Lattice Gauge Theory for Applications in
Double-beta Decay Processes and Quantum Simulation [0.0] 二重ベータ崩壊は、2-ニュートリノ二重ベータ崩壊とニュートリノレス二重ベータ崩壊の2つのモードで起こる稀な核過程である。
実験的な制約から信頼性の高い結論を引き出すためには、基礎となるハドロン相互作用を正確に予測する必要がある。
この論文は格子QCDフレームワークにおける有限体積効果を用いて二重ベータ崩壊の正式な処方料を提供する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:27:23 GMT)
The nature of static and dynamic correlation in nearly degenerate
singlet and triplet states of N-heterocyclic chromophores [0.0] 我々は,シクラジンの集合における励起エネルギーの予測における電子相関の役割について検討した。
近い縮退性は、静的相関と動的相関の適切なバランスで達成できる。
本稿では,より安価な理論を確立するためのベンチマーク数値を作成することを目的とする。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:54:23 GMT)
The Trifecta: Three simple techniques for training deeper
Forward-Forward networks [0.0] 本稿では,より深いネットワーク上でのフォワード・フォワードアルゴリズムを大幅に改善する3つの手法のコレクションを提案する。
我々の実験は、我々のモデルが、単純なデータセットのトレーニング速度とテスト精度の両方において、同様に構造化されたバックプロパゲーションベースのモデルと同等であることを示した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 22:44:32 GMT)
The Symmetric alpha-Stable Privacy Mechanism [0.0] 本稿では,Symmetric alpha-Stable (SaS) 機構の新しい解析法を提案する。
この機構は、畳み込みの下で閉じたまま、純粋に微分プライベートであることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:34:39 GMT)
The Open Review-Based (ORB) dataset: Towards Automatic Assessment of
Scientific Papers and Experiment Proposals in High-Energy Physics [0.0] 新しい包括的オープンレビューベースデータセット(ORB)を紹介する。
これには36,000以上の科学論文のキュレートされたリストが含まれ、89,000以上のレビューと最終決定が含まれている。
本稿では,データアーキテクチャと収集データの概要と関連する統計について述べる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:52:02 GMT)
The Measurement Problem Is a Feature, Not a Bug--Schematising the
Observer and the Concept of an Open System on an Informational, or
(Neo-)Bohrian, Approach [0.0] 「量子力学は、ボーアが通常の因果記述の自然な一般化と呼んだものである」と私は主張する。」
オープンシステムの概念の量子一般化が、アインシュタインの不満を和らげるためにどのように使われるかを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 22:33:10 GMT)
The Influence Functional in open holography: entanglement and R\'enyi
entropies [0.0] 我々は、ファインマン・ヴァーノン影響関数(IF)の助けを借りて、オープン量子場理論の例を研究する。
我々は、IFの存在下で、未観測環境の効果を捉えることができるオープン有効場理論としてシステムを解釈する。
IFの処方薬の1つがユニタリ進化と一致し、もう1つは標準結果のみを再現していることが示される。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:39:44 GMT)
Talking Head(?) Anime from a Single Image 4: Improved Model and Its
Distillation [0.0] 本研究では,アニメキャラクタの単一画像からリアルタイムに制御可能なキャラクタモデルを作成するという課題について検討する。
Talking Head Anime 3 (THA3)は、この問題に直接対処しようとするオープンソースプロジェクトである。
THA3は、一般的なPC上でリアルタイムにアニメーションを生成するには遅すぎるため、画質も改善できる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:29:26 GMT)
Steady-state quantum chaos in open quantum systems [0.0] オープン量子多体系における一般現象として、定常量子カオスの概念を導入する。
開量子系の定常状態におけるカオスと積分性は、時間進化生成器のスペクトル構造によって一意に決定される。
粒子数保存のない非平衡ボゾン系のパラダイム的例である, 駆動散逸型ボース・ハバードモデルにおける定常カオスについて検討した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:43:53 GMT)
Spinal Muscle Atrophy Disease Modelling as Bayesian Network [0.0] 本稿では,確率的図形モデルとベイズ推論を用いた疾患モデリングのための分子遺伝子発現研究と公開データベースについて検討する。
脊髄筋萎縮性ゲノム関連研究のケーススタディをモデル化し分析した。
疾患発生の2段階におけるアップ・アンド・ダウン制御遺伝子は、パブリックドメインで発行された先行知識と関連付けられ、共発現ネットワークが作成・解析される。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:45:27 GMT)
Skilful Precipitation Nowcasting Using NowcastNet [0.0] 降水今流しは、農業、輸送、公衆衛生、安全等に影響を及ぼすような事態に備えるのに役立ちます。
我々は最近提案した,物理条件の深い生成ネットワークである NowcastNet を用いて,衛星画像を用いたヨーロッパ各地の降水量の予測を行った。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:24:52 GMT)
Self-protected quantum simulation and quantum phase estimation in the
presence of classical noise [0.0] 本研究では,古典的雑音に免疫する自己保護量子シミュレーションを提案する。
読み出しのために、従来の量子位相推定を古典雑音の存在下でのアップグレード版に一般化する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:27:21 GMT)
Robustness Approaches for the Examination Timetabling Problem under Data
Uncertainty [0.0] テストタイムタブリング問題(ETTP)は、しばしばポストエンクルーメント問題(PE-ETTP)と見なされる。
本稿では、ロバスト最適化の文献で利用可能ないくつかのアプローチについて論じる。
本研究は, 試験時間の問題に対する各アプローチの影響を考察し, ETTPに最も好適なアプローチを適用する方法について述べる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:06:17 GMT)
Recovery With Incomplete Knowledge: Fundamental Bounds on Real-Time
Quantum Memories [0.0] オブザーバベースの(不完全な知識)回復プロトコルをリアルタイムパラメータ推定問題とみなす。
本稿では,このプロトコルの性能に関する情報理論および経験的境界について述べる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 00:06:32 GMT)
ROSO: Improving Robotic Policy Inference via Synthetic Observations [0.0] 本稿では、事前訓練されたポリシーのゼロショット性能を改善するために、生成人工知能の利用を提案する。
我々の実験は、生成AIをロボット推論に組み込むことで、成果が大幅に向上することを示した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:16:40 GMT)
Quantumness Measure from Phase Space Distributions [0.0] 近年のアプローチでは、量子状態の非古典的振る舞いの識別とノイズ耐性の検出が可能となっている。
ボーマンとアグデロのアプローチを修正し、量子度測度を提供しながら、元の提案の多重強みを継承する。
Xiは識別され、非常に敏感であり、システムの古典的でない励起の増加とともに単調に成長する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 06:58:39 GMT)
Quantum system ascribed to the Oppenheimer-Snyder model of massive star [0.0] 我々は積分量子化法を用いてブラックホールのオッペンハイマー・スナイダーモデルを定量化する。
古典的, 量子的両面において, 同じ足場上の空間的, 時間的座標を扱う。
副生成物として、量子レベルでシュワルツシルトブラックホールの重力特異点の分解を得る。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:17:46 GMT)
Quantum circuit synthesis via random combinatorial search [0.0] 完全忠実度量子回路の分数は、回路サイズが単位忠実度を達成するために必要な最小回路サイズを超えると、急速に増加することを示す。
ランダム探索法を4ビットトフォリゲートの分解問題に適用し、15個のCNOTゲートの分解を求める。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 00:59:29 GMT)
Quantum Neural Networks under Depolarization Noise: Exploring White-Box
Attacks and Defenses [0.0] 量子対向機械学習は、QMLモデルの弱い点と、対向した特徴ベクトルに直面するときの強調に役立っている。
マルチクラス分類シナリオにおいて, 脱分極雑音の付加は, さらなる堅牢性の提供を中止したことを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:00:19 GMT)
Quantum Computing Perspective for Electromagnetic Wave Propagation in
Cold Magnetized Plasmas [0.0] 本稿では,量子コンピュータ上でのマクスウェル方程式の実装に関する2つのトピックについて述べる。
1つ目は、コールドで不均一な磁化プラズマにおける波動伝播のためのマクスウェル方程式の量子シュロディンガー表現の定式化である。
第2のトピックは、量子格子アルゴリズム(QLA)の基礎となるユニタリ演算子の系列の開発である。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:41:57 GMT)
Programmable integrated source of polarization and frequency-bin
hyperentangled photon pairs [0.0] 集積フォトニックデバイス上での分極および周波数結合光子対を生成することができる4つのリング共振器のシステムを提案する。
生成状態の密度演算子は、偏極および周波数2自由度における超絡み合った状態を表すことを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:10:06 GMT)
Production of Entangled X-rays through Nonlinear Double Compton
Scattering [0.0] 絡み合ったX線を生成するためのアクセス可能な情報源は、高エネルギーの量子光学の分野にとって不可欠である。
本稿では、強いレーザー波中の電子によって放出される2つの光子の絡み合いと偏光について詳細に解析する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:57:27 GMT)
Probing entanglement and testing Bell inequality violation with
$\textrm{e}^{+}\textrm{e}^{-} \rightarrow \tau^{+}\tau^{-}$ at Belle II [0.0] 我々は、両方の$tau$ leptonsがハドロンに崩壊する事象を分析する。
我々はベル-II実験による量子絡み合いとベルの不等式違反の観測が可能であることを期待する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:39:05 GMT)
Pretty good fractional revival via magnetic fields: theory and examples [0.0] グラフの任意のサイズの部分集合において、かなり良い量子分数復元の理論を発展させる。
我々はこの理論を用いて、磁場がかなり良い分数再生を誘導できる条件を与える。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 23:10:28 GMT)
Precipitation Nowcasting With Spatial And Temporal Transfer Learning
Using Swin-UNETR [0.0] 降水流しは、関係機関がそのような事態に備えるのに役立ちます。
最近提案されたSwin-UNETRは、ヨーロッパの10の異なる地域での降水量計に使用されている。
Swin-UNETRは、衛星画像の複数の入力チャネルからスイムトランスフォーマーベースのエンコーダがマルチスケール特徴を抽出するU字型ネットワークを利用する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:35:50 GMT)
Physics-informed neural networks for transformed geometries and
manifolds [0.0] 本稿では,幾何学的変分を頑健に適合させるために,PINN内に幾何変換を統合する新しい手法を提案する。
従来のPINNに対して,特に幾何学的変動下での柔軟性の向上を実証する。
提案したフレームワークは、パラメータ化されたジオメトリ上でのディープ・ニューラル演算子のトレーニングの展望を示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:46:23 GMT)
Perancangan UI/UX Aplikasi Sistem Informasi Layanan Administrasi dalam
Perspektif Psikologi Menggunakan Metode Prototype [0.0] 本研究の目的は,SILASTRI (Administrative Services Information System) インターフェースの設計である。
SILASTRIはビナダルマ大学の学生管理サービスを支援するように設計されている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 04:08:09 GMT)
Parity vs. AC0 with simple quantum preprocessing [0.0] 我々は、$mathsfAC0$が$mathsfQNC0$回路の測定結果に作用するハイブリッド回路モデルについて検討する。
私たちは、$mathsfQNC0$が、タスクの検索とサンプリングに驚くほど強力なのに対して、その出力のグローバルな相関において、そのパワーは"ロックアウト"されていることに気付きました。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:04:47 GMT)
Page curve entanglement dynamics in an analytically solvable model [0.0] 本稿では、そのようなページ曲線を明示的に示す自由フェルミオンの、正確に解けるモデルを提案する。
体積法で飽和する代わりに、エントロピーは遅くまで消滅した。
粒子電流と絡み合い発生の間の半古典的接続がどのように崩壊するかをはっきりと見ることができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:44:45 GMT)
PViT-6D: Overclocking Vision Transformers for 6D Pose Estimation with
Confidence-Level Prediction and Pose Tokens [0.0] 分類トークンのカスタマイズによる直接6次元ポーズ推定のための視覚変換器の機能について検討する。
また、ほとんどの6次元ポーズ推定フレームワークに簡単に組み込むことができる、ポーズの信頼度を決定するための簡単な方法も導入する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:27:56 GMT)
Optimized Topological Quantum Compilation of Three-Qubit Controlled
Gates in the Fibonacci Anyon Model: A Controlled-Injection Approach [0.0] 非アーベルフィボナッチアロンモデル内に3量子制御ゲートをコンパイルする手法を提案する。
制御された3ビットゲートの従来の分解法と比較して, 精度の向上と編曲長の低減が図られた。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:07:15 GMT)
Open data ecosystems: what models to co-create service innovations in
smart cities? [0.0] スマートシティーの利害関係者がプロバイダとして行動するサービスとオープンデータのユーザの間で、サービスの集合的共創を刺激するために、どのようなモデルが想像できるだろうか?
Lisbonのような自治体は、このような最先端のサービス革新を推進するために、どのようなモデルに従えばいいのか?
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:26:39 GMT)
Multithreaded parallelism for heterogeneous clusters of QPUs [0.0] 我々は、量子無関係な並列マシンスケジューラとカッターであるMILQを紹介する。
複数の量子デバイスにスケジュールされた一連の回路の実行時間を優先順位付けする。
その結果, ベースラインアプローチに比べて最大26%の改善が見られた。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:54:04 GMT)
Model Performance Prediction for Hyperparameter Optimization of Deep
Learning Models Using High Performance Computing and Quantum Annealing [0.0] モデル性能予測を早期停止法と組み合わせることで,ディープラーニングモデルのHPOプロセスの高速化が期待できることを示す。
我々は,古典的あるいは量子的サポートベクター回帰を性能予測に用いるSwift-Hyperbandと呼ばれる新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:32:40 GMT)
Minimum full nonlocality, all versus nothing nonlocality, and quantum
pseudo telepathy [0.0] 最も単純な二部構造FN/AVN/PTは、Kochen-Specker (KS) セットの特定のタイプと同値であることを示す。
このシナリオは、クォートリット量子FN/AVN/PTを観測し、ベルとKSの定理を1つの実験で結びつけるのに十分小さい。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:38:38 GMT)
Mergen: The First Manchu-Korean Machine Translation Model Trained on
Augmented Data [0.0] 本稿では,満州・朝鮮語機械翻訳モデルの最初の試みであるMergenを紹介する。
満州・韓国の並列データセットが不足しているため、GloVe埋め込みで案内された単語置換を用いてデータを拡張しています。
実験により有望な結果が得られ、満州・朝鮮語翻訳の大幅な向上が示された。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:01:48 GMT)
Leveraging a Randomized Key Matrix to Enhance the Security of Symmetric Substitution Ciphers [0.0] 対称置換暗号の安全性を高める革新的な戦略を提示する。
様々なファイルフォーマットに適したランダム化キー行列の実装によって実装されている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:13:38 GMT)
Informal Safety Guarantees for Simulated Optimizers Through
Extrapolation from Partial Simulations [0.0] 自己教師付き学習は、最先端の言語モデリングのバックボーンである。
自己教師付きデータセットにおける予測損失を伴うトレーニングはシミュレータを引き起こすと論じられている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:32:56 GMT)
Improving Minority Stress Detection with Emotions [0.0] 性的・性的マイノリティの言語を理解するために、心理的ストレスモデルの有効性を評価するために、マイノリティ・ストレス検出の関連課題を用いる。
従来の心理的ストレスモデルではマイノリティなストレス検出が不十分であることに気付き,その性能格差を軽減するために感情注入モデルを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:39:38 GMT)
I Know You Did Not Write That! A Sampling Based Watermarking Method for
Identifying Machine Generated Text [0.0] 機械生成テキストを検出するための新しい透かし手法を提案する。
我々の方法は生成されたテキストにユニークなパターンを埋め込む。
本稿では,透かしがテキスト品質にどのように影響するかを示し,提案手法を最先端の透かし法と比較する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 20:04:57 GMT)
How to Build an AI Tutor that Can Adapt to Any Course and Provide
Accurate Answers Using Large Language Model and Retrieval-Augmented
Generation [0.0] 本稿では,最先端のLarge Language Model (LLM)を用いて,どの科目でもパーソナライズされた学習を提供する,革新的なWebアプリケーションであるAI Tutorを紹介する。
学生が質問を行うと、最も関連性の高い情報を取得し、証拠を引用して詳細な会話応答を生成する。
私たちは、AI Tutorの汎用性をさまざまなテーマに示す、フル機能のWebインターフェースとビデオデモを紹介します。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:02:46 GMT)
How Generative-AI can be Effectively used in Government Chatbots [0.0] 本稿では広東省の政府チャットボットChatGPTと,大規模言語モデルWenxin Ernieの比較を行った。
この研究は、政府のチャットボットと大きな言語モデルの間に大きな違いを見出した。
政府のチャットボットの今後の方向性をより深く探求するため,本研究では,目標とする最適化経路を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 07:27:15 GMT)
Homotopy Classification of loops of Clifford unitaries [0.0] 素数$p$の量子回路を$mathsfd$次元格子上に作用させるクリフォード量子回路について検討する。
そのようなループのホモトピー類を任意の奇数$p$と$mathsfd=0,1,2,3$と$4$で計算する。
我々は、$(mathsfd+1)$次元のクリフォード回路のループのホモトピークラスが、$mathsfd$次元のクリフォード量子セルオートマタモジュロ浅い回路と格子変換の群の商と一致することを観察する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:38:45 GMT)
Highlighting relations between Wave-particle duality, Uncertainty
principle, Phase space and Microstates [0.0] 本研究の主な目的は,波動-粒子の双対性,不確実性原理,位相空間の概念,および統計力学におけるミクロ状態の関係を分析することである。
これらの量子相空間の概念と量子力学の位相空間表現を用いて、波動-粒子の双対性についてより深く記述し、量子デコヒーレンスや測定問題といった量子力学の基礎的問題に関わるいくつかの現在の問題の研究に役立てる可能性についても論じる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:58:34 GMT)
Hearing the boundary conditions of the one-dimensional Dirac operator [0.0] 相対論的自由量子粒子に対する等スペクトル性問題はディラック・ハミルトンによって記述され、接合を持つ一次元の環に閉じ込められている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:48:46 GMT)
Genuine tripartite entanglement in a mixed spin-(1/2,1) Heisenberg
tetramer [0.0] 混合スピン(1/2,1)ハイゼンベルクテトラマーの真の三部構造は、外部磁場の存在下で厳密に解析される。
真の三部体の絡み合いの度合いは、真の三部体の負性度$cal N_ABC$に応じて評価される。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 08:37:51 GMT)
From Vlasov-Poisson to Schr\"odinger-Poisson: dark matter simulation
with a quantum variational time evolution algorithm [0.0] 本研究では, 自己整合性, 非線形性, 問題に変動的リアルタイム進化アプローチを適用することで, シュル・オーディンガー・ポアソン方程式をシミュレートする量子アルゴリズムを提案する。
このアプローチは、古典的アルゴリズムを用いてVlasov-Poisson(VP)方程式を解くための効率的な代替手段として機能する可能性を持っている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:49:25 GMT)
Formulation of the Electric Vehicle Charging and Routing Problem for a
Hybrid Quantum-Classical Search Space Reduction Heuristic [0.0] 制約付き量子最適化アルゴリズムの構築において、量子情報の多レベルキャリア -- 量子ビット -- をどのように活用するかを示す。
本稿では,制約付き解をサンプリングし,探索空間を大幅に削減するハイブリッド古典量子戦略を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:26:14 GMT)
Fleming-Viot helps speed up variational quantum algorithms in the
presence of barren plateaus [0.0] フレミング・ヴィオットの伝統では、平行探索は粒子と呼ばれる。
提案手法では,勾配が小さすぎる領域やうるさい領域に遭遇した場合,フレミング・ヴィオット粒子による探索を停止する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:18:23 GMT)
Fixed point actions from convolutional neural networks [0.0] 格子ゲージ同変畳み込みニューラルネットワーク(L-CNN)は任意の形状のウィルソンループを形成するために用いられる。
我々はL-CNNを用いて、再正規化群変換に基づく固定点(FP)動作を記述する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:10:49 GMT)
Fitting quantum noise models to tomography data [0.0] 我々は未知のノイズ過程を分析し評価するアルゴリズムを開発した。
マルコフ進化に整合した力学の場合、我々のアルゴリズムは最良のリンドブラディアンを出力する。
非マルコフ力学の場合、我々のアルゴリズムは非マルコフ性の定量的かつ操作的に有意な測度を返す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:44:23 GMT)
Exploring Factors Affecting Pedestrian Crash Severity Using TabNet: A
Deep Learning Approach [0.0] 本研究では,TabNetモデルを用いた歩行者事故の重大度調査を行った。
2010年から2022年までのユタ州の包括的データセットにTabNetを適用することで、歩行者事故の深刻度に寄与する複雑な要因が明らかになった。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:44:52 GMT)
Error estimation of different schemes to measure spin-squeezing
inequalities [0.0] 本稿では,マルチキュービット系におけるスピンスクイーズ不等式の測定に焦点をあてる。
スピンスクイーズ不等式は、全角運動量の測定だけでなく、2量子相関によって評価できることを示す。
そこで本研究では,非線形推定器の誤差境界の導出について,その分散の助けを借りて検討する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:49:10 GMT)
Entropy and the Kullback-Leibler Divergence for Bayesian Networks:
Computational Complexity and Efficient Implementation [0.0] 我々は、最も一般的な分布仮定の下で、シャノンのエントロピーと BN に対するクルバック・リーバーの発散を計算する方法を示す。
ガウス BN に対して、KL の計算複雑性を立方体から二次体に還元できることが示されている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:51:04 GMT)
Enhancing Post-Hoc Explanation Benchmark Reliability for Image
Classification [0.0] 実証的な評価では、メトリクス、データセット、ポストホックメソッドのベンチマーク信頼性が大幅に向上した。
この先駆的な研究は、ポストホックな説明手法の領域において、より信頼性の高い評価実践の基礎を確立する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:21:24 GMT)
Enhancing Data-Assimilation in CFD using Graph Neural Networks [0.0] 本稿では,グラフニューラルネットワーク(GNN)モデルによる随伴最適化に基づく,流体力学に応用されたデータ同化のための新しい機械学習手法を提案する。
我々は,有限要素法(FEM)の解法に基づく直接数値シミュレーションを用いて,GNNモデルと解法の間の2次元のインターフェースにより,GNNの予測をFEM解析の処理後ステップに組み込むことができることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 19:11:40 GMT)
End-to-end Joint Rich and Normalized ASR with a limited amount of rich
training data [0.0] 我々は、限られた量のリッチラベル付きデータで、ステートレストランスデューサベースのE2Eジョイントリッチで正規化されたASRシステムを訓練する。
最初のアプローチはE2EリッチなASRにつながり、ドメイン外のデータでは最大9%のエラーが減少する。
第2のアプローチは、中程度の(2.42%絶対)エラーの増加を伴う5%のリッチトレーニングデータを用いて、E2Eジョイントリッチで正規化されたASRシステムの実現可能性を示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:44:39 GMT)
Encoding and decoding of information in general probabilistic theories [0.0] 情報保存性ゲームにおける操作理論の符号化と復号化能力について検討する。
完全識別戦略が最適ではない理論があり、導入したゲームが超情報保存性のための操作テストとして使用できることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:51:33 GMT)
Electromagnetic field quantization in the presence of a moving
nano-particle [0.0] 適切なラグランジアンは、半無限空間で動くナノ粒子からなる系であると考えられている。
高速度ナノ粒子が経験する量子摩擦は、ナノ粒子の放射力の散逸項として同定できる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:18:16 GMT)
Easy Data Augmentation in Sentiment Analysis of Cyberbullying [0.0] インドネシアの若者の約50%にとって、サイバーいじめは重要な問題だ。
この問題に対処するために、コメントフィルタリングのための感情分析には、SVM(Support Vector Machine)とEDA(Easy Data Augmentation)を用いる。
EDAはデータセットを拡張し、サイバーいじめの堅牢な予測と分析を可能にする。
提案手法では,既存の最先端手法よりも92.5%,2.5%高い精度で精度が向上した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:05:58 GMT)
Dynamic Scheduling of a Multiclass Queue in the Halfin-Whitt Regime: A
Computational Approach for High-Dimensional Problems [0.0] システムマネージャが利用可能なサーバを顧客コールに動的に割り当てる,電話センターのマルチクラス待ち行列モデルについて考察する。
本稿では,元来のコールセンタースケジューリング問題に対するポリシーを提案する。
このポリシーの性能は、一般に利用可能なコールセンタデータに基づいてテスト問題を用いて評価される。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 22:38:33 GMT)
Distribution of a bipartite entanglement in a mixed spin-(1/2,1)
Heisenberg tetramer [0.0] 混合スピン(1/2,1)ハイゼンベルク四量体における二部晶の絡み合いの分布について検討した。
両端のエンタングルメントの強度を測定する4つの異なるネガティビティを解析した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:10:07 GMT)
Discussion Model for Propagation of Social Opinion via Quantum Galois
Noise Channels:Entanglement, SuperSpreader [0.0] 古典的および量子チャネルの概念を意見力学のモデリングに適用する。
我々は誤り率とノイズ効果を考慮した新しい意見力学モデルを構築した。
また,ノイズ情報伝達におけるスーパースプレッダの役割とその抑制機構についても検討した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:48:10 GMT)
Digital quantum simulation of NMR experiments [0.0] 本研究では,アセトニトリルのメチル基のゼロ場スペクトルをトラップイオン量子コンピュータの4キュービットを用いて計算し,NMRスペクトルの最初の量子シミュレーションを行った。
NMRシステムの本質的なデコヒーレンスにより、比較的短期的な量子ハードウェア上での古典的に硬い分子のゼロフィールドシミュレーションが可能となることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:31:51 GMT)
Digital Twins for Logistics and Supply Chain Systems: Literature Review,
Conceptual Framework, Research Potential, and Practical Challenges [0.0] 本稿では,物流・サプライチェーン産業の背景,DTとその可能性,研究の動機と範囲について紹介する。
文献レビューは、LSCSのための新しい概念DTフレームワークを提案するための研究と実践のギャップとニーズを示している。
LSCS用の透明で信頼性が高くレジリエントなDTをデプロイする次のステップに関するアイデアが紹介されている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:15:16 GMT)
Diagrammatic Monte Carlo for Dissipative Quantum Impurity Models [0.0] 我々は、散逸性量子不純物モデルのリアルタイムダイナミクスを図式化したモンテカルロ法を開発した。
本アルゴリズムは, ダブルケルディシュではなく, 1 つの実時間輪郭に定式化されたハイブリダイゼーション展開をサンプリングする。
局所マルコフ散逸は一般に図式モンテカルロサンプリングの収束に役立つことを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:41:38 GMT)
Data Driven Approaches to Cybersecurity Governance for Board Decision-Making -- A Systematic Review [0.0] 本稿では,既存のリスク計測機器,サイバーセキュリティ指標,およびBoDをサポートするための関連モデルについて検討する。
その結果、高度なサイバーセキュリティツールが存在し、開発中であるにもかかわらず、取締役会が、彼らが理解している言語でサイバーセキュリティを管理するためのメトリクスとモデルの観点から、それらをサポートするための限られた情報が存在することがわかった。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 12:14:01 GMT)
Cross-Axis Transformer with 2D Rotary Embeddings [0.0] 本稿では,Cross-Axis Transformerを紹介する。
CATは、Axial TransformersとMicrosoftのRetentive Networkの両方にインスパイアされたモデルである。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 17:01:00 GMT)
Conventional and inverse magnetocaloric and electrocaloric effects of a
mixed spin-(1/2, 1) Heisenberg dimer [0.0] 温度の断熱変化と等温エントロピー変化の2つの基本磁気光学特性の解析を行った。
その結果, 断熱脱磁性過程における電場の適用により, 冷却性能が向上する可能性が示唆された。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 09:38:20 GMT)
Compressing the Backward Pass of Large-Scale Neural Architectures by
Structured Activation Pruning [0.0] ディープニューラルネットワーク(DNN)におけるスパシティはソリューションとして注目されている。
この研究は、訓練中のメモリ消費を減らすことを目的として、短命の空間性に焦点を当てている。
大規模ニューラルアーキテクチャのトレーニング速度,精度,メモリ使用量を評価することにより,アクティベーションプルーニングの有効性を報告する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:41:36 GMT)
Complete unitary qutrit control in ultracold atoms [0.0] 我々は、超低温の87$Rbのアンサンブルで中性原子クォートを符号化し、任意の単一クォートSU(3)ゲートを示す。
この研究は、量子情報処理のための有望なプラットフォームとして、超低温中原子クォートを確立させる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 22:52:30 GMT)
Comparison of metaheuristics for the firebreak placement problem: a
simulation-based optimization approach [0.0] 火災発生の問題は防火に不可欠である。
したがって、発火から絶滅まで予測不可能な火災の性質を考える必要がある。
シミュレーションに基づく最適化の観点から,この問題に対する解法を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 06:45:07 GMT)
Combinatorial quantum gravity and emergent 3D quantum behaviour [0.0] アインシュタインの動的幾何学の考え方とホイーラーの「ビットから」仮説を組み合わせるアプローチである量子重力についてレビューする。
2次元の場合、幾何学的位相は2つの逆関係のスケール、紫外線(UV)プランク長と赤外(IR)曲率半径を持つ負曲率曲面を記述する。
大規模重力相互作用を表わすため, 大規模粒子のまわりの曲線軌道も3次元で得られる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:54:51 GMT)
Classical vs Quantum Annealing and Manifold Reduction in Soft-Spin
Minimizers of Ising Hamiltonians [0.0] Mobius グラフの循環結合のエネルギー景観を解析する。
本稿では, ソフトスピン振幅を定義位相空間領域に制限する「多様体還元法」を提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 05:15:38 GMT)
ChatGPT and post-test probability [0.0] われわれはChatGPTにベイズ規則の医学的診断方法の例を挙げる。
医療変数名の導入は,ChatGPTが犯す誤りの数の増加につながることを示す。
感度と特異性に関する最近の解説を踏まえて,本研究の結果について論じる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 23:15:15 GMT)
CRAFT: Contextual Re-Activation of Filters for face recogntion Training [0.0] 我々は「CRAFT: 顔認識訓練用フィルタのコンテキスト再活性化」を提案する。
CRAFTは,非活性フィルタの割合を平均で44%から32%に減らし,標準トレーニングでは見つからないフィルタパターンを発見する。
CRAFTは、リアクションのない標準トレーニングと比較して、標準的な顔認識ベンチマークデータセットでモデル精度が向上することを示した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 22:07:25 GMT)
Business Policy Experiments using Fractional Factorial Designs: Consumer
Retention on DoorDash [0.0] 本稿では、ビジネス意思決定のスピードアップと、ビジネスポリシーの分解による実験による学習コストの削減を両立させるアプローチについて検討する。
提案手法の実装とメリットを実証的に実証し,その妥当性をDoorDashで評価した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 04:23:13 GMT)
Binary perceptrons capacity via fully lifted random duality theory [0.0] 古典的二項パーセプトロンの統計容量を一般しきい値$kappa$で調べる。
我々は citeStojnicflrdt23 で確立された即時昇降ランダム双対性理論 (fl RDT) に頼り、パーセプトロンの能力を研究するための一般的な枠組みを作成する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 22:22:32 GMT)
BOIS: Bayesian Optimization of Interconnected Systems [0.0] BOにおける複合関数の効率的な利用を可能にする新しいパラダイムを提案する。
この単純なアプローチ(BOISと呼ぶ)が構造的知識の活用を可能にしていることを示す。
以上の結果から,BOISが性能向上を実現し,複合関数の統計を正確に把握できることが示唆された。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 02:32:02 GMT)
Asymmetric particle-antiparticle Dirac equation: first quantization [0.0] 我々は、同じ波数を共有する粒子と反粒子が異なるエネルギーとモータを持つ非対称ディラック方程式であるディラック型方程式を導出する。
非対称ディラック方程式と標準ディラック方程式の間の公式な接続を得る。
本研究では、現在の波動方程式の自由パラメータを適切に調整することにより、通常のディラック方程式の予測を再現できることを示す。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 13:46:41 GMT)
Anomalous Loss Reduction Below Two-Level System Saturation in Aluminum
Superconducting Resonators [0.0] 容量結合型半波長コプラナー導波路共振器について検討した。
2レベル系(TLS)は、数光子および低温状態において主要な損失源となる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 16:31:22 GMT)
An Efficient Illumination Invariant Tiger Detection Framework for
Wildlife Surveillance [0.0] 本稿では,トラ検出のためのEnlightenGANとYOLOv8に基づく正確な照明不変フレームワークを提案する。
微調整されたYOLOv8モデルでは、照明の強化を伴わずにmAPスコアが61%に達する。
このアプローチは、ATRWデータセットの最先端のパフォーマンスを約6%から7%向上させる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 11:35:54 GMT)
Adam-like Algorithm with Smooth Clipping Attains Global Minima: Analysis
Based on Ergodicity of Functional SDEs [0.0] 我々は,グローバル化された非-1損失関数を切断したAdam型アルゴリズムが正規化された非-1エラー形式を最小化することを示す。
また、スムーズな群のエルゴード理論を適用して、逆温度と時間を学ぶためのアプローチを研究する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 14:38:59 GMT)
A transductive few-shot learning approach for classification of digital
histopathological slides from liver cancer [0.0] 本論文は,2次元病理組織パッチの分類法として,少数ショット学習を用いた新しいアプローチを提案する。
病理組織学スライドにスライディングウインドウ手法を適用することにより,トランスダクティブラーニングの実践的メリットを解説する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:44:00 GMT)
A publicly available vessel segmentation algorithm for SLO images [0.0] Infra-red scanning laser ophthalmoscope (IRSLO) 画像は、後極と網膜血管の微細な細部を表示する際の眼底のカラー写真と類似している。
IRSLO画像に特化した血管分割アルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:53:08 GMT)
A Stochastic-Geometrical Framework for Object Pose Estimation based on
Mixture Models Avoiding the Correspondence Problem [0.0] 本稿では,複数特徴点の観測に基づくオブジェクトポーズ推定のための新しい幾何学的モデリングフレームワークを提案する。
混合モデルに基づくポーズ推定の確率論的モデリングは、正確でロバストなポーズ推定につながると結論付けることができる。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 21:45:33 GMT)
A Reconstruction of Algebraic Quantum Theory [0.0] この研究は、単純な思考実験から数学的公理を直接取得することで、抽象代数的アプローチの必要性を強調している。
観測者に関する基本的な仮定と、それらがどのように現実を観察できるかから、$W*$-algebra構造を得る。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 15:43:26 GMT)
A Pipeline For Discourse Circuits From CCG [0.0] DisCoCircは、自然言語のテキストを、テキストのコアセマンティック情報をキャプチャするサーキットとして表現する。
DisCoCircは、短期量子コンピュータで実装可能なNLPモデルを提供することを目標としている。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 18:46:29 GMT)
A Multiparty Commutative Hashing Protocol based on the Discrete Logarithm Problem [0.0] 本稿では,ハッシュ関数$H:mathcalXnrightmathcalY$の計算を可能にするプロトコルを提案する。
本稿では,ハッシュ関数を$H:mathcalXnrightmathcalY$で計算できるプロトコルを提案する。
論文参考訳(メタデータ) (Wed, 29 Nov 2023 10:19:34 GMT)