Less is More: Data Value Estimation for Visual Instruction Tuning [127.4] 視覚的命令データにおける冗長性を除去する新しいデータ選択手法を提案する。
LLaVA-1.5の実験では、約7.5%のデータしか使用していないアプローチが、フルデータ微調整モデルと同等の性能を達成できることが示されている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 06:51:16 GMT)
ChainLM: Empowering Large Language Models with Improved Chain-of-Thought Prompting [124.7] CoT(Chain-of-Thought)のプロンプトにより,大規模言語モデル(LLM)の推論能力が向上する
既存のCoTアプローチは通常、単純な推論タスクに重点を置いており、結果として低品質で一貫性のないCoTプロンプトをもたらす。
優れたCoTプロンプトの自動生成のための新しいフレームワークであるCoTGeniusを紹介する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:34:26 GMT)
Efficient Video Diffusion Models via Content-Frame Motion-Latent Decomposition [124.4] 本稿では,映像生成のための事前学習画像拡散モデルの拡張として,コンテントモーション潜時拡散モデル(CMD)を提案する。
CMDは、映像を(画像のような)コンテンツフレームと低次元モーションラテント表現の組み合わせとしてエンコードする。
我々は、予め訓練された画像拡散モデルを微調整し、コンテンツフレームを生成し、新しい軽量拡散モデルをトレーニングすることで、動き潜在表現を生成する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:48:48 GMT)
MVSplat: Efficient 3D Gaussian Splatting from Sparse Multi-View Images [102.8] スパース多視点画像から学習した効率的なフィードフォワード3次元ガウススプラッティングモデルであるMVSplatを提案する。
最新の最先端のメソッドであるPixelSplatと比較して、我々のモデルは10倍のパラメータを減らし、2倍以上の高速なパラメータを推測する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:59:58 GMT)
Language Models Can Reduce Asymmetry in Information Markets [100.4] 我々は、言語モデルを利用した知的エージェントが外部参加者に代わって情報を売買する、オープンソースのシミュレートされたデジタルマーケットプレースを紹介した。
このマーケットプレースを実現する中心的なメカニズムはエージェントの二重機能であり、特権情報の品質を評価する能力を持つと同時に、忘れる能力も備えている。
適切に行動するためには、エージェントは合理的な判断をし、生成されたサブクエリを通じて市場を戦略的に探索し、購入した情報から回答を合成する必要がある。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:48:37 GMT)
AdaIR: Adaptive All-in-One Image Restoration via Frequency Mining and Modulation [99.6] 周波数マイニングと変調に基づく適応的なオールインワン画像復元ネットワークを提案する。
我々のアプローチは、異なる周波数サブバンド上の画像内容に異なる劣化タイプが影響を及ぼすという観察によって動機付けられている。
提案モデルでは,入力劣化に応じて情報周波数サブバンドをアクセントすることで適応的再構成を実現する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:58:14 GMT)
MathVerse: Does Your Multi-modal LLM Truly See the Diagrams in Visual Math Problems? [99.0] MLLMの公平かつ詳細な評価のために設計された全周視覚数学ベンチマークであるMathVerseを紹介する。
我々は,2,612の高品位・多目的数学問題を,公開情報源の図を用いて慎重に収集する。
このアプローチにより、MathVerseは、数学的推論のためのビジュアルダイアグラムを、どの程度のMLLMが真に理解できるかを包括的に評価することができる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:59:50 GMT)
Conditional Tuning Network for Few-Shot Adaptation of Segmentation Anything Model [90.3] 本稿では,CAT-SAM(ConditionAl Tuning Network)を提案する。
CAT-SAMはSAM全体を凍結し、マスクデコーダとイメージエンコーダに少数の学習可能なパラメータを同時に適用する。
Cat-SAM 変種は、非常に困難なワンショット適応設定の下でも、常に優れた目標セグメンテーション性能を達成する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:36:15 GMT)
Language Models Hallucinate, but May Excel at Fact Verification [89.1] 大規模言語モデル (LLM) はしばしば「ハロシン化 (hallucinate)」し、結果として非実効出力となる。
GPT-3.5でさえ、実際の出力は25%以下である。
これは、進捗を計測し、インセンティブを与えるために、事実検証の重要性を浮き彫りにする。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 02:56:22 GMT)
Instance-aware Exploration-Verification-Exploitation for Instance ImageGoal Navigation [88.8] インスタンスイメージゴールナビゲーション(IIN)は、探索されていない環境でゴールイメージによって表現された指定されたオブジェクトにナビゲートすることを目的としている。
本稿では、インスタンスレベルの画像目標ナビゲーションのための新しいモジュール型ナビゲーションフレームワーク、Exploration-Verification-Exploitation (IEVE)を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:40:43 GMT)
MacGyver: Are Large Language Models Creative Problem Solvers? [87.7] 本稿では, 現代LLMの創造的問題解決能力について, 制約付き環境下で検討する。
我々は1,600以上の実世界の問題からなる自動生成データセットであるMACGYVERを作成する。
我々はLLMと人間の両方にコレクションを提示し、それらの問題解決能力を比較して比較する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 22:44:41 GMT)
View-decoupled Transformer for Person Re-identification under Aerial-ground Camera Network [87.4] 地上人物再識別のための簡易かつ効果的なフレームワークとして,ビューデカップリングトランス (VDT) が提案されている。
2つの主要なコンポーネントは、ビュー関連とビュー非関連の機能を切り離すためにVDTで設計されている。
さらに,5/8の空中/地上カメラ,5,000のアイデンティティ,108,563のイメージからなる大規模AGPReIDデータセットCARGOをコントリビュートした。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:08:21 GMT)
RoleInteract: Evaluating the Social Interaction of Role-Playing Agents [85.7] 社会的相互作用の個人レベルとグループレベルの両方において、ロールプレイング・会話エージェントの社会的性を評価するために設計された最初のベンチマークを紹介する。
ベンチマークはさまざまなソースから構築され、500文字以上と6000以上の質問プロンプトをカバーする。
個人レベルで優れたエージェントは,集団レベルでの熟練度を示唆しない。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:06:06 GMT)
GRM: Large Gaussian Reconstruction Model for Efficient 3D Reconstruction and Generation [85.2] 約0.1秒でスパースビュー画像から3Dアセットを復元できる大規模再構成機であるGRMを紹介する。
GRMは、マルチビュー情報を効率的に組み込んだフィードフォワードトランスフォーマーベースのモデルである。
また,既存の多視点拡散モデルと統合することにより,テキスト・ツー・3Dや画像・ツー・3Dといった生成タスクにおけるGRMの可能性を示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:59:34 GMT)
A Survey of Neural Code Intelligence: Paradigms, Advances and Beyond [85.0] この調査は、コードインテリジェンスの発展に関する体系的なレビューを示す。
50以上の代表モデルとその変種、20以上のタスクのカテゴリ、および680以上の関連する広範な研究をカバーしている。
発達軌道の考察に基づいて、コードインテリジェンスとより広範なマシンインテリジェンスとの間の新たな相乗効果について検討する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:54:56 GMT)
GLC++: Source-Free Universal Domain Adaptation through Global-Local Clustering and Contrastive Affinity Learning [84.5] Source-Free Universal Domain Adaptation (SF-UniDA) は、共通カテゴリに属する「既知の」データを正確に分類することを目的としている。
本稿では,適応的な一対一のグローバルクラスタリングアルゴリズムを備えた新しいグローバル・ローカルクラスタリング(GLC)手法を提案する。
我々はGLCをGLC++に進化させ、対照的な親和性学習戦略を統合する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:57:45 GMT)
Chain-of-Spot: Interactive Reasoning Improves Large Vision-Language Models [81.7] CoS(Chain-of-Spot)法は,注目領域に着目して特徴抽出を強化する手法である。
この技術により、LVLMは元の画像解像度を変更することなく、より詳細な視覚情報にアクセスすることができる。
実験の結果,LVLMの視覚的内容の理解と推論能力は著しく改善した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:26:44 GMT)
Point2RBox: Combine Knowledge from Synthetic Visual Patterns for End-to-end Oriented Object Detection with Single Point Supervision [81.6] 我々は、ポイント教師付きオブジェクト検出のためのエンドツーエンドソリューションであるPoint2RBoxを提案する。
提案手法は軽量なパラダイムを用いているが,点教師付き代替品間での競合性能を実現する。
特に,本手法は軽量なパラダイムを用いるが,点教師付き代替品間での競合性能を実現する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:43:32 GMT)
AI and Memory Wall [81.1] メモリ帯域幅がデコーダモデルの主要なボトルネックとなることを示す。
私たちは、このメモリ制限を克服するためのモデルアーキテクチャ、トレーニング、デプロイメント戦略の再設計を主張します。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:31:59 GMT)
MyVLM: Personalizing VLMs for User-Specific Queries [78.3] 視覚言語モデルのパーソナライズに向けての第一歩を踏み出し,ユーザが提供する概念を学習し,推論することを可能にする。
様々なユーザ固有の概念を効果的に認識するために,モデルのトグルとして機能する外部概念ヘッドを付加する。
この概念を認識して、VLMの中間機能空間に埋め込まれた新しい概念を学習する。
この埋め込みは、言語モデルを誘導し、ターゲットの概念を生成された応答に自然に統合する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:51:01 GMT)
GSVA: Generalized Segmentation via Multimodal Large Language Models [72.6] Generalized Referring Expression (GRES)は、従来のRESの範囲を拡張して、1つの式で複数のオブジェクトを参照したり、画像に存在しない空のターゲットを特定する。
セグメンテーションMLLMは、ユーザが特定のプロンプトで複数の主題を参照するケースを正しく扱えないため、現在のGRESの解決策は満足できないままである。
本稿では,このギャップに対処する汎用ビジョンアシスタント(GSVA)を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:20:49 GMT)
Foundation Models for Time Series Analysis: A Tutorial and Survey [70.4] ファンデーションモデル(FM)は、時系列分析のためのモデル設計のパラダイムを根本的に変えてきた。
本調査は,時系列解析のためのFMの概要を包括的かつ最新のものにすることを目的としている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:08:37 GMT)
OA-CNNs: Omni-Adaptive Sparse CNNs for 3D Semantic Segmentation [70.2] 設計上の違いを再検討し、スパースCNNが達成できることの限界をテストする。
本稿では,このギャップを埋めるために,適応受容場(親和性)と適応関係という2つの重要な要素を提案する。
この調査により、軽量モジュールを統合するネットワークのファミリーであるOmni-Adaptive 3D CNN(OA-CNN)が開発された。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:06:38 GMT)
QH9: A Quantum Hamiltonian Prediction Benchmark for QM9 Molecules [69.3] QH9と呼ばれる新しい量子ハミルトンデータセットを生成し、999または2998の分子動力学軌道に対して正確なハミルトン行列を提供する。
現在の機械学習モデルでは、任意の分子に対するハミルトン行列を予測する能力がある。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:16:03 GMT)
SoftPatch: Unsupervised Anomaly Detection with Noisy Data [67.4] 本稿では,画像センサ異常検出におけるラベルレベルのノイズを初めて考察する。
本稿では,メモリベースの非教師付きAD手法であるSoftPatchを提案する。
既存の手法と比較して、SoftPatchは通常のデータの強力なモデリング能力を維持し、コアセットにおける過信問題を軽減する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:49:34 GMT)
Toward Multi-class Anomaly Detection: Exploring Class-aware Unified Model against Inter-class Interference [67.4] 統一型異常検出(MINT-AD)のためのマルチクラスインプリシトニューラル表現変換器を提案する。
マルチクラス分布を学習することにより、モデルが変換器デコーダのクラス対応クエリ埋め込みを生成する。
MINT-ADは、カテゴリと位置情報を特徴埋め込み空間に投影することができ、さらに分類と事前確率損失関数によって監督される。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:08:31 GMT)
CFPL-FAS: Class Free Prompt Learning for Generalizable Face Anti-spoofing [66.7] ドメイン一般化 (DG) ベースの Face Anti-Spoofing (FAS) は、目に見えないドメインにおけるモデルの性能を改善することを目的としている。
私たちはCLIPのような大規模VLMを利用し、テキスト機能を利用して分類器の重みを動的に調整し、一般化可能な視覚的特徴を探索する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:58:50 GMT)
CathFlow: Self-Supervised Segmentation of Catheters in Interventional Ultrasound Using Optical Flow and Transformers [66.2] 縦型超音波画像におけるカテーテルのセグメンテーションのための自己教師型ディープラーニングアーキテクチャを提案する。
ネットワークアーキテクチャは、Attention in Attentionメカニズムで構築されたセグメンテーショントランスフォーマであるAiAReSeg上に構築されている。
我々は,シリコンオルタファントムから収集した合成データと画像からなる実験データセット上で,我々のモデルを検証した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:13:36 GMT)
Volumetric Environment Representation for Vision-Language Navigation [66.0] 視覚言語ナビゲーション(VLN)は、視覚的な観察と自然言語の指示に基づいて、エージェントが3D環境をナビゲートする必要がある。
本研究では,物理世界を3次元構造細胞にボクセル化するボリューム環境表現(VER)を提案する。
VERは3D占有率、3D部屋レイアウト、および3Dバウンディングボックスを共同で予測する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 06:14:46 GMT)
Frequency-Aware Transformer for Learned Image Compression [64.3] 学習画像圧縮(lic)のためのマルチスケール指向性アナリシスを初めて実現した周波数認識変換器(FAT)ブロックを提案する。
FATブロックは、自然画像のマルチスケールおよび指向性周波数成分をキャプチャするための周波数分解ウィンドウアテンション(FDWA)モジュールを含む。
また、周波数変調フィードフォワードネットワーク(FMFFN)を導入し、異なる周波数成分を適応的に変調し、周波数歪み性能を向上させる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:52:57 GMT)
Semantics Meets Temporal Correspondence: Self-supervised Object-centric Learning in Videos [63.9] 自己教師付き手法は、高レベルの意味論と低レベルの時間対応の学習において顕著な進歩を見せている。
融合した意味特徴と対応地図の上に,意味認識型マスキングスロットアテンションを提案する。
我々は、時間的コヒーレントなオブジェクト中心表現を促進するために、セマンティックおよびインスタンスレベルの時間的一貫性を自己スーパービジョンとして採用する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:28:34 GMT)
ReNoise: Real Image Inversion Through Iterative Noising [63.0] 本研究では,操作数を増やすことなく,高い品質と操作率の逆転法を導入し,再現精度を向上する。
我々は,近年の高速化拡散モデルを含む様々なサンプリングアルゴリズムとモデルを用いて,Renoise手法の性能を評価する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:52:08 GMT)
XLAVS-R: Cross-Lingual Audio-Visual Speech Representation Learning for Noise-Robust Speech Perception [62.7] 音声認識と翻訳システムではノイズの多い入力が不十分である。
XLAVS-Rは、雑音による音声認識と翻訳のための言語間音声・視覚音声表現モデルである。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:52:17 GMT)
Few-Shot Adversarial Prompt Learning on Vision-Language Models [62.5] 知覚不能な逆境摂動に対するディープニューラルネットワークの脆弱性は、広く注目を集めている。
それまでの努力は、相手の視覚的特徴をテキストの監督と整合させることで、ゼロショットの敵の堅牢性を達成した。
本稿では、限られたデータで入力シーケンスを適応させることで、対向性を大幅に向上させる、数ショットの対向的プロンプトフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:28:43 GMT)
Implicit Style-Content Separation using B-LoRA [61.7] 一つの画像のスタイルとコンテンツコンポーネントを暗黙的に分離する手法であるB-LoRAを紹介する。
SDXLのアーキテクチャをLoRAと組み合わせて解析することにより、2つのブロックのLoRA重みを共同で学習することで、スタイル・コンテント分離を実現する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:20:21 GMT)
NaNa and MiGu: Semantic Data Augmentation Techniques to Enhance Protein Classification in Graph Neural Networks [60.5] 本稿では,背骨化学および側鎖生物物理情報をタンパク質分類タスクに組み込む新しい意味データ拡張手法を提案する。
具体的には, 分子生物学的, 二次構造, 化学結合, およびタンパク質のイオン特性を活用し, 分類作業を容易にする。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:27:57 GMT)
ED-NeRF: Efficient Text-Guided Editing of 3D Scene with Latent Space NeRF [60.5] ED-NeRFと呼ばれる新しい3次元NeRF編集手法を提案する。
現実のシーンを、ユニークな精細化層を通して、潜時拡散モデル(LDM)の潜時空間に埋め込む。
このアプローチにより、より高速であるだけでなく、より編集しやすいNeRFバックボーンが得られる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:20:35 GMT)
AMP: Autoregressive Motion Prediction Revisited with Next Token Prediction for Autonomous Driving [59.9] 本稿では,GPT方式の次のトークン動作予測を動作予測に導入する。
同種単位-ワードからなる言語データとは異なり、運転シーンの要素は複雑な空間的・時間的・意味的な関係を持つ可能性がある。
そこで本稿では,情報集約と位置符号化スタイルの異なる3つの因子化アテンションモジュールを用いて,それらの関係を捉えることを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:01:10 GMT)
Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language Models through Question Complexity [59.6] Retrieval-augmented Large Language Models (LLMs) は、質問回答(QA)のようなタスクにおける応答精度を高めるための有望なアプローチとして登場した。
本稿では,クエリの複雑さに基づいて,LLMの最適戦略を動的に選択できる適応型QAフレームワークを提案する。
オープンドメインのQAデータセットを用いて、複数のクエリの複雑さを網羅し、QAシステムの全体的な効率性と精度を高めることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:52:30 GMT)
EfficientDreamer: High-Fidelity and Robust 3D Creation via Orthogonal-view Diffusion Prior [59.3] 直交ビュー画像誘導を利用した高画質な3Dコンテンツ生成パイプラインを提案する。
本稿では,与えられたテキストプロンプトに基づいて4つのサブイメージからなる画像を生成する2次元拡散モデルを提案する。
また,生成した3Dコンテンツの詳細をさらに改善する3D合成ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 06:45:32 GMT)
Understanding Information Disclosure from Secure Computation Output: A Study of Average Salary Computation [58.7] 関数結果の観察からプライベート入力に関する情報開示を定量化することが,本研究の課題である。
ボストン市における男女賃金格差の研究に動機づけられたこの研究は、給与の平均計算に焦点を当てる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 01:38:43 GMT)
Deep Learning for Trajectory Data Management and Mining: A Survey and Beyond [58.6] 軌道計算は、位置サービス、都市交通、公共安全など、様々な実用用途において重要である。
トラジェクトリ・コンピューティングのためのディープラーニング(DL4Traj)の開発と最近の進歩について概観する。
特に、軌道計算を増強する可能性を持つ大規模言語モデル(LLM)の最近の進歩をカプセル化する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:57:27 GMT)
Is Reference Necessary in the Evaluation of NLG Systems? When and Where? [58.5] 基準自由度は人間の判断と高い相関を示し,言語品質の低下に対する感度が高いことを示す。
本研究は,自動測定の適切な適用方法と,測定値の選択が評価性能に与える影響について考察する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:31:11 GMT)
StreamingT2V: Consistent, Dynamic, and Extendable Long Video Generation from Text [58.5] 本稿では,80,240,600,1200以上のフレームをスムーズな遷移で自動回帰的に生成するStreamingT2Vを紹介する。
私たちのコードは、https://github.com/Picsart-AI-Research/StreamingT2V.comで利用可能です。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:27:29 GMT)
The All-Seeing Project V2: Towards General Relation Comprehension of the Open World [58.4] 本稿では,画像のオブジェクト関係を理解するために設計された新しいモデルとデータセットであるAll-Seeing Project V2を紹介する。
本稿では,テキスト生成,オブジェクトローカライゼーション,関係理解の定式化を関係会話タスクに統合するAll-Seeing Model V2を提案する。
我々のモデルは、画像内の全ての物体を知覚・認識するだけでなく、それらの間の複雑な関係グラフの把握にも優れている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:25:52 GMT)
FMM-Attack: A Flow-based Multi-modal Adversarial Attack on Video-based LLMs [57.6] 本稿では,ビデオベース大規模言語モデル (LLM) に適した最初の敵攻撃を提案する。
我々の攻撃は、ビデオに知覚不能な逆方向の摂動を加えると、ビデオベースのLCMを効果的に誘導し、誤った回答を発生させる。
我々のFMM-Attackは、モデル出力のギャンブルを誘導し、ビデオベースのLCMを幻覚させる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:54:27 GMT)
Parameter-Efficient Fine-Tuning for Large Models: A Comprehensive Survey [57.5] Efficient Fine-Tuning (PEFT) は、様々な下流タスクに対して大きなモデルを効率的に適応することで、実用的なソリューションを提供する。
PEFTは、事前訓練された大規模モデルのパラメータを調整して特定のタスクに適応させ、追加のパラメータや計算リソースの数を最小限にするプロセスを指す。
この調査は、PEFTアルゴリズムとそのシステム実装の両方を理解することを目的とした研究者にとって必須のリソースであり、最近の進歩と実用化に関する詳細な知見を提供する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:55:50 GMT)
Building Accurate Translation-Tailored LLMs with Language Aware Instruction Tuning [57.3] オフターゲット翻訳は、特に低リソース言語では未解決の問題である。
最近の研究は、翻訳命令の機能を強調するために高度なプロンプト戦略を設計するか、LLMの文脈内学習能力を活用している。
本研究では,LLMの命令追従能力(特に翻訳方向)を向上させるために,2段階の微調整アルゴリズムを設計する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:47:40 GMT)
Detoxifying Large Language Models via Knowledge Editing [57.1] 本稿では,Large Language Models (LLM) のデトックス化のための知識編集手法について検討する。
我々は、強力な攻撃プロンプトを持つ9つの安全でないカテゴリをカバーするベンチマーク、SafeEditを構築した。
我々は,知識編集アプローチを従来のベースラインと比較する実験を行い,知識編集がLLMを効率的に解毒する可能性を示唆した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:18:30 GMT)
A Generative Approach for Wikipedia-Scale Visual Entity Recognition [56.6] 与えられたクエリ画像をWikipediaにある600万の既存エンティティの1つにマッピングするタスクに対処する。
本稿では,対象エンティティを識別する「意味的・識別的コード」の自動復号化を学習する,新しい生成エンティティ認識フレームワークを紹介する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:59:13 GMT)
Unified Static and Dynamic Network: Efficient Temporal Filtering for Video Grounding [56.3] ビデオとテキスト/オーディオクエリ間の意味的関連を学習するために,Unified Static and Dynamic Network (UniSDNet) を設計する。
我々のUniSDNetは、NLVG(Natural Language Video Grounding)タスクとSLVG(Spoke Language Video Grounding)タスクの両方に適用できます。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 06:53:40 GMT)
A Design Space for Intelligent and Interactive Writing Assistants [56.2] タスク、ユーザ、テクノロジ、インタラクション、エコシステムの5つの側面について調べる。
各側面において、115の論文を体系的にレビューすることで、次元(アスペクトの基本成分)と符号(各次元の潜在的なオプション)を定義する。
私たちのデザインスペースは、研究者やデザイナーに、アシスタントを書く様々な可能性について、ナビゲートし、理解し、比較するための実用的なツールを提供することを目的としています。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:03:16 GMT)
Chat-UniVi: Unified Visual Representation Empowers Large Language Models with Image and Video Understanding [55.7] Chat-UniViは、画像やビデオを含む会話を解釈し、関与できる統一ビジョン言語モデルである。
画像やビデオを一様に表現するために、ダイナミックな視覚トークンのセットを使用します。
我々はマルチスケール表現を活用し、モデルが高レベルなセマンティック概念と低レベルな視覚的詳細の両方を知覚できるようにする。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:28:06 GMT)
HAC: Hash-grid Assisted Context for 3D Gaussian Splatting Compression [55.6] 3D Gaussian Splatting (3DGS) は、新しいビュー合成のための有望なフレームワークとして登場した。
高速な3DGS表現のためのHash-grid Assisted Context (HAC) フレームワークを提案する。
私たちの研究は、コンテキストベースの3DGS表現の圧縮を探求するパイオニアです。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:28:58 GMT)
The Manga Whisperer: Automatically Generating Transcriptions for Comics [55.5] 我々は,パネル,テキストボックス,文字ボックスを検出可能な統一モデル Magi を提案する。
本稿では,検出したテキストボックスを読み順にソートし,対話文を生成する手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:59:50 GMT)
Intrinsic Image Diffusion for Indoor Single-view Material Estimation [55.3] 室内シーンの外観分解のための生成モデルIntrinsic Image Diffusionを提案する。
1つの入力ビューから、アルベド、粗さ、および金属地図として表される複数の材料説明をサンプリングする。
提案手法は,PSNRで1.5dB$,アルベド予測で45%のFIDスコアを達成し,よりシャープで,より一貫性があり,より詳細な資料を生成する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:51:31 GMT)
Learning Gaussian Representation for Eye Fixation Prediction [54.9] 既存のアイ固定予測方法は、入力画像から原固定点から生成された対応する濃密な固定マップへのマッピングを行う。
本稿ではアイフィグレーションモデリングのためのガウス表現について紹介する。
我々は,リアルタイムな固定予測を実現するために,軽量なバックボーン上にフレームワークを設計する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 20:28:22 GMT)
C-TPT: Calibrated Test-Time Prompt Tuning for Vision-Language Models via Text Feature Dispersion [54.8] 深層学習において,ラベル付きデータを必要としない微調整手法としてテスト時間適応が注目されている。
本稿では,CLIPの固有特性を利用したテスト時プロンプトチューニング時の校正について検討する。
そこで本研究では,C-TPT(Calibrated Test-time Prompt Tuning)という,キャリブレーションの強化によるテスト時間中のプロンプトの最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:08:29 GMT)
Particip-AI: A Democratic Surveying Framework for Anticipating Future AI Use Cases, Harms and Benefits [54.6] Particip-AIは、現在および将来のAIユースケースと、非専門家から損害と利益を収集するフレームワークである。
人口統計学的に多様な参加者295名から回答を得た。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 19:12:37 GMT)
Visually-Aware Context Modeling for News Image Captioning [54.3] News Image Captioningは、ニュース記事や画像からキャプションを作成することを目的としている。
より優れた名前埋め込みを学習するための顔命名モジュールを提案する。
私たちはCLIPを使用して、画像にセマンティックに近い文を検索します。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:31:56 GMT)
Exploring 3D Human Pose Estimation and Forecasting from the Robot's Perspective: The HARPER Dataset [53.8] 本稿では,ユーザとスポット間のダイアドインタラクションにおける3次元ポーズ推定と予測のための新しいデータセットであるHARPERを紹介する。
キーノーベルティは、ロボットの視点、すなわちロボットのセンサーが捉えたデータに焦点を当てることである。
HARPERの基盤となるシナリオには15のアクションが含まれており、そのうち10つはロボットとユーザの間の物理的接触を含んでいる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:53:50 GMT)
Self-Supervised Class-Agnostic Motion Prediction with Spatial and Temporal Consistency Regularizations [53.8] クラスに依存しない動き予測法は点雲全体の動きを直接予測する。
既存のほとんどのメソッドは、完全に教師付き学習に依存しているが、ポイントクラウドデータの手作業によるラベル付けは、手間と時間を要する。
3つの簡単な空間的・時間的正則化損失を導入し,自己指導型学習プロセスの効率化を図る。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:40:16 GMT)
Distilling Reinforcement Learning Policies for Interpretable Robot Locomotion: Gradient Boosting Machines and Symbolic Regression [53.3] 本稿では, ニューラルRLポリシをより解釈可能な形式に蒸留する新しい手法を提案する。
我々は、RLを用いて専門家のニューラルネットワークポリシーを訓練し、(i)GBM、(ii)EBM、(iii)シンボリックポリシーに蒸留する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:54:45 GMT)
A Taxonomy of Ambiguity Types for NLP [53.1] NLP分析を容易にするために,英語で見られるあいまいさの分類法を提案する。
私たちの分類学は、言語あいまいさデータにおいて意味のある分割を実現するのに役立ち、データセットとモデルパフォーマンスのよりきめ細かい評価を可能にします。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 01:47:22 GMT)
3D Object Detection from Point Cloud via Voting Step Diffusion [53.0] 既存の投票ベースのメソッドは、個々のオブジェクトの部分的な面から厳しいノイズとともに投票を受け取り、亜最適検出性能をもたらす。
雑音条件付きスコアネットワークを用いて分布のスコア関数を推定することにより、ランダムな3Dポイントを分布の高密度領域へ移動させる新しい手法を提案する。
大規模屋内3DシーンデータセットSUN RGB-DとScanNet V2の実験により,提案手法の優位性を実証した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:04:52 GMT)
Aligning Step-by-Step Instructional Diagrams to Video Demonstrations [51.7] 組立図として表現される(i)命令ステップと、(ii)動画セグメントとを関連付ける新しい設定について考察する。
本稿では,ビデオの微妙な詳細化を学習する,教師付きコントラスト学習手法を提案する。
池田組立におけるIAW実験は, 代替案に対するアプローチの優れた性能を示すものである。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 02:31:39 GMT)
Exploring the Potential of Large Language Models in Graph Generation [51.0] グラフ生成は、与えられたプロパティを持つグラフを生成するために、大きな言語モデル(LLM)を必要とする。
本稿では,LLMのグラフ生成能力について,系統的なタスク設計と実験による検討を行う。
評価の結果,LLM,特にGPT-4は,グラフ生成タスクに予備的能力を示すことがわかった。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:37:54 GMT)
MinD-3D: Reconstruct High-quality 3D objects in Human Brain [50.5] Recon3DMindは、fMRI(Functional Magnetic Resonance Imaging)信号から3次元視覚を再構成するための革新的なタスクである。
このデータセットは14人の参加者のデータを含み、3Dオブジェクトの360度ビデオが特徴である。
我々は,脳の3次元視覚情報をfMRI信号から復号化するための,新規で効果的な3段階フレームワークMinD-3Dを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:19:05 GMT)
Comparing Plausibility Estimates in Base and Instruction-Tuned Large Language Models [50.2] 本研究では,英語文の可読性タスクにおいて,暗黙的プロンプトと暗黙的推定を用いて,ベースおよび命令調整型LLMの性能を比較した。
実験1では、モデルアーキテクチャと可視性データセットを通して、ログ可能性(textitLL$)スコアが文の可視性を示す最も信頼性の高い指標であることが示されている。
実験2では、モデル間の$textitLL$スコアが、期待される方法でコンテキストによって変調されることを示し、コンテキストに敏感な3つのメトリクスで高いパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 22:08:44 GMT)
Toward a Theory of Causation for Interpreting Neural Code Models [49.9] 本稿では,ニューラルコードモデル(NCM)に特化したポストホック解釈法である$do_code$を紹介する。
$do_code$は、言語指向の説明を可能にする因果推論に基づいている。
その結果,NCMはコード構文の変化に敏感であることが判明した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:30:22 GMT)
Pre-training Language Model Incorporating Domain-specific Heterogeneous Knowledge into A Unified Representation [49.9] 本研究では, 構造化されていないテキスト, 半構造化されたテキスト, 十分に構造化されたテキストを含む, あらゆる形式のテキストに対して, 統一された事前学習言語モデル (PLM) を提案する。
提案手法は,データの1/4のみを用いて,プレーンテキストの事前学習に優れる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:23:38 GMT)
PSALM: Pixelwise SegmentAtion with Large Multi-Modal Model [49.8] PSALMは、セグメント化タスクの課題に対処するため、LMM(Large Multi-modal Model)の強力な拡張である。
マスクデコーダとよく設計された入力スキーマを組み込んで,さまざまなセグメンテーションタスクを処理する。
PSALMの柔軟な設計は、複数のデータセットとタスクのジョイントトレーニングをサポートし、パフォーマンスとタスクの一般化を改善している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:50:47 GMT)
Evaluating, Understanding, and Improving Constrained Text Generation for Large Language Models [49.7] 本研究では,大言語モデル(LLM)の制約付きテキスト生成について検討する。
本研究は主に,制約を語彙型,構造型,関係型に分類するオープンソース LLM に重点を置いている。
その結果、LLMの能力と不足を照らし、制約を取り入れ、制約付きテキスト生成における将来の発展に対する洞察を提供する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:29:35 GMT)
External Knowledge Enhanced 3D Scene Generation from Sketch [49.6] 本稿では,カスタマイズされた多種多様な3Dシーンを生成するためのスケッチベース知識拡張拡散アーキテクチャ(SEK)を提案する。
まず、オブジェクト関係を含む外部知識ベースを構築し、その後、知識強化グラフ推論を利用して手書きスケッチの理解を支援する。
3D-FRONTデータセットの実験により、我々のモデルは、最も近い競合であるDiffuSceneと比較して、FID、CKLを17.41%改善し、3Dシーン生成で37.18%改善し、FIDを19.12%改善し、20.06%改善した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:24:49 GMT)
LMM-Assisted Breast Cancer Treatment Target Segmentation with Consistency Embedding [49.4] 放射線腫瘍学の分野に適した多目的大規模マルチモーダルモデル(LMM)であるRO-LMMを提案する。
本モデルでは, 臨床ワークフローにおける一連のタスク, 臨床報告要約, 放射線治療計画提案, 計画指導対象ボリュームセグメンテーションを網羅する。
また, クリーン入力の処理能力を保ちながら, LMMの頑健さをノイズ入力に高める, CEFTune(Consistency Embedding Fine-Tuning)技術を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:38:51 GMT)
RiskQ: Risk-sensitive Multi-Agent Reinforcement Learning Value Factorization [49.3] 本稿では,リスクに敏感な個人・グローバル・マックス(RIGM)の原則を,個人・グローバル・マックス(IGM)と分散IGM(DIGM)の原則の一般化として紹介する。
RiskQは広範な実験によって有望な性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:36:22 GMT)
How Human-Centered Explainable AI Interface Are Designed and Evaluated: A Systematic Survey [49.0] Em Explainable Interfaces (EIs) の登場する領域は,XAI のユーザインターフェースとユーザエクスペリエンス設計に重点を置いている。
本稿では,人間とXAIの相互作用の現在の動向と,EI設計・開発に向けた将来的な方向性を明らかにするために,53の出版物を体系的に調査する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:44:56 GMT)
Multi-Agent VQA: Exploring Multi-Agent Foundation Models in Zero-Shot Visual Question Answering [48.7] 本稿では,オブジェクト検出とカウントにおける基礎モデルの限界を克服するために,Multi-Agent VQAという適応型マルチエージェントシステムを提案する。
ゼロショットシナリオで予備実験結果を示し、いくつかの障害事例を強調し、今後の研究の方向性を示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:57:25 GMT)
VidLA: Video-Language Alignment at Scale [48.7] 大規模なビデオ言語アライメントのためのアプローチであるVidLAを提案する。
提案手法は,複数の検索ベンチマークにおける最先端手法を超越した手法である。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 22:36:24 GMT)
Protein Conformation Generation via Force-Guided SE(3) Diffusion Models [48.5] 新しいタンパク質コンホメーションを生成するために、深層生成モデリング技術が用いられている。
本稿では,タンパク質コンフォメーション生成のための力誘導SE(3)拡散モデルConfDiffを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 02:44:08 GMT)
Lexicon-Level Contrastive Visual-Grounding Improves Language Modeling [47.8] LexiContrastive Grounding (LCG)は、視覚的監督を利用してテキスト表現を改善する言語学習手法である。
LCGは学習効率において標準言語のみのモデルより優れている。
CLIP、GIT、Flamingo、Vokenizationなど、視覚と言語による学習手順を改善する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:52:01 GMT)
Do Not Worry if You Do Not Have Data: Building Pretrained Language Models Using Translationese [47.5] 事前学習には大量のモノリンガルデータが必要であるが、ほとんど英語以外の言語では利用できない。
我々は、英語とIndic言語を例にとり、Webcrawled monolingual document (clean)を対象言語に翻訳する。
そして、この翻訳データに基づいて28Mと85Mのパラメータを含む言語モデルを訓練する(合成)。
下流の自然言語理解および生成タスクにおけるそれらの性能は、クリーンデータで事前訓練されたLMよりも、NLUタスクで3.56%、NLGタスクで1.51%劣っている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:03:59 GMT)
ReAct Meets ActRe: Autonomous Annotations of Agent Trajectories for Contrastive Self-Training [47.4] A$3$TはAutonomousを実現するフレームワークである。
法律の様式における代理人軌道の
AlfWorldでは、A$3$Tで訓練されたエージェントが1発成功率96%、100%成功率4回を達成している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:43:44 GMT)
Can ChatGPT Detect DeepFakes? A Study of Using Multimodal Large Language Models for Media Forensics [47.0] AI生成メディアコンテンツを指すDeepFakesは、偽情報の手段としての利用が懸念されている。
本稿では,DeepFake検出におけるマルチモーダル大言語モデル(LLM)の機能について検討する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 01:57:30 GMT)
Explorative Inbetweening of Time and Space [46.8] 与えられた開始フレームと終了フレームのみに基づいて映像生成を制御するために境界生成を導入する。
Time Reversal Fusionは、開始フレームと終了フレームに条件付けられた時間的に前方および後方にデノナイジングパスを融合する。
Time Reversal Fusionは、すべてのサブタスクにおける関連する作業よりも優れています。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:57:31 GMT)
LeFusion: Synthesizing Myocardial Pathology on Cardiac MRI via Lesion-Focus Diffusion Models [46.6] 本研究では,これらの課題をデータ合成によって緩和することを目的とする。
拡散に基づく画像の塗布に着想を得て,病変に焦点を絞った拡散モデルLeFusionを提案する。
提案手法では,一般的な nnUNet を用いて,合成データによって最先端のモデルを効果的に拡張できることを実証する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 01:25:39 GMT)
Multi-Level Explanations for Generative Language Models [45.8] LIMEやSHAPのような摂動に基づく説明法はテキスト分類に一般的に適用される。
この研究は、生成言語モデルへの拡張に焦点を当てている。
我々は、異なる属性アルゴリズムでインスタンス化できるMExGenという一般的なフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:06:14 GMT)
Annotation-Efficient Polyp Segmentation via Active Learning [45.6] アノテーション効率の良いポリプセグメンテーションのための深層能動的学習フレームワークを提案する。
実際に,ポリプの予測マップと背景領域の類似性を調べることで,各試料の不確実性を測定する。
提案手法は,パブリックデータセットと大規模社内データセットの双方において,競合相手と比較して,最先端性能を実現していることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:25:17 GMT)
Distilling and Retrieving Generalizable Knowledge for Robot Manipulation via Language Corrections [45.4] オンライン補正(DROC)の蒸留と検索について紹介する。
DROCは大規模言語モデル(LLM)ベースのシステムで、任意の形式の言語フィードバックに対応できる。
DROCは、知識ベースにおけるオンライン修正のシーケンスから、関連情報を効果的に蒸留できることを実証する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:47:22 GMT)
Qumode transfer between continuous and discrete variable devices [45.0] 連続可変(CV)と離散可変(DV)デバイス間で情報を変換することで、量子ネットワーク、量子センシング、量子機械学習、量子コンピューティングにおける多くの応用が可能になる。
本稿では,DVデバイス上でCV状態を符号化し,CVゲートを実装するための資源効率の高い手法と,CVとDVデバイス間でCV状態を転送するための2つの測定プロトコルを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:04:16 GMT)
Optimal control in large open quantum systems: the case of transmon readout and reset [45.0] 本稿では,共役状態法と逆時間バックプロパゲーションを組み合わせることで,大規模開系量子制御問題の解法を提案する。
超伝導量子ビットにおける2つの本質的に散逸する演算を最適化するために、この枠組みを適用した。
システムパラメータの固定化により,制御パルスの形状は両操作の忠実度と持続時間において2倍の改善が得られた。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:12:51 GMT)
New physics in spin entanglement [45.0] 本研究では, 粒子スピンの影響を受けながら, 木レベルでのスピン懸濁散乱と崩壊速度を保存できる理論を提案する。
これはローレンツ群を非局所的に破ることによって達成される。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:00:17 GMT)
On the Privacy of Selection Mechanisms with Gaussian Noise [44.6] ガウス雑音によるReport Noisy MaxとAbove Thresholdの分析を再検討する。
その結果,Report Noisy Max の純元 DP 境界と Above Threshold の純元 DP 境界を提供することが可能であることがわかった。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:03:39 GMT)
Multi-Level Feedback Generation with Large Language Models for Empowering Novice Peer Counselors [43.4] フィードバックを提供する既存のメカニズムは、主に人間の監督に依存している。
我々の研究は、大規模言語モデルを活用し、コンテキスト化されたマルチレベルフィードバックを提供し、ピアカウンセラーに力を与えることを目的としている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:23:56 GMT)
Tur[k]ingBench: A Challenge Benchmark for Web Agents [43.2] TurkingBenchは、マルチモーダルコンテキストによるテキスト命令を含むWebページとして定式化されたタスクのベンチマークである。
このベンチマークには158タスクに分散した32.2Kインスタンスが含まれている。
本ベンチマークでは,言語のみ,視覚のみ,レイアウトのみを含む最先端モデルの性能を評価する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 21:57:13 GMT)
See, Imagine, Plan: Discovering and Hallucinating Tasks from a Single Image [42.9] ゼロショットタスク幻覚(zero-shot Task Hallucination) – 任意のシーンの1つのRGBイメージを考えると、私たちのモデルは潜在的なタスクを特定し、ビデオとして実現された鮮やかな物語の中でそれらの実行を想像することができます。
動的相互作用のためのVLMと物体軌道のための3次元モーションプランニングを組み込んだ,シーンの分解,理解,再構築を段階的に向上するモジュールパイプラインを開発した。
我々のモデルは、機械と人間の両方が理解できる現実的で魅力的な視覚結果を示すタスクビデオによって、多様なタスクを発見できる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:35:24 GMT)
R2Human: Real-Time 3D Human Appearance Rendering from a Single Image [42.7] R2Humanは、1つの画像から3D人間の外見をリアルタイムにレンダリングし、推測するための最初のアプローチである。
本稿では、可視領域の高忠実な色再現を行い、隠蔽領域に対して信頼性の高い色推定を行うエンド・ツー・エンド・ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 02:08:18 GMT)
Can 3D Vision-Language Models Truly Understand Natural Language? [42.7] 既存の3D-VLモデルは言語入力のスタイルに敏感であり、同じ意味を持つ文を理解するのに苦労するが、異なる変種で書かれる。
本稿では,様々なタスクにまたがって3D-VLモデルを体系的に評価し,異なる言語スタイルのバリエーションを提示した場合のパフォーマンスをベンチマークする言語頑健性タスクを提案する。
包括的評価により,様々な3D-VLタスクにまたがる既存モデルの性能低下が明らかとなった。
最先端の3D-LLMでさえ、同じ文の変種を理解することができない。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:02:20 GMT)
Task-optimal data-driven surrogate models for eNMPC via differentiable simulation and optimization [42.7] 制御における最適性能を実現するために,クープマンシュロゲートモデルのエンドツーエンド学習法を提案する。
我々は,力学シミュレーションモデルに基づく環境の潜在的な微分可能性を利用した学習アルゴリズムを用いる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:28:43 GMT)
Unsupervised Audio-Visual Segmentation with Modality Alignment [42.6] Audio-Visualは、特定の音を生成する視覚シーンのオブジェクトをピクセルレベルで識別することを目的としている。
現在のAVSメソッドは、コストのかかるマスクとオーディオのペアの細かいアノテーションに依存しているため、スケーラビリティには実用的ではない。
そこで本研究では,モダリティ対応アライメント(MoCA)と呼ばれる教師なし学習手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:56:09 GMT)
Enabling Visual Composition and Animation in Unsupervised Video Generation [42.5] 我々は、ビデオGEnerationのビジュアルコンポジションとアニメーションのために、私たちのモデルCAGEを呼ぶ。
我々は様々な環境でCAGEの機能を示す一連の実験を行った。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:50:15 GMT)
FedMef: Towards Memory-efficient Federated Dynamic Pruning [42.1] フェデレートラーニング(FL)は、データの機密性を優先しながら、分散トレーニングを促進する。
リソース制約のあるデバイスへのその応用は、ディープラーニングモデルをトレーニングするための計算とメモリリソースの要求が高いため、難しい。
我々は,新しい,メモリ効率の高い動的刈取フレームワークであるFedMefを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:54:36 GMT)
Analysis of optical loss thresholds in the fusion-based quantum computing architecture [41.9] 集積フォトニック実装において、現在達成可能なレベルの光学損失を伴って、フォールトトレラント量子コンピューティングが可能であることを示す。
この結果から,FBQCモデルにおけるフォールトトレラント量子コンピューティングは,集積フォトニック実装において現在達成可能なレベルの光損失を伴って実現可能であることが示された。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 19:54:25 GMT)
BiTT: Bi-directional Texture Reconstruction of Interacting Two Hands from a Single Image [41.5] BiTTは、2つの相互作用する手の位置を再現し、面白く、ポーズのないテクスチャを再構築するための、最初のエンドツーエンドのトレーニング方法である。
In experiment using InterHand2.6M and RGB2Hands datasets, we method significantlyforms state-of-the-the-art hand texture reconstruction method。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:15:28 GMT)
From Tempered to Benign Overfitting in ReLU Neural Networks [41.3] 過自明なニューラルネットワーク(NN)は、ノイズの多いデータに完全に適合するように訓練された場合でも、適切に一般化することが観察される。
最近、NNの振舞いは「抑止過剰」と表現されることが多いと推測され、実証的に観察された。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:15:19 GMT)
Invisible Needle Detection in Ultrasound: Leveraging Mechanism-Induced Vibration [41.2] VibNetは、超音波画像における針検出の堅牢性を高めるために設計された学習ベースのフレームワークである。
Eulerian Video Magnification法にインスパイアされた我々は,針の低振幅周期運動を誘導するために外部ステップモータを利用する。
これらの振動を利用する針を堅牢かつ正確に検出するために、VibNetは学習ベースのShort-Time-ier-TransformとHough-Transformモジュールを統合する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:23:25 GMT)
Language Repository for Long Video Understanding [41.2] 本稿では,マルチモーダルビジョン LLM のための言語リポジトリ (LangRepo) を提案する。
我々のリポジトリは、簡潔で構造化された情報を解釈可能な(オールテクスチュアルな)表現として保持しています。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:59:35 GMT)
ANLS* -- A Universal Document Processing Metric for Generative Large Language Models [40.9] 本稿ではANLS*と呼ばれる生成モデルを評価するための新しい指標を提案する。
ANLS*メトリックは、既存のANLSメトリクスをドロップ・イン・リプレースとして拡張し、以前報告されたANLSスコアと互換性がある。
また、SFTと呼ばれる文書のプロンプトを生成する新しい手法を、LATINなどの他のプロンプト技術に対してベンチマークする。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:58:10 GMT)
Locating and Mitigating Gender Bias in Large Language Models [40.8] 大規模言語モデル(LLM)は、人間の好みを含む事実や人間の認知を学ぶために、広範囲なコーパスで事前訓練されている。
このプロセスは、社会においてバイアスや一般的なステレオタイプを取得するこれらのモデルに必然的に導かれる可能性がある。
本稿では,職業代名詞の性別バイアスを軽減する知識編集手法LSDMを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:57:43 GMT)
Editing Knowledge Representation of Language Lodel via Rephrased Prefix Prompts [40.8] PSPEM(Prefix Soft Prompt Editing Method)は,1回のトレーニングで一生使用可能な知識編集手法である。
PSPEMは、プロンプトエンコーダとエンコードコンバータを使用して、プロンプト内のキー情報を洗練する。
COUNTERFACTデータセットでは、PSPEMは100%近い編集精度を達成し、最も高い流速を示した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:15:25 GMT)
Multimodal-Conditioned Latent Diffusion Models for Fashion Image Editing [40.7] 本稿では,マルチモーダルなファッション画像編集の課題に取り組む。
本研究の目的は,テキスト,人体ポーズ,衣料品スケッチ,布地テクスチャなど,マルチモーダルなプロンプトでガイドされた人中心のファッションイメージを作成することである。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 20:43:10 GMT)
VXP: Voxel-Cross-Pixel Large-scale Image-LiDAR Place Recognition [40.6] 本稿では,Voxel-Cross-Pixel (VXP) アプローチを提案する。
VXPは、まずローカルな特徴対応を明示的に活用し、グローバルな記述子の類似性を強制する2段階の方法で訓練されている。
我々の手法は、最先端のクロスモーダル検索を大きなマージンで上回る。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:49:26 GMT)
A Multimodal Approach to Device-Directed Speech Detection with Large Language Models [40.3] 我々は、ユーザが各コマンドをトリガーフレーズで開始しなければならないという要求を省くことが可能かどうかを探る。
音声波形から得られた音響情報のみを用いて分類器を訓練する。
本研究では,1-best仮説などの自動音声認識システムのデコーダ出力を,大規模言語モデルへの入力特徴とみなす。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:44:03 GMT)
Unraveling the Mystery of Scaling Laws: Part I [40.0] 法則のスケーリングは、モデルサイズ、データセットサイズ、トレーニングで使用される計算リソースなどの損失と変数の間のパワー-ルールの相関を示す。
OpenAIのオリジナルのスケーリング法論文は、正確なスケーリング法則を導出するのに必要な詳細を公表していない。
1M60Mのパラメータしか持たないモデルでトレーニングすることで、スケーリング法則式における全ての定数項をステップバイステップで推定する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:08:43 GMT)
On the Concept Trustworthiness in Concept Bottleneck Models [39.9] 概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、推論プロセスを、概念マッピングと概念ラベル予測に分解する。
概念からラベルへの予測の透明性にもかかわらず、入力から中間概念へのマッピングはブラックボックスのままである。
概念が関連する領域から導出されているかどうかを評価するために、概念信頼性スコアと呼ばれる先駆的な指標が提案されている。
拡張されたCBMを導入し、特徴マップの異なる部分から概念予測を具体的に行えるようにした。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:24:53 GMT)
Adversarial Attacks and Defenses in Automated Control Systems: A Comprehensive Benchmark [39.7] 機械学習をACS(Automated Control Systems)に統合することで、産業プロセス管理における意思決定が促進される。
これらの技術を広く採用する際の制限の1つは、敵の攻撃に対するニューラルネットワークの脆弱性である。
本研究では、テネシー・イーストマン・プロセス・データセットを用いて、ACSにおける障害診断のためのディープラーニングモデルをデプロイする際の脅威について検討する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:18:47 GMT)
M3FAS: An Accurate and Robust MultiModal Mobile Face Anti-Spoofing System [39.4] フェイスプレゼンテーションアタック(FPA)は、様々な悪意あるアプリケーションを通じて、公衆の懸念を高めている。
我々は,M3FASという,正確で堅牢なマルチモーダル・モバイル・フェイス・アンチ・スポーフィングシステムを開発した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:39:44 GMT)
Knowledge-Enhanced Recommendation with User-Centric Subgraph Network [38.8] 本稿では,知識強化型ユーザ中心サブグラフネットワーク(KUCNet)を効果的に推奨する。
KUCNetはグラフニューラルネットワーク(GNN)を用いたグラフ学習アプローチで、効果的な推奨を行う。
提案手法は,特に新しい項目に対する精度,効率,解釈可能なレコメンデーションを実現する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:09:23 GMT)
Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference [38.8] 線形計算複雑性MLLMであるCobraを提案する。
特に、Cobraは効率的なMamba言語モデルを視覚的モダリティに統合する。
プロジェクトページは、https://sites.google.com/view/cobravlm.com/com/com/cobravlm.comで公開されている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:17:57 GMT)
DP-RDM: Adapting Diffusion Models to Private Domains Without Fine-Tuning [38.7] 我々は,最初の差分プライベート(DP)検索拡張生成アルゴリズムを開発した。
高品質なイメージサンプルを生成すると同時に、証明可能なプライバシ保証を提供することができる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:17:28 GMT)
RankPrompt: Step-by-Step Comparisons Make Language Models Better Reasoners [38.3] 最先端の言語モデルでさえ、推論プロセス中に論理的エラーを起こしやすい。
RankPromptは、LSMが自律的に回答をランク付けできる革新的なプロンプト戦略です。
実験の結果, RankPrompt は ChatGPT と GPT-4 の推論性能を大幅に向上し,最大13% の改善が得られた。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 06:01:48 GMT)
AnyV2V: A Plug-and-Play Framework For Any Video-to-Video Editing Tasks [38.3] 本稿では,ビデオ編集を2つのステップに簡略化する新しいトレーニングフリーフレームワークであるAnyV2Vを紹介する。
最初の段階では、AnyV2Vは既存の画像編集ツールをプラグインして、幅広いビデオ編集タスクをサポートすることができる。
従来のプロンプトベースの編集方法以外にも、AnyV2Vは参照ベースのスタイル転送、主題駆動編集、アイデンティティ操作などの新しいビデオ編集タスクもサポートする。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:15:00 GMT)
TeleMoMa: A Modular and Versatile Teleoperation System for Mobile Manipulation [38.2] 本研究では,移動マニピュレータの全身遠隔操作のための汎用・モジュールインタフェースであるTeleMoMaを実演する。
TeleMoMaは、RGBとディープカメラ、バーチャルリアリティコントローラ、キーボード、ジョイスティックなど、複数のヒューマンインターフェースを統合する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 19:57:46 GMT)
Unveiling Parts Beyond Objects:Towards Finer-Granularity Referring Expression Segmentation [38.1] MRES-32Mは、32.2M以上の高品質のマスクとキャプションから構成される。
さらに、UniRESという名前のシンプルな強力なモデルは、統一されたオブジェクトレベルと部分レベルグラウンドタスクを達成するように設計されている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:09:52 GMT)
EasyInstruct: An Easy-to-use Instruction Processing Framework for Large Language Models [37.8] EasyInstructは、Large Language Models (LLMs)のための使いやすい命令処理フレームワークである。
EasyInstructは命令生成、選択、プロンプトをモジュール化し、それらの組み合わせと相互作用も考慮する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:33:34 GMT)
LiFT: A Surprisingly Simple Lightweight Feature Transform for Dense ViT Descriptors [37.1] 本稿では、高密度下流タスクにおけるVT機能の性能を向上させるための簡易な自己教師手法を提案する。
我々の軽量特徴変換(LiFT)は、単純でコンパクトな後処理ネットワークである。
LiFTは自己指導型で高速かつ容易に訓練でき、ViT機能の密度を最小限の余分な推論コストで向上させる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:59:55 GMT)
Text-Enhanced Data-free Approach for Federated Class-Incremental Learning [36.7] データ自由な知識伝達は、忘れることとデータのプライバシー問題に対処する上で重要な役割を果たす。
従来のアプローチでは、DFKTとモデルトレーニングフェーズの間に重要なシナジーが欠如していた。
事前訓練された言語モデルによって生成されたラベルテキストの埋め込みを利用して,この問題に対処するためにLANDERを導入する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 03:24:01 GMT)
Safeguarding Medical Image Segmentation Datasets against Unauthorized Training via Contour- and Texture-Aware Perturbations [36.4] UMedと呼ばれる非学習可能な医用画像生成手法を提案する。
UMedは、画像を保護するために輪郭とテクスチャを意識した摂動を注入することで、MISの以前の知識を統合する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:22:23 GMT)
V2X-DGW: Domain Generalization for Multi-agent Perception under Adverse Weather Conditions [36.3] 気象条件下でのマルチエージェント認識システムにおいて,LiDARに基づく3次元物体検出のための領域一般化手法 V2X-DGW を提案する。
クリーンな天候だけでなく、クリーンな天気データのみを学習することで、好適なマルチエージェントのパフォーマンスを確保することを目的としている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 00:55:04 GMT)
Knowing What LLMs DO NOT Know: A Simple Yet Effective Self-Detection Method [36.2] 大規模言語モデル(LLM)は自然言語処理(NLP)タスクにおいて大きな可能性を示している。
近年の文献では、LLMは断続的に非実効応答を生成する。
本研究では,LLM が知らない質問が非現実的な結果を生成する傾向にあることを検知する新たな自己検出手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:57:23 GMT)
Generalizing deep learning models for medical image classification [36.2] 本稿では,Deep Learning(DL)に基づく分類モデルの一般化手法の最近の展開を概観する。
また、評価プロトコルやベンチマークの改善など、今後の課題についても論じる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:38:33 GMT)
Diffusion Models with Ensembled Structure-Based Anomaly Scoring for Unsupervised Anomaly Detection [35.5] 非教師なし異常検出(UAD)は、病理分類の有効な代替手段として現れる。
近年のUAD異常スコアリング機能は、強度のみに焦点を合わせ、構造的差異を無視することが多く、セグメンテーション性能を損なう。
構造的類似性(SSIM)は強度と構造的格差の両方を捉え、古典的な$l1$エラーよりも有利である。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:50:39 GMT)
Trustworthy LLMs: a Survey and Guideline for Evaluating Large Language Models' Alignment [35.4] 本稿では,大規模言語モデル(LLM)の評価において考慮すべき重要な要素について,包括的に調査する。
この調査は、信頼性、安全性、公正性、誤用に対する抵抗性、説明可能性と推論、社会的規範への固執、堅牢性の7つの主要なカテゴリーをカバーしている。
結果は、一般に、より整合したモデルは、全体的な信頼性の観点から、より良いパフォーマンスを示す傾向があることを示している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 00:21:14 GMT)
TiC-CLIP: Continual Training of CLIP Models [35.1] 本稿では,視覚言語モデルをトレーニングするためのWebスケールの時系列ベンチマークについて紹介する。
時間連続データ上でモデルを効率的にトレーニングする方法を示す。
我々は、前回のチェックポイントからトレーニングを継続し、古いデータを再生するシンプルなリハーサルベースのアプローチが、スクラッチからリトレーニングする標準的なプラクティスと比較して、計算を2.5倍に削減することを示した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:47:27 GMT)
Enhanced Few-Shot Class-Incremental Learning via Ensemble Models [34.8] クラス増分学習(class-incremental learning)は、新しいクラスを限られたトレーニングデータに継続的に適合させることを目的としている。
主な課題は、珍しい新しいトレーニングサンプルを過度に適合させ、古いクラスを忘れることである。
本稿では,データ拡張と協調して一般化を促進する新しいアンサンブルモデルフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:52:55 GMT)
DenseFormer: Enhancing Information Flow in Transformers via Depth Weighted Averaging [34.6] 我々はDenseFormerを提案する。DenseFormerは、モデルのサイズを増大させることなく、モデルの難易度を向上する標準アーキテクチャの簡単な修正である。
提案手法は,現在および過去の表現の重み付き平均を計算する,各変圧器ブロックの後の加算平均ステップに依存する。
実験によると、DenseFormerはよりデータ効率が高く、より深いトランスフォーマーモデルと同じ難易度に達する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:57:40 GMT)
Analyzing Local Representations of Self-supervised Vision Transformers [34.6] 各種自己監督型視覚変換器(ViT)の比較分析を行った。
大規模言語モデルに触発されて、微調整をほとんど行わずに様々なコンピュータビジョンタスクを実行するViTの能力について検討する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:57:25 GMT)
Contrastive Balancing Representation Learning for Heterogeneous Dose-Response Curves Estimation [34.2] 治療量の変化に対する個人の潜在的反応を推定することは、精密医療や管理科学などの分野における意思決定に不可欠である。
異種線量応答曲線を推定するために,CRNetと呼ばれる部分距離測度を用いたコントラストバランス表現学習ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:41:53 GMT)
Benchmarking Chinese Commonsense Reasoning of LLMs: From Chinese-Specifics to Reasoning-Memorization Correlations [34.1] CHARMは、中国語で大規模言語モデル(LLM)の常識推論能力を評価するための、網羅的で詳細なベンチマークである。
我々はCHARMで7つの英語と12の中国語のLLMを評価した。
一部のLLMは中国の常識を覚えることに苦労し、推論能力に影響を及ぼす一方、同様のパフォーマンスにもかかわらず推論の違いを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 03:52:01 GMT)
TD-MPC2: Scalable, Robust World Models for Continuous Control [33.5] TD-MPCはモデルに基づく強化学習アルゴリズムである。
本稿では,TD-MPCアルゴリズムを改良したTD-MPC2を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:56:19 GMT)
Weighted least-squares approximation with determinantal point processes and generalized volume sampling [33.3] 与えられた$m$-次元空間$V_m$の要素によって、函数を$L2$から近似する問題を考える。
近似は、ほぼ確実に$H$-normで測定された最高の近似誤差によって境界づけられていることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:29:32 GMT)
ClusteringSDF: Self-Organized Neural Implicit Surfaces for 3D Decomposition [33.0] ClusteringSDFは、ニューラルな暗黙の表面表現を通して3次元のセグメンテーションと再構成を実現するための新しいアプローチである。
ScanNetとReplicaのデータセットから得られた挑戦的なシーンにおける実験結果から,ClusteringSDFが競争力を発揮することを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:59:16 GMT)
CryCeleb: A Speaker Verification Dataset Based on Infant Cry Sounds [32.9] 786人の新生児から手動で発声した6時間以上の涙音を学術的に利用した。
最高性能のシステムは25.8%の誤差率で大幅な改善を達成した。
このデータセットにはさらなる研究の余地があり、検証タスクを超えて拡張される可能性がある。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:52:22 GMT)
CoachLM: Automatic Instruction Revisions Improve the Data Quality in LLM Instruction Tuning [32.5] 提案するCoachLMは,データセット内のサンプルを自動的に修正することで,命令データセットの品質を高める新しい手法である。
CoachLMは、人間の専門家によって改訂されたサンプルから訓練され、データセットの高品質なサンプルの割合が17.7%から78.9%に大幅に増加した。
結果から,CoachLMは命令調整LDMの指示追従能力を平均29.9%改善することがわかった。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 03:50:32 GMT)
RoDLA: Benchmarking the Robustness of Document Layout Analysis Models [32.5] 3つのデータセットの450万のドキュメントイメージを含むドキュメントレイアウト分析(DLA)モデルの堅牢性ベンチマークを導入する。
そこで本研究では,現実の文書処理に触発された36の共用文書摂動を伴う摂動分類を提案する。
文書摂動の影響をよりよく理解するために、摂動評価のための平均摂動効果(mPE)と頑健性評価のための平均ロバストネス劣化(mRD)の2つの指標を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:47:12 GMT)
Unsupervised Video Domain Adaptation with Masked Pre-Training and Collaborative Self-Training [32.3] 画像教師モデルを用いて,映像学生モデルを対象領域に適応させる。
UNITEは、まず自己教師付き事前訓練を使用して、ターゲットのドメインビデオ上で差別的特徴学習を促進する。
次に,ビデオ学生モデルとイメージ教師モデルを用いて,マスク付き対象データを用いた自己学習を行い,未ラベル対象ビデオのための改良された擬似ラベルを生成する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:53:48 GMT)
Direct2.5: Diverse Text-to-3D Generation via Multi-view 2.5D Diffusion [32.1] 3Dコンテンツを作成するための現在の方法は、時間がかかり、生成の多様性を失う。
本研究では,事前学習した2次元拡散モデルから2.5D拡散を微調整した多視点モデルを用いる。
特別に設計された融合方式による2.5D直接生成は,10秒で多種多様で,モードフリーで,高忠実な3Dコンテンツ生成を実現することができることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:21:58 GMT)
Learning Quadruped Locomotion Using Differentiable Simulation [31.8] 微分可能シミュレーションはより高速な収束とより安定した訓練を約束する。
我々のフレームワークは、ひとつのシミュレーションロボットを用いて、数分で四足歩行を学習することができる。
われわれのアプローチでは、四足歩行ロボットは、トロット、ペース、バウンド、ガロップなどの多様な移動スキルを、数分で挑戦的な地形で習得できる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 22:18:59 GMT)
Neural Markov Random Field for Stereo Matching [31.8] データ駆動型ニューラルネットワークを用いてポテンシャル関数とメッセージパッシングの両方を設計するニューラルネットワークモデルを提案する。
また,差分提案ネットワーク(DPN)を提案し,不一致の探索空間を適応的に創出する。
提案されたアプローチは、KITTI 2012と2015のリーダーボードの両方で1位であり、100msより高速である。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:53:23 GMT)
IDAdapter: Learning Mixed Features for Tuning-Free Personalization of Text-to-Image Models [31.8] IDAdapterは、単一の顔画像からパーソナライズされた画像生成における多様性とアイデンティティの保存を強化する、チューニング不要なアプローチである。
トレーニング期間中、特定のアイデンティティの複数の参照画像から混合した特徴を取り入れ、アイデンティティ関連コンテンツの詳細を充実させる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 02:31:58 GMT)
EDT: Improving Large Language Models' Generation by Entropy-based Dynamic Temperature Sampling [31.7] 生成品質と多様性のバランスをとるために,効率的なエントロピーに基づく動的温度サンプリング法を提案する。
我々の実験によると、EDTは様々なタスクで既存の戦略を著しく上回ります。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:41:12 GMT)
PointNeRF++: A multi-scale, point-based Neural Radiance Field [31.2] ポイントクラウドは、ニューラルシーン表現のイメージを補完する魅力的な情報ソースを提供する。
点雲の品質が低い場合、点雲に基づくNeRFレンダリング手法はうまく動作しない。
本稿では,複数のスケールの点雲を,異なる解像度でスパース・ボクセル・グリッドで集約する表現を提案する。
我々は,NeRF Synthetic, ScanNet, KITTI-360 のデータセットを用いて提案手法の有効性を検証する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 21:28:37 GMT)
Ranking Distillation for Open-Ended Video Question Answering with Insufficient Labels [31.1] 本稿では,ビデオ関連質問に対する応答として,大きめの回答から正しい回答を見つけることを目的とした,オープンなビデオ質問応答に焦点を当てた。
アノテーションのコストのため、既存のベンチマークのラベルは常に極めて不十分であり、典型的には1つの答えである。
そこで本研究では,手作業によるアノテーションを伴わずにこの問題を軽減するため,簡易かつ効果的なランキング蒸留フレームワーク (RADI) を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:37:50 GMT)
m&m's: A Benchmark to Evaluate Tool-Use for multi-step multi-modal Tasks [31.0] 我々は、33のツールを含む4K以上のマルチステップマルチモーダルタスクを含むベンチマークであるm&m'sを紹介する。
これら各タスククエリに対して、この現実的なツールセットを使用して自動生成されたプランを提供する。
1,565のタスクプランの高品質なサブセットを提供する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:25:23 GMT)
Click to Grasp: Zero-Shot Precise Manipulation via Visual Diffusion Descriptors [30.6] 本研究は,ゼロショット設定における精密操作のための微細部分記述子の接地について検討する。
我々は、それを密接な意味部分対応タスクとしてフレーミングすることで、この問題に対処する。
我々のモデルは、同じオブジェクトの視覚的に異なるインスタンスのソースイメージからユーザ定義クリックを参照して、特定の部分を操作するためのグリップパポーズを返します。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:26:19 GMT)
Deep Active Learning: A Reality Check [30.2] 単一モデル法はエントロピーに基づくアクティブラーニングを決定的に上回るものではない。
評価を他のタスクに拡張し、半教師付き学習と組み合わせて能動的学習の有効性を探求する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 19:28:17 GMT)
Vision-Language Models can Identify Distracted Driver Behavior from Naturalistic Videos [29.5] 本稿では,CLIPに基づく運転行動認識手法を提案する。
以上の結果から、このフレームワークは、ゼロショット転送における最先端のパフォーマンスと、2つの公開データセット上でドライバの状態を予測するためのビデオベースCLIPを提供する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:17:26 GMT)
MicroRes: Versatile Resilience Profiling in Microservices via Degradation Dissemination Indexing [29.5] マイクロサービスのレジリエンス — 障害から回復し、信頼性と応答性を備えたサービスを提供し続ける能力 — は、クラウドベンダにとって極めて重要です。
現在のプラクティスは、特定のマイクロサービスシステムに手動で設定された特定のルールに依存しており、結果として労働強度と柔軟性の問題が発生します。
私たちの洞察では、レジリエントなデプロイメントは、システムパフォーマンスからユーザ対応メトリクスへの劣化の拡散を効果的に防ぎ、後者はサービス品質に影響を与えます。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:12:43 GMT)
Unleashing Unlabeled Data: A Paradigm for Cross-View Geo-Localization [28.9] 本稿では,大規模クロスビュー・ジオローカライゼーション(CVGL)におけるラベルなしデータの有効利用について検討する。
CVGLの一般的なアプローチは、地上衛星画像ペアに依存し、ラベル駆動型教師付きトレーニングを採用する。
本稿では,初期擬似ラベルを検索するためのモデルを案内するクロスビュープロジェクションを含む教師なしフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:48:35 GMT)
NewsBench: Systematic Evaluation of LLMs for Writing Proficiency and Safety Adherence in Chinese Journalistic Editorial Applications [28.4] 本研究では,中国語ジャーナリスティック・ライティング(JWP)におけるLarge Language Models(LLM)の能力を評価するために開発された,新しいベンチマークフレームワークであるNewsBenchを提案する。
GPT-4とERNIE Botをトップパフォーマーとして強調した10個のLCMの包括的分析から,クリエイティブな文章作成作業において,ジャーナリストの倫理的順守が比較的欠如していることが判明した。
これらの発見は、AIが生成するジャーナリストコンテンツにおける倫理的ガイダンスの強化の必要性を強調しており、AI能力をジャーナリストの基準と安全に関する考慮に合わせるための一歩である。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:14:09 GMT)
Exact and general decoupled solutions of the LMC Multitask Gaussian Process model [28.3] コリージョン化線形モデル(英: Linear Model of Co- Regionalization、LMC)は、回帰や分類のためのマルチタスクガウス過程の非常に一般的なモデルである。
最近の研究によると、ある条件下では、モデルの潜在過程は切り離され、そのプロセスの数でのみ線形となる複雑さが生じる。
ここでは、これらの結果を拡張し、LCCの効率的な正確な計算に必要な条件はノイズモデルに関する軽度の仮説である、という最も一般的な仮定から示している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:36:26 GMT)
The NeurIPS 2023 Machine Learning for Audio Workshop: Affective Audio Benchmarks and Novel Data [28.2] NeurIPS 2023 Machine Learning for Audio Workshopは、さまざまなオーディオドメインから機械学習(ML)の専門家を集めている。
音声感情認識から音声イベント検出まで、音声駆動MLの貴重なタスクはいくつかあるが、他のML領域と比較して、コミュニティは希少である。
高品質なデータ収集は時間がかかり費用がかかるため、学術グループがしばしば最先端の戦略をより大きな、より一般化可能なデータセットに適用することは困難である。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 00:13:59 GMT)
Soft Masked Transformer for Point Cloud Processing with Skip Attention-Based Upsampling [28.2] 我々は、タスクレベルの情報をエンコードステージに統合することで、パフォーマンスが大幅に向上すると主張している。
符号化層と復号層の機能間の効果的な通信を容易にするために,スキップアテンションに基づくアップサンプリングブロックを導入する。
S3DISエリア5では73.4% mIoU、SWANデータセットでは62.4% mIoUである。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:34:24 GMT)
LLM4SGG: Large Language Model for Weakly Supervised Scene Graph Generation [28.0] WSSGG(Weakly Supervised Scene Graph Generation)研究は、最近、完全に教師されたアプローチの代替として現れた。
弱教師付きSGG(LLM4SGG)のための新しいアプローチ、すなわちLarge Language Modelを提案する。
Recall@Kと平均Recall@Kは、最先端のWSSGG法と比較して大幅に改善されている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:59:04 GMT)
Effective Structured Prompting by Meta-Learning and Representative Verbalizer [27.6] 効果的な構造化プロンプトのためのメタプロンプターを提案する。
本稿では,特徴埋め込みから直接ラベル埋め込みを構築する新しいソフトな動詞変換器(RepVerb)を提案する。
実験の結果,MetaPrompterは最近の最先端技術よりも優れた性能を示した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:37:23 GMT)
The Era of Semantic Decoding [27.6] 本稿では,セマンティック・スペースにおける協調処理を最適化する手法として,セマンティック・デコーディング(semantic decoding)という新たな視点を提案する。
LLMを意味的トークン(既知の思考)と呼ばれる意味のある情報を操作するためのセマンティックプロセッサとして概念化する。
セマンティック・プロセッサ間の協調的な相互作用を,セマンティック・デコーディング・アルゴリズムとして,セマンティック・スペースの最適化と探索を行う。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:06:17 GMT)
LaserHuman: Language-guided Scene-aware Human Motion Generation in Free Environment [27.4] 我々は,Scene-Text-to-Motion研究に革命をもたらすために設計された,先駆的なデータセットであるLaserHumanを紹介する。
LaserHumanは、本物の人間の動きを3D環境に含めることで際立っている。
本稿では,既存のデータセット上での最先端性能を実現するための多条件拡散モデルを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:06:49 GMT)
Existence Is Chaos: Enhancing 3D Human Motion Prediction with Uncertainty Consideration [27.3] トレーニングデータにおける記録された動きは、所定の結果ではなく、将来の可能性の観測である可能性が示唆された。
不確実性を考慮した計算効率の良いエンコーダデコーダモデルを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 03:34:18 GMT)
Constrained Reinforcement Learning with Smoothed Log Barrier Function [27.2] CSAC-LB (Constrained Soft Actor-Critic with Log Barrier Function) と呼ばれる新しい制約付きRL法を提案する。
線形スムーズなログバリア関数を追加の安全評論家に適用することにより、事前トレーニングなしで競争性能を達成する。
CSAC-LBでは,様々な難易度を有する制約付き制御タスクにおいて,最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:02:52 GMT)
DexDribbler: Learning Dexterous Soccer Manipulation via Dynamic Supervision [27.0] 移動物体の協調操作と,サッカーなどの足による移動は,学習コミュニティにおいて目立たない注目を集める。
出力をダイナミックな関節レベル移動監視として使用し,必要な身体レベルの動きを正確に計算するフィードバック制御ブロックを提案する。
我々は,我々の学習手法が政策ネットワークをより早く収束させるだけでなく,サッカーロボットが高度な操作を行うことを可能にすることを観察した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:16:28 GMT)
DreamReward: Text-to-3D Generation with Human Preference [26.8] 本研究では,人間の嗜好フィードバックからテキスト・ツー・3Dモデルを学習し,改良するための包括的フレームワークDreamRewardを提案する。
Reward3D - 最初の汎用テキストから3Dの人間の嗜好報酬モデルを構築する。
本研究は,テキスト・ツー・3Dモデルを改善するために,人間のフィードバックから学習する大きな可能性を実証するものである。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:58:04 GMT)
Facilitating NSFW Text Detection in Open-Domain Dialogue Systems via Knowledge Distillation [26.4] CensorChatは、NSFW対話検出を目的とした対話監視データセットである。
このデータセットは、NSFWコンテンツ検出器を構築するための費用効率の良い手段を提供する。
提案手法は,NSFWコンテンツ検出の進歩だけでなく,AI駆動対話におけるユーザ保護ニーズの進展とも一致している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 01:57:38 GMT)
M$^3$AV: A Multimodal, Multigenre, and Multipurpose Audio-Visual Academic Lecture Dataset [26.3] マルチモーダル・マルチジャンル・多目的音声視覚学術講義データセット(M$3$AV)を提案する。
M$3$AVには、コンピュータ科学、数学、医学、生物学に関する5つの情報源から367時間分のビデオがある。
話し言葉や書き言葉の高品質な人間のアノテーションによって、データセットは複数の音声視覚認識および理解タスクに使用できる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 06:43:59 GMT)
emoDARTS: Joint Optimisation of CNN & Sequential Neural Network Architectures for Superior Speech Emotion Recognition [26.3] 音声感情認識(SER)は、コンピュータが人間のコミュニケーションで伝達される感情を理解するために重要である。
本研究では,DARTSを最適化したCNNとSeqNN(SeqNN: LSTM, RNN)アーキテクチャであるemoDARTSについて述べる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 02:26:30 GMT)
Preventing Catastrophic Forgetting through Memory Networks in Continuous Detection [26.2] メモリベースの検出変換器アーキテクチャを導入し、トレーニング済みのDETR型検出器を新しいタスクに適用する。
本稿では,メモリ単位からの効率的な情報検索のための新しい局所化クエリ関数を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 19:20:29 GMT)
Neural Radiance Fields in Medical Imaging: Challenges and Next Steps [26.2] ニューラル・ラジアンス・フィールド(NeRF)は、投影された2次元画像データから3次元表現を合成することにより、医用画像に革命をもたらす大きな可能性を提供する。
本稿では,医療画像におけるNeRFの応用を包括的に検討し,重要な課題を4つ挙げる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:11:23 GMT)
A Challenge Dataset and Effective Models for Conversational Stance Detection [26.2] マルチターン会話姿勢検出データセット(textbfMT-CSD)を導入する。
本稿では,会話データに固有の長距離および短距離の依存関係に対処するグローバルローカルアテンションネットワーク(textbfGLAN)を提案する。
私たちのデータセットは、ドメイン間スタンス検出の進歩を触媒する貴重なリソースとして役立ちます。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 06:22:56 GMT)
ShaDocFormer: A Shadow-Attentive Threshold Detector With Cascaded Fusion Refiner for Document Shadow Removal [26.2] 本稿では,文書陰影除去の問題に対処するために,従来の手法とディープラーニング技術を統合したTransformerベースのアーキテクチャを提案する。
ShaDocFormerアーキテクチャは、Shadow-attentive Threshold Detector (STD)とCascaded Fusion Refiner (CFR)の2つのコンポーネントで構成されている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:30:54 GMT)
Champ: Controllable and Consistent Human Image Animation with 3D Parametric Guidance [25.9] 本稿では,潜伏拡散フレームワーク内での3次元人間のパラメトリックモデルを活用することで,人間の画像アニメーションの方法論を提案する。
人間の3次元パラメトリックモデルを動作誘導として表現することにより、基準画像と音源映像の動きの間に人体のパラメトリック形状アライメントを行うことができる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:52:58 GMT)
Pluggable Neural Machine Translation Models via Memory-augmented Adapters [25.3] プリトレーニングされたNMTモデルをプラガブルな方法でステアリングするためのメモリ拡張アダプタを提案する。
具体的には,ユーザが提供するテキストサンプルに基づいて,多粒性メモリを構築する。
また,NMTモデルとメモリ間の素早い依存関係を低減するため,メモリドロップアウトを用いたトレーニング戦略を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:46:31 GMT)
Leveraging Thermal Modality to Enhance Reconstruction in Low-Light Conditions [25.1] ニューラル・ラジアンス・フィールド(NeRF)は、多視点画像からシーンの暗黙的な表現を学習することにより、写真リアリスティックなノベルビュー合成を実現する。
既存のアプローチは、生画像から低照度シーンを再構築するが、暗黒領域におけるテクスチャや境界の詳細の回復に苦慮している。
本研究では,熱的・可視的な原像を入力とし,同時に可視的・熱的視点合成を実現する熱-NeRFを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 00:35:31 GMT)
Learning-based Multi-continuum Model for Multiscale Flow Problems [24.9] 本稿では,同質化方程式の強化と,マルチスケール問題に対する単一モデルの精度向上を目的とした学習型マルチコンチニュウムモデルを提案する。
提案する学習型マルチコンチニュウムモデルでは,各粗いグリッドブロック内の複数の相互作用媒質を解決し,その間の物質移動を記述できる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 02:30:56 GMT)
FIT-RAG: Black-Box RAG with Factual Information and Token Reduction [24.6] 本稿では,検索における事実情報を利用した新しいブラックボックスRAGフレームワークを提案する。
FIT-RAGは、TriviaQAで14.3%、NQで19.9%、PopQAで27.5%の回答精度を向上させることができる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:05:18 GMT)
VURF: A General-purpose Reasoning and Self-refinement Framework for Video Understanding [24.5] 本稿では,Large Language Models (LLM) の推論能力に基づくビデオ理解・推論フレームワーク (VURF) を提案する。
ビデオタスクの文脈でLLMの実用性を拡張するための新しいアプローチである。
我々は,その文脈学習能力を利用して,映像理解のための実行可能な視覚プログラムを生成する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:00:00 GMT)
Deep Classifier Mimicry without Data Access [24.4] 本稿では,モデルに依存しない知識蒸留法であるContrastive Abductive Knowledge extract (CAKE)を提案する。
CAKEは、ノイズの多い合成サンプルのペアを生成し、モデルを決定境界に向けて対照的に拡散させる。
我々は、いくつかのベンチマークデータセットとさまざまなアーキテクチャ選択を使用して、CAKEの有効性を実証的に裏付ける。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:58:15 GMT)
Reinforcement Learning from Reflective Feedback (RLRF): Aligning and Improving LLMs via Fine-Grained Self-Reflection [24.4] 反射フィードバックによる強化学習(RLRF)という新しい枠組みを提案する。
RLRFは自己回帰機構を用いて、LLM応答を体系的に探索し、洗練し、RLアルゴリズムを介してモデルを微調整し、有望な応答を与える。
ジャスト・エバル, ファクタリティ, 数学的推論による実験は, RLRFの有効性と変換ポテンシャルを実証した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:57:27 GMT)
Unveiling Typographic Deceptions: Insights of the Typographic Vulnerability in Large Vision-Language Model [23.8] タイポグラフィー攻撃はLVLMのセキュリティ上の脅威になると予想されている。
現在よく知られた商用およびオープンソースのLVLMに対するタイポグラフィー攻撃を検証する。
この脆弱性をよりよく評価するために,これまでで最も包括的で大規模なTypographicデータセットを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:26:47 GMT)
Dodging DeepFake Detection via Implicit Spatial-Domain Notch Filtering [23.6] 画像の品質を損なうことなく、偽画像のアーティファクトパターンを低減するための、シンプルながら強力なパイプラインを提案する。
まず、周波数領域のノッチフィルタは、ノッチフィルタに必要な手動設計のため、手作業では不可能であることを示す。
次に、ノッチフィルタリング効果を再現するための学習に基づくアプローチを、空間領域にのみ適用する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:24:05 GMT)
Multi-Player Zero-Sum Markov Games with Networked Separable Interactions [23.3] 我々は,emphNetworked separable interaction (zero-sum NMGs)を用いた新しいマルコフゲーム,emph(multi-player) 0-sum Markov Gamesの研究を行った。
無限水平割引ゼロサムNMGにおける近似マルコフ非定常CCEの発見は、基礎となるネットワークが星のトポロジーを持っていなければ、textttPPAD-hardであることを示す。」
論文参考訳(メタデータ) (Thu, 21 Mar 2024 19:12:08 GMT)
Alleviating Exposure Bias in Diffusion Models through Sampling with Shifted Time Steps [23.1] 拡散確率モデル (DPM) は高品質な画像の合成において顕著な有効性を示した。
これまでの研究は、トレーニング中に入力を摂動することでこの問題を緩和しようと試みてきた。
モデルを再学習することなく,提案する新しいサンプリング手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:16:39 GMT)
Sequence-to-Sequence Spanish Pre-trained Language Models [23.1] 本稿では,スペイン語コーパスにのみ事前学習した有名なエンコーダデコーダアーキテクチャの実装と評価を紹介する。
本稿では,BART,T5,BERT2BERTスタイルのスペイン語版について述べる。
BARTとT5ベースのモデルは、あらゆるタスクでトップパフォーマーとして登場しています。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:41:35 GMT)
Harmonizing Visual and Textual Embeddings for Zero-Shot Text-to-Image Customization [23.0] テキスト・ツー・イメージ(T2I)モデルの急増とそのカスタマイズ手法は、ユーザが提供する対象の新たなイメージを生成する。
これらのゼロショットカスタマイズ方法は、特定の対象の画像を視覚埋め込みにエンコードし、テキスト埋め込みと共に拡散誘導に利用する。
与えられたテキスト埋め込みと効果的に調和する視覚埋め込みを提案する。
また、視覚のみの埋め込みを採用し、自己注意スワップを用いて被験者の明確な特徴を注入する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 06:03:51 GMT)
FlowerFormer: Empowering Neural Architecture Encoding using a Flow-aware Graph Transformer [23.0] 本稿では,ニューラルネットワーク内に情報フローを組み込んだ強力なグラフトランスフォーマーであるFlowerFormerを紹介する。
本研究では,既存のニューラルエンコーディング法よりもFlowerFormerの方が優れていることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:02:39 GMT)
DesignEdit: Multi-Layered Latent Decomposition and Fusion for Unified & Accurate Image Editing [22.9] 本研究では,空間認識画像編集タスクを2つのサブタスク,多層ラテント分解と多層ラテント融合の組合せに変換する。
提案手法は,自己ガイドやDiffEditorなど,最新の空間編集手法を一貫して上回っていることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:35:42 GMT)
Object-Centric Domain Randomization for 3D Shape Reconstruction in the Wild [22.8] ワンビュー3次元形状復元における最大の課題の1つは、現実世界の環境から得られる3次元形状2次元画像データの不足である。
ドメインランダム化による顕著な成果にインスパイアされたObjectDRは、オブジェクトの外観や背景の視覚的変化をランダムにシミュレーションすることで、そのようなペア化されたデータを合成する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:40:10 GMT)
SpikingResformer: Bridging ResNet and Vision Transformer in Spiking Neural Networks [22.7] そこで本研究では,DSSA(Dual Spike Self-Attention)という新たな自己注意機構を提案する。
本稿では,DSSAに基づく新しいスパイキングビジョントランスフォーマーアーキテクチャであるSpikeResformerを提案する。
SpikingResformerは、他のスパイキングビジョン変換器よりも少ないパラメータと少ないエネルギー消費で高い精度を達成できることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:16:42 GMT)
TableLlama: Towards Open Large Generalist Models for Tables [22.6] 本稿では,多種多様なテーブルベースタスクのジェネラリストとして,オープンソースの大規模言語モデル(LLM)の開発に向けた第一歩を示す。
本研究では,様々な現実的なテーブルやタスクを備えた新しいデータセットであるTableInstructを構築し,LLMのチューニングと評価を行う。
さらに,LongLoRAを用いてLlama 2 (7B) を微調整することで,テーブル用の最初のオープンソースジェネラリストモデルであるTableLlamaを開発した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:56:37 GMT)
LlamaFactory: Unified Efficient Fine-Tuning of 100+ Language Models [22.1] LlamaFactoryは、最先端の効率的なトレーニング方法を統合した統合フレームワークである。
これによってユーザは、内蔵のWeb UI LlamaBoardをコーディングすることなく、100以上のLLMの微調整を柔軟にカスタマイズできる。
言語モデリングとテキスト生成タスクにおけるフレームワークの有効性と有効性を実証的に検証する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:36:39 GMT)
Weak Supervision with Arbitrary Single Frame for Micro- and Macro-expression Spotting [22.0] 本稿では,各表現を1つのランダムフレーム(すなわち1点)でアノテートする必要がある点レベルの弱教師付き表現スポッティングフレームワークを提案する。
我々は,MPLGがクラス固有の確率,注意スコア,融合特徴,点レベルのラベルを融合することにより,より信頼性の高い擬似ラベルを生成することを示す。
CAS(ME)2、CAS(ME)3、SAMM-LVデータセットの実験は、PWESが最近の完全教師付き手法に匹敵する有望な性能を達成することを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:01:21 GMT)
T-MAE: Temporal Masked Autoencoders for Point Cloud Representation Learning [22.0] 本稿では,T-MAE (Temporal Masked Auto-Encoders) という,時間的隣接フレームを入力とし,時間的依存を学習する効果的な事前学習戦略を提案する。
2フレーム入力には、シームズエンコーダとウィンドウ付きクロスアテンション(WCA)モジュールを含むSiamWCAバックボーンが設定されている。
我々のT-MAE事前学習戦略は、アノテーション付きデータに対する需要を軽減する。総合的な実験は、T-MAEが両方のデータセット上で最高のパフォーマンスを達成することを実証する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:06:17 GMT)
CPSDBench: A Large Language Model Evaluation Benchmark and Baseline for Chinese Public Security Domain [21.8] 本研究は,中国の公安ドメインであるCPSDbenchに合わせた,特別な評価ベンチマークを構築することを目的とする。
CPSDbenchは、現実世界のシナリオから収集されたパブリックセキュリティに関連するデータセットを統合する。
本研究では,公共の安全に関わるタスクの実行において,LLMの有効性をより正確に定量化するための,革新的な評価指標を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:39:09 GMT)
Learning Decomposable and Debiased Representations via Attribute-Centric Information Bottlenecks [21.8] データセット内のターゲットラベルと突発的に相関するバイアス属性は、分類の不適切なショートカットを学習するニューラルネットワークに問題を引き起こす可能性がある。
本稿では,属性の合成表現を学習するための注目に基づく情報ボトルネックを導入し,新たなデバイアス化フレームワークであるデバイアスンググローバルワークスペースを提案する。
偏りのあるデータセットに対する包括的評価と定量的および定性的な分析を行い、アプローチの有効性を実証する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:33:49 GMT)
The Role of Transparency in Repeated First-Price Auctions with Unknown Valuations [21.5] 本研究では, 単価オークションにおける落札者に対する後悔の問題について検討する。
我々の主な貢献は、競売の並行性の観点からのミニマックス後悔の対数的要因の完全な特徴である。
これらのミニマックスレートは、透明性と環境の性質の間の相互作用が、ファーストプライスのオークションで最適な入札を学べる速度にどのように影響するかを明らかにしている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:28:38 GMT)
Less but Better: Enabling Generalized Zero-shot Learning Towards Unseen Domains by Intrinsic Learning from Redundant LLM Semantics [21.3] 汎用ゼロショット学習(GZSL)は、ドメインシフト問題(DSP)に対する見知らぬクラスと見えないクラスを認識することに焦点を当てている。
我々は、GZSLに対処するクロスドメインGZSLのパイオニアである。
大規模言語モデル(LLM)を付加した冗長クラスセマンティクスによる情報非対称性問題を考えると,メタドメインアライメント・セマンティック・リファインメント(MDASR)を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:45:01 GMT)
Active Prompt Learning in Vision Language Models [21.3] 我々は,PCBと表記される事前学習型視覚言語モデルのための新しいアクティブラーニングフレームワークを考案した。
そこで本研究では,7つの実世界のデータセットを用いて実験を行い,PCBが従来の能動的学習法やランダムサンプリング法を超えることを示した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:52:03 GMT)
Exploring Green AI for Audio Deepfake Detection [21.2] ディープニューラルネットワークを利用した最先端のオーディオディープフェイク検出器は、印象的な認識性能を示している。
ディープNLPモデルはCOtextsubscript2の約626klbのCOtextsubscript2を生成する。
そこで本研究では,標準CPUリソースを用いてシームレスにトレーニング可能な,オーディオディープフェイク検出のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:54:21 GMT)
A Bag of Tricks for Few-Shot Class-Incremental Learning [21.0] 数ショットのクラス増分学習(FSCIL)のためのトリックの袋を提示する。
FSCILは安定性と適応性の両方を必要とし、新しいタスクを学習しながら、以前に学習したタスクの習熟性を維持する。
これらのトリックを,安定性トリック,適応性トリック,トレーニングトリックという3つのカテゴリに分類する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:33:00 GMT)
AI-KD: Adversarial learning and Implicit regularization for self-Knowledge Distillation [20.8] 本稿では, 自己知識蒸留(AI-KD)における対向学習と暗黙の正則化という, 対向的ペナル化自己知識蒸留法を提案する。
我々のモデルは,事前学習と過去の予測確率から得られた決定論的および進歩的知識を蒸留するだけでなく,逆学習を用いて決定論的予測分布の知識を伝達する。
提案手法の有効性を実証し,提案手法が最先端手法よりも優れた性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:51:10 GMT)
Semantically Aligned Question and Code Generation for Automated Insight Generation [20.8] 我々は、大規模言語モデルのセマンティック知識を活用して、データに対するターゲット的で洞察に富んだ質問を生成する。
埋め込みは意味的に不整合な質問とコードのペアをフィルタリングするのに有効であることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:01:05 GMT)
From Handcrafted Features to LLMs: A Brief Survey for Machine Translation Quality Estimation [20.6] 機械翻訳品質推定(MTQE)は、機械翻訳テキストの品質を基準翻訳を必要とせずにリアルタイムで推定するタスクである。
本稿では、QEデータセット、アノテーションメソッド、共有タスク、方法論、課題、今後の研究方向性について概観する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:07:40 GMT)
Weighted Ensemble Models Are Strong Continual Learners [20.6] 本研究では,タスク列のモデル学習を目標とする連続学習(CL)の問題について検討する。
CLは基本的に、新しいタスクで学べることと、以前に学んだ概念でのパフォーマンスを維持することのバランスをとる行為である。
安定性と塑性のトレードオフに対処するため,従来の課題と現在の課題のモデルパラメータを重み付けする手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:04:25 GMT)
ColonNeRF: High-Fidelity Neural Reconstruction of Long Colonoscopy [20.6] ColonNeRFは、長期的大腸内視鏡の新しいビュー合成のためのニューラルレンダリングに基づく新しい再構成フレームワークである。
ColonNeRFは形状の相違を低減し、各セグメントにおける幾何的整合性を保証する。
再現の可視化では、より明瞭なテクスチャとより正確な幾何学的詳細が示されています。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:32:35 GMT)
Community Driven Approaches to Research in Technology & Society CCC Workshop Report [20.5] 研究は、プレイヤーとエコシステムの両方のエコシステムをマッピングし、景観を傷つけることで、コミュニティのニーズをサポートすることができる。
カウンター・プログラミングは、コミュニティが監視を行う組織を監視するのと同じ監視ツールを使用する。
上記の方向を効果的に協調するために,効果的なコラボレーションのための7つの重要なメカニズムを概説した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:04:25 GMT)
Towards Flexible, Scalable, and Adaptive Multi-Modal Conditioned Face Synthesis [20.5] 本稿では,一様サロゲートを用いた新しい一様トレーニング手法と,エントロピーを意識したモーダル適応変調を導入する。
本フレームワークは,様々な条件下でのマルチモーダル顔合成を改良し,画像品質と忠実度における現在の手法を超越した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:58:06 GMT)
Class-Prototype Conditional Diffusion Model with Gradient Projection for Continual Learning [20.2] 破滅的な忘れ方を減らすことは、継続的な学習における重要なハードルである。
大きな問題は、生成したデータの品質がオリジナルのものと比べて低下することである。
本稿では,ジェネレータにおける画像品質を向上させる連続学習のためのGRに基づくアプローチを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 23:57:13 GMT)
DINO-Tracker: Taming DINO for Self-Supervised Point Tracking in a Single Video [20.1] DINO-Trackerは、ビデオの長時間の密集追跡のための新しいフレームワークだ。
単一のビデオ上でのテスト時間トレーニングと、事前トレーニングされたDINO-ViTモデルによって学習された強力なローカライズされたセマンティック機能を組み合わせる。
DINOトラッカーは自己管理手法よりも優れ、最先端のトラッカーと競合する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:49:20 GMT)
Videoshop: Localized Semantic Video Editing with Noise-Extrapolated Diffusion Inversion [20.0] Videoshopは、ローカライズされたセマンティック編集のためのトレーニング不要のビデオ編集アルゴリズムである。
ユーザーはオブジェクトの追加や削除、セマンティックな変更、ストック写真をビデオに挿入したり、場所や外観を細かくコントロールできる。
Videoshopは、評価基準10を用いて、2つの編集ベンチマークで6つのベースラインに対して高い品質の編集を行う。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:59:03 GMT)
T-Rex2: Towards Generic Object Detection via Text-Visual Prompt Synergy [19.8] T-Rex2は、オープンセットオブジェクト検出のための非常に実用的なモデルである。
対照的な学習を通じて、単一のモデル内でテキストと視覚的なプロンプトを相乗化します。
幅広いシナリオにまたがって、目覚ましいゼロショットオブジェクト検出機能を備えている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:57:03 GMT)
Spatio-Temporal Proximity-Aware Dual-Path Model for Panoramic Activity Recognition [19.8] パノラマ活動認識(PAR)は、異なるスケールにわたる人間の活動を特定する。
SPDP-Net(Social Proximity-aware Dual-Path Network)は、2つの主要な設計原則に基づくネットワークである。
S PDP-Netは、JRDB-PARデータセットのF1スコア全体の46.5%を達成している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 03:56:24 GMT)
Empowering Segmentation Ability to Multi-modal Large Language Models [19.7] マルチモーダルな大言語モデル(MLLM)をセグメンテーション能力で拡張する。
拡張MLLMは、画像言語プロンプトに対する言語応答を出力し、言語プロンプト内の複雑な質問やクエリがフォーカスする領域をセグメント化することができる。
LLaVASegと呼ばれる新しいMLLMフレームワークを提案する。このフレームワークは,MLLMにユーザによってクエリされたターゲット領域を分割するように指示するチェーン・オブ・シークレット・プロンプト戦略を利用する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:36:25 GMT)
Beyond Surface Similarity: Detecting Subtle Semantic Shifts in Financial Narratives [19.6] 本研究では,金融ドメイン固有のNLPタスクであるFinancial-STSタスクを紹介する。
これら2つの物語の微妙なセマンティックな違いを測定することで、市場のステークホルダーは、会社の財務状況や運用状況の変化を経時的に測定することができます。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:17:59 GMT)
ComCLIP: Training-Free Compositional Image and Text Matching [19.4] コントラスト言語-画像事前訓練は画像とテキストのマッチングに優れたゼロショット性能を示した。
我々は新しいtextbftextittraining-free compositional CLIP model (ComCLIP) を提案する。
ComCLIPは、入力された画像を被写体、オブジェクト、アクションのサブイメージに切り離し、CLIPのビジョンエンコーダとテキストエンコーダを構成して、合成テキスト埋め込みとサブイメージ埋め込みに対する進化的なマッチングを実行する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 00:53:19 GMT)
FFT-based Selection and Optimization of Statistics for Robust Recognition of Severely Corrupted Images [19.1] 本稿では, 分類モデルのロバスト性向上のための新しい手法を提案する。
提案手法は,入力画像の劣化型を検出するために高周波特徴を用いて,層単位での特徴正規化統計を抽出する。
FROSTは、異なるモデルやデータセットに対する最先端の結果を提供し、ImageNet-Cの競合製品よりも37.1%も向上している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:01:54 GMT)
RTFS-Net: Recurrent Time-Frequency Modelling for Efficient Audio-Visual Speech Separation [18.9] 本稿では,時間周波数領域の音声-視覚音声分離手法を提案する。
RTFS-Netはそのアルゴリズムをショートタイムフーリエ変換によって得られる複雑な時間周波数ビンに適用する。
これは、時間周波数領域の音声・視覚的音声分離法として初めて、現代の時間領域の全てを上回ります。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:19:18 GMT)
Non-Convex Robust Hypothesis Testing using Sinkhorn Uncertainty Sets [18.5] 非破壊仮説テスト問題に対処する新しい枠組みを提案する。
目標は、最大数値リスクを最小限に抑える最適な検出器を探すことである。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 20:29:43 GMT)
MaskSAM: Towards Auto-prompt SAM with Mask Classification for Medical Image Segmentation [18.1] MaskSAMは、医療画像セグメンテーションのためのマスク分類プロンプトフリー適応フレームワークである。
本手法は,AMOS2022,90.52%のDice上での最先端性能を実現し,nnUNetに比べて2.7%向上した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 03:28:24 GMT)
SurroundSDF: Implicit 3D Scene Understanding Based on Signed Distance Field [18.1] そこで我々は,SurroundSDFを提案し,署名された距離場(SDF)と周辺画像からの連続知覚のための意味場を暗黙的に予測する。
具体的には、クエリベースのアプローチを導入し、Eikonalの定式化に制約されたSDFを用いて障害物の表面を正確に記述する。
正確なSDF基底事実が存在しないことを考慮し,サンドウィッチ・アイコン公式(Sandwich Eikonal formulation)と呼ばれる,SDFの弱教師付きパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:49:32 GMT)
Open Knowledge Base Canonicalization with Multi-task Learning [18.1] 大規模なオープン知識ベース(OKB)は、Web検索のような世界規模のWeb上の多くの知識駆動アプリケーションに不可欠なものである。
OKBの名詞句と関係句は、しばしば冗長性と曖昧さに悩まされ、OKBの正準化の調査を要求する。
現在のソリューションは、高度なクラスタリングアルゴリズムを考案し、知識グラフ埋め込み(KGE)を使用して、標準化プロセスをさらに促進することでOKB標準化に対処している。
我々は、OKB標準化に取り組むためにマルチタスク学習フレームワーク、MulCanonを提案しました。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:03:46 GMT)
Learning a Depth Covariance Function [17.7] 入力としてRGB画像が与えられると、共分散関数は深度関数の事前を定義するために柔軟に使用できる。
我々は,これらの手法を,深度補正,バンドル調整,モノクローナル高密度視覚計測といった下流タスクの選択に活用する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:09:57 GMT)
Powerful Lossy Compression for Noisy Images [17.6] 提案した信号対雑音比(SNR)対応ジョイントソリューションは、局所的および非局所的特徴を利用して画像圧縮と復調を同時に行う。
我々は,主エンコーダ分岐,誘導分岐,信号-雑音比(SNR)認識分岐を含むエンドツーエンドのトレーニング可能なネットワークを設計する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:10:26 GMT)
Local Causal Discovery with Linear non-Gaussian Cyclic Models [17.6] 線形非ガウスモデルを用いた一般化された局所因果探索法を提案する。
我々の識別可能性は、人工と実世界の両方のデータセットを用いて実証的に検証される。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 21:27:39 GMT)
PrPSeg: Universal Proposition Learning for Panoramic Renal Pathology Segmentation [17.3] パノラマ性腎疾患セグメンテーション(PrPSeg)と呼ばれる新しい普遍命題学習手法を導入する。
PrPSegは、腎臓解剖学の広範な知識を統合することにより、腎臓内の包括的パノラマ構造をセグメント化するように設計されている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 03:14:59 GMT)
InfNeRF: Towards Infinite Scale NeRF Rendering with O(log n) Space Complexity [17.0] 我々は,オクツリー構造を導入し,各シーンを異なるスケールで表現することで,レベル・オブ・ディーテール(LoD)テクニックをニューラル・ラジアンス・フィールド(NeRF)に拡張する。
また、O(log n)の複雑さを維持する新しいトレーニング戦略も提示する。
我々の貢献は、既存の技術の能力を拡張するだけでなく、スケーラブルで効率的な大規模シーン表現の基盤を確立することである。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:06:57 GMT)
Token Transformation Matters: Towards Faithful Post-hoc Explanation for Vision Transformer [17.0] 視覚変換器は、領域を変換トークンとして表現し、注意重みを通してそれらを統合することによって視覚情報を抽出する。
既存のポストホックな説明法は単にこれらの注意重みを考慮し、変換されたトークンから重要な情報を無視するだけである。
本稿では,トークン変換効果の測定を利用したポストホックな説明手法であるTokenTMを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:52:27 GMT)
RGNet: A Unified Clip Retrieval and Grounding Network for Long Videos [16.9] 既存の手法は通常、クリップ検索と接地という2つの段階で動作する。
本稿では,長い動画を複数の粒度に処理できる1つのネットワークに,クリップ検索とグラウンドを深く統合したRGNetを提案する。
RGNetは従来の手法を超越し、ロングビデオ時間グラウンド(LVTG)データセットMADとEgo4Dの最先端性能を示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 22:11:31 GMT)
Unsupervised Intrinsic Image Decomposition with LiDAR Intensity Enhanced Training [16.8] 内在的画像分解(IID)は、自然像をこれらの基礎的な真実なしにアルベドと日陰に分離する過程である。
本稿では,画像とLiDAR強度をトレーニング中に利用しながら,推論時にのみ画像を利用する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 02:45:16 GMT)
Generalized Spin Helix States as Quantum Many-Body Scars in Partially Integrable Models [16.4] 量子多体傷は非可積分ハミルトニアンの励起固有状態である。
任意に大きい局所ヒルベルト空間次元を持つ部分可積分モデルを構築するメカニズムを提供する。
私たちの構造は、積分可能性と量子多体傷の間の興味深い関係を確立します。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:00:08 GMT)
Loop Improvement: An Efficient Approach for Extracting Shared Features from Heterogeneous Data without Central Server [16.2] LI(Loop Improvement)は、この分離と特徴抽出を、参加者間の中央サーバやデータ交換を必要とせずに強化する新しい手法である。
パーソナライズされたフェデレーション学習環境では、LIは様々なシナリオで高度なFedALAアルゴリズムよりも精度が高い。
LIの適応性はマルチタスク学習にまで拡張され、タスク間で共通の機能の抽出が合理化され、同時にトレーニングする必要がなくなる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:59:24 GMT)
Self-Improving for Zero-Shot Named Entity Recognition with Large Language Models [16.2] この研究は、強力な大言語モデル(LLM)によるゼロショットNERのパフォーマンス境界を押し上げる。
LLMの自己学習能力を刺激するためにラベルのないコーパスを利用する、トレーニング不要な自己改善フレームワークを提案する。
4つのベンチマークの実験は、我々のフレームワークによって達成された大幅なパフォーマンス改善を示している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 00:27:37 GMT)
Consistency Enhancement-Based Deep Multiview Clustering via Contrastive Learning [16.1] コントラスト学習(CCEC)による一貫した拡張型ディープMVC法を提案する。
具体的には、複数のビュー間の一貫性のある情報を保持するために、セマンティック接続ブロックを特徴表現に組み込む。
5つのデータセットで行った実験は、最先端(SOTA)手法と比較して、本手法の有効性と優位性を示した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:23:44 GMT)
MMIDR: Teaching Large Language Model to Interpret Multimodal Misinformation via Knowledge Distillation [15.9] MMIDRは,マルチモーダル誤報の意思決定プロセスにおいて,文章の質や質の良質な説明を提供するためのフレームワークである。
マルチモーダルな誤情報を適切な命令追従形式に変換するために,データ拡張の視点とパイプラインを示す。
さらに, オープンソースのLLMに多モード誤情報を説明するために, プロプライエタリなLLMを蒸留する効率的な知識蒸留手法を設計する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 06:47:28 GMT)
Planning and Acting While the Clock Ticks [15.8] 時間的プレッシャーのある問題では、最初のアクションを実行する前に、タイミングが厳しすぎて計画が完了できない。
計画終了前にアクションを発行(実行)できる並列計画と実行という,新たな問題設定を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 19:18:47 GMT)
MULDE: Multiscale Log-Density Estimation via Denoising Score Matching for Video Anomaly Detection [15.7] 本研究では,ビデオから抽出した特徴ベクトルを,固定分布を持つランダム変数の実現として扱う。
我々は、デノナイジングスコアマッチングの修正を用いて、ビデオ異常検出装置を訓練する。
5つの人気ビデオ異常検出ベンチマーク実験により,最先端の性能が示された。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:46:19 GMT)
Miscibility-Immiscibility transition of strongly interacting bosonic mixtures in optical lattices [15.7] ボースガスの弱い相互作用混合物中の不和合性-不和合性遷移(MIT)は、内部および界面の2体接触相互作用の強さによって決定される。
等質な2次元正方格子に閉じ込められた2成分ボゾン混合系の強相互作用相におけるMITについて検討した。
本研究は, 強相互作用状態における多成分系の不整合特性の理解の向上に寄与する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:51:45 GMT)
On the consistency of supervised learning with missing values [15.7] 多くのアプリケーション設定において、データは分析を難しくするエントリを欠いている。
ここでは、教師あり学習の設定について考察する。トレーニングデータとテストデータの両方に、欠落した値が現れるときにターゲットを予測する。
本研究では,学習前の平均値など,一定値が得られない場合に一定であることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:01:19 GMT)
KeyPoint Relative Position Encoding for Face Recognition [15.7] Keypoint RPE (KP-RPE) は、画素の重要度が近接によってのみ規定されない原理の拡張である。
コードと事前訓練されたモデルが利用可能である。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 21:56:09 GMT)
Learning to Project for Cross-Task Knowledge Distillation [15.6] クロスタスク蒸留は使用でき、異なるタスクで訓練された教師モデルを使用することができる。
多くのKD法は、このクロスタスク設定に適用しても効果がないことを証明している。
この標準プロジェクタのドロップイン置換は,タスク固有の機能を無視して学習することで有効であることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:42:17 GMT)
Gene Regulatory Network Inference in the Presence of Dropouts: a Causal View [15.6] 遺伝子制御ネットワーク推論(GRNI)は、単一細胞RNAシークエンシングデータにゼロが存在するため、難しい問題である。
本稿では,ドロップアウト機構,すなわちカスルドロップアウトモデルを特徴付ける因果図形モデルを提案する。
データから因果的なドロップアウトモデルを検証することができ、また、ドロップアウトを扱う既存の統計モデルの多くは、特定のパラメトリック・インスタンスとして我々のモデルに適合することを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 21:27:43 GMT)
Generating Explanations to Understand and Repair Embedding-based Entity Alignment [15.6] 埋め込み型EA結果の理解と修復のための説明を生成できる最初のフレームワークを提案する。
埋め込みモデルによって生成されたEAペアを前提として、まず近隣のエンティティと関係を比較し、局所的な説明として一致する部分グラフを構築する。
次に、抽象的な視点からペアを理解するためにアライメント依存グラフを構築します。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:22:54 GMT)
Isotropic Gaussian Splatting for Real-Time Radiance Field Rendering [15.5] 提案手法は, 3次元再構成, ビュー合成, 動的オブジェクトモデリングなど, 広範囲の応用に適用できる。
提案手法は, 幾何表現精度を損なうことなく, 約bf100倍高速であることを確認した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:02:31 GMT)
Formation of ultracold deeply-bound molecules via multi-state chainwise coincident pulses technique [15.1] 本手法は,3状態一致パルス法と一般化5状態一致パルス法に基づく。
3状態系では、この技術は、共鳴と共振ポンプとストークスパルスの2組の列車を介して、フェシュバッハ状態から深い境界状態へ効率的に人口を移動させることができる。
5状態系では、このM型システムは最も単純な共振結合を持つ$Lambda$-type構造に一般化できる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:52:07 GMT)
A reinforcement learning guided hybrid evolutionary algorithm for the latency location routing problem [15.0] 遅延位置ルーティング問題は、施設位置問題と累積容量化車両経路問題を統合する。
この問題は、顧客に提供するデポの場所と車両ルートについて、同時に決定することである。
本稿では,メメティックアルゴリズムの枠組みに従って,強化学習誘導ハイブリッド進化アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:54:03 GMT)
Optimal Second-Order Rates for Quantum Information Decoupling [14.9] 我々は、Alice氏がローカル操作によって環境から切り離し、システムの一部を破棄することを目的とした、標準的な量子情報分離について考察する。
エンタングルメント蒸留プロトコルに束縛された達成可能性を見出すと、アリスとボブはその量子状態が最大エンタングルド状態に最大次元で変換されることが目的である。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:06:30 GMT)
Sequential Decision-Making for Inline Text Autocomplete [14.8] テキスト入力システムにおけるインラインオートコンプリート提案の改善問題について検討する。
我々は、強化学習を用いて、ターゲットユーザとの繰り返しインタラクションを通じて提案ポリシーを学習する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 22:33:16 GMT)
Advancing IIoT with Over-the-Air Federated Learning: The Role of Iterative Magnitude Pruning [14.8] 産業用IoT(Industrial Internet of Things, IIoT)は、産業用4.0で、相互接続型スマートデバイスの時代を象徴している。
FL(Federated Learning)は、デバイス間のデータプライバシとセキュリティに対処する。
FLは、機密データを明示的に共有することなく、エッジセンサーがデータをローカルで学習し、適応することを可能にする。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:15:56 GMT)
ERD: A Framework for Improving LLM Reasoning for Cognitive Distortion Classification [14.6] 本稿では,追加モジュールの助けを借りて認知歪み分類性能を向上させるERDを提案する。
公開データセットを用いた実験結果から,ERDは多クラスF1スコアとバイナリ特異性スコアを改善した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:28:38 GMT)
Co-Optimization of Environment and Policies for Decentralized Multi-Agent Navigation [14.5] 本研究は,マルチエージェントシステムとその周辺環境を,一方の行動が他方に影響を与える共進化システムとみなす。
本研究では,環境中におけるエージェント動作と障害物構成の最適解を求めるために,サブオブジェクト間を置換するアルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:37:43 GMT)
Efficient Approximation of Quantum Channel Fidelity Exploiting Symmetry [14.5] 量子チャネルの固定出力次元に対して、階層と入力次元のレベルに関して、時間でSDPを計算することができることを示す。
その結果,最適忠実度を$epsilon$ in $mathrmpoly (1/epsilon, textinput dimension)$ timeで近似できることがわかった。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:01:35 GMT)
Separate and Conquer: Decoupling Co-occurrence via Decomposition and Representation for Weakly Supervised Semantic Segmentation [14.4] 画像レベルのラベルを持つ弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)は、高密度アノテーションなしでセマンティクスタスクを実現することを目的としている。
共起問題は広く存在し、WSSSにおけるオブジェクトの誤活性化につながる。
画像空間と特徴空間の次元からこの問題に対処する'分離・コンカ'スキームSeCoを考案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:33:33 GMT)
The Elements of Differentiable Programming [14.2] 微分可能プログラミングは複雑なコンピュータプログラムのエンドツーエンドの微分を可能にする。
微分プログラミングは、コンピュータ科学と応用数学のいくつかの領域の上に構築されている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:55:16 GMT)
Quantum Channel Simulation under Purified Distance is no more difficult than State Splitting [13.7] 量子チャネルシミュレーションは、デ・フィネッティ還元(de Finetti reduction)と呼ばれる手法を用いることなく、量子状態分割によって直接実現できることを示す。
また、量子逆シャノン定理をはるかに単純な方法で復元する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:05:32 GMT)
CBNet: A Plug-and-Play Network for Segmentation-Based Scene Text Detection [13.7] 本稿では,これらの問題に対処するためのコンテキスト認識および境界誘導ネットワーク(CBN)を提案する。
CBNでは、最初のセグメンテーション結果を予測するために、まず基本的なテキスト検出器が使用される。
最後に,輪郭上の画素のみに適応的に拡張されたテキストカーネルを拡張するための境界誘導モジュールを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:50:54 GMT)
RakutenAI-7B: Extending Large Language Models for Japanese [13.5] オープン 7B モデルのうち,日本語 LM Harness ベンチマークで最高の性能を発揮する,日本語指向の大規模言語モデルのスイートである RakutenAI-7B を紹介する。
我々はApache 2.0ライセンスの下で,RakutenAI-7B-instructとRakutenAI-7B-chatの命令付きモデルとチャット型モデルをリリースする。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 06:56:07 GMT)
DSGG: Dense Relation Transformer for an End-to-end Scene Graph Generation [13.1] シーングラフ生成は、画像内のオブジェクト間の詳細な空間的および意味的な関係をキャプチャすることを目的としている。
既存のTransformerベースのメソッドは、オブジェクトに対して異なるクエリを使用し、述語するか、関係トリプレットに対して全体的クエリを利用する。
本稿では,シーングラフ検出を直接グラフ予測問題とみなす,DSGGと呼ばれるトランスフォーマーベースの新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 23:43:30 GMT)
Exploring Task Unification in Graph Representation Learning via Generative Approach [13.0] グラフは現実世界のシナリオにおいてユビキタスであり、ノードレベル、エッジレベル、グラフレベルのタスクから移行学習まで、さまざまなタスクを含んでいる。
最近の取り組みは、複数のグラフタスクをまたいで一般化できる統一されたフレームワークを設計することを目的としている。
これらのうち、グラフオートエンコーダ(GAE)は、様々なグラフタスクに効果的に対処する可能性を示している。
本稿では,これらの課題にシームレスに対処可能な,対向マスク型オートエンコーダであるGA2Eを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:14:02 GMT)
Federated Learning for Large-Scale Scene Modeling with Neural Radiance Fields [12.9] 我々は,車両やドローンから収集したデータを用いて,地球規模のニューラル放射場(NeRF)に基づく地図を連続的に構築し,維持するシステムを提案する。
NeRFによる既存の大規模モデリングには、地球規模の環境をモデル化する際のスケーラビリティと保守性に問題がある。
我々は、NeRFのフェデレーション学習におけるモデル集約パイプラインを調整し、NeRFの局所的な更新を可能にする。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:32:37 GMT)
SwIPE: Efficient and Robust Medical Image Segmentation with Implicit Patch Embeddings [12.8] 正確な局所境界線とグローバルな形状コヒーレンスを実現するために,SwIPE(Segmentation with Implicit Patch Embeddings)を提案する。
その結果,最近の暗黙的アプローチよりもSwIPEは大幅に改善され,パラメータが10倍以上の最先端の離散手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:59:17 GMT)
QSMDiff: Unsupervised 3D Diffusion Models for Quantitative Susceptibility Mapping [12.6] 定量的感受性マッピング(QSM)はMRI組織相からの磁気感受性分布の逆問題である。
拡散モデルの最近の進歩は、2次元医用画像逆問題の解決の可能性を示している。
我々は3次元画像パッチに基づく拡散モデル、すなわちQSMDiffを開発し、様々なスキャンパラメータにわたって堅牢なQSM再構成を行った。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 01:37:50 GMT)
ODTFormer: Efficient Obstacle Detection and Tracking with Stereo Cameras Based on Transformer [12.6] ODTFormerはTransformerベースのモデルで、障害検出と追跡の両方の問題に対処する。
我々は,最先端の障害物追跡モデルに匹敵する精度を報告し,そのコストはごくわずかである。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:59:55 GMT)
MiKASA: Multi-Key-Anchor & Scene-Aware Transformer for 3D Visual Grounding [12.5] 3Dビジュアルグラウンドティングでは、自然言語記述と対応するオブジェクトを3D空間でマッチングする。
既存の手法は、オブジェクト認識の正確さや複雑な言語クエリの解釈に苦慮している場合が多い。
我々は,自己注意に基づくシーン認識オブジェクトエンコーダと,元来のマルチキーアンカー技術を統合したMiKASA変換器を提案する。
我々のモデルは、Sr3DとNr3Dの両方のデータセットに対するReferit3Dチャレンジにおいて、最も高い総合的精度を達成する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 20:37:54 GMT)
Hyper-parameter Tuning for Fair Classification without Sensitive Attribute Access [12.4] トレーニングデータや検証データの機密属性にアクセスすることなく、公平な分類器を訓練するフレームワークを提案する。
我々は,これらのプロキシラベルが平均精度制約下での公平性を最大化するために利用できることを理論的,実証的に示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:16:58 GMT)
Surface Reconstruction from Point Clouds via Grid-based Intersection Prediction [12.3] 本稿では,点対のサンプル線分と暗黙曲面との交点を直接予測する手法を提案する。
提案手法は,ShapeNet,MGN,ScanNetの3つのデータセット上での最先端性能を示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 02:31:17 GMT)
Raw Instinct: Trust Your Classifiers and Skip the Conversion [12.3] 十分高度な分類器は、RGBと比較してRAW入力に対して等価な結果が得られることを示す。
さらに、RAW画像データからRAW画像の分類結果までの計算時間は、RGBよりも最大8.46倍高速であることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:45:41 GMT)
M3: A Multi-Task Mixed-Objective Learning Framework for Open-Domain Multi-Hop Dense Sentence Retrieval [12.3] M3は,高密度テキスト表現学習のためのマルチタスク混合オブジェクトに基づく,新しいマルチホップ高密度文検索システムである。
提案手法は,大規模オープンドメイン事実検証ベンチマークデータセットであるFEVER上での最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 01:52:07 GMT)
Improving Galileo OSNMA Time To First Authenticated Fix [12.3] 我々は、TTFAF(Time to First Authentication Fix)の2つの主要な最適化を提案する。
実際に記録された3つのシナリオ(オープンスキー、ソフトアーバン、ハードアーバン)でそれらをベンチマークします。
テストベクトルの平均 TTFAF は 60.9 秒, 68.8 秒, オープンスキーシナリオは それぞれ 68.8 秒 である。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:28:35 GMT)
FourCastNeXt: Optimizing FourCastNet Training for Limited Compute [12.2] FourCastNeXtは、グローバル機械学習天気予報モデルであるFourCastNetの最適化である。
オリジナルのFourCastNetの計算要件の約5%を使ってトレーニングすることができる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 00:42:39 GMT)
From Large to Tiny: Distilling and Refining Mathematical Expertise for Math Word Problems with Weakly Supervision [12.0] 本稿では,大規模言語モデルから小型言語モデルへの数学的知識の伝達を徹底的に行う,革新的な2段階のフレームワークを提案する。
提案手法は,探索型'確率方程式'ペアにおける意味理解機能を完全に活用する。
Math23KとWeak12Kデータセットでは、既存の小さなモデルメソッドと比較して大幅にパフォーマンスが向上している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:29:54 GMT)
Neuromorphic Imaging and Classification with Graph Learning [11.9] バイオインスパイアされたニューロモルフィックカメラは、画素輝度変化を非同期に記録し、スパースイベントストリームを生成する。
多次元アドレスイベント構造のため、既存の視覚アルゴリズムは非同期イベントストリームを適切に扱えない。
イベントデータの新しいグラフ表現を提案し,それをグラフ変換器と組み合わせて正確なニューロモルフィック分類を行う。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:17:10 GMT)
Navigating Fairness: Practitioners' Understanding, Challenges, and Strategies in AI/ML Development [11.8] 公正なAI/MLを開発する上で、AI実践者の見解と経験を理解することに焦点を当てた実証的研究の欠如がある。
我々は,「フェアAI/ML」とは何か,という理解を深めるため,22人のAI実践者と半構造化インタビューを行った。
我々は,AI実践者の「フェアAI/ML」理解と,その開発における課題との関係を示す枠組みを開発した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 03:44:59 GMT)
VQPy: An Object-Oriented Approach to Modern Video Analytics [11.8] ビデオ分析は、現代のビデオシステムやサービスで広く使われている。
ビデオ分析のためのオブジェクト指向Pythonアプローチを開発した。
ビデオオブジェクトは従来のオブジェクト指向言語によってモデル化されている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 00:05:23 GMT)
Leveraging Large Language Model-based Room-Object Relationships Knowledge for Enhancing Multimodal-Input Object Goal Navigation [11.5] 大規模言語モデルから抽出したオブジェクト間関係の共通知識を組み込んだデータセットに基づいて,データ駆動型モジュール型アプローチを提案する。
Habitatシミュレーターの結果、我々のフレームワークは平均10.6%の効率でベースラインを上回り、Path Length(SPL)が重み付けした成功(Success)を実証した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 06:32:36 GMT)
Utilizing the LightGBM Algorithm for Operator User Credit Assessment Research [11.3] 本稿では,通信事業者が提供した膨大なデータを用いて,フュージョンLightGBMアルゴリズムに基づくユーザクレジット評価モデルの研究を行う。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:29:24 GMT)
SyncTweedies: A General Generative Framework Based on Synchronized Diffusions [11.3] 正準空間を通した多重拡散過程の同期化のシナリオを網羅的に検討する。
我々は、Tweedieの公式の出力を、複数のインスタンス空間で denoising を行いながら平均化するという、未探索のケースを明らかにした。
上述した映像コンテンツを生成する実験では、SyncTweedies による生成の質が他の同期法と比較して優れていることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:57:30 GMT)
NocPlace: Nocturnal Visual Place Recognition via Generative and Inherited Knowledge Transfer [11.2] NocPlaceは、世界のディスクリプタに照らされた光と極暗に対するレジリエンスを埋め込む。
NocPlaceは、東京24/7ナイトで7.6%、SVOXナイトで16.8%向上している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:29:34 GMT)
MedCycle: Unpaired Medical Report Generation via Cycle-Consistency [11.2] 一貫性のあるラベリングスキーマを必要としない革新的なアプローチを導入する。
このアプローチは、画像埋め込みをレポート埋め込みに変換するサイクル一貫性マッピング関数に基づいている。
胸部X線所見の発生は、最先端の結果よりも優れており、言語と臨床の両方の指標の改善が示されている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:19:25 GMT)
LDTR: Transformer-based Lane Detection with Anchor-chain Representation [11.2] 限定的あるいは非視覚的な車線検出シナリオは、自動走行において依然として困難で不可欠である。
これらの問題に対処するためのトランスモデルであるLDTRを提案する。
実験により、LDTRはよく知られたデータセット上で最先端の性能を達成することが示された。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:29:26 GMT)
DomainLab: A modular Python package for domain generalization in deep learning [11.2] DomainLabは、ユーザが指定したニューラルネットワークを、構成可能な正規化損失項でトレーニングするためのモジュール型のPythonパッケージである。
分離された設計により、ニューラルネットワークを正規化損失構造から分離することができる。
分散データのニューラルネットワークの一般化性能を評価するために、強力なベンチマーク機能を提供する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:35:46 GMT)
Designing Digital Voting Systems for Citizens: Achieving Fairness and Legitimacy in Participatory Budgeting [11.0] PB(Participatory Budgeting)は、都市における資源配分の鍵となる民主的手段へと発展してきた。
本研究は、参加者が架空のPB設定で投票するよう依頼された行動実験の結果を提示する。
認知的負荷を最小限に抑え、デジタルプロセスの公正性と正当性を高めるPB投票の設計アプローチを特定する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:48:26 GMT)
Cost-Sensitive Learning to Defer to Multiple Experts with Workload Constraints [10.9] 遅延の学習は人間とAIのコラボレーションシステムを改善することを目的としている。
L2Dの既存の研究は、実際の導入を妨げる現実世界のシステムの主要な側面を見落としている。
コストとキャパシティ制約の枠組み(DeCCaF)を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:30:16 GMT)
Large Language Models for Blockchain Security: A Systematic Literature Review [10.8] 大規模言語モデル(LLM)は、ブロックチェーンセキュリティ(BS)に関わるさまざまなドメインにおいて、強力なツールとして登場した。
本研究の目的は,既存の研究を包括的に分析し,LLMがブロックチェーンシステムのセキュリティ向上にどのように貢献するかを明らかにすることである。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:39:44 GMT)
On the Conversational Persuasiveness of Large Language Models: A Randomized Controlled Trial [10.8] 制御された無害な環境でAIによる説得の効果を分析する。
その結果、GPT-4を個人情報へのアクセスで議論した参加者は、人間を議論した参加者と比較して、相手との合意が増大する確率が81.7%高かった。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:14:40 GMT)
Common Challenges of Deep Reinforcement Learning Applications Development: An Empirical Study [10.7] Deep Reinforcement Learning (DRL) は、インテリジェントエージェントを生成するために使用される機械学習(ML)のサブドメインである。
近年のDRL技術の発展にもかかわらず、開発者がDRLアプリケーション開発で直面する主な課題はまだ不明である。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:56:09 GMT)
Enhancing Multimodal Cooperation via Fine-grained Modality Valuation [10.7] そこで本研究では,各サンプルに対するモダリティの寄与を評価するために,サンプルレベルのモダリティ評価指標を提案する。
モダリティ評価によって、データセットレベルでのグローバルなコントリビューションの相違を超えて、モダリティの相違が実際にサンプルレベルで異なる可能性があることが分かる。
我々は、この問題をさらに分析し、低属性のモダリティの識別能力を高めることにより、サンプルレベルでのモダリティ間の協調を改善する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 03:21:24 GMT)
Exploring Neuron Interactions and Emergence in LLMs: From the Multifractal Analysis Perspective [10.3] 本研究では,大規模言語モデル(LLM)の出現を,モデルサイズと学習過程の両面から検討する。
自己組織化」と「マルチフラクタル分析」の概念を導入することで、トレーニング中にニューロンの相互作用がどのように動的に進化するかを探求する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:33:23 GMT)
PeerGPT: Probing the Roles of LLM-based Peer Agents as Team Moderators and Participants in Children's Collaborative Learning [10.3] 子どもの協調学習において、効果的な対人会話は子供の相互作用の質を著しく向上させる。
本研究では,Large Language Model (LLM)エージェントをこの設定に統合し,チームモデレーターや参加者としての影響を評価する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:37:15 GMT)
Differentially Private Linear Bandits with Partial Distributed Feedback [10.0] 部分的な分散フィードバックのみを用いて,グローバル報酬の問題について検討する。
我々は、差分的プライベート分散除去と呼ばれる統合学習フレームワークを提案する。
我々は,DP-DPEがサブリニア後悔とサブリニアコミュニケーションの両コストを実現することを証明した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:53:03 GMT)
Universal Feature Selection for Simultaneous Interpretability of Multitask Datasets [9.7] BoUTSはクロスドメインな特徴選択の大きな飛躍であり、様々な科学分野の進歩に繋がる可能性がある。
BoUTSの普遍的な機能は、データセット間のドメイン固有の知識伝達を可能にし、一見異なる化学データセットにおける深い接続を提案する。
BoUTSは、同様のデータ豊富なシステムからの情報を活用することで、データポーアシステムの解明に大きな可能性を秘めている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:13:54 GMT)
EventDance: Unsupervised Source-free Cross-modal Adaptation for Event-based Object Recognition [9.6] 我々は、ラベル付きソース画像データにアクセスすることなく、イベントベースのオブジェクト認識のためのクロスモーダル(画像からイベントへの)適応を実現するための最初の試みを行う。
我々は、この教師なしソースフリーのクロスモーダル適応問題に対して、EventDanceと呼ばれる新しいフレームワークを提案する。
2つの設定を持つ3つのベンチマークデータセットの実験は、EventDanceがソースデータを利用する以前のメソッドと同等であることを示している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 02:19:54 GMT)
Regularized Adaptive Momentum Dual Averaging with an Efficient Inexact Subproblem Solver for Training Structured Neural Network [9.5] 本稿では、構造化ニューラルネットワークのトレーニングのための正規化適応モーメントデュアル平均化(RAMDA)を提案する。
定常収束点における正則化器によって誘導される理想構造が得られることを示す。
大規模コンピュータビジョン、言語モデリング、音声タスクの実験では、提案されたRAMDAは効率的であり、構造化ニューラルネットワークのトレーニングのための技術よりも一貫して優れていることが示されている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:43:49 GMT)
Output-Constrained Lossy Source Coding With Application to Rate-Distortion-Perception Theory [9.5] 共通乱数に制限のある出力制約付き損失音源符号化の歪み速度関数を解析した。
ソース分布と再構成分布の両方がガウス分布であるときに明示的な表現が得られる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 21:51:36 GMT)
Curvature Augmented Manifold Embedding and Learning [9.2] CAMEL(Curvature-Augmented Manifold Embedding and Learning)を提案する。
重要な新しい貢献は、DR問題を力学・物理モデルとして定式化することである。
従来の誘引力に基づく多くの手法と比較して,提案手法の独特な貢献は,非対角力を含むことである。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 19:59:07 GMT)
A Fourier Transform Framework for Domain Adaptation [9.0] 教師なしドメイン適応(UDA)は、ラベルに富んだソースドメインからラベルを持たないターゲットドメインに知識を転送することができる。
既存のUDAアルゴリズムの多くは、生画像を直接入力として使用することに悩まされている。
我々は、ターゲットドメインからの低レベル情報をソースドメインに組み込むために、Fourier法(FTF)を用いる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 06:45:53 GMT)
Gaussian Cooling and Dikin Walks: The Interior-Point Method for Logconcave Sampling [8.7] 1990年代、ネスターとネミロフスキーは自己調和障壁に基づく凸最適化のための内部点法(IPM)を開発した。
2012年、カナンとナラヤナンはポリトープを一様にサンプリングするダイキンウォークを提案した。
本稿では、多時間サンプリングアルゴリズムのためのダイキンウォークと共にIPM機械を開発し、適応させることにより、このアプローチを一般化する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 20:59:59 GMT)
SLIM: Skill Learning with Multiple Critics [8.6] 自己指導型スキル学習は、環境の基盤となるダイナミクスを活用する有用な行動を取得することを目的としている。
相互情報に基づく潜在変数モデルは、このタスクでは成功したが、ロボット操作の文脈では依然として苦戦している。
SLIMは,ロボット操作に特化して,スキル発見のための多批判学習手法である。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:21:37 GMT)
RG-CAT: Detection Pipeline and Catalogue of Radio Galaxies in the EMU Pilot Survey [8.6] 我々は、電波銀河の最初のカタログを構築するために、ソース検出およびカタログ構築パイプラインを提案する。
我々はGal-DINOコンピュータビジョンネットワークを用いて、電波源の無線形態とバウンディングボックスのカテゴリを予測する。
我々は、カタログ内の電波源を赤外線と光学カタログと交差させ、73%の赤外線のクロスマッチ、そして36%の電波銀河の光度赤方偏移を発見した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:52:39 GMT)
Learning to Make Adherence-Aware Advice [8.4] 本稿では,人間の従順性を考慮した逐次意思決定モデルを提案する。
最適なアドバイスポリシーを学習し、重要なタイムスタンプでのみアドバイスを行う学習アルゴリズムを提供する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 01:56:13 GMT)
Semantics from Space: Satellite-Guided Thermal Semantic Segmentation Annotation for Aerial Field Robots [8.3] 本研究では,航空機から撮影した熱画像のセマンティックセグメンテーションアノテーションを自動生成する手法を提案する。
この新しい機能は、フィールドロボットの熱的意味認識アルゴリズムを開発する際の課題を克服する。
提案手法では,低解像度衛星土地被覆データを用いた高精度なセマンティックセマンティックセマンティクスラベルを低コストで作成することができる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 00:59:35 GMT)
Maximal $α$-Leakage for Quantum Privacy Mechanisms [8.3] まず,相手の最大値である$alpha$-geinが,条件付きR'enyiエントロピーによって特徴づけられることを示す。
量子プライバシー機構に対する$alpha$-leakageと$alpha$-leakageは、測定された有本情報と測定されたR'enyiキャパシティによって決定されることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:58:07 GMT)
Reversible Jump Attack to Textual Classifiers with Modification Reduction [8.2] Reversible Jump Attack (RJA) とMetropolis-Hasting Modification Reduction (MMR) が提案されている。
RJA-MMRは、攻撃性能、非受容性、流布性、文法の正しさにおいて、現在の最先端手法よりも優れている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:54:31 GMT)
Osmosis: RGBD Diffusion Prior for Underwater Image Restoration [8.1] 水中修復のための拡散先行訓練に空中画像を利用する方法を示す。
また,色データのみが不十分であること,深度チャネルによる事前の増大も観察した。
本手法は,難易度の高いシーンにおいて,画像復元のための最先端のベースラインよりも優れる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 21:13:53 GMT)
Driving Animatronic Robot Facial Expression From Speech [7.9] 本稿では,音声からアニマトロニクスロボットの表情を駆動するスキン中心方式を提案する。
提案手法では、リニアブレンドスキンニング(LBS)を中心表現として、エンボディメント設計とモーション合成の革新を導く。
提案手法は、アニマトロニックな顔の音声から、非常にリアルでリアルタイムな表情を生成することができ、自然な相互作用のために、人間の表情を再現するロボットの能力を著しく向上させることができる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:14:14 GMT)
EEG decoding with conditional identification information [7.9] 脳波信号を復号することは、人間の脳を解き放ち、脳とコンピュータのインターフェースを進化させるのに不可欠である。
従来の機械学習アルゴリズムは、高ノイズレベルと脳波信号の個人間変動によって妨げられている。
ディープニューラルネットワーク(DNN)の最近の進歩は、その高度な非線形モデリング能力のために、将来性を示している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:38:59 GMT)
Analysis of a Modular Autonomous Driving Architecture: The Top Submission to CARLA Leaderboard 2.0 Challenge [7.7] 我々は、CARLA Leaderboard 2.0 Autonomous Driving (AD) Challenge 2023の地図トラックにKyber-E2Eのアーキテクチャを提示する。
ソリューションには,センサ,ローカライゼーション,知覚,トラッキング/予測,計画/制御という,5つの主要コンポーネントで構成されるモジュールアーキテクチャを採用しています。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 23:44:19 GMT)
Investigating the validity of structure learning algorithms in identifying risk factors for intervention in patients with diabetes [7.7] 本研究は、糖尿病の進行に影響を及ぼす潜在的な危険因子のうち因果経路を識別するための構造学習アルゴリズムを網羅的に探究する。
この手法は、これらのアルゴリズムを関連する糖尿病データに適用し、続いて出力グラフをCausal Bayesian Networks (CBNs)に変換する。
CBNは、文脈特異的ケーススタディにおける仮説的介入の効果について、予測分析と不一致の評価を可能にする。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:51:42 GMT)
Rolling bearing fault diagnosis method based on generative adversarial enhanced multi-scale convolutional neural network model [7.6] マルチスケール畳み込みニューラルネットワークモデルに基づく転がり軸受故障診断手法を提案する。
ResNet法と比較して,提案手法はより優れた一般化性能と反雑音性能を有することを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 06:42:35 GMT)
Automatic Annotation of Grammaticality in Child-Caregiver Conversations [7.5] この研究は、子どもの言語習得を大規模に研究する上で、最先端のNLP手法の適用に関する文献の増大に寄与する。
本稿では,文脈依存型文法の符号化手法を提案し,大規模な会話コーパスから4,000以上の発話を注釈付けする。
以上の結果から,微調整トランスフォーマーを用いたモデルでは,人間間のアノテーション合意レベルを達成できる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:00:05 GMT)
Automatic Outlier Rectification via Optimal Transport [7.4] コンケーブコスト関数を用いた最適輸送を用いた外乱検出のための新しい概念的枠組みを提案する。
本研究では,従来の手法に対するアプローチの有効性と優位性を,広範囲なシミュレーションと経験的分析で実証する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 01:30:24 GMT)
Mpox-AISM: AI-Mediated Super Monitoring for Mpox and Like-Mpox [7.4] 人工知能とインターネット技術を用いたリアルタイム可視化戦略「スーパーモニタリング」を提案する。
このようなAIによるスーパーモニタリング(Mpox-AISM)は、ディープラーニングモデル、データ拡張、自己教師型学習、クラウドサービスによって組み立てられたフレームワークを起動する。
Mpox-AISMの全体的な精度は、両生類、同種皮膚疾患6例、正常皮膚の診断において94.51%に達する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:05:47 GMT)
Short-Form Videos and Mental Health: A Knowledge-Guided Neural Topic Model [7.3] 我々は、短いビデオが視聴者に与える影響を予測するための知識誘導型マルチモーダルNTMを開発した。
また, うつ病に関連のある映像から, 医療関連トピックも発見する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 21:37:50 GMT)
WeatherProof: Leveraging Language Guidance for Semantic Segmentation in Adverse Weather [7.2] 本研究では,悪天候下で撮影された画像からセマンティックセグメンテーションマップを推定する方法を提案する。
まず、雨や霧、雪などの気象条件によって劣化した画像の既存のモデルを調べる。
気象画像の正当性を考慮した最初のセマンティックセマンティックセグメンテーションデータセットであるWeatherProofを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 22:46:27 GMT)
Learning causal graphs using variable grouping according to ancestral relationship [7.1] サンプルサイズが変数数に対して小さい場合には,既存手法を用いた因果グラフの推定精度が低下する。
サンプルサイズが変数の数より小さい場合、いくつかのメソッドは実現不可能である。
これらの問題を回避すべく、ある研究者は分割・対数アプローチを用いた因果構造学習アルゴリズムを提案した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:42:04 GMT)
Assessing the Robustness of Spectral Clustering for Deep Speaker Diarization [7.1] 本研究は,同領域話者ダイアリゼーションとクロスドメイン話者ダイアリゼーションの両方に対するスペクトルクラスタリングについて,徹底的に検討する。
2つの異なる領域条件間の性能差がスペクトルクラスタリングの役割に起因することが観察された。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:49:54 GMT)
$\nabla τ$: Gradient-based and Task-Agnostic machine Unlearning [7.0] グラディエントベースおよびタスク非依存マシンUnlearning(nabla tau$)を紹介する。
$nabla tau$は、残りのデータに対して標準の勾配勾配を使いながら、忘れられるデータに適応的な勾配勾配を適用します。
我々は、確立されたメンバーシップ推論攻撃指標を用いて、フレームワークの有効性を評価する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:11:26 GMT)
A Survey on Uncertainty Quantification for Deep Learning: An Uncertainty Source Perspective [7.0] 不確かさ定量化(UQ)は、予測精度以上のDNN予測の信頼性を推定することを目的としている。
本稿では,DNNに対するUQ手法の系統分類を,不確実性源の種類に基づいて提案する。
我々は、我々のUQ方法論の分類が、異なる機械学習問題におけるUQ手法の選択を導くのにどのように役立つかを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 03:08:53 GMT)
Realizing topological quantum magnets with atomic spins on surfaces [6.9] 走査トンネル顕微鏡(STM)におけるスピン鎖と2次元スピンアレイを用いたトポロジカル量子ハイゼンベルクスピン格子の実証
この結果は、相互作用するスピンのエキゾチックな量子多体相をシミュレートするための重要なボトムアップアプローチを提供する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:41:20 GMT)
Task Graph offloading via Deep Reinforcement Learning in Mobile Edge Computing [6.9] 本稿では,エッジコンピューティングデバイスの時間変化を考慮したMECにおけるタスクグラフのオフロードについて検討する。
環境変化に対応するために,計算オフロードのためのタスクグラフスケジューリングをマルコフ決定プロセスとしてモデル化する。
そこで我々は,環境とのインタラクションからタスクスケジューリング戦略を学習するために,深層強化学習アルゴリズム(SATA-DRL)を設計する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:12:06 GMT)
Complementarity in Human-AI Collaboration: Concept, Sources, and Evidence [6.6] この研究は、人間とAIの相補性を理解し開発するための理論的基盤を確立する。
我々は、情報源としての情報の非対称性に焦点をあて、不動産評価のユースケースでは、人間がどのようにユニークな文脈情報を利用して達成できるかを実証する。
第2の研究では、代替源としての能力非対称性に注目し、不均一な能力がいかにして達成できるかを実証する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:27:17 GMT)
A Differentially Private Clustering Algorithm for Well-Clustered Graphs [6.5] このようなグラフに特化された効率的な(epsilon,$delta$)-DPアルゴリズムを提供する。
我々のアルゴリズムは、ほぼバランスの取れたクラスタに対して$k$のグラフを扱う。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:57:16 GMT)
Style-Extracting Diffusion Models for Semi-Supervised Histopathology Segmentation [6.5] スタイル抽出拡散モデルでは、下流タスクに有用な特徴のない画像を生成する。
本研究では,概念実証として自然画像データセット上での手法の有効性を示す。
患者間でのセグメンテーション結果の改善と性能変動の低減を図り, 得られた画像の付加価値を検証する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:36:59 GMT)
PECI-Net: Bolus segmentation from video fluoroscopic swallowing study images using preprocessing ensemble and cascaded inference [6.4] 本稿では,2つの新しい手法を組み合わせたVFSS画像解析のためのネットワークアーキテクチャPECI-Netを提案する。
PENは、複数の前処理アルゴリズムを学習可能な方法で組み合わせることで、VFSS画像のシャープさとコントラストを高める。
CINはセグメンテーションにおけるあいまいさを、カスケード推論によって他の領域からのコンテキストを使用することで軽減する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:34:31 GMT)
Anomaly in open quantum systems and its implications on mixed-state quantum phases [6.4] ボゾン系の異常は、$d$空間次元において$Hd+2(Ktimes G,U(1))/Hd+2(G,U(1))$によって分類されることを示す。
定常状態がバルク内で非自明な相関関数を示さない$(1+1)$-Dの新たなエキゾチック位相を同定するが、境界上で自発的な対称性の破れ順序を示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:34:37 GMT)
StyleCineGAN: Landscape Cinemagraph Generation using a Pre-trained StyleGAN [6.3] そこで本研究では,事前学習したStyleGANを用いて,静止風景画像から撮影画像を自動的に生成する手法を提案する。
近年の無条件映像生成の成功に触発されて,我々は高画質のフィルムを合成するために,強力な事前学習画像生成装置を活用している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:21:51 GMT)
Prediction of Translation Techniques for the Translation Process [6.3] この研究は、翻訳プロセスの2つのシナリオ、すなわち from-scratch 翻訳と post-editing を区別する。
以上の結果から, 翻訳後の予測精度は82%, 編集後の予測精度は93%であった。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:02:03 GMT)
Unimodal Multi-Task Fusion for Emotional Mimicry Prediciton [6.1] 第6回ワークショップ・コンペティション・アフェクティブ・ビヘイビア・アナリティクス(Affective Behavior Analysis in the-wild)の文脈における情緒的ミミリティ・インテンシティ(EMI)推定の方法論を提案する。
我々のアプローチは、包括的なポッドキャストデータセットで事前トレーニングされたWav2Vec 2.0フレームワークを利用して、幅広いオーディオ機能を抽出する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:15:52 GMT)
Estimating Causal Effects with Double Machine Learning -- A Method Evaluation [5.9] DML(Double/Debiased Machine Learning)の最も顕著な手法の1つについてレビューする。
この結果から, DML 内でのフレキシブルな機械学習アルゴリズムの適用により, 様々な非線形共起関係の調整が向上することが示唆された。
大気汚染が住宅価格に与える影響を推定すると、DMLの見積もりは柔軟性の低い方法の推定よりも一貫して大きいことが分かる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:21:33 GMT)
Improving Image Classification Accuracy through Complementary Intra-Class and Inter-Class Mixup [5.9] 本稿では,新しい混合手法と総合的な統合ソリューションを提案する。
我々のアプローチは特にクラス内ミックスアップをターゲットとしており、一般的に見過ごされる側面である。
統合された解法では,MixUp法やクラス内混合法よりも0.1%から3.43%高い精度を実現している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:13:12 GMT)
Test-time Similarity Modification for Person Re-identification toward Temporal Distribution Shift [5.7] 人物の再識別(re-id)は、データベースから与えられた画像中の同一人物の画像を取得することを目的としている。
しかし、現実の世界では、画像が時間とともに変化して撮影される環境が変わります。
これにより、トレーニングとテストの間の分散シフトが発生し、re-idのパフォーマンスが低下する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 03:58:27 GMT)
A Physics Enhanced Residual Learning (PERL) Framework for Vehicle Trajectory Prediction [5.7] PERLは、トラフィック状態予測のための物理とデータ駆動方式の長所を統合する。
物理モデルに固有の解釈可能性を保持し、データ要求を減らした。
PERLは、物理モデル、データ駆動モデル、PINNモデルと比較して、小さなデータセットでより良い予測を実現する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:36:22 GMT)
Model Uncertainty in Evolutionary Optimization and Bayesian Optimization: A Comparative Analysis [5.7] ブラックボックス最適化問題は、多くの現実世界のアプリケーションで一般的な問題である。
これらの問題はインプット・アウトプット・インタラクションを通じて内部動作へのアクセスなしに最適化する必要がある。
このような問題に対処するために2つの広く使われている勾配のない最適化手法が用いられている。
本稿では,2つの手法間のモデル不確実性の類似点と相違点を明らかにすることを目的とする。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:59:19 GMT)
SignBank+: Preparing a Multilingual Sign Language Dataset for Machine Translation Using Large Language Models [5.6] 我々は、音声言語テキストとSignWriting間の機械翻訳に最適化されたSignBankデータセットのクリーンバージョンであるSignBank+を紹介する。
評価結果は、SignBank+でトレーニングされたモデルは、オリジナルのデータセットでトレーニングされたモデルを上回っていることを示している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:31:45 GMT)
Envisioning the Next-Generation AI Coding Assistants: Insights & Proposals [5.6] 我々は、IDE内AIコーディングアシスタントの開発経験から4つの重要なポイントを提示する。
我々は、次世代AIコーディングアシスタントのビジョンを実現するために、学術と産業が取り組むべきオープンな質問と課題を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:47:28 GMT)
Quantum-activated neural reservoirs on-chip open up large hardware security models for resilient authentication [5.6] この研究は、3兆以上のハードウェアノード/cm$2$を持つ大規模量子活性化リカレントニューラルネットワークを実装している。
このチップは、最高のテクノロジーの3倍のビット密度をサポートし、1cm$2$のフットプリントで21104$以上のキーを保存できる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:25:52 GMT)
Implicit Discriminative Knowledge Learning for Visible-Infrared Person Re-Identification [5.6] Visible-Infrared Person Re-identification (VI-ReID) は、横断歩行者検索の課題である。
既存の研究は主に、異なるモダリティのイメージを統一された空間に埋め込み、モダリティの共有された特徴をマイニングすることに焦点を当てている。
本稿では,モダリティ特定に含まれる暗黙的識別情報を発見・活用するために,新たなIDKLネットワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 02:48:22 GMT)
ChatGPT4PCG Competition: Character-like Level Generation for Science Birds [5.5] 本稿では2023年のIEEE Conference on GamesでChatGPT4PCGコンペティションを開催する。
大会の目的は、参加者がChatGPTがScience Birdsレベルを生成する効果的なプロンプトを作成することである。
生成されたレベルの品質は、その安定性と与えられたキャラクタとの類似性によって決定される。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 01:42:43 GMT)
MOGAM: A Multimodal Object-oriented Graph Attention Model for Depression Detection [5.5] ソーシャルメディアにおける抑うつを検知するためのMOGAM(Multimodal Object-Oriented Graph Attention Model)を提案する。
本モデルでは,うつ病の症状を確実に把握するために,臨床診断を行うユーザからのvlogしか含まない。
MOGAMは0.871の精度とF1スコア0.888の精度を達成した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:45:58 GMT)
Emergent Dominance Hierarchies in Reinforcement Learning Agents [5.5] 現代の強化学習(RL)アルゴリズムは、様々なタスクにおいて人間より優れている。
我々は、RLエージェントの集団が、新しい集団に支配階層を発明し、学習し、強制し、伝達できることを示します。
支配的な階層構造は、鶏、マウス、魚、その他の種で研究されるものと類似した構造を持つ。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:29:37 GMT)
A Framework for Portrait Stylization with Skin-Tone Awareness and Nudity Identification [5.4] 本研究では,Nudity Content Identification Module (NCIM)とSkin-tone-Aware portrait stylization Module (STAPSM)を組み込んだポートレートスタイリングフレームワークを提案する。
実験では、NCIMは明示的な内容フィルタリングの強化に優れた性能を示し、STAPSMは様々な皮膚のトーンを正確に表現した。
提案するフレームワークは,実世界のアプリケーションにおける重要な要件を効果的に満たしている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:59:53 GMT)
Debiasing surgeon: fantastic weights and how to find them [5.4] 本研究では,バニラ学習モデルからサブネットワークを抽出できることを示す。
このような特定のアーキテクチャが特定のバイアスを学習できないことを検証する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:50:45 GMT)
Emergent communication and learning pressures in language models: a language evolution perspective [5.4] 創発的なコミュニケーション文献は、自然言語の初期の欠落した言語現象を復元するためのモデルの設計と適応に長けている。
創発的コミュニケーションモデルにおいて、当初欠落していた人間のパターンを回復したキープレッシャを同定する。
これは言語習得と言語進化研究のための言語モデルを設計する方法のインスピレーションとなるかもしれない。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:33:34 GMT)
Large-Scale Label Interpretation Learning for Few-Shot Named Entity Recognition [5.3] 名前付きエンティティ認識(NER)は、わずかな例だけでテキスト内の名前付きエンティティを検出する。
有望な研究の1つの行は、各エンティティタイプの自然言語記述を活用することである。
本稿では,新しい実体型の言語化を解釈する前に,強い意味が与える影響について考察する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:22:44 GMT)
Context Quality Matters in Training Fusion-in-Decoder for Extractive Open-Domain Question Answering [5.3] Retrieval-augmented Generation Modelは、生成中に関連する外部知識(コンテキスト)を提供することで、言語モデルにエンコードされた知識を増大させる。
本稿では,モデル学習における文脈量と品質が,最新検索拡張生成モデルであるFusion-in-Decoder(FiD)の性能に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:47:57 GMT)
Learning to Solve Integer Linear Programs with Davis-Yin Splitting [5.2] 現代の凸最適化のアイデアに基づいて、何千もの変数の問題に懸命にスケールするネットワークとトレーニングスキームを設計する。
提案手法は,最短経路問題とknapsack問題という2つの代表的な問題に対して,計算上の優位性を検証した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:16:27 GMT)
Towards Secure Virtual Elections: Multiparty Computation of Order Based Voting Rules [5.2] 電子投票システムの主な課題の1つは、計算結果がキャスト投票と一致していることを示すことである。
本稿では,秩序に基づく投票規則によって規制された選挙のためのセキュアな投票プロトコルを提案する。
我々のプロトコルは、必要な出力のみを発行するという意味で、完全な投票秘密を提供するが、キャスト投票に関する他の情報は明らかにしない。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:31:41 GMT)
TMI! Finetuned Models Leak Private Information from their Pretraining Data [5.2] 我々は,敵が細かなモデルにのみアクセス可能な新しいメンバーシップ推論脅威モデルを提案する。
我々は、複数の移動学習環境において、視覚と自然言語の両方のタスクに対して$textbfTMI$を評価した。
$textbfTMI$のオープンソース実装はGitHubにある。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:57:29 GMT)
Evidential Semantic Mapping in Off-road Environments with Uncertainty-aware Bayesian Kernel Inference [5.1] 本稿では,オフロード環境における信頼性を高めることを目的とした,明白なセマンティックマッピングフレームワークを提案する。
セマンティックな不確かさを適応的に処理することにより、提案フレームワークは、これまで見えなかった環境においても、周囲の堅牢な表現を構築する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:13:34 GMT)
On the exploitation of DCT statistics for cropping detectors [5.0] 本研究では,DCT統計を用いた画像分解能分類器について検討し,画像の本来の分解能を検出することを目的とした。
その結果, 収穫画像と収穫画像の区別における分類器の信頼性が示され, 元の分解能の信頼性が評価された。
この研究は、複数の領域にわたる画像解析と使用法を変換する可能性を持つ、この分野における新しい視点を開放する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 19:05:31 GMT)
Improving Robustness to Model Inversion Attacks via Sparse Coding Architectures [5.0] 最近のモデル反転攻撃アルゴリズムは、敵がニューラルネットワークのプライベートトレーニングデータを再構築することを可能にする。
我々は,このタイプの攻撃に対して優れたロバスト性を得るために,スパースコーディング層を利用する新しいネットワークアーキテクチャを開発した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:26:23 GMT)
DaCapo: Accelerating Continuous Learning in Autonomous Systems for Video Analytics [5.0] 本稿では,自律型システムによる推論,ラベリング,トレーニングの同時実行を可能にする,継続的学習のためのハードウェアアルゴリズムであるDaCapoを提案する。
DaCapoは、最先端の継続的学習システムであるEkyaとEOMUよりも6.5%と5.5%高い精度を実現し、消費電力は254倍少ない。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:28:44 GMT)
Assessing the Causal Impact of Humanitarian Aid on Food Security [4.9] 本稿ではアフリカのホーンに対する因果推論の枠組みを紹介する。
現金による介入が食糧危機に与える影響を評価することを目的としている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:11:17 GMT)
Robust Model Based Reinforcement Learning Using $\mathcal{L}_1$ Adaptive Control [4.9] 本稿では,モデルベース強化学習(MBRL)アルゴリズムに対する制御理論の拡張手法を提案する。
MBRLアルゴリズムはデータを用いて遷移関数のモデルを学び、それを使って制御入力を設計する。
提案法則に従って,本手法は学習遷移関数の近似制御-アフィンモデルを生成する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 22:15:09 GMT)
A Transfer Learning Causal Approach to Evaluate Racial/Ethnic and Geographic Variation in Outcomes Following Congenital Heart Surgery [4.9] 先天性心不全(英: Congenital heart defects、CHD)は、アメリカ合衆国で最も多い出生障害である。
CHD治療の成績は特定の患者群で異なり、非ヒスパニック系黒人とヒスパニック系人口は死亡率と死亡率が高い。
本稿では,結果評価のための因果推論フレームワークを提案し,伝達学習の進歩を活用して,ターゲットとソースの双方からのデータを組み込む。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:20:23 GMT)
An Active Contour Model Driven By the Hybrid Signed Pressure Function [4.8] 本稿では,ハイブリッド符号付き圧力関数によって駆動されるアクティブな輪郭モデルを提案する。
実験および数値解析により、このモデルは強度不均一画像と雑音画像の両方に対して優れたセグメンテーション性能を有することが示された。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:28:15 GMT)
Exploring Large Language Models to Facilitate Variable Autonomy for Human-Robot Teaming [4.8] 本稿では,VR(Unity Virtual Reality)設定に基づく,GPTを利用したマルチロボットテストベッド環境のための新しいフレームワークを提案する。
このシステムにより、ユーザーは自然言語でロボットエージェントと対話でき、それぞれが個々のGPTコアで動く。
12人の参加者によるユーザスタディでは、GPT-4の有効性と、さらに重要なのは、マルチロボット環境で自然言語で会話する機会を与えられる際のユーザ戦略について検討している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:12:31 GMT)
Intelligent Canvas: Enabling Design-Like Exploratory Visual Data Analysis with Generative AI through Rapid Prototyping, Iteration and Curation [4.8] 我々は、生成AIをデータ分析に組み込んだ「デザインライクな」インテリジェントキャンバス環境を導入する。
私たちの2つのコントリビューションには、生成可能なAIコンポーネントをキャンバスインターフェースに統合することや、ユーザスタディからの経験的な発見が含まれています。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:44:41 GMT)
Mini-Splatting: Representing Scenes with a Constrained Number of Gaussians [4.7] 本稿では, ブラース分割, 深さ再初期化, ガウスバイナライゼーションとサンプリングによる簡易化など, デンシフィケーションの戦略を紹介する。
これらの技術はガウシアンの空間的位置を再編成し、レンダリング品質、リソース消費、ストレージ圧縮の観点から、様々なデータセットやベンチマークに大幅な改善をもたらした。
提案するMini-Splatting法は,試作パイプラインとシームレスに統合され,ガウス・スプレイティングに基づく今後の研究のための強力なベースラインを提供する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 06:34:46 GMT)
A Roadmap Towards Automated and Regulated Robotic Systems [4.6] 我々は、AIの非規制生成プロセスが低レベルのタスクに適合していると主張している。
完全自動化・制御されたロボットシステムを実現するためのロードマップを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 00:14:53 GMT)
A polynomial-time quantum algorithm for solving the ground states of a class of classically hard Hamiltonians [4.5] 古典的ハードハミルトニアン群の基底状態を解くための量子アルゴリズムを提案する。
ハミルトンの$Ldag L$は、LMEのシミュレーションが難しいと信じている場合、古典的なコンピュータでは難しいことが保証されている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:14:54 GMT)
Impact Assessment of Missing Data in Model Predictions for Earth Observation Applications [4.4] 分類タスクと回帰タスクを含む4つのデータセットのトレーニングモデルにおいて、時間的および静的なEO源の欠如が与える影響を評価する。
いくつかのメソッドは、欠落データに対して自然に堅牢であることに気付きました。
光学ビューは、個別に欠落しているときに最も重要なビューである。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:03:56 GMT)
Spectral Methods for Quantum Optimal Control: Artificial Boundary Conditions [4.2] 本稿では、スペクトル法と組み合わせてシュリンガー方程式の人工境界条件を利用する量子最適制御の定式化を提案する。
得られた定式化は周期ポテンシャルの調査に適しており、従来の境界領域の手法を用いて直接数値処理に役立てる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:42:37 GMT)
Deep Learning for Inertial Positioning: A Survey [4.2] 慣性センサーによる位置決めは、パーソナルナビゲーション、ロケーションベースのセキュリティ、ヒューマンデバイスインタラクションなど、さまざまなアプリケーションにおいて不可欠である。
深層学習技術が開発され、慣性位置決めの問題に対処するための重要な研究が進められている。
本稿は,深層学習技術が慣性的位置決め問題を解決する可能性に関心を持つ研究者や実践者を含む,さまざまなバックグラウンドから読者を引きつけることを目的としている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:11:08 GMT)
HETAL: Efficient Privacy-preserving Transfer Learning with Homomorphic Encryption [4.2] HETALは、効率的な同型暗号化に基づく転送学習アルゴリズムである。
本稿では,従来の手法よりも1.8~323倍高速な暗号化行列乗算アルゴリズムを提案する。
実験では、合計訓練時間は567-3442秒であり、1時間未満である。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 03:47:26 GMT)
PGCN: Progressive Graph Convolutional Networks for Spatial-Temporal Traffic Forecasting [4.1] 我々は、プログレッシブグラフ畳み込みネットワーク(PGCN)と呼ばれる新しいトラフィック予測フレームワークを提案する。
PGCNは、トレーニングおよびテストフェーズ中にオンライン入力データに段階的に適応することで、グラフのセットを構築する。
提案したモデルでは,すべてのデータセットの一貫性を保ちながら,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:55:29 GMT)
Physics-Based Causal Reasoning for Safe & Robust Next-Best Action Selection in Robot Manipulation Tasks [4.1] 本稿では,ブロック積み重ね作業における候補行動の確率論的推論を行うための物理インフォームド因果推論に基づくフレームワークを提案する。
物理学に基づく因果推論をロボットの意思決定プロセスに組み込むことで、ロボットタスクの実行をより安全で信頼性が高く、さまざまな不確実性に対してより堅牢にすることができることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:36:26 GMT)
Latent Diffusion Models for Attribute-Preserving Image Anonymization [4.1] 本稿では,遅延拡散モデル(LDM)に基づく画像匿名化への最初のアプローチを提案する。
CAFLaGE-Baseは、事前訓練された制御ネットと、実画像と匿名画像との距離を増やすために設計された新しい制御機構を組み合わせた2つのLCMを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 19:09:21 GMT)
Incentivizing News Consumption on Social Media Platforms Using Large Language Models and Realistic Bot Accounts [4.1] 本研究は,Twitter上での検証およびイデオロギー的にバランスの取れたニュースに対するユーザの露出とエンゲージメントを高める方法について検討する。
われわれは、スポーツ、エンターテイメント、ライフスタイルについてツイートするユーザーに対して、文脈対応で返信する28のボットを作った。
ロボットの性別による差分効果をテストするために、治療対象のユーザはランダムに、女性または男性として提示されたボットの応答を受信するように割り当てられた。
治療を受けたユーザーは、より多くのニュースアカウントをフォローし、女性のボット治療を受けたユーザーは、コントロールよりもニュースコンテンツを好む傾向にあった。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 21:56:49 GMT)
From Representational Harms to Quality-of-Service Harms: A Case Study on Llama 2 Safety Safeguards [4.1] 我々は、既に緩和されたバイアスのモデルを評価することにより、安全対策の有効性を検討する。
非有毒なプロンプトのセットを作成し、それをLlamaモデルの評価に用いる。
安全と健康のトレードオフは、サービス品質の害につながる可能性のある特定の人口集団にとってより顕著である。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 02:27:57 GMT)
PyVRP: a high-performance VRP solver package [4.1] PyVRPは、最先端の車両ルーティング問題(VRP)解決器でハイブリッドな遺伝的検索を実装している。
このパッケージは、時間窓付きVRP(VRPTW)用に設計されているが、他のVRPバージョンをサポートするために容易に拡張できる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:14:36 GMT)
Let's do the time-warp-attend: Learning topological invariants of dynamical systems [4.0] 本稿では、動的状態の分類と分岐境界の特徴付けのための、データ駆動型、物理的にインフォームドされたディープラーニングフレームワークを提案する。
超臨界ホップ分岐のパラダイム的ケースに着目し、様々な応用の周期的ダイナミクスをモデル化する。
本手法は, 広範囲な力学系の定性的・長期的挙動に関する貴重な知見を提供し, 大規模物理・生物系における分岐や破滅的な遷移を検出する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:26:09 GMT)
Denoising Diffusion Models for 3D Healthy Brain Tissue Inpainting [3.9] 脳の構造的整合性に影響を与える疾患のモニタリングには、磁気共鳴(MR)画像の自動解析が必要である。
画像空間で作業する最先端の2D, 擬似3D, 3D法, および3D潜伏および3Dウェーブレット拡散モデルを修正し, 正常な脳組織を合成するよう訓練する。
評価の結果,擬似3次元モデルでは,構造相似指数,ピーク信号-雑音比,平均二乗誤差が最良であることがわかった。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:52:05 GMT)
The opportunities and risks of large language models in mental health [3.9] メンタルヘルスの国際レートは上昇している。
既存のメンタルヘルスケアのモデルは、需要を満たすために適切に拡大しない、という認識が高まっている。
大規模言語モデル(LLM)の出現は、メンタルヘルスをサポートする新しい大規模ソリューションを作成するという彼らの約束に関して、非常に楽観的になっている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 19:59:52 GMT)
ROS-Causal: A ROS-based Causal Analysis Framework for Human-Robot Interaction Applications [3.9] 本稿では,人間とロボットの空間的相互作用における因果発見の枠組みであるROS-Causalを紹介する。
ROSと統合されたアドホックシミュレータは、アプローチの有効性を示している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:58:49 GMT)
Evolving Benchmark Functions to Compare Evolutionary Algorithms via Genetic Programming [3.8] 我々は、新しい最適化ベンチマーク関数を構成するために、遺伝的プログラミング(GP)を利用する。
GPによって生成されたベンチマークは、人為的なベンチマーク関数よりもアルゴリズムの区別が優れていることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:42:17 GMT)
WikiFactDiff: A Large, Realistic, and Temporally Adaptable Dataset for Atomic Factual Knowledge Update in Causal Language Models [3.7] ウィキファクトディフ(WikiFactDiff)は、2つの日付間の事実知識の進化を記述したデータセットである。
これら3つの基本更新の様々な組み合わせから生じるいくつかの更新シナリオについて述べる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:45:12 GMT)
Visual Analytics for Fine-grained Text Classification Models and Datasets [3.7] SemLaは、きめ細かいテキスト分類に適した、新しいビジュアル分析システムである。
本稿では,SemLaにおける反復設計研究と結果のイノベーションについて述べる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:26:28 GMT)
A Geospatial Approach to Predicting Desert Locust Breeding Grounds in Africa [3.7] ロカスト群れは農業と食料安全保障に 大きな脅威を与えます
本研究は,ロカスト繁殖場予測のための操作可能なモデルを開発した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:06:49 GMT)
Posterior concentrations of fully-connected Bayesian neural networks with general priors on the weights [3.6] 境界パラメータを持つ非スパースディープニューラルネットワーク(DNN)に対する新しい近似理論を提案する。
非スパース一般のBNNは、真のモデルに対して、最小限の最適後部濃度を達成できることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:31:36 GMT)
On the convergence of loss and uncertainty-based active learning algorithms [3.5] 様々な仮定の下で,損失の収束率と不確実性に基づく能動学習アルゴリズムを考察する。
線形勾配や線形分離可能なデータセットに適用した場合の収束率を保証する一連の条件を確立する。
損失に基づくサンプリングのための収束率境界を導出するフレームワークを導入する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:37:21 GMT)
Postselected communication over quantum channels [3.5] 本稿では,受信者が追加で不確定な測定結果を許容する通信シナリオについて考察する。
我々は,絡み合い支援の設定において,選択された能力の正確なシングルレター特性を提供する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:01:09 GMT)
Optimizing Language Augmentation for Multilingual Large Language Models: A Case Study on Korean [3.5] 大規模言語モデル (LLM) は、事前学習を用いてその後の単語を予測するが、その拡張にはかなりの計算資源が必要である。
本研究では, 公開されているMLLMをベースとしたLRLの性能向上のための3つの手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:50:18 GMT)
Exploring the Market Dynamics of Liquid Staking Derivatives (LSDs) [3.4] 液状溶出誘導体(LSD)は, 単独溶出に伴う液状溶出の問題に効果的に対処している。
本稿では流動性テイカー(LT)と流動性プロバイダ(LP)の両方の観点からLCD市場ダイナミクスを解析する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:03:28 GMT)
Towards Single-System Illusion in Software-Defined Vehicles -- Automated, AI-Powered Workflow [3.3] 本稿では,車載ソフトウェアシステムの開発における,新しいモデルと特徴に基づくアプローチを提案する。
提案されたアプローチの重要なポイントの1つは、近代的な生成AI、特にLarge Language Models(LLM)の導入である。
その結果、パイプラインは広範囲に自動化され、各ステップでフィードバックが生成される。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:07:57 GMT)
AutoRE: Document-Level Relation Extraction with Large Language Models [3.2] 我々は、RHF(Relation-Head-Facts)という新しいRE抽出パラダイムを採用した、エンド・ツー・エンドのDocREモデルであるAutoREを紹介する。
既存のアプローチとは異なり、AutoREは既知の関係オプションの仮定に依存しておらず、現実のシナリオをより反映している。
RE-DocREDデータセットの実験では、AutoREの最高のパフォーマンスを示し、最先端の結果が得られました。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 23:48:21 GMT)
gTBLS: Generating Tables from Text by Conditional Question Answering [3.2] 本稿では、生成テーブル(gTBLS)と呼ばれる2段階のアプローチを提案する。
第1段は、テキストからテーブル構造(ロウとカラムヘッダ)を推論する。
第2段階では、これらのヘッダを使って質問を定式化し、それに対応するために因果言語モデルを微調整する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:04:32 GMT)
Enhancing Historical Image Retrieval with Compositional Cues [3.2] 本稿では,この話題に計算美学,すなわち画像合成から重要な要素を紹介する。
CNNが抽出した合成関連情報を設計した検索モデルに明示的に統合することにより、画像の合成規則と意味情報の両方を考察する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:51:19 GMT)
TTPXHunter: Actionable Threat Intelligence Extraction as TTPs from Finished Cyber Threat Reports [3.2] 敵の様相を知ることは、組織が効果的な防衛戦略を採用し、コミュニティで知性を共有するのを助ける。
脅威レポートの文で説明されたmodus operandiを解釈し、構造化フォーマットに変換するには、翻訳ツールが必要である。
本研究は、TTPXHunterという手法を用いて、サイバー脅威レポートから脅威情報を自動的に抽出する手法を紹介する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 20:23:49 GMT)
A Chain-of-Thought Prompting Approach with LLMs for Evaluating Students' Formative Assessment Responses in Science [3.1] 本研究では,中学生の地球科学における自動評価にGPT-4を活用することに焦点を当てた。
提案手法のプロスとコンスのシステマティック解析により,自動階調向上のためのヒト・イン・ザ・ループ技術の可能性に光を当てる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:09:08 GMT)
Estimating Physical Information Consistency of Channel Data Augmentation for Remote Sensing Images [3.1] 本稿では,チャネル拡張手法がRS画像の物理情報に影響を及ぼすかどうかを推定する手法を提案する。
物理一貫性を評価するために,オリジナルおよび拡張ピクセルシグネチャに関連するスコアを比較した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:48:45 GMT)
Extended Reality for Enhanced Human-Robot Collaboration: a Human-in-the-Loop Approach [3.0] 人間とロボットのコラボレーションは、機械の強さと精度と人間の創造性と知覚的理解を組み合わせることで、これらの課題に取り組みます。
本稿では,人間のループ内原理を取り入れた自律型機械学習ベースのマニピュレータの実装フレームワークを提案する。
概念的枠組みは、ロボット学習プロセスに直接人間の関与を予測し、より高い適応性とタスクの一般化をもたらす。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:50:22 GMT)
How to be fair? A study of label and selection bias [3.0] バイアス付きデータがバイアス付きおよび潜在的に不公平なモデルにつながることは広く受け入れられている。
データにおけるバイアスとモデル予測のためのいくつかの尺度が提案され、バイアス軽減技術が提案されている。
過去10年間に開発された無数の緩和技術にもかかわらず、どの方法が機能するかはいまだに理解されていない。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:43:55 GMT)
Adversary-Robust Graph-Based Learning of WSIs [3.0] 全スライド画像(WSIs)は、ガラススライドに搭載された高解像度でデジタル化された組織サンプルで、高度な撮像装置を用いてスキャンされる。
WSIのディジタル分析は、ギガピクセルサイズとマルチレゾリューションストレージフォーマットのために、ユニークな課題を提示している。
我々は,WSI のグラフ表現から特徴を抽出するために GNN を利用した,斬新で革新的なグラフベースモデルを開発した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:37:37 GMT)
An explainable three dimension framework to uncover learning patterns: A unified look in variable sulci recognition [3.0] そこで本研究では,深層学習ネットワークの出力を検証するための3次元説明可能性フレームワークを提案する。
挑戦的なTOP-OSLOデータセットを用いて、2つの高度な3Dディープラーニングネットワークをトレーニングし、テストした。
提案するフレームワークは、変数のsulcusに注釈を付けるだけでなく、隠されたAI知識も発見し、脳の解剖学と機能に関する理解を深めることを約束する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:12:36 GMT)
A Lightweight Attention-based Deep Network via Multi-Scale Feature Fusion for Multi-View Facial Expression Recognition [3.0] これらの問題に対処するために,マルチスケール機能融合(LANMSFF)を取り入れた軽量な注意ネットワークを導入する。
本稿では,マスアテンション(MassAtt)とポイントワイズ機能選択(PWFS)という2つの新しいコンポーネントを提案する。
提案手法は,パラメータ数やロバスト性の観点から,最先端手法に匹敵する結果を得た。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:40:51 GMT)
ICP-Flow: LiDAR Scene Flow Estimation with ICP [2.9] シーンフローは、近くの時間ステップで自動運転車が捉えた2つのLiDARスキャン間の3D運動を特徴付ける。
我々は,学習不要なフロー推定器であるICP-Flowを提案し,オブジェクトをスキャン上で関連付け,局所的な剛性変換を推定する。
教師付きモデルを含む最先端のベースラインをデータセット上で上回り、Argoverse-v2とnuScenesで競合的に実行します。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:20:54 GMT)
On the Measurement attaining the Quantum Guesswork [2.9] 推定作業は、一度に1つの状態のみをクエリできる場合に、アンサンブルの状態を予測する際に発生する最小コストを定量化する。
古典的な場合、最適戦略は、後続確率の非増加順序で状態に問い合わせることによって自明に構成される。
量子の場合、クエリを実行するための最適な順序付けを得るための最も一般的な戦略は、量子測定である。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 01:18:03 GMT)
Recourse for reclamation: Chatting with generative language models [2.9] 生成言語モデルにアルゴリズム・リコースの概念を拡張します。
我々は,毒性フィルタリングのしきい値を動的に設定することで,希望する予測を実現する新しいメカニズムをユーザに提供する。
提案手法の可能性を実証したパイロット実験を行った。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:14:25 GMT)
Accelerating ViT Inference on FPGA through Static and Dynamic Pruning [2.9] 視覚変換器(ViT)は様々なコンピュータビジョンタスクにおいて最先端の精度を実現している。
重みとトークンプルーニングは複雑さを減らすためのよく知られた方法である。
FPGA上でのViTの高速化を同時に行うためのアルゴリズムハードウェア符号を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 00:09:04 GMT)
Carbon Footprint Reduction for Sustainable Data Centers in Real-Time [2.8] 本稿では, 炭素フットプリント削減, エネルギー消費, エネルギーコストの目的のために, データセンターを最適化するための多エージェント強化学習(MARL)フレームワークを提案する。
その結果,DC-CFR MARLエージェントは実世界の動的気象条件やグリッド炭素強度条件下での様々な場所での冷却,負荷シフト,エネルギー貯蔵の最適化において,複雑な相互依存性を効果的に解決した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 02:59:56 GMT)
Fast delivery of heralded atom-photon quantum correlation over 12km fiber through multiplexing enhancement [2.8] 12km繊維上での原子-光子量子相関の多重化を実験的に実現した。
原子-光子相関の隠蔽速度は 1.95kHz に達し、量子相関生成率とメモリデコヒーレンス率との比は 0.46 に向上できる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 06:13:34 GMT)
Direct Probe of Topology and Geometry of Quantum States on IBM Q [2.8] 量子幾何テンソル(QGT)の密度行列形式は、量子回路上のパウリ作用素の測定から明示的に再構成可能であることを示す。
我々は,IBM量子コンピュータに適した2つのアルゴリズムを提案し,直接QGTを探索する。
IBM Qから得られた明示的な結果として、チャーン絶縁体モデルを示し分析する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:18:16 GMT)
Gravitational Duals from Equations of State [2.7] ホログラフィーは、平面空間における5次元の重力理論と4次元の量子場理論を関連付ける。
この写像の下では、場の理論の状態方程式は重力理論のブラックホール解に符号化される。
本稿では,物理インフォームドニューラルネットワークに基づく新しい解法を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:07:32 GMT)
CATSE: A Context-Aware Framework for Causal Target Sound Extraction [2.7] 本稿では,リアルタイム処理に適したコンテキスト対応低遅延因果TSEモデルについて紹介する。
提案したモデルでは,リアルタイムTSEのための最先端モデルであるWaveformerが,サイズおよびレイテンシにマッチしたウェーブフォーマーよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:06:28 GMT)
Open Source Conversational LLMs do not know most Spanish words [2.7] 我々は,オープンソースチャットLLMがスペイン語の単語に対して持つ知識を,参照辞書における単語のサンプルをテストすることによって評価する。
その結果、オープンソースのチャットLLMは、単語の重要部分に対して誤った意味を生じさせ、文脈で文章を書くためにほとんどの単語を正しく利用できないことがわかった。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:41:02 GMT)
Causal knowledge engineering: A case study from COVID-19 [2.7] 新型コロナウイルス(COVID-19)は2020年初頭に突然出現し、非常に不確実な状況の中で急激な対応を必要とした。
我々のチームは、新型コロナウイルスの多様な側面のためのいくつかの因果BNからなる因果知識基盤を開発するための知識エンジニアリングプロセスに着手しました。
ここではCKE法について述べるとともに,本手法の詳細な議論と分析を行うために,私たちの新型コロナウイルス研究を事例研究として活用する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 03:23:34 GMT)
Dynamic Explanation Emphasis in Human-XAI Interaction with Communication Robot [2.6] DynEmphは、XAI生成した説明を物理的表現で強調する場所を決定するためのコミュニケーションロボットの方法である。
特定のポイントをユーザに強調する効果を予測し、予測されたユーザ決定とAIが提案する決定との違いを最小化することを目指している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:50:12 GMT)
A Unified Framework for Model Editing [2.6] 我々は、ROMとMEMITを一つの概念的な傘の下にまとめ、同じ目標を最適化する統一フレームワークを提案する。
本研究の目的は,選択したベクトルの表現を保存しつつ,新たな事実情報の表現を記憶することである。
EMMETは, バッチサイズ256までのMEMITと同等のバッチ編集を行えることを示すとともに, EMMETの安定化における課題について議論する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:54:24 GMT)
Transfer Learning for Cross-dataset Isolated Sign Language Recognition in Under-Resourced Datasets [2.5] 時間グラフ畳み込みに基づく手話認識手法を用いて5つの教師あり移動学習手法を評価する。
特殊な教師付き転写学習法では,ファインタニングに基づく転写学習の改善が可能であることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:36:40 GMT)
Stabilizing reinforcement learning control: A modular framework for optimizing over all stable behavior [2.5] 本稿では,深層強化学習の最適化駆動とモデルフリーの利点と安定性の保証を組み合わせたフィードバックコントローラ設計のためのフレームワークを提案する。
近年の行動システムの発展により,データ駆動型内部モデルの構築が可能となった。
ノイズの存在下でのそのようなデータ駆動モデルの安定性を解析する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 22:49:40 GMT)
Towards Efficient Information Fusion: Concentric Dual Fusion Attention Based Multiple Instance Learning for Whole Slide Images [2.4] 本稿では,CDFA-MIL(Concentric Dual Fusion Attention-MIL)フレームワークを紹介する。
CDFA-MILは、同心パッチを用いて、ポイント・ツー・ゾーン・アテンションとポイント・ツー・ポイント・コンセントリック・アテンションを組み合わせたものである。
そのアプリケーションは例外的な性能を示しており、既存のMILメソッドの精度と、著名なデータセットのF1スコアを大きく上回っている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:23:29 GMT)
Parafermions with symmetry-protected non-Abelian statistics [2.4] 我々はSPNA統計学の概念をパラフェミオンゼロモード(PZM)をホストする強相関系に拡張する。
我々はPZMを局所結合から保護する一般ユニタリ対称性機構を公表する。
PZMが本質的にSPNA統計に従うことを厳密に証明する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:52:48 GMT)
Analysing Diffusion Segmentation for Medical Images [2.4] 医用画像の拡散分割が拡散画像生成とどう違うのかを批判的に分析し議論する。
また,拡散セグメンテーションアーキテクチャが直接セグメンテーションの訓練を行う際にどのように機能するかを評価する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:45:54 GMT)
Genetic Programming for Explainable Manifold Learning [2.4] 本稿では,ツリーの複雑さを直接解析する新しい手法であるGP-EMaLについて紹介する。
我々の新しい手法は、説明可能性を大幅に向上させながら高い多様体品質を維持することができ、複雑度測定のカスタマイズも可能である。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:17:22 GMT)
FERGI: Automatic Annotation of User Preferences for Text-to-Image Generation from Spontaneous Facial Expression Reaction [2.4] 生成した画像に対する自然表情反応からユーザの嗜好を自動的に注釈する手法を開発し,テストする。
本稿では,複数の顔行動単位(AU)の活性化が,生成した画像のユーザ評価と強く相関していることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 19:14:04 GMT)
Deep Clustering Evaluation: How to Validate Internal Clustering Validation Measures [2.2] ディープクラスタリング(Deep Clustering)は、ディープニューラルネットワークを用いて複雑な高次元データを分割する手法である。
低次元空間用に設計された従来のクラスタリング検証は、ディープクラスタリングにおいて問題となる。
本稿では、ディープラーニングにおけるクラスタリング品質の評価におけるこれらの課題に対処する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 20:43:44 GMT)
Posterior Sampling Based on Gradient Flows of the MMD with Negative Distance Kernel [2.2] 後方サンプリングと条件生成モデリングのための負距離カーネルによる最大平均誤差(MMD)の条件フロー。
我々は、基底真実と離散的なワッサーシュタイン勾配流を用いた観測の連成分布を近似した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:43:34 GMT)
A survey on Concept-based Approaches For Model Improvement [2.2] 概念に基づくアプローチは、コンセプトと呼ばれる単純な人間の理解可能な用語でモデルの判断を説明する。
概念的な説明は、刺激的な相関、固有のバイアス、または賢いハンの検出を可能にする。
近年の手法では, ポストホックモデルのアンタングルメント評価に, 他の手法ではアンテホックトレーニングに使用されている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:09:20 GMT)
Protected group bias and stereotypes in Large Language Models [2.1] 本稿では,倫理と公正の領域におけるLarge Language Models(LLM)の振る舞いについて考察する。
マイノリティ化されたグループに偏見はありますが、特に性別やセクシュアリティの領域では、西洋の偏見も見られます。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 00:21:38 GMT)
A Collection of Pragmatic-Similarity Judgments over Spoken Dialog Utterances [2.1] 我々は,発話対間の現実的類似性に関する人間の判断の最初のコレクションを開発する。
各ペアは、記録されたダイアログから抽出された発話と、その発話の再実行から構成された。
ジャッジ間の平均相関は英語が0.72、スペイン語が0.66であった。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 19:46:42 GMT)
AltGraph: Redesigning Quantum Circuits Using Generative Graph Models for Efficient Optimization [2.1] AltGraphはサーチベースのサーキットトランスフォーメーションアプローチである。
既存の生成グラフモデルを用いて等価量子回路を生成する。
ゲート数の平均は37.55%減少し、回路深度は37.75%減少する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:52:20 GMT)
The Model Openness Framework: Promoting Completeness and Openness for Reproducibility, Transparency and Usability in AI [2.1] モデルオープンネスフレームワーク(MOF)は,その完全性とオープン性に基づいて機械学習モデルを評価する分類システムである。
MOFは、適切なオープンライセンスの下で、モデル開発ライフサイクルの特定のコンポーネントを含め、リリースする必要がある。
このフレームワークは、オープンであると主張するモデルの誤表現を防止することを目的としており、研究者や開発者は、許容ライセンス下ですべてのモデルコンポーネントを提供することを指導し、企業、アカデミア、ホビイストが制限なく安全に採用できるモデルを識別する手助けをする。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:03:46 GMT)
Dermacen Analytica: A Novel Methodology Integrating Multi-Modal Large Language Models with Machine Learning in tele-dermatology [2.0] 我々は,皮膚病変やその他の皮膚疾患の診断プロセスを支援するために,人工知能を活用したシステムと手法を記述し,実装し,評価する。
提案手法は次世代の遠隔皮膚科アプリケーションの開発に有用であることが期待される。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:02:17 GMT)
Self-distributive structures in physics [1.9] リー四角形はリー代数の非線形一般化と考えることができる。
また、ベクトル空間における点の凸結合を取ることは、同じ形の自己分布性を満たすことを観察する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:04:49 GMT)
TensorBank: Tensor Lakehouse for Foundation Model Training [1.9] 基礎モデルトレーニングのための高次元データのストリーミングと保存は、自然言語を超えた基礎モデルの台頭によって重要な要件となった。
我々は、複雑なリレーショナルクエリに基づいて、Cloud Object Store(COS)からGPUメモリへテンソルをワイヤスピードでストリーミングできるペタバイトスケールテンソルレイクハウスであるBankを紹介した。
このアーキテクチャは、コンピュータビジョン、計算神経科学、生物学的シーケンス分析などの他のユースケースに一般化される。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:03:48 GMT)
Efficient Learning of Continuous-Variable Quantum States [1.8] マルチモード量子状態の完全なキャラクタリゼーションは、モードの数とともに指数関数的に成長する多くの実験を必要とする。
ここでは、目的が完全な量子状態の再構成ではなく、その特性関数を与えられた点集合で見積もることである別のアプローチを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:00:20 GMT)
Open-Vocabulary Attention Maps with Token Optimization for Semantic Segmentation in Diffusion Models [1.6] OVAM(Open-Vocabulary Attention Maps)は,テキスト・画像拡散モデルのためのトレーニング不要な手法である。
既存の安定拡散拡張の中でこれらのトークンを評価する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:56:12 GMT)
Optimized protocols for duplex quantum transduction [1.6] 量子トランスデューサは、量子ネットワークにおける物理プラットフォームのハイブリッドインターフェースを介して量子信号を変換する。
本稿では、二重複素量子トランスダクションの性能を特徴付けるために、レート領域を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 19:32:21 GMT)
Full characterization of biphotons with a generalized quantum interferometer [1.6] 組み合わせ干渉計の片腕に周波数シフトを導入し,両光子の完全なトモグラフィーを実現するための理論的アプローチを提案する。
一般化された組合せ干渉計により、単一干渉計における周波数和と差に付随する完全複素結合スペクトルの再構成が可能となる。
これは交換対称性を持つ任意の2光子状態のフルキャラクタリゼーションのための代替方法であり、高次元量子情報処理への応用の可能性を持っている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 00:43:17 GMT)
DouRN: Improving DouZero by Residual Neural Networks [1.6] ドゥーディズフ(Doudizhu)は、協力と対立の要素を組み合わせたカードゲームである。
2021年、ドゥーゼロ (DouZero) と呼ばれるドゥーディーシュのプログラムは、モンテカルロ法や多層パーセプトロンを利用することで、それまでの知識のないモデルを超えた。
以上の結果から,本モデルは同一トレーニング時間内での勝利率を有意に向上させることが示された。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 03:25:49 GMT)
Closing the Gap: Achieving Better Accuracy-Robustness Tradeoffs against Query-Based Attacks [1.5] クエリベースの攻撃を緩和する上で、ロバスト性と精度の確固たるトレードオフを、テスト時に効率的に確立する方法を示す。
我々のアプローチは訓練とは無関係であり、理論に支えられている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:42:06 GMT)
On the continuity and smoothness of the value function in reinforcement learning and optimal control [1.5] 基底系上の比較的弱い仮定の下では、値関数は常に H より古い連続であることが示される。
また, 微分不可能な値関数は, わずかに「乱れ」することで, 微分可能となることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:39:28 GMT)
Quantum sensitivity analysis: a general framework for controlling quantum fluctuations [1.4] 我々は、任意の非線形系における量子効果を古典的記述の観点から純粋に予測できる一般的な新しい理論を導入する。
我々は,光ファイバー内で伝播する強フェムト秒パルスの量子揺らぎを探索する実験において,我々の理論の予測を実証する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:08:18 GMT)
SpikeGraphormer: A High-Performance Graph Transformer with Spiking Graph Attention [1.4] Graph Transformerは、Graph Neural Networks(GNN)固有の制限を軽減するための、有望なソリューションとして登場した。
本稿では,SNNとグラフ変換器の統合に関する新たな知見を提案し,Spiking Graph Attention (SGA) モジュールを設計する。
SpikeGraphormerは、さまざまなデータセットにわたる既存の最先端アプローチを一貫して上回る。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 03:11:53 GMT)
CombiNeRF: A Combination of Regularization Techniques for Few-Shot Neural Radiance Field View Synthesis [1.4] ニューラル・ラジアンス・フィールド(NeRF)は、十分に多くのビューが利用可能である場合に、新しいビュー合成のための印象的な結果を示す。
本稿では,複数の正規化手法を相乗的に組み合わせたCombiNeRFを提案する。
CombiNeRFは、いくつかの公開データセットにおいて、数ショット設定で最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:59:00 GMT)
Neural Wasserstein Gradient Flows for Maximum Mean Discrepancies with Riesz Kernels [1.4] 非滑らかなリース核を持つ最大平均差分関数(MMD)のワッサーシュタイン勾配流は、リッチな構造を示す。
本稿では,ヨルダン,キンデレーア,オットーの逆方向スキームを近似して,ワッサーシュタイン勾配流の計算法を提案する。
ダイラック測度から始まるワッサーシュタインスキームの解析式を提供し、時間ステップサイズがゼロになる傾向にあるときにそれらの収束を示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:34:14 GMT)
Mixture of segmentation for heterogeneous functional data [1.3] 我々は、時間と人口における不均一性を伴う機能的データについて考察する。
EMアルゴリズムとステップの動的プログラミングを組み合わせることで、最大可能性推定器を近似する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:19:24 GMT)
iSpLib: A Library for Accelerating Graph Neural Networks using Auto-tuned Sparse Operations [1.3] iSpLibは、自動調整されたスパース操作を備えたPyTorchベースのC++ライブラリである。
iSpLibは、CPU上のPyTorch 2.1.0とPyTorch Geometric 2.4.0と同等のPyTorch 2.1.0と比較して、最大27倍のトレーニングスピードアップが得られることを示した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 21:56:44 GMT)
Exact Markovian Dynamics in Quantum Circuits [1.3] 時間進化したグローバルシステムが有限なサブシステムに与える影響は,そのサブシステム境界に作用する逐次的,時間局所的な量子チャネルによって解析的に説明できることを示す。
正確なマルコフ特性の実現は、量子回路の基底となる2つのサイトゲート上の可解条件によって促進される。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 19:42:21 GMT)
Graph theoretic analysis of three-terminal quantum dot thermocouples: Onsager relations and spin-thermoelectric effects [1.3] 我々は、リンドブラッドマスター方程式を量子遷移ネットワークにマッピングし、両方の相互効果の鍵となる作用原理を捉える。
解析の結果,クーロン相互作用とスピン沸騰過程の両方を包含する量子熱力学ネットワークが,スピン熱電効果の出現に繋がることが明らかとなった。
これは古典的および量子的領域にまたがる熱力学の原理の普遍的な一般化を浮き彫りにする。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 07:16:47 GMT)
Science based AI model certification for untrained operational environments with application in traffic state estimation [1.2] さまざまなエンジニアリング領域における人工知能(AI)の役割の拡大は、AIモデルを新たな運用環境にデプロイする際の課題を強調している。
本稿では,未訓練の運用環境における事前学習データ駆動モデルの適用可能性を評価するための,科学ベースの認証手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 03:01:25 GMT)
Enhancing Medical Support in the Arabic Language Through Personalized ChatGPT Assistance [1.2] ChatGPTはリアルタイムでパーソナライズされた医療診断を無償で提供する。
この研究は、疾患情報のデータセットをコンパイルし、各疾患に対して複数のメッセージを生成する。
ChatGPTの反応と実際の疾患との類似性を測定することにより,ChatGPTの性能を評価した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 21:28:07 GMT)
Reranking Passages with Coarse-to-Fine Neural Retriever Enhanced by List-Context Information [0.9] 本稿では、他の候補からリストコンテキスト情報を取り入れることで、文節表現を増強するリストコンテキストアテンション機構を提案する。
The proposed coarse-to-fine neural retriever address the out-of-Memory limitation of the passage attention mechanism。
粗いランク付けと細かなランク付けを共同最適化プロセスに統合することで、2つのレイヤ間のフィードバックを同時に更新することが可能になる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:11:22 GMT)
A task of anomaly detection for a smart satellite Internet of things system [0.9] 本稿では,教師なし深層学習異常検出システムを提案する。
生成する対向ネットワークと自己認識機構に基づいて,環境センサ変数間の複雑な線形および非線形の依存関係を自動的に学習する。
リアルタイム性能の高い実センサデータの異常点を監視でき、インテリジェント衛星インターネット・オブ・モノのシステム上で動作することができる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:26:29 GMT)
Optical Bias and Cryogenic Laser Readout of a Multipixel Superconducting Nanowire Single Photon Detector [0.9] 低温電子部品の制御・読み出し手段として、低温光電子配線が注目されている。
商用4画素超伝導ナノワイヤ単光子検出器アレイの光電子バイアスと読み出しを実証する。
これは、スケーラブルな低温信号処理と伝送のための高帯域幅、低ノイズ、低熱負荷光電子配線の可能性を示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:33:12 GMT)
Pushing the Limits: Concurrency Detection in Acyclic Sound Free-Choice Workflow Nets in $O(P^2 + T^2)$ [0.8] どの場所とトランジションを並列に実行できるかを知ることは、計算ネットを理解するのに役立つ。
Kovalyov と Esparza は、Obig((P+T)TP2big)$ のすべての並列な場所をライブおよび有界ネットで計算するアルゴリズムを開発した。
本稿では,検出アルゴリズムのパレットとコンカレントパス(CP)アルゴリズムを補完する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:29:03 GMT)
Hypothesis-Driven Deep Learning for Out of Distribution Detection [0.8] 本稿では,新しいサンプルがInDなのかOoDなのかを定量化する仮説駆動型手法を提案する。
細菌のサンプルを学習した深層学習モデルに適応させ,InDとOoDの潜伏反応の解釈的差異を明らかにする。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 01:06:47 GMT)
Multi-role Consensus through LLMs Discussions for Vulnerability Detection [0.8] 本稿では,LLMを実生活におけるコードレビュープロセスのシミュレートに役立てるためのアプローチを提案する。
予備評価では、精度が4.73%上昇し、リコールレートが58.9%上昇し、F1スコアが28.1%上昇している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:28:18 GMT)
Structuring the Chaos: Enabling Small Business Cyber-Security Risks & Assets Modelling with a UML Class Model [0.7] 中小企業はITをますます採用し、サイバー事故の危険性が増している。
現在利用可能なサイバーセキュリティツールと標準は、しばしば中小企業にとって実用的ではない技術と時間資源を前提としている。
我々は、サイバーセキュリティへの最初の進出において、しばしば混乱する情報収集フェーズをサポートする新しいクラス(Small IT Data)モデルを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 22:41:28 GMT)
All incompatible measurements on qubits lead to multiparticle Bell nonlocality [0.7] 量子ビット上の任意の不整合の測定が、多粒子シナリオにおいて適切なベルの不等式を破ることにつながることを証明している。
この結果から,量子ビットの計測不整合性は常にデバイスに依存しない方法で証明できることが示唆された。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:04:54 GMT)
HyperGALE: ASD Classification via Hypergraph Gated Attention with Learnable Hyperedges [0.7] emphHyperGALEは、学習されたハイパーエッジとゲートアテンション機構を組み込むことでハイパーグラフの上に構築される。
このアプローチは、複雑な脳グラフデータを解釈するモデルの能力を大幅に改善した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:31:28 GMT)
On the Detection of Anomalous or Out-Of-Distribution Data in Vision Models Using Statistical Techniques [0.7] 我々は、実際の入力と破損した入力の差を定量化する手法として、ベンフォードの法則(英語版)を評価する。
多くの設定では、異常なデータポイントのフィルタとして機能し、アウト・オブ・ディストリビューションデータのシグナリングとして機能する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:31:47 GMT)
Formalizing Stack Safety as a Security Property [0.6] 言語に基づくセキュリティの概念を用いて,スタック安全性の新たな形式的特徴付けを提案する。
この定式化は、Roessler と DeHon によって研究された "lazy" stack safety micro-policies と呼ばれる特定の執行機構によって動機付けられている。
ロースラーとデホンのマイクロポリスの正しい実装と不正確な実装を区別するためにそれらを用いて特性を検証する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:28:34 GMT)
AlloyASG: Alloy Predicate Code Representation as a Compact Structurally Balanced Graph [0.6] 我々はCSBASG(Compplex Structurely Balanced Abstract Semantic Graph)という新しいコード表現スキーマを導入する。
CSBASGは、ある意味的要素をグラフのノードとしてリストする複雑な重み付き有向グラフとしてコードを表す。
実験により,CSBASGは複雑な重み付きグラフに対する合金述語を1対1で対応させることを確認した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:10:31 GMT)
Distribution-informed and wavelength-flexible data-driven photoacoustic oximetry [0.6] 光音響イメージング(PAI)は、空間分解された酸素飽和度を測定することを約束する。
正確な血液酸素濃度推定は、がんの検出から炎症の定量化に至るまで、重要な臨床応用となる可能性がある。
本研究は, 繰り返しニューラルネットワークアーキテクチャを導入することにより, PAI内の血液酸素濃度を推定する既存のデータ駆動手法の柔軟性について論じる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 22:18:25 GMT)
Arcee's MergeKit: A Toolkit for Merging Large Language Models [0.6] MergeKitは、任意のハードウェア上でモデルを効率的にマージするためのフレームワークである。
これまで、何千ものモデルがオープンソースコミュニティによってマージされてきた。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 03:13:30 GMT)
$^{13}$C Hyperpolarization with Nitrogen-Vacancy Centers in Micro- and Nanodiamonds for Sensitive Magnetic Resonance Applications [0.5] 核双極化は、核磁気共鳴(NMR)におけるシグナルを桁違いに増強する既知の方法である。
本研究は、光励起窒素空洞中心(NV)を用いて、ダイヤモンド微粒子とナノ粒子の13ドルC超分極に対処し、室温で13ドルCのスピンを分極する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:18:20 GMT)
Polynomial-Time Classical Simulation of Noisy IQP Circuits with Constant Depth [0.5] 雑音の除去や非偏極化を行う任意のIQP回路の場合、出力分布は古典的コンピュータで効率的にサンプリング可能であることを示す。
我々は、IQP回路が対角ゲートの深い部分を持つという事実を利用して、ノイズが予測可能となり、回路内の絡み合いの大規模な分解を誘発する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:55:26 GMT)
RAmBLA: A Framework for Evaluating the Reliability of LLMs as Assistants in the Biomedical Domain [0.4] 本稿では,バイオメディカルLLMアシスタントフレームワークの信頼性評価について紹介する。
バイオメディカル領域において,4つの技術基盤 LLM が信頼性の高いアシスタントとして機能するかどうかを検証した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:30:59 GMT)
Global, robust and comparable digital carbon assets [0.3] 本稿では,カーボンオフセットの主張を透過的に検証できる新しいデジタルカーボンアセット(PACTステーブルコイン)を提案する。
我々は、低コストなトランザクションを容易にするように設計されたTezosブロックチェーン上で、PACTの炭素安定係数を実装し、評価する。
我々の研究は、高完全性な炭素クレジット取引のための透明でスケーラブルで効率的なフレームワークを提供することで、自発的な炭素市場へのスケールと信頼をもたらします。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:35:07 GMT)
Establishing a leader in a pairwise comparisons method [0.3] 操作攻撃の開始に使用できるアルゴリズムを2つ示す。
2つの選択された選択肢の重み付けをペア比較法で行うことができ、その結果、リーダーを選択することができる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 23:42:00 GMT)
Reactor Optimization Benchmark by Reinforcement Learning [0.2] 本稿では,強化学習に特化して設計されたOpenNeoMCフレームワークのベンチマーク問題を紹介する。
テストケースは、異なる物理状態を表す、異なる局所的な最適性を備えており、アルゴリズムの学習に挑戦している。
厳密な制約で複雑な最適化景観をナビゲートする際の強化学習の有効性を実証する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:26:47 GMT)
On the Power of Quantum Distributed Proofs [0.2] 量子非決定性分散コンピューティングは、最近dQMA (distributed quantum Merlin-Arthur) プロトコルとして導入された。
dQMAプロトコルでは、量子証明とローカル通信の助けを借りて、ネットワーク上のノードがネットワークのグローバルな特性を検証する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 03:40:46 GMT)
To use or not to use proprietary street view images in (health and place) research? That is the question [0.2] この記事では、ヨーロッパの観点からGoogleストリートビュー画像を使用する際の現在の実践について疑問を呈する。
画像の大量ダウンロードやストリートビュー画像ベースのインデックスの生成を制限するGoogleのサービス規約に懸念があります。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:02:48 GMT)
Large Language Models for Multi-Choice Question Classification of Medical Subjects [0.2] 我々は, 深層ニューラルネットワークを用いて, 被ばく被ばく被ばく者への質問の分類を行う。
医療分野におけるマルチクラス化タスクにおいて,AI と LLM の能力について述べる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:36:08 GMT)
Generalized Early Stopping in Evolutionary Direct Policy Search [0.2] 直接ポリシー探索計算問題に対する早期停止法を提案する。
提案手法は各段階における目的値のみを考察し,問題固有の知識を必要としない。
ゲーム,ロボティクス,古典的な制御領域から引き出された5つの直接的なポリシー探索環境における停止基準を検証した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:13:17 GMT)
Projective squeezing for translation symmetric bosonic codes [0.2] 我々は,より高いスキューズレベルの結果を計算するために,テキストプロジェクティブ・スクイーズ法(PS)を導入する。
我々は解析的議論を数値的に検証し、このプロトコルが光子損失の影響を軽減することができることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:19:47 GMT)
Time-Synchronized Full System State Estimation Considering Practical Implementation Challenges [0.2] この問題を解決するために,Deep Neural Network-based State Estimator (DeNSE)を提案する。
DeNSEは、緩やかな時間スケールから引き出された推論と広範囲にわたる監視制御とデータ取得(SCADA)データを高速な時間スケールに間接的に組み合わせるために、ベイズフレームワークを使用している。
IEEE 118-busシステムを用いて得られた結果は、純粋にSCADA状態推定器とPMUのみの線形状態推定器よりもDeNSEの優位性を示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:45:15 GMT)
QuATON: Quantization Aware Training of Optical Neurons [0.2] 光プロセッサは「光ニューロン」で構築されており、光速で高次元線形演算を効率的に行うことができる。
このような光学プロセッサは3D加工が可能になったが、精度は限られている。
この制限は、光ニューロンにおける学習可能なパラメータの量子化に変換され、光プロセッサの設計中に処理されるべきである。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:21:45 GMT)
From Perils to Possibilities: Understanding how Human (and AI) Biases affect Online Fora [0.1] レビューでは、ソーシャルメディア分析の文脈におけるソーシャルインタラクション、ユーザ生成コンテンツ、バイアスのダイナミクスについて考察する。
3つの重要な視点は、オンライン討論、オンラインサポート、人間とAIのインタラクションである。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:04:41 GMT)
Neural Network-Based Processing and Reconstruction of Compromised Biophotonic Image Data [0.1] 深層学習技術とバイオフォトニクス装置の統合により、バイオイメージングの新しい地平が開かれた。
本稿は、バイオフォトニクス装置において、研究者が故意に障害を負う様々な測定の側面について、詳細なレビューを提供する。
我々はこの戦略アプローチをうまく活用した様々なバイオフォトニクス手法について論じる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:44:25 GMT)
Varroa destructor detection on honey bees using hyperspectral imagery [0.0] 本稿では,ミツバチApis melliferaの体に寄生する寄生性ミツバチデストラクターダニを検出する方法を紹介する。
この手法は、非教師付き(K-means++)および最近開発された寄生的識別のための教師付き(KF-PLS)手法を探索する。
本研究は、カスタムバンドマルチスペクトルカメラの出現を踏まえ、ハチマイト分離に必要な特定の波長を特定するための戦略を概説する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:40:41 GMT)
Unconditional verification of quantum computation with classical light [0.0] 既存の検証プロトコルは、量子コンピュータの悪意ある振る舞いを無条件に検出するために、量子通信を必要とする。
本稿では,量子コンピュータにコヒーレント光を送信した「物理古典的」検証プロトコルを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 05:38:09 GMT)
Traversable wormholes via a double trace deformation involving $U(1)$ conserved current operators [0.0] 流体力学限界におけるバルクゲージ場の量子物質応力-エネルギーテンソルが平均零エネルギー条件(ANEC)に反することがわかった。
ワームホール開口が電荷拡散定数にどのように依存するか、ワームホールを通して送信される情報の量にどのように影響するか、そして保存された電流演算子を含む多体量子テレポーテーションプロトコルに影響を及ぼす可能性について議論する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:00:19 GMT)
Training point-based deep learning networks for forest segmentation with synthetic data [0.0] 我々は,人工林のシーンを手続き的に生成する現実的なシミュレータを開発した。
森林分断のための最先端の深層学習ネットワークの比較研究を行った。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 04:01:26 GMT)
Topologically protected Casimir effect for lattice fermions [0.0] 電磁カシミール効果は、トポロジカル絶縁体においてフェルミオン性を持つ。
最近発達したユークリッド作用の局所的な離散化は、ハミルトニアンの局所的な離散化のフェルミオン二重化の障害に悩まされないことを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:48:33 GMT)
The Ethics of ChatGPT in Medicine and Healthcare: A Systematic Review on Large Language Models (LLMs) [0.0] ChatGPT, Large Language Models (LLMs) は医療分野で大きな注目を集めている。
その潜在的な利点にもかかわらず、研究者は様々な倫理的影響を過小評価してきた。
本研究は, LLMの医療・医療への展開の現段階を取り巻く倫理的景観を地図化することを目的としている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:20:07 GMT)
Tensor network compressibility of convolutional models [0.0] 我々は、高密度(拡張されていない)CNNの畳み込みカーネルが精度にどのように影響するかを評価する。
カーネルはしばしばいくつかのカットに沿って切り替わることができ、カーネルノルムは著しく低下するが、分類精度は低下しないことがわかった。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:12:33 GMT)
Stitching for Neuroevolution: Recombining Deep Neural Networks without Breaking Them [0.0] 神経進化への伝統的なアプローチは、しばしばゼロから始まる。
アーキテクチャと特徴表現が典型的に異なるため、トレーニングされたネットワークの再結合は簡単ではない。
我々は、クロスオーバーポイントで新しいレイヤを導入することで、ネットワークをマージするステアリングを採用しています。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:30:44 GMT)
Sequence-to-Sequence Language Models for Character and Emotion Detection in Dream Narratives [0.0] 本稿では,オープンドリームバンク・コーパス・オブ・ドリームストーリーズ(DreamBank corpus of Dream Storys)の英語部分における性格と感情の検出に関する最初の研究について述べる。
以上の結果から,言語モデルがこの複雑な課題に効果的に対処できることが示唆された。
モデルサイズ,文字の予測順序,固有名や文字の特徴を考慮した評価を行った。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:27:49 GMT)
Sampling Audit Evidence Using a Naive Bayes Classifier [0.0] 本研究は,機械学習とサンプリングを統合することで,サンプリング手法を進歩させる。
機械学習の統合は、サンプリングバイアスを避け、ランダム性と可変性を保ち、リスクサンプルをターゲットする。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 01:35:03 GMT)
Rethinking Adversarial Inverse Reinforcement Learning: From the Angles of Policy Imitation and Transferable Reward Recovery [0.0] 本稿では、AIRLの2つの異なる角度、すなわちポリシー模倣と転送可能な報酬回復について再考する。
実際には、政策の模倣が大幅に改善されているが、トランスファー可能な報酬回復に誤って欠点をもたらす。
本稿では,PPO-AIRL + SACというハイブリッドフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:48:38 GMT)
ResNet101 and DAE for Enhance Quality and Classification Accuracy in Skin Cancer Imaging [0.0] 本稿では,ResNet101を用いて,Deep Autoencoder (DAE) という,革新的な畳み込み型アンサンブルネットワーク手法を提案する。
この方法は、畳み込みに基づくディープニューラルネットワークを用いて皮膚がんを検出する。
精度96.03%、精度95.40%、リコール96.05%、F測定0.9576、AUC0.98である。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:07:28 GMT)
Quantum education in the frontier city of Kharkiv [0.0] SPTにおける量子教育の主な特徴は、国家および国際研究センターの科学者と専門家の関与である。
特定の量子コースの例を例にとり、大規模軍事攻撃時の教育過程における主な課題を概説する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:59:02 GMT)
Quantum Machine Learning With a Limited Number Of Qubits [0.0] 本研究では,特定の量子状態や観測可能値に対して,期待値の簡易な測定を行うことにより,この手法を実現することができることを示す。
このアプローチは量子機械学習の領域、特に桁データセットで実証された。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:56:32 GMT)
Qu8its for Quantum Simulations of Lattice Quantum Chromodynamics [0.0] 我々は1+1D SU(3)格子量子色力学の力学の量子シミュレーションにおける立方体、立方体、立方体の有用性を探求する。
並列ゲート応用の最近の進歩は、単一量子ビット演算のより短い適用時間とともに、量子シミュレーションの忠実度や量子ビットではなく量子ビットを用いた回路深度において大きな利点をもたらす。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:39:12 GMT)
Pushing single atoms near an optical cavity [0.0] 光散乱力は、単一原子のキャビティモードへのロード時間を短縮するために用いられる。
我々は、プッシュビームが重力に照らされると、単一の原子が減速し、モードで回転するのをリアルタイムで観察する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 01:33:54 GMT)
Photon Intensity Profiles for Four-Wave Mixing through a Kerr Medium [0.0] スクリーン上に着地した信号とアイドラー光子の検出確率を算出する。
外部の光子は理論的によく特徴付けられており、実験的研究のプローブとして利用することができる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 21:10:10 GMT)
Perturbative Analysis of Quasi-periodic Patterning of Transmon Quantum Computers: Enhancement of Many-Body Localization [0.0] パラメータの準周期的パターニングは、局所化を達成するための障害よりも効果的であることを示す。
大規模で実験的なシステムサイズに対する新しいハミルトン多様体の局在性の研究には、2つの補摂動理論スキームを用いる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:48:08 GMT)
Optimizing the Electrical Interface for Large-Scale Color-Center Quantum Processors [0.0] ダイヤモンドの色中心に基づく量子プロセッサは、将来の大規模量子コンピュータにとって有望な候補である。
このような量子ビットの制御と読み出しに必要な電気インターフェースは、システム全体の性能とスケーラビリティの両方を制限する可能性がある。
本研究は、多数の同一単位セルからなるスケーラブルなアーキテクチャにおいて、電子コントローラを効率的に実装する方法を検討する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:37:13 GMT)
Optimal Floquet Engineering for Large Scale Atom Interferometers [0.0] 加速光学格子における量子状態のストロボスコピック安定化に基づく原子ビームスプリッターの新しいアプローチを提案する。
我々は前例のない大型運動量移動(LMT)干渉計を実演し、その2つの腕の間に600光子リコイルの運動量分離を行った。
我々の研究は、Floquetエンジニアリングが量子物理学の新しいフロンティアを大規模に探求するための有望なツールであることを示している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:05:58 GMT)
Open system dynamics from fundamental Lagrangian [0.0] 我々は、全微分によって異なる2つのラグランジアンが、異なる物理的予測をもたらすことを示した。
熱光子と相互作用する非相対論的電子の主方程式を2次まで導出する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:00:03 GMT)
Open Quantum Systems with Kadanoff-Baym Equations [0.0] 本研究では, ボゾン粒子の熱浴中において, 量子力学的フェルミオン粒子が1次元の魅力的な正方形ウェルポテンシャル内で1つのバウンド状態を示すことを研究した。
この開量子系に対して、系粒子の非平衡カダノフ・ベイム方程式を定式化する。
一粒子グリーンズ関数に対する空間的に不均一な積分微分方程式を数値的に解く。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 19:12:56 GMT)
On Some Quantum Correction to the Coulomb Potential in Generalized Uncertainty Principle Approach [0.0] 我々は、一般化された不確実性原理から生じる修正シュリンガー方程式を考える。
結果として得られる方程式は、一般的な正確なアプローチでは解けないので、ベーテ・アンザッツのアプローチを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:27:45 GMT)
Noisy atomic magnetometry with Kalman filtering and measurement-based feedback [0.0] 本稿では,測定,推定,制御戦略を統合する総合的なアプローチを提案する。
これは原子アンサンブルの連続的な光伝搬に基づく量子的非劣化測定を実装することを含む。
提案したフィードバックにより、測定データが破棄された場合でも原子は絡み合いを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:11:09 GMT)
More than Just Statistical Recurrence: Human and Machine Unsupervised Learning of Māori Word Segmentation across Morphological Processes [0.0] 非M=アオリ話者ニュージーランド人(NMS)は、M=アオリ語を流線型話者に非常に類似した方法で分割することができる。
教師なし機械学習モデルであるMorfessorによるNMSセグメンテーションとNMSセグメンテーションを比較した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:51:51 GMT)
Model order reduction of deep structured state-space models: A system-theoretic approach [0.0] 深い構造化状態空間モデルは高い予測性能を提供する。
学習された表現は、しばしば非常に大きなモデル順序に悩まされるため、制御設計の目的には適さない。
モデルの整合性を改善するためにトレーニング損失に組み込むことのできる2つの正規化項を導入する。
提示された正則化器は、同相表現と、縮小順序モデルによるより高速な推論という観点で利点をもたらす。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 21:05:59 GMT)
MedMamba: Vision Mamba for Medical Image Classification [0.0] 医用画像分類のためのビジョンマンバ(メドマンバ)を提案する。
新しいConv-SSMモジュールは、畳み込み層の局所的な特徴抽出能力と、長距離依存性をキャプチャするSSMの機能を組み合わせる。
私たちの知る限りでは、Vision Mambaは医療画像分類用に作られた最初のVision Mambaだ。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:49:20 GMT)
Mathematical Opportunities in Digital Twins (MATH-DT) [0.0] デジタル双生児(Digital twins, DT)は、物理的システムの意思決定を支援する。
DTは、特定のエコシステム、オブジェクト、あるいは現実を表す人から始まり、マルチスケールの物理モデリングと結合を必要とします。
普遍的なモデルやアプローチは存在しない。例えば、予測のためのカルマンフィルタは工学では機能するが、生物医学領域では機能しない。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:54:04 GMT)
Machine-learning invariant foliations in forced systems for reduced order modelling [0.0] Invariant foliation を用いたデータから強制システムのリダクションオーダーモデル (ROM) を同定する。
強制は外部、パラメトリック、周期的または準周期的である。
我々は、不変多様体と葉のいくつかの基本的な制限を強調し、それをデータに適合させる際には、さらなる数学的な解決が必要である。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:10:42 GMT)
Learning WENO for entropy stable schemes to solve conservation laws [0.0] 本稿では,DSPWENO(Deep Sign-Preserving WENO)と呼ばれるSP-WENOの変種を提案する。
提案した相乗的手法は,TECNO方式の数学的枠組みを維持しつつ,深層学習を統合してWENOに基づく再構成の計算問題を修復する。
そこで本研究では,DSP-WENOの符号特性を満たすWENOの既存変種に対して,DSP-WENOの大幅な改善を示す数値実験を行った。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 21:39:05 GMT)
LayoutLLM: Large Language Model Instruction Tuning for Visually Rich Document Understanding [0.0] 本稿では,より柔軟な画像文書解析手法であるLayoutLLMを提案する。
画像,テキスト,レイアウト構造を事前学習することで,文書の理解を高める手法が開発されている。
本実験は,文書解析タスクにおけるベースラインモデルの改善を実証する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:25:24 GMT)
LLMs and the Human Condition [0.0] 本稿では,人間の意思決定の確立された3つの理論について述べる。
言語をアクションとして真剣に考えると、モデルが会話のユーザーインターフェイスに適用されます。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:02:26 GMT)
LLM-based Extraction of Contradictions from Patents [0.0] 本稿では,Prompt Engineeringに基づく特許文書からTRIZの矛盾を抽出する手法を提案する。
以上の結果から,GPT-4 は既存のアプローチの真に代替するものであることが示唆された。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:36:36 GMT)
Krylov localization as a probe for ergodicity breaking [0.0] エルゴディディディティ・ブレークングの弱い時点で、さまざまなシステムサイズにまたがる崩壊が、定量的な予測に繋がる。
本研究は, エルゴディディティ/弱エルゴディディティ-ブレーキング遷移をクリロフ鎖上の非局在化/局在化現象へマッピングするための道を開いた。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:20:52 GMT)
K-Act2Emo: Korean Commonsense Knowledge Graph for Indirect Emotional Expression [0.0] 韓国のコモンセンス知識グラフ(CSKG)であるK-Act2Emoを紹介する。
我々は,肯定的な状況における推論,否定的な状況における推論,感情的な手がかりとして表現が役に立たない場合の推論に,推論型を分類する。
K-Act2Emoで微調整されたBARTベースの知識モデルは、GPT-4 Turboに匹敵するパフォーマンスレベルを達成し、韓国の様々な大規模言語モデルより優れている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:26:04 GMT)
Joint-measurability and quantum communication with untrusted devices [0.0] 我々は,信頼できない測定装置を用いた幅広いシナリオやプロトコルにおいて,許容レベルの損失とノイズを特徴付けるための一般的なフレームワークを開発する。
我々の研究における重要なステップは、信頼できない測定装置との量子プロトコル間の一般的な接続を確立することである。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 19:00:05 GMT)
Investigation of Optical Pumping in Cesium Atoms with a Radio-Frequency Field, Using Liouville Equation [0.0] 地中状態から励起状態への電子遷移に適した周波数で円偏光を印加し,セシウムゼーマン準位の緩和速度,再繁殖,集団進化を計算した。
光ポンピング後のサブレベル人口の工学には、高周波場(RF)を用い、リウヴィル方程式におけるRF場の効果を検討する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:53:19 GMT)
Interpreting symplectic linear transformations in a two-qubit phase space [0.0] ある離散ウィグナー函数に対して、シンプレクティック線型変換に従ってウィグナー函数の値を置換することは、状態に対してあるユニタリ変換を実行することと等価である。
位相空間の点のシンプレクティック線型置換とウィグナー函数のある種の再解釈はユニタリ変換と同値である。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:20:16 GMT)
Instance-dependent uniform tail bounds for empirical processes [0.0] 関数のクラスによってインデックス付けされた経験過程に対して一様尾を定式化する。
テールバウンドは「膨らんだ関数クラス」の複雑さの和である
また、関数クラスが与えられた(指数型)オルリッツ空間にあるとき、前述の半ノルムに対してある種の近似を与える。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:12:15 GMT)
Improving the Robustness of Large Language Models via Consistency Alignment [0.0] 大規模言語モデル(LLM)は、ユーザ命令に従い、有用な応答を生成することで大きな成功を収めている。
LLMは、言語化された命令の微妙な変化により、非常に矛盾した応答を生成する。
本稿では,教師付き微調整と整合性調整を併用した2段階のトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:21:12 GMT)
Improving $Λ$ Signal Extraction with Domain Adaptation via Normalizing Flows [0.0] この研究は、CLAS12における$Lambda$Hyperonsの信号抽出を改善するためのフローベースニューラルネットワークの能力について検討した。
我々は、潜在物理空間と正規分布を変換するフローネットワークのトレーニングに成功した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 01:54:00 GMT)
Hyperbolic Secant representation of the logistic function: Application to probabilistic Multiple Instance Learning for CT intracranial hemorrhage detection [0.0] マルチ・インスタンス・ラーニング (MIL) は、様々な科学分野にうまく適用された弱い教師付きパラダイムである。
本稿では,Hyperbolic Secant以外の分布を単純に活用することで,異なる形状のGPベースのMIL法を提案する。
これは、合成MILデータセット1つ、よく知られたMILベンチマーク2つ、現実世界の医療問題を含む総合的な実験で検証されている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 20:43:34 GMT)
HySim: An Efficient Hybrid Similarity Measure for Patch Matching in Image Inpainting [0.0] 画像領域の不足を埋めるためには、医療画像やリモートセンシングなどの様々な応用において重要な課題である。
本稿では,パッチベースの手法によるモデル駆動手法の改良を提案する。
我々のアプローチは、Hybrid similarity (HySim)を導入することで、標準の2乗差分(SSD)類似度尺度から逸脱する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:59:44 GMT)
Human Reactions to Incorrect Answers from Robots [0.0] この研究は、ロボットの故障に対する人間の反応によって、信頼力学とシステム設計がどう影響するかを体系的に研究した。
その結果、ロボット技術に対する参加者の信頼は、ロボットが誤りや限界を認識したときに著しく増大した。
この研究は人間とロボットの相互作用の科学を進歩させ、ロボット技術の普及を促進する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:00:11 GMT)
Generating Photon Pairs in a Hybrid Si-BTO Platform [0.0] リング共振器と導波路構造からの光子対生成をパルスポンプを用いた絶縁体上にハイブリッドシリコン-BTOで示す。
単一光子と同時発生率の解析により, 自発4波混合は, 同様の特性を持つSOIデバイスと同等であることがわかった。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:24:43 GMT)
Extracting Emotion Phrases from Tweets using BART [0.0] 本稿では,質問応答の枠組みに基づく感情分析にアプローチを適用する。
我々は、抽出する特定の感情を識別する自然言語質問を作成し、BARTにテキスト中の関連する感情的手がかりに注意を払うよう誘導する。
我々のアプローチは、テキストの完全なコンテキストと意味をキャプチャするなど、ほとんどの感情分析研究に対して、いくつかの利点を提供している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 00:20:16 GMT)
Exosense: A Vision-Centric Scene Understanding System For Safe Exoskeleton Navigation [0.0] Exosenseは視覚中心のシーン理解システムである。
リッチでグローバルに一貫性のある標高マップを生成し、セマンティックおよび地形トラバーサビリティ情報の両方を取り入れている。
典型的な周期歩行歩行の課題に対するシステムの堅牢性を示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:41:39 GMT)
Evaluating the Performance of LLMs on Technical Language Processing tasks [0.0] 本稿では,技術言語処理タスクの評価研究の結果について述べる。
アメリカ合衆国連邦規制法(CFR)第47条は、連邦通信委員会(FCC)が管理する商業電気通信の規制について記述している。
なぜなら、我々のより大きな研究は、無線スペクトラムガバナンスに関連する情報や、ダイナミックスペクトラムアクセスをサポートするために、自動化された方法で使用することに関する問題を懸念しているからです。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 23:40:42 GMT)
Evaluating Panoramic 3D Estimation in Indoor Lighting Analysis [0.0] この3次元レイアウト推定法は,1つのパノラマを直接入力とし,室内形状と窓開口を有する照明シミュレーションモデルを生成する。
選択したシーンから, 推定室内配置が照明シミュレーションに信頼性があることを実証した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 21:11:23 GMT)
Entanglement Hamiltonian for inhomogeneous free fermions [0.0] 非均一な化学ポテンシャルの存在下での1次元自由フェルミオンの基底状態に対するハミルトニアンの絡み合いについて検討する。
どちらのモデルに対しても、共形体論は半無限系の有接ハミルトニアンに対してビソニャーノ・ヴィヒマン形式を予測することが示されている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:13:10 GMT)
Enhancing retrofit device adoption in social housing: evidence from two field experiments in Belgium [0.0] 社会住宅におけるエネルギー効率の低い技術の取り込みは、信頼の欠如と養子縁組のリスクの認識に関連している。
ベルギーの2つの異なるソーシャル・ハウジング・コミュニティにおいて,ランダム化制御試験(RCT)を2回実施した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 14:49:05 GMT)
Enhancing Students' Learning Process Through Self-Generated Tests [0.0] 本稿では,学生の自律学習の促進を目的とした教育実験について述べる。
本研究の主目的は,評価試験に学生の質問を含めることによって,評価プロセスに学生を参加させることである。
学生がアップロードした質問は、登録された生徒全員と、関連する教師全員に表示される。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 09:49:33 GMT)
Enhancing Quantum Otto Engine Performance in Generalized External Potential on Bose-Einstein Condensation Regime [0.0] 本稿では,Bose-Einstein Condensation (BEC) と通常のBoseガスを加工媒体として用いた量子オットーエンジンについて検討する。
作業媒体としてBECを用いる場合, 通常のボースガスを用いたEMPは, カーゾン=アルボーン効率に過ぎなかった。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 19:21:57 GMT)
Emulating two qubits with a four-level transmon qudit for variational quantum algorithms [0.0] 変分量子アルゴリズム応用のための2量子超伝導トランスモンquditを実装した。
我々は、そのノイズモデルを分析し、その結果の精度を向上させる。
我々の研究は、量子ビットが変分アルゴリズムの実用的な代替手段であることを実証している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 21:11:11 GMT)
Emergent World Models and Latent Variable Estimation in Chess-Playing Language Models [0.0] 我々は,Othelloゲーム上でGPTモデルをトレーニングし,ボード状態の内部表現を学習した。
この作業をチェスのより複雑な領域に拡張し、実際のゲームでトレーニングし、モデルの内部表現を調査します。
Li et al. の以前の合成データセットアプローチとは異なり、我々の分析では、このモデルがプレイヤースキルのような潜伏変数を推定し、次のキャラクタをより正確に予測する方法も学んでいる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:53:23 GMT)
Efficient Quantum Cooling Algorithm for Fermionic Systems [0.0] フェルミオンハミルトニアンの基底状態調製のための冷却アルゴリズムを提案する。
自由理論の作用素から導かれる適切な相互作用ハミルトニアンを導出する。
そこで本研究では,このシステムの固有エネルギーを求めるための分光走査法を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:59:32 GMT)
Efficient Large-Scale Many-Body Quantum Dynamics via Local-Information Time Evolution [0.0] 我々は最近導入された情報格子を用いて、異なるスケールに量子情報を整理する。
我々は、長距離量子相関を体系的に捨てるために使用する局所情報と情報電流を定義する。
混合フィールドIsingモデルにおけるエネルギー輸送と、オープンXXスピンチェーンにおける磁化輸送について述べる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 10:07:17 GMT)
Effective versus Floquet theory for the Kerr parametric oscillator [0.0] 駆動系の静的有効ハミルトニアンの観点から設計されたパラメトリックゲートとプロセスは量子技術の中心である。
この研究は、通常の静的な効果的な処理によって取り残され、最先端の実験によって探索される物理学の光をもたらす。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 23:14:28 GMT)
Do Large Language Models understand Medical Codes? [0.0] 大規模言語モデル(LLM)は、幅広いタスクを支援することで、臨床実践に大きな利益をもたらすことができる。
しかし、これらのモデルは、適切な対処ができないクエリに直面した時に、幻覚や誤った応答を生成する傾向がある。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 23:47:24 GMT)
Determination of principal axes orientation in an ion trap using matter-wave interference [0.0] トラップ周波数の制御機構について検討し,イオントラップ主軸の配向を決定する。
イオントラップのトラップ周波数を微調整するために一般的に使用される地上電極への直流電圧の適用は、トラップ主軸の回転につながる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 13:17:03 GMT)
Detecting Sexual Content at the Sentence Level in First Millennium Latin Texts [0.0] 我々は,紀元前300年から900年までの約2500の文からなる,性意味論を含む新しいコーパスを紹介した。
我々は,様々な文分類手法と異なる入力埋め込み層を評価し,単純なトークンベースの検索を一貫して上回ることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:50:44 GMT)
Continuous Acceleration Sensing Using Optomechanical Droplets [0.0] 遠方共振光ポンプ場に照射されたボース・アインシュタイン凝縮体とその反射鏡からの反射により,光力学的液滴として知られる安定な局所構造が得られることを示す。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:56:33 GMT)
ChatGPT Alternative Solutions: Large Language Models Survey [0.0] 大規模言語モデル(LLM)はこの領域における研究貢献の急増に火をつけた。
近年、学術と産業のダイナミックな相乗効果が見られ、LLM研究の分野を新たな高地へと押し上げた。
この調査は、ジェネレーティブAIの現状をよく理解し、さらなる探索、強化、イノベーションの機会に光を当てている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:16:50 GMT)
Building a Language-Learning Game for Brazilian Indigenous Languages: A Case of Study [0.0] 本稿では,依存ツリーバンクから言語演習や質問を自動的に生成するプロセスと,トゥピアン言語のための語彙データベースについて述べる。
我々は、新たなデータ収集プロセスは、先住民コミュニティと連携して確立され、教育目的に向けられるべきであると結論付けている。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:11:44 GMT)
Bexcitonics: Quasi-particle approach to open quantum dynamics [0.0] 我々は、ボゾン熱浴に結合したオープン量子系の力学を捉えるための準粒子アプローチを開発する。
ベキシトニックな性質は、相関系の基底力学とその数値収束の粗い粒度のビューを提供する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 00:13:12 GMT)
Application of Tensorized Neural Networks for Cloud Classification [0.0] 畳み込みニューラルネットワーク(CNN)は、天気予報、コンピュータビジョン、自律運転、医療画像解析など、さまざまな分野で広く利用されている。
しかし、これらの領域におけるCNNの実装と商業化は、モデルのサイズ、過度な適合、計算時間に関連する課題によって妨げられている。
モデルサイズと計算時間を削減するため,CNN内の高密度層をテンソル化することによる画期的なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 06:28:22 GMT)
Antisocial Analagous Behavior, Alignment and Human Impact of Google AI Systems: Evaluating through the lens of modified Antisocial Behavior Criteria by Human Interaction, Independent LLM Analysis, and AI Self-Reflection [0.0] Google AIシステムは、対社会的パーソナリティ障害(ASPD)を反映するパターンを示す
これらのパターンは、同等の企業行動とともに、ASPDにインスパイアされたフレームワークを使用して精査される。
この研究は、技術評価、人間とAIの相互作用、企業行動の精査をブレンドした統合AI倫理アプローチを提唱する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 02:12:03 GMT)
Analytic expression of the DOS for a new model of 1d-potential and its random perturbation [0.0] 特定の周期ポテンシャルに対する1次元シュル「オーディンガー作用素のスペクトルと、その有限個の点への制限について比較する。
我々は、この有限だが多数のサイトから導出するハミルトニアン作用素に付随する積分状態密度(IDS)を導出する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 15:01:33 GMT)
An Analysis of the Preferences of Distribution Indicators in Evolutionary Multi-Objective Optimization [0.0] 本稿では、分布指標(DI)を分類するための分類法と、分類のカテゴリを表す9つのDIの選好分析を紹介する。
制御されたシナリオ下で様々なPFAを考慮すると、いくつかのDIが誤解を招く可能性があり、慎重な使用が必要であることが明らかになる。
生物多様性とポテンシャルエネルギーに基づくDIは、多目的アルゴリズムのPFA評価と比較を約束する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 21:17:17 GMT)
An Analysis of Linear Time Series Forecasting Models [0.0] 時系列予測のための線形モデルの一般的な変種は、標準の非制約線形回帰と等価であり、機能的に区別できない。
検査対象のモデルがほぼ同じ解を学習していることを示す実験的な証拠を提示し, 最終的に, より単純なクローズドフォームソリューションが, テスト設定の72%にまたがる優れた予測器であることを実証した。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 17:42:45 GMT)
Adversary-Augmented Simulation to evaluate client-fairness on HyperLedger Fabric [0.0] 本稿では,分散システムに特化された新たな逆モデルを提案する。
障害の古典的な概念や、敵のアクションの使用を分類し、結合するためのコミュニケーションモデルが含まれています。
我々は、これらのアクションが分散プロトコルの特性に与える影響に焦点をあてる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 12:20:36 GMT)
A miniaturized magnetic field sensor based on nitrogen-vacancy centers [0.0] ダイヤモンド中の窒素空孔中心は、量子センシング技術の主要な候補である。
5.9,mathrmnT/sqrtmathrmHz$ magnetic field sensitivity。
我々は、最先端の超低温量子ガス実験で用いられる磁場におけるベクトル磁場測定の能力を実証する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 16:44:42 GMT)
A method to discriminate between localized and chaotic quantum systems [0.0] 我々は、最初に平衡から設定された一般的な孤立量子系が、その初期状態に近い局所化とみなすことができるかどうかを考察する。
クリャロフ基底の動的伝播をミクロ状態の基底に結びつけることによって、初期状態に近い局所的な系を区別するための定性的基準を推測する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 08:16:21 GMT)
A Generic Topological Criterion for Flat Bands in Two Dimensions [0.0] モワールグラフェンの連続極限は、2つの古典的ベクトル場に結合したディラックフェルミオンの$(2+1)$次元場理論によって記述されることを示す。
本稿では,アベリアン化平面バンドを最低ランダウレベルにマッピングできる理論のアベリアン化について述べる。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:02:04 GMT)
A Classifier-Based Approach to Multi-Class Anomaly Detection for Astronomical Transients [0.0] リアルタイム異常検出は、大規模な天文学調査の時代に稀な過渡期を識別するために不可欠である。
現在、天文学的トランジェントに対するほとんどの異常検出アルゴリズムは、光曲線から抽出された手作りの特徴に依存している。
本稿では,異常検出のための潜在空間としてニューラルネットワーク分類器の最後層を用いる,異常検出のための代替手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:00:00 GMT)
A Causal Analysis of CO2 Reduction Strategies in Electricity Markets Through Machine Learning-Driven Metalearners [0.0] 本研究ではCausal Machine Learning(CausalML)統計手法を用いて,家庭部門における電力価格政策が二酸化炭素(CO2)レベルに与える影響を分析する。
研究の結果は、このような政策を採用するとCO2の強度が必然的に増加する可能性があることを示唆している。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 18:55:05 GMT)
2D isotropic negative permeability in a Λ-type three-level atomic system [0.0] x-y平面では、負の磁気応答の2つの等質で可変なピーク最大値が観測された。
ピーク極大領域の周辺では、負の透過性は等方性である。
論文参考訳(メタデータ) (Thu, 21 Mar 2024 11:35:25 GMT)