Automated Black-box Prompt Engineering for Personalized Text-to-Image Generation [150.6] PRISMは人間の解釈可能なプロンプトと転送可能なプロンプトを自動的に識別するアルゴリズムである。
T2Iモデルへのブラックボックスアクセスのみを前提として、望まれる概念を効果的に生成できる。
本実験は,オブジェクト,スタイル,画像の正確なプロンプト生成におけるPRISMの有効性と有効性を示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 02:35:53 GMT)
JailbreakBench: An Open Robustness Benchmark for Jailbreaking Large Language Models [123.7] ジェイルブレイク攻撃は、大きな言語モデル(LLM)が有害、非倫理的、またはその他の不快なコンテンツを生成する原因となる。
これらの攻撃を評価することは、現在のベンチマークと評価テクニックの収集が適切に対処していない、多くの課題を提示します。
JailbreakBenchは、以下のコンポーネントを備えたオープンソースのベンチマークである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 02:44:02 GMT)
Continual Learning: Applications and the Road Forward [119.0] 継続的学習は、機械学習モデルが、過去に学んだことを忘れずに知識を蓄積することで、新しいデータを継続的に学習できるようにすることを目的としている。
この研究は、2023年3月のDagtuhl Seminar on Deep Continual Learningで著者らが行った多くの議論の結果である。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:16:50 GMT)
RH20T-P: A Primitive-Level Robotic Dataset Towards Composable Generalization Agents [108.0] ロボット学習の最終的な目標は、包括的で一般化可能なロボットシステムを取得することである。
言語モデルを高レベルプランナとして活用する最近の進歩は,タスクをプリミティブレベルプランに分解することで,タスクの複雑さを低減できることを実証している。
将来性はあるものの、コミュニティはまだ構成可能な一般化エージェントに十分な準備が整っていない。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:42:54 GMT)
Towards Temporally Consistent Referring Video Object Segmentation [98.8] 本稿では,参照セグメンテーションとともに時間的一貫性を明示的にモデル化する,エンドツーエンドなR-VOSパラダイムを提案する。
自動生成された高品質の参照マスクを有するフレームの特徴は、残りのフレームをセグメント化するために伝播される。
大規模な実験により,本手法は時間的整合性を著しく向上させることが示された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:32:49 GMT)
IME: Integrating Multi-curvature Shared and Specific Embedding for Temporal Knowledge Graph Completion [97.6] 時間的知識グラフ(TKG)は時間次元を取り入れており、知識の進化を正確に捉えることができる。
本稿では,TKGCタスクのための新しい多曲率共有固有埋め込み(IME)モデルを提案する。
IMEは2つの重要な性質、すなわち空間共有性と空間固有性を含んでいる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 23:31:25 GMT)
Disentangling Length from Quality in Direct Preference Optimization [93.7] RLHF(Reinforcement Learning from Human Feedback)は、近年の大規模言語モデルの成功において重要な要素である。
RLHFは、冗長性のような人間の嗜好のバイアスを利用することが知られている。
我々は,モデル品質の改善を維持しつつ,長さの搾取を防止するための基本的かつ単純な正規化戦略を開発する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 06:03:47 GMT)
Collaborative Knowledge Infusion for Low-resource Stance Detection [83.9] 姿勢検出モデルを支援するために、ターゲット関連の知識がしばしば必要である。
低リソース姿勢検出タスクに対する協調的知識注入手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:32:14 GMT)
A Comprehensive Study of Knowledge Editing for Large Language Models [82.7] 大規模言語モデル(LLM)は、人間のコミュニケーションを忠実に反映したテキストの理解と生成の素晴らしい能力を示している。
本稿では,知識編集の問題を定義し,最先端アプローチの包括的レビューを行う。
我々は,代表的知識編集アプローチの総合的評価のための新しいベンチマークであるKnowEditを紹介した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:56:55 GMT)
Parameter Efficient Fine-tuning via Cross Block Orchestration for Segment Anything Model [81.6] PEFTにクロスブロックオーケストレーション機構を組み、SAM(Segment Anything Model)の様々な下流シナリオへの適応を可能にする。
本稿では,超複素層から重みが生じる線形射影ヘッドを導入するブロック内拡張モジュールを提案する。
提案手法は,約1Kのパラメータのみを付加した新規シナリオにおいて,セグメンテーション性能を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:51:18 GMT)
ViTAR: Vision Transformer with Any Resolution [81.0] ビジョントランスフォーマーは、トレーニング中に見られるものと異なる処理解像度で性能低下を経験する。
複数の解像度で一貫した位置認識を提供するために、視覚変換器にファジィ位置符号化を導入する。
我々のモデルであるViTARは、1120x1120の解像度で83.3%、4032x4032の解像度で80.4%の精度で、優れた適応性を示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:59:44 GMT)
Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model [80.6] 画像分類性能を高めるための一般的な戦略は、T2Iモデルによって生成された合成画像でトレーニングセットを増強することである。
本研究では,既存のデータ拡張技術の欠点について検討する。
Diff-Mixと呼ばれる革新的なクラス間データ拡張手法を導入する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:23:45 GMT)
HallE-Control: Controlling Object Hallucination in Large Multimodal Models [80.0] 詳細な字幕作成のための GPT-4 支援評価手法である $textitCCEval$ を導入する。
LMMは既存のVQAベンチマークにおいて最小限のオブジェクト存在幻覚を示すが、提案手法はそのような幻覚への感受性を継続することを示す。
LLaVA$_7B$に比べて幻覚は44%減少し,対象範囲を維持できる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 22:27:12 GMT)
Towards Understanding Dual BN In Hybrid Adversarial Training [79.9] モデルトレーニングにおけるアフィンパラメータのアンタングリングよりも,アンタングリング統計がより少ない役割を担っていることを示す。
本稿では,ハイブリッドAT改善のための実証的基礎と統一的なフレームワークとして機能する2タスク仮説を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 05:08:25 GMT)
OmniParser: A Unified Framework for Text Spotting, Key Information Extraction and Table Recognition [79.9] 多様なシナリオにまたがって視覚的なテキストを解析するための統一パラダイムを提案する。
具体的には,3つの視覚的なテキスト解析タスクを同時に処理できるOmniというユニバーサルモデルを提案する。
オムニでは、全てのタスクが統一エンコーダ・デコーダアーキテクチャ、統一目的点条件テキスト生成、統一入力表現を共有している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:51:14 GMT)
Adaptive, Doubly Optimal No-Regret Learning in Strongly Monotone and Exp-Concave Games with Gradient Feedback [75.3] オンライン勾配降下(OGD)は、強い凸性や単調性仮定の下では二重最適であることが知られている。
本稿では,これらのパラメータの事前知識を必要としない完全適応型OGDアルゴリズム,textsfAdaOGDを設計する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:37:02 GMT)
SkillDiffuser: Interpretable Hierarchical Planning via Skill Abstractions in Diffusion-Based Task Execution [75.3] 拡散モデルは、ロボット軌道計画の強力な可能性を示している。
高レベルの命令からコヒーレントな軌道を生成することは依然として困難である。
エンド・ツー・エンドの階層的計画フレームワークであるSkillDiffuserを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:49:40 GMT)
Reasoning or Reciting? Exploring the Capabilities and Limitations of Language Models Through Counterfactual Tasks [71.2] 最近の言語モデルは、幅広いタスクで印象的なパフォーマンスを示している。
これらのスキルは一般的で、移行可能か、あるいは事前トレーニング中に見られる特定のタスクに特化していますか?
本稿では,標準タスクの既定前提から逸脱する「数値的」タスク変種に基づく評価フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 23:37:24 GMT)
GS-IR: 3D Gaussian Splatting for Inverse Rendering [71.1] 3次元ガウス散乱(GS)に基づく新しい逆レンダリング手法GS-IRを提案する。
我々は、未知の照明条件下で撮影された多視点画像からシーン形状、表面物質、環境照明を推定するために、新しいビュー合成のための最高のパフォーマンス表現であるGSを拡張した。
フレキシブルかつ表現力のあるGS表現は、高速かつコンパクトな幾何再構成、フォトリアリスティックな新規ビュー合成、有効物理ベースレンダリングを実現する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 05:47:24 GMT)
RTracker: Recoverable Tracking via PN Tree Structured Memory [71.1] 本稿では,木構造メモリを用いてトラッカーと検出器を動的に関連付け,自己回復を可能にするRTrackerを提案する。
具体的には,正負と負のターゲットサンプルを時系列に保存し,維持する正負のツリー構造メモリを提案する。
我々の中核となる考え方は、正と負の目標カテゴリーの支持サンプルを用いて、目標損失の信頼性評価のための相対的距離に基づく基準を確立することである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:54:40 GMT)
Learning from One Continuous Video Stream [70.3] 1つの連続ビデオストリームからオンライン学習のためのフレームワークを導入する。
連続するビデオフレーム間の高い相関を考えると、これは大きな課題となる。
プリトレーニングとシングルストリーム評価を切り替える実用的で柔軟な方法として,ピクセル・ツー・ピクセル・モデリングを採用している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:29:55 GMT)
Jointly Training and Pruning CNNs via Learnable Agent Guidance and Alignment [69.3] 本稿では,CNNモデルの重みと構造的プーン構造を協調的に学習するための新しい構造的プルーニング手法を提案する。
本手法の中核となる要素は強化学習(RL)エージェントであり,その動作がCNNモデルの階層のプルーニング比を決定する。
我々は,モデルの重みとエージェントのポリシーを反復的に訓練し,共同訓練と刈り取りを行う。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:22:29 GMT)
Knowledge Boundary and Persona Dynamic Shape A Better Social Media Agent [69.1] パーソナライズされた知識と動的ペルソナ情報に基づくソーシャルメディアエージェントを構築する。
パーソナライズされた知識に対して、外部知識ソースを追加し、エージェントのペルソナ情報とマッチングすることにより、エージェントにパーソナライズされた世界知識を与える。
動的ペルソナ情報については、現在の行動情報を用いてエージェントのペルソナ情報を内部的に検索し、現在の行動に対する多様なペルソナ情報の干渉を低減する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:01:23 GMT)
Interpreting Key Mechanisms of Factual Recall in Transformer-Based Language Models [68.8] 本稿では,Transformer ベースの言語モデルを用いて,実際のリコールタスクに使用するメカニズムについて検討する。
ゼロショットのシナリオでは、"The capital of France is"のようなプロンプトが与えられ、タスク固有の注意がトピックを抽出し、後続のドメインに渡す。
モデルの最終層に広く存在するメカニズムを観察し、正しい予測を抑える。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:54:59 GMT)
Fine-Tuning Language Models with Reward Learning on Policy [68.7] 人間からのフィードバックからの強化学習(RLHF)は、大きな言語モデル(LLM)を人間の好みに合わせる効果的なアプローチとして現れている。
その人気にもかかわらず、(固定された)報酬モデルが不正確な流通に悩まされることがある。
本稿では、政策サンプルを用いて報酬モデルを洗練し、流通を継続する、教師なしのフレームワークであるポリシーに関する報酬学習(RLP)を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:02:10 GMT)
OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation [67.6] OV-Uni3DETRは、様々なシナリオにおける最先端のパフォーマンスを達成し、既存のメソッドを平均6%以上上回っている。
コードと事前訓練されたモデルは、後にリリースされる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:05:04 GMT)
Self-Prompting Large Language Models for Zero-Shot Open-Domain QA [67.1] Open-Domain Question Answering (ODQA)は、背景文書を明示的に提供せずに質問に答えることを目的としている。
このタスクは、調整済みの検索リーダーモデルをトレーニングするデータがないゼロショット設定で顕著に困難になる。
本稿では,大規模言語モデルのパラメータに符号化された膨大な知識を明示的に活用するセルフプロンプトフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 06:06:59 GMT)
Revisiting Code Search in a Two-Stage Paradigm [67.0] TOSSは2段階のフュージョンコード検索フレームワークである。
まずIRベースのバイエンコーダモデルを使用して、少数のトップkコード候補を効率的にリコールする。
その後、より微細なクロスエンコーダを使用してランク付けを行う。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:51:21 GMT)
LLMRefine: Pinpointing and Refining Large Language Models via Fine-Grained Actionable Feedback [65.8] 最近の大規模言語モデル(LLM)は、世代品質を改善するために人間のフィードバックを活用している。
LLMの出力を最適化する推論時間最適化手法であるLLMRefineを提案する。
機械翻訳、長文質問応答(QA)、話題要約を含む3つのテキスト生成タスクについて実験を行った。
LLMRefineは、すべてのベースラインアプローチを一貫して上回り、翻訳タスクの1.7 MetricXポイント、ASQAの8.1 ROUGE-L、トピックの要約の2.2 ROUGE-Lの改善を実現している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 00:50:55 GMT)
Lessons from Formally Verified Deployed Software Systems (Extended version) [65.7] 本稿は、正式に認証されたシステムを作成し、実際に使用するためにデプロイした各種のアプリケーション分野のプロジェクトについて検討する。
使用する技術、適用の形式、得られた結果、そしてソフトウェア産業が形式的な検証技術やツールの恩恵を受ける能力について示すべき教訓を考察する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 22:01:48 GMT)
Large Language Models are Effective Text Rankers with Pairwise Ranking Prompting [65.0] Pairwise Ranking Prompting (PRP)は、大規模言語モデル(LLM)の負担を大幅に軽減する手法である。
本研究は,中等級のオープンソースLCMを用いた標準ベンチマークにおいて,最先端のランク付け性能を達成した文献としては初めてである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:59:09 GMT)
MagicLens: Self-Supervised Image Retrieval with Open-Ended Instructions [64.9] オープンエンド命令をサポートする自己教師付き画像検索モデルであるMagicLensを紹介する。
MagicLensは、重要な新しい洞察に基づいて構築されている。同じWebページで自然に起こるイメージペアは、幅広い暗黙の関係を含んでいる。
従来のSOTA(State-of-the-art)手法よりも、様々な画像検索タスクの8つのベンチマークで同等またはより良い結果が得られる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:59:20 GMT)
Finding needles in a haystack: A Black-Box Approach to Invisible Watermark Detection [62.4] WaterMark Detection (WMD) は、ブラックボックスとアノテーションなしの設定下で最初に目に見えない透かし検出法である。
我々はオフセット学習の基礎を用いてWMDを開発し、クリーンな非透かしデータセットにより、透かしサンプルのみの影響を分離することができる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:30:25 GMT)
Is Synthetic Image Useful for Transfer Learning? An Investigation into Data Generation, Volume, and Utilization [62.2] ブリッジドトランスファー(ブリッジドトランスファー)と呼ばれる新しいフレームワークを導入する。このフレームワークは、当初、トレーニング済みモデルの微調整に合成画像を使用し、転送性を向上させる。
合成画像と実画像のスタイルアライメントを改善するために,データセットスタイルの逆変換方式を提案する。
提案手法は10の異なるデータセットと5つの異なるモデルで評価され、一貫した改善が示されている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 22:25:05 GMT)
Test-Time Domain Generalization for Face Anti-Spoofing [60.9] Face Anti-Spoofing (FAS) は、顔認識システムをプレゼンテーション攻撃から保護するために重要である。
本稿では,テストデータを活用してモデルの一般化性を高める新しいテスト時間領域一般化フレームワークについて紹介する。
テスト時間スタイル投影 (TTSP) とディバーススタイルシフトシミュレーション (DSSS) によって構成された本手法は, 目に見えないデータを領域空間に効果的に投影する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:50:23 GMT)
ACT-Diffusion: Efficient Adversarial Consistency Training for One-step Diffusion Models [59.9] 整合性トレーニング損失の最適化は,目標分布と生成分布とのワッサーシュタイン距離を最小化することを示す。
CIFAR10 と ImageNet 64$times$64 と LSUN Cat 256$times$256 データセットの FID スコアを改善する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:59:06 GMT)
ProTeCt: Prompt Tuning for Taxonomic Open Set Classification [59.6] 分類学的オープンセット(TOS)設定では、ほとんどショット適応法はうまくいきません。
本稿では,モデル予測の階層的一貫性を校正する即時チューニング手法を提案する。
次に,階層整合性のための新しいPrompt Tuning(ProTeCt)手法を提案し,ラベル集合の粒度を分類する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 05:35:46 GMT)
Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language Models through Question Complexity [59.6] Retrieval-augmented Large Language Models (LLMs) は、質問回答(QA)のようなタスクにおける応答精度を高めるための有望なアプローチとして登場した。
本稿では,クエリの複雑さに基づいて,LLMの最適戦略を動的に選択できる適応型QAフレームワークを提案する。
オープンドメインのQAデータセットを用いて、複数のクエリの複雑さを網羅し、QAシステムの全体的な効率性と精度を高めることを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 06:45:11 GMT)
Mitigating Misleading Chain-of-Thought Reasoning with Selective Filtering [59.5] 大規模言語モデルは、複雑な問題を解くためにチェーン・オブ・ソート(CoT)推論技術を活用することで、顕著な能力を示した。
本稿では,選択フィルタリング推論(SelF-Reasoner)と呼ばれる新しい手法を提案する。
SelF-ReasonerはScienceQA、ECQA、LastLetterタスクに対して、微調整されたT5ベースラインを一貫して改善する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 06:28:35 GMT)
SubjectDrive: Scaling Generative Data in Autonomous Driving via Subject Control [59.2] 我々は、自動走行アプリケーションの改善を継続的に行う方法で、生成データ生産を拡大することが証明された最初のモデルであるSubjectDriveを提案する。
本研究では, 多様なデータを生成するために, 多様な外部データソースを活用可能な, 主観制御機構を備えた新しいモデルを開発する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:07:13 GMT)
Learned representation-guided diffusion models for large-image generation [58.2] 自己教師型学習(SSL)からの埋め込みを条件とした拡散モデルを訓練する新しいアプローチを導入する。
我々の拡散モデルは、これらの特徴を高品質な病理組織学およびリモートセンシング画像に投影することに成功した。
実画像のバリエーションを生成して実データを増やすことにより、パッチレベルおよび大規模画像分類タスクの下流精度が向上する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:07:38 GMT)
Transcending Forgery Specificity with Latent Space Augmentation for Generalizable Deepfake Detection [57.6] LSDAと呼ばれる簡易で効果的なディープフェイク検出器を提案する。
より多様な偽の表現は、より一般化可能な決定境界を学べるべきである。
提案手法は驚くほど有効であり, 広く使用されている複数のベンチマークで最先端の検出器を超越することを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:25:51 GMT)
A diverse Multilingual News Headlines Dataset from around the World [57.4] Babel Briefingsは、2020年8月から2021年11月までの470万のニュースの見出しを、世界中の30の言語と54の場所にわたって掲載した、新しいデータセットである。
言語モデルのトレーニングや評価のための高品質なデータセットとして機能し、単純でアクセスしやすい記事のコレクションを提供する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:08:39 GMT)
Detoxifying Large Language Models via Knowledge Editing [57.1] 本稿では,Large Language Models (LLM) のデトックス化のための知識編集手法について検討する。
我々は、強力な攻撃プロンプトを持つ9つの安全でないカテゴリをカバーするベンチマーク、SafeEditを構築した。
いくつかの知識編集手法を用いて実験を行い、知識編集がLLMを効率的に解毒する可能性を示唆した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:24:17 GMT)
Natural Language Processing for Dialects of a Language: A Survey [56.9] 最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットに対するNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:47:46 GMT)
X-MIC: Cross-Modal Instance Conditioning for Egocentric Action Generalization [56.8] 我々はX-MICと呼ぶクロスモーダル適応フレームワークを提案する。
私たちのパイプラインは、凍結したテキストの埋め込みを、共有された埋め込み空間内で、それぞれのエゴセントリックなビデオにアライメントすることを学びました。
これにより、各エゴセントリックビデオへのテキスト埋め込みのアライメントが向上し、データセットの一般化が大幅に向上する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:45:35 GMT)
Syntactic Language Change in English and German: Metrics, Parsers, and Convergences [56.5] 本論文は,過去160年間の議会討論のコーパスを用いて,英語とドイツ語の統語的言語変化のダイアクロニックな傾向を考察する。
私たちは、広く使われているStanford Coreと、新しい4つの選択肢を含む5つの依存関係をベースとしています。
文長分布の尾部では,構文的尺度の変化が頻繁であることが明らかとなった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:16:28 GMT)
Data-Adaptive Tradeoffs among Multiple Risks in Distribution-Free Prediction [55.8] しきい値とトレードオフパラメータが適応的に選択された場合、リスクの有効な制御を可能にする手法を開発する。
提案手法は単調なリスクとほぼ単調なリスクをサポートするが,それ以外は分布的な仮定はしない。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:28:06 GMT)
Appeal: Allow Mislabeled Samples the Chance to be Rectified in Partial Label Learning [55.5] 部分ラベル学習(PLL)では、各インスタンスは候補ラベルのセットに関連付けられ、そのうち1つだけが接地真実である。
誤記されたサンプルの「アペアル」を支援するため,最初の魅力に基づくフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 04:46:19 GMT)
Sparse Feature Circuits: Discovering and Editing Interpretable Causal Graphs in Language Models [55.2] 本稿ではスパース特徴回路の発見と適用方法を紹介する。
これらは言語モデルの振る舞いを説明するための人間の解釈可能な特徴の因果関係の著作である。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:56:07 GMT)
GaussianCube: Structuring Gaussian Splatting using Optimal Transport for 3D Generative Modeling [55.1] 3次元ガウス散乱(GS)は3次元適合率とレンダリング速度の点でニューラルレイディアンス場よりも大幅に改善されている。
散在したガウス群によるこの非構造表現は、生成的モデリングにとって重要な課題である。
本稿では,GaussianCubeについて紹介する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:59:50 GMT)
Subjective-Aligned Dataset and Metric for Text-to-Video Quality Assessment [54.0] 現在までに最大規模のテキスト・ビデオ品質評価データベース(T2VQA-DB)を構築している。
データセットは、9つの異なるT2Vモデルによって生成される1万のビデオで構成されている。
主観的テキスト・ビデオ品質評価(T2VQA)のためのトランスフォーマーに基づく新しいモデルを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:04:51 GMT)
LocCa: Visual Pretraining with Location-aware Captioners [53.9] 位置認識キャプタ(LocCa)を用いた簡易な視覚前訓練法を提案する。
LocCaは単純なイメージキャプタタスクインターフェースを使用して、リッチな情報を読み取るモデルを教える。
エンコーダ・デコーダアーキテクチャのマルチタスク機能により、プレトレーニング中に画像キャプタが容易に複数のタスクを処理できることが示される。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:20:39 GMT)
RecDiffusion: Rectangling for Image Stitching with Diffusion Models [53.8] 画像縫合整形のための新しい拡散学習フレームワーク textbfRecDiffusion を提案する。
このフレームワークは運動拡散モデル(MDM)を組み合わせて運動場を生成し、縫合された画像の不規則な境界から幾何学的に修正された中間体へ効果的に遷移する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 06:22:45 GMT)
CDIMC-net: Cognitive Deep Incomplete Multi-view Clustering Network [53.7] 我々は,認知的深層不完全多視点クラスタリングネットワーク(CDIMC-net)という,新しい不完全多視点クラスタリングネットワークを提案する。
ビュー固有のディープエンコーダとグラフ埋め込み戦略をフレームワークに組み込むことで、各ビューの高レベルな特徴とローカル構造をキャプチャする。
人間の認知、すなわち、簡単からハードに学ぶことに基づいて、モデルトレーニングのための最も自信あるサンプルを選択するための自己評価戦略を導入する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:45:03 GMT)
GlORIE-SLAM: Globally Optimized RGB-only Implicit Encoding Point Cloud SLAM [53.6] フレキシブルなニューラルポイントクラウド表現シーンを用いたRGBのみの高密度SLAMシステムを提案する。
また,単分子深度とともに暗黙のポーズと深さを最適化する新しいDSPO層を導入する。
我々のシステムは、Replica、TUM-RGBD、ScanNetデータセットの追跡、レンダリング、正確性において、既存の高密度ニューラルネットワークRGB SLAM手法により良い、あるいは競争力がある。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:32:06 GMT)
MVEB: Self-Supervised Learning with Multi-View Entropy Bottleneck [53.4] 自己監督的アプローチは、画像の2つのビューを入力と自己監督的信号の両方とみなす。
近年の研究では、ビュー間で共有されていない過剰な情報を捨てることにより、一般化が促進されることが示されている。
目的とする多視点エントロピー・ボトルネック(MVEB)を提案し,最小限の表現を効果的に学習する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 00:50:02 GMT)
Uncertainty Quantification for In-Context Learning of Large Language Models [52.9] 大規模言語モデル(LLM)の画期的な能力として、文脈内学習が登場している。
両タイプの不確かさを定量化するための新しい定式化法とそれに対応する推定法を提案する。
提案手法は、プラグイン・アンド・プレイ方式でコンテキスト内学習の予測を理解するための教師なしの方法を提供する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:41:34 GMT)
TableLLM: Enabling Tabular Data Manipulation by LLMs in Real Office Usage Scenarios [52.7] 我々は13億のパラメータを持つ堅牢な大規模言語モデル(LLM)であるTableLLMを紹介する。
本稿では,推論プロセス拡張戦略を含む遠隔トレーニングのための遠隔監視手法を提案する。
我々は、ユーザインタラクションのためのモデルチェックポイント、ソースコード、ベンチマーク、Webアプリケーションを公開した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:21:12 GMT)
NativE: Multi-modal Knowledge Graph Completion in the Wild [51.8] 本研究では,MMKGCを実現するための包括的フレームワークNativEを提案する。
NativEは、任意のモダリティに対して適応的な融合を可能にするリレーショナル誘導デュアルアダプティブフュージョンモジュールを提案する。
提案手法を評価するために,5つのデータセットを用いたWildKGCという新しいベンチマークを構築した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:04:00 GMT)
Mesh2NeRF: Direct Mesh Supervision for Neural Radiance Field Representation and Generation [51.3] Mesh2NeRFは、3次元生成タスクのためのテクスチャメッシュから地上構造放射場を導出するアプローチである。
各種タスクにおけるMesh2NeRFの有効性を検証する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:22:53 GMT)
Echo-chambers and Idea Labs: Communication Styles on Twitter [51.1] 本稿では,ワクチン接種状況におけるTwitter(X)コミュニティのコミュニケーション形態と構造について検討する。
本研究は,ソーシャルネットワークにおけるコミュニケーションの微妙な性質に光を当てることによって,オンラインコミュニティにおける視点の多様性を理解することの重要性を強調する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:55:51 GMT)
Enhancing Trust and Privacy in Distributed Networks: A Comprehensive Survey on Blockchain-based Federated Learning [51.1] ブロックチェーンのような分散型アプローチは、複数のエンティティ間でコンセンサスメカニズムを実装することで、魅力的なソリューションを提供する。
フェデレートラーニング(FL)は、参加者がデータのプライバシを保護しながら、協力的にモデルをトレーニングすることを可能にする。
本稿では,ブロックチェーンのセキュリティ機能とFLのプライバシ保護モデルトレーニング機能の相乗効果について検討する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:08:26 GMT)
UFineBench: Towards Text-based Person Retrieval with Ultra-fine Granularity [50.9] 既存のテキストベースの人物検索データセットは、しばしば比較的粗い粒度のテキストアノテーションを持つ。
これにより、実際のシナリオにおけるクエリテキストのきめ細かいセマンティクスを理解するモデルが妨げられます。
我々は,超微細な人物検索のためにtextbfUFineBench という新しいベンチマークを作成した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:09:07 GMT)
Towards a Brazilian History Knowledge Graph [50.3] ブラジル歴史辞典(DHBB)とウィキペディア/ウィキデータに基づくブラジルの歴史に関する知識グラフを構築した。
DHBBに記述されている多くの用語/エンティティがWikidataに対応する概念(またはQ項目)を持っていないことを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 22:05:32 GMT)
Noisy-Correspondence Learning for Text-to-Image Person Re-identification [50.1] 本稿では,雑音対応においても頑健な視覚関係を学習するための新しいロバスト二重埋め込み法(RDE)を提案する。
提案手法は,3つのデータセット上での合成ノイズ対応と非合成ノイズ対応を両立させる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:16:11 GMT)
Toward a Theory of Causation for Interpreting Neural Code Models [49.9] 本稿では,ニューラルコードモデル(NCM)に特化したポストホック解釈法である$do_code$を紹介する。
$do_code$は、言語指向の説明を可能にする因果推論に基づいている。
その結果,NCMはコード構文の変化に敏感であることが判明した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 01:36:14 GMT)
EthioMT: Parallel Corpus for Low-resource Ethiopian Languages [49.8] 15言語用の新しい並列コーパスであるEthioMTを紹介する。
また、エチオピアのより優れた言語のためのデータセットを収集して、新しいベンチマークを作成する。
トランスフォーマーと微調整手法を用いて,新たに収集したコーパスと23のエチオピア語に対するベンチマークデータセットを評価した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:26:45 GMT)
Data Poisoning for In-context Learning [49.8] In-context Learning (ICL)は、新しいタスクに適応する革新的な能力として認識されている。
本論文は、ICLのデータ中毒に対する感受性の重大な問題について述べる。
ICLの学習メカニズムを活用するために考案された特殊攻撃フレームワークであるICLPoisonを紹介する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 01:42:08 GMT)
A Corpus for Sentence-level Subjectivity Detection on English News Articles [49.5] 我々はこのガイドラインを用いて、議論を呼んだ話題に関する英ニュース記事から抽出した638の目的語と411の主観的な文からなるNewsSD-ENGを収集する。
我々のコーパスは、語彙や機械翻訳といった言語固有のツールに頼ることなく、英語で主観的検出を行う方法を舗装している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:27:01 GMT)
InterGen: Diffusion-based Multi-human Motion Generation under Complex Interactions [49.1] 動作拡散プロセスに人間と人間の相互作用を組み込んだ効果的な拡散ベースアプローチであるInterGenを提案する。
我々はまず、InterHumanという名前のマルチモーダルデータセットをコントリビュートする。これは、様々な2人インタラクションのための約107Mフレームで構成され、正確な骨格運動と23,337の自然言語記述を持つ。
本稿では,世界規模での2人のパフォーマーのグローバルな関係を明示的に定式化した対話拡散モデルにおける動作入力の表現を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:15:57 GMT)
Text2Loc: 3D Point Cloud Localization from Natural Language [49.0] 我々は,いくつかの言語学的記述に基づく3次元点群局所化の問題に取り組む。
我々は,ポイントとテキスト間の意味的関係を完全に解釈する新しいニューラルネットワークText2Locを導入する。
Text2Locは、KITTI360Poseデータセットの最先端技術に対して最大2倍のローカライゼーション精度を向上する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:31:05 GMT)
Towards Generalizable Tumor Synthesis [48.5] 腫瘍合成は、医用画像における人工腫瘍の作成を可能にし、腫瘍の検出とセグメンテーションのためのAIモデルのトレーニングを容易にする。
本論文は, 臨界観察を生かして, 一般化可能な腫瘍合成に向けて進歩的な一歩を踏み出した。
私たちは、Diffusion Modelsのような生成AIモデルが、単一の臓器から限られた数の腫瘍例を訓練しても、様々な臓器に一般化された現実的な腫瘍を作成できることを確認した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:52:45 GMT)
NaviNeRF: NeRF-based 3D Representation Disentanglement by Latent Semantic Navigation [48.1] 3D表現のゆがみは、3Dデータの基本的な説明因子を特定し、分解し、操作することを目的としている。
NeRFは生成するNeRFパイプライン上に構築されており、アウターナビゲーションブランチとインナーリファインメントブランチを備えている。
NaviNeRFは、従来の3D対応モデルよりもきめ細かい3Dディスタングル能力が優れている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:20:19 GMT)
Retrieval-Enhanced Knowledge Editing for Multi-Hop Question Answering in Language Models [47.2] 大規模言語モデル(LLM)は質問応答タスクの習熟度を示しているが、しばしばリアルタイム知識更新の統合に苦慮している。
マルチホップ質問応答に適したRetrieval-Augmented Model Editing (RAE) フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:47:19 GMT)
Within the Dynamic Context: Inertia-aware 3D Human Modeling with Pose Sequence [47.2] 本研究では、現在のフレームのポーズ状態だけでなく、過去のポーズ状態にも人間の外観の変化が依存していることを明らかにする。
非剛性変形に対するデルタポーズシーケンス表現を利用した新しい手法であるDycoを導入する。
さらに, 慣性を考慮した3次元人間の手法は, 異なる速度での慣性による外観変化を前例なくシミュレートすることができる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 06:05:14 GMT)
MemoNav: Working Memory Model for Visual Navigation [47.0] イメージゴールナビゲーションは、不慣れな環境でイメージによって示されるゴールにエージェントがナビゲートする必要がある、困難なタスクである。
様々な場面の記憶を利用する既存の手法は、すべての歴史的観察を意思決定に用いているため、非効率な探索に苦しむ。
動作メモリにインスパイアされたパイプラインを用いてナビゲーション性能を向上させる,イメージゴールナビゲーションのための新しいメモリモデルであるMemoNavを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 04:07:57 GMT)
Cycling on the Freeway: The Perilous State of Open Source Neuroscience Software [46.8] 既存の神経科学オープンソースソフトウェアのエコシステムは不安定である、と我々は主張する。
近年、神経科学データ分析のためのフリーのオープンソース科学ソフトウェア(FOSSS)への依存がシフトしている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:11:09 GMT)
Compositional Chain-of-Thought Prompting for Large Multimodal Models [46.7] CCoT(コンポジション・チェーン・オブ・ソート)は、新規なゼロショット・オブ・ソート・プロンプト法である。
まず,Large Language Model(LLM)を用いてSGを生成し,そのSGをプロンプトに使用して応答を生成する。
提案手法は,LMMの性能向上だけでなく,一般的なマルチモーダルベンチマーク上でのLMMの性能向上にも寄与する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 23:02:27 GMT)
SineNet: Learning Temporal Dynamics in Time-Dependent Partial Differential Equations [46.2] 本稿では、複数の連続接続されたU字型ネットワークブロックからなるSineNetを提案する。
SineNetでは、高解像度の機能は、複数のステージを通じて徐々に進化し、各ステージ内でのミスアライメントの量を減らす。
提案手法は,Navier-Stokes方程式や浅水方程式など,複数のPDEデータセット上で厳密に検証されている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:41:41 GMT)
HGT: Leveraging Heterogeneous Graph-enhanced Large Language Models for Few-shot Complex Table Understanding [45.9] HGTは,多種性グラフ(HG)を拡張した大規模言語モデル(LLM)を用いて,数発のTUタスクに対処するフレームワークである。
我々はHGTの有効性を実証的に実証し、いくつかのベンチマークで数発の複雑なTUに対してSOTAよりも優れていることを示した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:20:54 GMT)
An Interactive Human-Machine Learning Interface for Collecting and Learning from Complex Annotations [45.2] 我々は,従来のラベルの制約にヒトのアノテータが適応するという期待を緩和するために,監視情報が収集される形で,さらなる柔軟性を実現することを目的としている。
そこで本研究では,データセットのアノテーションとして標準バイナリラベルを補完するために,ヒューマンアノテータによる実例の活用を可能にする,バイナリ分類タスクのためのヒューマンマシン学習インタフェースを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:57:06 GMT)
Break-for-Make: Modular Low-Rank Adaptations for Composable Content-Style Customization [45.2] コンテンツとスタイルのパラメータ空間を分離する学習フレームワークを提案する。
提案手法は,コンテンツスタイルとプロンプトのアライメントの観点から,最先端のシングル/マルチコンセプト学習パイプラインより優れている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:27:36 GMT)
AIpom at SemEval-2024 Task 8: Detecting AI-produced Outputs in M4 [44.8] AIpomは人書きテキストと機械生成テキストの境界を検出するように設計されている。
命令調整されたデコーダのみのモデルとシーケンスタグの予測を組み合わせた2段階パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:10:30 GMT)
RELI11D: A Comprehensive Multimodal Human Motion Dataset and Method [44.7] 本稿では、LiDAR、IMUシステム、RGBカメラ、イベントカメラを含む高品質なマルチモーダルヒューマンモーションデータセットRELI11Dを提案する。
3.32時間の同期したLiDAR点雲、IMU計測データ、RGBビデオ、イベントスチームを含む7つのシーンで5つのスポーツを行う10人の俳優の動きを記録している。
そこで我々は,LiDAR Point Cloud, Event Stream, RGBを効果的に活用するマルチモーダルベースラインであるLEIRを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:31:36 GMT)
To Whom are You Talking? A Deep Learning Model to Endow Social Robots with Addressee Estimation Skills [44.5] 本研究では,話者からの非言語的身体的手がかりを解釈し,活用することにより,発話者の宛先を理解する能力である宛先推定の問題に取り組む。
本研究では,話者の顔と身体姿勢の2次元ベクトルを表現した入力画像として,畳み込み層とLSTMセルからなるハイブリッドディープラーニングモデルを実装する。
我々は,ロボットの自我中心の視点から,空間におけるアドレスの局所化の観点から,我々のモデルがアドレス推定問題を解くことができることを示した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:26:50 GMT)
CLoRA: A Contrastive Approach to Compose Multiple LoRA Models [44.0] Low-Rank Adaptations (LoRA) は画像生成の分野で強力で一般的な技術として登場した。
CLoRAは、複数の概念をシームレスにブレンドして、さまざまな概念を1つのイメージでキャプチャする問題に対処する。
本手法は,LoRAの特性を反映した合成画像の作成を可能にする。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:58:43 GMT)
SpecNeRF: Gaussian Directional Encoding for Specular Reflections [43.1] 近接場照明条件下でのビュー依存効果をより良くモデル化するための学習可能なガウス方向符号化法を提案する。
我々の新しい指向性符号化は、近接場照明の空間的に変化する性質を捉え、事前フィルタされた環境マップの挙動をエミュレートする。
これにより、粗さ係数の異なる任意の3次元位置において、事前変換された明色を効率よく評価することができる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:13:53 GMT)
Can 3D Vision-Language Models Truly Understand Natural Language? [42.7] 既存の3D-VLモデルは言語入力のスタイルに敏感であり、同じ意味を持つ文を理解するのに苦労するが、異なる変種で書かれる。
本稿では,様々なタスクにまたがって3D-VLモデルを体系的に評価し,異なる言語スタイルのバリエーションを提示した場合のパフォーマンスをベンチマークする言語頑健性タスクを提案する。
包括的評価により,様々な3D-VLタスクにまたがる既存モデルの性能低下が明らかとなった。
最先端の3D-LLMでさえ、同じ文の変種を理解することができない。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:46:49 GMT)
GaussianAvatars: Photorealistic Head Avatars with Rigged 3D Gaussians [41.4] 本稿では,表現,ポーズ,視点の面で完全に制御可能な光現実的頭部アバターを作成するための新しい手法を提案する。
中心となる考え方は、3次元ガウスのスプレートをパラメトリックな形態素面モデルに組み込んだ動的3次元表現である。
我々は、いくつかの挑戦的なシナリオにおいて、フォトリアリスティックアバターのアニメーション能力を実演する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:51:05 GMT)
WinSyn: A High Resolution Testbed for Synthetic Data [41.1] 我々は、手続き的モデリング技術を用いて高品質な合成データを作成するためのユニークなデータセットとテストベッドであるWinSynを紹介する。
このデータセットには、世界中の場所から選抜された高解像度の窓の写真が含まれており、89,318の個々の窓作物は、多様な幾何学的特徴と材料的特性を示している。
合成画像と実画像の両方で意味的セグメンテーションネットワークを訓練し、実画像の共有テストセットでそれらの性能を比較することによって、手続きモデルを評価する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:47:42 GMT)
Genos: General In-Network Unsupervised Intrusion Detection by Rule Extraction [39.8] 異常に基づくネットワーク侵入検知システム(A-NIDS)は、教師なしモデルを用いて予期せぬ攻撃を検出する。
既存のA-NIDSソリューションは、スループットの低下、解釈可能性の欠如、メンテナンスコストの高騰に悩まされている。
我々はルール抽出による教師なしA-NIDSのための一般的なネットワーク内フレームワークGenosを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:08:45 GMT)
Efficient 3D Instance Mapping and Localization with Neural Fields [39.7] 3DIMLは、ビュー一貫性のあるインスタンスセグメンテーションマスクを生成するためにラベルフィールドを効率的に学習する新しいフレームワークである。
Replica と ScanNet のデータセットから 3DIML を推定し,画像シーケンスの軽度な仮定の下で 3DIML の有効性を実証した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:25:25 GMT)
Investigating the Emergent Audio Classification Ability of ASR Foundation Models [39.7] 本稿では,主に音声認識のために訓練された音声認識基礎モデルであるWhisperとMMSが,ゼロショット音声分類を行うことができることを示す。
以上の結果から,Whisperは8種類の音声分類データセットに対してゼロショット分類性能を示し,既存のゼロショットベースラインの精度を平均9%向上させることを示した。
さらに、モデルサイズによって性能が向上し、ASR基盤モデルがスケールアップされるにつれて、ゼロショット性能が向上する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:31:26 GMT)
Quantum machine learning for image classification [39.6] 本研究では、量子力学の原理を有効計算に活用する2つの量子機械学習モデルを紹介する。
我々の最初のモデルは、並列量子回路を持つハイブリッド量子ニューラルネットワークであり、ノイズの多い中間スケール量子時代においても計算の実行を可能にする。
第2のモデルは、クオン進化層を持つハイブリッド量子ニューラルネットワークを導入し、畳み込みプロセスによる画像の解像度を低下させる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:36:50 GMT)
MILL: Mutual Verification with Large Language Models for Zero-Shot Query Expansion [39.2] 本稿では,大規模言語モデル(LLM)を相互検証に用いるゼロショットクエリ拡張フレームワークを提案する。
提案手法は完全にゼロショットであり,その有効性を示すために3つの公開ベンチマークデータセットに関する広範な実験を行った。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 06:49:56 GMT)
OAKINK2: A Dataset of Bimanual Hands-Object Manipulation in Complex Task Completion [39.1] OAKINK2は、複雑な日常活動のための双方向オブジェクト操作タスクのデータセットである。
操作タスクを整理する3つのレベルの抽象化が導入されている。
OakINK2データセットは、人体、手、さまざまな相互作用するオブジェクトに対して、マルチビューの画像ストリームと正確なポーズアノテーションを提供する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:47:19 GMT)
Instance-Adaptive and Geometric-Aware Keypoint Learning for Category-Level 6D Object Pose Estimation [38.0] カテゴリーレベルの6Dオブジェクトのポーズ推定は、特定のカテゴリ内の見えないインスタンスの回転、翻訳、サイズを推定することを目的としている。
カテゴリレベルの6次元オブジェクトポーズ推定(AG-Pose)のための新しいインスタンス適応型および幾何学的キーポイント学習法を提案する。
提案した AG-Pose は、カテゴリー固有の形状の先行を伴わず、最先端の手法よりも大きなマージンで性能を向上する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:02:03 GMT)
From Activation to Initialization: Scaling Insights for Optimizing Neural Fields [37.5] 本稿では、初期化とアクティベーションの相互作用を掘り下げ、ニューラルネットワークの堅牢な最適化の基礎となることを目的としている。
ネットワークの初期化, アーキテクチャの選択, 最適化プロセスの深い関係を理論的考察により明らかにし, 最先端のニューラルフィールドの設計において, 全体的アプローチの必要性を強調した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:06:48 GMT)
Multi-Agent Diagnostics for Robustness via Illuminated Diversity [37.4] 発光ダイバーシティ(MADRID)によるロバストネスのマルチエージェント診断法を提案する。
MADRIDは、事前訓練されたマルチエージェントポリシーの戦略的脆弱性を明らかにする様々な敵シナリオを生成する。
我々は,Google Research Footballの11vs11バージョンにおけるMADRIDの有効性を評価する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 22:24:30 GMT)
Self-Discovering Interpretable Diffusion Latent Directions for Responsible Text-to-Image Generation [36.9] 拡散モデルによるリスクは、バイアスや有害な画像などの不適切なコンテンツの潜在的な生成である。
これまでの研究は、拡散モデルの解釈可能な潜在空間におけるベクトルを意味論的概念として解釈する。
本稿では,ある概念に対する解釈可能な潜在方向を見つけるための,新たな自己教師型アプローチを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:58:59 GMT)
WaterJudge: Quality-Detection Trade-off when Watermarking Large Language Models [36.9] 本稿では, フレキシブルなNLG評価フレームワークである比較評価を, 特定の透かし設定による品質劣化を評価するための簡易解析フレームワークを提案する。
われわれのフレームワークは、透かし設定の品質-検出トレードオフを簡単に可視化できることを実証する。
このアプローチは2つの異なる要約システムと翻訳システムに適用され、タスクのクロスモデル解析とクロスタスク解析を可能にした。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:28:38 GMT)
Jamba: A Hybrid Transformer-Mamba Language Model [36.5] 本稿では,新しいハイブリッドなTransformer-Mamba混在型アーキテクチャに基づく,新しいベースとなる大規模言語モデルであるJambaを紹介する。
JambaはTransformer層とMamba層のブロックをインターリーブし、両方のモデルファミリーの利点を享受する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 23:55:06 GMT)
SCALE: Constructing Structured Natural Language Comment Trees for Software Vulnerability Detection [36.4] 本稿では,事前学習モデルに基づく構造化自然言語コメント木に基づくvulnerAbiLity dEtectionフレームワークを提案する。
提案したStructured Natural Language Comment Tree (SCT)は、コードステートメントのセマンティクスとコード実行シーケンスを統合する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 02:20:03 GMT)
Dual-Personalizing Adapter for Federated Foundation Models [35.9] そこで我々は,テストタイムのパーソナライゼーション(test-time personalization)という新たな設定を提案し,対象とするローカルタスクに集中し,テストタイムの分散シフトを示すタスクに拡張する。
具体的には、グローバルアダプタとテスト時間分散シフトとパーソナライズに対処するローカルアダプタからなる、二重対人アダプタアーキテクチャ(FedDPA)を提案する。
提案手法の有効性を,異なるNLPタスクのベンチマークデータセットを用いて評価した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:19:33 GMT)
Policy Bifurcation in Safe Reinforcement Learning [35.8] いくつかのシナリオでは、実行可能なポリシーは不連続または多値であり、不連続な局所最適性の間の補間は必然的に制約違反につながる。
我々は,このような現象の発生機構を最初に同定し,安全RLにおける分岐の存在を厳密に証明するためにトポロジカル解析を用いる。
本稿では,ガウス混合分布をポリシ出力として利用するマルチモーダルポリシ最適化(MUPO)と呼ばれる安全なRLアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:46:02 GMT)
Multi-Antenna Dual-Blind Deconvolution for Joint Radar-Communications via SoMAN Minimization [35.5] セキュアな軍事受信機のような合同レーダー通信(JRC)アプリケーションでは、受信信号にレーダーと通信信号がオーバーレイされることが多い。
これらの受動的聴取基地では、レーダと通信の両方の信号とチャネルが受信機に未知である。
オーバーレイド信号から全ての信号とチャネルパラメータを復元する不適切な問題は、テキスト・ブラインド・デコンボリューション(DBD)と呼ばれる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 20:55:01 GMT)
Warm-Starting and Quantum Computing: A Systematic Mapping Study [35.2] 量子コンピューティング領域におけるウォームスタート技術に関する科学文献の収集と分析を行う。
量子ソフトウェア技術者がウォームスタートテクニックを分類し、実際に適用できるようにすることを目標としています。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:15:57 GMT)
Synthetic Medical Imaging Generation with Generative Adversarial Networks For Plain Radiographs [35.0] 本研究の目的は、再利用可能なオープンソースの合成画像生成パイプラインであるGAN画像合成ツール(GIST)を開発することである。
このパイプラインは、特定の患者に関連付けられていない高品質な合成画像データを生成することによって、デジタルヘルス空間におけるAIアルゴリズムの改善と標準化を支援する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 02:51:33 GMT)
Nonsmooth Implicit Differentiation: Deterministic and Stochastic Convergence Rates [34.8] パラメトリックな非微分可縮写像の固定点の微分を効率的に計算する問題について検討する。
我々は、反復的分化(ITD)と近似的暗黙的分化(AID)の2つの一般的なアプローチを分析する。
NSIDは、不偏推定器を通してのみアクセス可能な外部マップと内マップの合成として固定点が定義されるとき、導関数を計算するための新しい方法である。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:56:05 GMT)
MMCert: Provable Defense against Adversarial Attacks to Multi-modal Models [34.8] 我々は,マルチモーダルモデルに対する敵攻撃に対する最初の認証された防御であるMCCertを提案する。
我々は,マルチモーダル道路セグメンテーションタスクとマルチモーダル道路セグメンテーションタスクと,マルチモーダル感情認識タスクの2つのベンチマークデータセットを用いて,MCCertを評価した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 01:05:06 GMT)
TOD3Cap: Towards 3D Dense Captioning in Outdoor Scenes [34.7] 屋外3次元高密度キャプションの新たな課題について紹介する。
この課題に対処するために,BEV表現を利用してオブジェクトボックスの提案を生成するTOD3Capネットワークを提案する。
また、TOD3Capデータセットを導入し、850シーンから64.3Kの屋外オブジェクトを2.3Mで記述した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:12:55 GMT)
Manifold Constraint Regularization for Remote Sensing Image Generation [34.7] GAN(Generative Adversarial Networks)は、リモートセンシング領域における顕著な成果を示している。
本稿では,リモートセンシング画像の特徴を分析し,多様体制約正規化を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:51:37 GMT)
ShapeFusion: A 3D diffusion model for localized shape editing [34.5] 本研究では,任意の形状領域の局所的な操作を容易にする効果的な拡散マスキングトレーニング戦略を提案する。
現在の最先端技術と比較して、我々の手法は遅延コード状態に依存する方法よりも解釈可能な形状操作をもたらす。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:50:19 GMT)
Model Stock: All we need is just a few fine-tuned models [34.4] 本稿では,大規模な事前学習モデルに対する効率的な微調整手法を提案し,強力な分布内分散(ID)と分布外分散(OOD)性能を提供する。
最終的な重量を達成するために、はるかに少ないモデルを採用するが、精度は優れている。
事前学習型CLIPアーキテクチャに基づく微調整モデルを用いたモデルストックの有効性を示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:57:20 GMT)
DreamSalon: A Staged Diffusion Framework for Preserving Identity-Context in Editable Face Generation [34.4] 私たちはDreamSalonを紹介します。
詳細な画像操作とアイデンティティ・コンテキスト保存に重点を置いている。
実験では、ドリームサロンが人間の顔の細部を効率よく忠実に編集する能力を示している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:47:02 GMT)
Can Small Language Models be Good Reasoners for Sequential Recommendation? [34.1] SLIM (Step-by-step knowLedge dIstillation fraMework for recommendation)
より大規模な教師モデルのためのユーザ行動系列に基づくCoTプロンプトを導入する。
教師モデルによって生成される理論的根拠をラベルとして利用し、下流のより小さな学生モデルを蒸留する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:55:32 GMT)
SuperNOVA: Design Strategies and Opportunities for Interactive Visualization in Computational Notebooks [34.0] ノートブックの対話型可視化ツール163について分析する。
重要な設計上の意味とトレードオフを特定します。
我々は、研究者が既存のノートブック視覚化ツールを探索するのに役立つオープンソースのインタラクティブブラウザであるSuperNOVAを開発した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:51:55 GMT)
Scalable Diffusion Models with State Space Backbone [33.9] 拡散状態空間モデルは、時間、条件、ノイズの多いイメージパッチを含む全ての入力をトークンとして扱う。
我々はGflopsのフォワードパス複雑性によって測定されたDiSのスケーラビリティを解析する。
遅延空間におけるDiS-H/2モデルは、クラス条件のImageNetベンチマークにおける事前拡散モデルと同様のパフォーマンスレベルを達成する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:28:44 GMT)
Efficient and Effective Weakly-Supervised Action Segmentation via Action-Transition-Aware Boundary Alignment [33.7] 弱教師付きアクションセグメンテーションは、長いビデオを複数のアクションセグメンテーションに分割する学習である。
既存の手法の多くは、すべてのフレームと転写文間のシリアルアライメントによるトレーニングのために擬似セグメンテーションを推論する必要がある。
本稿では,雑音境界を効果的かつ効果的にフィルタリングし,遷移を検出する新しい行動遷移対応境界アライメントフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:39:44 GMT)
All-in-One: Heterogeneous Interaction Modeling for Cold-Start Rating Prediction [33.1] 異種相互作用評価ネットワーク(HIRE)と呼ばれるフレキシブルなフレームワークを提案する。
HIRE線量は、事前に定義された相互作用パターンや、手動で構築された異種情報ネットワークにのみ依存しない。
実験では,実世界の3つのデータセットに対して,3つのコールドスタート設定でモデルを評価する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 04:40:59 GMT)
Hardness of Learning Boolean Functions from Label Proportions [33.0] 近年,ラベル比率(LLP)から学習するフレームワークは,機械学習において重要性を増している。
本研究では,LLP学習ブール関数の抽出性に着目した。
最大2ドルでOR関数と整合なサイズのバッグの集合が与えられた場合、常に多くの節の CNF を見つけることはNP-hard であることが示される。
またパリティの学習可能性について研究し、$(q/2q-1 + o(1))$-fraction以上を満たすのがNPハードであることを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:24:18 GMT)
Surface-based parcellation and vertex-wise analysis of ultra high-resolution ex vivo 7 tesla MRI in neurodegenerative diseases [32.9] アルツハイマー病と関連する認知症にまたがる等方分解能の0.3mmで、82個の脳半球外T2wの1-of-in-kindデータセットを提出した。
Desikan-Killiany-Tourville (DKT) 脳のアトラスを用いて,超高分解能の生体外脳組織を母体空間分解能で解析するために,高速で使いやすく自動表面ベースパイプラインを開発した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:27:34 GMT)
STaR-GATE: Teaching Language Models to Ask Clarifying Questions [32.7] 有用な質問を生成するためにモデルに報酬を与えることにより、言語モデルがcitep[STaR;]zelikman2022starを自己改善する能力について検討する。
質問することで、textttQuestionerはtexttRoleplayerから好みを抽出する。
以上の結果から,より良い質問をするために言語モデルを教えることで,よりパーソナライズされた回答が得られることが示唆された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 05:35:22 GMT)
Multi-modal In-Context Learning Makes an Ego-evolving Scene Text Recognizer [32.7] 野生のシーンテキスト認識(STR)は、ドメインのバリエーション、フォントの多様性、形状の変形などに対処する際の課題に頻繁に遭遇する。
E$2$STRは、コンテキストに富んだシーンテキストシーケンスでトレーニングされたSTRモデルで、提案したインコンテキストトレーニング戦略を介してシーケンスを生成する。
E$2$STRは、様々なシナリオにおいて顕著なトレーニングなし適応を示し、公開ベンチマークにおける微調整された最先端のアプローチよりも優れています。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:30:56 GMT)
TOGS: Gaussian Splatting with Temporal Opacity Offset for Real-Time 4D DSA Rendering [32.4] 4次元デジタルサブトラクション血管造影(4D DSA)は、血管を充填するコントラスト剤の過程で異なる段階と角度で撮影される一連の2D画像を提供する医用イメージング技術である。
現在の手法では、スパースビューではレンダリング品質が不十分であり、レンダリング速度の遅さに悩まされている。
これらの制約を克服するために、時間とともに不透明なオフセットを持つガウススプラッティング法TOGSを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:08:58 GMT)
De-confounded Data-free Knowledge Distillation for Handling Distribution Shifts [32.1] Data-Free Knowledge Distillation (DFKD)は、従来のトレーニングデータに頼ることなく、実際のデプロイメントを強化するために、高性能な小型モデルをトレーニングする有望なタスクである。
既存の方法は、合成データやサンプルデータを利用することで、プライベートデータへの依存を避けるのが一般的である。
本稿では,このような変化の影響から学生モデルを遠ざけるために,因果推論を用いた新しい視点を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:13:22 GMT)
PointCloud-Text Matching: Benchmark Datasets and a Baseline [32.0] PointCloud-Text Matchingは、指定されたポイントクラウドクエリやテキストクエリにマッチする正確なクロスモーダルインスタンスを見つけることを目的としている。
3D2T-SR, 3D2T-NR, 3D2T-QAという3つの新しいベンチマークデータセットを構築した。
これらの課題に対処するため,Robost PointCloud-Text Matching Method (RoMa) というPTMベースラインを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:51:15 GMT)
HiRoPE: Length Extrapolation for Code Models [31.8] 階層型回転位置埋め込み(HiRoPE)について紹介する。
HiRoPEは、ソースコードの階層構造に基づいた階層形式への伝統的な回転位置埋め込みを強化する。
我々は,この分野でのさらなる開発を促進するために,現実世界のコードプロジェクトに対して,新たな長大なコード理解タスクを導入する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:11:38 GMT)
Promptly Predicting Structures: The Return of Inference [31.4] ゼロショットと少数ショットの言語構造予測器を構築するためのフレームワークを提案する。
その結果, 整合性の維持は構造的に有効であるだけでなく, 性能も向上することがわかった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:17:17 GMT)
BP4ER: Bootstrap Prompting for Explicit Reasoning in Medical Dialogue Generation [31.4] 医療対話生成(MDG)はその実質的な価値から注目を集めている。
MDG(BP4ER)における明示的推論のためのBootstrap Prompting法を提案する。
BP4ERはMDGの多段階推論プロセスを明示的にモデル化し、この推論プロセスを反復的に強化する。
2つの公開データセットの実験結果から,BP4ERは客観的および主観的評価指標の両方の観点から,最先端の手法よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:38:13 GMT)
LISA: Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning [31.1] 微調整作業におけるローランド適応 (LoRA) の層間特性について検討し, 異なる層にまたがる重みノルムの非一般的な歪さを観察する。
私たちはLayerwise Importance Sampled AdamW (LISA)と名付けました。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:44:39 GMT)
Imagination Augmented Generation: Learning to Imagine Richer Context for Question Answering over Large Language Models [30.4] 知識強化フレームワークImagination-Augmented-Generation(IAG)を提案する。
IAGは人間の能力をシミュレートし、知識不足を補うと同時に、外部リソースに頼ることなく、想像のみで質問に答える。
3つのデータセットの実験結果から、IMcQAはオープンドメインとクローズドブックの両方で大きな優位性を示すことが示された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:28:24 GMT)
Top-$k$ Classification and Cardinality-Aware Prediction [30.4] 和和と制約付き損失は、上位の$k$損失に対する$H$一貫性境界によって支持されることを示す。
本稿では、インスタンス依存型コスト依存学習を通じて、基数認識損失関数を導入する。
これらの損失を最小限に抑えることで、トップ$kの分類のための新しい濃度認識アルゴリズムが生まれる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:45:03 GMT)
Regression with Multi-Expert Deferral [30.4] 複数の専門家で予測を遅延させる学習は、学習者が複数の専門家に予測を遅延させることを選択できるフレームワークである。
本稿では、複数の専門家に予測を延期することを含む、遅延を伴う新しい回帰の枠組みを提案する。
両シナリオに新たなサロゲート損失関数を導入し,これらが$H$一貫性境界でサポートされていることを証明した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:26:38 GMT)
$H$-Consistency Guarantees for Regression [30.4] まず、以前に与えられたツールを一般化して$H$-一貫性境界を確立する新しい定理を提案する。
次に、二乗損失の損失関数を代用する新しい$H$整合境界を証明した。
我々はさらに、回帰のために$H$-consistencyを解析し、逆回帰のために原則化された代理損失を導出する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:08:51 GMT)
Learning From Correctness Without Prompting Makes LLM Efficient Reasoner [30.2] 大規模言語モデル(LLM)は様々なタスクで優れた性能を示してきたが、幻覚、不誠実な推論、有害な内容などの制限がまだ残っている。
人間のフィードバックや外部ツール,手工芸のプロンプトを不要にする,本質的な自己修正推論フレームワークをLLMに導入する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 02:12:49 GMT)
GraspXL: Generating Grasping Motions for Diverse Objects at Scale [30.1] 人間の手は、対象の特定の部分をつかんだり、望ましい方向から近づいたりするなど、多様な物体と相互作用する器用さを持っている。
近年の作業では、所望の進路方向や把握領域などの単一目的に追従する把握動作を合成している。
政策学習フレームワークGraspXLにおいて,複数の運動目標,多様な物体形状,器用な手形態にまたがる手物体把握動作の生成を統一する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:57:27 GMT)
Harmonic Self-Conditioned Flow Matching for Multi-Ligand Docking and Binding Site Design [30.0] FlowSiteはこのフローモデルを拡張して、タンパク質ポケットの離散残基タイプと分子の結合3D構造を共同で生成する。
HarmonicFlowは, ドッキングの簡易性, 汎用性, 平均試料品質の向上を図っている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:53:36 GMT)
MoDiTalker: Motion-Disentangled Diffusion Model for High-Fidelity Talking Head Generation [29.6] そこで本研究では,MoDiTalkerと呼ばれる,対話型ヘッド生成のための移動距離拡散モデルを提案する。
本稿では、音声から唇の動きを同期させるオーディオ・トゥ・モーション(AToM)と、生成された動きに追従して高品質な頭部映像を生成するモーション・トゥ・ビデオ(MToV)の2つのモジュールを紹介する。
標準ベンチマークで行った実験により,既存のモデルと比較して,本モデルが優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 04:35:42 GMT)
FMA-Net: Flow-Guided Dynamic Filtering and Iterative Feature Refinement with Multi-Attention for Joint Video Super-Resolution and Deblurring [28.6] 本稿では,高分解能ビデオと高分解能ビデオとの連成学習手法であるVSRDBを,ぼやけた低分解能ビデオから復元する手法を提案する。
本稿では,フロー誘導動的フィルタリング(FGDF)とマルチアテンション(FRMA)フレームワークを用いた反復的特徴改善を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 00:43:21 GMT)
Client-supervised Federated Learning: Towards One-model-for-all Personalization [28.6] FLシステムにおける未確認/テストクライアント上のパーソナライズされたモデルと競合する性能を達成するために,単一の堅牢なグローバルモデルのみを学習する新しいフェデレーション学習フレームワークを提案する。
具体的には、新しいクライアント監督型フェデレートラーニング(FedCS)を設計し、クライアントの潜在表現に対するバイアスを解消し、グローバルモデルがクライアント固有の知識とクライアントに依存しない知識の両方を学習できるようにする。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:29:19 GMT)
Change-Agent: Towards Interactive Comprehensive Change Interpretation and Analysis from Change Detection and Change Captioning [28.4] 現在のRSICI技術は、変更検出と変更キャプションを包含しており、それぞれに包括的な解釈を提供する限界がある。
本稿では,多段階変化解釈モデル(MCI)を眼として,大言語モデル(LLM)を脳として統合した対話型変化エージェントを提案する。
我々のChange-Agentは、ユーザ指示に従って、包括的な変更解釈と洞察に富んだ分析を実現するために、ユーザ指示に従うことができる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:55:42 GMT)
Frame by Familiar Frame: Understanding Replication in Video Diffusion Models [28.4] ビデオ生成は、その高次元の性質、トレーニングデータの不足、そして関連する複雑な関係により、より大きな課題をもたらす。
さらに制約のあるデータセットで動作するビデオ拡散モデルは、トレーニングセットからサンプルを複製する傾向にある。
本稿では,ビデオ拡散モデルにおけるサンプル複製現象の系統的研究を行う。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:15:23 GMT)
Generative Quanta Color Imaging [27.8] 本稿では,単光子カメラの単一バイナリフレームからカラー画像を生成する可能性について検討する。
我々の論文の中核的な革新は、ニューラル常微分方程式(ニューラルODE)の下でフレーム化された露光合成モデルである。
このイノベーションは、着色剤が取り掛かるバイナリイメージに一貫した露光を保証し、着色性が顕著に向上する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 00:11:12 GMT)
A Study on the Calibration of In-context Learning [27.5] In-context Learning (ICL) は静的言語モデルに適切なプロンプトで適応するための一般的な手法である。
また,ICL例の増加に伴い,モデルの誤校正が向上し,キャリブレーションの精度が向上することが確認された。
再校正手法について検討し,スケーリング結合キャリブレータが一貫した校正誤差を低減できることを見出した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:01:45 GMT)
XScale-NVS: Cross-Scale Novel View Synthesis with Hash Featurized Manifold [27.4] 実世界の大規模シーンの高忠実なクロススケールビュー合成のためのXScale-NVSを提案する。
我々は、遅延ニューラルネットワークのフレームワークと結合した新しいハッシュベースのデファチュアライズであるハッシュデファチュアライズド多様体を導入する。
提案手法は,様々な実世界のシーンにおいて競合するベースラインを著しく上回り,従来の最先端に比べて平均40%低いLPIPSが得られる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:48:16 GMT)
FedSOL: Stabilized Orthogonal Learning with Proximal Restrictions in Federated Learning [27.3] フェデレートラーニング(FL)は、個々のクライアントからローカルに訓練されたモデルを集約し、グローバルモデルを構築する。
FLは、クライアントが不均一なデータ分散を持つ場合、大きなパフォーマンス劣化に悩まされることが多い。
本稿では,地域学習とグローバル学習のバランスをとる新しい手法であるFederated Stabilized Orthogonal Learning (FedSOL)を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:23:02 GMT)
Uncover the Premeditated Attacks: Detecting Exploitable Reentrancy Vulnerabilities by Identifying Attacker Contracts [27.2] スマートコントラクトにおける悪名高い脆弱性であるReentrancyは、数百万ドルの損失をもたらしている。
現在のスマートコントラクトの脆弱性検出ツールは、永続的脆弱性を持つコントラクトを識別する上で、高い偽陽性率に悩まされている。
攻撃者の契約を識別することで、再侵入の脆弱性を検出するツールであるBlockWatchdogを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:07:23 GMT)
InterDreamer: Zero-Shot Text to 3D Dynamic Human-Object Interaction [27.1] 本稿では,テキスト・インタラクション・ペア・データを直接学習することなく,人間と物体の相互作用を生成できる可能性を示す。
人間の行動が物体の動きにどのように影響するかをモデル化し、単純な物理を理解するために設計された世界モデルを導入する。
これらのコンポーネントを統合することで、新しいフレームワークであるInterDreamerは、ゼロショット方式でテキスト整列した3D HOIシーケンスを生成することができる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:59:30 GMT)
Bright Coherent Ultrahigh Harmonics in the keV X-Ray Regime from Mid-Infrared Femtosecond Lasers [27.1] 高調波発生は、伝統的に100個の近赤外線レーザー光子を組み合わせて、明るく位相整合した極端紫外光を生成する。
ここでは, 高圧ガス中における2秒間フェムトレーザーの誘導により, 超高調波を5000のオーダーまで生成可能であることを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:10:03 GMT)
Genetic Quantization-Aware Approximation for Non-Linear Operations in Transformers [26.6] 非線型関数はトランスフォーマーとその軽量な変種で広く使われており、ハードウェアコストは大幅に過小評価されている。
従来の最先端の作業では、これらの操作を1次線形近似により最適化し、パラメータをルックアップテーブル(LUT)に格納する。
本稿では,量子化認識を用いたパラメータの自動決定が可能な遺伝的LUT近似アルゴリズムGQA-LUTを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:13:47 GMT)
Towards Multimodal Video Paragraph Captioning Models Robust to Missing Modality [26.6] ビデオキャプション(VPC)は、長いビデオのための詳細な物語を生成する。
既存のモデルは、1つの補助モダリティの一定の可用性の仮定によって制約される。
本稿では, 利用可能な全ての補助入力を有効活用し, 一定のモダリティがなくてもレジリエンスを維持する, ミス・抵抗性フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:35:46 GMT)
Large Language Models Are Unconscious of Unreasonability in Math Problems [25.9] 本研究では,不合理な数学問題に直面した大規模言語モデル(LLM)の挙動について検討する。
実験により、LLMは不合理な誤りを検出することができるが、それでも非幻覚的コンテンツを生成するのに失敗することが示された。
さらに、臨界計算と結論という戦略的なプロンプトテンプレートを設計する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:04:28 GMT)
RouterBench: A Benchmark for Multi-LLM Routing System [25.5] パフォーマンスとコストのバランスをとる場合、すべてのタスクやアプリケーションに最適に対処できるモデルは存在しない。
この制限により、個々のLSMの制約を克服するために、様々なモデルの強みを組み合わせたLSMルーティングシステムの開発に繋がった。
本稿では LLM ルーティングシステムの有効性を体系的に評価する新しい評価フレームワークである RouterBench を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:56:28 GMT)
RSMamba: Remote Sensing Image Classification with State Space Model [25.3] リモートセンシング画像分類のための新しいアーキテクチャであるRSMambaを紹介する。
RSMamba は State Space Model (SSM) をベースにしており、Mamba として知られる効率的なハードウェアを意識した設計を取り入れている。
非時間画像データのモデル化にマンバの容量を増大させる動的マルチパスアクティベーション機構を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:59:49 GMT)
Sine Activated Low-Rank Matrices for Parameter Efficient Learning [25.1] 低ランク分解過程に正弦波関数を統合する新しい理論枠組みを提案する。
我々の手法は、視覚変換器(ViT)、Large Language Models(LLM)、NeRF(Neural Radiance Fields)において、既存の低ランクモデルの強化を証明している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:58:20 GMT)
Breaking the Length Barrier: LLM-Enhanced CTR Prediction in Long Textual User Behaviors [25.1] 大型言語モデル(LLM)はクリックスルー率(CTR)予測の性能を向上させるために用いられる。
ユーザシーケンスが長くなるにつれて、LLMの現在の効率は数十億のユーザやアイテムのトレーニングに不十分である。
我々は,LLMに基づくCTRモデリングの効率を高めるために,行動集約階層(BAHE)を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:05:15 GMT)
CoderUJB: An Executable and Unified Java Benchmark for Practical Programming Scenarios [25.1] 我々は,多種多様なJavaプログラミングタスクにわたる大規模言語モデル(LLM)を評価するために設計された新しいベンチマークであるCoderUJBを紹介した。
本ベンチマークでは,様々なオープンソースおよびクローズドソース LLM の符号化能力について検討した。
この結果は、LSMは強力な可能性を示す一方で、特に非機能コード生成において課題が残っていることを示している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:19:18 GMT)
Quantum circuit design for mixture and preparation of arbitrary pure and mixed quantum states [25.0] 本稿では、任意の混合量子状態を作成することの課題に対処する。
2つの回路設計法が提示され、1つは純状態の混合によるものであり、もう1つは精製によるものである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 06:37:00 GMT)
DecentNeRFs: Decentralized Neural Radiance Fields from Crowdsourced Images [24.9] ニューラルレイディアンス場(NeRF)は、世界中で撮影された画像を没入型3D視覚体験に変換する可能性を示している。
これらのキャプチャーされた視覚データのほとんどは、カメラロールにサイロ化されており、画像には個人情報が含まれている。
私たちのアプローチであるDecentNeRFは、分散化されたクラウドソースのNeRFの最初の試みです。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 20:06:38 GMT)
Tiny Machine Learning: Progress and Futures [24.8] Tiny Machine Learning (TinyML)は、機械学習の新しいフロンティアである。
TinyMLはハードウェアの制約のために難しい。
まず、TinyMLの定義、課題、応用について論じる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 00:34:56 GMT)
D'OH: Decoder-Only random Hypernetworks for Implicit Neural Representations [24.6] 我々は,層間に存在する冗長性を利用して,付加的な圧縮を実現することができるという仮説を探求する。
オフライントレーニングデータを使用しない新しい実行時デコーダのみのハイパーネットワークを提案する。
潜在符号の次元を直接変更して対象の暗黙的ニューラルアーキテクチャを近似することにより、ニューラル表現のメモリフットプリントを変更する自然な方法を提供する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 06:18:12 GMT)
Segment Every Out-of-Distribution Object [24.5] 本稿では,意味的セグメンテーションにおけるOoD検出の簡易かつ効果的なフレームワークであるS2Mと呼ばれる,異常な textbfScore textbfTo セグメンテーション textbfMask を変換する手法を提案する。
異常スコアをプロンプト可能なセグメンテーションモデルへのプロンプトに変換することで、S2Mはしきい値の選択を不要にする。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:15:04 GMT)
Uncertainty-Aware Deep Video Compression with Ensembles [24.2] 深層アンサンブルによる予測不確かさを効果的に把握できる不確実性対応ビデオ圧縮モデルを提案する。
我々のモデルは1080pのシーケンスに比べて20%以上効率良くビットを節約できる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 05:44:48 GMT)
AnimatableDreamer: Text-Guided Non-rigid 3D Model Generation and Reconstruction with Canonical Score Distillation [24.0] 本研究では,モノクロビデオから抽出した骨格上に,多種多様な非剛体オブジェクトを生成できるテキストから4D生成フレームワークを提案する。
AnimatableDreamerには、CSD(Canonical Score Distillation)と呼ばれる新しい最適化設計が搭載されています。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:40:08 GMT)
Federated attention consistent learning models for prostate cancer diagnosis and Gleason grading [23.9] 本研究は,大規模病理画像にまつわる課題に対処する,集中型注意一貫性学習フレームワークを提案する。
多発性前立腺癌19,461枚の全スライディング画像を用いて, がん診断およびGleason grading タスクにおけるFACLの有効性を検討した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:31:28 GMT)
Channel Estimation via Successive Denoising in MIMO OFDM Systems: A Reinforcement Learning Approach [23.6] 本稿では,強化学習フレームワークに基づく周波数領域の復調手法を提案する。
我々のアルゴリズムは、実用最小二乗推定法(LS)よりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:47:39 GMT)
CLAP4CLIP: Continual Learning with Probabilistic Finetuning for Vision-Language Models [23.4] 継続学習(CL)は、深層ニューラルネットワークが学習内容を保持しながら新しい知識を学ぶのを支援することを目的としている。
近年、CLIPのような強力な一般化能力を持つ事前学習型視覚言語モデルが、実用的なCL候補として注目を集めている。
我々の研究は、確率的微調整(CLAP)による連続LeArningを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 04:15:58 GMT)
FPGA-Based Neural Thrust Controller for UAVs [23.3] 本稿では,Artix-7 FPGAを搭載した,オープンソースのマイクロUAVプラットフォーム用の新しいハードウェアボードを提案する。
我々はRLベースの低レベルコントローラを実装することで、その機能を検証することに成功した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:44:06 GMT)
Boosting Latent Diffusion with Flow Matching [23.0] フローマッチング(FM)はより高速なトレーニングと推論を提供するが、合成の多様性は低い。
拡散モデルと畳み込みデコーダの間にFMを導入することで高分解能画像合成が実現できることを示す。
我々は,計算コストを最小限に抑えて,最先端の高解像度画像合成を10242ドルで実現した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:35:29 GMT)
J-CRe3: A Japanese Conversation Dataset for Real-world Reference Resolution [22.9] 実世界の参照解決において、システムは、エゴセントリックな視点で観察される視覚情報とユーザインタラクションに現れる言語情報を接地しなければならない。
我々は,マルチモーダル参照解決タスクを提案し,実世界参照解決のための日本語会話データセット(J-CRe3)を構築した。
我々のデータセットには、実世界の会話のエゴセントリックなビデオと対話音声が含まれています。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:32:43 GMT)
SpikingResformer: Bridging ResNet and Vision Transformer in Spiking Neural Networks [22.7] そこで本研究では,DSSA(Dual Spike Self-Attention)という新たな自己注意機構を提案する。
本稿では,DSSAに基づく新しいスパイキングビジョントランスフォーマーアーキテクチャであるSpikeResformerを提案する。
SpikingResformerは、他のスパイキングビジョン変換器よりも少ないパラメータと少ないエネルギー消費で高い精度を達成できることを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 05:13:43 GMT)
OpenGraph: Open-Vocabulary Hierarchical 3D Graph Representation in Large-Scale Outdoor Environments [22.5] 大規模屋外環境を対象とした最初のオープン語彙階層グラフ表現であるOpenGraphを提案する。
OpenGraphは、画像からインスタンスとキャプションを抽出し、それらをエンコードすることでテキスト推論を強化する。
イメージをLiDARポイントクラウドに投影することで,機能埋め込みによる3Dインクリメンタルなオブジェクト中心マッピングを実現している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:10:08 GMT)
Maximum Likelihood Estimation on Stochastic Blockmodels for Directed Graph Clustering [22.4] 我々は、有向ブロックモデルにおいて、基盤となるコミュニティを推定するものとしてクラスタリングを定式化する。
本稿では,2つの効率的かつ解釈可能な有向クラスタリングアルゴリズム,スペクトルクラスタリングアルゴリズム,半定値プログラミングに基づくクラスタリングアルゴリズムを紹介する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:47:13 GMT)
MATEval: A Multi-Agent Discussion Framework for Advancing Open-Ended Text Evaluation [22.2] 生成型大規模言語モデル(LLM)は注目に値するが、これらのモデルによって生成されたテキストの品質は、しばしば永続的な問題を示す。
MATEval: "Multi-Agent Text Evaluation framework"を提案する。
本フレームワークは,評価プロセスの深度と広さを高めるために,自己回帰と整合性戦略とフィードバック機構を取り入れている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:41:47 GMT)
CAT: Exploiting Inter-Class Dynamics for Domain Adaptive Object Detection [22.1] ドメイン適応設定におけるクラスバイアス問題に対処するクラス意識教師(CAT)を提案する。
我々の研究では、クラス間関係モジュール(ICRm)とのクラス関係を近似し、モデル内のバイアスを減らすためにそれを利用する。
各種データセットおよびアブレーション実験により,本手法はドメイン適応設定におけるクラスバイアスに対処可能であることが示された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:02:08 GMT)
Wasserstein Distortion: Unifying Fidelity and Realism [21.6] ワッサーシュタイン歪みは、一方のピクセルレベルの忠実度と他方のリアリズムまたは知覚的品質を同時に一般化する。
ワッサーシュタインの歪みが、パラメータ選択の異なる純粋忠実性制約や純粋現実性制約にどのように還元されるかを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:50:50 GMT)
GOLD: Generalized Knowledge Distillation via Out-of-Distribution-Guided Language Data Generation [21.6] 金はタスクに依存しないデータ生成および知識蒸留フレームワークである。
LLMには反復的なアウト・オブ・ディストリビューション誘導フィードバック機構が採用されている。
ノイズ発生データを扱うためのエネルギーベースOOD評価手法も導入されている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:08:22 GMT)
Improving Pre-trained Language Model Sensitivity via Mask Specific losses: A case study on Biomedical NER [21.6] マスク特化言語モデリング(英語: Mask Specific Language Modeling、MSLM)は、ターゲットドメインの知識を効率的に取得する手法である。
MSLMはDS-termsとジェネリックワードを共同でマスクし、マスク固有の損失を学習する。
分析の結果,MSLMはDS項の感度と検出を改善した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:01:21 GMT)
Towards Enhancing Time Series Contrastive Learning: A Dynamic Bad Pair Mining Approach [21.6] 悪い正のペアは、対照的な学習を通して学んだ時系列表現の質を損なう可能性がある。
本稿では,悪い正のペアを確実に識別し,抑制する動的バッドペアマイニング(DBPM)アルゴリズムを提案する。
DBPMは、学習可能なパラメータなしで軽量なプラグインとして設計された単純なアルゴリズムである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:54:32 GMT)
Meta Reinforcement Learning with Finite Training Tasks -- a Density Estimation Approach [21.4] メタ強化学習(メタRL)では、エージェントは、同じタスク分布から引き出された新しいタスクの迅速な解決方法のセットから学習する。
この研究で検討する質問は、高い確率で最適な行動を保証するために、どの程度のトレーニングタスクが必要かということだ。
本研究では,タスク分布を直接学習し,密度推定手法を用いて,学習したタスク分布に関するポリシーを訓練するアプローチを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 20:48:00 GMT)
EgoThink: Evaluating First-Person Perspective Thinking Capability of Vision-Language Models [21.4] 視覚言語モデル(VLM)は、最近、従来の下流タスクにおいて有望な結果を示している。
EgoThinkは、12の詳細な次元を持つ6つのコア機能を含む、新しい視覚的質問答えベンチマークである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:35:55 GMT)
Uncovering Misattributed Suicide Causes through Annotation Inconsistency Detection in Death Investigation Notes [21.4] NVDRS(National Violent Death Reporting System)のデータは、死のパターンや原因を発見するために広く利用されている。
最近の研究では、NVDRS内のアノテーションの不整合と誤った自殺原因の帰属に対する潜在的影響が示唆されている。
本稿では,アノテーションの不整合を検知し,問題のあるインスタンスを識別するクロスバリデーションのようなパラダイムを採用する,経験的自然言語処理(NLP)アプローチを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:03:12 GMT)
Mitigating Motion Blur in Neural Radiance Fields with Events and Frames [21.1] 本研究では,フレームやイベントを融合させることにより,カメラ動作下でのNeRF再構成を改善する新しい手法を提案する。
我々は、イベント二重積分を追加のモデルベースとして利用して、ぼやけた生成プロセスを明示的にモデル化する。
合成および実データから,提案手法は,フレームのみを使用する既存の劣化型NeRFよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:06:37 GMT)
JIST: Joint Image and Sequence Training for Sequential Visual Place Recognition [21.0] 視覚的場所認識は、視覚的手がかりに頼って、これまで訪れた場所を認識することを目的としており、SLAMとローカライゼーションのためのロボティクスアプリケーションで使用される。
マルチタスク学習フレームワークを用いて,大規模な未処理画像集合を利用する新しいJIST(Joint Image and Sequence Training Protocol)を提案する。
提案モデルでは,8倍の小さい記述子を用いて,より軽量なアーキテクチャで,さまざまな長さのシーケンスを処理し,より高速な動作を実現している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:11:26 GMT)
Predicting Species Occurrence Patterns from Partial Observations [21.0] 本稿では,(a)衛星画像を用いた種発生パターンの予測と,(b)他の種の発生に関する既知の情報を紹介する。
この課題に対して,衛星画像,環境データ,蝶の観察データのデータセットであるSatButterflyを導入する。
そこで本研究では,見つからない部分的な観測データの利用を可能にする種発生パターンを予測するための一般モデルR-Tranを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:06:15 GMT)
Hypergraph-based Multi-View Action Recognition using Event Cameras [21.0] マルチビューイベントベースのアクション認識フレームワークであるHyperMVを紹介する。
我々は6つの視点から50のアクションからなる、最も大きなマルチビューイベントベースのアクションデータセットである$textTHUtextMV-EACTtext-50$を提示する。
実験の結果,HyperMVはクロスオブジェクトとクロスビューの両方のシナリオにおいて,ベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:17:00 GMT)
Sparse 3D Reconstruction via Object-Centric Ray Sampling [20.9] 本研究では,360度カメラリグから取得したスパースビューから3次元オブジェクトを復元する新しい手法を提案する。
我々は、校正ベースニューラル表現とトライアングルメッシュの両方を使用するハイブリッドモデルにより、オブジェクトを表現する。
私たちはGoogleのScanned Objects, Tank and Temples, MVMC Carデータセットのスパースなビューで作業しています。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:16:09 GMT)
Rethinking Information Loss in Medical Image Segmentation with Various-sized Targets [20.8] 医用画像の分割を行う新しいStagger Network(SNet)を導入する。
グローバルな依存関係とローカルなフォーカスの両方を強調するため、セマンティックギャップを埋めるパラレルモジュールを設計する。
さらに、補完的な情報をネットワークに戻すために、情報回復モジュールが採用されている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:01:11 GMT)
RiEMann: Near Real-Time SE(3)-Equivariant Robot Manipulation without Point Cloud Segmentation [20.7] 本稿では,シーンポイントクラウド入力からリアルタイムSE(3)-等価ロボットマニピュレーション模倣学習フレームワークRiEMannを提案する。
ディスクリプタのフィールドマッチングに依存する従来のメソッドと比較して、RiEMannはオブジェクトのセグメンテーションなしで操作するためのオブジェクトのターゲットポーズを直接予測する。
RiEMannは、5から10のデモで操作タスクをスクラッチから学習し、SE(3)変換とターゲットオブジェクトのインスタンスを一般化し、邪魔なオブジェクトの視覚的干渉に抵抗し、ターゲットオブジェクトのほぼリアルタイムのポーズ変更に従う。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:31:10 GMT)
Learning Multiple Representations with Inconsistency-Guided Detail Regularization for Mask-Guided Matting [20.6] マスク誘導マットネットワークは近年,実用化に大きな可能性を秘めている。
これらのアプローチは、間違ったリージョンで低レベルの詳細をオーバーフィットする傾向があります。
マスク誘導マットモデルのための新しい補助学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:21:56 GMT)
Make Large Language Model a Better Ranker [20.5] 本稿では,aligned Listwise Ranking Objectives (ALRO)を用いた言語モデルフレームワークを提案する。
ALROの重要な特徴は、言語生成タスクに適した損失適応である、ソフトロスの導入である。
評価研究により,ALROが既存の埋め込み型レコメンデーション法より優れていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:22:16 GMT)
Text Data-Centric Image Captioning with Interactive Prompts [20.5] 画像キャプションの監視手法は大きな進歩を遂げているが,高品質な人手による画像テキストデータの収集は困難である。
本稿では,Interactive Prompts を用いた新しいテキストデータ中心型画像キャプタリング手法 TIPCap を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:43:49 GMT)
OpenGraph: Towards Open Graph Foundation Models [20.4] 本研究では,多種多様なグラフデータに存在する複雑なトポロジ的パターンを理解するための一般グラフ基盤モデルを構築した。
本稿では,グラフモデルに統一的なグラフトークン化手法を提案する。
また,グローバルなトポロジ的コンテキスト内のノード依存性を効果的にキャプチャするスケーラブルなグラフ変換器を開発した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:11:27 GMT)
Evaluating Step-by-Step Reasoning through Symbolic Verification [20.2] 事前学習言語モデル(LM)は、文脈内学習において顕著な推論性能を示した。
LMLPは、より小さなモデルサイズであっても、長さの一般化ベンチマークにおいて、チェーン・オブ・ソート(CoT)よりも25%以上精度が高い。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:20:12 GMT)
TimeChat: A Time-sensitive Multimodal Large Language Model for Long Video Understanding [20.0] TimeChatは、長いビデオ理解のために特別に設計された、時間に敏感なマルチモーダルな大規模言語モデルである。
本モデルは,(1) フレームのタイムスタンプに視覚的コンテンツをバインドするタイムスタンプ対応フレームエンコーダ,(2) 長さの異なるビデオトークンシーケンスを生成するスライドビデオQ-Formerの2つの重要なアーキテクチャ的コントリビューションを含む。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:41:14 GMT)
Learnable Earth Parser: Discovering 3D Prototypes in Aerial Scans [20.0] そこで本研究では,現実のシーンの大規模な3次元スキャンを,容易に解釈可能な形状で解析するための教師なし手法を提案する。
提案手法は,入力された3次元点群を学習された3次元形状の小さな集合に分解する確率的再構成モデルに基づく。
実世界の様々なシナリオから得られた7つの大型LiDARスキャンのデータセット上で,本モデルの有用性を実証する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:53:08 GMT)
Siamese Vision Transformers are Scalable Audio-visual Learners [19.9] 本稿では,AVSiam(Audio-visual siamese Network)を用いて,高能率かつスケーラブルな視覚前訓練を行う。
我々のフレームワークは、単一の共有視覚変換器のバックボーンを使用して、音声および視覚入力を処理する。
音声,視覚,視覚の入力を単一の共有VTバックボーンで頑健に処理できる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:52:24 GMT)
Infrared Small Target Detection with Scale and Location Sensitivity [19.9] 本稿では,より効率的な損失を伴い,より単純なモデル構造で検出性能を向上させることに焦点を当てる。
具体的には、まず、既存の損失の限界に対応するために、新しいスケール・アンド・ロケーション・センシティブ(SLS)損失を提案する。
予測の規模毎にSLS損失を適用することで、MSHNetは既存の最先端手法よりも大きなマージンで性能を向上する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:28:58 GMT)
Language Models Learn Rare Phenomena from Less Rare Phenomena: The Case of the Missing AANNs [19.8] 言語モデルは希少な構文現象を学習するが、それらは暗記に依存していると論じられている。
我々は、体系的に操作されたコーパスの言語モデルを繰り返し訓練し、希少な文法現象の学習を評価した。
この結果から,比較的希少な現象からの一般化により,モデルが希少な文法現象を学習することを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 20:35:10 GMT)
Incremental Processing in the Age of Non-Incremental Encoders: An Empirical Assessment of Bidirectional Models for Incremental NLU [19.8] 双方向LSTMとTransformerは、エンコードされるシーケンスがフルである、と仮定する。
インクリメンタルなインタフェースの下でどのように振る舞うかを、部分的な出力が提供される必要があるか検討する。
その結果,非インクリメンタルな品質を維持しつつ,双方向エンコーダをインクリメンタルモードで使用することが可能になった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:26:58 GMT)
Few-Shot Learning Patterns in Financial Time-Series for Trend-Following Strategies [19.8] 本稿では,新しい市場環境に迅速に適応できる時系列トレンド追従予測器を提案する。
X-Trendは、金融時系列体制のコンテキストセットに参画する役割を担っている。
新型コロナウイルス(COVID-19)の減少から回復する戦略は、ニューラルネットワークによる時系列トレンド予測の2倍の速さで回復する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:30:07 GMT)
Patch Spatio-Temporal Relation Prediction for Video Anomaly Detection [19.6] ビデオ異常検出(VAD)は、特定のコンテキストと時間枠内の異常を識別することを目的としている。
近年の深層学習に基づくVADモデルは,高解像度フレームの生成によって有望な結果を示した。
本稿では, パッチ間関係予測タスクを通じて, VADの自己教師型学習手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:07:16 GMT)
A Real-Time Framework for Domain-Adaptive Underwater Object Detection with Image Enhancement [18.9] EnyoLOは、水中画像強調(UIE)と物体検出(UOD)を同時に行うために設計された統合リアルタイムフレームワークである。
このフレームワークはUIEタスクとUDDタスクの両方でSOTA(State-of-the-art)性能を実現するが、異なる水中シナリオに適用した場合にも優れた適応性を示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 01:00:08 GMT)
Toward a Surgeon-in-the-Loop Ophthalmic Robotic Apprentice using Reinforcement and Imitation Learning [18.7] 眼内白内障手術における外科医中心の自律エージェントに対するシミュレーションに基づく画像誘導アプローチを提案する。
本研究は,外科医の行動と嗜好をトレーニングプロセスに組み込むことで,ロボットが個別の外科医の独特なアプローチを暗黙的に学習し適応することを可能にする。
我々のアプローチは、他の眼科手術に拡張する可能性があり、新しい世代の手術ロボットへの扉を開く。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:24:46 GMT)
HQ-VAE: Hierarchical Discrete Representation Learning with Variational Bayes [18.6] 本稿では,階層的量子化変分オートエンコーダ(HQ-VAE)と呼ばれる,変分ベイズフレームワークに基づく階層的離散表現学習フレームワークを提案する。
HQ-VAEはVQ-VAE-2や残留量子化VAE(RQ-VAE)のようなVQ-VAEの階層的変種を自然に一般化する
画像データセットに関する総合的な実験により、HQ-VAEはコードブックの使用率を高め、再構築性能を向上させることが示された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 06:38:55 GMT)
CoherentGS: Sparse Novel View Synthesis with Coherent 3D Gaussians [18.4] 2次元画像空間で制御できる構造付きガウス表現を導入する。
次に、ガウス群、特にその位置を制約し、最適化中に独立に動くのを防ぐ。
我々は,様々な場面における最先端のスパースビュー NeRF ベースのアプローチと比較して,顕著な改善を示した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:27:13 GMT)
Data-Efficient Multimodal Fusion on a Single GPU [18.2] FuseMix は任意の訓練済みの単調エンコーダの潜時空間で動作するスキームである。
本稿では,事前学習したテキストから画像への生成モデルを音声から画像へ変換する手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:32:10 GMT)
Learning To Guide Human Decision Makers With Vision-Language Models [18.0] 医療診断などの高度なタスクにおいて、人間の意思決定を支援するAIの開発への関心が高まっている。
学習指導(Learning to Guide,LTG)は、人間の専門家から制御されるのではなく、機械が指導を提供するフレームワークである。
指導が解釈可能であることを保証するため,任意の視覚言語モデルをテキスト誘導の能力のある生成器に変換するアプローチであるSLOGを開発した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:46:45 GMT)
Localizing Paragraph Memorization in Language Models [17.9] 記憶化は複数の層やモデル成分にまたがるが,記憶化段落の勾配は識別可能な空間パターンを有することを示す。
また、記憶された継続は、学習が困難であるだけでなく、記憶されていないものよりも腐敗することも示している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:53:24 GMT)
Deciphering the Interplay between Local Differential Privacy, Average Bayesian Privacy, and Maximum Bayesian Privacy [17.9] 我々はベイジアン・プライバシを導入し、LDPとベイジアン・プライバシ・トレードオフに関する新たな洞察を公表した。
私たちの研究は、将来の経験的探索の基盤となるだけでなく、プライバシー保護アルゴリズムの設計を促進することを約束しています。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:27:38 GMT)
Offline Imitation Learning from Multiple Baselines with Applications to Compiler Optimization [17.7] 我々は,Kベースラインポリシーで収集した一連のトラジェクトリを与えられる強化学習問題について検討する。
目標は、状態空間全体におけるベースラインの最高の組み合わせと同様に、機能するポリシーを学ぶことです。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:34:02 GMT)
Concept-based Analysis of Neural Networks via Vision-Language Models [17.4] 我々は、視覚モデルについて推論できるレンズとして、新しいマルチモーダル、ヴィジュアル言語、ファンデーションモデル(VLM)を活用することを提案する。
これらの概念の観点から仕様の記述を容易にするために設計された論理仕様言語 $textttCon_textttspec について説明する。
textttCon_textttspec$仕様を定義し、正式にチェックするには、視覚モデルの自然言語特性をエンコードし、効率的にチェックする手段を提供するVLMを利用する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:15:38 GMT)
On the Robustness of LDP Protocols for Numerical Attributes under Data Poisoning Attacks [17.4] ローカルディファレンシャルプライバシ(LDP)プロトコルは、データ中毒攻撃に対して脆弱である。
この脆弱性は、敵対的環境におけるLDPの堅牢性と信頼性に関する懸念を引き起こす。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:43:38 GMT)
PoCo: A Self-Supervised Approach via Polar Transformation Based Progressive Contrastive Learning for Ophthalmic Disease Diagnosis [17.3] 眼科疾患診断のための極変法に基づくプログレッシブコントラスト学習(PoCo)による自己指導手法を提案する。
提案手法がアノテーションの労力を減らし,信頼性の高い診断を行うことができることを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:35:00 GMT)
Target Span Detection for Implicit Harmful Content [17.3] 我々は、より微妙なヘイトスピーチを認識し、デジタルプラットフォーム上で有害なコンテンツを検出するために不可欠な、ヘイトスピーチの暗黙のターゲットを特定することに注力する。
我々は、SBIC、DynaHate、IHCの3つの顕著な暗黙のヘイトスピーチデータセットでターゲットを収集し、注釈付けする。
実験の結果,Implicit-Target-Spanはターゲットスパン検出法に挑戦的なテストベッドを提供することがわかった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:15:15 GMT)
Beyond Talking -- Generating Holistic 3D Human Dyadic Motion for Communication [17.3] 本稿では,人間のコミュニケーションに焦点をあてた革新的なタスクを紹介し,話者と聴取者の両方に対して3次元の全体的人間の動きを生成することを目的とする。
話者とリスナーのリアルタイム相互影響を考察し,新しい連鎖型トランスフォーマーに基づく自己回帰モデルを提案する。
提案手法は,2つのベンチマークデータセット上での最先端性能を示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:47:32 GMT)
GOTCHA: Real-Time Video Deepfake Detection via Challenge-Response [17.1] オンラインビデオのインタラクションの統合性は、ますます懸念されている。
AI対応のリアルタイムディープフェイク(RTDF)の台頭により、オンラインビデオインタラクションの整合性が懸念されている。
本稿では,ライブ環境での信頼性を確立するための課題応答手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:49:33 GMT)
Dataflow-Aware PIM-Enabled Manycore Architecture for Deep Learning Workloads [16.7] PIM(Processing-in-Memory)は、ディープラーニング(DL)ワークロードのエネルギー効率と高性能アクセラレーションの実現手段として登場した。
抵抗型ランダムアクセスメモリ(ReRAM)は、PIMを実装する上で最も有望な技術の一つである。
既存のPIMベースのアーキテクチャは、主に通信の役割を無視しながら計算に焦点を当てている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 00:29:15 GMT)
GraphAD: Interaction Scene Graph for End-to-end Autonomous Driving [16.2] 我々は,エゴ車両,道路エージェント,地図要素間の相互作用をモデル化するための統合手法として,インタラクションシーングラフ(ISG)を提案する。
提案手法をnuScenesデータセット上で評価した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 02:22:28 GMT)
Purposeful remixing with generative AI: Constructing designer voice in multimodal composing [16.2] 本研究は, 生成型AIツールの使用が, 多モーダル執筆において, より一貫した音声構築に役立つかどうかを考察する。
この研究は、技術的柔軟性によって得られるように、AIによるマルチモーダル書き込みの意図的かつ非帰的な性質に光を当てている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 02:15:03 GMT)
JDocQA: Japanese Document Question Answering Dataset for Generative Language Models [16.0] 本稿では,大規模文書ベースのQAデータセットであるJDocQAについて紹介する。
PDF形式で5,504件の文書と日本語で11,600件の質問・回答文からなる。
現実的な質問応答アプリケーションのために,複数のカテゴリの質問と,文書から解答不能な質問を取り入れた。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:22:54 GMT)
Can multiple-choice questions really be useful in detecting the abilities of LLMs? [15.8] 大規模言語モデル(LLM)の評価には,MCQ(Multiple-choice Question)が広く用いられている。
課題と評価方法のミスアライメントは,MCQの有効性の思慮深い分析を必要とする。
質問応答(QA)データセットを中国語と英語の2言語で評価した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:57:05 GMT)
Total-Decom: Decomposed 3D Scene Reconstruction with Minimal Interaction [15.5] 人間のインタラクションを最小限に抑えた3次元再構成法であるTotal-Decomを提案する。
提案手法は,Segment Anything Model (SAM) とハイブリッド型暗黙的なニューラルサーフェス表現をシームレスに統合し,メッシュベースの領域成長技術を用いて正確な3次元オブジェクト分解を行う。
提案手法をベンチマークデータセット上で広範囲に評価し,アニメーションやシーン編集などの下流アプリケーションの可能性を示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:12:33 GMT)
Fisher-Rao Gradient Flows of Linear Programs and State-Action Natural Policy Gradients [15.2] 状態-作用分布のフィッシャー情報行列に基づく別の自然勾配法について検討する。
摂動型フィッシャー・ラオ勾配流と自然勾配流の近似誤差に対するサブ線形収束性を示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:16:23 GMT)
QNCD: Quantization Noise Correction for Diffusion Models [15.2] 拡散モデルは画像合成に革命をもたらし、品質と創造性の新しいベンチマークを設定した。
トレーニング後の量子化は、サンプルの品質を犠牲にしてサンプリングを加速するソリューションを提供する。
サンプリング過程を通して量子化ノイズを最小化することを目的とした量子化ノイズ補正方式(QNCD)を導入する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 04:24:56 GMT)
Residual-based Language Models are Free Boosters for Biomedical Imaging [15.2] 本研究では,バイオメディカルイメージングタスクのエンコーダの一部として,残留型大規模言語モデル(LLM)の予期せぬ有効性を明らかにする。
これらのLCMは,2次元と3次元の視覚的分類タスクを含む,様々なバイオメディカルイメージングアプリケーションにおいて,性能を向上させることができることがわかった。
副産物として,提案手法は,MedMNIST-2Dと3Dの広範囲な標準化データセットに対して,最先端の成果を新たに設定し,優れた性能を実現した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:28:00 GMT)
Fairness in Ranking: Robustness through Randomization without the Protected Attribute [15.1] 本稿では,保護属性の可用性を必要とせず,列挙後処理のランダム化手法を提案する。
本研究では,P-FairnessとNDCG(正規化非カウント累積ゲイン)に関して,提案手法のロバスト性を示し,従来提案されていた手法を改良した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:50:24 GMT)
Self-Improved Learning for Scalable Neural Combinatorial Optimization [14.9] 本研究は、ニューラルネットワーク最適化のスケーラビリティを向上させるための新しい自己改善学習(SIL)手法を提案する。
我々は,ラベル付きデータを使わずに大規模問題インスタンス上での直接モデルトレーニングを可能にする,効率的な自己改善機構を開発した。
さらに,計算モデルに対する線形注意複雑化機構を設計し,オーバヘッドの少ない大規模問題インスタンスを効率的に処理する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:46:53 GMT)
Information Cascade Prediction under Public Emergencies: A Survey [14.7] 本稿では,情報カスケードモデリング,予測,応用の体系的な分類と要約について述べる。
我々は,最先端の研究と情報カスケード予測のモデルと方法の理解を支援することを目的としている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:46:56 GMT)
BAMM: Bidirectional Autoregressive Motion Model [14.7] 本稿では,双方向自動回帰運動モデル(BAMM)を提案する。
BAMMは,(1)3次元の人間の動きを潜在空間の離散トークンに変換するモーション・トークンライザ,(2)ランダムにマスクされたトークンを自動予測するマスキング・セルフアテンション・トランスフォーマーの2つの重要な構成要素から構成される。
HumanML3DとKIT-MLデータセットに関する実験は、BAMMが定性的および定量的な測定において現在の最先端の手法を上回ることを示した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:04:17 GMT)
SG-PGM: Partial Graph Matching Network with Semantic Geometric Fusion for 3D Scene Graph Alignment and Its Downstream Tasks [14.5] 我々は3次元シーングラフアライメントを部分的なグラフマッチング問題として扱い、グラフニューラルネットワークを用いてそれを解くことを提案する。
我々は、点雲登録法で学習した幾何学的特徴を再利用し、クラスタ化された点レベルの幾何学的特徴とノードレベルの意味的特徴を関連付ける。
本稿では,3次元シーングラフのノードワイドアライメントを用いて,事前学習した点雲登録手法からマッチング候補を再重み付けする点マッチング再構成手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:01:58 GMT)
A Review of Graph Neural Networks in Epidemic Modeling [14.3] 新型コロナウイルスのパンデミックが始まって以来、疫学モデルの研究への関心が高まっている。
グラフニューラルネットワーク(GNN)は、疫病研究において徐々に普及しているツールである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:54:48 GMT)
Improving Vietnamese-English Medical Machine Translation [14.2] MedEVは、医療領域向けに構築された高品質のベトナム語と英語の並列データセットで、約360Kの文対で構成されている。
我々は、Google Translate、ChatGPT(gpt-3.5-turbo)、最先端のベトナム語-英語ニューラルマシン翻訳モデル、および新しいMedEVデータセット上で事前訓練されたバイリンガル/マルチリンガルシーケンス・ツー・シーケンスモデルの比較実験を行った。
実験結果から, 翻訳方向ごとに「ビナイ翻訳」を微調整することで, 最高の性能が得られることがわかった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 06:07:15 GMT)
Optimal Transport Perturbations for Safe Reinforcement Learning with Robustness Guarantees [14.1] 我々は、最適な輸送コストの不確実性セットを用いてロバストネスを組み込んだ安全な強化学習フレームワークを導入する。
安全性の制約のある継続的制御タスクの実験では,本手法はロバストな性能を示しながら,デプロイ時の安全性を大幅に改善する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:08:43 GMT)
PQA: Exploring the Potential of Product Quantization in DNN Hardware Acceleration [14.1] 製品量子化(PQ)は、マルチプライ累積(MAC)操作を置き換えるためにディープニューラルネットワーク(DNN)に適用されている。
私たちは、近くの検索とドット商品のルックアップを並列化し、加速するための、カスタムハードウェアアクセラレータを作成します。
高度に最適化された従来のDNNアクセラレータと比較しても、ResNet20の性能を最大3.1$times$で改善するPQ構成を識別する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:27:18 GMT)
Frequency-Adaptive Dilated Convolution for Semantic Segmentation [14.1] 本稿では、スペクトル分析の観点から、拡張畳み込みの個々の位相を改善するための3つの戦略を提案する。
周波数適応型拡張畳み込み(FADC)を導入し、局所周波数成分に基づいて空間的に拡散率を調整する。
2つのプラグインモジュールを設計し、有効帯域幅と受容フィールドサイズを直接的に拡張する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:41:05 GMT)
Cloudy with a Chance of Cyberattacks: Dangling Resources Abuse on Cloud Platforms [13.9] 私たちは初めて、クラウドリソースの現実的なハイジャックを特定しました。
攻撃者が主にIPアドレスを標的とするというこれまでの仮定とは対照的に、我々の発見は、リソースの種類がハイジャックの主な考慮事項ではないことを示している。
攻撃者がハイジャックされたリソースを悪用し、以前の研究で考慮された脅威とは対照的に、乱用のほとんどはブラックハット検索エンジンの最適化である。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:31:08 GMT)
Going Beyond Word Matching: Syntax Improves In-context Example Selection for Machine Translation [13.9] In-context Learning (ICL) は、大規模言語モデル(LLM)の時代におけるトレンドの促進戦略である。
機械翻訳(MT)のテキスト内サンプル選択は、表面的な単語レベルの特徴に重点を置いている。
本稿では,依存木間の構文的類似性を計算し,構文に基づくMTの例選択手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:13:34 GMT)
Enhancing Object Coherence in Layout-to-Image Synthesis [13.8] 本稿では,グローバル・セマンティック・フュージョン(GSF)と自己相似機能拡張モジュールを用いた新しい拡散モデルを提案する。
セマンティックコヒーレンスについては,イメージキャプションには画像内のオブジェクト内のセマンティックな関係を定義するための豊富な情報が含まれていると論じる。
物理コヒーレンスを改善するため,各画素の生成プロセスに局所的な物理的コヒーレンスを明示的に統合する自己相似コヒーレンスアテンション(SCA)モジュールを開発した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 06:20:10 GMT)
Intrinsic Image Decomposition Using Point Cloud Representation [13.8] 本稿では3次元クラウドデータを利用してアルベドとシェーディングマップを同時に推定するPoint Intrinsic Net(PoInt-Net)を紹介する。
PoInt-Netは効率的で、任意のサイズのポイントクラウドで一貫したパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:54:38 GMT)
The State of Lithium-Ion Battery Health Prognostics in the CPS Era [13.7] 本稿では,バッテリ内における診断と健康管理のシームレスな統合について考察する。
予後学において重要な概念であるRemaining useful Life (RUL) を深く検討し, コンポーネント障害の予測におけるその役割を強調した。
Liイオン電池の健康診断分野におけるディープラーニングアーキテクチャへのパラダイムシフトを強調している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 20:01:35 GMT)
Detecting Image Attribution for Text-to-Image Diffusion Models in RGB and Beyond [13.5] 現代のテキスト・ツー・イメージ(T2I)拡散モデルは、顕著なリアリズムと創造性を持った画像を生成することができる。
これらの進歩は、偽画像の検出と帰属の研究に火をつけているが、以前の研究では、この課題の実際的および科学的側面について完全には研究されていない。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:59:42 GMT)
A Two-Phase Recall-and-Select Framework for Fast Model Selection [13.4] 本稿では,2相モデル選択フレームワークを提案する。
これは、ベンチマークデータセット上でモデルのトレーニングパフォーマンスを活用することにより、堅牢なモデルを選択する効率を高めることを目的としている。
提案手法は,従来のベースライン法に比べて約3倍の速度でハイパフォーマンスモデルの選択を容易にすることが実証された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:44:44 GMT)
NIGHT -- Non-Line-of-Sight Imaging from Indirect Time of Flight Data [13.4] 最近の研究は、カスタム・ダイレクト・タイム・オブ・フライト・センサーによって生成された過渡撮像データを活用する可能性を示した。
ハードウェアを必要とせずに、市販の間接飛行時センサのデータのみを用いてこの問題に対処する。
我々は、仮想ミラーとして光が反射する表面を再構成できるディープラーニングモデルを導入する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:38:21 GMT)
Top Leaderboard Ranking = Top Coding Proficiency, Always? EvoEval: Evolving Coding Benchmarks via LLM [13.3] EvoEvalは、既存のベンチマークを異なるターゲットドメインに進化させたプログラム合成ベンチマークスイートである。
我々の研究では、HumanEvalのような標準ベンチマークで得られたハイパフォーマンスと比較して、パフォーマンスが大幅に低下していることが示されている。
本稿では,リワードや微妙な変化に遭遇した場合の命令追従モデルの脆さなど,様々な知見を紹介する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:10:39 GMT)
Compressing Large Language Models by Streamlining the Unimportant Layer [13.0] 大規模言語モデル(LLM)は、様々な自然言語のタスクやドメインに広く適用されている。
本稿では,レイヤプルーニングと層置換という2つの部分からなるLCM-Streamlineを提案する。
提案手法であるLCM-Streamlineは,従来の最先端(SOTA)モデルプルーニング法より優れていた。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 04:12:13 GMT)
GeoAuxNet: Towards Universal 3D Representation Learning for Multi-sensor Point Clouds [13.0] 本稿では,ボクセル表現が点レベルの幾何学情報にアクセスできるようにするために,幾何学とボクセルの補助学習を提案する。
具体的には、ボクセル誘導動的点ネットワークによって生成される階層的幾何プールを構築する。
提案手法は,マルチセンサデータセットで学習した他のモデルよりも優れる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:34:04 GMT)
SecGraph: Towards SGX-based Efficient and Confidentiality-Preserving Graph Search [13.0] 本稿では,SGXに基づくグラフ検索方式SecGraphを提案する。
SecGraphの検索時間はPeGraphと比較して最大208倍向上した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:06:13 GMT)
MineLand: Simulating Large-Scale Multi-Agent Interactions with Limited Multimodal Senses and Physical Needs [13.0] 我々は,限られたマルチモーダル感覚と物理的ニーズを導入することでギャップを埋めるマルチエージェントMinecraftシミュレータMineLandを提案する。
我々のシミュレーターは、最大48のエージェントをサポートし、視覚的、聴覚的、環境的な認識が限られており、食物や資源といった物理的なニーズを満たすために、積極的にコミュニケーションし、協力することを余儀なくされます。
実験により,シミュレータ,対応するベンチマーク,およびAIエージェントフレームワークが,より生態学的・ニュアンスな集団行動に寄与することが示された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:53:41 GMT)
GauStudio: A Modular Framework for 3D Gaussian Splatting and Beyond [13.0] GauStudioは3Dガウススティングのモデリングのための新しいフレームワーク(3DGS)
本研究では,前景とスカイボールの背景モデルを用いたハイブリッドガウス表現を提案する。
また、3DGS入力を微調整せずに高忠実度メッシュ再構成を行うための新しいレンダインフューズ手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:47:31 GMT)
Data-free Defense of Black Box Models Against Adversarial Attacks [12.9] データフリーセットアップにおける敵攻撃に対するブラックボックスモデルに対する新しい防御機構を提案する。
生成モデルを用いて合成データを構築し, モデルステルス手法を用いてサロゲートネットワークを訓練する。
本手法は,CIFAR-10の対向精度を38.98%,32.01%向上させる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:53:54 GMT)
Burst Super-Resolution with Diffusion Models for Improving Perceptual Quality [12.7] バーストLR画像を受け入れる以前のSRネットワークは、曖昧なSR画像を生成することが知られている決定論的方法で訓練される。
このようなぼやけた画像は知覚的に劣化しているので、我々は鋭い高忠実度境界を再構築することを目指している。
一方,提案手法では,初期バーストSR画像の再構成にバーストLR特性を用いる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:58:05 GMT)
Segmentation Re-thinking Uncertainty Estimation Metrics for Semantic Segmentation [12.5] セマンティックセグメンテーションは機械学習の基本的な応用である。
画像セグメンテーションタスクにおけるエントロピーに基づく不確実性を評価するための特殊なツールとしてPAvPU(パッチ精度対パッチ不確実性)が開発された。
本研究は,PAvPUフレームワークの中核となる3つの欠陥を同定し,ロバストな解を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 20:34:02 GMT)
QAGCN: Answering Multi-Relation Questions via Single-Step Implicit Reasoning over Knowledge Graphs [12.4] マルチリレーション質問応答(QA)は難しい課題である。
KGに対する明示的な多段階推論を持つ最近の手法はこの課題で顕著に用いられている。
マルチリレーショナルQAは、エンド・ツー・エンドのシングルステップの暗黙の推論によって達成できると論じる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 20:38:01 GMT)
Croissant: A Metadata Format for ML-Ready Datasets [12.1] Croissantは、MLツールやフレームワークでのデータの使用方法を簡単にするデータセットのメタデータフォーマットである。
すでに、数十万のデータセットにまたがる、人気のあるデータセットリポジトリがサポートしている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:27:26 GMT)
SOLD: Sinhala Offensive Language Dataset [11.6] 本稿はスリランカで1700万人以上の人々が話していた低リソースのインド・アーリア語であるシンハラにおける攻撃的な言語識別に取り組む。
SOLDは手動でアノテートされたデータセットで、Twitterから1万の投稿がアノテートされ、文レベルとトークンレベルの両方で攻撃的ではない。
また,145,000以上のSinhalaツイートを含む大規模データセットであるSemiSOLDについても紹介する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:25:21 GMT)
FluoroSAM: A Language-aligned Foundation Model for X-ray Image Segmentation [11.6] 我々は、1.6Mの合成X線画像に基づいて、ゼロから訓練されたセグメンテーション・アニーシング・モデルの言語対応版であるFluoroSAMを開発した。
FluoroSAMは0.51と0.79のDICEでテキストのみのプロンプトに基づいて骨質の解剖学的構造を分割することができる。
また、言語アライメントのおかげで、トレーニングセット以外のセグメントクラスへのゼロショットの一般化も可能である。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 00:59:37 GMT)
Graph Neural Networks for Treatment Effect Prediction [11.5] 電子商取引における因果効果の推定には、大規模な環境では実用的でないような費用がかかる傾向がある。
電子商取引データに共通するグラフに依存して,必要なトレーニングセットのサイズを小さくするグラフニューラルネットワークを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:19:36 GMT)
Symbolic Regression on Sparse and Noisy Data with Gaussian Processes [11.4] 本研究では, 非線形力学(SINDy)法をスパース同定し, データをノイズ化し, 非線形力学方程式を同定する。
我々の単純なアプローチは、SINDy単独と比較して、スパースでノイズの多いデータによる堅牢性の向上を提供します。
我々は,SINDyよりも20.78%,SSRよりも61.92%,ベースラインよりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 01:00:05 GMT)
MedBN: Robust Test-Time Adaptation against Malicious Test Samples [11.4] テスト時間適応(TTA)は、トレーニングデータとテストデータの間の予期せぬ分散シフトによるパフォーマンス劣化に対処する、有望なソリューションとして登場した。
以前の研究では、テストバッチのごく一部が不正に操作された場合でも、TTA内のセキュリティ脆弱性が明らかになった。
テスト時間推論におけるバッチ正規化層内の統計量推定に中央値のロバスト性を利用する中央値バッチ正規化(MedBN)を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:33:02 GMT)
The New Agronomists: Language Models are Experts in Crop Management [11.2] 本稿では,より先進的な作物管理システムを提案する。
我々は、特に深層Qネットワークである深部RLを用いて、シミュレータから多数の状態変数を観測として処理する管理ポリシーを訓練する。
我々のアプローチの新たな側面は、これらの状態変数をより情報的な言語に変換し、言語モデルが状態を理解し、最適な管理方法を探求する能力を促進することである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:20:27 GMT)
sDPO: Don't Use Your Data All at Once [11.1] 本稿では、アライメントチューニングのためのDPO(DPO)の拡張であるステップワイズDPO(SDPO)を提案する。
このアプローチでは、利用可能な選好データセットを分割して、すべてを一度に使用するのではなく、段階的に活用する。
本手法は, DPOトレーニングフレームワーク内で, より正確に整列された参照モデルの使用を容易にすることを実証する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:56:04 GMT)
DORE: A Dataset For Portuguese Definition Generation [11.0] 定義モデリング(英: Definition modelling、DM)とは、特定の単語の辞書定義を自動的に生成するタスクである。
DMは、教師付き自然言語生成問題であると考えられている。
DMデータセットは、英語や他の高ソース言語向けにリリースされた。
ポルトガル語のDMデータセットは提供されていない。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:19:46 GMT)
DANCER: Entity Description Augmented Named Entity Corrector for Automatic Speech Recognition [10.8] 本稿では、自動音声認識(E2E ASR)における音声の混同を軽減するために、CorrEctoR(dubed DANCER)について述べる。
DANCERは、名前付きエンティティのAISHELL-1に対して、文字誤り率(CER)の約7%の削減により、強いベースラインである音声編集距離ベースNECモデル(PED-NEC)より優れている。
DANCERは、名前付きエンティティを含むHomophoneでテストすると、名前付きエンティティに対してPED-NECよりもCERが46%減少する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:59:09 GMT)
Checkpoint Merging via Bayesian Optimization in LLM Pretraining [10.7] 大規模言語モデル(LLM)の事前学習におけるチェックポイントマージを提案する。
提案手法はプレトレーニングの強化能力を示し,最小限のコストで実質的な利益を得る機会を提示する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:01:18 GMT)
MANUS: Markerless Grasp Capture using Articulated 3D Gaussians [10.5] 我々はArticulated 3D Gaussian を用いたマーカレスハンドオブジェクトグラフキャプチャー手法 MANUS を提案する。
我々は,手話の高忠実度表現のために3次元ガウススプラッティングを拡張する3次元ガウス表現を新たに構築する。
最も正確な結果を得るためには、現在のデータセットが提供していない何万ものカメラビューが必要です。そのために、30以上のシーン、3つの被写体、そして700万フレーム以上からなる50以上のカメラから見る手動物体の把握を含む新しいデータセットであるMANUS-Graspsを構築します。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:50:37 GMT)
DiffusionPoser: Real-time Human Motion Reconstruction From Arbitrary Sparse Sensors Using Autoregressive Diffusion [10.4] 限られた数のボディウーンセンサーからのモーションキャプチャーは、健康、人間のパフォーマンス、エンターテイメントに重要な応用がある。
最近の研究は、6つのIMUを用いて、特定のセンサー構成から全身の動きを正確に再構築することに焦点を当てている。
センサの任意の組み合わせから人の動きをリアルタイムで再現する単一拡散モデルDiffusionPoserを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:49:42 GMT)
MMM: Generative Masked Motion Model [10.2] MMM は Masked Motion Model に基づく,比較的単純なモーション生成パラダイムである。
あらゆる方向に動きやテキストトークンに参加することで、MMMはモーショントークンとテキストトークン間のセマンティックマッピングの間に固有の依存関係をキャプチャする。
MMMは、編集可能なモーション拡散モデルよりも1つの中距離GPUで2桁高速である。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:26:51 GMT)
FACTOID: FACtual enTailment fOr hallucInation Detection [10.2] RAGは、Large Language Modelsが生成したテキストがサポートされているか、矛盾しているかを確認するために、TE(textual Entailment)や同様の手法に依存している。
FEは、LLMが生成したコンテンツの事実的不正確な検出と、現実と矛盾する特定のテキストセグメントの強調を目的としている。
FEは、GPT-3、SpanBERT、RoFormerとともに、e5-mistral-7b-instructのような最先端(SoTA)のテキスト埋め込みを組み込んでいる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:09:42 GMT)
Leveraging Variational Autoencoders for Parameterized MMSE Estimation [10.1] 条件付き線形最小二乗誤差推定器のパラメータ化のための変分オートエンコーダに基づくフレームワークを提案する。
導出した推定器は、推定問題の生成前として変分オートエンコーダを用いて最小平均2乗誤差推定器を近似する。
提案手法と最小平均二乗誤差推定器の差分を限定して厳密な解析を行う。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:51:24 GMT)
IVLMap: Instance-Aware Visual Language Grounding for Consumer Robot Navigation [10.0] VLN(Vision-and-Language Navigation)は、人間の自然言語で写実的な環境を移動させるロボットを必要とする課題である。
近年の研究では,環境の意味的な空間地図表現を構築することで,この課題に対処することを目指している。
本稿では,インスタンスレベルおよび属性レベルのセマンティックマッピングをロボットに提供するために,インスタンス対応のビジュアル言語マップ(IVLMap)を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:52:42 GMT)
Synthesize Step-by-Step: Tools, Templates and LLMs as Data Generators for Reasoning-Based Chart VQA [9.7] 我々は,推論能力の強い大規模言語モデル(LLM)を自動データアノテータとして活用する。
私たちの方法における重要な革新は、Synthesize Step-by-Step戦略にあります。
我々は、チャートVQAモデルを大幅に強化し、ChartQAおよびPlotQAデータセットの最先端の精度を達成する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:45:44 GMT)
Quantifying and Mitigating Unimodal Biases in Multimodal Large Language Models: A Causal Perspective [9.6] 視覚質問応答問題におけるバイアスを解釈するための因果的枠組みを提案する。
因果グラフに触発され、12,000のVQAインスタンスからなる新しいMOREデータセットを導入する。
本稿では,MLLMの推論能力を高めるための2つの手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:09:36 GMT)
On the Power of the Weisfeiler-Leman Test for Graph Motif Parameters [9.6] k$次元Weisfeiler-Leman(k$WL)テストは、グラフ同型を検証するための広く認識されている方法である。
本稿では,ラベル付きグラフモチーフパラメータのWL次元を正確に評価する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:00:52 GMT)
Imperceptible Protection against Style Imitation from Diffusion Models [9.5] 私たちは人間の目に最も敏感な領域を特定する知覚マップを作成します。
次に、インスタンス認識の精細化によって導かれる保護強度を調整する。
その結果,保護効果を損なうことなく,保護画像の品質を著しく向上させることがわかった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:21:00 GMT)
Zero-shot Prompt-based Video Encoder for Surgical Gesture Recognition [9.4] 手術ビデオにおけるジェスチャー認識のための訓練済み視覚テキストモデル(CLIP)を微調整する。
実験の結果,プロンプトベースのビデオエンコーダはジェスチャー認識タスクにおいて,標準的なエンコーダよりも優れていた。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:10:54 GMT)
Detect-Order-Construct: A Tree Construction based Approach for Hierarchical Document Structure Analysis [9.3] 本稿では,複数のサブタスクを同時に処理する木構築手法を提案する。
このフレームワークに基づく効果的なエンドツーエンドソリューションを提案し,その性能を実証する。
本システムでは,2つの大規模文書レイアウト解析データセットの最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:40:08 GMT)
Semantic Map-based Generation of Navigation Instructions [9.2] 画像キャプションタスクとして問題をフレーミングすることでナビゲーション命令生成に新たなアプローチを提案する。
従来のアプローチでは、ナビゲーション命令を生成するために一連のパノラマ画像を使用する。
セマンティックマップを用いた命令生成のためのベンチマークデータセットを提案し、初期モデルを提案し、人に対して、生成した命令の質を手動で評価するよう依頼する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:27:44 GMT)
Img2Loc: Revisiting Image Geolocalization using Multi-modality Foundation Models and Image-based Retrieval-Augmented Generation [9.2] 画像位置情報をテキスト生成タスクとして再定義する新しいシステムであるImg2Locを提案する。
Img2LocはまずCLIPベースの表現を使用して画像ベースの座標クエリデータベースを生成する。
そして、クエリ結果と画像自体を一意に結合し、LMM用にカスタマイズされた精巧なプロンプトを形成する。
Im2GPS3kやYFCC4kのようなベンチマークデータセットでテストする場合、Img2Locは従来の最先端モデルのパフォーマンスを上回るだけでなく、モデルトレーニングなしでテストする。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:07:02 GMT)
Open Datasheets: Machine-readable Documentation for Open Datasets and Responsible AI Assessments [9.1] 本稿では、オープンデータセットのための、ノーコードで機械可読なドキュメントフレームワークを紹介する。
このフレームワークは、オープンデータセットの理解性とユーザビリティを改善することを目的としている。
このフレームワークは、研究や意思決定に使用されるデータの質と信頼性を高めることが期待されている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 02:20:36 GMT)
Empirical Analysis for Unsupervised Universal Dependency Parse Tree Aggregation [9.1] 依存関係解析はNLPにおいて必須のタスクであり、多くの下流タスクには依存性の品質が不可欠である。
様々なNLPタスクにおいて、アグリゲーション法は後処理のアグリゲーションに使われ、様々な品質の問題に対処することが示されている。
異なる非教師付き後処理アグリゲーション法を比較し、最も適した依存木構造アグリゲーション法を同定する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:27:10 GMT)
Entanglement Routing over Networks with Time Multiplexed Repeaters [8.9] 量子ネットワークは、量子リピータを使用することで、長距離のエンタングルメントで消費者にサービスを提供することができる。
グローバルリンク状態の知識は、2つの消費者間の絡み合いの発生率を最大化するために必要である。
本稿では、量子メモリのコヒーレンス時間要求を緩和するために、局所リンク状態の知識のみを必要とする2つの絡み合ったルーティングプロトコルを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 22:54:23 GMT)
Evaluating gesture generation in a large-scale open challenge: The GENEA Challenge 2022 [8.8] 本稿では、データ駆動型自動音声ジェスチャー生成のベンチマークのための第2回GENEA Challengeについて報告する。
10チームがフルボディとアッパーボディの2段階にわたる挑戦に参加した。
本研究では、ジェスチャー動作の人間的類似性と、特定の音声信号に対するその適切性について評価する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:59:24 GMT)
Concerned with Data Contamination? Assessing Countermeasures in Code Language Model [8.8] SEタスクのコード言語モデル(CLM)の機能を活用するために、さまざまなテクニックが提案されている。
データ汚染の脅威を軽減するために、さまざまな対策が提案されている。
汚染データと浄化データに対するCLMの性能差を調べた結果,これらの対策の効果について検討した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 05:00:47 GMT)
Human Gaussian Splatting: Real-time Rendering of Animatable Avatars [8.7] この研究は、マルチビュービデオから得られたフォトリアリスティックな人体アバターのリアルタイムレンダリングの問題に対処する。
本稿では,3次元ガウススプラッティングに基づくアニマタブルな人体モデルを提案する。
提案手法は, THuman4データセット上での最先端PSNRの改善を1.5dBで実現し, リアルタイムにレンダリングできる(512x512の80 fps)。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:07:28 GMT)
Algorithmic Ways of Seeing: Using Object Detection to Facilitate Art Exploration [8.7] 視覚的な探索のための設計プロセスにオブジェクト検出パイプラインを組み込む方法を示す。
本稿では,美術館のコレクションを探索するアプリの設計と開発について紹介する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 06:46:45 GMT)
Ungrammatical-syntax-based In-context Example Selection for Grammatical Error Correction [8.7] 本稿では,文法的誤り訂正のための非文法的シンタクスに基づく文内例選択手法を提案する。
具体的には,多種多様なアルゴリズムを用いた構文構造に基づいて文の類似度を測定し,テスト入力に最もよく似た不規則な構文を共有する最適なICL例を同定する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:05:57 GMT)
On permutation-invariant neural networks [8.6] Deep SetsやTransformersといったニューラルネットワークアーキテクチャの出現は、セットベースのデータ処理において大きな進歩を見せている。
この総合的な調査は、設定関数を近似するニューラルネットワークに関する様々な問題設定と進行中の研究の概観を提供することを目的としている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 22:28:02 GMT)
Random Vector Functional Link Networks for Function Approximation on Manifolds [8.5] ランダムな入力-隠蔽層重みとバイアスを持つ単一層ニューラルネットが実際に成功していることを示す。
さらに、このランダム化されたニューラルネットワークアーキテクチャをユークリッド空間の滑らかでコンパクトな部分多様体上の近似関数に適用する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:51:49 GMT)
WoLF: Large Language Model Framework for CXR Understanding [8.3] 胸部X線理解のための広スコープ大言語モデルフレームワークを提案する。
実際の臨床シナリオにおける正確な診断に利用される多面的患者の記録を収集する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:40:05 GMT)
Expectations Versus Reality: Evaluating Intrusion Detection Systems in Practice [8.3] 最高のソリューションはないが、データセット内の攻撃の種類、複雑性、ネットワーク環境など、外部変数に依存している。
ディープニューラルネットワークソリューションは、テストされたデータセットの平均F1スコアが最も高かったが、必ずしも最高のパフォーマンスであるとは限らない。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:02:35 GMT)
Gaining the Sparse Rewards by Exploring Lottery Tickets in Spiking Neural Network [8.2] スパイキングニューラルネットワーク(SNN)は、従来のニューラルネットワーク(ANN)よりも低レイテンシで低エネルギーな性質のため、有望なソリューションを提供する。
本稿では, スパイキング型LT (SLTs) について検討し, その特性と極端な効率性について検討した。
Patch Embedding Projection (ConvPEP)モジュールに畳み込み操作を組み込んだスパイキングトランスフォーマー構造に適したスパースアルゴリズムが提案されている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 02:24:38 GMT)
OST: Refining Text Knowledge with Optimal Spatio-Temporal Descriptor for General Video Recognition [8.2] 我々は、一般化可能なビデオ認識を容易にするために、テキスト知識の洗練を優先する。
カテゴリー名の区別の少ない意味空間の限界に対処するため、我々は大規模言語モデル (LLM) を推し進める。
我々の最良のモデルは、Kinetics-600で最先端のゼロショット精度75.1%を達成する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:25:27 GMT)
Improved Genetic Algorithm Based on Greedy and Simulated Annealing Ideas for Vascular Robot Ordering Strategy [8.0] 本研究では,医療環境におけるABLVR血管ロボットの獲得,利用,維持を最適化するための包括的アプローチを提案する。
ダイナミックな医療環境を考えると、ロボット船やオペレーターのためのロバストな資源配分モデルを含む。
演算子に対する適応学習プロセスのユニークな要件と,ロボット部品のメンテナンスニーズを取り入れた。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:14:03 GMT)
DoseDiff: Distance-aware Diffusion Model for Dose Prediction in Radiotherapy [7.9] 線量分布を正確に予測するための距離認識拡散モデル(DoseDiff)を提案する。
その結果,ドセディフ法は定量的性能と視覚的品質の両方の観点から,最先端の線量予測法よりも優れていた。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:05:23 GMT)
Reinforcement Learning in Agent-Based Market Simulation: Unveiling Realistic Stylized Facts and Behavior [7.8] 投資家や規制当局は、現実の市場における意思決定の結果を予測できる現実的な市場シミュレーターの恩恵を受けることができる。
伝統的なルールベースの市場シミュレータは、しばしば市場の参加者のダイナミックな振る舞いを正確に把握するのに不足する。
本研究では,強化学習(RL)エージェントを用いたエージェントベースシミュレーションフレームワークについて検討する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:06:50 GMT)
SAID-NeRF: Segmentation-AIDed NeRF for Depth Completion of Transparent Objects [7.5] 市販のRGB-Dカメラを使って透明物体の正確な深度情報を取得することは、コンピュータビジョンとロボティクスにおいてよく知られた課題である。
NeRFは学習のないアプローチであり、新しいビューの合成と形状回復に広く成功している。
提案したAID-NeRF法は,透明物体とロボットグルーピングのための深度補完データセットに有意な性能を示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:28:32 GMT)
Prompt Space Optimizing Few-shot Reasoning Success with Large Language Models [7.5] プロンプトエンジニアリングにより、算術的推論、質問応答、要約、関係抽出、機械翻訳、感情分析などの様々なタスクにおいて、大きな言語モデル(LLM)が優れている。
現在のアプローチでは、最適なプロンプトを決定するための厳密な数学的解決策が欠如している。
提案手法では,テキスト埋め込みを用いて行列分解による基底ベクトルを取得し,すべてのプロンプトを表す空間を構築する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:23:59 GMT)
Biased Over-the-Air Federated Learning under Wireless Heterogeneity [7.4] OTAデバイスプリスケーラの設計について,OTA-FL収束に着目して検討した。
最小ノイズ分散と最小ノイズ分散ゼロバイアス解の2つの解を同定する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:52:15 GMT)
Direct Superpoints Matching for Robust Point Cloud Registration [7.3] 本稿では,グローバルなマッチング方式でスーパーポイントの対応を見つけるための,シンプルで効果的なベースラインを提案する。
我々の単純で効果的なベースラインは、3つのデータセットの最先端メソッドと同等かそれ以上の結果を示している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:55:39 GMT)
RFAConv: Innovating Spatial Attention and Standard Convolutional Operation [7.3] RFA(Receptive-Field Attention)と呼ばれる新しい注意機構を提案する。
RFAは受容場空間的特徴に重点を置いているが、大規模な畳み込みカーネルに対して効果的な注意重みを与える。
計算コストとパラメータのほとんど無視可能な増加を提供すると同時に、ネットワーク性能も大幅に向上する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:07:44 GMT)
ChatTracer: Large Language Model Powered Real-time Bluetooth Device Tracking System [7.2] LLMを利用したリアルタイムBluetoothデバイストラッキングシステムChatTracerを提案する。
ChatTracerはBluetoothスニッフィングノード、データベース、微調整LDMからなる。
4つのスニッフィングノードを持つChatTracerのプロトタイプを開発しました。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:04:11 GMT)
RAPGen: An Approach for Fixing Code Inefficiencies in Zero-Shot [7.1] 本稿では,RAPGen(Retrieval-Augmented Prompt Generation)と呼ばれる新しい手法を提案する。
パフォーマンス問題のあるコードスニペットが与えられた後、RAPGenは最初に、以前のパフォーマンスバグ修正の事前構築された知識ベースからプロンプトを検索する。
RAPGenは60%のケースで開発者と同等かそれ以上のパフォーマンス改善提案を生成することができ、そのうち42%が冗長である。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 00:09:13 GMT)
RowPress: Amplifying Read Disturbance in Modern DRAM Chips [7.0] RowPressは、DRAM行を長時間開いておくことで、メモリアイソレーションを壊します。
極端な場合、RowPressは隣接する行が一度だけアクティベートされたときにDRAM行のビットフリップを誘導する。
164個の実DDR4 DRAMチップの詳細な特徴は、RowPressが3大DRAMメーカーのすべてのチップに影響を与えることを示している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:34:51 GMT)
Code Comparison Tuning for Code Large Language Models [7.0] コード大言語モデル(Code LLM)の単純かつ効果的なチューニング手法であるコード比較チューニング(CCT)を提案する。
CCTは、トークンレベルとシーケンスレベルの両方において、比較の概念を命令チューニングに統合する。
CCTがpass@1スコアの命令チューニングを最大4ポイント上回っていることを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:25:23 GMT)
NaijaHate: Evaluating Hate Speech Detection on Nigerian Twitter Using Representative Data [7.0] ヘイトスピーチ検出(HSD)にアノテートされた最初のデータセットであるNaijaHateを紹介する。
文献で伝統的に用いられてきたバイアス付きデータセットを用いて評価されたHSDは、代表データに基づいて実世界のパフォーマンスを過大評価している。
また、ナイジェリアのTwitterコンテキストに合わせて事前訓練されたモデルであるNaijaXLM-Tを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:34:31 GMT)
Plug-and-Play Grounding of Reasoning in Multimodal Large Language Models [7.0] P2GはMLLMにおける推論のプラグ・アンド・プレイグラウンドのためのフレームワークである。
P2GBは、高解像度画像に挑戦する際のオブジェクト間の関係やテキストを理解するMLLMの能力を評価するためのベンチマークである。
私たちの研究は、推論のプラグ&プレイグラウンド化の可能性を強調し、モデルスケーリング以外の有望な選択肢を開放します。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:26:30 GMT)
SA-GS: Scale-Adaptive Gaussian Splatting for Training-Free Anti-Aliasing [6.9] 抗エイリアス・ガウス・スティング(SA-GS)のためのスケール適応法を提案する。
SA-GSは、任意の事前訓練されたガウススプラッティングフィールドにプラグインとして適用することができ、フィールドのアンチサーシング性能を著しく改善することができる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:32:58 GMT)
STREAM: Spatio-TempoRal Evaluation and Analysis Metric for Video Generative Models [6.9] ビデオ生成モデルは、短いビデオクリップを生成するのに苦労する。
現在のビデオ評価メトリクスは、埋め込みをビデオ埋め込みネットワークに切り替えることによって、画像メトリクスの単純な適応である。
本稿では,空間的側面と時間的側面を独立に評価するために一意に設計された新しいビデオ評価指標STREAMを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 04:45:23 GMT)
H2ASeg: Hierarchical Adaptive Interaction and Weighting Network for Tumor Segmentation in PET/CT Images [6.8] PET(Positron emission tomography)とCT(Computed tomography)の併用は、がんの診断や予後に日常的に用いられている。
従来のマルチモーダルセグメンテーションソリューションは、モダリティ融合の連結演算に依存している。
本稿では,H2ASeg と呼ばれる階層型適応的相互作用と重み付けネットワークを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:46:25 GMT)
Trust in AI: Progress, Challenges, and Future Directions [6.7] 私たちの日常生活における人工知能(AI)システムの利用の増加は、ユーザの視点からAIにおける信頼と不信の重要性を説明してくれます。
AIにおける信頼/不信は規制官の役割を担い、この拡散のレベルを著しく制御することができる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:13:35 GMT)
A Simple and Effective Point-based Network for Event Camera 6-DOFs Pose Relocalization [6.7] イベントカメラは、高いダイナミックレンジ、非同期性、低レイテンシなどの顕著な特性を示す。
これらのカメラは、イベント中の動きや深度情報を暗黙的に捉え、カメラポーズ・リローカライゼーション(CPR)タスクのためのセンサーをアピールする。
イベントに基づく既存のCPRネットワークは、イベントにおける重要な微粒な時間情報を無視し、不満足なパフォーマンスをもたらす。
PEPNetは,6自由度(6-DOF)イベントカメラのポーズを抑えるために設計された,シンプルで効果的なポイントベースネットワークである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:36:00 GMT)
CRKD: Enhanced Camera-Radar Object Detection with Cross-modality Knowledge Distillation [6.7] 我々は,LC検出器とCR検出器のパフォーマンスギャップを,新しいクロスモダリティKDフレームワークで橋渡しするカメラレーダー知識蒸留(CRKD)を提案する。
そこで本研究では,教師モデルから重要な特徴を学習するための蒸留損失を4つ提案する。
提案するCRKDフレームワークの有効性を示すため,nuScenesデータセットについて広範囲な評価を行った。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 02:39:45 GMT)
Superfluid Oscillator Circuit with Quantum Current Regulator [6.7] ボース・アインシュタイン凝縮体の2つの貯留層を接続するメソスコピックチャネルからなる超流動回路における原子電流の特性について検討した。
その結果,回路は電圧制限機構と電流制限機構の両方の特徴を示すことがわかった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:42:06 GMT)
Dataverse: Open-Source ETL (Extract, Transform, Load) Pipeline for Large Language Models [6.7] 大規模言語モデル(LLM)のためのETLパイプラインであるDataverseを提案する。
Dataverseにブロックベースのインターフェースを備えたカスタムプロセッサを簡単に追加することで、Dataverseを簡単かつ効率的に使用して独自のパイプラインを構築することができる。
本稿では,システムの性能と実装を解説した,簡潔で2分間のデモ映像を提供する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:57:08 GMT)
Fake or JPEG? Revealing Common Biases in Generated Image Detection Datasets [6.6] AI生成画像検出のための多くのデータセットには、JPEG圧縮と画像サイズに関するバイアスが含まれている。
我々は、検出器が本当にこれらの望ましくない要因から学習できることを実証した。
これにより、ResNet50とSwin-T検出器のクロスジェネレータ性能が11%以上向上する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:24:16 GMT)
Metric Learning from Limited Pairwise Preference Comparisons [6.5] 理想点モデルに基づく選好比較から計量学習を研究する。
一般に、$o(d)$比較は、無限に多くのユーザでさえ、計量に関する情報を示さないことを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:46:25 GMT)
Improving Clinical NLP Performance through Language Model-Generated Synthetic Clinical Data [6.5] 本研究では,先進言語モデルから生成された合成データを利用して,臨床自然言語処理性能の向上を図る。
評価結果は、そのような高い領域で実現可能な応用を示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:44:18 GMT)
Exploring Accurate 3D Phenotyping in Greenhouse through Neural Radiance Fields [6.3] コントロールされた実験室環境における伝統的な表現型付けは、価値はあるものの、実際の環境下での植物の成長を理解するには不十分である。
本研究では, 温室環境下でのトウガラシの個体内表現の精度を高めるために, ニューラル放射場を用いた学習に基づく表現法について検討した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:21:30 GMT)
Benchmarking Implicit Neural Representation and Geometric Rendering in Real-Time RGB-D SLAM [6.2] インプシット・ニューラル表現(INR)と幾何学的レンダリングの組み合わせは、リアルタイム高密度RGB-D SLAMに採用されている。
我々は、広く使われているINRとレンダリング関数の幅広いスペクトルの性能を評価するための、最初のオープンソースのベンチマークフレームワークを構築した。
RGB-D SLAMシステムに対応するために,高忠実度高密度グリッドマッピングのための明示的なハイブリッド符号化を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:59:56 GMT)
Zero-shot Referring Expression Comprehension via Structural Similarity Between Images and Captions [6.2] ゼロショット参照表現理解は、提供されるテキストプロンプトに対応する画像内のバウンディングボックスをローカライズすることを目的としている。
既存の視覚言語アライメントモデル、例えばCLIPは両方の側面で苦労しているため、このタスクに直接使用することはできない。
我々は、大きな基礎モデルを活用して、画像とテキストの両方を(オブジェクト、述語、オブジェクト)の形式で三つ子に分解する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:23:15 GMT)
Clustering MOOC Programming Solutions to Diversify Their Presentation to Students [6.2] 私たちは、人気のあるMOOCプラットフォームであるHyperskill上のPythonのサブミッションに、JPlagというプラジャリズム検出ツールを適応させました。
ツールの内部アルゴリズムのため、研究対象となったタスクは867件中46件に過ぎなかった。
我々はJPlagが処理するタスクの5.3%と残りの94.7%でRhubarbを使用するシステムを開発した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:18:49 GMT)
Single-Shared Network with Prior-Inspired Loss for Parameter-Efficient Multi-Modal Imaging Skin Lesion Classification [6.2] マルチモーダルアプローチを導入し,マルチスケールな臨床・皮膚内視鏡的特徴を1つのネットワークに効率的に統合する。
提案手法は,現在進行している手法と比較して,精度とモデルパラメータの両面で優位性を示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:00:14 GMT)
Learning to Optimise Climate Sensor Placement using a Transformer [6.2] 深部強化学習(RL)法を用いた学習改善に焦点を当てた新しいセンサ配置手法を提案する。
提案手法は,政策ネットワークをトレーニングするためのアクター・クリティカル・アルゴリズムによって駆動される学習改善のためのRL定式化を利用する。
本研究は,気候センサ配置問題に先進的なDL RL技術を適用するための有望な方向性を示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 00:52:59 GMT)
On the Two Sides of Redundancy in Graph Neural Networks [6.1] 我々は近所の木に基づく新しい集約手法を開発した。
近傍木をコンパクトに表現し,それらをマージし,計算冗長性を生かした。
我々の手法は従来のメッセージパッシングニューラルネットワークよりも過度に理解されにくい。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:56:25 GMT)
Integrating behavior analysis with machine learning to predict online learning performance: A scientometric review and empirical study [6.1] 本研究では,学習行動分析をMLアルゴリズムと組み合わせて学習者のオンライン学習成績の予測精度を高める統合フレームワークを提案する。
その結果,本フレームワークは,自律的な学生にほぼ完璧な予測性能を与え,モチベーションのある学生に満足できる性能を与えることがわかった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:29:02 GMT)
Towards Stable Machine Learning Model Retraining via Slowly Varying Sequences [6.1] 我々は、異なるデータバッチ更新間で機械学習モデルを再学習する問題について、一意に考察する混合整数最適化アルゴリズムを開発した。
本手法は, モデル性能が小さめ, 制御可能な犠牲を負うモデルよりも安定性が強いことを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 22:45:38 GMT)
DeNetDM: Debiasing by Network Depth Modulation [5.9] DeNetDMは、浅層ニューラルネットワークが学習コア属性を優先するのに対して、より深いものは、異なる情報を取得することを課題とする際のバイアスを強調するという観察に基づく、新しいデバイアス手法である。
提案手法は,データ内のバイアス強調点の多様性を効果的に活用し,従来の手法を超越し,バイアス強調点の多様性を高めるための明示的な拡張に基づく手法の必要性を回避している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 22:17:19 GMT)
Parallel and real-time post-processing for quantum random number generators [5.9] 本研究では、FPGAにおける複数シードリアルタイム更新トエプリッツハッシュ抽出器の並列およびリアルタイム実装について検討し、並列QRNGを実現する。
高性能ADCを用いて,20Gbpsを超えるランダム数生成率を得た。
これは、チップベースの並列QRNGへの重要なステップであり、信頼性、デバイス非依存、セミデバイス非依存のシナリオにおけるCVQRNGの実用性を高めている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:05:39 GMT)
AlloyBERT: Alloy Property Prediction with Large Language Models [5.8] 本研究は, テキスト入力による合金特性の予測を目的とした変圧器エンコーダモデル, AlloyBERTを紹介する。
テキストデータに基づいてトレーニングされたトークン化器とRoBERTaエンコーダを組み合わさることで,Multi principal Elemental Alloys (MPEA)データセットにおける平均2乗誤差(MSE)が0.00015,Refractory Alloy Yield Strength (RAYS)データセットで0.00611に達した。
本研究は,材料科学における言語モデルの可能性を強調し,合金特性のテキストベース予測のための基礎的枠組みを構築した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:09:46 GMT)
Policy-Space Search: Equivalences, Improvements, and Compression [5.8] 完全な観測不可能な非決定論的計画(FOND)は、不確実性を伴う人工知能計画の中核にある。
A* with Non-Determinism (AND*)は、FOND計画のためにA*を一般化するFONDプランナーである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 23:40:20 GMT)
Enhancing Efficiency in Vision Transformer Networks: Design Techniques and Insights [5.8] 本稿では、視覚変換器(ViT)ネットワークにおける注意機構の設計手法と洞察を包括的に探求する。
再設計したアプローチを応用した,ViT内の様々な注意機構の系統分類法を提案する。
この分析には、新規性、強み、弱み、そして提案された様々な戦略の詳細な評価が含まれる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 23:31:59 GMT)
Asymmetric and trial-dependent modeling: the contribution of LIA to SdSV Challenge Task 2 [5.8] 本稿では,実験室の話者認識分野への貢献について述べる。
提案手法は,SdSv評価におけるそれらの妥当性と効率を実験的に示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:49:31 GMT)
Oh! We Freeze: Improving Quantized Knowledge Distillation via Signal Propagation Analysis for Large Language Models [5.7] 大規模言語モデル(LLM)や拡散モデルといった大規模な生成モデルは、それぞれNLPとコンピュータビジョンの分野に革命をもたらした。
本研究では, 知識蒸留(KD-QAT)を用いた軽量量子化対応微調整技術を提案し, 4ビット量化LDMの性能向上を図る。
我々は, ovフリーズがほぼ浮動小数点精度, すなわちCommonsense Reasoningベンチマークにおいて0.7%未満の精度で精度を低下させることを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:22:31 GMT)
OffLanDat: A Community Based Implicit Offensive Language Dataset Generated by Large Language Model Through Prompt Engineering [5.6] ヘイトスピーチや攻撃的な言語は、明示的な形と暗黙的な形の両方に存在する。
OffLanDatはコミュニティベースの暗黙的な攻撃的な言語データセットである。
本稿では、暗黙の攻撃的言語を効果的に生成するプロンプトベースのアプローチを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:44:48 GMT)
Attending to Graph Transformers [5.6] グラフのトランスフォーマーアーキテクチャは、グラフを用いた機械学習の確立した技術に代わるものとして登場した。
ここでは、グラフトランスフォーマーアーキテクチャの分類を導き、この新興分野に何らかの秩序をもたらす。
グラフ変換器は, グラフ特性の回復, ヘテロ親水性グラフの処理能力, 過度なスキャッシングを防ぐ程度について検討する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:35:01 GMT)
Task2Morph: Differentiable Task-inspired Framework for Contact-Aware Robot Design [5.5] 本稿では,タスク2Morphと呼ばれる接触認識型ロボット設計のための,新しい識別可能なタスクインスパイアされたフレームワークを提案する。
そこでは,マッピング学習と全最適化の両方に勾配情報を活用した,微分可能なロボット設計プロセスにマッピングを組み込む。
実験は3つのシナリオで実施され,Task2MorphがDiffHandより優れていることが確認された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 02:02:00 GMT)
Brant-2: Foundation Model for Brain Signals [5.5] 基礎的なモデルは、大量のラベルのないデータに対する事前トレーニングの恩恵を受ける。
脳信号における最大の基礎モデルであるBrant-2を提示する。
広範囲なタスクを実験することにより、Brant-2が脳信号の様々な応用シナリオに適応可能であることを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:55:31 GMT)
ECoDepth: Effective Conditioning of Diffusion Models for Monocular Depth Estimation [5.2] パララックスの手がかりがない場合、学習に基づく単一画像深度推定モデルは、画像のシェーディングと文脈的手がかりに大きく依存する。
このようなモデルを、キャプチャが難しい大規模で多様なデータセットでトレーニングする必要がある。
CLIPのようなトレーニング済みの基礎モデルからの埋め込みを使用することで、いくつかのアプリケーションにおけるゼロショット転送が改善される。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:01:34 GMT)
FewUser: Few-Shot Social User Geolocation via Contrastive Learning [5.1] FewUserはFew-shotソーシャルユーザー位置情報の新しいフレームワークである。
FewUserは、事前訓練された言語モデル(PLM)を利用して、多様なソーシャルメディア入力を効果的に処理し、融合するユーザ表現モジュールを備えている。
本研究では、ユーザ表現が位置情報性能に与える影響を総合的に分析する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:59:59 GMT)
RT-SRTS: Angle-Agnostic Real-Time Simultaneous 3D Reconstruction and Tumor Segmentation from Single X-Ray Projection [5.0] RT-SRTSは、マルチタスク学習(MTL)に基づく1つのネットワークに3Dイメージングと腫瘍セグメンテーションを統合する。
提案法は15例を対象に評価し, 最先端の3例と比較した。
同時再建と分節を約70ミリ秒で完了させることができ、リアルタイム腫瘍追跡に必要な時間しきい値よりもはるかに高速である。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:20:33 GMT)
Naming Practices of Pre-Trained Models in Hugging Face [5.0] PTM(Pre-Trained Models)は、コンピュータシステムにおいて、デプロイ前に品質や性能に適応するために使用される。
エンジニアはデプロイメント前に品質やパフォーマンスに適応する。
以前の調査では、モデル名は必ずしも適切に選択されている訳ではなく、時に誤っている、と報告されていた。
本稿では,Hugging Face PTMレジストリにおいて,PTM命名の実践に関する実証的研究を行った。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 20:12:16 GMT)
Exploiting Individual Graph Structures to Enhance Ecological Momentary Assessment (EMA) Forecasting [5.0] 本研究では,GNN(Recurrent and Temporal Graph Neural Networks)の性能について検討する。
また,異なる特徴を持つグラフの構築がGNNの性能に与える影響についても検討した。
学習過程で動的に洗練されるGNN学習グラフの評価を行った。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:11:40 GMT)
Feature Unlearning for Pre-trained GANs and VAEs [4.8] 我々は、事前訓練された画像生成モデル、GANとVAEから特徴学習を行う問題に取り組む。
我々は,事前学習した生成モデルから,顔画像のヘアスタイルなどの特定の特徴を解き放つことを目的としている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:48:40 GMT)
AssetHarvester: A Static Analysis Tool for Detecting Assets Protected by Secrets in Software Artifacts [4.8] AssetHarvesterは、リポジトリ内のシークレットとアセスメントのペアを検出する静的解析ツールです。
我々は188のパブリックリポジトリから抽出した4種類のデータベースの1,791のシークレットアセスメントペアのベンチマークをキュレートした。
以上の結果から, AssetHarvester を用いたデータフロー解析は, 偽陽性0%のシークレット・アセスメント・ペアを検出することが示唆された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 00:24:49 GMT)
Learning to reconstruct the bubble distribution with conductivity maps using Invertible Neural Networks and Error Diffusion [4.7] 電解時に発生するガスバブルは反応を妨げ、セル効率を低下させ、エネルギー消費を増加させる。
Invertible Neural Networks (INNs) を用いて導電性フィールドを再構築する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:33:42 GMT)
GANTASTIC: GAN-based Transfer of Interpretable Directions for Disentangled Image Editing in Text-to-Image Diffusion Models [4.7] GANTASTICは、事前学習したGANモデルから既存の方向を抽出し、これらの方向を拡散モデルに転送する新しいフレームワークである。
このアプローチは、拡散モデルが知られている生成的品質と多様性を維持するだけでなく、正確なターゲット画像編集を行う能力を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:55:16 GMT)
The Role of Syntactic Span Preferences in Post-Hoc Explanation Disagreement [4.6] 言語学的観点から,手法間の不一致の潜在的な源泉について検討する。
異なる手法が、異なる種類の単語を体系的に選択し、他の手法と最もよく一致し、人間が類似した言語的嗜好を示す方法が見つかる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:56:23 GMT)
Gegenbauer Graph Neural Networks for Time-varying Signal Reconstruction [4.6] 時間変化グラフ信号は、幅広い応用を伴う機械学習と信号処理において重要な問題である。
本稿では,下流タスクの精度を高めるために学習モジュールを組み込んだ新しい手法を提案する。
提案手法の有効性を評価するために,実データセットに関する広範な実験を行った。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:29:17 GMT)
Expanding Chemical Representation with k-mers and Fragment-based Fingerprints for Molecular Fingerprinting [4.6] 本研究では,サブストラクチャカウント,$k$-mers,Daylightのような指紋を組み合わせることで,SMILES文字列の化学構造の表現を拡大する手法を提案する。
本発明の統合方法は、識別力及び情報内容を高める包括的分子埋め込みを生成する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:36:07 GMT)
New Semantic Task for the French Spoken Language Understanding MEDIA Benchmark [4.4] 音声言語理解(SLU)の基本課題はインテント分類とスロット充足である
約15年間,両モデルが協調的に達成し,相互強化を生かしたモデルが提案されてきた。
ジョイントモデルを用いた多言語モジュールが計画され、ヨーロッパのプロジェクトのための観光対話システムを構築した。
MEDIAデータセットを含む複数のデータセットの組み合わせが、このジョイントモデルをトレーニングするために提案された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:40:02 GMT)
A Benchmark Evaluation of Clinical Named Entity Recognition in French [4.4] バイオメディカルモデルであるCamemBERT-bioとDrBERTを評価し,標準フランスのモデルであるCamemBERT,FrauBERT,FrALBERTと比較した。
その結果,CamemBERT-bioはDrBERTを一貫して上回り,FrauBERTは競争性能を示し,FrAlBERTは最も低い炭素プリントを達成することが示唆された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:59:58 GMT)
Complete Neural Networks for Complete Euclidean Graphs [4.4] 点雲の集中型グラム行列に3WLグラフ同型テストを適用することにより、点雲を完全に決定できることを示す。
次に、中程度の大きさのユークリッドグラフニューラルネットワークによって、我々の完全なユークリッドテストがどのようにシミュレートされるかを示し、その分離能力を高度に対称な点雲上で実証する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:45:43 GMT)
With Trail to Follow: Measurements of Real-world Non-fungible Token Phishing Attacks on Ethereum [4.3] NFTフィッシング攻撃の新しい手段が生態系に現れたという逸話が増えている。
既存の研究のほとんどは、ブロックチェーン上のネイティブ暗号通貨のフィッシング詐欺アカウントの検出に重点を置いている。
新興NFTのフィッシング攻撃の分野では、研究の欠如がある。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:51:04 GMT)
An Efficient Quantum Algorithm for Linear System Problem in Tensor Format [4.3] 本稿では,最近のアディバティック・インスパイアされたQLSAの進歩に基づく量子アルゴリズムを提案する。
実装の全体的な複雑さは、その次元において多対数的であることを厳密に示します。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 20:37:32 GMT)
Arbitrary State Transition of Open Qubit System Based on Switching Control [4.2] 開キュービット系における任意の状態遷移に対するリアプノフ制御に基づくスイッチング制御戦略を提案する。
コヒーレントベクトル表現を用いて、量子ビットの状態が不変集合や特異値集合に入るのを防ぐことができるスイッチング制御戦略を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:17:27 GMT)
Generalization bounds for learning under graph-dependence: A survey [4.2] 我々は、例が依存する学習シナリオと、それらの依存関係が依存グラフによって記述される学習シナリオについて検討する。
グラフ依存的な濃度境界を収集し、ラデマッハの複雑性と安定性の一般化を導出する。
私たちの知る限りでは、この調査はこの種の調査としては初めてである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:38:18 GMT)
Evolving Assembly Code in an Adversarial Environment [4.2] CodeGuruコンペティションのアセンブリコードを進化させます。
コンペティションの目標は、最も長い共有メモリを実行する組立プログラムであるサバイバルを作ることだ。
我々は,CodeGuruゲームにおいて,人手による勝利者に対するサバイバルの評価を行った。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:21:23 GMT)
Vision-Language Synthetic Data Enhances Echocardiography Downstream Tasks [4.2] 本稿では,近年の視覚言語モデルを用いて,多彩でリアルな人工心エコー画像データを作成する。
合成データに含まれるリッチな文脈情報は、下流タスクの精度と解釈可能性を高める可能性があることを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 23:26:45 GMT)
CAP: A General Algorithm for Online Selective Conformal Prediction with FCR Control [4.1] 全体の誤発見レベルを測定するために,FCR (Real-time false coverage-statement rate) を制御することが重要である。
キャリブレーションセットを構築するために,過去のデータに対して適応的なピックルールを実行するCAPというフレームワークを開発した。
我々は,CAPが有限サンプルおよび分布自由な状態において,厳密な選択条件のカバレッジ保証を達成できることを証明した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:20:13 GMT)
Tiny Graph Neural Networks for Radio Resource Management [4.1] 無線リソース管理のための低ランクメッセージパッシンググラフニューラルネットワーク(LR-MPGNN)を提案する。
LR-MPGNNの基盤は、従来の線形層を低ランク層に置き換える低ランク近似手法の実装である。
提案するLR-MPGNNモデルの性能を,いくつかの指標に基づいて評価する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 04:35:27 GMT)
Joint torques prediction of a robotic arm using neural networks [4.0] 動的モデルを導出する伝統的なアプローチは、ラグランジュ力学やニュートン力学の応用に基づいている。
一般的な代替手段は、"ブラックボックス"方法論のコンテキストにおける機械学習(ML)技術の適用である。
本稿では,実際の6自由度マニピュレータ(DoF)に対するこのアプローチの経験について報告する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:38:26 GMT)
Human-compatible driving partners through data-regularized self-play reinforcement learning [4.0] HR-PPO(Human-Regularized PPO)は、エージェントが人間の参照ポリシーから逸脱する小さなペナルティで自己プレイを通じて訓練されるマルチエージェントアルゴリズムである。
その結果,HR-PPOは93%,オフロード率3.5%,衝突率3%の目標達成に極めて有効であることがわかった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:56:56 GMT)
Graph Neural Networks for Carbon Dioxide Adsorption Prediction in Aluminium-Exchanged Zeolites [3.9] 分子シミュレーションと比較して吸着特性が4~5桁高速なモデルを提案する。
機械学習モデルから得られた予測はモンテカルロシミュレーションから得られた値と一致している。
このモデルは, 吸着部位の同定に有効であることを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:19:21 GMT)
Improving Adversarial Data Collection by Supporting Annotators: Lessons from GAHD, a German Hate Speech Dataset [3.9] GAHDは,1,11kの例を含む新しいドイツ語のアディバーショナル・ヘイト音声データセットである。
実験の結果,最先端のヘイトスピーチ検出モデルにおいても,結果のデータセットは困難であることが判明した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:44:14 GMT)
Deep Reinforcement Learning: A Convex Optimization Approach [3.9] 本稿では,各エピソード毎に凸最適化を用いて,最適な$Q$関数の2層ニューラルネットワーク近似を求める。
安定な非線形系に対しては、アルゴリズムが収束し、トレーニングされたニューラルネットワークの収束パラメータを最適なニューラルネットワークパラメータに任意に近づけることができることを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:59:03 GMT)
FlexEdit: Flexible and Controllable Diffusion-based Object-centric Image Editing [3.9] オブジェクトのフレキシブルでコントロール可能な編集フレームワークであるFlexEditを紹介します。
FlexEditブロックを使用して、各denoisingステップでレイトを反復的に調整します。
当社のフレームワークでは,デノナイズ時に自動的に抽出されるアダプティブマスクを用いて,背景の保護を行う。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:56:07 GMT)
Can Language Models Pretend Solvers? Logic Code Simulation with LLMs [3.8] トランスフォーマーベースの大規模言語モデル(LLM)は、論理問題に対処する上で大きな可能性を示している。
この研究は、論理コードシミュレーションという新しい側面に発展し、論理プログラムの結果を予測するために論理解法をエミュレートするよう LLM に強制する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 06:56:47 GMT)
Automatic Classification of Subjective Time Perception Using Multi-modal Physiological Data of Air Traffic Controllers [3.7] 本稿では,航空管制官の主観的時間知覚を自動的に評価する手法を提案する。
生理データは、光胸腺図、電球活動、温度データから成っている。
サポートベクトル分類器は, 79 %の精度で最適であることがわかった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:15:10 GMT)
Cross-Attention is Not Always Needed: Dynamic Cross-Attention for Audio-Visual Dimensional Emotion Recognition [3.6] 本研究では,動的クロスアテンション(DCA)を提案する。
本稿では,RECOLAとAff-Wild2データセットに対する提案手法の性能評価を行う。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:38:04 GMT)
Situation Awareness for Driver-Centric Driving Style Adaptation [3.6] 本稿では,車両データに基づいて事前学習した視覚特徴エンコーダに基づく状況認識型運転スタイルモデルを提案する。
実験の結果,提案手法は静的な運転スタイルを著しく上回り,高い状況クラスタを形成していることがわかった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:19:16 GMT)
KazSAnDRA: Kazakh Sentiment Analysis Dataset of Reviews and Attitudes [3.5] KazSAnDRAは、様々な情報源から得られた180,064のレビューを幅広く収集し、1から5までの数値評価を含んでいる。
この研究は、4つの機械学習モデルの開発と評価を通じて、カザフ語感情分類の自動化も追求した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:51:11 GMT)
Coexistence of non-Hermitian skin effect and extended states in one-dimensional nonreciprocal lattices [3.4] スタッガートオンサイト変調と非相互ホッピングを持つ一次元非エルミート格子について検討する。
非相反ホッピングとオンサイト調節の相互作用は皮膚効果の方向を逆転させる可能性がある。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:59:28 GMT)
MIST: Mitigating Intersectional Bias with Disentangled Cross-Attention Editing in Text-to-Image Diffusion Models [3.3] 本稿では,拡散型テキスト・画像モデルにおける交叉バイアスに対処する手法を提案する。
提案手法では,事前学習した安定拡散モデルを用いて,参照画像の追加の必要性を排除し,未修正概念の本来の品質を維持する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:54:38 GMT)
Mixed Preference Optimization: Reinforcement Learning with Data Selection and Better Reference Model [3.3] 大きな言語モデル(LLM)は、自然言語の処理と生成能力によって、ますます人気が高まっている。
大量のテキストのデータセットでトレーニングされているため、LLMは有害なバイアスを継承し、人間の値と一致しない出力を生成することができる。
本稿では,人間フィードバックを用いた強化学習(RLHF)と直接選好最適化(DPO)のような対照的な学習手法の2つのLLMアライメントについて検討する。
RLHFとDPOの安定性とロバスト性を解析することにより,両手法の弱点を緩和する新しい手法MPOを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:15:10 GMT)
The FormAI Dataset: Generative AI in Software Security Through the Lens of Formal Verification [3.3] 本稿では,脆弱性分類を伴う112,000のAI生成Cプログラムの大規模なコレクションであるFormAIデータセットを提案する。
すべてのプログラムには、型、行番号、脆弱な関数名を示すソースコード内の脆弱性がラベル付けされている。
ソースコードは112,000のプログラムで利用でき、各プログラムで検出された脆弱性を含む別のファイルが付属する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:52:02 GMT)
The Relational Bottleneck as an Inductive Bias for Efficient Abstraction [3.3] ニューラルネットワークはアーキテクチャを通して、個々の入力の属性ではなく、知覚的入力間の関係に焦点を絞っていることを示す。
データ効率のよい方法で抽象化を誘導するために、このアプローチを用いたモデルのファミリーをレビューする。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:18:08 GMT)
Many-Objective Evolutionary Influence Maximization: Balancing Spread, Budget, Fairness, and Time [3.2] インフルエンス・最大化(IM)問題は、情報伝達を最大限に広めることのできるグラフ内のノードの集合を見つけ出そうとする。
この問題はNPハードであることが知られており、通常は第2の目的を最適化する影響(スプレッド)を最大化して研究される。
本研究では,シードセットサイズの影響と最小化に基づいて,予算の公平性,コミュニティ,時間といったIM固有の目的関数を最適化した最初のケーススタディを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:05:56 GMT)
MFORT-QA: Multi-hop Few-shot Open Rich Table Question Answering [3.2] 今日の急成長する業界では、専門家は大量の文書を要約し、毎日重要な情報を抽出するという課題に直面している。
この課題に対処するために、テーブル質問回答(QA)のアプローチを開発し、関連する情報を抽出した。
近年のLarge Language Models (LLMs) の進歩により,プロンプトを用いて表データから情報を取り出す新たな可能性が高まっている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:14:18 GMT)
GrINd: Grid Interpolation Network for Scattered Observations [3.2] GrINd(Grid Interpolation for Scattered Observations)は、散乱した観測を高解像度グリッドにマッピングする新しいネットワークアーキテクチャである。
高分解能空間において、NeuralPDEクラスモデルは、微分可能なODEソルバと完全な畳み込みニューラルネットワークを用いて、将来の時点におけるシステムの状態を予測する。
我々は,分散した場所で観測された6つの物理系からなるベンチダイナベンチマークデータセット上で,GrINdを実験的に評価した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:52:47 GMT)
KazParC: Kazakh Parallel Corpus for Machine Translation [3.1] KazParCは、カザフ語、英語、ロシア語、トルコ語にまたがる機械翻訳用に設計された並列コーパスである。
我々の研究は、Tilmashと呼ばれるニューラルマシン翻訳モデルの開発にも及んでいる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:19:16 GMT)
A Novel Stochastic Transformer-based Approach for Post-Traumatic Stress Disorder Detection using Audio Recording of Clinical Interviews [3.1] PTSD(Post-traumatic stress disorder)は、外傷的な出来事を目撃または経験した後に発症する精神疾患である。
PTSD 尺度 (CAPS) と PTSD Check List for Civilians (PCL-C) は、PTSD の診断における金の基準である。
本研究は,臨床面接における音声記録を用いたPTSD検出の最先端性能を実現するための深層学習に基づくアプローチを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:11:40 GMT)
A Tulu Resource for Machine Translation [3.0] 英語・トゥルー語翻訳のための最初の並列データセットを提案する。
トゥル語はインド南西部で約250万人が話されている。
パラレル・イングリッシュ・トゥルデータを使わずにトレーニングした我々のイングリッシュ・トゥルシステムは、Google Translateを19のBLEUポイントで上回っている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 04:30:07 GMT)
PrOnto: Language Model Evaluations for 859 Languages [3.0] 本稿では,新約聖書翻訳を施した言語に対して,事前学習した言語モデル評価に適した評価データセット群を受信できる新しい評価データセット構築手法を提案する。
この手法は、英語OntoNotesのNew Testament部分にあるものと詩を一致させ、手動の注釈を必要とせず、英語からターゲット言語にアノテーションを投影する。
859年の新約聖書翻訳1051件に適用し公開する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:23:08 GMT)
Secure Link State Routing for Mobile Ad Hoc Networks [3.0] ここで提案されているSecure Link State Routing Protocol (SLSP)は、安全なプロアクティブトポロジ発見を提供する。
SLSPはスタンドアロンプロトコルとして、あるいはハイブリッドルーティングフレームワークに自然に適合する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 22:10:40 GMT)
Beyond Borders: Investigating Cross-Jurisdiction Transfer in Legal Case Summarization [3.0] 判例要約モデルの断続的一般化性について検討する。
具体的には、参照要約ができない対象の司法管轄区域の訴訟を効果的に要約する方法を検討する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:18:31 GMT)
Do Similar Entities have Similar Embeddings? [2.9] 知識グラフ埋め込みモデル(KGEMs)は、知識グラフ内のエンティティのベクトル表現を学習する。
一般的な仮定は、KGEエンティティ類似性仮定であり、これらのKGEMはグラフの構造を埋め込み空間内に保持する。
しかし、埋め込み空間における実体の類似性と類似性の関係は、公式に評価されることはめったにない。
本稿では、グラフにおけるエンティティの類似性が本質的に埋め込み空間に反映されているという一般的な仮定に挑戦する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:12:21 GMT)
Optimizing Quantum Convolutional Neural Network Architectures for Arbitrary Data Dimension [2.9] 量子畳み込みニューラルネットワーク(QCNN)は量子機械学習において有望なアプローチである。
量子リソースの割り当てを最適化しながら任意の入力データ次元を処理できるQCNNアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 02:25:12 GMT)
DeepMachining: Online Prediction of Machining Errors of Lathe Machines [2.9] 深層学習に基づくAIシステムDeepMachiningについて述べる。
我々の知る限りでは、この研究は、学習済みの深層学習モデルを用いて、機械の加工誤差を予測する最初の工場実験の1つである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:36:06 GMT)
MAPL: Model Agnostic Peer-to-peer Learning [2.9] 我々は、異種パーソナライズされたモデルと協調グラフを同時に学習するために、MAPL(Model Agnostic Peer-to-peer Learning)を導入する。
MAPLは、(i)ローカルレベルのパーソナライズドモデルラーニング(PML)と、(ii)ネットワーク全体の分散協調グラフラーニング(CGL)という2つの主要なモジュールから構成され、局所的なタスク類似性に基づいて協調重みを動的に洗練する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:17:54 GMT)
Phonetic Segmentation of the UCLA Phonetics Lab Archive [2.8] VoxAngeles (VoxAngeles) は、UCLA音声学研究所アーカイブの監査された音声書き起こしと電話レベルのアライメントのコーパスである。
VoxAngelesはCC-BY-NC 4.0ライセンスで無料でダウンロードできる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:42:07 GMT)
UADA3D: Unsupervised Adversarial Domain Adaptation for 3D Object Detection with Sparse LiDAR and Large Domain Gaps [2.8] 3次元物体検出(UADA3D)のための教師なし反転領域適応法について紹介する。
様々な適応シナリオにおいて有効性を示し、自動運転車と移動ロボットの両方の領域で顕著に改善されていることを示す。
私たちのコードはオープンソースで、まもなく利用可能になります。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:47:45 GMT)
ILPO-NET: Network for the invariant recognition of arbitrary volumetric patterns in 3D [2.8] 本稿では、局所的なパターン配向に本質的に不変な畳み込み操作を伴う任意の形状のパターンを扱う新しいアプローチであるILPO-Netを提案する。
我々のアーキテクチャは、新しい畳み込み演算子をシームレスに統合し、MedMNISTやCATHといった様々なボリュームデータセットをベンチマークすると、優れた性能を示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:32:01 GMT)
Information Disturbance Tradeoff in Bidirectional QKD [2.7] 本稿では、有限結果の量子ネットワークについて述べる。
textitPhysで最適戦略から導いたネットワークを構築する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 05:37:29 GMT)
Towards Reverse-Engineering the Brain: Brain-Derived Neuromorphic Computing Approach with Photonic, Electronic, and Ionic Dynamicity in 3D integrated circuits [2.6] 人間の脳は、極度のエネルギー効率とスケールで膨大な学習能力を持ち、人工システムは一致していない。
本稿では,脳由来ニューロモルフィックコンピューティングシステムのプロトタイプを設計することで,脳のリバースエンジニアリングの可能性について議論する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 05:24:04 GMT)
On Uncertainty Quantification for Near-Bayes Optimal Algorithms [2.6] 本研究では, タスク分布によって定義されたベイズ後続部を, アルゴリズムを用いてマーチンゲール後続部を構築することにより, 未知だが最適であるベイズ後続部を復元可能であることを示す。
様々な非NNアルゴリズムとNNアルゴリズムに基づく実験により,本手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:42:25 GMT)
Hierarchical Deep Learning for Intention Estimation of Teleoperation Manipulation in Assembly Tasks [2.5] 人間とロボットのコラボレーションにおいて、共有制御は、製造および組み立てプロセスの効率を改善するためにロボット操作を遠隔操作する機会を提供する。
この目的のためには、行動観察に依存して、頑健で迅速な意図推定が必要である。
このフレームワークは、ニューラルネットワークにマルチスケール階層情報を組み込むことにより、階層レベルでの意図推定手法、すなわち低レベルな行動と高レベルなタスクを示す。
様々な入力による予測力の分析は、予測精度と早期意図同定の点で、深層階層モデルの優位性を示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:45:43 GMT)
Fusion of one-dimensional gapped phases and their domain walls [2.4] 有限深度量子回路を用いて1次元ギャップ位相の融合を研究する。
これは、高次元の自明なギャップ状バルク状態におけるギャップ状欠陥の「高いカテゴリ」構造のいくつかの単純な側面の具体的な図示を提供する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 00:17:26 GMT)
Differentially Private Distributed Estimation and Learning [2.4] ネットワーク環境における分散推定と学習の問題について検討する。
エージェントは、プライベートに観察されたサンプルからランダム変数の未知の統計特性を推定するために情報を交換する。
エージェントは、自分のプライベートな観察に関する情報を交換することで、未知の量を見積もることができるが、プライバシー上のリスクにも直面する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:56:06 GMT)
Leveraging Counterfactual Paths for Contrastive Explanations of POMDP Policies [2.4] XAIは、エージェント行動の説明を提供することで、混乱を減らし、システムの信頼を高めることを目的としている。
POMDPは、遷移と状態の不確実性を推論できる柔軟なフレームワークを提供する。
本研究は,POMDPポリシーの対照的な説明を生成するために,ユーザが提供する反ファクトファクトの活用について検討する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:19:38 GMT)
Deep Learning Framework with Uncertainty Quantification for Survey Data: Assessing and Predicting Diabetes Mellitus Risk in the American Population [2.4] 本稿では,ニューラルネットワーク(NN)モデルを用いた回帰と分類のための一般的な予測フレームワークを提案する。
NHANES 2011-2014コホートのデータを用いて,米国における糖尿病のリスク評価にこの枠組みを適用した。
糖尿病に焦点を当てながら、このNN予測フレームワークは、さまざまな疾患や医療コホートのための臨床モデルを作成するために適応できる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:06:11 GMT)
Transparent and Clinically Interpretable AI for Lung Cancer Detection in Chest X-Rays [2.4] 既存のポストホックXAI技術は医療データに乏しいことが示されている。
本稿では,臨床概念を分類パイプラインに導入した概念ボトルネックモデルに基づくアンテホックなアプローチを提案する。
本手法は, ベースライン深層学習モデルと比較して, 肺癌検出における分類性能の向上を図っている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:15:13 GMT)
VisionKG: Unleashing the Power of Visual Datasets via Knowledge Graph [2.3] Vision Knowledge Graph (VisionKG)は、知識グラフとセマンティックWeb技術を介して視覚データセットを相互にリンクし、整理し、管理する新しいリソースである。
VisionKGには現在5億1900万のRDFトリプルがあり、約4000万のエンティティを記述している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:52:16 GMT)
Using Deep Learning to Increase Eye-Tracking Robustness, Accuracy, and Precision in Virtual Reality [2.3] この研究は、目の特徴追跡のための現代の機械学習(ML)に基づくいくつかの手法の影響を客観的に評価する。
メトリックには、視線推定の精度と精度、およびドロップアウト率が含まれる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:43:25 GMT)
Sparse Generation: Making Pseudo Labels Sparse for weakly supervision with points [2.2] モデルのスパース出力の結果、弱教師付き擬似ラベルの生成を考える。
擬似ラベルをスパース化するスパース生成法を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:42:49 GMT)
On-demand driven dissipation for cavity reset and cooling [2.2] 電磁界の目標モード上で能動的かつオンデマンドで調整可能な消散を提供する超伝導回路装置を提案する。
本研究は,回路QEDにおける環境工学およびエントロピー除去のためのモジュールツールとしての有用性を実証するものである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:17:30 GMT)
Intelligent Classification and Personalized Recommendation of E-commerce Products Based on Machine Learning [2.2] 本稿では、eコマース、コンテンツ情報、メディアドメインにおけるパーソナライズされたレコメンデーションシステムの重要性と応用について考察する。
データプライバシ、アルゴリズムバイアス、スケーラビリティ、コールドスタート問題など、Eコマースにおいてパーソナライズされたレコメンデーションシステムに直面する課題を概説する。
本稿では、BERTモデルと近隣のアルゴリズムを利用したパーソナライズされたレコメンデーションシステムの概要を述べる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:02:45 GMT)
A ZX-Calculus Approach for the Construction of Graph Codes [2.1] QECC(Quantum Error-Correcting Codes)は、量子コンピューティングと通信システムの堅牢性を高める上で重要な役割を果たす。
QECCの領域内では、安定化符号、特にグラフ符号は、それぞれの異なる特性と量子技術における有望な有用性で際立っている。
本研究は、拡張性QECCを考案することの重要性を浮き彫りにして、ZX-calculusを量子計算推論に適したグラフィカル言語として採用する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:20:17 GMT)
Chinese Offensive Language Detection:Current Status and Future Directions [2.1] 本稿では,中国語における攻撃的言語検出について概観し,現在のベンチマークとアプローチについて検討する。
本調査の主な目的は,既存の技術を探究し,今後の研究の道筋を明らかにすることである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 05:27:43 GMT)
Towards Low-Energy Adaptive Personalization for Resource-Constrained Devices [2.1] Target Block Fine-Tuning (TBFT) はリソース制約のあるデバイスのための低エネルギー適応型パーソナライズフレームワークである。
我々は、エネルギーコストを削減して最適な性能を達成するために、モデルの異なるブロックを微調整する。
Block Avg$と比較すると、TBFTは平均15.30%の精度向上を示している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:00:04 GMT)
Brain-Shift: Unsupervised Pseudo-Healthy Brain Synthesis for Novel Biomarker Extraction in Chronic Subdural Hematoma [2.1] 慢性硬膜下血腫(cSDH)は、脳と硬膜間血の蓄積を特徴とする一般的な神経疾患である。
伝統的に、理想的な矢状面からの専門家によって手動で測定された正中線シフトと、ヘマトマ体積が、cSDHの定量化の主要な指標となっている。
そこで本研究では,脳の変形場を生成するために,解剖学を意識した非教師付き擬似健康合成法を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:39:55 GMT)
Lamarckian Inheritance Improves Robot Evolution in Dynamic Environments [2.1] 本研究では,ラマルク系と進化ロボティクス(ER)の統合について検討する。
ラマルクの原理を採用することで、ロボットは学習した特性を継承し、ダーウィンの学習と並行して、動的環境の適応について検討する。
我々の研究は6つの異なる環境設定で行われ、ラマルク系がダーウィン系よりも適応性と効率性が優れていることを示した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:27:20 GMT)
MRFP: Learning Generalizable Semantic Segmentation from Sim-2-Real with Multi-Resolution Feature Perturbation [2.0] 本稿では,ドメイン固有の細粒度特徴と粗い特徴の摂動スタイルをランダム化するための,MRFP(Multi Resolution Feature Perturbation)手法を提案する。
MRFPは最先端のディープニューラルネットワークで、シミュレーションから実際のセマンティックセグメンテーションのための堅牢なドメイン不変機能を学ぶのに役立つ。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:27:33 GMT)
Multi-channel Time Series Decomposition Network For Generalizable Sensor-Based Activity Recognition [2.0] 本稿では,MTSDNet(Multi- Channel Time Series Decomposition Network)を提案する。
トレーニング可能なパラメータ化時間分解により、元の信号を複数の成分と三角関数の組み合わせに分解する。
提案手法の精度と安定性を他の競合戦略と比較して予測する利点を示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:54:06 GMT)
Generation of Spatially Coherent Light at Extreme Ultraviolet Wavelengths [2.0] フェムト秒レーザーの高調波アップコンバージョンによる極紫外光の空間コヒーレンスの測定を行った。
このレーザーのようなEUV源のコヒーレンスは、小さな物体のガボルホログラムを記録することによって実証される。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:02:38 GMT)
A Review of Multi-Modal Large Language and Vision Models [2.0] 大規模言語モデル(LLM)が研究と応用の焦点として登場した。
近年、LLMはマルチモーダル大言語モデル(MM-LLM)に拡張されている。
本稿では,近年のMM-LLMとともに,マルチモーダル機能を有するLLMの現状を概観する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:53:45 GMT)
COA-GPT: Generative Pre-trained Transformers for Accelerated Course of Action Development in Military Operations [1.9] 本研究では,大規模言語モデル(LLM)を用いたCOA-GPTを導入して,有効な行動コース(COA)を迅速かつ効率的に生成する手法を提案する。
COA-GPTは軍隊の教義とドメインの専門知識をLLMに組み込んでコンテキスト内学習を行い、指揮官はミッション情報を入力し、戦略的に整列したCOAを受け取り、レビューと承認を行う。
この研究は、StarCraft IIの軍用バージョンにおける軍事関連シナリオにおけるCOA-GPTを評価し、その性能を最先端の強化学習アルゴリズムと比較した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:22:42 GMT)
Risk prediction of pathological gambling on social media [1.9] 本稿では、ソーシャルメディアデータにおけるリスク予測の問題に対処し、特にRedditユーザーを病的ギャンブル障害と分類することに焦点を当てる。
この問題に対処するために,本研究では,時間的・感情的な特徴をモデルに取り入れることに焦点を当てる。
EmoBERTaとTDレイヤを含むアーキテクチャはF1スコアを達成し、病理ギャンブルデータセットのベンチマークを上回りました。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:17:36 GMT)
Debiasing Cardiac Imaging with Controlled Latent Diffusion Models [1.8] 本稿では,データセットに固有の不均衡を,合成データの生成によって緩和する手法を提案する。
我々は,患者メタデータと心臓の形状から合成したテキストを条件に,拡散確率モデルに基づく制御ネットを採用する。
本実験は,データセットの不均衡を緩和する手法の有効性を実証するものである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:41:43 GMT)
Topological Cycle Graph Attention Network for Brain Functional Connectivity [1.8] 我々は新しいトポロジカルサイクルグラフ注意ネットワーク(CycGAT)を導入する。
CycGATは、シグナル伝達に必須の脳機能グラフ内の機能的バックボーンを規定する。
シミュレーションによるCycGATの局在化とそのABCD研究のfMRIデータ上での有効性を実証する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 05:07:41 GMT)
Scalable Interactive Machine Learning for Future Command and Control [1.8] 将来の戦争では、コマンド・アンド・コントロール(C2)の要員が時間スケールの縮小で決定を下す必要がある。
人工知能とヒューマンインテリジェンスの統合は、C2オペレーションプロセスに革命をもたらす可能性を秘めている。
本稿では、これらのアプローチを複雑なC2コンテキストで機能させるために、今後の研究が取り組むべき最先端の科学と技術のギャップについて述べる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:17:01 GMT)
Scaling up ridge regression for brain encoding in a massive individual fMRI dataset [1.7] 本稿では,リッジ回帰を伴う脳エンコーディングの訓練時間を短縮するために,異なる並列化手法を評価する。
マルチスレッドでは、Intel Math Kernel Library (MKL) がOpenBLASライブラリを著しく上回っている。
本稿では,時間複雑性解析に動機づけられたDask並列化の"バッチ"バージョンを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:52:12 GMT)
A Data-Driven Predictive Analysis on Cyber Security Threats with Key Risk Factors [1.7] 本稿では、社会経済的要因を分析して、サイバー攻撃の犠牲者となる可能性のある個人を予測するための機械学習(ML)に基づくモデルを示す。
我々は,20個の特徴量(95.95%)で最大精度を達成した新しい特徴量ランダムフォレスト(RF)モデルを提案する。
我々は10の重要な関連ルールを生成し、実世界のデータセットで厳格に評価されたフレームワークを提示した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:41:24 GMT)
MUGC: Machine Generated versus User Generated Content Detection [1.7] 従来の手法は, 機械生成データの同定において高い精度を示す。
機械生成テキストは短く、人間生成コンテンツに比べて単語の多様性が低い傾向にある。
可読性、バイアス、モラル、影響の比較は、機械生成コンテンツと人間生成コンテンツの間に明確なコントラストを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:33:53 GMT)
Closed-form congestion control via deep symbolic regression [1.6] 強化学習(RL)アルゴリズムは、超低レイテンシおよび高スループットシナリオにおける課題を処理することができる。
実際のデプロイメントにおけるニューラルネットワークモデルの採用は、リアルタイムの推論と解釈可能性に関して、依然としていくつかの課題を提起している。
本稿では,性能と一般化能力を維持しつつ,このような課題に対処する方法論を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:31:37 GMT)
TUNeS: A Temporal U-Net with Self-Attention for Video-based Surgical Phase Recognition [1.5] 畳み込み型U-Net構造のコアに自己アテンションを組み込んだ,効率的かつシンプルな時間モデルTUNeSを提案する。
実験では, ほぼすべての時間モデルが, より長い時間的文脈で訓練された特徴抽出器上でより優れた性能を示した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:24:20 GMT)
The Bad Batches: Enhancing Self-Supervised Learning in Image Classification Through Representative Batch Curation [1.5] 人間の監督なしに堅牢な表現を学ぶことの追求は、長年にわたる課題である。
本稿では,Fr'echet ResNet Distance(FRD)によるペアワイズ類似性計算を用いて,偽正負負対と偽負対の影響を緩和する。
提案手法の有効性は,STL10で87.74%,Flower102データセットで99.31%,自己教師付きコントラスト表現で訓練された線形分類器によって実証された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:04:07 GMT)
Collaborative Interactive Evolution of Art in the Latent Space of Deep Generative Models [1.4] 私たちはまず,Creative Adversarial Networks(CANs)と呼ばれるアーキテクチャを用いて,創造的なイメージの制作を訓練するGANを採用する。
次に、画像を発見するためにモデルの潜在空間内をナビゲートするために進化的アプローチを用いる。
我々は、自動美学と協調的対話的人間評価指標を用いて、生成された画像を評価する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:40:15 GMT)
Towards a Theoretical Foundation of Process Science [1.4] プロセスサイエンスは、非常に学際的な研究分野である。
多くの提案にもかかわらず、プロセス科学は分野の中核的な概念を十分に理解していない。
プロセスサイエンスに対処するより体系的なフレームワークは必須である。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:19:39 GMT)
ML2SC: Deploying Machine Learning Models as Smart Contracts on the Blockchain [1.4] 我々は、Pytorchで記述された多層パーセプトロン(MLP)モデルをSolidityスマートコントラクトバージョンに変換することができる、PyTorch to SolidityトランスレータであるMachine Learning to Contract (ML2SC)を紹介する。
生成されたスマートコントラクトをデプロイした後、PyTorchを使用してモデルをオフチェーンでトレーニングし、取得したウェイトとバイアスを関数コールを使用してスマートコントラクトに転送します。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 23:55:10 GMT)
Removing the need for ground truth UWB data collection: self-supervised ranging error correction using deep reinforcement learning [1.4] マルチパス効果と非視界条件は、アンカーとタグの間の範囲エラーを引き起こす。
これらの範囲の誤差を緩和するための既存のアプローチは、大きなラベル付きデータセットの収集に依存している。
本稿では,ラベル付き真実データを必要としない自己教師付き深層強化学習手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:36:55 GMT)
Finding Decision Tree Splits in Streaming and Massively Parallel Models [1.4] 観測データのストリームが与えられた場合、目標はデータを2つのセットに分割する最適な分割ポイント$j$を見つけることである。
サブ線形空間と少数のパスを使用する様々な高速ストリーミングアルゴリズムを提供する。
これらのアルゴリズムは、超並列計算モデルにも拡張することができる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 22:26:38 GMT)
Non-Abelian observable-geometric phases and the Riemann zeros [1.4] 非アベリア観測可能幾何位相の概念を導入する。
観測可能な幾何学的位相は観測可能な空間の幾何学と結びついているので、このことはハイゼンベルク方程式の研究に光を当てる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:23:46 GMT)
Neural Fields for 3D Tracking of Anatomy and Surgical Instruments in Monocular Laparoscopic Video Clips [1.3] 単一2次元単眼ビデオクリップ上で全構造を同時追跡する手法を提案する。
装置のサイズが小さいため、画像のごく一部しかカバーしていないため、追跡精度が低下する。
腹腔鏡下胆嚢摘出術を施行し, 解剖学的構造は92.4%, 機器は87.4%であった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:44:20 GMT)
A Tale of Two Communities: Exploring Academic References on Stack Overflow [1.3] 異なる分野の関心を持つStack Overflowコミュニティが、様々な周波数と速度で学術文献を扱っていることがわかった。
矛盾するパターンは、一部の規律が、その利益と開発軌道を、対応する実践者コミュニティから逸脱した可能性があることを示唆している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:19:48 GMT)
A Public and Reproducible Assessment of the Topics API on Real Data [1.2] Topics API for the Webは、サードパーティのクッキーに代わる、Googleのプライバシ向上のためのAPIだ。
実閲覧履歴の最大かつ一般公開されたデータセット上で,最新の Topics API の再現可能な評価を行う。
データセット中の1207ユーザーの46%、55%、60%が、広告主によるトピックの観察の後、ウェブサイト間でユニークに識別されていることがわかった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:03:44 GMT)
LLMSense: Harnessing LLMs for High-level Reasoning Over Spatiotemporal Sensor Traces [1.1] 我々は,大規模言語モデル(LLM)の高レベル推論タスクに有効なプロンプトフレームワークを設計する。
また,長いセンサトレースによる性能向上のための2つの戦略を設計する。
当社のフレームワークはエッジクラウドで実装可能で,データ要約やプライバシ保護のためにクラウド上での高レベルの推論を行うために,エッジ上で小さなLLMを実行することができる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 22:06:04 GMT)
Imbalanced Data Clustering using Equilibrium K-Means [1.1] 平衡K平均(EKM)は不均衡データに対するロバスト性を持つ新しいファジィクラスタリングアルゴリズムである。
EKMは単純で、高速で、FKMと同じ時間と空間の複雑さを持つ。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 08:36:27 GMT)
Re-Envisioning Command and Control [0.9] 将来の戦争では、コマンド・アンド・コントロール(C2)による決定は、より複雑で、高速で、非構造的で、要求の厳しい状況で行われなければならない。
現在のC2プラクティスは、新興のインテリジェンス時代ではなく、産業時代に由来するもので、線形で時間を要する。
我々は、人間と人工知能(AI)システムとの堅牢な連携に基づく将来のC2のビジョンを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:17:30 GMT)
Evaluating Fair Feature Selection in Machine Learning for Healthcare [0.9] 特徴選択の観点からアルゴリズム的公正性を探究する。
全人口集団に等しく重要と考えられる公平な特徴選択法を評価する。
当社のアプローチを、公開可能な3つの医療データセットでテストしました。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 06:24:04 GMT)
Generating Print-Ready Personalized AI Art Products from Minimal User Inputs [0.9] 本稿では,印刷アート製品の領域における生成人工知能(AI)応用を推し進めるための新しい枠組みを提案する。
このフレームワークは、効果的なプロンプトを生成するという高い複雑さと、拡散モデルによって生成された画像の低ネイティブ解像度という、2つの大きな課題に対処するパイプラインで構成されている。
私たちの仕事は、高品質なAIアートを民主化するための重要なステップであり、消費者、アーティスト、デザイナー、ビジネスのための新たな道を開く。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:48:19 GMT)
ENet-21: An Optimized light CNN Structure for Lane Detection [0.9] 本研究では,車線検出問題に対する最適構造について検討する。
現代の車両の運転支援機能には有望なソリューションを提供する。
我々の手法はexiよりも複雑なCNNアーキテクチャを使っている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:07:26 GMT)
Deep decomposition method for the limited aperture inverse obstacle scattering problem [0.9] 制限開口逆障害物散乱問題に対する深層学習手法を検討する。
これは、ニューラルネットワークアーキテクチャに散乱モデルに関連する物理演算子を提供することによって達成される。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:54:31 GMT)
Generalized Gradient Descent is a Hypergraph Functor [0.9] 勾配降下は最適化問題のハイパーグラフ圏から力学系のハイパーグラフ圏へハイパーグラフ関手を誘導することを示す。
本稿では、ハイパーグラフ関手が、ドメイン内で指定された任意の合成問題に対して分散最適化アルゴリズムをいかに誘導するかを説明する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:37:57 GMT)
Ultra-low-power, microwave-multiplexed qubit controller using adiabatic superconductor logic [0.7] 低温量子ビットコントローラ(QC)は、大規模超伝導量子プロセッサを構築する鍵である。
超低消費電力超伝導体論理系,すなわち断熱量子流-パラメタトロン論理系を用いたスケーラブルQCについて報告する。
AQFP-mux QCは、キュービット当たり81.8pWの極小消費電力で、キュービット制御のためのマルチトンマイクロ波信号を生成する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 05:24:22 GMT)
Towards Long Term SLAM on Thermal Imagery [0.7] 学習した特徴記述子は既存のBag of Wordのローカライズ方式で利用できることを示す。
訓練語彙の有効性を示すため,ベースラインSLAMシステムを開発した。
本システムでは, サーマルイメージの挑戦と, 昼夜の劇的なサーマル外観変化を克服する再ローカライゼーションについて, 良好な局所追跡を行う。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 23:51:51 GMT)
Vulnerabilities of smart contracts and mitigation schemes: A Comprehensive Survey [0.7] 本稿では,開発者がセキュアなスマート技術を開発するのを支援することを目的とした,文献レビューと実験報告の併用について述べる。
頻繁な脆弱性とそれに対応する緩和ソリューションのリストを提供する。
コミュニティで最も広く使われているツールを、サンプルのスマートコントラクト上で実行し、テストすることで評価する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:36:53 GMT)
A thermodynamic approach to optimization in complex quantum systems [0.6] 最適冷却条件は, 熱力学限界において, 浴槽が量子相転移を示す状態において得られることを示す。
このプロトコルは利害関係におけるコヒーレンスを損なうものではないが, 冷却効果をさらに高めることができることを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:48:12 GMT)
On the potential of quantum walks for modeling financial return distributions [0.6] 我々は、資産価格の進化をモデル化するための離散時間量子ウォークの可能性を探る。
量子ウォークアルゴリズムに基づくモデルから得られた帰属分布を古典的手法による帰属分布と比較する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:33:17 GMT)
Detecting Financial Bots on the Ethereum Blockchain [0.5] DLT(Distributed Ledger Technologies)のボットは、効率性と自動化を促進する。
それらの利用は捕食的取引や市場の操作にも関係しており、システムの完全性に脅威をもたらす可能性がある。
現在の検知システムは、主にルールベースであり、柔軟性がない。
プラットフォーム上での金融ボットの検出に機械学習を利用する新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:06:06 GMT)
The Variant of Designated Verifier Signature Scheme with Message Recovery [0.4] 本稿では,メッセージ復元機構を組み込んだ強力なDesignated Verifier Signature(DVS)方式を提案する。
この研究は、UDVS(Universal Designated Verifier Signature)スキームの概念に触発されている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 04:47:38 GMT)
Advances in Kidney Biopsy Lesion Assessment through Dense Instance Segmentation [0.4] textbfDiffRegFormerは、関心領域内のマルチクラスのマルチスケールオブジェクト用に設計された、エンドツーエンドの高密度なインスタンスセグメンテーションモデルである。
ジョーンズの148個の銀色の腎WSIのデータセットでは、芸術モデルの状態を上回り、APは52.1%(検出)と46.8%(分離)である。
病変分類サブネットワークは21889のオブジェクトパッチに対して89.2%の精度と64.6%のリコールを達成した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 20:49:55 GMT)
Swarm Characteristics Classification Using Neural Networks [0.4] 本稿では、ニューラルネットワーク時系列分類(NN TSC)を用いて、軍事的文脈において自律エージェントをスワーミングする重要な属性と戦術を予測する。
NN TSCは2つのバイナリ属性 – 通信と比例ナビゲーション – を推論するために適用され、相互に排他的な4つのSwarm戦術を定義する。
鍵となる発見は、NNが20ステップの短い観察窓を用いて97%の精度でSwarmの挙動を予測できることを示し、50%のノイズ下で80%の精度で優雅な劣化を示すことである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:56:39 GMT)
Real-time accident detection and physiological signal monitoring to enhance motorbike safety and emergency response [0.4] 都市化と生活水準の向上により、道路上の車両の数が大幅に増加した。
バイク事故は特にリスクが高く、重傷や重傷を負う。
本稿では,バイク事故に特化して設計された新しい自動検知・通知システムを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 01:41:31 GMT)
Efficient Deep Learning-based Estimation of the Vital Signs on Smartphones [0.3] 本研究では,ディープラーニングを用いたモバイルベースのバイタルサイン推定のための新しいエンドツーエンドソリューションを提案する。
完全な畳み込みアーキテクチャを用いることで、提案したモデルはパラメータが少なく、計算量も少ない。
全体として、提案するエンドツーエンドアプローチは、容易に利用可能な家電製品上でのデバイス上での健康モニタリングの効率と性能を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:17:43 GMT)
Approximating many-body quantum states with quantum circuits and measurements [0.3] 正確な準備条件を引き上げることで、資源を大幅に節約できることを示す。
特に、いわゆる$W$と、より一般的には、Dicke状態は、システムサイズに依存しないサイト毎の回路深さとアンシラの数を必要とする。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:32:23 GMT)
Entanglement-based quantum information protocols designed with silicon quantum dot platform [0.3] スピンベースの量子ビット(量子ビット)演算は、高忠実度で普遍論理ゲートを実現するために集中的に研究されている。
本稿では、電気的に定義された5つのシリコン量子ドット系における絡み合いに基づく量子情報プロトコルについて検討する。
本稿では,マジック状態の生成,絡み合いスワップ,量子テレポーテーションの3つの応用について論じる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:35:39 GMT)
Parallel Implementations Assessment of a Spatial-Spectral Classifier for Hyperspectral Clinical Applications [0.3] 本稿では,5つの異なるHPCプラットフォームが提供する性能の比較を行い,HS画像の空間スペクトルによる分類を行った。
神経外科的応用の主な制約は処理時間であり、他の環境では皮膚科的要件として考慮できる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:33:16 GMT)
Mining Bug Repositories for Multi-Fault Programs [0.3] 個々のエントリで複数のバグを識別するデータセットの拡張について説明する。
テストケースの移植とフォールトロケーションの翻訳を,バグの公開と発見に使用しています。
したがって、実際のソフトウェアプロジェクトの中で、真のマルチフォールトバージョンのデータセットを提供します。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 06:35:55 GMT)
BEACON: Bayesian Experimental design Acceleration with Conditional Normalizing flows $-$ a case study in optimal monitor well placement for CO$_2$ sequestration [0.2] CO$$ plumesは、漏洩、誘発地震、ライセンス境界の侵害などのリスクを防ぐために厳格な監視を必要とする。
これを解決するために、プロジェクトマネージャは、特定の場所でCO$とプレッシャーモニタリングを行うために、ボーアホール井戸を使用します。
提案手法は,プルーム不確実性推論のための生成ニューラルネットワークと,プルーム軌跡予測のための流体流解法を統合する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 20:17:58 GMT)
Understanding Archives: Towards New Research Interfaces Relying on the Semantic Annotation of Documents [0.2] 本稿では,研究資料のコーパスのテキスト内容の意味的アノテーションが,その活用と評価を促進する方法を示す。
まず,テキスト・セマンティクスに基づく新しいインタフェース構築のための方法論的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:55:29 GMT)
Developing Healthcare Language Model Embedding Spaces [0.2] 事前トレーニングされた大規模言語モデル(LLM)は、医療中心のテキストのようなドメイン外のデータセットに苦労することが多い。
従来のマスキング言語モデリング、Deep Contrastive Learning for Unsupervised Textual Representations(DeCLUTR)、およびヘルスケア設定からメタデータカテゴリを利用する新しい事前学習目標の3つの手法が評価されている。
対照的に訓練されたモデルは、分類タスクにおける他のアプローチよりも優れており、限られたラベル付きデータから強力なパフォーマンスを提供し、必要なモデルパラメータの更新を少なくする。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:31:32 GMT)
Bespoke Large Language Models for Digital Triage Assistance in Mental Health Care [0.2] 大規模言語モデル(LLM)は、電子的な健康記録に含まれる、構造化されていない、物語のない臨床データを処理するためのユーティリティを持つ。
2023年の毎月、370,000人から470,000人の新規紹介者が、二次的なメンタルヘルスケアサービスに移行した。
LLMをベースとした可変長臨床ERHデータのエンド・ツー・エンドの摂取に関する3つのアプローチを提案し,その評価を行った。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:17:07 GMT)
NeuroLGP-SM: A Surrogate-assisted Neuroevolution Approach using Linear Genetic Programming [0.2] 我々はNeuroLGP-Surrogate Model(NeuroLGP-SM)と呼ばれるディープニューラルネットワーク(DNN)のトレーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:31:01 GMT)
Segmentation tool for images of cracks [0.2] 本稿では,画像上のひび割れを手動で分割しやすくする半自動き裂分割ツールを提案する。
また、ひび割れの形状を測定するためにも用いられる。
提案手法は完全自動手法より優れており,手動データアノテーションの適切な代替となる可能性を示している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:23:52 GMT)
An Interactive Decision-Support Dashboard for Optimal Hospital Capacity Management [0.1] サージ期間中に病院の容量管理決定を通知するためのインタラクティブでユーザフレンドリな電子ダッシュボードを開発した。
ダッシュボードには、リアルタイム病院データ、予測分析、最適化モデルが統合されている。
病院の管理者は対話的にパラメータをカスタマイズでき、さまざまなシナリオを探索できる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 03:46:58 GMT)
Automatic Resource Allocation in Business Processes: A Systematic Literature Survey [0.1] リソース割り当ては複雑な意思決定の問題であり、プロセスの有効性と効率に大きな影響を与えます。
研究アロケーションを自動で支援するために、幅広いアプローチが開発された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:53:44 GMT)
Natural Language, AI, and Quantum Computing in 2024: Research Ingredients and Directions in QNLP [0.0] 量子言語処理においてNLP関連技術がどのように使われているかを示す。
テキストエンコーディングの基本課題に対する新しい量子設計を提案する。
我々は「幻覚」の問題は基本的な誤解によって生じると論じる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:15:07 GMT)
Hybrid quantum image classification and federated learning for hepatic steatosis diagnosis [0.0] 実世界の臨床データを利用して非アルコール性肝脂肪症を正確に評価するハイブリッド量子ニューラルネットワークモデルを提案する。
このモデルでは画像分類精度が97%に達し、従来の手法を1.8%上回る。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 20:01:02 GMT)
What's the Problem, Linda? The Conjunction Fallacy as a Fairness Problem [0.0] 我々はリンダ問題を再検討し、公平性問題として定式化する。
構造的因果認識の枠組みを通じて、関心のパラメータとして知覚を導入する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:10:37 GMT)
What do we know about Computing Education in Africa? A Systematic Review of Computing Education Research Literature [0.0] アフリカはCER(Computing Education Research)コミュニティにおいて不足している。
本研究は、CERの著名な学術雑誌や会議を調査し、出版されている研究の種類と、成長する分野にどの程度貢献したかを明らかにする。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 20:34:16 GMT)
Vison condensation and spinon confinement in a kagome lattice $\mathbb{Z}_2$ spin liquid: A numerical study of a quantum dimer model [0.0] 我々は,カゴメ格子上のスピン液体$mathbbZ$(mathZ$SL)と価結合固体(VBS)の遷移について検討した。
この遷移は、$mathbbZ$ スピン液体の弦のバイソン励起の凝縮によって引き起こされる。
スピン液体状態のトポロジカル縮退は、ビソン凝縮と相まって持ち上げられることが観察された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 02:19:05 GMT)
Towards probabilistic Weather Forecasting with Conditioned Spatio-Temporal Normalizing Flows [0.0] 生成的相関はマルチモーダル相関をモデル化することができ、時間分布もうまくモデル化できることが示されている。
これにより、これらは時空間予測に適した候補モデルとなり、科学の多くの分野において問題は一様である。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:13:33 GMT)
Topology of Bi$_2$Se$_3$ nanosheets [0.0] 近年、トポロジカル絶縁体Bi$Se$_3$の2次元コロイドナノ結晶の量子スピンホールエッジチャネルが直接観測されている。
従来,この素材の薄いナノシートを記述するために用いられてきた4バンド有効モデルを再考する。
8バンドモデルは実験結果のほとんどを捉えるだけでなく、厚さの異なる薄膜における$mathbbZ_2$逆転の以前の第一原理計算とも一致している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:14:12 GMT)
Topological obstructions to quantum computation with unitary oracles [0.0] いくつかのタスクは量子回路では不可能であるが、古典的なバージョンはクローン化などが容易である。
プロセストモグラフィ、オラクル中立化、$sqrt[dim U]U$、$UT$、$Udagger$アルゴリズムの制限を示す。
その結果、線形光学の利点を強化し、緩和因果性の実験に挑戦し、多くのアウトカム測定で新しいアルゴリズムを動機づけた。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:20:10 GMT)
Theoretical consideration of a twisted atom [0.0] 本稿では、ツイスト原子状態を記述するための枠組みを提案し、その後、ツイスト原子における核反動効果の相違について検討する。
初期原子状態がねじれた場合、光子分布は変化すると結論付ける。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:35:55 GMT)
The use of ChatGPT in higher education: The advantages and disadvantages [0.0] ChatGPTはOpenAIが開発した人工知能技術である。
本研究では,ChatGPTを高等教育に応用し,ハイレベルな授業の理解と作成について検討する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:00:05 GMT)
The kinematics of multiple Compton scattering of two-photon systems [0.0] 任意の2光子系のコンプトン多重散乱に伴う断面を計算するStokes-Mueller法を提案する。
場の量子論に基礎を置いているにもかかわらず、この方法は典型的に複雑な前提条件の深い理解を必要としない。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:28:11 GMT)
Taming the Interactive Particle Langevin Algorithm -- the superlinear case [0.0] 我々は,この非線型性の下で,触覚対話型粒子ランゲヴィンアルゴリズム(tIPLA)と呼ばれる新しい安定なクラスを開発する。
We obtain non-asymptotic convergence error estimates in Wasserstein-2 distance for the new class under an optimal rate。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:11:25 GMT)
Tabular Learning: Encoding for Entity and Context Embeddings [0.0] 異なるエンコーディング手法がエンティティとコンテキストの埋め込みに与える影響を調べる。
複数のデータセットに異なる前処理方法とネットワークアーキテクチャを適用することで、エンコーダがネットワークの学習結果にどのように影響するかのベンチマークが得られた。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:29:29 GMT)
Streaming quantum gate set tomography using the extended Kalman filter [0.0] 拡張カルマンフィルタを量子ゲートセットトモグラフィーのデータに適用し,システムエラーモデルと不確実性の両方をストリーミング推定する。
提案手法により,標準ラップトップは1ビットと2ビットの回路結果を処理することができ,ゲートセットエラーモデルを現在の実験実行に匹敵する速度で更新することができる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:24:25 GMT)
Smart Blockchain Networks: Revolutionizing Donation Tracking in the Web 3.0 [0.0] スマートコントラクトとブロックチェーン技術を活用した寄付追跡システムは、変革の可能性を秘めている。
本稿では、スマートコントラクトとブロックチェーンを使用して、慈善寄付を追跡するための透明でセキュアな台帳を作成する方法について検討する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:19:02 GMT)
Simulating the dynamics of large many-body quantum systems with Schrödinger-Feynman techniques [0.0] 本稿では,従来の計算機上での多体量子力学の特定の側面を効率的にシミュレートする革新的な手法として,ハイブリッド型シュリンガー・ファインマン技術を紹介する。
提案したSchr"odinger-Feynman法により、標準的なスパース・マトリクス法よりはるかに大きい系の純状態生存確率をシミュレートできる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 22:20:23 GMT)
Sharp bounds for max-sliced Wasserstein distances [0.0] 我々は、分離可能なヒルベルト空間上の確率測度と、$n$サンプルからの経験的分布との予想最大1-ワッサーシュタイン距離の上限と下限を一致させる。
また、ユークリッド空間上の対称確率測度$mu$の間の予想最大2-ワッサーシュタイン距離に対して、対数係数まで鋭い上限を得る。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:57:18 GMT)
Separating the wave and particle attributes of two entangled photons [0.0] 我々の常識では、量子オブジェクトの波動と粒子の性質は分離できない。
本研究では、2つの絡み合った光子の波動特性と粒子特性を空間的に分離する実現可能な手法を提案する。
我々のスキームはまた、2つの絡み合った光子の波動特性と粒子特性の観測がボーアの相補性原理に従うことを保証している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:12:55 GMT)
Saturability of the Quantum Cramér-Rao Bound in Multiparameter Quantum Estimation at the Single-Copy Level [0.0] 量子クラム・ラオ境界(Quantum Cram'er-Rao bound, QCRB)は、量子パラメータ推定における精度の最終的な下界である。
本稿では,QCRBの単一コピー環境での飽和度について,必要かつ十分な条件を定めている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 02:10:21 GMT)
SWoTTeD: An Extension of Tensor Decomposition to Temporal Phenotyping [0.0] 隠れ時間パターンを発見する新しい手法SWoTTeD(Sliding Window for Temporal Decomposition)を提案する。
我々は, 合成と実世界の両方のデータセットを用いて提案手法を検証し, パリ大病院のデータを用いた独自のユースケースを提案する。
その結果、SWoTTeDは最近の最先端テンソル分解モデルと同程度の精度で再現可能であることがわかった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:09:13 GMT)
Quantum-thermodynamic enhancements in continuous thermal machines require energetic coherence [0.0] エネルギーの異なるレベル間のコヒーレンスによって 真の熱力学的優位性がもたらされる
レベル間のコヒーレンスを示すエンジン、またはノイズによって引き起こされるコヒーレンスを示すエンジンは、古典的なエンジンによって体系的に優れていた。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:03:23 GMT)
Quantum asymptotic amplitude for quantum oscillatory systems from the Koopman operator viewpoint [0.0] 本稿では,量子振動系に対する量子振幅の定義を提案する。
提案した量子振幅は、一定速度で指数関数的に減衰するアイソスタブル振幅値を適切に得ることを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:33:29 GMT)
Quantum Realization of the Finite Element Method [0.0] 本稿では,二階線形楕円偏微分方程式を$d$線形有限要素で離散化するための量子アルゴリズムを提案する。
BPXプリコンディショナーは、線形システムを十分によく条件付けされたシステムに変換し、量子計算が可能である。
本稿では,我々のアルゴリズムの実行が可能な量子回路の設計と実装について詳述し,有限要素法の量子実現性をサポートするシミュレータ結果について述べる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 15:44:20 GMT)
Quantum Many-Body Scars for Arbitrary Integer Spin in $2+1$D Abelian Gauge Theories [0.0] 量子多体スカー(Quantum Many-Body Scars)の存在は、様々な量子多体システムにまたがって確立されている。
任意の大きさの整数スピンを持つ純ゲージ理論のスカーを2+1$Dで同定し、具体的にはTrncated Link Models について述べる。
これらの結果は,小回転スピンと$S=1$量子リンクモデルに対して数値的に確認する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:46:21 GMT)
Quantum Many-Body Scarring in $2+1$D Gauge Theories with Dynamical Matter [0.0] 量子多体散乱(Quantum many-body scarring, QMBS)は、非可積分量子多体モデルにおける弱いエルゴディディディティ破壊の興味深いパラダイムとして登場した。
QMBS は 2+1$D $mathrmU(1)$ quantum link model で発生することを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:31:38 GMT)
Quantum Darwinism-encoding transitions on expanding trees [0.0] ブロードキャストとスクランブルの間を補間する量子力学は情報伝達の鋭い位相遷移を示す可能性があることを示す。
QD、中間および符号化の3つのフェーズと、2つの連続的な遷移を見出す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:15:26 GMT)
Quantum Causal Inference with Extremely Light Touch [0.0] 我々は、量子観測のみを用いた明示的な量子因果推論スキームを提案する。
空間時間擬似密度行列の閉形式表現を複数時間およびキュービットに関連付ける。
2つのサブシステムの間にシグナルが存在しない場合、擬密度行列の関連する還元状態は負性を持たないことが証明される。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 07:32:35 GMT)
QN-Mixer: A Quasi-Newton MLP-Mixer Model for Sparse-View CT Reconstruction [0.0] 準ニュートン法に基づくアルゴリズムQN-Mixerを導入する。
Incept-Mixerは非局所正規化用語として機能する効率的なニューラルネットワークである。
我々のアプローチは知的に情報をサンプリングし、計算要求を大幅に削減する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:29:56 GMT)
Probing Causation Dynamics in Quantum Chains near Criticality [0.0] 我々は、最近のLiang情報の量子拡張を用いて、それらの相図を横断する量子鎖の因果関係を調べる。
我々は,各症例が相関測定と異なり,特徴点間の因果関係の顕著な変化を識別した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:25:29 GMT)
Post Quantum Cryptography & its Comparison with Classical Cryptography [0.0] 量子暗号は量子力学の原理に基づいており、セキュア通信における新たなフロンティアを提供する。
量子暗号と古典的暗号とは対照的に、量子力学がセキュアな通信の風景にどのように革命をもたらすかが明らかになる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:38:13 GMT)
Physics-Informed Neural Networks for Satellite State Estimation [0.0] 本稿では、衛星の軌道状態と連続低振幅加速度プロファイルを推定するためのPINNの適用について詳述する。
PINNを用いた純粋物理モデルの性能を観測残差および観測範囲を超えた伝播精度の観点から評価した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:54:57 GMT)
Phase-Matching of High-Order Harmonics Driven by Mid- Infrared Light [0.0] 駆動レーザ波長が0.8マイクロメートルから1.3マイクロメートルに増加すると、アルゴン中での高調波発生のための位相整合遮断は45eVから100eVに増加する。
理論計算により、中赤外パルスによって駆動される位相整合高調波周波数のアップコンバージョンは、極端に高光子エネルギーに拡張できることが示唆された。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:27:43 GMT)
Phase-Matched Generation of Coherent Soft-X-Rays [0.0] 可視光の軟X線への位相整合高調波変換を実証した。
最近開発された誘導波周波数変換技術は、800ナノメートルから17ナノメートルから32ナノメートルの範囲への光のアップシフトに使われた。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:49:56 GMT)
Phase matching of high harmonic generation in the soft and hard X-ray regions of the spectrum [0.0] フェムト秒レーザー光の非線形アップコンバージョンにより、明るく、完全コヒーレントで硬いX線ビームが生成可能であることを示す。
長波長駆動レーザーの位相整合機構について検討した。
駆動レーザの波長が増大するにつれて、全体的な変換効率のスケーリングが驚くほど好ましい。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:40:41 GMT)
Phase Matching of High-Order Harmonics in Hollow Waveguides [0.0] ガス充填キャピラリー導波路における相整合の3つの異なる状態が観察された。
原子分散の役割は、いくつかの気体に対するハーモニック信号の依存性を研究することによって示される。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:19:18 GMT)
Optimizing Josephson Junction Reproducibility in 30 kV E-beam Lithography: Analysis of Backscattered Electron Distribution [0.0] 本研究は,橋梁周辺における線量分布のシミュレーションへの影響について検討し,製造感度に関する課題に対処する。
本研究は, 接合部における線量分布の均質化を図り, 接合部における線量分布の均質化を図ったものである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:32:41 GMT)
Non-standard Hubbard model and two-electron pairing [0.0] 任意の単一粒子ポテンシャルプロファイルと粒子間相互作用に適用可能な非標準ハバードモデルを提案する。
我々の研究は、長距離粒子間相互作用が、反発性粒子対の新たなメカニズムを誘導できることを実証している。
これらの発見は、平らなバンドの形成、二層グラフェンの超伝導の出現、新しい金属絶縁体転移の可能性など、様々な現象に重要な意味を持つ。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:01:12 GMT)
Nearest Neighbor Classication for Classical Image Upsampling [0.0] 結果の解像度は何らかの要因によって改善され、最終的な結果が人間のテストに合格する。
アップスケーリングの時間的複雑さは、ダウンスケーリングの実装の損失に比較的近い。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:31:23 GMT)
Narratives of Collective Action in YouTube's Discourse on Veganism [0.0] 我々は、自然言語処理を用いて、ヴィーガン運動に特有の道徳的物語の理論的枠組みを運用する。
分析の結果,理論によって定義された複数の物語型がデータ中に経験的に存在することが明らかとなった。
社会的戦いを主張するビデオ物語は、抗議や、他人を原因に転換しようとする努力によっても、それぞれのコメントの中でより強い集団行動の感覚に結びついている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:39:59 GMT)
Multimodal Data Integration for Oncology in the Era of Deep Neural Networks: A Review [0.0] 多様なデータ型を統合することで、がんの診断と治療の精度と信頼性が向上する。
ディープニューラルネットワークは、洗練されたマルチモーダルデータ融合アプローチの開発を促進する。
グラフニューラルネットワーク(GNN)やトランスフォーマーといった最近のディープラーニングフレームワークは、マルチモーダル学習において顕著な成功を収めている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:36:56 GMT)
Multi-site Integrated Optical Addressing of Trapped Ions [0.0] 量子コンピュータの性能を向上させる最も効果的な方法の1つは、システム内の量子ビットや量子リソースの数を増やすことである。
解決しなければならない大きな技術的課題は、多くの個々のイオンに光信号の配信を拡大することである。
この研究は、原子時計や閉じ込められたイオン量子情報システムのためのスケーラブルな集積フォトニクスの実現に向けた重要なステップである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 20:40:11 GMT)
Multi-Frame, Lightweight & Efficient Vision-Language Models for Question Answering in Autonomous Driving [0.0] 我々は,自律運転のための視覚質問応答を行う,効率的で軽量な多フレーム視覚言語モデルを開発した。
従来のアプローチと比較して、EM-VLM4ADは少なくとも10倍のメモリと浮動小数点演算を必要とする。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:18:33 GMT)
Modeling local decoherence of a spin ensemble using a generalized Holstein-Primakoff mapping to a bosonic mode [0.0] エンタングル原子スピンライト界面で発生するデコヒーレンスを、単純にボソニックモードのダイナミクスとしてモデル化できることを示す。
我々は、ハミルトニアン進化、局所的および集団的デコヒーレンス、測定バックアクションの組合せ効果を研究するために、フォーマリズムを利用する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:31:29 GMT)
Model Of Information System Towards Harmonized Industry And Computer Science [0.0] このプロジェクトの目的は、業界とコンピュータサイエンス部門のコミュニケーションを支援するウェブベースのチャットアプリケーションを設計し、ソフトウェア化することである。
アプリケーションは、後で使用すると決定できるこの情報を格納することができる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:53:08 GMT)
Measurement-induced transitions beyond Gaussianity: a single particle description [0.0] 繰り返し測定することで量子系の力学における絡み合い相転移を誘導することができる。
異なるプロトコルの絡み合いと非ガウス性構造を比較することにより、測定誘起相転移の新しい単一粒子指標を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:49:06 GMT)
Magnetic Bloch oscillations in a non-Hermitian quantum Ising chain [0.0] 虚場は、低層ワニエ・スターク・はしごを形成する際に、実際の横場と同じような役割を果たすことを示す。
これらの結果から、非ハーミティシティの量子スピンダイナミクスに対する非自明な効果が明らかとなった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:28:07 GMT)
Magic-induced computational separation in entanglement theory [0.0] 絡み合いは量子情報理論の基本的な柱として機能する。
エンタングルメント理論におけるマジックの役割を,エンタングルメント推定,蒸留,希釈を用いて検討した。
ヒルベルト空間は, エンタングルメント支配(ED)相とマジック支配(MD)相の2つの相に分けられる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:31:13 GMT)
Machine learning augmented diagnostic testing to identify sources of variability in test performance [0.0] 我々は機械学習を用いて、診断試験を適用して解釈を増強する状況リスクを評価する。
検査特異性を損なうことなく、皮膚検査で検出された感染群の割合が16ポイント以上向上するように、検査感度を向上できることを示した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:51:28 GMT)
MPXGAT: An Attention based Deep Learning Model for Multiplex Graphs Embedding [0.0] マルチプレックスグラフ埋め込みに適した,革新的注目に基づくディープラーニングモデルMPXGATを紹介する。
MPXGATは層内接続と層間接続の両方を利用して多重ネットワークの構造をキャプチャする。
様々なベンチマークデータセットを用いて実施した総合的な実験的評価により,MPXGATが最先端の競合アルゴリズムより一貫して優れていることを確認した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:06:23 GMT)
Level attraction in a quasi-closed cavity [0.0] 準閉鎖型フォトニックキャビティと強磁性材料からなるハイブリッドシステムにおいて, 反共鳴に付随する有効結合について述べる。
提案モデルにより, 共振器における位相ジャンプと反共振の研究から, 共振器内のフェライトの所定の位置に対する反共振器の有効結合の性質を予測できることを示した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:22:59 GMT)
LLMs and the Human Condition [0.0] このモデルは、哲学、社会学、コンピュータ科学から、人間の意思決定に関する確立した3つの理論を統合する。
これは、多くの哲学者や、多くの現代のAI研究者によって取られた位置である「反応性システム」として一般的に考えられているものを記述している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:51:44 GMT)
Influence of disorder at Insulator-Metal interface on spin transport [0.0] 非磁性金属と補償反強磁性絶縁体との界面によるスピン輸送を考察する。
スピン輸送は金属中のスピン偏極電子と絶縁体中のマグノンによって輸送される。
スピンホール効果による金属中のスピン蓄積の存在下でのスピン電流と熱勾配を計算した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:01:52 GMT)
Improving Cancer Imaging Diagnosis with Bayesian Networks and Deep Learning: A Bayesian Deep Learning Approach [0.0] 本稿では,Deep LearningとBayesian Networkの予測モデルの背後にある理論について考察する。
画像の分類における健康産業におけるベイズ深層学習のアプローチの適用と正確性について分析する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 01:27:10 GMT)
Imperfect quantum networks with tailored resource states [0.0] 絡み合いに基づく量子ネットワークは、絡み合ったリソース状態の選択においてユニークな柔軟性を示す。
本研究では, 完全に非対称なネットワークシナリオにおける絡み合いの分布に, このアプローチの柔軟性をどのように利用できるかを検討する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:00:02 GMT)
Graph-Based Optimisation of Network Expansion in a Dockless Bike Sharing System [0.0] 自転車シェアリングシステム(BSS)は世界中で数千以上の都市に展開されており、多くの都市交通システムにおいて重要な役割を果たしている。
本研究では,ドッキングレス BSS オペレータである Bikes Moby の旅行データを用いて,最適時間グラフを構築した。
グラフを最適化するプロセスは、将来のBSSの拡張中に新しいステーションを建てるための主要な場所を明らかにした。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:29:25 GMT)
General quantum-classical dynamics as measurement based feedback [0.0] このノートは、連続測定の理論と一般(非マルコフ的)フィードバックから、一般ハイブリッド量子古典力学の微分方程式と偏微分方程式を導出する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 18:02:01 GMT)
GenAI Detection Tools, Adversarial Techniques and Implications for Inclusivity in Higher Education [0.0] 本研究では,修正された機械生成コンテンツと対向する6つの主要生成AI(GenAI)テキスト検出器の有効性について検討した。
その結果、既に低い精度(39.5%)の検出器は、操作された内容に直面すると、大きな精度(17.4%)の低下を示すことが示された。
正確さの限界と偽の告発の可能性は、これらのツールが学術的完全性に違反したかどうかを判断するために現在推奨できないことを示している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 04:57:13 GMT)
Gaussian Formalism: Concrete Realization of Joint Measurement for Heisenberg's Uncertainty Relation for Errors [0.0] 我々の関節計測は, 位置と運動量の投射的測定とを円滑に補間することを示す。
位置運動量測定におけるLee-Tsutsui(LT)誤差と改良Lee誤差を得る。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:10:48 GMT)
Feature-Based Echo-State Networks: A Step Towards Interpretability and Minimalism in Reservoir Computer [0.0] 本稿では,時系列予測のためのエコー状態ネットワーク(ESN)パラダイムを用いた,新しい,解釈可能なリカレントニューラルネットワーク構造を提案する。
系統的な貯水池アーキテクチャは、特徴として知られる異なる入力の組み合わせによって駆動される小さな並列貯水池を用いて開発されている。
結果として、Feat-ESN(Feat-ESN)は、従来の単一貯留層ESNよりも低いリザーブノードを持つ。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:41:17 GMT)
Evaluating Explanatory Capabilities of Machine Learning Models in Medical Diagnostics: A Human-in-the-Loop Approach [0.0] 我々は、膵癌治療の確立に関係するさまざまな特徴の重要性を確立するために、Human-in-the-Loop関連技術と医療ガイドラインをドメイン知識の源泉として使用しています。
本稿では,説明結果の解釈を容易にするため,重み付きジャカード類似度係数などの類似度尺度を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 20:11:34 GMT)
Engineering flat bands in twisted-bilayer graphene away from the magic angle with chiral optical cavities [0.0] キラル光学キャビティを用いることで、トポロジカルフラットバンドをマジックアングルから遠ざけることができることを示す。
時間反転対称性の破れは、孤立したバンドを平らにし、スペクトルの残りの部分を切り離すのに基本的な役割を果たす。
本研究は,光デバイスを用いたTBGにおけるフラットバンドの工学的可能性を示すものである。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:34:51 GMT)
Emotion Detection with Transformers: A Comparative Study [0.0] 我々は、異なる変圧器の変種を用いて、感情データセットを用いて、事前訓練されたトランスフォーマーモデルを訓練し、評価する。
解析の結果,句読解や停止語といった一般的な手法は,モデルの性能を損なうことが判明した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:26:39 GMT)
EmoScan: Automatic Screening of Depression Symptoms in Romanized Sinhala Tweets [0.0] この研究は、抑うつのリスクがある個人を特定するために、ロマタイズド・シンハラのソーシャルメディアデータの利用を探求する。
言語パターン、感情、行動の手がかりを分析することにより、抑うつ症状の自動スクリーニングのための機械学習ベースのフレームワークが提示される。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:31:09 GMT)
Dynamic Hysteresis Across a Dissipative Multi-Mode Phase Transition [0.0] 多モード駆動散逸系における第1次散逸相転移の動的スイープについて検討する。
システムの温度を変化させることにより, システムのコヒーレントポンプ化の重要性について検討する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:39:01 GMT)
Developing generative AI chatbots conceptual framework for higher education [0.0] 本研究では、高等教育における生成人工知能(GAI)チャットボットの急速な変化について考察する。
CGAICAMは、よく知られたフレームワークから要素を合成した結果である。
この研究は、AIが高等教育に与える影響を理解し、その効果的な実装のために重要な要素を指摘することを目的としている。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:40:26 GMT)
Dephasing Noise Simulation for Coherence-Generating Devices [0.0] 本稿では,量子ゲートのコヒーレンス発生力を低減させる劣化雑音について検討する。
この結果から, クビットゲートに影響を及ぼす非自明な劣化雑音の構造が明らかとなった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:07:57 GMT)
Density engineering via inter-condensate dipole-dipole interactions [0.0] 本研究では, 封止されたエム制御双極子凝縮体を用いて, エムターゲットのボース・アインシュタイン凝縮体の密度を軸方向に閉じ込め, 設計できることを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 05:50:09 GMT)
Data-efficient, Explainable and Safe Box Manipulation: Illustrating the Advantages of Physical Priors in Model-Predictive Control [0.0] MPCフレームワークにおける環境力学の事前知識が,説明可能性,安全性,データ効率の向上につながることを示す。
我々は,実際のロボットシステムに基づくペイロード操作問題をモデル化し,MPCフレームワークにおける環境のダイナミクスに関する事前知識を活用することにより,説明可能性,安全性,データ効率の向上につながることを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:16:15 GMT)
Constants of Motion for Conserved and Non-conserved Dynamics [0.0] 本稿では,時系列データに機械学習技術(FJet)を適用した動的モデルから始める。
この力学モデルはリー対称性の手法で解析され、運動定数を得る。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 13:49:43 GMT)
Classifying Objects in 3D Point Clouds Using Recurrent Neural Network: A GRU LSTM Hybrid Approach [0.0] 拡張現実における3次元オブジェクト分類のためのディープラーニング戦略を提案する。
提案手法はGRUとLSTMの組み合わせである。
提案手法は4,499,0641点のデータセットで0.99の精度を達成した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:14:53 GMT)
Classical-Quantum correspondence in Lindblad evolution [0.0] 我々は、(多くは)古典的ハミルトン多様体と(多くは)線型的に成長する古典的ジャンプ関数を用いて定義されるリンドブラッドの進化について、量子可観測はエルベルト-シュミットノルムにおける古典的フォッカー-プランクの進化に近いままであることを示す。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:21:04 GMT)
Charge-parity switching effects and optimisation of transmon-qubit design parameters [0.0] 包括的雑音モデルに基づく量子ビット設計パラメータの最適範囲を同定する。
電荷パリティスイッチは、2量子ゲートの準粒子関連エラー源となる。
本稿では,量子回路実行のための性能指標を提案する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:04:45 GMT)
Calculation of DC Stark Resonances for the Ammonia Molecule [0.0] 我々は、非単調なシフトが観測された平面幾何学水分子に関する以前の研究を拡張した。
分子軸に沿った場の非単調なシフトが見つかる。
垂直場の場合、1e軌道の高速かつ遅いイオン化軌道への分割を報告する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 10:58:47 GMT)
Bi-objective Ranking and Selection Using Stochastic Kriging [0.0] 両目的のランク付けと選択の問題について検討し,その2つの目的が不確実性をもって観測された。
そこで本研究では,競合する解に対して逐次サンプルを割り当てるバイーシアン双対象ランクと選別法を提案する。
実験結果から,提案手法は標準的なアロケーション手法よりも優れており,また,よく知られた最先端のアルゴリズムも優れていることがわかった。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 14:52:27 GMT)
Bardeen-Cooper-Schrieffer interaction as an infinite-range Penson-Kolb pairing mechanism [0.0] 有名な $(kuparrow, -kdownarrow)$ Bardeen-Cooper-Schrieffer 相互作用が実空間で考えると、無限範囲のペンソン=コルブ対化機構と等価であることを示す。
リング状格子に閉じ込められたフェルミオン粒子の動力学について検討した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:01:02 GMT)
Artificial Intelligence (AI) Based Prediction of Mortality, for COVID-19 Patients [0.0] 重篤な新型コロナウイルス患者に対しては、高リスク患者を特定し、生存とICU(ICU)の必要性を予測することが重要である。
本研究では,9つの機械学習アルゴリズムと2つの広く使われている特徴選択法を組み合わせたディープラーニングアルゴリズムの性能について検討した。
LSTMは最終状態とICU要件を90%, 92%, 86%, 95%の精度, 感度, 特異度, AUCで予測した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 12:11:29 GMT)
Arbitrary quantum circuits on a fully integrated two-qubit computation register for a trapped-ion quantum processor [0.0] トラップイオン量子コンピュータの計算モジュールとして機能するユニバーサル2量子レジスタ上の任意の回路の実装について報告する。
量子ゲートの普遍的な集合は、チップ集積マイクロ波アドレスのみを用いて9$Be$+$イオンの2イオンクーロン結晶上に実装される。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:44:18 GMT)
Anomalous noise spectra in a spin-exchange-relaxation-free alkali-metal vapor [0.0] スピン交換緩和自由状態下では、非偏極8,7mathrmRb$蒸気上でスピンノイズ分光を行う。
ローレンツモデルから強く逸脱する雑音スペクトル分布を観測する。
スピンスクイーズおよび絡み込み検出における量子センシングと絶対雑音校正の意義について論じる。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 20:19:23 GMT)
Analytical results for the Quantum Alternating Operator Ansatz with Grover Mixer [0.0] 我々はGrovermixerを用いてQAOAを分析する統計的手法を提案する。
レイヤ数に依存しない期待値の式が得られます。
我々は、Groverのアルゴリズムの最適性と矛盾する議論を用いて、すべての境界を一般化する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 21:29:09 GMT)
Almost All Quantum Channels Are Diagonalizable [0.0] 我々は「単純な固有値しか持たない$mathcal S$のすべての要素の集まりは$mathcal S$で密接である」という文を証明している。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 17:54:33 GMT)
AAPMT: AGI Assessment Through Prompt and Metric Transformer [0.0] 本研究では,知覚品質,信頼度,テキストと画像の対応性などのパラメータに着目したモデルを開発する。
Metric Transformerは、様々なAGI品質指標間の複雑な関係にインスパイアされた、新しい構造である。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 02:31:06 GMT)
A stability theorem for bigraded persistence barcodes [0.0] 有限擬計量空間 X のビッグラッド持続ホモロジー加群とビッグラッドバーコードを定義する。
重み付き持続的二重ホモロジー加群とバーコードに対する安定性定理を証明した。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 16:37:06 GMT)
A finite operator learning technique for mapping the elastic properties of microstructures to their mechanical deformations [0.0] 本稿では,機械平衡の解法をパラメトリックに学習する手法を提案する。
マイクロメカニクスを例として、マイクロメカニクスの知識が不可欠である。
演算子学習と有限要素法にインスパイアされた本手法は,他の数値解法からのデータに頼らずに学習できることを実証する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 19:57:48 GMT)
A Machine Learning Approach for Crop Yield and Disease Prediction Integrating Soil Nutrition and Weather Factors [0.0] バングラデシュにおける作物選択・病気予測のための知的農業意思決定支援システムの開発が主な目的である。
推奨されるアプローチは、作物の生産、土壌条件、農業・気象地域、作物病、気象要因に関する様々なデータセットを使用する。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 09:57:50 GMT)
3D-Space and the preferred basis cannot uniquely emerge from the quantum structure [0.0] HSF (Hilbert-Space Fundamentalism) は、量子状態ベクトルとハミルトニアンのみの基本構造であると述べている。
HSFは、ヒルベルト空間の受動的変換によって単に実現された、時間的および代替現実における「受動的」旅行のような奇妙な効果をもたらす。
論文参考訳(メタデータ) (Thu, 28 Mar 2024 11:08:11 GMT)