Boosting Visual-Language Models by Exploiting Hard Samples [126.4] HELIPは、既存のCLIPモデルの性能を高めるための費用対効果戦略である。
我々の方法では、既存のモデルのトレーニングパイプラインと懸命に統合できます。
包括的なベンチマークでは、HELIPはパフォーマンス向上のために既存のモデルを継続的に強化する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 14:00:53 GMT)
Strategic Preys Make Acute Predators: Enhancing Camouflaged Object
Detectors by Generating Camouflaged Objects [107.5] カモフラーゲ型物体検出(COD)は、カモフラーゲ型物体を視覚的に周囲に混入させる難易度の高い課題である。
我々は、捕食者がより優れたカモフラージュと捕食者を開発し、より鋭い視覚システムを取得するための獲物を誘導する獲物捕食者ゲームからインスピレーションを得ている。
内部コヒーレンスとエッジガイダンス (ICEG) と呼ばれる新しいCOD法を導入し, カモフラージュした特徴コヒーレンスモジュールを導入した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 09:43:34 GMT)
A Discriminative Latent-Variable Model for Bilingual Lexicon Induction [100.8] 本稿では,バイリンガルレキシコン誘導のための新しい識別潜在変数モデルを提案する。
我々のモデルは、Haghighi et al. (2008) 以前の二部語マッチング辞書と表現に基づくアプローチを組み合わせたものである。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 18:35:27 GMT)
HIQL: Offline Goal-Conditioned RL with Latent States as Actions [81.7] オフラインデータからゴール条件付きRLの階層的アルゴリズムを提案する。
この階層的な分解によって、推定値関数のノイズに頑健になることを示す。
提案手法は,従来の手法を巧みに操り,高次元画像観察にスケールできるとともに,アクションフリーなデータを容易に利用することができる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 04:26:48 GMT)
Democratizing Fine-grained Visual Recognition with Large Language Models [80.5] 画像から下位レベルのカテゴリを識別することは、コンピュータビジョンにおける長年の課題であり、きめ細かい視覚認識(FGVR)と呼ばれる。
FGVRシステムの開発における大きなボトルネックは、高品質なペアのエキスパートアノテーションの必要性によって引き起こされる。
本研究では,大規模言語モデル (LLM) の世界の知識をプロキシとして内部的に活用する,きめ細かなセマンティックカテゴリー推論(FineR)を提案する。
トレーニングフリーのFineRは、最先端のFGVRや言語、ビジョンアシスタントモデルより優れており、野生や新しい領域で働くことを約束しています。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 16:01:25 GMT)
DiffuMatting: Synthesizing Arbitrary Objects with Matting-level
Annotation [76.7] 拡散の強大な全ての生成能力を継承し,「何でも達成する」力を与えるDiffuMattingを提案する。
我々のDiffuMattingは、いくつかの潜在的な応用(マットデータ生成、コミュニティフレンドリーなアートデザイン、制御可能な生成など)を示している。
マットデータ生成器として、DiffuMattingは汎用オブジェクトとポートレート・マッティングセットを合成し、一般オブジェクト・マッティングでは15.4%、ポートレート・マッティングでは11.4%の誤差を効果的に削減した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 10:39:32 GMT)
A Dataset for the Validation of Truth Inference Algorithms Suitable for Online Deployment [76.0] 実世界のクラウドソーシングプラットフォームから収集した,実質的なクラウドソーシングアノテーションデータセットを紹介する。
このデータセットは、約2万のワーカー、100万のタスク、600万のアノテーションで構成されている。
本データセットにおけるいくつかの代表的真理推論アルゴリズムの有効性を評価する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 16:00:41 GMT)
LMSYS-Chat-1M: A Large-Scale Real-World LLM Conversation Dataset [76.0] LMSYS-Chat-1M(LMSYS-Chat-1M)について紹介する。
このデータセットは、VicunaのデモとArenaのWebサイトで、210KのIPアドレスから収集されています。
GPT-4と同様の動作を行うコンテンツモデレーションモデルの開発、安全性ベンチマークの構築、Vicunaと同様の動作を行う命令追従モデルのトレーニング、挑戦的なベンチマーク問題の作成、という4つのユースケースを通じて、その汎用性を実証する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 19:34:57 GMT)
Can Large Language Model Agents Simulate Human Trust Behaviors? [75.7] 大規模言語モデル(LLM)エージェントは、社会科学などの応用において人間をモデル化するためのシミュレーションツールとして、ますます採用されている。
本稿では,人間同士のインタラクションや信頼の最も重要な行動の一つに焦点をあて,LLMエージェントが人間の信頼行動をシミュレートできるかどうかを検討する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 13:48:43 GMT)
No Language is an Island: Unifying Chinese and English in Financial
Large Language Models, Instruction Data, and Benchmarks [73.1] ICE-PIXIUは、翻訳された英語とオリジナルの英語のデータセットとともに、中国語のタスクのスペクトルを統合する。
多様なモデル変種への無制限アクセス、多言語および多モーダル命令データのコンパイル、エキスパートアノテーションによる評価ベンチマークを提供する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 16:22:20 GMT)
Summarize the Past to Predict the Future: Natural Language Descriptions
of Context Boost Multimodal Object Interaction Anticipation [72.7] マルチモーダルトランスアーキテクチャであるTransFusionを提案する。
アクションコンテキストを要約することで、言語の表現力を利用する。
我々のモデルはより効率的なエンドツーエンド学習を可能にします。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 17:21:25 GMT)
On the Detection of Reviewer-Author Collusion Rings From Paper Bidding [71.4] 衝突リングは、コンピュータサイエンスカンファレンスのピアレビューシステムに大きな脅威をもたらす。
この問題を解決する1つのアプローチは、操作された入札から衝突するレビュアーを検出することである。
衝突環の検出が可能であるという研究はまだ確立されていない。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 23:46:41 GMT)
From Instructions to Constraints: Language Model Alignment with
Automatic Constraint Verification [70.1] NLPタスクの共通制約を調査し、それらの引数の型に基づいて、それらを3つのクラスに分類する。
本稿では,ACT(ConsTraintsのアラインメント)という統合フレームワークを提案し,制約に適応したユーザアライメントのための監視信号を自動的に生成する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 22:14:54 GMT)
METRA: Scalable Unsupervised RL with Metric-Aware Abstraction [69.9] Metric-Aware Abstraction (METRA)は、教師なし強化学習の新たな目標である。
潜在空間のあらゆる方向に移動することを学ぶことで、METRAは様々な振る舞いの抽出可能な集合を得る。
複雑なピクセルベースの環境においても,METRAは様々な有用な振る舞いを発見できることを示す。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 04:30:17 GMT)
M4: Multi-generator, Multi-domain, and Multi-lingual Black-Box
Machine-Generated Text Detection [69.3] 大規模言語モデル(LLM)は,多様なユーザクエリに対して,流動的な応答を生成する優れた能力を示している。
これはまた、ジャーナリズム、教育、アカデミアにおけるそのようなテキストの誤用の可能性への懸念も提起している。
本研究では,機械が生成したテキストを検知し,潜在的誤用を特定できる自動システムの構築を試みている。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 01:04:48 GMT)
Cross-Cluster Shifting for Efficient and Effective 3D Object Detection
in Autonomous Driving [69.2] 本稿では,自律運転における3次元物体検出のための3次元点検出モデルであるShift-SSDを提案する。
我々は、ポイントベース検出器の表現能力を解き放つために、興味深いクロスクラスタシフト操作を導入する。
我々は、KITTI、ランタイム、nuScenesデータセットに関する広範な実験を行い、Shift-SSDの最先端性能を実証した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 10:36:32 GMT)
Editing Conceptual Knowledge for Large Language Models [67.8] 本稿では,Large Language Models(LLMs)における概念知識の編集の先駆者となる。
本研究では,新しいベンチマークデータセットConceptEditを構築し,評価のための新しいメトリクスセットを確立する。
実験の結果,既存の編集手法は概念レベルの定義をある程度効率的に修正できるが,関連する瞬間的知識を歪ませる可能性も示された。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 16:57:10 GMT)
AutoVP: An Automated Visual Prompting Framework and Benchmark [66.6] ビジュアルプロンプト(VP)は、様々な下流画像分類タスクを解決するために、事前訓練された視覚モデルを適用するための、パラメータ効率の高い微調整手法である。
本稿では,VP設計選択を自動化するエンドツーエンド拡張可能なフレームワークであるAutoVPと,12のダウンストリーム画像分類タスクを提案する。
実験の結果,AutoVPは,現在よく知られているVP手法よりもかなり優れていることがわかった。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 19:00:00 GMT)
S-DyRF: Reference-Based Stylized Radiance Fields for Dynamic Scenes [61.0] 現在の3Dスタイリング手法は、現実世界の動的な性質に反する静的なシーンを想定することが多い。
本稿では,動的ニューラルネットワークのための参照型時間スタイリング手法であるS-DyRFを提案する。
合成と実世界の両方のデータセットを用いた実験により,本手法が有意なスタイリング結果をもたらすことが示された。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 13:04:01 GMT)
UNICORN: Ultrasound Nakagami Imaging via Score Matching and Adaptation [59.9] 超音波による組織散乱の可視化と定量化は中上イメージングが約束している。
既存の手法では、最適なウィンドウサイズの選択に苦労し、推定の不安定性に悩まされている。
提案手法は,中上パラメータ推定のための高精度でクローズドな形状推定器であるUNICORNを提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 18:05:41 GMT)
Revisiting Edge Perturbation for Graph Neural Network in Graph Data
Augmentation and Attack [58.4] エッジ摂動はグラフ構造を変更する方法である。
グラフニューラルネットワーク(GNN)の性能への影響に基づき、2つの静脈に分類できる。
統一的な定式化を提案し、エッジ摂動法の2つのカテゴリ間の明確な境界を確立する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 15:50:04 GMT)
Decoupled Contrastive Learning for Long-Tailed Recognition [58.3] Supervised Contrastive Loss (SCL) は視覚表現学習で人気がある。
ロングテール認識のシナリオでは、各クラスのサンプル数が不均衡である場合、2種類の正のサンプルを同じように扱うと、カテゴリー内距離に対するバイアス最適化が導かれる。
そこで我々は,尾級の低表現を緩和するために,頭級から尾級へ知識を伝達するためのパッチベースの自己蒸留法を提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 09:46:28 GMT)
Deep Reinforcement Learning with Spiking Q-learning [56.1] スパイクニューラルネットワーク(SNN)は、少ないエネルギー消費で人工知能(AI)を実現することが期待されている。
SNNと深部強化学習(RL)を組み合わせることで、現実的な制御タスクに有望なエネルギー効率の方法を提供する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 08:02:12 GMT)
Towards Generalizable and Interpretable Motion Prediction: A Deep
Variational Bayes Approach [54.4] 本稿では,分布外ケースに対する頑健な一般化性を有する動き予測のための解釈可能な生成モデルを提案する。
このモデルでは, 長期目的地の空間分布を推定することにより, 目標駆動動作予測を実現する。
動き予測データセットの実験は、適合したモデルが解釈可能で一般化可能であることを検証した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 04:16:04 GMT)
DiffSTG: Probabilistic Spatio-Temporal Graph Forecasting with Denoising
Diffusion Models [53.7] 本稿では,不確実性や複雑な依存関係のモデル化が困難であることから,確率的STG予測に焦点をあてる。
本稿では,一般的な拡散モデルをSTGに一般化する最初の試みとして,DiffSTGと呼ばれる新しい非自己回帰フレームワークを提案する。
提案手法は,本質的時間学習能力STNNと拡散モデルの不確実性測定を組み合わせたものである。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 01:31:24 GMT)
WorldGPT: A Sora-Inspired Video AI Agent as Rich World Models from Text
and Image Inputs [53.2] 本稿では、Soraにインスパイアされたマルチモーダル学習の力を活用して、熟練した世界モデルフレームワークを構築する革新的なビデオ生成AIエージェントを提案する。
このフレームワークには、プロンプトエンハンサーとフルビデオ翻訳という2つの部分が含まれている。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 16:09:02 GMT)
Learn from the Past: A Proxy Guided Adversarial Defense Framework with
Self Distillation Regularization [53.0] 敵対的訓練(AT)は、ディープラーニングモデルの堅牢性を固める上で重要な要素である。
AT方式は、目標モデルの防御のために直接反復的な更新を頼りにしており、不安定な訓練や破滅的なオーバーフィッティングといった障害に頻繁に遭遇する。
汎用プロキシガイド型防衛フレームワークLAST(bf Pbf astから学ぶ)を提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 16:17:08 GMT)
Diffusion Models Trained with Large Data Are Transferable Visual Models [52.0] そこで本研究では,適度な量の目標データを用いて,基本的な視覚知覚タスクにおいて顕著な伝達性能を実現することができることを示す。
結果は、様々なタスクや実世界のデータセットにまたがる拡散モデルのバックボーンの顕著な転送可能性を示している。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 04:23:24 GMT)
Generalizing Graph Neural Networks on Out-Of-Distribution Graphs [51.3] トレーニンググラフとテストグラフの分散シフトを考慮せずにグラフニューラルネットワーク(GNN)を提案する。
このような環境では、GNNは、たとえ素早い相関であるとしても、予測のためのトレーニングセットに存在する微妙な統計的相関を利用する傾向がある。
本稿では,スプリアス相関の影響を排除するため,StableGNNと呼ばれる一般的な因果表現フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 07:52:04 GMT)
ImagenHub: Standardizing the evaluation of conditional image generation
models [48.5] 本稿では,条件付き画像生成モデルの推論と評価を標準化するワンストップライブラリであるImagenHubを提案する。
本研究では,感性一貫性と知覚品質という2つの評価スコアと,生成した画像を評価するための包括的なガイドラインを設計する。
人間の評価は,0.4以上の値を持つ76%のモデル上で,クリッペンドルフのαに対する高い労働者間合意を達成する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 21:41:51 GMT)
Risk-Sensitive RL with Optimized Certainty Equivalents via Reduction to
Standard RL [48.2] 我々は,OCE(Optimized Certainty Equivalent)リスクを用いたリスク感性強化学習について検討した。
標準RLへの還元による2つの一般的なメタアルゴリズムを提案する。
我々は,事前アルゴリズムが確実に失敗する間に,最適リスク感応ポリシーを学習することを示す。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 21:45:12 GMT)
SuPRA: Surgical Phase Recognition and Anticipation for Intra-Operative
Planning [46.6] 本稿では,手術段階を同時に認識し,次の手術段階を予測する2つのアプローチを提案する。
外科的位相認識・予測法(SuPRA)は,過去と現在の情報を正確な術中位相認識に活用する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 12:46:33 GMT)
Enhancing Quality of Compressed Images by Mitigating Enhancement Bias
Towards Compression Domain [46.3] 既存の圧縮画像の品質向上手法は圧縮領域に対する広範化バイアスを示す。
本稿では,このバイアスを緩和し,圧縮画像の品質を高めるための簡易かつ効果的な方法を提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 13:37:21 GMT)
Adaptive Learning Rate for Follow-the-Regularized-Leader: Competitive
Analysis and Best-of-Both-Worlds [46.3] FTRL(Follow-The-Regularized-Leader)は、オンライン学習における効果的で汎用的なアプローチとして知られている。
逐次意思決定問題としてFTRLの学習率を調整する問題を定式化する。
我々は,この下限の定数係数内で上限を達成できる学習率の更新ルールを提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 15:12:16 GMT)
Overcoming the Barrier of Orbital-Free Density Functional Theory for
Molecular Systems Using Deep Learning [46.1] 軌道自由密度汎関数理論(英: Orbital-free density functional theory、OFDFT)は、Kohn-Sham DFTよりも低コストでスケールできる量子化学の定式化である。
本稿では、深層学習関数モデルを用いて分子システムを解くことができるOFFTアプローチであるM-OFDFTを提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 04:00:39 GMT)
An End-to-End Deep Learning Generative Framework for Refinable Shape
Matching and Generation [45.8] In-Silico Clinical Trials (ISCTs) の必要条件としての形状生成モデルの構築
本研究では,非教師なしの幾何学的深層学習モデルを構築し,潜在空間における補修可能な形状対応を確立する。
提案するベースモデルを,より可変性を高めるために,結合形状生成クラスタリングマルチアトラスフレームワークに拡張する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 21:33:53 GMT)
PRIME: Scaffolding Manipulation Tasks with Behavior Primitives for
Data-Efficient Imitation Learning [44.8] PRIME(Primitive-based imitation with data efficiency)は、模倣学習のデータ効率を改善するために設計された行動プリミティブベースのフレームワークである。
本実験は,多段階操作タスクにおいてPRIMEが大幅な性能向上を実現することを示す。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 08:55:18 GMT)
Selective Visual Representations Improve Convergence and Generalization
for Embodied AI [44.3] 身体化されたAIモデルは、CLIPのような棚の視覚バックボーンを使って視覚的な観察をエンコードすることが多い。
これは学習プロセス内のノイズを導入し、タスク関連視覚的手がかりからエージェントの焦点を逸脱させる。
人間が経験、知識、課題に基づいて知覚をフィルタリングするプロセスにおいて、人間の選択的な注意を喚起して、我々は、具体化されたAIのための視覚刺激をフィルタリングするためのパラメータ効率の良いアプローチを導入する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 01:55:47 GMT)
Enriching Phrases with Coupled Pixel and Object Contexts for Panoptic
Narrative Grounding [43.7] 汎視的物語基盤は、物語キャプションの名詞句で表現された画像に物や物を分割することを目的としている。
本稿では,Phrase-Pixel-Object Transformer Decoder (PPO-TD)を提案する。
提案手法は,高いマージンを有する新しい最先端性能を実現する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 12:59:53 GMT)
ASiT: Local-Global Audio Spectrogram vIsion Transformer for Event
Classification [43.0] ASiTは、グループマスク付きモデル学習と自己蒸留を用いて、局所的およびグローバルな文脈情報をキャプチャする、新しい自己教師型学習フレームワークである。
我々は、音声イベント分類、キーワードスポッティング、話者識別を含む音声および音声の分類タスクにおいて、事前訓練されたモデルを評価する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 19:56:17 GMT)
Coherent Temporal Synthesis for Incremental Action Segmentation [42.5] 本稿では、インクリメンタルなアクションセグメンテーションのためのビデオデータ再生手法を初めて検討する。
本稿では,個々のフレームを格納する代わりに生成モデルを用いて行動を表現するテンポラリ・コヒーレント・アクション・モデルを提案する。
Breakfastデータセットの10タスクのインクリメンタルセットアップでは,ベースラインと比較して最大22%の精度向上を実現している。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 06:07:06 GMT)
Whiteness-based bilevel learning of regularization parameters in imaging [42.4] 副次的な白色ガウス雑音の存在下での逆問題の画像化の文脈において、正規化パラメータを学習するための教師なし二段階最適化戦略を考察する。
提案手法は, 平均二乗誤差オラクルに近い推定値を提供し, 差分に基づく原理を導出することを示す。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 15:45:39 GMT)
The ACPATH Metric: Precise Estimation of the Number of Acyclic Paths in C-like Languages [41.9] ACPATHは、与えられた関数を通して非循環的な実行パスの数を非常によく見積もることができる。
関数本体が後向きのgogoを含まず、ループ外からのループへのジャンプを含まない場合、そのような推定は実際に正確であることを示す。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 08:15:44 GMT)
RAPHAEL: Text-to-Image Generation via Large Mixture of Diffusion Paths [40.9] 我々はRAPHAELと呼ばれるテキスト条件画像拡散モデルを導入し,芸術的画像を生成する。
RAPHAELは、日本の漫画、リアリズム、サイバーパンク、インクイラストレーションなど、さまざまなスタイルの画像を切り替える際の優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 04:14:13 GMT)
LDB: A Large Language Model Debugger via Verifying Runtime Execution
Step-by-step [40.2] 大規模言語モデル(LLM)はコード生成の大きな進歩を導いている。
本研究では,Large Language Model Debugger (LDB)を紹介する。
LDBはプログラムを基本ブロックに分割し、実行中の各ブロックの後に中間変数の値を追跡する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 06:16:01 GMT)
Automatic design optimization of preference-based subjective evaluation
with online learning in crowdsourcing environment [40.1] ペアの組み合わせ選択とオンライン学習による評価ボリュームの割り当ての観点から,選好に基づく主観評価の自動最適化手法を提案する。
合成音声の嗜好に基づく主観評価実験では,ペアの組み合わせを351対から83対に減らし,評価精度を損なうことなく30対から663対に最適な評価量を割り当て,予算配分を無駄にすることで,テストの最適化に成功した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 05:55:00 GMT)
FedPIT: Towards Privacy-preserving and Few-shot Federated Instruction
Tuning [39.3] フェデレーション・インストラクション・チューニング(FedIT)は、プライバシを保護しながら、複数のデータオーナからのフェデレーション・ラーニングを活用するソリューションとして登場した。
我々は,LLMのコンテキスト内学習機能を利用して,タスク固有の合成データを自己生成して自律的に学習する,新しいフェデレーションアルゴリズムであるFedPITを提案する。
本手法では,データ抽出攻撃を効果的に抑えるため,パラメータ分離学習を用いて,合成データと拡張局所データで訓練された局所パラメータのグローバルパラメータを維持できる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 08:41:22 GMT)
Transferable Reinforcement Learning via Generalized Occupancy Models [39.2] 一般化占有モデル(GOM)の新たなクラスを提案する。
GOMは、定常データセットのカバレッジの下で、ある状態から可能なすべての長期的な結果の分布をモデル化する。
GOMは任意の報酬関数の一般性を保ちながら複合エラーを避ける。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 22:27:21 GMT)
ModuLoRA: Finetuning 2-Bit LLMs on Consumer GPUs by Integrating with
Modular Quantizers [38.2] 大規模言語モデル(LLM)のためのメモリ効率の高い微調整アルゴリズムを提案する。
lploraは、テキスト分類、自然言語推論、タスクに続く命令に対する競合性能を、既存のアプローチよりもはるかに少ないメモリで実現している。
私たちはまた、一般的な要約タスクにおいて最先端のROUGEスコアを超えます。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 03:24:06 GMT)
TEDDY: Trimming Edges with Degree-based Discrimination strategY [37.3] 本稿では,一対一のエッジスペーシフィケーションフレームワークであるTEDDYを紹介する。
我々のTEDDYは,グラフ構造とモデルパラメータの両方のターゲット空間レベルを考慮し,単一のトレーニングでグラフ抽選チケット(GLT)を効率的かつ迅速に実現する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 14:51:56 GMT)
GlanceVAD: Exploring Glance Supervision for Label-efficient Video
Anomaly Detection [36.7] 本稿では,異常検出精度とアノテーションコストのバランスを改善するために,"glance annotations"と呼ばれる新しいラベリングパラダイムを提案する。
本手法の有効性を評価するため,UCF-Crime と XD-Violence の2つの標準ビデオ異常検出データセットに対して,視線アノテーションを手動でアノテートする。
また,Ssianカーネルを基本単位として時間的異常分布を構成するGlanceVAD法を提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 09:57:10 GMT)
Unpacking Tokenization: Evaluating Text Compression and its Correlation
with Model Performance [36.7] 我々は,0-gram言語モデリングとみなす圧縮の理論的重要性を論じる。
事前学習した言語モデルの下流での成功に対する圧縮の実証的重要性を示す。
本稿では,トークン化器の圧縮とモデル下流性能の相関関係を示す。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 17:02:53 GMT)
$V_kD:$ Improving Knowledge Distillation using Orthogonal Projections [36.3] 知識蒸留は、小規模かつ効率的なディープラーニングモデルの訓練に有効な方法である。
しかし、1つのメソッドの有効性は、他のタスク、モダリティ、または他のアーキテクチャに転送する際に退化することができる。
本稿では,この制限に対処する新しい制約付き特徴蒸留法を提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 13:26:24 GMT)
Large Language Models for Software Engineering: A Systematic Literature
Review [35.3] 大規模言語モデル(LLM)は、ソフトウェア工学(SE)を含む多くの領域に大きな影響を与えている。
我々は2017年から2023年までの229件の研究論文を収集し分析し、4つの重要な研究課題(RQ)に答える。
これらのRQに対する回答から、現在の最先端とトレンド、既存の研究のギャップの特定、今後の研究に向けた有望な領域のフラグ付けなどについて論じる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 06:28:33 GMT)
The Lottery Ticket Hypothesis in Denoising: Towards Semantic-Driven
Initialization [34.4] ランダムなガウス雑音像を復調する際の抽選券仮説を定式化する。
我々は、既知の当選チケットから初期ノイズを生成する意味駆動型初期画像構築を実装した。
この結果から,入賞チケットを初期雑音画像に集約することで,モデルが対応する位置で特定対象を生成できることが示唆された。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 02:08:31 GMT)
VEIL: Vetting Extracted Image Labels from In-the-Wild Captions for
Weakly-Supervised Object Detection [33.7] 本稿では,ノイズキャプションから抽出したラベルを「ベット」する手法を提案する。
キャプション内のラベルノイズの種類を分析し,アノテートする。
分類器はデータセット境界とカテゴリをまたいだ一般化を行う。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 23:22:20 GMT)
RESTORE: Towards Feature Shift for Vision-Language Prompt Learning [33.1] ここでは,CLIPの1つの分岐のみに沿った即時チューニングが,誤調整の発生の原因であることを示す。
学習可能なパラメータをさまざまなモダリティで適切に正規化することなく、迅速な学習は元の事前学習制約に違反する。
クロスモーダルな一貫性に明示的な制約を課すマルチモーダルなプロンプト学習手法であるRESTOREを提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 08:52:48 GMT)
TRAD: Enhancing LLM Agents with Step-Wise Thought Retrieval and Aligned
Decision [32.2] 大規模言語モデル(LLM)エージェントは、Webナビゲーションやオンラインショッピングなど、さまざまなタスクのために構築されている。
本稿では,これらの問題に対処するための新しいフレームワーク(TRAD)を提案する。
TRADはThought Retrievalを実行し、思考マッチングによるステップレベルのデモ選択を実現する。
そして、TRADはAligned Decisionを導入し、検索したデモステップを、以前のステップまたはその後のステップで補完する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 13:58:38 GMT)
Adversarial Training on Purification (AToP): Advancing Both Robustness
and Generalization [31.2] 我々は,AToP(Adversarial Training on Purification)と呼ばれる新しいパイプラインを提案する。
乱数変換(RT)による摂動破壊と、逆数損失による微調整モデル(FT)の2つの構成要素から構成される。
そこで我々は,CIFAR-10,CIFAR-100,ImageNetteの大規模実験を行った。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 06:49:58 GMT)
Harmonious Group Choreography with Trajectory-Controllable Diffusion [30.1] Trajectory-Controllable Diffusion (TCDiff) は、重複しない軌道を利用してコヒーレントなダンスの動きを促進する新しい手法である。
ダンサーの衝突に対処するために,音楽に基づいて複数のダンサーの軌道を生成できるダンス・ビート・ナビゲータを導入する。
フレキシブルなフットワークを実現するために,隣接するフレームからの軌道変位を利用したフットワークアダプタを提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 12:11:34 GMT)
Scaling Laws for Imitation Learning in Single-Agent Games [29.9] 我々は,モデルとデータサイズを慎重にスケールアップすることで,シングルエージェントゲームにおける模倣学習環境に類似した改善がもたらされるかどうかを検討する。
われわれはまずAtariのさまざまなゲームについて実験を行い、その後NetHackの非常に挑戦的なゲームに焦点を当てた。
IL損失と平均戻り値は計算予算とスムーズに一致し,相関関係が強く,計算最適ILエージェントの訓練には電力法則が適用されることがわかった。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 14:50:52 GMT)
Depicting Beyond Scores: Advancing Image Quality Assessment through
Multi-modal Language Models [29.9] 本稿では,従来のスコアベース手法の制約を克服するDepicted Image Quality Assessment法(DepictQA)を提案する。
DepictQAは、マルチモーダル大言語モデル(MLLM)を活用することで、画像品質の詳細な、言語ベース、人間ライクな評価を可能にする
本研究は,非参照アプリケーションにおける全参照データセットの有用性を実証し,言語ベースのIQA手法が個人の好みに合わせてカスタマイズできる可能性を示唆している。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 09:18:17 GMT)
Application of Tensor Neural Networks to Pricing Bermudan Swaptions [29.2] チェエットモデルはヨーロッパやベルムダンのスワップのような金利デリバティブの価格設定に広く用いられている。
深層学習技術は、ヨーロッパ・ベルムダン・スワプティオンの値過程に関連する後方微分方程式の解法として用いられてきた。
Dense Neural NetworksはDense Neural Networksよりも高速にトレーニングでき、それよりも正確で堅牢な価格を提供する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 21:51:28 GMT)
ClickVOS: Click Video Object Segmentation [29.2] Video Object(VOS)タスクは、ビデオ内のオブジェクトをセグメントすることを目的としている。
これらの制限に対処するため、Click Video Object (ClickVOS) という設定を提案する。
ClickVOSは、第1フレーム内のオブジェクトごとのクリック数に応じて、ビデオ全体を通して関心のあるオブジェクトをセグメントする。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 08:37:37 GMT)
Absence of spurious solutions far from ground truth: A low-rank analysis
with high-order losses [28.0] マトリックスセンシング問題は、最適以下の急激な解の拡散を伴う、広範に非順序性を示す。
この研究は、景観の複雑さを解き明かす新しい理論的な洞察を提供する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 01:07:22 GMT)
FrameQuant: Flexible Low-Bit Quantization for Transformers [27.9] ポストトライニング量子化は、事前トレーニングされたモデルを変更し、それを8ビット以下に量子化する。
変換器モデルに対する(ほとんど)2ビット量子化は、大きな効率向上を約束することを示す。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 04:01:49 GMT)
An Improved Analysis of Langevin Algorithms with Prior Diffusion for
Non-Log-Concave Sampling [27.9] 本研究では, 先行拡散を用いた改良型ランゲヴィンアルゴリズムが, 強対数対数対象分布に対して独立に次元を収束させることができることを示す。
また、修正したランゲヴィンアルゴリズムは、異なるステップサイズスケジュールを持つKL発散の次元非依存収束も得ることを証明した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 11:50:34 GMT)
PSS-BA: LiDAR Bundle Adjustment with Progressive Spatial Smoothing [27.1] 本稿では, プログレッシブ空間平滑化によるLiDARバンドル調整について述べる。
提案手法の有効性とロバスト性をシミュレーションと実世界のデータセットで検証した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 07:56:54 GMT)
VidProM: A Million-scale Real Prompt-Gallery Dataset for Text-to-Video
Diffusion Models [26.9] VidProMは、実際のユーザから166万のユニークなテキスト対ビデオプロンプトを含む、最初の大規模データセットである。
データセットには、4つの最先端拡散モデルと関連するデータによって生成された669万のビデオが含まれている。
収集したデータセットVidProMをGitHubで公開し、CC-BY-NC 4.0ライセンスの下でHugging Faceを公開しています。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 05:40:12 GMT)
A Comprehensive Overhaul of Multimodal Assistant with Small Language
Models [26.6] マルチモーダル小言語モデル(Multimodal Small Language Models, MLM)の設計側面について検討し, Mipha という名前の効率的なマルチモーダルアシスタントを提案する。
私たちのMipha-3Bは、最先端の大規模MLLM、特にLLaVA-1.5-13Bを複数のベンチマークで上回ります。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 12:43:27 GMT)
OpenVIS: Open-vocabulary Video Instance Segmentation [26.1] OpenVIS(Open-vocabulary Video Instance)は、ビデオ内の任意のオブジェクトカテゴリを検出し、セグメンテーションし、追跡する。
我々は、強力なオープン語彙機能を実現するOpenVISフレームワークInstFormerを提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 08:23:58 GMT)
Learning Exposure Correction in Dynamic Scenes [26.1] 我々は、露光不足と露光過多の両方を含む、世界初の実世界のペアビデオデータセットを構築した。
空間アライメントを実現するために,2台のデジタル一眼レフカメラとビームスプリッタを用いて不適切な露光映像と通常の露光映像を同時に撮影する。
本稿では,Retinex理論に基づくビデオ露光補正ネットワーク(VECNet)を提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 08:51:29 GMT)
FARPLS: A Feature-Augmented Robot Trajectory Preference Labeling System
to Assist Human Labelers' Preference Elicitation [26.1] 優先度に基づく学習は、ロボットタスクの目的と人間の価値を一致させることを目的としている。
従来の比較に基づく選好ラベリングシステムは、ビデオに記録された複雑な軌跡間の重要な違いをダイジェストし、識別するラベラーをほとんどサポートしない。
FARPLSは、人間にとって重要な様々なタスク機能における潜在的なアウトリーチを強調し、容易にレビューと比較のために対応する動画を抽出する。
また、ユーザの親しみ、軌道対の難しさ、不一致度に応じてラベリング順序を動的に調整する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 17:07:20 GMT)
DiffAR: Denoising Diffusion Autoregressive Model for Raw Speech Waveform
Generation [26.0] 本研究では,生音声波形を生成する拡散確率的エンドツーエンドモデルを提案する。
我々のモデルは自己回帰的であり、重なり合うフレームを生成し、各フレームは以前に生成されたフレームの一部に条件付けされる。
実験により,提案モデルが他の最先端のニューラル音声生成システムと比較して,高品質な音声を生成することが示された。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 22:31:45 GMT)
MoST: Motion Style Transformer between Diverse Action Contents [25.8] そこで本研究では,コンテンツからスタイルを効果的に切り離し,ソースモーションから転送されたスタイルを持つ可視動作を生成する新しい動き変換器を提案する。
提案手法は既存の手法より優れており,特に異なる内容のモーションペアにおいて,後処理を必要とせず,非常に高品質であることを示す。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 14:11:25 GMT)
Universal Debiased Editing for Fair Medical Image Classification [25.7] 本研究では,Foundation Models (FM) API を用いた医療画像のバイアス問題に対処する。
そこで本研究では,UDEノイズを発生させるU(niversal)D(ebiased)E(diting)戦略を提案する。
われわれのパイプライン全体は、様々な医療状況にまたがって適用可能な公平な画像編集を可能にする。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 06:15:42 GMT)
Neural Field Convolutions by Repeated Differentiation [25.3] 本稿では,ニューラルネットワークなどの一般的な連続信号を用いて連続的な畳み込みを行う手法を提案する。
我々は、様々なデータモダリティと空間的に異なるカーネルに対して、我々のアプローチを実証する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 19:35:43 GMT)
Language-Driven Anchors for Zero-Shot Adversarial Robustness [25.2] 本稿では,言語駆動型アンカー型対外訓練戦略を提案する。
テキストエンコーダのセマンティック一貫性を活用することで、LAATは画像モデルの対角的堅牢性を高めることを目指している。
LAATは、最先端手法よりもゼロショット対逆ロバスト性を著しく向上することを示す。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 08:01:03 GMT)
Benchmarking Segmentation Models with Mask-Preserved Attribute Editing [25.1] 本研究では,ロバストネス評価のための局所特性およびグローバル特性の変動について検討する。
そこで我々は,実際の画像の視覚的属性を編集するマスク保存属性編集パイプラインを構築した。
パイプラインを使用して、オブジェクト属性とイメージ属性の両方をカバーするベンチマークを構築します。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 15:12:35 GMT)
Fine-grainedly Synthesize Streaming Data Based On Large Language Models
With Graph Structure Understanding For Data Sparsity [25.0] ユーザデータの膨大さのため、Eコマースプラットフォームにおけるユーザレビューに対する感情分析は、しばしばパフォーマンスの低下に悩まされる。
スパースユーザを3つのカテゴリ(Mid-tail, Long-tail, Extreme)に分類する,詳細なストリーミングデータ合成フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 08:59:04 GMT)
nnMamba: 3D Biomedical Image Segmentation, Classification and Landmark
Detection with State Space Model [25.0] 本稿では、CNNの強みとステートスペースシーケンスモデル(SSM)の高度な長距離モデリング機能を統合する新しいアーキテクチャであるnnMambaを紹介する。
6つのデータセットの実験では、3D画像のセグメンテーション、分類、ランドマーク検出など、一連の困難なタスクにおいて、nnMambaが最先端のメソッドよりも優れていることが示されている。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 07:13:49 GMT)
Are Language Models Puzzle Prodigies? Algorithmic Puzzles Unveil Serious
Challenges in Multimodal Reasoning [24.4] 本稿では,視覚的質問応答の文脈内での多モーダルパズル解決の新たな課題を紹介する。
本稿では,アルゴリズムパズルの解法におけるマルチモーダル言語モデルの能力に挑戦し,評価するための新しいデータセットAlgoVQAを提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 00:59:35 GMT)
Fluent: Round-efficient Secure Aggregation for Private Federated
Learning [23.9] フェデレートラーニング(FL)は、多数のクライアント間で機械学習モデルの協調トレーニングを促進する。
FLは、プライバシ推論や逆攻撃といった脆弱性の影響を受け続けている。
本研究は,プライベートFLのためのラウンドおよび通信効率の高いセキュアアグリゲーション方式であるFluentを導入する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 09:11:57 GMT)
Finding Visual Saliency in Continuous Spike Stream [23.6] 本稿では,連続スパイク流における視覚的塩分濃度を初めて検討する。
本稿では,フルスパイクニューラルネットワークに基づくRecurrent Spiking Transformerフレームワークを提案する。
我々のフレームワークは、スパイクストリームにおける視覚的サリエンシの強調とキャプチャにおいて、大幅に改善されている。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 15:15:35 GMT)
SCORE: Self-supervised Correspondence Fine-tuning for Improved Content
Representations [23.6] 本研究は,SSL音声表現をコンテンツ関連タスクに適用するために,自己教師付き対応(SCORE)ファインタニングというコスト効率の高いSSFT手法を提案する。
SCOREは、自動音声認識、音素認識、クエリ・バイ・サンプルタスクのための単一のGPU上で、わずか数時間の微調整(5時間)で、SUPERBベンチマークのバニラ HuBERT を上回っている。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 16:57:51 GMT)
Is your model predicting the past? [23.2] 本稿では,理論的,経験的,規範的な2つの予測経路の区別を提案する。
私たちの提案の中心には、後方ベースラインと呼ばれる単純で効率的な統計テストのファミリーがあります。
我々は、背景変数とシステムの予測のみを考慮し、ブラックボックスとして予測システムを監査するための意味のある後方ベースラインを導出する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 11:56:19 GMT)
Exploring Iterative Enhancement for Improving Learnersourced
Multiple-Choice Question Explanations with Large Language Models [23.1] 我々は、自動説明生成のタスクを足場として、"ILearner-LLM" というフレームワークを提示し、評価する。
このフレームワークは、評価モデルから品質評価スコアをインストラクションプロンプトに反復的にフィードバックすることで、高品質な学生対応の説明を生成する。
本研究は,学生の学習支援体験を充実させるための有望な道のりを示すものである。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 13:48:41 GMT)
A streamlined Approach to Multimodal Few-Shot Class Incremental Learning
for Fine-Grained Datasets [23.0] FSCIL(Few-shot Class-Incremental Learning)は、限られた新しいデータストリームから学習しながら、事前の知識を維持するという課題を提起する。
本稿では,セッション間の画像テキスト埋め込みの分離性を向上するSSP(Session-Specific Prompts)を提案する。
第2のハイパーボリック距離は、同じクラス内の画像とテキストのペアの表現を圧縮し、異なるクラスから拡張し、より良い表現をもたらす。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 19:50:03 GMT)
MIM-Reasoner: Learning with Theoretical Guarantees for Multiplex
Influence Maximization [22.9] マルチプレックス・インフルエンス(MIM)は、マルチプレクサネットワークにおいて、期待される影響のあるユーザ数を最大化するために、シードユーザのセットを特定するように要求する。
多重化ネットワークの層内および層間における複雑な伝搬過程をキャプチャするMIM-Reasonerを提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 07:35:15 GMT)
Jailbreaking ChatGPT via Prompt Engineering: An Empirical Study [22.4] 大規模言語モデル(LLM)は、大きな可能性を示しているが、コンテンツ制約や潜在的な誤用に関連する課題ももたらしている。
本研究は, 1 つの重要な研究課題について,(1) 脱獄性 LLM を回避できる異なるプロンプトの種類数,(2) 脱獄性 LLM 制約を回避するための脱獄性プロンプトの有効性,(3) 脱獄性プロンプトに対する ChatGPT のレジリエンスについて検討した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 13:58:08 GMT)
Multi-Patch Prediction: Adapting LLMs for Time Series Representation
Learning [22.3] aLLM4TSは、時系列表現学習にLarge Language Models(LLM)を適用する革新的なフレームワークである。
われわれのフレームワークの特筆すべき要素はパッチワイドデコーディング層である。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 01:53:40 GMT)
Low-dose CT Denoising with Language-engaged Dual-space Alignment [21.2] 本稿では,低用量CTデノーミングモデルの最適化を目的としたLanguage-Engaged Dual-space Alignment Los (LEDA)を提案する。
我々の考えは、大きな言語モデル(LLM)を活用して、連続的な知覚空間と離散的な意味空間の両方において、鑑別CTおよび正常線量CT画像を整列させることである。
LEDAには2つのステップがある: まず、LCM誘導のCTオートエンコーダを事前訓練し、CT画像を連続的な高レベルな特徴にエンコードし、それらをトークン空間に量子化し、セマンティックトークンを生成する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 08:21:50 GMT)
ABC-Channel: An Advanced Blockchain-based Covert Channel [19.9] 私たちは、ABC-Channelというブロックチェーンベースの新しい隠蔽チャネルである、フルライフサイクルの隠蔽チャネルを達成するための最初の努力をしています。
オフチェーンの連絡先依存や、トランザクションボリュームの増加によるマスクレーディングの困難の増加など、一連の課題に対処しています。
ABC-Channelを検証するためのプロトタイプを開発し、Bitcoinテストネット上で広範囲なテストを行う。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 16:57:53 GMT)
Domain adaptation, Explainability & Fairness in AI for Medical Image
Analysis: Diagnosis of COVID-19 based on 3-D Chest CT-scans [19.8] 本稿では,DeF-AI-MIA COV19Dコンペティションを紹介する。
コンペティションはICCV 2021、ECCV 2022、ICASSP 2023の3つのコンペティションに続くシリーズ第4位である。
本論文では, チャレンジで使用するベースラインモデルと, 得られた性能について述べる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 15:36:56 GMT)
Attacking Transformers with Feature Diversity Adversarial Perturbation [19.6] 我々は,様々なブラックボックスモデルに対して強い伝達性を示すVTモデルに対して,ラベルフリーなホワイトボックス攻撃手法を提案する。
我々のインスピレーションは、ViTsにおける機能崩壊現象から来ており、重要な注意機構は機能の低周波成分に依存する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 00:55:58 GMT)
{A New Hope}: Contextual Privacy Policies for Mobile Applications and An
Approach Toward Automated Generation [19.6] コンテキストプライバシポリシ(CPP)の目的は、プライバシポリシを簡潔なスニペットに断片化し、アプリケーションのグラフィカルユーザインターフェース(GUI)内の対応するコンテキスト内でのみ表示することである。
本稿では,モバイルアプリケーションシナリオでCPPを初めて定式化し,モバイルアプリケーション用のCPPを自動生成するSeePrivacyという新しいマルチモーダルフレームワークを提案する。
人間の評価では、抽出されたプライバシーポリシーセグメントの77%が、検出されたコンテキストと適切に一致していると認識されている。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 06:19:10 GMT)
Is Vanilla MLP in Neural Radiance Field Enough for Few-shot View
Synthesis? [19.3] NeRFは、シーンをMLP(Multi-Layer Perception)とボリュームレンダリング手順でモデル化することで、新しいビュー合成において優れた性能を実現している。
既知のビューが少ないと、モデルは与えられたビューを過度に適合させる傾向がある。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 04:27:06 GMT)
From Text to Self: Users' Perceptions of Potential of AI on
Interpersonal Communication and Self [18.3] 我々は1週間の日記とインタビュー調査を行い、AIMC(AI-mediated communication)ツールに対するユーザの認識を調査した。
以上の結果から,AIMCはコミュニケーション信頼度の向上などのメリットを引用して,AIMCの支持を良好に捉えていることが示唆された。
しかし、この研究は、冗長性、不自然な反応、過度の感情の強さなど、AIMCツールの現在の限界を明らかにしている。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 01:19:41 GMT)
DrFuse: Learning Disentangled Representation for Clinical Multi-Modal
Fusion with Missing Modality and Modal Inconsistency [18.3] そこで本研究では,DrFuseを効果的に多モード核融合を実現するために提案する。
モダリティに共通する特徴と各モダリティに特有の特徴を分離することで、モダリティの欠如に対処する。
実世界の大規模データセットMIMIC-IVとMIMIC-CXRを用いて提案手法を検証する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 12:41:34 GMT)
u-LLaVA: Unifying Multi-Modal Tasks via Large Language Model [18.1] u-LLaVAは、MLLMの知覚能力を改善するためにピクセル、地域、グローバル機能を統合する革新的な統合マルチタスクフレームワークである。
この研究は、277Kサンプルからなるマスクベースの新しいマルチタスクデータセットに貢献し、MLLMの微粒化知覚能力に挑戦し評価する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 04:18:12 GMT)
A Bi-variant Variational Model for Diffeomorphic Image Registration with
Relaxed Jacobian Determinant Constraints [17.9] 本稿では,新しい二変差動画像登録モデルを提案する。
ヤコビ方程式 $det(nablabmvarphi(bmx)) = f(bmx) > 0$ 上の柔らかい制約は、局所変形をフレキシブル範囲内で縮小し、成長させることを可能にする。
緩和関数 $f(bmx)$ の最適化には正の制約が課され、正規化器は$f(bmx)$ の滑らかさを保証するために用いられる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 06:17:08 GMT)
In-context Prompt Learning for Test-time Vision Recognition with Frozen
Vision-language Model [17.9] In-Context Prompt Learning (In-Context Prompt Learning, InCPL) を提案する。
InCPLは、インコンテキストプロンプトとしてラベル付けされた1つの例で新しいテストサンプルを関連付ける。
提案手法は,様々な下流データセットにまたがって,優れた性能を示し,最先端の結果を得た。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 08:15:51 GMT)
Unbiased Estimator for Distorted Conics in Camera Calibration [17.3] モーメントを用いた円錐型キャリブレーションの新しい定式化について述べる。
我々の導出は、第1モーメントが歪み下であってもバイアスなしで推定できるという数学的発見に基づいている。
これにより、突起と歪の間のモーメント変化を追跡でき、歪んだ円錐の最初のモーメントを確実に保存できる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 04:48:39 GMT)
Training-free Linear Image Inverses via Flows [17.3] 本研究では,事前学習フローモデルを用いて,線形逆問題に対する学習自由度を求める手法を提案する。
提案手法では,高次元データセット上でのノイズの多い線形逆問題に対して,問題固有のチューニングは不要である。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 22:01:18 GMT)
Chiral spin liquid phase in an optical lattice at mean-field level [17.0] ラマンポテンシャルによって生成される有効U($1$)ゲージ束は、CSL相の実現に重要な役割を果たしている。
スピノン平均場解析により,強磁気フラストレーションの場合,CSL相は安定していることが示された。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 12:53:17 GMT)
Test-time Distribution Learning Adapter for Cross-modal Visual Reasoning [17.0] テスト期間中に直接動作するTT-DNA(Test-Time Distribution LearNing Adapter)を提案する。
具体的には,ガウス分布を推定し,少数ショット支援画像の視覚的特徴をモデル化し,支援セットから知識を抽出する。
ヒトの物体相互作用の視覚的推論に関する広範な実験結果から,提案したTT-DNAは既存の最先端手法よりも大きなマージンで優れていることが示された。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 01:34:45 GMT)
Limit of the Maximum Random Permutation Set Entropy [16.8] ランダム置換集合(RPS)のエントロピーとその対応する最大エントロピーが提案されている。
エントロピー関数のエンベロープという新しい概念が定義される。
数値的な例は 提案された封筒の効率性と簡潔さを検証します
論文参考訳(メタデータ) (Sun, 10 Mar 2024 13:04:09 GMT)
Group-based Robustness: A General Framework for Customized Robustness in
the Real World [16.4] 対象とするロバスト度を計測する従来の指標は、あるソースクラスから別のターゲットクラスへの攻撃に耐えるモデルの能力を適切に反映していないことが分かりました。
我々は、既存のメトリクスを補完し、特定の攻撃シナリオにおけるモデル性能を評価するのに適した新しい指標であるグループベースロバストネスを提案する。
同様の成功率で、新たな損失関数を用いた回避サンプルの発見は、対象とするクラスの数に匹敵する程度に削減できることが示される。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 05:02:04 GMT)
COVID-19 Computer-aided Diagnosis through AI-assisted CT Imaging
Analysis: Deploying a Medical AI System [16.2] 我々は,CT画像の自動解析を目的とした最先端AIシステムの統合と信頼性,迅速な展開について紹介する。
提案システムは、医師の発見時間を短縮し、新型コロナウイルス検出の全体的な効率を高めることが期待されている。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 15:54:45 GMT)
Refinement of MMIO Models for Improving the Coverage of Firmware Fuzzing [16.0] 本稿では,周辺機器のメモリマップI/O(MMIO)を改良することにより,コードカバレッジを向上させるES-Fuzzを提案する。
ES-Fuzzは、所定のファームウェアファザーを使用して、ESファームウェアのテスト後にテストケース以外に、ステートレスで固定されたMMIOモデルを生成する。
ES-Fuzzはファズウェアのカバー範囲を最大で160%まで増やすが、他のファームウェアのカバー範囲を大幅に減らすことはない。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 18:19:40 GMT)
Cold-start Bundle Recommendation via Popularity-based Coalescence and
Curriculum Heating [16.0] 既存のコールドスタートアイテムレコメンデーションの方法は、バンドルに簡単には適用できない。
我々はコールドスタートバンドルレコメンデーションのための正確なアプローチであるCoHeatを提案する。
CoHeatはコールドスタートバンドルレコメンデーションにおいて優れたパフォーマンスを示しており、最高の競合相手に比べて193%高いnDCG@20を実現している。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 05:13:41 GMT)
Fake or Compromised? Making Sense of Malicious Clients in Federated
Learning [15.9] 本報告では, 各種毒素攻撃および防御凝集規則(AGR)の包括的分析について述べる。
既存の敵モデルを接続するために、敵のスペクトルの中間に位置するハイブリッド敵モデルを提示する。
我々は、FLシステムを設計する際に考慮すべきさまざまな脅威について、実践者や研究者に明確に理解することを目的としている。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 21:37:21 GMT)
Personalized LoRA for Human-Centered Text Understanding [15.7] HCTUタスクのためのプラグイン・アンド・プレイ・フレームワークを備えたパーソナライズされたLoRA(PLoRA)を紹介する。
PLORAは、PLMに効果的で、パラメータ効率が高く、動的にデプロイする。
4つのベンチマークデータセットを用いて行った実験により,提案手法は実時間/実時間/ゼロショットの学習シナリオにおいて,既存の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 13:04:54 GMT)
FairSeg: A Large-Scale Medical Image Segmentation Dataset for Fairness
Learning Using Segment Anything Model with Fair Error-Bound Scaling [15.3] フェアネス学習研究を促進するためには、高品質な医療フェアネスデータセットが必要である。
既存の医療フェアネスデータセットはすべて分類タスク用であり、医療セグメント化にはフェアネスデータセットが使用できない。
我々は,1万件の被験者を対象とし,HarvardFairSegという医療セグメント化のための最初のフェアネスデータセットを提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 14:47:57 GMT)
Towards Fully Decoupled End-to-End Person Search [15.1] エンド・ツー・エンドの人物探索は、原シーン画像中の対象人物を統一モデルで共同で検出し、再同定することを目的としている。
検出タスクは、re-idタスクが異なるアイデンティティを識別している間に、すべての人を統一する。
既存の手法は、部分的に分離されたモデルのため、サブタスクの1つまたは2つの部分最適である。
タスクインクリメンタルな人探索ネットワークを提案し, タスク検出とリIDサブタスクのためのエンド・ツー・エンド・モデルを構築した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 14:00:23 GMT)
L$^2$GC: Lorentzian Linear Graph Convolutional Networks For Node
Classification [13.9] ローレンツ線形GCNの新しいフレームワークを提案する。
グラフノードの学習した特徴を双曲空間にマッピングする。
次に、ロレンツ線形特徴変換を行い、基礎となる木のようなデータ構造をキャプチャする。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 02:16:13 GMT)
Implicit Image-to-Image Schrodinger Bridge for CT Super-Resolution and
Denoising [13.5] Image-to-Image Schr"odinger Bridge (I2SB)は、破損した画像から生成過程を初期化する。
Inlicit Image-to-Image Schrodinger Bridge (I3SB)を導入し,その生成過程を非マルコフ過程に変換する。
この強化により、I3SBは、少数の生成ステップを使用して、より優れたテクスチャ復元の画像を生成することができる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 03:22:57 GMT)
BlazeBVD: Make Scale-Time Equalization Great Again for Blind Video
Deflickering [13.5] 高精細度・高速ブラインドビデオデクリッカリングのためのヒストグラム支援ソリューションBlazeBVDを導入する。
BlazeBVDはSTEフィルタ内のスムーズな照明ヒストグラムを用いて、時間データ学習の難しさを緩和する。
推論速度は最先端の10倍にも達する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 15:56:55 GMT)
Transformer based Multitask Learning for Image Captioning and Object
Detection [13.3] 本研究は,画像キャプションとオブジェクト検出を結合モデルに組み合わせた,新しいマルチタスク学習フレームワークを提案する。
我々は,2つのタスクを共同で訓練するためのTICOD, Transformer-based Image Captioning, Object Detectionモデルを提案する。
我々のモデルはBERTScoreの3.65%の改善によって、画像キャプション文学のベースラインを上回ります。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 19:31:13 GMT)
RepoHyper: Better Context Retrieval Is All You Need for Repository-Level
Code Completion [13.3] RepoHyperは、リポジトリレベルのコード補完に関連する複雑な問題に対処するために設計されたフレームワークである。
RepoHyperの中心はRepoレベルのセマンティックグラフ(RSG)であり、コードリポジトリの広大なコンテキストをカプセル化する新しいセマンティックグラフ構造である。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 05:10:34 GMT)
Bayesian Random Semantic Data Augmentation for Medical Image
Classification [13.2] 本稿では,新しい,効率的な,プラグアンドプレイ型セマンティックデータ拡張手法を提案する。
BRSDAは、特定の方向に沿った特徴空間における単純な翻訳によって動機付けられている。
9つのモードをカバーする5つの2次元および6つの医用画像データセットに対するBRSDAの有効性を実証した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 08:56:02 GMT)
A Unified Model for Spatio-Temporal Prediction Queries with Arbitrary
Modifiable Areal Units [12.9] One4All-STは、1つのモデルのみを使用して任意の修飾可能なアラル単位に対してST予測を行うことができるフレームワークである。
本稿では,定式化された最適組合せ問題を解くための動的プログラミング手法を提案する。
2つの実世界のデータセットの実験は、One4All-STの有効性と有効性を検証する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 02:34:44 GMT)
Leveraging Computer Vision in the Intensive Care Unit (ICU) for
Examining Visitation and Mobility [12.8] 我々は、奥行き画像に基づく最先端の非侵襲型コンピュータビジョンシステムを活用し、ICU訪問と患者の移動性を特徴付ける。
患者視力低下と訪問の増加に伴うデリリウムの出現との関連を見いだした。
ICU患者に対する非侵襲的自律システムの有用性と可能性について検討した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 21:43:47 GMT)
Learning the irreversible progression trajectory of Alzheimer's disease [12.3] アルツハイマー病(英語: Alzheimer's disease、AD)は、30年にわたって展開する進行性脳疾患である。
症状の発症前に介入を適用できるように、早期に疾患の進行を捉えることが重要である。
機械学習(ML)モデルは、ADの開始を予測するのに効果的であることが示されている。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 04:17:42 GMT)
Can LLM Substitute Human Labeling? A Case Study of Fine-grained Chinese
Address Entity Recognition Dataset for UAV Delivery [11.7] CNER-UAVは、粒度の細かいtextbf Chinese textbfName textbfEntity textbfRecognitionデータセットである。
データセットには5つのカテゴリがあり、NERモデルの総合的なトレーニングと評価を可能にする。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 05:12:16 GMT)
Target-constrained Bidirectional Planning for Generation of
Target-oriented Proactive Dialogue [11.3] ターゲット指向対話生成のための効果的な対話計画に着目する。
認知科学における意思決定理論に着想を得て,新たな目標制約型双方向計画手法を提案する。
我々のアルゴリズムは、様々なベースラインモデルよりも大幅に優れている。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 02:14:24 GMT)
MACE: Mass Concept Erasure in Diffusion Models [11.1] 我々は、マス・コンセプト・エミッションのタスクのための微調整・フレームワークであるMACEを紹介した。
このタスクは、トリガー時に不要な概念を具現化した画像が生成されるのを防ぐことを目的としている。
我々は,4つのタスクにまたがる先行手法に対して,MISを広範囲に評価する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 08:50:56 GMT)
Brain-ID: Learning Contrast-agnostic Anatomical Representations for
Brain Imaging [11.1] 脳画像のための解剖学的表現学習モデルであるBrain-IDを導入する。
提案された"Mild-to-Severe"イントラオブジェクト生成により、Brain-IDは被験者固有の脳解剖に対して堅牢である。
本稿では,物体内および物体間ロバスト性を評価するための新しい指標を提案し,その性能を4つの下流アプリケーションで評価する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 14:35:30 GMT)
Model Editing by Pure Fine-Tuning [11.0] ファインチューニングは、より専門的な手法に比べてパフォーマンスが悪いため、モデル編集には効果がないとして除外される。
モデル編集において,純微調整が有効な手法であることを示す。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 13:53:45 GMT)
Slowly Changing Adversarial Bandit Algorithms are Efficient for
Discounted MDPs [10.7] 強化学習は、長期計画の地平線と未知の遷移カーネルのさらなる困難を伴って、多武装のバンディット問題を一般化する。
また, 無限水平割引マルコフ決定過程において, 逆帯域設定における最適後悔を達成するために, 徐々に変化する逆帯域設定アルゴリズムが最適後悔を達成できることを示す。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 02:52:58 GMT)
Cooperative Classification and Rationalization for Graph Generalization [10.7] 本稿では,分類モジュールと合理化モジュールからなる協調分類・合理化手法を提案する。
本研究では,環境条件生成ネットワークを用いた多種多様な学習分布を導入し,頑健なグラフ表現を実現する。
最後に、非合理的表現を収集し、それらを協調学習のための分類モジュールに組み込むことにより、複数の環境を推論する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 15:38:20 GMT)
Bridging or Breaking: Impact of Intergroup Interactions on Religious
Polarization [10.6] 重要事象に関するグループ間相互作用がソーシャルネットワークにおける多数派と少数派間の分極に影響を及ぼすかどうかを検討する。
私たちは、2020年中に新型コロナウイルス関連の談話に従事している70万人近いインド人Twitterユーザーの宗教的アイデンティティに関するデータを使用します。
政治的・社会的事象においては、集団間相互作用は分極を減少させるが、この減少は、グループに対してすでに高い適合性を示す極端の個人にとってより弱い。
対照的に、共同イベントの間、グループ間相互作用は群整合性を増加させる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 05:38:20 GMT)
Decoupled Data Consistency with Diffusion Purification for Image
Restoration [10.5] 本稿では,データ整合性ステップから逆処理を分離することで問題に対処する拡散型画像復元法を提案する。
我々の手法は多目的性を示し、潜在空間における効率的な問題解決に高い適応性を与える。
提案手法の有効性は,画像のデノイング,デブロアリング,インペイント,超解像など,画像修復作業における総合的な実験を通じて検証される。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 00:47:05 GMT)
TNF: Tri-branch Neural Fusion for Multimodal Medical Data Classification [10.3] マルチモーダル医療画像と表データの分類を目的としたTNF(Tri-branch Neural Fusion)アプローチ
また、マルチモーダル分類におけるラベルの不整合に対処する2つの解決策も導入している。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 08:43:19 GMT)
Uncertainty-aware Pseudo-label Selection for Positive-Unlabeled Learning [10.0] 本稿では,正の未ラベル学習環境における不均衡データセットとモデル校正の問題に取り組むことを提案する。
マイノリティクラスからのシグナルを増強することにより、擬似ラベル付けはラベル付きデータセットをラベル付きデータセットから新しいサンプルで拡張する。
PUUPLは一連の実験において、高度に不均衡な設定で大幅な性能向上をもたらす。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 13:49:43 GMT)
FastVideoEdit: Leveraging Consistency Models for Efficient Text-to-Video
Editing [10.0] 既存のビデオ編集における画像生成モデルへのアプローチは、ワンショットの微調整、追加条件抽出、DDIMの逆変換といった時間を要する。
我々は、一貫性モデル(CM)にインスパイアされた効率的なゼロショットビデオ編集手法であるFastVideoEditを提案する。
本手法は,特別な分散スケジュールを用いて,ソース映像からターゲット映像への直接マッピングを可能にする。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 17:12:01 GMT)
Higher-order exceptional surface in a pseudo-Hermitian superconducting
circuit [9.1] 擬エルミート超伝導回路における高次例外面(ES)について検討する。
我々の研究は、擬エルミート系における高次ESと関連する応用を探求するための扉を開く。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 02:11:39 GMT)
Deep spatial context: when attention-based models meet spatial
regression [8.9] 深部空間コンテキスト(DSCon)法は,空間コンテキストの概念を用いた注意に基づく視覚モデルの研究に役立つ。
病理学者にヒントを得たものであるが、様々な領域に応用できる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 16:37:32 GMT)
Probing Image Compression For Class-Incremental Learning [8.7] 連続機械学習(ML)システムは、前もって学習したデータのパフォーマンスを維持するために、メモリ制限内に代表サンプル(例題としても知られる)を格納することに依存する。
本稿では,バッファの容量を増大させる戦略として画像圧縮を利用する方法を検討する。
本稿では,事前処理データ圧縮ステップと効率的な圧縮率/アルゴリズム選択方法を含む連続MLのための画像圧縮を組み込む新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 18:58:14 GMT)
ArgMed-Agents: Explainable Clinical Decision Reasoning with Large
Language Models via Argumentation Schemes [8.7] ArgMed-Agentsは、大きな言語モデル(LLM)が相互作用を通じて説明可能な臨床判断を下すことを目的としている。
セットアップ実験の結果,ArgMed-Agentsは,他のプロンプト手法と比較して,複雑な臨床的意思決定推論問題の精度を向上させるだけでなく,信頼性を高めるための意思決定説明を提供することがわかった。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 19:47:00 GMT)
Towards In-Vehicle Multi-Task Facial Attribute Recognition:
Investigating Synthetic Data and Vision Foundation Models [8.5] 車両の乗客の顔の特徴を認識する複雑なマルチタスクモデルを訓練するための合成データセットの有用性について検討する。
我々の研究は直感に反する発見を明らかにし、特に特定のマルチタスクコンテキストにおいて、ViTよりもResNetの方が優れた性能を示した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 04:17:54 GMT)
Local Vertex Colouring Graph Neural Networks [8.1] Wesfeiler-Lehman (1-WL) フレームワークを超えて拡張されたグラフ表現を,従来の検索アルゴリズムで効率的に計算できることが示される。
また,2つの探索戦略,幅優先探索と深さ優先探索に基づく新しいタイプのGNNも開発している。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 03:59:24 GMT)
Generalization of Graph Neural Networks through the Lens of Homomorphism [8.1] 本稿では,グラフ・ニューラル・ネットワーク(GNN)の一般化を,グラフ準同型のエントロピー解析という新たな視点で研究することを提案する。
グラフ準同型と情報理論測度を結びつけることにより、グラフ分類とノード分類の両方の一般化境界を導出する。
これらの境界は、パス、サイクル、傾きなど、様々なグラフ構造に固有の微妙さを捉えることができる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 03:51:59 GMT)
Text-Guided Variational Image Generation for Industrial Anomaly
Detection and Segmentation [8.1] 工業生産における異常検出のためのクリーンなデータ取得の課題に対して,テキスト誘導型変分画像生成手法を提案する。
本手法では,対象対象物に関するテキスト情報を用いて,入力画像に類似した非欠陥データ画像を生成する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 16:11:17 GMT)
Domain Adversarial Active Learning for Domain Generalization
Classification [8.0] ドメイン一般化モデルは、ソースドメインデータからクロスドメイン知識を学び、未知のターゲットドメインの性能を改善することを目的としている。
近年の研究では、多種多様なソース・ドメイン・サンプルがドメインの一般化能力を高めることが示されている。
そこで本研究では,ドメイン一般化における分類タスクに対するDAAL(Domain-adversarial Active Learning)アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 10:59:22 GMT)
LLM4VV: Developing LLM-Driven Testsuite for Compiler Validation [8.0] 大規模言語モデル(LLM)は、自然言語を含む幅広いアプリケーションのための強力なツールである。
オープンソースLLM -- Meta Codellama、PhindによるCodellama、Deepseek Deepseek Coder、クローズソースLLM -- OpenAI GPT-3.5-Turbo、GPT-4-Turboなど、最先端のLLMの機能について検討する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 21:05:28 GMT)
Reward Model Ensembles Help Mitigate Overoptimization [7.7] RLHF(Reinforcement Learning from Human feedback)は、大規模言語モデルを微調整して指示に従うための標準手法である。
真の」報酬の完全な表現として、学習された報酬モデルは過度に最適化される。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 16:14:58 GMT)
Few-shot Learning on Heterogeneous Graphs: Challenges, Progress, and Prospects [7.7] ヘテロジニアスグラフ(FLHG)でのショットラーニングは、学術と産業の両方から注目を集めている。
FLHGは、限られた注釈付きデータに直面したパフォーマンス劣化に対処することを目的としている。
本稿では,既存のFLHG手法を概観し,課題,研究の進展,今後の展望について述べる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 00:43:36 GMT)
A Study on Domain Generalization for Failure Detection through Human
Reactions in HRI [7.7] マシンラーニングモデルは一般的に、分散(データセット)でテストされる。
これにより、ドメインの一般化 - 異なる設定でパフォーマンスを維持する - が重要な問題となる。
本稿では,人間の表情を訓練した故障検出モデルにおける領域一般化の簡潔な解析を行う。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 21:30:22 GMT)
Platypose: Calibrated Zero-Shot Multi-Hypothesis 3D Human Motion
Estimation [7.6] Platyposeは、ゼロショット3Dポーズシーケンス推定のために、人間の3Dモーションシーケンスに事前訓練された拡散モデルを使用するフレームワークである。
Platyposeは、Human3.6M、MPI-INF-3DHP、および3DPWの静的ポーズでテストした場合、最先端のキャリブレーションと競合するジョイントエラーを実現する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 10:30:34 GMT)
Understanding and Mitigating Human-Labelling Errors in Supervised
Contrastive Learning [7.4] 我々は,SCL(Supervised Contrastive Learning)において,ヒューマンラベリングエラーがユニークな課題をもたらすことを示す。
その結果, 偽陽性例の99%の症例において, 学習過程に悪影響を及ぼすことが明らかとなった。
既存のノイズ除去法は主に合成ラベルの誤りに焦点を当て、非常に高い合成ノイズ率の非現実的な設定に取り組む。
そこで我々は,SCL-RHEという,ヒューマンラベリングエラーに対するロバスト性を持った新しいSCL目標を提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 19:05:12 GMT)
ENCORE: Ensemble Learning using Convolution Neural Machine Translation for Automatic Program Repair [7.0] 本稿では,新しいG&Vプログラム修復技術であるENCOREを提案する。
畳み込みニューラルネットワーク翻訳(NMT)モデルでアンサンブル学習を使用して、複数のプログラミング言語のバグを自動的に修正する。
ENCOREは4つの人気のあるプログラミング言語に適用された最初のG&V修復技術である。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 00:30:11 GMT)
Disentangling shared and private latent factors in multimodal
Variational Autoencoders [6.7] MVAE や MMVAE のようなマルチモーダル変分オートエンコーダは、それらの根底にある潜在因子を推測し、共有変分をプライベートから分離する自然な選択である。
既存のモデルの制約を実証し、モダリティ固有の変動に対してより堅牢にする方法を提案する。
本研究は,様々な実世界のマルチオミクスデータセットと合成実験によって支援された。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 23:11:05 GMT)
Dynamical Transition of Operator Size Growth in Quantum Systems Embedded
in an Environment [6.7] 環境を伴うオール・ツー・オール相互作用を持つ量子系の遷移を予測する。
この遷移は、システムの本質と環境推進スクランブルと環境誘導散逸との競合によって引き起こされる。
我々の研究は、環境の存在下での量子システムの基本的な挙動に光を当てている。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 02:48:12 GMT)
The Independence Postulate, the Many Worlds Theory, and Constructor
Theory [6.5] 多くの世界理論と建設論は独立宣言と矛盾している。
この衝突は、多数の電子のスピンを測定する有限の実験の存在によって示される。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 20:10:15 GMT)
Large receptive field strategy and important feature extraction strategy
in 3D object detection [6.4] 本研究は,3次元目標検出における鍵となる課題に焦点を当てた。
3次元畳み込みカーネルの受容領域を拡大する課題に対処するために,動的特徴融合モジュールを導入する。
このモジュールは、3D畳み込みカーネルの受容場を適応的に拡張し、拡張と許容される計算負荷のバランスをとる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 10:37:21 GMT)
Enhancing 3D Object Detection with 2D Detection-Guided Query Anchors [6.4] 本稿では,2次元検出結果から3次元クエリアンカーを推定するQAF2Dという新しいクエリ生成手法を提案する。
QAF2DがnuScenesの検証サブセットにもたらす最大の改善は、NDSが2.3%、mAPが2.7%である。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 04:38:27 GMT)
Fine-tuning of diffusion models via stochastic control: entropy
regularization and beyond [6.2] 本稿では,連続時間拡散モデルにおけるエントロピー正規化微調整問題に対する厳密な対処法を開発し,提供することを目的とする。
一般の$f$-divergence regularizerを含む微調整まで解析をどのように拡張できるかを示す。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 18:13:22 GMT)
Who Are We Missing? A Principled Approach to Characterizing the
Underrepresented Population [6.1] 最適化に基づく最適化手法であるROOT(Rashomon Set of Optimal Trees)を導入する。
ROOTは、ターゲット平均処理効果推定値の分散を最小化して、ターゲットサブポピュレーション分布を最適化する。
我々の枠組みは、意思決定の精度を高め、多様な集団における将来の試行を通知するための体系的なアプローチを提供する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 18:08:27 GMT)
Cross-ecosystem categorization: A manual-curation protocol for the
categorization of Java Maven libraries along Python PyPI Topics [6.0] 本研究では,機能的目的によってソフトウェアを言語に依存しない分類する手法について検討する。
これにより、ソフトウェアメトリクスの比較に必要な機能的な指紋情報が得られる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 20:15:08 GMT)
Even shorter quantum circuit for phase estimation on early
fault-tolerant quantum computers with applications to ground-state energy
estimation [5.7] 異なる特徴を持つ位相推定法を開発した。
アルゴリズムの総コストは、ハイゼンベルク制限スケーリング$widetildemathcalO(epsilon-1)$を満たす。
我々のアルゴリズムは、初期のフォールトトレラント量子コンピュータで位相推定タスクを行う際の回路深さを著しく削減することができる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 21:53:59 GMT)
Error-Mitigated Quantum Random Access Memory [5.5] 本稿では,ZNE (Zero-Noise Extrapolation) の修正版を提案する。
以上の結果から,ZNEにおける外挿機能の役割が示唆された。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 23:19:57 GMT)
Dynamics of Polarization Under Normative Institutions and Opinion
Expression Stewarding [5.2] 我々は,人間の規範性,すなわち,人口に関する信念に基づく規範的意見の個々人の表現が,人口レベルの分極につながることを確証する。
ゲーム理論モデルを用いて、より極端な意見を持つ個人は、その外集団メンバーに対して、より極端なレトリックと高い誤解を抱くことを確かめる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 17:02:19 GMT)
Separable Physics-informed Neural Networks for Solving the BGK Model of
the Boltzmann Equation [5.0] 本稿では,ボルツマン方程式のBGKモデルを効果的に解くために,分離可能な物理情報ニューラルネットワーク(SPINN)を用いた手法を提案する。
我々は、SPINNの正準多進分解構造とモーメント計算の線形性を活用し、二次ルール適用の計算コストを大幅に削減する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 23:44:55 GMT)
Robust ground-state energy estimation under depolarizing noise [5.0] 我々は,大域的な分極誤差チャネルの下で頑健な新しい基底状態エネルギー推定アルゴリズムを提案する。
本研究は, 脱分極雑音の存在下での地中エネルギー推定の可能性を示すものである。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 21:55:20 GMT)
Simulating Open Quantum Systems Using Hamiltonian Simulations [4.9] 我々はリンドブラッド方程式をシミュレートする新しい手法を提案し、リンドブラッド力学、微分方程式、ハミルトニアンシミュレーションの関係を描いている。
拡大ヒルベルト空間におけるユニタリ力学の列を導出し、リンドブラッド力学を任意の高次に近似することができる。
このユニタリ表現は、ハミルトニアンシミュレーションとアンシラ量子ビットの追跡のみを含む量子回路を用いてシミュレートすることができる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 22:02:43 GMT)
Explaining Code with a Purpose: An Integrated Approach for Developing
Code Comprehension and Prompting Skills [4.8] 我々は,EePE質問に対する学生の回答に基づいて,LLMを用いてコードを生成することを提案する。
我々は,EePEの問題解決に有効なプロンプトの作成に学生が成功したことを報告した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 00:23:08 GMT)
LinearAPT: An Adaptive Algorithm for the Fixed-Budget Thresholding
Linear Bandit Problem [4.7] 本稿では、Thresholding Linear Bandit(TLB)問題の固定予算設定のために設計された新しいアルゴリズムであるLinearAPTを提案する。
コントリビューションでは、LinearAPTの適応性、単純性、計算効率を強調しており、複雑なシーケンシャルな意思決定課題に対処するためのツールキットとして貴重なものとなっている。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 15:01:50 GMT)
Quantum-Inspired Tensor Neural Networks for Option Pricing [4.4] 近年の深層学習の進歩により,高次元の問題を解くことで,次元性の呪い(COD)に対処することが可能になった。
このようなCODに対処するアプローチのサブセットは、高次元PDEの解決に繋がった。
この結果、数学的な金融から産業用途の制御まで、様々な現実世界の問題を解決するための扉が開けた。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 21:29:53 GMT)
Can Large Language Models Automatically Score Proficiency of Written
Essays? [4.4] 大規模言語モデル(LLMs)は、様々なタスクにおいて異常な能力を示すトランスフォーマーベースのモデルである。
我々は,LLMの強力な言語知識を活かして,エッセイを分析し,効果的に評価する能力をテストする。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 09:39:00 GMT)
Are You Being Tracked? Discover the Power of Zero-Shot Trajectory
Tracing with LLMs! [3.8] LLMTrackは、ゼロショット軌道認識にLLMをどのように活用できるかを示すモデルである。
本研究では,屋内シナリオと屋外シナリオを特徴とする異なる軌跡を用いて,現実のデータセットを用いてモデルを評価した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 12:50:35 GMT)
Characterization of hybrid quantum eigenstates in systems with mixed
classical phasespace [3.8] トンネリング,スカーリング,ローカライゼーションなどの量子効果が標準パラダイムに従わないことを示す。
我々は、エルゴディディティとローカライゼーションの反対の観点から、カオス領域と正規領域のハイブリッド化を強調した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 13:25:31 GMT)
From Chatbots to PhishBots? -- Preventing Phishing scams created using
ChatGPT, Google Bard and Claude [3.8] 本研究では,一般的な4つの大規模言語モデルを用いてフィッシング攻撃を発生させる可能性について検討する。
我々は、悪意のあるプロンプトの早期検出に使用できるBERTベースの自動検出ツールを構築した。
我々のモデルは4つの商用LCM間で転送可能であり、フィッシングサイトプロンプトの平均精度は96%、フィッシングメールプロンプトの平均精度は94%である。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 04:12:27 GMT)
FMPAF: How Do Fed Chairs Affect the Financial Market? A Fine-grained
Monetary Policy Analysis Framework on Their Language [3.8] 大規模言語モデル(LLM)と回帰分析を統合する新しいアプローチであるFMPAF(Fincent-Grained Monetary Policy Analysis Framework)を提案する。
当社の望ましい仕様に基づき、S&P 500 Exchange-Traded Fundの価格上昇に伴うセンチメントスコアのワンユニット上昇が関係している。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 07:21:31 GMT)
Boosting Data Analytics With Synthetic Volume Expansion [3.6] 本稿では,合成データに対する統計的手法の有効性と,合成データのプライバシーリスクについて考察する。
この枠組みにおける重要な発見は、合成データに対する統計的手法の誤差率は、より多くの合成データを追加することで減少するが、最終的には上昇または安定化する可能性があることを明らかにする世代効果である。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 18:53:50 GMT)
Computational Complexity Evaluation of Neural Network Applications in
Signal Processing [3.5] 本稿では,デジタル信号処理におけるニューラルネットワーク層の計算複雑性を評価し,比較するための体系的アプローチを提案する。
4つの指標のうちの1つは、加算数とビットシフト数 (NABS) と呼ばれ、不均一な量子化のために新たに導入されたものである。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 21:00:09 GMT)
Improving behavior based authentication against adversarial attack using XAI [3.3] 本稿では,eXplainable AI(XAI)をベースとした,このようなシナリオにおける敵攻撃に対する防御戦略を提案する。
本手法で訓練した特徴セレクタは,元の認証器の前のフィルタとして使用することができる。
我々は,XAIをベースとした防衛戦略が敵の攻撃に対して有効であり,他の防衛戦略よりも優れていることを実証する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 16:41:18 GMT)
PEPSI: Pathology-Enhanced Pulse-Sequence-Invariant Representations for
Brain MRI [3.2] PEPSIは、脳MRIのための最初の病理拡張型、パルスシーケンス不変な特徴表現学習モデルである。
PEPSIは、新しい病理エンコーディング戦略を持つ合成画像で完全に訓練されている。
実験では,PEPSIの画像合成能力について,最先端のコントラスト非依存合成モデルと比較した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 14:33:55 GMT)
Optimizing Heat Alert Issuance with Reinforcement Learning [2.9] 気候変動への社会適応の鍵となる戦略は、予防行動を促すことによって極端な熱事象の健康への影響を減少させる警告システムを使用することである。
本研究では,そのようなシステムの有効性を最適化するツールとしての強化学習について検討する。
まず,新しいRL環境を導入し,ヒートアラーム対策の有効性を評価し,熱関連入院を減らした。
第2に、この環境を用いて、ヒートアラート発行の文脈における標準RLアルゴリズムの評価を行う。
第3に、ポストホックコントラスト分析は、私たちの修正されたヒートアラート-RLポリシーが、現在の大きな利得/損失をもたらすシナリオに関する洞察を提供する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 20:37:47 GMT)
Comparison of pipeline, sequence-to-sequence, and GPT models for
end-to-end relation extraction: experiments with the rare disease use-case [2.9] エンド・ツー・エンド関係抽出(E2ERE)は、バイオメディシンにおける自然言語処理(NLP)の重要かつ現実的な応用である。
稀な疾患に焦点を絞った複雑なデータセットを用いて,E2EREの一般的なパラダイムを3つ比較した。
パイプラインモデルが依然として最善であるのに対して、シーケンス・ツー・シーケンスモデルはそれほど遅れていないことが分かっています。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 01:11:20 GMT)
Physics-Guided Abnormal Trajectory Gap Detection [2.8] 本研究では,時空間のインデックス化と軌道ギャップのマージを両立させるための時空間ギャップ検出(STAGD)手法を提案する。
また、ダイナミックリージョンベースのマージ(DRM)アプローチを導入し、ギャップ異常スコアを効率的に計算する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 17:07:28 GMT)
The ALL0CORE Tensor Decomposition for Sparse Count Data [2.3] ALL0COREは確率的でない非負のテンソル分解の新しい形式である。
CP分解の計算的トラクタビリティと、タッカーの質的に魅力的な潜在構造の両方を楽しむ。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 09:54:56 GMT)
Knowledge Distillation of Convolutional Neural Networks through Feature
Map Transformation using Decision Trees [2.1] 畳み込みニューラルネットワーク(CNN)の最終層から特徴を抽出する蒸留手法を提案する。
抽出した特徴は、深さとノードの制約の下で最良の精度を達成するために決定木を訓練するために使用される。
その結果,決定木を用いたCNNによる意思決定の解釈が促進された。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 04:20:51 GMT)
DeepFDR: A Deep Learning-based False Discovery Rate Control Method for
Neuroimaging Data [1.9] ボクセルベースの多重テストは神経画像データ解析に広く用いられている。
従来の偽発見率(FDR)制御法は、ボクセルベースのテストの空間依存性を無視する。
DeepFDRは、教師なしのディープラーニングベースのイメージセグメンテーションを使用して、ボクセルベースの多重テスト問題に対処する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 19:29:06 GMT)
Style Blind Domain Generalized Semantic Segmentation via Covariance
Alignment and Semantic Consistence Contrastive Learning [1.9] BlindNetは、外部モジュールやデータセットなしでスタイルを無視する新しいDGSSアプローチである。
BlindNetは、共分散アライメントとセマンティックコントラスト学習という2つの重要なコンポーネントで構成されている。
提案手法は既存のDGSS手法よりも優れており,未確認対象ドメインに対するセマンティックセグメンテーションの堅牢性と優れた性能を示す。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 07:44:41 GMT)
NASH: Neural Architecture Search for Hardware-Optimized Machine Learning
Models [1.8] NASHは、ニューラルネットワーク検索を機械学習ハードウェアに適用する新しいアプローチである。
本稿では,NASH戦略の4つのバージョンについて述べる。
その結果,FINNの最大スループットは324.5fpsであることがわかった。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 05:49:03 GMT)
GPTSee: Enhancing Moment Retrieval and Highlight Detection via
Description-Based Similarity Features [1.6] モーメント検索(MR)とハイライト検出(HD)は、自然言語クエリからビデオ中の関連モーメントとハイライトを特定することを目的としている。
MR&HDの既存の手法はまだ大きな言語モデルと統合されていない。
本稿では,LLMの出力を第2段変換器エンコーダ・デコーダの入力とする2段階モデルを提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 09:56:22 GMT)
FWin transformer for dengue prediction under climate and ocean influence [1.6] デング熱は最も致命的な蚊由来の熱帯感染症の1つである。
本研究では,長期予測のためのデング症例の予測法について検討した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 19:20:55 GMT)
Speeding up 6-DoF Grasp Sampling with Quality-Diversity [1.5] 品質多様性(QD)アルゴリズムは、与えられた問題に対する多様なハイパフォーマンスなソリューションを得るために、一連のソリューションを最適化する。
標準物体に2本から5本の指を持つ4本のグリップで行った実験では、QDは一般的な方法よりも大きなマージンで優れていた。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 10:58:54 GMT)
Cracking the neural code for word recognition in convolutional neural
networks [1.3] 学習スクリプトにおける単語認識のために,単位の小さなサブセットがどのように特殊化されるかを示す。
これらのユニットは、単語の左または右の空白空間からの距離や特定の文字の識別に敏感であることを示す。
提案したニューラルネットワークは,文字の同一性や位置に関する情報を抽出し,不変な単語認識を可能にするメカニズム的な知見を提供する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 10:12:32 GMT)
Large Language Models on Fine-grained Emotion Detection Dataset with
Data Augmentation and Transfer Learning [1.2] 本研究の目的は,テキスト中の微妙な感情を検出することの課題に対処することである。
この発見は、テキストにおける感情検出の課題に対処するための貴重な洞察を提供する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 06:30:54 GMT)
Generalizable improvement of the Spalart-Allmaras model through
assimilation of experimental data [1.2] 本研究では,Reynolds-a averageaged Navier-Stokes Solution of separated flowに対するSpalart-Allmaras(SA)クロージャモデルの改善のためのモデルとデータ融合の利用に焦点を当てた。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 18:33:54 GMT)
Sort & Slice: A Simple and Superior Alternative to Hash-Based Folding for Extended-Connectivity Fingerprints [0.9] 構造指紋のベクトル化のための一般的な数学的枠組みを,サブストラクチャープーリング(substructure pooling)と呼ばれる形式的操作により導入する。
Sort & Sliceは、ECFPサブ構造のプーリングのためのハッシュベースの折り畳みの、実装が容易でビットフリーな代替品である。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 16:49:04 GMT)
Reframe Anything: LLM Agent for Open World Video Reframing [0.8] ビデオリフレーミングのためのビジュアルコンテンツを再構成するAIベースのエージェントであるReframe Any Video Agent (RAVA)を紹介する。
RAVAは、ユーザーの指示やビデオコンテンツを解釈する知覚、アスペクト比やフレーミング戦略を決定する計画、最終映像を作成するための編集ツールを呼び出す実行の3段階からなる。
我々の実験は、AIを利用したビデオ編集ツールとしての可能性を実証し、ビデオの有能なオブジェクト検出と現実世界のリフレーミングタスクにおけるRAVAの有効性を検証した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 03:29:56 GMT)
Tunable optical multistability induced by a single cavity mode in cavity
quantum electrodynamics system [0.7] しきい値と光の可視性曲線は、ブロードバンド範囲のシステムパラメータによって自由に調整できる。
提案手法は,マルチ状態全光論理デバイスの集積化と,全光通信ネットワークの基本要素の構築に有用である。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 17:59:51 GMT)
Multi-channel all-optical switching based on coherent perfect absorption
in atom-cavity system [0.7] ブロードバンドコヒーレント完全吸収に基づく超効率,ブロードバンド,マルチチャネル全光スイッチング方式を提案する。
提案手法は、全光ルーティング、全光通信ネットワーク、および様々な量子論理要素を構築するのに有用である。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 17:29:15 GMT)
On the Limitations of Carbon-Aware Temporal and Spatial Workload
Shifting in the Cloud [0.7] 当社は、クラウドワークロードにおける炭素認識スケジューリングのメリットと限界を理解するために、詳細なデータ駆動分析を実施しています。
この結果から, 限られた作業量シフトは二酸化炭素排出量を減少させるが, 現実的な削減は理想とは程遠いことが示唆された。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 19:36:04 GMT)
All-in-one platform for AI R&D in medical imaging, encompassing data
collection, selection, annotation, and pre-processing [0.6] Deep Learningは医療画像研究開発(R&D)を推進しており、AI/MLベースの医療機器の頻繁な臨床利用につながっている。
しかし、AIR&Dを前進させるためには、1) ヨーロッパ/アメリカ、そしてアジアからの10%未満のデータを含む重要なデータ不均衡、2) 世界の人口の60%を占めること、2) 商用利用のためにデータセットをキュレートするために必要な時間と投資の2つの課題が生じる。
そこで我々は,1)データ収集,2)データ選択,3)アノテーション,および4)事前処理などのステップを含む,最初の商用医用イメージングプラットフォームを構築した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 09:24:53 GMT)
UCINet0: A Machine Learning based Receiver for 5G NR PUCCH Format 0 [0.6] 本稿では,PUCCH Format 0に対するAI/MLベースの受信機設計について検討する。
UCINet0と呼ばれるニューラルネットワークは、ユーザがPUCCHで送信していないことを予測できる。
シミュレーションおよびハードウェアキャプチャフィールドデータセットによる推論結果から、UCINet0モデルは従来のDFTベースのデコーダを全SNR範囲で上回ることを示す。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 09:56:02 GMT)
PIRB: A Comprehensive Benchmark of Polish Dense and Hybrid Text
Retrieval Methods [0.6] ポーランド語情報検索ベンチマーク(PIRB, Polish Information Retrieval Benchmark)は、ポーランド語のための41のテキスト情報検索タスクを含む総合的な評価フレームワークである。
このベンチマークには、既存のデータセットに加えて、医学、法律、ビジネス、物理学、言語学など、さまざまなトピックをカバーする、10の新しい未発表データセットが含まれている。
我々は,20以上の密度・疎度検索モデルの評価を行い,そのベースラインモデルについて検討した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 16:13:37 GMT)
Enhancing Quantum Variational Algorithms with Zero Noise Extrapolation
via Neural Networks [0.5] 変分量子固有解法(VQE)は複雑な量子問題を解くための有望なアルゴリズムである。
量子デバイスにおけるノイズのユビキタスな存在は、しばしばVQE結果の正確さと信頼性を制限する。
本稿では,VQE計算におけるゼロノイズ外挿(ZNE)にニューラルネットワークを利用する新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 15:35:41 GMT)
Generation of entanglement using a short-wavelength seeded free-electron
laser [0.5] 2つの大粒子からなる二部量子系における超高速時間スケールの絡み合いについて検討する。
その結果, 短波長コヒーレント光パルスを用いた光電子・イオン系生成の可能性を明らかにした。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 20:27:13 GMT)
Creating Image Datasets in Agricultural Environments using DALL.E:
Generative AI-Powered Large Language Model [0.4] テキスト・ツー・イメージと画像・ツー・イメージ(変化)の2つのアプローチを用いた研究
画像から画像までの手法で生成した画像は、テキストから画像へのアプローチで生成した画像よりも現実的であった。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 17:47:38 GMT)
How much data do you need? Part 2: Predicting DL class specific training
dataset sizes [0.4] 本稿では,機械学習の分類モデルの性能を予測することを目的とする。
クラスごとのトレーニング例の数だけでなく、トレーニング例の総数も考慮します。
実験の空間充填設計の特別な事例から動機づけたアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 21:08:29 GMT)
On Certified Randomness from Fourier Sampling or Random Circuit Sampling [0.2] 証明されたランダム性は量子情報において長い歴史を持ち、多くの潜在的な応用がある。
アーロンソンは、既存のランダム回路サンプリング(RCS)実験に基づいて、新しい認証ランダム性プロトコルを提案した。
量子ランダムオラクルモデル(QROM)における証明されたランダム性について検討する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 21:19:59 GMT)
Texture image retrieval using a classification and contourlet-based
features [0.1] 本稿では,テクスチャ画像に対するCBIR(Content Based Image Retrieval)を改善するための新しいフレームワークを提案する。
RCT-Plus変換に基づく新しい画像表現を用いることで実現した。
我々は,従来のCBIR方式と比較して,検索率を大幅に改善した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 00:07:47 GMT)
Engineering synthetic gauge fields through the coupling phases in cavity
magnonics [0.1] キャビティマグノニクスは、量子トランスデューサ、量子メモリ、非相互挙動を持つデバイスのための有望なプラットフォームである。
ループ結合系では、モードとして少なくとも多くのカップリングが存在する場合、結合相は物理学に関係する。
我々はイットリウム・アイアン・ガーネットと2つの異なる再入射キャビティからなる2つの球体を考慮し,そのような結合相の存在を実験的に証明した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 18:57:31 GMT)
f(R,T) Analogue Gravity in (2+1) D graphene sheet [0.0] グラフェンに適用したf(R,T)重力の文脈における類似重力モデルについて検討した。
2次元(2D)におけるラグランジアン密度の導出を行い、関数 f(R,T) によって特徴づけられる重力効果の変化を考慮に入れた。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 18:24:32 GMT)
Use of Nash equilibrium in finding game theoretic robust security bound
on quantum bit error rate [0.0] DL04プロトコルは、量子セキュアなダイレクト通信のためのスキームである。
受信機、送信機、盗聴機(Eve)は量子プレイヤーであると考えられている。
メッセージモードにおけるPavivci'c攻撃に対するDL04プロトコルの脆弱性を確立する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 20:53:21 GMT)
Transformations in quantum networks via local operations assisted by
finitely many rounds of classical communication [0.0] 近年の進歩は量子ネットワークの最初のプロトタイプへと導かれ、このプロトタイプでは絡み合いは二部結合状態を生成するソースによって分配される。
このことは、局所的な演算と古典的な通信を用いて、バイパーティイトソースに基づいて量子ネットワークでどの状態が生成できるかという問題を提起する。
局所演算の有限ラウンドにおける状態変換と,最大絡み合った2量子状態に基づくネットワークにおける古典的通信について検討する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 12:00:56 GMT)
The Quantum Cartpole: A benchmark environment for non-linear
reinforcement learning [0.0] 状態推定と制御可能性のトレードオフがどのように生じるかを示す。
本稿では、転送学習を用いて強化学習を通して訓練された量子制御エージェントを開発する可能性を示す。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 11:58:04 GMT)
Textureless Object Recognition: An Edge-based Approach [0.0] 初期不均衡な小さなデータセットから堅牢な拡張データセットを作成します。
エッジ機能、機能の組み合わせ、機能/機能の組み合わせで強化されたRGBイメージを抽出して、15のデータセットを生成します。
実験と解析の結果から,RGB画像は3つのエッジ特徴を組み合わせて向上し,他の画像と比較した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 06:27:04 GMT)
Sistemas de informaci\'on de salud en contextos extremos: Uso de
tel\'efonos m\'oviles para combatir el sida en Uganda [0.0] ウガンダ・カラガラ地域のHIV患者に対するm-healthシステムについて検討した。
このようなシステムの設計や展開において、社会的コンテキストと技術との間のリッチな相互作用が中心的な関心事であると考えられる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 03:44:16 GMT)
Simulating Family Conversations using LLMs: Demonstration of Parenting
Styles [0.0] 本研究では,大規模言語モデル(LLM)を用いた模擬会話を通して,心理学的・言語的な研究を行うための枠組みを提案する。
提案手法は、特に潜在的な非倫理的言語や行動を含む人間の相互作用をシミュレートする上で、大きな利点を提供する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 09:18:43 GMT)
SecureRights: A Blockchain-Powered Trusted DRM Framework for Robust Protection and Asserting Digital Rights [0.0] 本稿では,革新的なデジタル著作権管理フレームワークであるSecureRightsを提案する。
SecureRightsは、タイムスタンプ認証によってブロックチェーン上の透かし情報をセキュアに格納する。
QRコードの追加は透かしを強化し、回復力のある知的財産権保護のための包括的なソリューションを提供する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 04:41:08 GMT)
SecureReg: A Combined Framework for Proactively Exposing Malicious
Domain Name Registrations [0.0] 本稿では,登録プロセス開始時に疑わしいドメインを特定するための最先端アプローチを提案する。
付随するデータパイプラインは、新しいドメインと登録ドメインを比較して重要な特徴を生成する。
本システムはセマンティックな属性と数値的な属性を分析し,早期脅威検出のための堅牢なソリューションを提供する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 14:55:39 GMT)
SeMA: Extending and Analyzing Storyboards to Develop Secure Android Apps [0.0] SeMAは、ストーリーボードのような既存のモバイルアプリデザインアーティファクトの上に構築された、モバイルアプリ開発方法論である。
SeMAの有効性を評価することで、Androidアプリで既知の49の脆弱性を検出し、防止することができる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 18:44:57 GMT)
RescueNet: A High Resolution UAV Semantic Segmentation Benchmark Dataset
for Natural Disaster Damage Assessment [0.0] RescueNetはハリケーン・マイケルの後に収集された災害後の画像を含んでいる。
RescueNetは、建物、道路、プール、木など、すべてのクラスに対してピクセルレベルのアノテーションを提供する。
本研究では,RescueNet上での最先端セグメンテーションモデルを実装することにより,データセットの有用性を評価する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 03:44:25 GMT)
Quantum physics, digital computers, and life from a holistic perspective [0.0] 量子物理学は線形理論であるため、デジタルコンピュータや生命など、非常に複雑なシステムを根底から生かすことは、やや厄介である。
本稿では,その可能性について考察する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 20:46:37 GMT)
Quantum Neural Networks for Power Flow Analysis [0.0] 本稿では、電力フロー解析における量子およびハイブリッド量子古典ニューラルネットワークの可能性について検討する。
また, 量子, ハイブリッド量子古典, 古典ニューラルネットワークの系統的性能比較を行った。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 15:49:57 GMT)
Potential renormalisation, Lamb shift and mean-force Gibbs state -- to
shift or not to shift? [0.0] ポテンシャル歪みが小さければ(しかし無視できない)、対数項はカップリングにおける二階の散逸過程に影響を与えないことを示す。
大規模環境遮断においては, ランブシフト項は, 対向項によるコヒーレント効果をほぼキャンセルすることを示した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 08:43:44 GMT)
Phishing Website Detection through Multi-Model Analysis of HTML Content [0.0] 本研究では,HTMLコンテンツに着目した高度な検出モデルを導入することにより,フィッシングのプレス問題に対処する。
提案手法は、構造化表データのための特殊多層パーセプトロン(MLP)モデルと、テキストの特徴を解析するための2つの事前学習自然言語処理(NLP)モデルを統合する。
2つのNLPと1つのモデルであるMultiText-LPの融合により、96.80 F1スコアと97.18精度スコアが得られた。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 11:13:32 GMT)
Optimal Policy Sparsification and Low Rank Decomposition for Deep
Reinforcement Learning [0.0] 深層強化学習(DRL)は、コンピュータゲームやロボティクスを含む幅広いアプリケーションにおいて大きな可能性を示している。
密度の高いDRLポリシーによる推論は、特にエッジコンピューティングにおける実用的応用を制限する。
本稿では,DRLポリシーをスパース化し,報酬を損なうことなく下位階に分解を促進するために最適空間マップを用いた新しい$L_0$-norm-regularization手法を提案する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 21:18:54 GMT)
On the mutual exclusiveness of time and position in quantum physics and
the corresponding uncertainty relation for free falling particles [0.0] 我々は、位置 $x$ で、位置 $X_t$ で、時刻 $t$ で、T_x$ は量子系に対して相互に排他的であると主張する。
均一な重力場に落下する質量$m$の量子粒子に対して、対応する不確実性関係を$Delta T_x Delta X_t geq frachbar2mg$と表すことができる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 01:08:09 GMT)
On depth prediction for autonomous driving using self-supervised
learning [0.0] この論文は、単眼の自己教師型学習技術を用いた深度予測の課題に焦点を当てている。
この問題は、条件付き生成逆ネットワーク(cGAN)を探索する、より広い視点からアプローチされる。
第2のコントリビューションは、厳密な前提に対する解決策を提案する、単一のイメージ・ツー・ディープス・セルフ教師方式を含む。
3つ目の重要な側面は、ビデオから深度マップの予測アプローチの導入である。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 12:33:12 GMT)
Observation of non-contact Casimir friction [0.0] 量子力学は真空中におけるランダムな電磁場変動(仮想光子)の発生を予測する。
相対運動における2つの物体間の仮想光子の交換は、非接触量子真空摩擦やカシミール摩擦につながる可能性がある。
2つの移動体間の非接触カシミール摩擦力の最初の測定を報告する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 00:39:52 GMT)
More Excitement Across the Horizon [0.0] 我々は、ブラックホールに放射状に落下する検出器の遷移速度に同様の現象が存在することを示す。
この結果は、この効果が強固であり、他のブラックホールの時空における同様の効果の探索を動機付けていることを示唆している。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 17:30:39 GMT)
Low Overhead Qutrit Magic State Distillation [0.0] 9m-k, k, 2]_3$ triorthogonal codes for $kleq 3m-2$, for qutrit magic state distillation with low overhead。
この符号は従来知られていた四角形符号よりも高い雑音閾値のマジック状態を蒸留する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 14:56:07 GMT)
LLMs Still Can't Avoid Instanceof: An Investigation Into GPT-3.5, GPT-4
and Bard's Capacity to Handle Object-Oriented Programming Assignments [0.0] 大規模言語モデル(LLM)は、プログラミング課題を解決しながら学生を支援するための有望なツールとして登場した。
本研究では,3つの卓越したLCMを用いて,実環境におけるOOPの課題を解決する実験を行った。
この結果から、モデルはエクササイズに対する動作可能なソリューションを多く達成する一方で、OOPのベストプラクティスを見落としていることが判明した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 16:40:05 GMT)
Krylov Complexity in Lifshitz-type Scalar Field Theories [0.0] 自由リーフシッツスカラー理論の族におけるランツォ係数の様々な側面について検討する。
本研究ではLaczos係数の挙動に及ぼす質量, 有限紫外カットオフ, 有限格子間隔の影響について検討した。
この結果は,従来の相対論的理論の文献に見られるものと類似していることが判明した。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 16:40:30 GMT)
Imaginary gap-closed points and non-Hermitian dynamics in a class of
dissipative systems [0.0] 本稿では,消散系における虚空ギャップ閉点とその関連力学について検討する。
IGC点がバルク損失確率のパワー-ロー崩壊を誘導し、「エッジバースト」と呼ばれる境界現象を引き起こすことを示す。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 14:07:52 GMT)
Identifying and interpreting non-aligned human conceptual
representations using language modeling [0.0] 先天性失明は,a-モダル語と知覚関連言語ドメインの両方において概念的再編成を引き起こすことを示す。
視覚障害者は、より強く社会的・認知的な意味と、行動に関連する動詞を関連づける。
一部の動詞では、盲目と盲目の表現は非常に似ている。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 13:02:27 GMT)
Fractional Quantum Hall Effect as Consequence of Symmetry Invariance [0.0] 保存モータがどちらも考慮された場合にのみローレンツ力が回復できることが示されている。
系の保存的性質に基づいて、ハミルトニアンの対称性を定義するユニタリ作用素が確立される。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 18:53:13 GMT)
Federated Learning: Attacks, Defenses, Opportunities, and Challenges [0.0] AIの新しい時代の始まりは連邦学習(FL)だと考える人も多いが、まだ未熟である。
FLは、セキュリティとプライバシーに関する議論があるので、コミュニティの信頼を損なうことはなかった。
本研究はFLのセキュリティとプライバシ機能の完全な概要を提供することを目的としている。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 03:05:59 GMT)
FRAC-Q-Learning: A Reinforcement Learning with Boredom Avoidance
Processes for Social Robots [0.0] 本稿では,ソーシャルロボットであるFRAC-Q学習に特化した新しい強化学習手法を提案する。
提案アルゴリズムは,プロセスのランダム化と分類に加えて,忘れるプロセスから構成される。
FRAC-Qラーニングは,従来のQラーニングに比べて関心度が高い傾向を示し,利用者のブーイングが著しく困難であった。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 15:50:36 GMT)
Exploiting the Margin: How Capitalism Fuels AI at the Expense of
Minoritized Groups [0.0] 本稿では、資本主義、人種抑圧、人工知能(AI)の複雑なネクサスについて考察する。
この研究は、資本主義的な実践を通じて、地域社会の歴史的搾取を追跡することによって、AI技術がどのように社会的偏見を反映し、増幅しているかを示す。
この記事では、AI開発に責任を負うための継続的な取り組みが紹介されている。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 22:40:07 GMT)
Entanglement of bosonic systems under monitored evolution [0.0] 連続射影測定における非相互作用ボソンの進化について検討した。
これらの量は, エンタングルメントエントロピーとバイパルタイト系のエンタングルメントスペクトルに直接関係していることを示す。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 20:05:42 GMT)
Ensemble Language Models for Multilingual Sentiment Analysis [0.0] SemEval-17のツイートテキストとアラビアセンティメントのつぶやきデータセットの感情分析について検討する。
その結果,単言語モデルでは性能が優れ,アンサンブルモデルではベースラインよりも優れていた。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 01:39:10 GMT)
Emotion Classification in Short English Texts using Deep Learning
Techniques [0.0] 本研究は,英語短文の感情を識別する深層学習手法の徹底的な検討を行う。
ディープラーニングアプローチでは、より優れた精度を達成するために、トランスファーラーニングとワード埋め込み(特にBERT)を採用している。
Small EnglishEmotionsデータセットは、5つの主要な感情カテゴリーに注釈付けされた6372種類の短い英文からなる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 15:58:56 GMT)
Effective-medium approach to the resonance distribution of wave
scattering in a random point field [0.0] 量子粒子の散乱に伴う波数$k$の複素平面における共振極の分布が数値的に発見された。
波動輸送理論に基づく詳細な理論的研究は、これらの構造の起源を説明し、それらの分布を複雑な$k$平面で予測するために提案されている。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 11:49:18 GMT)
Design and Development of a Multi-Purpose Collaborative Remote
Laboratory Platform [0.0] このワーク・イン・プログレス・ペーパーでは,新しい遠隔実験プラットフォームの開発の現状について述べる。
研究成果は,遠隔実験室における今後の共同研究の基盤となることを目的としている。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 13:04:48 GMT)
CLEAR: Cross-Transformers with Pre-trained Language Model is All you
need for Person Attribute Recognition and Retrieval [0.0] 属性認識と属性ベースの検索は、人間中心の2つのコアタスクである。
個人属性認識のための頑健なクロストランスフォーマーネットワークを導入する。
また、アダプタのいくつかの追加パラメータのみをトレーニングするための効果的なトレーニング戦略も導入しています。
CLEARは、両方のタスクに対して最先端のパフォーマンスまたは競合的な結果を達成する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 07:31:06 GMT)
Attention is all you need for boosting graph convolutional neural network [0.0] グラフ畳み込みニューラルネットワーク(GCN)は、非グリッドドメインでグラフデータを処理するための強力な能力を持っている。
本研究では,GKEDM (Graph Knowledge Enhancement and Distillation Module) と呼ばれるプラグインモジュールを提案する。
GKEDMは、グラフ情報を抽出し集約することにより、ノード表現を強化し、GCNの性能を向上させることができる。
大規模教員ネットワークからの蒸留知識を、注意蒸留により小規模学生ネットワークに効率的に伝達することができる。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 11:28:33 GMT)
Arrows of Time for Large Language Models [0.0] 本稿では,自己回帰型大規模言語モデルによる確率論的モデリングを時間方向の角度から検討する。
我々は、そのようなモデルが自然言語をモデル化する能力で示す時間非対称性を経験的に見出す。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 14:33:49 GMT)
Analytical evaluation of the effect of deterministic control error on
isolated quantum system [0.0] 分離された量子力学に対して決定的に発生するアナログ制御誤差について検討する。
時間進化に従う2つの孤立量子系間の重なり合いの低い境界を導出する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 07:23:37 GMT)
Analysis of Total Variation Minimization for Clustered Federated
Learning [0.0] クラスタ化されたフェデレーション学習は、ほぼ均一なローカルデータセットのクラスタを特定することで、この問題に対処する。
クラスタ化フェデレーション学習における最近のアプローチの1つは、一般化総変分最小化(GTVMin)である。
我々は、GTVMinソリューションとクラスタ平均との差を上界に導出する。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 20:07:14 GMT)
A Self-matching Training Method with Annotation Embedding Models for
Ontology Subsumption Prediction [0.0] In-index Matrix Embedding (InME) と Co-occurrence Matrix Embedding (CoME) の2つのオントロジー埋め込みモデルに対する自己マッチングトレーニング手法を提案する。
自己マッチング学習法は、予測されたスーパークラスがサブクラスに類似しており、オントロジーにおいて他のエンティティに分離されたときに、概念の仮定予測の堅牢性を高める。
論文参考訳(メタデータ) (Sun, 10 Mar 2024 10:04:41 GMT)