概要 - SLTarch:ワークロードのバランス崩れとメモリの非正規性を制御して拡張可能なポイントベースのニューラルレンダリングに向けて
タイトル
SLTarch:ワークロードのバランス崩れとメモリの非正規性を制御して拡張可能なポイントベースのニューラルレンダリングに向けて
時間
2025-07-29 04:46:48
著者
{"Xingyang Li","Jie Jiang","Yu Feng","Yiming Gan","Jieru Zhao","Zihan Liu","Jingwen Leng","Minyi Guo"}
カテゴリ
{cs.AR}
リンク
http://arxiv.org/abs/2507.21499v1
PDF リンク
http://arxiv.org/pdf/2507.21499v1
概要
SLTARCHは、モバイルプラットフォーム上でスケーラブルなポイントベースのニューラルレンダリング(PBNR)を実現するためのアルゴリズム・アーキテクチャ共同設計フレームワークです。PBNRパイプラインの2つの主要なボトルネック:LoD検索とスプラッティングに対応しています。 LoD検索は、ワークロードのバランスが悪く、不規則なメモリアクセスがあるため、市販のGPUでは効率が悪いです。SLTARCHは、効率的なLoD検索に特化した、専用のサブツリー型データ構造であるSLT REEを導入しました。また、SP COREという専門のハードウェアアーキテクチャと共に、ドロップアウトのないスプラッティングアルゴリズムを設計しました。 モバイルGPUと比較して、SLTARCHは3.9倍のスピード向上と98%のエネルギー節約を達成しました。既存のアクセラレータと比較して、1.8倍のスピード向上と54%のエネルギー節約を達成しました。 主要な貢献: - SLT REE:LoD検索におけるワークロードのバランスが悪く、不規則なDRAMアクセスを抑え、ビット精度の結果を得るための新しいデータ構造と共同設計されたアルゴリズム。 - SLTARCH:大規模PBNRのための初の種類のアクセラレータで、SLT REEのトラバースにおける動的バランスの悪さとスプラッティングにおけるワープドロップアウトを解決します。 - 性能:モバイルGPUに対して3.9倍のスピード向上と98%のエネルギー節約、既存のアクセラレータに対して1.8倍のスピード向上と54%のエネルギー節約を達成します。
推奨論文
LOTUS: 質から社会偏りとユーザー好みに至る詳細な画像キャプションのためのリーダーボード
ユークリッドフリーズタグ問題における向上した目覚め時間
ホモシフトのブロック貼り合わせクラスの不決定性
Hess-MC2: ヘッシアン情報と二階提案を使用した連続モンテカルロ平方法
無限次元の転移確率行列の推定:一般化された階層的棒割りプロセスを用いて
非曲がり可能なガラス中間基板によって実現される高性能かつ熱的にも可能なマルチチップレットアーキテクチャの設計
CUDA-L1: 対比強化学習を通じてCUDA最適化を向上させる
計算統計の難解性から生じるトレードオフ
「デュアル戦略統合による需要予測のためのベースモデル」
草のゲノムにおける広範な遠縁 introgression