Key points are not available for this paper at this time.
概要 本研究では、ファブリックコントローラ(FC)、8つの計算コアのクラスター、および従来のハードウェア支援キャッシュメモリの代わりにスクラッチパッドを持つ4レベルのメモリ階層を備えた、GAP8並列超低消費電力プラットフォーム(PULP)上での畳み込み演算子の効率的な実装に取り組む。本プラットフォーム向けの解決策として、ロアリング手法を通じて畳み込みを一般行列・行列乗算(gemm)に変換し、タイル化やループ並列処理といった主流のマルチスレッドかつキャッシュ認識型のgemm実装技術を慎重に適用することで、GAP8上で合理的な性能を達成可能であることを示す。
Building similarity graph...
Analyzing shared references across papers
Loading...
Cristián Ramírez
Adrián Castelló
Héctor Martínez
The Journal of Supercomputing
Universitat Politècnica de València
University of Córdoba
Building similarity graph...
Analyzing shared references across papers
Loading...
Ramírezら(Mon,)はこの問題について研究した。
www.synapsesocial.com/papers/68e78968b6db6435876fbe3c — DOI: https://doi.org/10.1007/s11227-024-05927-y
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: