Key points are not available for this paper at this time.
Die Niedrigbit-Quantisierung kann den Speicherbedarf sowie die Rechenkosten von tiefen neuronalen Netzwerken effektiv reduzieren. Bestehende Quantisierungsmethoden erzielten bei der Anwendung auf leichte Netzwerke unbefriedigende Ergebnisse. Zudem können nach der Netzwerkquantisierung Unterschiede in den Datentypen zwischen den Operatoren Probleme bei der Bereitstellung von Netzwerken auf Field Programmable Gate Arrays (FPGAs) verursachen. Darüber hinaus können einige Operatoren nicht heterogen auf FPGAs beschleunigt werden, was zu häufigem Wechsel zwischen Advanced RISC Machine (ARM)- und FPGA-Umgebungen für Rechenaufgaben führt. Zur Lösung dieser Probleme wird in dieser Arbeit ein benutzerdefinierter Netzwerkquantisierungsansatz vorgeschlagen. Erstens wird während des quantisierungsbewussten Trainings eine verbesserte Parameterized Clipping Activation (PACT)-Methode eingesetzt, um den Wertebereich der Netzwerkparameter zu begrenzen und den Präzisionsverlust durch Quantisierung zu verringern. Zweitens wird die Strategie der aufeinanderfolgenden Ausführung von Faltung-Operatoren (Consecutive Execution Of Convolution Operators, CEOCO) verwendet, um den Ressourcenverbrauch durch den häufigen Umgebungstausch zu mildern. Der vorgeschlagene Ansatz wurde auf den Plattformen Xilinx Zynq Ultrascale+ MPSoC 3EG und Virtex UltraScale+ XCVU13P validiert. Die Netzwerke MobileNetv1, MobileNetv3, PPLCNet und PPLCNetv2 dienten als Testumgebungen für die Validierung. Experimentelle Ergebnisse basieren auf den öffentlichen Datensätzen miniImageNet, CIFAR-10 und OxFord 102 Flowers. Im Vergleich zum Originalmodell führen die vorgeschlagenen Optimierungsmethoden zu einem durchschnittlichen Rückgang der Genauigkeit um 1,2%. Im Vergleich zur herkömmlichen Quantisierung bleibt die Genauigkeit nahezu unverändert, während die Bildraten (FPS) auf FPGAs im Durchschnitt um das 2,1-Fache verbessert werden.
Building similarity graph...
Analyzing shared references across papers
Loading...
Lingjie Yi
Xianzhong Xie
Yi Wan
International Journal of Distributed Sensor Networks
Chongqing University of Posts and Telecommunications
Building similarity graph...
Analyzing shared references across papers
Loading...
Yi et al. (Tue,) untersuchten diese Fragestellung.
www.synapsesocial.com/papers/68e70b3ab6db643587684d8c — DOI: https://doi.org/10.1155/2024/8018810
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: