@InProceedings{2023_crozet1199,
	author = "Florent Crozet and Stéphane Mancini and Marina Nicolas",
	title = "Pseudo-Randomisation Partielle et Quantification pour la compression des réseaux de neurones convolutifs",
	booktitle = "29° Colloque sur le traitement du signal et des images",
	year = "2023",
	publisher = "GRETSI - Groupe de Recherche en Traitement du Signal et des Images",
	number = "2023-1199",
	pages = "p. 517-520",
	month = "Aout # 6 - Sept # 9",
	address = "Grenoble",
	doi = "",
	pdf = "2023_crozet1199.pdf",
	abstract = "L'amélioration des performances des CNNs passe, encore aujourd'hui, par une augmentation du nombre de couches
du réseau de neurones et/ou du nombre de filtres par couche, induisant une augmentation du nombre de paramètres nécessaires
à l'exécution de l'inférence. Pour un système embarqué, ce coˆut supplémentaire impacte le déploiement de solutions de vision par
ordinateur basées sur des CNNs. Nous proposons une méthode de compression des CNNs basée sur le remplacement de poids
appris par des poids pseudo-aléatoires qui sont générés à la volée lors de l'inférence ainsi que sur l'utilisation de la quantification
pour limiter l'empreinte mémoire du réseau. Avec cette approche, nous divisons par 5 la taille mémoire de MobileNetV2 en
impactant sa précision de moins de 5%..pdf",
}
