Instance-Aware Group Quantization for Vision Transformers

No se pudo agregar al carrito

Solo puedes tener X títulos en el carrito para realizar el pago.

Add to Cart failed.

Por favor prueba de nuevo más tarde

Error al Agregar a Lista de Deseos.

Por favor prueba de nuevo más tarde

Error al eliminar de la lista de deseos.

Por favor prueba de nuevo más tarde

Error al añadir a tu biblioteca

Por favor intenta de nuevo

Error al seguir el podcast

Intenta nuevamente

Error al dejar de seguir el podcast

Intenta nuevamente

Instance-Aware Group Quantization for Vision Transformers

Escúchala gratis

Ver detalles del espectáculo

Obtén 3 meses por US$0.99 al mes + $20 crédito Audible

This story was originally published on HackerNoon at: https://hackernoon.com/instance-aware-group-quantization-for-vision-transformers.
A new PTQ method, IGQ-ViT, uses dynamic instance-aware grouping to quantize Vision Transformers efficiently without major accuracy loss.
Check more stories related to tech-stories at: https://hackernoon.com/c/tech-stories. You can also check exclusive content about #computer-vision-models, #vision-transformers, #post-training-quantization, #model-compression, #instance-aware-ai, #neural-network-efficiency, #low-bit-neural-networks, #igq-vit, and more.

This story was written by: @instancing. Learn more about this writer by checking @instancing's about page, and for more stories, please visit hackernoon.com.

Post-training quantization works well for CNNs but breaks down with Vision Transformers due to highly variable activation distributions. IGQ-ViT solves this by dynamically grouping channels per input instance so each group shares similar statistics, then quantizing them with shared parameters. The method also extends to softmax attention and includes a group-allocation strategy under BOP constraints. Across classification, detection, and segmentation tasks, IGQ-ViT delivers state-of-the-art quantization results for ViTs at low bit-widths without costly retraining.

Todavía no hay opiniones