GPU-Based Deep Learning Inference - A Performance and Power Analysis

NVIDIA GPUs already provide the platform of choice for Deep Learning Training today. This whitepaper investigates Deep Learning Inference on a Geforce Titan X and Tegra TX1 SoC. The results show that GPUs provide state-of-the art inference performance and energy efficiency, making them the platform of choice for anyone wanting to deploy a trained neural network in the field. 

NVIDIA Tegra X1 - NVIDIA'S New Mobile Superchip

Tegra X1 is NVIDIA's latest superchip, and has raised the bar again for mobile visual computing and energy-efficiency. Tegra X1 with its 256-core Maxwell GPU delivers 2x the performance and 2x the energy efficiency of Tegra K1. Tegra X1 supports the latest graphics APIs and further blurs the lines separating mobile, console and PC gaming. This paper explains the architectural features and capabilities of Tegra X1 and focuses in detail on mobile graphics and automotive technologies made possible by Tegra X1. 


NVIDIA's latest and most advanced mobile processor Tegra™ K1, creates a major discontinuity in the state of mobile graphics by bringing the powerful NVIDIA Kepler GPU architecture to mobile, and delivering tremendous visual computing capabilities and breakthrough power efficiency. With two decades of GPU industry leadership, the NVIDIA Tegra K1 mobile processor delivers the performance demanded by next-generation PC- and console-class mobile games, modern user interfaces, advanced visual computing applications, and high-resolution 4K displays, while delivering exceptional power efficiency required to bring the above capabilities to mobile devices. This whitepaper describes the architecture and benefits of Tegra K1 and Kepler GPU. 

NVIDIA Software Defined Radio Modem Technology – Enabling Next Generation LTE

Conventional wisdom, together with the massive amount of legacy investment by traditional modem vendors, dictates a fixed function approach to modem design. However the complexity of multi-mode, high-throughput cellular air-interfaces requires a revolution to lift us from convention. This revolution is brought about by the NVIDIA® Software Defined modem technology, the latest implementation of which is in the NVIDIA i500 and Tegra® 4i, discussed in this whitepaper. 

NVIDIA Tegra 4 Family GPU Architecture

The need for higher quality GPU subsystems in mobile devices and automotive infotainment systems will continue to grow as usage models rely increasingly on faster graphics processing capabilities. For the best user experiences, devices must provide highly responsive graphical user interfaces, fast Web browsing capability, visually rich 3D gaming, all while being able to drive higher resolution displays. The GPU subsystem within the NVIDIA® Tegra 4 family of processors is enabling all of the aforementioned visual computing capabilities in mobile devices, and is discussed in detail in this whitepaper. 

NVIDIA Tegra 4 Family CPU Architecture – Next Generation 4-PLUS-1™ Quad core

Smartphones and tablets are increasingly being used as personal computing devices. Today's mobile devices are no longer being used only for phone calls, messaging, and occasional Web browsing. Mobile applications for PC-class use cases such as photo editing, word processing, multi-tabbed Web browsing, modern graphics-rich gaming, and multi-tasking are now available and are pushing the performance requirements of mobile devices. The quad core CPUs and fifth Battery Saver Core in the NVIDIA® Tegra® 4 family of mobile SoCs discussed in this whitepaper, are architected to drive the next generation of mobile applications, and include several key enhancements that deliver higher performance along with great battery life. 

Chimera: The NVIDIA Computational Photography Architecture

The next wave in smartphone camera use will be fueled by computational photography. This will result in better images, capturing a scene based exactly on the subtleties and details your eyes see. The Chimera architecture harnesses the processing power built into the Tegra GPU, CPU, and ISP, enabling new computational photography features such as Always-on HDR for truly stunning photos, and advanced object tracking capability. 

NVIDIA Miracast Wireless Display Architecture

The group that brought Wi-Fi to the world will soon introduce their Miracast wireless display standard – enabling mobile devices to stream video and audio directly to large HDTVs without the need for cables or an existing wireless network. NVDIA will support this standard by bringing Tegra's outstanding multimedia capabilities to wireless display. This white paper looks at how NVIDIA's expertise in graphics and video processing can deliver an enriched wireless display experience. 

Arquitectura NVIDIA® DirectTouch™

NVIDIA DirectTouch es una arquitectura táctil (en espera de patente) que mejora la capacidad de respuesta al toque al descargar parte del procesamiento del toque que por lo general realizan los controladores táctiles y los módulos táctiles en el procesador de aplicaciones NVIDIA® Tegra® 3. La arquitectura también simplifica la implementación del hardware y las interfaces del usuario basados en el toque, lo que requiere menos energía y a la vez ofrece un rendimiento más escalable. 

Los beneficios de las CPU de núcleo cuádruple en los dispositivos móviles

Este informe técnico analiza cómo las CPU de núcleo cuádruple y la tecnología Symmetric Multiprocessing (SMP) variable les permitirán a los dispositivos móviles ampliar aún más los límites del rendimiento. Vea cómo esto les permite a los desarrolladores de juegos y aplicaciones brindar nuevas experiencias móviles y, a la vez, aumentar la duración de la batería en los usos más populares. 

SMP variable: una arquitectura de CPU con múltiples núcleos para obtener alto rendimiento con un consumo de energía bajo

A medida en que aumentan las exigencias de rendimiento en las aplicaciones móviles, los proveedores de SoC adoptan cada vez más las arquitecturas de procesamiento con múltiples núcleos. Esto les permite ofrecer un mayor rendimiento mientras se mantiene el consumo de energía dentro del presupuesto. Este informe técnico analiza la tecnología variable Symmetric Multiprocessing (vSMP) del Proyecto Kal-El, que brinda nuevos niveles de rendimiento con cuatro núcleos, además de ahorros de energía que minimizan el consumo de alimentación durante los estados de espera activos. 

Gráficos avanzados en dispositivos portátiles

El tamaño y la resolución de las pantallas de los dispositivos móviles han aumentado rápidamente durante los últimos años. Además, la popularidad creciente de las tabletas hará que la resolución y los tamaños de pantalla se aproximen de los de las PC portátiles. Este informe técnico analiza cómo los dispositivos móviles actuales y futuros necesitarán GPU que no sólo manejen las mayores cargas de procesamiento de píxeles, sino también se mantengan dentro de los presupuestos destinados a la energía de dispositivos móviles. 

Los beneficios de las CPU con múltiples núcleos en los dispositivos móviles

Cinco años atrás, los fabricantes de CPU para PC de escritorio hicieron la transición a las arquitecturas de procesamiento con múltiples núcleos para responder a las mayores exigencias de rendimiento y al crecimiento exponencial del consumo de energía de los procesadores con un solo núcleo. Las CPU actuales usan múltiples núcleos para completar el trabajo con mayor rapidez y menos consumo de energía que sus predecesores con un solo núcleo. Y los procesadores móviles enfrentan los mismos desafíos de rendimiento y consumo de energía. Este informe técnico explora cómo los dispositivos móviles harán la transición a las CPU con múltiples núcleos para aumentar aún más el rendimiento y ampliar la duración de la batería.