Nvidia GTX 680 testada: a fera faz jus ao hype

Por Rodrigo Ghedin22 de março de 2012 às 15:329 minutos de leitura

Certa vez Johannes Kepler escreveu que “a natureza usa o mínimo possível de qualquer coisa.” A última GPU da Nvidia, codinome Kepler por causa do matemático alemão, parece ter se inspirado na citação, tanto quanto a proeza matemática original de Kepler. A nova GPU, GTX 680, oferece potência para gráficos soberbos, mas pede em troca apenas dois conectores de energia PCI-Express de 6 pinos. É um grande salto em relação à GTX 580 da geração anterior, que era rápida, mas sedenta por energia.

Falaremos sobre desempenho em breve, mas antes, vejamos primeiro a arquitetura do Kepler.

Menor Igual Maior

A GPU do Kepler é feita usando um processo de 28nm, permitindo à Nvidia construir mais circuitos em menos área do die.

Como o Fermi, o Kepler é uma arquitetura modular, o que possibilita à Nvidia escalar o design para mais ou para menos adicionando ou removendo blocos funcionais. No Fermi, Streaming Multiprocessors, ou simplesmente SMs, são o bloco de construção básico a partir do qual a linha de GPUs GTX 500 era construída. O número de núcleos CUDA dentro dos SMs podia variar. Por exemplo, cada bloco SM na GTX 560 Ti continha 48 núcleos CUDA, enquanto a GTX 580 SM era constituída com 32 núcleos. A GTX 580, por outro lado, tinha um total de 16 SMs com 32 núcleos cada, chegando ao total de 512 núcleos CUDA.

O bloco fundamental no Kepler é o SMX. As GPUs Kepler são construídas em 28nm, o que permite aos arquitetos da Nvidia escalar as coisas de modo um pouco diferente. Então a Nvidia aumentou a quantidade de núcleos dentro do SMX do Kepler para impressionantes 192 núcleos CUDA em cada um.

A GTX 680 é feita ade oito blocos SMX, arranjados em grupos emparelhados chamados GPCs (Graphics Performance Clusters). Isso dá à GTX 680 incríveis 1536 núcleos CUDA.

O SMX não serve apenas para armazenar núcleos CUDA, porém. Embutido em cada SMX está o novo motor Polymorph, que contém o motor, configuração e recursos relacionados de tesselação via hardware. Também incluídos estão 16 unidades de textura. Isso dá à GTX 680 um total de 128 unidades de textura (comparados às 64 unidades de textura embutidas na GTX 580). É interessante notar que o cache mudou um pouquinho — cada SMX ainda tem 64 KB de cache L1 cada, parte do qual pode ser usado como memória compartilhada pela GPU. Entretanto, isso significa que o total de cache L1 encolheu um pouco, já que agora só existem oito unidades SMX na GTX 680, não as 16 da GTX 580. O cache L2 também ficou menor, com 512 KB em vez dos 768 KB do Fermi.

Outra mudança interessante é a pré-decodificação e dependência da verificação foi repassada para o software, enquanto que no Fermi elas eram feitas no hardware. O que a Nvidia ganhou em troca foi uma melhor eficiência em instruções e mais espaço no die. Curiosamente, a contagem de transistores na GPU da GTX 680 é de 3,5 bilhões, pouca coisa a mais que os 3 bilhões da GTX 580. O tamanho do die diminuiu, porém, para um número muito mais maleável, 294mm² — a título de comparação, o die da CPU quad-core Sandy Bridge de 32nm da Intel tem 216mm².

Texturas, antialiasing e mais

Um dos novos recursos mais legais de uma perspectiva de aplicação prática é as texturas sem ligações. Antes do Kepler, as GPUs da Nvidia eram limitadas a 128 texturas simultâneas; o Kepler impulsiona isso ao permitir que textutas sejam alocadas conforme o necessário dentro do programa de shader, com até 1 milhão de texturas simultâneas disponíveis. É discutível se os jogos usarão tantas texturas, mas certos tipos de renderização de arquiteturas poderão ser beneficiados.

A Nvidia continua a incorporar o modo antialiasing proprietário FXAA, mas adicionou um novo modo chamado TXAA. O “T” vem de “temporário”. O TXAA em seu modo padrão é, na realidade, uma variante do 2x multisampling AA, mas que diversifica o padrão de amostragem com o tempo (por exemplo, em vários quadros). O resultado é bordas com qualidade superior até ao 8x MSAA, mas o impacto no desempenho é mais próximo de um 2x multisampling.

Outro recurso bacana que eventualmente também será suportado por GPUs antigas da Nvidia é o Vsync Adaptativo. Atualmente, se você travar o vertical sync para a taxa de atualização do seu monitor (geralmente 60 Hz, mas pode ultrapassar os 120 Hz em algumas telas), você terá um gameplay mais suave. Porém, você poderá ver um efeito de obturador quando a taxa de frames ficar em 30 fps ou menos, devido à saída de frames estar travada ao vsync. Por outro lado, se você rodar com o vsync desligado, você talvez veja os frames bem agressivos, já que novos frames são enviados ao monitor antes que os anteriores estejam completos.

O Vsync Adaptativo trava a taxa de frames à taxa de atualização vertical, até que o driver detecte que a taxa de frames caiu abaixo da de atualização. O Vsync é, então, desabilitado temporariamente até que a taxa de frames se recupere e volte a estar acima da do monitor. O resultado é um desempenho muito mais suave do ponto de vista do jogador.

Por fim, a Nvidia reforçou o motor de vídeo, construindo um motor de codificação capaz de codificar vídeo H.264 high-profile a 4x-8x em tempo real. O consumo de energia é baixo nesse modo, consumindo um dígito de watts, em vez das dezenas que as antigas GPUs consumiam via shaders.

A placa de vídeo GTX 680

A Nvidia criou uma placa de circuito melhorada para receber a GPU da GTX 680. A placa chega com 2 GB de GDDR5, com frequência da memória padrão a 6008 MHz — a primeira placa a sair de fábrica com GDDR5 a 6 GHz. A GTX 680 também apresenta a GPU Boost, uma ideia vinda do mundo de CPUs X86. A GPU Boost aumenta a velocidade da frequência do núcleo se a temperatura do ambiente interno permite. Isso faz com que jogos que ofereçam pouco “peso” em geral receba desempenho adicional conforme o necessário. Em outro ponto, a GTX 680 oferece uma única frequência — as frequências do shader estão agora na mesma da do núcleo. As caixas dos produtos provavelmente mostrarão as duas frequências, base e máxima (com a GPU Boost), estampadas. Tal qual os últimos lançamentos da AMD, a GTX 680 está totalmente de acordo com o PCI 3.0.

Algumas outras coisinhas empolgantes vêm a mente ao observar as especificações. Primeiro, essa é uma interface de memória de 256 bits, contra a de 384 bits da Radeon HD 7970 da AMD. A Nvidia compensa isso com eficiência aprimorada no controlador de memória, mais GDDR5 com frequência mais alta. O frame buffer é de “apenas” 2 GB, mas isso foi o suficiente para rodar nossos exigentes benchmarks a 2560×1600 com todos os detalhes no máximo e 4x MSAA ativado.

Vale ainda mencionar a nova devoção a eficiência energética da Nvidia. A GTX 680 é substancialmente mais eficiente nesse departamento que a sua antecessora, com um TDP máximo de apenas 195W. Ociosa, ele é de cerca de 15W. Vimos a economia em energia nos nossos testes.

A GTX 680 é, ainda, a primeira placa com uma única GPU da Nvidia a suportar mais de dois monitores. Os usuários podem adicionar até quatro monitores usando todas as quatro portas. A Nvidia estava estranhamente relutante em conversar sobre sua implementação da DisplayPort 1.2, o que permitiria ainda mais monitores já que monitores e HUBs 1.2 deve surgir no final do ano.

O sistema de refrigeração da GTX 680 é um redesign completo, usando uma pilha de lemes cônicos, amortecimento acústico e um tubo de calor super eficiente. A placa esteve bastante quieta quando foi exigida, embora basicamente igual ao design com cooler duplo da Radeon HD 7970 da XFX. Claro, ter um desenho de GPU que seja mais eficiente é uma grande ajuda. A GTX 680 não é um aspirador de pó.

Como ela se sai?

Colocamos a GTX 680 contra dois designs antigos da GTX 580, a sutilmente overclockada EVGA GTX 580 SC e a mais overclockada EVGA GTX 580 Classified. A XFX Radeon HD 7970 Black Edition também foi incluída. Rodamos nossos benchmarks tradicionais a 2560×1600 com 4x MSAA ativado, junto com os testes sintéticos FutureMark e Unigine.

A GTX 680 claramente ganha na maioria dos testes, embora a XGX HD 7970 contabilize algumas vitórias. Note que alguns desses testes talvez tenham sido limitados pela CPU, mesmo com 4x MSAA, mas é difícil dizer com certeza. Esse é muito provavelmente o caso de HAWX 2, onde a velha GTX 580 Classified (ainda que seja uma GTX 580 overclockada) apresentou uma vantagem de 1 fps.

Os índices da GTX 680 ociosa são impressionantes também. O gasto total de energia do sistema quando ocioso foi de apenas 116W, 8W melhor que a placa da XFX. Entretanto, a Nvidia não incorpora nada que lembre a tecnologia ZeroCore da AMD, a qual reduz a energia para próximo de 3W quando o monitor é desligado (como quando o Windows 7 escurece a tela). Ainda melhor é a energia quando em uso intensivo — a GTX 680 é a única GPU a rodar abaixo dos 300W quando em carga máxima.

A GTX 680 que testamos é a placa de referência da Nvidia e é bem provável que algumas fabricantes lancem placas com frequências de núcleo ainda mais rápidas. Essas placas para o varejo estarão disponíveis no seu lançamento (22 de março). A Nvidia definiu o preço da placa em US$ 500, mas ele pode variar um pouco dependendo da fabricante. O valor de US$ 500 representa uma diminuição considerável de cerca de US$ 100 em relação à Radeon HD 7970 da AMD, o que deixa a GTX 680 ainda mais interessante para jogadores hardcore.

Tudo indica que a GTX 680 recuperará para a Nvidia a coroa de desempenho, brevemente em posse da AMD, e com um preço menor também. O mais intrigante, porém, é que é bem provável que o Kepler ainda tenha espaço para mais consumo de energia, o que possibilitará à Nvidia o lançamento de uma placa ainda mais top de linha quando necessário. A corrida pelo desempenho continua e embora o primeiro lugar agora pertença à NVIDIA, a empresa também precisa lançar GPUs mid-range para competir com os recentes lançamentos da AMD. A longo prazo, os jogadores serão beneficiados com mais opções e competição. Todos ganham. [Maximum PC]

Maximum PC traz para você as últimas notícias, reviews e tutoriais sobre PC.