NVIDIA anuncia novidades em IA; veja 4 destaques
O CEO da NVIDIA, Jensen Huang, acaba de anunciar uma série de novidades em IA (inteligência artificial), semicondutores, softwares e serviços de armazenamento na nuvem. A multinacional de tecnologia apresentou os lançamentos no GTC, conferência global de inovações em IA que vai até quinta-feira (23).
Entre as principais atrações está a tecnologia cuLitho, que deve acelerar a criação e reduzir o tamanho dos semicondutores em meio à crise global de chips. A maior fabricante de chips do mundo, a taiwanesa TMSC, será a primeira a implantar a tecnologia.
Outra novidade é o DGX Cloud. Em síntese, é como um plano de assinatura para empresas terem acesso a uma alta tecnologia de IA através de um simples navegador web. Pode ser uma boa saída para quem quer usar inteligência artificial, porém não consegue criar sua própria infraestrutura.
A NVIDIA também aposta em IA para grandes companhias com sua nova GPU (unidade de processamento gráfico) H100, já usada pela Meta e Microsoft Azure. A AI Foundation também deve dar o que falar. A plataforma vai reunir serviços para refinar dados e imagens por inteligência artificial em grandes modelos de linguagem. Confira os detalhes a seguir.
Mais semicondutores com cuLitho
A princípio, a nova biblioteca de software cuLitho permitirá a criação de chips semicondutores com transistores e fios menores dos produzidos atualmente. Isso permitirá mais rendimento, redução da pegada de carbono e definição de base para 2 nanômetros.
Quando executado em GPUs, o cuLitho apresenta um desempenho até 40 vezes maior que a litografia atual – processo de criação de padrões em um wafer (fina fatia) de silício. Isso deve acelerar as enormes cargas de trabalho computacional e, assim, reduzir a necessidade de energia e os gastos ambientais.
A tecnologia é inovadora porque as fábricas que adotarem o mecanismo podem ajudar a produzir de 3 a 5 vezes mais fotomáscaras (modelos de design de chip) por dia. Elas farão isso com 9 vezes menos energia que as usadas atualmente.
“Uma fotomáscara que era produzida em duas semanas agora pode ser processada durante a noite”, disse a NVIDIA em comunicado à imprensa. A TMSC, a maior fabricante de chips semicondutores do mundo, já começou a implantar a tecnologia.
Acesso a uma super IA via navegador
O DGX Cloud é a forma mais fácil para empresas acessarem uma super IA a partir de um navegador. O serviço de supercomputação permite a entrada imediata na infraestrutura e software capazes de treinar modelos avançados para IA generativa.
Na prática, é uma forma de cada empresa acessar sua própria inteligência artificial usando um navegador web simples. Isso reduz a complexidade de adquirir ou implantar uma infraestrutura própria, por exemplo. O serviço está disponível em planos mensais para empresas.
Nova GPU H100 Tensor Core
Essa é provavelmente a GPU mais poderosa do mercado para atender demandas de IA. Baseada na arquitetura de computação NVIDIA Hopper, a nova versão foi otimizada para desenvolver, treinar e implantar grandes modelos de linguagem de IA generativa.
Ou seja, a tecnologia oferece treinamento de IA até nove vezes mais rápido e inferência até 30 vezes mais veloz que as GPUs de gerações anteriores. A Meta já implantou o mecanismo em seu supercomputador Grand Teton AI, que é usado pelas equipes de produção e pesquisa em inteligência artificial.
Em contrapartida, outras grandes empresas de tecnologia, como a OCI (Oracle Cloud Infrastructure), Amazon Web Services e Microsoft Azure já estão usando a tecnologia em seus sistemas internos. “O H100 pode reduzir os custos de processamento de grandes modelos de linguagem em uma ordem de grandeza”, disse Huang. Veja as especificações aqui.
IA para refinar dados e tarefas
Aqui entra a NVIDIA AI Foundations, uma família de serviços em nuvens para pessoas que precisam construir, refinar e operar LLMs (grandes modelos de linguagem, na sigla em inglês) personalizados em domínios e tarefas específicas. Os serviços são:
- NeMo: plataforma que cria linguagem personalizada de texto para modelos generativos.
- Picasso: serviço de linguagem visual para pessoas que desejam construir modelos personalizados treinados com conteúdo licenciado ou do qual é proprietário
- BioNeMo: destinado a auxiliar pesquisadores na indústria de medicamentos. Oferece modelos personalizados para processar dados de pesquisa em tempo real. Até mesmo grandes farmacêuticas, como AstraZeneca, Alchemab e Innophore serão os primeiros a usar a tecnologia.
A AI Foundations também inclui uma parceria com a Adobe para criar um conjunto de recursos de IA para seus programas de criação. Ao mesmo tempo, a Getty Images também entrará no serviço para treinar conversão de texto em imagem e modelos básicos de texto para vídeo.
Enquanto isso, a Shuttershtock trabalhará em um treinamento de modelo de IA generativa de texto para 3D, a fim de simplificar a criação de recursos 3D mais detalhados.