NVIDIA traz IA generativa para milhões com GPUs Tensor Core, LLMs e estações de trabalho RTX

nvidia

Compartilhe

Plataforma gera impulso acelerado por RTX com novas GPUs GeForce RTX SUPER, notebooks com IA e mais

Durante a CES 2024 (Consumer Electronics Show), a NVIDIA anunciou hoje, 8 de janeiro, as novas GPUs para desktop GeForce RTX SUPER, focadas no desempenho de IA generativa. Além disso, foram apresentados novos notebooks de IA de fabricantes líderes, bem como novos softwares e ferramentas de IA aceleradas pela tecnologia RTX, direcionados tanto para desenvolvedores quanto para consumidores.

Com uma base de mais de 100 milhões de GPUs RTX impulsionando a era da Inteligência Artificial, a empresa agora disponibiliza ferramentas para aprimorar as experiências de PC com IA generativa. Destacam-se a TensorRT para o modelo popular Stable Diffusion XL, facilitando a conversão de texto em fluxos de trabalho de imagem, e o RTX Remix, que oferece ferramentas generativas de textura de IA. Além disso, houve o anúncio dos microsserviços ACE e mais jogos que utilizam a tecnologia DLSS 3 com Frame Generation.

- PUBLICIDADE -

A TensorRT-LLM (TRT-LLM), uma biblioteca de código aberto que otimiza o desempenho de inferência dos mais recentes modelos de linguagem grande (LLMs), agora suporta uma variedade maior de modelos pré-otimizados para PCs. O Chat with RTX, uma demonstração tecnológica lançada este mês, permite que entusiastas da IA interajam com suas notas, documentos e outros conteúdos, acelerado pelo TRT-LLM.

Tecnologia “crucial”

Jensen Huang, fundador e CEO da NVIDIA, ressaltou que a IA generativa representa a transição de plataforma mais significativa na história da computação e impactará diversos setores, incluindo o de jogos. “Com mais de 100 milhões de PCs e estações de trabalho RTX IA, a NVIDIA oferece uma base instalada substancial para desenvolvedores e jogadores explorarem as possibilidades da IA generativa.”

A execução da IA generativa localmente em um PC acabou enfatizada pela NVIDIA como crucial para questões de privacidade, latência e aplicativos sensíveis a custos. Assim, em resposta a essas necessidades, a empresa está introduzindo inovações em sua linha de tecnologias, promovendo novas experiências e capitalizando sobre os mais de 500 jogos e softwares para PC habilitados para IA.

- PUBLICIDADE -

PCs e estações de trabalho RTX AI

As GPUs NVIDIA RTX, conhecidas por sua capacidade de executar uma ampla variedade de softwares com o mais alto desempenho, desbloqueiam todo o potencial da IA generativa em PCs. Os Tensor Cores presentes nessas GPUs aceleram significativamente o desempenho da Inteligência Artificial em softwares e aplicativos exigentes, tanto para trabalho quanto para lazer.

As novas placas de vídeo da série GeForce RTX 40 SUPER, anunciadas na CES, incluem modelos como a GeForce RTX 4080 SUPER, 4070 Ti SUPER e 4070 SUPER, projetadas para proporcionar um desempenho superior em IA. Destaca-se que a GPU GeForce RTX 4080 SUPER é capaz de gerar vídeos 1,5x mais rápido e imagens 1,7x mais rápido do que a GPU GeForce RTX 3080 Ti, com o auxílio da IA. Além disso, os Tensor Cores presentes nas GPUs SUPER oferecem uma capacidade de até 836 trilhões de operações por segundo, introduzindo recursos transformadores de IA para jogos, atividades e produtividade.

Fabricantes de peso

Principais fabricantes de mercado, como Acer, ASUS, Dell, HP, Lenovo, MSI, Razer e Samsung, estão lançando uma nova geração de notebooks RTX IA. Esses dispositivos trazem um conjunto completo de recursos de Inteligência Artificial generativa para os usuários, oferecendo um aumento de desempenho que varia de 20x a 60x em comparação com o uso de unidades de processamento neural. A disponibilidade comercial desses sistemas está programada para começar neste mês.

Por fim, estações de trabalho móveis equipadas com GPUs RTX agora têm a capacidade de executar o software AI Enterprise, que inclui TensorRT e NVIDIA RAPIDS. Essa configuração proporciona uma solução simplificada e segura para IA generativa e desenvolvimento de ciência de dados. Além disso, cada GPU A800 de 40 GB ativa inclui uma licença de três anos para o AI Enterprise, tornando-se uma plataforma de desenvolvimento de estação de trabalho ideal para IA e ciência de dados.

Novas ferramentas para construção de modelos de IA

Para auxiliar os desenvolvedores na criação, teste e personalização eficientes de modelos de IA generativos pré-treinados e LLMs, fazendo uso do alto desempenho de PCs e gerenciamento eficiente de memória, a NVIDIA anunciou o AI Workbench. Este kit de ferramentas unificado e de fácil utilização chegará em versão beta ainda este mês.

O AI Workbench proporciona acesso simplificado a repositórios populares, como Hugging Face, GitHub e NVIDIA NGC, junto com uma interface de usuário intuitiva que permite aos desenvolvedores reproduzir, colaborar e migrar projetos de forma fácil. Projetos podem ser escalados para diferentes ambientes, como data centers, nuvens públicas ou a nuvem DGX, podendo então ser trazidos de volta para sistemas RTX locais em PCs ou estações de trabalho para inferência e personalização.

Em parceria com a HP, a NVIDIA está simplificando ainda mais o desenvolvimento de modelos de IA ao integrar modelos e endpoints da AI Foundation no HP AI Studio. Este é um ambiente centralizado para ciência de dados, facilitando aos usuários a pesquisa, importação e implantação de modelos otimizados em PCs e na nuvem.

Após a criação de modelos de IA para casos de uso em PC, os desenvolvedores podem otimizá-los utilizando o TensorRT para aproveitar ao os Tensor Cores das GPUs RTX. A extensão recente do TensorRT para softwares baseados em texto com o TensorRT-LLM para Windows, uma biblioteca de código aberto para acelerar LLMs, é uma adição significativa. A atualização mais recente do TensorRT-LLM, já disponível, inclui modelos pré-otimizados adicionais para PC, como Phi-2 e Zephyr 7B, expandindo as opções disponíveis para os desenvolvedores.

IA generativa acelerada por RTX impulsiona novas experiências de PC

Durante a CES, a NVIDIA e seus parceiros desenvolvedores também lançaram novos softwares e serviços generativos baseados em IA para PCs. Em seguida, veja:

  1. RTX Remix: Uma plataforma inovadora para criar remasterizações RTX de jogos clássicos. Com lançamento beta previsto para o final deste mês, esta ferramenta oferece recursos generativos de IA capazes de transformar texturas básicas de jogos clássicos em materiais de renderização modernos, com resolução 4K e baseados em física.
  2. Microsserviços ACE: Incluindo modelos generativos de fala e animação alimentados por IA. Esses microsserviços possibilitam aos desenvolvedores adicionar avatares digitais inteligentes e dinâmicos aos jogos, enriquecendo a interação e a experiência do usuário.
  3. Aceleração TensorRT para Stable Diffusion XL (SDXL) Turbo e Modelos de Consistência Latente: Dois dos métodos de aceleração de difusão estável mais populares. A TensorRT aprimora o desempenho desses métodos em até 60% em comparação com implementações anteriores mais rápidas. Uma versão atualizada da extensão Stable Diffusion WebUI TensorRT também está disponível, incluindo suporte para SDXL, SDXL Turbo, LCM – Low-Rank Adaptation (LoRA) e suporte LoRA.
  4. DLSS 3 com Geração de Quadros: Utilizando IA para aumentar as taxas de quadros em até 4x em comparação com a renderização nativa. Esta tecnologia estreará em 12 dos 14 novos jogos RTX anunciados, incluindo títulos como Horizon Forbidden West, Pax Dei e por fim, Dragon’s Dogma 2.
  5. Chat com RTX: Uma demonstração técnica, disponível no final deste mês, que permite que entusiastas de IA conectem PC LLMs aos seus dados usando geração aumentada de recuperação (RAG). A demonstração, acelerada pelo TensorRT-LLM, permite aos usuários interagir rapidamente com suas notas, documentos e outros conteúdos. Além disso, acabará disponibilizada como um projeto de referência de código aberto, facilitando aos desenvolvedores a implementação desses recursos em seus próprios aplicativos.

Compartilhe

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

LIVES

TODOS OS DIAS

O melhor conteúdo do mundos dos Games para você! São LIVES diárias com os melhores jogos de luta, Últimos Lançamentos, Notícias, Temporadas da “Guerra das Torres (Mortal Kombat)” e da “Guerra das Ruas (Street Fighter)” com os melhores players do momento e muito mais! É só colar e mandar aquele “Salve”