Início " Vida profissional " Negócios " Crescimento da Nvidia

O crescimento da Nvidia, de pioneira em jogos a empresa líder em IA

Uma mão segurando uma tela de telefone com o logotipo da Nvidia

O que leva uma empresa de tecnologia a se transformar de uma pioneira em gráficos de jogos em uma potência de IA? O crescimento da Nvidia, de uma startup em dificuldades para a fabricante de chips mais valiosa do mundo, mostra uma jornada notável de inovação e mudança estratégica. A evolução da empresa demonstra como o investimento inicial em tecnologias emergentes, combinado com estratégias de negócios adaptáveis, pode levar ao domínio do mercado.

O que o CEO Jensen Huang e sua equipe não podiam prever totalmente era como os avanços da IA se alinhariam perfeitamente com a infraestrutura de processamento paralelo que eles já haviam criado. Continue lendo para saber como essa empresa revolucionou dois setores - e o que seu futuro pode reservar em um cenário cada vez mais competitivo.

Imagem via Pexels(licença). Imagem cortada.

Como a Nvidia cresceu ao longo dos anos

A Nvidia passou estrategicamente dos gráficos de jogos para a tecnologia de IA há mais de uma década, investindo bilhões e mobilizando milhares de engenheiros para desenvolver hardware e software de IA especializados. A empresa reaproveitou seus chips de unidades de processamento gráfico (GPUs), originalmente projetados para videogames, para lidar com cálculos de IA, capitalizando seus recursos superiores de processamento paralelo. Esse compromisso inicial e a inovação tecnológica posicionaram a Nvidia na vanguarda da revolução da IA, permitindo que ela atendesse às complexas demandas de IA e aprendizado de máquina com soluções de alto desempenho e eficiência energética.

(Nota breve: GPUs são processadores especializados projetados para acelerar a renderização de gráficos. Elas são essenciais para tarefas que exigem processamento paralelo, como renderização em 3D, reprodução de vídeo e, mais recentemente, aprendizado de máquina e aplicativos de IA).

Exploraremos como o crescimento da Nvidia levou ao domínio da computação de IA, os desafios que a empresa enfrenta e as outras maneiras pelas quais a Nvidia está inovando.

Mudança da Nvidia para IA 

De acordo com Stephen Witt em A máquina de pensara revolução da IA que transformou a Nvidia de uma empresa de gráficos em uma das empresas de tecnologia mais valiosas do mundo começou quando os pesquisadores descobriram que um tipo específico de modelo de aprendizado de computador chamado de rede neural poderia alcançar resultados sem precedentes, mas somente quando alimentado exatamente pelo tipo de processamento paralelo maciço que a CUDA tornou acessível.

As redes neurais - sistemas de computação projetados para imitar vagamente a forma como o cérebro humano processa as informações - existiam na teoria há décadas, mas continuaram impraticáveis até que os pesquisadores descobriram como treiná-las de forma eficaz usando enormes quantidades de dados e poder computacional. Diferentemente do software tradicional, que segue regras predeterminadas, as redes neurais aprendem analisando padrões em vastos conjuntos de dados por meio de milhões de cálculos simultâneos. Esse processo de aprendizado, chamado de "treinamento", exige exatamente o tipo de processamento paralelo maciço para o qual as GPUs da Nvidia foram projetadas.

(Nota breve: O equivalente biológico dos chips de processamento discutidos por Witt - células nervosas no cérebro - é muito mais lento do que o computador mais básico. A vantagem do cérebro é que sua capacidade de processamento paralelo é inigualável. Em A Thousand Brains (Mil Cérebros)o neurocientista Jeff Hawkins explica que o neocórtex, a parte do cérebro responsável pelas funções cognitivas superiores, consiste em cerca de 150.000 colunas corticais-agrupamentos de células nervosas que atuam como unidades discretas de processamento de informações. Hawkins escreve que a cognição humana emerge do processamento paralelo de todas essas colunas corticais trabalhando juntas como um armazém gigante cheio de GPUs, produzindo o que sua mente consciente percebe como sua experiência da realidade).

A descoberta da AlexNet que validou a estratégia da Nvidia

Em 2012, pesquisadores da Universidade de Toronto comprovaram o potencial das redes neurais usando a tecnologia da Nvidia. De acordo com Witt, uma equipe de pesquisadores liderada por Alex Krizhevsky usou duas placas de vídeo Nvidia de prateleira com o software CUDA para criar uma rede neural para reconhecimento de imagens chamada AlexNet. Essa rede não teve apenas um desempenho ligeiramente melhor do que as abordagens anteriores; ela representou um salto fundamental que tornou outros métodos obsoletos.

O que tornou o AlexNet revolucionário não foi apenas seu desempenho, mas o que ele revelou sobre a relação entre o poder computacional e a capacidade de IA. Os pesquisadores descobriram que quanto maior o poder de processamento paralelo que podiam aplicar ao treinamento de redes neurais, melhores eram os resultados. No início daquele ano, observa Witt, pesquisadores do Google haviam treinado uma rede neural para identificar vídeos de gatos usando 16.000 processadores tradicionais. A equipe de Krizhevsky obteve resultados de nível mundial com apenas duas placas de circuito da Nvidia.

(Nota breve: a AlexNet usa "convolução", uma operação matemática que desliza pequenos filtros de detecção de padrões por uma imagem - como mover uma pequena janela - para procurar bordas, formas ou texturas. Como isso requer milhares de cálculos idênticos realizados simultaneamente em toda a imagem, corresponde perfeitamente ao que as GPUs foram projetadas para fazer com excelência. Mais potência computacional significa ter mais filtros sendo executados em paralelo, o que permite que a rede neural detecte recursos cada vez mais complexos, desde simples bordas até objetos completos, como rostos. É por isso que o aumento da potência de processamento torna a IA mais capaz: Mais poder de computação significa literalmente reconhecer padrões mais sofisticados).

Embora a comunidade de pesquisa de IA mais ampla tenha demorado a compreender todas as implicações da AlexNet, Witt explica que Huang a reconheceu imediatamente como uma grande oportunidade para a arquitetura de computação paralela da Nvidia. Ele rapidamente redirecionou toda a empresa para a "aprendizagem profunda", o tipo de treinamento de rede neural demonstrado pela AlexNet, e declarou a Nvidia uma "empresa de IA" quase da noite para o dia. Esse pivô rápido e decisivo provou ser crucial para aproveitar a oportunidade emergente que transformaria a Nvidia e o setor de tecnologia.

Como os Transformers criaram a revolução da IA da linguagem

O próximo grande avanço ocorreu em 2017, quando os pesquisadores do Google desenvolveram a arquitetura de transformadores. De acordo com Witt, os transformadores são um tipo de rede neural projetada para processar a linguagem analisando as relações entre todas as palavras em um texto simultaneamente, em vez de processá-las uma de cada vez. Em vez de ler uma frase do início ao fim, como fazem os seres humanos, os transformadores podem examinar cada palavra em relação a todas as outras palavras ao mesmo tempo. Essa capacidade de processamento paralelo tornou os transformadores perfeitamente adequados para a aceleração de GPU, o que significa que eles poderiam aproveitar ao máximo a capacidade dos chips da Nvidia de realizar milhares de cálculos simultaneamente, criando outra grande oportunidade para a Nvidia.

(Nota breve: Embora os transformadores tenham representado um grande avanço no processamento de linguagem da IA, eles ainda enfrentam uma "barreira de significado" significativa: Eles não entendem a linguagem da mesma forma que os humanos. Em Inteligência ArtificialMelanie Mitchell explica que os transformadores dependem da correspondência estatística de padrões. Em outras palavras, eles processam o texto sem a compreensão genuína de seu significado. Eles também não têm o conhecimento intuitivo sobre o mundo que consideramos natural, o que os deixa vulneráveis a erros surpreendentes. Isso sugere que o alinhamento entre os transformadores e os recursos de processamento paralelo da Nvidia, embora comercialmente bem-sucedido, pode representar uma sofisticada correspondência de padrões, e não a verdadeira inteligência com a qual os críticos de IA se preocupam).

Os transformadores permitiram o desenvolvimento de grandes modelos de linguagem (LLMs), sistemas de IA que usam a arquitetura do transformador para processar e gerar linguagem após serem treinados em grandes quantidades de texto. Modelos como a série GPT da OpenAI exigiam um poder computacional sem precedentes para serem treinados. Mas os pesquisadores descobriram que, à medida que esses modelos cresciam e consumiam mais recursos computacionais, eles se tornavam muito mais capazes. Os modelos destinados a prever a próxima palavra em uma frase podiam traduzir idiomas, escrever códigos ou explicar conceitos científicos. Witt explica que isso criou um ciclo de feedback: Mais poder de computação levou a uma IA mais capaz, o que justificou maiores investimentos em infraestrutura, o que beneficiou a Nvidia.

Como as fábricas de IA se tornaram uma infraestrutura essencial

As demandas computacionais dos modelos de IA baseados em transformadores criaram um novo desafio. Witt observa que as tarefas tradicionais de computação poderiam ser realizadas por uma única máquina potente. Mas o treinamento dos LLMs mais avançados exigia dividir o trabalho em milhões de partes e coordenar os cálculos em milhares de chips em tempo real. A solução de Huang foi o que ele imaginou como "fábricas de IA", data centers especializados projetados especificamente para treinar e executar sistemas de IA. Elas representavam uma nova forma de infraestrutura industrial que consumiria dados brutos e produziria inteligência, da mesma forma que as fábricas tradicionais consomem matérias-primas e produzem bens. 

Do chão de fábrica à fábrica de IA: Uma nova forma de alienação

A fábrica de IA de Huang revela uma nova manifestação das observações feitas por Karl Marx em sua teoria da alienação do trabalhador - a desconexão entre as pessoas e os produtos que elas produzem. As fábricas tradicionais separavam os trabalhadores dos resultados de seu trabalho físico, mas as fábricas de IA criam uma nova forma de separação entre os criadores humanos e sua produção intelectual. Os LLMs são treinados em enormes conjuntos de dados de escrita, arte e outros trabalhos criativos humanos. Esse processo transforma a criatividade humana em matéria-prima para a produção algorítmica: Bilhões de pensamentos, experiências e expressões criativas de pessoas são incorporados a conjuntos de dados usados para reduzir a criação de significados humanos a relações estatísticas.

O processo se baseia em várias camadas de abstração e "alienação" que se afastam progressivamente da compreensão humana. Os sistemas de IA primeiro convertem o texto em listas de números que representam a posição de cada palavra no espaço matemático. Em seguida, o sistema identifica padrões em como esses números se relacionam entre si, em vez de se envolver com o significado real da própria linguagem. Portanto, quando os sistemas de IA geram texto ou arte, eles estão fazendo matemática avançada: Eles recombinam padrões numéricos para produzir resultados que imitam a expressão humana. O texto ou a arte que um sistema de IA cria é um eco matemático dos padrões de pensamento humano, mas desprovido do significado e da importância originais desses pensamentos.

As implicações econômicas dessa mudança de infraestrutura foram sem precedentes. O treinamento dos modelos de IA mais avançados exigia recursos computacionais medidos em milhares de GPUs-ano (trabalho que levaria milhares de anos para ser concluído em um único chip), mas poderia ser realizado em semanas ou meses quando distribuído em sistemas paralelos maciços. Witt observa que isso tornou a barreira de entrada para o desenvolvimento de sistemas de IA de última geração tão alta que somente as maiores empresas de tecnologia poderiam competir: Empresas como Microsoft, Google e Amazon entraram em uma corrida armamentista pela capacidade computacional, gastando bilhões em hardware da Nvidia para construir fábricas de IA cada vez maiores e manter sua vantagem competitiva.

(Nota breve: embora a computação paralela permita que GPUs individuais processem milhares de cálculos simultaneamente, o escalonamento maciço do poder de computação descrito por Witt só se tornou possível com a computação distribuída: coordenação de milhares de GPUs para treinar um único modelo de IA. O treinamento de um LLM requer o processamento de bilhões de exemplos de texto e o ajuste de milhões de configurações internas, chamadas de parâmetros, que determinam como o modelo responde: uma tarefa tão grande que levaria milhares de anos para um único computador, mas requer apenas semanas quando distribuída em milhares de GPUs. Essa coordenação cria grandes desafios, que a Nvidia resolveu com hardware e software de rede especializados para otimizar o modo como as GPUs compartilham informações).

A Nvidia ganhou vantagem por ser uma inovadora precoce, oferecendo software que os desenvolvedores preferiam e produzindo grandes volumes de GPUs de forma mais confiável do que os concorrentes. Essa vantagem levou a uma ampla adoção em vários setores, inclusive no setor automotivo, onde os chips da Nvidia se tornaram a opção preferida para o processamento de imagens de sensores em sistemas de assistência ao motorista.

Este não é o primeiro pivô da Nvidia

Em 1993, Jensen Huang, Curtis Priem e Chris Malachowsky fundaram a Nvidia, reconhecendo o potencial futuro dos processadores gráficos nos jogos para PC. Como Tae Kim relata em seu livro The Nvidia Wayembora os fundadores estivessem confiantes de que sua tecnologia inovadora poderia atrair os jogadores e superar os padrões do setor, os primeiros anos da Nvidia foram marcados por desafios e instabilidade significativos.

Os empreendimentos iniciais da empresa se mostraram problemáticos. Seus dois primeiros modelos de chip não conseguiram ganhar força, e um investimento caro de US$ 15 milhões em um desenvolvimento de chip malsucedido levou a Nvidia à beira do colapso. Com apenas algumas semanas antes de chegar a um ponto sem retorno, os fundadores tomaram medidas decisivas, incluindo reduções de pessoal, para manter a empresa à tona. Outro revés ocorreu quando o chip NV2, destinado ao próximo console de jogos da Sega, foi cancelado no meio do desenvolvimento, rendendo apenas uma taxa de desenvolvimento de US$ 1 milhão por seus esforços.

De acordo com Kim, o ponto de virada da Nvidia ocorreu com sua decisão de inovar em uma nova direção. Eles desenvolveram o RIVA 128, com o objetivo de criar o chip gráfico mais rápido do mercado. Esse projeto era mais complexo do que seus antecessores e exigia recursos de fabricação ampliados. Apesar de enfrentar um cronograma apertado - precisando concluir em nove meses o que normalmente levava dois anos - a Nvidia teve sucesso ao mudar sua estratégia. Em vez de buscar tecnologia proprietária, eles se concentraram na criação de um produto versátil que suportasse todos os principais jogos, mantendo a compatibilidade com versões anteriores.

Nos últimos anos, a Nvidia expandiu sua influência por meio de parcerias estratégicas com os principais fabricantes de computadores e provedores de nuvem. Essas colaborações aumentaram o apelo de suas plataformas de IA e atraíram mais desenvolvedores e clientes, consolidando ainda mais a posição de liderança da Nvidia.

Inovando e dominando o mercado

A inovação da Nvidia vai muito além dos chips de IA, demonstrando a adaptabilidade da empresa em várias tecnologias de ponta.

  • Supercomputação. Os chips da Nvidia processam grandes quantidades de dados para sistemas de computador avançados. A Meta usa esses recursos para treinar modelos complexos de IA; a Tesla para impulsionar o desenvolvimento de um supercomputador focado em IA para aprimorar a automação de veículos.
  • Jogos. GPUs como a GeForce RTX 4070 permitem jogos mais rápidos e de alta resolução - essenciais à medida que o setor muda de consoles para plataformas baseadas em nuvem.
  • Metaverso e realidade ampliada. A plataforma Omniverse e as ferramentas de modelagem 3D da Nvidia estão avançando nos cenários de metaverso e realidade estendida (XR), atendendo às crescentes necessidades de ambientes de treinamento virtual e outros aplicativos.
  • Mineração de criptomoedas. As placas de vídeo da Nvidia, cruciais para a mineração de criptomoedas com uso intensivo de energia, viram a demanda aumentar à medida que os tokens digitais ganharam popularidade.

Desafios para o crescimento contínuo da Nvidia

Apesar de seu atual domínio do mercado, o crescimento e a posição de mercado da Nvidia no futuro enfrentam vários desafios significativos:

  • Aumento da concorrência. Gigantes da tecnologia, como Intel, AMD, Meta, Google, Microsoft e Amazon, estão desenvolvendo seus próprios chips, o que pode comprometer a participação de 80% da Nvidia no mercado. À medida que o setor evolui, as empresas que procuram evitar a dependência de um único fornecedor podem recorrer a esses concorrentes, corroendo o domínio da Nvidia.
  • Altos custos e problemas na cadeia de suprimentos. Os caros chips de ponta da Nvidia e os possíveis longos tempos de espera podem levar os clientes a considerar alternativas, um ponto fraco que os concorrentes podem explorar.  
  • Possível escassez de chips. Apesar do CHIPS and Science Act de 2022, que visa a aumentar a produção de chips nos EUA, o fornecimento ainda pode ficar aquém da crescente demanda por chips da Nvidia.
  • Questões regulatórias e comerciais. As regulamentações emergentes no mercado de IA generativa e as restrições comerciais dos EUA em relação à China podem prejudicar as operações e as vendas da Nvidia.

O caminho a seguir

A Nvidia continua sendo uma força dominante em IA, com seus processadores essenciais em muitos data centers. Isso posiciona a empresa para se beneficiar do crescimento do mercado de chips de IA.

No entanto, os especialistas alertam que o cenário está mudando. À medida que a concorrência se intensifica, a Nvidia pode enfrentar desafios de novos participantes que oferecem tecnologias inovadoras e versáteis que funcionam em diferentes tipos de hardware. Isso poderia ameaçar o modelo da Nvidia, que depende muito de seu software proprietário CUDA, projetado exclusivamente para suas GPUs.

Além disso, embora seja excelente no treinamento de modelos de IA, a Nvidia está atrasada em tarefas de inferência, usadas para treinar modelos de IA para decisões ou previsões em tempo real. Se os concorrentes desenvolverem chips mais rápidos para esses aplicativos, a Nvidia poderá perder participação de mercado nessa área crucial.

Em última análise, a capacidade da Nvidia de inovar e se adaptar determinará se ela conseguirá manter sua posição de liderança.

PERGUNTAS FREQUENTES

O que tornou a Nvidia tão bem-sucedida em seus primeiros anos?

Após os primeiros fracassos do produto, a Nvidia teve um grande avanço com o chip RIVA 128 - seu primeiro grande sucesso - graças a uma mudança estratégica em direção à versatilidade e à compatibilidade com versões anteriores.

Qual foi o papel da descoberta do AlexNet no sucesso da Nvidia?

O projeto AlexNet de 2012 provou que as GPUs da Nvidia poderiam acelerar drasticamente o treinamento de redes neurais, validando a decisão de Jensen Huang de direcionar a empresa para a IA.

Como a Nvidia fez a transição dos jogos para a IA?

A Nvidia reaproveitou suas unidades de processamento gráfico (GPUs), originalmente criadas para jogos, para lidar com os complexos cálculos necessários para IA e aprendizado de máquina.

O que são "fábricas de IA" e como a Nvidia as utiliza?

As fábricas de IA são data centers especializados criados para treinar e executar sistemas de IA. Elas representam um novo modelo industrial em que os dados são a matéria-prima e a inteligência é o resultado, alimentado em grande parte pelo hardware da Nvidia.

Como os transformadores contribuem para o sucesso da Nvidia?

Os transformadores, que processam todas as palavras em um texto simultaneamente, dependem muito do processamento paralelo - perfeitamente adequado às GPUs da Nvidia - alimentando o crescimento explosivo de grandes modelos de linguagem e dos negócios da Nvidia.

Em que outros setores a Nvidia domina?

A tecnologia da Nvidia impulsiona os avanços em supercomputação, jogos, metaverso e mineração de criptomoedas.

Quais são os principais desafios enfrentados pela Nvidia?

Os maiores obstáculos da Nvidia incluem o aumento da concorrência de empresas que desenvolvem seus próprios chips, altos custos de produção, possível escassez de chips e novas restrições regulatórias e comerciais.

Saiba mais sobre o crescimento da Nvidia no setor de IA

Para entender melhor o crescimento da Nvidia e seu contexto mais amplo, confira os guias e artigos da Shortform que mencionamos neste artigo:

Deixar uma resposta