Etched conseguiu levantar US$ 120 milhões para desafiar a Nvidia no mercado de chips de IA. A empresa está desenvolvendo um novo chip chamado Sohu, projetado para lidar com um aspecto crucial do processamento de IA: a arquitetura transformer. Ao integrar essa arquitetura diretamente em seus chips, a Etched afirma estar criando os servidores mais potentes para inferência de transformers, considerando Sohu o chip transformer mais rápido já produzido.
Esse anúncio é especialmente relevante, uma vez que a Nvidia recentemente superou a Microsoft para se tornar a empresa mais valiosa do mundo, alcançando uma avaliação de US$ 3,3 trilhões. Com o respaldo de investidores influentes, como Peter Thiel, a Etched confia na capacidade de sua equipe de 35 membros para competir com a Nvidia.
A rodada de investimentos, liderada pela Primary Venture Partners e Positive Sum Ventures, atraiu investidores institucionais, incluindo Hummingbird, Fundomo, Fontinalis, Lightscape, Earthshot, Two Sigma Ventures e Skybox Data Centers. Entre os investidores anjos destacados estão Peter Thiel, Stanley Druckenmiller, David Siegel, Balaji Srinivasan, Amjad Masad, Kyle Vogt, Kevin Hartz, Jason Warner, Thomas Dohmke, Bryan Johnson, Mike Novogratz, Immad Akhund, Jawed Karim e Charlie Cheeve.
Alex Handy, diretor da Thiel Fellowship, comentou: "Investir na Etched representa uma aposta estratégica no futuro da IA. Seus chips abordam questões de escalabilidade que os concorrentes hesitam em enfrentar, ajudando a combater a estagnação observada em outras partes da indústria. Os fundadores exemplificam o talento inovador que suportamos, tendo abandonado Harvard para enfrentar o desafio dos semicondutores. Eles estão abrindo caminho para que o Vale do Silício inove sem o fardo das preocupações com tecnologias legadas."
A demanda por GPUs potentes continua a crescer. A Etched foi fundada por ex-alunos de Harvard, Robert Wachen, Gavin Uberti e Chris Zhu, que se comprometeram significativamente com a IA desde junho de 2022, apostando no potencial transformador do modelo transformer. Historicamente, vários modelos de IA, como CNNs, RNNs e U-Nets, desempenharam papéis importantes em seus campos, mas os transformers (o “T” no ChatGPT) emergiram como o primeiro modelo de IA escalável.
"Creio que a inteligência continuará a se expandir com a computação. Nossa aposta é que empresas investirão bilhões em modelos de IA executados em chips especializados", disse o CEO Gavin Uberti em uma postagem no blog. "Nos últimos dois anos, desenvolvemos Sohu, o primeiro ASIC especializado do mundo para transformers. Este chip não pode executar modelos clássicos de IA, como DLRMs que melhoram feeds do Instagram ou modelos de dobramento de proteínas, nem lidar com CNNs ou RNNs. No entanto, para transformers, Sohu é incomparável em velocidade e custo, superando significativamente até mesmo as futuras GPUs Blackwell da Nvidia."
Uberti enfatizou que a paisagem dos modelos de IA mudou dramaticamente em direção aos transformers, como demonstrado por desenvolvimentos como ChatGPT, Sora, Gemini e Stable Diffusion 3. Se novas arquiteturas surgirem, como SSMs ou misturadores monárquicos, os chips da Etched podem perder relevância. No entanto, se suas previsões se concretizarem, Sohu pode mudar totalmente o jogo. A empresa está estabelecendo parcerias com a TSMC para fabricar no avançado nó de 4nm.
Por que essa aposta? A Etched está focando em transformers. Segundo a empresa, a chave para alcançar superinteligência está na escala. Em apenas cinco anos, os modelos de IA evoluíram de formas rudimentares para superar capacidades humanas em testes padronizados, principalmente devido ao aumento de escala.
Ao expandir os modelos de IA e melhorar a qualidade dos dados de treinamento, esses sistemas se tornam significativamente mais inteligentes. A quantidade de FLOPS necessária para treinar modelos líderes aumentou cerca de 50.000 vezes de GPT-2 para Llama-3-400B em cinco anos.
Uberti explicou que, enquanto as arquiteturas de IA costumavam evoluir rapidamente—com uma infinidade de modelos emergindo—os sistemas atuais de ponta, como Llama 3, se assemelham muito a seus predecessores, como GPT-2, com apenas pequenos ajustes. Essa tendência deve continuar.
"Todos os principais players, incluindo Google, OpenAI, Amazon e Microsoft, estão investindo mais de US$ 100 bilhões em data centers de IA", observou Uberti. Apesar das opiniões divergentes na academia, os principais laboratórios de IA concordam amplamente que escalar grandes modelos de linguagem (LLMs) nos levará em direção à superinteligência.
Uberti enfatizou: "Estamos testemunhando a maior expansão de infraestrutura da história. As leis de escala mostraram sucesso consistente ao longo dos últimos dez ordens de magnitude (de $10^16 a $10^{26} FLOPS). Se as projeções se mantiverem para as próximas quatro ordens (até $10^{30} FLOPS), a superinteligência estará ao alcance, e chips de IA dominarão a demanda do mercado."
Os chips flexíveis atingiram um platô. A perspectiva da Etched sobre GPUs. Nos últimos anos, mudanças frequentes nas arquiteturas dos modelos, como CNNs, DLRMs e LSTMs, dominaram o panorama da IA, cada uma incorrendo em custos substanciais. O mercado total de chips de IA variava de US$ 10 bilhões a US$ 20 bilhões.
Para atender a esse amplo mercado, muitas empresas desenvolveram chips de IA versáteis para diversas arquiteturas, incluindo GPUs da Nvidia, TPUs do Google, Trainium da Amazon e outros. No entanto, todas tiveram dificuldade em igualar a performance do modelo H100 da Nvidia.
Uberti observou que "muitos concorrentes alegam ganhos de desempenho ao combinar múltiplos chips em um único card, enquanto, na realidade, o desempenho por área permaneceu estagnado—desafios ainda permanecem para quem busca transitar de GPUs."
A Etched afirma que todo grande mercado de computação acaba gravitanto em direção a chips especializados, desde redes até mineração de Bitcoin, oferecendo vantagens de desempenho vastas em relação às GPUs. Uberti declarou: "Devido aos imensos interesses financeiros em IA, a especialização é inevitável."
A Etched prevê que a maioria dos investimentos se concentrará em modelos que ultrapassam 10 trilhões de parâmetros, que provavelmente operarão a partir de alguns enormes data centers em nuvem, ecoando tendências observadas na fabricação de chips, onde instalações de alto custo e alta resolução substituíram as menores.
"Mesmo se uma arquitetura superior for desenvolvida, a transição para fora dos transformers implica desafios significativos, pois trabalhos fundamentais devem ser refeitos em várias facetas técnicas", acrescentou. À medida que a complexidade dos modelos de IA aumenta e os custos de treinamento sobem, a demanda por chips especializados crescerá, tornando os primeiros adotantes líderes no campo.
A Etched está posicionada para liderar. Os fundadores—Wachen, Uberti e Zhu—afirmam que nenhum chip de IA específico para a arquitetura foi construído até o momento. Anteriormente, criar tais chips especializados exigia demanda substancial e convicção sobre sua viabilidade duradoura.
"Optamos por investir em transformers, que estão ganhando rapidamente tração", disse Uberti. Com a demanda crescente por inferência de transformers agora ultrapassando US$ 5 bilhões, grandes empresas de tecnologia, incluindo OpenAI, Google, Amazon e Microsoft, integraram modelos transformer em suas operações.
Uberti destacou que arquiteturas distintas se consolidaram de maneira significativa. Modelos como a série GPT da OpenAI, PaLM do Google e LLaMa do Facebook giram amplamente em torno de transformers.
"Estamos avançando rapidamente para realizar o potencial do Sohu", afirmou. "Estamos a caminho do ciclo de desenvolvimento mais rápido para um chip verificado de 4nm. Colaborando com a TSMC, estamos garantindo fornecimento duplo de HBM3E de fornecedores de ponta, assegurando dezenas de milhões em reservas de empresas de IA."
A empresa também apontou que os modelos de IA hoje costumam ser caros demais e lentos para entregar produtos de maneira eficaz, com desafios como altos custos operacionais para agentes de codificação de IA e tempos de processamento lentos para modelos de vídeo.
Uberti concluiu: "Com Sohu, podemos transformar o cenário. Capacidades em tempo real de vídeo, áudio, agentes e busca estão finalmente ao alcance, melhorando radicalmente a viabilidade econômica dos produtos de IA."
A Etched pode superar a Nvidia? A abordagem distinta da Etched ao processamento paralelo a posiciona de maneira única no mercado. Em resposta a questionamentos sobre como uma empresa menor poderia eclipsar a Nvidia, o COO Robert Wachen explicou: "Historicamente, o mercado de computação de IA era fragmentado, com numerosos modelos em uso ativo. Bilhões foram gastos em modelos transformer, indicando uma mudança em direção à especialização. Embora nossos chips não superem GPUs em cargas de trabalho generalizadas, eles dominarão a inferência de transformers, essencial para produtos de IA generativa."
Essa especialização dá à Etched uma vantagem competitiva, permitindo que seus chips se destaquem onde outros não conseguem.