O que é DeepSeek? O rival chinês ChatGPT faz as ações da Nvidia e da Microsoft caírem, abalando gigantes da IA

As empresas americanas de inteligência artificial ficaram cambaleantes depois que uma pequena startup chinesa construiu um LLM por uma fração do custo típico. Aqui está o que saber.

O setor de IA dos Estados Unidos ficou abalado no fim de semana depois que uma pequena empresa chinesa chamada DeepSeek lançou uma versão atualizada do seu chatbot na semana passada, que parece superar até mesmo a versão mais recente do ChatGPT.

Mas não é só o desempenho do DeepSeek que está abalando os gigantes da inteligência artificial dos EUA. É o fato de que o DeepSeek construiu seu modelo em apenas alguns meses, usando hardware inferior e a um custo tão baixo que antes era quase impensável. Aqui está o que você precisa saber sobre o DeepSeek.

O que é DeepSeek?

DeepSeek é um laboratório chinês de inteligência artificial. Foi fundado em 2023 e está sediado em Hangzhou, na província chinesa de Zhejiang. Ele lançou um modelo de IA de código aberto, também chamado DeepSeek. A versão mais recente do DeepSeek, chamada DeepSeek-V3, parece rivalizar e, em muitos casos, superar o ChatGPT da OpenAI — incluindo seu modelo GPT-4o e seu mais recente modelo de raciocínio o1.

No entanto, a ideia de que o chatbot DeepSeek-V3 poderia superar o ChatGPT da OpenAI, assim como o Llama 3.1 da Meta e o Claude Sonnet 3.5 da Anthropic, não é a única coisa que está enervando os especialistas em IA dos Estados Unidos. É o fato de que a DeepSeek parece ter desenvolvido o DeepSeek-V3 em apenas alguns meses, usando hardware de IA que está longe de ser de última geração, e por uma fração minúscula do que outras empresas gastaram desenvolvendo seus chatbots LLM.

Quanto custou o desenvolvimento do DeepSeek?

Talvez a coisa mais espantosa sobre o DeepSeek seja o custo que a empresa levou para desenvolver. De acordo com o relatório técnico da empresa sobre o DeepSeek-V3, o custo total de desenvolvimento do modelo foi de apenas US$ 5,576 milhões.

Sim, são milhões .

Por menos de US$ 6 milhões, a DeepSeek conseguiu criar um modelo LLM enquanto outras empresas gastaram bilhões no desenvolvimento do seu próprio. (No treinamento apenas do GPT-4, a OpenAI supostamente gastou US$ 100 milhões sozinha, observou a Wired em 2023.)

Isso levanta diversas questões existenciais para os gigantes da tecnologia dos Estados Unidos, e uma delas é se eles gastaram bilhões de dólares dos quais não precisavam na construção de seus grandes modelos de linguagem.

Os altos custos de pesquisa e desenvolvimento são a razão pela qual a maioria dos LLMs ainda não atingiu o ponto de equilíbrio para as empresas envolvidas, e se os gigantes da IA dos Estados Unidos pudessem tê-los desenvolvido por apenas alguns milhões de dólares, eles desperdiçaram bilhões que não precisavam.

Mas o fato de que a DeepSeek pode ter criado um modelo LLM superior por menos de US$ 6 milhões também levanta sérias preocupações com a concorrência. Quando se pensava que os LLMs exigiam centenas de milhões ou bilhões de dólares para serem construídos e desenvolvidos, isso deu aos gigantes da tecnologia dos Estados Unidos, como Meta, Google e OpenAI, uma vantagem financeira — poucas empresas ou startups têm o financiamento que antes se pensava necessário para criar um LLM que pudesse competir no reino do ChatGPT.

Mas se a DeepSeek conseguiu construir seu LLM por apenas US$ 6 milhões, então os gigantes da tecnologia americanos podem descobrir que em breve enfrentarão muito mais concorrência não apenas de grandes players, mas até mesmo de pequenas startups nos Estados Unidos — e em todo o mundo — nos próximos meses.

Os Estados Unidos não deveriam impedir que empresas chinesas assumissem a liderança na corrida da IA?

Sim. O governo Biden colocou uma série de controles de exportação em tecnologias de IA na esperança de que eles fizessem exatamente isso. Alguns dos controles de exportação proibiram empresas americanas de vender seus chips de IA mais avançados e outros hardwares para empresas chinesas. Alguns dos hardwares de IA mais avançados da Nvidia caíram sob esses controles de exportação.

É por isso que o sucesso do DeepSeek é ainda mais chocante. O modelo foi desenvolvido usando hardware que estava longe de ser o mais avançado. O DeepSeek treinou seu LLM usando chips H800 da Nvidia — um chip de IA de médio porte.

Apesar de ser consignado a usar hardware menos avançado, o DeepSeek ainda criou um modelo LLM superior ao ChatGPT. Ele também é muito mais eficiente em termos de energia do que LLMS como o ChatGPT, o que significa que é melhor para o meio ambiente.

Em uma entrevista com o CEO da Perplexity, Aravind Srinivas, sobre os avanços do DeepSeek, Srinivas disse à CNBC: “A necessidade é a mãe da invenção. Como eles tiveram que descobrir soluções alternativas, eles acabaram construindo algo muito mais eficiente.”

Como os gigantes da IA dos Estados Unidos reagiram ao DeepSeek?

Com choque e preocupação. No Fórum Econômico Mundial em Davos, Suíça, na quarta-feira, o CEO da Microsoft, Satya Nadella, disse: “Ver o novo modelo do DeepSeek é superimpressionante em termos de como eles realmente fizeram um modelo de código aberto que faz essa computação de tempo de inferência e é supercomputacionalmente eficiente. Devemos levar os desenvolvimentos da China muito, muito a sério.”

A Microsoft gastou bilhões investindo na OpenAI, fabricante do ChatGPT.

O cientista chefe de IA da Meta, Yann LeCun, tem uma opinião um pouco diferente. No Threads, ele afirmou que o sucesso do DeepSeek mostra que “os modelos de código aberto estão superando os proprietários”.

“O DeepSeek lucrou com pesquisa aberta e código aberto (por exemplo, PyTorch e Llama do Meta)”, escreveu LeCun. “Eles tiveram novas ideias e as construíram em cima do trabalho de outras pessoas. Como o trabalho deles é publicado e de código aberto, todos podem lucrar com ele. Esse é o poder da pesquisa aberta e do código aberto.”

Como os investidores reagiram às notícias do DeepSeek?

Com algum alarme. No momento em que este texto foi escrito, as principais ações de IA ou adjacentes à IA estavam em baixa no premarket trading.

As ações da NVIDIA Corporation (Nasdaq: NVDA) estão atualmente em queda de mais de 10%. O sucesso da Nvidia nos últimos anos, nos quais ela se tornou a empresa mais valiosa do mundo, se deve em grande parte às empresas que compram o máximo possível de seus chips de IA mais avançados. No entanto, se as empresas agora podem construir modelos de IA superiores ao ChatGPT em chipsets inferiores, o que isso significa para os lucros futuros da Nvidia?

As ações da ASML Holding NV (Nasdaq: ASML) também caíram 9% no pré-mercado. A ASML fabrica o equipamento necessário para produzir chips avançados de IA.

As ações da Microsoft Corporation (Nasdaq: MSFT), maior investidora da OpenAI, caíram mais de 6% no pré-mercado.

Posso usar o DeepSeek?

Sim. O DeepSeek pode ser usado gratuitamente — não há custo para usar o mais avançado DeepSeek-V3, que na maioria dos testes supera o modelo o1 do ChatGPT. Este último custa US$ 200 por mês para usar.

O DeepSeek pode ser usado gratuitamente na web. Como você pode ver, sua interface não parece diferente das interfaces de outros LLMS.

Você também pode usar o DeepSeek gratuitamente no seu smartphone através do aplicativo DeepSeek dedicado para iOS e Android.

E como um sinal de como o DeepSeek ganhou tanta atenção no mercado de IA nos últimos dias, o aplicativo agora é o aplicativo número 1 na App Store da Apple.

Postagens Relacionadas:

Novas cores do Google Maps: um sinal esperançoso de mais mudanças por vir

Como o Javascript afeta o SEO?

Como a arte da IA impactará a criatividade?

Escreva um comentário