DeepSeek lança nova versão experimental de modelo de inteligência artificial
A desenvolvedora chinesa de inteligência artificial DeepSeek apresentou seu mais recente modelo “experimental”, denominado DeepSeek-V3.2-Exp, que, segundo a empresa, oferece maior eficiência no treinamento e melhor desempenho no processamento de longas sequências de texto em comparação às versões anteriores.
Com sede em Hangzhou, a DeepSeek define esse lançamento como uma etapa intermediária rumo à sua arquitetura de próxima geração, considerada o próximo avanço significativo da companhia desde as versões V3 e R1, que causaram impacto no Vale do Silício e entre investidores de tecnologia.
Entre as principais inovações do modelo V3.2-Exp está o mecanismo DeepSeek Sparse Attention, responsável por reduzir custos computacionais e aumentar o desempenho em determinados tipos de modelos. Também foi anunciado um corte superior a 50% nos preços da API da empresa, como divulgado em sua conta na rede social X.
Embora a nova arquitetura experimental possa não desencadear no mercado o mesmo impacto das versões anteriores lançadas no início do ano, a DeepSeek tem potencial para pressionar seus concorrentes nacionais, como a Qwen da Alibaba, e também rivais americanos, como a OpenAI. Para isso, precisará comprovar capacidade técnica robusta a custos significativamente menores que os praticados pelos principais concorrentes no treinamento de modelos.



