A DeepSeek, startup chinesa de inteligência artificial, apresentou seus mais recentes modelos, DeepSeek-R1 e DeepSeek-R1-Zero. Ambos surpreenderam ao igualar o desempenho do OpenAI o1 em benchmarks de raciocínio. Este feito consolida a DeepSeek como um importante competidor no avançado cenário global de IA.
DeepSeek R1-Zero impressiona em benchmarks
Os modelos da DeepSeek foram avaliados em diversos benchmarks de raciocínio, apresentando resultados impressionantes. O DeepSeek-R1 alcançou 79,8% no AIME 2024 e 97,3% no MATH-500. Ademais, superou 96,3% dos participantes humanos no Codeforces, um famoso ranking de competições de programação.
Por sua vez, o modelo R1-Zero também se destacou. Ele utiliza uma abordagem inovadora, baseada exclusivamente em aprendizado por reforço, sem exemplos humanos para treinamento. Essa técnica permite que o modelo desenvolva habilidades de raciocínio mais estruturadas, decompondo problemas complexos em etapas menores.
Modelos menores também impressionam
Além das versões principais, a DeepSeek introduziu seis modelos menores, com tamanhos que variam de 1,5 a 70 bilhões de parâmetros. Surpreendentemente, essas variantes menores, treinadas com exemplos gerados pelo modelo R1, alcançaram resultados comparáveis ou superiores ao OpenAI o1-mini em vários benchmarks.
Essas opções mais compactas demonstram o compromisso da DeepSeek em atender a diferentes demandas de mercado, desde aplicações mais leves até aquelas que exigem alta potência computacional.
Avanço da China no cenário de IA
O sucesso da DeepSeek destaca a crescente relevância da China no campo da inteligência artificial. Mesmo enfrentando restrições no acesso a chips avançados, startups chinesas vêm desenvolvendo modelos que competem com as principais empresas norte-americanas. Além disso, métodos alternativos como “mixture of experts” e aprendizado por reforço têm ajudado essas empresas a superar limitações tecnológicas.
Portanto, o lançamento do DeepSeek-R1 e do R1-Zero não apenas reafirma a capacidade técnica da empresa, mas também coloca a China em destaque na corrida global pela inovação em inteligência artificial.
Fonte: The Decoder