DeepSeek R1-Zero rivaliza com OpenAI o1

Imagem do Autor
Por AINEWS

Publicidade

DeepSeek

A DeepSeek, startup chinesa de inteligência artificial, apresentou seus mais recentes modelos, DeepSeek-R1 e DeepSeek-R1-Zero. Ambos surpreenderam ao igualar o desempenho do OpenAI o1 em benchmarks de raciocínio. Este feito consolida a DeepSeek como um importante competidor no avançado cenário global de IA.

DeepSeek R1-Zero impressiona em benchmarks

Os modelos da DeepSeek foram avaliados em diversos benchmarks de raciocínio, apresentando resultados impressionantes. O DeepSeek-R1 alcançou 79,8% no AIME 2024 e 97,3% no MATH-500. Ademais, superou 96,3% dos participantes humanos no Codeforces, um famoso ranking de competições de programação.

Por sua vez, o modelo R1-Zero também se destacou. Ele utiliza uma abordagem inovadora, baseada exclusivamente em aprendizado por reforço, sem exemplos humanos para treinamento. Essa técnica permite que o modelo desenvolva habilidades de raciocínio mais estruturadas, decompondo problemas complexos em etapas menores.

Modelos menores também impressionam

Além das versões principais, a DeepSeek introduziu seis modelos menores, com tamanhos que variam de 1,5 a 70 bilhões de parâmetros. Surpreendentemente, essas variantes menores, treinadas com exemplos gerados pelo modelo R1, alcançaram resultados comparáveis ou superiores ao OpenAI o1-mini em vários benchmarks.

Essas opções mais compactas demonstram o compromisso da DeepSeek em atender a diferentes demandas de mercado, desde aplicações mais leves até aquelas que exigem alta potência computacional.

Avanço da China no cenário de IA

O sucesso da DeepSeek destaca a crescente relevância da China no campo da inteligência artificial. Mesmo enfrentando restrições no acesso a chips avançados, startups chinesas vêm desenvolvendo modelos que competem com as principais empresas norte-americanas. Além disso, métodos alternativos como “mixture of experts” e aprendizado por reforço têm ajudado essas empresas a superar limitações tecnológicas.

Portanto, o lançamento do DeepSeek-R1 e do R1-Zero não apenas reafirma a capacidade técnica da empresa, mas também coloca a China em destaque na corrida global pela inovação em inteligência artificial.

Fonte: The Decoder

Foto de Por AINEWS
Por AINEWS

A AINEWS é a primeira plataforma brasileira dedicada exclusivamente à Inteligência Artificial. Nos dedicamos à produção diária e especializada de notícias, artigos técnicos e análises profundas sobre as últimas tendências e inovações em IA.

Ver MAIS publicações
Foto de Por AINEWS
Por AINEWS

A AINEWS é a primeira plataforma brasileira dedicada exclusivamente à Inteligência Artificial. Nos dedicamos à produção diária e especializada de notícias, artigos técnicos e análises profundas sobre as últimas tendências e inovações em IA.

Importante: os comentários e opiniões contidos neste texto são responsabilidade do autor e não necessariamente refletem a opinião da AINEWS ou de seus controladores.

Compartilhe nas redes:

Assine agora a newsletter gratuita e participe da comunidade que está liderando a transformação digital no Brasil e no mundo:

Publicidade

 Inscreva-se na NEWSLETTER

Esteja sempre um passo à frente. Assine agora a newsletter gratuita.

 Inscreva-se em nosso LinkedIn

🔥 Últimas notícias 🇧🇷