Modelos de linguagem podem “pensar demais” e entrar em loops infinitos

Imagem do Autor
Por AINEWS
Redes Neurais

Pesquisadores de diversas universidades dos EUA e do ETH Zurich identificaram uma vulnerabilidade inesperada em modelos de linguagem: a tendência de “pensar demais”, levando-os a ficarem presos em ciclos intermináveis de raciocínio, especialmente em ambientes interativos. Esse comportamento pode prejudicar significativamente o desempenho desses modelos, mesmo quando projetados especificamente para tarefas de raciocínio.

O dilema entre raciocínio e ação

Os pesquisadores introduziram o conceito de “dilema raciocínio-ação”, que descreve o equilíbrio que os modelos de IA devem manter entre interagir diretamente com o ambiente para obter feedback e realizar simulações internas para considerar possíveis ações e consequências. Mesmo com poder computacional ilimitado, descobriu-se que modelos que “pensam demais” podem tomar decisões inadequadas devido a uma compreensão incompleta do mundo, levando a erros que se acumulam ao longo do tempo.

Medição do “overthinking” em modelos de IA

Para quantificar essa tendência ao “overthinking”, a equipe desenvolveu métodos sistemáticos utilizando dois frameworks principais: o benchmark de engenharia de software “SWE-bench Verified” e o “OpenHands Framework” para simular ambientes interativos. Utilizando o modelo Claude 3.5 Sonnet, com uma janela de contexto de 200.000 tokens, foram analisados aproximadamente 4.000 processos de interação, atribuindo uma pontuação de “overthinking” em uma escala de 0 a 10.

Padrões de comportamento problemático

A análise revelou três padrões principais de comportamento problemático em modelos de linguagem:

  1. Paralisia por análise: o modelo fica preso na fase de planejamento, incapaz de avançar para a ação.
  2. Ações simultâneas conflitantes: o modelo tenta executar múltiplas ações ao mesmo tempo, que deveriam ser realizadas de forma sequencial.
  3. Desistência prematura: o modelo abandona tarefas com base em simulações internas, sem validar os resultados no ambiente real.

Esses comportamentos indicam que, além de “pensar de menos” (underthinking), como identificado em estudos anteriores, os modelos de IA também podem “pensar demais”, resultando em desempenho insatisfatório.

Impacto em diferentes modelos de linguagem

O estudo avaliou 19 modelos de linguagem distintos, incluindo o o1 da OpenAI, o QwQ da Alibaba e o DeepSeek-R1. Observou-se que tanto modelos projetados para raciocínio quanto os não especializados apresentaram tendências ao “overthinking”, embora os primeiros tenham exibido pontuações mais altas nesse aspecto. Curiosamente, o tamanho da janela de contexto dos modelos mostrou pouco impacto na propensão ao “overthinking”.

Conclusão

A descoberta de que modelos de linguagem podem “pensar demais” e ficarem presos em loops de raciocínio destaca a necessidade de desenvolver estratégias que equilibrem adequadamente o raciocínio e a ação em sistemas de IA. Abordagens que considerem tanto a eficiência quanto a eficácia das ações podem ser essenciais para aprimorar o desempenho desses modelos em ambientes interativos.

Fonte: The Decoder

Foto de Por AINEWS
Por AINEWS

A AINEWS é a primeira plataforma brasileira dedicada exclusivamente à Inteligência Artificial. Nos dedicamos à produção diária e especializada de notícias, artigos técnicos e análises profundas sobre as últimas tendências e inovações em IA.

Ver MAIS publicações
Foto de Por AINEWS
Por AINEWS

A AINEWS é a primeira plataforma brasileira dedicada exclusivamente à Inteligência Artificial. Nos dedicamos à produção diária e especializada de notícias, artigos técnicos e análises profundas sobre as últimas tendências e inovações em IA.

Importante: os comentários e opiniões contidos neste texto são responsabilidade do autor e não necessariamente refletem a opinião da AINEWS ou de seus controladores.

Compartilhe nas redes:

Assine agora a newsletter gratuita e participe da comunidade que está liderando a transformação digital no Brasil e no mundo:

 Inscreva-se na NEWSLETTER

Esteja sempre um passo à frente. Assine agora a newsletter gratuita.

 Inscreva-se em nosso LinkedIn

🔥 Últimas notícias 🇧🇷

» Você pode se interessar