Apoiadores:
Apoie também

CriticGPT: Uma Nova Abordagem para Avaliação e Alinhamento de Modelos de IA

Author picture

Publicidade

CriticGPT

A evolução dos modelos de Inteligência Artificial, como os da série GPT-4, trouxe avanços significativos em termos de precisão e capacidades interativas. No entanto, conforme esses modelos se tornam mais sofisticados, também se tornam mais difíceis de avaliar. Para enfrentar esse desafio as fabricantes a exemplo de Google, Meta e Anthropic precisam desenvolver soluções para ditimir o risco de falhas nas respostas (halucinações). Para esta coluna, hoje irei destacar a iniciativa que a OpenAI desenvolveu, chamada CriticGPT. O CriticGPT é um modelo baseado no GPT-4, com o objetivo de identificar falhas nas saídas geradas pelo ChatGPT, especialmente em respostas relacionadas a códigos.

O que é o CriticGPT?

O CriticGPT foi implementado para analisar e criticar as respostas geradas pelo ChatGPT (que conta com seu próprio LLM). O foco está na detecção de erros na derivação de conteúdo e especialmente na falha de geração de código (code-source). Ao ser integrado à linha de treinamento de modelos por meio de Reinforcement Learning from Human Feedback (RLHF), o CriticGPT visa melhorar a supervisão humana em tarefas complexas, se tornando mais uma ferramenta para treinadores humanos de IA. A OpenAI informa que estudos demonstraram que a utilização do CriticGPT como suporte melhora o desempenho dos avaliadores humanos em 60% dos casos, quando comparado com aqueles que realizam o processo de avaliação sem o CriticGPT.

Por que o CriticGPT é necessário?

À medida que os modelos se tornam mais avançados, seus erros também se tornam mais sutis e difíceis de identificar. Isso dificulta o trabalho dos treinadores, que precisam avaliar comparações entre respostas de diferentes iterações do ChatGPT.

Um dos principais desafios do RLHF está no aumento da capacidade dos modelos, mais especificamente nas áreas de conhecimento que os treinadores humanos não têm o conhecimento necessário para identificar falhas, especialmente em domínios técnicos como programação.

Como o CriticGPT foi treinado?

O CriticGPT foi treinado usando RLHF (aprendizado por reforço com base no feedback humano), sendo exposto a entradas deliberadamente contendo erros, ou seja, os treinadores humanos inseriram esses erros em códigos gerados pelo ChatGPT e forneceram exemplos de feedback, identificando os problemas inseridos determinando a solução. Com isso, o CriticGPT aprendeu a gerar críticas detalhadas, apontando falhas nos bugs (inseridos propositalmente) e em erros naturalmente detectados por treinadores.

Imagem com borda

Publicidade

CriticGPT em Ação: Casos de Uso e Benefícios

A utilização do CriticGPT em ambientes de treinamento traz benefícios significativos:

  • Aprimoramento da Qualidade de Críticas: quando combinado com a expertise humana, o CriticGPT ajuda treinadores a elaborar críticas mais detalhadas, reduzindo as alucinações. Em experimentos, os treinadores preferiram críticas geradas em colaboração com o CriticGPT em 63% dos casos, em comparação com aquelas feitas sem auxílio.
  • Redução de Erros Não Detectados: o modelo é capaz de destacar problemas que poderiam passar despercebidos, ajudando treinadores a identificar falhas mais sutis nas respostas do ChatGPT, especialmente em áreas como programação de software.
  • Equilíbrio Entre Precisão e Cobertura: durante a fase de avaliação, foram empregadas técnicas de busca em tempo de teste para ajustar o nível de profundidade e crítica na identificação de problemas, equilibrando a precisão (evitar falsas detecções) e o recall (detecção de erros reais).

Vamos para os exemplos práticos de aplicação:

  • Detecção de Erros em Código: em plataformas de aprendizado de programação de software, o CriticGPT pode ser usado para avaliar códigos submetidos por alunos, apontando erros sintáticos e falhas lógicas que podem ser difíceis de detectar.
  • Melhoria de Chatbots de Atendimento: em empresas que utilizam chatbots baseados em modelos General-Purpose Technology (GPT) para atendimento ao cliente, o CriticGPT pode ser integrado para revisar interações e melhorar a precisão das respostas, especialmente em setores regulados como financeiro e jurídico.
  • Apoio a Equipes de Revisão de Conteúdo: em empresas que dependem da IA para gerar conteúdo técnico, como documentação ou artigos, o CriticGPT pode atuar como uma camada adicional de revisão, garantindo que o conteúdo gerado esteja livre de erros críticos.

Limitações do CriticGPT

Embora o CriticGPT seja uma ferramenta poderosa, ela ainda possui algumas limitações:

  • Dependência de Respostas Curtas: treinamento do CriticGPT foi baseado em respostas relativamente curtas. Tarefas mais complexas, que envolvem múltiplas etapas ou dependências, ainda representam um desafio significativo para o modelo.
  • Alucinações Persistentes: apesar de uma redução no número de alucinações, elas ainda ocorrem, especialmente em contextos onde a resposta correta não é clara ou depende de múltiplos fatores inter-relacionados (contexto profundo).
  • Capacidade Limitada em Tarefas Extensas: em tarefas ou avaliações que exigem uma visão holística, como projetos de software considerando o escopo fim a fim, o modelo ainda pode falhar em captar erros que estão dispersos ao longo de uma sequência extensa de respostas.

O desenvolvimento do CriticGPT representa um avanço promissor na supervisão de sistemas de IA. Para alinhar modelos cada vez mais complexos, a OpenAI informa que a pesquisa continuará focada em expandir as capacidades do CriticGPT, permitindo que ela lide com tarefas mais longas e complexas. Além disso, a integração contínua do CriticGPT no pipeline do RLHF poderá melhorar a qualidade dos dados de feedback, acelerando o desenvolvimento de modelos mais precisos e alinhados.

O CriticGPT exemplifica o potencial de utilizar modelos de IA para aprimorar a supervisão e avaliação de outros modelos, atuando como uma ferramenta crítica para treinar sistemas de IA mais robustos e precisos. É possível dizer que no futuro, espera-se que essa abordagem seja escalada para outras áreas, ampliando sua aplicação e impacto no desenvolvimento de IA alinhada com múltiplas áreas do conhecimento e uso cruzado.

Picture of Por Sergio Gaiotto
Por Sergio Gaiotto

Gaiotto, pai, professor e mentor voluntário.

Atualmente como Chief Data & AI Officer na Claro, a frente de soluções de Dados e IA em TI.

Professor no MBA da FIA Labdata, leciona IA aplicada ao negócio e Transformação Digital a partir da IA.

Mentor voluntário na ONG Jovem com Futuro.

Com 31 anos de mercado, sendo 19 anos gerando valor com Inteligência de Dados e disseminação da Cultura Data-Driven.

Ver MAIS publicações
Picture of Por Sergio Gaiotto
Por Sergio Gaiotto

Gaiotto, pai, professor e mentor voluntário.

Atualmente como Chief Data & AI Officer na Claro, a frente de soluções de Dados e IA em TI.

Professor no MBA da FIA Labdata, leciona IA aplicada ao negócio e Transformação Digital a partir da IA.

Mentor voluntário na ONG Jovem com Futuro.

Com 31 anos de mercado, sendo 19 anos gerando valor com Inteligência de Dados e disseminação da Cultura Data-Driven.

Importante: os comentários e opiniões contidos neste texto são responsabilidade do autor e não necessariamente refletem a opinião da AINEWS ou de seus controladores.

Compartilhe nas redes:

Assine agora a newsletter gratuita e participe da comunidade que está liderando a transformação digital no Brasil e no mundo:

Publicidade

 Inscreva-se na NEWSLETTER

Esteja sempre um passo à frente. Assine agora a newsletter gratuita.

 Inscreva-se em nosso LinkedIn

🔥 Últimas notícias 🇧🇷