CriticGPT: nova ferramenta da OpenAI corrige erros do ChatGPT
A OpenAI apresentou sua mais nova ferramenta de inteligência artificial, o CriticGPT. Ela foi desenvolvida exclusivamente para identificar erros no código das respostas geradas pelo ChatGPT.
Os modelos avançados da empresa, como o GPT-4o, por exemplo, aprendem por um sistema conhecido como RLHF (aprendizado de reforço a partir do feedback humano, na sigla em inglês). Na prática, isso significa que o chatbot melhora seu desempenho efetivamente de acordo com o feedback fornecido pelos treinadores de IA humanos após as interações.
Conforme o feedback dos usuários vai tornando a ferramenta mais “inteligente”, os erros se tornam cada vez mais difíceis de identificar. O que requer uma ferramenta especializada em flagrar essas pequenas sutilezas e garantir que o modelo de IA siga aprendendo e evoluindo.
CriticGPT oferece avaliação de conteúdo gerado
O CriticGPT, além de pegar erros em respostas de modelos de IA, também oferece uma avaliação do conteúdo gerado. E, com isso, pode garantir a evolução contínua da ferramenta. “Este é um passo para poder avaliar respostas de sistemas avançados de IA que podem ser difíceis para as pessoas classificarem sem ferramentas melhores”, afirmou a OpenAI em comunicado.
IA tem 70% de chance de destruir a humanidade, diz ex-OpenAI
Voice Engine: novo modelo da OpenAI consegue clonar vozes humanas
A empresa alerta que seu novo sistema de IA não oferece 100% das respostas corretas. Mas aumenta consideravelmente a possibilidade de identificação de erros em modelos de inteligência artificial. Assim como acontece com o ChatGPT, a nova ferramenta também vai se aperfeiçoando conforme vai sendo utilizada por humanos.
A OpenAI sustenta que o sistema automatizado é fundamental no cenário atual, onde os modelos estão cada vez mais sofisticados e os erros cada vez mais difíceis de identificar. Atualmente, o sistema RLHF não é suficiente para encontrar erros nas saídas de chatbots conversacionais.
Para o futuro, a companhia planeja integrar o CriticGPT ao sistema RLHF para auxiliar os humanos a fornecerem feedbacks melhores ao GPT-4.