Do BioGPT ao Longevity Escape Velocity: Como a IA e os modelos generativos estão transformando a pesquisa ciêntífica. 

Imagem do Autor
BioGPT

Os modelos de linguagem natural (LLMs, do inglês Large Language Models) evoluíram tão rapidamente nos últimos dois anos, que suas aplicações já estão muito além de apenas gerar textos ou responder perguntas de um call center. No artigo anterior, sobre os dois anos de ChatGPT, vimos diversos cenários de impacto nesse sentido. Claro que ainda estamos no ritmo das esteiras de projetos em muitas empresas, saindo de provas de conceitos e avaliando o ROI ou cenários mais indicados para a aplicação de IA generativa, ao lado das IAs preditivas já consolidadas como visão computacional, estimativa de resultados, detecção de anomalias, predição, classificação, etc. Nem só de GenAI vive a ciência de dados! 😊 Mas tecnologias como GPT e Deep Learning abriram caminhos para modelos mais especializados, como o BioGPT, Graphormer ou Magentic One, que são projetados para cenários especializados em química, ciência de materiais, sistemas multi-agentes, entre outros, que são temas muitas vezes relacionados às chamadas Deep Techs. É o que veremos no artigo de hoje! 

O que são Deep Techs? 

Para dar um contexto, deep techs são consideradas startups que atuam com cenários de inovações baseadas em avanços científicos profundos e tecnologias de base, muitas vezes relacionadas à engenharia, biologia sintética, inteligência artificial, desafios planetários, mudanças climáticos e física avançada. Diferente de startups tradicionais que se concentram em modelos de negócios ou soluções digitais de alta escala com abrangência global, deep techs focam em resolver problemas estruturais em setores como saúde, energia, engenharias e ciência de materiais, como alguns exemplos. 

E no Brasil existem muitas deep techs! Em estudo recente, a FINEP mapeou 875 startups brasileiras no contexo de deep techs, o que é sensacional! A categoria de biotechs é dominante nesse ecosistema, com impacto para desafios climáticos, biodiversidade, energia limpa e claro, inteligência artificial. Confira o relatório aqui: 

Relatório – Panorama startups deep tech brasileiras – Emerge Brasil 

O que são cenários de IAs avançados?  

Os LLMs aplicados à química e ciência de materiais são exemplos em franca exploração, acelerando a pesquisa científica de maneiras que antes eram impensáveis. Vejamos alguns exemplos: 

Mineração em Biomedicina   

BioGPT é um pre-trained language model para mineração e geração de textos a partir de domínios de pesquisa em biomedicina. Esse projeto é de agosto de 2022, antes do lançamento do ChatGPT 3 como conhecemos e já oferece indicações de caminhos para IA em biomedicina. 

GitHub: https://github.com/microsoft/BioGPT  

Fonte: https://www.microsoft.com/en-us/research/publication/biogpt-generative-pre-trained-transformer-for-biomedical-text-generation-and-mining/  

Modelos como o BioGPT podem analisar vastas quantidades de dados moleculares para prever propriedades químicas, sugerir reações ou identificar compostos promissores para uso em diversas aplicações. Isso é particularmente útil na pesquisa de novos polímeros, semicondutores orgânicos ou ligas metálicas avançadas. 

Descoberta de Medicamentos (Drug Discovery)   

No campo farmacêutico, modelos generativos estão sendo usados para identificar alvos moleculares e prever interações entre proteínas e compostos. Isso reduz drasticamente o tempo e os custos associados à descoberta de novos medicamentos.  

Modelos de IA generativa podem ajudar na descoberta de medicamentos criando novos exemplos de dados com base nos padrões encontrados em seus dados de treinamento. Esses modelos são treinados usando extensos repositórios de compostos químicos, informações biológicas e pesquisas clínicas para prever potenciais candidatos a medicamentos. IA generativa refere-se a um tipo de modelo de IA capaz de gerar novos dados com propriedades semelhantes. 

Uma ferramenta recente é o Generative Chemistry, com modelos pré-treinados que aceleram a identificação de candidatos em projetos de exploração em química.  

Fonte: https://www.microsoft.com/en-us/research/project/generative-chemistry/ 

De fato, o processo de desenvolvimento de novos medicamentos é incrivelmente complexo, exigindo a avaliação de centenas de milhares de compostos candidatos antes que um projeto alcance a fase de ensaios clínicos. Esse processo é lento, caro e demanda uma enorme quantidade de tempo de especialistas. Neste  contexto, o Generative Chemistry busca treinar sistemas de aprendizado de máquina para ajudar químicos e farmacêuticos a encontrar mais rapidamente novos candidatos relevantes para seus projetos, reduzindo o tempo de combinação e seleção de compostos.  

Modelagem Molecular 

Outro importante projeto em deep learning é o Graphormer, um framework de aprendizado de máquina profundo (deep learning) de uso geral para modelagem molecular.  

GitHub: https://github.com/microsoft/Graphormer  

Pesquisas e benchmarks recentes demonstraram que o Graphormer frequentemente supera outros modelos baseados em grafos, como GNNs (Graph Neural Networks), em tarefas de predição molecular e análise de dados de grafos. Isso é possível pois ele combina a capacidade de capturar a complexidade estrutural dos grafos de representação molecular com a eficiência de modelos de IA, tornando o Graphormer uma das ferramentas mais avançadas para modelagem e predição molecular. 

Sistemas Multi-Agentes para Tarefas Complexas 

E finalmente, o futuro é multi-agente. Vemos cada vez mais arquiteturas de referência para sistemas com múltiplas personas ou agentes de IA, coordenando entre si a execução de tarefas complexas. Nesse contexto, vamos citar três projetos para ficarem no radar: 

DISCLAIMER: alguns dos sites a seguir são projetos “as is”, ou seja, iniciativas abertas como frameworks, sistemas experimentais ou plataformas de pesquisa em está estágio avançado, mas que servem para exploração e geração de insights para seus projetos. Não são portanto produtos ou plataformas acabadas. 

JARVIS (Abril/2023) 

O projeto JARVIS da Microsoft é um sistema interessante, que conecta grandes modelos de linguagem (LLMs) com ferramentas e recursos especializados para criar uma plataforma de IA colaborativa. Ele utiliza uma arquitetura baseada em agentes, onde um agente principal coordena outros agentes especializados para realizar tarefas complexas de maneira eficiente. No contexto de LLMs, o JARVIS aproveita a capacidade desses modelos para entender e gerar linguagem natural, enquanto os conecta a APIs, sistemas de aprendizado de máquina (ML), e outras ferramentas externas. Essa integração permite que o sistema execute uma ampla gama de tarefas, como análise de dados, modelagem preditiva e até mesmo automação de fluxos de trabalho técnicos. 

Um diferencial do JARVIS é sua capacidade de planejar, interagir com humanos e corrigir erros automaticamente, tornando-o flexível e útil em cenários diversos. Além disso, ele é projetado para ser modular, o que facilita sua personalização e expansão para atender a diferentes necessidades. Com isso, o JARVIS representa um avanço significativo no uso de LLMs como plataformas gerais de IA. Confira os links a seguir: 

Github: https://github.com/microsoft/JARVIS  

Fonte: https://arxiv.org/pdf/2303.17580.pdf  

AUTOGEN (Setembro/2023) 

Autogen é um projeto também no contexto de simplificação e orquestração em cenários baseados em múlitplos modelos de LLM em um mesmo sistema. Assim, o objetivo é simplificar a criação, orquestração, otimização e automação de fluxos de trabalho baseados em modelos LLMs, através de um framework que permite o uso de agentes personalizáveis e conversacionais, aproveitando as capacidades de modelos como o GPT-4, enquanto mitiga suas limitações por meio ferramentas e interações automatizadas entre agentes via chat. Isso facilita a implementação de fluxos complexos de LLMs, tornando-os mais eficientes e acessíveis. Confira nos links a seguir: 

Github: https://github.com/microsoft/autogen  

Fonte: https://www.microsoft.com/en-us/research/blog/autogen-enabling-next-generation-large-language-model-applications/  

MAGENTIC-ONE (Novembro/2024) 

Esse é o mais recente projeto publicado pela Microsoft, no contexto de sistemas de múltiplos agentes. O objetivo do projeto Magentic-One é desenvolver um sistema multi-agente de alto desempenho, capaz de realizar tarefas complexas utilizando agentes de IA que colaboram entre si. Ele visa criar um sistema geral e modular que integre planejamento, raciocínio multi-etapas, recuperação de erros e execução de ações em cenários variados. A arquitetura do Magentic-One utiliza um “Orquestrador” principal para gerenciar e coordenar agentes especializados, como aqueles que operam navegadores, acessam arquivos ou executam códigos. Além de alcançar desempenho competitivo em benchmarks desafiadores, o sistema é projetado para ser extensível e de fácil desenvolvimento, permitindo a adição ou remoção de agentes sem necessidade de ajustes significativos. Confira: 

Github: https://github.com/microsoft/autogen/tree/main/python/packages/autogen-magentic-one  

Fonte: Magentic-One: A Generalist Multi-Agent System for Solving Complex Tasks – Microsoft Research 

O Impacto das Deep Techs no Uso de IA Generativa 

Então sigo com a provocação, de que deep techs dependem de inovação científica radical, enquanto LLMs são catalisadores naturais desse processo. Empresas que atuam em energia renovável, exploração espacial ou até mesmo em biologia sintética irão cada vez mais integrar experimentos com IAs generativas em seus fluxos de trabalho. Quando falamos que vivemos uma era de IA e de Copilots ou assistentes de IA, faz sentido! Teremos interfaces de Copilots ou assistentes de IA com linguagem natural na frente de sistemas de múltiplos agentes de IA, coordenando atividades complexas de diferentes domínios. E a combinação de aprendizado profundo e ciência básica promete avanços como: 

  • Materiais Sustentáveis: A criação de plásticos biodegradáveis ou novos tipos de materiais de construção que capturam carbono.   
  • Energia Limpa: Modelos LLMs que podem ajudar a otimizar células solares ou desenvolver tecnologias de fusão nuclear mais eficientes.   
  • Saúde Personalizada: Descobertas em genômica e biologia computacional que permitem tratamentos adaptados ao perfil genético de cada indivíduo, só para ilustrar com alguns cenários de futuro. 

Longevity Escape Velocity (LEV) 

O conceito de Longevity Escape Velocity (LEV) foi popularizado por Aubrey de Grey, um cientista biomédico, pesquisador de IA e defensor da extensão radical da vida. Ele introduziu o termo por volta de 2008, com seu livro “Ending Aging” (referência no final do artigo), como parte de sua visão de que avanços médicos podem eventualmente alcançar um ponto em que a ciência prolongue a vida humana mais rapidamente do que o envelhecimento ocorre.  

Esse tema ressurgiu mais forte com os avanços recentes da IA. Olhando os diferentes cenários deste artigo, podemos conectar alguns dos impactos de IA com a cura de doenças ou o adiamento da velhice, através da aceleração de descobertas científicas, da automação de processos de pesquisa, da customização de terapias, ou do avanço científico mais acessível para pesquisadores e startups ao redor do mundo. 

Em uma edição do TED, o pesquisador Ray Kurzweil, fundador da Singularity University, também falou sobre esse tema, ao explorar o futuro das IAs, imperdível: 

Fonte: The Last 6 Decades of AI — and What Comes Next | Ray Kurzweil | TED 

Conclusão 

De fato, os modelos LLMs estão reconfigurando o que é possível em ciência e tecnologia. Do ChatGPT ao BioGPT e além, essas ferramentas estão catalisando inovações em áreas essenciais para o futuro de diferentes setores da sociedade.  

É possível que os modelos LLMs não sejam realmente a base para futuras AGIs ou Inteligências Artificiais Gerais, mas o impacto atual de sua derivação de conhecimento de forma tão eficiente está revolucionando áreas de pesquisa científica. Nos próximos anos, podemos esperar ver IA generativa ocupando um lugar central no avanço de temas em deep techs, redefinindo o modelo como resolvemos problemas complexos e criamos um mundo mais sustentável e tecnologicamente avançado.  

Afinal, Tony Stark não usava teclado! Ele conversava com o JARVIS – Just a Rather Very Intelligent System. 😊 

Por enquanto é só! Até o próximo artigos! 

Alguns livros que recomendo nesse contexto são: 

  • A era da ia: e Nosso Futuro Como Humanos Capa comum – 15 junho 2023, por Eric Schmidt (Autor), Daniel Huttenlocher (Autor), Henry A. Kissinger (Autor), Vanessa (Tradutor) Schreiner (Editor). 
  • A próxima onda: Inteligência artificial, poder e o maior dilema do século XXI – 16 outubro 2023, por Mustafa Suleyman (Autor), Michael Bhaskar (Autor), Alessandra Bonrruquer (Tradutor). 
  • Genesis: Artificial Intelligence, Hope, and the Human Spirit – 19 novembro 2024, por Henry a Kissinger (Autor). 
  • Quantum Chemistry and Computing for the Curious: Illustrated with Python and Qiskit(R) code, by Keeper L Sharkey (Author), Alain Chancé (Author). 
  • Computational Drug Discovery, 2 Volumes: Methods and Applications 1st Edition, by Vasanthanathan Poongavanam (Editor), Vijayan Ramaswamy (Editor) 
  • Ending Aging: The Rejuvenation Breakthroughs That Could Reverse Human Aging in Our Lifetime – October 14, 2008, by Aubrey de Grey (Author), Michael Rae (Author) 
Foto de Por Waldemir Cambiucci
Por Waldemir Cambiucci

Dr. Waldemir Cambiucci é um especialista em TI com mais de 30 anos de experiência, reconhecido por sua atuação em transformação digital, inteligência artificial e computação quântica no Brasil e no exterior. Atuou na Microsoft Brasil por mais de duas décadas, passando por áreas de consultoria, arquitetura, soluções e enterprise. Participou do lançamento de dois centros de tecnologia no país, o Microsoft Technology Center (MTC), onde atuou como arquiteto-chefe e diretor para centenas de projetos de diversas indústrias.

É Engenheiro de Computação, Mestre e Doutor pela Escola Politécnica da Universidade de São Paulo (USP), com certificações do MIT xPRO, IBM Qiskit Dev, INSEAD e DelftX, conduzindo pesquisas com foco em arquitetura de computadores quânticos, computação quântica distribuída e algoritmos. É membro da Sociedade Brasileira de Computação (SBC), da IEEE Quantum Technical Community e da IEEE Computer Society, com dezenas de artigos acadêmicos publicados em congressos e revistas internacionais. Também foi Azure Quantum Ambassador pela Microsoft entre 2022 e 2025, conduzindo iniciativas em quantum computing e post-quantum cryptography.

Colunista da AINEWS, é coautor dos livros “Reference Guide for Quantum Computing – A Microsoft Garage Project” e “Microsoft Azure: Arquitetura Bem Definida”, e autor de “Uma Introdução sobre IA, IOT, CLOUD e QUANTUM”. É palestrante com presença frequente em fóruns de tecnologia, think tanks e eventos de inovação no Brasil e no exterior. https://www.linkedin.com/in/wcamb/.

Ver MAIS publicações
Foto de Por Waldemir Cambiucci
Por Waldemir Cambiucci

Dr. Waldemir Cambiucci é um especialista em TI com mais de 30 anos de experiência, reconhecido por sua atuação em transformação digital, inteligência artificial e computação quântica no Brasil e no exterior. Atuou na Microsoft Brasil por mais de duas décadas, passando por áreas de consultoria, arquitetura, soluções e enterprise. Participou do lançamento de dois centros de tecnologia no país, o Microsoft Technology Center (MTC), onde atuou como arquiteto-chefe e diretor para centenas de projetos de diversas indústrias.

É Engenheiro de Computação, Mestre e Doutor pela Escola Politécnica da Universidade de São Paulo (USP), com certificações do MIT xPRO, IBM Qiskit Dev, INSEAD e DelftX, conduzindo pesquisas com foco em arquitetura de computadores quânticos, computação quântica distribuída e algoritmos. É membro da Sociedade Brasileira de Computação (SBC), da IEEE Quantum Technical Community e da IEEE Computer Society, com dezenas de artigos acadêmicos publicados em congressos e revistas internacionais. Também foi Azure Quantum Ambassador pela Microsoft entre 2022 e 2025, conduzindo iniciativas em quantum computing e post-quantum cryptography.

Colunista da AINEWS, é coautor dos livros “Reference Guide for Quantum Computing – A Microsoft Garage Project” e “Microsoft Azure: Arquitetura Bem Definida”, e autor de “Uma Introdução sobre IA, IOT, CLOUD e QUANTUM”. É palestrante com presença frequente em fóruns de tecnologia, think tanks e eventos de inovação no Brasil e no exterior. https://www.linkedin.com/in/wcamb/.

Importante: os comentários e opiniões contidos neste texto são responsabilidade do autor e não necessariamente refletem a opinião da AINEWS ou de seus controladores.

Compartilhe nas redes:

Assine agora a newsletter gratuita e participe da comunidade que está liderando a transformação digital no Brasil e no mundo:

 Inscreva-se na NEWSLETTER

Esteja sempre um passo à frente. Assine agora a newsletter gratuita.

 Inscreva-se em nosso LinkedIn

🔥 Últimas notícias 🇧🇷