A computação molecular usa moléculas ou átomos para resolver problemas de alta complexidade em muito menos tempo. As pesquisas ainda estão em estágio inicial, mas o potencial é grande
Tiago Cordeiro
Migrar do silício para o carbono representa uma revolução para a ciência da computação do século 21. No lugar dos atuais sistemas binários, constituídos pelas combinações de dois dígitos, 0 e 1, é possível utilizar o alfabeto genético, composto pelas letras que representam as bases nitrogenadas que formam o DNA e o RNA: A (de “adenina”), G (“guanina”), C (“citosina”) e T (“timina”). A computação baseada no DNA é uma área da computação molecular que busca realizar operações lógicas e aritméticas usando as propriedades moleculares do DNA.
Considerada possível, em teoria, desde a década de 1950, a técnica se demonstrou viável em 1994, graças ao trabalho do cientista da computação americano Leonard Adleman, que comprovou a eficiência do uso das bases nitrogenadas para solucionar, de forma muito mais rápida, problemas extremamente complexos. Desde então, vem sendo colocada em prática rapidamente. “O uso de quatro elementos aumenta a capacidade de representação e processamento de informação e permite formar máquinas moleculares com DNA ou, introduzindo a base U (‘uracila’), circuitos gênicos usando RNA”, explica o professor Luciano Silva, que vai lecionar a disciplina Teoria da Computação e Linguagens Formais no novo curso de Ciência da Computação do Insper.
“A capacidade de controlar as moléculas no nível dos genes nos permite explorar novos controles bioquímico-computacionais para controle do câncer, que se manifesta quando as células sofrem mutação e se reproduzem o tempo todo, sem instruções de quando parar”, diz o professor. Com o circuito gênico, torna-se possível, utilizando a engenharia da computação, “ligar” e “desligar” genes, controlando a doença.
Ou seja: as técnicas e os algoritmos de computação molecular ajudam biólogos a projetarem as próximas gerações de terapias moleculares programáveis para combate ao câncer. “A medicina e a bioquímica estão começando a perceber o potencial dessa parceria com a Engenharia e a Ciência da Computação”, diz Silva.
Paulo de Paiva Amaral, professor do Insper, onde pesquisa a intersecção de biologia molecular com bioengenharia e o desenvolvimento de técnicas e ferramentas analíticas para o estudo de biomoléculas, explica que a computação molecular usa moléculas (ou átomos) para resolver problemas computacionais, com uma ampla gama de potenciais aplicações e novas funcionalidades, seja de forma inteiramente sintética, seja com o uso de células vivas, como as bactérias, que podem ser rotineiramente cultivadas e manipuladas geneticamente.
Entre os diferentes tipos de molécula, o DNA é a mais conhecida, em parte por ser o meio físico que todas as células e organismos utilizam para codificar e transmitir informações para as próximas gerações. “A natureza encontrou a forma de manifestar essa informação nas células com o uso do código genético e com mecanismos regulatórios para ligar e desligar genes de forma controlada”, diz Amaral.
Na computação molecular, ou biocomputação, essas propriedades podem ser exploradas de diferentes formas. “A mais conhecida é o uso do DNA para codificar e compactar informações em sua sequência de nucleotídeos, que expande consideravelmente a computação tradicional, já que permite a conversão de códigos binários em códigos de DNA e uma quantidade enorme de combinações com as unidades básicas.”
Amaral lembra que, como material, o DNA é extremamente duradouro, já que pode resistir por centenas de milhares de anos em condições de resfriamento e baixa umidade. Também representa uma forma ultracompacta de armazenamento de dados digitais — afinal, apenas um grama de DNA pode armazenar milhões de gigabytes. Pode ainda ter sequências extremamente longas.
“O DNA pode ser sintetizado artificialmente de forma customizada e é facilmente copiado in vitro ou usando células de microrganismos. Da mesma forma, o DNA pode ser ‘lido’ para a recuperação de informações usando técnicas modernas de sequenciamento genético, a cada dia mais precisas e poderosas”, diz Amaral. É possível, por exemplo, armazenar 10 filmes longas-metragens em um volume de DNA equivalente a um grão de sal.
Inovações continuam a surgir, como o armazenamento de informação em bactérias vivas e o uso de técnicas recentes de edição genética programada que podem converter sinais de input, como pulsos elétricos ou a presença de açúcares, em bits de informação em seu DNA, que depois são decodificados. Esses sistemas de manifestação “on” e “off” têm uma série de aplicações biotecnológicas, como o uso de biossensores para detecção de patógenos e contaminantes no ambiente. Também oferecem aplicações computacionais mais eficientes em termos energéticos e que podem ser usados em circuitos e de forma sequencial.
“As explorações mais recentes incluem o uso de ferramentas moleculares de edição genética programada, como o método de Crispr [do inglês clustered regularly interspaced short palindromic repeats, ou “repetições palindrômicas curtas agrupadas e regularmente interespaçadas], que levou as pesquisadoras Emmanuelle Charpentier e Jennifer Doudna ao Prêmio Nobel de Química no ano passado”, explica Amaral. “Há também o emprego da capacidade de se desenhar biomoléculas que se dobram em estruturas 3D modulares e capazes de armazenar informação e de responder a uma gama de estímulos.”
O potencial da biocomputação tem gerado interesse crescente de startups e grandes empresas, que buscam quebrar as barreiras técnicas envolvidas no uso de ferramentas biológicas para armazenamento de dados, processamento paralelo e produção de softwares e hardwares biomoleculares. E também tem um enorme impacto na medicina.
Ainda que os estudos estejam em estágio inicial, alguns apresentam resultados promissores. Foi o caso de um trabalho desenvolvido em 2004 no Instituto Weizmann de Ciência, de Israel, onde pesquisadores criaram um computador biomolecular microscópico — um trilhão deles, somados, ocupam o mesmo espaço de apenas uma gota d’água.
Desenvolvido inteiramente de material orgânico, esse computador poderia ser programado para circular pelo organismo, coletando informações, propondo diagnósticos e até mesmo combatendo tumores em estágio inicial, desenvolvendo tratamentos específicos para cada necessidade. Por enquanto, os testes não ultrapassaram o estágio laboratorial.
“A primeira dificuldade é como alterar as sequências em organismos complexos”, explica o professor Luciano Silva. “Já sabemos que alguns organismos vivos, como vírus e bactérias, têm determinados elementos que funcionam como circuitos. Conseguimos manipular os adenovírus, em particular, para produzir vacinas, que, afinal, são terapias em nível molecular.” Assim se explica a agilidade com que as vacinas contra a covid-19 foram desenvolvidas.
Também já são viáveis tratamentos gênicos para imunodeficiências primárias, realizados com base na extração de células do sangue, que são alteradas geneticamente e reinseridas nos pacientes. Mas, para câncer, as terapias ainda estão no estágio de simulações in vitro.
É um longo caminho, que será trilhado com apoio dos profissionais de computação. Este é um mercado promissor para quem atua na área, aponta Silva. “O mercado vai precisar de especialistas capazes de caracterizar novos genomas e transcriptomas e ajudar na simulação de processos biomoleculares”, afirma. (Tanscriptoma é uma coleção dos RNAs mensageiros presentes em uma célula.)
Segundo o professor, um cientista da computação alinhado com tecnologias de ponta precisa estudar biologia molecular, bioquímica e imunologia. “Esses campos oferecem não só novas forma para fazer computação, como trazem problemas muito interessantes”, diz. “A visão de inovação do Insper permite preparar profissionais de computação com conhecimentos gerais amplos o suficiente para lidar com este tipo de demanda específica”, afirma.