Investigadores han desarrollado TranscriptFormer, un atlas celular generativo que integra datos de expresión génica de una amplia gama de organismos, cubriendo 1.500 millones de años de evolución. Este modelo permite la comparación de tipos celulares a través de especies distantes, identificando similitudes y divergencias en su programa genético. La capacidad de TranscriptFormer para mapear la evolución celular a esta escala sin precedentes abre nuevas vías para comprender los principios fundamentales que rigen la diversidad y función celular.
El estudio aborda el desafío de comparar tipos celulares homólogos en organismos con genomas muy distintos, una tarea tradicionalmente compleja debido a la divergencia de secuencias. TranscriptFormer supera esto al centrarse en patrones de expresión génica, permitiendo la identificación de tipos celulares conservados y la reconstrucción de trayectorias evolutivas. Esto es crucial para comprender cómo la complejidad biológica ha surgido a lo largo del tiempo, desde organismos unicelulares hasta multicelulares complejos.
La metodología se basa en un modelo generativo que aprende las características comunes de la expresión génica celular, independientemente de la especie. Al entrenar el modelo con una vasta colección de datos de transcriptómica de células individuales de diversas especies, TranscriptFormer puede inferir relaciones entre tipos celulares que no son evidentes mediante análisis de secuencias directos. Este enfoque computacional representa un avance significativo en la biología comparada y la evo-devo (biología evolutiva del desarrollo).
Los resultados de este atlas generativo no solo proporcionan una visión detallada de la conservación y evolución de los tipos celulares, sino que también ofrecen una herramienta predictiva para identificar nuevos tipos celulares o inferir sus propiedades en especies poco estudiadas. Las implicaciones van desde una mejor comprensión de las enfermedades humanas, al identificar homólogos celulares en modelos animales, hasta la ingeniería de tejidos y la biotecnología, al desentrañar los programas genéticos que definen la identidad celular.