Zheng Xia, Ph.D., originalmente fijó sus perspectivas en una carrera de ingeniería.
Su salto a la biología del cáncer llegó después de su experiencia trabajando en un proyecto de aprendizaje automático en Houston Methodist, el centro médico académico de Texas, donde cada día veía a pacientes enfermos y familias preocupadas en los pasillos.
Aunque su formación no tenía nada que ver con la biología o el cáncer, afirma: “Sentí que incursionar en este campo era muy digno de mi esfuerzo”.
Era el año 2007 y Xia había oído hablar de los rápidos avances en las tecnologías de lectura genética, como los micromatices, capaces de medir los niveles de actividad de miles de genes en un solo momento. El flujo de datos de tales experimentos estaba sobrepasando los métodos tradicionales de análisis biológico.
Xia estaba convencido de que su experiencia podría ayudar a los investigadores del cáncer
a identificar respuestas. Estaba en lo cierto.
Ahora, Xia es profesor asociado de ingeniería biomédica en OHSU School of Medicine y miembro del OHSU Knight Cancer Institute. Su laboratorio desarrolla herramientas bioinformáticas, incluidos sistemas de aprendizaje automático, que pueden interpretar conjuntos de datos biomédicos más allá de la escala de comprensión humana directa. Él y sus colaboradores tienen varias publicaciones en revistas de alto impacto como Nature, Nature Biotechnology y Clinical Cancer Research. Es investigador principal en tres y coinvestigador en nueve subvenciones principales a nivel R01 de los Institutos Nacionales de Salud y otras fuentes de financiación externa.
Trabajar junto a biólogos y profesionales clínicos ha sido clave.
“Para mí es muy importante que me señalen las preguntas biológicas o clínicas significativas, pero como mi experiencia es en ingeniería, no conozco las preguntas clínicamente importantes”, indica Xia. “A través de colaboraciones, aprendo a pensar sobre los problemas, y sobre cómo los biólogos generan hipótesis. Y, mientras respondemos a las preguntas que interesan a nuestros colaboradores, esas preguntas nos motivan a pensar en nuevas herramientas para analizar los datos desde diferentes ángulos”.
Al trabajar con Amy Moran, Ph.D., profesora asociada de biología celular, del desarrollo y del cáncer, Xia ayudó a recopilar más información sobre el análisis de ARN de una sola célula, la molécula genética mensajera transcripta a partir de genes activos. La investigación, dirigida por Moran, reveló cómo la hormona sexual conocida como andrógeno, más comúnmente testosterona en los hombres, puede limitar la respuesta del cuerpo a la inmunoterapia contra
el cáncer, un hallazgo que puede ayudar a hacer que esas terapias sean más efectivas.
Descifrar los comportamientos de la enfermedad
El proyecto inspiró a Xia y a los miembros de su laboratorio a desarrollar una potente herramienta informática llamada Scissor, que puede enfocarse en las subpoblaciones de células dentro de un tumor que están impulsando comportamientos importantes de las enfermedades, como la capacidad de resistirse a los tratamientos contra el cáncer. El método amplía el alcance del análisis de una sola célula, que se ha visto limitado por tamaños de muestra pequeños, dando como resultado una potencia estadística inadecuada para responder algunas preguntas vitales sobre los tumores.
Scissor conecta los hallazgos de una sola célula con los datos de resultados clínicos disponibles a nivel de tumor completo en bancos de datos públicos, como el Cancer Genome Atlas. En una demostración de la utilidad de Scissor, los investigadores identificaron una subpoblación de células cancerígenas agresivas en tumores de adenocarcinoma de pulmón, el tipo más común de cáncer de pulmón, que se asoció a peores resultados de supervivencia. Tenían datos de una sola célula de solo dos pacientes con cáncer, pero datos de resultados clínicos de 471 muestras de pacientes en el Cancer Genome Atlas. La capacidad de identificar qué subpoblaciones de células son responsables de la respuesta a los medicamentos, la evolución del tumor y la propagación del cáncer podría ayudar a revelar los mecanismos y señalar el camino para crear terapias mejor dirigidas.
Más recientemente, Xia y sus colegas desarrollaron PENCIL, un modelo pionero de aprendizaje automático que puede usar datos de actividad génica de una sola célula no solo para seleccionar subpoblaciones importantes de células cancerosas, sino también para revelar subpoblaciones de células que están haciendo una transición continua entre condiciones, tales como las células que se están transformando de normales a malignas.
PENCIL utiliza una estrategia llamada “aprendizaje con rechazo”. En el aprendizaje automático supervisado tradicional, el modelo informático debe elegir una etiqueta para predecir una nueva muestra de las etiquetas que se proporcionaron para el aprendizaje del modelo. El aprendizaje con rechazo da a los sistemas de aprendizaje automático la capacidad y la libertad de rechazar decisiones de baja confianza al permitirles decir “No sé”.
“Es una idea muy nueva”, afirma Xia. “Creo que somos los primeros en aplicar el aprendizaje con rechazo a la investigación biomédica”.
Al rechazar células cancerosas irrelevantes y centrarse en las relevantes, PENCIL puede reconocer señales genéticas no advertidas por modelos estándar y ofrecer predicciones más precisas. La estrategia, dice Xia, “se alinea con lo que Confucio dijo una vez: Es de sabios decir que no conocemos la respuesta a una pregunta sobre la que no estamos seguros, y solo responder a preguntas sobre las que tenemos mucha confianza.
“Cada uno puede hacer predicciones con el aprendizaje automático pero, en medicina, se trata más de predicciones de alta confianza ya que nuestra predicción puede afectar las decisiones
de tratamiento para nuestros pacientes”, continúa. “Si predecimos que este paciente responde a un medicamento específico, debe ser una predicción de alta confianza”.
oncoGPT
Ahora Xia está trabajando en un proyecto al que se le da el apodo oncoGPT, en referencia a la famosa herramienta de inteligencia artificial que genera texto ChatGPT. Con base en un gran volumen de textos disponibles al público, ChatGPT produce contenido escrito coherente y gramaticalmente correcto.
oncoGPT de Xia funcionará de manera análoga al utilizar bases de datos disponibles al público con datos de expresión genética de muchos millones de células cancerosas que pueden estar asociados con factores como la respuesta inmunitaria, la resistencia al tratamiento y la supervivencia de los pacientes. El proyecto recibió el premio 2024 OHSU Faculty Excellence and Innovation Award patrocinado por Silver Family Innovation Fund.
“Este será un modelo de base para facilitar nuestro propio análisis de datos clínicos, que puede tener un tamaño de muestra limitado”, indica.
Por ejemplo, el modelo podría usarse para ayudar a predecir el medicamento terapéutico o la combinación de medicamentos más eficaz para pacientes incluidos en el programa SMMART del Knight Cancer Institute, en el que los investigadores han organizado múltiples tecnologías para analizar el tumor de cada persona con gran detalle y hacer un seguimiento de cómo las células cancerosas evolucionan con el tiempo en respuesta al tratamiento.
Dado el ritmo sorprendente de los avances en materia de inteligencia artificial, Xia se siente entusiasmado por las oportunidades y ansioso por mantenerse informado. Pero, dice, “siento que nunca ha sido un mejor momento para hacer análisis de grandes datos y aprendizaje automático para la investigación traslacional del cáncer, el ADN del Knight Cancer Institute”.