Vistas de página en total

miércoles, 14 de marzo de 2018

El amplio instituto de Harvard-MIT impulsa la investigación genómica en la nube

El amplio instituto de Harvard-MIT impulsa la investigación genómica en la nube

https://blogs.wsj.com/cio/2018/03/12/harvard-mits-broad-institute-powers-genomic-research-in-the-cloud/

'Necesita construir una infraestructura de escalamiento vertical, y no tiene sentido hacerlo usted mismo', dice CIO

Bill Mayo, CIO de Broad Institute, se esfuerza por reducir el costo de la computación en la nube a $ 3 por genoma.
Bill Mayo, CIO de Broad Institute, se esfuerza por reducir el costo de la computación en la nube a $ 3 por genoma. FOTO: BILL MAYO
El Broad Institute of MIT y Harvard continúa cambiando su investigación genómica a la nube, donde el CIO William Mayo dice que una infraestructura informática más escalable y accesible sirve mejor a los investigadores y estimula los avances en el campo.
Broad comenzó a construir capacidades informáticas de alto rendimiento en la nube hace unos cuatro años, después de darse cuenta de que los sistemas informáticos tradicionales en las instalaciones no podrían mantenerse al día con las demandas de investigación.
La secuenciación del genoma, la edición de genes y otros avances están generando una explosión de ideas sobre las raíces de la enfermedad. La computación en nube permite el procesamiento de datos a gran escala y facilita a los investigadores el intercambio de datos de forma segura.
Broad tiene como objetivo utilizar la genómica para avanzar en la comprensión y el tratamiento de las enfermedades humanas y sentar las bases para nuevas terapias. Abarca más de 100 instituciones privadas y públicas en todo el mundo. Ha trabajado para analizar los genomas del cáncer y sirve como centro para el análisis genético de enfermedades comunes como la diabetes tipo 2 y la enfermedad cardíaca.
Un esfuerzo en la nube es Genomic Analysis ToolKit, un paquete de software de código abierto utilizado por unas 55,000 personas que se utiliza para ayudar a buscar variantes genómicas y realizar análisis genómicos. La cuarta versión, lanzada este año, utiliza aprendizaje automático y redes neuronales para mejorar la precisión y funciona en múltiples nubes.
Para analizar adecuadamente las cantidades masivas de datos genómicos, "necesita construir una infraestructura de escalamiento horizontal, y no tiene sentido hacerlo usted mismo", dijo el Sr. Mayo en una entrevista telefónica. "Y necesita asociarse con otros porque no vas a tener todos los datos que necesitas a tu alcance ".
Las alianzas han sido importantes a medida que crecen las iniciativas de investigación, dijo. Broad trabaja con compañías que incluyen Google, Intel Corp., Microsoft Corp. de Alphabet Inc., Amazon Web Services de Amazon.com Inc., AliCloud de Alibaba Group Holding Ltd., International Business Machines Corp. y Cloudera Inc. en proyectos de infraestructura, algoritmos y datos.
Broad usa Google Cloud Platform en gran medida para computación y almacenamiento, pero no exclusivamente. "El objetivo es una nube múltiple porque sabemos que no todos estarán de acuerdo en una sola plataforma", dijo Mayo.
En el campo de la investigación, Broad maneja aproximadamente 70 petabytes de datos científicos, incluida información genómica. Aproximadamente la mitad de esos datos se encuentra en la nube pública, mientras que la otra mitad está en las instalaciones. Tiene aproximadamente 100 millones de horas de computación en la nube, aproximadamente la mitad de su huella de cálculo. El Sr. Mayo espera que las necesidades locales continúen, pero no serán la mayor parte del trabajo.
Antes de pasar a la nube, los investigadores construirían in situ "islas" informáticas de alto rendimiento que podrían agregar costos, duplicar datos innecesariamente o introducir posibles diferencias técnicas en función de cómo se ensambló cada entorno informático, dijo Mayo.
La computación en la nube permite a los investigadores compartir datos de una manera más rentable que beneficie el progreso científico, dijo Mayo. También libera al equipo de TI de la construcción de infraestructura informática de alto rendimiento, por lo que puede apoyar a los científicos mediante la migración de flujos de trabajo antiguos, proporcionando capacitación sobre la nube pública y herramientas para controlar el gasto.
Broad ha reducido el costo de procesamiento en la nube desde aproximadamente $ 45 por genoma cuando el movimiento en la nube comenzó a $ 5 ahora, y tiene un objetivo de $ 3 basado en algún trabajo actualmente en progreso, dijo Mayo.
La seguridad también ha sido una prioridad para el equipo del Sr. Mayo. Broad ha trabajado en estrecha colaboración con los Institutos Nacionales de Salud y una serie de socios tecnológicos para desarrollar herramientas de seguridad que pueden ayudar a los investigadores a trabajar con datos mientras se mantiene la privacidad de los sujetos.
A medida que continúa el cambio a la nube, el equipo del Sr. Mayo está haciendo modificaciones en las aplicaciones y ayuda a capacitar a los investigadores sobre las nuevas tecnologías. Por ejemplo, Broad tiene un investigador que trabaja con ADN antiguo. Algunos de los flujos de trabajo son diferentes a los de la mayoría de los investigadores, y las herramientas deben reescribirse para tener en cuenta los diferentes formatos de almacenamiento en la nube y para usar las máquinas virtuales de manera eficiente.
El Sr. Mayo dijo que no tiene un recuento de cuántas cargas de trabajo deberán reescribirse para la nube, pero un equipo está trabajando en la migración.
El grupo de TI continúa lidiando con preguntas más amplias en el campo de la investigación, como por ejemplo cómo eliminar los datos correctamente después de un estudio para garantizar que se usen solo para el propósito previsto.
"La gestión de consentimiento es un área de especial enfoque para Broad", dijo Mayo. El instituto ha desarrollado un paquete de software conocido como DUOS que brinda a los investigadores barandillas para garantizar que respeten las restricciones de uso de datos especificadas en los formularios de consentimiento informado.
Escriba a steven.norton@wsj.com .

No hay comentarios:

Publicar un comentario