21 de febrero de 2017

Bioinformática, a lo grande

Fuente: Remedios Valseca / Fundación Descubre

Grupo de investigación responsable del estudio de la Universidad de Málaga

El departamento de arquitectura de computadores de la Universidad de Málaga, en colaboración con la empresa austríaca RISC Software GmbH, ha desarrollado un nuevo procedimiento para el tratamiento de grandes volúmenes de datos. Este entorno virtual se ajusta a las necesidades de cada proyecto de investigación, ya que sólo se utilizan los recursos necesarios de una manera personalizada y mejora el rendimiento de los actuales equipos utilizados por los científicos.

El artículo publicado en la revista Future Generation Computer Systems titulado ‘Building an open source cloud environment with auto-scaling resources for executing bioinformatics and biomedical workflows’ detalla las herramientas que han desarrollado.

Entre otras aplicaciones, el sistema permite comparar genomas de distintas especies en las que intervienen millones de secuencias genéticas y desarrollar estudios sobre enfermedades teniendo en cuenta todas las relaciones que se dan en la expresión de distintos genes, reduciendo el tiempo de trabajo hasta en siete veces. Dentro de las investigaciones, los expertos han podido comparar el cromosoma X de distintas especies de mamíferos en tan sólo dos horas y media.

El sistema desarrollado permite el acceso a los componentes virtualizados para construir una plataforma propia, según las necesidades del proyecto

“En el campo de la biomedicina es necesario el estudio de asociaciones entre datos genotípicos y fenotípicos. Existen casos de enfermedades mendelianas, como la hemofilia, donde hay una relación directa entre variaciones genéticas simples y la enfermedad. Sin embargo, otras enfermedades más complejas, como la diabetes, requieren observar la relación entre múltiples variaciones genéticas y el fenotipo. En estos estudios, el sistema presentado es capaz de proveer todo su potencial”, indica a la Fundación Descubre el investigador de la Universidad de Málaga Oswaldo Trelles, autor del artículo.

El modelo consiste en la unificación de distintas tecnologías ya existentes para su aplicación en el campo de la biomedicina y la genética. Están basadas en el modelo conocido como Big-Data, sistemas para el procesado de una gran cantidad de datos y con multitud de relaciones entre ellos. Las dificultades más habituales vinculadas a la gestión de información de gran tamaño son los altos costes del material informático que se necesita para la transmisión de datos, el almacenamiento y su procesamiento. La complejidad del análisis y la visualización de los enlaces que se establecen suponen otros problemas a los que deben enfrentarse los científicos.

A través del nuevo método computacional, los investigadores no necesitan invertir en grandes instalaciones ni requieren personal específico para el mantenimiento informático. Podrán configurar el sistema según las especificaciones de cada proyecto, campo científico y requisitos propios de cada laboratorio con un coste sensiblemente inferior que si adquieren los equipos.

Relaciones y comparación en el genoma

Las relaciones complejas de la genética son muy difíciles de definir. Sin embargo, el sistema es capaz de mostrar de una manera directa y rápida todas las conexiones entre sí. Así, se podrán crear los esquemas genéticos de multitud de enfermedades.

En el caso de las alergias, por ejemplo, intervienen distintos genes que se expresan de una manera distinta y provocan además, la expresión en cadena de otros que potencian una respuesta concreta en el organismo. En este tipo de enfermedades, en las que interviene más de un gen, el sistema es capaz de realizar análisis epistáticos. Es decir, observar la interacción entre diferentes genes al expresar un carácter fenotípico. También puede analizar cómo la actuación de un gen se ve modificada por la acción de uno o varios genes en un proceso concreto.

El proyecto, además, permite la creación de árboles filogenéticos. Estos esquemas muestran las relaciones evolutivas entre varias especies con una ascendencia común, como podría ser el caso de primates y humanos. En algunos casos, se observan huecos evolutivos, lo que plantea la probabilidad de la existencia de secuencias genéticas desaparecidas o que han evolucionado hasta perderles el rastro.

Por tanto, la genómica, área que se encarga de la secuenciación del genoma, se ve favorecida por el nuevo sistema, ya que requiere de una gran cantidad de memoria necesaria en el hardware y un tiempo amplio de procesado que ralentiza los trabajos. En ocasiones, es necesario estudiar largas cadenas genéticas, pero las limitaciones actuales no permiten tampoco la comparación de grandes secuencias.

Con la nueva tecnología se puede tener información sobre los puntos de interrupción, que indican una secuencia desconocida y que necesita ser incluida. Además, también es posible obtener la estimación de frecuencias, es decir, cuándo se repiten las cadenas de genes, sin que exista, en principio, ninguna limitación en su extensión.

El ADN del Big Data

El sistema se basa en el Cloud computing (nube), una infraestructura compartida por múltiples usuarios y que permite la elasticidad y adaptación a cada uno en concreto. La nube incluye multiprocesadores lo suficientemente potentes como para trabajar con grandes volúmenes de datos en poco tiempo, como los que se requieren en biomedicina o genómica.

De esta manera, los investigadores obtienen acceso a los componentes virtualizados para construir con ellos su propia plataforma, según sus necesidades. Así, pueden utilizar soluciones informáticas económicas y fáciles de ampliar, ya que toda la complejidad y el coste asociado a la administración del hardware es responsabilidad del proveedor del servicio. Si la escala o el volumen de actividad de la investigación crece o decrece, el producto se adapta.

Los resultados que muestra el estudio se enmarcan dentro del programa europeo Marie Curie que lidera la Universidad de Málaga.

Referencias:

Óscar Torreno, Michael Krieger, Oswaldo Trelles, Dieter Kranzlmüller: ‘Building an open source cloud environment with auto-scaling resources for executing bioinformatics and biomedical workflows’, Future Generation Computer Systems.

Imágenes:

Grupo de investigación responsable del estudio de la Universidad de Málaga

https://www.flickr.com/photos/fundaciondescubre/33029377335/in/dateposted-public/

El sistema desarrollado permite el acceso a los componentes virtualizados para construir una plataforma propia, según las necesidades del proyecto

https://www.flickr.com/photos/fundaciondescubre/32987702966/in/dateposted-public/

Más información:

FUNDACIÓN DESCUBRE

Departamento de Comunicación

Teléfono: 954239422

e-mail: comunicacion@fundaciondescubre.es

Últimas publicaciones

Ver todas

Cookie	Duración	Descripción
__cfduid	1 mes	La cookie es utilizada por servicios cdn como CloudFlare para identificar clientes individuales detrás de una dirección IP compartida y aplicar configuraciones de seguridad por cliente. No corresponde a ningún ID de usuario en la aplicación web y no almacena ninguna información de identificación personal.
CONSENT	16 años 7 meses	La cookie se establece mediante el consentimiento de cookies de GDPR para registrar el consentimiento del usuario para las cookies.
cookielawinfo-checbox-analytics	11 meses	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. La cookie se utiliza para almacenar el consentimiento del usuario para las cookies en la categoría "Análisis".
cookielawinfo-checkbox-advertisement	1 año	La cookie se establece mediante el consentimiento de cookies de GDPR para registrar el consentimiento del usuario para las cookies en la categoría "Publicidad".
cookielawinfo-checkbox-necessary	11 meses	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. Las cookies se utilizan para almacenar el consentimiento del usuario para las cookies en la categoría "Necesarias".
PHPSESSID	sessión	Esta cookie es nativa de las aplicaciones PHP. La cookie se utiliza para almacenar e identificar la identificación de sesión única de un usuario con el fin de administrar la sesión del usuario en el sitio web. La cookie es una cookie de sesión y se elimina cuando se cierran todas las ventanas del navegador.
viewed_cookie_policy	11 meses	La cookie está configurada por el complemento de consentimiento de cookies de GDPR y se utiliza para almacenar si el usuario ha dado su consentimiento o no para el uso de cookies. No almacena ningún dato personal.

Cookie	Duración	Descripción
__stid	1 año	ShareThis establece la cookie. La cookie se utiliza para el análisis del sitio para determinar las páginas visitadas, la cantidad de tiempo dedicado, etc.
__stidv	1 año	ShareThis utiliza esta cookie. Esta cookie se utiliza para compartir el contenido del sitio web en las redes sociales.
_ga	2 años	Esta cookie es instalada por Google Analytics. La cookie se utiliza para calcular los datos de visitantes, sesiones y campañas y realizar un seguimiento del uso del sitio para el informe de análisis del sitio. Las cookies almacenan información de forma anónima y asignan un número generado aleatoriamente para identificar visitantes únicos.
_gat	1 minuto	Google Universal Analytics instala estas cookies para acelerar la tasa de solicitud y limitar la recopilación de datos en sitios de alto tráfico.
_gid	1 día	Esta cookie es instalada por Google Analytics. La cookie se utiliza para almacenar información sobre cómo los visitantes usan un sitio web y ayuda a crear un informe analítico de cómo está funcionando el sitio web. Los datos recopilados, incluido el número de visitantes, la fuente de donde provienen y las páginas visitadas de forma anónima.
fpestid	1 año	ShareThis utiliza esta cookie. Esta cookie se utiliza para compartir el contenido del sitio web en las redes sociales.
IDE	1 año 24 días	Utilizado por Google DoubleClick y almacena información sobre cómo el usuario utiliza el sitio web y cualquier otro anuncio antes de visitar el sitio web. Se utiliza para presentar a los usuarios anuncios que son relevantes para ellos de acuerdo con el perfil del usuario.
ms-uid	1 año	Esta cookie es instalada por Google Analytics. La cookie se utiliza para almacenar información sobre cómo los visitantes usan un sitio web y ayuda a crear un informe analítico de cómo está funcionando el sitio web. Los datos recopilados, incluido el número de visitantes, la fuente de donde provienen y las páginas visitadas de forma anónima.
st_samesite	sessión	ShareThis utiliza esta cookie. Esta cookie se utiliza para compartir el contenido del sitio web en las redes sociales.
test_cookie	15 minutos	Esta cookie la establece doubleclick.net. El propósito de la cookie es determinar si el navegador del usuario admite cookies.
VISITOR_INFO1_LIVE	5 meses 27 días	Youtube establece esta cookie. Se utiliza para rastrear la información de los videos de YouTube incrustados en un sitio web.
YSC	sessión	Estas cookies son establecidas por Youtube y se utilizan para rastrear las vistas de videos incrustados.

Bioinformática, a lo grande

Últimas publicaciones

Antenas de bajo coste para analizar el clima local

La proteína SOS1 se perfila como uno de los objetivos más prometedores en la lucha contra el cáncer

La Fundación

Equipo

Webs temáticas

Exploria Ciencia

Participa

Agenda

Bioinformática, a lo grande

Últimas publicaciones

Antenas de bajo coste para analizar el clima local

La proteína SOS1 se perfila como uno de los objetivos más prometedores en la lucha contra el cáncer

Suscríbete a nuestra newsletter

La Fundación

Equipo

Webs temáticas

Exploria Ciencia

Participa

Agenda