Si no estás suscripto: Regístrate

–El tema del almacenamiento viene dando mucho que hablar, por un lado el problema de acceso a la información, por otro la protección en el tiempo de los mismo, y por último el volumen, por lo menos a mi los números que dan me resultan asombrosos–

 

04 de junio 2012

Es hora de poner el apretón de datos genómicos

Michael Feldman


A medida que el precio de la secuenciación del genoma se desploma, la salida de datos de genómica se está disparando. De acuerdo con los EE.UU. National Human Genome Research Institute, en los próximos años, el número de genomas secuenciados humanos se espera que exploten – de alrededor de 30.000 en 2011 a más de un millón antes de 2014. Olvídese por un momento, la potencia de procesamiento necesaria para transformar el genoma de cada uno en el conocimiento médico útil, sólo la capacidad de almacenamiento necesaria para guardar todos estos datos es asombrosa.

Como se señala en un reciente post en Technology Review (TR), si cada persona en el planeta tuviese su genoma secuenciado, quien se ocupará de almacenamiento digital hasta que estuviera disponible en todo el mundo en 2010,  se estima en un poco más se 721 PB.. Eso suponiendo 100 GB por genoma humano.

Pero eso de 100 GB representa una bonita fuerza bruta para el modelo de almacenamiento. En teoría, una persona 3.2 mil millones de pares de bases sólo debe tener 800 MB (cada una de las cuatro bases pueden ser empacados en 2 bits). El problema, según lo expuesto por TR, es que una gran cantidad de otros datos se recogen sobre las bases, y los genes se secuenciaron varias veces en aras de la precisión.

Una solución, al menos según Harvard genetista George Church, es almacenar sólo las diferencias entre un genoma particular y algunos genoma de referencia. De acuerdo con la Iglesia que reduciría la capacidad de los datos necesarios para tan sólo 4 MB por persona. Con este enfoque, se necesitarían sólo 28 PB de almacenamiento para guardar todos los genomas humanos.

Y si eso parece mucho, tenga en cuenta que la supercomputadora Blue Waters tendrá una capacidad de almacenamiento de más de 25 PB estando en línea a finales de este año. A mediados de esta década, cuando las supercomputadoras petaescala tienden a ser mucho más común, que el  28 PB probablemente va a reflejar una capacidad de almacenamiento de tamaño medio de cientos de sistemas en todo el mundo.

Artículo completo en Technology Review

Fuente:  HPCWire

 

 

 

Deja un comentario

Powered by WP Symposium - Social Networking for WordPress v12.03.10