Se estiman 100 GB por genoma humano
–El tema del almacenamiento viene dando mucho que hablar, por un lado el problema de acceso a la información, por otro la protección en el tiempo de los mismo, y por último el volumen, por lo menos a mi los números que dan me resultan asombrosos–
04 de junio 2012
Es hora de poner el apretón de datos genómicos
Michael Feldman
A medida que el precio de la secuenciación del genoma se desploma, la salida de datos de genómica se está disparando. De acuerdo con los EE.UU. National Human Genome Research Institute, en los próximos años, el número de genomas secuenciados humanos se espera que exploten – de alrededor de 30.000 en 2011 a más de un millón antes de 2014. Olvídese por un momento, la potencia de procesamiento necesaria para transformar el genoma de cada uno en el conocimiento médico útil, sólo la capacidad de almacenamiento necesaria para guardar todos estos datos es asombrosa.
Como se señala en un reciente post en Technology Review (TR), si cada persona en el planeta tuviese su genoma secuenciado, quien se ocupará de almacenamiento digital hasta que estuviera disponible en todo el mundo en 2010, se estima en un poco más se 721 PB.. Eso suponiendo 100 GB por genoma humano.
Pero eso de 100 GB representa una bonita fuerza bruta para el modelo de almacenamiento. En teoría, una persona 3.2 mil millones de pares de bases sólo debe tener 800 MB (cada una de las cuatro bases pueden ser empacados en 2 bits). El problema, según lo expuesto por TR, es que una gran cantidad de otros datos se recogen sobre las bases, y los genes se secuenciaron varias veces en aras de la precisión.
Una solución, al menos según Harvard genetista George Church, es almacenar sólo las diferencias entre un genoma particular y algunos genoma de referencia. De acuerdo con la Iglesia que reduciría la capacidad de los datos necesarios para tan sólo 4 MB por persona. Con este enfoque, se necesitarían sólo 28 PB de almacenamiento para guardar todos los genomas humanos.
Y si eso parece mucho, tenga en cuenta que la supercomputadora Blue Waters tendrá una capacidad de almacenamiento de más de 25 PB estando en línea a finales de este año. A mediados de esta década, cuando las supercomputadoras petaescala tienden a ser mucho más común, que el 28 PB probablemente va a reflejar una capacidad de almacenamiento de tamaño medio de cientos de sistemas en todo el mundo.
Artículo completo en Technology Review
Fuente: HPCWire
Lo que se viene!!!
- noviembre 8, 2012 – Computación científica de alto desempeño en plataformas cluster, grid y cloud computing
12:06 pm, General - noviembre 10, 2012 – SC12
8:00 am, General - noviembre 12, 2012 – SCCG 2012
9:00 am, General
- noviembre 8, 2012 – Computación científica de alto desempeño en plataformas cluster, grid y cloud computing
Recent Forum Posts
admin replied Obvio que soy un esquizofréni... 1 year ago.
admin replied Me encantan 1 year ago.
admin started ¿Qué opinan de los foros? 1 year ago.Recent Post
Reciente
- dvadell en Premio ICTP para Pablo Mininni
- marianarojas en Un poco de chismerio supercomputacionil
- marianarojas en Séptimas Jornadas Argentinas de Data Mining
- marianarojas en GPU Programming in MATLAB
- marianarojas en Nobel de física 2012 acerca a la computación cuántica
Saving...


