《服务:数据驱动的基因组分析与解读(29页).pdf》由会员分享,可在线阅读,更多相关《服务:数据驱动的基因组分析与解读(29页).pdf(29页珍藏版)》请在三个皮匠报告上搜索。
陈钢CTOWeGene服务:数据驱动的基因组分析与解读个人基因组为用户做什么?我们在阿里云生态中的实践未来的基因组数据平台目 录content一、个人基因组为用户做什么?WeGene:基因组数据Fitbit:运动数据若饭:定量饮食Quantified Self!二、我们在阿里云中的实践数据存储RDS:预处理后的基因组数据,表型数据,网站数据OSS:基因组原始数据,大型的计算结果:全基因组数据:FASTQ,BAM,约每用户200GB,约50用户芯片数据:CEL,约每用户200MB,约7000用户GeneDock:正在处理的全基因组数据和芯片数据本地存储:所有数据的备份数据传输芯片数据:实验室用OSS客户端上传OSS全基因组数据:通过GeneDock的专线上传GeneDock系统23andme等数据:通过API直接存储RDS计算本地服务器:主要用于研发,或者是处于alpha测试阶段的产品,Celery调度基于Spark的芯片数据质控ECS:实时的小规模计算,例如简单的遗传风险评估;常规Web服务GeneDock:全基因组数据分析三、未来基因组数据的二次分析统计分析,机器学习,数据可视化全基因组数据存储、分析和可视化Genomics API,上层应用,标准化亚洲人群的Genome Graph参考数据集,自学习系统,开放服务