作者:亚 时间:2023-09-21 09:43:02
近年国家将"精准医疗"列入"十三五"康健生长问题举行研究《康健中国“2030”计划纲要》更提出了增强精准医学等关键技术的突破。
近年国家将"精准医疗"列入"十三五"康健生长问题举行研究《康健中国“2030”计划纲要》更提出了增强精准医学等关键技术的突破。“精准医疗”需要不停响应最新的信息技术和医疗希望是典型的交织学科。当前先进盘算技术已经被应用到卵白质结构研究盘算机辅助药物设计生物信息学等。
“精准医疗”是医学全新领域的分支是凭据个体基因差异、小我私家生活方式以及情况因素在精准数据的指导下对疾病开展预防和治疗的新方法;从狭义的角度讲是使用已知的基因信息为现在肿瘤、感染性疾病和遗传病提供针对个体化的更为有效的治疗手段之一。
海量数据分析对先进盘算需求升级
曙光有着富厚的精准医疗互助履历。非典时期曙光4000无偿协助完成了SARS全基因组测序。今年新冠肺炎疫情伸张 5月学术界顶级周刊《自然》杂志揭晓针对新型冠状病毒的研究结果。
此项研究获得了正在建设中的“转化医学国家重大科技基础设施”有力支撑。该结果的基因数据分析等研究事情使用了2019年中科曙光部署完成的先进盘算系统。
在这个历程中面临众多技术挑战。
一方面是软件应用问题:对应某一功效的软件数以百计随着仪器的更新换代同一款软件的算法也不停升级造成软件选择难;另外分析效率不高多为领域专家依赖剧本语言和库写成的软件未思量与硬件资源使用的匹配。
同时分析流程中多软件衔接难:多数的高通量测序数据分析需几个软件配合完成各软件通过剧本和大数据的重复读写来协调。例如比对之后做SNP检测那么比对效果将作为SNP分析的输入。各软件资源使用特征差异大:如拼接软件需要大量的内存消耗比对则是典型的数据麋集盘算。
二方面是数据存储问题。由于基因测序历程不允许被中断对支撑测序应用的存储系统稳定性和可靠性的要求则极为苛刻。基因测序中25微秒收罗一幅高清晰图像对性能要求也凌驾了现有闪存固态盘的最高带宽必须接纳更快的固态盘。
另外海量小数据将发生全新的存储需求。海量小文件的文件尺寸小物理位置跨度大而文件系统的每次文件会见都市陪同一定的元数据操作。
文件数量越多元数据会见压力越大;此外海量小文件读写并发随机会见对存储系统的随机读写性能有极高的要求。
由此可见基因数据分析在对先进盘算的盘算能力和存储的容量、吞吐能力、存储架构都提出了差别于其他应用的全新要求。
曙光先进盘算与“精准医疗”共发展
作为生物信息学的一个重要分支基因数据处置惩罚一般需要举行4步处置惩罚划分是对测序获取的短序列举行比对拼接、举行全基因组基因注释、对预测的基因举行功效注释、比力基因组和分子进化分析。
精准医疗以康健大数据为基础、以移动通信为手段将使人类康健治理真正做到个性化、准确化。面临“精准医疗”这一项庞大的工程曙光针对第三代基因测序、组学分析等技术的大批量、小规模一次提交成百上千应用数据处置惩罚需求特点以及多种基因检测及特征分析软件并存、更新迭代快且无统一尺度的局势曙光先进盘算将全面升级具备PB(十亿亿字节)级储存架构下解决数据庞大流程分析能力并适应软件的多样与多变。
据悉曙光已为“北京大学医学部”、“四川省人民医院”等超12所三甲级医院以及“重庆市巴南医院”、“江苏泰州市人民医院”等超50家普通医院、县级医院、医疗机构等提供盘算服务。此外曙光还与华大基因等“基因组学研发机构”互助推动基因测序行业生长。
曙光先进盘算将不停突破技术生长的极限为精准医疗大生长、大发作提供有力技术支撑。
。本文来源:亚-www.nicolabirdart.com