在阿里云的支持下,近日由西南林业大学大数据与智能工程学院、轻工与食品学院和绿色发展研究院,合作完成的松树比较组学研究,接收并在线发表在《BMC genomics》(中科院2区,SCI影响因子3.8)(https://bmcgenomics.biomedcentral.com/articles/10.1186/s12864-018-5127-6)。该研究主要基于分布于亚、欧、美洲的12种松树的微观生物信息学数据(92%为公共数据),并结合宏观古地质学和古气候学数据,研究了板块运动、海陆变迁及古气候变化对松树物种分化和选择性进化模式的影响。该研究涉及的原始及中间的数据量高达200G,其中包含约30万个不同种松树基因的两两比对分析。在西林阿里云和大数据与智能工程学院服务器的帮助下,计算时间长达两个月(文中专门致谢西林阿里云)。同时,该研究鉴定了全球松树物种中,众多与环境因子相关的抗逆基因,包含抗冷、抗干旱、抗盐碱、抗炎热等,为松树及近缘物种的遗传育种研究奠定了重要基础。更为重要的是,该松树大数据分析流程(本研究第一作者赵友杰历时一年开发),主要基于公开数据库,有非常好的可重复性,项目组研究人员已开始逐步应用于林业其他物种的分析中。
松树大数据研究的完成,标志着大数据与智能工程学院在融合宏观地理信息和微观生物信息方面,已经具备了处理TB级林业大数据的软硬件基础和分析能力。同时获悉,在阿里云的支持下,大数据与智能工程学院参与的另一项生物信息分析研究,已被《PNAS》(美国科学院院刊)接收。