“大数据”是有效的,这是因为有重大的信息可以从大数据集合里分析。越是大样本的体量,越能发现一些在小样本体量中难以发现的小问题。另一些研究者则表示:“大数据”岂止于大?而是越多越好。 来自美国 St. Jude儿童研究中心的首席信息官、高级副总裁Keith Perry认为,“大数据”包含额外的三层意思:多个品种的数据类型、数据生成的速度和数据集成的程度。在他看来,目前的许多数据库之间无相互接口,因为它们是由单独的预防、研究和临床部门产生的,现在缺乏一个整合这些不同结构、集中信息的潜在平台。 另一位来自爱立信公司的Narayan Desai博士引用了其在2015年的新闻文章,基因组学将不得不解决的基本问题是数据是如何生成的。尽管目前的数据收集和分析能力有限,但应该利用好它,因为测序的可访问性,将导致访问信息出现爆炸性的增长,并在很大程度上较为分散,传统的信息挖掘将难以解决问题。 影响一:隐藏的弱点 最近,一些科学家建议:针对性和创造性的利用现有的数据可以指导临床实践。来自加州大学旧金山分校(UCSF)的Nevann Krogan教授表示:基因组学已经为癌症治疗带来了重大变革,其作用远超过以...