人类基因组图谱已绘制完成,不过多数个体的基因组还没有被绘制出来,至少迄今还未完成。但个体基因组图谱一旦完成,世界将面临一个问题:如今全球的计算机系统完全没有足够的空间来存储这些数据。

“仅基因组数据的体积问题便是基因组学真正普及至全球的关键障碍之一。”总部位于佩塔提克瓦的Geneformics企业CEO拉斐尔•菲特伯格(Rafael Feitelberg)说道。测序后的人类基因组原始数据大小可能为200到300千兆字节,而分析后的基因组数据却可能占整整一太字节。“如果你想建立基因库,仅数据体积就会是非常非常棘手的障碍。”

同时菲特伯格表示,Geneformics的作用“完全是提供工具和基础设施,可使基因组数据经压缩后更容易被获得”。

绘制人类基因组图谱的关键不仅在于了解基因之间通常如何相互作用,还要能够将绘图技术应用在个体当中。例如,绘制出可供个人使用的基因图谱后,个性化医疗或将迎来欣欣向荣的时代。医生或将可以为患者研制个性化药物,确保药物在无任何副作用的情况下有针对性地解决问题。

Geneformics目前的客户为两大全球基因测序机构——总部位于马萨诸塞州的WuXi NextCode和位于悉尼的加文医学研究所(Garvan Institute of Medical Research)。

数据压缩过程中的一个问题是:数据被解压后会发生什么。“数据压缩应该是以无损、透明的方式进行数据隐藏。”菲尔伯格表示,“从压缩和解压角度来讲,我们有能力以很高的速度解压数据,且实际上能够以无损的形式将数据传输回所有程序中。这就使解压后的数据可位对位地与未经压缩的原始文件呈现相同结果。”

Geneformics最初以魏茨曼科学研究院计算生物学家伊兰•西格尔(Eran Segal)的数据压缩产品为基础。2014年西格尔和职业技术人员及Geneformics现任技术官艾瑞克•克赛特(Arik Keshet)联合创办了该公司。

该公司目前的资金来源为其总裁多夫•摩伦(Dov Moran)等投资者,而摩伦发明的DiskOnKey被普遍认为是世界上首个USB闪存盘。创业数据平台Crunchbase称,摩伦与两大私人股本公司已向Geneformics注资约285万美元。

Geneformics最近公布了其首个完全基于云计算的新产品——Geneformics D。

克赛特表示新产品的操作原理仍是商业机密。”这是个新兴行业,迄今还没有真正的压缩标准。人们也还没有自己基因组的JPEG或MPEG格式等效图。”他表示。

“我们希望最后能在时机成熟之时建立标准。那时我们将会拥有影响数据存储空间的技术、(知识产权)以及市场影响力。”

菲尔伯格称,该公司认为保存数据十分重要。“我们可以通过压缩数据将其所占内存空间减少90%之多。此外,我们会完成基因组数据库的粒级智能化分层,那时我们甚至可以节省更多内存空间。”他补充道。

————————

相关阅读:

以色列技术助中以农业学家绘制棉与番薯基因组

以色列罕见基因类疾病制药企业Eloxx获2400万美元融资

以色列基因数据软件可对农作物做出优化评估

以色列生物科技公司NRGene欲破译人类基因密码

本文版权归《以色列时报》中文版所有,未经授权不得以任何形式转载或修改后转载部分或全部内容,违者必究。