一种传输测序数据的方法与流程

allin2023-04-17  115



1.本发明涉及一种传输测序数据的方法,属于生物信息领域,更具体的,本发明的方法基于序列化和远程过程调用。


背景技术:

2.随着高通量测序技术的发展和成熟,生成的测序数据量也急剧增长,爆炸式增长的数据量为测序数据分析工作带来了巨大的挑战。目前市场上的基因测序系统通常包括测序仪和服务器,测序仪采集数据,服务器装载相应的分析软件对数据进行分析。由于测序仪和服务器是两个独立的系统,将测序原始数据从测序仪转移到服务器就成为整个测序流程中非常重要的环节,甚至是限速步骤。已有的数据传输方法包括使用移动存储设备进行数据转存,这种方法有效率低、需要额外人工等缺点。还有些系统使用跨网络文件传输工具,如通过rsync进行传输,相比于使用移动存储设备,该方法效率高、可嵌入到整个系统中自动执行,但是需要首先将数据存储在测序仪的磁盘上,然后通过网络传输至服务器主机。即使单次测序产生的数据量也是很大的,将数据存储在测序仪主机上要求存储空间足够大,存在数据存储瓶颈;而且在数据传至服务器之后,对测序仪主机上的数据进行管理也需要时间和精力。还有一些公司解决这一问题的出发点是用多种方法对数据进行压缩,从而提高数据的传输效率。例如采取的方法是将测序数据以若干个碱基序列为一个序列单元,每个序列单元对应不同的特异符号,以特异符号的形式进行核酸测序数据的压缩和保存,从而减少数据的存储空间,例如利用该压缩方法最终将2.7gb的数据压缩到2.0gb,压缩率只有74%左右,压缩效率不高,且该方法还需要再进行解压缩,进一步增加了整个测序流程的时长。因此,需要开发一种速度更快、效率更高、更加可靠的高通量测序数据的传输方法,来优化测序流程的实现过程。


技术实现要素:

3.为了克服以上方法的缺点,本发明公开一种传输测序数据的方法,利用序列化和远程过程调用实现测序仪和服务器之间快速、高效、可靠地传输高通量测序数据,缩短了整个测序流程完成所需时间。
4.本发明提供一种利用序列化和远程过程调用传输测序数据的方法,其特征在于,包括以下步骤:
5.利用测序仪对待测样品测序,生成原始测序数据;
6.在客户端实时序列化所述生成的原始测序数据,并通过远程过程调用将所述序列化后的原始测序数据传输至服务器;
7.服务器接收客户端发起的对其所提供的远程过程调用接口服务的调用,在服务器将测序数据反序列化后存储。
8.根据优选的实施方式,所述原始测序数据包括由测序仪的光学系统捕获的荧光图像。
9.根据优选的实施方式,所述序列化是指将数据对象转换为二进制流的过程;反序列化则是指将二进制流恢复为数据对象的过程。
10.根据优选的实施方式,所述客户端指的是测序仪端的控制软件。
11.根据优选的实施方式,原始测序数据在测序仪端不进行存储,生成原始测序数据后,实时进行数据传输。
12.根据优选的实施方式,所述方法进一步包括:
13.对存储在服务器的测序数据进行实时初步分析。也就是说,将测序数据从测序仪端通过序列化和远程过程调用传输至服务器后,对此测序数据进行实时初步分析。
14.根据优选的实施方式,重复进行上述数据传输、初步分析步骤,直至得到所有原始测序数据的初步分析结果。
15.根据优选的实施方式,所述初步分析结果为fastq格式,包括碱基识别以及质量评分等。
16.根据优选的实施方式,根据具体需求,对所述初步分析结果做高级分析,生成最终的测序结果文件;所述高级分析包括序列组装、突变识别、基因功能分析、基因表达分析等。
17.根据优选的实施方式,所述的远程过程调用,包括一个服务器程序和一个客户端调用函数库,其具体实现包括以下步骤:
18.a)基于远程过程调用框架提供的语法规则编写接口定义文件,接口文件包括远程过程方法定义及消息结构定义;
19.b)将所述接口定义文件编译成可供使用的接口定义头文件和源文件;
20.c)根据步骤a)中的消息定义,在服务器程序中实现远程调用方法所应提供的功能;
21.d)在客户端调用函数库中实现对步骤c)中远程调用方法的调用逻辑;
22.e)编译生成服务器程序和客户端调用函数库的可执行文件;
23.f)客户端调用客户端调用函数库使用服务器程序的远程方法,实现原始测序数据从测序仪端传输到服务器,并在服务器主机的磁盘存储设备中存储。
24.根据优选的实施方式,所述客户端指的是测序仪端的控制软件。
25.根据优选的实施方式,所述远程过程调用框架为开源软件,包括grpc、thrift、cap’n proto。
26.根据优选的实施方式,所述消息结构包括:消息数据块、图像数据块、文件数据块;所述消息数据块是从控制软件获取运行身份标识、配置文件等信息封装成的结构;所述图像数据块是从控制软件获取待发送测序数据的小区、循环信息及荧光图像数据封装成的结构;所述文件数据块是从控制软件获取待发送文件的文件名称、文件数据信息封装成的结构。
27.根据优选的实施方式,所述远程过程方法包括连接服务器,该方法的功能为当服务器程序收到此方法调用时根据消息数据块中的运行身份标识,配置文件信息及时间戳信息生成16位的字符串作为令牌返回给客户端。
28.根据优选的实施方式,所述远程过程方法包括传输图像,该方法的功能为传输测序图像数据,服务器程序收到此方法调用后,首先验证所使用的令牌是否是合法的,然后根据接收到的小区、循环信息及荧光图像数据将数据存储至服务器主机的磁盘存储设备中。
29.根据优选的实施方式,所述远程过程方法包括传输文件,该方法的功能为传输测序文件,服务器程序收到此方法调用后,首先验证所使用的令牌是否是合法的,然后根据接收到的文件名信息将文件数据直接以原文件格式存储至服务器主机的磁盘存储设备中。
30.根据优选的实施方式,步骤e)中所述编译使用的是自动化编译工具cmake。
31.有益效果:
32.本发明利用序列化和远程过程调用(rpc)传输测序数据,尤其是高通量测序数据,具有如下有益效果:
33.1.无需移动存储设备进行数据转存,效率更高。
34.2.与一些现有的跨网络文件传输工具相比,本发明的方法不需要将测序数据先存储在测序仪的磁盘上,降低了对测序仪主机存储空间的要求;同时也无需管理测序仪主机的测序数据,节省了人力物力。
35.3.测序过程中边测序边传输数据,可以在测序时间内将所产生的测序数据实时传输至服务器,而不必等待至测序结束再进行测序数据传输,满足快速、可靠传输测序数据的要求,实现测序数据的实时分析,缩短了完成整个测序流程的所需时间。
附图说明
36.图1.基于序列化和远程过程调用的高通量测序数据的传输方法时序图。
37.图2.客户端的过程日志图。
具体实施方式
38.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。
39.除非另外定义,否则本文使用的所有科学和技术术语的含义与本领域普通技术人员通常理解的含义相同。术语“包括”的使用不是限制性的,应被解释为具有开放式含义,也就是说,其应与短语“至少包括”同义地解释。
40.近年来,高通量测序技术在人类医学研究领域及基础科学研究领域中的应用越来越广泛,例如人类全基因组测序,适用于癌症基因组学、药物基因组学、遗传病研究、群体进化等多个研究领域。高通量测序结合生物信息学的快速发展,为疾病诊断和个性化治疗提供了诸多便利和前所未有的可能性,例如在对癌症患者进行治疗时,对与肿瘤靶向治疗密切相关的基因位点进行测序分析,得到患者癌组织的相关突变信息,可以指导医生为病人制定个性化靶向治疗方案,提高患者的5年生存率。无论是医学研究还是基础科学研究,都迫切需要在尽可能短的时间内得到测序结果,以指导其治疗或进一步研究,因此需要一种能够加快完成测序过程的方法。
41.从广义上讲,一个完整的测序过程不仅包括利用测序仪生成原始测序数据,还包括利用生物信息学的方法对原始测序数据进行分析,将原始测序信号变为可供解读的碱基序列,例如上述肿瘤患者癌组织的基因突变位点。测序数据是在测序仪端生成的,而数据分析需要在服务器进行,需要将原始测序数据快速、高效、可靠地传输至服务器。在一次完整的测序流程中,会产生数量巨大的原始测序数据,耗费上百个测序循环的时间,如果按照常规的操作方式,在得到全部测序数据后,再将数据从测序仪端拷贝到服务器上进行分析,这
样就浪费了很多等待时间,可能长达1天甚至数天。而若在测序过程中将原始测序数据实时传输到服务器,则服务器可进行实时数据处理,这将节省大量的等待时间,加快整个测序过程的完成。本发明提供的数据传输方法是基于序列化和远程过程调用的方法,能够实现加快完成测序过程的目的。
42.本发明提供一种利用序列化和远程过程调用传输测序数据的方法,其特征在于,包括以下步骤:
43.利用测序仪对待测样品测序,生成原始测序数据;
44.在客户端实时序列化所述生成的原始测序数据,并通过远程过程调用将所述序列化后的原始测序数据传输至服务器;
45.服务器接收客户端发起的对其所提供的远程过程调用接口服务的调用,在服务器将测序数据反序列化后存储。
46.本发明中,原始测序数据在测序仪端不进行存储,降低了对测序仪存储空间的要求,用户也不需再耗费人力物力对庞大的测序数据进行管理及维护,节约了人力和时间成本。
47.根据优选的实施方式,所述原始测序数据包括由测序仪光学系统捕获的荧光图像。在二代测序中,例如检测荧光信号的边合成边测序技术,利用荧光显微镜扫描测序芯片获取原始测序信号,每一次测序荧光扫描的最小单位即为tile,或称为“小区”;发生一次测序反应,对所有tile都扫描完成,即为一个cycle,或称循环。其原始测序数据是荧光图像。
48.本文中,术语“实时”可以指小于约1秒、0.1秒、0.01秒、1毫秒或更短的响应时间。响应时间也可能大于1秒。在一些实施例中,实时可以指同时或基本上同时的处理。
49.本发明的数据传输方法的特殊之处在于利用了序列化和远程过程调用。远程过程调用(remote procedure call,rpc),是一种常用的同步通信机制,通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议,使用此种机制能方便业务进程使用函数调用的方式来调用其他进程的服务,可以实现应用或服务的解耦及灵活部署。rpc采用对象序列化技术来实现数据的传输。内存中的数据对象只有转换为二进制流才可以进行数据持久化和网络传输。
50.以计算1+2为例,描述rpc过程如下:
51.假如存在一个函数add,该函数有两个传入参数x和y,返回结果为x+y,并且服务器程序已经实现了该函数add(x,y),现在客户端控制软件要使用服务器程序提供的add服务来计算1+2的结果:
52.1.客户端控制软件调用客户端stub,并传入参数1和2。
53.2.客户端stub将客户传入的参数打包成消息,并通过系统调用将该消息从客户端发送给服务器。
54.3.服务器主机收到消息后将其传给服务器stub,服务器stub从消息中解析出相应的参数1和2,然后调用服务器程序add。
55.4.服务器程序将运算结果3返回给服务器stub。
56.5.服务器stub将结果3打包成消息,通过服务主机的系统发送给客户端主机。
57.6.客户端主机收到消息之后,将其转给客户端stub,然后客户端stub从消息中解析出结果3返回给客户端控制软件。至此,一个完整的远程过程调用结束。
58.stub是同时安装在客户端和服务器的应用库。客户端stub负责把函数调用的参数转换成可通过网络传输的形式,并将服务器传回的结果解析成客户端程序可识别的数据类型。服务器stub负责将客户端传来的参数解析成服务器程序可识别的数据类型,并将服务器程序的计算结果转换成可通过网络传输的形式。
59.在本发明中,序列化是指将数据对象转换为二进制流的过程;是将对象的状态信息转换为可以存储或传输的形式的过程,序列化后的数据可以跨应用、主机或网络进行传输。与序列化相对的是反序列化,反序列化则是指将二进制流恢复为数据对象的过程;它将流转换为对象。序列化最主要的用处就是在传递和保存对象的时候,保证对象的完整性和可传递性。序列化与反序列化过程结合起来,可以轻松实现数据的存储和传输过程。
60.根据优选的实施方式,所述远程过程调用框架为开源软件,包括grpc、thrift、cap’n proto等。其中,grpc是google于2015年对外开源的跨语言rpc框架;thrift最初是由facebook开发的内部系统跨语言的rpc框架,2007年成为apache开源项目之一,支持多种语言;cap’n proto是非常快速的数据交换格式和基于容量的rpc系统。
61.优选的,本发明使用cap’n proto提供的序列化和rpc功能。作为一种数据交换格式,cap’n proto不需要在内存中编码和解码消息。在实现中,cap’n proto使用了类似于编译器所使用的方式,以二进制格式存储数据,但是以与平台无关的方式实现。cap'n proto需要定义描述文件,然后通过capnp的编译器编译成特定语言的对象使用。cap'n proto支持的数据类型包括:
62.1)基本类型:包括整型(integer:int8,int16,int32,int64)、浮点型(floating-point:float32,float64)、布尔型(boolean)、列表(list)等;
63.2)二进制大数据类型:包括字符型(text)和数据块型(data);
64.3)结构类型:包括结构体(struct)、联合(union)、枚举(enum);
65.4)接口类型:接口类型(interface)是一组方法集,每一个方法接受输入参数并返回输出结果;
66.5)常量类型:用const定义的数据类型。
67.使用cap'n proto提供的数据类型定义的结构称之为消息,使用时必须根据cap’n proto支持的语法自定义消息结构,并将其存储为以.capnp为后缀名的文件中,每个文件可以包括多个消息结构。文件中的内容包括文件id(对一个文件唯一),自定义消息结构(可以包括多个)。消息结构的每一行代表一个变量定义,变量名在前,变量类型在后,其中@及其后的数字表示该变量在消息结构中的顺序,如name@0:text,其中name是变量名称,text是变量类型,@0表示name是所在消息结构中的第一个变量。
68.根据优选的实施方式,本发明所述的远程过程调用,包括一个服务器程序(rpcserver)和一个客户端调用函数库(rpcclient),其具体实现包括以下步骤:
69.a)基于远程过程调用框架提供的语法规则编写接口定义文件,接口文件包括远程过程方法定义及消息结构定义;
70.b)将所述接口定义文件编译成可供使用的接口定义头文件和源文件;
71.c)根据步骤a)中的消息定义,在服务器程序中实现远程调用方法所应提供的功能;
72.d)在客户端调用函数库中实现对步骤c)中远程方法的调用逻辑;
73.e)编译生成服务器程序和客户端调用函数库的可执行文件;
74.f)客户端调用客户端调用函数库使用服务器程序的远程方法,实现原始测序数据从测序仪端传输到服务器,并在服务器主机的磁盘存储设备中存储。
75.根据优选的实施方式,所述远程过程调用框架为开源软件,包括grpc、thrift、cap’n proto等。所述接口定义文件中包括3种远程过程方法定义,分别是:连接服务器、传输图像、传输文件;还包括3种消息结构定义,即:消息数据块、图像数据块和文件数据块。
76.根据优选的实施方式,所述消息数据块是从控制软件获取运行身份标识、配置文件等信息封装成的结构;所述图像数据块是从控制软件获取待发送测序数据的小区、循环信息及荧光图像数据封装成的结构;所述文件数据块是从控制软件获取待发送文件的文件名称、文件数据信息封装成的结构。
77.根据优选的实施方式,所述远程过程方法包括连接服务器,该方法的功能为当服务器程序收到此方法调用时根据消息数据块中的运行身份标识,配置文件信息及时间戳信息生成16位的字符串作为令牌返回给客户端。
78.根据优选的实施方式,所述远程过程方法包括传输图像,该方法的功能为传输测序图像数据,服务器程序收到此方法调用后,首先验证所使用的令牌是否是合法的,然后根据接收到的小区、循环信息及荧光图像数据将数据存储至服务器主机的磁盘存储设备中。
79.根据优选的实施方式,所述远程过程方法包括传输文件,该方法的功能为传输测序文件,服务器程序收到此方法调用后,首先验证所使用的令牌是否是合法的,然后根据接收到的文件名信息将文件数据直接以原文件格式存储至服务器主机的磁盘存储设备中。
80.根据优选的实施方式,客户端调用函数库对应服务器程序提供的远程方法也实现了三个方法:aida连接服务器,aida传输图像,aida传输文件。这两组方法一一对应,共同提供了预定义的功能。
81.具体的,aida连接服务器方法是从控制软件获取运行身份标识、配置文件等信息,并将其封装成消息数据块结构,再将其发送给服务器程序,然后等待服务器程序返回的令牌信息,并将其传递给控制软件;aida传输图像方法是从控制软件获取待发送数据的小区、循环信息及荧光图像数据,并将其封装成图像数据块结构,发送给服务器程序,等待服务器程序返回是否成功的信息,并将其传递给控制软件;aida传输文件方法是从控制软件获取待发送文件的文件名信息,并将文件封装成文件数据块结构,发送给服务器程序,等待服务器程序返回是否成功的信息,并将其传递给控制软件。
82.根据优选的实施方式,所述客户端指的是测序仪端的控制软件,将其称为seqclient。seqclient直接调用客户端调用函数库(即rpcclient)提供的方法接口将测序仪生成的测序数据,无论是文件数据还是内存数据,直接发送到服务器程序(即rpcserver)。具体过程如图1所示。其中,aida_connectaida、aida_transferimage分别为aida连接服务器、aida传输图像这两种方法,connectaida、transferimage则分别为连接服务器、传输图像这两种方法。aida为服务器的名称。
83.根据优选的实施方式,步骤e)中所述编译使用的是自动化编译工具cmake。
84.根据优选的实施方式,所述利用序列化和远程过程调用传输测序数据的方法进一步包括:对存储在服务器的测序数据进行实时初步分析。也就是说,将测序数据从测序仪端通过序列化和远程过程调用传输至服务器后,对此测序数据进行实时初步分析。
85.根据优选的实施方式,重复进行上述数据传输、初步分析步骤,直至得到所有原始测序数据的初步分析结果。
86.根据优选的实施方式,所述初步分析结果为fastq格式,包括碱基识别以及质量评分等。fastq是一种存储了核苷酸序列以及相应的质量评价的文本格式,在高通量测序中,此格式是最为常见的一种。fastq格式是以ascii编码的,序列一般都包含四行:第一行由“@”开始,后面跟着序列的描述信息;第二行是序列;第三行由“+”开始,后面也可以跟着序列的描述信息;第四行是每个碱基的测序质量,是用ascii码来表示的,字符数跟第二行的序列是相等的。
87.根据优选的实施方式,根据具体需求,对所述初步分析结果做高级分析,生成最终的测序结果文件。所述高级分析包括序列组装、变异识别、基因功能分析、基因表达分析;所述变异包括,例如:单核苷酸多态性(snp)、小插入和缺失(indel)以及拷贝数变异(cnv)和染色体重排等;经过上述高级分析得到最终测序结果文件。变异是导致物种表型差异的一个重要原因,且变异与各类疾病,特别是癌症的发生、发展关联密切,因此对基因组变异进行识别非常重要,也是临床测序数据分析中非常重要的一部分,可根据具体需求对此进行相应的高级分析。
88.本发明对测序技术没有明显限制,只要是原始测序数据为荧光图像的测序方法,都可以用本发明的数据传输方法完成数据传输,例如illumina基于荧光信号的测序技术,焦磷酸测序技术等。
89.优选的,本发明所述的原始测序数据为基于荧光发生测序方法生成的数据,关于荧光发生测序方法的内容可参见专利cn201510822361.9,cn201710630287.x。特殊的,上述两个专利的内容可以以引用的形式加入本专利。
90.实施例1
91.1.基于cap’n proto提供的数据结构及语法,定义需要调用的远程方法,生成“aida.capnp”接口定义文件,该文件中的消息及方法定义如下:
[0092][0093]
2.使用capnp提供的编译工具编译步骤1中所定义的接口文件,生成c++代码文件,具体调用为:
[0094]
capnp compile-oc++aida.capnp
[0095]
生成的c++源码文件为:aida.capnp.h和aida.capnp.cpp。
[0096]
3.创建rpcserver工程,将步骤2生成的文件aida.capnp.h和aida.capnp.cpp添加
到rpcserver工程里,同时新建rpc_server.cpp文件,在该文件中实现步骤1接口文件中所定义的方法;然后使用自动化编译工具cmake编译、构建rpcserver工程,生成可执行程序rpcserver。
[0097]
4.创建seqclient工程,将步骤2生成的文件aida.capnp.h和aida.capnp.cpp添加到seqclient工程里,新建seq_client.cpp文件,在该文件中实现对连接服务器(connectaida)和传输图像(transferimage)方法的调用。然后使用cmake工具编译、构建工程seqclient,生成可执行程序seqclient。
[0098]
5.在服务器端运行程序rpcserver。
[0099]
6.在测序仪端运行程序seqclient,seqclient程序启动时会通过方法connectaida连接rpcserver。如果连接成功,则会接着调用transferimage方法发送测试图像文件,rpcserver程序在接收到seqclient发送的数据之后会返回通过transferimage方法返回状态给seqclient端。
[0100]
7.测试通过seqclient程序将测序仪端磁盘上的单个8m的测序数据文件共40个,发送给服务器端的rpcserver程序,seqclient端的过程日志如图2所示。
[0101]
8.从图2可以看出,使用本发明所示方法在测序仪主机和服务器端传输测序数据,40个8m的数据文件平均每个文件耗时约100ms。

技术特征:
1.一种传输测序数据的方法,其特征在于,包括以下步骤:利用测序仪对待测样品测序,生成原始测序数据;在客户端实时序列化所述生成的原始测序数据,并通过远程过程调用将所述序列化后的原始测序数据传输至服务器;服务器接收客户端发起的对其所提供的远程过程调用接口服务的调用,在服务器将测序数据反序列化后存储。2.根据权利要求1所述的方法,其特征在于,所述原始测序数据包括由测序仪的光学系统捕获的荧光图像。3.根据权利要求1所述的方法,其特征在于,所述序列化是指将数据对象转换为二进制流的过程;反序列化是指将二进制流恢复为数据对象的过程。4.根据权利要求1所述的方法,其特征在于,所述客户端指的是测序仪端的控制软件。5.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:对存储在服务器的测序数据进行实时初步分析。6.根据权利要求1所述的方法,其特征在于,所述的远程过程调用,包括一个服务器程序和一个客户端调用函数库,其具体实现包括以下步骤:a)基于远程过程调用框架提供的语法规则编写接口定义文件,接口文件包括远程过程方法定义及消息结构定义;b)将所述接口定义文件编译成可供使用的接口定义头文件和源文件;c)根据步骤a)中的消息结构定义,在服务器程序中实现远程调用方法所应提供的功能;d)在客户端调用函数库中实现对步骤c)中远程调用方法的调用逻辑;e)编译生成服务器程序和客户端调用函数库的可执行文件;f)客户端调用客户端调用函数库使用服务器程序的远程方法,实现原始测序数据从测序仪端传输到服务器,并在服务器主机的磁盘存储设备中存储。7.根据权利要求6所述的方法,其特征在于,所述客户端指的是测序仪端的控制软件。8.根据权利要求7所述的方法,其特征在于,所述消息结构包括:消息数据块、图像数据块、文件数据块;所述消息数据块是从控制软件获取运行身份标识、配置文件等信息封装成的结构;所述图像数据块是从控制软件获取待发送测序数据的小区、循环信息及荧光图像数据封装成的结构;所述文件数据块是从控制软件获取待发送文件的文件名称、文件数据信息封装成的结构。9.根据权利要求8所述的方法,其特征在于,所述远程过程方法包括连接服务器,该方法的功能为当服务器程序收到此方法调用时根据所述消息数据块中的运行身份标识、配置文件信息及时间戳信息生成16位的字符串作为令牌返回给客户端。10.根据权利要求9所述的方法,其特征在于,所述远程过程方法包括传输图像,该方法的功能为传输测序图像数据,服务器程序收到此方法调用后,首先验证所使用的令牌是否是合法的,然后根据接收到的小区、循环信息及荧光图像数据将数据存储至服务器主机的磁盘存储设备中。11.根据权利要求9所述的方法,其特征在于,所述远程过程方法包括传输文件,该方法的功能为传输测序文件,服务器程序收到此方法调用后,首先验证所使用的令牌是否是合
法的,然后根据接收到的文件名信息将文件数据直接以原文件格式存储至服务器主机的磁盘存储设备中。

技术总结
本发明公开一种传输测序数据的方法,利用序列化和远程过程调用实现测序仪和服务器之间快速、高效、可靠地传输高通量测序数据,缩短了整个测序流程完成所需时间。包括以下步骤:利用测序仪对待测样品测序,生成原始测序数据;在客户端实时序列化所述生成的原始测序数据,并通过远程过程调用将所述序列化后的原始测序数据传输至服务器;服务器接收客户端发起的对其所提供的远程过程调用接口服务的调用,在服务器将测序数据反序列化后存储。在服务器将测序数据反序列化后存储。在服务器将测序数据反序列化后存储。


技术研发人员:司二玲 冯濒啸 乔朔
受保护的技术使用者:赛纳生物科技(北京)有限公司
技术研发日:2022.01.28
技术公布日:2022/7/5
转载请注明原文地址: https://www.8miu.com/read-10766.html

最新回复(0)