使用锚定至邻近纳米孔的聚合酶的系链对多核苷酸测序的组合物、系统和方法与流程

allin2022-09-25  205


使用锚定至邻近纳米孔的聚合酶的系链对多核苷酸测序的组合物、系统和方法
1.本技术是申请日2016年6月2日,申请号:201680040823.4,发明名称“使用锚定至邻近纳米孔的聚合酶的系链对多核苷酸测序的组合物、系统和方法”的中国发明专利申请的分案申请。
2.对相关申请的交叉引用
3.本技术要求以下申请的权益,每个申请的全部内容通过引用并入本文:
4.于2005年6月3日提交的题名为“compositions,systems,and methods for sequencing polynucleotides using tethers anchored to polymerases adjacent to nanopores”的美国临时专利申请号62/170,563。
5.该申请涉及以下申请,其每一个的全部内容通过引用并入本文:
6.于2014年6月3日提交的题名为“compositions,systems,and methods for detecting events using tethers anchored to or adjacent to nanopores”的美国临时专利申请号62/007,248;
7.于2015年5月5日提交的题名为“compositions,systems,and methods for detecting events using tethers anchored to or adjacent to nanopores”的美国临时专利申请号62/157,371;和
8.于2015年6月2日提交的题名为“compositions,systems,and methods for detecting events using tethers anchored to or adjacent to nanopores”的美国专利申请号14/728,721。
9.序列表
10.本技术包含已经以ascii格式电子提交的序列表,并且通过引用以其全部并入本文。于2016年4月25日创建的所述ascii拷贝被命名为12957-180-28_sl.txt,并且大小为665字节。
发明领域
11.本技术一般涉及对多核苷酸测序。


背景技术:

12.已经投入大量的学术和公司时间和精力到对核苷酸(如dna)的测序中。例如,olsen等人的“electronic measurements of single-molecule processing by dna polymerase i(klenow fragment)”,jacs 135:7855-7860(2013)(其全部内容通过引用并入本文)公开了将dna聚合酶i的klenow片段(kf)的单分子生物缀合到电子纳米电路中,从而允许具有单独的核苷酸掺入事件的分辨率的酶促功能和动态变异性的电记录。或者,例如,hurt等人,“specific nucleotide binding and rebinding to individual dna polymerase complexes captured on a nanopore”,jacs 131:3772-3778(2009)(其全部内容通过引用并入本文)公开了在施加的电场中测量dna与kf的复合物在纳米孔顶上的停
留时间(dwell time)。或者,例如,kim等人,“detecting single-abasic residues within a dna strand immobilized in a biological nanopore using an integrated cmos sensor,”sens.actuators b chem.177:1075-1082(2012)(其全部内容通过引用并入本文)公开了在涉及在α-溶血素纳米孔中捕获的dna的实验中使用电流或通量测量传感器。或者,例如,garalde等人,“distinct complexes of dna polymerase i(klenow fragment)for based and sugar discrimination during nucleotide substrate selection”,j.biol.chem.286:14480-14492(2011)(其全部内容通过引用并入本文)公开了当在α-溶血素孔顶部的电场中捕获时基于它们的性质区分kf-dna复合物。公开了涉及α-溶血素的测量的其它参考文献包含均为howorka等人的下列各项,其全部内容通过引用并入本文:“kinetics of duplex formation for individual dna strand within a single protein nanopore,”pnas 98:12996-13301(2001);“probing distance and electrical potential in a protein pore with tethered dna”,biophysical journal 83:3202-3210(2002);和“sequence-specific detection of individual dna strand using engineered nanopores,”nature biotechnology 19:636-639(2001)。
13.turner等人的美国专利号8,652,779(其全部内容通过引用并入本文)公开了使用单一聚合酶酶复合物和溶液中的核苷酸类似物的核酸测序的组合物和方法,聚合酶复合物包含聚合酶和纳米孔近端附着的模板核酸。核苷酸类似物包含附着到核苷酸类似物的多磷酸部分的电荷阻断标记物,使得当核苷酸类似物掺入生长的核酸中时,电荷阻断标记物被切割。根据turner,通过纳米孔检测电荷阻断标记物以确定掺入的核苷酸的存在和身份,从而确定模板核酸的序列。jayasinghe等人的美国专利公开号2014/0051069(其全部内容通过引用并入本文)涉及包含跨膜蛋白孔亚基和核酸操作酶的构建体。
14.然而,诸如由olsen,hurt,kim,garalde,howorka,turner和jayasinghe描述的先前已知的组合物、系统和方法可能不一定足够稳健,可再现或敏感,并且可能不具有足够高的通量用于实际实施,例如,需要商业应用,如临床和其它需要成本有效和高度精确操作的背景中的基因组测序。因此,需要改进的用于对多核苷酸测序的组合物、系统和方法。
15.发明概述
16.本发明的实施方案提供了使用锚定至邻近纳米孔的聚合酶的系链对多核苷酸测序的组合物、系统和方法。
17.一方面,组合物包含纳米孔,所述纳米孔包含第一侧、第二侧和延伸穿过所述第一侧和第二侧的孔径。组合物还可以包含多个核苷酸,其中每个多核苷酸包含伸长标签(elongated tag)。组合物还可以包含第一和第二多核苷酸,所述第一多核苷酸与所述第二多核苷酸互补。组合物还可以包含布置为邻近纳米孔的第一侧的聚合酶,所述聚合酶配置为基于第二多核苷酸的序列将多个核苷酸的核苷酸添加至第一多核苷酸。组合物还可以包含永久性系链(tether),其包含头部区、尾部区和布置在它们之间的伸长体(elongated body),所述头部区锚定至所述聚合酶,其中所述伸长体出现在所述纳米孔的所述孔径中。组合物还可以包含布置在所述伸长体上的第一部分,其中所述第一部分配置为结合至所述聚合酶作用的第一核苷酸的所述伸长标签,以及布置在所述伸长体上的报告物区,其中所述报告物区配置为指示何时所述第一核苷酸与所述第二多核苷酸的序列中的下一个核苷酸互补或不互补。
18.在一些实施方案中,第一部分配置为产生响应聚合酶作用于第一核苷酸的第一信号状态,第一核苷酸能基于所述第一信号状态鉴定。在一些实施方案中,所述聚合酶作用于所述第一核苷酸包含所述聚合酶结合第一核苷酸。在一些实施方案中,第一信号状态包含电信号或光信号。
19.在一些实施方案中,报告物区配置为产生第二信号状态,基于所述第二信号状态能检测所述第一核苷酸是否与第二多核苷酸的下一个核苷酸互补或不互补。在一些实施方案中,报告物区配置为产生所述第二信号状态,其响应聚合酶成功地将第一核苷酸掺入所述第一多核苷酸中。
20.在一些实施方案中,报告物区配置为产生响应焦磷酸释放的第二状态,所述焦磷酸释放响应聚合酶成功地将第一核苷酸掺入第一多核苷酸中。在一些实施方案中,聚合酶经修饰而延迟焦磷酸释放,所述焦磷酸释放响应第一核苷酸对第一多核苷酸的掺入。在一些实施方案中,聚合酶包含经修饰的重组ф29、b103、ga-1、pza、φ15、bs32、m2y、nf、g1、cp-1、prd1、pze、sf5、cp-5、cp-7、pr4、pr5、pr722,或l17聚合酶。在一些实施方案中,聚合酶包含具有选自下组的至少一个氨基酸取代或取代组合的经修饰的重组ф29dna聚合酶:在位置484处的氨基酸取代、在位置198处的氨基酸取代,和在位置381处的氨基酸取代。在一些实施方案中,聚合酶包含具有选自下组的至少一个氨基酸取代或取代组合的经修饰的重组ф29dna聚合酶:e375y、k512y、t368f、a484e、a484y、n387l、t372q、t372l、k478y、i370w、f198w,和l381a。
21.在一些实施方案中,报告物区配置为产生响应所述聚合酶构象改变的所述第二信号状态。在一些实施方案中,聚合酶构象改变的幅度和持续时间响应第一核苷酸与第二多核苷酸的下一个核苷酸互补或不互补,第二信号状态的幅度或持续时间或这两者基于聚合酶的构象改变。
22.在一些实施方案中,第二信号状态包含电信号。在一些实施方案中,第二信号状态包含光信号。
23.在一些实施方案中,伸长标签包含第一核苷酸序列并且所述第一部分包含与所述第一核苷酸序列互补的第二核苷酸序列。系统可以包括此类组合物并且还可以包含配置为测量穿过所述孔径的第一电流或通量状态的测量电路。在一些实施方案中,第一电流或通量状态基于所述伸长标签,所述第一核苷酸能基于所述第一电流或通量状态鉴定。在一些实施方案中,测量电路进一步配置为测量穿过孔径的第二电流或通量状态。在一些实施方案中,第二电流或通量状态基于所述孔径内所述报告物区的位置,基于所述第二电流或通量状态能确定所述第一核苷酸是否与所述第二多核苷酸中的下一个核苷酸互补或不互补。
24.在一些实施方案中,系链的第一部分和第二部分配置为彼此杂交以形成发夹结构。在一些实施方案中,组合物还包含配置为在所述第一和第二侧间施加电压的电压源。在一些实施方案中,系链的所述第一部分和所述第二部分配置为在两步过程中响应所述电压而彼此脱杂交(dehybridize)。
25.另一方面,方法可以包括提供纳米孔,其包含第一侧、第二侧,和延伸穿过所述第一侧和第二侧的孔径。方法还可以包括提供多个核苷酸,其中所述核苷酸各自包含伸长标签。方法还可以包括提供第一和第二多核苷酸,所述第一多核苷酸与所述第二多核苷酸互补。方法还可以包括提供布置为邻近所述纳米孔的第一侧的聚合酶,所述聚合酶配置为基
于所述第二多核苷酸的序列将所述多个核苷酸的核苷酸添加至所述第一多核苷酸,其中将所述聚合酶锚定至永久性系链,所述永久性系链包含头部区、尾部区和布置在它们之间的伸长体,所述伸长体出现在所述纳米孔的所述孔径中。方法还可以包括基于所述伸长标签与布置在所述伸长体上的第一部分的结合,确定所述聚合酶正作用于第一核苷酸。方法还可以包括凭借布置在所述伸长体上的报告物区,指示何时所述第一核苷酸与所述第二多核苷酸的序列中的下一个核苷酸互补或不互补。
26.在一些实施方案中,所述确定包括产生响应聚合酶作用于所述第一核苷酸的第一信号状态并基于所述第一信号状态来鉴定所述第一核苷酸。在一些实施方案中,聚合酶作用于所述第一核苷酸包含聚合酶结合所述第一核苷酸。在一些实施方案中,第一信号状态包含电信号或光信号。
27.在一些实施方案中,所述指示包括检测第二信号状态和基于所述第二信号状态确定所述第一核苷酸与所述第二多核苷酸的下一个核苷酸互补或不互补。在一些实施方案中,方法包括产生第二信号状态,其响应聚合酶将所述第一核苷酸掺入所述第一多核苷酸中。
28.在一些实施方案中,方法包括产生响应焦磷酸释放的所述第二信号状态,所述焦磷酸释放响应将所述第一核苷酸掺入所述第一多核苷酸中的所述聚合酶。在一些实施方案中,聚合酶经修饰而延迟焦磷酸释放,所述焦磷酸释放响应所述第一核苷酸对所述第一多核苷酸的掺入。在一些实施方案中,聚合酶包含经修饰的重组ф29、b103、ga-1、pza、φ15、bs32、m2y、nf、g1、cp-1、prd1、pze、sf5、cp-5、cp-7、pr4、pr5、pr722,或l17聚合酶。在一些实施方案中,聚合酶包含具有选自下组的至少一个氨基酸取代或取代组合的经修饰的重组ф29dna聚合酶:在位置484处的氨基酸取代、在位置198处的氨基酸取代,和在位置381处的氨基酸取代。在一些实施方案中,聚合酶包含具有选自下组的至少一个氨基酸取代或取代组合的经修饰的重组ф29dna聚合酶:e375y、k512y、t368f、a484e、a484y、n387l、t372q、t372l、k478y、i370w、f198w,和l381a。
29.在一些实施方案中,方法包括产生响应所述聚合酶构象改变的所述第二信号状态。在一些实施方案中,聚合酶构象改变的幅度和持续时间响应所述第一核苷酸与多核苷酸的下一个核苷酸互补或不互补,第二信号状态的幅度或持续时间或这两者基于所述聚合酶的构象改变。
30.在一些实施方案中,第二信号状态包含电信号。在一些实施方案中,第二信号状态包含光信号。
31.在一些实施方案中,伸长标签包含第一核苷酸序列并且所述第一部分包含与所述第一核苷酸序列互补的第二核苷酸序列。在一些实施方案中,所述确定还包括测量穿过所述孔径的第一电流或通量状态。在一些实施方案中,第一电流或通量状态基于所述伸长标签,所述确定还包括基于所述第一电流或通量状态鉴定所述第一核苷酸。在一些实施方案中,指示包括响应聚合酶作用于所述第一核苷酸移动所述孔径内的报告物区。在一些实施方案中,指示还包括测量穿过所述孔径的第二电流或通量状态。在一些实施方案中,第二电流或通量状态基于所述孔径内所述报告物区的位置,所述指示还包括基于所述第二电流或通量状态来测定是否所述第一核苷酸与所述第二多核苷酸中的下一个核苷酸互补或不互补。
32.在一些实施方案中,系链的第一部分和第二部分相互杂交以形成发夹结构。一些实施方案还包括在所述第一和第二侧间施加电压的电压源。在一些实施方案中,系链的第一部分和第二部分在两步过程中响应电压而彼此脱杂交。
33.在一些实施方案中,方法包括基于伸长标签与布置在伸长体上的第一部分的结合,确定所述聚合酶正作用于后续寡核苷酸;并且凭借布置在伸长体上的报告物区,指示何时后续核苷酸与第二多核苷酸的序列中的下一个核苷酸之后的核苷酸互补或不互补。一些实施方案包括针对多个后续核苷酸重复此类步骤,所述多个后续核苷酸与所述下一个核苷酸之后的多个核苷酸互补或不互补。
34.附图简述
35.图1a-图1d示意性显示了根据本发明一些实施方案的使用锚定至邻近纳米孔的聚合酶的系链对多核苷酸测序的组合物。
36.图2a示意性显示了根据本发明一些实施方案的包含测量电路的系统,该测量电路配置为测量纳米孔的孔径内至少一个报告物区的运动。
37.图2b示意性显示了根据本发明一些实施方案的包含测量电路的系统的平面图,该测量电路配置为测量纳米孔阵列的相应孔径内的相应报告物区的运动。
38.图3显示了根据本发明一些实施方案的使用锚定至邻近纳米孔的聚合酶的系链对多核苷酸测序的方法。
39.图4中的a-e示意性显示了根据本发明一些实施方案的使用锚定至邻近纳米孔的聚合酶的系链对多核苷酸测序的组合物的示例性用途。图4中的f示意性显示了根据本发明一些实施方案的在使用图4中的a-e的组合物期间可以产生的示例性信号。
40.图5a-图5d示意性显示了根据本发明一些实施方案的使用锚定至邻近纳米孔的聚合酶的系链对多核苷酸测序的组合物的示例性用途。
41.图6示意性显示了根据本发明一些实施方案的在使用图5a-图5d的组合物期间可以产生的示例性信号。
42.图7a-图7b示意性显示了聚合酶的示例性构象改变
43.图7c-图7d示意性显示了根据本发明一些实施方案的组合物,所述组合物包含锚定至邻近纳米孔的聚合酶并配置用于对多核苷酸测序的系链。
44.图8显示了用于反应方案的示例性反应参数(如速率常数和停留时间),该方案中相应地由聚合酶作用的核苷酸是匹配或错配(改编自johnson,“the kinetic and chemical mechanism of high-fidelity dna polymerases,”biochim biophys acta 1804(5):1041-1048(2010),全部内容通过引用并入本文)。
45.图9a示意性显示了根据本发明一些实施方案的示例性核苷酸,该核苷酸包含延伸标签,该延伸标签包含在对多核苷酸测序中使用期间与图1a-图1d中描述的系链的部分相互作用的部分。
46.图9b-图9c示意性显示了根据本发明一些实施方案的示例性核苷酸,该核苷酸包含延伸标签,该延伸标签包含可以在对多核苷酸测序中使用期间与示例性系链相互作用的相应部分。
47.图9d示意性显示了根据本发明的一些实施方案的示例性系链和部分,所述部分可以在对多核苷酸测序中使用期间与系链相互作用。附图公开了seq id no:1。
48.图10a-图10b示意性显示了根据本发明一些实施方案,示例性系链响应在用于对多核苷酸测序期间与示例性核苷酸的延伸标签的部分杂交的移动。
49.图11a-图11c示意性显示了根据本发明一些实施方案的示例性结构,该结构用于修改可用于对多核苷酸测序的反应方案中的动力学常数。
50.图12a-图12b显示了根据本发明一些实施方案的示例性结构,该结构用于修改聚合酶作用于核苷酸的反应方案中的动力学常数。
51.发明详述
52.本发明的实施方案提供了使用锚定至邻近纳米孔的聚合酶的系链对多核苷酸测序的组合物、系统和方法。
53.更具体地,本组合物、系统和方法可以以稳健、可再现、灵敏、和具有高通量的方式适当用于对多核苷酸测序。例如,本组合物可以包含纳米孔和锚定至布置为邻近所述纳米孔的聚合酶的永久性系链。纳米孔可以包含第一侧和第二侧以及延伸穿过所述第一侧和第二侧的孔径。永久性系链可以包括头部区和尾部区以及布置在它们之间的伸长体。在具体的实施方案中,系链的头部区锚定至布置为邻近纳米孔的第一侧的聚合酶,并且伸长体出现在纳米孔的孔径中。另外,本组合物可以包含多个核苷酸,其各自包含伸长标签。系链或伸长标签或两者可以包含一个或多个促进对多核苷酸(例如模板多核苷酸)测序的特征。例如,系链或伸长标签或两者可以包含一个或多个提供第一信号状态的特征,该第一信号状态基于作用于核苷酸的聚合酶,并且系链或伸长标签或两者可以包含提供第二信号状态的一个或多个特征,该第二信号状态基于核苷酸与正被测序的多核苷酸的序列中的下一个核苷酸互补或不互补。在一些实施方案中,可以基于第一信号状态来确定正由聚合酶作用的核苷酸的身份。另外,在一些实施方案中,可以基于第二信号状态来确定该核苷酸与正被测序的多核苷酸的序列中的下一个核苷酸的互补性,该第二信号状态可以帮助区分该核苷酸是否与要被测序的多核苷酸互补,或取而代之帮助区分聚合酶是否短暂作用于不与正被测序的多核苷酸的序列中的下一个核苷酸互补的核苷酸,但在不将该核苷酸添加至生长的互补性多核苷酸的情况下。因此,例如通过提供错误检查功能,第二信号状态在核酸测序应用期间的碱基调用(basecalling)中是有用的。应当理解,此类第一和第二信号状态(其分别可代表核苷酸的身份或此类核苷酸是匹配还是错配)不一定在彼此不同的时间发生,而且确实可以彼此同时发生。例如,测量信号(例如光或电信号)可以包含多于一种信号状态(如两种信号状态)的组合,每种信号状态提供有关核苷酸的身份或此类核苷酸是匹配还是错配中的一项或多项的信息。
54.已经开发了用于边合成边测序(sbs)的先前已知的方法。例如,单链dna(ssdna)可以响应纳米孔间施加的电势而穿过生物纳米孔,如蛋白质纳米孔,其嵌入在屏障,如脂质双层中。在可以称为“链”测序的事情中,当ssdna的核苷酸通过孔收缩部时,那些核苷酸的组合可以创建独特的电流或通量阻断,其对应于通过收缩部的特定组合中的核苷酸的身份。正在测序的这些链并非永久地附着到孔或聚合酶。相反,这些链移位通过孔,使得链的净位置相对于孔变化。然而,ssdna的极快速移位速率(约1nt/μsec)以及涵盖核苷酸组合而不是单核苷酸的收缩部的天然解析可阻碍逐个核苷酸的此类电流或通量阻断的精确测量。酶“发动机(motor)”已经用于将移位速度减慢到与数据采集更相容的速率(每个核苷酸的毫秒数)。然而,当用于链测序构造时,此类发动机可以引入误差模式,如跳跃、滑动和切换
(toggling),其可以抑制ssdna中核苷酸的可靠检测。在链测序期间可发生的这些和其它不依赖于发动机的误差模式可以源于位于发动机和纳米孔的收缩部之间的ssdna的“弹性”或弹力。此类弹性可以是ssdna的序列的函数,并且如果该组合的不同情况分别被不同的ssdna序列包围,则可以导致经过收缩部的相同核苷酸组合的不同电流或通量。此外,因为收缩部可以相对小,例如约2nt,并且布朗移动总是存在,所以孔“读出头”的大小可以有效地为约4个核苷酸,例如,收缩部一次读出约4个核苷酸的组合,因此使得更难以独特地鉴定每个核苷酸,因为存在需要彼此区分的4^4(256)个电流或通量。
55.因此,仍然需要改进sbs,例如用于sbs的便宜、精确、长读段、高通量的组合物、系统和方法。使用纳米孔(如生物纳米孔)的sbs代表此类需要的一种潜在解决方案,因为这些蛋白质的纳米级再现性和易于生产。综合起来,可以预期不含发动机(例如使用核酸酶作为偶联到纳米孔的检测器,而不是作为调节靶链通过纳米孔的发动机),更耐受布朗移动,并且具有单核苷酸分辨率的方法大大推进纳米孔dna测序领域。
56.首先,将简要解释本文中使用的一些术语。然后,将描述一些示例性组合物,包含可以与本组合物一起使用的测量电路(例如,电或光学测量电路)的示例性系统、可以与本组合物一起使用的示例性方法、以及可以在此类方法期间使用的组合物的一些具体实例。
57.示例性术语
58.如本文所使用的,术语“孔(pore)”旨在表示包含允许分子从孔的第一侧穿过其到达孔的第二侧的孔径的结构。也就是说,孔径延伸穿过孔的第一和第二侧。能够穿过孔的孔径的分子可以包含例如离子或水溶性分子,如核酸、蛋白质、核苷酸和氨基酸。孔可以布置在屏障内。当孔的孔径的至少一部分具有100nm或更小,例如10nm或更小,或2nm或更小的宽度时,孔可以但不必被称为“纳米孔(nanopore)”。可选地,孔径的一部分可以比孔的第一和第二侧中的一个或两个更窄,在此类情况下,孔径的该部分可以被称为“收缩部”。或者/另外,孔的孔径或孔的收缩部(如果存在)或两者可以大于0.1nm,0.5nm,1nm,10nm或更大。孔可以包含多个收缩部,例如至少两个、三个、或四个、或五个、或多于五个收缩部。
59.如本文所使用的,“屏障”旨在表示通常抑制分子从屏障的一侧通过到屏障的另一侧的结构。抑制通过的分子可包含例如离子或水溶性分子,如核酸、蛋白质、核苷酸和氨基酸。孔可以布置在屏障内,并且孔的孔径可以允许分子从屏障的一侧通到屏障的另一侧。屏障包含生物来源的膜和非生物屏障,如固态膜。
60.如本文所使用的,“系链”旨在表示具有头部区、尾部区和它们之间的伸长体的伸长成员。系链包含分子。系链可以是但不一定是处于伸长状态,例如可以包含伸长的分子。例如,系链的伸长体可具有二级或三级构造,例如发夹、折叠、螺旋构造等。系链可以包含聚合物,如多核苷酸或合成聚合物。系链可以具有范围为例如从约5nm至约500nm,例如从约10nm至约100nm的长度(例如,以拉伸或最大延伸状态测量)。系链可以具有例如范围为约1nm至约50nm,例如从约2nm至约20nm的宽度。系链可以是直链或支链的。当在使用组合物的条件下,例如在检测方法中,不将系链从本文中列出的组合物中移出时,可以认为系链是“永久的”。当系链的位置从一个循环到下一个循环或从一个反应到反应重复没有净变化时,用于循环或重复反应中的系链也可以被认为是“永久的”。应当理解,即使在整个循环或反应中位置没有净变化,在单个循环或反应期间,永久性系链的位置可能改变。
61.如本文所使用的,系链的“头部区”旨在表示附着到另一个成员的系链的官能团。
此类附着可以通过化学键,例如通过共价键、氢键、离子键、偶极-偶极键、伦敦分散力(london dispersion force)或其任何合适的组合形成。在一个实施方案中,此类附着可以通过头部区的第一寡核苷酸与另一成员的第二寡核苷酸的杂交来形成。或者,可以使用物理或生物相互作用形成此类附着,例如头部区的第一蛋白质结构与抑制头部区与另一成员分开的另一成员的第二蛋白质结构之间的相互作用。系链的头部区可以附着的示例性成员包含孔,例如孔的第一或第二侧、其中布置孔的屏障、以及布置在孔的第一或第二侧上的分子,如蛋白质。如果系链的头部区附着到布置在孔的第一或第二侧上的另一成员,则可以说系链的头部区与孔相邻。头部区可以但不一定位于系链的末端。
62.如本文所使用的,“锚定”旨在表示第一成员和第二成员之间的附着,其是永久的,例如足够稳定以用于对多核苷酸测序或者例如是能移动的但在使用附着成员的条件下不经历净移动。在一些实施方案中,此类永久性附着在使用附着的成员的条件下,例如在检测方法中通常是不可逆的。在其它实施方案中,此类永久性附着是可逆的,但是至少持续其用于对核苷酸测序的时间段。例如,系链可以在系链使用期间永久附着到孔或在孔附近以对核苷酸测序,并且随后可以是能除去或能用另一个系链替换。共价键仅是适合地可用于将第一成员锚定到第二成员的附着的一个实例。其它实例包含寡核苷酸之间的双链体、肽-肽相互作用和链霉亲合素-生物素或链霉亲合素-脱硫生物素。
63.如本文所使用的,系链的“尾部区”旨在表示远离头部区布置的系链的一部分。尾部区可以远离头部区自由地延伸,例如,可以不附着到任何其它成员。或者,尾部区可以是附着的。此类附着可以通过化学键,例如通过共价键、氢键、离子键、偶极-偶极键、伦敦分散力或其任何合适的组合形成。在一个实施方案中,此类附着可通过尾部区的第一寡核苷酸与另一成员的第二核苷酸的杂交形成。或者,可以使用物理或生物相互作用形成此类附着,例如尾部区的第一蛋白结构与抑制尾部区与另一成员分开的另一成员的第二蛋白结构之间的相互作用。尾部区附着的任何成员可以是但不必是头部区附着的相同成员。尾部区可以但不需要必然位于系链的末端。
64.如本文所使用的,“伸长体”旨在表示成员如系链的一部分,其足够长和窄以布置在孔的孔径的至少一部分内。当伸长体附着到受到作用的核苷酸时,此类伸长体可以称为“伸长标签”,以便于与系链的伸长体区分开。伸长体可以由生物来源或非生物来源的任何合适材料或其组合形成。在一个实例中,伸长体包含聚合物。聚合物可以是生物或合成聚合物。适合地包含在伸长体内的示例性生物聚合物包含多核苷酸、多肽、多糖、多核苷酸类似物和多肽类似物。适用于伸长体的示例性多核苷酸和多核苷酸类似物包含dna、对映异构体dna、rna、pna(肽-核酸)、吗啉代和lna(锁定核酸)。示例性的合成多肽可以包含带电荷的氨基酸以及亲水性和中性残基。适合地可以包含在伸长体内的示例性合成聚合物包含peg(聚乙二醇)、ppg(聚丙二醇)、pva(聚乙烯醇)、pe(聚乙烯)、ldpe(低密度聚乙烯)、hdpe(高密度聚乙烯)、聚丙烯、pvc(聚氯乙烯)、ps(聚苯乙烯)、nylon(脂肪族聚酰胺)、(四氟乙烯)、热塑性聚氨酯、聚醛、聚烯烃、聚(环氧乙烷)、聚(ω-烯酸酯)、聚(甲基丙烯酸烷基酯)和其它聚合化学和生物接头,例如描述于hermanson,bioconjugate techniques,第三版,academic press,london(2013)中。另外,伸长体可任选地包含可与另一部分相互作用的部分。此类部分可以包含例如生物聚合物dna、rna、pna、lna、吗啉代或对映异构体dna。伸长体的区域可以是带电的或中性的,这取决于报告物读出(reporter readout)的具体实
施。
65.如本文所使用的,“报告物区”意指在改变时,使用合适的检测方法或系统可检测的部分。此类改变可以包含但不限于移动。移动可以是约10nm或更小,或约5nm或更小,或约2nm或更小,或约1nm或更小,或约0.5nm或更小,或约0.2nm或更小,或甚至约0.1nm或更小,并且可以使用报告物区和合适的检测方法或系统检测。该部分可以具有可检测的物理、化学、电学、光学或生物学性质或其它合适的通量阻断性质。例如,部分可以具有促进光学检测或表征的光学性质。光学性质包含荧光和拉曼信号的产生。在一个示例性实例中,部分是与相应的fret受体或供体相互作用以发射可检测的特定波长的光的荧光共振能量转移(fret)供体或受体。供体和受体可以被认为是fret对配偶体。或者,例如,该部分可以具有电或通量阻断性质。电或通量阻断性质包含静电电荷,例如正电荷或负电荷。或者,例如,该部分可以具有物理性质。物理性质包含部分的体积和形状。在一个示例性示例中,通过调节通过孔或收缩部的阻断电流或通量,在孔径内的部分的移动引起通过孔径或其中的收缩部的电流或通量的可测量的变化。或者,例如,部分可以具有促进化学或生物检测的化学或生物学性质。化学或生物学性质包含化学或生物基团的存在,例如放射性基团或具有酶活性的基团。部分的一个或多个电学、物理、化学、生物或其它通量阻断性质可以提供通过孔径或收缩部的电流的可测量的变化,或光学信号。在一个示例性实例中,在孔径内的部分的移动引起通过孔径或收缩部的电流的可测量的变化,或引起通过孔径或收缩部的分子的通量的可测量的变化,所述通量的变化可以以电学、化学、生物学或光学方式可检测。无碱基核苷酸是部分的一个非限制性实例,所述部分的移动可引起通过孔径或收缩部的电流的可测量变化或通过孔径或收缩部的分子通量的可测量变化。
66.如本文所使用的,“运动”或“移动”可以是平移的、旋转的或构象的,或其组合。
67.如本文所使用的,聚合酶“作用于”核苷酸可以包括多核苷酸进入核酸酶上的活性位点。聚合酶作用于核苷酸还可以包括但不限于聚合酶引起核苷酸或该核苷酸的一部分的化学变化。化学变化可以包括聚合酶除去核苷酸的一部分、聚合酶将核苷酸添加至另一个分子、核苷酸结合聚合酶或从聚合酶上脱结合、聚合酶修饰核苷酸或其一部分、以及聚合酶形成或切割化学键,如在多核苷酸合成期间等等。例如,聚合酶作用于核苷酸可以包括将核苷酸添加至多核苷酸。聚合酶作用于核苷酸任选地可以包括聚合酶、核苷酸,或两者的移动和化学改变。作为非限制性的纯粹示例性的实例,聚合酶作用于核苷酸可以包括以下的一个或多个:聚合酶测试核苷酸,在核苷酸与正测序的多核苷酸中的下一个核苷酸错配时聚合酶排斥(reject)核苷酸,聚合酶使用外切核酸酶活性从多核苷酸切除核苷酸,以及聚合酶使用焦磷酸裂解(pyrophosphorylysis)从多核苷酸切除核苷酸。图8显示了反应方案的示例性的反应参数(例如速率常数和停留时间),该反应方案中被聚合酶作用的核苷酸是匹配或错配(改编自johnson,“the kinetic and chemical mechanism of high-fidelity dna polymerases,”biochim biophys acta 1804(5):1041-1048(2010),全部内容通过引用并入本文)。聚合酶如t7 pol通常基于对正确匹配核苷酸的增加的结合亲和力(例如,正确对错配大约10倍的偏好)、错配核苷酸的大大降低的催化速率(例如,对于错配大约减慢1000倍)、和错配核苷酸从闭合催化状态的解离速率大大增加(例如,对于错配大约快300倍)的组合区分匹配和错配核苷酸。
68.如本文所使用的,“构象变化”意指分子形状的变化(例如,分子的相对原子坐标的
变化)。此类构象变化可以包含相对于分子的另一部分移动的分子的一部分。分子的一部分的化学反应性可以响应分子的该部分或另一部分的相对移动而变化。分子可以经历响应刺激的构象变化。此类刺激可以包含但不限于施加于分子的变化或力,与其它分子的相互作用或环境因素。对分子的变化或施加的力可包含施加于分子或其一部分的物理力、施加于分子的电场、或与分子或其部分的化学反应或其组合,例如底物的结合、催化和/或产物的释放。与其它分子的相互作用可包含另一分子的存在、另一分子的浓度、另一分子的作用或对另一分子的作用或其组合。与另一种分子的示例性相互作用包含两种寡核苷酸的杂交或作用于核苷酸的聚合酶。环境因素可以包含ph的变化或温度的变化,或其组合。
69.如本文所使用的,术语“核苷酸”意指包含糖和至少一个磷酸基团并任选还包含核碱基的分子。缺乏核碱基的核苷酸可称为“无碱基(absic)”。核苷酸包含脱氧核糖核苷酸、经修饰的脱氧核糖核苷酸、核糖核苷酸、经修饰的核糖核苷酸、肽核苷酸、经修饰的肽核苷酸、经修饰的磷酸糖主链核苷酸及其混合物。核苷酸的实例包含一磷酸腺苷(amp)、二磷酸腺苷(adp)、三磷酸腺苷(atp)、一磷酸胸苷(tmp)、二磷酸胸苷(tdp)、三磷酸胸苷(ttp)、一磷酸胞苷(cmp)、二磷酸胞苷(cdp)、三磷酸胞苷(ctp)、一磷酸鸟苷(gmp)、二磷酸鸟苷(gdp)、三磷酸鸟苷(gtp)、一磷酸尿苷(ump)、二磷酸尿苷(udp)、三磷酸尿苷(utp)、一磷酸脱氧腺苷(damp)、二磷酸脱氧腺苷(dadp)、三磷酸脱氧腺苷(datp)、一磷酸脱氧胸苷(dtmp)、二磷酸脱氧胸苷(dtdp)、三磷酸脱氧胸苷(dttp)、二磷酸脱氧胞苷(dcdp)、三磷酸脱氧胞苷(dctp)、一磷酸脱氧鸟苷(dgmp)、二磷酸脱氧鸟苷(dgdp)、三磷酸脱氧鸟苷(dgtp)、一磷酸脱氧尿苷(dump)、二磷酸脱氧尿苷(dudp)和三磷酸脱氧尿苷(dutp)。
70.术语“核苷酸”还意在涵盖与天然存在的核苷酸相比,包含经修饰的核碱基、糖和/或磷酸部分的一类核苷酸的任何核苷酸类似物。可以包含在多核苷酸中的示例性的经修饰的核碱基(无论是否具有天然主链或类似物结构)包含肌苷、黄嘌呤、次黄嘌呤、异胞嘧啶、异鸟嘌呤、2-氨基嘌呤、5-甲基胞嘧啶、5-羟甲基胞嘧啶、2-氨基腺嘌呤、6-甲基腺嘌呤、6-甲基鸟嘌呤、2-丙基鸟嘌呤、2-丙基腺嘌呤、2-硫尿嘧啶、2-硫代胸腺嘧啶、2-硫代胞嘧啶、15-卤代尿嘧啶、15-卤代胞嘧啶、5-丙炔基尿嘧啶、5-丙炔基胞嘧啶、6-偶氮尿嘧啶、6-偶氮胞嘧啶、6-偶氮胸腺嘧啶、5-尿嘧啶、4-硫尿嘧啶、8-卤代腺嘌呤或鸟嘌呤、8-氨基腺嘌呤或鸟嘌呤、8-巯基腺嘌呤或鸟嘌呤、8-硫代烷基腺嘌呤或鸟嘌呤、8-羟基腺嘌呤或鸟嘌呤、5-卤素取代的尿嘧啶或胞嘧啶、7-甲基鸟嘌呤、7-甲基腺嘌呤、8-氮杂鸟嘌呤、8-氮杂腺嘌呤、7-脱氮鸟嘌呤、7-脱氮腺嘌呤、3-脱氮鸟嘌呤、3-脱氮腺嘌呤等。如本领域已知的,某些核苷酸类似物不能掺入多核苷酸中,例如核苷酸类似物,如腺苷5
’‑
磷酸硫酸盐。
71.在磷酸部分处修饰的示例性核苷酸包含例如lee等人,“synthesis and reactivity of novelγ-phosphate modified atp analogues,”bioorganic&medicinal chemistry letters 19:3804-3807(2009);kumar等人,“peg-labeled nucleotides and nanopore detection for single molecule dna sequencing by synthesis”,scientific reports 2:684(2012);kumar等人,“terminal phosphate labeled nucleotides:synthesis,applications,and linker effect on incorporation by dna polymeraseases”,nucleosides,nucleotides,and nucleic acids 24:401-408(2005)和mulder等人,“nucleotide modification in theγ-phosphate leads to the improved fidelity of hiv-1reverse transcriptase”,nucleic acids research33:4865-4873
(2005)中描述的核苷酸类似物,其全部内容通过引用并入本文。lee等人描述了具有以下结构的某些示例性γ-磷酸修饰的atp类似物:
72.kumar等人(2012)公开了可以附着到dntp或ntp(dntp/ntp)的末端磷酸或四磷酸核苷酸(dn4p/n4p)的末端磷酸的不同长度的peg-香豆素标签。示例性长度包含例如香豆素-peg
16-dn4p/n4p,香豆素-peg
20-dn4p/n4p,香豆素-peg
24-dn4p/n4p和香豆素-peg
36-dn4p/n4p。kumar等人(2005)公开了四和五磷酸修饰的核苷酸,包含用或不用接头附着的染料。如kumar等人(2005)中描述,不用接头的示例性染料包含ddao、resorufin、coumarins、烷基-xanthenes、硝基酚、羟基吲哚、elf和bbt;通过接头附着的示例性染料包含r110、reg、tamra、rox、cy染料和et染料;并且示例性接头包含二氨基丙烷、二氨基庚烷、二氨基十二烷、eea、pap、二氨基环己烷、二氨基二甲苯和五赖氨酸。mulder等人公开了经化学修饰的核苷酸,包含附着到核苷酸的γ-磷酸的1-氨基萘-5-磺酸盐(ans),例如γ-p-氨基萘-5-磺酸脱氧或核糖核苷酸(dntp或ntp),如ans-atp、ans-ctp、ans-gtp和ans-ttp和/或这些或其它核苷酸的脱氧形式。
73.如本文所使用的,术语“多核苷酸”是指包含彼此键合的核苷酸序列的分子。多核苷酸的实例包含脱氧核糖核酸(dna)、核糖核酸(rna)及其类似物。多核苷酸可以是核苷酸的单链序列,如rna或单链dna,核苷酸的双链序列,如双链dna,或可以包含单链和双链核苷酸序列的混合物。双链dna(dsdna)包含基因组dna、以及pcr和扩增产物。单链dna(ssdna)可以转化为dsdna,反之亦然。多核苷酸中核苷酸的精确序列可以是已知的或未知的。以下是多核苷酸的示例性实例:基因或基因片段(例如探针、引物、表达序列标签(est)或基因表达系列分析(sage)标签)、基因组dna、基因组dna片段、外显子、内含子、信使rna(mrna)、转移rna、核糖体rna、核酶、cdna、重组多核苷酸、合成多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离的dna、任何序列的分离的rna、核酸探针、引物或任何上述物质的扩增拷贝。
74.如本文所使用的,“杂交”意指非共价结合第一多核苷酸与第二多核苷酸。第一和第二多核苷酸之间的结合强度随那些多核苷酸之间的互补性而增加。
75.如本文所使用的,术语“蛋白质”旨在表示包含折叠成三维结构的多肽或由折叠成三维结构的多肽组成的分子。多肽包含当折叠成三维结构时赋予蛋白质以生物活性的部分。
76.如本文所使用的,术语“酶”意指催化修饰另一分子的分子。酶可包含蛋白质,以及某些其它类型的分子,如多核苷酸。也作为蛋白质的酶的实例包含聚合酶、外切核酸酶和解旋酶。
77.如本文所使用的,“聚合酶”意指具有通过将核苷酸聚合成多核苷酸而组装多核苷酸的活性位点的酶。聚合酶可以结合引发的单链多核苷酸模板,并且可以向生长的引物顺序添加核苷酸以形成具有与模板序列互补的序列的多核苷酸。
78.用于对核苷酸测序的示例性组合物、系统和方法
79.现在将参考图1a-图1d显示示例性的组合物,其包含锚定至邻近纳米孔的聚合酶的系链。一方面,组合物包含纳米孔,该纳米孔包含第一侧、第二侧和延伸穿过所述第一侧和第二侧的孔径。组合物还可以包含多个核苷酸,其中每个所述核苷酸包含伸长的标签。组合物还可以包含第一和第二多核苷酸,所述第一多核苷酸与所述第二多核苷酸互补。组合物还可以包含布置为邻近所述纳米孔的第一侧的聚合酶,该聚合酶配置为基于所述第二多核苷酸的序列将所述多个核苷酸的核苷酸添加至所述第一多核苷酸。组合物还可以包含永久性系链,其包含头部区、尾部区和布置在它们之间的伸长体,所述头部区锚定至所述聚合酶,其中所述伸长体出现在纳米孔的孔径中。组合物还可以包含布置在所述伸长体上的第一部分,其中所述第一部分配置为结合至所述聚合酶作用的第一核苷酸的所述伸长标签。组合物还可以包含布置在所述伸长体上的报告物区,其中报告物区配置为指示何时第一核苷酸与第二多核苷酸的序列中的下一个核苷酸互补或不互补。
80.例如,图1a示意性显示了示例性组合物的横截面,该组合物包含纳米孔100、永久性系链110、多个核苷酸120(为了简化说明而示出了其中的一个)、聚合酶130、第一多核苷酸140、和第二多核苷酸150。纳米孔100包含第一侧101、第二侧102、孔径103、和收缩部104。永久性系链110包含头部区111、尾部区112、以及伸长体113。在如图1a所示的实施方案中,将聚合酶130布置为邻近纳米孔100的第一侧101,将永久性系链110的头部区111锚定至聚合酶130,将永久性系链110的尾部区112自由布置在纳米孔100的第二侧102上,并且永久性系链110的伸长体113可在纳米孔100的孔径内移动。永久性系链110的伸长体113包含第一部分115和一个或多个报告物区114。核苷酸120包含伸长标签121,该伸长标签包含第二部分122。聚合酶130配置为基于第二多核苷酸150的序列,将多个核苷酸120的核苷酸添加到第一多核苷酸140。
81.如图1b所示,基于作用于核苷酸120的聚合酶130,永久性系链110的伸长体113的第一部分115配置为结合核苷酸120的伸长体121,即配置为结合至第二部分122。例如,聚合酶130可以包含接收并结合核苷酸120的活性位点(未特别示出),这将第二部分122置于相对靠近第一部分115达足够的时间用于使第一部分115和第二部分122彼此相互作用,如彼此结合(这也称作彼此形成双链体(duplex))。例如,在一些实施方案中,第一部分115包含第一寡核苷酸,并且第二部分122包含与第一寡核苷酸互补并杂交的第二寡核苷酸。
82.可配置第一部分115以产生响应聚合酶130作用于核苷酸120的至少第一信号状态,并且可以基于第一信号状态以诸如本文别处更详细描述的方式来鉴定核苷酸120。例如,部分115和部分122间的双链体形成可以导致一个或多个报告物区114布置在孔径103内的位置处,这导致穿过孔径103的独特电流或通量,基于该电流或通量可以鉴定核苷酸120。示例性地,第一信号状态可以包含电信号或光信号。
83.或者,永久性系链110的伸长体113的一个或多个报告物区114可以配置为指示何时核苷酸120与第二多核苷酸150的序列中的下一个核苷酸互补或不互补。例如,在一些实施方案中,孔径103内的一个或多个报告物区114的位置可以基于聚合酶130的特定构象,这
可以基于核苷酸120是否是与第二多核苷酸150的序列中的下一个核苷酸的匹配或错配。关于匹配和错配核苷酸之间的聚合酶构象和动力学差异的进一步细节,参见以下参考文献,每篇文献的全部内容通过引用并入本文:freudenthal et al.,"new structural snapshots provide molecular insights into the mechanism of high fidelity dna synthesis,"dna repair,doi:10.2016/j.dnarep/2015.04.007(available online april 30,2015);freudenthal et al.,"watching a dna polymerase in action,"cell cycle 13:691-692,doi:10.4161/cc.27789(2014);和freudenthal et al.,"observing a dna polymerase choose right from wrong,"cell 154:157-168,doi:10.1016/j.cell.2013.05.048(2013)。
84.例如,如图1b所示,基于作为与第二多核苷酸150的序列中的下一个核苷酸的匹配或错配的核苷酸120,聚合酶130可具有修饰的构象130’,这使一个或多个报告物区114置于孔径103内的位置处,从而导致穿过孔径103的独特电流或通量,基于该电流或通量可以确定核苷酸120是匹配。相比之下,如图1b所示,基于核苷酸120不是与第二多核苷酸150的序列中的下一个核苷酸的匹配,聚合酶130具有修饰的构象130”,这使一个或多个报告物区114置于孔径103内的位置处,从而导致穿过孔径103的独特电流或通量,基于该电流或通量可以确定核苷酸120是错配。
85.注意,在图1b所示的实施方案中,报告物区114可以在部分115和部分122彼此结合时提供匹配或错配的指示。或者如图1d所示,基于作为与第二多核苷酸150的序列中的下一个核苷酸的匹配的核苷酸120,聚合酶130再次可具有修饰的构象130’,这使报告物区114置于孔径103内的位置处,从而导致穿过孔径103的独特电流或通量,基于该电流或通量可以确定核苷酸120是否是匹配或错配。然而,部分115和部分122不需要必需彼此结合以便使报告物区114提供此类指示。例如,部分115和部分122可以彼此解离,如响应于孔径103内的热波动,或响应于在第一侧101和第二侧102之间施加足够的电位差,并且部分115和122彼此解离时孔径103内报告物区114的位置可以指示核苷酸120是否是匹配或错配。相较而言,如果核苷酸120是错配,则聚合酶130可具有类似于图1c中所示的构象130”,这使报告物区114置于孔径103内的位置处,从而导致穿过孔径103的独特电流或通量,基于该电流或通量可以确定核苷酸120是错配。
86.另外,基于作为匹配的核苷酸120,聚合酶130可将核苷酸120掺入第一多核苷酸,并可以从核苷酸120切出延伸标签121,其可以在纳米孔100的顺侧(例如,第一侧)扩散开。另外,基于聚合酶成功地将核苷酸120掺入第一多核苷酸140,聚合酶130可以释放焦磷酸或可具有两个或多个磷酸亚基(如两个、三个、四个、五个,或六个磷酸亚基(未具体示出))的其他磷氧阴离子(oxyanion)。另外,基于聚合酶130未成功地将核苷酸120掺入第一多核苷酸140,聚合酶130不释放焦磷酸。
87.配置报告物区114以便基于一个或多个效果产生一个或多个信号,所述效果源自由聚合酶130作用的核苷酸120或源自与第二多核苷酸150的序列中的下一个核苷酸互补或不互补的核苷酸120,例如基于结合至或位于聚合酶130的活性位点的核苷酸120或成功地或未成功地将核苷酸120掺入第一多核苷酸140的聚合酶130的一个或多个效果。此类示例性第二信号状态的进一步的细节在下面参照图3、4a-4f、5a-5d和6更详细地描述。可以基于一个或多个信号来检测聚合酶130是否是作用于第一核苷酸或第一核苷酸是否与第二多核
苷酸的下一个核苷酸互补或不互补,或在被聚合酶作用和第一核苷酸是否与第二多核苷酸的下一个核苷酸互补或不互补两者。示例性地,一个或多个信号各自独立地可以包含电信号或光信号。
88.任选地,伸长体113可以包含超过一个报告物区,如可以包含任何合适数量的报告物区,如一个,或两个,或三个,或四个,或五个,或超过五个报告物区。每个此类报告物区可以与每个其他报告物区相同。或者,每个此类报告物区可以不同于每个其他报告物区。或者,一些报告物区可以彼此相同,而其它报告物区可以彼此不同。在一个示例性的非限制性实例中,伸长体113包含多核苷酸,该多核苷酸包含定义报告物区114的无碱基核苷酸。可以在纳米孔的孔径内检测无碱基核苷酸,如在例如wilson,“electronic control of dna polymerase binding and unbinding to single dna molecules tethered in a nanopore”,ph.d.thesis,university of california santa cruz(2009)中描述,其全部内容通过引用并入本文。示例性地,一个或多个无碱基核苷酸或其它合适的报告物区114的移动或存在可以引起通过孔径103或收缩部104的电流的可测量的变化、通过孔径103或收缩部104的分子通量的可测量变化、或光学信号。例如,通过孔径103或收缩部104的分子通量的变化可以以电学、化学、生物学或光学方式检测。
89.在图1a-图1d所示的实施方案中,系链110的头部区111、尾部区112和伸长体113可以包含任何合适的材料或材料的组合。例如,头部区111可以配置为经由化学键(例如,通过共价键、氢键、离子键、偶极-偶极键、伦敦分散力或其任何合适的组合)锚定到聚合酶130。例如,头部区111可以包含例如共价键合到聚合酶130的第二部分的第一部分。可以将头部区111锚定到聚合酶130的示例性共价键包含碳-碳键、碳-氮键、碳-氧键、氧-氧键、硫-硫键、磷-氧键、磷-硫键、酰胺键、硫醚键、酰肼键、碳-硫键,以及由羟基胺(oxyamine)与羰基(醛和酮),staudinger试剂对(如膦和叠氮化物)或点击化学对(如叠氮化物和炔)反应产生的键。然而,附着不需要是共价的。例如,此类附着可以通过头部区的第一寡核苷酸与聚合酶130的第二核苷酸的杂交来形成。或者,可以使用物理或生物相互作用形成此类附着,例如头部区的第一蛋白质结构与抑制头部区与聚合酶130分开的聚合酶130的第二蛋白质结构之间的相互作用。例如,头部区111可以包含第一α螺旋,并且聚合酶可以包含锁定到头部区111以便抑制头部区111从第一侧101解离的第二α螺旋。受体和配体之间的相互作用也是有用的,其实例包含亲合素-生物素或其类似物;抗体-表位;凝集素-碳水化合物等。
90.伸长体113可以附着(例如共价键合)到头部区111,并且尾部区112可以限定伸长体113的远离头部区111的末端。伸长体113可以包含生物来源或非生物来源的任何合适材料,或其组合。如下文更详细描述的,伸长体113可任选地包含一个或多个报告物区,该报告物区指示何时由聚合酶130所作用的核苷酸与第二多核苷酸150的序列中的下一个核苷酸互补或不互补。伸长体113也可包含第一部分115,该部分可以与聚合酶130正作用的核苷酸120的伸长标签121相互作用(如与其结合)。可以包含在伸长体113内的示例性生物材料包括生物聚合物,如多核苷酸、多肽、多糖和上述物质的类似物。适合地可包含在伸长体113内的示例性合成聚合物包含peg(聚乙二醇)、ppg(聚丙二醇)、pva(聚乙烯醇)、pe(聚乙烯)、ldpe(低密度聚乙烯)、hdpe(高密度聚乙烯)、聚丙烯、pvc(聚氯乙烯)、ps(聚苯乙烯)、nylon(脂肪族聚酰胺)、(四氟乙烯)、热塑性聚氨酯、聚醛、聚烯烃、聚环氧乙烷、聚(ω-烯酸酯)、聚(甲基丙烯酸烷基酯)和其它聚合化学和生物接头,如在上文进一步提及的
hermanson等人中描述的。
91.纳米孔100可以具有允许将聚合酶130布置为邻近纳米孔100的第一侧101的任何合适的构造,使得系链110的头部区111锚定至聚合酶130,并且系链110的伸长体113出现在(如可以布置在)纳米孔100的孔径103中。在一些实施方案中,纳米孔100可以是生物孔、固态孔或生物和固态杂合孔。生物孔旨在表示由一种或多种生物来源的材料制成的孔。“生物来源”是指衍生自或分离自生物环境(如生物体或细胞)的材料,或生物学可用结构的合成制造的形式。生物孔包含例如多肽孔和多核苷酸孔。
92.多肽孔意指由一种或多种多肽制成的孔。一种或多种多肽可以包含单体、均聚物或杂聚物。多肽孔的结构包含例如α-螺旋束孔和β-桶孔以及本领域熟知的所有其它孔。示例性的多肽孔包含α-溶血素、耻垢分枝杆菌(mycobacterium smegmatis)孔蛋白a、短杆菌肽a(gramicidin a)、麦芽孢菌素(maltoporin)、ompf、ompc、phoe、tsx、f-pilus、sp1、线粒体孔蛋白(vdac)、tom40、外膜磷脂酶a和奈瑟氏球菌(neisseria)自转运蛋白脂蛋白(naip)。“耻垢分枝杆菌孔蛋白a(mspa)”是由分枝杆菌产生的膜孔蛋白,允许亲水性分子进入细菌。mspa形成紧密相连的八聚体和跨膜β桶,其类似于杯状物并且包含中心收缩部。关于α-溶血素的更多细节,参见美国专利号6,015,714,其全部内容通过引用并入本文。关于sp1的更多细节,参见wang等,chem.commun.,49:1741-1743,2013,其全部内容通过引用并入本文。关于mspa的进一步细节,参见butler等人,“single-molecule dna detection with an engineered mspa protein nanopore,”proc.natl.acad.sci.105:20647-20652(2008)和derrington等人,“nanopore dna sequencing with mspa,”proc.natl.acad.sci.usa,107:16060-16065(2010),两者的全部内容通过引用并入本文。其它孔包含例如来自皮疽诺卡菌(norcadia farcinica)的mspa同源物和胞溶素(lysenin)。关于胞溶素的更多细节,参见pct公开号wo 2013/153359,其全部内容通过引用并入本文。
93.多核苷酸孔旨在表示由一种或多种核酸聚合物制成的孔。多核苷酸孔可包含例如多核苷酸纸折物(polynucleotide origami)。
94.固态孔旨在表示由一种或多种非生物来源的材料制成的孔。“固态”是指不是生物来源的材料。固态孔可以由无机或有机材料制成。固态孔包含例如氮化硅孔、二氧化硅孔和石墨烯孔。
95.生物和固态杂合孔旨在表示由生物和非生物来源二者的材料制成的杂合孔。生物来源的材料在上文限定,并且包含例如多肽和多核苷酸。生物和固态杂合孔包含例如多肽-固态杂合孔和多核苷酸-固态孔。
96.应当理解,不同类型的纳米孔在多个方面可以具有彼此不同的尺寸。例如,如图1a所示,纳米孔100可以表征为具有限定邻近孔径103的纳米孔100的厚度的第一尺寸h1,例如,第一侧101的外表面105和第二侧102的外表面106之间的厚度。在纳米孔100包含收缩部104的实施方案中,纳米孔100还可以表征为具有限定邻近孔径103的收缩部深度的第二尺寸h2,例如,第一侧101的外表面105和收缩部104的最窄部分之间的深度。纳米孔100还可以表征为具有限定孔径103的直径的第一直径d1,例如在孔径的最宽点处的孔径103的直径。在纳米孔100包含收缩部104的实施方案中,纳米孔100还可以表征为具有限定收缩部直径的第二直径d2,例如收缩部的最窄点处的收缩部104的直径。应当理解,纳米孔100的此类尺
寸不应被解释为限制性的,并且可以适当地限定纳米孔100的其它尺寸。例如,纳米孔100的第一尺寸h1可以沿着横向尺寸变化,例如,若纳米孔100包含相对薄的屏障,其中布置相对厚的孔。或者,例如,在纳米孔100包含收缩部104的实施方案中,纳米孔100的第二尺寸h2可以根据收缩部104与第一侧101的外表面的相对位置而变化。也就是说,收缩部104可以位于布置在纳米孔100内的任何合适的位置,并且实际上甚至可以布置在第一侧101或第二侧102的外表面的远侧。孔径103和收缩部104不需要一定是完全圆形的,并且仍然可以表征为具有近似直径或使用任何其它合适的尺寸。此外,纳米孔100可以包含多个收缩部,其中每个收缩部适当地可以使用适当的尺寸来表征。
97.在一些实施方案中,纳米孔100的第一尺寸h1为约100nm或更小,或约50nm或更小,或约20nm或更小,或约10nm或更小,或约5nm或更小,或约2nm以下。例如,h1可以在约2nm和约100nm之间,或者在约5nm和约50nm之间,或者在约10nm和约20nm之间。在包含收缩部104的实施方案中,纳米孔100的第二尺寸h2为约100nm或更小,或约50nm或更小,或约20nm或更小,或约10nm或更小,或约5nm或更小,约2nm或更小,或约1nm或更小。例如,h2可以在约1nm至约100nm之间,或约2nm至约50nm之间,或约5nm至约20nm之间。示例性地,h1可以在约5nm和约50nm之间,并且h2可以在约1nm和约5nm之间。在一个示例性实施方案中,h1约为10nm,并且h2约为5nm。在另一个示例性实施方案中,h1为约10nm,并且h2为约6nm。在另一个示例性实施方案中,h1为约10nm,并且h2为约7nm。在另一个示例性实施方案中,h1约为10nm,并且h2约为8nm。在另一个示例性实施方案中,h1约为10nm,并且h2约为9nm。在另一个示例性实施方案中,h1约为10nm,并且h2约为10nm。在另一个示例性实施方案中,h1为约5nm,并且h2为约2nm。在另一个示例性实施方案中,h1为约5nm,并且h2为约3nm。在另一个示例性实施方案中,h1为约5nm,并且h2为约4nm。在另一个示例性实施方案中,h1为约5nm,并且h2为约5nm。术语“约”和“大约”旨在表示高于或低于叙述数值的10%以内。
98.在一些实施方案中,纳米孔100的孔径103的第一直径d1为约100nm或更小,或约50nm或更小,或约20nm或更小,或约10nm或更小,或约5nm或更小,或约2nm或更小。例如,d1可以在约2nm和约100nm之间,或者在约5nm和约50nm之间,或者在约10nm和约20nm之间。在包含收缩部104的实施方案中,纳米孔100的收缩部104的第二直径d2为约100nm或更小,或约50nm或更小,或约20nm或更小,或约10nm或更小,或约5nm或更小,或约2nm或更小,或约1nm或更小。例如,d2可以在约1nm和约100nm之间,或者在约2nm和约50nm之间,或者在约5nm和约20nm之间。示例性地,d1可以在约5nm和约50nm之间,并且d2(如果适用)可以在约1nm和约5nm之间。
99.在一个例示性实施方案中,d1为约5至10nm,且d2为约1至1.2nm。在另一个例示性实施方案中,d1为约5至10nm,且d2为约1.2至1.4nm。在另一个例示性实施方案中,d1为约5至10nm,且d2为约1.4至1.6nm。在另一个例示性实施方案中,d1为约5至10nm,且d2为约1.6至1.8nm。在另一个例示性实施方案中,d1为约5至10nm,且d2为约1.8至2.0nm。在孔是mspa的示例性实施方案中,d1可以是例如约4.8nm,d2可以是例如约1.1至1.2nm,h1可以是例如约9.6nm,且h2可以是例如约7.9至8.1nm。在孔是α-溶血素的示例性实施方案中,d1可以是例如约2.6nm,d2可以是例如约1.4至1.5nm,h1可以是例如约10nm,并且h2可以是例如约5nm。对于其它类型的孔,可以适当地选择其它合适的尺寸组合。
100.永久性系链110的特征可以基于纳米孔100的尺寸中的一个或多个适当地选择。例
如,系链110的伸长体113可以具有基于d1或d2,或者d1和d2二者选择的宽度。例如,伸长体113的宽度可以选择为使得伸长体113在孔径103内可移动,例如伸长体113具有小于孔径103的第一直径d1的宽度。在包含收缩部104的实施方案中,也可以选择伸长体113的宽度,使得伸长体113的至少一部分可以邻近收缩部104移动,例如具有等于或小于第二直径d2的宽度。可选地,在包含收缩部104的实施方案中,伸长体113的宽度也可以选择为使得伸长体113的至少一部分能移动通过收缩部104,例如具有的宽度足够小于第二直径d2,以允许伸长体113移动通过收缩部104。如果纳米孔100包含多个收缩部(未具体显示),则可以选择伸长体113的宽度,使得伸长体113在适当时可移动通过这些收缩部中的一些或全部。
101.系链110的伸长体113的长度可基于h1或h2或h1和h2二者来选择。例如,伸长体113的长度可以选择为短于h1,使得即使伸长体113向第二侧102完全延伸通过收缩部104,尾部区112也不会延伸超过纳米孔100的第二侧102的外表面。或者,例如,在包含收缩部104的实施方案中,伸长体113的长度可以选择为短于h2,使得即使伸长体113完全向第二侧103延伸,尾部区112不会延伸超过纳米孔100的收缩部104。在其它实施方案中,伸长体113的长度可以选择为长于h1,使得如果伸长体113向第二侧102完全延伸通过收缩部104,尾部区112将延伸超过纳米孔100的第二侧102的外表面。或者,例如,在包含收缩部104的实施方案中,伸长体113的长度可以选择为长于h2,使得如果伸长体113完全向第二侧103延伸,则尾部区112将延伸超过纳米孔100的收缩部104。
102.可以选择伸长体113的长度,以便允许伸长体113在孔径103内,至少在纳米孔100的第一侧101上的相对自由移动,基本上没有由伸长体本身引起的空间位阻或其它干扰。也就是说,伸长体113可以配置为使得仅占据纳米孔100的第一侧101上的孔径103的体积的一部分,例如,以便占据纳米孔100的第一侧101上的孔径103的体积的小于50%,纳米孔100的第一侧101上的孔径103的体积的小于20%,或纳米孔100的第一侧101上的孔径103的体积的小于10%,或纳米孔100的第一侧101上的孔径103的体积的小于5%,或纳米孔100的第一侧101上的孔径103的体积的小于1%。另外,在图1a-1d所示的实施方案中,系链110的尾部区112可以不附着到纳米孔100或任何其它成员,从而允许整个伸长体113相对于头部区111的相对自由移动。或者,在诸如下面参考图4中的a-4、5a-5d、和6所述的实施方案中,尾部区112可以附着至另一成员以抑制聚合酶130从纳米孔100解离。
103.在非限制性的一个实例中,一个或多个报告物区114可以促进测量伸长体113的平移、旋转或构象运动或存在(或其组合),其响应作用于核苷酸120的聚合酶130,或者响应基于核苷酸120与第二多核苷酸140的序列中的下一个核苷酸互补或不互补的聚合酶130的构象改变,或响应作用于核苷酸120的聚合酶130以及基于核苷酸120与第二多核苷酸140的序列中的下一个核苷酸互补或不互补的聚合酶130的构象改变两者。在一个示例性实施方案中,适合地选择孔径103的尺寸d1以便促进使用报告物区来测量伸长体113的移动。例如,孔径103可以足够窄,以便响应报告物区144的移动可测量地与一个或多个报告物区144相互作用。作为一个实例,报告物区144具有电或通量阻断特征,并且孔径103具有选定的宽度,使得在纳米孔100间施加的电压下报告物区144的移动引起通过孔径103的电流或通量的可检测变化。例如,与具有较小伸长标签的t相比,较大的核苷酸(如a和g)当它们布置在孔径中时可导致更多的阻断,例如具有布置在mspa的收缩部中的伸长标签。阻断电流或通量的示例性范围(以开孔电流或通量的%计)包含0至10%、10%至20%、20%至30%、30%至
40%、、40%至50%、60%至70%、70%至80%、80%至90%和90%至100%。在一个示例性实施方案中,对于mspa,在300mm kcl中在180mv偏压和110pa的开孔电流或通量的情况下,该范围在20%至70%之间。本文更详细地提供报告物114的其他非限制性实例。
104.尽管图1a显示了纳米孔100、聚合酶130、和永久性系链110的组分的一种示例性排列,应当理解可以合适地使用其他排列。例如,取而代之,可以将锚定有头部区111的聚合酶130布置为邻近第二侧102。或者,例如,取而代之,永久性系链110的尾部区112可以布置在纳米孔100的第一侧101上。或者,例如,取而代之,永久性系链110的尾部区112可以锚定至纳米孔100的第一侧101或第二侧102,或者锚定至布置为纳米孔100的第一侧101或第二侧102的另一个成员。本文和临时专利申请(其通过引用并入本文)中描述了特征的一些此类组合,但应当理解所有此类特征的组合都是涵盖的,并且可以基于本文的教导容易想到。
105.本伸长体的长度可以适当地改变,使得本尾部区可以相对于纳米孔100布置在任何合适的位置。例如,伸长体113不需要必须足够长,使得尾部区112以图1a-图1d中所述的方式布置超出纳米孔100的第二侧102。相反,伸长体113可以足够长,使得尾部区112布置在纳米孔100的第一侧101上,或者可以足够长,使得尾部区112布置在纳米孔100的第二侧102上但不超出第二侧102。另外,本尾部区不需要必须自由延伸,但取而代之可以附着至任何合适的成员。
106.另外,应当理解,可以在本文中提供的实施方案中使用任何合适类型的纳米孔100、任何合适类型的聚合酶130,和任何合适类型的永久性系链110,例如如图1a-图1d中所示的。例如,如上进一步所述,纳米孔可以包含生物孔、固态孔或生物和固态杂合孔。例如,纳米孔100可以包含一种或多种固态材料。适用于固态纳米孔的示例性固态材料包含硅(si)、氮化硅(sin或sin
x
)、石墨烯和氧化硅(sio2或sio
x
)。关于固态纳米孔的更多细节,参见以下参考文献,其各自的全部内容通过引用并入本文:dekker,“solid-state nanopores,”nature nanotechnology 2:209-215(2007);schneider et al.,“dna translocation through graphene nanopores,”nano letters 10:3163-3167(2010);merchant et al.nano letters 10:2915-2921(2010);以及garaj et al.,“graphene as a subnanometre trans-electrode membrane,”nature 467:190-193(2010)。生物孔例如包含多肽孔和多核苷酸孔。生物孔可以布置在包含生物来源的膜或固态膜的屏障内。生物纳米孔的非限制性实例包括mspa和alpha溶血素。生物来源的示例性膜包含脂质双层。示例性的固态膜包含硅和石墨烯。关于示例性杂合纳米孔及其制备的进一步细节,参见以下参考文献,其各自的全部内容通过引用并入本文:hall et al.,“hybrid pore formation by directed insertion of alpha hemolysin into solid-state nanopores,”nature nanotechnology 5:874-877(2010),和cabello-aguilar et al.,“slow translocation of polynucleotides and their discrimination byα-hemolysin inside a single track-etched nanopore designed by atomic layer deposition,”nanoscale 5:9582-9586(2013)。
107.在如参考图7a-7d和图8的以下更为详细描述的一些实施方案中,图1a-图1d中所示的聚合酶130任选地可经修饰以在使用图1a-图1d中所示的组合物对多核苷酸测序期间延迟一个或多个反应参数。例如,聚合酶130任选地可经修饰使得延迟释放焦磷酸,其响应核苷酸130对第一多核苷酸140的掺入。
108.另外,应当理解,系链的首基(head group)可以以任何数目的方式附着到聚合酶。例如,可以使用诸如上述hermanson描述的公知的生物缀合物化学。在例示性实施方案中,聚合酶包含用于形成附着的化学部分,例如半胱氨酸,或肽接头,如spytag。关于spytag及其用于形成附着的用途的其它信息可以参见例如以下参考文献,其各自的全部内容通过引用并入本文:zakeri等人,“peptide tag forming a rapid covalent bond to a protein,through engineering a bacterial adhesin,”proc.nat.acad.sci.usa 109:e690-e697(2012),以及fierer等人,“spyligase peptide-peptide ligation polymerases affibodies to enhance magnetic cancer cell capture,”proc.nat.acad.sci.usa 111:e1176-e1181(2014)。其他示例性的接头包括:nhs-酯、异氰酸酯和异硫氰酸酯接头与胺的缀合、马来酰亚胺与半胱氨酸的缀合,使用叠氮化物与炔的点击化学,使用融合标签例如halotag,spycatcher-spytag和其它类似的蛋白质-蛋白质生物缀合方法。关于可以使用的示例性连接的更多信息,参见以下参考文献,其各自的全部内容通过引用并入本文:hermanson,bioconjugate techniques,第2版,elsevier,2008;zakeri等人,“peptide tag forming a rapid covalent bond to a protein,through engineering a bacterial adhesin,”pnas 109(12):e691-e697(2012);和liu等人,“specific enzyme immobilization approaches and their application with nanomaterials,”topics in catalysis55(16-18):1146-1156(2012)。
109.使用锚定至邻近纳米孔的聚合酶的系链对多核苷酸测序的示例性系统现在将参考图2a-图2b加以说明。图2a示意性地显示系统270,其包含如图1a-图1d中所示的组合物和测量电路(如电或光测量电路),所述测量电路配置为测量电流或通量状态,所述电流或通量状态基于伸长体113的第一部分115与聚合酶130正作用的核苷酸120的伸长标签121的结合,和通过一个或多个报告物区114指示何时该核苷酸与第二多核苷酸的序列中的下一个核苷酸互补或不互补(第二多核苷酸未在图2a中具体示出,但可以类似地配置为如图1a-1d所示)之一或两者。系统270包含纳米孔100、永久性系链110、核苷酸120、聚合酶130、和测量电路230。纳米孔100包含第一侧101、第二侧102、孔径103和收缩部104。永久性系链110包含头部区111、尾部区112,和伸长体113。核苷酸120包含伸长标签121和第二部分122。可以如本文其他地方所述类似地配置伸长体130。另外,伸长体113可以包含第一部分115以及报告物区114,所述第一部分115配置为结合聚合酶130正作用的核苷酸120的伸长标签121,所述报告物区114配置为指示何时核苷酸120与第二多核苷酸(未在图2a中具体示出,但可以如上文参照图1a-1d描述类似地配置)的序列中的下一个核苷酸互补或不互补。
110.在一个示例性的实例中,如图1a-图1d中所示的纳米孔100、系链110、核苷酸120、聚合酶130、以及第一和第二多核苷酸可以浸入导电流体,例如盐水溶液中。测量电路230可以与第一电极231和第二电极232通信,并且可以配置为在第一电极231和第二电极232之间施加电压,以在纳米孔100间施加电压。可以使用直流(dc)或交流(ac)电压。在一些实施方案中,测量电路230还可以配置为使用第一电极231和第二电极232来测量通过孔径203的电流或通量的幅度。在一些实施方案中,测量电路230还可以包含光学、生物或化学传感器,其分别配置为以光学、生物或化学方式感测通过孔径203的分子通量的幅度。示例性的光学传感器包含ccd和光电二极管。在一些实施方案中,测量电路包含一种或多种试剂,所述试剂与通过孔径103的分子通量发生化学或生物反应,以便产生可光学检测的信号。下文参考图
4中的f和图6描述可使用图2a中所示的系统270产生的示例性的信号(如光或电信号)。
111.可以配置系链110的伸长体113的第一部分115以产生至少一种信号,所述信号响应作用于核苷酸120的聚合酶130,基于此类信号可鉴定核苷酸120。例如,如上文参考图1b描述并在图2a中所示,第一部分115可以与伸长标签121的第二部分122相互作用(如结合,如杂交)。第一部分115与第二部分122的结合可以限定双链体,该双链体足够大而不能穿过纳米孔100的收缩部104,并取而代之可在第一电极231和第二电极232在纳米孔100间施加的电压下滞留在收缩部104内或邻近收缩部104。可以选择伸长标签121的部分122,使得可基于当双链体滞留在收缩部104内或邻近收缩部104时穿过孔径103的电流或通量的状态来鉴定核苷酸120。例如,核苷酸120的每个不同类型(如a、c、t或g)可以包含彼此不同的相应的伸长标签121,如每个包含结合第一部分115中彼此不同的部分的不同第二部分122。在一个非限制性实例中,伸长标签121包含第一核苷酸序列,并且第一部分115包含与第一核苷酸序列互补的第二核苷酸序列。测量电路230可以配置为测量穿过孔径103的对应电流或通量状态。此类电流或通量状态可基于伸长标签,可基于此类电流或通量状态来鉴定核苷酸120。
112.例如,第一核苷酸120(如a、c、t或g之一)的伸长标签121的部分122可以包含与第二核苷酸120(如a、c、t或g中的另一种)的伸长标签121的部分122不同的核苷酸序列,和与第三核苷酸120(如a、c、t或g中的又一种)的伸长标签122的部分122不同的核苷酸序列,以及与第四核苷酸120(如a、c、t或g中的剩余一种)的伸长标签122的部分122不同的核苷酸序列。示例性地,不同部分各自可结合(如杂交)至第一部分115中彼此不同的部分,并且当产生的双链体滞留在收缩部104内或邻近收缩部104(或在其它情况下与收缩部104相互作用)时,导致彼此不同的电流或通量状态。另外/或者,产生的双链体滞留在收缩部104中或邻近收缩部104(或在其它情况下与收缩部104相互作用)可以引起报告物区114布置在孔径103内的位置处,导致与其它双链体不同的电流或通量状态,并对应于该核苷酸。因此,基于穿过孔径的电流或通量状态,对应于聚合酶130正作用的特定核苷酸120的延伸标签122,可鉴定此类核苷酸。
113.报告物区114可以具有与伸长体113的一个或多个其它区域不同的物理、化学、电学、光学、生物或其它合适的通量阻断特性,并可经配置以鉴定核苷酸120或以指示何时核苷酸120由聚合酶130作用或与第二多核苷酸(未在图2a中示出,但可以如图1a-图1d中所示配置)的序列中的下一个核苷酸互补或不互补,或前述两者以鉴定核苷酸120并指示何时核苷酸120由聚合酶130作用或者与第二多核苷酸的序列中的下一个核苷酸互补或不互补。例如,报告物区可以提供或产生一个或多个独特电流或通量签名(signatures)(如信号状态),其单独鉴定所作用的核苷酸或单独指示核苷酸是否与第二多核苷酸的下一个核苷酸互补或不互补,或既单独鉴定所作用的核苷酸又单独指示核苷酸是否与第二多核苷酸的下一个核苷酸互补或不互补。例如,报告物区可以产生信号状态(如电流或通量状态),其响应核苷酸120由聚合酶130的活性位点结合或存在聚合酶130的活性位点中、核苷酸120与测序的多核苷酸中的下一个核苷酸互补或不互补、或者聚合酶130成功地在互补下一个核苷酸的位置处将核苷酸120掺入第二多核苷酸中的一些或所有(未在图2a中示出,但可如图1a-图1d中所示配置)。
114.例如,聚合酶130的构象改变的幅度或持续时间可以响应与第二多核苷酸的下一
个核苷酸互补或不互补的核苷酸120,并且相应信号的幅度或持续时间或两者可基于聚合酶130的构象改变。示例性地,在一些实施方案中,测量电路130可配置为检测报告物区114相对于收缩部104的位置,该位置可以指示何时聚合酶130作用的核苷酸与第二多核苷酸的序列中的下一个核苷酸互补或不互补。例如,报告物区114的位置可基于聚合酶130的构象改变,该改变可在聚合酶130以如本文其他地方描述的方式成功地将核苷酸120添加到第一多核苷酸时发生。另外,如本文其他地方提及的,在一些实施方案中,报告物区114相对于收缩部104的位置可基于核苷酸120的身份。因此,可通过系统270测量(光学或电学测量)的特定信号状态(如电流或通量状态)可以指示以下之一或两者:核苷酸120的身份和核苷酸120是否与测序的多核苷酸中的下一个核苷酸互补或不互补。
115.作为另一个实例,报告物区114可以具有与伸长体113的一些或所有其它区不同的物理性质。例如,报告物区114与伸长体113的其它区域相比可以引起通过孔径203的差异阻断电流或通量。另外/或者,报告物区114可以具有与伸长体113的一些或所有其它区域不同的电或通量阻断特性。例如,报告物区114可以包含静电电荷,而伸长体113的一些或所有其它区域可以包含不同的静电电荷,或者可以是不带电的(例如,可以是电中性的)。或者,例如,报告物区114可以是不带电荷的,而伸长体113的一些或所有其它区域可以包含静电电荷。或者,例如,报告物区114可以具有物理性质。物理性质包含报告物区114的体积和形状。在一个例示性实例中,报告物区114在孔径103内的移动通过调节通过孔径或收缩部的阻断电流或通量而引起通过孔径或其中的任选的收缩部104的电流或通量的可测量的变化。或者,例如,报告物区114可以具有促进化学或生物检测的化学或生物学特征。化学或生物学性质包含化学或生物基团的存在,例如放射性基团或具有酶促活性的基团。
116.报告物区114的一个或多个电学、物理、化学、光学、生物或其它通量阻断特征可以提供通过孔径103或收缩部104的电流的可测量变化、通过孔径103或收缩部104的分子通量的可测量变化、或光学信号。在一个例示性实例中,孔径103内的报告物区114的移动或存在引起通过孔径103或收缩部104的电流的可测量的变化,或引起通过孔径103或收缩部104的分子通量的可测量的变化,所述通量变化可以以电学、化学、生物或光学方式可检测。例如,报告物区114在孔径103或收缩部104内的存在或移动可以引起离子电流阻断或分子通量阻断,其可以以光学、电学、化学或生物方式检测。示例性地,反侧的分子梯度可以创建可以被报告物区114部分阻断的自然分子流。测量电路130可以配置为使用发光(例如,荧光或化学发光)分子的通量,或在其它试剂存在下变为化学发光的试剂的通量以非电学(例如,光学)测量此类分子通量。例如,ca
2+
可以从纳米孔的一侧流通到另一侧,在那里它遇到钙敏感染料,如fluo-2、fluo-4、fluo-8等,以诱导荧光。可以使用的其它试剂对包含但不限于鲁米诺(luminol)和氧化剂、钙和水母发光蛋白(aequorin)、或atp和萤光素酶,等等。关于通过孔径或收缩部的分子通量的光学检测的更多细节,参见ivankin等人,“label-free optical detection of biomolecular translocation through nanopore arrays,”acsnano 8(10):10774-10781(2014),其全部内容通过引用并入本文。
117.在诸如下文参考图4中的a-f、5a-5d和6更为详细描述的非限制性实施方案中,向纳米孔100间应用足够高的电压可以导致通过第一部分115和第二部分122形成的双链体彼此分离,这之后一个或多个报告物区114可布置在孔径103内的位置处,其基于聚合酶130的构象状态。因此,基于第一信号状态,可鉴定核苷酸120,并且第二信号状态可指示聚合酶
130的构象状态,该构象状态可指示何时核苷酸120与第二多核苷酸的序列中的下一个核苷酸互补或不互补。纳米孔100间的电压可以重复地反转(reverse),使得促进第一部分与第二部分彼此的重复结合,接着测量第一信号状态,接着使第一部分与第二部分彼此解离,接着测量第二信号状态,持续期望的次数以便鉴定聚合酶130作用的核苷酸120,并且以确定核苷酸120是否以期望的精确性与第二多核苷酸的序列中的下一个核苷酸互补或不互补。
118.在这方面,注意到以前已知的实时单分子测序技术相对易错并展示出相对差的精确性,因为此类技术可能未充分区分作用的核苷酸实际上是否与第二多核苷酸的序列中的下一个核苷酸互补或不互补,或取而代之是否此类核苷酸是具有聚合酶和引发核酸的“错配”复合物的成员。比较而言,本组合物、系统和方法可以鉴定作用的核苷酸,如基于第一信号状态,且还可以基于第二信号状态确定核苷酸是否与第二多核苷酸的序列中的下一个核苷酸互补或不互补(即匹配),并因此能大大提高多核苷酸测序的精确性。应当理解,用于产生信号状态的其他方案(如本文中提供)类似地可以大大提高多核苷酸测序的准确性,所述信号状态指示所述核苷酸是否与第二多核苷酸的序列中的下一个核苷酸互补或不互补。
119.例如,一个或多个报告物区114各自可具有与伸长体113的一些或所有其他区域不同的物理特性。在一些实施方案中,与伸长体113的其他区域相比,报告物区114可引起穿过孔径103的差异阻断电流或通量。另外/或者,报告物区114可具有与伸长体113的一些或所有其它区域不同的电流或通量阻断特性。例如,报告物区114可以包含静电电荷,而伸长体113的一些或所有其他区域可以包含不同的静电电荷,或可以是不带电荷的(如可以是电中性的)。或者,例如,报告物区114可以是不带电荷的,而伸长体113的一些或所有其他区域可以包含静电电荷。穿过孔径103的电流或通量的状态(如幅度)可以基于孔径103内报告物区114的位置,该位置可基于聚合酶130的构象状态,并且电流或通量状态的时间段可以基于位置中一个或多个报告物区的改变的持续时间。在一个示例性非限制性实例中,伸长体113包含多核苷酸,其包含限定报告物区114的一个或多个无碱基核苷酸。
120.在一个示例性的实施方案中,纳米孔100是生物纳米孔。生物纳米孔的非限制性实例包含mspa和alpha溶血素。系链111的报告物区114可以包含一个或多个无碱基残基,其配置为位于生物纳米孔的一个或多个收缩部104内或附近。一个或多个适当定位的无碱基残基移动通过任一孔的收缩部可导致容易可检测的信号,例如通过收缩部104的电流或通量的可检测变化。生物纳米孔,如mspa和alpha溶血素有效地可以包含可以用于聚焦报告物区114的效应的收缩部。例如,mspa包含具有约1.2nm的直径和约0.5nm的长度的单一收缩部,可以提供合适的空间分辨率,因为通过收缩部的离子电流或通量阻断的幅度主要基于穿过纳米孔的狭窄区(收缩部)的伸长体区段。
121.在一个示例性实施方案中,一个或多个报告物区114包括静电电荷,并且由系统270产生的第一和第二信号状态各自包含穿过收缩部104的电流或通量状态,所述第一和第二信号状态分别响应作用于核苷酸120的聚合酶(对于第一信号状态)并且指示何时核苷酸120与第二多核苷酸的下一个核苷酸互补或不互补(对于第二信号状态)。然而,应当理解,测量电路230可以包含促进任何合适的报告物区测量的元件或元件的组合,或与促进任何合适的报告物区测量的元件或元件的组合通信,并不需要一定基于测量穿过收缩部104的电流或通量或者甚至基于报告物区的移动。另外,报告物区114不需要一定附着至系链110,而是取而代之可以附着至核苷酸120或其他作用的分子,或可附着至聚合酶130。例如he等
人的美国专利公开号2011/0312529(其全部内容通过引用并入本文)公开了示例性的经修饰的聚合酶,其可以指示聚合酶(如构象标记的)的构象状态。
122.可基于系统270的特定构象来选择一个或多个报告物区(如报告物区114或布置在组合物和系统中其他位置处的报告物区)的特定性质,从而促进那些报告物区的测量。例如,一个或多个报告物区可具有光学特性,并且系统270可包含光学传感器,或与光学传感器通信,所述光学传感器配置为测量光学特性以及产生一种或多种信号状态,所述信号状态基于核苷酸120的身份或聚合酶130作用的核苷酸120何时与第二多核苷酸(未在图2a中具体示出,但可参考图1a-图1d中描述的那样配置)的序列中的下一个核苷酸互补或不互补,或基于核苷酸120的身份和聚合酶130作用的核苷酸120何时与第二多核苷酸的序列中的下一个核苷酸互补或不互补两者。在一个示例性实施方案中,报告物区114或布置在组合物和系统中其他地方的其他报告物区可包含第一fret对配偶体(如fret供体或受体),其与相应的第二fret对配偶体(如fret供体或受体)相互作用,以便发射测量电路230配置得检测的特定波长的光。或者,例如,报告物区114或布置在组合物和系统中其他地方的其他报告物区可具有化学或生物学特性,并且系统270可以包含化学或生物传感器或与之通信,所述传感器配置为测量化学或生物学特性并且当聚合酶130正作用的核苷酸120与第二多核苷酸(未在图2a中具体示出,但可参考图1a-图1d中描述的那样配置)的序列中的下一个核苷酸互补或不互补时,其产生第二信号状态。作为另一个实例,报告物区可提供调节穿过孔径或收缩部的分子通量的分子通量阻断,其中所述通量可以以光学、电学、化学或生物学方式检测。
123.在一个非限制性实例中,测量电路230配置为测量由报告物区114产生的信号状态,该信号状态响应焦磷酸或其他磷氧阴离子释放,所述焦磷酸或其他磷氧阴离子释放响应成功将核苷酸120掺入第一多核苷酸(未在图2a中具体示出,但可参考图1a-图1d中描述的那样配置)的聚合酶130。例如,报告物区114可配置为结合焦磷酸,该焦磷酸的释放响应以类似于下面参考图11a-图11c中描述的方式成功将核苷酸120掺入第一多核苷酸的聚合酶130。
124.在这方面,注意到聚合酶130任选地可以经修饰以延迟焦磷酸的释放,该释放响应核苷酸120对第一多核苷酸的掺入。例如,在一些实施方案中,聚合酶130可包含经修饰的重组φ29、b103、ga-1、pza、φ15、bs32、m2y、nf、g1、cp-1、prd1、pze、sf5、cp-5、cp-7、pr4、pr5、pr722,或l17聚合酶。在一些实施方案中,聚合酶130可以包含具有选自以下的至少一个氨基酸取代或取代组合的经修饰的重组φ29dna聚合酶:在位置484处的氨基酸取代,在位置198处的氨基酸取代和在位置381处的氨基酸取代。在一些实施方案中,聚合酶130可以包含具有选自下组的至少一个氨基酸取代或取代组合的经修饰的重组φ29dna聚合酶:e375y、k512y、t368f、a484e、a484y、n387l、t372q、t372l、k478y、i370w、f198w、和l381a。关于可延迟响应核苷酸掺入多核苷酸的焦磷酸释放的示例性的经修饰的聚合酶的进一步细节,参见bjornson等人的美国专利号8,133,672,其全部内容通过引用并入本文。
125.在另一个非限制性实例中,测量电路230配置为测量由报告物区114产生的信号状态,所述信号状态响应伸长标签121的释放,该伸长标签121的释放响应成功将核苷酸120掺入第一多核苷酸(未在图2a中具体示出,但可参考图1a-图1d中描述的那样配置)的聚合酶130。例如,报告物区114可配置为结合伸长标签121的部分,其释放响应成功将核苷酸120掺
入第一多核苷酸的聚合酶130。示例性地,如果将变构适体置于标签的接头部分上,则该适体可以暴露成功渗入后结合系链的寡核苷酸,所述变构适体可以识别新切割的焦磷酸并经历构象变化以暴露寡核苷酸。这种结合可以创建新的剥离(stripping)信号状态。例如,在一个非限制性实施方案中,附着至核苷酸的伸长标签可以包含能够以如图11a-图11c所示的方式与系链杂交的两个部分。一个此类部分可以在磷酸盐近端并因此可以在系链远端并接近聚合酶活性位点。第二个此类部分可以在核苷酸远端并能够在核苷酸在聚合酶活性位点中时结合系链。可以通过远端部分来创建第一剥离信号,只要核苷酸保持在活性位点中并且正发生电压循环(ac)(如本文其他地方所述)即可。此远端部分信号可以指示活性位点中核苷酸的类型。基于在没有磷酸切割和掺入的情况下离开活性位点的核苷酸,近端部分可以与系链杂交,并可创建凭借其对核苷酸的剩余附着而影响的剥离信号。此类信号状态可以指示并未掺入的核苷酸。基于发生的磷酸切割和掺入,近端部分可以与系链杂交并可以创建不同的剥离信号,因为该核苷酸不再存在。此类信号状态可以指示核苷酸掺入和磷酸切割。
126.应当理解,可以提供纳米孔阵列,以便彼此平行地对多个多核苷酸测序。例如,图2b示意性显示了系统260的平面图,所述系统260包含测量电路240,所述测量电路240配置为测量纳米孔阵列的相应孔径内的一个或多个相应报告物区的移动。多个系统250(每个可以类似于上面参考图2a描述的系统270来配置),可以彼此整体布置在共同的基底中,或者可以单独地制备并彼此相邻布置。每个系统250可以包含纳米孔100、系链(未具体显示的系链)和可寻址电极241。测量电路240可以类似于测量电路230进行配置,可以经由合适的通信路径,例如导体(显示用于仅单一系统250的通信)与每个系统250的每个可寻址电极241以及与共同的电极242为电通信。测量电路240可以配置为通过在所述纳米孔的可寻址电极241间和共同电极242间施加电压在每个纳米孔100间可选择性施加电压,并且可选择地测量应用电压下通过该纳米孔的电流或通量。类似的阵列可以容易地设想用于其它类型的检测系统,例如光,化学或生物检测系统。
127.现在将描述用于对多核苷酸测序的一些示例性方法和可在此类方法过程中使用的示例性组合物。一方面,方法包括提供纳米孔,其包含第一侧、第二侧,和延伸穿过所述第一侧和第二侧的孔径;提供多个核苷酸,其中所述核苷酸各自包含伸长标签;和提供第一和第二多核苷酸,所述第一多核苷酸与所述第二多核苷酸互补。方法还可以包括提供布置为邻近所述纳米孔的第一侧的聚合酶,所述聚合酶配置为基于所述第二多核苷酸的序列将所述多个核苷酸的核苷酸添加至所述第一多核苷酸,其中将所述聚合酶锚定至永久性系链,所述永久性系链包含头部区、尾部区和布置在它们之间的伸长体,所述伸长体出现在所述纳米孔的所述孔径中。方法还可以包括基于所述伸长标签与布置在所述伸长体上的第一部分的结合,确定所述聚合酶正作用于第一核苷酸;并且凭借布置在所述伸长体上的报告物区,指示何时所述第一核苷酸与所述第二多核苷酸的序列中的下一个核苷酸互补或不互补。
128.例如,图3显示了使用包含锚定至邻近纳米孔的聚合酶的系链的组合物对多核苷酸测序的示例性方法300。方法300包括提供纳米孔,其包含第一侧、第二侧,和延伸穿过所述第一侧和第二侧的孔径(步骤301)。纳米孔可以具有任何合适的构造,例如如以上参考图1a-图1d描述。例如,图1a所示的纳米孔100包含第一侧101、第二侧102和延伸穿过所述第一
侧和第二侧的孔径103。
129.步骤301也可以但不需要必需包括制备纳米孔。例如,步骤301可以包括限定屏障并且在屏障之上或之中布置纳米孔。制备纳米孔的方法是本领域已知的。例如,制备mspa纳米孔的例示性方法可以在butler等人,“single-molecule dna detection with an engineered mspa protein nanopore,”proc.natl.acad.sci.105:20647-20652(2008)中找到,其全部内容通过引用并入本文。或者,例如,制备alpha溶血素纳米孔的示例性方法可以在howorka等人,“sequence-specific detection of individual dna strands using engineered nanopores”,nature biotechnology 19:636-639(2001)和clarke等人,“continuous base identification for single-molecule nanopore dna sequencing”,nature nanotechnology 4:265-270(2009)中找到,两者的全部内容通过引用并入本文。
130.图3中所示的方法300还包含提供多个核苷酸,其中每个核苷酸包含伸长标签(步骤302)。例如,图9a示意性显示了包含伸长标签921的示意性核苷酸920,该伸长标签921包含第二部分922,其与用在检测聚合酶130正作用的核苷酸期间与图1a-图1d中描述的系链110的第一部分115相互作用。在图9a所示的非限制性实例中,示例性核苷酸920(如t)的伸长标签921可包含例如经由delta磷酸连接附着至核苷酸920的gamma磷酸的寡核苷酸部分922。寡核苷酸部分922可以包含选择为与系链110的部分115内相应核苷酸序列杂交的任何合适的核苷酸序列。例如,图9a中所示的寡核苷酸部分922可以包含示例性序列5’gcat 3’,并且部分115可以包含互补序列5’atgc 3’。
131.每种不同类型的核苷酸可以包含以与图9a所示类似的方式附着到其gamma磷酸或以其它方式适当地附着的相应的伸长标签。例如,图9b-图9c示意性显示了示例性核苷酸,其包含伸长标签,所述伸长标签包含在用于对多核苷酸测序期间与示例性系链相互作用的相应部分。如图9b所示,a,t,c和g核苷酸可以分别包含伸长的标签,其包含彼此不同的部分,例如分别由三角形,菱形,正方形和圆形表示。可以适当地选择特定部分以便与永久性系链的相应部分相互作用,例如杂交,并且诱导对系链的不同的相应构象变化。图9c显示了可以包含在图9b中所示的伸长标签中的部分的非限制性实例。每个此类部分可以与永久性系链的相应部分的不同的相应部分相互作用,例如杂交,以便诱导系链的不同的相应的构象变化。
132.例如,图9d示意性显示了包含头部区911,尾部区912和包含一个或多个报告物区914和部分915的伸长体913的示例性系链。头部区911可以包含化学接头,如3’马来酰亚胺(“mal”)基团,用于与孔上的半胱氨酸(cys)残基缀合。尾部区912可以包含带电荷的5'磷酸基团(“phos”),并因此有助于响应施加的电压将系链进入通过孔的孔径。伸长体913可以包含聚合物,例如如图9c所示的多核苷酸,或任何其它合适的聚合物,如生物聚合物或合成聚合物。报告物区914包含一个或多个表示为“x”的无碱基核苷酸,并且在一个示例性实施方案中,可位于距马来酰亚胺的约14-15个碱基处,其对于某些纳米孔类型可以大约是从孔口到孔收缩部的距离h2。部分915可以包含核苷酸序列,例如gggtatat,其与附着到待作用的a、t、c和g核苷酸上的每个部分可以彼此不同地相互作用,例如杂交。
133.如本文提供,附着至聚合酶的永久性系链的部分与被作用的核苷酸的部分之间的相互作用的不同类型可以产生信号状态,可以基于该信号状态来鉴定核苷酸或基于该信号状态可以确定核苷酸是否与测序的多核苷酸中的下一个核苷酸互补。根据本发明的一些实
施方案,图10a-图10b示意性显示了在用于对多核苷酸测序期间响应与示例性核苷酸的伸长标签的部分杂交的示意性系链的移动。系链的头部区1011锚定至布置为邻近纳米孔100的聚合酶1030,该纳米孔100任选地包含收缩部104,并且伸长体1013伸长穿过孔径1003,例如使得报告物区1014布置在收缩部1014内或邻近收缩部1014。在图10a-图10b所示的实施方案中,伸长体1013包含多核苷酸如ssdna,该多核苷酸的核苷酸由水平条1016表示。报告物区1014包含多核苷酸(如ssdna)的一个或多个无碱基位点。部分1015包含核苷酸序列,其选择为使得与被聚合酶1030作用的核苷酸的伸长标签的相应部分,例如核苷酸的互补序列杂交(被作用的核苷酸及其伸长标签,在图10a-10b中未具体显示)。
134.如图10a所示,在部分1015与被作用的核苷酸的相应部分结合之前,核苷酸1016彼此间隔约5埃。另外,聚合酶1030可以具有对应于核苷酸的构象状态,该核苷酸不被聚合酶的活性状态结合或不存在于聚合酶的活性状态中。如图10b所示,响应部分1015与所作用的核苷酸的相应部分的相互作用(例如杂交),例如响应形成双链dna双链体的部分,部分1015内的核苷酸1016之间的间距降低至约3.3埃。可以通过从ssdna创建双链dna(dsdna)来诱导系链长度的变化,该ssdna各自包含在部分1015和所作用的核苷酸标签的部分内。例如,ssdna比dsdna长约1.5埃/核苷酸,其在本系统(如图2a所示的系统270或图2b所示的系统260)的分辨率限内。每个核苷酸可以包含对应的寡核苷酸部分,该寡核苷酸部分选择为在所述部分与部分1015杂交后,创建不同长度的dsdna,从而将系链缩短对应于被聚合酶1050作用的核苷酸的距离。在一些实施方案中,完全拉紧的系链的缩短量的公式,如响应施加的电压延伸穿过孔的系链可以表示为:
135.ds=n*(l
ss-l
ds
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
136.其中n是杂交的碱基数,ds是系链缩短的距离,l
ss
是ssdna中核苷酸之间的长度(约5埃),并且l
ds
是dsdna中核苷酸之间的长度(约3.3埃)。图10b中的短黑色垂直线指示5碱基杂交事件,其缩短系链并将报告物区1014移动到新位置。例如如图9c-图9d所示,6、7或8个碱基的双链体可以比图10b中所示的更短。
137.另外,基于所作用的核苷酸是否与测序的多核苷酸(多核苷酸未明确示出)中的下一个核苷酸互补或不互补,聚合酶1030的构象可以改变。例如,如图10b所示,聚合酶1030可以具有修饰的构象1030’,其基于核苷酸是与测序的多核苷酸的序列中的下一个核苷酸的匹配,这引起报告物区1014布置在孔径1003内的位置,从而导致穿过孔径1003的独特电流或通量,基于该电流或通量可以确定该核苷酸是否是匹配。相较而言,聚合酶1030可具有不同的修饰的构象,其基于核苷酸不是与测序的多核苷酸的序列中的下一个核苷酸的匹配,这引起报告物区1014布置在孔径1003内的位置处,从而导致穿过孔径1003的独特电流或通量,基于该电流或通量可以确定该核苷酸是否是错配。在这方面,注意到特定信号状态(如电流或通量状态)可以指示核苷酸的身份和是否核苷酸是匹配或错配两者。因此,应当理解,不同的信号状态(其可以表示核苷酸的身份或此类核苷酸是否是匹配或错配)不需要一定在彼此不同的时间发生,并确实可以彼此同时发生。例如,测量信号(如光学或电学)可以包含超过一个信号状态(如两个信号状态)的复合(composite),每个所述信号状态提供关于核苷酸的身份或是否此类核苷酸是匹配或错配中的一项或多项的信息。
138.注意,图9a-9d中所示的部分旨在纯粹是示例性的,而不是对本发明的限制。然而,可以选择附着到待作用的核苷酸的部分,以满足一个或多个以下参数,并且任选地满足以
下所有参数:
139.1.附着到彼此不同类型的核苷酸的部分可以以可彼此区分的方式与系链的部分相互作用,例如经由测量通过孔收缩部的电流或通量。
140.2.核苷酸部分和系链的相应部分之间的双链体的稳定性足够低,使得附着到“游离”核苷酸(不被聚合酶作用,因此与系链瞬时相互作用的核苷酸)的此类部分仅与系链的部分短暂相互作用,例如小于1msec。例如,核苷酸部分和系链部分之间的双链体的稳定性可以表示为双链体的tm或解链温度。系统操作温度预期为约20℃或室温。预期约5-8个核苷酸长的部分具有tm《12℃,其可在室温下提供足够低的稳定性,使得附着到“游离”核苷酸的部分将仅与该系链的部分短暂相互作用。
141.3.核苷酸部分和系链的相应部分之间的双链体的稳定性足够高,使得当在掺入期间核苷酸被聚合酶作用并由聚合酶保持就位几毫秒(例如1至30msec)时,此类作用增加核苷酸部分相对于系链部分的有效浓度,其驱动部分之间的反应向前并增加稳定性,使得双链体的有效tm大于20℃(或系统的预期操作温度),例如大于30℃,或大于40℃,或大于50℃。
142.4.被作用的核苷酸的伸长标签的长度,例如,部分和gamma磷酸之间的长度可以足够长,使得当该部分稳定地杂交到系链的相应部分时,基本上不存在对核苷酸的力。如果该长度太短,则系链可以对核苷酸的伸长标签施加力,这预期导致降低的聚合酶效率。
143.5.凭借附着至聚合酶的系链,预期报告物的位置随聚合酶的活性位点中的核苷酸是否是匹配或错配而变化,因为聚合酶的构象可受到核苷酸与被测序的多核苷酸中的下一个核苷酸的互补性,和因此报告物区在孔径内的相对位置,如相对于收缩部的位置影响。以这种方式,可以根据报告物在孔径中的位置来辨别核苷酸的身份以及核苷酸的互补性。
144.关于将寡核苷酸彼此杂交的进一步信息,参见turner等人的美国专利号8,652,779,其全部内容通过引用并入本文。根据turner等人,在此类大小规模下,寡核苷酸应当比聚合酶可以掺入核苷酸快约100倍对其构造空间取样。将此类原理应用于本组合物,据信被作用的核苷酸的部分可能容易地“发现”系链的相应部分并且与系链的相应部分相互作用,并且还将在从被作用的核苷酸切割部分后从系链解离。
145.注意,在图9d中所示的示例性部分中,附着于被作用的核苷酸的每个部分仅与包含5至8个碱基的相应的系链部分915具有仅单一匹配杂交。虽然存在不会导致完全杂交的其它杂交选项,但是此类选项可以预期明显不如全长选项稳定。
146.再次参见图1a-图1c,聚合酶130对核苷酸120的作用可以维持部分122相对紧密邻近系链的部分115,导致寡核苷酸部分122的局部浓度的瞬时增加,这可以相对于附着至当前不被聚合酶130作用的核苷酸的部分优先诱导部分122和155之间的临时杂交。另外,如上所述,在将核苷酸120掺入多核苷酸后,聚合酶130能够切割伸长标签121,对这响应,部分122可以从部分115解离。可以容易地想出用于提供包含伸长标签的核苷酸的合适方法。
147.图3中所示的方法300还包括提供第一和第二多核苷酸,第一多核苷酸与第二多核苷酸互补(步骤303)。例如,步骤303可以包括提供第二多核苷酸,该第二多核苷酸也可称为“靶物”或“模板”,其是期望被测序的。步骤303还可以包含使用已知的方法提供与第二多核苷酸互补,但可以短于第二多核苷酸的第一多核苷酸。示例性地,第一多核苷酸可以包含与第二多核苷酸的部分互补或与之杂交的引物。
148.图3中所示的方法300还包括提供布置为邻近纳米孔的第一侧的聚合酶(步骤304)。聚合酶可以配置为基于第二多核苷酸(步骤303中提供)的序列将多个核苷酸的核苷酸(步骤302中提供)添加到第一多核苷酸(也在步骤303中提供)。示例性的合适的聚合酶在本文其他地方描述或者是本领域已知的。任选地,可以修饰聚合酶以便生成基于聚合酶构象的信号,如he等的美国专利公开号2011/0312529描述的,或者以便减缓焦磷酸的释放,如美国专利号8,133,672中描述的,两者的全部内容通过引用并入本文。
149.另外,步骤304中提供的聚合酶可以锚定至永久性系链,该永久性系链包含头部区、尾部区和它们之间的伸长体,伸长体包含一个或多个报告物区,头部区锚定至或邻近纳米孔的第一侧或第二侧。系链可以具有如上文参照图1a-图1d的或本文另外提供的任何合适的构象。例如,系链的伸长体可以具有比限定纳米孔厚度的第一尺寸h1长的长度,例如如图1a-图1d所示。或者,例如,伸长体可以具有与限定纳米孔厚度的第一尺寸h1相等的长度,或比所述第一尺寸h1短的长度。或者,例如,在包含收缩部的实施方案中,伸长体可以具有比限定收缩部深度的第二尺寸h2更长的长度,例如如图1a-图1d所示。或者,例如,在包含收缩部的实施方案中,伸长体可以具有比第二尺寸h2更短的长度。或者,例如,一个或多个报告物区可以布置在沿着伸长体的位置,其被选择为使得基于当头部区锚定到聚合酶时完全或部分延伸的伸长体,聚合酶邻近纳米孔,并且伸长体的第一部分115与伸长标签的第二部分122解离,报告物区可定位在纳米孔的孔径内,例如,邻近收缩部或在收缩部内,如图1a-图1d所示。可以使用这些特征的任何合适的组合。
150.步骤304也可以但不需要必需包含制备系链。例如,步骤304可以包含限定伸长体,其包含限定头部区,尾部区和一个或多个报告物区的其部分。例如,如本文别处描述,系链可包含dna。可以使用本领域熟知的方法制备足够长度的dna寡核苷酸。例如,具有5’或3’伯胺的寡核苷酸可以从诸如integrated dna technologies,inc.(coralville,iowa)的供应商商购。寡核苷酸可以是订购的,以便包含一个或多个无碱基部分,其可以用作如本文中描述的一个或多个报告物区。包含胺反应性基团(nhs)和硫醇反应基团(马来酰亚胺)的双官能接头,例如磺基-smcc(磺基琥珀酰亚胺基-4-(n-马来酰亚胺基甲基)环己烷-1-羧酸酯)可以容易地从商业来源获得,例如来自thermo fisher scientific,inc.(rockford,illinois)。此类接头可以在本领域熟知的适当反应条件下与寡核苷酸反应,形成稳定的酰胺键。在从未反应的磺基-smcc纯化寡核苷酸后,修饰的寡核苷酸(其凭借其马来酰亚胺基团现在是硫醇反应性的)可以与聚合酶反应。聚合酶可以预先制备,以便包含至少一种溶剂可及的半胱氨酸残基,该半胱氨酸残基具有其还原形式的硫醇(sh)基团。例如,还原形式可以通过与5mm三(2-羧基乙基)膦(tcep)(其是容易获得的市售化合物)一起温育而获得。修饰的寡核苷酸可以例如以摩尔过量与还原的聚合酶在本领域熟知的反应条件下组合,使得马来酰亚胺形成稳定的硫醚键。可以从过量的未反应的寡核苷酸中纯化聚合酶-寡核苷酸缀合物。在另一个实例中,适合包含在基于聚乙二醇(peg)的系链中的化合物,例如马来酰亚胺-peg,可容易地从商业来源,如laysan bio,inc.(arab,alabama)获得。例如,马来酰亚胺可以以与上述类似的方式与还原性半胱氨酸硫醇缀合。可以在peg内限定一个或多个合适的报告物区。在另一个实例中,寡核苷酸和α溶血素纳米孔之间的二硫键可以以如howorka等人,“kinetics of duplex formation for individual dna strand within a single protein nanopore”,pnas98:12996-13301(2001)(其全部内容通过引用并入本文)
描述的方式制备。
151.步骤304还可以包括将系链的伸长体布置在纳米孔的孔径内。基于伸长体的长度,伸长体可以但不需要必需一直伸长穿过纳米孔的孔径。例如,在如上参考图1a-图1d描述的实施方案中,系链的伸长体任选地可以足够长,使得系链的尾部区与系链的头部区布置在纳米孔的收缩部(如果存在的话)的不同侧,并任选地可以与系链的头部区相比布置得超出纳米孔的不同侧。示例性地,通过向系链的伸长体施加合适的定向力,系链的伸长体可以布置在纳米孔的孔径内。例如,可以以如本文参考图2a-图2b中描述的方式在纳米孔间施加电压,并且系链的伸长体可以包含至少一个带电部分,其基于电压将系链的尾部区吸引到纳米孔的侧面,该侧面与系链的头部区被附着到的或将系链的头部区附着到第一成员的侧面相反,并且引起尾部区的移位,以便将系链的伸长体的全部或一部分布置在纳米孔的孔径内。
152.另外,步骤304任选地可以包含将聚合酶布置为邻近纳米孔的第一侧。例如,聚合酶可使用化学键(例如共价键,氢键,离子键,偶极-偶极键,伦敦分散体,或其任何合适的组合)附着到纳米孔的第一侧或其附近。或者,例如,可以使用聚合酶上的第一蛋白质结构和附着到或邻近于纳米孔的第一侧的第二蛋白质结构之间的相互作用将聚合酶附着到纳米孔的第一侧。例如,第一和第二结构可以包含彼此互锁的alpha螺旋。纳米孔的第一侧附近的聚合酶附着可以是永久的,使得聚合酶相对于纳米孔的第一侧保持在大致固定的位置。
153.在一个例示性实施方案中,聚合酶或纳米孔的半胱氨酸残基的还原硫醇(-sh)基团(也称为巯基)可以与另一聚合酶或纳米孔的硫醇反应性基团反应。这些基团的实例包含马来酰亚胺和碘乙酰胺。如在www.lifetechnologies.com/us/en/home/references/molecular-probes-the-handbook/thiol-reactive-probes/introduction-to-thiol-modification-and-detection.html#head2中更详细描述的,包含碘乙酰胺,马来酰亚胺,苄基卤化物和溴甲基酮的伯硫醇反应试剂可以通过硫醇的s-烷基化反应,以产生稳定的硫醚产物;芳基化试剂如7-硝基苯-2,1,3-恶二唑(nbd)卤化物可以通过亲核试剂类似取代芳族卤化物与硫醇或胺反应;并且因为硫醇盐阴离子是比中性硫醇更好的亲核体,所以半胱氨酸在其pka以上更具反应性。此外,如在www.piercenet.com/method/sulfhydryl-reactive-crosslinker-chemistry中更详细描述的,巯基反应性化学基团包含卤代乙酰基,马来酰亚胺,氮丙啶(aziridines),丙烯酰基(acryloyls),芳基化试剂,乙烯基砜,吡啶基二硫化物,tnb-硫醇(2-硝基-5-硫代苯甲酸)和二硫化物还原剂;此类基团可以通过烷基化(例如通过硫醚键的形成)或二硫化物交换(例如形成二硫键)与巯基缀合。也可以适当地使用巯基交换反应。或者,可以靶向胺(-nh2)。例如,赖氨酸残基的伯胺和多肽n-末端是相对反应性的。胺残基可以用可以形成稳定的酰胺键的n-羟基琥珀酰亚胺酯(nhs酯)或可以与伯胺反应形成脒键的亚氨酸酯交联剂进行靶向。存在许多其它胺反应性化合物。例如,如www.piercenet.com/method/amine-reactive-crosslinker-chemistry描述,可与伯胺形成化学键的合成化学基团包含异硫氰酸酯,异氰酸酯,酰基叠氮化物,nhs酯,磺酰氯,醛,乙二醛,环氧化物,环氧乙烷,碳酸酯,芳基卤化物,亚氨酸酯,碳二亚胺,酸酐和氟苯基酯;此类基团可以与胺缀合,例如通过酰化或烷基化。在其它实施方案中,修饰的氨基酸残基可以用于引入新颖的功能性,如与点击化学一起使用的叠氮化物或炔。例如,如上描述的硫醇或胺反应性可以与允许添加叠氮化物或炔官能团以进一步用于点击化学反应的接头一起使
用。
154.图3中所示的步骤304任选地还可以包含将系链的尾部区附着到纳米孔的第一侧或第二侧中的另一个或附着到第二成员。可以适当地使用如本文提供的或本领域另外已知的任何合适的附着。例如,步骤304任选地可以包含将系链的尾部区附着到纳米孔的第二侧。或者,例如,步骤304任选地可以包含将系链的尾部区附着到第二成员(如寡核苷酸),其布置在与头部区侧相反的纳米孔侧上。在这方面,注意到聚合酶130不需要必需锚定到纳米孔的第一侧以使聚合酶130保持与纳米孔结合。例如,在一些条件下,将定向力施加到系链的伸长体可以引起尾部区的移位,以便将所有系链布置在纳米孔的孔径内。足够大的力可以使附着到系链上的聚合酶暂时滞留在纳米孔中或纳米孔上。虽然就物理构造而言不意图是限制的,但是结果可以称为聚合酶对纳米孔的“栓塞(corking)”。可以通过限制系链上的力(例如,在纳米孔间施加小于180mv),限制施加在系统上的力的持续时间,或使用大得足以避免栓塞相互作用的蛋白质来抑制或避免栓塞。或者/另外,可以向系统施加反向电压以逆转蛋白质和纳米孔之间的相互作用(称为“拔塞(uncorking)”)。抑制或避免栓塞或促进拔塞的另一选项是从纳米孔开口除去带电荷的氨基酸或在蛋白质表面上的互补电荷,以便降低两种组分之间的电荷亲和力。可以进一步有利的是向蛋白质的结构添加交联(例如,用于二硫化物交联的工程化半胱氨酸对或化学交联剂),以稳定蛋白质的球状结构。
155.可以基于与由纳米孔系统的其它构造产生的样式不同的特征电流或通量样式来观察栓塞。例如,当对纳米孔系统施加正或负偏压(negative bias)时,可以观察到独特的样式。因此,可以在装配或使用包含蛋白质的系统的过程中检测电流或通量或光学样式,所述蛋白质通过附着到蛋白质并布置在纳米孔腔中的系链定位于纳米孔。样式的检测可以用于监测装配(例如,以避免栓塞),引导拔塞,或以其它方式优化期望的装配。
156.注意,由于系链的头部区附着至聚合酶,此类定向力也可以以本文参考图1a-图1d中描述的方式使聚合酶邻近纳米孔的孔径或全部或部分布置在纳米孔的孔径内。例如,将尾部区向纳米孔侧吸引还可以引起第一成员向邻近纳米孔的孔径或全部或部分布置在纳米孔的孔径内的位置移位,所述纳米孔侧与系链的头部区附着到第一成员的侧面相反。当聚合酶处于该位置时,系链110的尾部区112可以锚定至另一个成员,如可以与同系链的尾部区112上的寡核苷酸互补的寡核苷酸杂交,并且尾部区112的此类锚定可以抑制聚合酶从纳米孔100解离。
157.图3所示的方法300还包括基于伸长标签与布置在伸长体上的第一部分的结合来确定聚合酶作用于第一核苷酸(步骤305)。例如,如上参考图1a-图1d和图2a-图2b所述,伸长体的第一部分115和伸长标签的第二部分122之间的结合可以限定产生第一信号状态(如第一电学或光学信号状态)的双链体,该第一状态可通过例如图2a所示的测量电路230或图2b所示的测量电路240的合适的测量电路检测。不同的核苷酸可以包含彼此不同的部分122,所述部分可以产生彼此不同的信号,从而促进基于所得信号鉴定被聚合酶130作用的特定核苷酸。
158.图3所示的方法300还包括凭借沿着伸长体布置的一个或多个报告物区,指示何时第一核苷酸与第二多核苷酸的序列中的下一个核苷酸互补或不互补(步骤306)。例如,如上参考图1a-图1d和图2a-图2b所述,可以配置报告物区以产生信号状态,所述信号状态响应与第二多核苷酸中的下一个核苷酸互补的第一核苷酸,如基于聚合酶的构象变化,焦磷酸
或其他合适的磷氧阴离子的释放,核苷酸的伸长标签的释放等。
159.例如,聚合酶可以在称为“开放状态”(其中聚合酶不结合核苷酸)的情况与“闭合状态”(其中聚合酶结合核苷酸)之间转换。参见例如xia等人,“alteration in the cavity size adjacent to the active site of rb69 dna polymerase changes changes its constructational dynamics”,nucl.acids res.(2013),nar.gkt674,其全部内容通过引用并入本文。还参见santoso等人,“conformational transitions in dna polymerase i revealed by single-molecule fret,”proc.natl.acad.sci.natl.acad.sci.u s a,107(2):715-720(2010),其全部内容通过引用并入本文。
160.已知当聚合酶从开放状态转变为闭合状态时,或者当聚合酶转换为编辑模式时,在核苷酸掺入的催化循环期间发生几纳米量级的构象变化。例如,图7a-图7b示意性显示两种不同聚合酶中相对大的聚合酶构象变化(》1nm)。图7a显示了rb69聚合酶,其显示相对较大的构象变化,其导致拇指结构域和指结构域之间的相对移动,在开放和闭合构象之间经历超过3nm的移动,如xia等人所述。图7b显示了pol i(klenow片段或kf),其在核苷酸掺入期间经历构象变化,如santoso等人公开。聚合酶的α-碳主链以米色显示。dna模板链为深灰色,引物链为浅灰色。活性位点处的末端碱基对是品红色。根据santoso,两个侧链的β碳用作荧光团附着位点,显示为绿色和红色球,以测量聚合酶的构象变化。箭头表示在开放和关闭构象中绿色和红色cβ位置之间的距离(以埃计)。还有证据表明,聚合酶的构象变化可以取决于所掺入的核苷酸的身份,例如,如olsen等人,“electronic measurements of single-molecule processing by dna polymerase i(klenow fragment)”,jacs 135:7855-7860(2013),其全部内容通过引用并入本文。在本公开的纳米孔实施方案中,当系链附着到拇指结构域时,可以将指结构域锚定到纳米孔。或者,拇指结构域可锚定到纳米孔,同时系链附着到手指结构域。在任一构建体中,在聚合酶活性期间发生在手指和拇指结构域之间的相对移动可以被检测为系链和纳米孔之间的相对移动。本文引用的参考文献中的用于附着光学探针(例如,fret对)的附着化学物质可用于本文阐述的纳米孔实施方案中。可以在聚合酶-纳米孔构建体中使用其它附着点,只要聚合酶中的构象变化可靠地作为系链和纳米孔之间的相对移动传递。
161.图7c-图7d示意性显示了包含永久性系链的示例性组合物,所述永久性系链锚定到邻近纳米孔布置的聚合酶,并且配置用于检测响应聚合酶对核苷酸的作用的聚合酶的构象变化。纳米孔包含生物孔605,其可以布置在屏障(未具体显示)中,例如生物来源的膜,如脂质双层或固态膜。生物孔605包含孔径603和收缩部604。永久性系链包含头部区611,伸长体613和一个或多个报告物区614。聚合酶650邻近生物孔605布置,并且任选地可以附着到生物孔605。聚合酶650配置为接收模板多核苷酸,例如待测序的环状或线性ssdna,以通过按照ssdna的序列序贯接收,结合和添加核苷酸至多核苷酸来合成具有与ssdna序列互补的序列的多核苷酸。永久性系链的头部区611可以锚定到聚合酶650的位置,所述聚合酶650经历构象变化,例如响应接收核苷酸,结合核苷酸或向多核苷酸660添加核苷酸,并且将报告物区614移动到相对于收缩部604的足够不同位置,以便产生信号,该信号指示何时被作用的核苷酸与ssdna的序列中的下一个核苷酸互补或不互补。例如,头部区611可以附着到聚合酶的指区或聚合酶的拇指。在美国专利公开号2011/0312529 a1(其全部内容通过引用并入本文)中阐述了聚合酶的手指和拇指区中的示例性附着点和用于将部分附着到这些点的
化学物质。
162.关于家族a和b聚合酶的结构和功能的更多细节,参见patel等人,“getting a grip on how dna polymeraseases function”,nature structural biology 8:656-659(2001),其全部内容是通过引用并入本文。关于聚合酶如pol i的结构和功能的进一步细节,参见以下参考文献,其各自的全部内容通过引用并入本文:olsen等人,“electronic measurements of single-molecule processing by dna polymerase i(klenow fragment,”jacs 135:7855-7860(2013);torella等人,“identifying molecular dynamics in single-molecule fret experiments with burst variance analysis”,biophysics j.100:1568-1577(2011);santoso等人等人,“conformational transitions in dna polymerase i revealed by single-molecule fret,”proc.natl.acad.sci.usa,107(2):715-720(2010),markiewicz等人,“single-molecule microscopy single-molecule microscopy reveals new insights into nucleotide selection by dna polymerase i”,nucleic acids res.40:7975-7984(2012);gill等人,“dna polymerase activity at the single-molecule level”,biochem.soc.trans.39:595-599(2011)和johnson等人,“processive dna synthesis observed in a polymerase crystal suggested a mechanism for the prevention of frameshift mutations,”proc.natl.acad.sci.usa 100:3895-3900(2003)。从上述参考文献(或本文引用的其它参考文献)中已知的在聚合酶活性期间经历相对位置变化的任何两个残基或结构域可以分别充当本公开的实施方案中的纳米孔和系链的附着点。
163.在一个实例中,可以例如使用测量电路230和电极231,232(如上面参照图2a进一步描述),或测量电路240和电极241,242(如上面参照图2b进一步描述)在纳米孔605间施加电压。报告物区614或伸长体613包含静电电荷,其响应所施加的电压而引起伸长体613延伸通过收缩部604,使得当伸长体613的第一部分615不结合被作用的核苷酸的伸长标签的第二部分时,报告物区614布置在收缩部604部内或收缩部604附近。任选地,当伸长体613的第一部分615不结合被作用的核苷酸的伸长标签的第二部分时,所施加的电压可引起伸长体613变得拉紧。如本文其他地方所述,当伸长体613的第一部分615结合被作用的核苷酸的伸长标签的第二部分时,所得的双链体在纳米孔间施加电压下滞留在纳米孔的收缩部中或邻近纳米孔的收缩部,导致第一信号状态,基于该第一信号状态可以鉴定核苷酸。如图7d所示,随着聚合酶605的蛋白质结构域移动,例如相对于图7d中所示的构象改变构象,此类移动可以对头部区611施加力,该头部区611在伸长体613上施加力,所述伸长体613在报告物区614上施加力,导致在孔径603内报告物区614的平移移动,例如相对于收缩部604的移动。因此,聚合酶650的构象变化可以被转化或转换成通过孔径603的电流或通量的可测量变化,其也可以被称为阻断电流或通量。基于此类第二信号状态可以检测被作用的核苷酸是否与ssdna的下一个核苷酸互补或不互补。
164.在一个例示性实施方案中,使用修饰的核苷酸构建报告物区614。例如,与包含碱基的残基,如dt残基相比,无碱基核苷酸通常产生70pa阻断电流,所述dt残基在包含10mm 4-(2-羟乙基)-1-哌嗪乙磺酸(hepes)缓冲液ph8.0,300mm kcl,1mm mgcl2,1mm dl-二硫苏糖醇(dtt),mspa m2突变体孔(d90n,d91n,d93n,d118r,d134r&e139k),在1,2-二植烷酰-sn-甘油基-3-胆碱磷酸(1,2-diphytanoyl-sn-glycero-3-phosphocholine dphpc)双层间
180mv的条件下仅产生20pa阻断电流。
165.无碱基残基在例如仅几埃的量级上的移动可以引起容易检测到的电流或通量的变化,例如,从一个到几十个pa。由于一些聚合酶在纳米级上移动,并且系链中的单个碱基对应于约0.5纳米,预期可以产生由接受系链锚定的聚合酶中的构象变化引起的系链移动,并且容易转导到电流或流量。由于聚合酶的特定构象可以基于聚合酶作用的核苷酸是否与ssdna中的下一个核苷酸互补或不互补,可以基于信号状态(电流或通量状态)来确定合适核苷酸与ssdna中的下一个核苷酸互补或不互补。另外,由于核苷酸的身份影响构象变化的幅度以及在闭合状态中花费的时间两者,信号状态(电流或通量状态)也潜在可以在核苷酸被掺入时单独鉴定它们,以便确认基于第一信号状态的步骤305的核苷酸鉴定。例如,在如图5b所示的一些实施方案中,可以通过与部分522杂交的报告物514的位置来揭示核苷酸的身份。相应的信号在图6,部分“b”中示出。如果存在如图5c中的完美匹配,则聚合酶可以采取特定的构象。相应的信号描绘于图6,部分d中。图6中的部分“c”和“d”中的信号是独特的,并且可以独特地分别表示匹配或错配。
166.聚合酶构象变化的幅度或持续时间或两者可基于聚合酶作用的特定核苷酸。表1列出了示例性单分子动力学参数,其使用附着至单一聚合酶的swnt中的电流变化对模板的klenow片段处理测量,并由olsen等人报道。在表1中,τ
lo
对应于在聚合酶的闭合构象中花费的时间的持续时间,r
lo
对应于τ
lo
的平均归一化方差,τ
hi
对应于在聚合酶的开放构象中花费的时间的持续时间,r
hi
对应于τ
hi
的平均归一化方差,并且速率对应于加工速率,例如聚合酶多么快速将核苷酸加入模板。olson等人报告了平均幅度h是酶的机械闭合程度的代表。对于本系统,方法和组合物,值h可以被认为是聚合酶上两个参考点之间的构象变化程度,以距离单位测量。例如h可以对应于受核苷酸匹配或错配影响的机械闭合的幅度。
167.表1:
[0168][0169]a.平均值
±
标准差
[0170]
7858 dx.doi.org/10.102l/ja311603r|j.am.chem.soc.2013,135,7855-7860
[0171]
使用本文提供的组合物、方法和系统,与开放状态的时间持续τ
hi
,构象变化的幅度h和处理的速率相关的信号可以用于指示何时第一核苷酸与ssdna的下一个核苷酸互补或不互补,并且可以根据每个碱基的独特签名来潜在区分信号。掺入率也可以通过选择性使用修饰的核苷酸(例如alpha-或gamma硫醇核苷酸)而大大改变。参见he等人的美国专利公开号2011/0312529,其全部内容通过引用并入本文。
[0172]
在一个例示性实施方案中,模板dna被环化,并且聚合酶650是链置换聚合酶(如phi29)。以这种方式,可以以如本领域已知的滚环模式对模板进行多次测序。此类实施方案还可以抑制无意中将模板dna拉入或通过收缩部604,因为只有ssdna可以移位。可以通过收缩部604(或者如果使用线性模板)找到其路径的任何杂散ssdna预期快速转移并且预期表现为信号中的噪声。或者,可以在相反的极性下使用一个或多个带正电荷的报告物区614,
使得只有报告物区被吸入收缩部604中,而带负电荷的dna将被排斥。
[0173]
在一些实施方案中,聚合酶650任选地可以附着(例如锚定)到生物孔605的口。这可以例如使用半胱氨酸/硫醇缀合化学完成。此类缀合可以提供聚合酶650锚定在可再现的和稳定的方向上,其可以增强聚合酶650的构象运动转移到报告物区614的平移运动。然而,不需要要求聚合酶与孔的缀合。例如,响应施加的电压由系链施加的力可足以将聚合酶保持在适当位置,或者另一个成员(例如寡核苷酸)可以结合至系链的尾末端以便抑制聚合酶从纳米孔的解离。
[0174]
另外,注意,可以使用快速ac电流代替dc电流,以便产生必要的电场。这具有抑制agcl电极耗尽和延长器件可以运行的时间的优点。
[0175]
注意,在伸长标签的部分和系链的部分之间形成的双链体可以处于热力学平衡。应当理解,热力学平衡中的双链体可以具有基于核酸序列的长度和特征的开启和关闭速率,并且双链体可以随时间解离。可以有用的是在双链体状态中所花费的平均时间(解离速率的倒数)比掺入事件期间的聚合酶-核苷酸复合物的平均寿命短,使得在掺入和标签从核苷酸释放后,标签将扩散开来并且不阻断进入的核苷酸标签。与聚合酶-核苷酸复合物的寿命相比,有效结合速率可以足够高以导致相对快速的重结合,使得检测掺入事件,并且使得在核苷酸掺入期间发生任何解离事件后双链体重形成。结合速率将是核苷酸的伸长标签的浓度中的伪一级,这可以被认为使得此类排列成为伸长标签的浓度的随机传感器。注意,自由扩散的伸长标签可具有相对低的浓度(例如,10nm至100nm,或100nm至250nm,或250nm至500nm,或500nm至1μm),而所作用的核苷酸的伸长标签将有效地具有相对高的浓度,因为其结合到在掺入期间由聚合酶保持在适当位置的核苷酸,因此不能自由扩散开来。
[0176]
在本文描述的某些示例性实施方案中,系链的伸长体和被聚合酶作用的核苷酸的伸长标签分别可以包含单链dna(ssdna)或甚至可以仅由单链dna(ssdna)组成。然而,应当理解,可以适当地使用其它类型的分子。例如,可以适当地使用任何系链,其包含具有一个或多个以下特征的伸长体,并且可选地包含所有以下特征:
[0177]
1.伸长体可包含与部分相互作用的区域,所述部分分别以所述部分彼此可区分的方式附着到不同类型的核苷酸,例如通过测量通过孔收缩部的电流或通量。
[0178]
2.伸长体可以包含带电区,该带电区响应施加的电压而使其被拉过孔的收缩部。在此类构造中,伸长体可以保持拉紧。该带电区域可以位于孔收缩部附近以产生净力。
[0179]
3.伸长体可以包含一个或多个报告物区,当聚合酶作用的核苷酸与测序的多核苷酸的序列中的下一个核苷酸互补或不互补时,所述报告物区产生清晰可区分的信号状态。报告物区和带电荷区可以彼此相同;也就是说,单个区可以是报告物区和带电荷区两者。另外,应当理解可以表示核苷酸的身份或此类核苷酸是否是匹配或错配的不同信号状态不需要必需彼此在不同时间发生,并且确实可以彼此同时发生。例如,测量的信号(如光学或电学)可以包含超过一种信号状态(如两种信号状态)的复合,每个所述信号状态提供了有关核苷酸的身份或此类核苷酸是否是匹配或错配中的一项或多项的信息。
[0180]
可以包含在系链的伸长体中的示例性材料或作用的核苷酸的伸长标签或两者是聚合物。聚合物包含生物聚合物和合成聚合物。适合用于系链的伸长体或作用的核苷酸的伸长标签或两者的示例性生物聚合物包含多核苷酸,多肽,多糖,多核苷酸类似物和多肽类似物。适用于系链的伸长体或作用的核苷酸的伸长标签或两者的示例性多核苷酸和多核苷
酸类似物包含dna,对映异构体dna,rna,pna(肽-核酸),吗啉基和lna(锁定核酸)。示例性的合成多肽可以包含带电荷的氨基酸以及亲水和中性残基。在一些实施方案中,系链不是核酸或不包含核苷酸。例如,系链可排除天然存在的核苷酸,非天然存在的核苷酸类似物或两者。本文中阐述或本领域另外已知的一种或多种核苷酸可以从系链中排除。
[0181]
可适用于系链的伸长体或作用的核苷酸的伸长标签或两者的其它示例性聚合物包含合成聚合物,例如peg(聚乙二醇),ppg(聚丙二醇),pva(聚乙烯醇),pe(聚乙烯),ldpe(低密度聚乙烯),hdpe(高密度聚乙烯),聚丙烯,pvc(聚氯乙烯),ps(聚苯乙烯),nylon(脂肪族聚酰胺),(四氟乙烯),热塑性聚氨酯,聚醛,聚烯烃,聚(环氧乙烷),聚(ω-链烯酸酯),聚(甲基丙烯酸烷基酯)和其它聚合化学和生物接头,如上文进一步提及的hermanson中描述的。另外,如上所述,系链的伸长体的部分或作用的核苷酸的伸长标签或两者可以是彼此相互作用的单独的短核苷酸序列。例如,这些部分可以与聚合酶不相互作用,例如rna,pna或lna标记物,吗啉代或对映异构体dna。该部分不需要由与系链的伸长体的其它部分或作用的核苷酸的伸长标签相同的聚合物形成。如本领域所熟知的,伸长标签可以容易地附着到核苷酸的γ磷酸。另外,在一个例示性实施方案中,isog和isoc碱基可以用于核苷酸伸长标签或系链或两者上,以抑制伸长标签或系链与测序的dna杂交。另外,可以使用其它方案诱导系链中的二级结构以缩短它,例如发夹。
[0182]
另外,注意,系链可以包含多个部分,其中每个部分分别与附着到给定类型的核苷酸的部分相互作用。核苷酸的部分与系链的相应部分之间的相互作用可以将系链的报告物区移动相应量,所述相应量有助于通过信号,例如经由通过孔的孔径的电流或通量鉴定相应核苷酸。
[0183]
在一个非限制性的示例性实施方案中,孔包含mspa,其可提供核苷酸特异性电流或通量的令人满意的分开,例如与alpha-溶血素相比大3.5倍的核苷酸特异性电流或通量分开。然而,应当理解,alpha-溶血素或其它类型的孔适当地可以与本组合物,系统和方法一起使用。
[0184]
另外,注意,在孔间施加电压并且经由通过孔的电流或通量测量报告物区的移动的实施方案中,电压可以适当地使用直流(dc)或交流(ac)施加。ac电流可以帮助伸长电极寿命,在标签被粘住时有助于从孔中喷射裂开的伸长标签。另外,注意,带正电荷的系链可以在孔上具有反向偏压的情况下使用,以便抑制测序的dna被吸入孔中。另外,注意,带正电荷的系链和带正电荷的伸长标签可以在孔上具有反向偏压的情况下使用,以便抑制测序的dna被吸入孔中。
[0185]
另外,可以采用随机感测方法。在此类排列中,可以使用ac电流来移动邻近收缩部的杂交双链体。例如图4中的a-e示意性显示了组合物,其包含锚定到纳米孔或纳米孔附近的系链,并且配置用于使用锚定到或邻近纳米孔的系链来检测聚合酶对核苷酸的作用,所述系链响应纳米孔间的电势改变,并且图4中的f显示了在使用此类组合物过程中可以产生的示例性信号。
[0186]
图4中的a所示的组合物包含纳米孔400,所述纳米孔400包含第一侧,第二侧,延伸穿过所述第一侧和第二侧的孔径,以及布置在第一和第二侧之间的收缩部(纳米孔400的收缩部未特别标注,但可以与图7c-图7d中所示的相似);永久性系链410,所述永久性系链410包含锚定至纳米孔400的第一侧的头部区,任选地与抑制聚合酶430与纳米孔400解离的另
一成员460(例如寡核苷酸)偶联的尾部区,和伸长体,其包含一个或多个报告物区414和第一部分415(系链410的其他组分未特别标注,但可以与图7c-图7d中所示的相似);以及聚合酶430。如图4中的a所示,当聚合酶430不作用于核苷酸时,聚合酶可以处于开放状态。描绘在图4中的a下面的图4中的f中显示的信号包含在纳米孔400间施加的正电压(如+180mv)下对应于布置在聚合酶430的开放状态特征性的位置中的报告物区414的电流或通量状态,其中+180mv指示纳米孔第一侧的0mv和纳米孔第二侧的+180mv。
[0187]
图4中的b所示的组合物还包含包含延伸标签421的核苷酸420,该延伸标签421包含第二部分422。聚合酶430作用于核苷酸420,引起聚合酶430将构象改变为闭合状态,如图4中的b所示。描绘在图4中的b下面的图4中的f中显示的信号包含在纳米孔400间施加的正电压(如+180mv)下对应于布置在聚合酶430的闭合状态特征性的位置中的报告物区414的电流或通量状态。注意,在此类正电压下,第一部分415可以布置在核苷酸420的部分422相反的纳米孔400侧上,从而抑制正电压下部分415和部分422之间双链体的形成。注意,部分415可以位于沿系链410的伸长标签的任何合适位置处,如可以位于尾部区和报告物区414之间(如图4中的a所示),或可以邻近头部区、邻近尾部区、邻近报告物区,或头部区和报告物区414之间。
[0188]
如图4中的c所示,逆向电压下(如负电压下,基于所述负电压,部分415和422彼此布置在纳米孔400的同侧),核苷酸420的部分422和系链410的部分415之间的相互作用可以限定双链体423。描绘在图4中的c下面的图4中的f中显示的信号包含在纳米孔400间施加的负电压(如-180mv)下对应于报告物区414和双链体423的位置的电流或通量状态,其中-180mv指示纳米孔第一侧的0mv和纳米孔第二侧的-180mv。根据系链附着至聚合酶的位置,可以使报告物区414的位置变得敏感,从而以类似于上述freudenthal参考文献中描述的方式区分匹配和错配核苷酸。
[0189]
如图4中的d所示,向正电压(如+180mv)逆转电压后,双链体423可以滞留在纳米孔的收缩部内或邻近纳米孔的收缩部。描绘在图4中的d下面的图4的f中显示的信号包含在纳米孔400间施加的正电压(如+180mv)下对应于双链体423位置以及限定双链体423的特定部分的电流或通量状态。基于选择为对应单一类型核苷酸的部分422,信号可用于确定哪个核苷酸正在被聚合酶430作用。注意,部分415和部分422之间形成的双链体423可以足够大以抑制双链体移动穿过收缩部。
[0190]
如图4中的e所示,响应继续施加的正电压(如+180mv),双链体423可以解离。此类解离可以被认为“中断”部分415和部分422之间形成的双链体423。在一些实施方案中,部分415可以移动穿过收缩部,从而布置在纳米孔400的第二侧。图4中的e正下方的图4中的f的部分显示了部分415与部分422解离后正电压下穿过孔径的示例性电流或通量。描绘在图4中的e下面的图4中的f中显示的信号包含在纳米孔400间施加的正电压(如+180mv)下对应于报告物区414的电流或通量状态,该报告物区414布置在聚合酶430的闭合状态特征性位置中。可以配置部分422以便保持布置在纳米孔400的第一侧(即使部分415布置在纳米孔400的第二侧)以便暂时抑制部分415和422之间的相互作用。如图4中的c所示,此类解离后,孔径403间施加的电压可以再次改变,即可以变回第一电压,响应于该第一电压,部分415和422能彼此相互作用,从而再次限定双链体423。
[0191]
应当理解,可以以任何合适的方式检测对应于报告物区414和双链体423的相对位
置和限定双链体423的特定部分的信号。例如,组合物可以与测量电路可操作通信,例如上面参考图2a或图2b所述的。测量电路可以配置为检测穿过纳米孔400的孔径的电流或通量,这可以基于聚合酶430的构象状态和基于聚合酶430作用的特定核苷酸420的部分422随时间变化。在一个例示性实施方案中,纳米孔400,系链410,聚合酶430和核苷酸420可以浸没在导电流体(例如盐水溶液)中。与图2a中所示的测量电路230或图2b中所示的测量电路230类似配置的测量电路可以可以与第一和第二电极通信,并且可以配置为在那些电极之间施加电压,以便在纳米孔400间施加电压,以图4中的a中的“+”和
“‑”
符号表示,并使用电极来测量在第一电压下穿过孔径403的电流或通量的幅度。例如,图4中的a正下方的图4中的f的部分显示了第一电压下穿过纳米孔400的孔径的示例性电流或通量。报告物区414可以具有与系链的伸长体的一些或所有其他区域(未明确标记)不同的电流或通量阻断特性。例如,报告物区414可以包含静电电荷,而伸长体的一些或其他区域可以包含不同的静电电荷,或可以是不带电荷的(例如可以是电中性的)。或者,例如报告物区414可以是不带电荷的,而伸长体的一些或所有其他区域可以包含静电电荷。在一个示例性非限制性实例中,系链的伸长体包含多肽,其含有限定报告物区414的一个或多个无碱基核苷酸。通过纳米孔400的孔径的电流或通量的幅度可以响应报告物区414在孔径403内的相对位置、双链体423的相对位置、和限定双链体423的部分(基于此,可以确定聚合酶430的构象状态以及聚合酶430的作用)而可测量变化。
[0192]
注意,在一些实施方案中,共选择系链的伸长体的各自长度以及桥接核苷酸和伸长标签的接头,部分415和422的相应位置,以及报告物区414的相应位置,以便抑制或排除在核苷酸被聚合酶430作用时将力施加到核苷酸420,并且因此以抑制此类力免于修饰聚合酶的性能。在一些示例性的实施方案中,部分415和部分422之间的相互作用形成双链体423。可以共选择系链的伸长体的长度和沿伸长体的部分415的位置,使得部分415可以响应合适的施加电压而延伸穿过纳米孔400的收缩部,例如从而引起部分415和部分422之间的解离。双链体423的大小可以抑制双链体移动穿过纳米孔400的收缩部,并可以遮蔽核苷酸420免于在其它情况下可能已经经由伸长标签421施加到核苷酸420的力。在一个示例性的实施方案中,报告物区414布置在沿系链410的伸长体的合适位置处,使得当在正电压下部分415和422彼此解离时,布置在纳米孔400的收缩部内或邻近纳米孔400的收缩部。
[0193]
在另一个实例中,图5a-图5d示意性显示了组合物,其包含锚定至或邻近纳米孔的系链,并配置用于使用锚定至或邻近的纳米孔的系链来检测聚合酶对核苷酸的作用,所述系链响应纳米孔间的电势变化,并且图6显示了可在使用此类组合物过程中产生的示例性信号。
[0194]
图5a中所示的组合物包含纳米孔500,其包含第一侧,第二侧,延伸穿过所述第一侧和第二侧的孔径,和布置在第一和第二侧之间的收缩部(纳米孔500的组分没有具体标记,但可以与图7c-图7d中所示的那些类似);永久性系链510,包含锚定至纳米孔500的第一侧的头部区,任选地与抑制聚合酶530与纳米孔500解离的另一成员560(如寡核苷酸)偶联的尾部区,以及伸长体,其包含一个或多个报告物区514和第一部分515(系链510的其他成分未具体标记,但可以与图7c-图7d中所示的那些类似);核苷酸520,其包含含有第二部分522的伸长标签(未标记);和聚合酶530。如图5a所示,当聚合酶530不作用于核苷酸520时,聚合酶可以处于开放状态或闭合状态,每个状态具有关于其未结合状态的独特信号。图6所
示标注为“a”的信号(长划线)包含在纳米孔500间施加的正电压(如+180mv)下对应于报告物区514的电流或通量状态,该报告物区514布置在聚合酶530的未结合状态特征性的位置中。
[0195]
图5b所示的组合物包含作用于核苷酸520的聚合酶530,引起聚合酶530将构象改变为闭合状态。另外,核苷酸520的部分522和系链510的部分515之间的相互作用可以限定双链体523。在正电压(如+180mv)下,双链体523可以滞留在纳米孔500的收缩部中或邻近纳米孔500的收缩部。图6所示标注为“b”的信号(实线)包含在纳米孔500间施加的正电压(如+180mv)下对应于双链体523位置以及限定双链体523的特定部分的电流或通量状态。基于选择为对应单一类型的核苷酸的部分522,该信号可用于确定哪个核苷酸正被聚合酶530作用。注意,部分515和部分522之间形成的双链体523可以足够大以便抑制双链体移动穿过收缩部。示例性地,每个不同核苷酸的“报告物”可以包含直接邻近双链体的碱基(如恰好在图5b中的最后一个双链体碱基下面)。因此,在一个非限制性实例中,可以有4个报告物以鉴定核苷酸。还可以有第五报告物,其是以圆圈示出的报告物514。报告物514可用于报告图5c和图5d中聚合酶530的构象状态。该构象状态可依赖于是否聚合酶保持匹配的或错配的核苷酸。
[0196]
例如,如图5c所示,响应继续施加的正电压(如+180mv),双链体523可以解离。此类解离可以被认为“中断”部分515和部分522之间形成的双链体523。在一些实施方案中,部分515可以移动穿过收缩部,以便布置在纳米孔500的第二侧。图6所示标注为“c”的部分(短虚线)显示了部分515与部分522解离后在正电压下穿过孔径的示例性电流或通量。标注为“c”的电流或通量状态对应在纳米孔500间施加的正电压(如+180mv)下的报告物区514,该报告物区514布置在聚合酶530的闭合状态特征性的位置处,其中正确(匹配)的核苷酸520被聚合酶结合。
[0197]
在该实例中,聚合酶530将核苷酸520掺入测序的多核苷酸中,切割该核苷酸的标签,并序贯结合可以或可以不与测序的多核苷酸中的下一个核苷酸互补的另一个核苷酸。例如,图5c中所示的“t”核苷酸碰巧与测序的多核苷酸中的下一个核苷酸互补,而图5d中所示的“t”核苷酸碰巧不与测序的多核苷酸中的下一个核苷酸互补。在图5d中所示的实例中,在施加正电压(如+180mv)下,聚合酶530可以改变至独特构象,这仅当被作用的核苷酸是与测序的多核苷酸中的下一个核苷酸的错配时发生。相对于对于核苷酸是匹配的情况(例如如图5c中显示)的报告物区514位置,这略微重新定位了在纳米孔500的收缩部中的报告物区514。图6中标注为“d”的部分(点线)显示在聚合酶530改变为对应于错配核苷酸的构象的正电压下,在纳米孔500间施加正电压(如+180mv)下,穿过孔径的示例性电流或通量。注意,“d”处点线的信号水平不同于“c”处虚线的信号水平,因此有助于区分匹配核苷酸与错配核苷酸。另外,每个错配碱基也可具有独特聚合酶构象,导致可区分信号状态。
[0198]
注意,上述状态并不意图是限制性的,而是作为例子提供,可以发生与显示的那些状态不同的可检测状态。例如,当聚合酶没有对应于诸如开放和闭合等构造的核苷酸时聚合酶可以有多个可检测状态,或者当存在有与开放或闭合状态的聚合酶有关的错配核苷酸时甚至可以有多个状态。
[0199]
应当理解,可以如本文其他地方提供的任何合适的方式检测信号,所述信号对应于报告物区514和双链体523的相对位置和限定双链体523的特定部分。另外,应当理解,指
示何时作用的核苷酸与测序的多核苷酸的序列中的下一个核苷酸互补或不互补的信号不需要是电学的或光学的,并且确实可以以任何适当的方式产生。
[0200]
另外,应当注意,双链体(诸如可以响应施加的电压,基于在伸长体的第一部分和伸长标签的第二部分之间的相互作用而形成)的解离可以表征为限定第一途径,其特征在于两个或更多个动力学常数。另外,指示何时第一核苷酸与测序的多核苷酸的序列中的下一个核苷酸互补或不互补(如聚合酶的构象变化,焦磷酸释放,或核苷酸的伸长标签的释放)可以表征为限定第二途径,其特征在于两种或更多种动力学常数。在获得第一途径或第二途径的测量过程期间测量(例如,光学或电学测量)的信号的统计分布可以基于对应于该途径的动力学常数的相对值。例如,基于第一途径或第二途径的给定动力学常数明显大于该途径的其它动力学常数,该途径的动力学可以由给定的动力学常数支配,并且信号的得到的统计分布可以通过指数函数描述。相比之下,第一途径或第二途径的两个或更多个动力学常数可以选择为彼此具有相同的数量级,或者甚至使得彼此基本相同(例如,彼此相差5倍或更少,或4倍或更少,或3倍或更少,或两倍或更少),使得该途径的动力学不受任一动力学常数支配,并且信号的所得的统计分布可以由伽马函数描述,其中基本上不存在基本上观察不到的零时间或非常短的事件的概率。相比之下,在指数分布的情况下,存在基本上观察不到的非常短或零时间事件的高概率。
[0201]
第一途径或第二途径的一个或多个动力学常数可以以任何合适的方式来修饰以便与该途径的一个或多个其他动力学常数具有相同的量级,或者甚至以便与该途径的一个或多个其他动力学常数基本相同。例如,如上所述,可以修饰聚合酶以便延迟响应核苷酸向第一核苷酸掺入的焦磷酸释放,从而修饰该途径的至少一个动力学常数。作为另一个实例,系链还包含与第一部分杂交的第二部分以便形成发夹结构。系链的第一和第二部分可以配置为响应施加在纳米孔间的电压,在两步过程中彼此去杂交,从而改变该路径的至少一个动力学常数。具有配置为形成发夹结构的标记物的示例性四磷酸修饰的核苷酸显示在图12a中。在与系链杂交时,形成发夹,如图12b所示。可以预期该发夹具有两个剥离速率常数k1和k2,其在图12b中所示。这些速率常数可以设计为彼此具有相似的量级,使得当加在一起时,它们可以形成伽马分布。
[0202]
如本文别处所述,多种组合物可适当地包含在核苷酸的伸长标签或系链的伸长体或两者中。此类组合物可以包含dna,pna,lna,rna,吗啉代,peg(聚乙二醇)等,并且可以具有任何合适的长度。包含适当修饰的核苷酸的寡核苷酸标记物可以适当地连接到此类不同的组合物,例如,使用点击化学相容的前体是理想的。在一个实例中,核苷酸是叠氮化物标记的,这将有利于使用容易合成的炔标记的寡核苷酸。示例性分子包含如下所示的四磷酸盐标记的核苷酸,其中(a)对应于叠氮化物-p4o
13-dttp,(b)对应于炔-p4o
13-dttp。这些核苷酸可以通过使用标准点击化学用任何期望的标签进行修饰:
[0203][0204]
关于制备和标记四磷酸核苷酸的参考文献包含以下各项,其各自的全部内容通过
引用并入本文:
[0205]
kumar,s.,a.sood,j.wegener,p.j.finn,s.nampalli,j.r.nelson,a.sekher,p.mitsis,j.macklin and c.w.fuller,"terminal phosphate labeled nucleotides:synthesis,applications,and linker effect on incorporation by dna polymerases,"nucleosides nucleotides nucleic acids 24(5-7):401-408(2005);
[0206]
sood,a.,s.kumar,s.nampalli,j.r.nelson,j.macklin and c.w.fuller,"terminal phosphate-labeled nucleotides with improved substrate properties for homogeneous nucleic acid assays,"j am chem soc 127(8):2394-2395(2005);
[0207]
kumar,s.,c.tao,m.chien,b.hellner,a.balijepalli,j.w.robertson,z.li,j.j.russo,j.e.reiner,j.j.kasianowicz and j.ju,"peg-labeled nucleotides and nanopore detection for single molecule dna sequencing by synthesis,"sci rep 2:684(8pages)(2012);
[0208]
bonnac,l.,s.e.lee,g.t.giuffredi,l.m.elphick,a.a.anderson,e.s.child,d.j.mann and v.gouverneur,"synthesis and o-phosphorylation of 3,3,4,4-tetrafluoroaryl-c-nucleoside analogues,"org biomol chem 8(6):1445-1454(2010);and
[0209]
lee,s.e.,l.m.elphick,a.a.anderson,l.bonnac,e.s.child,d.j.mann and v.gouverneur,"synthesis and reactivity of novel gamma-phosphate modified atp analogues,"bioorg med chem lett 19(14):3804-3807(2009).
[0210]
其它替代实施方案
[0211]
尽管上面描述了本发明的各种例示性实施方案,但是对于本领域技术人员来说显而易见的是,在不脱离本发明的情况下可以对其进行各种改变和修改。例如,虽然上面参照对多核苷酸例如dna或rna测序讨论了某些组合物,系统和方法,但是应当理解,本组合物,系统和方法可以适合改编以用于检测任何类型的事件,例如分子或其一部分的运动,其可以与邻近纳米孔的收缩部的报告物区的存在或移动相关联。所附权利要求书旨在覆盖落入本发明的真实精神和范围内的所有此类改变和修改。
[0212]
本发明提供了以下内容:
[0213]
1.组合物,其包含:
[0214]
纳米孔,所述纳米孔包含第一侧、第二侧和延伸穿过所述第一侧和第二侧的孔径;
[0215]
多个核苷酸,其中所述核苷酸各自包含伸长的标签;
[0216]
第一和第二多核苷酸,所述第一多核苷酸与所述第二多核苷酸互补;
[0217]
布置为邻近所述纳米孔的第一侧的聚合酶,所述聚合酶配置为基于所述第二多核苷酸的序列将所述多个核苷酸的核苷酸添加至所述第一多核苷酸;
[0218]
永久性系链,其包含头部区、尾部区和布置在它们之间的伸长体,所述头部区锚定至所述聚合酶,其中所述伸长体出现在所述纳米孔的所述孔径中;
[0219]
布置在所述伸长体上的第一部分,其中所述第一部分配置为结合至所述聚合酶作用的第一核苷酸的所述伸长标签;和
[0220]
布置在所述伸长体上的报告物区,其中所述报告物区配置为指示何时所述第一核苷酸与所述第二多核苷酸的序列中的下一个核苷酸互补或不互补。
[0221]
2.项1的组合物,所述第一部分配置为产生响应所述聚合酶作用于所述第一核苷酸的第一信号状态,所述第一核苷酸能基于所述第一信号状态鉴定。
[0222]
3.项2的组合物,其中所述聚合酶作用于所述第一核苷酸包括所述聚合酶结合所述第一核苷酸。
[0223]
4.项2的组合物,所述第一信号状态包含电信号或光信号。
[0224]
5.项2的组合物,所述报告物区配置为产生第二信号状态,基于所述第二信号状态能检测所述第一核苷酸是否与所述第二多核苷酸的下一个核苷酸互补或不互补。
[0225]
6.项5的组合物,所述报告物区配置为产生所述第二信号状态,所述第二信号状态响应所述聚合酶成功地将所述第一核苷酸掺入所述第一多核苷酸中。
[0226]
7.项6的组合物,所述报告物区配置为产生响应焦磷酸释放的所述第二信号状态,所述焦磷酸释放响应所述聚合酶成功地将所述第一核苷酸掺入所述第一多核苷酸中。
[0227]
8.项7的组合物,所述聚合酶经修饰而延迟焦磷酸释放,所述焦磷酸释放响应所述第一核苷酸对所述第一多核苷酸的掺入。
[0228]
9.项8的组合物,其中所述聚合酶包含经修饰的重组ф29、b103、ga-1、pza、φ15、bs32、m2y、nf、g1、cp-1、prd1、pze、sf5、cp-5、cp-7、pr4、pr5、pr722,或l17聚合酶。
[0229]
10.项8的组合物,其中所述聚合酶包含具有选自下组的至少一个氨基酸取代或取代组合的经修饰的重组ф29dna聚合酶:在位置484处的氨基酸取代、在位置198处的氨基酸取代,和在位置381处的氨基酸取代。
[0230]
11.项8的组合物,其中所述聚合酶包含具有选自下组的至少一个氨基酸取代或取代组合的经修饰的重组ф29dna聚合酶:e375y、k512y、t368f、a484e、a484y、n387l、t372q、t372l、k478y、1370w、f198w,和l381a。
[0231]
12.项5的组合物,所述报告物区配置为产生所述第二信号状态,所述第二信号状态响应所述聚合酶的构象改变。
[0232]
13.项12的组合物,所述聚合酶构象改变的幅度和持续时间响应所述第一核苷酸与所述第二多核苷酸的下一个核苷酸互补或不互补,所述第二信号状态的幅度或持续时间或这两者基于所述聚合酶的构象改变。
[0233]
14.项5的组合物,其中所述第二信号状态包含电信号。
[0234]
15.项5的组合物,其中所述第二信号状态包含光信号。
[0235]
16.项1的组合物,其中所述伸长标签包含第一核苷酸序列并且所述第一部分包含与所述第一核苷酸序列互补的第二核苷酸序列。
[0236]
17.系统,其包含项16的组合物,且还包含配置为测量穿过所述孔径的第一电流或通量状态的测量电路。
[0237]
18.项17的组合物,其中所述第一电流或通量状态基于所述伸长标签,所述第一核苷酸能基于所述第一电流或通量状态鉴定。
[0238]
19.项12的组合物,所述测量电路进一步配置为测量穿过所述孔径的第二电流或通量状态。
[0239]
20.项19的组合物,其中所述第二电流或通量状态基于所述孔径内所述报告物区的位置,基于所述第二电流或通量状态能确定所述第一核苷酸是否与所述第二多核苷酸中的下一个核苷酸互补或不互补。
[0240]
21.项15的组合物,其中所述系链的第一部分和第二部分配置为彼此杂交以形成发夹结构。
[0241]
22.项21的组合物,其还包含配置为在所述第一和第二侧间施加电压的电压源。
[0242]
23.项22的组合物,其中所述系链的所述第一部分和所述第二部分配置为在两步过程中响应所述电压而彼此脱杂交(dehybridize)。
[0243]
24.方法,其包括:
[0244]
(a)提供纳米孔,其包含第一侧、第二侧,和延伸穿过所述第一侧和第二侧的孔径;
[0245]
(b)提供多个核苷酸,其中所述核苷酸各自包含伸长标签;
[0246]
(c)提供第一和第二多核苷酸,所述第一多核苷酸与所述第二多核苷酸互补;
[0247]
(d)提供布置为邻近所述纳米孔的第一侧的聚合酶,所述聚合酶配置为基于所述第二多核苷酸的序列将所述多个核苷酸的核苷酸添加至所述第一多核苷酸,其中将所述聚合酶锚定至永久性系链,所述永久性系链包含头部区、尾部区和布置在它们之间的伸长体,所述伸长体出现在所述纳米孔的所述孔径中;
[0248]
(e)基于所述伸长标签与布置在所述伸长体上的第一部分的结合,确定所述聚合酶正作用于第一核苷酸;并且
[0249]
(f)凭借布置在所述伸长体上的报告物区,指示何时所述第一核苷酸与所述第二多核苷酸的序列中的下一个核苷酸互补或不互补。
[0250]
25.项24的方法,所述确定包括产生响应所述聚合酶作用于所述第一核苷酸的第一信号状态并基于所述第一信号状态来鉴定所述第一核苷酸。
[0251]
26.项25的方法,其中所述聚合酶作用于所述第一核苷酸包括所述聚合酶结合所述第一核苷酸。
[0252]
27.项26的方法,所述第一信号状态包含电信号或光信号。
[0253]
28.项26的方法,所述指示包括检测第二信号状态和基于所述第二信号状态确定所述第一核苷酸与所述第二多核苷酸的下一个核苷酸互补或不互补。
[0254]
29.项28的方法,其包括产生第二信号状态,所述第二信号状态响应所述聚合酶将所述第一核苷酸掺入所述第一多核苷酸中。
[0255]
30.项29的方法,其包括产生响应焦磷酸释放的所述第二信号状态,所述焦磷酸释放响应所述聚合酶将所述第一核苷酸掺入所述第一多核苷酸中。
[0256]
31.项30的方法,所述聚合酶经修饰而延迟焦磷酸释放,所述焦磷酸释放响应所述第一核苷酸对所述第一多核苷酸的掺入。
[0257]
32.项31的方法,其中所述聚合酶包含经修饰的重组ф29、b103、ga-1、pza、φ15、bs32、m2y、nf、g1、cp-1、prd1、pze、sf5、cp-5、cp-7、pr4、pr5、pr722,或l17聚合酶。
[0258]
33.项31的方法,其中所述聚合酶包含具有选自下组的至少一个氨基酸取代或取代组合的经修饰的重组ф29dna聚合酶:在位置484处的氨基酸取代、在位置198处的氨基酸取代,和在位置381处的氨基酸取代。
[0259]
34.项33的方法,其中所述聚合酶包含具有选自下组的至少一个氨基酸取代或取代组合的经修饰的重组ф29dna聚合酶:e375y、k512y、t368f、a484e、a484y、n387l、t372q、t372l、k478y、1370w、f198w,和l381a。
[0260]
35.项28的方法,其包括产生所述第二信号状态,所述第二信号状态响应所述聚合
酶的构象改变。
[0261]
36.项35的方法,所述聚合酶的构象改变的幅度和持续时间响应所述第一核苷酸与所述多核苷酸的下一个核苷酸互补或不互补,所述第二信号状态的幅度或持续时间或这两者基于所述聚合酶的构象改变。
[0262]
37.项29的方法,其中所述第二信号状态包含电信号。
[0263]
38.项29的方法,其中所述第二信号状态包含光信号。
[0264]
39.项24的方法,其中所述伸长标签包含第一核苷酸序列并且所述第一部分包含与所述第一核苷酸序列互补的第二核苷酸序列。
[0265]
40.项39的方法,所述确定还包括测量穿过所述孔径的第一电流或通量状态。
[0266]
41.项40的方法,其中所述第一电流或通量状态基于所述伸长标签,所述确定还包括基于所述第一电流或通量状态鉴定所述第一核苷酸。
[0267]
42.项41的方法,所述指示包括响应作用于所述聚合酶作用于所述第一核苷酸移动所述孔径内的报告物区。
[0268]
43.项42的方法,所述指示还包括测量穿过所述孔径的第二电流或通量状态。
[0269]
44.项43的方法,其中所述第二电流或通量状态基于所述孔径内所述报告物区的位置,所述指示还包括基于所述第二电流或通量状态来测定是否所述第一核苷酸与所述第二多核苷酸中的下一个核苷酸互补或不互补。
[0270]
45.项39的方法,所述系链的所述第一部分和所述第二部分彼此杂交以形成发夹结构。
[0271]
46.项45的方法,其还包括在所述第一和第二侧间施加电压。
[0272]
47.项46的方法,其中所述系链的所述第一部分和所述第二部分在两步过程中响应所述电压而彼此脱杂交。
[0273]
48.项24的方法,其还包括:
[0274]
(g)基于所述伸长标签与布置在所述伸长体上的第一部分的结合,确定所述聚合酶正作用于后续寡核苷酸;并且
[0275]
(h)凭借布置在所述伸长体上的报告物区,指示何时所述后续核苷酸与所述第二多核苷酸的序列中的所述下一个核苷酸之后的核苷酸互补或不互补。
[0276]
49.项48的方法,其还包括针对多个后续核苷酸重复步骤(g)和(h),所述多个后续核苷酸与所述下一个核苷酸之后的多个核苷酸互补或不互补。

技术特征:
1.组合物,其包含:具有第一侧和第二侧的基底,延伸穿过所述基底的第一侧和第二侧的纳米孔,其中所述纳米孔具有直径d1,并且其中纳米孔包含在最窄点处具有直径d2的收缩区,并且其中d2<d1;多个核苷酸,其中每个核苷酸包含伸长标签;第一和第二多核苷酸,所述第一多核苷酸与所述第二多核苷酸互补;布置在所述纳米孔的第一侧附近的聚合酶,其中所述聚合酶基于所述第二多核苷酸的序列将所述多个核苷酸中的核苷酸添加到所述第一多核苷酸;永久性系链,包括头部区、尾部区和设置在它们之间的伸长体,所述头部区锚定到所述聚合酶,其中所述伸长体布置在所述纳米孔中;布置在所述伸长体上的第一部分,其中所述第一部分配置为结合所述聚合酶作用的第一核苷酸的伸长标签;和布置在所述伸长体上的报告物区,其中所述报告物区配置为指示所述第一核苷酸何时与所述第二多核苷酸序列中的下一个核苷酸互补或不互补。2.权利要求1的组合物,其中布置在所述伸长体上的所述报告物区位于所述纳米孔的收缩区内。3.权利要求1的组合物,其中所述伸长体和尾部区不延伸超出所述基底的第二侧。4.权利要求1的组合物,其中所述尾部区延伸超出所述基底的第二侧。5.权利要求1的组合物,所述第一部分配置为响应于作用于所述第一核苷酸的所述聚合酶产生第一信号状态,所述第一核苷酸可基于所述第一信号状态来鉴定。6.权利要求5的组合物,其中所述作用于所述第一核苷酸的聚合酶包括结合所述第一核苷酸的聚合酶。7.权利要求5的组合物,其中所述第一信号状态包括电信号或光信号。8.权利要求5的组合物,其中所述报告物区配置为在所述第一核苷酸与所述第二多核苷酸的下一个核苷酸互补或不互补时产生第二信号状态。9.权利要求8的组合物,其中所述报告物区配置为响应于成功地将所述第一核苷酸掺入所述第一多核苷酸中的所述聚合酶产生所述第二信号状态。10.权利要求8的组合物,其中所述报告物区配置为响应焦磷酸盐的释放产生所述第二信号状态,所述焦磷酸盐的释放响应于成功地将所述第一核苷酸掺入到所述第一多核苷酸中的所述聚合酶。

技术总结
提供了使用锚定至邻近纳米孔的聚合酶的系链对多核苷酸测序的组合物、系统和方法。组合物包含含有第一和第二侧以及孔径的纳米孔、各自含有伸长标签的核苷酸,和与第二多核苷酸互补的第一多核苷酸。可以将聚合酶布置在邻近纳米孔的第一侧处并且配置为基于第二多核苷酸的序列将核苷酸添加到第一多核苷酸。永久性系链可以包含锚定至聚合酶的头部区、尾部区,和布置在它们之间的伸长体,所述伸长体出现在所述纳米孔的所述孔径中。可以将第一部分布置在伸长体上,该伸长体结合聚合酶所作用的第一核苷酸的伸长标签。可以将报告物区布置在伸长体上,所述伸长体指示何时第一核苷酸与第二多核苷酸序列中的下一个核苷酸互补或不互补。核苷酸序列中的下一个核苷酸互补或不互补。核苷酸序列中的下一个核苷酸互补或不互补。


技术研发人员:K.L.冈德森 J.G.曼德尔
受保护的技术使用者:亿明达股份有限公司
技术研发日:2016.06.02
技术公布日:2022/7/5
转载请注明原文地址: https://www.8miu.com/read-3633.html

最新回复(0)