密码子优化是什么有什么作用?新手入门必看指南

文章摘要

密码子优化是什么**密码子优化是根据目标生物体的密码子使用偏好,调整基因序列中密码子的组成,让基因在该生物体中更容易被“读懂”和表达的技术**,我们知道,DNA上的遗传信息通过密码子指导蛋白质合成,就像用字母拼单词,每个密码子对应一个氨基酸,但不同生物“拼单词”的习惯不一样,有的偏爱用这个密码子,有的偏爱那个……

密码子优化是什么

**密码子优化是根据目标生物体的密码子使用偏好,调整基因序列中密码子的组成,让基因在该生物体中更容易被“读懂”和表达的技术**,我们知道,DNA上的遗传信息通过密码子指导蛋白质合成,就像用字母拼单词,每个密码子对应一个氨基酸,但不同生物“拼单词”的习惯不一样,有的偏爱用这个密码子,有的偏爱那个,密码子优化就是把基因里的“单词”换成目标生物“常用”的,让基因表达更顺畅。

比如同样是编码精氨酸,大肠杆菌特别喜欢用CGU这个密码子,而人类细胞更爱用AGA,如果把人类的基因直接放到大肠杆菌里表达,大肠杆菌看到一堆AGA,就像我们看到一堆生僻字,读得慢还容易出错,蛋白表达量自然高不了,密码子优化就是把这些“生僻字”换成大肠杆菌认识的“常用字”,让它读得快、读得准。

密码子优化有什么作用

**密码子优化最直接的作用是提高蛋白表达量**,很多时候实验室辛辛苦苦克隆出基因,转进细胞里却几乎看不到蛋白,不是基因坏了,可能就是密码子不对路,我之前在实验室做大肠杆菌表达重组蛋白,一开始用的原始基因序列,培养了一周,蛋白浓度只有0.1mg/mL,跑电泳条带淡得像蚊子腿,后来导师建议做密码子优化,调整后再表达,三天就达到了1.2mg/mL,产量翻了十倍还多,当时激动得差点把离心管甩出去。

除了提高产量,密码子优化还能减少表达错误,有些稀有密码子会让核糖体在翻译时“卡壳”,导致蛋白合成中断或者出现错误折叠,优化后的密码子能让核糖体“一路绿灯”,合成出的蛋白不仅多,质量也更稳定,之前有个师姐做酶工程,原始基因表达的酶活性忽高忽低,优化密码子后,活性稳定了不说,半衰期还延长了两天,实验数据一下子就漂亮起来了。

密码子优化怎么操作步骤

**第一步是确定目标宿主**,不同生物比如大肠杆菌、酵母、哺乳动物细胞,密码子偏好天差地别,选错宿主等于白忙活,我刚开始学的时候,把给酵母用的优化序列拿去转大肠杆菌,结果蛋白表达量比没优化还低,被导师笑了好久,选宿主要看实验目的,做基础研究用大肠杆菌或酵母就行,要是做药用蛋白,就得用哺乳动物细胞,比如CHO细胞,毕竟和人体更像。

密码子优化是什么有什么作用?新手入门必看指南

第二步是获取原始基因序列,可以从GenBank数据库下载,也可以自己测序得到,序列一定要准确,要是有碱基突变,后面优化得再好也白费,我有次抄序列抄错了一个碱基,结果优化完表达出的蛋白完全没活性,回头检查半天才发现是原始序列抄错了,恨不得找个地缝钻进去。

第三步是选择优化工具,在线工具比如JCat、OptimumGene,本地软件比如DNAStar,各有各的用法,新手建议先用在线工具,不用安装,打开网页就能用,输入原始序列,选好目标宿主,工具就会自动分析序列里的密码子使用频率,然后把稀有密码子换成偏好密码子。

第四步是检查优化后序列,工具给出结果后,不能直接用,得自己检查有没有出现不该有的东西,比如提前终止密码子、复杂的二级结构,之前有个同学用工具优化完就送去合成了,结果序列里多了个终止密码子,蛋白合成到一半就停了,白花钱不说,还耽误了实验进度。

第五步是合成优化后基因并验证,把优化后的序列发给基因合成公司,合成好后转进宿主细胞,检测蛋白表达量,要是表达量没提升,就得回头看看是宿主选错了,还是优化时参数没设对,从头再来一遍。

密码子优化常用工具对比

OptimumGene是商业软件,功能强大到能考虑mRNA稳定性、翻译起始位点、密码子上下文等一堆因素,优化后的表达量通常很高,但它是收费的,而且价格不便宜,一般只有经费充足的实验室才会买,我们这种学生实验室基本用不起。

JCat是免费在线工具,由德国海德堡大学开发,操作简单到不行,打开网页,把基因序列粘贴进输入框,在宿主选项里选大肠杆菌、酵母还是人类细胞,点一下“Start Optimization”,等个一两分钟,优化后的序列、密码子使用频率表、GC含量分析就都出来了,我刚开始学密码子优化的时候,就是靠JCat练手,输入不同的序列,看它怎么优化,慢慢就明白哪些密码子是需要替换的。

GeneOptimizer是另一个商业工具,比OptimumGene稍微便宜点,优化算法更侧重翻译效率和mRNA结构,它的优势是能生成多个优化方案,让你选最适合自己实验的,但和JCat比,它的劣势很明显——要钱,而且必须注册账号才能用,不像JCat打开就能用,对新手不够友好。

DNAStar是本地软件,需要安装在电脑上,功能很全面,除了密码子优化,还能做序列比对、蛋白结构预测,它的好处是数据存在本地,不用担心序列泄露,适合处理一些保密的基因序列,但它对电脑配置有要求,老电脑跑起来会很卡,而且学习成本比在线工具高,新手要花好几天才能学会怎么用。

和这些工具比,JCat的优势在于完全免费,不需要注册,操作门槛低,输出结果详细,还会告诉你每个密码子为什么被替换,替换后的使用频率是多少,对新手来说简直是“保姆级”工具,虽然它的优化算法没有商业软件那么复杂,但对大部分基础实验来说完全够用了,性价比拉满,目前官方暂无明确的定价,因为JCat是学术机构开发的免费工具,一直对公众开放使用。

密码子优化案例分享

我师兄做的是大肠杆菌表达干扰素基因,原始基因是从人细胞里克隆来的,刚开始用原始序列转大肠杆菌,摇了三天菌,用Western blot检测,膜上只有淡淡的一条带,几乎看不到蛋白,导师让他试试密码子优化,他用JCat把序列优化了一下,替换了12个人细胞偏爱的密码子,换成大肠杆菌的偏好密码子,优化后的基因合成好,转进大肠杆菌,同样摇三天菌,这次Western blot的条带浓得发黑,蛋白浓度测出来有3.5mg/mL,比原始序列高了快20倍,师兄当时拿着结果单,手都在抖,那可是他磨了两个月的实验,终于看到希望了。

隔壁实验室有个师姐做酵母表达胰岛素前体,酵母表达真核蛋白本来就比大肠杆菌有优势,但她的原始序列表达量一直上不去,测了好几次,浓度都在0.1mg/L以下,后来她用密码子优化工具分析原始序列,发现里面有5个酵母的稀有密码子,还有一段GC含量高达75%的区域,容易形成复杂的二级结构,影响翻译,她把稀有密码子换成酵母偏好的,把GC含量高的区域调整到55%左右,优化后的序列转进酵母,培养一周后,胰岛素前体的表达量直接冲到了5mg/L,虽然离工业化生产还有距离,但对实验室研究来说已经完全够用了。

还有个同学做哺乳动物细胞表达单克隆抗体,抗体基因比较大,原始序列转进CHO细胞后,表达量忽高忽低,很不稳定,他用GeneOptimizer优化,选了“高翻译效率”和“mRNA稳定性”两个参数,生成了三个优化方案,试了第一个方案,表达量比原始序列高了3倍,但还是不稳定;试第二个方案,把密码子上下文也考虑进去了,表达量高了5倍,而且连续测了三次,波动都很小,终于解决了稳定性的问题,现在他的实验进展顺利得很,天天在实验室哼歌。

密码子优化是什么有什么作用?新手入门必看指南

密码子优化常见问题解决

优化后表达量没提升是最让人头疼的问题,出现这种情况,先别急着怪工具,看看是不是目标宿主选错了,比如你明明要在酵母里表达,却选了大肠杆菌的密码子偏好,优化完当然没用,之前有个师妹就是这样,把酵母当成大肠杆菌来优化,结果表达量一点没涨,后来换了酵母的密码子偏好,一下子就上去了。

要是宿主选对了,那就看看是不是优化过度了,有些同学觉得稀有密码子越少越好,把所有密码子都换成偏好的,结果适得其反,其实细胞翻译的时候,偶尔遇到稀有密码子会“减速”,让新生肽链有时间正确折叠,全换成偏好密码子,翻译太快,肽链来不及折叠,就会形成包涵体,表达量看着高,其实都是没有活性的蛋白,这时候得把部分稀有密码子加回去,尤其是在蛋白折叠关键区域附近,留几个“减速带”,蛋白活性反而会提高。

优化后出现移码突变也挺常见的,这一般是因为优化时不小心改了碱基的数量,比如多删了一个碱基,或者多插了一个碱基,导致阅读框移位,解决办法就是优化完序列后,用翻译工具把DNA序列翻译成氨基酸序列,和原始序列比对一下,看看氨基酸序列有没有变,变了就是阅读框错了,得回头检查优化后的序列,把多删或多插的碱基改回来。

mRNA二级结构太复杂也是个麻烦事,优化后的序列如果GC含量太高,就容易形成发夹结构,核糖体根本结合不上去,翻译自然就没办法进行,这时候可以用RNAfold这样的工具预测一下mRNA二级结构,把结构复杂的区域找出来,调整里面的密码子,降低GC含量,让mRNA结构“舒展”一点,核糖体就能顺利结合了。

密码子优化新手学习资源

B站上有个UP主叫“生物萌新实验室”,他的密码子优化入门视频做得特别好,视频里用动画演示密码子是怎么指导蛋白质合成的,不同生物的密码子偏好有什么不一样,就像看动画片一样,比看教科书有意思多了,我当初就是看他的视频才搞明白,为什么大肠杆菌不爱用某些密码子,原来每种生物的tRNA丰度不一样,偏好的密码子就是tRNA多的那些,就像我们说话喜欢用自己熟悉的词一样。

NCBI的密码子使用数据库(Codon Usage Database)是个宝藏资源,里面收集了几千种生物的密码子使用频率数据,你想知道大肠杆菌的密码子偏好,就搜“Escherichia coli”,想知道酵母的,就搜“Saccharomyces cerevisiae”,数据详细到每个密码子的使用频率、相对同义密码子使用度(RSCU)都有,我每次做密码子优化前,都会先去这里查一下目标宿主的密码子使用情况,心里有个数,再用工具优化的时候就知道工具有没有瞎优化。

《分子克隆实验指南》这本书里有一章专门讲密码子优化,虽然有点老,但基础原理讲得特别清楚,书里还举了好几个不同宿主的优化案例,从原核到真核都有,看完之后对密码子优化的理解会更深一层,我们实验室的书架上就有一本,被翻得书皮都快掉了,谁遇到密码子优化的问题,都会去翻一翻。

在线课程的话,Coursera上有个“Gene Expression Analysis”课程,里面有一节讲翻译调控,提到了密码子优化在提高翻译效率中的作用,课程是英文的,但有中文字幕,听起来不费劲,老师会带着你分析真实的基因序列,怎么用工具优化,怎么验证优化效果,特别实用,我暑假的时候跟着学了一遍,感觉自己对密码子优化的理解一下子从“知道是什么”到“知道为什么这么做”了。

常见问题解答

密码子优化是不是就是改改字母啊?

其实没那么简单哦!密码子就像单词,不同生物说话“口音”不一样,比如大肠杆菌喜欢说“CGU”,人细胞喜欢说“AGA”,密码子优化就是把基因里的“单词”换成目标生物听得懂的“口音”,不是乱改的,得根据人家的偏好来,改不好基因就“说不出话”啦,表达不出蛋白哦,而且还要考虑mRNA会不会形成复杂结构,核糖体能不能顺利结合,好多细节要注意呢,可不是随便改改字母就行的。

自己在家能做密码子优化吗?

当然可以!现在有好多免费的在线工具,比如JCat,你只要把基因序列复制粘贴进去,选好目标生物,点一下优化,等几分钟结果就出来了,就像用翻译软件一样简单,不过要注意,优化完的序列还得送去合成,自己在家可合成不了基因,得找专门的公司帮忙,合成好的基因转进细胞里,还得有培养细胞的设备,要是没有这些,就只能停在优化步骤啦,但光做密码子优化这一步,在家用电脑就能搞定,特别方便。

密码子优化后蛋白会变吗?

不会的!密码子优化只改DNA上的密码子,不改氨基酸序列,就像“西红柿”和“番茄”都是一个东西,名字变了东西没变,蛋白是根据氨基酸序列来的,只要氨基酸不变,蛋白的结构和功能就还是老样子,比如编码苯丙氨酸的密码子有UUU和UUC,把UUU换成UUC,氨基酸还是苯丙氨酸,蛋白自然不会变,所以不用担心优化后蛋白“变质”,它还是原来的那个蛋白,只是表达量更高了而已。

所有基因都需要密码子优化吗?

不是哦!如果基因来自和目标宿主亲缘关系很近的生物,比如从人身上拿的基因放到人的细胞里表达,密码子偏好本来就差不多,就不用优化;但如果是跨物种表达,比如把细菌的基因放到植物里,那十有八九得优化,不然人家“听不懂”你的基因在说啥,表达量肯定高不了,还有一种情况,如果原始基因里稀有密码子特别多,就算是同一物种,也得优化,不然翻译的时候老“卡壳”,表达量上不去,所以要不要优化,得看基因来源和目标宿主的关系,以及原始序列的密码子组成。

密码子优化工具哪个最好用啊?

新手的话推荐JCat,免费又简单,不用下载软件,直接在网页上操作,输入基因序列,选好目标生物,它就会自动帮你改密码子,还会告诉你改了哪些地方,为什么改,特别适合刚开始学的人,要是实验室有钱,OptimumGene也不错,功能更全,优化效果更好,但要花钱,如果担心序列泄露,DNAStar本地软件是个好选择,数据存在自己电脑里,安全放心,总之没有绝对最好用的工具,只有最适合自己的,新手先从JCat开始,慢慢就能找到适合自己的工具啦。