导 师: 李恩民;李伍举
学科专业: G1010
授予学位: 硕士
作 者: ;
机构地区: 汕头大学
摘 要: 对甲醇营养型毕赤酵母表达系统的研究和应用有近20年的历史。大量文献资料表明,许多外源基因可以在毕赤酵母中成功表达,但表达水平有时相差很大。基因表达的影响因素较多。迄今为止,人们尚不能在实验前对目的基因的表达水平进行有效评估。在本文中,我们分析了外源基因3’末端二级结构与表达水平之间的关系;在此基础上,建立了一个针对pPIC9表达载体在毕赤酵母中高效表达的数学模型。而且以NGAL(Neutrophil Gelatinase-Associated Lipocalin)为目的基因,应用这一模型对NGAL基因是否能在毕赤酵母中高效表达进行了预测和实验验证,初步证明了这一数学模型的准确性。 内容与方法: 1.收集了40例应用pPIC9载体在毕赤酵母GS115株中表达目的基因的数据。获取下列基本信息:基因名称、表达量、目的基因插入载体的酶切位点、基因扩增引物等,拟定以表达量100mg/L为界限,按此界限将40例目的基因表达水平分为高/低两组。 2.从NCBI获取相关目的基因的核酸序列,与基因的3’端扩增引物进行核酸序列比对,确认表达载体的翻译终止密码子前后各100bp的序列,据此对每个数据构建200bp的片段。 3.从上述每个基因的200bp片段,截取9,000个区间,截取方式为[X,Y],X和Y在200bp片段的范围为1≤X≤100,和111≤Y≤200。 4.使用RNAfold软件计算每个区间最低自由能,构建最低自由能矩阵。 5.使用Tclass分类程序和目的基因的分类信息对最低自由能矩阵进行t检验及判别分析,得到理论上可以判别表达水平高低的区间组合,随后重复200次按75%比例随机将所有40例目的基因的自由能数据分为训练集和检验集,通过分类稳定性分析来筛选最佳判别区间组合。 6.利用获得的最佳判别区间组合建立判别函数,将40个数据按75%比例随机分成两组,并利用多数组建立判别函数,此过程重复1000次,最终得到1000个判别函数。 7.构建NGAL基因的200bp片段,利用RNAfold软件计算上述步骤“6”结果中最佳判别区间的最低自由能。
分 类 号: [Q786]
领 域: [生物学]