原鸡基因CD8a生物信息学初步分析论文1.doc
《原鸡基因CD8a生物信息学初步分析论文1.doc》由会员分享,可在线阅读,更多相关《原鸡基因CD8a生物信息学初步分析论文1.doc(23页珍藏版)》请在三一文库上搜索。
1、原原鸡鸡基因基因 CD8a 生物信息学初步分析生物信息学初步分析 姓 名 卢慧 院 系生命科学学院 专 业生物技术 班 级 2011 级 1103 班 学 号1154010426 指导教师贾震虎 内容摘要 本文的实验对象是原鸡的 CD8a。本实验运用生物信息学方法,对本条核酸 序列进行核酸一级结构和其表达产物的一级结构、二级结构以及三级结构进行 初步分析。通过分析我们得出,该条序列长度为 648bp,有多种酶的限制性酶 切位点,与其他鸡形目的 CD8a 相似性很高,本条序列共编码 216 个氨基酸。氨 基酸疏水性不高,有 12 个磷酸化位点,没有信号肽,有一个跨膜区,蛋白质二 级结构主要是 螺
2、旋,占 22.69%;延伸链,占 15.74%;无规卷曲,占 61.57%,并且分布不连续。通过对其系统发生树的建立,三种方法构建的系统 树,所表现的 CD8a 和其他物种同源序列之间的关系基本一致。 【关键词】:原鸡 生物信息学 CD8a 目录 一、综述.4 二、分析研究材料与方法.5 (一)研究材料5 (二)研究方法及工具5 (三)分析方法和具体步骤6 三、预测结果与分析.8 (一)核酸序列一级结构分析8 1核酸序列基本分析8 2.核酸序列的酶切图谱分析.9 3.碱基同源性初步分析.11 (二)氨基酸序列的初步分析12 1.氨基酸序列的组成.12 2磷酸位点的预测14 3氨基酸的疏水性和亲
3、水性分析14 4氨基酸的跨膜区分布15 5信号肽区域的预测16 (三)氨基酸高能结构的分析17 1氨基酸的二级结构分析17 2蛋白质序列的结构功能域分析18 3蛋白质的亚细胞定位19 4氨基酸序列三级结构的分析20 5系统进化树的构建及其进化分析20 四、结果讨论.21 (一)核酸序列的基本分析21 (二)氨基酸序列的基本分析21 (三)蛋白质高级结构分析及功能预测22 (四)结论22 五、参考文献.22 原鸡基因 CD8a 生物信息学初步分析 Bioinformatical Analysis of a Gallus gallus CD8a Gene 学生姓名:卢慧 指导老师:贾震虎 一、一、
4、综综述述 生物信息学是一门新兴的前沿的科学,它随着计算机的技术的发展,逐步 应用于农林学、生物学、医学等研究中1,通过各种软、数据库、服务器对生 物分子的分析及功能预测,在科技领域显示了它越来越重要的作用。 本文就是利用生物信息学方法,对原鸡的 CD8a 进行初步分析。原鸡不仅适 应于热带、亚热带地区饲养繁衍,而且对高寒地区也具有良好的适应能力,全 年各个季节全国各地均可饲养。而且其抗病能力强,病害少,育雏成活率高, 达到 98%左右,属于中国二级保护动物。 CD8分子是 T 淋巴细胞表面的 I 型跨膜蛋白2,也是 T 淋巴细胞表面重要的 标志性分子3, 4。鸡的 CD8分子主要表达在细胞毒性
5、 T 淋巴细胞5、抑制性 T 细胞和树突状细胞的表面。6CD8分子是二聚体,并有 CD8aa 同型二聚体和 CD8a 异型二聚体两种表达形式。CD8主要识别 MHC类分子递呈的内源性抗原; 鸡 CD8分子是鸡免疫系统的重要组成部分,与哺乳动物的 CD8分子在生物进化和 功能上有明显的相似性12,13。CD8a 参与胸腺分化以及 T 细胞活化的信号传导,7 而 CD8 主要协助 CD8a 发挥生物学功能。 通过对不同物种的 CD8a 核酸序列的分析,人们发现 CD8a 是一个功能类似 而且较为保守的跨膜蛋白,约由230个氨基酸组成,包含一个规范的信号肽,一 个 Ig 高变区,Ig 高变区暴露于同
6、源的免疫球蛋白的 CDR1、2、3的钩环区;紧 接着 Ig 高变区的是富含脯氨酸的铰链区,之后是由二十个氨基酸构成的跨膜区。 本文首先对核酸序列进行基本分析,通过对酶切位点的分析,我们可以 对本条核酸序列酶切及体外扩增,用于分子实验。对氨基酸序列的分析,我 们可以找到其磷酸化的位置,有无信号肽,以及亚细胞定位和其二级结构等, 在此基础上,来分析预测结构和功能的关系。对CD8a 基因的生物信息学分 析,通过比较相同基因和不同基因的等位基因,有助于研究不同基因间的进化 关系,以及进一步研究 CD8a 与免疫系统防御的关系,所以在原鸡养殖和优良 育种方面具有很好的应用前景8。 二、分析研究材料与方法
7、二、分析研究材料与方法 (一)研究材料 研究对象是原鸡的 CD8a 作为研究材料,长度为 648bp,在 GenBank 的登录 号为 NM_205235.1。 (二)研究方法及工具 本论文采用生物信息学方法,用计算机对草鱼的原鸡的 CD8a(648bp)的 结构、功能及进化地位进行了研究,主要用到的生物信息学数据库、分析软件 以及网络服务器如下 数据库: NCBI(National Center for Biotechnology Information,美国 国家生物技术信息中心) 软件: Bioedit(用于核酸序列编辑与分析) Discover studio Visualizer(用于
8、蛋白质结构的分析) MEGA(用于分子进化遗传分析) 网络服务器(主要用于蛋白质结构的预测): BLAST 程序(用于同源序列的比对) SCRATCH Protein Predictor(蛋白质结构预测) Swiss-model; CBS 服务器的 NetPhos2.0 Server Expos 服务器的 Prostate CBS 服务器的 TMHMM Server v. 2.0 CBS 服务器的 SignalP3.0 server PBIL LYON-GERLAND 信息库 SMART CBS 服务器的 CPHmodels Wolf PSORT CDART: Conserved Domain
9、 Architecture Retrieval Tool (三)分析方法和具体步骤 首先,登录 NCBI,将待分析核酸序列存为 FASTA 格式,命名为 48。将氨基 酸序列存为 FASTA 格式,命名为 CD8a。 1.对本条核酸序列一级结构的分析 (1)核酸序列的基本分析采用 Bioedit 软件,打开 Bioedit,选择文件, 将保存好的 FASTA 格式的核酸序列打开。选中本条序列后点击 SequenceNucleic AcidNucleotide Composition,就会显示核酸序列的分 子量、碱基数量等结果,保存这个结果。 (2)核酸序列的酶切图谱分析 用 Chromaspr
10、o 软件进行限制性酶切位点的分析,在 Chromaspro 软件中打 开该序列的 FASTA 格式,再点 Analysis Restriction Enzyme,选择 all Enzyme 即可显示出分析结果,保存结果。 (3)同源序列的搜索与对比 首先打开 NCBI 首页,再打开 Blast,在 Basic Blast 中选 Nucleotide blast。页面打开后,在对话框中浏览文件,选择保存好的 FASTA 格式的核酸序 列,在 Database 中选 others(nr etc),默认其它参数。最后点 BLAST,显示分 析结果,保存。 2氨基酸序列的初步分析 (1)氨基酸序列的组
11、成 打开 BioEdit 软件,打开本条氨基酸编码的氨基酸序列,选中序列,点 SequenceProteinAmino Acid Composition,显示结果,保存。 (2)氨基酸序列的磷酸化位点分析 运用丹麦科技大学(DTU)的 CBS 服务器上的 NetPhos2.0 Server 程序。 网址:http:/www.cbs.dtu.dk/services/NetPhos/ 打开网址,浏览文件,选中 FASTA 格式的氨基酸序列,之后,在参数中选 择:tyrosine(酪氨酸)、threonine(苯丙氨酸)、serine(丝氨酸)这三种 氨基酸为了看是这三种氨基酸否被磷酸化,点击 Su
12、bmit 提交,最后结果以图像 形式输出。 (3)氨基酸序列疏水性和亲水性分析 采用 ExPAsy 服务器上的 ProtScale 程序进行氨基酸的疏水性分析 网址:http:/www.expasy.org/cgi-bin/protscale.pl 打开网址,之后将氨基酸序列复制粘贴到对话框,在参数选择中,有不同 的 Window size 和 amino acid scale,选择不同的参数会得到不同的结果,在 这里,我们选择:Hphob. / Roseman,点击 Sumbit 提交,出现结果并保存。 (4)氨基酸序列的跨膜区分析 运用丹麦科技大学(DTU)的 CBS 服务器上的 TMHM
13、M Server v. 2.0 程序。 网址:http:/www.cbs.dtu.dk/services/TMHMM/ 打开网址,浏览文件,将氨基酸序列的 FASTA 格式选入对话框中,输出形 式选 Extensive,with graphic,最后点击 Submit(提交),稍后会出现分析 结果,保存结果。 (5)氨基酸序列的信号肽预测 使用 SignalP3.0 server 程序。 网址:http:/www.cbs.dtu.dk/services/SignalP/ 首先打开网址,浏览文件,将氨基酸序列 FASTA 格式选入对话框中,选择 参数: Organism group:选 Euka
14、ryotes(真核细胞); Method(神经网络算法):本实验为了比较选 Both; Graphics:选择 GIF (inline); Output format:选择 Standard(标准)输出方式; Truncation:由于无法预测信号肽长度一般选择(0)阻断,本次实验为 了比较还选择(30)为阻断常数。点 Submit 按钮,出现结果并保存。 3.氨基酸高能结构的分析 (1)氨基酸序列的二级结构分析及预测 运用 PBIL LYON-GERLAND 数据库对氨基酸的序列进行二级结构预测。 网址:http:/npsa-pbil.ibcp.fr/cgi- bin/npsa_automa
15、t.pl?page=/NPSA/npsa_hnn.html 首先,打开网址,把氨基酸序列粘贴在对话框中。点击 Submit(提交), 显示结果并保存。 (2)氨基酸序列的结构功能域分析 用简单模块构架搜索工具 SMART 对氨基酸序列序列进行结构功能域分析。 网址:http:/smart.embl-heidelberg.de/, 打开网址,在首页上点 throuth this page,进入新页面。在 Sequence 中 粘贴氨基酸序列,最后点 Sequence SMART 即可得到结果,保存结果。 (3)蛋白质的亚细胞定位 运用 WoLF PSORT 程序对氨基酸序列进行亚细胞定位。 网址
16、:http:/wolfpsort.seq.cbrc.jp/ 首先,打开网址,在“select an organism type” 中选择“Animal”。 之后,“Please select input method”选择“From File”;浏览文件,选入 FASTA 格式的氨基酸序列,最后,提交,将结果保存。 (4)氨基酸序列三级结构分析 运用丹麦科技大学(DTU)的 CBS 服务器上的 CPHmodel3.0 程序对氨基酸序列 进行三级结构的分析。 网址:http:/www.cbs.dtu.dk/services/CPHmodels/ 首先打开网址,将氨基酸序列放入对话框,点 Subm
17、it,将新页面中的 Email 地址填好,几分钟之后将结果打开,点 query.pdb 下载 pdb 格式的文件。 打开 Accelrys Discovery Studio Visualizer3.1 软件,在 OPEN 里打开刚 才下载的文件,即可出现蛋白质的 3D 结构,保存结果。 (5)系统发生树的构建及进化地位分析 运用 MEGA4 软件对的核酸序列和氨基酸序列进行同源性分析,并绘制出系 统发生树。通过 NCBI 数据库,BioEdit 和 MEGA 软件进行系统发生树的构建, 来进行进化地位分析。 首先在 NCBI 中通过 Protein Blast 找到与该 EST 氨基酸序列相似
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因 CD8a 生物 信息学 初步 分析 论文
链接地址:https://www.31doc.com/p-3916292.html