24小时论文定制热线

热门毕设:土木工程工程造价桥梁工程计算机javaasp机械机械手夹具单片机工厂供电采矿工程
您当前的位置:论文定制 > 毕业设计论文 >
快速导航
毕业论文定制
关于我们
我们是一家专业提供高质量代做毕业设计的网站。2002年成立至今为众多客户提供大量毕业设计、论文定制等服务,赢得众多客户好评,因为专注,所以专业。写作老师大部分由全国211/958等高校的博士及硕士生设计,执笔,目前已为5000余位客户解决了论文写作的难题。 秉承以用户为中心,为用户创造价值的理念,我站拥有无缝对接的售后服务体系,代做毕业设计完成后有专业的老师进行一对一修改与完善,对有答辩需求的同学进行一对一的辅导,为你顺利毕业保驾护航
代做毕业设计
常见问题

林木生物信息系统设计与实现

添加时间:2018/09/13 来源:河南农业大学 作者:谢鹏芳
利用 JAVA 编程语言的灵活性和 Spring MVC、Ibaties 框架的快速构建的特点,采用 CSS+DIV 的布局方式的客户端,利用 Browser/Server 模式的优点以及先进的 MySQL 关系型数据库技术,实现了以毛果杨蛋白质数据为主体的林木生物信息系统。
以下为本篇论文正文:

摘要

  在后基因组时代,由于生物信息学的快速发展,生物信息数据呈指数级增长,生物信息数据库系统中的数据日益庞大,这为某一专业领域的研究提供了更多的研究数据,但在浩瀚如海的数据库中查找并筛选与研究领域相关的数据会耗费研究者大量的时间与精力。因此,根据自己的研究需求与特点建立自己的生物信息系统成为每个研究领域的重要课题,以便实现对数据的有效管理和分析。森林资源信息化管理可以有效提高森林可持续经营与经济生态效益,随着现代科技的快速发展,林业资源日趋减少,为了实现林业资源经营的可持续发展,需要对森林资源进行科学有效的管理。

  森林的生物信息资源的管理是森林资源信息化管理的重要方面,将宏观与微观相结合,形成一个由内到外、标本兼管的森林资源信息化管理系统。

  本研究就此问题设计并建立了林木生物信息系统(以毛果杨蛋白质序列为例),用于系统地整合并存储各数据库(如 PIR、SwissProt、TrEMBL、NCBI 等)中林木蛋白质序列及序列信息以及实验中得到的杨树蛋白质信息以及对数据进行简单的处理。本系统使用的 MySQL 是当下最热门的、开源的且具有较好的灵活性及可扩展性的数据库关系型数据库,而且其简单易学且使用成本低。

  搭建平台服务器主要使用了框架——Spring MVC、Ibatis:Spring 是一个十分优秀的轻量级的 DI和 AOP 容器框架,可以很好的集成支持当前主流框架,如 Struts2、Hibernate 等,并且可以提供众多服务,如事务管理、WS 等,使用 Spring 的 IOC 容器可将对象之间的依赖关系交给 Spring,降低组件之间的耦合性,而 DI 机制则可以降低对象替换的复杂性;Ibatis 是一个十分优秀的持久层框架,是一个半自动化的 ORM 实现,具有很大的灵活性,易于学习使用,通过文档和源代码,可以较完全的掌握它的设计思路和实现。客户端则使用了当前主流的 CSS+DIV 的布局方式,将表现和内容分离,提高页面浏览速度,使用Jquery等前端框架,能更方便地处理HTML documents、events、实现动画效果,并且方便地为网站提供 AJAX 交互。

  系统设计全文检索,帮助研究人员方便快捷的检索所需数据。同时,本数据库平台实现了上传功能,可以方便研究人员上传自己研究得到的数据,实现数据共享。另外提供一些有用的分析功能来方便研究者分析蛋白质序列,如通过本地 BLAST 搜索本地数据库中的同源蛋白质序列,利用蛋白质理化性质分析蛋白质氨基酸组成、亲疏水性、等电点等,支持用户对蛋白质序列进行编码:简单编码和 V 型编码,系统还提供蛋白质序列二级结构的预测功能。

  关键词:林木生物信息、杨树蛋白质、JAVA、BLAST、蛋白质编码、二级结构预测

ABSTRACT

  Because of the rapid development of bioinformatics, biological information data exponentially, biological information data in a database system is increasingly large in post genome era. Therefore, they build their own biological information system according to their own research needs and characteristics and this Biological information system becomes an important issue in the field of each research, in order to realize the effective management and analysis of the data. Forest resources information management can effectively improve the ecological benefits of forest sustainable management and economic, but it still has difficulty in controlling the disease of the body to produce trees. This needs us to carry on research from trees and find the key to disease. And then, from the perspective of the essence, take measures effectively to solve forest disease, combining macro and micro, formation and symptoms of forest resource information management.

  This study is to design and set up forest biological information system (populus trichocarpa protein sequences, for example), is used to systematically integrate and store the database (e.g., PIR, SwissProt, TrEMBL, NCBI) trees in protein sequence and protein sequence information, and the experiment of poplar information and simple data processing.

  MySQL used by the system is the most popular, and has good flexibility and scalability to open source database, relational database, and its easy to learn and the cost is low. To build platform server mainly USES the framework - Spring MVC, Ibatis: Spring is a very good lightweight DI container and AOP framework, can very good integration support the current mainstream framework, such as struts 2, Hibernate, etc., and can provide many services, such as transaction management, WS, using Spring IOC container can be dependencies between objects to the Spring, to reduce coupling between components, whereas DI mechanism can reduce the complexity of the object to replace; Ibatis is an excellent persistence layer framework, a semi-automated ORM implementation. It has a great deal of flexibility. While it’s easy to learn to use. Through the document and source code, we can be fully grasp its design idea and implementation. Client is using the current mainstream of CSS + DIV layout, the separation performance and content, increase the speed of page views, such as using Jquery front frame, can more easily handle HTML documents, events, to achieve animation effects, and convenient to provide AJAX interaction for the web site.

  Full text retrieval system design, convenient and quick to help researchers can retrieve the required data. At the same time, the database platform can realize the function of uploading, researchers can upload their data, realize data sharing. Meanwhile it provides some useful analysis function to convenient researchers analyze protein sequences, such as through local BLAST search local homologous protein sequences in the database, using protein protein amino acid composition, physical and chemical properties analysis distinguishes water-based, isoelectric point, etc., it also supports user to encode protein sequence: simple encoding and V coding, and system also provides secondary structure prediction of protein sequences.

  Key words: forest biological information; poplar protein; JAVA; BLAST; protein coding;Secondary structure prediction

  信息系统(Information system)是基于信息流处理的人机一体化系统[1],由计算机软件、计算机硬件设施、网络和通信技术、数据信息、用户信息和规章制度构成,是建立在信息技术基础上的一种进行组织和管理的手段,能够实现输入、输出、存储、处理和控制等功能[2]。它是 20 世纪中期信息科学、管理科学、系统科学、计算机科学、决策科学等相互交叉融合发展起来的新兴学科,能够最大极限地发挥计算机技术和网络通信技术的使用,通过统计公司所具有的人力、物力、财力、设施、技术等数据信息[3],建立完整、有效的信息数据库,对数据信息进行加工和处理,将整理好的各类信息资料及时反馈给管理人员,便于决策者加强企业信息管理,做出正确决策以便不断提高企业的管理水平和经济效益[4]。信息系统从其系统的特点以及发展来分类,可划分成管理信息系统、数据处理系统、决策支持系统、虚拟办公系统和专家系统五种[5]。

  信息系统的发展与计算机技术、网络通讯技术、数据库技术以及硬件设施的提升密切相关。自1946 年第一台电子计算机诞生,信息系统的发展在过去 70 年里经过了由单机到网络,由低级到高级,由电子数据处理系统(EDPS)到管理信息系统(MIS)、再到决策支持系(DSS),由数据处理到智能处理的过程[5-9]:电子数据处理系统阶段,首要功能是用于处理日常的工作事务,用计算机取代人工计算与管理,按时为管理者提供一系列有效的数据信息。管理信息系统阶段最突出的特征是信息高度集中化,可以快速处理高度集中的数据与信息并对其进行统一使用;另一主要特征是采用量化的科学管理手段,运用预测、优化规划、管理、调控等技术进行决策支持。决策支持系统阶段是信息系统发展过程中产生的更高层次、更先进的系统,可以为各级决策管理部门提供问题分析、建模、决策模拟及方案解决的过程和环境,将各种数据信息以及分析手段融合使用,有效提高决策者的决策水准与效率。信息系统在这三大阶段的发展中不停探究并逐步完善。1993 年,Internet 上出现 www(万维网),为信息系统的网络化创造了绝佳的发展前提[5,10]。

  从当前国际信息系统的发展情况来看,全球信息化正在引发技术变革,加快信息化技术发展,已成为当今全球趋势,信息系统是对信息进行有效加工管理的有效手段,它的建立能够对全球信息化发展起到重要支撑作用,因此信息系统全球化是全球信息化发展的有效途径。当前的信息系统正迈向网络化、集成化和知识信息系统、智能经济系统的形式[11,12]:信息系统网络化发展为电子商务发展提供了强有力的技术支持,电子商务是互联网上建立的世界电子市场;伴随全球经济一体化,当今经济形态正逐渐向知识经济方向发展,信息系统的结构、处理能力等都应符合知识经济发展的要求。

  知识信息系统除了应具有信息系统的所有功能外,其核心功能是专家系统功能;智能信息系统能够处理非结构化业务并且处于决策过程的核心位置,可以为人作向导,知识创新功能是其所特有的功能;当信息系统以基于神经网络神经元构建、遗传算法的智能网为主发展时,信息系统对人类生产生活的贡献会更大[13,14]。

  生物信息系统的主要功能是生物信息数据的收集、整理、存储、管理与分析,其主要任务有两个,一是管理好后基因组时代中产生的海量生物信息数据,二是利用好这些数据,研究发现新规律,产生社会价值。数据库是生物信息系统的核心研究内容,国外的发达国家在这方面起步较早,有一些机构在生物信息学领域已经处于主导地位了,它们都开发了相关的数据库、系统等。如美国国家生物技术信息中心(National Center for Biotechnology Information, NCBI)建立并维护的 GenBank数据库,欧洲分子生物学实验室(European Molecular Biology Laboratory, EMBL)的数据库和日本的DNA 数据库(DNA Data Bank of Japan, DDBJ)都是被普遍使用的综合性一级核酸数据库系统。随着高通量技术的发展,大数据的存储、传输与处理技术的发展,软件和算法的提升,数据库系统的综合化、S/C 模式的构建使含有生物信息数据库、分析工具以及生物信息文献资料等在内的生物信息系统成为研究人类、动物、植物等领域的有力工具及手段,从新基因的发现与测定、蛋白质序列预测其结构与功能、研究筛选疫苗到新药的研发全都离不开生物信息系统,几乎覆盖了生命科学研究的各个领域,尤其在人类、动物、植物等领域的应用[15]。

  1995 年 5 月 Sun Microsystems 公司在 Sun world 会议上正式对外发布 Java 和 HotJava浏览器。IBM、Adobe、Netscape、Oracle、Apple 以及微软等各大公司都暂停自己的开发项目,争相购买 Java 使用许可证,并为自己的产品开发了相应的 Java 平台[58,59]。2006年 Sun Microsystems 公司宣布:Java 技术将免费对外发布,从 2007 年 3 月起,世界各地所有的开发人员都可以修改 Java 的源代码[60]。Java 语言具有面向对象性、动态性、分布式性、安全性、健壮性、高性能性、多线程性、跨平台等优点。Java 与 Matlab 相比,Java 代码是完全免费开源的,与 R 语言相比具有嵌入到 Java 程序更方便的优势;与 Perl相比,Java 的执行效率更高。近年来,得益于其开源、可重复利用和面向对象的优势,Java 在生物信息学中得到了广泛的应用[61,62]。

  目前,针对生物信息学发展中存在的种种问题,研究者已经用 Java 语言开发了诸如BioJava、 Cytoscape 等[60]很多软件系统工具。BioJava 是 Java 平台下的一个开源工程项目,主要是用来处理生物信息数据,如序列处理,文件解析,ACeDB,DAS,CORBA协同性的访问,动态程序等等,并且能做一些简单的统计程序。BioJava 主要功能覆盖基因组、蛋白质组、算法和 BioSQL 这方面,可对基因序列转换、注释、BLAST&FASTA;计算蛋白质等电点、蛋白结构预测、蛋白质序列比对等;提供一些常用算法,如遗传算法、HMM、动态规划等;提供生物学数据库支持,如一般的序列数据库、数据库类型和Ontology 数据库等。 Cytoscape 是 Java 语言编写的用于绘制和分析各类生物信息数据网络,针对不同类型的网络开发出的基于 Cytoscape 的插件大概有数百种。此外,作为生物信息系统领域中最权威和使用最普遍的平台--美国国立生物技术信息中心(NationalCenter for Biotechnology Information, NCBI)[63]也提供了相应的 Java API,因此,Java成为生物信息系统研究中最有效的开发语言。

  林木生物信息系统效果演示:

林木生物信息系统登录界面
林木生物信息系统登录界面

林木生物信息系统首页
林木生物信息系统首页

选择上传文件
选择上传文件

Populus Trichocarpa 检索结果
Populus Trichocarpa 检索结果

蛋白质详细信息
蛋白质详细信息

本地 BLAST 比对
本地 BLAST 比对

蛋白质基本性质分析结果
蛋白质基本性质分析结果

蛋白质序列 V 型编码结果
蛋白质序列 V 型编码结果

目录

  摘 要
  1 文献综述
    1.1 信息系统
      1.1.1 信息系统概念
      1.1.2 信息系统的发展
    1.2 生物信息系统
      1.2.1 人类生物信息系统
      1.2.2 动物生物信息系统
      1.2.3 植物生物信息系统
    1.3 JAVA、BIOJAVA 在生物信息系统中的应用
  2 引言
  3 材料与方法
    3.1 数据来源
      3.1.1 蛋白质序列数据库
      3.1.2 蛋白质结构数据库
      3.1.3 蛋白质序列二级数据库
    3.2 数据收集与整理
    3.3 林木生物信息系统数据库设计
      3.3.1 需求分析
      3.3.1 数据库系统设计
    3.4 林木生物信息系统功能设计
      3.4.1 数据上传
      3.4.2 BLAST 比对工具
      3.4.3 蛋白质理化性质分析工具
      3.4.4 蛋白质编码
      3.4.5 蛋白质二级结构预测
  4 结果与分析
    4.1 系统开发环境
      4.1.1 系统软件开发环境
      4.1.2 系统硬件开发环境
    4.2 用户登录界面及系统主界面
    4.3 数据上传功能
    4.4 数据检索功能
      4.4.1 高级检索
      4.4.2 快速检索
    4.5 数据分析功能
      4.5.1 BLAST 比对
      4.5.2 蛋白质理化性质分析
      4.5.3 蛋白质序列编码
      4.5.4 蛋白质二级结构预测
  5 结论与讨论
    5.1 结论
    5.2 讨论
  参考文献
  英文摘要

(如您需要查看本篇毕业设计全文,请您联系客服索取)

相关内容
相关标签:Java毕业设计
好优论文定制中心主要为您提供代做毕业设计及各专业毕业论文写作辅导服务。 网站地图
所有论文、资料均源于网上的共享资源以及一些期刊杂志,所有论文仅免费供网友间相互学习交流之用,请特别注意勿做其他非法用途。
如有侵犯您的版权或其他有损您利益的行为,请联系指出,论文定制中心会立即进行改正或删除有关内容!