“工业生物技术知识环境”建设及应用.pdf
APPLICATION e-Science 应用 “工业生物技术知识环境” 建设及应用 马俊才1* 吴林寰1 刘斌2 邢雪荣2 于建荣3 邓勇4 杜晓萌1 徐萍3 夏芸3 陈方4 1.中国科学院微生物研究所,北京市 100101 2.中国科学院生命科学与生物技术局,北京市 100864 3.中国科学院上海生命科学信息中心,上海市 200031 4.中国科学院成都文献情报中心,四川省成都市 610041 摘 要:鉴于工业生物技术的重要地位,中国科学院设立了“先进工业生物技术创新 基地”。为了使现代信息化手段更好地服务于基地建设,我们启动了“工业 生物技术战略研究和知识环境建设”。知识环境的信息化成果主要体现在管 理平台、虚拟实验室、网络化办公、战略研究等方面。该知识环境的建设是 一种全新的信息化工作和服务模式的探索,将信息化平台工作建设与实际的 科学研究活动紧密结合,对于加强信息技术在科研中的应用,提高科学研究 活动的效率等方面有着积极的意义。 关键词: 工业生物技术;信息化;知识环境 e-Science 总第6期 45 技 术 e-Science 应用 e-Science APPLICATION The Development and Application of Knowledge Environment of Industrial Biotechnology Ma Juncai*1, Wu Linhuan1, Liu Bin2, Xing Xuerong2, Yu Jianrong3, Deng Yong, Du Xiaomeng1, Xu Ping3, Xia Yun3, Chen Fang4 1.Institute of Microbiology, Chinese Academy of Sciences, Beijing 100101, China 2.Bureau of Life Science and Biotechnology, Chinese Academy of Sciences, Beijing 100101, 100864 3.Shanghai Information Center for Life Sciences, Chinese Academy of Sciences, Shanghai 200031, China 4.Chengdu Library of Chinese Academy of Sciences, Chengdu 610041, China Abstract: In view of the importance of industrial biotechnology, Chinese Academy of Sciences establishes the Advanced Industrial Biotechnology Innovation Base. In order to facilitate its work with modern informationization achievement, we launch the project of Strategic Study and Knowledge Environment Development of Industrial Biotechnology. The project has made great progress in management platform, virtual lab, networking and strategic study. As a brand-new informational means and service pattern, the knowledge environment delicately integrates the informationization platform and scientific research, which can enhance the application information technology and improve the efficiency of research work. Keywords: Industrial biotechnology; Informationization; Knowledge environment 46 e-Science 2009年 APPLICATION 1.引言 资源的保护和管理等一系列政策 e-Science 应用 为贯彻这一理念,我们开始 [2] 进行“工业生物技术战略研究和 工业生物技术是继医药生 我国也十分重视工业生物技 知识环境建设”。知识环境的建 物技术、农业生物技术之后,国 术的发展,制定了中长期科技发 设思路是运用各种信息化手段, 际生物技术发展的“第三次浪 展规划,明确提出要发展工业生 整合和集成工业生物技术研究必 潮”。它以微生物或酶为催化 物技术,并把生物技术作为未来 须的生物实物资源信息、专利信 剂进行物质转化,与现代工程 高技术产业迎头赶上的重点,加 息、文献情报、产品、企业、政 技术有机结合,大规模生产人类 强生物技术在农业、工业、人口 策等信息,建立工业生物技术基 所需的化学品、医药、能源、材 与健康等领域应用的总体部署, 地综合知识仓库、智能检索引擎 料等,是解决人类目前面临的资 并在国家中长期科学与技术规划 和信息化协同工作环境;结合基 法规 。 [3] 源、能源及环境危机的有效手 中将其列为重点研究领域 。中 地的人力资源管理,建立骨干科 段,发展前景十分广阔。作为新 科院也意识到工业生物技术具有 研人员个人门户,管理组织的显 兴的绿色化工产业,工业生物技 重要的战略地位,认为及时了解 性知识,并且积累、挖掘组织的 术的产业化领域主要包括生物能 国际先进工业生物技术发展动态 隐性知识;建立项目进展日志, 源、生物基产品、绿色工艺过 信息、开展工业生物技术战略研 实现基地的信息化管理,并与ARP 程、生物炼制、代谢组学与代谢 究、分析各国的战略规划、总 系统实现联合,将科研活动和科 工程、生物催化与生物转化、发 结和预测工业生物技术产品和市 研管理有机结合在一起;以“中 酵与下游过程工程、特殊环境微 场,对我国工业生物技术的发展 国工业生物技术信息网”为门 生物资源与能源植物资源等。世 是非常重要的。有鉴于此,中国 户,加强与院地合作局的合作, 界经合组织(OECD)指出:“工 科学院特别在院创新工程三期中 促进我院生物技术成果的信息共 业生物技术是工业可持续发展最 提出,将“先进工业生物技术创 享、成果转化和院地、院企合作。 [1] 新基地”列为科技发展的“1+ “先进工业生物技术创新基 有希望的技术” 。 世界上的主要发达国家和地 10”基地之一。 地”是中科院创新工程“10+1” 区都针对工业生物技术领域制定 “先进工业生物技术创新基 基地中,第一个开始知识环境建 了重大规划与项目。例如,美国 地”的定位是一个知识型组织, 设的基地,在基地的信息化应用 众议院于2007年12月18日通过了 其管理理念大力提倡知识的整 方面是一个新的突破。 修改后的新能源法案,大力鼓励 合、创新和集成,认为良好的战 生物燃料乙醇的发展;欧盟先后 略决策支持和信息化的管理平台 实施了“欧洲能源政策”、“欧 对于工业生物技术的研究以及相 洲能源技术战略计划”、“欧盟 关的产业化发展起着举足轻重的 知识环境建设集成了国际与 战略能源技术计划”、BIOCOUP项 作用。为此我们提出,要利用信 国内工业生物技术领域较为全面 目等一系列政策及项目规划,均 息化管理平台,将基地的科研进 的、多类型的信息资源,应用相 涉及生物质能源的应用和推广; 展、专家队伍、管理经验等重要 应的数据挖掘工具,揭示了工业 巴西则是推动生物燃料产业发展 的无形资产转化为可管理、可共 生物技术领域的知识概念之间的 的先锋,实施了提高汽油中的乙 享、可利用的信息网络资源,为 内在联系,建立了工业生物技术 醇比例、提高柴油中的生物柴 研发中心、技术平台、重点实验 知识分类体系,实现了对各种信 油比例、推广生物燃料“生态证 室和工程中心的建设和重大项目 息资源进行组织与管理,从而构 书”、完善对生物多样性和遗传 的实施提供支持。 建了规范化、数字化的工业生物 e-Science 总第6期 2.建设思路及技术路线 47 技 术 e-Science 应用 e-Science APPLICATION 个性化信 息服务 战略情报 数据分析 微生物改 造策略 系统优化 策略 过程模拟 检索引擎 系统 超级计算 知识服务 工 业 生 物 技 术 知 识 环 境 系统优化 Web Service 文献、专利 过程 菌种 市场 核酸序列 新闻 数据库 数据 数据库 数据库 数据库 数据库 知识生产 图1 知识环境建设思路 技术战略研究与集成知识环境, 对微生物的改造策略和系统优化 术的领导、专家和科研人员对战 是将来进行数据挖掘工作、生成 策略。从而实现从知识积累到知 略研究、知识管理和信息服务的 工业生物技术发展战略报告的数 识生产并进行知识服务的过程。 不同需求。为基地学科部署、领 域方向调整、重大项目的立项、 据基础。 知识环境的建设思路是集成 3.信息化成果 重要规划、路线图的制定提供战 略决策支持,还为院相关各局、 包括文献、专利数据库、工业生 物技术过程工程数据库、菌种资 知识环境建设开展两年多 源数据库、市场数据库、核酸序 来,通过参与建设的中科院微生 列数据库和新闻数据库等在内的 物所、上海生命科学信息中心、 信息化成果主要体现在管 各种数据资源,利用信息化手段 中科院成都文献情报中心、中科 理平台、虚拟实验室、网络化办 和IT技术,如检索引擎技术、超 院青岛生物能源与过程研究所等 公、战略研究等方面。 级计算平台和网络技术,实现一 单位的通力合作,在信息化建设 1)数据库整合 个从数据分析到过程模拟到系统 方面已经取得了一系列成果,在 在平台建设过程中,数据 优化的工业生物技术系统过程, 院内外取得了极大的反响。知识 提取、转换和加载(Extraction 该过程的结果会产出一系列的产 环境的研究成果创新性地以一系 Transformation and Loading,下 品,也就是知识环境的信息产 列的信息产品的形式进行组织, 简称ETL)起着至关重要的作用。 品,包括战略情报的分析报告、 各个信息产品的定位有所区分 工业生物技术领域的信息来源包 面对专家的个性化信息服务、针 和侧重,覆盖到我国工业生物技 括生物实物资源信息、生物物种 48 科技部、发改委和基金委相关领 导、专家提供知识服务。 e-Science 2009年 APPLICATION e-Science 应用 数据、知识产权信息、生物信息 先进工业生物技术基地涉 学家们提供一个更好的信息交流 学数据等多种,其数据源既有关 及到中国科学院院内的18个研究 和科研合作平台,我们建立了基 系型数据库,也有来自文件系统 所,建设南北两个研究中心,在8 于网格(GRID)和WEB SERVICE环 的数据(如文本文件,csv文件, 个重要方向部署60-70个重要方向 境的工业生物技术网上虚拟实验 Excel文件等),还有web数据源。 项目,建设5个关键技术平台,涉 室。这是e-Science概念在工业生 ETL过程从多个数据源提取业务数 及资源研究、组学研究、分子操 物技术领域的重要应用。通过虚 据,清理数据,然后集成这些数 作、过程优化、应用开发5大研究 拟实验室,科学家既可以便捷、 据,并将它们整合进数据库中, 团队。新的组织管理模式,对基 有效地与其他地区或其他领域的 地的管理工作提出了严峻的挑战 研究人员及时地讨论研究进展、 和更高的要求。 科研成果等情况,同时也可以利 [4] 为数据分析做好准备 。 在数据库整合方面,我们 深入研究了PubMed,ISI Web of 为此,我们设计了一套信 用网络发布业内信息、提交战略 Knowledge等web文献数据库的结 息化的管理平台,这是知识环境 需求,进而形成一个跨地区、跨 构特征,在此基础上,针对工业 的重要性和创新性的体现。知识 领域、满足工业生物技术基地这 生物技术领域相关的文献、专利 环境建设了一系列与基地的项目 一分布式和网格式特殊组织形式 等情报数据特点,分别设计了文 和管理相关的数据库,记录了基 要求的信息化协同工作环境。将 献、专利数据库的数据模型; 地所管理的平台和项目在经费投 网格化的协同工作环境与具体的 针对不同数据源(ISI Web of 入、人员组成、建设成果等各方 科学研究相结合,从而形成覆盖 Science, Pubmed等)的数据格 面详细的数据。这些数据库使基 整个基地甚至我国工业生物技术 式,设计开发了相应的ETL工具, 地的管理工作井然有序。例如, 领域的网络交流平台,是知识环 实现了异构数据源的数据向Mysql 结合工业生物技术基地建设,通 境一个创新性的尝试。 数据仓库的ETL过程。目前,已经 过信息化手段推动基地综合管 4)网络化办公 集成了生物能源、生物材料、生 理,建立基地建设进展数据库, 我们充分地发挥了网络覆盖 物催化与生物转化、发酵与下游 以全程跟踪和记录工业生物技术 面广、使用方便的优势,在日常 工程技术和生物资源等领域,包 基地的建设步伐和发展轨迹;结 工作中实现了较为全面的网络化 括聚乳酸、脱落酸、生物丁醇、 合工业生物技术基地的队伍建设 办公。除了上面提到的信息化管 生物柴油、沼气等主题在内的十 和人力资源管理,建立基地科技 理,网络化在我们日常工作中的 个主题的文献数据库和聚乳酸、 专家数据库;结合工业生物技术 应用还体现在诸多方面:首先, 脱落酸、生物丁醇、生物柴油、 基地的重大项目和重要方向项目 我们充分调动一线科研人员的积 沼气专利等在内的9个专利数据 的实施,建立项目管理数据库, 极性,参与知识环境的建设,及 库。并进一步在此整合的数据仓 服务于基地整体层面的信息采集 时提供信息、知识,使他们不仅 库的基础上,采用Apache + PHP 和决策管理。依托这些数据库, 是知识环境的用户,而且是重要 + Mysql的web开发工具,采用基 我们可以进行综合统计,进一步 的建设者;其次,我们利用现代 于MVC的ThinkPHP框架,开发了基 挖掘隐性知识,形成基地管理的 化IT技术,对“中国工业生物 于web的工业生物技术专题数据库 知识积累。 技术信息网”等门户网站进行维 的检索查询系统,初步实现了基 3)虚拟实验室 于web的信息浏览、检索、统计 先进工业生物技术基地涉及 功能。 2)信息平台 e-Science 总第6期 护,实时发布信息。 5)战略研究服务 的实验室不是独立的个体,必须 由于工业生物技术所涉及 加强交流,密切合作。为了给科 的学科范畴较为复杂,包括基础 49 技 术 e-Science 应用 e-Science APPLICATION 生物学、生物技术、化工技术、 工业生物技术发展态势的专题报 策依据,具有重要的理论意义和 工程技术等领域,体现出较强的 告;我们还为“先进工业生物技 现实意义。 学科交叉的特点,导致决策制定 术基地”在“纤维素乙醇的高温 者和科学家花费了大量的时间和 发酵和生物炼制”等重大项目的 精力却难以得到准确的情报、文 立项和“生物质资源科技领域” 献、专利等资源,对相关领域的 发展路线图的制定提供了可靠的 产业发展和动态缺乏全面和系统 战略与信息服务。 4.意义及前景 工业生物技术战略研究与知 识环境建设是一种全新的信息化 的把握。因此迫切需要建设一个 这一知识环境对无论是对 工作和服务模式的探索,将信息 非常有效的、可利用的资源和信 相关领域的决策者、科研人员, 化平台工作建设与实际的科学研 息服务平台,为政策制定和科研 还是对企业界人士,都具有重要 究活动紧密结合,对于加强信息 活动提供支持。 的意义。借助工业生物技术领域 技术在科研中的应用,提高科学 在“工业生物技术战略研究 的战略情报研究,相关管理者和 研究活动的效率等方面有着积极 与知识环境建设”过程中,我们 决策者可以了解各国制订战略规 的意义。 充分考虑到该领域的特殊性,借 划的背景、内容,各种计划的实 开展工业生物技术战略研究 助网络信息技术手段搜集国内外 施方略、组织方式,以及计划的 和知识环境建设的目的旨在为了 工业生物技术领域较为全面的、 实施情况,总结各国的战略规划 促进“先进工业生物技术创新基 有代表意义的、多类型的动态信 的成功经验,使之在制定工业生 地”的科技创新活动,为决策部 息资源,采用情报研究领域的知 物技术的发展计划过程中有所借 门、科研管理者以及科学家提供 识管理技术,开发相应的数据挖 鉴;借助战略情报研究,科研人 快捷、及时的工业生物技术信息 掘工具,揭示工业生物技术领域 员可以了解、追踪国内外在工业 和决策报告。到目前为止,知识 的知识概念之间的内在联系,建 生物技术领域的最新发展动向, 环境已经为中国科学院先进工业 立工业生物技术知识分类体系, 准确把握国际、国内的战略规划 生物技术基地所涉及到的数十个 实现对各种信息资源进行组织 与研究计划、政策,合理调整研 研究所、近百位科研人员和科研 与管理,提供系统的战略决策情 究方向,使之适应国家战略规划 管理工作者提供服务,它为管理 报、学科情报与竞争情报,从而 和产业化的实际要求;借助战略 与咨询决策提供参考依据,为科 构建规范化、数字化的工业生物 情报研究,企业界人士能够分析 研与开发人员提供全面及时的研 技术战略研究与集成知识环境。 和预测工业生物技术领域的基础 究方向评述和市场需求分析以及 我们通过及时搜集整理和 研究方向和产品开发潜力,明确 深层次、高层面的战略研究与知 分析工业生物技术领域动态消 市场定位。战略研究服务兼具专 识决策环境。 息,深入研究国家经济社会发展 业咨询、决策依据与信息导向的 知识环境的建设已经初具 的相关战略需求和本领域国际科 作用,通过个性化的信息定制服 规模,也摸索出了一套适合的发 技发展前沿与趋势,取得了一定 务,将信息与资源及时和准确地 展模式。要真正地使知识环境有 的成果。例如,通过对国内外工 传递给最需要的人。因此,加强 效地运转起来,就必须与科研领 业生物技术领域著名公司和研究 工业生物技术领域的战略情报、 域的专家和科研人员相结合。因 机构的发展状况的调研,结合 企业与产品的竞争情报以及学科 此,我们从建设之初,就一直是 专家的建议,我们推出了《生物 情报的研究,可以为国家的战略 以从科研活动的实际需求出发为 柴油》、《生物丁醇》、《聚乳 决策、科学家的研究活动、企业 原则进行的,并取得了比较好的 酸》、《纤维素乙醇》等一系列 的生产提供科学的情报咨询与决 效果。在建设工业生物技术知识 50 e-Science 2009年 APPLICATION e-Science 应用 仓库时,对科学家的需求进行了 也为专家提供了可以订制的个性 领域进行推广。我们还将广泛开 实际的调研,根据科研活动的情 化信息服务,科研人员可以通过 展与国内外工业生物技术领域企 况,进行数据库的设计,并且通 网络选择他们所关注的新闻、文 业的合作,将知识环境的服务对 过虚拟实验室和网格环境,可以 献、专利、会议等各种信息进行 象从科研人员拓宽到工业生物技 将数据积累与科研活动有机地联 订制,知识环境会将所订制的信 术领域相关企业,为企业提供相 系起来并且在科学研究中应用。 息直接发送给科研人员,避免了 关信息咨询和决策支持服务,增 在进行战略情报研究的过程中, 信息搜集的复杂性和冗余信息的 强科研人员与企业的有效交流, 也是通过网络环境的有效组织, 干扰。 促进科技成果向实际生产力的转 将专家的智慧通过网络环境聚集 我们的目标是要将知识环 化。为我国的工业生物技术的科 并且通过信息化的手段转变为可 境的概念和信息管理模式在我国 研和生产发展提供技术和智力 以直接利用的知识。同时,我们 工业生物技术甚至整个生物技术 支持。 参考文献: [1] Organization for Economic Cooperation and Development. [3] 曹竹安. 抓住大好时机 发展工业生物技术. 生物技术 Biotcchnology for Clean Industrial Products and Processes: Towards 产业,2007,2. Industrial Sustainability. Paris: OECD report, 1998. [4] 苏庆. 工业生物技术数据仓库ETL系统的设计与实 [2] 江洪波,等. 工业生物技术领域重大规划与项目.2008 现.中国科学院微生物研究所硕士论文,2008. 工业生物技术发展报告.北京:科学出版社,2008:2-29. 收稿日期:2009年4月16日 作者信息 马俊才 中国科学院微生物研究所信息网络中心,主任、正高级工程师,研究方向为生物信 息学、生物网格、并行检索技术、超大规模全文检索技术、远程异构数据库的检索 引擎技术、LINUX机群系统、IT技术在生物学领域的综合利用等。 e-Science 总第6期 51

“工业生物技术知识环境”建设及应用.pdf




