当前位置: 您当前的位置 : 科技金融网  ->  人物  -> 正文

畅游“数据海” 共享大智慧

2018年12月07日 14:44:03 来源:浙江日报 作者:

  浙江日报记者黄慧仙通讯员何冬雪

  走进浙江大学玉泉校区图书馆,穿过数字图书馆工程研究中心的大门,一排排印有“CADAL(大学数字图书馆国际合作计划)”的玻璃墙拦出的长长走廊。往里走,再刷开一道玻璃门,便是浙江大学计算机学院庄越挺教授的办公室。

  在这一道道门墙之内,庄越挺所做的,却是不断拆除“藩篱”的工作,让囿于时空阻隔的知识汇成无边界的“汪洋”。

  “我读大学的时候,计算机系只有两台微机,各带4个终端,我们都是轮流上机的。每次进机房,一看到那一闪一闪的光标,内心就特别兴奋。”从学生时代到留校任教,30余年光阴,庄越挺都在浙江大学玉泉校区度过。

  庄越挺曾担任浙江大学计算机学院院长。回溯往昔,他与团队实现了250万册图书的数字化。2000年初,当时世界上已出版的图书有1亿册,却多未进行数据化。于是,2002年至2012年,庄越挺带领团队建成了全球最大的公益性数字图书馆,广袤的知识之海从图书馆蔓延至世界的每个角落。

  “图书数字化可以让任何人在任何时候、任何地点获取人类的任何知识,知识的获得不再有不可逾越的边界。”庄越挺说,如今鼠标轻轻一点,几秒便能在世界任何地方搜索到需要的古籍内容。据后台统计数据显示,2017年,该数字图书馆在线服务资源超过240万册,资源门户访问总量达2亿多次,图书访问1500万册次,访问人员来自2092所海内外高校及科研机构。

  一点浩然气,千里快哉风。在数字图书馆项目基础上,庄越挺团队又成为中国工程院启动建设的“中国工程科技知识中心”项目的核心技术力量之一。

  2010年前后,正是国外“大数据”概念开始流行之时。而早在数字图书馆项目开展时,庄越挺便敏锐地嗅到了当时数字化背景下出现的海量数据问题。“做图书录入时我们发现,项目中积累下的数据越来越多,它与以往的小数据明显不同,其如何存储、传输、拷贝、冗余备份都是值得思考的问题。”庄越挺说,当时潘云鹤院士便早于“大数据”概念而提出了“数据海”概念,意为如“浩瀚大海般”的“丰富矿藏”。

  正是这些在前期项目中的积累与思考,之后“中国工程科技知识中心”项目的开展才有了更为坚实的根基。

  “随着科技的发展,中国在工程科技领域积累下了诸多资料和数据,其中一部分是以图书形式呈现,另一部分则记载于很多没有发表的工程技术文档中,它们往往存在于专业数据库,一般的网络搜索引擎难以直接搜索到。”2012年接手新项目时,庄越挺便面临一道来自中国工程技术领域的新“藩篱”。

  于是,庄越挺的“拆墙”征程再次开启。打通数据库,让工程科技知识的搜索变得透明而便捷,这成为庄越挺工作的动力所在。

  “大部分数据是非结构化的,如何将无序的、繁杂的数据加工成标准化、结构化的数据,是项目需要解决的关键问题。”庄越挺说,构建知识技术引擎成为必然之选。通过专业知识服务系统,来自化工、海洋、能源等多领域庞杂的工程科技知识便尽入需求者囊中。最终,该项目得到联合国教科文组织的高度肯定,并为中国赢得“国际工程科技知识中心”的落户。

  30多年来,庄越挺在人工智能上的研究广阔而深入。其间,他发表了200多篇学术论文,三次获国家科技进步奖二等奖,2015年入选浙江省特级专家,并先后与浙大网新、科大讯飞、海康威视等企业建立人工智能合作研究中心,让科研成果落地生根。

  “如果世界是一个象限,以交通、餐饮、住宿、医疗等各类你想得到的应用为横坐标,以人工智能技术为纵坐标,那么,其中的每一个交点都大有可为。”采访收尾,庄越挺在手边的一张白纸上画下两条坐标轴,以工科生特有的思维作了这样一个比喻。

  透过纸上这些密布的交集点,我们似乎看见,中国人工智能的未来正穿越其间,随着一行行代码的铺展,谱写出无限的可能……

[编辑: 李伟民]
(本文来源:浙江日报)
  • 科技金融时报
Copyright © 2014 kjjrw.com.cn. All rights reserved. 浙ICP备14017371号-1
互联网新闻信息服务许可证 33120170005

联系我们

地址:杭州市文一路115号
举报电话:0571-87089618
法律顾问:北京京师(杭州)律师事务所陈佳律师