我国智慧农业大数据的发展状况(国内外农业科学大数据建设与共享进展)
AGDATA
布瑞克新媒体出品
来源:《农业大数据学报》
2019年第1卷第1期
3
农业科学数据的开放共享
3.1科学数据的共享政策
资源的价值在于共享和利用,数据共享为实现科学数据价值的最大化提供了一条有效途径。欧美等发达国家和地区较早开展了科学数据共享的研究,先后发布了很多有关科学数据共享的规范和政策。
目前国际上科学数据管理与共享政策主要分为宏观、中观和微观三个层次。
宏观层次的数据政策主要是指由国际组织倡导的数据政策和各国政府制定的数据政策法规。国际科学数据委员会(CODATA)于2000年制定了《网络时代的科学原则》,认为科学的进步依靠全面和公开地获取数据,数据的发布是科学研究和知识传播的基础,数据所有者的利益必须平衡社会对开放交换的需求,立法者要考虑知识产权法可能对研究和教育产生的影响。世界数据系统(WDS)奉行的数据政策为:在考虑到相关国际准则、国家政策和法律的情形下,WDS成员间的数据、元数据以及数据产品要实现充分地共享与交换。经济合作与发展组织(OECD)制定了《公共资金资助的研究数据获取原则与指南》,在成员国之间形成共享共识,该《原则与指南》还指导着各成员国制定并完善各自的科学数据共享政策。在国际组织倡议的原则下,各国政府制定了相应的数据政策。美国政府制定的《信息自由法》和《版权法》构成了数据共享政策的法律基础,明确了公众对政府信息和数据具有自由获取的权利,相关的法律还包括《阳光法》和《隐私权法》等。英国于2000年通过了《信息自由法》,并在2005年开始实施。日本政府2001年颁布了《信息技术基本法》。德国推行了《信息和通讯服务规范法》,俄罗斯推行了《联邦信息、信息化和信息保护法》,法国推行了《信息社会法》等。
中观层面的数据政策通常指由研究资助机构制定的政策,美国国家科学基金会(NSF)发布的项目管理指南中规定,从2011年起,所有提交到美国自然科学基金委员会的项目申请书必须包含一份不超过两页的“数据管理计划”的附件。美国国立卫生研究院(NIH)制定了《数据共享计划》,要求从2003年10月1日起所有向NIH申请项目经费在50万以上的科研人员都必须包含一个数据共享计划或者数据不共享的说明。澳大利亚研究理事会(ARC)和国家健康与医学研究理事会(NHMRC)均有关于科学数据共享的相关规定,ARC项目资助指南从2008年开始就鼓励研究者将项目研究中产生的数据和出版物存放在合适的学科库或者机构库中,并在项目最终报告中说明存放的地方。
微观层面的数据政策是指操作性更强的数据政策,国外的许多高等院校制定了较为详细的数据管理政策,如英国的牛津大学、爱丁堡大学以及美国的斯坦福大学、匹兹堡大学等。英国大学的政策偏重于数据管理计划、数据管理指导与服务,美国各大学的数据管理政策重点关注数据访问、保存和所有权。微观政策的另一类是指由学术期刊和出版商制定的政策。目前Science、PNAS、Nature、BMC等出版商及期刊都制定了科学数据政策,对数据的存储及传播做出明确要求。Nature要求作者在提交论文时,必须提交研究中相应的数据,并且要经过编辑审查和同行评议。PLoS从2014年3月1日起推行新的科学数据开放政策,作者提交论文时必须提交一份数据可用性声明,以方便共享论文中相关的科学数据。一些主流的生态学和进化生物学期刊与数据保存机构Dryad签署合作,承诺在投稿政策中鼓励作者将论文相关数据提交至Dryad保存并共享。
在国内,2004年中共中央办公厅发布了《中共中央办公厅、国务院办公厅关于加强信息资源开发利用工作的若干意见》,2007年国务院公布了《中华人民共和国政府信息公开条例》,这些成为指导我国科学数据共享的重要政策文件。2008年发布的《国家重点基础发展计划资源环境领域项目数据汇交暂行办法》是我国科研资助机构数据政策的代表。此外,国家重点基础研究发展规划、国家高级研究发展计划和国家科技支撑计划等项目管理规定中也有关于数据管理与共享的相关规定。值得一提的是,2018年国务院印发了《科学数据管理办法》,该办法明确了科学数据管理的职责,对数据采集、汇交和保存,数据共享与利用,以及数据保密与安全都做出明确规定,明确要求建立科学数据汇交制度,即“政府预算资金资助的各级科技计划(专项、基金等)项目所形成的科学数据,应由项目牵头单位汇交到相关科学数据中心”,同时,还要求各级科技计划(专项、基金等)管理部门建立“先汇交科学数据、再验收科技计划(专项、基金等)项目”机制,该办法为各领域各部门制定科学数据管理政策指明了方向。
3.2科学数据的开放获取
根据世界银行的定义,开放数据是指数据可以被任何人自由免费地访问、获取、利用和分享。《开放数据宪章》将开放数据定义为具备必要的技术和法律特性,从而能被任何人、在任何时间和任何地点进行自由利用、再利用和分发的电子数据。以上定义均突出强调了开放数据供社会进行充分利用和再利用,意在释放数据能量,创造社会经济价值。
科学数据的开放最早起源于2003年,在德国马普学会发布的《柏林宣言》中指出了开放获取的内容,其中包括原始科学数据。之后,科学数据开放获取运动不断发展。
OECD的34个成员国于2004年签发了《开放获取公共资助研究数据的宣言》,2006年签发了《开放获取公共资助研究数据的原则和指南》,并对开放数据的范围和定义进行了界定。政府作为社会管理的主体,数据拥有量以及数据公开服务责任都是其他部门无法比拟的,在开放数据运动中理应首当其冲。
美国是政府开放数据的发起者。为建立更加开放透明、参与、合作的政府,2009年1月,美国总统奥巴马签署了《开放透明政府备忘录》,同年数据门户网站Data.gov上线,美国联邦行政管理和预算局(OMB)向白宫提交的《开放政府令》获批准。
2011年9月20日,巴西、印度尼西亚、墨西哥、挪威、菲律宾、南非、英国、美国等8个国家成立开放政府合作伙伴(OGP,Open Government Partnership),联合签署了《开放数据声明》。
2013年6月,八国集团首脑在北爱尔兰峰会上签署《开放数据宪章》,G8成员国承诺,在2013年年底前完成开放数据行动方案的制定,最迟在2015年末按照宪章和技术附件要求来进一步向公众开放可机读的政府数据。
政府开放的数据网站,主要内容为各国政府产出的资料与数据集,且大多属于公共领域的数据集,这些数据不涉及国家安全以及相关机构单位限制的保密数据,通常由各单位自行上传。
如美国的Data.gov网站,提供“一站式”数据服务,只要数据不涉及隐私与国家安全,均公开发布,目前已开放了超过20万个数据集供社会免费利用,覆盖农业、商业、气候、消费、生态、教育、能源、金融、卫生、制造、海洋、公共安全、科研、地方政府等10多个主题。
英国的数据开放门户网站(data.gov.uk),共开放了13 670个公开的数据集以及4170个非公开的数据集,其中农业领域数据集集中在环境主题下,开放的数据集达13 400多个。
澳大利亚政府信息目录的开放数据平台(data.gov.au),网站包含了169个部门的29 136个数据集,提供多种格式的数据下载和在线数据服务的链接,该门户还通过特殊的工具,向用户开放地理空间数据集。
除了政府部门外,一些国际组织也积极推动并参与科学数据的开放。
2012年7月,欧盟委员会(European Commission,EC)发布开放共享政策,宣布Horizon 2020战略实施部分领域开展科学数据开放共享试验,并建议EC个成员国制定本国的公共资助科研论文开放共享政策,探索科学数据开放共享与长期保存以及相应的基础设施建设。
同年11月,Horizon 2020开放存储政策声明出版,明确指出与出版物相关的科学数据的开放存取是开放存取的必要环节。2016年2月发布科学数据管理指南和科学文献与科学数据开放存取指南,对Horizon 2020战略中的科学数据开放存取提出进一步的规定。
2013年,欧盟开放数据平台Open Data Portal向公众开放,到目前为止,平台开放了多达12 419个数据集,包括环境、经济、能源、大农业等主题的数据,其中农业、林业和渔业数据集接近800个,该主题下数量最多的是环境方面的数据达到165个,其次产量、技术和研究方面的数据集有108个,这些数据主要来源于欧盟统计局(Eurostat)、欧盟联合研究中心(JRC)、欧洲食品安全局(EFSA)等。
此外,欧洲研究与技术发展第七框架(FP7)要求其资助的科研项目成果实施开放存取,由此FP7对能源、环境、健康等领域的科研成果提出开放存取的政策要求,科学数据作为科研成果的重要组成之一,FP7主导的这一政策,增加了科学数据开放存取的可行性。
我国于2008年5月1日开始实施《中华人民共和国政府信息公开条例》,推动我国开放数据的落实,并逐步面向全社会提供开放数据获取服务。
2009年9月25日,由科技部、财政部推动建设的国家科技基础条件平台门户网站面向公众开放服务。2015年国务院提出数据资源建设与共享要加强顶层设计和统筹协调,大力推动政府信息系统和公共数据互联开放共享,加快政府信息平台整合,消除信息孤岛,推进数据资源向社会开放。国内数据中心联盟和开放数据中心委员会的相继成立,以及以开放数据为主题的会议和论坛的举办,促进了我国开放数据政策的需求,也加快了开放数据的步伐。如国家发展和改革委员会发布了《关于进一步加强政务部门信息共享建设管理的指导意见》,上海、广州、贵州等地方政府也积极行动,上海发布了《2014年度上海市政府数据资源向社会开放工作计划》,广州市交通委员会印发了《广州交通信息资源整合共享平台管理办法》,贵州省政府印发了《关于加快大数据产业发展应用若干政策的意见》和《贵州省大数据产业发展应用规划纲要( 2014—2020年)》等。我国主要地方政府开放数据门户见附表3。
表3 国内主要地方政府开放数据门户
Table 3 Main local government open data portal in China
3.3科学数据出版
科学数据出版是数据共享的新阶段,也是数据达到可引用和追溯状态的又一形式,数据出版的核心内容是为数据引用提供标准的格式和永久访问的地址。数据出版有助于保持数据的完整性、防止科学造假,还能减少重复投入,提升科研人员知名度和影响力。
对于数据的出版形式,学术界也有不同的认识。
美国加利福尼亚大学把科学数据出版形式分为商业性数据仓储、数据期刊、期刊文献的支撑数据、个人或实验网站4类。
荷兰阿姆斯特丹大学则认为科学数据出版只有3种形式:科学数据仓储、科研人员服务器或网站、增强出版物。
我国学者认为数据出版形式包含数据独立出版、数据论文出版、合作出版和期刊自行出版。
学术期刊数据政策很大程度上促进了科学数据的出版,国际上大多数学术期刊都要求作者在提交学术论文时,需要同时提交论文中涉及到的原始数据,有的期刊选择自行出版科学数据,而大多数期刊选择与公共数据仓储合作,委托数据仓储出版数据,而学术期刊只专注于论文的出版。包含Nature、Science、PLoS等在内的著名期刊与Dryad公共仓储库合作,实现了科学数据与学术论文的集成出版,Dryad将数据集信息和来源文献信息进行集成,要求来源文献中必须插入存储在Dryad中的数据的DOI号,实现文献和数据的关联。
数据出版除了依靠公共的数据仓储外,以数据论文的形式展现给用户也变得逐渐盛行,2012年Wiley集团推出了发表地球科学数据论文的数据期刊Geoscience Data Journal,主要以数据论文的形式出版地理领域的科学数据。2014 年5月自然出版集团正式出版数据期刊Scientific Data,帮助科研人员发布、发现和重用研究数据,此外开放获取出版商BioMed Central推出了数据期刊BMC Research Note,专门发表实验结果为阴性的研究数据,也称之为“黑暗数据”,避免其他科研人员费时费力的重复劳动。
目前作为我国唯一的专门面向多学科领域的科学数据出版学术期刊《中国科学数据》,主要致力于发表生命科学与医学、地球系统科学、物理学、化学、社会科学等多个领域的基础数据及数据产品,该期刊完整的数据论文出版包括数据论文和对应数据集两部分,二者通过DOI实现关联,并经同行专家评议以保证数据的质量。
在全球变化领域,以中国科学院地理科学与资源研究所和中国地理学会主导建设的全球变化科学研究数据出版系统从2014年开始投入运行,接受数据集(库)的投稿和出版,数据集(库) 包括元数据、数据论文、实体论文三部分, 出版的数据集各有一个相对应的数据论文(中英文版) 关联出版,至今已在线出版了431个数据集,并且于2017年创办了《全球变化数据学报》(季刊),目前共出版7期。
此外中国科学技术信息研究所、中国农业科学院农业信息研究所等机构也正在积极关注科研论文和数据的集成出版,并正在尝试创建数据期刊,其中中国农业科学院农业信息研究所主办的《农业大数据学报》数据期刊已经被批准创办,作为我国农业领域唯一的数据期刊,今后必将为我国农业科学数据的发布、共享和重用发挥重要作用。
4
农业科学大数据建设与共享
问题及对策
随着国家农业科技投入的不断增长,农业科学数据资源总体规模呈现指数级增长,加之农业科学具有较强的综合性和交叉性特点,为农业科学数据资源建设和共享带来了诸多挑战。一些问题和不足也在实践中逐渐显现,表现为:
①科学数据共享政策尚不完善,政策执行效果得不到保障,数据整合和共享进展受到影响。
②一些数据库系统性、整体性欠缺,总体质量有待进一步提高,资源管控和评价机制不足,影响数据的使用和进一步分析。
③资源整合和挖掘深度不够,尤其是数据跨界融合不足,科学大数据增值效果不明显。
④数据版权仍然是制约数据共享进程的重要因素,数据开放与出版有待加强和深入等。
综合以上分析,结合10多年在农业科学大数据建设与共享方面的实践经历,提出如下建议:
(1)政府层面进一步完善政策体系,尤其强化政策执行
数据建设与共享,需要政策先行,有效的政策推动是实现全社会科学数据资源科学建设与充分共享的必要条件。在农业领域,我国现有的信息共享机制过于柔性,大多属于合作性质,缺乏硬性约束,给信息共享带来很大的障碍,需要进一步完善政策体系,采取立法的刚性措施,使相关部门和人员有法可依,打破各自为政的壁垒,将数据资源建设与共享作为一种制度贯彻执行。要以《科学数据管理办法》为契机,加强宣传教育,提升全社会的农业科学数据资源汇交与共享意识。在政策制定上,要层次性分明,从宏观(国家)、中观(政府部门)和微观(科研机构、高校、期刊等)角度完善相关政策体系。在政策执行上,要以目标为导向,强化执行效果,既要有“接受政府财政经费支持的机构、个人、项目等,有义不容辞的责任向国家提交相关科学数据”这样的强制要求,也要通过奖励、政策引导等多种方式充分调动数据生产、汇交、存储、评价、传播各环节参与者的积极性与主动性,确保政策执行到点、到位。
(2)创新农业科学数据资源建设模式,提升资源整合效率
我国现有主要农业科学数据平台基本上都是以国家财政立项支持的方式开始建设的,大都采取由牵头单位通过任务书(合同)的形式将各个参建单位组织起来开展农业科学数据资源整合,这种模式给数据资源建设的范围、深度和规模都带来了一定局限性。为此,未来农业科学数据平台可采取资源交换(如与科学数据出版商建立资源互换渠道)、用户自主资源注册(如利用积分权益对等的方式鼓励用户提交自己建设的农业科学数据资源)、任务众包等措施创新和完善现有的资源建设模式,不断增加农业科学数据资源建设的参与主体,提升农业科学数据资源建设效率。
(3)加强农业科学数据资源关联与集成,提高资源整合深度
当前,国内农业科学数据平台建设的绝大多数资源均是以相互独立的数据库形式存在,未能实现不同数据库之间的关联,这就使得农业科学数据平台在面对用户诸如数据资源挖掘与分析、数据产品定制与开发等深层次和个性化需求时显得力不从心,直接导致农业科学数据平台的共享服务效果大打折扣。为改变这一局面,今后,农业科学数据平台要充分利用大数据智能处理、关联数据、知识组织体系、数据融合等技术手段对不同农业科学数据库间的关联关系进行挖掘、分析、揭示和再组织,实现农业科学数据资源的深度整合、跨界整合和集成。
(4)推进农业科学数据开放与出版,促进数据共享与利用
总体来看,目前我国开放政府数据还存在数据量少、价值低、可机读比例低、动态数据少、数据授权协议条款模糊等问题,各地的数据开放工作在数量和价值上离社会需求仍有较大差距,无法满足经济发展与社会创新领域的需求,包括农业科学数据在内的大量高价值且不涉及国家安全、商业机密和个人隐私的数据尚未开放。这就要求在接下来的工作中,一方面要加强政府开放数据门户对农业科学数据资源的开放力度;另一方面,可重点建设集中揭示各级政府部门、科研机构、高等院校、企业等不同来源农业科学数据资源的专业数据开放平台。
此外,在农业科学数据出版方面,除建设专业的农业科学数据期刊外,我国农业类科技期刊也可借鉴国际上、国内医学和地球科学等其他领域学术期刊的经验,对作者投稿的文章所涉及的原始数据的保存与共享提出要求,不能仅仅满足于以附件或图表的形式向读者公布数据,而应充分考虑从便于数据共享与再利用的角度,确立机制把数据提交到专业的存储机构或数据中心,与数据中心合作,为数据与文献的集成出版创造条件。
5
总结
科学数据是信息时代最基本、最活跃的科技资源,随着科学数据保存与共享理念的普及以及大数据技术的不断发展,科学大数据资源的科学价值和使用价值得以充分体现,科学大数据资源的建设、管理与共享工作逐渐得到世界各国政府、科研机构、科学家的高度关注和重视,相关发展战略、规划、计划框架等也纷纷出台。
在此背景下,农业科学大数据的建设与共享实践取得诸多成果,一批质量高、应用广的农业科学数据库及平台得到持续建设和发展,开放数据、数据出版等新模式在农业科学大数据共享中也得到有效应用。
当然,在农业科学大数据资源建设与利用工作不断推进的过程中,也面临着一些问题与挑战,这些问题和挑战既涉及到相关的政策制定,也关系到农业科学大数据资源整合、开放共享的实际成效,需要未来农业科学大数据资源建设与利用的参与各方共同努力解决与应对。在政府层面需要进一步完善政策体系,尤其强化政策执行;在资源整合层面,一方面为提升资源整合效率,急需要创新农业科学资源建设模式,另一方面为提高资源整合深度,需加强农业科学数据资源关联与集成;在数据开放共享层面,为促进农业科学大数据的共享与利用,还需要积极推进农业科学数据开放与出版。只有数据利益相关者从各个层面加以努力,我国才能真正迈入农业科学大数据建设与共享时代。
END
推 荐 阅 读
Q: 你理解的农业大数据是什么?
欢迎留言与大家分享
请把这篇文章分享给你的朋友
转载 / 投稿请BricSZ_PR@accfutures.com
布瑞克农业大数据是一家通过农业大数据收集、处理、分析和可视化系统,服务于政府、涉农企业、科研机构等行业的大数据应用公司。历时10年,现已发展成为集农业咨询、信息技术、土地流转、电子商务、供应链风控服务为一体的智慧农业大数据综合解决方案提供商。
截止2018年底,布瑞克已与300多县达成农业大数据平台建设和智慧农业合作框架,超过20个县正式开展农业大数据业务。2017年布瑞克县级农业大数据入选农业农村部农业农村大数据实践案例,2018年布瑞克苏州公司入选苏州市独角兽培育库企业。
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com