哪些地方开放了真正ldquo能用r
大数据文摘授权转载自复旦DMG作者:郑磊,复旦大学国际关系与公共事务学院教授新冠肺炎疫情发生以来,各地政府通过多种渠道发布疫情数据,对于满足公众知情权,加强自我防护起到了重要作用,还有些数据被专业人员进一步利用,开发出了许多受到公众欢迎的服务应用。然而,各地发布数据的内容和方式各有差异,带来的阅读体验和利用价值也各不相同。哪种数据发布方式是不容易看懂的?哪种方式是虽然能看懂,但不容易拿来用的?怎样的数据才是真正“有用”和“好用”的?我国又有哪些地方开放了真正能用和好用的数据?这些数据被用来做了什么?本篇就来讨论盘点一下这些问题。哪种数据是用来看,但还不能用和不好用的?文字+数字目前,大部分地方是以在文字中夹杂数字的形式发布疫情统计数据,包括疑似病例、确诊病例、密切接触者、病情平稳病例、重症危重病例、死亡病例、出院病例数量等(如下图),覆盖了疫情发展和治疗过程的基本环节。这些统计数据有助于公众了解一个地方的疫情总体状况。然而,这些统计数据是对原始数据进行加工和归总后形成的结果,并不是细颗粒度的一手数据,数据的利用价值有限。因此,针对公众获知和利用更具体的病例个体数据的需求,有些地方发布了病人的性别、年龄、居住区域、医院、病症、行动轨迹、湖北接触史等病例数据(见下图),包含了病例的基本信息、行为特征和诊疗情况等方面,这类更为原始和一手的数据比统计数据更为详尽全面,也有更大的深度利用空间。但总体上,这类将数据夹杂在文字中发布的方式还缺少用户视角和数据利用思维。对于普通公众来说,这种方式不够清晰直观,不便于阅读和理解;对于专业人士来说,这种形式也不便于被开发利用,如果要对这些数据做一些处理分析,需要先将数据从这些文字中提取出来,整理成结构化的表格。图片格式的表格因此,有些地方又开始在疫情通告里以结构化表格的形式来展现数据(见下图)。这些表格比起文字更为直观清晰,便于普通读者阅读和理解。但对于专业的数据利用者来说,这些以图片格式提供的表格,好看但还不好用,如要对这些数据进行分析,需要先将图片中的数据转化为机器可以读取和处理的excel或csv等格式。而且,这些包含数据表格在不同的时间发布,呈现为碎片化、不连续的状态,如果想要分析某段时期内的趋势,就要把之前发布的一条条通报搜寻出来,然后再把其中的数据整合连接起来。可视化展现为了让数据更为直观易懂,还有些地方使用了可视化图形的方式来展现数据(如下图)。同样,对普通公众来说,这种图形化形式虽然生动形象,易于理解,但对专业用户来说,这些可视化图形并不是数据本身,而是基于原始数据制作的一种数据应用。对他们来说,这些图形往往还不如朴素简单的表格更为好用,他们还需要手工把这些图形上的数据再提取还原为数据表格后,才能做进一步的分析利用。数据不仅要能看,还要能“用”和好“用”在大数据时代,政府在“发布数据”的同时,还需要进一步“开放数据”,前者是为了便于“看”,后者是为了易于“用”。传统的信息公开提供的是文本形式的文件,或是经过归总分析后的统计报告,这种方式便于公众阅读和知晓结果,保障公众的知情权。但在大数据时代,公众的需求有了变化,他们不仅想要“知道”,还想对数据做些“利用”,他们不仅仅是数据的读者,也是数据的利用者。从“知情”到“利用”,这正体现了从信息公开和数据开放的递进,并对政府提供数据的内容和方式都提出了新的要求,从而使数据既能用又好用。目前,政府部门发布的疫情数据虽然已在便于阅读上花了很大功夫,但大多还不便于被加工利用。那么,怎样的数据才是真正能用和好用的?目前,在世界各国的政府数据开放实践中,开放数据通常呈现为以电子化、结构化、可机读格式开放的数据集。数据集是指由数据组成的集合,通常以表格形式出现,每一列代表一个特定变量,每一行则代表一个样本单位,总体上,这样的形式才能用和好用。具体而言,国际上普遍接受的数据开放基本原则包括以下七项:需要强调的是,政府在开放数据疫情时还要把握好保障公众知情权和保护患者隐私之间的平衡,防止个人数据的过度披露对患者带来伤害。我国哪些地方真正开放了能用和好用的疫情数据?那么,目前我国有哪些地方开放了真正“能用”和“好用”的疫情数据呢?我们发现,以下这些省级、副省级和地级政府已及时在其数据开放平台上提供了可获取的、完整的、细颗粒的、及时的、可机读的、结构化的数据,这些数据符合开放数据的基本标准,是我国疫情数据开放的引领者。北京市目前,北京市政务数据资源网已开放了由市卫生健康委员会提供的数据集“新型冠状病毒感染的肺炎病例信息”。
网址:
转载请注明:http://www.dwwaw.com/kjzms/13091.html
上一篇文章: 与西安医院精神心理科下一篇文章: 华欧教育医院招聘16人