一篇文章读懂数据可视化的发展


发布时间:Jan 21, 2020 9:01:25 AM      创建人:心之所向      来源:原创      访问量:4323次

前言

百度搜索“数据可视化”,大概能查到7,150,000个词条。“数据可视化”是当今数据分析领域中发展最快,也是最引人注目的领域。

“数据可视化”这个词并不难理解,但是说到数据可视化的起源,估计知道的人就不多了,就连百度百科的词条上起源时间也只是写到了二十世纪50年代,数据可视化一般被认为是起源于统计学诞生的时代。但是真正追溯其根源,可以把时间往前推10个世纪。

10 世纪:填补空白

让我们一起先来看一幅10世纪的数据可视化作品,这幅作品应该是目前能找到的时代最久远的数据可视化作品了,是由一位不知名的天文学家创作。这幅作品中,包含了很多现代统计图形元素:坐标轴,网格,时间序列。(这个时候中国土地上应该是宋朝,宋是个很NB的朝代,以后有机会我会再开个主题)

14-17 世纪:拉开帷幕

接下来欧洲进入了一个伟大的时期,文艺复兴时期(14世纪-17世纪),这段时间里面出现了很多现代科学和艺术的牛人,出现了各种测量技术,著名的“笛卡尔”弄出来了解析几何和坐标系,费马和赌徒哲学家帕斯卡发展出了概率论(那个时候真是黄金时期,赌博也可以弄一门理论出来),英国人开始了人口统计学研究。这些科学和艺术的发展,为数据可视化正式开启了大门。

18 世纪:初露锋芒

时间来到18世纪,这个世纪牛顿老爷子被苹果砸了,微积分,物理,化学,数学都开始蓬勃发展,统计学也开始出现了萌芽。数据的价值开始为人们重视起来,人口,商业等经验数据开始被系统的收集整理,记录下来,各种图表和图形也开始诞生。(这个时候中国是清朝康熙时期)

我们来看一张很牛的图,作者是哈雷,就是那个哈雷彗星的轨道计算者,著名天文学家。这张图是在地图的网格上用等值线标注了磁偏角。这张图是绘制于1702年。(这个时候是清康熙四十年,看到这张图,我严重怀疑哈雷是不是穿越回去的)

这里还要提一个人,苏格兰工程师William Playfair(1759-1823),就是他创造了今天我们习以为常的几种基本数据可视化图形:折线图,条图,饼图。

英格兰 1700-1780 年进出口情况

1780-1781 苏格兰进出口情况

欧洲国家的领土比例及人口和税收

19世纪:黄金时代

19世纪是现代图形学的开始,随着科技迅速发展,工业革命从英国扩散到欧洲大陆和北美。随着社会对数据的积累和应用的需求,现代的数据可视化,统计图形和主题图的主要表达方式,在这几十年间基本都出现了。

在这个时期内,数据可视化的重要发展包括:统计图形方面,散点图、直方图、极坐标图形和时间序列图等等当代统计图形的常用形式都已出现。主题图方面,主题地图和地图集成为这个年代展示数据信息的一种常用方式,应用领域涵盖社会、经济、疾病、自然等各个主题。

其中一个著名的例子就是在1864年,John Snow(不是冰与火之歌的那个John Snow),他是一个医生,使用了散点在地图上标注了伦敦的霍乱发病案例。从而判断出Broad Street的水井污染是疫情爆发的根源。这个是一个典型的数据可视化案例。

另一个数据可视化的经典案例,就是1858年南丁格尔(护理人员的祖师爷),在克里米亚战争后,统计的英军伤亡人数,这个可视化图形就以她的名字命名:南丁格尔玫瑰图。

玫瑰图不仅清楚展示了军队死亡人数的变化,而且更重要的是,她将三种死亡情况也分别用不同颜色标记出来:蓝色表示死于可预防的疾病、红色表示死于战争伤害、黑色表示死于其它原因。这样可以清楚知道军队伤亡原因的结构,真正影响战争伤亡的并非战争本身,而是由于军队缺乏有效的医疗护理。

时间到了1885年,一个名叫:Etienne Jules Marey的人发明了第一款“腕式血压脉搏计”,这是一款便携式可复用的设备,可以将脉搏可视化的记录到纸上,这是人类第一次将血压变成一个可以测量的可视化内容。

19世纪中末期,可以说是数据可视化的黄金时期,出现了大量的经典作品,人们对数据价值的理解在图表的帮助下普及开来。欧洲的官方统计机构也普遍的建立起来,高斯和拉普拉斯也奠定了统计理论的基础。下面我简单的贴几幅作品大家感受一下。(这个时候中国还在清朝末期,哎)

拿破仑 1812 年远征(1869 年出版)

美国内战对棉花贸易的影响

美国第 11 次人口普查(1898年)

20世纪:稳步发展

随着19世纪结束,数据可视化的第一个黄金时期也终结了。20世纪初,数据可视化进入了低谷,原因有两个:1)数理统计诞生,追求数理统计的数学基础成为首要目标,而图形作为一个辅助工具,被搁置起来;2)一战,二战的爆发,对经济的影响深远,之前的数据表现方式已经足够使用了;当然这个时期依然还是有不少标志性作品的诞生。比如伦敦的地铁图,这种图形目前全世界的地铁都在使用,距离发明的时间已经过去快一个世纪了。

1933 年伦敦地铁图

20世纪后期-21世纪:日新月异

时间进入到20世纪下半段,随着计算机技术的兴起,数据统计处理变得越来越高效。理论层面,数理统计也把数据分析变成了坚实的科学。

世界大战后的工业和科学发展导致的对数据处理的迫切需求把这门科学运用到各行各业。统计的各个应用分支建立起来,处理着各自行业面对的数据问题。在应用当中,图形表达占据了重要的地位,比起参数估计假设检验来,明快直观的图形形式更容易被人接受。

由 DataHunter 设计制作的某媒体中央厨房大屏效果图(部分内容)

进入21世纪以来,计算机技术获得了长足的进展,计算机图形学,高分辨率高色深还原度的屏幕应用越来广泛,数据可视化的需求也正在变的越来越强烈。数据可视化即将进入一个新的黄金时代!




推荐文章