什么是数据可视化
数据可视化
将结果数据的每一个数据项,作为单个图元元素展示,大量的数据集构成数据图像,同时将数据的各个属性以多维度的方式展现,从而提高数据的可读性
数据可视化的优点
图形化展示比文字的描述能力更强,降低大数据据阅读门槛,清晰有效地传达与沟通信息。具体做法:是指将大型数据集中的数据以图形图像形式表示。基于几何的技术、面向像素技术、基于图标的技术、基于层次的技术、基于图像的技术和分布式技术等等
国内经典案例:
百度统计(https://tongji.baidu.com/)(导航栏demo链接进入)
阿里云 数加(https://data.aliyun.com/)
北京数字冰雹(http://www.uipower.com/)
数据处理流程
将已经存在的数据管理起来( 收集、采集 )
数据清洗 (etl extract transform load 数据仓库技术 )
数据计算:统计分析(分组、极值、多维度展示), 结果预测(spark)、python机器学习(分类/聚类算法)
数据可视化
- echarts:(百度开源项目,国内应用领域十分广泛,apache孵化器,各大领域,入门比较容易、主要是修改配置)
- highCharts: (学习可以,商用需要授权,09年发布,使用纯js编写的图表库)
- d3:D3 的全称是(Data-Driven Documents),一个被数据驱动的文档。听名字有点抽象,说简单一点,其实就是一个 JavaScript 的函数库,主要是用来做数据可视化,将强大的可视化组件应用于需求中。
预备知识
HTML:超文本标记语言,用于设定网页的内容
CSS:层叠样式表,用于设定网页的样式
JavaScript:一种直译式脚本语言,用于设定网页的行为
DOM:文档对象模型,用于修改文档的内容和结构
SVG:可缩放矢量图形,用于绘制可视化的图形