欢迎进入澳门名都手机论坛! 网站地图  |  XML地图

行业案例

Excel数据分析案例分享

更新时间:2021-01-08 00:45
 

  数据分析师的招聘越来越火,越来越多的小伙伴都想要往这方面发展,其中有一项必不可少的技能要求就是会 Excel 做数据清洗、建模和分析,现在就用 Excel 来实战分析数据分析师的招聘需求如何。用到的是 Mac 版 Excel 2016。

  数据清洗是数据分析非常重要的一环,做好数据清洗可以保证数据的准确度,一般会占用数据分析大部分时间,但随着经验的增长和技能的数量,效率会有所提升,但一定要细致保证每一步的准确性。

  得到原始数据后,要理解每一列的数据表示含义,选择出重点的分析对象,将无关紧要或者意义重复的列进行隐藏(最好是隐藏,不要删除数据,保留数据的完整性)。

  本数据中发现一个 “职位ID” 对应一个职位,所以只要去看 “职位ID“列 里面的 “职位ID” 有没有重复值,有的话就把重复值删除。

  重复值删除后,若此列的值共有 A 个,其他分析列的值小于 A 个,就需要将有缺失值的列补全。比如此表发现 “城市” 列有缺失,选中 “城市” 列,使用定位功能,定位 “空值”,就可以将缺失值的单元格找出来,定位功能的快捷键是 Control + G,

  找出空值的单元格后,如果需要输入在所有空格中的内容一致,则在第一个空格中输入内容后按住 Control + Enter 就可以自动将所有空值单元格补全,如果需要输入在空格的内容不一致,则可以使用筛选功能筛选出空格,再进行填充。

  一致化是什么意思?就是把所有的数据处理成容易使用公式或者数据透视表的形式。

  举例1,在 “公司所属” 列中,大部分公司从属一个行业,小部分公司从属两个行业,此时就需要将这两个行业分隔开来。此时需要用到的功能是 “分列”,一般需要将需要分列的列粘贴到最后一列,这样分割出来的列有足够的空间,不会遮挡原本单元格内容,操作如下图:

  注:如果原单元格内容是 “A,B”,用分隔符 “,” 分列后成 A、B 两列;如果原单元格内容是 “A,B,C”,用分隔符 “,” 分列后成 A、B、C 三列。

  举例2,我们需要分析薪水的水平如何,但是 “薪水”列中,薪水是使用一个区间表示的,这时需要把最低薪水和最高薪水分隔开来,才能更好的直接使用图表查看薪水情况,这里需要用到函数 Find 和 Left/Mid/Right 和 Len。

  Left/Mid/Right 函数,用于截取字符串内容,分别表示从左中右截取,公式为:

  公式完成后,用筛选功能检查数据是否全部都截取正常,发现 “最低薪水”列 有不能显示的值,如下图:

  此时需要找出问题在哪,既然公式是正确的,那去查看原本的字符串是否有问题,发现这些不能显示的值对应的 “薪水”列中都是大写的 “K”,而前面用到的公式中都用的小写的 “k”,此时使用替换功能将 K 替换为 k 即可。

  此时可看到,因为没有最高薪水所以显示不出来,处理办法可用最高薪水=最低薪水,来弥补这些缺失值。

  计算完成后,将最低薪水和最高薪水复制,选择性粘贴“值”到另两行之后可以计算平均值,并降序排列。(注意粘贴完后需要将数值的 “文本”格式改成 “数字”格式)

  “职位名称”列 中有非常多的职位名称,但我们需要分析的是数据分析类岗位,所以需要选择出与数据分析类岗位匹配的 “职位名称”。此时需要用到数据透视表功能。

  挑选计数最多的职位名称里面的关键词,可看出为“数据分析”,“分析师”,“数据运营”为三个关键词,于是回到原表,在 “职位名称” 后插入新列,选择出 ”职位名称” 里包含这些关键词的职位,此时需要用到 Find 和 Count 和 If 函数。

  if与count经常嵌套,表示查找某单元格是否包含某字符串,此案例的公式如下图:

  数据清洗完成后,需要做的是构建模型。数据分析一定是有目的的,所以在最开始就提出的分析目标非常有助于建模。利用数透功能可得以下数据透视表:

 网站地图