![Excel电商数据分析与应用(第2版·微课版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/903/51647903/b_51647903.jpg)
1.1.3 数据分析的流程
数据是客观的事实,但是数据本身并不会告诉人们它的价值,其蕴涵的信息需要分析师进行挖掘。数据分析的流程分为8个步骤,如图1-5所示。
![](https://epubservercos.yuewen.com/4E0D45/30471587203823406/epubprivate/OEBPS/Images/image_11_1_l.jpg?sign=1739333910-PsWnzYhHUnMhOZnKlHVDrm8iHUCAsMjx-0-3ea1c7e5c3c3f29c4b54bda26b5dc9ec)
图1-5 数据分析的流程
1.明确目标
数据分析是一种有目的的行为,比如,你想要了解销售情况,或者想找到数据之间的某种规律,一切行为操作都针对某个目标展开。因此进行数据分析的基础是目标明确,没有明确的目标,任何分析操作都可能是做无用功。
2.明确分析维度和指标
围绕目标选定进行数据分析的维度和指标,只有选定了范围才可以有目的地收集数据,并进行分析。明确的分析范围能避免分析报告内容太多、不深入。
例1-3:分析目标是了解新上线的详情页的效果,为此选定分析的维度和指标。
解:分析的维度有日期、页面,指标有停留时间、转化率。
3.数据采集
数据是数据分析的基础,没有数据就无法开展数据分析工作,数据采集是将目标数据收集到计算机硬盘等存储空间中。基础的数据采集可采用Excel、八爪鱼、火车采集器、码栈等软件,进阶的数据采集可使用Python。
4.数据清洗
采集到的数据一般会有一部分“脏数据”,所以不能直接用于数据分析,如果不处理它们将会影响分析结果。所以在进行分析前需要对数据进行检查,如果发现“脏数据”就必须进行清洗。
例1-4:表1-1所示为从淘宝生意参谋下载的店铺经营数据,其中第三行观测值中存在以“—”为标记的缺失值,如果不处理此类缺失值将无法进行下一步操作,因此需将数据中的“—”替换为数字“0”。
表1-1 店铺经营数据
![](https://epubservercos.yuewen.com/4E0D45/30471587203823406/epubprivate/OEBPS/Images/table_image_11_0.jpg?sign=1739333910-1CmkKTcivEPcmW1V1Z7RZbgpdElMD0Fo-0-43a00076165f621892eab236330cfb1b)
数据清洗可使用Excel、Python等工具,亦可使用专业的ETL(Extract Transform Load,抽取、转换、装载)工具。利用Excel中的Power Query组件(Office 2016及以上版本自带该组件),可实现大量数据的清洗。
5.数据整理
因为收集到的数据一般都是零散或者杂乱的,直接观察数据难以洞察出有效信息,所以只有对其进行整理,才能保证后续流程顺利进行。
按照某个维度汇总数据才能对其进行有效的观察。比如,要观察新的详情页上线后用户行为的变化,可以按照上线前和上线后的用户行为数据进行分类汇总,然后通过这两份数据的对比来得出结论。
例1-5:表1-2所示为淘宝网女装T恤和衬衫两个品类在2023年1~3月的成交金额数据,将数据整理成表1-3所示的形式,更便于分析。
表1-2 未经整理的成交金额数据
![](https://epubservercos.yuewen.com/4E0D45/30471587203823406/epubprivate/OEBPS/Images/table_image_12_0.jpg?sign=1739333910-NZKu7fUXkyIi4uf2NUMCoRVLtiOYEnS9-0-9e024cdf7dbb232e6d04f3ed311f025a)
表1-3 整理后的成交金额数据 单位:千万元
![](https://epubservercos.yuewen.com/4E0D45/30471587203823406/epubprivate/OEBPS/Images/table_image_12_1.jpg?sign=1739333910-QQjFOvyXhrRWifP0re493vDWOs5cthEc-0-3f90aaa6bd46e926db8ea7ba6b0afcb5)
6.数据分析
数据分析的目的是将数据转变成有效的信息。前面的步骤都是为这一步做准备,信息的提炼可以采用对比法、拆分法、分组法等分析方法。
例1-6:表1-4所示为商品标题中的关键词词根分析结果。观察表1-4中的支付买家数,可以发现“收纳箱”和“大号”这两个词根的支付买家数为0,表示没有用户通过这两个词根产生交易,因此得到的信息是“收纳箱”和“大号”这两个词根可以优化。
表1-4 关键词词根分析结果 单位:个
![](https://epubservercos.yuewen.com/4E0D45/30471587203823406/epubprivate/OEBPS/Images/table_image_12_2.jpg?sign=1739333910-sP7xsuL9C71X9ydFIELSJyicsmlHnZKg-0-8b9630b5c1fc3b33043b716e0367c411)
7.数据可视化
数据可视化旨在借助图形化手段,清晰、有效地传达信息。
例1-7:将表1-5中的数据直观地展现出来。
表1-5 多个产品的对比数据
![](https://epubservercos.yuewen.com/4E0D45/30471587203823406/epubprivate/OEBPS/Images/table_image_13_0.jpg?sign=1739333910-WATkgI1HX63l0mqhZgWaG5zE5xVutLfb-0-e5c60c693213604cf7d4cd51696b73a7)
根据表1-5中的数据画出雷达图,如图1-6所示,各个产品间的差异清晰可见。
![](https://epubservercos.yuewen.com/4E0D45/30471587203823406/epubprivate/OEBPS/Images/image_13_0_l.jpg?sign=1739333910-XK2e6bsTILWdPr0McXzQ73pZSIvAfwVo-0-4fb738553106305ccad8fd6606c4a80a)
图1-6 雷达图
8.数据报告撰写
数据报告是对分析结果进行逻辑性的集中展现并阐述分析的文档,可以采用PPT、Word文档等形式。图1-7所示为一份数据报告示例。
![](https://epubservercos.yuewen.com/4E0D45/30471587203823406/epubprivate/OEBPS/Images/cutq_13_59174_l.jpg?sign=1739333910-Y96L9SagV7eCzVWBsKwH8c27UsbPRS5H-0-8ce71979b4336e0c8c430b4bf100979b)
图1-7 数据报告示例