举例说明数据分析的一般过程
简述数据分析的定义及流程
数据分析的流程包括:数据采集、数据存储、数据提取、数据挖掘、数据分析、数据展现。
1. 数据采集。了解数据采集的意义在于真正了解数据的原始面貌,包括数据产生的时间、条件、格式、内容、长度、限制条件等。这会帮助数据分析师更有针对性的控制数据生产和采集过程,避免由于违反数据采集规则导致的数据问题;同时,对数据采集逻辑的认识增加了数据分析师对数据的理解程度,尤其是数据中的异常变化。
2. 数据存储。在数据存储阶段,数据分析师需要了解数据存储内部的工作机制和流程,最核心的因素是在原始数据基础上经过哪些加工处理,最后得到了怎样的数据。由于数据在存储阶段是不断动态变化和迭代更新的,其及时性、完整性、有效性、一致性、准确性很多时候由于软硬件、内外部环境问题无法保证,这些都会导致后期数据应用问题。
3. 数据提取。数据提取是将数据取出的过程,数据提取的核心环节是从哪取、何时取、如何取。 从哪取,数据来源——不同的数据源得到的数据结果未必一致。 何时取,提取时间——不同时间取出来的数据结果未必一致。 如何取,提取规则——不同提取规则下的数据结果很难一致。
版权申明:文章由用户发布,不代表本网站立场,如果侵权请联系我们删除。