全国服务热线:
18106547650

什么是数据分析?

分享到:
点击次数:207 更新时间:2020年09月08日11:12:15 打印此页 关闭

自2015年以来,我对数据分析的看法发生了巨大变化。总的来说,我认为我的回答过于狭窄地集中在技术方面,而不是我们为什么需要数据分析的更高层次的目标。

————————我在2015年写的答案——————————-

 

我已经担任数据分析师大约两年了。以下是我对数据分析的一些快速思考。

首先,数据分析不是软件工程的工作。也就是说,数据分析与构建产品或产品功能或系统或任何相关的幻想无关。

其次,数据分析不是可视化的工作。创造出色的视觉效果既不是数据分析师工作的最终目标,也不是其开始的部分。不用说,数据分析并不是要创建视觉上具有影响力的信息图表。

第三,数据分析不是科学的工作。特别是,数据分析师不在学术界工作。正是行业的特殊要求和商业市场的呼声使数据分析师的工作成为必需。数据分析师通常不发表论文,论文或书籍出版业务也不是任何数据分析师日常工作的一部分。

最后但并非最不重要的一点是,我不同意公众的观点,即数据分析至少在很大程度上是统计学。

只是想简单介绍一下自己。有一次我被要求雇用某人来协助我的工作,并最终通过电话面试了许多申请人。许多申请人来自统计分析领域,并且大多数申请人似乎听起来非常有信心,他或她将胜任该职位。但是,我最终没有在现场给他们打电话。当时我意识到的一件事是,单凭统计知识并不能使一个人有资格有效地协助我完成我需要做的数据分析工作,这是我稍后会提到的原因。

现在,我们准备讨论什么是数据分析。它包含了一些编程技能,一些统计准备情况,一些可视化技术以及最后但并非最不重要的许多商业意义。我特别关心的业务意识是使用能力或意愿(有时是急切的)将任何业务问题转换为可以使用当前或即将获得的数据来解决的问题。实际上,它采用一种特殊的方式将随机世界中充满数据的所有点连接起来,而对于大多数工作数据分析师而言,您可能不会立即发现其中的大部分。

根据我目前的理解,数据分析师是将商业世界和数据世界之间的点连接起来的人。同样,数据分析是数据分析师用来实现这一目标的技术。

我将分享我最喜欢的关于数据分析的类似物。进行数据分析就像准备一顿饭。首先从数据处理开始,包括但不限于ETL(提取,转换和加载),数据清洗,数据调试等。这与准备食物源类似,您需要冲洗食物,清洗蔬菜,肉和米饭,将食物切成适当大小的块,放在一旁。完成之后,您就可以准备烹饪食物了,这与数据探索,特征构建,特征简化,运行和组合算法等相对应。这是分步烹饪蔬菜和肉类的时候时尚,在经过特别计算的时间点上添加成分和来源,并观察原材料变成可食用的碎片。最后一步是提供食物 当您以艺术方式安排煮熟的食物,并按照特定的第一道菜,第二道菜等顺序将其提供给订购食物的客户。这是您准备以艺术化的可视化方式准备数据挖掘结果并创建报告或数据故事以发送给希望首先完成此数据分析工作的业务用户的时候。

综上所述,数据分析的过程包括数据处理,数据挖掘和提供可行的见解。根据我自己的经验,可以完成所有或部分操作的通用工具集包括Python,R,Tableau,SQL等。

Python作为通用工具特别方便,特别适合数据处理。得益于全能的scikit-learn软件包,它还可以用于数据挖掘,甚至基于其快速增长的图形处理能力提供见解。

与Python相比,R在数据处理方面有点害羞。但是,由于它的性质是“统计上完整的”(我刚说了一个词),这意味着您听说过的任何统计事物很可能已经由R包或两个R包表示了-R非常适合探索数据并在不同的参数设置上运行算法。这使R成为用于数据分析原型的好工具-例如,在您开始为“真实”编写复杂的生产代码之前,R可以识别关键特征集以及具有参数设置的足够好的机器学习算法。除上述功能外,R还具有强大的可视化软件包,可用于将可重复的数据挖掘片段转换为闪亮的报表。

谈到数据可视化,Tableau是用于可视化浏览数据的最佳商业软件之一。它对于创建交互式可视化报告或数据故事也非常方便。

除了Python,R和Tableau外,在结束本文之前,我还想提到一个数据分析工具。SQL是数据处理世界中的英语语言,至少在很长一段时间以来一直如此。它在集成不同的数据源方面功能强大,并且方便进行数据探索和数据调试。

这些只是我关于数据分析的两分钱。到目前为止,我希望对您有意义。我仍然是该领域的学习者,并且只是一个初学者,我希望在不久的将来对该主题有更多更深入的了解。

末尾配图.jpg

上一条:数据分析师如何使用统计数据? 下一条:论如何成为一名数据分析师Part 1
  • 发表评论
  • 查看评论
文明上网理性发言,请遵守评论服务协议。
首页 上一页 下一页 尾页