《数据科学与分析:Python语言实现》 —1.5 总结
【摘要】 本节书摘来自华章计算机《数据科学与分析:Python语言实现》 一书中第1章,第1.5节,作者是[英]赫苏斯·罗格尔–萨拉查(Jesús Rogel-Salazar),白 皓 刘江一 上官明乔 刁 娟 译。
1.5 总结
在本章中,我们讨论了一些关键方面,这些方面将使我们能够得到鹿角兔般存在的数据科学家。我们为数据科学这个术语提供了定义,并描述了它是如何迅速发展的多学科领域——涉及数学、计算机科学、统计学和商业领域。
我们提到了一些数据科学产品的例子,并且已经看到数据科学和分析的主要动机是从数据中获得有价值和实际可操作的见解。我们的讨论指出,为了实现这一目标,需要具备适当技能的数据科学家。不幸的是,一些人对数据科学家产生了一些过高的期望,即数据科学家的角色应该类似于神秘的独角兽。我们认为,要想更好地理解这个角色,应该使用不同的形象,即鹿角兔。它仍然是一个神话般的存在,但是你可以从现实中(如在团队中)拼凑出一个这样的整体,或者暗示它们可能存在科学的解释,这为许多对利用自身大数据感兴趣的企业提供了更有希望的全景展望。
我们接下来讨论了支持高效数据科学团队的3个主要角色,即数据科学项目经理、首席数据科学家和数据架构师。我们看到,不仅团队组成很重要,而且能以高效的方式执行任务的工具是也不可或缺的。在本章的最后,我们概述了简化的数据科学工作流程中的步骤,并解释了这些步骤应该被视为迭代过程一部分的重要性。
在下一章中,我们将简要介绍一些使用Python的重要概念。这将使我们能够为本书的其余部分提供一些参考点,其中Python将用于实现各种算法,这些算法也是构成数据科学家的技巧包的一部分。
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)