作者小头像 Lv.4
670 成长值

个人介绍

人工智能算法专家,专注大模型和自然语言处理领域

感兴趣或擅长的领域

昇腾、人工智能、云计算
个人勋章
TA还没获得勋章~
成长雷达
485
60
0
105
20

个人资料

个人介绍

人工智能算法专家,专注大模型和自然语言处理领域

感兴趣或擅长的领域

昇腾、人工智能、云计算

达成规则

发布时间 2023/11/21 09:20:29 最后回复 Jack20 2024/03/25 16:00:04 版块 大数据
101 5 0
他的回复:
《深入浅出的统计学》,对零基础人士超级友好,问答式学习法浅显易懂形象生动。刷完整本,已经足够去面试初级岗位了。《Mysql必知必会》小白看这本书得挑着看!完全没必要完全看完,入职想进阶的时候才整本阅读。那我们需要看哪些章节呢?第1-8章,第11-21章。数据分析师主要用到SQL的“增删查改”功能,在加点“SQL优化”。嵩天老师的《Python语言程序设计》对于编程语言,我实在不推荐小白先去看书学习,文字难以具体化编程精华,一本简洁易懂的免费视频课程就尤其关键!这里我推荐北京理工大学教授嵩天老师在Mooc的Python视频课,听完都会不禁感叹“不愧是名校教授!”思路清晰,剖析清楚,道理浅显易懂,还非常非常的实用!对于零基础的同学,我暂时没看到哪本数据思维的书讲解的特别好的。很多经典的书籍,例如《金字塔原理》、《精益数据分析》等。是一本好书,但我个人认为零基础同学读完收获甚微,需要结合一定的数分经验在读才容易吸收。我这里是推荐针对以下关键词进行搜索学习,不是让你学得十分熟练(而且根本不可能,以下很多思维概念十分庞大)。而是学到面试时候被问得基础概念不会哑口无言。关键词:PEST、4P、5W2H、SWOT、公式化思维、下钻分析思维、逻辑树思维、对比思维、费米思想、RFM模型、漏斗模型、AARRR模型、用户生命周期模型、熵权法、TGI分析法、双重差分法、AHP层次分析法、拐点法、Abtest、用户画像、增长黑客、北极星指标、OSM指标体系构数据挖掘与数据化运营实战:思路、方法、技巧与应用》这是一本数据思维进阶书籍,建议入行后细读。书中除了运用数据思维的方法外还大量运用了机器学习到实际的数据工作中。和我坚持的“数据之道”不谋而合,我始终认为,机器学习不是算法独有的工作,它也可以是数据分析师的一个武器,解决实际的业务问题时提供智能化的手段。机器学习篇直白说,我认为机器学习本来对零基础人士就难以友好,如果数学知识基本忘记了,那初期学机器学习的时候真得是蛮痛苦的。我仍清晰记得当初我第一次机器学习的时候无论看视频还是看书籍都感觉看天书一样。知乎热推的几个书籍周志华《机器学习》、李航《统计学习方法》、吴恩达《machine learning》视频。和我背景相当的零基础同学去看看,基本是劝退。这类同学听我一句劝,学机器学习别想着简单易懂的教材,就不可能有,那怎么学,很简单就死啃,哪里不会啃哪里!目前我从事数据挖掘工程师岗位,对于零基础同学入门机器学习的路线,我也提供一些思路吧。1、入门首先把机器学习基础理论了解了(模型,训练,损失,监督无监督、分类回归、目标函数、模型评估等等)2、其次完全理解逻辑回归以及决策树两个十分重要的模型,包括其数学原理。逻辑回归的原理推导的流程比较完整,从模型变换、目标函数转换、凸优化、到迭代更新等等。有了这个经验,后续遇到复杂的模型也不太慌。大多流程是想通的。3、学习完两个模型,我就建议开始可以调包使用模型了,调包模型很简单,几句代码。但实践完整的一套数据挖掘流程就不这么简单。这时去玩kaggle一个必玩的比赛吧,泰坦尼克号。多看看kaggle大神的源码,学习和模仿整个数据挖掘流程。4、懂了这个流程,就开始深入模型调参。模型的参数主要分4种:(1)、避免模型欠拟合的。(2)、避免模型过拟合的。(3)、提升模型运算性能。(4)、不影响模型的辅助参数,比如打印训练日志等。我们主要要去学,模型参数的意义,以及了解当模型过拟合或欠拟合了,我们要调整什么,以及调整的方向。5、以上解决了,那就是熟能生巧了,疯狂的打比赛。至少打5个以上。完成后,基本对数据挖掘的常规套路已经很熟练了,遇到算法任务也基本不慌了。6、到了这时,又要回到原点,通过书籍《统计学习方法》《机器学习》等系统的学习机器学习,这时大部分的模型你都得基本掌握模型原理(包括其数学)。若时间充裕,可模仿他人代码进行python实现(这很难,量力而为)。7、有了新理论,那就开始新实践,打比赛,如此循环。机器学习,越学越觉得自己渺小,是一个常学常新的学科。至于以上学习流程所推荐的资料:1、谷歌机器学习2、李航《统计学习方法第二版》3、周志华《机器学习》4、kaggle算法比赛冠军代码5、刘建平Pinard博客等等