关于深度学习,这里有一份入门公开课(文末福利)
前不久,“逃犯看张学友演唱会被 抓”的新闻让不少人都感慨,原来演唱会还能用来干这个!其实这都是AI面部识别技术的功劳,在支付、安防等领域,AI面部识别技术有着广泛的应用。在互联网金融信贷风险控制中,我们也会借助机器学习和统计分析的模型,对信贷申请者进行“AI面部识别”。即使一个微博、一条朋友圈这些看似平常的个人社交信息,经过AI模型计算后,也能帮助我们识别出那些可能的“逃犯”——信贷欺诈者。
本次公开课将从建模的角度,介绍互联网金融反欺诈模型的关键——如何从信贷申请数据中提取出有用的特征。实际的建模结果表明,信贷申请人的“社交网络”特征往往是最有效的。
1|分享嘉宾介绍
我是谁?我为什么要开公开课
唐亘,数据科学家,《精通数据科学:从线性回归到深度学习》一书作者。热爱并积极参与Apache Spark、 scikit-learn等开源项目。作为讲师和技术顾问为多家机构(包括惠普,华为,复旦大学等)提供百余场技术培训。
在此之前,工作和研究集中于经济和量化金融,曾参与经合组织(OECD)的研究项目并发表论文,并担任英国在线出版社Packt的技术审稿人。
曾获得复旦大学的数学和计算机双学士学位;巴黎综合理工的金融硕士学位;法国国立统计与经济管理学校的数据科学硕士学位。
扫码识别,进入直播间
2|分享题目
适合零基础的你?
分享题目:“社交网络”分析在互联网金融反欺诈中的应用
分享概要
在互联网金融信贷风险控制中,反欺诈识别是很重要的一环。在实践中,我们常常借助机器学习和统计分析的模型从信贷申请中识别出那些可能的欺诈者。从建模的角度来讲,如何从申请数据中提取出有用的特征是模型成功的关键,而实际的建模结果表明,申请人或者申请的“社交网络”特征是最有效的。
此次分享主要分为两个部分,第一部分主要介绍互联网金融反欺诈所用的数据源和模型框架,为分享的第二部分做铺垫;第二部分是分享的重点,将依次介绍
利用申请数据搭建申请人或者申请的“社交网络”
利用染色等方法找到网络中可能的欺诈团伙
利用深度学习(deepwalk)的方法将网络向量化,并和其他特征一起搭建模型
分享的技术和模型即包含业内最有效的反欺诈手段,也包含了前沿的研究实验方向,具有很大的实用性。
分享大纲
互联网金融反欺诈简介
搭建社交网络
挖掘欺诈团伙
深度学习在社交网络中的应用
大纲详解
在互联网金融反欺诈简介中将介绍如下三个内容。
互联网金融的业务简介以及欺诈案例介绍:互联网金融的业务模式、特点以及公司模型介绍;信贷欺诈特点、规模以及宜人贷欺诈案例介绍
互联网金融反欺诈(风控)数据源介绍:从来源的角度来看,数据可以分为内部数据和外部数据;从分类的角度来看,数据可以分为个人信息数据、通讯数据、行为数据。这一部分将简单介绍不同数据的大致用法,并为后面的社交网络做准备
反欺诈模型架构以及模型产出物介绍:与风控模型类似,反欺诈的模型产出大概有两个,一是基于逻辑回归生成相应的欺诈评分模型;二是利用决策树生成反欺诈规则。这两种产出都严重依赖于特征提取,特别是社交网络的特征提取
在搭建社交网络这个部分,将主要介绍如下两个内容。
• 搭建社交网络的一般步骤:定义节点和边、搭建异构网络、折叠同构网络、社区发现和染色。
• 常用的异构网络以及同构网络举例:利用第一联系人、家庭地址等搭建网络;折叠成申请为结点的网络
在挖掘欺诈团伙的这个部分,将介绍如下的两个部分
• 一度、二度关联的特征提取
• 利用社区发现以及page rank算法(染色算法)进行半监督的学习:LPA算法介绍以及效果展示,page rank算法效果展示。
在深度学习在社交网络中的应用这一部分,将介绍如下的内容:
• 向量化社交网络的意义:向量化社交网络是关键的一步,使得社交网络可以和其他特征一起使用,也方便使用经典的算法对社交网络进行聚类或分类。
• word2Vec的模型简介
• deepwalk简介以及模型效果展示
3|听课福利
不仅有免费公开课,还有礼物送?
福利一:公开课结束,将选出提问的3名读者,赠送唐亘作品《精通数据科学:从线性回归到深度学习》一本。
福利二:选出10名读者,赠送异步社区20元e读版图书现金券一张。
福利三:关注【异步图书】微信公众号,回复“公开课”进入此次公开课微信群,活动结束后获取此次演讲PPT。
福利四:今日在异步社区购买《精通数据科学:从线性回归到深度学习》畅享7折优惠,点击领取优惠券购书。
4|嘉宾作品
《精通数据科学:从线性回归到深度学习》
《精通数据科学:从线性回归到深度学习》
唐亘 著
数据科学入门到实战,介绍数据科学常用的工具——Python、数学基础及模型,讨论数据科学的前沿领域——大数据和人工智能 ,包括机器学习领域经典的模型、分布式机器学习、神经网络和深度学习等。
在数据学科的角度,融合了数学、计算机科学、计量经济学的精髓
为读者阐释了数据科学所要解决的核心问题—数据模型、算法模型的理论内涵和适用范围
以常用的IT工具—Python为基础,教会读者如何建模以及通过算法实现数据模型,具有很强的实操性。
本书还为读者详解了分布式机器学习、神经网络、深度学习等大数据和人工智能的前沿技术。
本文转载自异步社区
原文链接:https://www.epubit.com/articleDetails?id=N1dbd7b9e-8ffb-4fda-805c-2e81be50065b
- 点赞
- 收藏
- 关注作者
评论(0)