Lv.1
mantou
更多个人资料
30
成长值
0
关注
2
粉丝
+ 关注
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
大数据
个人勋章
TA还没获得勋章~
成长雷达
10
0
0
0
20
个人资料
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
大数据
达成规则
以上满足
项可达成此勋章
博客
关注
粉丝
论坛
全部时间
全部时间
最近三天
最近一周
最近一月
全部
暂无专栏分类
使用Atlas进行元数据管理之Atlas简介
0. 当我们谈论数据治理/元数据管理的时候,我们究竟在讨论什么?谈到数据治理,自然离不开元数据。元数据(Metadata),用一句话定义就是:描述数据的数据。元数据打通了数据源、数据仓库、数据应用,记录了数据从产生到消费的全过程。因此,数据治理的核心就是元数据管理。数据的真正价值在于数据驱动决策,通过数据指导运营。通过数据驱动的方法判断趋势,帮住我们发现问题,继而推动创新或产生新的解决方案。...
数据管理服务 DAS
华为Atlas 200 DK AI开发者套件
mantou
2019-02-22 10:37:31
9050
0
0
2019-02-22 10:37:31
999+
0
0
使用Atlas进行元数据管理之Type(类型)
1. 概述Atlas允许用户为他们想要管理的元数据对象定义模型。该模型由称为type(类型)的定义组成。称为entities(实体)的type(类型)实例表示受管理的实际元数据对象。 Type System是一个允许用户定义和管理类型和实体的组件。开箱即用的Atlas管理的所有元数据对象(例如Hive表)都使用类型建模并表示为实体。要在Atlas中存储新类型的元数据,需要了解类型系统组件的概...
数据管理服务 DAS
Hive
数据库
华为Atlas 200 DK AI开发者套件
mantou
2019-02-22 10:36:42
8833
0
0
2019-02-22 10:36:42
999+
0
0
使用Atlas进行元数据管理之Glossary(术语)
背景:笔者和团队的小伙伴近期在进行数据治理/元数据管理方向的探索, 在接下来的系列文章中, 会陆续与读者们进行分享在此过程中踩过的坑和收获。1. Glossary(术语表) 介绍Atlas的术语表(Glossary)提供了一些适当的“单词”,这些“单词”能彼此进行关连和分类,以便业务用户在使用的时候,即使在不同的上下文中也能很好的理解它们。此外,这些术语也是可以映射到数据资产中的,比如:数据...
Atlas
mantou
2019-02-22 10:35:32
4542
0
0
2019-02-22 10:35:32
999+
0
0
[机器学习Lesson3] 梯度下降算法
1. Gradient Descent(梯度下降)梯度下降算法是很常用的算法,可以将代价函数J最小化。它不仅被用在线性回归上,也被广泛应用于机器学习领域中的众多领域。1.1 线性回归问题应用我们有一个函数J(θ0,θ1),要使其最小化minJ(θ0,θ01):Outline对θ0,θ1开始进行一些猜测通常将初θ0,θ1初始化为0在梯度算法中,要做的就是不停的一点点改变θ0和θ1试图通过这种改...
线性回归
机器学习
mantou
2018-11-12 15:48:51
6211
0
0
2018-11-12 15:48:51
999+
0
0
[机器学习Lesson 2]代价函数之线性回归算法
本章内容主要是介绍:单变量线性回归算法(Linear regression with one variable)1. 线性回归算法(linear regression)1.1 预测房屋价格下图是俄勒冈州波特兰市的住房价格和面积大小的关系:该问题属于监督学习中的回归问题,让我们来复习一下:监督学习(Supervised'Learning'):对示例数据给出“正确答案”。回归问题(Regress...
线性回归
机器学习
mantou
2018-11-12 15:48:09
6244
0
0
2018-11-12 15:48:09
999+
0
0
[机器学习Lesson 1] 机器学习简介
1. Machine Learning definition(机器学习定义)Arthur Samuel(1959年)将机器学习非正式定义为:在不直接针对问题进行编程的情况下,赋予计算机学习能力的一个研究领域。创造西洋棋程序,可以和自己对战。Tom Mitchell(1998年)提出一个更为正式关于机器学习的定义 :对于一个计算机程序来说:给它一个任务T和一个性能测量方法P,如果在经验E的影响...
计算
机器学习
mantou
2018-11-12 15:46:36
9512
0
0
2018-11-12 15:46:36
999+
0
0
【大数据安全】Apache Kylin 安全配置(Kerberos)
1. 概述本文首先会简单介绍Kylin的安装配置,然后介绍启用Kerberos的CDH集群中如何部署及使用Kylin。Apache Kylin™是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc. 开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。1.2 环境说明CDH版本:5.11.2Lin...
HBase
Kerberos
Hive
登录
mantou
2018-11-12 15:45:52
8527
0
0
2018-11-12 15:45:52
999+
0
0
【大数据安全】Kerberos集群安装配置
1. 概述Kerberos是一种计算机网络认证协议,它允许某实体在非安全网络环境下通信,向另一个实体以一种安全的方式证明自己的身份。它也指由麻省理工实现此协议,并发布的一套免费软件。它的设计主要针对客户-服务器模型,并提供了一系列交互认证——用户和服务器都能验证对方的身份。Kerberos协议可以保护网络实体免受窃听和重复攻击。Kerberos协议基于对称密码学,并需要一个值得信赖的第三方。...
Kerberos
安全
大数据
mantou
2018-11-12 15:44:29
5725
0
0
2018-11-12 15:44:29
999+
0
0
【大数据安全】基于Kerberos的大数据安全验证方案
1.背景互联网从来就不是一个安全的地方。很多时候我们过分依赖防火墙来解决安全的问题,不幸的是,防火墙是假设“坏人”是来自外部的,而真正具有破坏性的攻击事件都是往往都是来自于内部的。近几年,在thehackernews等网站上总会时不时看到可以看到一些因为数据安全问题被大面积攻击、勒索的事件。在Hadoop1.0.0之前,Hadoop并不提供对安全的支持,默认集群内所有角色都是可靠的。用户访问...
Kerberos
安全
大数据
数据安全
mantou
2018-11-12 15:43:32
7443
0
0
2018-11-12 15:43:32
999+
0
0
https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
+ 关注