作者小头像 Lv.1
更多个人资料
20 成长值
0 关注
3 粉丝
+ 关注

个人介绍

这个人很懒,什么都没有留下

感兴趣或擅长的领域

大数据、编程语言、数据库、人工智能
个人勋章
TA还没获得勋章~
成长雷达
0
0
0
0
20

个人资料

个人介绍

这个人很懒,什么都没有留下

感兴趣或擅长的领域

大数据、编程语言、数据库、人工智能

达成规则

以上满足项可达成此勋章

  • 博客
  • 关注
  • 粉丝
  • 论坛
全部时间
全部时间
最近三天
最近一周
最近一月
  • 全部
  • 暂无专栏分类
ClickHouse集群应用、分片、复制
数据分片分片,就像是把鸡蛋放到多个篮子里,降低整体风险,结果可能是部分数据不可用,虽然一定程度上起到了「高可用」的作用,但分片的目的是为了提速。况且,比较严格的场景下,部分不可用也是不可用。1.建数据表先创建本地表ontime_local:CREATE TABLE ontime_local (FlightDate Date,Year UInt16) ENGINE = MergeTree(Fl...
数据库
作者小头像 1226741228 2019-01-16 11:33:41
11525
1
0
2019-01-16 11:33:41
999+
1
0
快速的把HDFS中的数据导入ClickHouse
之前介绍的有关数据入库的经验都是基于实时数据流,数据存储在kafka中,使用Java或者Golang将数据从kafka中读取、解析、清洗之后写入ClickHouse中,实现数据的快速接入。在很多的使用场景中,数据都不是实时的,可能需要将HDFS或者是hive的数据导入ClickHouse,可以通过编写Spark程序实现数据的导入。HDFS to ClickHouse假设日志存储在HDFS中,...
spark Hadoop
作者小头像 1226741228 2019-01-16 11:28:57
11809
0
0
2019-01-16 11:28:57
999+
0
0
Linux配置ntp时间服务器
时间服务器作用:大数据产生与处理系统是各种计算设备集群的,计算设备将统一、同步的标准时间用于记录各种事件发生时序,如数据库处理时间等。若计算时间不同步,这些应用或操作将无法正常进行。大数据系统是对时间敏感的计算处理系统,时间同步是大数据能够得到正确处理的基础保障,是大数据得意发挥作用的技术支持。时间同步也是如此,利用大数据的互联网络传送时间信息,实现大数据系统内时间同步。网络时间同步协议是时...
NTP Linux
作者小头像 1226741228 2019-01-16 11:25:54
12957
0
0
2019-01-16 11:25:54
999+
0
0
centos7安装ZooKeeper-cdh
1.上传安装包下载的安装包一定要是对应cdh的版本,如cdh5.14.0,对应的是zookeeper-3.4.5-cdh5.14.0.tar.gz创建安装目录,将此安装包mv到此目录下2.解压安装包命令:tar -zxvf zookeeper-3.4.5-cdh5.14.0.tar.gz可在当前目录3.配置环境变量命令:vim ~/.bash_profile在文件末位追加,export Z...
ZooKeeper CentOS
作者小头像 1226741228 2019-01-16 11:22:08
8526
0
0
2019-01-16 11:22:08
999+
0
0
搭建ClickHouse集群
系统要求如果从官方仓库安装,需要确保您使用的是x86_64处理器构架的Linux并且支持SSE 4.2指令集检查是否支持SSE 4.2:命令:grep -q sse4_2 /proc/cpuinfo && echo "SSE 4.2 supported" || echo "SSE 4.2 not supported"我们推荐使用Ubuntu或者Debian。终端必须使用UTF-8编码。基于r...
XML 存储
作者小头像 1226741228 2019-01-16 11:16:07
11887
0
0
2019-01-16 11:16:07
999+
0
0
https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
作者小头像
作者小头像
快速交付
+ 关注