caroly
首页
阅读
链接
图库
日志
关于
归档
随笔
规范代码
试题
Dubbo
Elasticsearch
Java
JVM
Kafka
Linux
MyBatis
MySQL
RabbitMQ
Redis
Spring
SpringBoot
SpringCloud
SpringMVC
Tomcat
ZooKeeper
标签
Hadoop
2021-04-16 Fri
大数据
(0)
(1,647)
Hadoop(十三)Spark Standalone 集群搭建
Apache Spark 是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在 2009 年由加州大学伯克利分校的 AMPLab 开发,并于 2010 年成为 Apache 的开源项目之一。
Hadoop
Spark
阅读更多
2020-12-22 Tue
大数据
(0)
(1,818)
Hadoop(十二)Flume 安装
Apache Flume 是一个分布式、可靠、高可用的海量日志聚合系统,支持在系统中定制各类数据发送方,用于收集数据;同时,Flume 可以对数据的简单处理,并写到各种数据接收方。
Hadoop
Flume
阅读更多
2020-12-21 Mon
大数据
(0)
(1,861)
Hadoop(十一)Kafka 安装
Apache Kafka 最早是由 LinkedIn 开源出来的分布式消息系统,现在是 Apache 旗下的一个子项目,并且已经成为开源领域应用最广泛的消息系统之一。
Kafka
Hadoop
阅读更多
2020-12-21 Mon
大数据
(0)
(1,676)
Hadoop(十)Storm 安装
Storm 安装Apache Storm 是自由开源的分布式实时计算系统,擅长处理海量数据,适用于数据实时处理而非批处理。
Storm
Hadoop
阅读更多
2020-12-08 Tue
Linux
大数据
(0)
(1,790)
Hadoop(八)ClouderaManager 部署
拥有集群自动化安装、中心化管理、集群监控、报警功能,使得安装集群从几天的时间缩短在几个小时内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率。
ClouderaManager
Hadoop
阅读更多
2020-12-02 Wed
大数据
(0)
(2,351)
Hadoop(七)HBase 分布式安装
Hadoop Database是一个高可靠性、高性能、面向列、可伸缩、实时读写的分布式数据库。
Hadoop
HBase
阅读更多
2020-12-02 Wed
大数据
(0)
(2,769)
Hadoop(六)Hive 优化及高可用
Hive 优化及高可用核心思想:把 Hive SQL 当作 MapReduce 程序去优化。
Hive
Hadoop
阅读更多
2020-12-02 Wed
大数据
(0)
(4,070)
Hadoop(五)Hive 多节点搭建
Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的 SQL 查询功能,将类 SQL 语句转换为 MapReduce 任务执行。
Hive
Hadoop
阅读更多
2020-12-02 Wed
大数据
(0)
(2,871)
Hadoop(四)TF-IDF 算法原理与实现
如果某个词或短语在一篇文章中出现的频率高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。
Java
Hadoop
阅读更多
2020-12-02 Wed
大数据
(0)
(2,610)
Hadoop(三)WordCount(单词统计)源码解析
WordCount源码解析特别数据类型介绍『Hadoop』本身提供了一套可优化网络序列化传输的基本类型,而不直接使用『Java』内嵌的类型。
Java
Hadoop
阅读更多
上一页
下一页
1
2
caroly
文章
39
分类
9
标签
17
关注我
分类
大数据
14
分布式数据库
13
Java
6
Spring Boot
4
Linux
2
小程序
2
JavaScript
1
C#
1
专栏
1
标签
Hadoop
12
Java
9
Spring Boot
4
Hive
2
MiniPro
2
JavaScript
1
HBase
1
Linux
1
Elasticsearch
1
Storm
1
ClouderaManager
1
Kafka
1
Flume
1
Spark
1
C#
1
WPF
1
阅读
1
标签云
阅读
MiniPro
WPF
C#
Spark
Flume
Kafka
ClouderaManager
Storm
Elasticsearch
Linux
Spring Boot
HBase
Hadoop
Java
Hive
JavaScript
最新文章
2022-03-01 Tue
阅读
2021-05-15 Sat
分布式数据库
2021-05-15 Sat
分布式数据库(十二)
2021-05-15 Sat
分布式数据库(十一)
2021-05-15 Sat
分布式数据库(十)
最新文章
2022-03-01 Tue
阅读
2021-05-15 Sat
分布式数据库
2021-05-15 Sat
分布式数据库(十二)
2021-05-15 Sat
分布式数据库(十一)
2021-05-15 Sat
分布式数据库(十)
最新评论
Your browser is out of date!
Update your browser to view this website correctly.
Update my browser now
×
分类
分布式数据库
专栏
小程序
C#
Linux
Spring Boot
大数据
Java
JavaScript
标签
阅读
MiniPro
WPF
C#
Spark
Flume
Kafka
ClouderaManager
Storm
Elasticsearch
Linux
Spring Boot
HBase
Hadoop
Java
Hive
JavaScript