1,生存时间(TTL)设置 (1)应用系统经常需要从数据库里删除老数据,通过配置列族 TTL 参数,可使数据增加生命周期。这样,当数据超过该配置时间,将会在大合并时“被删除”。(单位:秒) (2)下面命令创建一个名为 t3 的表,并指定该表包含一个列族 cf1,同时设置该列族的数据的生存时间为 18000 秒......
1,HFile 介绍 (1)HFile 是 HBase 中重要的一个存在,可以说是 HBase 架构中最小的结构,HBase 的底层数据都在 HFile 中。HFile 从根本上来说是 HDFS 中的文件,只是它有自己特殊的格式。 (2)HFile 文件由 6 部分组成: Data(数据块):保存表中的数据(key-value 的形式),这部分可以被压缩......
在开发和调试阶段,我们通过 HBase 自带的 Shell 命令行可以进行创建表、添加数据、修改数据等操作,而无需编写复杂的代码,比较方便。HBase 的 Shell 命令行中的命令大致可以分为 3 种:基础命令、DDL 命令和增删改查命令。 下面我将通过样例对各个命令进行演示......
我之前写过文章介绍如何在 CentOS 系统下进行单机版的 HBase 安装。而在生产环境,为了使系统具备高可用性和横向扩展性,以满足日益增长的数据处理需求,通常需要在多节点环境中搭建 HBase 集群。本文将演示如何在多节点上搭建 HBase 集群......
在之前的文章中,我介绍了 Spring Boot 如何与 Redis 进行基本的整合操作。 而在大规模数据操作时,逐条执行 Redis 命令会导致性能瓶颈,因此 Redis 提供了 Pipeline(管道)技术,可以一次性发送多条命令,减少网络通信次数,提升性能。本篇教程将详细讲解如何在 Spring Boot 中使用 Redis 的 Pipeline 进行批量操作数据......
1,什么是 Doris? (1)Doris 是一个现代化的 MPP 分析型数据库产品,“亚秒”级响应,可以有效地支持实时数据分析。 (2)Doris 的分布式架构非常简洁,易于运维,并且可以支持 PB 级别以上的超大数据集。 (3)Doris 可以满足多种数据分析需求......
1,什么是 ClickHouse? (1)ClickHouse 的全称是 Click Stream + Data WareHouse,可以将其翻译为“点击流数据仓库”。 (2)ClickHouse 是俄罗斯的 Yandex 公司于 2016 年开源的一个列式数据库,专为 OLAP 而设计。这个列式储存数据库的性能大幅超越了很多商业 MPP 数据库软件......
1,什么是 Druid? (1)Druid(文翻译为德鲁伊)是一个高性能的实时分析数据库,可以在复杂的海量数据下进行交互式实时数据分析,能够处理 TB 级别数据,以及响应在“毫秒”级。它主要是针对时间序列数据提供低延时的数据写入,以及快速交互式查询......
得到 APP 是一款提供各种优质知识内容的平台,用户可以通过该应用阅读电子书、听课、获取知识。有时我们希望能够将得到中的电子书下载到本地,以便在离线状态下阅读或长期保存。这个可以使用第三方的开源工具 dedao-dl 来实现,下面我将详细介绍这个软件的用法......
十一月头条:Go 语言势不可挡 Go 语言在 TIOBE 榜单中的排名稳步上升。该语言过去长期位居前十之后,现在已经是位列第 7 位,这是 Go 语言有史以来的最高排名。在前十名的编程语言中,Go 的独特之处在于其程序运行快速且易于部署,同时语言本身也易于学习......