学习 Parquet(一):初识 Parquet

Apache Parquet 是 Hadoop 生态圈列式存储文件格式。 文件格式 类型 Parquet 类型: BOOLEAN 1 bit boolean INT32 32 bit 有符号整型 INT64 64 bit 有符号整型 INT96 96 bit 有符号整型 FLOAT »

学习 HDFS(七):权限

权限模型 HDFS 文件和目录权限模型的实现与 POSIX 模型相似,文件和目录都关联到一个 owner 和一个 group。 执行命令 hadoop fs -ls / 显示: drwxr-x---+ - hdfs supergroup 0 2019-01-15 09:00 /data 第一位 d 说明 »

学习 Kylin(五):集成 LDAP

Apache Kylin 版本:2.5.2 在生产环境下,通过集成 LDAP 实现了 Apache Kylin 的身份认证。 生成密码 为了安全起见,conf/kylin.properties 配置文件中的密码是通过 AES 算法加密的。 将密码明文加密为密文,执行命令: cd $KYLIN_HOME/ »

学习 Livy(一):初识 Livy

除了 Apache Spark 本身提供的 spark-submit、spark-shell 和 ThriftServer 之外, Apache Livy 提供了另一种与 Spark 集群交互的方式,通过 REST 接口。 此外,Apache Livy 支持同时维护多个会话。 可以通过 REST 接口、Java/Scala »