各自努力,顶峰相见

  1. 数据仓库

    如何对数仓进行建模

    1.数仓建模First Blood

    2019/06/08

  2. 数据仓库

    基于Hadoop的数据仓库

    1 什么是数据仓库

    2019/06/07

  3. Java

    爱上Java诊断利器之Arthas

    1. Arthas是什么?

    2019/06/06

  4. 大数据平台

    初识Airflow任务调度平台

    1.分布式和集群

    2019/06/02

  5. 大数据平台

    大数据任务调度平台

    任务调度平台对比

    2019/05/31

  6. 数据仓库

    了解一下数据仓库

    0.什么是数据库?

    2019/05/20

  7. 数据仓库

    数据仓库从0到1总结整理

    目录: 1.了解一下数据仓库

    2019/05/19

  8. Hive

    Hive SQL查询效率提升之Analyze方案的实施

    0.简介 Analyze,分析表(也称为计算统计信息)是一种内置的Hive操作,可以执行该操作来收集表上的元数据信息。这可以极大的改善表上的查询时间,因为它收集构成表中数据的行计数,文件计数和文件大小(字节),并在执行之前将其提供给查询计划程序。

    2019/05/18

  9. Hive

    Hive集群合并之应用端的负载均衡算法

    0.背景 有这么一个场景,我们有两个Hive集群,Hive集群1(后面成为1号集群)是一直专享于数据计算平台的,而Hive集群2(后面成为2号集群)是用于其他团队使用的,比如特征,广告等。而由此存在两个主要问题:a) 两个Hive集群共享了同一份MetaData,导致经常会出现在HUE(建立与2号集群上)上建表成功后,但是在计算平台上却无法查询到新建表信息;b) 让运维同学们同时维护两套集群,管理和资源分配调整起来的确是麻烦很多,毕竟也不利于资源的弹性分配。那么鉴于此,经过讨论,需要做这么一样工作:两个集群合二为一,由1号集群合并到2号集群上来。

    2019/05/11

  10. 安装教程

    Python3.x安装教程

    1.前期准备

    2019/03/01

  • 58
    文章
  • 49
    标签