About 30,400 results
Open links in new tab
  1. 写hive能完全替代mapreduce吗? - 知乎

    Hive目前底层还是用MapReduce,以后可能会用Spark,Tez。Hive差不多是一个查询接口,你的SQL语句还是会翻译成MapReduce任务的,你用explain就可以看到这些任务的执行计划。

  2. jdbc连接hive并认证kerberos,url中principal后跟的是什么? - 知乎

    Hive数据库连接说明 1、没有开启kerberos认证,需要正常的jdbc url, 账号+密码就能获取到Connection 2、开启了kerberos认证,不需要密码,需要密钥文件 (kertab文件),认证配置文件 …

  3. 为什么impala主要场景用于数据分析(应用层)与而hive的使用场 …

    什么是Hive Hive可以看做是SQL到Mapreduce的一个映射器,就是不用开发Mapreduce,只要懂SQL就可以了,HiveQL是标准SQL92的一个子集,和标准的SQL并不完全一样,HiveQL本身 …

  4. 一起学Hive——详解四种导入数据的方式 - 知乎

    在使用Hive的过程中,导入数据是必不可少的步骤,不同的数据导入方式效率也不一样,本文总结Hive四种不同的数据导入方式: - 从本地文件系统导入数据 - 从HDFS中导入数据 - 从其他 …

  5. 与 Hadoop 对比,如何看待 Spark 技术? - 知乎

    这是Hadoop峰会上Tez的材料,第九页开始有描述Hive on Tez和传统MR Hive的区别,这些区别应该也适用于MR Hive和Spark SQL,也很清楚的体现了为何MR模型很笨重。 相比Tez,Spark …

  6. hive的直方图函数histogram_numeric的结果怎么解读? - 知乎

    hive的直方图函数histogram_numeric的结果怎么解读? 构建了一个表一共两列 一列是实体ID另一列是int类型的数值。 我想看一下数值的分布情况用histogram_numeric函数输出了一下 仿佛跟实 …

  7. 数仓篇:Hive优化实践(二)治理小文件

    欢迎关注 数据墨客 ,会持续分享数据相关知识,感谢! Hive小文件概述 Hive小文件主要是指文件大小远远小于HDFS文件块大小,通常小于128MB。 Hive小文件产生的背景 数据写入频率较 …

  8. hive如何避免重复插入? - 知乎

    Apr 18, 2023 · hive 高版本支持ACID,这个得看你的版本,如果你的版本正好支持,那就直接delete再insert,或者用merge操作。 另外 hive 不支持唯一索引,就我所知,好像也没有类似 …

  9. hive多表查询的条件写在join里好还是用子查询? - 知乎

    hive多表查询的条件写在join里好还是用子查询? 两个表关联查询,是把条件都写join on里好? select a.* from a join b on ( a.id = b.id and a.a … 显示全部 关注者 26

  10. HBase 和 Hive 的差别是什么,各自适用在什么场景中? - 知乎

    1. Hive中的表是纯逻辑表,就只是表的定义等,即表的元数据。 Hive本身不存储数据,它完全依赖HDFS和MapReduce。 这样就可以将结构化的数据文件映射为为一张数据库表,并提供完整 …