About 30,400 results
Open links in new tab
  1. HBase 和 Hive 的差别是什么,各自适用在什么场景中? - 知乎

    1. Hive中的表是纯逻辑表,就只是表的定义等,即表的元数据。 Hive本身不存储数据,它完全依赖HDFS和MapReduce。 这样就可以将结构化的数据文件映射为为一张数据库表,并提供完整的SQL …

  2. 大数据之hadoop / hive / hbase 的区别是什么?有什么应用场景? - 知乎

    2. Hive Hive是一个基于Hadoop的数据仓库系统,它将SQL语言转化为MapReduce任务,并在Hadoop集群上运行。 它提供了类似于SQL的查询和分析接口,使得非专业开发人员可以通过简单的SQL语句 …

  3. 请问spark和hive是什么关系? - 知乎

    再来看看hive。 hive 官网有描述,“Apache Hive data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage using SQL.”,hive的定位是数据仓库,其 …

  4. 为什么Hive正在被淘汰? - 知乎

    总的来说,Hive on Tez 保留了与 Hadoop 的紧密集成,可在 YARN 环境下执行,但相比 MapReduce 查询响应时延显著降低,吞吐量得到提升。 Hive + LLAP Hive 3.x 版本引入了 LLAP(Live Long And …

  5. 如何通俗地理解Hive的工作原理? - 知乎

    接下去Hive会对执行计划进行优化,最常见的优化可能是PartitionPrune,比如你在Hive中定义了分区表,那么如果有Where条件中出现了分区字段,比如WHERE date = '2016-08-25',而且分区就 …

  6. 已安装spark和hadoop,对应版本的hive如何选择? - 知乎

    May 28, 2022 · 已安装spark和hadoop,对应版本的hive如何选择? 目前按照厦大教程进行学习大数据,安装了spark2.4.7,hadoop2.7.1,但不知如何选择hive版本,试了好几个版本都会报错,请求问 …

  7. 基于hive的数据仓库如何处理数据更新(update)问题? - 知乎

    Mar 15, 2018 · 3) Hive的执行延迟比较高,因此Hive常用于数据分析,对实时性要求不高的场合。 4) Hive优势在于处理大数据,对于处理小数据没有优势,因为Hive的执行延迟比较高。 5) Hive支持用 …

  8. pyspark 如何读取大数据平台中的 hive 数据表? - 知乎

    比如我们指定使用MySQL作为Hive元数据的存储介质,那么就需要把Hive连接MySQL的相关属性配置在hive-site.xml文件中,这样不管是本地模式还是远程模式启动,不管客户端本地连接还是远程连接,都 …

  9. 在 Hive 中,如何使用 INSERT INTO 语句向表中插入数据? - 知乎

    在 Hive 中,你可以使用 INSERT INTO 语句向表中插入数据。以下是一个示例: INSERT INTO table_name VALUES (value1, value2, ...); 在上述示例中,你需要将 table_name 替换为要插入数据的 …

  10. mysql,hive sql,spark sql语法乃至其他方面有什么区别? - 知乎

    Hive SQL和Spark SQL则更加强调其分布式计算和分析的能力,因此增加了很多针对大规模数据处理的扩展功能,如窗口函数、复杂数据类型等。 执行引擎:MySQL使用的是基于磁盘的MyISAM或InnoDB …