登录注册写文章

贝贝公司面试题汇总

田井中律

2022-02-13 10:52:58 阅读 852

1.spark sql和hive sql的区别

2.从原始数据层获取数据，数据丢失的情况有没有遇到过？

3.kafka消息丢失，如何发现这些问题以及如何处理？

4.项目中用到的kafka的topic，以及一些相关的历史天数之类的参数是怎么去设计的？

5.kafka消息队列的消息一般会保存几天？

6.datax了解吗？

7.sparksql和hivesql的语法上的区别有哪些？举例说明

8.hivesql的查询语句中有select，from，join，order by group by的执行顺序是怎样的？

你遇到hive中哪几类数据倾斜，以及如何解决这些问题的？

9.hivesql的行转列的语法上是怎么实现的？

10.找出连续三天及以上访问网站的用户

四哔哩哔哩（b站）

1.进程、线程间如何通信

2.Hadoop高可用简单介绍下

3.集群规模，你们订单表全量数据有多少

4.JVM垃圾回收算法那些、标记算法哪些、根据哪些指标选择垃圾回收器。

5.项目中哪些场景有Spark数据倾斜

6.MySQL中订单数据表如何进行分库分表

7.Sqoop 读取MySQL数据导入HDFS 的流转过程

8.如何感知订单表变化数据导入了HDFS

9.订单表导入HDFS后是如何进行分区的。

10.MySQL中订单表总共数据量多少T，实际行数有多少？

总结：没答好，卒，总结了一波，这个岗位偏数据平台建设和开发，没准备太充分。

文章来源：网络版权归原作者所有,如涉及知识产权问题，请权利人联系我们，我们将立即处理.

标签:

田井中律

田井中律

文章 96 获得 0个赞共 0个粉丝

推荐阅读更多精彩内容

Go语言标准库有哪些

学习编程语言，早已不是学一点语法规则那么简单。现在更习惯称作选择 Ecosystem（生态圈），而这其中标准库的作用和分量尤为明显。在Go语言的安装文件里包含了一些可以直接使用的包，即标准库。Go语言

顾你木偶阅读 1183 标签: go
Go语言的性能如何？

根据 Go 开发团队和基本的算法测试，Go语言与C语言的性能差距大概在 10%~20% 之间。虽然没有官方的性能标准，但是与其它各个语言相比已经拥有非常出色的表现。时下流行的语言大都是运行在虚拟机上，

顾你木偶阅读 1046
Go语言为并发而生

在早期 CPU 都是以单核的形式顺序执行机器指令。Go语言的祖先C语言正是这种顺序编程语言的代表。顺序编程语言中的顺序是指：所有的指令都是以串行的方式执行，在相同的时刻有且仅有一个 CPU 在顺序执行

顾你木偶阅读 1168 标签: go
Go语言有哪些特性？

Go语言也称为 Golang，是由 Google 公司开发的一种静态强类型、编译型、并发型、并具有垃圾回收功能的编程语言。接下来从几个方面来具体介绍一下Go语言的特性。语法简单抛开语法样式不谈，单就类

顾你木偶阅读 1209 标签: go
什么是Go语言

Go语言（或 Golang）起源于 2007 年，并在 2009 年正式对外发布。Go 是非常年轻的一门语言，它的主要目标是“兼具 Python等动态语言的开发速度和 C/C++等编译型语言的性能与安

顾你木偶阅读 1259 标签: go
太平洋保险大地保险华腾有限公司面试题汇总

1.介绍项目：完整的2.zookeeper：zkServer，使用过这在内部删除东西？不明白他想问啥？3.zookeeper的反压：4.DAG：DAGscheduler,taskscheduler,t

上杉夏香阅读 879 标签: 大数据 hadoop storm
东软集团面试题汇总

1.hbase有什么特点，他的优缺点：海量存储，列式存储，高并发，稀疏（列的灵活性，列族中可以指定任意多的列，在列数据为空的情况下，是不会占用存储空间的），高可用（WAL解决高可用，瞬间写入量）2.单

一生所爱の赫萝阅读 965 标签: 大数据 hadoop
大数据组件技术面试

hadoop框架1.hdfs的读写基本不问,但是还是要知道2.mapjoin的原理3.hadoop的shuffle原理也没问,也要知道4.你在工作中的hadoop的小文件处理,结合项目进行说明5.ha

九公里浅绿阅读 1021 标签: 大数据 hadoop
阿里面试题汇总

一面1.hive数据倾斜有哪几种？举例说明2.数据采集方式是什么？3.数仓是如何分层的？4.数据应用层对外使用的话，是通过什么方式去使用的？5.数据应用程序指标的设计过程是怎样的？6.能举例说下进行过

田井中律阅读 916
贝贝公司面试题汇总

1.spark sql和hive sql的区别2.从原始数据层获取数据，数据丢失的情况有没有遇到过？3.kafka消息丢失，如何发现这些问题以及如何处理？4.项目中用到的kafka的topic，以及一

田井中律阅读 852