1..mapreduce过程介绍一下2.项目中用到的hive存储结构有哪些3.查看连续5天登陆的用户4.spark 的yarn集群的cluster模式运行和client模式运行的区别是什么5.spar
1..mapreduce过程介绍一下2.项目中用到的hive存储结构有哪些3.查看连续5天登陆的用户4.spark 的yarn集群的cluster模式运行和client模式运行的区别是什么5.spar
1 Shell命令行对于经常和数据打交道的人来说,数据工程师应该也是常常和Linux打交道。Linux以其强大的命令行称霸江湖,因此,Shell命令也是数据极客的必修兵器。利用Linux命令行的几个命
定义函数的时候,我们把参数的名字和位置确定下来,函数的接口定义就完成了。对于函数的调用者来说,只需要知道如何传递正确的参数,以及函数将返回什么样的值就够了,函数内部的复杂逻辑被封装起来,调用者无需了解
取一个list或tuple的部分元素是非常常见的操作。比如,一个list如下:>>> L = ['Michael', 'Sarah', 'Tracy', 'Bob', 'Jack']
1.直接命令添加通过-v命令直接添加 (需要在根目录下创建 containerData )创建后修改容器内containerData 会同步到hostData ,反之亦是如此docker run -i
问:说说Python中猴子补丁是什么?答:在Ruby、Python等动态编程语言中,猴子补丁仅指在运行时动态改变类或模块,为的是将第三方代码打补丁在不按预期运行的bug或者feature上 。在运行时
问:说说Python 单引号、双引号、三引号的区别?答:今天这个问题,我们先来说说单引号和双引号,这两者普通用法是相同的,都是用来定义一个字符串的 。比如下面这个:str1 ='引号'str2 ="引
问:说说Python中HTTP常见响应状态码?答:http协议是超文本传输协议,是用于从万维网服务器传输文本到本地浏览器的传送协议,是基于tcp/ip通信协议来传输数据的。HTTP状态码(HTTP S
问:说说Python多线程与多进程的区别?答:1、多线程可以共享全局变量,多进程不能2、多线程中,所有子线程的进程号相同;多进程中,不同的子进程进程号不同3、线程共享内存空间;进程的内存是独立的4、同
问:说说Python种有几种字符串格式化?答:Python字符串格式化主要有两种方式:分别为占位符(%)和format方式 。文末还有2种要介绍,所以总共有4种 。其中,占位符(%)方式比较老,而fo