hadoop 主备倒换控制器:ZKFailoverController详解
   简介 HDFS的NameNode、Yarn的ResourceManager都是依靠ZK实现主备倒换的。核心的类为:ZKFailoverController.java, 选举的核心类为ActiveStandbyElector.java 主备选举 主备选举的核心类是ActiveStandbyElector。在初始化的时候需要创建zk连接并且尝试在zk上面创建文件。在创建连接或者创建文件的时候都会有回调事件。 回调处理的函数主要包含: 创建node节点回调 入口函 ......
hadoop   |  2024-09-22   0 评论   392 浏览

Hadoop 认证模块详解
   客户端认证 客户端的入口函数为 KerberosAuthenticator.authenticate函数 连接HTTP服务端 HttpURLConnection conn = token.openConnection(url, connConfigurator); conn.setRequestMethod(AUTH_HTTP_METHOD); conn.connect(); SPNEGO认证 对于普通的HTTP的kerberos认证(SPNEGO),需要 ......
hadoop   |  2024-09-01   0 评论   636 浏览

ContainerManager详解
   简介 ContainerManager主要负责NM中管理所有Container生命周期,其主要包含启动Container、恢复Container、停止Container等功能。 主要功能由ContainerManagerImpl类实现,具体代码可以参考当前类。 初始化 初始化主要分为两部分: ContainerManagerImpl实例的构造函数和serviceInit函数。 构造函数 当前函数为构造函数,主要初始化必须要的一些变量等。 dispatche ......
hadoop   yarn   |  2024-08-01   1 评论   434 浏览

BPServiceActor详解
   简介 BPServiceActor 主要在DataNode中用于和NameNode沟通的类。主要功能如下: 与 namenode 进行预注册握手。 向 namenode 注册。 定期向 namenode 发送心跳。 处理从 namenode 收到的命令。 核心功能 BPServiceActor的入口函数为start函数,当前类本身为runnable接口的实现类,所以在start函数里面新建了BPServiceActor线程,并且将其启动, 所以其真实的启 ......
hadoop   |  2024-07-21   0 评论   976 浏览

【Hadoop】【持续更新】hdfs 常见命令
   常见命令记录,总结篇
hadoop   转载   |  2023-11-29   0 评论   2,015 浏览

【Hadoop】ResourceManager简介
   简介 ResourceManager(RM),RM是全局的资源管理器,负责整个系统的资源管理和分配。主要由以下两部分组成: 调度器:根据容量、队列限制条件将系统资源分配给各个应用。 资源分配的单位是container,container是一个动态资源单位,它将内存、CPU、磁盘、网络等资源封装在一起,从而限定了资源使用量。 调度器是一个可插拔的组件,用户可以自己定制,也可以选择Fair或Capacity调度器. 应用程序管理器:负责管理所有应用程序的 ......
hadoop   |  2023-11-25   0 评论   1,901 浏览

neovim 从0开始配置优化
   neovim是从vim的一个分支fork出来的,从性能等方面来讲都比vim强很多,所以从vim转到neovim了。 本文涉及的neovim配置都在https://git.zeekling.cn/linux/nvim-config/src/branch/master里面。 快速使用方法: ```bash git clone https://git.zeekling.cn/linux/nvim-config.git ~/.config/nvim # 或者 git ......
neovim   |  2024-06-09   2 评论   1,403 浏览

【Hadoop】FSDirectory详解
   Namenode最重要的两个功能之一就是维护整个文件系统的目录树(即命名空间namesystem) 。 HDFS文件系统的命名空间(namespace) , 也就是以“/”为根的整个目录树, 是通过FSDirectory类来管理的。 FSNamesystem也提供了管理目录树结构的方法。 FSNamesystem中的方法多是调用FSDirectory类的实现。FSNamesystem在FSDirectory类方法的基础上添加了editlog日志记录的功能。 ......
hadoop   |  2024-03-31   0 评论   1,788 浏览

【Hadoop】Yarn 作业启动源码解读
   作业启动 作业提交的客户端比较核心的类是Job.java,看作业启动的源码需要从这个类开始看。 Job.java 作业启动的入口函数为waitForCompletion函数。当前函数的核心函数为submit(),主要如下: public void submit() throws IOException, InterruptedException, ClassNotFoundException { ensureState(JobState.DEFINE); s ......
yarn   hadoop   |  2023-12-07   1 评论   2,033 浏览

docker stop container 报错:tried to kill container, but did not receive an exit event
   问题现象 执行docker stop xxxx报错如下: Error response from daemon: cannot stop container: xxxx: tried to kill container, but did not receive an exit event 执行下面命令重启docker,发现container依旧在,依旧无法停止。 systemctl restart docker 解决方案 通过docker ps查看co ......
Docker   |  2024-06-02   2 评论   1,493 浏览

【Hadoop】jobhistory 作业缓存源码详解
   jobhistory 作业缓存 jobhistory 一般会保存一部分作业信息到内存中,查询作业信息的时候一般会从内存查询,如果内存查询不到就会从磁盘上扫描。 jobhistory 缓存一般分为两层,第一层是guava缓存,默认情况下guava的缓存个数是5,可以通过配置项mapreduce.jobhistory.loadedjobs.cache.size控制。 当guava的一级缓存中不存在的时候,默认是需要重新加载的,jobhistory中定义了加载规则 ......
hadoop   |  2024-05-26   0 评论   1,322 浏览

国产动漫详细列表
   国产动漫详细列表,简单记录最近可以看的动漫列表。持续更新。
动漫   |  2019-06-26   21 评论   13,906 浏览

决策树详解
   和支持向量机一样, 决策树是一种多功能机器学习算法, 即可以执行分类任务也可以执行回归任务, 甚至包括多输出(multioutput)任务.
机器学习   转载   |  2019-07-20   0 评论   1,434 浏览

K近邻算法(KNN)详解
   K近邻算法,即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例,这K个实例的多数属于某个类,就把该输入实例分类到这个类中.
机器学习   |  2019-09-15   0 评论   1,212 浏览

深入理解L1,L2正则化
   正则化(Regularization) 是机器学习中对原始损失函数引入额外信息,以便防止过拟合和提高模型泛化性能的一类方法的统称。正则化是在经验风险上面加了一个正则化项或者惩罚项,正则化函数一般是模型法则度的单调增函数,模型越负责,正则化值就越大.
机器学习   |  2019-09-22   0 评论   1,996 浏览