2024 中秋-国庆
证书自动化
今年有一个变动,亚洲诚信取消了一年的证书,迫使我这种懒狗也需要来做证书自动化了
安装cert-manager
# 添加Helm存储库
helm repo add jetstack https://charts.jetstack.io --force-update
# 安装cert-manager
helm install \
cert-manager jetstack/cert-manager \
--namespace cert-manager \
--create-namespace \
--version v1.15.3 \
--set crds.enabled=true
后续DNS provider使用dnspod,参考官方文档使用webhook扩展:
容器服务 使用 cert-manager 为 DNSPod 的域名签发免费证书-实践教程-文档中心-腾讯云 (tencent.com)
配置完成后就可以通过cert-manager.io/v1的CRD绑定证书了
Traefik v2 to v3
traefik并不能直接通过helm进行迁移,我们需要让其共存来进行平滑迁移
单独创建了traefik-v3的namespace,这里traefik创建了一个新的CRD,和之前的ingressroute同名,但是apiVersion变为了apiVersion: traefik.io/v1alpha1,此前为traefik.containo.us/v1alpha1
2025 新年-春节
关于traefik
目前来看,新版本并不能解决连接丢包的问题,甚至旧版本的兼容性更好。旧的配置暂时没有迁移上新的计划。
硬盘替换
前几天登录的时候发现readonly了,重启后检查了SMART信息发现出现了FAILED
=== START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: FAILED! Drive failure expected in less than 24 hours. SAVE ALL DATA. See vendor-specific Attribute list for failed Attributes.
且硬盘坏道数处于FAILING_NOW
5 Reallocated_Sector_Ct 0x0033 139 139 140 Pre-fail Always FAILING_NOW 2613
事后可知,这里的通电时间为22379小时
9 Power_On_Hours 0x0032 070 070 000 Old_age Always - 22379
对于非RAID盘,我均打上了不稳定标签,但是如果重启失败仍然会有所损失,虽然博客等都存在多重备份,但是媒体站是单点存储的,如果存在坏种的资源,将会很难找回。
但是对于RAID盘,目前由于DELL的限制,非原装的硬盘暂时查询不到寿命信息,这点非常的麻烦。
这也引申出了计划中的异地备份计划。有关硬盘健康度等相关的排查,移步https://blog.maoyulong.club/?p=152
我对其立即进行了longhorn的迁移,将节点标签重复打在另外的节点上,并将Scheduling设置为Disable,将Eviction Requested设置为True,longhorn顺利的跑完了驱逐命令,此时存储剩余2.77TB。
但是longhorn有个比较那啥的问题,当我换上新盘之后,修改标签,即使之前的盘标签删除到了不匹配的状态,volume仍然不会主动调度,此时只能驱逐或者手动调节,但是如果驱逐部分不涉及或者说无所谓的volume也会出现变动。
计划中的
异地备份构建计划
homelab的灾备架构再不依赖云端的情况下,始终是单点的,RAID并不能作为磁盘备份的一种,这是从梗图流传下来的常识,且目前来说,dell的服务器对于自己买的硬盘没有办法查询到硬盘的健康信息。所以在有homelab的伙伴的情况下,计划进行如下的方案:
- longhorn可以使用对象存储备份,所以可以互相构建minio来解决。
- 互相使用对面的容器镜像站;容器镜像站建立在自身所属的k8s中会有一个问题,当k8s彻底重启的时候,harbor没有起来,k8s会不断的重试拉取镜像,降低了容器的恢复速度。
- 系统盘备份,目前没有计划好的方案。
PT站创建计划
预计春节期间回去完善,会记录比较多的事情,计划单开一篇blog
kubernetes和kubesphere升级计划
k8s的升级计划本来计划是9月份的,看看一月份是否能做了
因为底层资源的变动会出现不可预料的需要现在操作的步骤,预计节后完成,目标kubernetes 1.28,kubesphere 4.1.1
新的cdn方案
百度云的ipv6目前不清楚还能撑多久,且想把域名证书等全放在一个云厂进行管理。目前来看腾讯云这边只有EO可以支持,但不支持IPV6域名,计划是写一个DCDN来解决这个问题。