2024 中秋-国庆

证书自动化

今年有一个变动,亚洲诚信取消了一年的证书,迫使我这种懒狗也需要来做证书自动化了

安装cert-manager

# 添加Helm存储库
helm repo add jetstack https://charts.jetstack.io --force-update
# 安装cert-manager
helm install \
  cert-manager jetstack/cert-manager \
  --namespace cert-manager \
  --create-namespace \
  --version v1.15.3 \
  --set crds.enabled=true

后续DNS provider使用dnspod,参考官方文档使用webhook扩展:

容器服务 使用 cert-manager 为 DNSPod 的域名签发免费证书-实践教程-文档中心-腾讯云 (tencent.com)

配置完成后就可以通过cert-manager.io/v1的CRD绑定证书了

Traefik v2 to v3

traefik并不能直接通过helm进行迁移,我们需要让其共存来进行平滑迁移

单独创建了traefik-v3的namespace,这里traefik创建了一个新的CRD,和之前的ingressroute同名,但是apiVersion变为了apiVersion: traefik.io/v1alpha1,此前为traefik.containo.us/v1alpha1

 

2025 新年-春节

关于traefik

目前来看,新版本并不能解决连接丢包的问题,甚至旧版本的兼容性更好。旧的配置暂时没有迁移上新的计划。

硬盘替换

前几天登录的时候发现readonly了,重启后检查了SMART信息发现出现了FAILED

=== START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: FAILED! Drive failure expected in less than 24 hours. SAVE ALL DATA. See vendor-specific Attribute list for failed Attributes.

且硬盘坏道数处于FAILING_NOW

  5 Reallocated_Sector_Ct   0x0033   139   139   140    Pre-fail  Always   FAILING_NOW 2613

事后可知,这里的通电时间为22379小时

9 Power_On_Hours          0x0032   070   070   000    Old_age   Always       -       22379

对于非RAID盘,我均打上了不稳定标签,但是如果重启失败仍然会有所损失,虽然博客等都存在多重备份,但是媒体站是单点存储的,如果存在坏种的资源,将会很难找回。

但是对于RAID盘,目前由于DELL的限制,非原装的硬盘暂时查询不到寿命信息,这点非常的麻烦。

这也引申出了计划中的异地备份计划。有关硬盘健康度等相关的排查,移步https://blog.maoyulong.club/?p=152

我对其立即进行了longhorn的迁移,将节点标签重复打在另外的节点上,并将Scheduling设置为Disable,将Eviction Requested设置为True,longhorn顺利的跑完了驱逐命令,此时存储剩余2.77TB。

但是longhorn有个比较那啥的问题,当我换上新盘之后,修改标签,即使之前的盘标签删除到了不匹配的状态,volume仍然不会主动调度,此时只能驱逐或者手动调节,但是如果驱逐部分不涉及或者说无所谓的volume也会出现变动。

 

计划中的

异地备份构建计划

homelab的灾备架构再不依赖云端的情况下,始终是单点的,RAID并不能作为磁盘备份的一种,这是从梗图流传下来的常识,且目前来说,dell的服务器对于自己买的硬盘没有办法查询到硬盘的健康信息。所以在有homelab的伙伴的情况下,计划进行如下的方案:

  1. longhorn可以使用对象存储备份,所以可以互相构建minio来解决。
  2. 互相使用对面的容器镜像站;容器镜像站建立在自身所属的k8s中会有一个问题,当k8s彻底重启的时候,harbor没有起来,k8s会不断的重试拉取镜像,降低了容器的恢复速度。
  3. 系统盘备份,目前没有计划好的方案。

PT站创建计划

预计春节期间回去完善,会记录比较多的事情,计划单开一篇blog

kubernetes和kubesphere升级计划

k8s的升级计划本来计划是9月份的,看看一月份是否能做了

因为底层资源的变动会出现不可预料的需要现在操作的步骤,预计节后完成,目标kubernetes 1.28,kubesphere 4.1.1

新的cdn方案

百度云的ipv6目前不清楚还能撑多久,且想把域名证书等全放在一个云厂进行管理。目前来看腾讯云这边只有EO可以支持,但不支持IPV6域名,计划是写一个DCDN来解决这个问题。