Agent Scheduler · Smart Oncall · Build Platform

独立研发 agent 调度平台

6 年云原生与 DevOps 经验,独立搭建企业级 Agent 云平台,支持群聊机器人、Prompt Template、Skills/MCP、批量推理、代码审查、门禁自动修复、智能 oncall 和分布式构建优化。

查看项目 下载 PDF

核心成果

重点不是“会调用模型”,而是把 Agent 做成可治理、可观测、可复用、能承载企业级研发流程的生产系统。

多机器人调度

支持不同飞书群聊机器人绑定独立提示词模板、Skills/MCP、工具权限和任务模板,实现多业务线隔离接入。

批量推理工程化

覆盖异步队列、并发限流、失败重试、Cron 触发、成本观测与容器化沙箱,支撑日 Token 开销可达 2T。

研发效能自动化

落地 Code Inline Review、门禁自动修复、Bug 定位、Commit 回溯、break commit 自动发现和 24h 智能 oncall。

工作经历

从云原生基础设施、分布式构建,到企业级 Agent 平台,长期在工程系统的关键路径上做降本增效。

某智能驾驶企业 2025.04 - 至今 AI Agent DevOps 平台负责人

Agent 调度平台 · 群聊机器人 · 批量推理 · 研发效能自动化

  • 独立搭建 Agent 云平台,接入企业飞书群聊机器人,支持不同群/机器人绑定独立 Prompt Template、Skills/MCP、工具权限与任务模板。
  • 设计 Agent Task 编排与调度能力,覆盖 Cron 定时触发、批量化推理、在线交互、异步队列、失败重试、并发限流与容器化沙箱。
  • 建设 Skills/MCP 分层管理和插件市场,用户可创建 Task Template 并导入共享配置,降低 Agent 工作流复制、治理和升级成本。
  • 为企业持续提交数百笔性能优化、依赖裁剪与工程治理 MR,覆盖构建耗时、镜像体积、运行依赖、CI 稳定性与代码质量门禁。
  • 日常单人运维上千台分布式构建集群,并对集群调度框架进行二次开发、定制优化和稳定性治理。
  • 研发并调优大规模分布式编译集群,基于负载动态扩缩容与任务路由降低 70% 构建资源消耗。
九维数智(北京)科技有限公司 2024.02 - 2025.04 云原生研发工程师

Kubernetes 存储 · CI/CD · 研发流程治理

  • 负责 K8s CSI 驱动与 Operator 二次开发,保障存储层高可用和自动化运维能力。
  • 建设 LDAP 成员管理与 Code Review 审核服务,完善权限精细化管控和研发流程治理。
  • 构建 CI/CD 平台,整合 Gerrit、Jenkins、BuildKitd、Bazel 与 Harbor,支撑镜像构建、制品发布和流水线门禁。
  • 带领 10+ 人研发团队推进研发流程标准化,提升项目交付效率与平台稳定性。
华为云计算技术有限公司 2022.03 - 2022.12 分布式构建系统研发

CloudBuild · Bazel · BuildBarn

  • 参与 CloudBuild 分布式编译系统研发,基于 Bazel、BuildBarn、ccache 优化 CMake/Maven 等构建链路。
  • 与欧洲团队协作参与 justbuild 开源项目;绩效优秀,晋升 1 级,获评“最强软件新生”。
自由职业 / 武汉泽塔云科技股份有限公司 2021.09 - 2024.02 独立开发者 / 云计算研发工程师

小程序全栈 · OpenStack 私有云

  • 独立设计并开发抖音/微信小程序,负责需求分析、前后端开发、上线运营与迭代维护。
  • 参与 OpenStack 二次开发与运维,支撑私有云基础设施建设、交付和问题排查。

核心项目

项目选择聚焦“能把复杂工程系统跑起来并长期变好”的能力。

企业级 AI Agent 调度平台

Python · Go · K8s · Docker · 飞书 API · MCP · Queue

面向群聊机器人、批量推理与研发自动化任务构建统一调度平台,支持机器人与 Prompt Template、Skills/MCP、工具权限和任务模板绑定。

平台覆盖用户隔离、Task 容器化隔离、插件市场、Cron 触发、成本治理与多业务接入。

分布式编译架构改造升级

Bazel · BuildBarn · K8s · 阿里云 API

完成手动扩容到动态扩缩容改造,落地 CAS/Worker 分离、按 Mnemonic 路由分组和平滑下线机制。

通过任务路由和负载治理降低构建资源消耗,支撑大规模研发流水线稳定运行。

研发效能 DevOps 平台

K8s · Jenkins · Gerrit · Ceph · Go · React

建设 CI/CD、Code Review、格式检查、单测门禁与推码联动部署能力,平台高可用 99.9%。

持续推进质量门禁、性能优化、依赖裁剪和工程治理,改善交付效率。

专业技能

横跨 Agent 应用平台、云原生基础设施、分布式构建和研发效能工具链。

AI AgentAgent 调度平台 · Prompt Template · Skills/MCP · 插件市场 · 群聊机器人 · 批量推理 · Code Review AI
编程语言Go(主力) · Python · TypeScript · C · Shell
容器编排Kubernetes · Docker · Operator · CSI · Helm · Kustomize
分布式系统Bazel · BuildBarn · 分布式编译 · 队列调度 · 动态扩缩容 · 高并发任务治理
存储网络Ceph · JuiceFS · GlusterFS · Harbor · Calico · Cilium · KubeVIP · MetalLB
CI/CDJenkins · Gerrit · BuildKitd · GitHub Actions · 质量门禁 · 依赖裁剪 · 性能优化