宋涤非

Agent 基础设施工程师

模型是 Agent 的大脑，但我们不是神经外科医生——我们是接口工程师。
我们的工作不是控制大脑如何思考，而是控制大脑与世界的接口：何时可以行动、何时必须停止、如何被观测。

Agent Runtime · 可观测性 · 运营工业化

GitHub X 代表作

开源项目

AgentHooksApache 2.0

AI Agent 事件驱动 Hooks 开放规范

定义 14 个生命周期事件（pre/post 钩子 + 质量门），标准化 Agent 与外部治理系统的接口。已实现在 kimi-cli fork 中。

TypedownMIT

Markdown 的渐进式形式化工具

为 Markdown 添加语义层：Pydantic Model → YAML Entity → 内容寻址引用 → 三层验证。VS Code 扩展 2,500+ 下载。

AtomDocMIT

AI 编辑 Word 文档的保真往返方案

Passthrough 架构：拆包保留全部 OOXML 部件，仅提取文本节点到 YAML。Agent 编辑 YAML，组装时做最小 XML 手术。100% 像素级保真。

核心论点

2024 年的挑战是"让 Agent 能跑起来"，2026 年的挑战是"让 Agent 能放心地跑在生产环境"。

Hooks 是强制执行的约束，其他一切只是善意的建议。但 Hooks 只回答"什么不安全" —— Agent 工程的下一个问题是"什么是对的"，以及谁来决定。

声明式而非过程式

用验收条件替代执行步骤，用令牌模型替代流程模型。

多层断言栈

策略从检测向下迁移为预防——让错误不可能发生，而非更快发现。

事实不可篡改

四类资产中唯一不可被"优化"的。只能被采集，或被忽略。

Ops-as-Code

运营工业化的声明式框架，构建 Agent 运行时的控制切面。

三层架构

产物层Product Layer

产物 = 内容 + 样式

最终交付物的视觉形态。Word、PPT、看板、邮件——内容和样式独立演化，互不污染。

内容层Content Layer

内容 = 模板 + 数据

剥离视觉表现后的"干货"。模板捕获可重复模式，数据驱动实例填充。

数据层Data Layer

结构化的原子事实

Pydantic schema + DB + API。数字、事实、事件——未经加工但经过严格类型约束。

控制策略

HITL 节点HITL

人做决策。信息不完备、后果不可逆时，保留人的最终判断权。

最慢 · 最贵 · 不可规模化

结构化评估项Eval

人/Agent 按明确规则判定。判定标准可文本化，允许解释空间。

可审计 · 可复现

AssertionAssert

pytest / CI 中执行。可访问数据库、API、文件系统——表达跨系统约束。

有 setup 成本 · 失败阻断流水线

ValidatorValidate

Pydantic field_validator，数据入库时自动触发。确定性、无副作用、零延迟。

最稳固 · 最廉价 · 预防而非检测

自动化方向：HITL → Eval → Assert → Validate

代码接口

weekly_report.py

 1from pydantic import BaseModel
 2 
 3class WeeklyReport(BaseModel):
 4    week: str
 5    dau: float
 6    dau_wow: float
 7    key_projects: list[str]
 8    risks: list[str]
 9 
10# 模板
11TEMPLATE = """
12# 周报 — {{ week }}
13...

Jinja2 模板 + Pydantic 模型：声明式数据框架驱动内容自动组装

内容领域

Engineering as Code

工程设计的形式化与可计算基础

6 篇文章

运营工业化

企业现实与 Agent 工程的接口

9 篇文章

Agent 架构

Harness 的控制切面

11 篇文章

工具

问题 → 分析 → 方案 → 效果

2 篇文章

跨层研究

RL · 对齐 · 形式化验证

3 篇文章

01. Engineering as Code: a General Method to Manage Complexity

将软件工程的成熟实践以领域适配的方式迁移至硬件、结构、电子、建造等一切人造物工程。系统阐述 EaC 五项核心实践：文本优先、可执行规格、Git 工作流、全频谱分层验证与 CI/CD。

Engineering as Code2026年6月29日

02. Software as Code: the First Prototype

软件工程是 Engineering as Code 的第一个完整参考实现。从机器码到高级语言、操作系统、协议栈与 CI/CD，回顾软件如何将构建行为本身纳入文本化与自动化体系。

Engineering as Code2026年6月29日

03. Silicon as Code: the Oligarchs' Waltz

半导体产业如何在互不信任的寡头格局下，用 PDK、DRC/LVS、可执行契约与 CI/CD 将千亿级晶体管的设计与制造纳入代码治理。

Engineering as Code2026年6月29日

04. MBSE: the Unfinished Journey

Model-Based Systems Engineering 二十年的实践留下了昂贵的模型仓库、不可执行的 SysML 图与专有工具锁定。本文剖析其治理理性缺血，并指向 EaC 作为出路。

Engineering as Code2026年6月29日

05. AI4Engineering: Why AI Cannot Yet Design

AI 能写诗、写代码、做芯片，却在建筑、机械、水利等传统工程设计中举步维艰。根因不是模型不够强，而是 as Code 基础设施缺失导致的质量左移断层。

Engineering as Code2026年6月29日

06. Engineering4AI: Next Major Domain of RLVR

从 Game → Math → Code → HWE，可验证奖励（RLVR）的下一个主战场是硬件工程。EaC 基础设施一旦建成，将为 AI 提供最密集、最分层的可验证奖励空间。