宋涤非

Agent 基础设施工程师

模型是 Agent 的大脑,但我们不是神经外科医生——我们是接口工程师

我们的工作不是控制大脑如何思考,而是控制大脑与世界的接口: 何时可以行动、何时必须停止、如何被观测。

Agent Runtime · 可观测性 · 运营工业化

2024 年的挑战是"让 Agent 能跑起来",2026 年的挑战是"让 Agent 能放心地跑在生产环境"

Hooks 是强制执行的约束,其他一切只是善意的建议。但 Hooks 只回答"什么不安全" —— Agent 工程的下一个问题是"什么是对的", 以及谁来决定。

声明式而非过程式

用验收条件替代执行步骤,用令牌模型替代流程模型。

多层断言栈

策略从检测向下迁移为预防——让错误不可能发生,而非更快发现。

事实不可篡改

四类资产中唯一不可被"优化"的。只能被采集,或被忽略。

Ops-as-Code

运营工业化的声明式框架,构建 Agent 运行时的控制切面。

产物层Product Layer
产物 = 内容 + 样式

最终交付物的视觉形态。Word、PPT、看板、邮件——内容和样式独立演化,互不污染。

内容层Content Layer
内容 = 模板 + 数据

剥离视觉表现后的"干货"。模板捕获可重复模式,数据驱动实例填充。

数据层Data Layer
结构化的原子事实

Pydantic schema + DB + API。数字、事实、事件——未经加工但经过严格类型约束。

01
HITL 节点HITL

人做决策。信息不完备、后果不可逆时,保留人的最终判断权。

最慢 · 最贵 · 不可规模化

02
结构化评估项Eval

人/Agent 按明确规则判定。判定标准可文本化,允许解释空间。

可审计 · 可复现

03
AssertionAssert

pytest / CI 中执行。可访问数据库、API、文件系统——表达跨系统约束。

有 setup 成本 · 失败阻断流水线

04
ValidatorValidate

Pydantic field_validator,数据入库时自动触发。确定性、无副作用、零延迟。

最稳固 · 最廉价 · 预防而非检测

自动化方向:HITL → Eval → Assert → Validate