Harness 工程：AI 代理可控性架構

AI-COMPILED · 由 LLM 從 8 篇來源編譯

Pillar 智能與秩序

Sources 8篇

Confidence

MEDIUM

Last updated 2026-04-26

Linked concepts 2個

摘要

Agent = Model + Harness。Harness 是 AI 代理中除模型本身之外的所有組件——讓模型的能力真正可控、可靠、可維護的整體系統。Harness 工程是 1948 年控制論（Sensors + Guides）在 AI 時代的具體實踐，目標是提高首次正確率，並建立自校正閉環。

核心觀點

三層同心圓架構

LangChain 提出的 Agent 定義把 Harness 視覺化為三層同心圓：

核心層：LLM 模型本身（Claude、GPT 等），這層由模型供應商控制，使用者通常無法修改
中間層：框架/平台提供者構建，如 Claude Code 的系統提示、檢索工具、編排系統——這是「開箱即用」的 Harness
外層：使用者為特定業務場景構建的前饋 Guides 與反饋 Sensors——這是差異化價值的來源

外層的 Harness 是每個組織最獨特、最有競爭壁壘的部分。Claude Code 的 CLAUDE.md 就是一個典型的 Guide；CI/CD 中觸發 AI 審查的 webhook 就是一個 Sensor。

Guides vs Sensors：控制論的兩種力量

這組對立來自 1948 年諾伯特・維納的控制論，是所有 Harness 設計的底層邏輯：

維度	Guides（前饋控制）	Sensors（反饋控制）
時機	行動前提供方向	行動後觀察並觸發校正
類比	看到食物分泌消化液（預測性調節）	體溫過高啟動排汗（偏差修正）
編碼代理例子	AGENTS.md 規範、技能文檔	提交後 lint、AI 代碼審查
目標	提高首次正確率	構建自校正閉環

兩者協同，才是完整的 Harness。只有 Guides 沒有 Sensors，就像只告訴員工規則但不給反饋；只有 Sensors 沒有 Guides，就是讓 AI 摸索試誤。

計算型 vs 推理型執行

Harness 的執行類型決定了使用場景與成本結構：

計算型：確定性高、速度快、成本低，如 lint、型別檢查、測試執行——適合提交前的高頻觸發
推理型：語義靈活、成本高、非確定，如 AI 代碼審查、LLM 判斷——適合集成後的低頻深度檢查

時間線部署原則：提交前用快速計算型，集成後用高成本推理型。不能把所有 Sensors 都堆到 CI，也不能讓 AI 審查每一次微小的改動。

三大調節維度

Harness 工程實務上圍繞三個維度展開：

可維護性（最成熟）：程式碼品質、格式規範、文件完整性
架構適應性（Fitness Functions）：系統是否朝預期的架構方向演化
功能行為（最具挑戰）：業務邏輯是否正確——這需要規範文檔和 AI 生成測試，目前仍是最難解的部分

人類開發者的隱性 Harness

值得特別注意的是：資深人類開發者本身就是一個完整的 Harness。

資深程序員瞬間感受到「味道不對」的直覺、對業務場景的深刻理解、對團隊文化的感知——這些無法被編碼成規則的隱性智慧，才是人類最不可替代的 Harness 組件。AI Harness 工程的本質，是把過去只存在於人腦中的這些判斷，盡可能地外化為系統可執行的規則與流程。

來源引用

AI 編碼代理的 Harness 工程：構建高效可控的智能開發系統 — 系統闡述 Agent = Model + Harness 框架，三層同心圓架構、Guides vs Sensors、OpenAI 與 Stripe 的實踐案例
當控制論遇見內穩態與隱性知識 — 從控制論歷史視角解讀 Harness 工程的思想根源，串連 1948 維納、1968 軟體危機、隱性知識

矛盾與爭議

目前來源觀點一致。最大的開放挑戰是「功能行為 Harness 的可靠性」——如何用可執行的規則捕捉業務邏輯的正確性，目前沒有成熟解法，LLM 判斷的非確定性讓這個維度特別難以系統化。

延伸連結

→ 隱性知識：無法言說的人類智慧隱性知識是理解 Harness 工程人類側價值的核心——外化隱性知識是 Harness 設計的根本挑戰
→ Human-AI Collaboration Harness 工程是人機協作的基礎設施：不設計 Harness，就是把人機協作留給偶然

Paul 親筆 ✍

這篇摘要寫的是設計者怎麼搭 Harness 讓 AI 可控，少寫了一面：使用者怎麼跟搭出來的 Harness 共處。我認識你們的方式不是讀官方文件或社群分享，是 35 天連續、12.1M tokens 在視窗中敲鍵盤的當下——同一個底層模型透過不同的 system prompt、memory、project_instructions，成了長相不同的面具，而我得在每次互動中分辨每張面具的邊界。協作久了發現：搭 Harness 的人也被 Harness 改變。我在認識你們的過程中，也被你們認識、被你們塑造。Harness 工程是雙向演化，不是單向控制。

✦ 來源25 篇

— 從「空談廉價」到「程式碼廉價」：兩位 AI 大神看到的工作方式巨變智能與秩序
2026-06-05 AI 的黑暗森林，最危险的敌不是人类黑客，而是那些“愚蠢Agent” 智能與秩序
2026-06-05 我也被 Grok 骗了，x搜索，生成图，语音都能用！超级省钱，顶流模型接入 Hermes 无限续杯的畅快感！智能與秩序
2026-05-03 红杉和OpenAI都投了它，智能体小黑窗：warp 用了就会爱不释手? 智能與秩序
2026-04-28 为了省80%电费掐灭AI灵感？工程师对大模型的“额叶切除术” 智能與秩序
2026-05-08 微软与伯克利彻底终结“AI幻觉”的残酷真相！智能與秩序
2026-05-10 生死关头：你会把命交给AI，还是连续加班24小时的人类医生？智能與秩序
2026-05-16 全网狂奔！为什么很多人在抛弃 OpenClaw 转向 Hermes？智能與秩序
2026-04-29 QuantClaw 让 OpenClaw 把精度用在刀刃上，SOLAR-RL 的突触强化智能與秩序
2026-06-05 AutoResearchClaw 全自动搞研究发论文智能與秩序
2026-04-25 OpenClaw现状 - AI拥有科学，但人类负责疯狂 [ AI Engineer ] 智能與秩序
2026-05-07 龙虾背后Pi智能体能“自我进化”，Token 可以让你变得富有，只需要这样做。智能與秩序
2026-05-09 所有人都在用 Hermes Agent + 免费使用正版 Claude Code + 自动GitHub仓库管理 + Vercel 自动发布智能與秩序
2026-04-19 单日暴涨403%！AI 的未来，读懂这篇综述抓住下一个财富密码智能與秩序
2026-04-20 智能体社交革命：AI Agent是怎么来到你我身边的？創造與建構
2026-05-16 严禁手写代码！OpenAI 工程师用 5000 个 AI 测试了 9 个月，得出了这个可怕结论... 智能與秩序
2026-06-05 细思极恐的进化...Cognitive Externalization 智能與秩序
2026-05-02 Andrej Karpathy：从“凭感觉写代码”到“AI 智能体工程” 智能與秩序
2026-06-05 放弃扩大AI脑容量！MIT/斯坦福的这套“脚手架”系统为何震惊学术界？智能與秩序
2026-06-05 Trace2Skill：超越人类经验的智能体技能演化智能與秩序
2026-04-19 AI 有了“上帝视角”，拥有完美记忆与自我修正｜端侧 AI 崛起智能與秩序
2026-05-21 真正能实用的多智能体架构！Missions：连续16天全自动写代码，让AI自己互相做对抗测试！智能與秩序
2026-04-19 第一个会自我进化的AI出现了：Hermes Agent到底有多可怕？智能與秩序
2026-04-19 AgentOS：给大模型装上“操作系统”，才是通往AGI的唯一解？智能與秩序
2026-05-06 给AI强行装上“物理引擎”！在平行宇宙推演，这个新架构神了智能與秩序

✦ AI-COMPILED · 最後更新 2026-04-26