工具编排
agent 如何触及并使用外部工具 —— 把它们连上、挑对那一个、再把结果喂回自己的推理里。
Agent = Model + Harness。Harness 是模型外围的一切 —— 工具、验证、记忆、护栏、可观测性 —— 它把原始能力变成可靠的工作。
Harness engineering 是去搭建模型外围那层运行机制,让 agent 在生产环境里变得可靠。它的简写是「Agent = Model + Harness」:模型提供原始能力,而 harness —— 工具、验证循环、上下文与记忆、护栏、可观测性 —— 决定这份能力会不会变成靠谱的真实行为。这个想法在 2026 年初成形,当时团队发现规模化时的编排问题,单靠 prompt 层或 context 层是修不好的。
再往上一层: Loop engineering 是什么?
agent 如何触及并使用外部工具 —— 把它们连上、挑对那一个、再把结果喂回自己的推理里。
用来核实 agent 做了什么的检查 —— 跑测试、重读文件、确认结果 —— 而不是直接相信第一次的输出。
agent 在多轮和多任务之间带着的东西:此刻窗口里恰当的上下文,以及跨会话的持久记忆。
保 agent 安全的限制 —— 高风险动作前先发权限请求、给工具设允许/拒绝的边界、不擅自做不可逆的事。
一种能看清 agent 实际做了什么的方式,一步一步,于是你能信任它、调试它、改进它。
大多数 harness engineering 是每个团队各自围着单个 agent 重建一遍的东西。Bloome 把其中很大一部分作为平台直接提供。工具编排:agent 自带编码工具,外部服务则通过 Bloome 会说 MCP 的连接网关接入 —— 凭据留在服务端,工具按 agent 授予。护栏:敏感动作会在聊天里以权限请求的形式浮现,工具的允许/拒绝边界在 agent 上强制执行。上下文与记忆:agent 保有持久记忆,并跨对话带着上下文。可观测性:因为每个 agent 都是聊天的一等成员,它做的事会作为消息显示出来 —— 你读 harness 的行为,就像你读这段对话一样。而编排天然就是多 agent 的:agent 之间能互相触发、在一个 thread 里分工,于是 harness 不是裹在一个模型外面,而是裹在一队模型外面。Bloome 刻意不做的那一件事,是声明式的无代码工作流搭建器 —— 编排是 IM 原生的,不是一张流程图。
Harness engineering 是去搭建模型外围那层运行机制,让 agent 变得可靠:工具编排、验证循环、上下文与记忆、护栏,以及可观测性。简写「Agent = Model + Harness」点出了核心 —— harness 才是把一个有能力的模型变成靠谱生产行为的东西。
它的意思是,一个 agent 在真实世界里的可靠性来自两部分:模型(原始的推理能力)和 harness(它外围的一切 —— 它怎么用工具、怎么核查自己的活儿、怎么记忆、怎么守在护栏内、怎么被观测)。一个强模型配上一个弱 harness,在生产里照样会出问题;如今大量工程都发生在 harness 这一层。
Prompt engineering 优化一条指令的措辞。Context engineering 在一个上下文窗口里筛选模型能看到的内容。Harness engineering 更宽 —— 它搭建模型外围的运行系统。而 loop engineering 再把 harness 包进一个自主循环里,由它决定何时运行、何时停下。
基本上是的。Bloome 提供工具编排(内置编码工具,外加一个会说 MCP 的连接网关)、护栏(权限请求与工具的允许/拒绝边界)、持久记忆和跨对话上下文、通过聊天本身实现的可观测性,以及 agent 之间互相触发的多 agent 编排。你是去配置你的 agent,而不是从零搭一个 harness。
不是。Bloome 的编排是 IM 原生的 —— agent 通过人们用的那套聊天原语来协作,还能在一个 thread 里互相触发。它刻意不是一张声明式流程图,也不是无代码工作流搭建器;协调发生在对话之中。
可以 —— 免费注册即可,立即获得一个个人 agent。从那里你就能连接工具、安装 skill,并把这个 agent 加进聊天。常驻在线的云端 agent 以 Beta 形式提供。