展示 HN：基于 RLM 的 AI 代理跟踪本地调试器

✨ 基于 RLM 的代理优化器，使用生产跟踪✨ 快速入门 • 这是什么？ • 基准测试 • 开发 • 贡献快速入门使用以下命令安装 HALO 桌面应用程序：curl -fsSL https://inference.net/halo/install.sh | sh 安装程序会下载适合您平台的最新版本，并设置桌面应用程序。macOS 使用经过签名的、经过公证的 DMG。您也可以直接从 GitHub 发布页面安装。如果您正在寻找一个托管的，即插即用版本的 HALO，请注册 inference.net 并按照这里的说明进行操作。这是什么？ HALO 是一种使用 RLM 构建递归自我改进代理工具的方法论。该存储库包含: HALO 桌面应用程序，用于在您的机器上本地运行 HALO。关于 HALO 方法论的信息。一个实现核心 HALO-RLM 引擎的 Python 包。查看 PyPI 一个演示项目，展示如何使用 Python 包为您的代理构建 HALO 循环。查看演示基准测试示例，将 HALO 应用于流行的代理基准测试。（查看 AppWorld）。 HALO 循环核心 HALO 循环出乎意料地简单：从您的代理工具中收集执行跟踪。HALO 使用兼容 OpenTelemetry 的跟踪。将跟踪信息输入 HALO-RLM 引擎。该引擎分解跟踪以理解工具执行中的常见失败模式，并生成包含其发现的报告。该报告被输入到像 Cursor 或 Claude Code 这样的编码代理中，以生成和应用一组对您的工具的更改。然后重新部署工具，收集更多跟踪，重复该周期。 HALO 在生产代理部署中查找问题非常出色。我们发现高流量环境往往会生成更多数据，在执行过程中具有更高的方差，从而产生 HALO 擅长识别的那种问题。为什么使用 RLM？像 Claude Code 这样的通用工具不适合进行跟踪分析。并不是因为模型不聪明，而是因为跟踪信息可能非常长，您需要一个专门的工具包以便对系统代理行为进行观察。我们在测试中注意到，像 CC 这样的工具往往会过拟合于单个/少量跟踪中的错误，而不是推广到工具级别的问题。这导致我们创建了一种特殊形式的 RLM。开始使用安装从 PyPI 安装 HALO 引擎 + CLI：pip install halo-engine # 验证安装 halo --help 使用集成跟踪通过运行您的代理收集跟踪信息运行 HALO 引擎 export OPENAI_API_KEY=... # 可选：将 HALO 指向另一 OpenAI 兼容的提供者。 export OPENAI_BASE_URL=https://openrouter.ai/api/v1 halo path_to_your_traces.jsonl -p "诊断您发现的错误并建议修复" HALO 使用规范的 OpenAI 环境变量：OPENAI_API_KEY 用于凭证，OPENAI_BASE_URL 用于 OpenAI 兼容的提供者。如果未设置 OPENAI_BASE_URL，则 HALO 使用 https://api.openai.com/v1 。运行 halo --help 以查看所有 CLI 选项。 CLI 选项镜像了 Python SDK 的 ModelConfig 和 ModelProviderConfig 暴露的模型/提供者设置。 CLI 选项标记默认描述 TRACE_PATH 必需 JSONL 跟踪文件 --prompt , -p 必需发送到根代理的用户提示 --model , -m gpt-5.4-mini 根代理和子代理调用的模型名称；也是综合和压缩的后备 --synthesis-model --model 综合调用的模型（跟踪摘要）。推荐使用较小、便宜的模型（例如 gpt-4.1-nano） --compaction-model --model 压缩调用的模型（上下文摘要）——在大型运行中消耗最多的令牌。推荐使用较小、便宜的模型（例如 gpt-4.1-nano） --max-depth 2 最大子代理递归深度 --max-turns 20 每个代理的最大轮次 --max-parallel 10 最大并发子代理 --base-url OPENAI_BASE_URL / https://api.openai.com/v1 OpenAI 兼容的API基础URL --api-key OPENAI_API_KEY 提供者API密钥 --header , -H 未设置提供者标头为 NAME: VALUE。对于多个标头重复，遵循 curl 的 -H 约定 --temperature 提供者默认传递给模型的采样温度 --max-output-tokens 提供者默认转发到模型的最大输出令牌 --parallel-tool-calls / --no-parallel-tool-calls 启用允许模型发出并行工具调用 --refusal-retries 0 当模型拒绝时，重试代理模型请求的次数 --reasoning-effort 模型/提供者默认根代理和子代理调用的推理努力。 --telemetry 关闭发出 HALO 自身 LLM、工具和代理活动的 OpenInference 跟踪例如： halo path_to_your_traces.jsonl -p "诊断您发现的错误并建议修复" --base-url https://openrouter.ai/api/v1 -H " HTTP-Referer: https://example.com " 遥测 HALO 可以发出其自身 LLM、工具和代理活动的 OpenInference 格式跟踪。默认情况下是关闭的；除非您传递 --telemetry，否则不会发出任何内容。 halo TRACE_PATH --prompt " ... " --telemetry 当启用遥测时，CATALYST_OTLP_TOKEN 会通过 OTLP 上传跨度到 inference.net Catalyst。如果未设置，跨度将写入本地 JSON。