展示 HN:基于 RLM 的 AI 代理跟踪本地调试器
✨ 基于 RLM 的代理优化器,使用生产跟踪✨ 快速入门 • 这是什么? • 基准测试 • 开发 • 贡献 快速入门 使用以下命令安装 HALO 桌面应用程序:curl -fsSL https://inference.net/halo/install.sh | sh 安装程序会下载适合您平台的最新版本,并设置桌面应用程序。macOS 使用经过签名的、经过公证的 DMG。您也可以直接从 GitHub 发布页面安装。如果您正在寻找一个托管的,即插即用版本的 HALO,请注册 inference.net 并按照这里的说明进行操作。 这是什么? HALO 是一种使用 RLM 构建递归自我改进代理工具的方法论。该存储库包含: HALO 桌面应用程序,用于在您的机器上本地运行 HALO。关于 HALO 方法论的信息。一个实现核心 HALO-RLM 引擎的 Python 包。查看 PyPI 一个演示项目,展示如何使用 Python 包为您的代理构建 HALO 循环。查看演示 基准测试示例,将 HALO 应用于流行的代理基准测试。(查看 AppWorld)。 HALO 循环 核心 HALO 循环出乎意料地简单:从您的代理工具中收集执行跟踪。HALO 使用兼容 OpenTelemetry 的跟踪。将跟踪信息输入 HALO-RLM 引擎。该引擎分解跟踪以理解工具执行中的常见失败模式,并生成包含其发现的报告。该报告被输入到像 Cursor 或 Claude Code 这样的编码代理中,以生成和应用一组对您的工具的更改。然后重新部署工具,收集更多跟踪,重复该周期。 HALO 在生产代理部署中查找问题非常出色。我们发现高流量环境往往会生成更多数据,在执行过程中具有更高的方差,从而产生 HALO 擅长识别的那种问题。 为什么使用 RLM? 像 Claude Code 这样的通用工具不适合进行跟踪分析。并不是因为模型不聪明,而是因为跟踪信息可能非常长,您需要一个专门的工具包以便对系统代理行为进行观察。我们在测试中注意到,像 CC 这样的工具往往会过拟合于单个/少量跟踪中的错误,而不是推广到工具级别的问题。这导致我们创建了一种特殊形式的 RLM。 开始使用 安装 从 PyPI 安装 HALO 引擎 + CLI:pip install halo-engine # 验证安装 halo --help 使用 集成跟踪 通过运行您的代理收集跟踪信息 运行 HALO 引擎 export OPENAI_API_KEY=... # 可选:将 HALO 指向另一 OpenAI 兼容的提供者。 export OPENAI_BASE_URL=https://openrouter.ai/api/v1 halo path_to_your_traces.jsonl -p "诊断您发现的错误并建议修复" HALO 使用规范的 OpenAI 环境变量:OPENAI_API_KEY 用于凭证,OPENAI_BASE_URL 用于 OpenAI 兼容的提供者。如果未设置 OPENAI_BASE_URL,则 HALO 使用 https://api.openai.com/v1 。 运行 halo --help 以查看所有 CLI 选项。 CLI 选项镜像了 Python SDK 的 ModelConfig 和 ModelProviderConfig 暴露的模型/提供者设置。 CLI 选项 标记 默认 描述 TRACE_PATH 必需 JSONL 跟踪文件 --prompt , -p 必需 发送到根代理的用户提示 --model , -m gpt-5.4-mini 根代理和子代理调用的模型名称;也是综合和压缩的后备 --synthesis-model --model 综合调用的模型(跟踪摘要)。推荐使用较小、便宜的模型(例如 gpt-4.1-nano) --compaction-model --model 压缩调用的模型(上下文摘要)——在大型运行中消耗最多的令牌。推荐使用较小、便宜的模型(例如 gpt-4.1-nano) --max-depth 2 最大子代理递归深度 --max-turns 20 每个代理的最大轮次 --max-parallel 10 最大并发子代理 --base-url OPENAI_BASE_URL / https://api.openai.com/v1 OpenAI 兼容的API基础URL --api-key OPENAI_API_KEY 提供者API密钥 --header , -H 未设置 提供者标头为 NAME: VALUE。对于多个标头重复,遵循 curl 的 -H 约定 --temperature 提供者默认 传递给模型的采样温度 --max-output-tokens 提供者默认 转发到模型的最大输出令牌 --parallel-tool-calls / --no-parallel-tool-calls 启用 允许模型发出并行工具调用 --refusal-retries 0 当模型拒绝时,重试代理模型请求的次数 --reasoning-effort 模型/提供者默认 根代理和子代理调用的推理努力。 --telemetry 关闭 发出 HALO 自身 LLM、工具和代理活动的 OpenInference 跟踪 例如: halo path_to_your_traces.jsonl -p "诊断您发现的错误并建议修复" --base-url https://openrouter.ai/api/v1 -H " HTTP-Referer: https://example.com " 遥测 HALO 可以发出其自身 LLM、工具和代理活动的 OpenInference 格式跟踪。默认情况下是关闭的;除非您传递 --telemetry,否则不会发出任何内容。 halo TRACE_PATH --prompt " ... " --telemetry 当启用遥测时,CATALYST_OTLP_TOKEN 会通过 OTLP 上传跨度到 inference.net Catalyst。如果未设置,跨度将写入本地 JSON。
本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。
☕请我喝杯咖啡