可能筹集了900万美元以构建一种更可靠的AI

随着LLM（大型语言模型）变得越来越强大，幻觉问题一直难以避免。即使是最聪明的模型中也会出现错误，尽管有一些方法可以捕捉这些错误，但行业仍在寻找最佳解决方案。刚刚从安德森·霍洛维茨（Andreessen Horowitz）筹集了900万美元种子资金的Probably，正在尝试建立一种更严格的方法来捕捉这些错误。正如创始人彼得·埃利亚斯（Peter Elias）所说，该公司的目标是防止幻觉和简单事实错误传达给用户，并达到99.99%的准确性，这在确定性系统中常见，但在AI中更难实现。事实证明，将LLM提升到这种准确性水平需要重新思考AI工程的许多基本假设。Probably的第一个产品是一个数据科学工具，旨在从复杂数据集中快速生成答案。每个结果都附带引用和开发过程的审计轨迹，这在AI工具中越来越常见。但要防止错误渗入这些总结，需要一个复杂的保护系统，埃利亚斯将其形容为“数据科学机甲”。LLM的第一次回答会与确定性验证系统进行检查，任何与数据集不匹配的结果都会被拒绝。关键是，LLM已经在验证器的基础上进行了训练，整个系统经过优化以实现快速和准确的答案，公司表示。“我们在构建这个过程时学到的是，你的保护工程越好，模型可以越弱，”埃利亚斯表示。“如果你能足够精炼上下文，模型就不需要花费很大力气去做正确的事情。基本上，这是一个减少模糊性的练习。”这使得Probably的数据科学工具可以在显著较小的AI模型上运行。埃利亚斯表示，当前版本运行在一个“比前沿模型弱四个等级的模型”上，这意味着它可以在本地硬件（即桌面计算机而不是数据中心）上运行，从而减少与AI使用相关的庞大令牌成本。在令牌成本上升和许多客户重新评估其AI预算的时代，这是一个受欢迎的想法。此外，埃利亚斯的创意不仅限于数据科学，因为相同的引擎可以扩展到会计或医疗服务等用例——正如埃利阿斯所说，“任何精确度敏感的用例”。“我认为，具有大型AI实验室甚至没有尝试做到这一点，这真的很有趣，”埃利亚斯说。“他们被激励不要这样做，因为他们越多次需要纠正模型，就越能赚钱。”当您通过我们文章中的链接购买时，我们可能会赚取少量佣金。这不会影响我们的编辑独立性。拉塞尔·布兰登（Russell Brandom）自2012年以来一直在报道科技行业，专注于平台政策和新兴技术。他曾在The Verge和Rest of World工作，并为Wired、The Awl和麻省理工学院《技术评论》撰写过文章。您可以通过russell.brandom@techcrunch.com与他联系，或通过Signal联系412-401-5489。查看简历