可能筹集了900万美元以构建一种更可靠的AI
随着LLM(大型语言模型)变得越来越强大,幻觉问题一直难以避免。即使是最聪明的模型中也会出现错误,尽管有一些方法可以捕捉这些错误,但行业仍在寻找最佳解决方案。刚刚从安德森·霍洛维茨(Andreessen Horowitz)筹集了900万美元种子资金的Probably,正在尝试建立一种更严格的方法来捕捉这些错误。正如创始人彼得·埃利亚斯(Peter Elias)所说,该公司的目标是防止幻觉和简单事实错误传达给用户,并达到99.99%的准确性,这在确定性系统中常见,但在AI中更难实现。事实证明,将LLM提升到这种准确性水平需要重新思考AI工程的许多基本假设。Probably的第一个产品是一个数据科学工具,旨在从复杂数据集中快速生成答案。每个结果都附带引用和开发过程的审计轨迹,这在AI工具中越来越常见。但要防止错误渗入这些总结,需要一个复杂的保护系统,埃利亚斯将其形容为“数据科学机甲”。LLM的第一次回答会与确定性验证系统进行检查,任何与数据集不匹配的结果都会被拒绝。关键是,LLM已经在验证器的基础上进行了训练,整个系统经过优化以实现快速和准确的答案,公司表示。“我们在构建这个过程时学到的是,你的保护工程越好,模型可以越弱,”埃利亚斯表示。“如果你能足够精炼上下文,模型就不需要花费很大力气去做正确的事情。基本上,这是一个减少模糊性的练习。”这使得Probably的数据科学工具可以在显著较小的AI模型上运行。埃利亚斯表示,当前版本运行在一个“比前沿模型弱四个等级的模型”上,这意味着它可以在本地硬件(即桌面计算机而不是数据中心)上运行,从而减少与AI使用相关的庞大令牌成本。在令牌成本上升和许多客户重新评估其AI预算的时代,这是一个受欢迎的想法。此外,埃利亚斯的创意不仅限于数据科学,因为相同的引擎可以扩展到会计或医疗服务等用例——正如埃利阿斯所说,“任何精确度敏感的用例”。“我认为,具有大型AI实验室甚至没有尝试做到这一点,这真的很有趣,”埃利亚斯说。“他们被激励不要这样做,因为他们越多次需要纠正模型,就越能赚钱。”当您通过我们文章中的链接购买时,我们可能会赚取少量佣金。这不会影响我们的编辑独立性。拉塞尔·布兰登(Russell Brandom)自2012年以来一直在报道科技行业,专注于平台政策和新兴技术。他曾在The Verge和Rest of World工作,并为Wired、The Awl和麻省理工学院《技术评论》撰写过文章。您可以通过russell.brandom@techcrunch.com与他联系,或通过Signal联系412-401-5489。查看简历
本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。
☕请我喝杯咖啡