构建可靠的代理AI系统

临床前药物发现本质上复杂且数据密集。研究人员在这一关键阶段面临着高效访问和分析大量信息的重大挑战。传统的基于关键词的搜索方法，通常依赖于严格的布尔逻辑，在面对临床前研究问题的细微和复杂性时，往往无法达到预期效果。大型语言模型（LLMs）的出现提供了一个变革性的机会。通过将LLMs的生成能力与信息检索系统的精准性相结合，检索增强生成（RAG）作为一种有前景的技术出现。这种方法有潜力彻底改变临床前数据访问，使研究人员能够用自然语言提出复杂问题，并获得基于专有数据的准确、丰富的上下文答案。拜耳意识到这种潜力，承诺探索这些技术如何解决临床前研究中长期存在的挑战。在这篇文章中，我们分享这一旅程——拜耳在生成AI上的早期投资如何促成了PRINCE，这是一个建立在代理RAG基础上的代理AI系统。本案例研究探讨了技术架构、工程决策以及在将临床前数据检索从一个复杂迷宫转变为直观对话体验中得到的经验教训。PRINCE背后的许多工程决策现在可以通过上下文工程和支架工程的视角来理解，尽管在最初设计系统时我们并没有使用这些术语。上下文工程塑造了每个模型接收到的信息、未接收到的信息以及上下文如何在研究、反思和写作等专业步骤之间移动。支架工程塑造了模型周围的支撑结构：编排、工具边界、状态持久性、重试、后备、验证、反思循环、可观察性和人工审核。虽然这篇文章的重点是技术架构和工程挑战，但我们在《人工智能前沿》上发表的论文更详细地讨论了产品演变和商业影响。挑战：导航临床前数据迷宫拜耳的临床前研究环境，像许多大型制药公司一样，特点是数据的多样性和广泛性。这包括来自各种研究的高度结构化数据集，以及嵌入在研究报告、出版物和监管提交等文本文件中的大量非结构化信息。研究人员在有效访问和分析这些信息时经常遇到重大障碍：数据孤岛：信息分散且散布在众多不同的系统和仓库中，使得对与特定化合物或研究相关的临床前数据获得全面的整体视图变得极为困难。有限的搜索能力：传统的基于关键词的搜索引擎在处理临床前术语和研究问题的复杂性及多样性时常常显得力不从心，结果往往是不相关、不完整或过多的信息。耗时的手动分析：提取特定见解或跨多个文档汇编信息需要相当的手动工作，从而分散了研究人员宝贵的科学活动时间。这些固有的挑战突显了对更高效、更智能和更集成的临床前数据检索和分析方式的明确需求。解决方案：PRINCE - 一个进化平台为了应对这些挑战，拜耳开发了临床前信息中心（PRINCE）平台。PRINCE被设想为一个统一的临床前数据网关，最初侧重于整合之前孤立的结构化研究元数据，并以“可搜索”的方式展示这些数据。这个初始阶段使用户能够应用高级过滤器，主要从结构化研究元数据中检索信息。然而，拜耳大量有价值的临床前知识仍然存在于几十年来积累的非结构化PDF研究报告中。由于多年来的多次系统迁移，与这些报告相关的结构化元数据可能不完整、缺失，甚至包含错误的注释。至关重要的是，得到批准的PDF研究报告中始终存在权威的“黄金标准”信息。生成AI，特别是RAG的出现，为释放这一丰富的非结构化数据提供了关键。通过集成RAG功能，PRINCE开始将范式从基于过滤器的“搜索”工具转变为自然语言“询问”系统，使研究人员能够直接查询这些研究报告的内容。这个演变反映了PRINCE经过三个不同阶段的进展：搜索：初始阶段专注于创建一个统一的网关，以访问数千份非临床研究报告，将多个内部数据孤岛整合在一起。