返回

文章详情

高级软件工程师基准:评估代理的开源基准

Hacker News2026年7月2日 02:55

1 ### 将 Google 图书作为 BookWorm 的元数据源,以便在回退/暂存导入时使用 2 3 ### 问题/机会 4 5 目前,BookWorm 依赖亚马逊和 ISBNdb 作为其主要的元数据来源。当元数据缺失、格式错误或不完整时,这就会出现问题,特别是对仅有 ISBN-13 的书籍。因此,通过承诺项目或 `/api/import` 提交的不完整记录可能无法被丰富,导致 Open Library 中存在低质量条目。这一限制影响了数据质量以及用户的导入成功率,尤其是对于不常见或国际出版的书籍。 6 7 ### 理由:我们为什么要进行这项工作,有什么可测量的影响? 8 9 将 Google 图书集成作为备用元数据源,增加了 Open Library 供给和阶段性丰富版本数据的能力。这提高了导入书籍的完整性,减少了因元数据稀疏而导致的导入失败,并增强了用户对导入体验的信任。其影响可以通过提高导入成功率和减少像“书籍 978...” 这样占位符条目的出现频率来衡量。 10 11 ### 定义成功:我们如何知道问题得到解决? 12 13 - BookWorm 能够使用 ISBN-13 从 Google 图书获取和阶段性丰富元数据。 14 15 - 自动化测试确认不同 Google 图书响应的准确解析,包括: 16 17 - 可用字段的正确映射(标题、副标题、作者、出版商、页数、描述、出版日期)。 18 19 - 正确处理缺失或不完整字段(例如,没有作者,没有 ISBN-13)。 20 21 - 当 Google 图书返回零个或多个匹配时不返回结果。 22 23 ### 提案 24 25 在 BookWorm 中引入支持 Google 图书作为备用元数据提供者。当亚马逊查找失败或仅有 ISBN-13 可用时,BookWorm 应尝试从 Google 图书 API 中获取元数据并为导入准备。这包括更新来源逻辑、元数据解析,并确保来自 `google_books` 的记录被正确处理。 26 27 需求: 28 - `openlibrary/core/imports.py` 中的元组 `STAGED_SOURCES` 必须包括 `

赞助内容

NordVPN Next-gen Antivirus

本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。

请我喝杯咖啡