返回

文章详情

展示 HN:任何 AI 工具的本地个人数据编辑

Hacker News2026年6月18日 01:52

在文档中查找并编辑个人信息——完全在您的设备上进行。加载 PDF、markdown 或文本文件,使用内置规则或本地 ONNX 模型检测 PII,审核每个匹配项,并导出已安全编辑的副本。文档内容不会离开您的机器。示例 · 特点 · 检测后端 · 设置 · 开发 · 路线图 PII GUI 是一款 Tauri 2 桌面应用(前端为 React 19 + TypeScript,后端为 Rust),用于本地优先的 PII 检测和编辑。检测在设备上运行,使用正则规则或量化的 ONNX 模型;唯一的网络访问是可选的一次性模型下载。示例 PII GUI 支持两种本地工作流程。文本 <-> PII 编辑 PDF 文本 -> PII:在导出已编辑副本之前,检测名称、电子邮件、电话号码、网址、日期、ID 和密钥。PII -> 文本:在您需要可逆的本地审查工作流程时,将审核过的占位符恢复为可读文本。将批准的编辑烧录到导出的 PDF 文件中,以便隐藏文本无法从输出文件中恢复。特点 本地推断——PII 检测完全在设备上运行。唯一的网络访问是从 Hugging Face 下载的可选一次性模型。PDF、Markdown 和纯文本输入——使用 pdf.js 解析 PDF,保留逐字符的位置,尽可能直接在渲染页面上突出检测。自定义规则——在任何后端之上添加您自己的正则表达式或精确匹配过滤器。在编辑之前审核——在导出之前,在工作台中启用或禁用个别匹配项。真正的 PDF 编辑——导出的 PDF 在渲染页面中烧录不透明矩形,因此被编辑的文本无法从输出文件中恢复。任务历史和持久性——选项卡、自定义规则和过滤器结果通过本地 SQLite 数据库和磁盘结果文件保存在重启中。长期文档支持——输入被分割成基于标记的、页面感知的块并通过任务队列处理。本地化用户界面——英文、韩文和日文。检测后端 后端 最适合 正则(内置) 电子邮件、电话、网址、日期、帐户号码和密钥的即时基线检测 OpenAI 隐私过滤器 长英文文档和广泛的隐私分类检测 BardsAI EU PII 在名称、地址和 ID 样式实体重要的欧洲语言文本中 检测分类 匹配被标记为固定的隐私分类:account_number·private_address·private_email·private_person·private_phone·private_url·private_date·secret 需求 Node.js 24+ pnpm Rust 和 Cargo Tauri v2 平台依赖于您的操作系统 设置 从 Releases 页面下载适用于 macOS、Windows 或 Linux 的最新安装程序。在首次启动时,入门流程让您选择默认后端。正则立即生效;ONNX 模型是可选下载(从 Hugging Face 获取到应用数据目录中,可以随时从设置中删除)。从源代码安装:cd tauri pnpm install 本地发布签名值对开发是可选的。如果您需要本地更新程序签名,请复制环境模板并填入自己的密钥:cp .env.example .env 它是如何工作的 文档(PDF / md / txt)→ 文本提取(pdf.js,每个字符的框对于 PDF)→ 基于标记的、页面感知的分块 → 任务队列 → Rust `redact_text` 命令 → 正则 / ONNX 推理(ort + tokenizers)→ 匹配 + 被编辑文本 → 在用户界面中审核和切换匹配 → 导出(烧录的 PDF 编辑或编辑文本)前端(React)处理文档解析、分块、审核和导出。Rust 后端(src-tauri/)拥有检测引擎、模型生命周期(下载 / 验证 / 删除)和文件 I/O——所有写入都限制在 Tauri 应用数据目录内。开发 从源代码运行 cd tauri pnpm install pnpm tauri dev 构建 cd tauri pnpm tauri build 测试 cd tauri pnpm test:unit # 前端单元测试(vitest) pnpm build # 类型检查 + 前端构建 cd src-tauri cargo test # Rust 后端测试 路线图 本地正则检测和审核工作流程 可选的 ONNX 后端接线,用于 OpenAI 隐私过滤器和 BardsAI EU PII 烧录 PDF 编辑导出 本地选项卡、自定义规则和结果持久性 对大型 PDF 和多语言文档的更广泛导入/导出 QA 可达性和仅键盘审核路径 与编码代理(Codex、Claude Code、Cursor)的集成 项目结构 tauri/ # 桌面应用 src/ # React 前端 App.tsx # 协调器:选项卡、路由、工作台 components/ # PDF 预览、shadcn/Radix UI 基础 lib/ pdf-document.ts # pdf.js 文本 + 字符框提取 pii-text-chunks.ts # 基于标记的分块 pii-task-queue.ts # 检测任务队列 redaction-policy.ts # 匹配合并/选择/恢复逻辑 pdf-redacted-export.ts # 烧录 PDF 编辑导出 app-persistence.ts # SQLite + 结果文件持久性 i18n.ts # 英文 / 韩文 / 日文用户界面文案 src-tauri/ # Rust 后端 src/lib.rs # Tauri 命令:redact_text、模型生命周期、文件 I/O src/redact_engine.rs # 正则 / ONNX / BardsAI 检测后端 docs/assets/ # README 缩略图和截图资产 .github

赞助内容

NordVPN Next-gen Antivirus

本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。

请我喝杯咖啡