苹果拒绝了我的口述应用程序,因为使用了无障碍 API
我创建了 WhisperPad,因为我需要它。在2024年秋天,我的手指关节在打字时开始疼痛。也许是我一生中大部分时间都在键盘上所导致的:童年玩电子游戏,随后在科技行业工作了10年。到冬天,这种情况变得更严重,到2025年初,我无法在持续打字时不触发不可持续的疼痛。它是一种渐进性的伤害,没有单一的戏剧性时刻;只是我每天可以做的事情逐渐缩小。这种缩小在一个不方便的时刻出现。我正处于换工作的阶段,试图决定接下来做什么,我决定申请人机交互硕士项目。我最大的担忧不是我能否跟上思维上的要求,而是我的手是否能够让我快速地完成工作以跟上进度。WhisperPad 的功能是什么 (或者说是曾经的功能) WhisperPad 处于你的菜单栏中。你按下键盘快捷键,讲话,它会在你的Mac本地转录你所说的话,并将文本放入光标所在的任何字段中。没有任何信息会发送到服务器。如果在它完成时你已经点击别的地方,文本会在你的剪贴板上,你可以随意粘贴。这就是整个应用程序。目的是减少将文字从我的脑中转移到计算机上所需的手部动作。你在口述时会出现的窗口指示器。在四月,苹果拒绝了我Mac口述应用程序 WhisperPad 的更新,理由是违反了指南 2.4.5。他们的立场是我以不符合无障碍使用的方式使用了无障碍 API。该应用程序的存在是因为我有手部受伤。苹果之前批准的早期版本也做了同样的事情。这次,他们没有批准。我最初使用了苹果内置的口述功能,体验十分令人沮丧。转录虽然接近但很少准确,每次修正都意味着要回到键盘上,删除、重新输入。我在伤害我的手来修复这个本该拯救它们的工具。这正是我想解决的具体问题:不是 "转录我的声音",而是 "转录我的声音足够好,以至于我不会不断地输入修正"。我会诚实地说我如何接近这个问题。我没有做很多市场调研。外面可能已经有好的工具,但大多数将你的音频发送到某个服务器,而我希望有一个不这样做的工具。当我想要一个东西时,我通常的第一个问题是 "我能不能自己建一个",而不是 "我能买到什么"。第一版很粗糙,但我每天都在使用并不断改进。我和几位同班同学分享了它,看到他们将其融入到自己的日常工作流程中。看到其他人悄悄依赖它让我想要正式发布它。拒绝版本 1.0 在冬季发布,并可从 App Store 免费下载。接下来,我添加了早期用户请求的功能,并决定将其变为付费应用。那个更新是版本 1.5。苹果在指南 2.4.5 下拒绝了它。拒绝的理由与无障碍权限有关。WhisperPad 使用它将转录的文本注入到其他应用程序中,而苹果的立场是这不是该 API 的批准使用。早些时候,已批准的版本的应用程序已经做了完全相同的事情,使用相同的权限,因此这让人难以接受。拒绝说明也有一些公平的反馈。我修复了那些问题,但 2.4.5 的问题才是真正的障碍。因此,我提出了上诉,解释说 WhisperPad 像一个无障碍工具 ,我有重复性拉伤伤害,而该应用程序注入文本的整个原因是为了减轻像我这样的人多余的击键。 我请求苹果从这个角度重新审视。 他们回应说,他们会仔细审查。 他们告诉我不要在这个线程中回复,并表示他们将会带着决定回来。 那是四月21日。 然后就没有消息了。 到了五月21日,我没有听到任何消息,于是我发送了一封简短、礼貌的邮件询问状态。 我曾从事客户支持工作。 我知道工单会被遗忘,而我想提醒他们重新关注这个问题。 他们很快回复,答案又一次是拒绝。 分歧的决定 那第二次拒绝迫使我做出一个真正的决定,我想要解释一下,因为原本做出一个更糟的决定很容易。 我花了一些时间权衡两个选择:遵守苹果的限制,发布符合其规则的版本(牺牲直接粘贴),或者通过直接分发发布 WhisperPad。 我决定不能牺牲 App Store 的覆盖面。 所以我会构建一个符合其规则的版本,放在那里,同时继续进行直接分发,以便提供我最初打算构建的完整版本。 关于这个约束的事情。 就我所知,苹果的指南意在规范应用程序将文本注入到自身以进行无障碍使用。
本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。
☕请我喝杯咖啡