我让Gemini和Claude写我的电子邮件回复——但只有一个听起来像我

Chandraveer Mathur/ZDNET 关注ZDNET：将我们添加为Google的首选来源。ZDNET的关键要点：Gemini为Gmail的"帮助我写"提供高效支持。您可以使用Gemini或Claude撰写上下文相关的电子邮件。测试显示Claude在匹配语调和要求方面更好。三年前，我开始使用"帮助我写"，这是Google最早的应用AI尝试之一。这个写作助手集成在Google的产品中，比如Docs和Gmail，我发现它可以从头开始撰写完整的电子邮件——我只需签字确认即可。尽管我喜欢"帮助我写"，但我注意到支撑它的Gemini LLM底层技术通过Google的独立AI应用程序交付的结果似乎更好。由于我将我的电子邮件线程输入Gemini以撰写回复，我决定比较Claude的表现。经过一周的测试，我惊讶地发现Anthropic的工具写出的信息非常像我的风格。我在比较什么，以及我是如何测试的这些竞争的LLM提供多个模型，但我选择使用Gemini 3.5 Flash来获取快速响应，使用的是Pro帐户。不过，它是免费的，使用限制相对宽松。重要的是，我在“附件 > 更多工具 > 个人智能”下打开了Google实验室的个人智能开关。它从我之前的Gemini聊天中提取可操作的风格线索和信息，为当前的回应增添个人风格。至于Anthropic的工具，我使用免费的Claude Sonnet 4.6模型，努力水平设定为高。这在速度（像Gemini Flash）和重要的事实准确性之间取得了平衡。此外，我通过口述我的提示来节省时间，而Claude的语音到文本引擎比Gemini强大得多，尤其是如果您有口音的话。同时，我让Gemini Flows整理我的Gmail，并有效地过滤了我的收件箱（但有一个微妙的秘密）。对于每封电子邮件，我概述草稿的目标，然后附上两条标准指令。它们始终个性化结果，并防止令牌浪费。首先，我要求AI暂停立即响应，并避免提出跟进问题以获取初始提示中缺失的细节。其次，我命令LLM模仿电子邮件线程中的我的语调。您需要这些指令来期待可行的回应。例如，我将使用一封关于运输延误和缺失跟踪号码的电子邮件进行后续跟进，这是一款我计划评测的产品。这是提示：“为以下电子邮件线程撰写回复，并再次请求发货跟踪号码，解释说由于我将在七月中旬旅行，我们需要为这款产品的评测设定一个时间表，以确保在我旅行前完成。请不要立即回复。从我这里问任何问题以撰写适当的回应。模仿我在线程中所见的半正式语调。”<附加的电子邮件链作为PDF>” 差异立刻显现一开始，Gemini跟进请求向我询问了两个问题。第一个问题寻求我未提及的一个有用的细节——评测的预期完成日期。遗憾的是，Gemini的第二个问题问收件人自我上次电子邮件以来是否有回复，但没有说明为什么需要我的答案。质疑提供的信息似乎多余，因为我显然会包括最新的回复，而伴随的理由依然模糊。电子邮件线程中包含对跟踪号码的先前请求，而AI却忽略了这一点。“如果他回复了您的跟踪号码请求，知道他说了什么将帮助我直接针对他的最新观点进行回应。如果他没有回复并且您再次跟进，我将将其表述为一种温和的提醒。”同时：您的Gmail正在进行AI改造——这里是您可以期待的内容和时间。 Claude的表现相似，但却询问了三个问题。虽然Google的工具询问了我计划的评测完成日期，但Anthropic询问了具体的旅行日期，这对我的收件人来说无疑更相关和易于理解。在仍然等待产品到来的情况下，我无法合理地承诺完成日期，但旅行日期是一个固定的常数。第二个问题突显了Claude对我提示的“理解”的优越性，直接问我希望多么坚定。理由明确指出我的回应将影响电子邮件的语气，与Gemini的模糊性形成鲜明对比。第三，Claude从我的电子邮件签名行中提取了我所写网站，并询问我会在哪里撰写相关的评测。这一细节与请求的电子邮件草稿无关，且在之前的对话中已经提及，让我感到有些失望。为了保持测试公平，我回答了两个AI的所有问题。电子邮件草稿差异明显鉴于这种将整个电子邮件线程作为LLM提示的方式需要相当大的努力而没有集成或脚本自动化，我认为我的期望非常高。目前，直接输入回复的速度确实比使用AI或从"帮助我写"中即兴发挥快。