返回

文章详情

这两位创始人离开高盛和Meta,致力于为被其他人忽视的市场构建语音AI

TechCrunch2026年6月3日 15:00

客户支持和服务目前是语音AI中最热门的领域之一。然而,在某些市场中,构建一个听起来像人类并且反应没有明显延迟的产品比其他市场要困难得多——而大多数主要玩家并未考虑非洲和中东的需求。AethexAI是一家成立于去年以填补这一空白的初创公司,已经获得了由4DX Ventures主导的300万美元前种子融资,Enza Capital、Dorm Room Fund、Mojo Ventures和Stanford GSB 26 Fund也参与了投资。个人投资者包括斯坦福大学教职工、电信高管以及来自Anthropic的AI研究人员。该公司没有使用现有的编排工具如Vapi和LiveKit,而是从头开始构建了自己的小模型和编排层,以处理其目标市场中使用的英语、法语和阿拉伯语的地方方言——这一决定是由于在该地区运营的特殊要求。该公司还推出了其平台,供企业试用其技术并注册其服务,同时提供供开发者实验其模型的API和SDK。初创公司由Mariama Diallo和Ayooluwa Odemuyiwa共同创办。首席执行官Diallo曾在高盛工作,后来加入了获得YC支持的ModelML,担任产品和增长职位。首席技术官Odemuyiwa毕业于加州理工学院,曾在Meta工作,并在共同创办公司之前入读斯坦福商学院。这对组合希望为新兴市场构建一些东西,并开始寻找机会。全球各地的企业都在竞相采用AI工具来自动化其部分运营。不过,这并不总是能成功。创始人发现,在埃及,一家呼叫中心自动化了其电话的显著份额,但由于效果不佳而回退了系统。非洲的几家支持中心告诉他们,找到并雇佣能够在合适成本下自动化电话的工程师一直是个难题。"我们在该地区看到的自动化电话的延迟和抖动实在是不可接受。如果我们成为了编排者,我们可能不得不使用托管在该地区外部的大模型,从而导致更高的延迟。我们意识到,要使这一切正常运作,我们必须使用非常小的模型,并在每个步骤中降低延迟," Odemuyiwa在讲述公司构建自己模型和编排层的决定时对TechCrunch说道。部署其最新模型的AI实验室通常会花费数百万用于训练和数据获取。AethexAI找到了解决方案。它没有追求尽可能大的模型,而是决定小模型足以解决延迟问题的同时保持准确性,并开发了自己的Kora系列模型,参数范围从3亿到17亿。这是大型语言模型的一个小部分,而这正是重点。为了训练这些模型,初创公司使用了来自呼叫中心合作伙伴的匿名录音。它还向整个非洲的广播电台运送硬盘以收集更多音频数据。为了控制成本,它建立了一个大学生的贡献者网络来标注数据并发音当地名称。因此,该初创公司表示,它现在每天处理超过17,000通电话。在业务方面,该公司小心翼翼地引导那些对语音AI不熟悉的客户了解过程,提供现场演示和研讨会,帮助他们识别自动化的最佳用例。"我们总是告诉客户,我们目前不能为每个人做一切。我们很小。当我们开始与一家公司交谈时,我们要求他们选择最重要的一个用例作为起点," Diallo说。该初创公司乐于与各行各业合作,但目前,其用途的很大一部分涉及债务追讨、客户激活或KYC(了解你的客户)验证——银行和电信公司使用的标准身份检查流程。公司正聘请合同制的前线工程师来服务当地市场,并与电信服务商建立渠道合作,以处理语音AI电话的电话服务。它表示,即插即用的解决方案在这里显然行不通。4DX Ventures的联合创始人兼管理合伙人Walter Badoo认为,非洲和中东市场与大多数语音AI公司建立的市场根本不同。"非洲和中东的企业处理的呼叫量大约是其西方同行的三倍,因为语音仍然是客户互动的主导渠道,"他说。"现有系统是为具有高端GPU基础设施、标准英语和欧洲语言环境以及在美国和欧洲常见的企业工作流程的西方市场构建的。当企业需要处理方言、代码切换和非正式语音模式的系统,并且需要在现有电话基础设施和实际价格范围内运作时,这就造成了真正的差距。"换句话说,虽然像ElevenLabs和Deepgram这样的公司正在针对这些市场构建新的解决方案,但这并没有解决所有的需求。

赞助内容

NordVPN Next-gen Antivirus

本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。

请我喝杯咖啡