一颗卫星刚刚学会独立寻找目标——这意味着什么
这是第一次,一颗地球观测卫星独立找到它所寻找的目标—没有地面的人类分析师参与。这个里程碑事件发生在四月份,标志着在轨道上首次报告使用视觉语言模型,并提供了一个关于人工智能如何从根本上改变基于空间的传感器能力以及它们的价值的视角。通常,卫星会将大量数据下载给地面分析师,他们使用机器学习算法或自己的眼睛来分析情况。但是,在太空基础设施公司Loft Orbital制造的Yam-9航天器上,NASA喷气推进实验室开发的软件包能根据自然语言查询识别感兴趣的区域。推动这一演示的谷歌DeepMind的Gemma 3——视觉语言模型(VLM)是为边缘应用量身定制的,意味着它可以在远离数据中心的有限硬件上运行。VLM结合了大型语言模型的上下文理解能力和图像分析能力:研究人员要求该模型分类自然环境与人类发展交汇处的传感器数据,或识别铁路枢纽周围的基础设施——它都能做到。这项演示之所以重要有两个原因。首先,在短期内,它可以通过在轨道上进行初步数据筛选,使空间传感器变得更加有用,从而减少分析师需要逐一处理的原始数据洪流。长期而言,它是向在太空中运行更大规模人工智能基础设施的一个证明点。“这为宇宙中的始终在线巡逻层打开了大门,”Loft的AI负责人保罗·拉塞尔告诉TechCrunch。“如果你有一个VLM,你可以有逻辑,比如‘帮我监测这个边界,并在发现可疑情况时告诉我’,并与卫星进行双向互动。”Loft的航天器被设计为第三方客户的平台。它的商业模式更接近于基础设施即服务,而不是传统的卫星制造。最近的一笔交易中,它为EarthDaily建造、发射并运营六颗新卫星,后者将分析并营销航天器收集的数据。Yam-9于2025年秋季发射,作为该公司轨道人工智能项目的先行者,搭载了一块Nvidia Jetson Orrin AGX GPU,这是太空计算中使用的领先芯片之一。NASA JPL AI小组的技术负责人胡安·德尔法·维多利亚领导了NAVI-Orbital的开发,这是一个有效地为Gemma 3 VLM提供支持的软件包。虽然Gemma 3是现成的,但软件工程师需要简化软件包,以减少所需的库和内存。虽然这是首次在轨道上报告使用VLM,我们可以期待其他公司跟进。Planet Labs使用Jetson Orin处理器飞行卫星;目前,它将其用于简单的物体检测任务,但发言人表示正在进行其他人工智能应用的研究,包括VLM。经营太空中最大GPU组的Kepler Communications拒绝透露是否已经在太空中部署VLM,因与合作伙伴之间的保密协议,但表示自1月以来已出现了“我们计算环境的多个未披露的用例”。“现在我们已经证明了这个概念,这确实是未来的发展方向,”拉塞尔说。目标是建造出卫星星座,以确保地球上任何地方的实时覆盖,他表示这需要大约50到100颗像Yam-9这样的卫星。(Loft目前在轨道上运营12颗航天器。)在轨道上部署这些较小模型所获得的经验,将为公司尝试在空间中部署大规模计算基础设施提供参考,特别是在电力和内存管理等平凡但至关重要的领域。它们也可能为新的科学工具铺平道路。NAVI-Space的构想始于JPL研究员塔兰·西里亚克·约翰,他在思考为探索月球或火星的宇航员提供数字助手。“我们在想,好吧,你有穿着压力服的宇航员,你知道他们不能在键盘上敲打,任何他们想做的事情都是复杂的。”德尔法·维多利亚说。“那么,我们怎么提供一个助手,就像在视频游戏和电影中看到的那样,你会看到一个互动的人工智能?”只要别叫它HAL 9000。当您通过我们文章中的链接购买时,我们可能会赚取少量佣金。这不会影响我们的编辑独立性。蒂姆·费尔霍兹是一个写关于技术、金融和公共政策的记者。他密切关注私营航天产业的崛起,并且是《火箭亿万富翁:埃隆·马斯克、杰夫·贝索斯与新的太空竞赛》的作者。此之前,他曾担任全球商业新闻网站Quartz的高级记者十多年,并以政治记者的身份开始了他的职业生涯。他可以通过电子邮件tim.fernholz@techcrunch.com联系或验证外联信息,或通过加密方式联系。
本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。
☕请我喝杯咖啡