以色列国防军的研发部门近日研究出了一种可以将视频自动转录成文本的方法,该方法有朝一日或可用于监控录像。

这项基于人工智能的技术能够读取和理解视频图像,并将其看到的内容翻译成文本。它可以实现图像与其他相关信息的相互参照,从而为录像提供更广泛的视角,如果发现需要特别注意的内容,它会发送紧急警报。

33岁的塞飞•科恩少校是以色列国防军运营数据和研究部门的主管,他在接受《以色列时报》采访时表示:“大部分情况下,士兵通过视频图像监视边界或任何其他活动时,可以精准地确定现场情况。”

他表示,监控人员观看视频时往往只能在某个时刻获取有限的信息。相比之下,软件可以一次查看大量图像,并将其中任何图像与其他可能相关的信息进行相互参照。

目前还无法确定这项仍处于原型阶段的技术最终是否会被纳入军队项目,用于开发产品。科恩说:“现在还为时尚早,目前我们仍在对这项技术进行优化。”

该软件结合了两种人工智能:卷积神经网络和循环神经网络。

科恩说:“我们将视频和图片输入卷积神经网络,并培训系统识别物体。然后我们再培训循环神经网络认识一系列物体,并将它看到的内容转化成文字。就像新生儿的大脑一样,我们向空白的系统输入数百万个视频图像。然后,这款软件能像大脑一样处理信息并输出文字。”

科恩称,举个例子,如果是人们穿着别有数字的衬衫奔跑的图像,输出的文本会认为他们正在参加竞赛或马拉松比赛。 “我们还耍了点小花招,展示了一张一条狗骑在自行车上的图像,这款软件也准确识别出来了。”

科恩说,我们还在解决一些问题。 “我们输入该技术的信息是基于民用图像和语言,并没有输入足够多的军用图像和语言,所以有时它可能无法准确识别。我们正在解决这个问题。“比如,该系统目前还无法区分狗和狼。

科恩的团队由来自以色列国防军Talpiot项目的10名士兵组成,这项计划为以色列国防军各部队的关键技术职位培训人才。科恩称,一名全职工作的士兵和一名兼职工作的士兵耗时三个月研发出了这一技术。

科恩称:“我们进行了实地考察,看看有哪些需求。然后我们列出了潜在项目清单,并继续开发技术。有一些项目成功了,还有一些不那么成功。我们的研发具有高风险。”

本文版权归《以色列时报》中文版所有,未经授权不得以任何形式转载或修改后转载部分或全部内容,违者必究。