不是愚人节玩笑,微软推出真实世界“搜索”技术

是不是很鹅妹子嘤?

让真实世界像数字世界一样,可索引、可搜索、可查询、可编程和可交互(有点像IFTTT 的逻辑),正是微软正在做的事情。今天在西雅图举行的 Build 2017 开发者大会上,该公司 CEO 萨提亚·纳德拉宣布了一项名为 AI for Workspace Safety 的新技术,旨在帮助企业客户更好地对工作环境,特别是那些高安全级别、高危险的工作环境、资产和人员进行管理。

AI for Workplace Safety 目前仍处于早期测试阶段。它的核心是微软的认知服务 (Cognitive Services),以计算机视觉为主。微软在 Build 上展示了一个建筑行业的场景:

Microsoft Build 2017

通过调取微软的认知服务-计算机视觉 API,工地现场的摄像头每秒可以进行 2700 万次扫描,识别环境中的 1)记录在册的建筑工具 2)记录未记录在册的人员。识别结果将会是可搜索的,微软的演示者在一个 demo 聊天软件里输入“凿岩机(jackhammer)在哪里?”系统立刻回复她“在地上”(下图)。

170510134126

过了一会,系统又发现了操作员使用完凿岩机后没有正确地将机器放到原处,于是发出了报警,告知了具体操作人员:

20170510134131

微软还展示了怎样通过简单的对话界面去管理员工权限:一名未授权人员进入了房间,摄像头通过人脸识别发现了这一情况,立刻记录了数十张照片,向监工发出报警。查看照片后,监工确认她是今天刚加入团队的新工人,通过一个对话框,很快就完成了新员工的信息录入和权限部署:“设定 Alice 为只可以使用本房间内的工具”

microsoft-workplace-artificial-intelligence-640x0

在另一个场景里,一位叉车司机在操作叉车时不小心推倒了一个液体罐,导致液体泄漏,但因为现场噪音和气味复杂而没有发现。系统在扫描画面时发现了这个异样,立刻向监工发出警报,问题很快被解决,避免了进一步的污染情况出现。

在西方国家,绝大部分建筑工地都会安装摄像头。过去,摄像头的画面会连接到工地的管理处;现在,很多摄像头都联网了,让更先进的建筑公司可以远程管理工地的情况。微软的这项技术建立在这一基础上,但实现这些从未见过功能的,其实是微软的后端人工智能,结合了计算机视觉和微软的云端软件堆栈 AzureStack。你可以理解为,认知服务就是新的爬虫,让现实世界中的物体可以被索引、搜索和交互。

微软认知服务最早出现在两年前。当时微软在自己的服务器里部署了一些训练好的人工智能 API,提供给任何第三方开发者使用。如果你对那个曾经很火的猜年龄应用 How-Old.Net 有印象,它其实就是微软为了推广认知服务,利用其中的人脸识别 API 开发的一个应用场景。到目前,认知服务已经涵盖了计算机视觉、语音识别、语音处理、知识结构和搜索5 个领域共 29 个 API——如果任何人想开发带有人工智能功能的应用、服务,那么认知服务可以说是最适合被拿来搭建的“积木”,人工智能界的“乐高”。

去年年底,微软整合了一些产品部门和团队以及微软研究院,成立了新的“人工智能和微软研究事业部”,由微软研究院创始成员,该公司全球执行副总裁沈向洋博士领导。今年一月,在接受PingWest品玩专访时,沈向洋透露新事业部有一个(很激进的)小目标:3-5 年内实现每年贡献一百亿美元收入。从 AI for Workplace Safety 来看,只用不到半年的时间,微软已经用现有人工智能技术找到了赚钱的市场——企业级市场,或者更具体一点,工业。