CNET科技行者 10月8日 北京消息: 围绕着人工智能和机器学习出现在我们生活方方面面的话题中,而这里面就有一个来自俄罗斯莫斯科PRISMA实验室的小型产品开发团队,用这些各种各样的算法拯救了垂死的照片编辑软件行业,并且采用了一种让我们非常惊讶的方式。
照片编辑应用程序Prisma现在也已经进入了安卓市场,成为今年夏天紧随Pokemon Go之后最受欢迎的应用程序。这款具有革命性的艺术滤镜应用程序可以从头开始制作照片,利用艺术家非常受欢迎的作品,如Edvard Munch的《The Scream》,Roy Lichtenstein的《Go for Baroque》以及很多标志性的艺术效果,并且加上毕加索、梵高的手法,把你的照片变成超现实的艺术品。
该应用程序混合使用了神经网络、人工智能和基于云的机器学习来实现一系列过滤效果,模仿艺术家的风格完成你的图像。目前该应用在iOS平台上的下载量已经超过了10M,登陆安卓平台几个小时之后,下载量就达到了40000次。公司首席执行官兼联合创始人Alexey Moiseenkov表示,这些令人惊叹的照片的秘诀在于,每张照片都是从头开始创建,并且表示一旦照片被采纳,就会完成操作并给出一张新的艺术照片,而且服务不会存储任何内容。
而且他还补充表示,“今天,我们在服务器上有三个类似神经网络。每一个完成不同的任务。它以从艺术品中提取的风格之类的东西为基础,将其应用于照片,并且使用一些技巧来加快这个流程。”他还说,Prisma的艺术滤镜和Instagram之类的滤镜实际上是不同的,而是在空白的画布上生成图像——使用了两个数据输入以生成最终的图像。
由于滤镜的数量有望增加到40个,并在战略上采用了以移动为中心的方式,该公司可能是硅谷所有权贵们目光注视的焦点。Moiseenkov还表示,他们的产品的处理技术对于处理移动视频场景依然足够快。
由于Prisma已经传播开来,有些人抱怨说,该应用程序可能会贬低真正的艺术家的作品,并夺走用手工制作艺术品——而不是用智能手机在几秒钟之内生成画作——的画家的工作。
但是目前,该应用仍然非常受欢迎,而且Moiseenkov表示,他预计其用户群将继续快速增长。Moiseenkov的背景是计算机科学,他本人不是艺术家。但他说他长大后喜爱绘画,而他最喜欢的艺术家是丹麦-法国印象派的Camille Pissarro。
据透露,开发人员们正在致力于将其过滤技术扩展到视频,用一种前所未有的复杂方式进行创新。这位联合创始人表示,他还没有做好准备透露视频功能何时将出现,或者它具体有什么样的功能,但是他表示,他估计这一功能将非常受欢迎,并且也希望最终将这种技术扩展到虚拟现实。
这是其一。
下一步计划——进军B2B领域
近期,这家创业企业将焦点转移到B2B领域,为开发人员构建工具,利用其使用神经网络和深度学习技术的专业知识,为移动设备提供视觉效果。后来还推出了一个新的网站,Prismalabs.ai,详细介绍了这款新产品。
Prisma的联合创始人表示,他们最初打算为希望给自己的应用程序增加风格转换和自拍镜头等效果的开发人员提供一个SDK——就像他们发布的那款API一样。
同时,他们也计划为希望将代码移植到移动端的开发者提供另一种服务。毕竟,这是该团队共同创始人们最初提出的关于Prisma应用程序的想法——在桌面计算机上实现一种风格转换(缓慢的)效果,并且意识到如果它可以以近乎实时的速度在手机上工作,能够有多么巨大的潜力。
Moiseenkov在谈到Prisma实验室接下来的工作时表示:“当你有一个想法并想付诸实施的时候,例如,风格转换或对象识别或者是类似于面罩之类的什么东西……又或者是图片分享镜头,第一个计划已经准备好了解决方案。”他表示,“如果你需要这种能力,我们可以为你提供SDK,你可以在你的应用程序中使用它。”
联合创始人Aram Airapetyan举了一个例子来说明他们的人工智能图像分割技术可以如何用于——比如说Skype的用户在视频通话期间按下按钮来更改或删除背景。(这并不一定会发生。)
Moiseenkov认为,更强大的硬件和来自移动平台的积极鼓励推动了增强现实在智能手机上的发展浪潮,这可能会推动对Prisma效果的需求增长,他们能够通过API或SDK提供对象跟踪以及面部跟踪。
他继续表示,“B2B产品的第二原因是因为我们觉得在许多公司中,开发人员正在努力地将技术移植到移动领域。”他表示,“而且我们认为我们可以为他们提供我们自己内部使用的解决方案 ——我们在内部有……一个平台,它可以帮助我们实验我们的研究和生产的大量演示应用程序,供内部使用以及挑选适当的应用。”
他们表示他们已经通过“一些非常大的公司”来测试开发人员工具,但是没有透露具体有哪些大公司。Moiseenkov补充表示:“我们想要探索计算机视觉(CV)领域,并帮助企业利用人工智能提供更伟大的用户体验,帮助人们更轻松地沟通,完成他们的任务。”
“我们觉得人工智能可以帮助很多公司极大地改善用户体验。相机,利用图像工作,过滤,去噪,很多不同的事情都可能会发生——这很酷。我觉得它可以提高App Store和Google Play中应用程序的整体质量。”
上个夏天,能够拍摄出美术作品的Prisma的消费者应用程序非常流行,为智能手机用户提供了将标准智能手机照片轻松快捷地变成不同图形风格的转换能力,以创建一个模仿特定艺术作品或者图形效果的图片。该应用程序的效果并不是通过对照片使用滤镜,而是通过利用神经网络和深度学习来处理原始照片并将其转化为所选的样式——结合两个输入源生成新的图像。
截至目前,Prisma吸引了像Facebook这样的平台巨头的关注,这些巨头们也很快推出了自己的风格转移功能——希望能够阻止这个应用程序的发展势头。然后,该团队尝试在风格转换工具中添加社交元素,看看他们是否可以将Prisma转化为社交平台——但是,由于Facebook和微信等巨头在消费者社交/消息领域的主导地位,这个希望看起来非常渺茫。
对于Prisma来说,进军B2B的做法看起来是更为可靠的战略步骤,将该团队定位成为开发人员提供加速打磨他们应用程序功能集/UX的方法,销售这些借助人工智能的视觉效果专业知识的B2B服务。
所以虽然Prisma正在改变其获利策略(它表示,有可能是基于使用的视觉效果SDK;也有可能是针对平台的授权模式),它的消费者应用程序并不会消失。事实上,他们现在的测试地点和展厅都扩大了一倍,用于展示他们的技术能够为其他开发人员做什么。
Moiseenkov表示,“自今年年初以来,我们一直在考虑探索如何才能有效赚钱的机会,我们决定去帮助企业在更多面向消费者的应用上使用计算机视觉或人工智能。”
“我们专注于效果;手机摄像头的视频效果……我们觉得对于像我们这样的公司来说,这是一个非常丰饶的区域。而且我们也感觉到,随着我们的应用程序进入市场,我们可以与不同的技术进行实验,而这种匹配对赚钱来说非常有用。”
Airapetyan补充表示:“我们有一个非常强大的研发团队。” 他表示,“我们有很多人正在研究和调查我们可以为不同的技术和基于人工智能的产品做什么,所以我们这段时间一直在研究这些技术。”
该团队于7月份推出了第二个消费者应用程序:一个名为Sticky的贴纸制作软件,它使用人工智能算法来快速切割自拍照,因此可以轻松地将它们变成彩色贴纸。
他们表示,这两个应用程序目前都有500万至1000万 MAU(月活跃用户)以及大约50万 DAU (日活跃用户)——Airapetyan对用户群的描述是“非常稳定”。
Prisma自己的团队大约有25人左右,分布在湾区和莫斯科的办公室。不过他们表示该团队也在考虑在中国设立一个办公室——因为看到在这样一个大型的应用程序生态系统中销售人工智能相关服务的“巨大”潜力。
该团队以前已经获得了种子资金,尽管它从未透露过具体金额。Crunchbase表示,其种子投资者包括 Gagarin Capital Partners、Haxus和Nikolai Oreshkin。(值得注意的是,Haxus也是谷歌最近收购的计算机视觉应用程序Fabby的投资者。)
Moiseenkov表示,Prisma自从去年年底以来没有获得任何资金,目前也并不希望募集资金——他补充表示,他们希望先看看这次B2B的尝试效果如何。
在B2B领域的计算机视觉/人工智能工具的竞争中,他指出亚洲的几家大公司提供了类似的服务,例如Face++。他还将Clarifai列为提供图像识别的另一竞争对手,同样是竞争对手的还有谷歌的图像处理API——不过他声称和Prisma 的计划相比,谷歌不会为开发人员提供太多选择。
Airapetyan补充表示:“我们正在致力于非常非常广泛的基于人工智能的技术。”
好文章,需要你的鼓励