总部位于纽约的创业公司TheTake是NVIDIA Inception计划的成员,最近推出了一种新的基于深度学习的算法,该算法可以近乎实时地自动解码名人,运动员或其他公众人物在视频中所佩戴的内容。
“TheTake的使命很简单:制作媒体内容,”该公司的联合创始人兼首席技术官Jared Browarnik表示。 “我们使用的深度学习技术非常复杂 - 需要一系列机器学习模型协同工作才能完成任务。 只有充分利用NVIDIA GPU的强大功能,我们才能快速有效地培训和部署我们的模型。“
在亚马逊网络服务云上使用NVIDIA Tesla GPU,使用cuDNN加速的Caffe和TensorFlow深度学习框架以及混合精确FP16,该公司在他们自己的人工策划的电影和节目数据集中培训了数百万张图像的深度神经网络。

部署完成后,TheTake将在Amazon Web Services(AWS)云上的NVIDIA V100 GPU上运行其模型。
“我们在AWS上使用NVIDIA GPU进行推理,这比在CPU上运行的替代方案更具成本效益,”Browarnik说。 我们还需要支持需要近实时推理的用例,如果没有GPU上运行的速度,这几乎是不可能的。“

该系统的独特之处在于它可以集成到智能电视和卫星和有线电视提供商的机顶盒中,使数百万观众可以访问基于深度学习的系统。 该工具还可以添加到移动应用程序中。
目前,Take的数据库包含超过8000万个系统可识别的项目。
了解这个公司的项目,请访问:
https://thetake.ai