Oracle数据科学：动态影像中的人类行为侦测

作者：Android源代码 | 来源：互联网 | 2023-09-13 09:43

使用OracleOCIGPU计算平台，结合AIallinoneimageforDataScience系统实现动态

在《Oracle数据科学：图像识别与视频合成》当中，我们针对静态图像中的物体侦测进行了介绍。但在我们日常工作中，更多情况下是对动态视频中的物体进行侦测，比如之前说的隧道中的火灾告警、公共场所的人类行为侦测，看看是否有人需要帮助或者是否有可疑人物有制造危险的企图等等。

今天我们为大家介绍，基于Oracle公有云上AI all in one镜像配合GPU环境搭建动态影像人类行为侦测的例子。具体的效果如下，下面视频是来自Oracle OOW2019上Larry的演讲。我们通过AI算法对视频中的人物行为进行标记。通过视频大家可以看出，AI算法已经成功侦测到Larry的站立、行走以及讲话动作，该算法可以标记人类的几百种常规动作。您也可以按照kinetics或者AVA格式创建自己的动作训练数据集，然后在HPC上训练属于自己的专属模型。比如目前我正在完成的关于医疗机构当中在生物样本采集的过程中是否遵守相关的SOP，侦测采集者的采检动作是否按照该检体采集的标准流程来完成，当出现操作疏失的时候立即提醒操作者，较少采检者和受采者的暴露风险。

环境搭建：

1、在Oracle公有云OCI上选择带有GPU资源的数据中心，比如美国Ashburn数据中心的AD2，使用GPU shape，比如GPU3.1作为基础架构，使用Oracle提供的AI all in one for Data Science免费镜像作为操作系统安装介质。

2、该环境当中已经带有Python环境以及PyTorch等用于张量计算和GPU加速的开源机器学习库，所以直接部署您的动作检测项目即可。

3、在该项目当中，我们可以将现有的视频片段作为输入，然后输出如上面视频那样的标记人类动作之后的结果视频。也可以将摄像机获取的实时视频作为输入，然后在显示器上输出实时侦测结果。在OCI GPU3.1环境当中，对于1080p的视频可以做到每秒13-15帧的处理速度，可以实现对摄像机输入准实时侦测的效果，如果要求分辨率更高的输入和刷新率更高的输出，可以选择GPU3.2或者更高的配置。

4、关于远端计算功能的调用，在之前发布的《Oracle数据科学：图像识别与视频合成》中的视频合成部分，我们可以实现使用Zoom，Skype等视频会议软件摄像头中图像实时换脸的效果，但凭借笔记本电脑或者一般台式机上面GPU的算力很难满足要求，于是我们使用远端计算资源调用的技术来解决这个问题，在个人计算机上只通过摄像头采集实时的视频图像，然后将该视频流发送到远端的OCI的GPU计算资源上，OCI的远端计算资源完成视频合成之后，实时将处理好的视频发送到个人计算机的模拟摄像头上，这样对方看到的就是换脸之后的影像了。举个例子，在洛杉矶通过Zoom参与视频会议，利用位于弗吉尼亚州的Ashburn的数据中心当中的GPU虚拟机对影像做降低分辨率之后的表情迁移处理，并将结果返回到洛杉矶的个人电脑，一般会出现1到1.5秒的影像延迟，这么小的延迟很难被对方发现。

最近正与数据科学的PM紧密合作，期待在不久的将来发布的新版Oracle Data Science Service以及新一代的AI (All-in-One) GPU Image for Data Science中为大家提供更多、更强大的功能，期待您的关注，谢谢。

编辑：殷海英

推荐阅读

python
TensorFlow入门上

前置准备在阅读本文之前，请确定你已经了解了神经网络的基本结构以及前向传播、后向传播的基本原理，如果尚未了解，可以查看下文。神经网络初探chrer.com也可以直接在我博客阅读Te ... [详细]

蜡笔小新 2023-10-16 10:25:39
search
程度|也就是_论文精读：Neural Architecture Search without Training

篇首语：本文由编程笔记#小编为大家整理，主要介绍了论文精读：NeuralArchitectureSearchwithoutTraining相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-10-16 16:33:20
io
基于PgpoolII的PostgreSQL集群安装与配置教程

本文介绍了基于PgpoolII的PostgreSQL集群的安装与配置教程。Pgpool-II是一个位于PostgreSQL服务器和PostgreSQL数据库客户端之间的中间件，提供了连接池、复制、负载均衡、缓存、看门狗、限制链接等功能，可以用于搭建高可用的PostgreSQL集群。文章详细介绍了通过yum安装Pgpool-II的步骤，并提供了相关的官方参考地址。 ... [详细]

蜡笔小新 2023-12-14 19:10:25
python
学习SLAM的女生，很酷

本文介绍了学习SLAM的女生的故事，她们选择SLAM作为研究方向，面临各种学习挑战，但坚持不懈，最终获得成功。文章鼓励未来想走科研道路的女生勇敢追求自己的梦想，同时提到了一位正在英国攻读硕士学位的女生与SLAM结缘的经历。 ... [详细]

蜡笔小新 2023-12-14 17:55:18
int
技嘉秀高端B450主板：不再支持第七代APU，性价比高且兼容锐龙一代和二代

在台北电脑展上，技嘉展示了一款高端的B450主板，型号为“b450 aorus pro wi-fi”。该主板具有10+1相供电、散热片覆盖的供电区域和芯片组，以及两个m.2插槽和背部IO挡板。虽然不支持第七代APU bristol ridge，但它兼容锐龙一代和二代，且具有较高的性价比。该主板还配备了音频声卡、Wi-Fi无线网卡等功能，是一款性能出色且设计精良的主板。 ... [详细]

蜡笔小新 2023-12-11 13:00:04
get
Learning to Paint with Model-based Deep Reinforcement Learning

本文介绍了一种基于模型的深度强化学习方法，通过结合神经渲染器，教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等，以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战，包括绘制纹理丰富的图像等。通过对比实验的结果，作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ... [详细]

蜡笔小新 2023-12-11 10:27:44
python
读手语图像识别论文笔记2

文章目录一、前言二、笔记1.名词解释2.流程分析上一篇快速门:读手语图像识别论文笔记1（手语识别背景和方法）一、前言一句：“做完了&#x ... [详细]

蜡笔小新 2023-10-17 20:45:15
int
Linux 内核 4.17-rc1 发布，关闭了合并窗口

LinusTorvalds发布了 Linux4.17-rc1，关闭了合并窗口。Linux4.17的主 ... [详细]

蜡笔小新 2023-10-16 20:41:28
python
「爆干7天7夜」入门AI人工智能学习路线一条龙，真的不能再透彻了

前言应广大粉丝要求，今天迪迦来和大家讲解一下如何去入门人工智能，也算是迪迦对自己学习人工智能这么多年的一个总结吧，本条学习路线并不会那么 ... [详细]

蜡笔小新 2023-10-16 12:17:31
io
鄂维南：从数学角度，理解机器学习的「黑魔法」，并应用于更广泛的科学问题...

作者|Hertz来源|科学智能AISI北京时间2022年7月8日晚上22:30，鄂维南院士在2022年的国际数学家大会上作一小时大会报告(plenarytalk)。今 ... [详细]

蜡笔小新 2023-10-15 23:41:17
python
分享篇：第十届“泰迪杯”数据挖掘挑战赛农田害虫图像识别（特等奖）一

1.1赛题背景昆虫的种类浩如烟海，农田常见的昆虫是人工生态系统的重要组成部分。分辨益虫和害虫，保留益虫，消灭害虫，对于减轻害 ... [详细]

蜡笔小新 2023-10-15 19:37:42
python
开源真香离线识别率高 Python 人脸识别系统

本文主要介绍关于python,人工智能,计算机视觉的知识点，对【开源真香离线识别率高Python人脸识别系统】和【】有兴趣的朋友可以看下由【000X000】投稿的技术文章，希望该技术和经验能帮到 ... [详细]

蜡笔小新 2023-10-14 15:43:38
python
【观察】中国产业AI化的破局之路：加速算力释放与生态合作共赢

申耀的科技观察读懂科技，赢取未来！电影《斗士》中，有这么一句台词令人印象深刻：“知道路要怎么走，和走上这条路& ... [详细]

蜡笔小新 2023-10-14 15:32:28
python
数仓面试，数据分析中异常值检测算法？

这一节来讲下关于数据分析中，异常数据识别的几种算法：k-m ... [详细]

蜡笔小新 2023-10-14 12:45:30
python
脑机接口和卷积神经网络的初学指南(一)

脑机接口和卷积神经网络的初学指南(一) ... [详细]

蜡笔小新 2023-10-13 11:11:52

Android源代码

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章