热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

百度网盘AI大赛:手写文字擦除(赛题二)Baseline

1.大赛背景百度网盘AI大赛——图像处理挑战赛是百度网盘开放平台面向AI开发者和爱好者发起的计算机视觉领域挑战赛。AI时代已到来,百度网盘与百度飞桨AIStudio

1.大赛背景

百度网盘AI大赛——图像处理挑战赛是 百度网盘开放平台 面向AI开发者和爱好者发起的计算机视觉领域挑战赛。AI时代已到来,百度网盘与百度飞桨AI Studio强强联合,旨在基于个人云存储的生态能力开放,通过比赛机制,鼓励选手结合当下前沿的计算机视觉技术与图像处理技术,完成模型设计搭建与训练优化,产出基于飞桨框架的开源模型方案,为中国开源生态建设贡献一份力量。

本次图像处理挑战赛以线上比赛的形式进行,参赛选手需要在规定时间内,完成模型设计搭建与训练优化,并提交基于评测数据集产出的结果文件,榜单排名靠前且通过代码复查的队伍可获得高额奖金。

百度网盘开放平台 致力于为全球AI开发者和爱好者提供专业、高效的AI学习与开发环境,挖掘培养AI人才,助力技术产业生态发展。我们向所有胸怀梦想的开发者发出邀请,希望大家能与百度一起,用技术让复杂的世界变得更简单。


2.数据集简介


比赛数据集

在本次比赛最新发布的数据集中,所有的图像数据均由真实场景采集得到,再通过技术手段进行相应处理,生成可用的脱敏数据集。该任务为image-to-image的形式,因此源数据和GT数据均以图片的形式来提供。各位选手可基于本次比赛最新发布的训练数据快速融入比赛,为达到更好的算法效果,本次比赛不限制大家使用额外的训练数据来优化模型。测试数据集的GT不做公开,请各位选手基于本次比赛最新发布的测试数据集提交对应的结果文件。
备注: 百度网盘坚持隐私红线,不会收集或者提供任何用户存储在百度网盘中的文件数据。


数据集构成

|- root |- images|- gts

本次比赛最新发布的数据集共包含训练集、A榜测试集、B榜测试集三个部分,其中训练集共1000个样本,A榜测试集共200个样本,B榜测试集共200个样本;
images 为带手写文字的源图像数据,gts 为无手写文字的真值数据(仅有训练集数据提供gts ,A榜测试集、B榜测试集数据均不提供gts);
images 与 gts 中的图片根据图片名称一一对应。


数据集下载

本次比赛将提供带有手写文字的文档图片作为比赛数据集。
其中,训练集1000张,A榜测试数据集共200张,B榜测试数据集共200张。


官网有训练集和测试集链接,但训练集只有原始图和GT图,作者在这儿做了一份粗略的MASK图以更好的适应模型的训练:下载路径



3.Baseline模型EraseNet介绍


Introduction


文字擦除的意义


  • 隐私保护
  • 有助于文字编辑

挑战


  • 定位文字内容
  • 合理填充前景
  • 背景保持原样

示例


Architecture


  • G network是一个由coarse和refinement组成的two-stage network
  • 作者设计了一个segmentation head,用来输出text mask,帮助模型更好的定位mask区域
  • 使用local-global SN-Patch-GAN去让GAN的训练过程更加稳定

Coarse-Erasure Sub-Network

该结构类似于UNet的FCN结构,其中在特征图叠加时采用下图的lateral concatenations的设计,这种设计保证了concat过程中feature map的非线性程度。


Refinement Sub-Network

该部分是Coarse Network的输出,该输出由于监督信号不足的原因导致图像中还包含部分文本信息,因此作者在加一个阶段去细化生成图像。


Segmentation Head

Segmentation Head作为辅助路径能够更好的为Coarse阶段隐式的定位文本位置。


Global and local discriminator

该结构通过全局和局部鉴别,保证了整体的一致性和局部的敏感性。


4.训练及测试


4.1 准备数据集

%cd /home/aistudio/data/
!unzip /home/aistudio/data/data121581/dehw_testA_dataset.zip
!unzip /home/aistudio/data/data121581/dehw_train_dataset.zip
!unzip /home/aistudio/data/data122013/mask.zip
%mv mask/ dehw_train_dataset/

解压数据集之后,数据集目录如下:

| dehw_testA_dataset/-images
| dehw_train_dataset/-gts-images-mask

其中mask 分支为手写文字的掩码,通过滤波算法生成的。


4.2 启动训练命令

%cd /home/aistudio/work/
!python train.py --dataset_root ../data/dehw_train_dataset/ --max_epochs 100 --batch_size 3 --sample_interval 100 --log_iters 100

4.3 启动测试命令

运行结束后,结果文件保存在train_result/model文件夹中,通过–pretrained选择训练模型的路径进行预测

!python test.py --dataset_root ../data/dehw_testA_dataset/ --pretrained model.pdparams

保存的文件在test_result路径中,进入该路径创建readme.txt文件,输入要求的内容:

训练框架:PaddlePaddle
代码运行环境:V100
是否使用GPU:是
单张图片耗时/s:0.06
模型大小:75MB
其他说明:该算法参考EraseNet

然后压缩所有文件

%cd test_result/
!zip -D result.zip ./*

4.4 提交结果

下载result.zip文件,页面提交后分数大概在0.56左右。


5.注

本项目在网络搭建上仍存在可优化空间,后续有改进思路会及时更新代码内容,期待与更多飞桨开发者交流学习,共同进步。


更多代码内容,可以关注公众号<九点澡堂子>并回复“手写文字擦除”获取,如有问题欢迎后台私信~



推荐阅读
  • 产业智能化升级的浪潮并没有因为疫情等原因停滞不前,作为带来人工智能应用井喷式发展的深度学习技术在近几年也可谓是“时代宠儿”,想要尝试应用深度学习技术解决 ... [详细]
  • 本文介绍了H5游戏性能优化和调试技巧,包括从问题表象出发进行优化、排除外部问题导致的卡顿、帧率设定、减少drawcall的方法、UI优化和图集渲染等八个理念。对于游戏程序员来说,解决游戏性能问题是一个关键的任务,本文提供了一些有用的参考价值。摘要长度为183字。 ... [详细]
  • 安装Tensorflow-GPU文档第一步:通过Anaconda安装python从这个链接https:www.anaconda.comdownload#window ... [详细]
  • ubantu系统下安装pytorch
    配置环境的步骤:1、下载anacondawgethttps:mirrors.tuna.tsinghua.edu.cnanacondaarchiveAnaconda3 ... [详细]
  • 世界人工智能大赛OCR赛题方案!
     Datawhale干货 作者:阿水,北京航空航天大学,Datawhale成员本文以世界人工智能创新大赛(AIWIN)手写体OCR识别竞赛为实践背景,给出了OCR实践的常见思路和流 ... [详细]
  • 人工智能技术越来越广泛的应用于各行各业,而这一切都离不开底层深度学习框架的支持。近日,百度深度学习P ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 本文介绍了PhysioNet网站提供的生理信号处理工具箱WFDB Toolbox for Matlab的安装和使用方法。通过下载并添加到Matlab路径中或直接在Matlab中输入相关内容,即可完成安装。该工具箱提供了一系列函数,可以方便地处理生理信号数据。详细的安装和使用方法可以参考本文内容。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 本文介绍了JavaScript进化到TypeScript的历史和背景,解释了TypeScript相对于JavaScript的优势和特点。作者分享了自己对TypeScript的观察和认识,并提到了在项目开发中使用TypeScript的好处。最后,作者表示对TypeScript进行尝试和探索的态度。 ... [详细]
  • 通过Anaconda安装tensorflow,并安装运行spyder编译器的完整教程
    本文提供了一个完整的教程,介绍了如何通过Anaconda安装tensorflow,并安装运行spyder编译器。文章详细介绍了安装Anaconda、创建tensorflow环境、安装GPU版本tensorflow、安装和运行Spyder编译器以及安装OpenCV等步骤。该教程适用于Windows 8操作系统,并提供了相关的网址供参考。通过本教程,读者可以轻松地安装和配置tensorflow环境,以及运行spyder编译器进行开发。 ... [详细]
  • 百度AI的2020
    百度AI的2020-世界的2020,是充满不确定性的变局之年;中国的2020,是团结一心、共克时艰、于变局中开新局的希望之年;百度AI的2020,是坚定信念,拥抱变化,践行“科技为 ... [详细]
  • 词表|句子_自然语言处理(NLP)基于序列到序列的中英机器翻译
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了自然语言处理(NLP)基于序列到序列的中-英机器翻译相关的知识,希望对你有一定的参考价值。【自然语言处理&#x ... [详细]
  • 本周AI热点回顾:和欧阳娜娜一起搞研发?强大的神经网络新算子involution,超越卷积、自注意力机制!...
    ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍点击左上方蓝字关注我们01我和欧阳娜娜一起搞研发AI新闻播报,开车明星导航,现如今根据文本生成语音的AI技术 ... [详细]
author-avatar
小景森的童年
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有