作者:lajallan608 | 来源:互联网 | 2023-05-17 12:50
本文主要介绍关于自然语言处理的知识点,对【doccano数据标注平台使用】和【用WORD文档写论文】有兴趣的朋友可以看下由【justdoitnow】投稿的技术文章,希望该技术和经验能帮到你解决你
本文主要介绍关于自然语言处理的知识点,对【doccano数据标注平台使用】和【用WORD文档写论文】有兴趣的朋友可以看下由【just do it now】投稿的技术文章,希望该技术和经验能帮到你解决你所遇的深度学习相关技术问题。
用WORD文档写论文
Step 1. 本地安装doccano
$ pip install doccano
Step 2. 初始化数据库和账户(用户名和密码可替换为自定义值)
$ doccano init
$ doccano createuser --username my_admin_name --password my_password
Step 3. 启动doccano
在一个窗口启动doccano的WebServer,保持窗口
$ doccano webserver --port 8000
在另一个窗口启动doccano的任务队列
$ doccano task
Step 4. 运行doccano来标注实体和关系
打开浏览器(推荐Chrome),在地址栏中输入http://0.0.0.0:8000/
后回车即得以下界面。
登陆账户。点击右上角的LOGIN
,输入Step 2中设置的用户名和密码登陆。
创建项目。点击左上角的CREATE
,跳转至以下界面。
勾选序列标注(
Sequence Labeling
)填写项目名称(
Project name
)等必要信息勾选允许实体重叠(
Allow overlapping entity
)、使用关系标注(
Use relation labeling
)创建完成后,项目首页视频提供了从数据导入到导出的七个步骤的详细说明。
设置标签。在Labels一栏点击Actions
,Create Label
手动设置或者Import Labels
从文件导入。
最上边Span表示实体标签,Relation表示关系标签,需要分别设置。
导入数据。在Datasets一栏点击Actions
、Import Dataset
从文件导入文本数据。
根据文件格式(File format)给出的示例,选择适合的格式导入自定义数据文件。导入成功后即跳转至数据列表。
标注数据。点击每条数据最右边的Annotate
按钮开始标记。标记页面右侧的标签类型(Label Types)开关可在实体标签和关系标签之间切换。
实体标注:直接用鼠标选取文本即可标注实体。关系标注:首先点击待标注的关系标签,接着依次点击相应的头尾实体可完成关系标注。
导出数据。在Datasets一栏点击Actions
、Export Dataset
导出已标注的数据。
ps:安装过程遇到的一些问题可以参照这个博客文本标注工具doccano安装及使用_夕由呀的博客-CSDN博客_doccano 数据库
本文《doccano数据标注平台使用》版权归just do it now所有,引用doccano数据标注平台使用需遵循CC 4.0 BY-SA版权协议。