基于论文摘要的文本分类与关键词抽取挑战赛
欢迎

DataWhale (“Datawhale” 2023) 在 2023年暑期, 组织了三期 AI夏令营.
最后一期 AI 夏令营包含三个方向
- 机器学习
- 深度学习 (两个实践项目)
- 自然语言处理 (NLP) 方向 (https://challenge.xfyun.cn/topic/info?type=abstract-of-the-paper)
- 计算机视觉 (CV) 方向
- AI for science (https://mp.weixin.qq.com/s/nhyT5Ye_Iyxl4uUH_gOt9A)
- 生命科学赛道
- 大气科学赛道
本站是我的 深度学习 自然语言处理 (NLP) 的笔记.
资源
- 学习手册: https://linklearner.com/learn/brief/123
- 实践任务:《基于论文摘要的文本分类与关键词抽取挑战赛》
Planning
实践任务 本任务分为两个子任务:
- 从论文标题、摘要作者等信息,判断该论文是否属于医学领域的文献。
- 从论文标题、摘要作者等信息,提取出该论文关键词。
第一个任务看作是一个文本二分类任务。机器需要根据对论文摘要等信息的理解,将论文划分为医学领域的文献和非医学领域的文献两个类别之一。
第二个任务看作是一个文本关键词识别任务。机器需要从给定的论文中识别和提取出与论文内容相关的关键词。
时间安排如下
| 学习日期 | 学习内容 | 直播/打卡 |
|---|---|---|
| 8月15日 | 开营直播 | |
| 8月16日-18日 | 任务一: 3. 提交任务一打卡,查看个人成绩排行榜 |
第一轮作业提交截止时间
|
| 8月19日-22日 | 任务二:
|
第二轮作业提交截止时间
|
| 8月23日-25日 | 任务三:
|
第三轮作业提交截止时间
|