基于论文摘要的文本分类与关键词抽取挑战赛

Author

Antoine

Published

August 31, 2023

欢迎

DataWhale (“Datawhale” 2023) 在 2023年暑期, 组织了三期 AI夏令营.

最后一期 AI 夏令营包含三个方向

本站是我的 深度学习 自然语言处理 (NLP) 的笔记.

资源

Planning

实践任务 本任务分为两个子任务:

  1. 从论文标题、摘要作者等信息,判断该论文是否属于医学领域的文献。
  2. 从论文标题、摘要作者等信息,提取出该论文关键词。

第一个任务看作是一个文本二分类任务。机器需要根据对论文摘要等信息的理解,将论文划分为医学领域的文献和非医学领域的文献两个类别之一。

第二个任务看作是一个文本关键词识别任务。机器需要从给定的论文中识别和提取出与论文内容相关的关键词。

时间安排如下

学习日期 学习内容 直播/打卡
8月15日 开营直播
8月16日-18日

任务一:

1. 阅读赛题信息,理解赛题解题思路

2. 跑通机器方法Baseline,获得自己的成绩

3. 提交任务一打卡,查看个人成绩排行榜

第一轮作业提交截止时间

⏰8月18日 23:30

8月19日-22日

任务二:

  1.  阅读深度学习Baseline章节
  2. 提交任务二打卡,查看个人成绩排行榜

第二轮作业提交截止时间

⏰8月22日 23:30

8月23日-25日

任务三:

  1. 跑通大模型方法Topline,获得自己的成绩
  2. 提交任务三打卡,查看个人成绩排行榜

第三轮作业提交截止时间

⏰8月25日 23:30