项目信息
- 导师:段清华
- 实习生:苏尧
- 项目地址: https://github.com/deepdialog/juzi-bot
- 任务描述: https://github.com/juzibot/intern/issues/5
简介:juzibot(repo)是基于wechaty的信息管理机器人,包括信息收集、管理、搜索、标签分析全文搜索等功能, 目前已有Arxiv论文收集和下载、图片OCR识别、记录notes等功能,方便在微信群里将各种文件、笔记等收集, 更加方便记录和检索。
Proposal Video
项目详情
- 阶段列表
- 熟悉机器人功能开发流程;
- 开发数个额外功能模块;
- Image Caption效果优化、提供置信度等;
- 功能的开关控制,实现可定制的产品;
- 实现功能的自动化测试。
- 当前进度
- 完成中文关键词提取的算法优化和库的开发GitHub - deepdialog/ZhKeyBERT: Minimal keyword extraction with BERT
- 提供了OCR、keyword extraction、object detection等功能的web api OCR、keyword extraction、object detection
- 每个具体功作为独立的api后端,分派到各自的容器中,wechaty作为前端解析微信消息的各种属性和意图,再通过前后端的交互实现具体功能,有利于功能扩展、快速相应
- 为Juzi Bot添加了识别arxiv链接并保存相应pdf文件以及爬取论文题目、摘要等信息的功能,并做了关键词抽取
- 对含有文本的图片自动做OCR识别,对笔记、文本文件自动做中/英文关键词抽取
- 计划安排:
- 阶段一
- 完成时间:11月21日(已完成)
- 计划描述:通过OCR、arxiv论文获取等小功能对JuziBot的开发流程有个整体了解,详情见当前进度
- 阶段二
- 完成时间:11月28日
- 计划描述:研究关键词抽取、Image Captioning等NLP算法,将相应功能加入到机器人中
- 阶段三
- 完成时间:12月5日
- 计划描述:做到每种功能的开关控制,群管理员可自行调整,实现可扩展、可定制的产品
- 阶段三
- 完成时间:12月12日
- 计划描述:完成(部分)功能的自动化测试,考虑测试的形式并给出相应的测试代码
- 阶段一
联系方式
- Email:1092702101@qq.com
Author:@AquaIndigo