这个作业属于哪个课程 | https://edu.cnblogs.com/campus/gdgy/SoftwareEngineering2024 |
---|---|
这个作业要求在哪里 | https://edu.cnblogs.com/campus/gdgy/SoftwareEngineering2024/homework/13136 |
这个作业的目标 | 体验个人软件开发流程 |
1.Gitcode链接
2.PSP
Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
---|---|---|
计划 | 5 | 5 |
估计这个任务需要多少时间 | 410 | 410 |
开发 | 120 | 120 |
需求分析 (包括学习新技术) | 60 | 160 |
生成设计文档 | 30 | 20 |
设计复审 | 10 | 10 |
代码规范 (为目前的开发制定合适的规范) | 10 | 40 |
具体设计 | 20 | 10 |
具体编码 | 180 | 60 |
代码复审 | 20 | 10 |
测试(自我测试,修改代码,提交修改) | 60 | 77 |
报告 | 30 | 30 |
测试报告 | 10 | 30 |
计算工作量 | 10 | 20 |
事后总结, 并提出过程改进计划 | 30 | 10 |
合计 | 410 | 597 |
3.设计文档
- 文件输入输出模块
类:FileUtils
属性:InFilename1、InFilename2、OutFilename
方法:read、write
- SimHash算法模块
类: SimHash
属性: token、intSimHash、strSimHash、hashbits
方法: simHash:产生文本海明hash;clean:清除特殊字符;hash产生字符的hash;getDistance:计算海明距离;getSemblance:计算重复率
- CmdArgsUtils(main)模块
类:CmdArgsUtils
接受命令,打通接口
3.性能分析
调用次数最多的是com.hankcs.hanlp包提供的接口, 即分词、取关键词与计算词频花费了最多的时间。
4.单元测试
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。