744 字
4 分钟
ZJU ADS HW and Project
Introduction
一个(不完全的)作业回归+项目展示,隐去相关违反诚信守则内容,请勿抄袭,此外假设内容有误敬请在discussion刊误。
HW
Project
private 项目 (尚未公开)
Must-work
- Project-3 Recover the Design
- code 😍(zzw4257)
- test 😍(WangHX)
- report 😍(Valkqs)
- presentation
- bonus reference
- code 😍(zzw4257)
- Project-7 Skip Lists
- code 😍(Valkqs)
- report
- *presentation
- bonus reference
- Project-3 Recover the Design
Optional-work
Project-1Roll Your Own Mini Search Engine
Project-2 Shortest Path Algorithm with Heap 😍(WangHX)
- bonus reference
- code 😍(WangHX)
- report😍(zzw4257+WangHX)
Project-4 Red-black Tree 😍(zzw4257)
- idea : in
/idea/project4-ans.md
😍(zzw4257) - code 😍(zzw4257)
- report 😍(zzw4257)
- presentation
- idea : in
Project-5 Shopping With Coupons
Project-6 Texture Packing
Project-8 MapReduce
- bonus reference:
/reference/MapReduce
- bonus reference:
Project1(没做)
比较好的参考,虽然我觉得纯粹简单问题复杂化
项目背景
本项目旨在设计和实现一个高性能的文本倒排索引系统,以提升文本检索的效率。倒排索引是一种将词项映射到包含该词项的文档列表的数据结构,广泛应用于信息检索领域。
项目目标
- 处理数据集 :使用“莎士比亚全集”作为数据集进行实验。
- 词干提取 :实现词干提取功能,以解决词形变化带来的检索问题。
- 倒排索引 :创建一个包含词干提取的倒排索引,排除已识别的停用词。
- 查询程序 :编写一个查询程序,接受用户输入的词或短语,并返回包含该词的文档ID。
项目任务
- 词频统计 :对莎士比亚文集进行词频统计,并识别停用词。
- 倒排索引构建 :基于识别的词干和排除的停用词,构建倒排索引。
- 查询处理 :开发查询程序,实现用户查询词的检索功能。
- 性能测试 :进行测试,展示查询阈值对结果的影响。
评分政策
- 编程 :实现词频统计(1分)、索引生成(5分)和查询处理(3分)程序,并添加充分注释。
- 测试 :设计倒排索引正确性测试(2分)和查询阈值测试(2分),并编写分析和评论(3分)。额外加分项:考虑处理500,000个文件和4亿个不同词的情况(+2分)。
- 文档 :撰写第1章(1分)、第2章(2分)和完整的项目报告(1分)。
项目结构
- 第1章 简介 :介绍项目背景和词干提取模块。
- 第2章 数据结构和算法说明 :详细说明基于
std::map
的简单实现、自适应基数树(ART)等二叉搜索树的倒排索引设计、搜索引擎设计等。 - 第3章 性能测试与分析 :展示使用不同数据集的性能测试结果。
- 第4章 思考与展望 :讨论内存利用率优化、长键测试和ART树的应用前景。
Project2(code+report)
堆优化最短路
没任何好说的,斐波纳契堆看我的ADS的数据结构部分笔记
Project3(code+report+presentation)
回溯剪枝求解围栏恢复问题
整体两个
Final Review
ZJU ADS HW and Project
https://zzw4257.cn/posts/cs/ads-hw_pr/