MindNLP学习营

MindNLP第五期学习营作业

简述：文件夹按每节课进行分类，每节课会上传标注好的课件以及完成跑通的作业代码

1st

第一课作业.txt https://gitee.com/mindspore/community/issues/IB7HY9

2nd

课件：

《极简风的大模型微调实战-课件(标注版）》

原课件知识的基础上，利用大模型AI助手逐一对专业名词进行释义，并且利用大模型理解图示内容进行批注。

代码：

《IA3_sequence_classification.ipynb》根据mindnlp的ia3仓库中的标准答案《sequence_classification.ipynb》略加修改而来。原标准答案代码有一点问题：所有训练结果都会显示准确率为68%。通过提issue已经把问题解决，代码可以正常更新模型参数。该现象成因已经探明，写在CSDN博文中：

【昇思打卡营第五期(MindNLP特辑）第二课--RoBERTa-Large的IA3微调 - CSDN App】 https://blog.csdn.net/a1966565/article/details/144751602?sharetype=blog&shareId=144751602&sharerefer=APP&sharesource=a1966565&sharefrom=link

-adapter_config.json和adapter_model.ckpt是该代码运行后保存的模型参数，可以通过代码重新加载使用。

3rd

《数据并行（标注版）》

原课件知识的基础上，利用大模型AI助手逐一对专业名词进行释义，并且利用大模型理解图示内容进行注释。

代码

https://github.com/mindspore-lab/mindnlp/tree/master/examples/parallel/bert_imdb_finetune

训练过程及产生的诸多信息和文件，专门写了一篇博文来解释：

《昇思打卡营第五期(MindNLP特辑）第三课--基于MindNLP的数据并行训练-上：课程示例代码详解》 https://blog.csdn.net/a1966565/article/details/144991037?spm=1001.2014.3001.5501

上传文件说明：

完整文件如图。

由于optimizer.ckpt和model .safetensors文件太大而无法上传。

4th

《大模型Decoding+MindSpore+NLP分布式推理详解》标注版

原课件基础上，利用AI助手对于专业名词、图表和公式进行注释。方便需要更详细解释的同学们想学习。

generate_parameter.ipynb

课程提到的第一篇代码，展示了多种Decoding策略的代码和计算原理，并给出了一定的反馈值。

run_llama3.py

Llama3模型的非并行代码，尽量在足够大的显存环境下运行。

distributed文件夹内

《昇思打卡营第五期(MindNLP特辑）课程四：基于MindSpore NLP的LLM推理（decoding策略）-上：课程示例代码详解》

https://blog.csdn.net/a1966565/article/details/145110468?fromshare=blogdetail&sharetype=blogdetail&sharerId=145110468&sharerefer=PC&sharesource=a1966565&sharefrom=from_link

博文的主要内容在这个文件夹里

根据多种解码策略改动的llama3模型分布式运行代码，需要在msrun或者mpirun的方式下启动。

msrun is a MindSpore defined launcher for multi-process parallel execution, which can get best performance, you can use it by the command below:

msrun --worker_num=2 --local_worker_num=2 --master_port=8118 --join=True run_llama3_distributed.py if you use Ascend NPU with Kunpeng CPU, you should bind-core to get better performance

msrun --worker_num=2 --local_worker_num=2 --master_port=8118 --join=True --bind_core=True run_llama3_distributed.py

mpirun controls several aspects of program execution in Open MPI, you can use it by the command below:

mpirun -n 2 python run_llama3_distributed.py if you use Ascend NPU with Kunpeng CPU, you should bind-core to get better performance:

mpirun --bind-to numa -n 2 python run_llama3_distributed.py

enhanced文件夹内

《昇思打卡营第五期(MindNLP特辑）课程四：基于MindSpore NLP的LLM推理（decoding策略）-下：中文成语释义与解析挑战》

https://blog.csdn.net/a1966565/article/details/145119113?fromshare=blogdetail&sharetype=blogdetail&sharerId=145119113&sharerefer=PC&sharesource=a1966565&sharefrom=from_link

博文主要内容在这个文件夹

主要是中文成语释义与挑战的赛事代码baseline，在这个文件夹内，包含了使用QWEN2-7B-instruct、GLM4的API、transformer、vLLM来处理赛题的代码。

5th

《基于MindNLP的LLM应用开发实战(标注版）》

原课件基础上，利用AI助手对于专业名词、图表和公式进行注释。方便需要更详细解释的同学们想学习。

代码仓库

https://github.com/ResDream/MindTinyRAG

MindTinyRAG文件夹

从华为Modelarts实例中跑完的代码，保存了checkpoint，在notebook里面可以看到返回值用于学习从零构建的代码的处理方式。（自己花钱跑的T_T)

python app.py 可以构建gradio对话端口，跟这个知识库助手对话。不过要打开app.py完成一下准备工作，把反向代理文件放进系统文件夹里。

PAI-DSW环境文件夹

从阿里云PAI-DSW实例中跑完的代码，两者除了速度不同其实无甚差异，都挺好用的。这个实例我领了免费试用计算时，所以挺爽的。

写了两篇输出来分析代码：

《昇思打卡营第五期(MindNLP特辑）课程五：基于MindNLP的LLM应用开发实战：从零开始的RAG应用开发上：实例代码上MindTinyRAG.ipynb和返回值解析》

https://blog.csdn.net/a1966565/article/details/145163448?fromshare=blogdetail&sharetype=blogdetail&sharerId=145163448&sharerefer=PC&sharesource=a1966565&sharefrom=from_link

《昇思打卡营第五期(MindNLP特辑）课程五：基于MindNLP的LLM应用开发实战：从零开始的RAG应用开发中：Gradio脚本、测试脚本和返回值解析》

(https://blog.csdn.net/a1966565/article/details/145179121?fromshare=blogdetail&sharetype=blogdetail&sharerId=145179121&sharerefer=PC&sharesource=a1966565&sharefrom=from_link)

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
1st		1st
2nd		2nd
3rd		3rd
4th		4th
5th		5th
6th		6th
7th-exwork		7th-exwork
.gitattributes		.gitattributes
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MindNLP学习营

MindNLP第五期学习营作业

1st

2nd

课件：

代码：

3rd

《数据并行（标注版）》

代码

训练过程及产生的诸多信息和文件，专门写了一篇博文来解释：

4th

《大模型Decoding+MindSpore+NLP分布式推理详解》标注版

generate_parameter.ipynb

run_llama3.py

distributed文件夹内

enhanced文件夹内

5th

《基于MindNLP的LLM应用开发实战(标注版）》

代码仓库

MindTinyRAG文件夹

PAI-DSW环境文件夹

《昇思打卡营第五期(MindNLP特辑）课程五：基于MindNLP的LLM应用开发实战：从零开始的RAG应用开发上：实例代码上MindTinyRAG.ipynb和返回值解析》

《昇思打卡营第五期(MindNLP特辑）课程五：基于MindNLP的LLM应用开发实战：从零开始的RAG应用开发中：Gradio脚本、测试脚本和返回值解析》

About

Releases

Packages

Languages

License

B3DDD/MindNLP_workhub

Folders and files

Latest commit

History

Repository files navigation

MindNLP学习营

MindNLP第五期学习营作业

1st

2nd

课件：

代码：

3rd

《数据并行（标注版）》

代码

训练过程及产生的诸多信息和文件，专门写了一篇博文来解释：

4th

《大模型Decoding+MindSpore+NLP分布式推理详解》标注版

generate_parameter.ipynb

run_llama3.py

distributed文件夹内

enhanced文件夹内

5th

《基于MindNLP的LLM应用开发实战(标注版）》

代码仓库

MindTinyRAG文件夹

PAI-DSW环境文件夹

《昇思打卡营第五期(MindNLP特辑）课程五：基于MindNLP的LLM应用开发实战：从零开始的RAG应用开发 上：实例代码上MindTinyRAG.ipynb和返回值解析》

《昇思打卡营第五期(MindNLP特辑）课程五：基于MindNLP的LLM应用开发实战：从零开始的RAG应用开发 中：Gradio脚本、测试脚本和返回值解析》

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

《昇思打卡营第五期(MindNLP特辑）课程五：基于MindNLP的LLM应用开发实战：从零开始的RAG应用开发上：实例代码上MindTinyRAG.ipynb和返回值解析》

《昇思打卡营第五期(MindNLP特辑）课程五：基于MindNLP的LLM应用开发实战：从零开始的RAG应用开发中：Gradio脚本、测试脚本和返回值解析》

Packages