GPU: A800 80G * 8 CUDA 12.4
Python 3.11.10
依赖包见 requirements.txt,主要功能的包需完整且功能一致
- Yi-1.5-34B-Chat-16K
- Qwen2.5-72B-Instruct
- Qwen2-72B-Instruct
下载好后更改infer_zero_shot_reason.py
里面的MODEL_PATH
变量为模型的路径
在cicc
目录下运行bash run.sh
,运行结束后会在data
目录下生成数据文件:
test_data_Qwen2___5-72B-Instruct_analysis.json
test_data_Qwen2-72B-Instruct_analysis.json
test_data_Yi-1___5-34B-Chat-16K_analysis.json
train_data_Qwen2___5-72B-Instruct_analysis.json
train_data_Qwen2-72B-Instruct_analysis.json
train_data_Yi-1___5-34B-Chat-16K_analysis.json
val_data_Qwen2___5-72B-Instruct_analysis.json
val_data_Qwen2-72B-Instruct_analysis.json
val_data_Yi-1___5-34B-Chat-16K_analysis.json
下载预训练ERNIE权重:ernie-3.0-xbase-zh
更改config/CICC_ernie.yaml
内部文件夹的路径:
data_path:
data_dir: "{cicc文件夹的绝对路径}"
model_path:
pretrained_model_dir: "{ERNIE权重的绝对路径(不包括ERNIE本身文件夹)}"
在cicc/Pytorch-template-main
目录下运行bash runsh/run_template_ernie.sh
进行模型训练
更改config/CICC_textcnn.yaml
内部文件夹的路径:
data_path:
data_dir: "{cicc文件夹的绝对路径}"
model_path:
pretrained_model_dir: "{ERNIE权重的绝对路径(不包括ERNIE本身文件夹)}"
在cicc/Pytorch-template-main
目录下运行bash runsh/run_template_textcnn.sh
进行模型训练
运行结束后生成的模型权重文件在cicc/Pytorch-template-main/save_models
的运行时间戳的文件夹中
(目前训练好的权重文件已经保存在该文件夹中)
更改config/CICC_ernie_qwen25_test.yaml
内部文件夹的路径:
data_path:
data_dir: "{cicc文件夹的绝对路径}"
model_path:
pretrained_model_dir: "{ERNIE权重的绝对路径(不包括ERNIE本身文件夹)}"
更改config/CICC_ernie_qwen2_test.yaml
内部文件夹的路径:
data_path:
data_dir: "{cicc文件夹的绝对路径}"
model_path:
pretrained_model_dir: "{ERNIE权重的绝对路径(不包括ERNIE本身文件夹)}"
更改config/CICC_ernie_yi_test.yaml
内部文件夹的路径:
data_path:
data_dir: "{cicc文件夹的绝对路径}"
model_path:
pretrained_model_dir: "{ERNIE权重的绝对路径(不包括ERNIE本身文件夹)}"
更改config/CICC_textcnn_qwen2_test.yaml
内部文件夹的路径:
data_path:
data_dir: "{cicc文件夹的绝对路径}"
model_path:
pretrained_model_dir: "{ERNIE权重的绝对路径(不包括ERNIE本身文件夹)}"
更改config/CICC_textcnn_qwen25_test.yaml
内部文件夹的路径:
data_path:
data_dir: "{cicc文件夹的绝对路径}"
model_path:
pretrained_model_dir: "{ERNIE权重的绝对路径(不包括ERNIE本身文件夹)}"
在cicc/Pytorch-template-main
目录下运行bash runsh/eval.sh
进行模型推理
会在result
文件夹下生成csv文件:
val_data_*.csv
test_data_*.csv
(目前生成好的csv文件已经保存在该文件夹中)
在cicc
目录下运行python merge.py
进行模型集成,会在cicc
目录下生成test_label.json
文件,即为最终结果
(目前生成好的test_label.json
文件已经保存在此位置)