FT-Data-Ranker-1B-No.8

FT-Data-Ranker 1B赛道第 8 名方案

核心思路

在 token 有限的情况下，句子越长且句子质量越高，喂进模型的训练效果越好。

训练流程

产生训练数据集

python ./data-juicer/tools/process_data.py --config ./juice_data_1119-2/alpaca-cot-en-refine.yaml

python ./lm-training/get_train_dataset_1b.py

训练模型

bash ./lm-training/train_scripts/deepspeed_train_1b.sh \
    ./models/falcon-rw-1b \
    ./juice_data_1119-2/train_data_en.jsonl \
    ./res_1b_1119-2

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
data-juicer		data-juicer
juice_data_1119-2		juice_data_1119-2
lm-training		lm-training
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

FT-Data-Ranker-1B-No.8

核心思路

训练流程

About

Releases

Packages

Languages

License

amulil/FT-Data-Ranker-1B-No.8

Folders and files

Latest commit

History

Repository files navigation

FT-Data-Ranker-1B-No.8

核心思路

训练流程

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages