is:issue is:open GLM-4-9B、GLM-4-9B-Chat、GLM-4-9B-Chat-HF、GLM-4-9B-Chat-1M、GLM-4-9B-Chat-1M-HF、GLM-4V-9B这几个模型的区别和应用场景是什么呢 #682

adminadminadminadminadminadminadmin · 2024-12-27T08:36:36Z

Feature request / 功能建议

请补充一下几个模型的区别和适用场景

Motivation / 动机

获取区别和使用场景

Your contribution / 您的贡献

.

zRzRzRzRzRzRzR · 2024-12-29T03:43:23Z

GLM-4-9B 是一个基座模型，不具备对话能力。
GLM-4-9B-Chat 是对话模型，具备工具调用，对话，指令跟随。适用transformers 4.44-4.46（后续版本未测试），支持vLLM（市面上主流的框架这个版本都支持）
GLM-4-9B-Chat-HF 适用于transformers 4.46以后，但是暂未适配vLLM，模型就是GLM-4-9B-Chat
GLM-4-9B-Chat-1M 是长文本模型，支持1M上下文，没有工具调用。GLM-4-9B-Chat 是128K上下文
GLM-4-9B-Chat-1M-HF同理。
GLM-4V-9B视觉理解模型，支持8K上下文，图像固定占用1600token，仅支持一张图像，不支持工具调用，主要完成VQA任务

zRzRzRzRzRzRzR self-assigned this Dec 28, 2024

THUDM deleted a comment Dec 28, 2024

zRzRzRzRzRzRzR closed this as completed Dec 30, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

is:issue is:open GLM-4-9B、GLM-4-9B-Chat、GLM-4-9B-Chat-HF、GLM-4-9B-Chat-1M、GLM-4-9B-Chat-1M-HF、GLM-4V-9B这几个模型的区别和应用场景是什么呢 #682

is:issue is:open GLM-4-9B、GLM-4-9B-Chat、GLM-4-9B-Chat-HF、GLM-4-9B-Chat-1M、GLM-4-9B-Chat-1M-HF、GLM-4V-9B这几个模型的区别和应用场景是什么呢 #682

adminadminadminadminadminadminadmin commented Dec 27, 2024

zRzRzRzRzRzRzR commented Dec 29, 2024 •

edited

Loading

is:issue is:open GLM-4-9B、GLM-4-9B-Chat、GLM-4-9B-Chat-HF、GLM-4-9B-Chat-1M、GLM-4-9B-Chat-1M-HF、GLM-4V-9B这几个模型的区别和应用场景是什么呢 #682

is:issue is:open GLM-4-9B、GLM-4-9B-Chat、GLM-4-9B-Chat-HF、GLM-4-9B-Chat-1M、GLM-4-9B-Chat-1M-HF、GLM-4V-9B这几个模型的区别和应用场景是什么呢 #682

Comments

adminadminadminadminadminadminadmin commented Dec 27, 2024

Feature request / 功能建议

Motivation / 动机

Your contribution / 您的贡献

zRzRzRzRzRzRzR commented Dec 29, 2024 • edited Loading

zRzRzRzRzRzRzR commented Dec 29, 2024 •

edited

Loading