收集和梳理垂直领域的开源模型、数据集及评测基准。
自以ChatGPT为代表的大语言模型出现以后,掀起了新一轮研究和应用浪潮,出现了许多包括LLaMA、ChatGLM、Baichuan、Qwen等在内的通用模型。 随后,来自不同领域的从业人员在通用模型的基础上通过持续预训练/指令微调将其应用于垂直领域。
本项目旨在收集和梳理垂直领域的开源模型、数据集及评测基准。 欢迎大家贡献本项目未收录的开源模型、数据集、评测基准等内容,一起推动大模型赋能各行各业!
领域模型通常在通用模型的基础上进行持续预训练或指令微调得到,此处整理常用的开源通用模型。
模型 | 大小 | 机构 | 论文 |
---|---|---|---|
LLaMA2 | 7B/7B-Chat 13B/13B-Chat 70B/70B-Chat |
Meta | paper |
ChatGLM3-6B | 6B-Base/6B/6B-32K | 清华大学 | paper |
Qwen | 1.8B/1.8B-Chat 7B/7B-Chat 14B/14B-Chat 72B/72B-Chat |
阿里云 | paper |
Baichuan2 | 7B/7B-Chat 13B/13B-Chat |
百川智能 | paper |
InternLM | 7B/7B-Chat 20B/20B-Chat |
上海AI实验室 | paper |
BBT-FinCUGE-Applications [paper]
OpenBioMed [paper1] [paper2] [paper3]