StarGLM Versions Save

StarWhisper:LLM for Astronomy

v0.2.0

7 months ago

1.通过数据集清洗再训练,缓解了先前版本经过Agent/工具学习训练后对原有知识的灾难性遗忘,并显著提升了数学推理、代码能力,可通过code interpreter解决一系列问题。

2.公布了现版本在CG-Eval评测上的结果,总排名达到第二,仅次于GPT-4,数学推理和天文能力接近或超过GPT 3.5 Turbo。

v0.1.3

8 months ago

1.通过Tool learning语料训练,提升了模型通过Agent进行工具规划调度与执行回复的能力。 2.公布了上一版本在CG-Eval评测上的结果,天文物理能力提升明显,数学推理计算得分高于文心一言。 注:需与sft和dpo权重合并使用

v0.1.2

9 months ago

通过修改训练方法、添加长文本回答语料、进行人工反馈强化学习等方法进行了优化: 1.很大程度解决了先前版本的灾难性遗忘问题 2.提高了模型基于知识库回复的质量与逻辑性。

v0.1.1

9 months ago

1.采用了新的训练方式,很大程度缓解了原微调模型的灾难性遗忘问题。 2.预计最近会在HF上发布模型与权重,以方便部署。 3.经过进一步SFT与RLHF的V2版本即将发布。

v0.1.0

10 months ago