StarGLM Versions Save

StarWhisper：LLM for Astronomy

7 months ago

1.通过数据集清洗再训练，缓解了先前版本经过Agent/工具学习训练后对原有知识的灾难性遗忘，并显著提升了数学推理、代码能力，可通过code interpreter解决一系列问题。

2.公布了现版本在CG-Eval评测上的结果，总排名达到第二，仅次于GPT-4，数学推理和天文能力接近或超过GPT 3.5 Turbo。

8 months ago

1.通过Tool learning语料训练，提升了模型通过Agent进行工具规划调度与执行回复的能力。 2.公布了上一版本在CG-Eval评测上的结果，天文物理能力提升明显，数学推理计算得分高于文心一言。 注：需与sft和dpo权重合并使用

9 months ago

通过修改训练方法、添加长文本回答语料、进行人工反馈强化学习等方法进行了优化: 1.很大程度解决了先前版本的灾难性遗忘问题 2.提高了模型基于知识库回复的质量与逻辑性。

9 months ago

1.采用了新的训练方式，很大程度缓解了原微调模型的灾难性遗忘问题。 2.预计最近会在HF上发布模型与权重，以方便部署。 3.经过进一步SFT与RLHF的V2版本即将发布。

10 months ago