👑 Easy-to-use and powerful NLP and LLM library with 🤗 Awesome model zoo, supporting wide-range of NLP tasks from research to industrial applications, including 🗂Text Classification, 🔍 Neural Search, ❓ Question Answering, ℹ️ Information Extraction, 📄 Document Intelligence, 💌 Sentiment Analysis etc.
很高兴地通知大家,飞桨大模型套件发布v2.8.0版本。这个版本中,我们深度优化套件的大模型精调对齐的能力,提升大模型套件在国产计算硬件训推能力,具体工作如下:
大模型精调对齐训推优化
基础框架升级
其他支持
问题修复
paddle.jit.dy2static.utils_helper
by @haohongxiang in https://github.com/PaddlePaddle/PaddleNLP/pull/7989
dtype
of initializing the model by @heavyrain-lzy in https://github.com/PaddlePaddle/PaddleNLP/pull/8199
Full Changelog: https://github.com/PaddlePaddle/PaddleNLP/compare/v2.7.2...v2.8.0
本版本做了一些小问题的修复
Full Changelog: https://github.com/PaddlePaddle/PaddleNLP/compare/v2.7.1...v2.7.2
本版本做了一些小问题的修复
Full Changelog: https://github.com/PaddlePaddle/PaddleNLP/compare/v2.7.0...v2.7.1
很高兴地通知大家,飞桨大模型套件发布v2.7.0版本。这个版本中,我们深入优化套件的大模型能力。从易用性、性能、到稳定性都有巨大提升。
总体而言,当前版本更新有以下亮点:
llm/run_pretrain.py
。moka-ai/m3e-base
检索模型BAAI/bge-small-zh-v1.5
检索模型paddlenlp.version.commit
在v2.6.1版本中,我们做了大量的bug修复,提高了LLM模型和相关组件的稳定性。除了bug修复以外,主要新增功能如下:
Full Changelog: https://github.com/PaddlePaddle/PaddleNLP/compare/v2.6.0...v2.6.1
我们很高兴宣布,PaddleNLP 2.6版本现已全新升级并正式发布!此次升级标志着我们正式迈入了大模型时代。在PaddleNLP 2.6版本中,我们推出了全新的飞桨大语言模型全流程工具链。这套工具链涵盖了预训练、精调、压缩、推理以及部署等环节,为用户提供了一个完整的端到端大模型解决方案。
我们的工具链全面支持LLaMA 1/2, BLOOM, ChatGLM 1/2, GLM, OPT等主流大模型。这使得用户可以在使用同一套工具的前提下,以低成本的方式尝试各种不同的大模型。
为了支持这套大模型工具链,我们进行了大量的底层和基础框架侧的升级:
这些升级都是为了让我们的用户能在大模型时代中更加轻松地进行模型的训练、优化和部署。我们期待你的试用,并期待你的反馈,让我们一起推进PaddleNLP的发展。在2.5版本到2.6版本中PaddleNLP有 40 位新增Contributors,感谢大家对PaddleNLP开源工作的支持!
Full Changelog: https://github.com/PaddlePaddle/PaddleNLP/compare/v2.5.2...v2.6.0
paddlenlp.transformers.activations
#4589PaddleNLP 2.5 正式版本全新升级来了!在PaddleNLP 2.5版本中我们发布了飞桨扩散模型工具箱PPDiffuers, 可以降低扩散模型的研究和使用成本。在产业应用侧我们发布了文档信息抽取UIE-X、统一文本分类UTC、统一情感分析UIE-Senta、无监督问答应用;为了降低端上部署难度,我们开源了最新ERNIE 3.0 Tiny v2 系列模型,同时提供了全量化和词表量化加持的端到端语义理解压缩方案。在基础框侧我们提供 PretrainedConfig 来统一预训练模型配置,同时 Trainer API、Prompt API、数据增强API 等框架API做了升级。在2.5正式发版中我们做了Huggingface生态联合相关工作,欢迎大家Huggingface体验PaddleNLP预训练模型效果。在2.4版本到2.5版本中PaddleNLP有 34 位新增Contributors,感谢大家对PaddleNLP开源工作的支持!下面是PaddleNLP 2.5 正式版本的发版内容介绍。
大火的AI绘画扩散模型来了 🔥
PPDiffusers是基于PaddlePaddle的扩散模型工具箱,提供多模态的扩散模型,希望助力开发者快速使用和开发文生图、文生视频、文生文相关扩散模型
发布基于ERNIE 3.0 Tiny模型的端上语义理解压缩方案,帮助开发者快速在边缘端设备部署预训练模型
Seq2SeqTrainer
支持 seq2seq 类型模型训练。#3352Memory Tracer
支持监控内存、显存 #4181model.generate()
接口调整,use_faster
参数调整为 use_fast
#4213PaddleNLP首次和Huggingface生态联合,支持所有Model和Tokenizer类支持直接从 Huggingface Hub下载和上传,开发者可以直接从Huggingface体验预训练模型效果
from_pretrained
支持直接从Huggingface Hub加载torch权重的模型from_pretrained_v2
不能load fp16模型的问题。#3902