# BELLE
**Repository Path**: umb/BELLE
## Basic Information
- **Project Name**: BELLE
- **Description**: No description available
- **Primary Language**: Python
- **License**: Apache-2.0
- **Default Branch**: chatbelle_app
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2023-12-24
- **Last Updated**: 2024-06-11
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
##
BELLE: Be Everyone's Large Language model Engine
*Read this in [English](README_en.md).*
## 最近更新
* [2023/04/12] 发布了[ChatBELLE App](chat/README.md),基于[llama.cpp](https://github.com/ggerganov/llama.cpp)和[Flutter](https://flutter.dev/),实现跨平台的BELLE-7B离线模型实时交互。
* [2023/04/11] 更新了一个人工精校的eval集合,大约一千多条
* [2023/04/08] [BELLE/10M](https://github.com/LianjiaTech/BELLE/tree/main/10M)中,新加40万条生成的给定角色的多轮对话[Generated Chat](https://huggingface.co/datasets/BelleGroup/generated_chat_0.4M),新加200万条生成多样化指令任务数据[train_2M_CN](https://huggingface.co/datasets/BelleGroup/train_2M_CN)。
* [2023/04/05] 提供了colab上面可运行的推理代码[Colab](https://colab.research.google.com/github/LianjiaTech/BELLE/blob/main/notebook/BELLE_INFER_COLAB.ipynb)
## 项目包含以下内容:
* 
* 详见[BELLE/train](https://github.com/LianjiaTech/BELLE/tree/main/train),尽可能简化的一个训练代码实现,支持finetune,lora,deepspeed
*  
* 详见[BELLE/1.5M](https://github.com/LianjiaTech/BELLE/tree/main/1.5M),参考[Stanford Alpaca](https://github.com/tatsu-lab/stanford_alpaca) 生成的中文数据集[1M](https://huggingface.co/datasets/BelleGroup/train_1M_CN) + [0.5M](https://huggingface.co/datasets/BelleGroup/train_0.5M_CN);
* 持续开放的数据集,详见[BELLE/10M](https://github.com/LianjiaTech/BELLE/tree/main/10M)
* 
* 详见[BELLE/eval](https://github.com/LianjiaTech/BELLE/tree/main/eval),一个1k+的测试集合,和对应打分prompt。包含多个类别,采用GPT-4或者ChatGPT打分。同时提供了一个打分的网页,方便针对单个case使用。欢迎大家通过PR提供更多的测试用例。
* 
* 基于BLOOMZ-7B1-mt优化后的模型:[BELLE-7B-0.2M](https://huggingface.co/BelleGroup/BELLE-7B-0.2M),[BELLE-7B-0.6M](https://huggingface.co/BelleGroup/BELLE-7B-0.6M),[BELLE-7B-1M](https://huggingface.co/BelleGroup/BELLE-7B-1M),[BELLE-7B-2M](https://huggingface.co/BelleGroup/BELLE-7B-2M)
* 基于[huggingface的LLaMA实例](https://huggingface.co/decapoda-research)实现调优的模型:[BELLE-LLAMA-7B-2M](https://huggingface.co/BelleGroup/BELLE-LLAMA-7B-2M),[BELLE-LLAMA-13B-2M](https://huggingface.co/BelleGroup/BELLE-LLAMA-13B-2M)。请注意,本项目不能保证其是原版的LLaMA模型,也不能保证调优后的模型和LLaMA原版模型之间的关系。请参考[Meta LLaMA的License](https://github.com/facebookresearch/llama/blob/main/LICENSE),目前仅供学习交流。请严遵守LLaMA的使用限制。强烈建议大家基于训练脚本和开放数据调优模型。
* 
* 详见[BELLE/gptq](https://github.com/LianjiaTech/BELLE/tree/main/gptq),参考gptq的实现,对本项目中相关模型进行了量化
* [](https://colab.research.google.com/github/LianjiaTech/BELLE/blob/main/notebook/BELLE_INFER_COLAB.ipynb) 提供了colab上面可运行的推理代码[Colab](https://colab.research.google.com/github/LianjiaTech/BELLE/blob/main/notebook/BELLE_INFER_COLAB.ipynb)
* 
* 详见[BELLE/chat](chat/README.md),基于[BELLE](https://github.com/LianjiaTech/BELLE)模型的跨平台离线大语言模型交谈App。使用量化后的离线端上模型配合Flutter,可在macOS(已支持)、Windows、Android、iOS等设备上运行。
**欢迎大家通过issue贡献更多的prompts!**