- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

大模型部署手记（2）baichuan2+Windows GPU

举报

张辉发表于 2023/10/03 05:24:26 2023/10/03

【摘要】大模型部署手记（2）baichuan2+Windows GPU

1.简介

组织机构：百川智能（前搜狗CEO王小川创立）

代码仓：https://github.com/baichuan-inc/Baichuan2

模型：baichuan-inc/Baichuan2-7B-Chat-4bits

下载：https://huggingface.co/baichuan-inc/Baichuan2-7B-Chat-4bits

镜像下载：https://aliendao.cn/models/baichuan-inc/Baichuan2-7B-Chat-4bits

硬件环境：暗影精灵7Plus

Windows版本：Windows 11家庭中文版 Insider Preview 22H2

内存 32G

GPU显卡：Nvidia GTX 3080 Laptop （16G）

参考资料：https://zhuanlan.zhihu.com/p/658999248

2.代码和模型下载

下载代码仓：

git clone https://github.com/baichuan-inc/Baichuan2.git

打开 https://huggingface.co/baichuan-inc/Baichuan2-7B-Chat-4bits 下载模型

并将其拷贝到 d:\Baichuan2\baichuan-inc\Baichuan2-7B-Chat-4bits 目录

3.安装依赖

创建conda环境

conda create -n baichuan2 python=3.10

conda activate baichuan2

cd Baichuan2

安装量化包：

pip install bitsandbytes --prefer-binary --extra-index-url=https://jllllll.github.io/bitsandbytes-windows-webui

安装Pytorch 2.0.1 for CUDA

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

安装加速包：

pip install xformers

将代码 cli_demo.py 改成4bit量化的模型：

d:

cd d:\Baichuan2

pip install -r requirements.txt

4.部署验证

运行命令行模式：

python cli_demo.py

做一些简单的交互：

修改web_demo.py文件：

运行网页模式：

python web_demo.py

这里好像哪里不对，但是系统提示可以使用streamlit运行：

streamlit run web_demo.py

系统自动打开浏览器：

做一些简单的交互：

（全文完，谢谢阅读）

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

评论（0）

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长