- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

大模型部署手记（1）ChatGLM2+Windows GPU

举报

张辉发表于 2023/10/03 05:09:04 2023/10/03

【摘要】大模型部署手记（1）ChatGLM2+Windows GPU

1.简介：

组织机构：智谱/清华

代码仓：https://github.com/THUDM/ChatGLM2-6B

模型：THUDM/chatglm2-6b

下载：https://huggingface.co/THUDM/chatglm2-6b

镜像下载：https://aliendao.cn/models/THUDM/chatglm2-6b

硬件环境：暗影精灵7Plus

Windows版本：Windows 11家庭中文版 Insider Preview 22H2

内存 32G

GPU显卡：Nvidia GTX 3080 Laptop （16G）

torch推荐使用 2.0 及以上的版本，以获得最佳的推理性能 :

nvidia-smi

CUDA是12.2版本。

nvcc -V

nvcc显示CUDA 11.6版本。

查看Nvidia控制面板：

2.代码和模型下载：

下载代码仓：

git clone https://github.com/THUDM/ChatGLM2-6B

浏览器打开 https://huggingface.co/THUDMM/chatglm2-6b/tree/main，选择 Files and versions，将所有文件都下载下来：

或者换这个地址：

https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/?p=%2Fchatglm2-6b&mode=list

或者换这个地址：

https://aliendao.cn/models/THUDM/chatglm2-6b

可以切换到Linux，执行以下命令，从镜像下载模型：

cd /home1/zhanghui/aliendao

python3 model_download.py --mirror --repo_id THUDM/chatglm2-6b

实验表明镜像站下载大的模型文件大概率还是会出现下载卡住的情形。

将下载好的文件移动到 /home1/zhanghui/ChatGLM2-6B/THUDM/chatglm2-6b 目录下（gitattributes文件可以改名为 .gitattributes)

将前面从Linux上下载好的ChatGLM2-6b的模型文件传到 D:\ChatGLM2-6B 目录下：

3.安装依赖

进入Anaconda提示符界面：

conda create -n torch2.0 python=3.8

conda activate torch2.0

d:

cd ChatGLM2-6B

安装pip依赖：

pip install -r requirements.txt

4.部署验证

启动:

python web_demo.py

修改 web_demo.py，将模型路径改为文件路径：

重试：

python web_demo.py

查看 https://betheme.net/qianduan/121637.html

降级一下transformers试试：

pip install transformers==4.26.1 -i https://pypi.tuna.tsinghua.edu.cn/simple

重试：

python web_demo.py

这个torch安装的是一个非GPU的版本啊。

参考：https://pytorch.org/get-started/locally/

安装GPU版本的pytorch:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

重试：

python web_demo.py

错误还是一样的。

换种方法，使用conda方式安装pytorch 2.0.1 for CUDA 11.8版本：

conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

安装的是pytorch2.0.1+torchvision 0.15.2

重试：

python web_demo.py

pip install chardet

重试：

python web_demo.py

终于启动起来了。

浏览器打开 http://127.0.0.1:7860

感觉有点奇怪，回答怎么没有呢？

换成streamlit方式启动试试吧：

streamlit run web_demo2.py

根据提示，使用浏览器打开 http://127.0.0.1:8501/

问两个问题吧：

回答的时候，GPU情况如下：

可以接着问：

好了，你知道得太多了。该睡觉了。

（全文完，谢谢阅读）

【版权声明】本文为华为云社区用户原创内容，转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

评论（0）

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长