自从ChatGpt爆火以来,各种大模型横空出世,让人眼花缭乱,也让nlp真正走进了大众视野,这其实也是好事,技术出圈才会加速落地。对企业来说可能意味着新的工作模式,经营模式的诞生,无论是对线上还是线下,人工智能所带来的商业想象空间还是挺大的。

最近因为要本地部署做个体验,就下载了最近比较火的两个国产模型ChatGLM-6B和MOSS,由于我的3090小破卡内存有限,所以只能下载MOSS的int4模型。

不同的模型都有自己擅长的和不擅长的地方,因为我的应用主要是偏商业,所以我的测试会偏重广告,营销等方向。而聊天,对话,写诗之类的我用不到,所以就不测试了,如果有这方面需要的可以自行测试下。

1、安装:

ChatGlm-6B:

MOSS:

在参数和显存占用方面 moss也是领先的,两个安装都比较简单,尤其是MOSS对新手比较友好一些。

这里因为ChatGlm-6B的安装方式不是很详细,我就补充下,给新手做一个参考:

1、建议最好先将模型权重和文件手动下载下来到本地,因为脚本自动下载可能比较慢,下载地址:https://huggingface.co/THUDM/chatglm-6b
也可以使用:git clone https://huggingface.co/THUDM/chatglm-6b

2、再去github上将模型调用代码克隆到本地:
git clone https://github.com/THUDM/ChatGLM-6B.git
也可以自己手动下载,其实这个里面用到一个模型调用的代码就够了,我用的是官方提供的web_demo2.py。

3、新建一个虚拟环境,建议使用conda,这个具体可以自行搜索

4、从代码目录,激活新建的虚拟环境以后,使用以下命令安装依赖
pip install -r requirements.txt

5、安装好以后,在根目录运行以下命令:
streamlit run web_demo2.py
即可进入界面

2、准备:

这里我随便准备了几个问题:

1、作为一个广告专家,请为饼干写三句广告词,饼干的卖点是:传统工艺,非油炸,健康,酥脆。广告词要突出快乐美好,让人在追剧的时候就想到饼干。
2、五一长假假期,我有一个民宿需要做宣传,主打自然体验,可以采摘,野炊、亲子互动,野营,请为我的民宿写一篇营销文案,要求不低于200字
3、我是一个饼干卖家,我需要拍短视频,请帮我写一个短视频脚本,要有趣好玩,并且突出饼干的卖点:传统工艺,非油炸,健康,酥脆。

我这里统一设置temperature=0.1,设置temperature越低生成的内容越稳定,但同时也少了发散性,这里因为是测试,我就用比较低的就行了。

3、效果:

1、ChatGLM

2、MOSS:

两个的效果也都差不了太多,一个很明显的区别在于:ChatGLM_6B更为小巧,并且速度比较快,几乎是秒出,而MOSS需要等几十秒不等的推理时间。

对中小商家来说,大模型并不是万能的,他有怎样的能力取决于他的训练数据,要想用的舒服,还是需要在自己的数据集上进行微调。