- 预审中
- 2 预审通过
- 3 已采纳
- 4 已实现
【功能建议】【HCDE体验官第三期】MaaS服务体验报告 预审通过 编辑 删除
- API
场景描述:
场景描述:
本期体验的是模型工具中的模型部署模块
这里全是语言类模型,现在“Qwen2 是阿里云最新推出的大语言模型系列,提供基础模型和指令调优版本,参数范围从 5 亿到 720 亿,其中包括一个 Mixture-of-Experts 模型。该模型已经在 Hugging Face 上开源了。”(引用)
现在人工智能在NLP上发展还是蛮快的。各大公司均推出自己的大模型。现在业界主流的有由OpenAI开发,基于Transformer架构的GPT-4;由Anthropic开发的Claude 3;由谷歌开发的Gemini;由Meta开发的LLM3;由LMSYSrg开发的Vicuna;由Mistral AI开发的Mistral 2。
国内比较常的通义千问 文心一言等。现在来测一下千问大模型
引用:Qwen2-72B 在针对预训练语言模型的评估中,对比当前最优的开源模型,Qwen2-72B 在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型,如 Llama-3-70B 以及 Qwen1.5 最大的模型 Qwen1.5-110B。这得益于其预训练数据及训练方法的优化。
模型体现效果还是不错的。本模型在代码和数学能力表现是很不错的。试了一下python的代码测试。可以辅助进行编程以及程序的学习。
测试一下英文,至少也是英文来回答的,在语种之间是可以进行切换使用的。语言可以支持以下。
这个参数不让手改0.8只能拖拉到0.8 top_k也是一样,应该是有限制禁止是0,这个算不算小BUG,可以修复一下。
复杂一点的问题测试一下,还可以。
不过不同模型的结果是不一样的。
模型调用也有详细的文档可以参考
现在模型的使用免责声名也给出了,模型更多的是辅助使用。建议华为是不是可以推出自己的语言大模型进行开源使用。
建议方案:
1、现在模型的使用免责声名也给出了,模型更多的是辅助使用。建议华为是不是可以推出自己的语言大模型进行开源使用。
2、现在大模型的应用技术走在了应用实践的前面,对于此有一个建议因为不同模型处理同一问题的结果不同,可以在同一界面中进行一下横向对比。可以看看模型的表现。
3、因为是现成的模型,在应用过程中BUG无法很好的发现,所有的表现都是模型的一个效果。
真正的模型要是在云上应用,对于算力资源的评估也是很重要的。一种是用算力还收费,一种是API调用来收费不知以后的策略是什么样的,可以给一个参考也评估。
4、有参数不让手改0.8只能拖拉到0.8 top_k也是一样,应该是有限制禁止是0,这个算不算小BUG,可以修复一下。
57 1
0/1000
仅支持JPG、JPEG、PNG、GIF,数量不超过4张且每张大小不超过2MB
删除建议
全部评论(1)
评论(1)
非常感谢您的反馈,您的建议和诉求已经收到,并已提交至相关产品团队进行核查评估,评估完成后对于建议是否采纳会尽快给您答复,也请您持续关注云声平台,了解反馈建议处理进展,感谢您对华为云的支持!