华为云AI Gallery,助力快速搭建专属大模型
【摘要】 AI Gallery提供一站式开发环境,帮助开发者高效完成大模型训练、部署全流程
概述
AI Gallery提供了模型、数据集、AI应用等AI数字资产的共享和使用,为高校科研机构、AI应用开发商、解决方案集成商、企业级/个人开发者等群体,提供安全、开放的共享及交易环节,加速AI资产的开发与落地,保障AI开发生态链上各参与方高效地实现各自的商业价值。
使用指导
部署模型
- 登录AI Gallery,单击“模型”进入模型列表。
- 选择需要部署为推理服务的模型,单击模型名称进入模型详情页。例如选择Qwen1.5-7B-chat-ascend。
- 在模型详情页,选择“部署 > 推理服务”进入部署推理服务页面。在部署推理服务页面完成参数配置,本示例安全认证选择“公开”,服务参数配置完成后,单击“启动部署”。
- 在“订单信息确认”页面,确认服务信息和费用,单击“确定”跳转至在线推理服务列表页面。当“状态”变为“运行中”表示在线推理服务部署成功,可以进行服务预测。当“状态”变为“运行中”表示在线推理服务部署成功,可以进行服务预测。
调用模型
推理服务预测
- 在线推理服务列表页面,选择服务“状态”为“运行中”的服务。单击操作列的“推理测试”,在测试页面根据任务类型以及页面提示完成对应的测试。
调用API
- 待推理服务的状态变为“运行中”时,可单击操作列的“调用接口”,复制对应的接口代码,在本地环境或云端的开发环境中进行接口。也可以和第三方应用对接。例如Dify:
- 如果您需要了解更多Dify内容及实践操作,具体可参考探索Dify:开启AI应用开发的新篇章。
- 如果您需要一键部署私有化Dify平台,可参考:快速搭建Dify LLM应用开发平台
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)