华为云DeepSeek-R1&V3满血版体验:10分钟让你轻松掌握AI大模型应用技巧!

举报
chenyunliang 发表于 2025/02/22 23:32:11 2025/02/22
181 0 0
【摘要】 10分钟体验华为云提供的满血版DeepSeek R1

注:本文转载自作者公众号原创文章,原文:https://mp.weixin.qq.com/s/TC-ONpL3PGklsD0yhtcuBQ 

什么是Deepseek V3


DeepSeek-V3 为杭州深度求索人工智能基础技术研究有限公司在2024年12月26日发布的自研的( MoE 模型,671B 参数,激活 37B,在 14.8T token 上进行了预训练。这些看不懂就不要看!)。

DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。

有图有真相,下面的图片来自其官网。(如有侵权,请联系删除)

 图片

图片
上面的图片看不懂,没关系,记住一个词:B!

 

什么是DeepSeek R1


 DeepSeek-R1 于 2025 年 1 月 20 日发布,性能对标 OpenAI 的 O1 正式版。DeepSeek-R1 遵循 MIT 许可,允许用户通过蒸馏技术利用 R1 训练其他模型。它还上线了 API,开放思维链输出,用户只需设置

model='deepseek-reasoner' 

即可调用。思维链是 AI 领域的核心技术之一,类似于人类做事前的思考过程,AI 通过思维链可以更像人类一样理性地思考和解决问题。

图片  图片

R1 开源许可统一采用 MIT 许可,完全开源,不限制商用,无需申请。同时,产品协议明确支持“模型蒸馏”,进一步推动技术开源和共享。这对各大模型厂商来说,无疑是一个冲击。现在,通过少量 GPU 和“模型蒸馏”就能实现与超大规模参数模型相媲美的效果,真是一个巨大的突破!

DeepSeek V3 和 R1 的主要区别体现在开源、技术特点和应用场景上。DeepSeek V3 作为第三代版本,注重提升模型的通用性和处理能力,适合大规模数据处理和多任务学习,应用范围更广。而 DeepSeek R1 则完全开源,采用 MIT 许可,支持蒸馏技术,允许用户利用少量 GPU 训练高效的模型,并引入“思维链”技术,使得 AI 在推理过程中更像人类思考问题。

DeepSeek R1 主要针对那些需要高效 GPU 使用和资源有限环境下的高性能训练与推理,因此在一些推理效率要求较高的应用场景中表现优异。

DeepSeek V3 更侧重于多任务和大数据处理,而 R1 则专注于资源优化和高效训练。

以上没看懂,没关系,接下来教大家如何在华为云上使用满血版的DeepSeek  V3和R1。

华为云ModelAart Studio(MaaS)


 ModelArts Studio(MaaS)是华为云推出的模型即服务平台,支持从数据准备到模型部署的全流程操作。最近,平台进行了重磅更新,新增支持昇腾适配版满血模型(参数达到671B),并且每个模型还提供200万免费tokens。这意味着用户可以在更强大的计算力支持下,进行大规模模型训练和推理,同时享受免费的 tokens 使用,极大降低了使用门槛和成本。

    DeepSeek-R1-671B-32K
    DeepSeek-V3-671B-32K 
    DeepSeek-R1-671B-8K 
    DeepSeek-V3-671B-8K 
    DeepSeek-V3-671B-4K 
    DeepSeek-R1-671B-4K

    分割线 

    第一步:注册华为云账号

    华为云官网:www.huaweicloud.com

    点击右上角“注册”,按要求填写即可。

    1. 注册后,登录

    2.在控制台右侧的区域,选择“西南-贵阳一”

    3.在左上角“三”处点击,搜索“model”

    图片
    在左侧点击“ModelArts Studio”
    图片


    分割线

     第二步:领取免费tokens

    进入ModelArts Studio大模型即服务平台

    点击“模型部署”,在右侧点击“领取”

    图片
    点击“调用”,获取API地址,模型名称等信息
    下面以模型“DeepSeek-R1-671B-32K”为例:
    图片
    点击“管理API Key”,新增API Key。
    图片
    点击“创建API Key”
    图片
    输入“描述”,点击“确定”
    图片
    复制“密钥”。
    图片
     
    分割线

     第三步:安装cherry studio

    官网下载:https://cherry-ai.com/download 

    网盘下载:https://pan.baidu.com/s/14y1VgCzG9hnrgIkZbSnELA?pwd=7i4w

    图片

    下载对应版本安装即可。

    分割线

    第四步:配置并使用cherry studio

    安装后,点击左下角的工具 -> 模型服务 -> 点击“添加”。

    提供商名称:华为云(可以是其他名字)

    提供商类型:OpenAI(这是是通用标准)

    点击确定。

    图片
    1.把前面创建API Key的密钥粘贴到“API密钥”
    2.API地址为第二步点击“调用”中的API地址,在结尾添加“#”,比如:
    https://infer-modelarts-cn-southwest-2.modelarts-infer.com/v1/infers/xxxe/v1/chat/completions#
    3.点击“添加”

    图片
    模型,模型名称,分组名称都是:DeepSeek-R1,点击“添加模型”。
    图片

    点击“检查”,弹窗点击“确定”。

    图片

    等待连接测试结果。

    图片

    如果连接失败,检查以下地方:

    1.API密钥是否复制正确;

    2.API地址末尾是否有“#”;

    3.模型名称是否正确。

    选择模型进行对话:

    1.点击左上角的聊天按钮

    2.更换模型为刚刚添加的DeepSeek-R1

    图片
    图片

    至此,可以体验由华为云昇腾AI芯片提供的满血版DeepSeek R1!

    【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
    • 点赞
    • 收藏
    • 关注作者

    作者其他文章

    评论(0

    抱歉,系统识别当前为高风险访问,暂不支持该操作

      全部回复

      上滑加载中

      设置昵称

      在此一键设置昵称,即可参与社区互动!

      *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

      *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。