mixtral大模型
【摘要】 简介Mixtral 是一种具有开放权重的高质量稀疏专家混合模型 (SMoE)。根据 Apache 2.0 许可。 Mixtral 在大多数基准测试中都优于 Llama 2 70B,推理速度提高了 6 倍。它是最强大的开放权重模型,具有宽松的许可证,也是成本/性能权衡方面的最佳模型。特别是,它在大多数标准基准测试中匹配或优于 GPT3.5。 Mixtral 的特点可以优雅地处理 32k 令牌...
简介
Mixtral 是一种具有开放权重的高质量稀疏专家混合模型 (SMoE)。根据 Apache 2.0 许可。 Mixtral 在大多数基准测试中都优于 Llama 2 70B,推理速度提高了 6 倍。它是最强大的开放权重模型,具有宽松的许可证,也是成本/性能权衡方面的最佳模型。特别是,它在大多数标准基准测试中匹配或优于 GPT3.5。
Mixtral 的特点
- 可以优雅地处理 32k 令牌的上下文。
- 可以处理英语、法语、意大利语、德语和西班牙语。
- 在代码生成方面表现出强大的性能。
基于 Hugging Face Transformers 使用 mixtral
## Use a pipeline as a high-level helper
from transformers import pipeline
def test_mixtral():
pipe = pipeline("text-generation", model="mistralai/Mixtral-8x7B-Instruct-v0.1")
pipe("请为google编写web自动化测试用例,使用pytest page object设计模式,断言使用hamcrest"))
使用 langchain 调用 mixtral
def test_mixtral():
llm = Ollama(model="mixtral", base_url="http://localhost:11434")
r = llm.invoke('请为google编写web自动化测试用例,使用pytest page object设计模式,断言使用hamcrest')
debug(r)
总结
Mixtral 是一种具有开放权重的高质量稀疏专家混合模型。
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)