Lv.6
Tester_muller
更多个人资料
4940
成长值
0
关注
11
粉丝
+ 关注
私信
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
暂无数据
个人勋章
TA还没获得勋章~
成长雷达
4940
0
0
0
0
个人资料
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
暂无数据
达成规则
以上满足
项可达成此勋章
博客
关注
粉丝
论坛
全部时间
全部时间
最近三天
最近一周
最近一月
全部
暂无专栏分类
人工智能,应该如何测试?(八)企业级智能客服测试大模型 RAG
大模型的缺陷 – 幻觉接触过 GPT 这样的大模型产品的同学应该都知道大模型的强大之处, 很多人都应该调戏过 GPT,跟 GPT 聊很多的天。 作为一个面向大众的对话机器人,GPT 明显是鹤立鸡群,在世界范围内还没有看到有能跟 GPT 扳手腕的存在。 也许很多人都认为 GPT 是非常强大的对话机器人了, 它学时丰富,什么领域内的问题都能回答。但其实就如我上一篇帖子中说道的, 虽然这种大模型...
客服
智能客服
Tester_muller
2024-04-07 16:22:54
93
0
0
2024-04-07 16:22:54
93
0
0
人工智能,应该如何测试?(七)大模型客服系统测试
知识引擎我们在生活中应该多多少少接触过对话机器人,比如我们都知道很多客服其实都是机器人先档在前面回答用户问题的, 有些机器人有相当程度的知识储备, 比如你去买了一辆车, 然后想咨询客服这辆车的保险的细节。 你就会问: 请问车的每年的保险费是多少钱。 但很多时候不同的车型,年份等其他细节会决定了保险费的价格。这时候机器人要通过问询的形式收集这些信息(我们管这些信息叫词槽),所以机器人要先识别...
客服
机器人
Tester_muller
2024-04-07 16:13:58
81
0
0
2024-04-07 16:13:58
81
0
0
人工智能,应该如何测试?(六)推荐系统拆解
推荐系统简介 推荐系统的问题根据之前学习到的内容,我们已经基本了解到了要如何构建一个二分类模型。我们都知道模型大体可以分成,回归,二分类和多分类。但推荐系统是属于哪一种场景呢,比如我们常见的广告推荐或者内容推荐,这些场景都是由系统来判断用户的喜好来推送广告或者视频内容,以追求更高的点击率和转化率。这种场景怎么看都不像跟这三种类型的算法有关系。 实现思路其实解决这个问题的思路也比较简单, 我...
推荐系统
机器学习
Tester_muller
2024-04-07 16:06:10
84
0
0
2024-04-07 16:06:10
84
0
0
人工智能,应该如何测试?(五)ASR 效果测试介绍
什么是 ASRASR 是自动语音识别(Automatic Speech Recognition)的缩写,是一种将人的语音转换为文本的技术。这项技术涉及声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等多个学科。ASR 系统的性能受到识别词汇表的大小和语音的复杂性、语音信号的质量、单个说话人或多个说话人以及硬件等因素的影响。 数据收集经过之前的介绍我们知道在评估模型的效果时,最重要...
Tester_muller
2024-04-07 15:52:22
74
0
0
2024-04-07 15:52:22
74
0
0
人工智能,应该如何测试?(四)模型全生命周期流程与测试图
这些日子讲了很多东西,但比较乱,我这里补充一下完整的业务和测试流程。 生命周期流程图根据数据闭环,我画出了上面的图,并标记了其中测试人员要参与的活动(浅蓝色)。下面我一一分析一下这些测试活动的含义。离线模型测试阶段:在模型的生命周期中,会涉及到 3 种数据。 训练集,验证集和测试集,其中训练集用来训练模型,验证集用来算法自测。 而测试人员需要自行采集/挖掘(要根据用户画像每种类别的数据都要采...
机器学习
Tester_muller
2024-04-07 15:48:43
88
0
0
2024-04-07 15:48:43
88
0
0
人工智能,应该如何测试?(三)数据构造与性能测试篇
前言人工智能场景中的性能测试与我们在互联网中创建到的有很大的不同,因为它需要模拟更复杂的情况。当然它也有相似的地方,只不过今天我们主要介绍它们不同的地方。 产品分类首先我们需要澄清一下, 从 AI 产品的类型来划分的话,我们可以分成两个大的类别:人工智能的业务类产品:AI 就是为了某个特定的业务服务的。它的形态可能就是一个模型。可以是用来做广告或者内容推荐的模型,也可以是用来做人脸识别,对...
Tester_muller
2024-04-07 15:45:01
59
0
0
2024-04-07 15:45:01
59
0
0
人工智能,应该如何测试?(二)数据挖掘篇
前言数据决定模型的上限,而算法调参只是尽量的帮你逼近那个上限,建模工程师 80% 的时间都是在跟数据打交道,国内在 AI 上的发展与国外最大的差距不是在算力上,而是高质量的数据。 相信大家在网络上都见过类似的说法,事实上这些说法都是正确的。并且对于测试人员来说也是一样的。 通过上一篇介绍效果测试的文章大家可以知道,目前已经有现成库帮我们去计算模型的评估指标,老实讲去计算这些指标没有一点难度...
开发者
数据挖掘
机器学习
Tester_muller
2024-04-07 15:35:05
1046
0
0
2024-04-07 15:35:05
999+
0
0
人工智能,应该如何测试?(一)基础效果篇(内含大模型的测试内容)
前言这个系列算是科普文吧,尤其这第一篇可能会比较长,因为我这 8 年里一直在 AI 领域里做测试,涉及到的场景有些多, 我希望能尽量把我经历过的东西都介绍一下,算是给大家科普一下我们这些在 AI 领域内做测试的人,每天都在做什么事情。 当然 AI 领域很庞杂,我涉及到的可能也仅仅是一小部分,这篇帖子算是抛砖引玉,欢迎大家一起来讨论。我打算先简单讲解一下人工智能的原理,毕竟后面要围绕这些去做...
机器学习
深度学习
Tester_muller
2024-04-07 15:07:29
608
0
0
2024-04-07 15:07:29
608
0
0
从基础到高级,带你深入了解和使用curl命令(二)
前言之前我们介绍了curl命令的请求网络,设置代理等操作,本文我们继续来介绍curl命令的操作,本文我们将会介绍curl命令中有关cookie的操作。 获取cookie要获取服务器发送的Cookie,可以使用curl命令的-c选项,将Cookie保存到文件中。例如:curl -c cookiec.txt http://www.baidu.com执行后cookie信息就被存到cookiec....
网络
Tester_muller
2024-04-03 19:07:16
66
0
0
2024-04-03 19:07:16
66
0
0
从基础到高级,带你深入了解和使用curl命令(一)
前言在网络通信和数据传输中,curl命令是一个功能强大且广泛使用的工具。它可以与各种协议进行通信,如HTTP、HTTPS、FTP等,并支持各种操作,如下载文件、发送请求、测试API等。本文将从基础开始,介绍curl命令的基本用法,然后深入探讨其高级功能和实用技巧。 curl简介curl 是常用的命令行工具,用来请求 Web 服务器。它的名字就是命令行(commandline)的 URL 工...
HTTP
Tester_muller
2024-04-03 19:04:56
143
0
0
2024-04-03 19:04:56
143
0
0
总条数:777
10
10
20
50
100
1
2
3
4
5
6
...
78
上滑加载中
https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
+ 关注
私信