作者小头像 Lv.3
更多个人资料
220 成长值
2 关注
2 粉丝
+ 关注 私信

个人介绍

这个人很懒,什么都没有留下

感兴趣或擅长的领域

人工智能、大数据、编程语言
个人勋章
TA还没获得勋章~
成长雷达
220
0
0
0
0

个人资料

个人介绍

这个人很懒,什么都没有留下

感兴趣或擅长的领域

人工智能、大数据、编程语言

达成规则

以上满足项可达成此勋章

  • 博客
  • 关注
  • 粉丝
  • 论坛
NLP相关问题-Subword算法简要总结
与常规方法的区别:传统以空格为主无法处理未知或罕见的词汇不利于学习词缀间的关系,例如love,lovely单个字母粒度又过细Byte Pair Encoding思路:拆分为最小的语义单元,然后依次确定频率最高的单词,循环统计;优点:较好的平衡词汇表大小和所需的token数量缺点:不能提供带概率的多个分片结果算法准备足够大的训练语料确定期望的subword词表大小将单词拆分为字符序列并在末尾添...
作者小头像 AI Medicine
1374
0
0
2021-09-29 15:48:57
999+
0
0
Python中数据集处理时,axis=0与axis=1的区分
【背景】:做数据分析时候,经常要按行或者按列整合数据,需要使用axis=0或者axis=1。 【问题】:axis=0或者asix=1,代表行还是列,经常容易混淆 【答案】:轴用来为超过一维的数组定义的属性,二维数据拥有两个轴:第0轴沿着行的垂直往下,第1轴沿着列的方向水平延伸。
作者小头像 AI Medicine
2039
1
1
2021-08-17 15:20:15
999+
1
1
总条数:22
  • 1
  • 2
  • 3
到第 页

上滑加载中

https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
作者小头像
作者小头像
快速交付
+ 关注 私信