Java---练习(面试题) :字符串截取(1)
【摘要】 在java中,字符串“abcd”与字符串“ab你好”的长度是一样,都是四个字符。 但对应的字节数不同,一个汉字占两个字节。 定义一个方法,按照指定的字节数来取子串。 如:对于“ab你好”,如果取三个字节,那么子串就是ab与“你”字的半个,那么半个就要舍弃。如果取四个字节就是“ab你”,取五个字节还是“ab你”。
上面给出的是在gbk编码下的截取字符串。 下面我...
在java中,字符串“abcd”与字符串“ab你好”的长度是一样,都是四个字符。
但对应的字节数不同,一个汉字占两个字节。
定义一个方法,按照指定的字节数来取子串。
如:对于“ab你好”,如果取三个字节,那么子串就是ab与“你”字的半个,那么半个就要舍弃。如果取四个字节就是“ab你”,取五个字节还是“ab你”。
上面给出的是在gbk编码下的截取字符串。
下面我写了个代码,可以在utf-8和gbk编码下都能截取字符串。
注意:utf-8下的绝大多数汉字都是3个字节,所以,为了简化,全部当成了3个字节处理。
package io.string;
import java.io.IOException;
import java.util.Scanner;
public class StringCutOut { static final String STR = "汗"; public static void main(String[] args) throws IOException { Scanner sc = new Scanner(System.in); // 只考虑GBK和UTF-8 while (true) { if (STR.getBytes().length % 2 == 0) {// GBK System.out.println("请输入字符串:(输入'#'结束为结束程序)"); String str = sc.next(); if ("#".equals(str)) { return; } System.out.println("请输入指定字节以用来截取字符串(截取的字符串的字串每个占一行):"); int n = sc.nextInt(); int len = 0; int m = n; while (len < str.length()) { if (str.charAt(len) >= 0 && str.charAt(len) <= 128) { n--; System.out.print(str.charAt(len)); if (n <= 0) { n = m; System.out.println(); } len++; } else { n -= 2; System.out.print(str.charAt(len)); if (n <= 0) { n = m; System.out.println(); } len++; } } System.out.println(); } else if (STR.getBytes().length % 2 != 0) {// utf-8 System.out.println("请输入字符串:(输入'#'结束为结束程序)"); String str = sc.next(); if ("#".equals(str)) { return; } str = new String(str.getBytes("gbk"), "UTF-8"); //因为我的终端输入默认是gbk的,改了系统的编码还是没用。所以就用这个转码了。。 //这里肯定是有bug的----留待下次编辑修复 // System.out.println(str); // System.out.println(str.length()); System.out.println("请输入指定字节以用来截取字符串(截取的字符串的字串每个占一行):"); int n = sc.nextInt(); int len = 0; int m = n; while (len < str.length()) { if (str.charAt(len) >= 0 && str.charAt(len) <= 128) { n--; System.out.print(str.charAt(len)); len++; if (n <= 0) { n = m; System.out.println(); } } else { if(n-2<=0&&m>=3){ n=m; System.out.println(); continue; } n -= 3; System.out.print(str.charAt(len)); if(n<=0){ n=m; System.out.println(); } len++; } } } System.out.println(); } }
}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
GBK编码下的一个测试结果:
请输入字符串:(输入'#'结束为结束程序)
ab你好
请输入指定字节以用来截取字符串(截取的字符串的字串每个占一行):
4
ab你
好
- 1
- 2
- 3
- 4
- 5
- 6
UTF-8下的一个测试结果:
请输入字符串:(输入'#'结束为结束程序)
ab你好
请输入指定字节以用来截取字符串(截取的字符串的字串每个占一行):
4
ab
你
好
- 1
- 2
- 3
- 4
- 5
- 6
- 7
今天就先到这里了。
文章来源: chenhx.blog.csdn.net,作者:谙忆,版权归原作者所有,如需转载,请联系作者。
原文链接:chenhx.blog.csdn.net/article/details/51255586
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)