Java---练习(面试题) :字符串截取(1)

举报
谙忆 发表于 2021/05/28 07:43:42 2021/05/28
【摘要】 在java中,字符串“abcd”与字符串“ab你好”的长度是一样,都是四个字符。 但对应的字节数不同,一个汉字占两个字节。 定义一个方法,按照指定的字节数来取子串。 如:对于“ab你好”,如果取三个字节,那么子串就是ab与“你”字的半个,那么半个就要舍弃。如果取四个字节就是“ab你”,取五个字节还是“ab你”。 上面给出的是在gbk编码下的截取字符串。 下面我...

在java中,字符串“abcd”与字符串“ab你好”的长度是一样,都是四个字符。
但对应的字节数不同,一个汉字占两个字节。
定义一个方法,按照指定的字节数来取子串。
如:对于“ab你好”,如果取三个字节,那么子串就是ab与“你”字的半个,那么半个就要舍弃。如果取四个字节就是“ab你”,取五个字节还是“ab你”。

上面给出的是在gbk编码下的截取字符串。
下面我写了个代码,可以在utf-8和gbk编码下都能截取字符串。

注意:utf-8下的绝大多数汉字都是3个字节,所以,为了简化,全部当成了3个字节处理。

package io.string;

import java.io.IOException;
import java.util.Scanner;

public class StringCutOut { static final String STR = "汗"; public static void main(String[] args) throws IOException { Scanner sc = new Scanner(System.in); // 只考虑GBK和UTF-8 while (true) { if (STR.getBytes().length % 2 == 0) {// GBK System.out.println("请输入字符串:(输入'#'结束为结束程序)"); String str = sc.next(); if ("#".equals(str)) { return; } System.out.println("请输入指定字节以用来截取字符串(截取的字符串的字串每个占一行):"); int n = sc.nextInt(); int len = 0; int m = n; while (len < str.length()) { if (str.charAt(len) >= 0 && str.charAt(len) <= 128) { n--; System.out.print(str.charAt(len)); if (n <= 0) { n = m; System.out.println(); } len++; } else { n -= 2; System.out.print(str.charAt(len)); if (n  <= 0) { n = m; System.out.println(); } len++; } } System.out.println(); } else if (STR.getBytes().length % 2 != 0) {// utf-8 System.out.println("请输入字符串:(输入'#'结束为结束程序)"); String str = sc.next(); if ("#".equals(str)) { return; } str = new String(str.getBytes("gbk"), "UTF-8"); //因为我的终端输入默认是gbk的,改了系统的编码还是没用。所以就用这个转码了。。 //这里肯定是有bug的----留待下次编辑修复 // System.out.println(str); // System.out.println(str.length()); System.out.println("请输入指定字节以用来截取字符串(截取的字符串的字串每个占一行):"); int n = sc.nextInt(); int len = 0; int m = n; while (len < str.length()) { if (str.charAt(len) >= 0 && str.charAt(len) <= 128) { n--; System.out.print(str.charAt(len)); len++; if (n <= 0) { n = m; System.out.println(); } } else { if(n-2<=0&&m>=3){ n=m; System.out.println(); continue; } n -= 3; System.out.print(str.charAt(len)); if(n<=0){ n=m; System.out.println(); } len++; } } } System.out.println(); } }
}

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54
  • 55
  • 56
  • 57
  • 58
  • 59
  • 60
  • 61
  • 62
  • 63
  • 64
  • 65
  • 66
  • 67
  • 68
  • 69
  • 70
  • 71
  • 72
  • 73
  • 74
  • 75
  • 76
  • 77
  • 78
  • 79
  • 80
  • 81
  • 82
  • 83
  • 84
  • 85
  • 86
  • 87
  • 88
  • 89

GBK编码下的一个测试结果:

请输入字符串:(输入'#'结束为结束程序)
ab你好
请输入指定字节以用来截取字符串(截取的字符串的字串每个占一行):
4
ab你
好
  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

UTF-8下的一个测试结果:

请输入字符串:(输入'#'结束为结束程序)
ab你好
请输入指定字节以用来截取字符串(截取的字符串的字串每个占一行):
4
ab
你
好
  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

今天就先到这里了。

文章来源: chenhx.blog.csdn.net,作者:谙忆,版权归原作者所有,如需转载,请联系作者。

原文链接:chenhx.blog.csdn.net/article/details/51255586

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。