深入理解 Go 中的字符串

举报
宇宙之一粟 发表于 2022/04/24 12:01:22 2022/04/24
【摘要】 字符串的本质在编程语言中,字符串发挥着重要的角色。字符串背后的数据结构一般有两种类型:一种在编译时指定长度,不能修改一种具有动态的长度,可以修改。比如:与Python 中的字符串一样,Go 语言中的字符串不能被修改,只能被访问。在 Python 中,如果改变一个字符串的值会得到如下结果:>>> hi = "Hello">>> hi'Hello'>>> hi[0] = 'h'Tracebac...

字符串的本质

在编程语言中,字符串发挥着重要的角色。字符串背后的数据结构一般有两种类型:

  • 一种在编译时指定长度,不能修改
  • 一种具有动态的长度,可以修改。

比如:与Python 中的字符串一样,Go 语言中的字符串不能被修改,只能被访问。

在 Python 中,如果改变一个字符串的值会得到如下结果:

>>> hi = "Hello"
>>> hi
'Hello'
>>> hi[0] = 'h'
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'str' object does not support item assignment
>>>

同理,在 Go 中也一样:

package main

import "fmt"

func main() {

	var hello = "Hello"
	hello[1] = 'h'

	fmt.Println(hello)
}

// # command-line-arguments
// string_in_go/main.go:8:11: cannot assign to hello[1] (strings are immutable)

字符串的终止方式有两种:

  • 一种是 C 语言的隐式声明,以字符 “\0” 作为终止符
  • 一种是 Go 语言的显式声明

Go 语言的 string 的表示结构如下:

type StringHeader struct {
  Data uintptr  // Data 指向底层的字符数组
  Len int  // Len 用来表示字符串的长度
}

字符串的本质上是一串字符数组,每个字符都在存储时对应了一个或多个整数。用这些整数来表示字符,比如打印 hello 的字节数组如下:

package main

import "fmt"

func main() {

	var hello = "Hello"
	for i := 0; i < len(hello); i++ {
		fmt.Printf("%x ", hello[i])
	}
}
// Output: 48 65 6c 6c 6f 

字符串的底层原理

字符串有特殊标识,有两种声明方式:

var s1 string = `hello world`
var s2 string = "hello world"

字符串常量在词法解析阶段最终会被标记为 StringLit 类型的 Token 并被传递到编译的下一个阶段。

在语法分析阶段,采取递归下降的方式读取 UTF-8 字符,单撇号或双引号是字符串的标识。分析的逻辑位于 syntax/scanner.go 文件中:

  • 如果是单撇号,则调用 rawString 函数,
  • 如果是双引号,则调用 stdString 函数
【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。