本文首发于公众号:Hunter后端
原文链接:Golang基础笔记二之字符串及其操作
这一篇笔记主要介绍 Golang 字符串相关处理,以下是本篇笔记目录:
- 字符串的定义和初始化
- 字符
- 字符串操作
1、字符串的定义和初始化
在 Go 里,我们可以使用双引号和反引号来对定义字符串。
1. 双引号
双引号用于创建解释型字符串字面量,这种字符串是支持转义字符的,比如我们在字符串中夹带换行符 n,这样在输出的时候,会自动进行换行:
s := "this is a testnthis is another test" fmt.Print(s) // this is a test // this is another test
2. 反引号
反引号用于创建原生字符串字面量,这种字符串中,所有字符都会按原样输出,转移字符不会被解释:
s := `this is a testnthis is another test` fmt.Print(s) // this is a testnthis is another test
2、字符
字符串是由一个个字符组合而成的,前面介绍过,Go 里字符有两种类型 byte 和 rune,但他们实际上分别是 uint8 和 int32 的别名,分别用于表示 ASCII 字符和 Unicode 字符。
每一个 byte 字符用一个字节(8位)来表示,每一个 rune 字符用 1-4 个字节来表示,如果我们想统计一个字符串的长度,首先需要判断我们是想统计其字节长度,还是字符长度。
因为对于一个字符串来说,如果字符串中包含了类似中文这种一个字符包含多个字节的字符,其字节长度和字符长度是不一样的,比如对于下面的字符串:
s := "hello世界"
对于前面的 hello 来说,一个字符就包含一个字节,所以它的字符长度是 5,字节长度也是 5。
而对于后面的 世界 来说,一个字符包含三个字节,所以它的字符长度是 2,但是字节长度是 2 * 3 = 6。
所以这个字符串的字节长度和字符串长度分别如下:
s := "hello世界" fmt.Println("s 的字节长度为:", len(s)) // 11 fmt.Println("s 的字符串长度为:", len([]rune(s))) // 7
在统计字符串长度的时候,我们先将其转为了 rune 类型的切片,然后再统计的其长度。
3、字符串操作
1. 字符串拼接
字符串的拼接可以用两种方式,一种是使用 +,一种是使用 strings.Builder
1) +运算符
s1 := "hello" s2 := " world" s3 := s1 + s2 fmt.Println(s3)
2) strings.Builder
import ( "strings" "fmt" ) func main() { var builder strings.Builder builder.WriteString("hello") builder.WriteString(" world") s := builder.String() fmt.Println(s) }
+运算符和 strings.Builder 都可以用于拼接字符串,但是在 Go 语言里,字符串属于不可变类型,每次使用 + 运算符拼接字符串时,都会创建一个新的字符串对象。
如果频繁拼接大量字符串,会产生大量的内存分配和数据复制操作,导致性能较低。
strings.Builder 内部维护了一个字节切片,在拼接字符串时,会先将字符串追加到这个字节切片中,最后再将字节切片转换为字符串。这样可以减少内存分配和数据复制的次数,性能更高。
2. 字符串的访问
如果想访问字符串中的单个字符,可以使用下标来操作:
s := "hello" fmt.Println(s[4]) // 111
我们可以对其进行格式化,使用 %c 来打印:
fmt.Printf("%cn", s[4]) // o
前面介绍字符串长度的时候,字符串是由字符组成的,但是因为这里测试字符串是全英文的,所以访问到的这个字符就是它的字节内容。
如果字符串包含中文,使用 len() 函数获取到的长度实际上是它的字节长度。
比如下面这个例子,我们访问到的就是字符串对应下标的字节内容,而不是对应的字符了:
s := "hello世界" fmt.Println(s[5]) // 228 fmt.Printf("%cn", s[5]) // ä
若要按字符访问带中文的字符串,可以将字符串转换为 []rune 类型,因为 rune 类型可以表示一个 Unicode 字符:
s := "hello世界" fmt.Printf("%cn", []rune(s)[5]) // 世 fmt.Printf("%cn", []rune(s)[6]) // 界
遍历访问字符串
如果要遍历访问字符串,可以按照前面的操作先将其转为 rune 切片,然后再遍历访问 rune 切片:
s := "hello世界" runes := []rune(s) for _, c := range runes { fmt.Printf("%cn", c) }
还可以使用 for...range 循环,它可以按字符迭代字符串,会自动处理 UTF-8 编码的多字节字符:
s := "hello世界" for _, char := range s { fmt.Printf("%cn", char) }
3. 字符串查找
我们可以引入 strings 模块使用 strings.Index() 来查找指定字符串,返回的是该字符串的字节索引,如果没有找到,则返回 -1。
s := "hello世界" index := strings.Index(s, "界") fmt.Println(index) // 8 index2 := strings.Index(s, "好") fmt.Println(index2) // -1
4. 字符串替换
我们可以使用 strings.Replace() 来替换字符串。
str := "hello世界" s2 := strings.Replace(str, "l", "x", 1) fmt.Println(s2)
在上面的操作中,表示将字符串 str 中的 l 字符串替换为 x,并且只替换第一个 l。
如果需要替换多个,则可以将后面的数字 1 改成指定个数。
如果想要将字符串中指定字符串全部替换,可以将最后一个参数设置为 -1。
也可以使用 strings.ReplaceAll() 来替换字符串:
str := "hello世界" s2 := strings.Replace(str, "l", "x", -1) fmt.Println(s2) s3 := strings.ReplaceAll(str, "l", "x") fmt.Println(s3)
5. 字符串分割
我们可以使用 strings.Split() 来进行字符串分割:
s := "hello,世界,我来了" parts := strings.Split(s, ",") fmt.Println(parts)
返回的 parts 就是一个字符串切片。
还可以使用 strings.SplitN() 对其进行指定长度的切割,比如只需要将其切割成两部分:
s := "hello,world" parts := strings.SplitN(s, "o", 2) fmt.Println(parts, len(parts)) // [hell ,world] 2
注意:这里的参数 2 指的是最终切割后生成的切片长度,如果 n 超过字符串可以切割的长度,则会根据指定字符串其全部切割并返回结果。
所以如果 n 参数为 1,则不会切割,返回原始结果,如果 n 参数为 0,则会返回 nil,如果 n 是负数,则会全部切割。
6. 字符串是否以字符串开头或结尾
strings.HasPrefix() 表示是否是以某字符串开头,返回 bool 型结果。
strings.HasSuffix() 表示是否是以某字符串结尾,返回 bool 型结果。
s := "世界hello,world" result := strings.HasPrefix(s, "世界") fmt.Println(result) result2 := strings.HasSuffix(s, "world") fmt.Println(result2)
7. 是否包含某字符串
strings.Contains() 用于判断字符串是否包含某个特定字符串,返回结果为布尔型。
s := "hello, world" isContain := strings.Contains(s, "world") fmt.Println(isContain)
8. 字符串统计包含子字符串个数
strings.Count() 用于统计字符串中包含某个特定字符串的个数。
s := "hello, world" l_count := strings.Count(s, "l") fmt.Println(l_count)
9. 转大小写
strings.ToUpper() 表示将字符串转为大写
strings.ToLower() 表示将字符串转为小写
s := "hello, world" upperS := strings.ToUpper(s) fmt.Println(upperS) lowerS := strings.ToLower(s) fmt.Println(lowerS)
10. 去除首尾指定字符串
strings.Trim() 去除字符串左右两边指定的字符串
strings.TrimLeft() 去除字符串左边指定的字符串
strings.TrimRight() 去除字符串右边指定的字符串
s := "ihello, worldi" result := strings.Trim(s, "i") fmt.Println(result) // hello, world result = strings.TrimLeft(s, "i") fmt.Println(result) // hello, worldi result = strings.TrimRight(s, "i") fmt.Println(result) // ihello, world
如果想获取更多相关文章,可扫码关注阅读:
