Golang 中的 Bufio 包詳解之 Bufio.Scanner
bufio.Scanner
bufio.Scanner 是 Golang 中一個(gè)用于逐個(gè)讀取輸入緩沖區(qū)的掃描器,通常與 bufio.Reader 一起使用,bufio.Reader 用于從輸入中讀取數(shù)據(jù),而 bufio.Scanner 則用于逐個(gè)讀取輸入緩沖區(qū)的內(nèi)容。
bufio.Scanner 可以將輸入數(shù)據(jù)分解為邏輯上的行并返回。Scanner 通過(guò)定義一個(gè) Split 函數(shù)來(lái)將輸入分解為行。結(jié)構(gòu)體定義和對(duì)應(yīng)的方法如下:
type Scanner struct {
r io.Reader // The reader provided by the client.
split SplitFunc // The function to split the tokens.
maxTokenSize int // Maximum size of a token; modified by tests.
token []byte // Last token returned by split.
buf []byte // Buffer used as argument to split.
start int // First non-processed byte in buf.
end int // End of data in buf.
err error // Sticky error.
empties int // Count of successive empty tokens.
scanCalled bool // Scan has been called; buffer is in use.
done bool // Scan has finished.
}
下面是 bufio.Writer 提供的一些主要方法:
- func (s *Scanner) Scan() bool,用于讀取輸入緩沖區(qū)中的下一個(gè)數(shù)據(jù)塊,并將其保存在內(nèi)部的緩沖區(qū)中。如果讀取成功,則返回 true;如果已經(jīng)讀取了所有數(shù)據(jù)或者發(fā)生了錯(cuò)誤,則返回 false。
- func (s *Scanner) Text() string,用于獲取內(nèi)部緩沖區(qū)中的文本內(nèi)容,通常與 Scan() 方法一起使用,用于獲取讀取的數(shù)據(jù)。
- func (s *Scanner) Bytes() []byte,用于獲取內(nèi)部緩沖區(qū)中的字節(jié)內(nèi)容,通常與 Scan() 方法一起使用,用于獲取讀取的數(shù)據(jù)。
- func (s *Scanner) Err() error,用于獲取在讀取輸入時(shí)發(fā)生的錯(cuò)誤信息,如果讀取過(guò)程中沒(méi)有發(fā)生錯(cuò)誤,則返回 nil;否則,返回一個(gè)非 nil 的錯(cuò)誤對(duì)象。
- func (s *Scanner) Buffer(buf []byte, max int), 用于自定義輸入緩沖區(qū)大小,接受一個(gè) []byte 類型的參數(shù),用于指定緩沖區(qū)的大小。
- func (s *Scanner) Split(split SplitFunc),用于指定一個(gè)分割函數(shù),將輸入分割成多個(gè)數(shù)據(jù)塊,接受一個(gè) func([]byte) bool 類型的參數(shù),該函數(shù)在每次讀取輸入時(shí)被調(diào)用,用于判斷是否需要將當(dāng)前數(shù)據(jù)塊分割成多個(gè)小塊。通常用于處理非常大的數(shù)據(jù)塊,以避免內(nèi)存溢出等問(wèn)題。
使用示例
簡(jiǎn)單使用示例如下:
package main
import (
"bufio"
"fmt"
"strings"
)
func main() {
input := "路多辛的所思所想\n很值得一看哦!\n"
scanner := bufio.NewScanner(strings.NewReader(input))
// 逐行遍歷
for scanner.Scan() {
fmt.Println(scanner.Text())
}
// 錯(cuò)誤處理
if err := scanner.Err(); err != nil {
fmt.Println("Error:", err)
}
// 自定義分隔符
scanner = bufio.NewScanner(strings.NewReader("路多辛,的,所思所想"))
scanner.Split(func(data []byte, atEOF bool) (advance int, token []byte, err error) {
// 分隔符為逗號(hào)
for i, d := range data {
if d == ',' {
return i + 1, data[:i], nil
}
}
if atEOF && len(data) > 0 {
return len(data), data, nil
}
return 0, nil, nil
})
for scanner.Scan() {
fmt.Println(scanner.Text())
}
}
運(yùn)行看下效果:
$ go run main.go
路多辛的所思所想
很值得一看哦
路多辛
的
所思所想
第一個(gè)示例中,使用了默認(rèn)的分割方式,即按行讀取輸入。第二個(gè)示例中,使用自定義分隔符,將輸入的字符串按照逗號(hào)進(jìn)行分隔。
小結(jié)
bufio.Scanner 在讀取緩沖區(qū)時(shí),會(huì)將讀取的數(shù)據(jù)保存在內(nèi)部緩沖區(qū)中。因此,在每次調(diào)用 scanner.Scan() 方法時(shí),都會(huì)從輸入中讀取一個(gè)新的數(shù)據(jù)塊,并保存在內(nèi)部緩沖區(qū)中。如果需要讀取輸入緩沖區(qū)中的所有數(shù)據(jù),需要不斷調(diào)用 scanner.Scan() 方法,直到返回 false 為止。