08.5.1 逐行读取文本文件

逐行读取文本文件是最常用的方式。这也是我们首先介绍它的原因。byLine.go程序分为三部分,将帮助你理解这个技巧。

byLine.go第一部分代码如下:

package main

import (
	"bufio"
	"flag"
	"fmt"
	"io"
	"os"
)

引入bufio包表示我们将使用缓冲区输入。

func lineByLine(file string) error {
	var err error

	f, err := os.Open(file)
	if err != nil {
		return err
	}
	defer f.Close()

	r := bufio.NewReader(f)
	for {
		line, err := r.ReadString('\n')
		if err == io.EOF {
			break
		} else if err != nil {
			fmt.Printf("error reading file %s", err)
			break
		}
		fmt.Printf(line)
	}
	return nil
}

所有的实现都在lineByLine()函数中。在确保可以打开指定的文件名进行读取之后,你调用bufio.NewReader()创建一个新的读实例,然后你可以调用bufio.ReadString()逐行读取文件。行分隔符通过bufio.ReadString()参数指定,它指示bufio.ReadString()一直读取,直到碰到行分隔符为止。当参数是换行符时,不断调用bufio.ReadString()会逐行读取输入文件!注意,使用fmt.Print()而不是fmt.Println()输出读取行,说明每个输入行中都包含了换行符。

byLine.go第三部分代码如下:

func main() {
	flag.Parse()
	if len(flag.Args()) == 0 {
		fmt.Printf("usage: byLine <file1> [<file2> ...]\n")
		return
	}

	for _, file := range flag.Args() {
		err := lineByLine(file)
		if err != nil {
			fmt.Println(err)
		}
	}
}

执行byLine.go,并使用wc(1)处理输出会产生如下的输出内容:

$ go run byLine.go /tmp/swtag.log /tmp/adobegc.log | wc
        4761   88521   568402 

如下的命令会校验前述输出的精确性:

$ wc /tmp/swtag.log /tmp/adobegc.log
         131     693     8440     /tmp/swtag.log
        4630   87828   559962     /tmp/adobegc.log
        4761   88521   568402     total

Last updated