forked from TrueCloudLab/restic
checker: add function to read and verify all data
This commit is contained in:
parent
8d229bfd21
commit
43a23f91a6
2 changed files with 187 additions and 14 deletions
|
@ -1,13 +1,17 @@
|
||||||
package checker
|
package checker
|
||||||
|
|
||||||
import (
|
import (
|
||||||
|
"bytes"
|
||||||
"errors"
|
"errors"
|
||||||
"fmt"
|
"fmt"
|
||||||
|
"io/ioutil"
|
||||||
"sync"
|
"sync"
|
||||||
|
|
||||||
"github.com/restic/restic"
|
"github.com/restic/restic"
|
||||||
"github.com/restic/restic/backend"
|
"github.com/restic/restic/backend"
|
||||||
|
"github.com/restic/restic/crypto"
|
||||||
"github.com/restic/restic/debug"
|
"github.com/restic/restic/debug"
|
||||||
|
"github.com/restic/restic/pack"
|
||||||
"github.com/restic/restic/repository"
|
"github.com/restic/restic/repository"
|
||||||
)
|
)
|
||||||
|
|
||||||
|
@ -335,7 +339,7 @@ type TreeError struct {
|
||||||
}
|
}
|
||||||
|
|
||||||
func (e TreeError) Error() string {
|
func (e TreeError) Error() string {
|
||||||
return fmt.Sprintf("%v: %d errors", e.ID.String(), len(e.Errors))
|
return fmt.Sprintf("tree %v: %v", e.ID.Str(), e.Errors)
|
||||||
}
|
}
|
||||||
|
|
||||||
type treeJob struct {
|
type treeJob struct {
|
||||||
|
@ -634,3 +638,73 @@ func (c *Checker) UnusedBlobs() (blobs backend.IDs) {
|
||||||
func (c *Checker) OrphanedPacks() backend.IDs {
|
func (c *Checker) OrphanedPacks() backend.IDs {
|
||||||
return c.orphanedPacks
|
return c.orphanedPacks
|
||||||
}
|
}
|
||||||
|
|
||||||
|
// checkPack reads a pack and checks the integrity of all blobs.
|
||||||
|
func checkPack(r *repository.Repository, id backend.ID) error {
|
||||||
|
debug.Log("Checker.checkPack", "checking pack %v", id.Str())
|
||||||
|
rd, err := r.Backend().Get(backend.Data, id.String())
|
||||||
|
if err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
|
||||||
|
buf, err := ioutil.ReadAll(rd)
|
||||||
|
if err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
|
||||||
|
err = rd.Close()
|
||||||
|
if err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
|
||||||
|
unpacker, err := pack.NewUnpacker(r.Key(), bytes.NewReader(buf))
|
||||||
|
if err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
|
||||||
|
var errs []error
|
||||||
|
for i, blob := range unpacker.Entries {
|
||||||
|
debug.Log("Checker.checkPack", " check blob %d: %v", i, blob.ID.Str())
|
||||||
|
|
||||||
|
plainBuf := make([]byte, blob.Length)
|
||||||
|
plainBuf, err = crypto.Decrypt(r.Key(), plainBuf, buf[blob.Offset:blob.Offset+blob.Length])
|
||||||
|
if err != nil {
|
||||||
|
debug.Log("Checker.checkPack", " error decrypting blob %v: %v", blob.ID.Str(), err)
|
||||||
|
errs = append(errs, fmt.Errorf("blob %v: %v", i, err))
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
|
||||||
|
hash := backend.Hash(plainBuf)
|
||||||
|
if !hash.Equal(blob.ID) {
|
||||||
|
debug.Log("Checker.checkPack", " ID does not match, want %v, got %v", blob.ID.Str(), hash.Str())
|
||||||
|
errs = append(errs, fmt.Errorf("ID does not match, want %v, got %v", blob.ID.Str(), hash.Str()))
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
if len(errs) > 0 {
|
||||||
|
return fmt.Errorf("pack %v contains %v errors: %v", id.Str(), len(errs), errs)
|
||||||
|
}
|
||||||
|
|
||||||
|
return nil
|
||||||
|
}
|
||||||
|
|
||||||
|
// ReadData loads all data from the repository and checks the integrity.
|
||||||
|
func (c *Checker) ReadData(errChan chan<- error, done <-chan struct{}) {
|
||||||
|
defer close(errChan)
|
||||||
|
|
||||||
|
for packID := range c.repo.List(backend.Data, done) {
|
||||||
|
debug.Log("Checker.ReadData", "checking pack %v", packID.Str())
|
||||||
|
|
||||||
|
err := checkPack(c.repo, packID)
|
||||||
|
if err == nil {
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
|
||||||
|
select {
|
||||||
|
case <-done:
|
||||||
|
return
|
||||||
|
case errChan <- err:
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
|
@ -1,10 +1,13 @@
|
||||||
package checker_test
|
package checker_test
|
||||||
|
|
||||||
import (
|
import (
|
||||||
|
"io"
|
||||||
|
"math/rand"
|
||||||
"path/filepath"
|
"path/filepath"
|
||||||
"sort"
|
"sort"
|
||||||
"testing"
|
"testing"
|
||||||
|
|
||||||
|
"github.com/restic/restic"
|
||||||
"github.com/restic/restic/backend"
|
"github.com/restic/restic/backend"
|
||||||
"github.com/restic/restic/checker"
|
"github.com/restic/restic/checker"
|
||||||
"github.com/restic/restic/repository"
|
"github.com/restic/restic/repository"
|
||||||
|
@ -24,13 +27,13 @@ func list(repo *repository.Repository, t backend.Type) (IDs []string) {
|
||||||
return IDs
|
return IDs
|
||||||
}
|
}
|
||||||
|
|
||||||
func checkPacks(chkr *checker.Checker) (errs []error) {
|
func collectErrors(f func(chan<- error, <-chan struct{})) (errs []error) {
|
||||||
done := make(chan struct{})
|
done := make(chan struct{})
|
||||||
defer close(done)
|
defer close(done)
|
||||||
|
|
||||||
errChan := make(chan error)
|
errChan := make(chan error)
|
||||||
|
|
||||||
go chkr.Packs(errChan, done)
|
go f(errChan, done)
|
||||||
|
|
||||||
for err := range errChan {
|
for err := range errChan {
|
||||||
errs = append(errs, err)
|
errs = append(errs, err)
|
||||||
|
@ -39,19 +42,16 @@ func checkPacks(chkr *checker.Checker) (errs []error) {
|
||||||
return errs
|
return errs
|
||||||
}
|
}
|
||||||
|
|
||||||
func checkStruct(chkr *checker.Checker) (errs []error) {
|
func checkPacks(chkr *checker.Checker) []error {
|
||||||
done := make(chan struct{})
|
return collectErrors(chkr.Packs)
|
||||||
defer close(done)
|
}
|
||||||
|
|
||||||
errChan := make(chan error)
|
func checkStruct(chkr *checker.Checker) []error {
|
||||||
|
return collectErrors(chkr.Structure)
|
||||||
|
}
|
||||||
|
|
||||||
go chkr.Structure(errChan, done)
|
func checkData(chkr *checker.Checker) []error {
|
||||||
|
return collectErrors(chkr.ReadData)
|
||||||
for err := range errChan {
|
|
||||||
errs = append(errs, err)
|
|
||||||
}
|
|
||||||
|
|
||||||
return errs
|
|
||||||
}
|
}
|
||||||
|
|
||||||
func TestCheckRepo(t *testing.T) {
|
func TestCheckRepo(t *testing.T) {
|
||||||
|
@ -204,3 +204,102 @@ func TestDuplicatePacksInIndex(t *testing.T) {
|
||||||
|
|
||||||
})
|
})
|
||||||
}
|
}
|
||||||
|
|
||||||
|
// errorBackend randomly modifies data after reading.
|
||||||
|
type errorBackend struct {
|
||||||
|
backend.Backend
|
||||||
|
}
|
||||||
|
|
||||||
|
func (b errorBackend) Get(t backend.Type, name string) (io.ReadCloser, error) {
|
||||||
|
rd, err := b.Backend.Get(t, name)
|
||||||
|
if err != nil {
|
||||||
|
return rd, err
|
||||||
|
}
|
||||||
|
|
||||||
|
if t != backend.Data {
|
||||||
|
return rd, err
|
||||||
|
}
|
||||||
|
|
||||||
|
return backend.ReadCloser(faultReader{rd}), nil
|
||||||
|
}
|
||||||
|
|
||||||
|
func (b errorBackend) GetReader(t backend.Type, name string, offset, length uint) (io.ReadCloser, error) {
|
||||||
|
rd, err := b.Backend.GetReader(t, name, offset, length)
|
||||||
|
if err != nil {
|
||||||
|
return rd, err
|
||||||
|
}
|
||||||
|
|
||||||
|
if t != backend.Data {
|
||||||
|
return rd, err
|
||||||
|
}
|
||||||
|
|
||||||
|
return backend.ReadCloser(faultReader{rd}), nil
|
||||||
|
}
|
||||||
|
|
||||||
|
// induceError flips a bit in the slice.
|
||||||
|
func induceError(data []byte) {
|
||||||
|
if rand.Float32() < 0.8 {
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
pos := rand.Intn(len(data))
|
||||||
|
data[pos] ^= 1
|
||||||
|
}
|
||||||
|
|
||||||
|
// faultReader wraps a reader and randomly modifies data on read.
|
||||||
|
type faultReader struct {
|
||||||
|
rd io.Reader
|
||||||
|
}
|
||||||
|
|
||||||
|
func (f faultReader) Read(p []byte) (int, error) {
|
||||||
|
n, err := f.rd.Read(p)
|
||||||
|
if n > 0 {
|
||||||
|
induceError(p)
|
||||||
|
}
|
||||||
|
|
||||||
|
return n, err
|
||||||
|
}
|
||||||
|
|
||||||
|
func TestCheckerModifiedData(t *testing.T) {
|
||||||
|
be := backend.NewMemoryBackend()
|
||||||
|
|
||||||
|
repo := repository.New(be)
|
||||||
|
OK(t, repo.Init(TestPassword))
|
||||||
|
|
||||||
|
arch := restic.NewArchiver(repo)
|
||||||
|
_, id, err := arch.Snapshot(nil, []string{"."}, nil)
|
||||||
|
OK(t, err)
|
||||||
|
t.Logf("archived as %v", id.Str())
|
||||||
|
|
||||||
|
checkRepo := repository.New(errorBackend{be})
|
||||||
|
OK(t, checkRepo.SearchKey(TestPassword))
|
||||||
|
|
||||||
|
chkr := checker.New(checkRepo)
|
||||||
|
|
||||||
|
hints, errs := chkr.LoadIndex()
|
||||||
|
if len(errs) > 0 {
|
||||||
|
t.Fatalf("expected no errors, got %v: %v", len(errs), errs)
|
||||||
|
}
|
||||||
|
|
||||||
|
if len(hints) > 0 {
|
||||||
|
t.Errorf("expected no hints, got %v: %v", len(hints), hints)
|
||||||
|
}
|
||||||
|
|
||||||
|
errFound := false
|
||||||
|
for _, err := range checkPacks(chkr) {
|
||||||
|
t.Logf("pack error: %v", err)
|
||||||
|
}
|
||||||
|
|
||||||
|
for _, err := range checkStruct(chkr) {
|
||||||
|
t.Logf("struct error: %v", err)
|
||||||
|
}
|
||||||
|
|
||||||
|
for _, err := range checkData(chkr) {
|
||||||
|
t.Logf("struct error: %v", err)
|
||||||
|
errFound = true
|
||||||
|
}
|
||||||
|
|
||||||
|
if !errFound {
|
||||||
|
t.Fatal("no error found, checker is broken")
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
Loading…
Reference in a new issue