Bonsoir,

J'effectue des sauvegardes via rsync. A la destination je passe une moulinette maison qui utilise le md5sum et les liens hards pour faire du versioning. C'est mieux que rien, mais ça a des limites.
Les logiciels de sauvegarde font des full/diff et ne dedupliquent pas. Le résultat est qu'il faut beaucoup de place pour les sauvegardes. C'est la méthode utilisée pour les sauvegardes sur bandes, mais quand on fait sur disques ou dans le Cloud (Amazon S3), c'est totalement absurde (d'autant qu'avec Amazon on paye au Go).

Connaissez-vous un logiciel qui fait des sauvegardes dédupliquées ?

Merci
rdiffbackup.
Il se base du diff et sur rsync.

Autrement dit tu as le meilleurs des deux commandes :
- La rapidité (rsync).
- L'économie de place (diff).
- La possibilité de restaurer d'anciennes versions (diff).
Bonjour,
autre solution :
- faire le rsync dans un répertoire donné : current
- puis faire des liens physiques (cp -al) vers un répertoire daté.

Comme ce sont des liens physiques, les fichiers non modifiés pointent sur le même inode.
Permet de restaurer rapidement tout un répertoire à une date donnée.

EDIT : en fait, j'avais mal lu ton post initial : tu fais déjà des hard links 😉 Quel est le manque avec cette solution ?
3 ans plus tard
J'ai 20 répertoires datés. Ca fait beaucoup de liens. Rsync se plante pour copier toutes les sauvegardes sur un autre disque.

Mais bon, les années ont passées :roll: . J'ai écrit ma propre solution. Je maintiens les metadatas dans un seul fichier binaire et les données dans un répertoire. Tout est basé sur le cksum et date d'un fichier pour savoir si il a été modifié depuis le précédent backup.
Ainsi il est facile de recopier la base de sauvegarde faite localement ailleurs (comme Amazon Glacier par exemple). Chaque sauvegarde peut-être supprimée dans n'importe quel ordre, ce qui permet de faire une sauvegarde par jour et d'alléger le nombre de sauvegardes quand elles vieillisses.