Problema con SVN (svn: Valid UTF-8 data)

Resulta que hoy (si, sábado) estaba agregando un nuevo proyecto que nos encomendaron al SVN.

Lo primero que hacemos luego de armar la estructura básica de directorios es, si es un proyecto que fue comenzado por otras personas, hacer un import de todos los datos originales.

Por lo general no hay problema, pero de vez en cuando nos aparece un error como el siguiente:

svn: Valid UTF-8 datasvn: Valid UTF-8 data 
(hex: 72)
followed by invalid UTF-8 sequence
(hex: e9 75 6e 69)

¿Qué significa este error? Por lo general quiere decir que algún nombre de archivo tiene un carácter inválido. Por ejemplo un acento o ñ que nos está trayendo problemas.

Realmente el problema no es culpa Subversion, éste trabaja muy bien con utf-8, el problema es el sistema de archivos. En este caso en particular los archivos fueron pasados por el cliente y nosotros simplemente los copiamos, lo que no sabíamos es que los nombres tenían una página de código diferente a la nuestra y todos los tildes, ñ y demás caracteres “extendidos” estaban mal representados y svn simplemente no sabía que hacer con ellos.

Moraleja, cuando se produce este error, se debe tener mucha paciencia y revisar los nombres de los archivos, uno por uno, para ver si tienen caracteres raros. Si lo tienen hay que renombrarlo, usando el carácter correcto y finalmente insertarlo en el repositorio como siempre.

Obviamente, lo mejor es directamente no usar estos caracteres en los nombre de los archivos, ni tampoco en su contenido ya que son fuente de miles de dolores de cabeza con páginas de código y lenguajes con problemas para entenderlos, pero a veces no hay opción.

Una aclaración, en mi caso, cuando me refiero a caracteres raros, lo que sucedía era que el nombre del archivo se veía con un signo de pregunta en el medio, el cual obviamente no era intencional. Renombrando el archivo y poniéndole una letra acentuada o lo que sea correcta soluciona el problema sin romper (en teoría) nada.


One Response to “Problema con SVN (svn: Valid UTF-8 data)”

  1. Post bastante viejo pero ayudó mucho, gracias =)

Discussion Area - Leave a Comment