BULMA

Bulma se une a la protesta contra SOPA y PIPA

Bergantells Usuaris de GNU/Linux de Mallorca i Afegitons   |   Bisoños Usuarios de GNU/Linux de Mallorca y Alrededores
CONTENIDOS
. Jornadas de software libre
. Version para PDA
. Enlaces breves
. La asociacion
. Los mas leidos
. Autores [Actividad]
. Ultimos Comentarios
. Todos los titulares!
. Estadisticas
. Guia de estilo
. ¿Sugerencias?
. Wiki
. XML [Ayuda]
Listas de correo
. Archivos bulmailing
. Archivos BulmaGes
Radio libre :-)
. Des de la Xarxa (Archivos)
. Mallorca en Xarxa
Busquedas

+ Enlaces Linux
Ultimos kernels
(21/05/2013 08:39:56)
    
Google


En bulma.net
En internet
Convertir ficheros entre distintos conjuntos de caracters (UTF, latin1...) (15967 lectures)
Por Ricardo Galli Granada
gallir (http://mnm.uib.es/gallir/)
Creado el 12/12/2001 20:55 modificado el 12/12/2001 20:55

Estaba ya cansado de no poder usar el kword para escribir los artículos de Bulma debido a que genera salida en UTF8, así que me puse a buscar como convertirlos a Latin1 o ISO-8859-{1,15} que es el estándar en Europa y Bulma.


Pagina1/1

Aunque el Quanta funciona muy bien, tiene sus problemas si lo que pretende es escribir un artículo de longitud media o larga. Las etiquetas HTML molestan bastante a la lectura y corrección y además tiene algunos bugs de formateo y salto de líneas.

Encontré dos soluciones razonables:

  1. Grabar como SGML y luego convertir a HTML con el sgmltools.
  2. Grabar como HTML y luego convertir los caracteres UTF8 generados por el kword a Latin1 con el tcs.

Según el código HTML generado, para escribir los artículos en Bulma me parece más sencillo usar el tcs y luego copiar el texto a los campos del formulario de Bulma.

tcs

El paquete Debian se llama igual que el comando, tcs. Básicamente lo que hace es convertir la codificación de caracteres de una serie de ficheros a otra codificación.

Para los impacientes, basta con grabar en HTML desde el Kword y luego ejecutar el tcs.

tcs  -t latin1 art_bulma.html

Las opciones más importantes del tcs son

  • -f tipo_entrada: especifica que codificación se usa en el fichero de original.
  • -t tipo_salida: especifica la codificación que queremos para la salida.

Los tipos para la entrada puedes ser obtenidas con tcs -l:

$ tcs -l
tcs version = 'Sun Mar 26 02:42:25 EST 1995'
cs: utf utf1 ascii 8859-1 latin1 8859-2 8859-3 8859-4
8859-5 8859-6 8859-7 8859-8 8859-9 8859-10 8859-14 koi8
ucode cp866 av cp1251 ov sf1 sf2 jis(from) jis-kanji
ujis ms-kanji big5 gb euc-k tis viet1 viet2 viscii
msdos msdos2 ps2 macrom next atari unicode ebcdic utf-l2

Como véis, también sirve para convertir desde diversas codificaciones, incluidas msdos, ebcdic, atari, etc.

sgmltools

Para los interesados en soluciones SGML/DocBook, podéis grabar desde el Kword en formato SGML (es un DTD DocBook-Oasis), que curiosamente sí graba en Latin1 (ISO-8859-1), y luego convertir a HTML con el sgmltools (paquete Debian sgml-tools o linuxdoc-tools).

Aunque este tema es más complejo y se merece un artículo más largo, para poner un artículo en Bulma basta con hacer:

sgmltools --backend=onehtml art_bulma.sgml

La opción onehtml indica que sólo hay que generar un fichero .html. Si se se quiere en un subdirectorio hay que especificar --backend=html.


Imprimir
Version para
imprimir

Imprimir
Version
PDF
Comentarios
Es posible que se hayan omitido algunos comentarios considerados poco constructivos
1.  Re: Convertir ficheros entre distintos conjuntos de caracters (UTF, latin1...) (14/12/2001 11:14, #3809)
  Por: Primetime (http://www.linuxsilo.net)
Gracias por el artículo, Ricardo. Yo he tenido los mismos problemas con todos los docuemntos que he generado con KWord para la BkP. Sólo una cosa me queda por averiguar, y es cómo pasar los caracteres ANSI a caracteres HTML (i.e. del documento final de HTML en Latin 1 con á, é, í, etc. a aacute, eacute, iacute, etc.
No es pot respondre
 
2.  Re: Convertir ficheros entre distintos conjuntos de caracters (UTF, latin1...) (14/12/2001 14:15, #3810)
  Por: gallir (http://m3d.uib.es/~gallir/)
No hace falta, la mayoría de los navegadores te lo interpretan correctamente (son parte del latin1 o iso-8859-1/15). Para evitar problemas basta con que pongas el charset iso que toca.

Si miras la cabecera generado por el html del kword, debes cambiar el utf-8 por "iso-8859-1" (o iso-8859-15 para el euro). Con eso te aseguras que el navegador use el charset correcto.

En cuanto tenga a mano mi Linux, te diré algún comando para convertir los caracteres iso a html, pero te repito que no hace falta.

No es pot respondre
 
3.  Re: Convertir ficheros entre distintos conjuntos de caracters (UTF, latin1...) (18/03/2005 06:14, #25751)
  Por: Nikoman
Disculpa quiero bajar e instalar el tcs resulta que soy nuevo en linux y no se como hacerlo ¿Podrias decirme como porfavor? tengo instalado Debian ya encontre la pagina, aunqeu tengo entendido que hay un comando para hacerlo
No es pot respondre
 
4.  Re: Convertir ficheros entre distintos conjuntos de caracters (UTF, latin1...) (15/07/2005 07:35, #27475)
  Por: avaj1007
Hay varias formas. La más sencilla creo yo es con apt.
Pero bine primero tendrás que ver si esta dentro de los repositorios. Es una comprobación de los más sencillo y te quitas de problemas.
# apt-cache search paquete--> en este caso # apt-cache search tcs.
Luego de las lineas que te salen no lo confundas con tcsh que es un tipo de shell.

Si esta simplemente # apt-get install tcs.

Espero haber ayudado.
No es pot respondre
 
GRACIAS
Distribuciones Universal
Por el servidor
Dpto. de Matematicas e Informatica
Calificacion
****
Vots: 17
Danos tu opinion:
**** Excelente
***0 Muy Bueno
**00 Bueno
*000 Regular
0000 Malo
SECCIONES
Noticia
Breve
Truco
Enlace
Participa
Proyecto
Articulo
Webbulma
Manoletada :-)
Seguridad
Modificado: 31/7/2007 23:21:42 | Tiempo Total: 0.030 segs | Kernel: Linux - i686 - 2.6.26-2-686 | Last boot: too much time ago!!
Powered by Apache    MySQL    PHP    Gimp