BULMA

Bulma se une a la protesta contra SOPA y PIPA

Bergantells Usuaris de GNU/Linux de Mallorca i Afegitons   |   Bisoños Usuarios de GNU/Linux de Mallorca y Alrededores
CONTENIDOS
. Jornadas de software libre
. Version para PDA
. Enlaces breves
. La asociacion
. Los mas leidos
. Autores [Actividad]
. Ultimos Comentarios
. Todos los titulares!
. Estadisticas
. Guia de estilo
. ¿Sugerencias?
. Wiki
. XML [Ayuda]
Listas de correo
. Archivos bulmailing
. Archivos BulmaGes
Radio libre :-)
. Des de la Xarxa (Archivos)
. Mallorca en Xarxa
Busquedas

+ Enlaces Linux
Ultimos kernels
(19/06/2013 01:02:33)
    
Google


En bulma.net
En internet
Nuevo buscador del Web Bulma basado en htDig (9645 lectures)
Por Ricardo Galli Granada
gallir (http://mnm.uib.es/gallir/)
Creado el 14/03/2001 02:53 modificado el 14/03/2001 02:53

El nuevo buscador de WebBulma es el htDig y permite buscar no sólo en el contenido de los artículos, sino también en los mensajes de las listas de correo de Bulma y los comentarios de los lectores. [ACTUALIZACIÓN] Además, como DaniRC no podía encontrar un artículo por problemas de acentos mal puestos ;-), modificamos el programa, los diccionarios y las reglas para que los ignore en la generación de índices y búsquedas.


Pagina1/1

Desde el día 10 de marzo lo hemos puesto en marcha con Guillem Cantallops en forma experimental y ahora ya está a pleno funcionamiento. El buscador es el htDig y lo hemos configurado para que interprete las palabras en castellano, palabras típicas informáticas en inglés y las principales derivaciones de las palabras raíces, por ejemplo: fichero-ficheros, limitar-limite-limites-limitamos-.. etc. Es muy potente, hasta inclusive está configurado para que trabaje con sinónimos de palabras técnicas, por ejemplo: IDSN-RDSI, mail-email-emilio, fichero-ficheros, etc.

 

El buscador actualiza su base de datos cada madrugada y genera unas bases de datos con índices por palabras y los punteros a cada página web. De esta forma la búsqueda es muy rápida y asigna pesos (los ) dependiendo de la aparición de las palabras. Cinco Tuxes indican el máximo.

Para poder asignar pesos correctos, hemos reorganizado las páginas web para que defina como título de la página al título de la noticia y el META “information” es el resumen de la misma. Por lo que desde ahora es muy importante poner buenos títulos y resúmenes para que los artículos aparezcan correctamente ordenados. Eso no sólo beneficiará a nuestro buscador, sino también a todos los buscadores.

Y ya que el buscador también funciona con los mensajes a las listas, estaría bien que los subjects fuesen del tema del mail, así facilitaremos la vida a todos.

Las configuraciones y base de datos que usamos están disponibles en:

Modificación para el castellano/español

Los ejecutables que están son el resultado de unas pequeñas modificaciones al String.cc y htString.h paraque ignore los acentos. Los diccionarios y reglas espa~nol.* también están modificados para ignorar acentos y no expandir en tantas palabras derivadas.

Los ejecutables son directamente usables con los diccionarios de los enlaces anteriores. El que quiera los diffs de los fuentes del htDig, que se ponga en contacto con nosotros en la lista Bulmailing (ver enlace en la página).

En cuanto lo termine de escribir, pondré una guía para escribir las noticias y hacer que aparezcan primeros en las herramientas de búsqueda.

--ricardo


Imprimir
Version para
imprimir

Imprimir
Version
PDF
Comentarios
Es posible que se hayan omitido algunos comentarios considerados poco constructivos
1.  Re: Nuevo buscador del Web Bulma basado en htDig (08/03/2002 02:07, #5123)
  Por: Antonio
Me gusta este software, pero me podrían decir como instalarlo para mi pagina en una intranet el HTDIG.
No es pot respondre
 
2.  Re: Nuevo buscador del Web Bulma basado en htDig (19/04/2002 13:12, #5790)
  Por: Portosss
Muchas gracias por permitir dejar ver los archivos de configuración del htdig, llevo días aprendiendo a manejar este programa y aunque he leido muchos manuales,casi todos en ingles, aun me queda mucho por aprender.Muchas Gracias
No es pot respondre
 
3.  Re: Nuevo buscador del Web Bulma basado en htDig (10/09/2004 14:21, #23236)
  Por: espi.net
Esto del htdig en español es un lío...

"Los ejecutables que están son el resultado de unas pequeñas modificaciones al String.cc y htString.h para que ignore los acentos."

Sería posible disponer de esos dos archivos con sus modificaciones?? (String.cc y htString.h) es que estos ejecutables me dan errores con librerías, supongo que porque se compilaron en otras condiciones y si tengo el string.cc u htString.h puedo compilar y todos contentos... espero...

sigo pensando que esto del htdig está un poco jodio para el español, y aunque hay indicaciones muy claras (externas), la realidad es que cuando no falla una cosa falla otra. A ver si algún día tenemos suerte!!! :-D

Muchas gracias!!!!!!!!
No es pot respondre
 
GRACIAS
Distribuciones Universal
Por el servidor
Dpto. de Matematicas e Informatica
Calificacion
**00
Vots: 9
Danos tu opinion:
**** Excelente
***0 Muy Bueno
**00 Bueno
*000 Regular
0000 Malo
Relacionados
. Pequeñas mejoras en las búsquedas en Bulma
. El web de BULMA ahora cuenta los accesos a los artículos
SECCIONES
Noticia
Breve
Truco
Enlace
Participa
Proyecto
Articulo
Webbulma
Manoletada :-)
Seguridad
Modificado: 20/4/2007 21:04:36 | Tiempo Total: 0.023 segs | Kernel: Linux - i686 - 2.6.26-2-686 | Last boot: too much time ago!!
Powered by Apache    MySQL    PHP    Gimp