Post by Adminstr. on Jun 15, 2012 6:42:38 GMT -5
Tengo intención de poner en abierto todo tipo de tecnicas para escaneadores. De momento hago una nota rápida para contestar a un mensje privado....
---------------------------------
NOTAS PARA NOVATOS EN ESCANEAR:
---------------------------------
[1]
Buscar en la red una copia de FINE READER, y aprender a manejarlo (es fácil y tiene un help/ayuda muy completo). Comparado con él, los demás OCRs no valen nada (y el soft que regalan con el scanner es una mierda).
[2]
A la hora de a escanear...
---En las opciones del Fine Reader poner que detecte orientación de las páginas, y que separe las páginas dobles.
---En el gestor del propio scaner poner modo BLANCO Y NEGRO (o TEXTO, si tiene ese modo), con resolución a 300 dpi. De esta forma irá a la máxima velocidad y con resultados óptimos en el Fine Reader. No usar modos de grises ni de color (van mucho más lentos y no aportan nada al texto). Para textos con letra muy muy muy pequeña... súbase la resolución a 400 dpi.
---Luego al empezar el escaneo ajusta dentro del Fine Reader que los números de las páginas escaneadas sincronicen con los del libro (con un simple click en un número lo deja cambiar) para no equivocarse y así no repetir páginas ni saltarselas.
[3]
Al acabar de escanear... mandar al fine reader que LEA el lote de lo escaneado.
Y cuando termine hay que ojear personalmente página a página (tecla: ALT y "CURSOR ABAJO") para:
---MARCAR LAS CABEZERAS DE CAPÍTULOS (con rayas ______ o lo que quieras)
---MARCAR LAS PAUSAS (con asteriscos * * * o lo que quieras) (Habrás de insertarla al comienzo del nuevo párrafo pues el Fine Reader no es una gran maquetador de textos, ya luego en encargado de revisar/maquetar lo pondrá bonito).
---MARCAR LAS ZONAS ESPECIALES (yo uso [[ ... ]] pero inventa lo que quieras) para que luego el encargado de revisar el texto le preste especial atención a esa zona: versos, canciones, citas, tablas, esquemas, imagenes, y notas-a-pie-de-pagina (que, por cierto, quiza convenga convertir en notas-a-pie-de-párrafo, aunque hay opiniones contrarias sobre a ese asunto).
---VIGILAR QUE NO HAYA ERRORES MASIVOS (por algún manchón en los bordes o por alguna pasada borrosa).
---En caso de pifias de algún encuadre del Fine reader (que se salte lineas o que monte on follón de rayas quebradas) entonces hacer uno mismo el encuadre (es el recuadro verde) y mandarle leer ESA pagina.
[4]
Exportar el contenido a un archivo RTF con las siguientes opciones: Un único archivo para todas las páginas, y que se conserve SOLO "fuentes y tamaños" (NO elegir "conservar distribución de la pagina", pues luego crea mucho embrollo en el World).
[5]
Desde el microsoft World o cualquier editor que contenga diccionario corrector... leer y maquetar el documento. Si se han hecho los pasos anteriores ahora será MUY FÁCIL, de lo contrario será mucho mas dificil y pesado (pues habría que andar consultando las imagenes escaneados para resolver dudas)
[6]
A la hora de subir a la red el ebook acabado puede hacerse en cualquier formato FINALISTA (pdf, epub, fb2, lit,...) pero DEBE SUBIRSE TAMBIÉN el formato BÁSICO que hayas editado (DOC o RTF), para que en un futuro los usuarios puedan hacer conversiones a otros formatos válidos para sus máquinas.
Los complementos (portadas, reseñas, comentarios...) son opcionales.
Si piensas dejar dentro del texto imágenes o links entoces usa el DOC; pero si te interesa un archivo más pequeño y universal (que funcione en cualquier plataforma y que se deje convertir bien a cualquier formato) entonces prescinde de imagenes (o ponlas exentas al archivo) y grábalo como RTF; luego lo abres con el pequeño editor que viene de regalo con el sistema "WORDPAD" (no confundirlo con el note-pad) y lo vuelves a grabar como RTF (así obtendrás un RTF version 1.0 o casi, que es lo más elemental que podréis conseguir en Windows).
---------------------------------
NOTAS PARA NOVATOS EN ESCANEAR:
---------------------------------
[1]
Buscar en la red una copia de FINE READER, y aprender a manejarlo (es fácil y tiene un help/ayuda muy completo). Comparado con él, los demás OCRs no valen nada (y el soft que regalan con el scanner es una mierda).
[2]
A la hora de a escanear...
---En las opciones del Fine Reader poner que detecte orientación de las páginas, y que separe las páginas dobles.
---En el gestor del propio scaner poner modo BLANCO Y NEGRO (o TEXTO, si tiene ese modo), con resolución a 300 dpi. De esta forma irá a la máxima velocidad y con resultados óptimos en el Fine Reader. No usar modos de grises ni de color (van mucho más lentos y no aportan nada al texto). Para textos con letra muy muy muy pequeña... súbase la resolución a 400 dpi.
---Luego al empezar el escaneo ajusta dentro del Fine Reader que los números de las páginas escaneadas sincronicen con los del libro (con un simple click en un número lo deja cambiar) para no equivocarse y así no repetir páginas ni saltarselas.
[3]
Al acabar de escanear... mandar al fine reader que LEA el lote de lo escaneado.
Y cuando termine hay que ojear personalmente página a página (tecla: ALT y "CURSOR ABAJO") para:
---MARCAR LAS CABEZERAS DE CAPÍTULOS (con rayas ______ o lo que quieras)
---MARCAR LAS PAUSAS (con asteriscos * * * o lo que quieras) (Habrás de insertarla al comienzo del nuevo párrafo pues el Fine Reader no es una gran maquetador de textos, ya luego en encargado de revisar/maquetar lo pondrá bonito).
---MARCAR LAS ZONAS ESPECIALES (yo uso [[ ... ]] pero inventa lo que quieras) para que luego el encargado de revisar el texto le preste especial atención a esa zona: versos, canciones, citas, tablas, esquemas, imagenes, y notas-a-pie-de-pagina (que, por cierto, quiza convenga convertir en notas-a-pie-de-párrafo, aunque hay opiniones contrarias sobre a ese asunto).
---VIGILAR QUE NO HAYA ERRORES MASIVOS (por algún manchón en los bordes o por alguna pasada borrosa).
---En caso de pifias de algún encuadre del Fine reader (que se salte lineas o que monte on follón de rayas quebradas) entonces hacer uno mismo el encuadre (es el recuadro verde) y mandarle leer ESA pagina.
[4]
Exportar el contenido a un archivo RTF con las siguientes opciones: Un único archivo para todas las páginas, y que se conserve SOLO "fuentes y tamaños" (NO elegir "conservar distribución de la pagina", pues luego crea mucho embrollo en el World).
[5]
Desde el microsoft World o cualquier editor que contenga diccionario corrector... leer y maquetar el documento. Si se han hecho los pasos anteriores ahora será MUY FÁCIL, de lo contrario será mucho mas dificil y pesado (pues habría que andar consultando las imagenes escaneados para resolver dudas)
[6]
A la hora de subir a la red el ebook acabado puede hacerse en cualquier formato FINALISTA (pdf, epub, fb2, lit,...) pero DEBE SUBIRSE TAMBIÉN el formato BÁSICO que hayas editado (DOC o RTF), para que en un futuro los usuarios puedan hacer conversiones a otros formatos válidos para sus máquinas.
Los complementos (portadas, reseñas, comentarios...) son opcionales.
Si piensas dejar dentro del texto imágenes o links entoces usa el DOC; pero si te interesa un archivo más pequeño y universal (que funcione en cualquier plataforma y que se deje convertir bien a cualquier formato) entonces prescinde de imagenes (o ponlas exentas al archivo) y grábalo como RTF; luego lo abres con el pequeño editor que viene de regalo con el sistema "WORDPAD" (no confundirlo con el note-pad) y lo vuelves a grabar como RTF (así obtendrás un RTF version 1.0 o casi, que es lo más elemental que podréis conseguir en Windows).