Como descargar la Wikipedia en varios pasos, para usar sin conexión
NorfiPC
NorfiPC » Descargar » Descargar la Wikipedia

Como descargar la Wikipedia en varios pasos, para usar sin conexión



Bajar todos los archivos ZIM de la Wikipedia, por partes con Wget, para consultarla en la computadora offline, con el lector Kiwix. Tiempo de descarga en distintas conexiones.
Como descargar la Wikipedia en varios pasos, para usar sin conexión
Muchos de nosotros necesitamos consultar regularmente información en la Wikipedia y es de mucha utilidad tenerla en la computadora o en el móvil, para buscar datos y leerlos sin conexión a internet.
El principal obstáculo para hacerlo, es el enorme tamaño de la base de datos que es necesario descargar.
En este artículo compartimos como descargar estos archivos gradualmente por partes, con una aplicación gratis llamada Wget y un pequeño archivo batch creado por el autor, que facilita esta tarea.



Usar la Wikipedia sin conexión a internet


La Wikipedia es el principal proyecto colaborativo libre de internet, para compartir información.
En sus páginas podemos encontrar respuestas a casi cualquier interrogante y datos sobre cualquier tema, todos aportados por decenas de miles de personas.
Cada día se agregan nuevas páginas, por lo que su base de datos crece regularmente.
Esto hace cada vez más difícil descargar sus archivos, para disponer de la enciclopedia offline.
En el momento de la publicación de este artículo, el archivo comprimido de la Wikipedia entera en español, ocupa 19 Gigabyte de datos.
También existe la opción para los que le resulte excesivo esta cantidad, de descargar solo el contenido de texto, sin imágenes.
En ese caso el tamaño es de 8.90 Gb.



Kiwix, lector de la Wikipedia offline


Para acceder a la Wikipedia online, usamos cualquier navegador web entrando directamente a su sitio.
Para leerla offline necesitamos un pequeño programa llamado Kiwix, que también permite leer otros proyectos similares de esta fundación u otros basados en MediaWiki (formato de la Wikipedia).
Kiwix (45 MB) es un lector de archivos en formato ZIM, archivos comprimidos que contienen la base de datos de la Wikipedia.
Se puede descargar gratis desde la página del proyecto en: https://www.kiwix.org/



Como descargar la Wikipedia completa


Para descargar todos los archivos y páginas de la Wikipedia y consultarla sin conexión en la computadora o en el móvil, con la aplicacion Kiwix, tenemos diferentes opciones, que explicamos a continuación.

Descargar la Wikipedia con Kiwix

Kiwix además de funcionar como lector offline de proyectos creados con MediaWiki, nos permite descargar a la computadora desde internet, cualquiera de ellos.
Solo necesitamos instalar la aplicación y desde su biblioteca explorar los archivos disponibles para descargar, tanto de la Wikipedia como de otros proyectos.
Solo necesitamos usar el botón "Obtener nuevos archivos" y ordenarlos por el idioma español.
A continuación usar el botón "Download" en el archivo seleccionado.
Explorar la biblioteca de Kiwix para descargar la Wikipedia
Esta opción es poco práctica cuando se trata de archivos de proyectos grandes, como la Wikipedia, si no contamos con una conexión de internet de alta velocidad.
La interrupción de la conexión por cualquier causa, puede malograr el tiempo invertido.



Descargar manualmente los archivos de la Wikipedia

Una segunda opción es descargar el archivo comprimido de la Wikipedia, disponible en la página de descargas de sitio de Kiwix, mediante el navegador web o con un gestor de descarga.
Allí también veremos los enlaces a otros proyectos similares.
Enlaces de descarga de la Wikipedia con y sin imágenes, en el sitio de Kiwix.
Enlaces de descarga de la Wikipedia
También tenemos la alternativa de descargarlo usando un Torrent.
Torrent es un sistema de descarga en el que intervienen varios equipos conectados a la red, incluyendo el nuestro.
Para usarlo debemos instalar un programa en nuestra computadora y a partir de ese momento esta se convertirá un nodo en la red, que coopera tanto en la descarga como proporcionando un punto de apoyo en la red, al que acudirán otros internautas.
Esta alternativa se recomienda solo a los que están familiarizados con la descarga de torrens.



Descargar los archivos ZIM o DUMPS desde la Wikipedia

Algo similar a la opción anterior, consiste en explorar todos los archivos ZIM o DUMPS, disponibles en el sitio de la Wikipedia.
Los archivos están ordenados por su idioma.
Explora esta opción con el siguiente enlace:
Archivos de descarga en Wikipedia


Tiempo de descarga de la Wikipedia

El tiempo de descarga de la Wikipedia en español, depende del ancho de banda y velocidad de nuestra conexión a internet.
A continuación mostramos algunos ejemplos del tiempo estimado de descarga, en diferentes conexiones.
Velocidad conexiónWikipedia completaWikipedia sin imágenes
1 Mbps42 horas20 horas
2 Mbps21 h10 h
4 Mbps11 h5 h
24 Mbps2 h1h
Se comprende que los afortunados que dispongan de una conexión de más de 20 Mbps, pueden descargar la Wikipedia directamente usando su navegador, sin tener que emplear métodos alternos.



Descargar la Wikipedia con Wget


Después de explicar todo lo que debemos conocer, llegamos al objetivo principal de este artículo, que es el método que yo utilizo para descargar la Wikipedia.
Consiste en usar Wget, un pequeño gestor de descarga gratis y un archivo batch que lo inicia, para descargar sus archivo comprimidos por partes.
Es decir descargar secciones, teniendo la opción de interrumpir en cualquier momento la descarga y reanudarla más tarde.
También podemos especificar el ancho de banda que usará la aplicación, para poder realizar otras tareas al mismo tiempo, sin que nos afecte esta operación.
A continuación explicamos cómo hacerlo paso por paso.

Descargar la Wikipedia por partes

1- Descarga la última versión de Wget para Windows (3.2 MB), en la siguiente página:
https://eternallybored.org/
En la página de descarga selecciona la versión más reciente y el sistema operativo.
2- Descomprime el archivo y copia el ejecutable "wget64.exe" a cualquier carpeta, en una unidad con suficiente espacio libre.
3- A continuación descarga uno de los siguientes archivos batch creados por el autor, para esta tarea:
Descomprime el archivo y copia "descargar-wikipedia.cmd" a la misma carpeta donde se encuentra Wget.
4- Dos clics en el archivo batch para comenzar la descarga.
Se abrirá la ventana del Símbolo del sistema, donde se puede ver la operación de descarga, incluyendo el porciento, el tamaño de los archivos descargados, el tamaño del archivo original y el tiempo pendiente estimado de descarga.
Ventana del Símbolo del sistema, con información de la operación de la descarga de la Wikipedia con Wget
Ventana del Símbolo del sistema
Minimiza la ventana para realizar otra tarea.
En cualquier momento se puede cerrar la ventana de la aplicación, para detener la operación de descarga.
Para reanudarla solo necesitamos ejecutar nuevamente el archivo batch, la operación continuará en el punto exacto donde la dejamos, aunque nos desconectemos de internet, aunque reiniciemos el equipo o aunque pasen varios días sin usarlo.

Modificar y configurar el archivo batch

Los archivos batch que compartimos para descargar la Wikipedia, contienen la ruta de descarga a los archivos de la Wikipedia desde el sitio de Kiwix y limitan la velocidad de la descarga a 500 KB/s (kilobytes por segundo).
Los que necesiten modificar estos valores pueden editarlos facilmente.
Para hacerlo solo necesitamos abrir el archivo batch con el Bloc de notas de Windows u otro editor de texto plano similar y después guardar los cambios.
El código que usan es el siguiente:
@echo off
cd
wget64.exe --secure-protocol=auto  --no-check-certificate -c  --limit-rate=500k http://download.kiwix.org/zim/wikipedia_es_all.zim
PAUSE

Descargar otros archivos con Wget

La dirección URL predeterminada, se puede reemplazar en el archivo batch para descargar cualquier otro archivo Kiwix de otro proyecto similar, como puede ser el Wikcionario, WikiViajes, la Biblioteca Gutenberg o cualquier otro disponible.

Modificar la velocidad de descarga

La opción "--limit-rate=500k" en el archivo batch, le indica a Wget la velocidad máxima de la conexión que puede emplear.
Podemos eliminar esta opción o adecuarla a la velocidad de nuestra conexión.
Por ejemplo:
Los que desean que Wget solo ocupe el 70% del ancho de banda de su conexión, para poder hacer otras tareas al mismo tiempo, pueden usar los siguientes valores, de acuerdo a su conexión:
Conexión de 1 Mbps (125 KB/s) - 87
Conexión de 2 Mbps (250 KB/s) - 175
Conexión de 4 Mbps (500 KB/s) - 350
Conexión de 8 Mbps (1000 KB/s) - 750
Conexión de 16 Mbps (2000 KB/s) - 1400
Conexión de 24 Mbps (3000 KB/s) - 2100
El resto de los valores del batch no se deben modificar, porque permiten la descarga continua (-c) y usar el protocolo HTTPS.
El valor PAUSE mantiene la ventana abierta al concluir la descarga.

Explorar la Wikipedia sin conexión con Kiwix


Después de descargar el archivo de la Wikipedia, debemos de descomprimirlo.
En su interior, en la carpeta "data/content" se encuentran los archivos ZIM de la base de datos de la enciclopedia.
También se incluyen los archivos de instalación de Kiwix, el lector de la Wikipedia, para distintos sistemas operativos.
Para instalarlo en Windows, solo necesitamos ejecutar "kiwix.exe" y comenzar a navegar por la enciclopedia libre.

Usar la Wikipedia en el móvil


Después de haber descargado la Wikipedia para usar en la computadora, podemos transferir la base de datos a un dispositivo móvil con Android.
Antes de eso debemos instalar la aplicación móvil de Kiwix para Android, disponible en Google Play.

Otros proyectos similares a Wikipedia


Otros proyectos que usan el mismo formato de la Wikipedia y se pueden descargar para consultarlos offline, son los siguientes:
Wikcionario. Proyecto de diccionario libre de la Fundación Wikipedia, que contiene definiciones, traducciones, etimologías, sinónimos y pronunciaciones de palabras en múltiples idiomas.
WikiViajes. Guía turística libre.
WikiSource. Biblioteca de textos originales libres, que sean de dominio público; junto con su traducción en distintas lenguas.
Wikilibros. Colección de libros de texto, manuales y otros textos pedagógicos de contenido libre.
WikiQuote. Colección de citas célebres de personajes famosos, libros y proverbios.
WikiSpecies. Directorio libre de especies. Cubre los animales, plantas, hongos, bacterias, arqueas, protistas y otras formas de vida.
Wikipedia Médica. Enciclopedia de Wikipedia, con información relacionada con la medicina y la salud.
Wikinoticias. Proyecto de noticias en una gran variedad de temas, con un punto de vista neutral.
Wikiversidad. Proyecto dedicado a materiales y comunidades de aprendizaje así como de investigación.
Proyecto Gutenberg. Biblioteca de libros electrónicos gratuitos en formato EPUB.
Vikidia. Proyecto con contenidos similares a Wikipedia, pero con un lenguaje más sencillo y comprensible.
Todos estos proyectos se pueden descargar para usar offline, con el software Kiwix.

Páginas relacionadas



Buscar en este sitio


Comparte esta página




Sígueme en las redes sociales








Comenta o lee lo que otros opinan
 
Inicio | Mapa del sitio | Sobre mí | Notificaciones | RSS