[Linux] Copier un site web avec HTTrack

Si comme moi vous souhaitez héberger votre propre copie de WikiLeaks sans pour autant laisser un accès (même minimal) à votre serveur, cet article est fait pour vous! Cette fois ci, nous n’allons pas utiliser Wget mais HTTrack. HTTrack est aspirateur de site web: c’est à dire qu’il va créer une copie locale du site web souhaité.

1. Installation

C’est sans doute l’étape la plus simple. Ouvrez un terminal et exécutez-y cette commande:

[PluXML] L'URL Rewriting avec Nginx

NB: J’ai également publié ce tutoriel sur le Wiki de PluXML. Toutes les modifications ou améliorations sont les bienvenues.

Vous souhaitez activer l’URL Rewriting de PluXML mais vous possédez Nginx? Voici la marche à suivre. Commencez par éditer le fichier qui contient les paramètres de votre serveur:

sudo nano /etc/nginx/sites-available/default

Puis ajoutez ces lignes entre server { et }:

# On cache le fichier version:
location /version {
  return 404;
}
# Et on défini les règles pour l'URL Rewriting:
if (!-f $request_filename){
  set $rule_0 1$rule_0;
}
if (!-d $request_filename){
  set $rule_0 2$rule_0;
}
if ($request_filename !~ "-l"){
  set $rule_0 3$rule_0;
}
if ($rule_0 = "321"){
  rewrite /([feed\/].*)$ /index.php? last;
}
rewrite /feed\/(.*)$ /feed.php? last;

Puis redémarrez Nginx:

Le pouvoir d’Internet

Si vous vous informez, vous aurez sûrement remarqué qu’en ce moment un site fait le buzz du ramdam: WikiLeaks. Tout d’abord, WikiLeaks c’est quoi? Et bien c’est un site qui récupère des documents top secret des gouvernements et qui les publies sur le web. On peut par exemple apprendre qu’un certain « Nicolas S. » préfèrerait le modèle Américain (vive les hôpitaux payants) au bon vieux modèle Français (celui qui consiste à ne jamais être content).

Le tutoriel sur l’auto-hébergement est en ligne!

Comme vous l’avez peut-être remarqué, une nouvelle page à fait son apparition sur le site, la page Auto-hébergement. Dans cette page, vous apprendrez à installer un serveur web et à le configuré de telle façon à ce qu’il consomme le moins de bande passante possible (pour éviter la saturation de votre ligne ADSL) et à le sécuriser (de nombreux robots trainent sur le web à la recherche de serveurs à malmener).

httpS://www.quent1.fr est maintenant accessible!

Vous ne l’attendiez pas, le voilà! Quent1.fr dispose maintenant de sa version https! J’utilise un certificat gratuit généré par la CAcert, une autorité qui délivre des certificats SSL gratuitement (mais qui ne sont pas reconnus par la majorité des navigateurs web). Je vous invite donc à autoriser les certificats dans votre navigateur et à me rapporter les éventuels bugs que vous pourriez rencontrer.