Aller au contenu
Ce billet
  • billets
    10
  • commentaires
    16
  • vues
    6 002

Trouver des livres de poker sur le net - le retour

ricomico

330 vues

Déjà, merci pour vos retours sur On va voir rapidement comment est fait un site internet et comment on peut se servir des informations qu'on a à notre disposition pour notre objectif ultime : trouver des livres de poker scannés sur internet.

Déjà quelques petites définitions

Comment s'est fait un site ? Pour faire simple, c'est un ensemble de pages écrites en langage web. Ces pages sont stockées sur un serveur, l'équivalent d'un disque dur. Quand on veut voir une page d'un site, par exemple une page de clubpoker, on demande en fait au serveur de nous envoyer la page par internet. Et on affiche la page avec un logiciel qui sait la décoder. Ce logiciel c'est le navigateur (Internet Explorer, Mozilla Firefox, Google Chrome, Safari etc.).

Ces pages sont codées en HTML, et le navigateur comprends ce langage et affiche ce qu'il faut où il faut (enfin normalement, car tous les navigateurs ne comprennent pas toujours le HTML de la même façon, c'est ce qui fait qu'un menu est parfois décalé avec Internet Explorer mais pas avec Firefox, ou qu'une vieille version d'Internet Explorer, comme IE6, pose problème aux webmasters... mais là on s'éloigne du sujet). Donc en résumé :

  • un navigateur (par exemple Internet Explorer, Mozilla Firefox, Google Chrome) : c'est un logiciel qui permet de comprendre une page codée en langage web, comme le HTML, et de l'afficher correctement.
  • un serveur : c'est comme un disque dur où est stocké tout ce qu'il faut pour afficher un site entier (c'est à dire l'ensemble des pages du site, les images, mais aussi des feuilles de style, des feuilles de scripts, etc.)
  • une page web : la page qui va être ouverte par le navigateur. Elle est stockée sur le serveur et codée en langage web, comme le HTML.
  • HTML : c'est un langage compréhensible par le navigateur. Il indique des informations sur l'affichage (comme par exemple "affiche moi le logo du site en haut à gauche") et du texte qui sera affiché. Si vous voulez voir à quoi ça ressemble, faites CTRL + U avec Google Chrome et Firefox, ou Affichage > Source avec Internet Explorer. Mais bon en fait ça nous servira pas donc pas besoin de s'embrouiller avec ça.

    Du coup sur le serveur on trouve différents documents : des pages web, des feuilles de style (pour dire par exemple "le fond sera en blanc"), des images, etc. Et que va faire le webmaster pour s'y retrouver ? Il va classer les types de documents dans des dossiers, par exemple les images dans un dossier "image". C'est comme sur votre disque dur, avec un dossier "film", un dossier "photo", dans ce dossier "photo" un dossier "anniversaire de tata Suzette".
    Donc si maintenant le webmaster met à disposition des internautes des livres de poker scannés, il va surement les mettre dans un dossier "books" ou "livre" ou "poker". Notre but, quand on va trouver un livre de poker scanné grâce à nos recherches sur internet, va être de voir où est situé ce document sur le serveur (dans quel dossier) pour ensuite aller voir dans le dossier si on a pas d'autres livres.


    Connaître l'URL d'un document à partir de Google

    Pour connaitre dans quel dossier est situé le document, on va chercher son URL. On va prendre un exemple, tapons la requête suivante sur Google : "harrington filetype:pdf" et regardons le quatrième résultat non commercial (c'est-à-dire sur fond blanc, pas sur fond jaune). Il s'agit du premier livre scanné sur le poker de tournoi. Le titre du document est : "[PDF] Harrington on Hold'em Vol I" (le titre est en écriture bleue). En cliquant sur ce titre, on va ouvrir le document. Bien, on a trouvé un livre, on va voir si sur ce site il y en a d'autres. On reste donc sur la page de résultat Google.
    • avec Internet Explorer : on clique droit sur le lien "[PDF] Harrington on Hold'em Vol I" et on fait "Copier le raccourci"
    • avec Firefox et Chrome : on clique droit sur le lien et on fait "Copier l'adresse du lien"
      Ensuite on ouvre le bloc-note de Windows, et on colle le lien qu'on a copié précédemment. On obtient une phrase qui commence par "http://www.google.fr/url?" et finie par une suite de chiffres, de lettres et de tirets. Dans cette phrase on va enlever ce qui ne nous intéresse pas :

    1. on recherche la partie "url=" dans la phrase et on supprime tout le début de la phrase du "http://www.google.fr" jusqu'à cette "url=" (que l'on supprime également). Notre phrase doit maintenant commencer par http:/
    2. on remplace ':' par deux points ':' et '/' par slash '/'. Dès qu'on arrive au dernier '/' on s'arrête
    3. on supprime la fin de la phrase après le dernier '/' (qu'on viendra de remplacer par un slash '/')

    Au final dans notre exemple, la phrase devrait commencer par "http://domi" et se terminer par "pokerbooks/". OK, et qu'est ce qu'on fait avec cette phrase maintenant ? C'est la meilleure partie ! On va explorer le dossier.

    Explorer un dossier

    Quand vous avez une URL du type site.com/dossier_1/fichier_1, en général sur le serveur on a un dossier général, dans celui-ci un dossier nommé dossier_1 et dans celui-ci un fichier nommé fichier_1. L'URL correspond (en général) à la disposition des dossiers et fichiers sur le serveur. C'est exactement comme sur votre poste de travail (D:\perso\musique\ correspond au dossier musique qui est comprise dans le dossier perso qui est compris sur la partition D).

    Quand on va taper l'URL dans le navigateur (c'est la phrase qu'on a trouvée tout à l'heure), comme on ne demande pas de fichier particulier (on s'est arrêté au dernier slash sans demander de fichier ensuite), le serveur va nous renvoyer la liste des dossiers et documents contenus dans le dossier. On va donc avoir accès à toute la liste des documents présents dans le dossier et les consulter. C'est bien ce qu'on voulait faire. Cool non ? En trouvant le premier document, on a pu deviner l'URL du dossier qui le contenait et voir la liste des documents présents dans ce dossier (15 documents ici).

    Quelques remarques à savoir

    Il n'est pas toujours possible d'avoir la liste des documents contenus dans un dossier. En général, le webmaster n'a aucun intérêt à laisser à la vue de tout le monde ce qui est contenu sur serveur (sauf si on souhait partager ces documents).

    [*]Protection des dossiers par fichier d'index : que fait le serveur quand on lui demande la liste d'un dossier ? Il cherche d'abord un fichier web nommé "index" et si le trouve, renvoi uniquement ce fichier. C'est quand il ne le trouve pas qu'il renvoie la liste des fichiers. Si quand vous tapez l'URL vous avez une page blanche, c'est surement que le webmaster a mis en place cette protection, et que vous recevez la page d'index (même si elle est vide, elle sera renvoyée. Comme elle est vide, elle n'affiche rien, c'est la page blanche). Un petit détail, quand vous tapez l'URL d'un site, par exemple http://www.clubpoker.net, le serveur cherche lui aussi la page d'index dans le répertoire principal et renvoie la page d'index. La preuve, tapez https://www.clubpoker.net/index.php, vous avez bien le même résultat[*]Protection des dossiers par login et mot de passe : quand le webmaster met ce type de protection, vous aurez une page avec un "403 forbidden"

    Les dossiers peuvent aussi ne pas exister physiquement, car on peut manipuler le serveur pour que quand on cherche site.com/dossier_1/fichier_1 il renvoie un fichier situé dans le répertoire principal, par exemple fichier_réécrit. Le dossier dossier_1 n'existe donc pas réellement, et quand on cherche l'affichage on tombe sur une erreur "404 Page introuvable".

    Quelques parades

    Dès qu'on a trouvé un livre de poker sur un site, il y en a généralement d'autres. Même si l'affichage des dossiers ne donne rien (par exemple le webmaster a protégé son dossier), il existe quand même quelques solutions.

    On peut se resservir des requêtes Google, et particulièrement de "site". Elle permet de restreindre l'affichage des recherches de Google à un seul site. On peut bien sur la combiner avec d'autres commandes, comme filetype. Ce qui donnerait pour notre exemple :

    site:nom_du_site filetype:pdf

    Voilà, hésitez pas à poser des questions si c'est pas clair. Je ferais peut être une troisième partie avec un cas concret.



0 Commentaire


Commentaires recommandés

Aucun commentaire à afficher.

Créer un compte ou se connecter pour commenter

Vous devez être membre afin de pouvoir déposer un commentaire

Créer un compte

Créez un compte sur notre communauté. C’est facile !

Créer un nouveau compte

Se connecter

Vous avez déjà un compte ? Connectez-vous ici.

Connectez-vous maintenant

English
Retour en haut de page
×
PokerStars : SCOOP
PokerStars : SCOOP