Le Web

Ajouter à mes favoris

Introduction

Le WorldWideWeb

Le "World Wide Web", plus communément appelé "Web" a été développé au CERN par le Britannique Sir Timothy John Berners-Lee et le Belge Robert Cailliau au début des années 90. À cette époque les principaux centres de recherche mondiaux étaient déjà connectés les uns aux autres, mais pour faciliter les échanges d'information Tim Berners-Lee met au point le système hypertexte. Le système hypertexte permet, à partir d'un document, de consulter d'autres documents en cliquant sur des mots clés. Ces mots "cliquables" sont appelés hyperliens et sont souvent soulignés et en bleu. Ces hyperliens sont plutôt connus aujourd'hui sous le simple terme de "liens".

Une chose très importante à bien avoir à l'esprit : beaucoup de personnes confondent "web" et "internet". Même si le "web" "s'appuie" sur internet, les deux choses n'ont rien à voir puisqu'"internet" est un "réseau de réseaux" s'appuyant sur le protocole IP alors que, comme nous venons de le voir, le web est la combinaison de trois technologies : HTTP, URL et HTML. D'ailleurs on trouve autre chose que le "web" sur internet, par exemple, les emails avec le protocole SMTP (Simple Mail Transfert Protocol) et les transferts de fichiers avec le protocole FTP (File Transfert Protocol).

Architecture client / serveur

Comme la plupart des services d’Internet, le Web repose sur une architecture client / serveur : pour obtenir une page Web, le client la demande au serveur qui la détient.

N'importe quel type d'ordinateur peut jouer le rôle de serveur, mais dans le monde professionnel les serveurs sont des machines spécialisées conçues pour fonctionner 24h sur 24h. Ils peuvent aussi avoir une grosse capacité de stockage afin de stocker un grand nombre de ressources (vidéos, sons,...).

 Une fois la liaison établie, le client et le serveur vont échanger des informations en dialoguant :

  1. client : bonjour www.google.fr, pourrais-tu m'envoyer le fichier index.html

  2. serveur : OK client, voici le fichier index.html

  3. client : je constate que des images, du code css sont utilisés, peux-tu me les envoyer

  4. serveur : OK, les voici

Évidemment ce dialogue est très imagé, mais il porte tout de même une part de « vérité ».

Google, Amazon ou encore Facebook possèdent un très grand nombre de serveurs afin de pouvoir satisfaire les demandes des utilisateurs en permanence. Ces entreprises possèdent d'immenses salles contenant chacune des centaines ou des milliers de serveurs



Les URL

Dans la barre d'adresse de votre navigateur web vous trouverez, quand vous visitez un site, des choses du genre : "https://eduno.fr/blog/cours-2/post/le-web-162". Nous aurons l'occasion de reparler du "https" et du "eduno.fr" plus tard.

La partie "/blog/cours-2/post/le-web-162" s'appelle une URL.

Une URL (Uniform Resource Locator) permet d'identifier une ressource (par exemple un fichier) sur un réseau.

L'URL indique « l'endroit » où se trouve une ressource sur un ordinateur. Un fichier peut se trouver dans un dossier qui peut lui-même se trouver dans un autre dossier... On parle d'une structure en arborescence, car elle ressemble à un arbre à l'envers.


Chemin absolu ou chemin relatif ?

Pour indiquer la position d'un fichier (ou d'un dossier) dans l'arborescence, il existe 2 méthodes : indiquer un chemin absolu ou indiquer un chemin relatif. Le chemin absolu doit indiquer « le chemin » depuis la racine. Par exemple l'URL du fichier fichier3.jpg sera : /dossier2/dossier3/fichier3.jpg

Remarquez que nous démarrons bien de la racine / (attention les symboles de séparation sont aussi des /).

Autre représentation un peu plus "jolie" :

Activité

Donnez le chemin absolu permettant d'atteindre le fichier "fichier6.html".

Protocole HTTP

Revenons sur l'adresse qui s'affiche dans la barre d'adresse d'un navigateur web et plus précisément sur le début de cette adresse c'est-à-dire le "http". Selon les cas cette adresse commencera par http ou https. Le protocole HTTP va permettre au client d'effectuer des requêtes à destination d'un serveur web. En retour, le serveur web va envoyer une réponse.

Voici un exemple de requête HTTP :

GET /mondossier/monFichier.html HTTP/1.1
User-Agent : Mozilla/5.0
Accept : text/html

Une fois la requête reçue, le serveur va renvoyer une réponse, voici un exemple de réponse du serveur :

HTTP/1.1 200 OK
Date: Thu, 15 feb 2019 12:02:32 GMT
Server: Apache/2.0.54 (Debian GNU/Linux) DAV/2 SVN/1.1.4
Connection: close
Transfer-Encoding: chunked
Content-Type: text/html; charset=ISO-8859-1
<!doctype html>
<html lang="fr">
<head>
<meta charset="utf-8">
<title>Voici mon site</title>
</head>
<body>
 <h1>Hello World! Ceci est un titre</h1>
<p>Ceci est un <strong>paragraphe</strong>. Avez-vous bien compris ?</p>
</body>
</html>

Le "HTTPS" est la version "sécurisée" du protocole HTTP. Par "sécurisé" en entend que les données sont chiffrées avant d'être transmises sur le réseau. Seul le possesseur de la clé de déchiffrement sera en mesure de lire les données transmises sur le réseau. D'un point vu strictement pratique il est nécessaire de bien vérifier que le protocole est bien utilisé (l'adresse commence par "https") avant de transmettre des données sensibles (coordonnées bancaires...).

 

Les langages du Web

HTML

Les premières pages Web sont des pages statiques, c’est-à-dire que la page retournée par le serveur ne dépend pas du client.Le premier langage du Web est HyperText Markup Language qui est un langage de description de documents à l’aide de balises.

HTML permet de définir la structure d’un document en le découpant en blocs logiques délimités par une <balise> ouvrante et une </balise> fermante.En particulier il permet de créer des liens hypertextes entre deux blocs d’un même document ou de documents différents.


CSS

Les pages statiques sont écrites en HTML et en CSS qui est un langage de feuille de style utilisé pour décrire la présentation d’un document écrit en HTML. La standardisation du CSS a souffert de la guerre des navigateurs à la fin des années 1990 mais CSS s’est imposé ensuite comme un complément indispensable de HTML.

HTML décrit la structure du document et CSS définit son apparence. Le fond et la forme sont ainsi séparés. D’ailleurs, le code CSS, même s’il peut être intégré au code HTML, est plutôt dans une feuille de style séparé liée au document HTML par une balise <link rel="stylesheet" href="feuille_style.css">.

JS, PHP, Python, etc...

A partir de la fin des années 1990, avec le développement du commerce en ligne, apparaissent des langages permettant de dynamiser les pages Web.

PHP et Python sont des langages qui s’exécutent côté serveur pour générer des page Web à la volée, il s’utilise avec une base de données pour générer des pages Web personnalisées et permet l’utilisation de formulaires interactifs.

Javascript est un langage qui s’exécute côté client pour créer des animations et modifier la page en fonction d’événements utilisateurs (souris, clavier, ... ).




Sécurité et confidentialité sur le web

Les moteurs de recherche

Un moteur de recherche doit effectuer plusieurs tâches dont le traitement reposent sur des algorithmes souvent secrets et l’utilisation de gigantesques datacenters (pour stocker des copies des pages indexées) :

  • des robots (logiciels), les crawlers explorent les pages du Web en suivant les liens hypertextes : les pages qui ne peuvent être atteintes constituent le Web profond ;

  • les pages sont indexées en fonction de mots clefs issus de leur contenu ou de leurs métadonnées (balises meta) et une note de popularité leur est assignée (en fonction des liens qu’elles reçoivent pour le PageRank de Google) ;

  • répondre aux requêtes très rapidement avec un classement des réponses le plus pertinent possible.



Les cookies

Les serveurs Web gardent des traces de leurs visiteurs en stockant des petits fichiers, les cookies, sur les machines clientes. 

Ces cookies sont souvent nécessaires au confort de la navigation mais ils sont parfois utilisées de façon abusive par des régies publicitaires pour récolter des données personnelles à des fins de publicité ciblée.

Le mode de navigation privée ne rend pas anonyme sur Internet (l’adresse IP n’est pas masquée) mais il permet d’effacer l’historique de navigation, les marque pages, les cookies à la fin de la session. Il est recommandé pour une navigation sur une machine multiutilisateurs.

 
 


1208 vues
Evaluez ce cours
0 0

Laisser un commentaire

Vous devez être Connecté en tant que pour poster un commentaire.