Aller au contenu

Site web

Un article de Wikipédia, l'encyclopédie libre.

Unsite web,site Web[1],[2]ou simplementsite[3],est un ensemble depages webet deressourcesreliées par deshyperliens,défini et accessible par uneadresse web.Un site est développé à l'aide de langages deprogrammation web,puis hébergé sur unserveur webaccessible via le réseau mondialInternet,unintranetlocal, ou n'importe quel autre réseau, tel que leréseau Tor.

L'ensemble des sites web publics constituent leWorld Wide Web.

En 30 ans environ (de 1992 à 2023), le nombre de sites Web en ligne est passé de 10 à plus de 1,88 milliards, répertoriés par les moteurs de recherche selonNetcraftet l'algorithmeWorldometer.Et un nombre indéterminé de sites non répertoriés existe[4],non indexés par les moteurs de recherches (dark web...); mais en 2022, 75 % étaient jugés inactifs (momentanément ou non) ou étaient des « noms de domaines parqués »[5].LesGAFAMet notamment Google, YouTube et Facebook sont les plus consultés (ex.:plusieurs dizaines de milliards de visites en mai 2023, selonSimilarWeb)[6].

Histoire[modifier|modifier le code]

Capture d'écran du navigateur World Wide Web
Capture d'écran du navigateur World Wide Web.

LeWorld Wide Web(WWW) a été créé en 1989 par l'ingénieur anglais duCERN,Tim Berners-Lee[7].Le web a été essentiellement conçu pour partager automatiquement des informations entre les scientifiques, universités et instituts du monde entier.info.cern.chfut le premier site web mis en ligne, fonctionnant sur un ordinateurNeXTau CERN. Ce site est toujours accessible par Internet[8].Le premier site web français est créé en 1992 au CNRS[9].À cette période, il existe seulement vingt-six sites web[10].

Avant l'introduction deHTMLetHTTP,d'autres protocoles tels queFTPetGopherétaient utilisés pour obtenir des fichiers depuis unserveur.Ces protocoles offraient une organisationhiérarchiquede répertoires dans lesquels l'utilisateur naviguait et choisissait les fichiers à télécharger.

En 1992, il n'y avait que 10 sites web en ligne. Environ 30 ans plus tard, le,il y en avait plus de 1,88 milliards répertoriés par les moteurs de recherche, selonNetcraftet l'algorithmeWorldometer,et un nombre indéterminé non répertoriés (dark web...); mais 75 % étaient jugés inactifs (momentanément ou non) ou étaient des « noms de domaines parqués »[5].Au début des années 2020, Google, YouTube et Facebook étaient les plus consultés (ex.:plusieurs dizaines de milliards de visites en mai 2023, selonSimilarWeb)[6].

Définition[modifier|modifier le code]

Un site web est un ensemble depages webqui peuvent être consultées en suivant deshyperliensà l'intérieur du site.

L'adresse webd'un site correspond en fait à l'URL(Uniform Resource Locator) d'une page web prévue pour être la première consultée: lapage d'accueil.

La consultation des pages d'un site s'appelle une « visite », car les hyperliens devraient permettre de consulter toutes les pages du site sans lequitter(sans devoir consulter une page web hors du site). Une visite peut commencer par n'importe quelle page, particulièrement lorsque son URL est donnée par unmoteur de recherche.Techniquement, rien ne distingue la page d'accueil d'une autre page. Les pages web sont écrites dans un langage informatique conçu pour contenir des hyperliens, leHTML(Hypertext Markup Language).

On parle parfois de « site Internet » parmétonymie,au lieu de site web. On devrait parler de site web à destination d'Internet, mais parabus de langage,l'expression site Internet reste souvent utilisée. Les sites web ne sont pas forcément accessibles par Internet. Par exemple, lesintranetpeuvent contenir un ou plusieurs sites web non accessibles via Internet.

Aujourd'hui, on considère que leWorld Wide Web(le Web) est constitué de l'ensemble des sites web en ligne sur Internet. Le protocoleclient-serveurHTTP(HyperText Transfer Protocol) est utilisé pour les communications entre lesserveurs webhébergeant les sites web, et les logiciels client HTTP que sont lesnavigateurs webetrobots d'indexation.

Organisation d'un projet web[modifier|modifier le code]

Les différentes étapes de la conduite d'un projet web peuvent être résumées ainsi[11]:

  1. lancement: étude des besoins, de laconcurrenceet de l'existant pour l'établissement d'un cahier des charges;
  2. conception: élaboration de la structure (arborescence), du contenu despages webet en particulier de lapage d'accueilet éventuellement unmoteur de recherche,du graphisme, qui font partie ducahier des charges fonctionnel;
  3. réalisation: voir ci-dessous;
  4. production: le site est mis en ligne, devient accessible au public ciblé;
  5. exploitation: phase de maintenance et de promotion du site, avec notamment leréférencementnaturel (Netlinking) ou payant (Google AdWords,Microsoft AdCenter,ou autres).

L'étape de réalisation comprend:

  • la réservation et gestion d'unnom de domaine(l'adresse webà laquelle le site est accessible);
  • la mise en œuvre d'une infrastructure d'hébergement du site (serveurs web, base de données...);
  • le développement de l'interface utilisateur(frontend), la partie visible dans le navigateur; les différentes pages sont décrites en langages connus des navigateurs web, principalementHTML,CSSetJavaScript.Les éléments graphiques (et éventuellement despublicitésservant à rémunérer le site) sont intégrés dans ces pages;
  • le développement de l'arrière plan (backend), la partie qui fonctionne côté serveur.

La création d'un site peut être confiée à uneagence web,untravailleur indépendant,ou faite soi-même. Si la création est déléguée, il est important en amont d'avoir défini un premier cadrage ou cahier des charges du projet. Pour développer un site web soi-même, il est possible d'utiliser unéditeur de pages web;pour lesdéveloppeurs webavertis, un simpleéditeur de textepeut suffire. On peut aussi avoir recours à un système de gestion de contenu.

Systèmes de gestion de contenu[modifier|modifier le code]

Lessystèmes de gestion de contenu(initialesSGC,CMSen anglais) permettent de fabriquer des sites web en utilisant des modèles préétablis faits par desprogrammeursou des communautés de programmeurs (voirListe de systèmes de gestion de contenu). Il existe de nombreux CMS commeWordPress,WiX,Jimdo,Shopify... Certains CMS nécessitent une prise en main technique plus ou moins avancé, par exemple sous WordPress il est souvent recommandé de débuter avec un prestataire, sous WIX à l'inverse la gestion est vraiment simple et permet de s'affranchir de différents prestataires. Ces logiciels sont disponibles pour les débutants et simplifient certaines étapes comme laprogrammation informatiqueou l'architecture du site. Les procédures de demande dunom de domaine,d'hébergementdu site et deréférencementsont semblables aux sites personnalisés classiques.

Sites statiques et dynamiques[modifier|modifier le code]

Répartition des langages de programmation côté serveur, des sites web le.

On distingue deux types de sites: lessites statiqueset lessites dynamiques.

Sites statiques[modifier|modifier le code]

Ces sites ont le mécanisme de fonctionnement le plus simple: les URL correspondent à un fichier renvoyé par le serveur web. Le contenu des pages d'un site statique ne dépend donc pas de variables telles que la date ou de bases de données. Pour changer le contenu d'une page, il est nécessaire de changer le contenu du fichier.

En outre, les visiteurs peuvent seulement voir le contenu du site mais pas y participer. Pour les réaliser, seuls les langages dits d'interface utilisateur (frontend) sont nécessaires, c'est-à-dire HTML,CSSetJavaScript(en théorie, il est toutefois possible d'utiliser uniquement le HTML).

  • Le HTML permet d'écrire le contenu de sa page;
  • Le CSS permet de mettre en page le contenu (emplacement des éléments), et mettre en forme le texte (police d'écriture, couleur, taille). Depuis CSS3, il est également possible de créer des modifications plus évoluées (animation, ombres, etc.);
  • JavaScript permet d'ajouter du dynamisme, mais uniquement du côté du navigateur (par exemple des animations graphiques).

Sites dynamiques[modifier|modifier le code]

Ces sites offrent un contenu qui peut évoluer dans le temps. Des programmes tournent du côté des serveurs, à l'arrière plan, (backend) pour générer les pages du site. Ces programmes peuvent se servir de bases de données ou autres sources de données pour composer les pages qui seront affichées dans le navigateur.

Ce dynamisme apporte des fonctionnalités que ne peuvent pas offrir les sites dits statiques. Par exemple les visiteurs peuvent y participer (commentaires sur unblog,changement du contenu des pages d'un wiki...). Ils ont donc pratiquement supplanté les sites statiques au début des années 2000.

Pour les réaliser, on a également besoin de HTML, de CSS et de JavaScript, mais les programmes qui tournent du côté serveur utilisent d'autres langages qui peuvent créer dynamiquement les pages, en analysant les requêtes des visiteurs pour ensuite fabriquer une réponse adaptée.

Il existe plusieurs langages pour créer ces pages:PHP,Java,C#,Ruby,voire d'autres commeC++,PythonetVisual Basicvia l'interfaceCGI.

Leur temps de chargement est généralement plus long que pour les pages statiques, toutefois il est possible d'obtenir des valeurs proches en stockant les pages dynamiques déjà appelées dans unemémoire cache,qui les réaffichera plus vite.

Nombre[modifier|modifier le code]

Le nombre de sites web est en progression constante[12],[13]:

Nombre des sites web consultables
(par année)
Année Nombre
1991 (août) 1
1991 10
1992 26[10]
1993 623[14]
1994 10 022
1995 62 800[15]
1997 1 000 000
2000 10 000 000
2003 (fév.) 35 863 952
2004 57 000 000
2005 74 000 000
2006 101 000 000
2007 155 000 000
2008 186 000 000
2009 (nov.) 207 316 960
2010 (fév.) 233 636 281
2011 (avr.) 312 693 296
2012 (jan.) 582 716 657
2014 (nov.) 947 029 805 (dont 177 782 668 actifs)[16]
2018 (juin) 1 630 322 579
2021 1 880 259 054

En fonction de la taille et du type d'entreprise[modifier|modifier le code]

Selon les pays[modifier|modifier le code]

En,lesstatistiques,en nombre de sites par habitant, montrent une disparité très forte entre les pays:

  1. Drapeau de l'AllemagneAllemagne:85;
  2. Drapeau du DanemarkDanemark:72;
  3. Drapeau du Royaume-UniRoyaume-Uni:64;
  4. Drapeau des États-UnisÉtats-Unis:64;
  5. Drapeau de la FranceFrance:11.

De plus, en 2013 les pays qui hébergent le plus de sites sont:

  1. Drapeau des États-UnisÉtats-Unis:42 %;
  2. Drapeau de l'AllemagneAllemagne:7 %;
  3. Drapeau de la République populaire de ChineChine:3,6 %;
  4. Drapeau du Royaume-UniRoyaume-Uni:3,6 %;
  5. Drapeau de la RussieRussie:3,5 %;
  6. Drapeau de la FranceFrance:3,5 %;
  7. Drapeau du JaponJapon:3 %;
  8. Drapeau des Pays-BasPays-Bas:2,6 %.

Selon les langues[modifier|modifier le code]

En 2015, plus de la moitié des sites web sont en anglais[17].

Fin 2017 les dix langues les plus utilisées sur internet sont[18]:

  • anglais avec 25,4 % d'utilisateurs (par rapport à l'ensemble desinternautes);
  • chinois avec 19,3 % d'utilisateurs;
  • espagnol avec 8,1 % d'utilisateurs;
  • arabe avec 5,3 % d'utilisateurs;
  • portugais avec 4,1 % d'utilisateurs;
  • indonésien/malaisien avec 4,1 % d'utilisateurs;
  • français avec 3,2 % d'utilisateurs;
  • japonais avec 2,9 % d'utilisateurs;
  • russe avec 2,6 % d'utilisateurs;
  • allemand avec 2,2 % d'utilisateurs.

Technologies[modifier|modifier le code]

Lestechnologiesmises en œuvre pour un site web sont multiples. On peut les classer ainsi:

Protocoles de communication[modifier|modifier le code]

Formats de contenus web[modifier|modifier le code]

Formats de contenus web:

Formats d'images graphiques. Utilisés pour agrémenter les pages et sont reconnus par tous lesnavigateurs web.

Autres formats souvent utilisés, requièrent unmodule d'extension,ouplug-in,sur le navigateur pour fonctionner:

Technologies serveur[modifier|modifier le code]

Réglementation en France[modifier|modifier le code]

Les contenus mis en ligne par l'intermédiaire d'un site web doivent respecter les règles légales et en particulier:

Un certain nombre de mentions légales doivent également figurer sur les sites dans une rubrique du même nom afin de donner aux internautes les informations obligatoires prévues par les différents textes de loi.

Depuis laloino2006-961 durelative au droit d'auteur et aux droits voisins dans la société de l'information,il existe un dépôt légal de l'Internet[19].Dans une logique de continuité des collections, la loi DADVSI prévoit le partage de l'archivage du web entre deux institutions dépositaires: l'Institut national de l'audiovisuel(INA) gère le dépôt légal des sites du web médiatique tandis que laBibliothèque nationale de France(BnF) est chargé d'archiver l'ensemble des autres sites du web français. Elles collectent essentiellement les.frmais aussi l'ensemble des noms de domaine dont l'éditeur est installé en France, quelle que soit l'extension[20].

Notes et références[modifier|modifier le code]

  1. Bureau de la Traduction du Canada, «Web (Recommandation linguistique du Bureau de la traduction)», surtermiumplus.gc.ca(consulté le).
  2. «site Web»,Grand Dictionnaire terminologique,Office québécois de la langue française(consulté le).
  3. Commission d’enrichissement de la langue françaisesite», surFranceTerme,ministère de la Culture(consulté le).
  4. «Web invisible»
  5. aetb«Infographie: Combien y a-t-il de sites Internet?», surStatista Daily Data (fr.statista ),(consulté le).
  6. aetbLe site fr.statista se base sur les chiffres deSimilarWebP. A.Baghurstet L. W.NicholInfographie: Les sites web les plus consultés dans le monde», surStatista Daily Data (fr.statista ),(ISSN0006-3002,PMID80,DOI10.1016/0005-2795(75)90349-9,consulté le),p.168–180.
  7. JulienLaussonLe web libre et ouvert fête ses 20 ans», surNumerama,(consulté le).
  8. « Le berceau du web »,CERN.
  9. «Comment le premier site web français a vu le jour au CNRS», surCNRS Le journal(consulté le).
  10. aetb(en)«World-Wide Web Servers», surw3.org(consulté le).
  11. VincentHiard,Gestion d'un projet web: Planification, pilotage et bonnes pratiques,Éditions ENI,(ISBN2746068273).
  12. En juillet 2009, à l'occasion des 20 ans du Web, une étude duCERNrecense cette évolution. Source:Jean-Paul Pinte, «Le Web invisible: l'antre du cybercrime»,Pour la Science,no70,‎,p.100.
  13. Source:Netcraft.
  14. «Internet Statistics: Web Growth, Internet Growth», surmit.edu(consulté le).
  15. «Web Server Survey | Netcraft», surnews.netcraft(consulté le).
  16. (en-GB)«Web Server Survey», surNetcraft News(consulté le).
  17. (en)«Percentages of Websites Using Various Content Languages»,.
  18. «Top Ten Internet Languages in The World - Internet Statistics», surinternetworldstats(consulté le).
  19. LégifranceCode du patrimoine - Article L. 131-2.
  20. LégifranceCode du patrimoine - Article R. 132-23.

Voir aussi[modifier|modifier le code]

Sur les autres projets Wikimedia:

Unecatégorieest consacrée à ce sujet:Site web.

Articles connexes[modifier|modifier le code]

Liens externes[modifier|modifier le code]