« Projet:Correction des liens externes » : différence entre les versions

Une page de Wikipédia, l'encyclopédie libre.
Contenu supprimé Contenu ajouté
Irønie (discuter | contributions)
Wisdood (discuter | contributions)
m aussi via le champ « brisé le » dans le modèle Lien web
 
(30 versions intermédiaires par 10 utilisateurs non affichées)
Ligne 7 : Ligne 7 :
'''Projet Correction des liens externes'''
'''Projet Correction des liens externes'''


De nombreux liens sont créés tous les jours vers des sites web externes. La vie de la toile évoluant rapidement, de nombreux liens pointent vers des pages qui ont disparu. Donc, avant de créer un lien, n’hésitez pas à aller lire attentivement la philosophie de Wikipédia sur ce sujet [[Aide:Liens externes]]. Toutefois, malgré ces conseils avisés, il restera des liens à corriger.
Sur Wikipédia en français, des dizaines de liens sont créés chaque jour vers des sites web externes aux [[projets Wikimedia]], notamment pour citer des articles de blog comme références dans des articles. Or, la toile évoluant très rapidement, des liens « se brisent » ou « meurent » tous les jours, pointant respectivement vers des pages web déplacées ou supprimées. Avant de créer un lien, il est conseillé de lire attentivement la philosophie de Wikipédia à ce sujet : [[Aide:Liens externes]]. Toutefois, malgré ces conseils avisés, il y a toujours des liens à corriger.
Ce projet vise donc à corriger les liens externes qui dirigent soit vers une page d’erreur, soit vers une absence de réponse du serveur.


Ce projet vise à corriger les liens externes qui dirigent soit vers une page d'erreur, soit vers une absence de réponse du serveur.
== Participants ==
* [[Utilisateur:Alphos]]
* [[Utilisateur:Bastenbas]] et son merveilleux bot [[Utilisateur:Bastenbasbot|Bastenbasbot]]{{sourire}}
* [[Utilisateur:Dodoïste]]
* [[Fichier:Robot icon.svg|link=|alt=Robot|16px]] [[Utilisateur:Micbot#Liens brisés|Utilisateur:Micbot]]
* [[Utilisateur:JackPotte]] (et [[Utilisateur:JackBot/hyperlynx.py|son robot]])
* [[Utilisateur:Pmartin]]
* [[Utilisateur:Tonnegrande]]

== Calendrier ==
* 10 juillet : publication des liens morts de [[!]] à [[Albatros]] (entre {{formatnum:2000}} et {{nombre|3000|liens}} morts prévus d’après le premier passage). ▪ [[Utilisateur:Eskimo|<font color="#1E90FF">Eskimo</font>]] [[Discussion Utilisateur:Eskimo|<font color="#FFD700">☼</font>]] {{1er}} juillet 2008 à 11:10 (CEST)


== J'ai trouvé un lien mort, que faire ? ==
== J'ai trouvé un lien mort, que faire ? ==

'''Un lien mort (ou lien brisé) vous a été signalé''' (sur la page de discussion ou via le [[Modèle:Lien brisé]]) '''et vous souhaitez savoir comment le corriger ?'''
'''Un lien mort (ou brisé) vous a été signalé''' (sur la page de discussion ou via le modèle {{m|Lien brisé}}, ou parfois par le champ « brisé le ») '''et vous souhaitez savoir comment le corriger :'''
# Si le lien n’est pas mort et n’est pas une redirection (vers la page d’accueil par exemple), indiquez-le :

#* s’il a été signalé par [[User:JackBot]] : ...
# Si le lien n'est pas mort et n'est pas une redirection (vers la page d'accueil par exemple), indiquez-le :
#* s’il a été signalé par [[User:DeepBlue]] : [[Discussion Utilisateur:Alphos|Chez son dresseur]].
#* s’il a été signalé par [[User:Eskimbot]] : dans la rubrique [[Projet:Correction des liens externes/Faux positifs|faux positifs]].
#* s'il a été signalé par [[User:JackBot]] : ...
#* s'il a été signalé par [[User:DeepBlue]] : [[Discussion Utilisateur:Alphos|chez son dresseur]] ;
#* Autre [[Discussion Projet:Correction des liens externes]]
#* s'il a été signalé par [[User:Eskimbot]] : dans la rubrique [[Projet:Correction des liens externes/Faux positifs|faux positifs]] ;
# Sinon passez au [[#Mode d'emploi|mode d’emploi]].
#* autre : sur la [[Discussion Projet:Correction des liens externes|page de discussion du projet]].
'''Un des liens de l’archive wikiwix {{gris|[archive]}} ne fonctionne pas :'''
# Sinon, passez au [[#Mode d'emploi|mode d'emploi]].

'''Un des liens de l'archive Wikiwix {{gris|[archive]}} ne fonctionne pas :'''

# Rapportez un bug sur [[Discussion Utilisateur:Pmartin/Cache]].
# Rapportez un bug sur [[Discussion Utilisateur:Pmartin/Cache]].
# Sinon passez au [[#Mode d'emploi|mode d’emploi]].
# Sinon, passez au [[#Mode d'emploi|mode d'emploi]].


=== Mode d'emploi ===
=== Mode d'emploi ===
{{Mettre à jour}}
{{Mettre à jour}}


<!-- Peut servir pour une refonte de la section. '''Possibilité 1''' : rien, le lien reste disponible via le prestataire du système de cache des liens externes (wikiwix, qq-chose comme ça). '''Possibilité 2''' : à l’ancienne, archive.org, comme indiqué ci-dessus. '''Possibilité 3''' : s’assurer que le lien n’existe vraiment plus (beaucoup de gens croient souvent à tort qu’un lien n’existe plus). '''Possibilité 4''' : l’information ainsi sourcée étant évidemment notable et donc sourcée plein de fois, donc donner une autre source. '''Possibilité 5''' : le lien ne sourçait rien de précis: le virer, il était décoratif.
<!-- Peut servir pour une refonte de la section. '''Possibilité 1''' : rien, le lien reste disponible via le prestataire du système de cache des liens externes (Wikiwix, quelque chose comme ça). '''Possibilité 2''' : à l’ancienne, archive.org, comme indiqué ci-dessus. '''Possibilité 3''' : s’assurer que le lien n’existe vraiment plus (beaucoup de gens croient souvent à tort qu’un lien n’existe plus). '''Possibilité 4''' : l’information ainsi sourcée étant évidemment notable et donc sourcée plein de fois, donc donner une autre source. '''Possibilité 5''' : le lien ne sourçait rien de précis: le virer, il était décoratif.


remplacer les <code>%20</code> par des <code>+</code> pour les espaces
remplacer les <code>%20</code> par des <code>+</code> pour les espaces


-->
-->
'''Vous avez trouvé un lien qui n’est pas corrigé par Wikiwix {{gris|[archive]}}.'''
'''Vous avez trouvé un lien qui n'est pas corrigé par Wikiwix {{gris|[archive]}}.'''
# Si le lien est une redirection vers la bonne page, remplacez l’adresse du lien par l’adresse de la page vers laquelle il redirige.
# Si le lien est une redirection vers la bonne page, remplacez l'adresse du lien par l'adresse de la page vers laquelle il redirige.
# Cherchez si le site a été déplacé, si vous retrouvez la page, remplacez le lien.
# Cherchez si le site a été déplacé, si vous retrouvez la page, remplacez le lien.
# Si ce n’est pas déjà fait, utilisez le modèle {{m|lien brisé}} avec la syntaxe suivante : {{vert|<nowiki>{{lien brisé|url=http://www.example.com|titre=exemple}}</nowiki>}}
# Si ce n'est pas déjà fait, utilisez le modèle {{m|Lien brisé}} avec la syntaxe suivante : {{vert|<nowiki>{{Lien brisé|url=http://www.example.com|titre=exemple}}</nowiki>}}
#* Si le lien utilise le modèle {{m|lien web}}, changez uniquement le nom du modèle en {{m|lien brisé}}, car ''lien brisé'' est identique à ''lien web'', les archives en plus.
#* Si le lien utilise le modèle {{m|Lien web}}, changez uniquement le nom du modèle en {{m|Lien brisé}}, car Lien brisé est identique à Lien web ; il faut simplement ajouter l'horodatage du dernier archivage dans [[Internet Archive]].
#* le modèle ajoute des liens vers [[Internet Archive]], [[Archive.is]], ''Google Cache'' et ''Wikiwix'', qui peuvent vous aider à voir le contenu de la page originale, ce qui est très utile pour retrouver la page déplacée.
#* le modèle ajoute des liens vers [[Internet Archive]], [[Archive.is]], Google Cache et Wikiwix, qui peuvent vous aider à voir le contenu de la page originale, ce qui est très utile pour retrouver la page déplacée.
#* Il catégorise la page dans [[:Catégorie:Article contenant un lien mort]], ainsi le lien mort est signalé.
#* Il catégorise la page dans [[:Catégorie:Article contenant un lien mort]]. Le lien mort est ainsi signalé.
#* Il est également possible de chercher dans d’autres sources de caches internet :
#* Il est également possible de chercher dans d’autres sources de caches internet :
#** Le cache Google : '''http://www.google.fr/search?q=cache:'''{{vert|url de la page cherchée}} (par exemple : http://www.google.fr/search?q=cache:www.justdroit.com/article.php?id=90)
#** Le cache Google : '''http://www.google.fr/search?q=cache:'''{{vert|url de la page cherchée}} (par exemple : http://www.google.fr/search?q=cache:www.justdroit.com/article.php?id=90)
#** Les autres caches : [[WebCite]], [http://www.archive-it.org/ archive-it]{{etc.}} (mode d’emploi à rédiger)
#** Les autres caches : [[WebCite]], [http://www.archive-it.org/ Archive-It]{{etc.}} (mode d’emploi à rédiger)
#** Des adds-ons de mozilla et la fonction page rank de I.E. semblent pouvoir faire ce genre de recherches à merveille, à suivre
#** Des [[Extension (Mozilla)|extensions]] de Mozilla et la fonction ''page rank'' de I.E. semblent pouvoir faire ce genre de recherches à merveille, à suivre.
# Si une des archives trouvées est valide,
# Si une des archives trouvées est valide,
#*si une archive sur [[Internet Archive]] (archive.org) est trouvée, vous pouvez remplacer le modèle « Lien brisé» par un {{m|Lien archive}} et ajouter un paramètre <code>horodatage archive</code> contenant l'identifiant correspondant à une archive valide, tout en conservant les autres paramètres du modèle. Exemple de syntaxe : « <code><nowiki>{{Lien archive | url = http://www.example.com/ | titre = titre obligatoire | date = date du document |site= site initial |horodatage archive=AAAAMMJJHHMMSS }})</nowiki></code> »
#*si une archive sur [[Internet Archive]] (archive.org) est trouvée, vous pouvez remplacer le modèle « Lien brisé» par un {{m|Lien archive}} et ajouter un paramètre <code>horodatage archive</code> contenant l'identifiant correspondant à une archive valide, tout en conservant les autres paramètres du modèle. Exemple de syntaxe : « <code><nowiki>{{Lien archive | url = http://www.example.com/ | titre = titre obligatoire | date = date du document |site= site initial |horodatage archive=AAAAMMJJHHMMSS }}</nowiki></code> »
#*Pour les autres archives, vous pouvez utiliser le modèle {{m|Lien web}} avec les paramètres <code><nowiki> |brisé le=</nowiki></code>(''oui ou date à laquelle est constaté que le lien est brisé'') <code><nowiki>|archive-url=</nowiki></code> (''url de l'archive'') et<code><nowiki>|archive-date=</nowiki></code> (''date de l'archive'').
#*Pour les autres archives, vous pouvez ajouter l’adresse de l’archive à côté du lien mort en laissant le lien mort, et en renseignant l’archive et sa date :
#** manuellement [http://www.ibe.unesco.org/publications/ThinkersPdf/pestalof.pdf Bio de Pestalozzi], [https://web.archive.org/web/20070610130912/http://www.ibe.unesco.org/publications/ThinkersPdf/pestalof.pdf archivé] sur [[Internet Archive]] le 10 juin 2007
# Si ce n’est pas le cas, il faudra trouver une autre référence :
# Si ce n’est pas le cas, il faudra trouver une autre référence :
#* Voir avec les auteurs de l’article ou du projet correspondant. Il pourront vous aider à trouver une autre référence pertinente.
#* Voir avec les auteurs de l’article ou du projet correspondant. Il pourront vous aider à trouver une autre référence pertinente.
#* Vous pouvez ajouter le lien et l’article dans lequel il a été trouvé dans la section [[Projet:Correction des liens externes#Liens à corriger à la main|« Liens à corriger à la main »]]. Le projet vous aidera à corriger le lien.
#* Vous pouvez ajouter le lien et l’article dans lequel il a été trouvé dans la section [[Projet:Correction des liens externes#Liens à corriger manuellement|« Liens à corriger à la main »]]. Le projet vous aidera à corriger le lien.
#* Si le lien est utilisé comme source, '''ne pas le supprimer''', même si vous trouvez une source de remplacement. Un lien mort conserve son importance : possibilité de le retrouver dans divers caches ou archives, le site peut être restauré après un long laps de temps{{etc.}} Si le lien comporte une date de consultation, il vaut toujours comme source.
#* Si le lien est utilisé comme source, '''ne pas le supprimer''', même si vous trouvez une source de remplacement. Un lien mort conserve son importance : possibilité de le retrouver dans divers caches ou archives, le site peut être restauré après un long laps de temps{{etc.}} Si le lien comporte une date de consultation, il vaut toujours comme source.
# Merci de l’aide {{sourire}} Vous trouverez d’autres informations intéressantes sur cette page. Les remarques, suggestions, questions ainsi que la participation au projet sont bienvenues : [[Discussion Projet:Correction des liens externes|c’est par là !]] {{clin}}
# Merci de l’aide ! Vous trouverez d'autres informations intéressantes sur cette page. Les remarques, suggestions, questions ainsi que la participation au projet sont bienvenues : [[Discussion Projet:Correction des liens externes|c'est par là !]]


=== Liens à corriger à la main ===
=== Liens à corriger manuellement ===
{{Article détaillé|:Catégorie:Article contenant un lien mort}}


Quand un paragraphe est terminé, merci de l'[[/Archives|archiver]].
''aucun''

* Voir aussi la [[:Catégorie:Article contenant un lien mort]]
* Quand un paragraphe est terminé, merci de l’[[/Archives|archiver]].


=== Chercher dans les caches et archives ===
=== Chercher dans les caches et archives ===
# [https://web.archive.org/ Internet Archive] possède peut-être la page dans ses archives. Cela peut aussi peut vous aider à voir le contenu de la page originale, ce qui est très utile pour retrouver une page déplacée (c'est-à-dire qui a changé d'[[adresse web]]).
# [https://web.archive.org/ Internet Archive] possède peut-être la page dans ses archives. Cela peut vous aider à voir le contenu de la page originale, ce qui est très utile pour retrouver une page déplacée (c'est-à-dire qui a changé d'[[adresse web]]).
# Tout comme les pages en cache sur Wikiwix, dont l'adresse est de la forme : '''http://archive.wikiwix.com/cache/?url= {{vert|url de la page}}'''. Par exemple, la page http://www.ethnologue.com/show_language.asp?code=fia est en cache à http://archive.wikiwix.com/cache/?url=http://www.ethnologue.com/show_language.asp?code=fia.
# Tout comme les pages en cache sur Wikiwix, dont l'adresse est de la forme : '''http://archive.wikiwix.com/cache/?url= {{vert|url de la page}}'''. Par exemple, la page http://www.ethnologue.com/show_language.asp?code=fia est en cache à http://archive.wikiwix.com/cache/?url=http://www.ethnologue.com/show_language.asp?code=fia.
# Il est possible de chercher dans le cache Google. L'adresse est : '''[http://webcache.googleusercontent.com/search?q=cache: http://webcache.googleusercontent.com/search?q=cache:] {{vert|url de la page}}'''. Par exemple, http://webcache.googleusercontent.com/search?q=cache:http://www.ethnologue.com/show_language.asp?code=fia. (Des [[Extension_(Mozilla)|add-ons]] de [[Mozilla]] ou la fonction [[PageRank]] de [[Internet Explorer|IE]] semblent pouvoir faire ce genre de recherches, à suivre.)
# Il est possible de chercher dans le cache Google. L'adresse est : '''[http://webcache.googleusercontent.com/search?q=cache: http://webcache.googleusercontent.com/search?q=cache:] {{vert|url de la page}}'''. Exemple : http://webcache.googleusercontent.com/search?q=cache:http://www.ethnologue.com/show_language.asp?code=fia. (Des [[Extension_(Mozilla)|extensions]] de [[Mozilla]] ou la fonction [[PageRank]] de [[Internet Explorer|IE]] semblent pouvoir faire ce genre de recherches ; à suivre.)
# WebCite (mode d’emploi à rédiger)
# [[WebCite]] (mode d'emploi à rédiger)
# Archive-It (mode d’emploi à rédiger)
# [http://www.archive-it.org/ Archive-It] (mode d'emploi à rédiger)
# [[:en:Category:Web archives]]
# [[:en:Category:Web archives]]
# [[:en:Category:Online archives]]
# [[:en:Category:Online archives]]


== Cache Google ==
== Cache Google ==
Le cache Google est mis à jour plus ou moins fréquemment suivant le [[Pagerank]] de la page à mettre en cache. Ceci est fait par les [[Googlebot]]. En théorie, il s’agit d’un cache, toutefois certains sites web fermés peuvent rester en « cache » plusieurs années durant.
Le cache Google est mis à jour plus ou moins fréquemment suivant le [[Pagerank]] de la page à mettre en cache. Ceci est fait par les [[Googlebot]]s. En théorie, il s'agit d'un cache ; toutefois, certains sites web fermés peuvent rester en « cache » pendant plusieurs années.


=== Les erreurs possibles ===
=== Erreurs possibles ===
{{Section vide ou incomplète}}
* Le site a refusé la mise en cache du site (syntaxe ?)

* Lorsqu’un [[Googlebot]] est passé sur le site, le site était indisponible. Le robot n’a pas archivé la page et il est possible qu’aucun autre [[Googlebot]] ne vienne archiver le site.
* Le site a refusé la mise en cache du site (syntaxe ?) ;
* Les sous-pages sont inaccessibles : probablement interdites par /nofollow
* Lorsqu'un [[Googlebot]] est passé sur le site, le site était indisponible. Le robot n'a pas archivé la page et il est possible qu'aucun autre [[Googlebot]] ne vienne archiver le site ;
* Retiré de l’archive pour des problèmes légaux divers
* Les sous-pages sont inaccessibles : probablement interdites par /nofollow ;
* … (à compléter [ex. durée de vie d’une erreur 404 → {{nombre|6|mois}} ??]
* Retiré de l'archive pour des problèmes légaux divers ;
* L'erreur 404 est arrivée à expiration ;


=== Navigation ===
=== Navigation ===
La navigation est difficile, car un lien (interne ou externe) dans cette page ne donne pas la version mise en cache (contrairement à internet archive)
La navigation est difficile, car un lien (interne ou externe) dans cette page ne donne pas la version mise en cache (contrairement à ''[[Internet Archive]]'').


== Internet archive ==
== Internet archive ==
Cette archive dispose d’une mise à jour peu fréquente (donc si un site apparaît et disparait entre deux mises à jour il n’y figure pas), et pas disponible immédiatement (il faut attendre quelques mois).
Cette archive dispose d’une mise à jour peu fréquente (donc si un site apparaît et disparait entre deux mises à jour il n’y figure pas), et pas disponible immédiatement (il faut attendre quelques mois).


=== Les erreurs possibles ===
=== Erreurs possibles ===
{{Section vide ou incomplète}}
* Le site a refusé la mise en cache du site (via [https://stackoverflow.com/a/1341133 balises meta] ou [https://stackoverflow.com/a/2068407 entêtes HTTP])
* Retiré de l’archive pour des problèmes légaux divers, via le fichier « [[robots.txt]] » (dans lequel [[Alexa (Internet)|Alexa]] est identifié sous le nom « [[ia_archiver]] »)([http://www.alexa.com/site/help/webmasters#crawl_site détails]). et http://searchengineland.com/meta-robots-tag-101-blocking-spiders-cached-pages-more-10665.php
* …
* Voir la [https://archive.org/about/faqs.php FAQ]


* Le site a refusé la mise en cache du site (via [https://stackoverflow.com/a/1341133 balises meta] ou [https://stackoverflow.com/a/2068407 entêtes HTTP]) ;
=== Navigation ===
* Retiré de l'archive pour des problèmes légaux divers, via le fichier « [[robots.txt]] » dans lequel [[Alexa (Internet)|Alexa]] est identifié sous le nom « [[ia_archiver]] ». Voir [https://support.alexa.com/hc/en-us/articles/200450194 les détails], [http://searchengineland.com/meta-robots-tag-101-blocking-spiders-cached-pages-more-10665.php un article en anglais], [https://help.archive.org/hc/en-us la FAQ d'''archive.org''] (en anglais) ;
La navigation est aisée (liens internes et externes automatiquement transformés vers le correspondant de l’archive).


=== Navigation ===
La navigation est aisée : les liens internes et externes sont automatiquement transformés vers le correspondant de l'archive.


== Participants au projet ==
== Participants au projet ==
'''Vous souhaitez participer au projet, basez vous sur la liste ci-dessous.'''
'''Vous souhaitez participer au projet : la démarche à suivre est la suivante.'''

Les articles sont séparés en petits blocs, d’une dizaine de pages.
Les articles sont séparés en petits blocs, d'une dizaine de pages.


Pour corriger des liens :
Pour corriger des liens :
# '''Vérifiez''' que les liens sont bien morts (si la page est un message indiquant que l’accès au site sera bientôt rétabli, ne supprimez pas le lien)
# '''Vérifiez''' que les liens sont bien morts (si la page est un message indiquant que l'accès au site sera bientôt rétabli, ne supprimez pas le lien).
# '''Vérifiez''' que le lien n’a pas déjà été corrigé (après le {{3e}} passage du bot pour vérifier si le message en page de discussion avait été suivi d’une correction)
# '''Vérifiez''' que le lien n'a pas déjà été corrigé (après le {{3e}} passage du bot pour vérifier si le message en page de discussion avait été suivi d'une correction) :
## Si le lien est une redirection, remplacez le lien par un lien direct vers le contenu, barrez
## Si le lien est une redirection, remplacez le lien par un lien direct vers le contenu, barrez ;
## Si le lien n’est pas mort, '''supprimez le message sur la page de discussion''' de l’article et '''rapportez le lien [[/Faux positifs|ici]]'''.
## Si le lien n'est pas mort, '''supprimez le message sur la page de discussion''' de l'article et '''rapportez le lien [[/Faux positifs|ici]]'''.
# Si le lien est mort, cf. ci-dessus. Pensez à rayer le lien de la liste des liens à corriger (en utilisant ''<nowiki><s></s></nowiki>''). '''S'il n’y a pas eu de discussion sur le lien''' (est-il vraiment utile, ce site correspond-il vraiment au même contenu…), merci aussi de '''supprimer le message''' de la page de discussion.
# Si le lien est mort, cf. ci-dessus. Pensez à rayer le lien de la liste des liens à corriger (en utilisant ''<nowiki><s></s></nowiki>''). '''S'il n'y a pas eu de discussion sur le lien''' (Est-il vraiment utile ? Ce site correspond-il vraiment au même contenu ?), merci aussi de '''supprimer le message''' de la page de discussion.
# Comme commentaire, vous pouvez laisser :
# Comme commentaire, vous pouvez laisser :
::'''<nowiki>[[Projet:Correction des liens externes|Projet de correction des liens externes]] </nowiki>'''
::'''<nowiki>[[Projet:Correction des liens externes|Projet de correction des liens externes]]</nowiki>'''


== Les erreurs sur le web ==
== Les erreurs sur le web ==

{{Article connexe|Liste des codes HTTP}}
{{Article connexe|Liste des codes HTTP}}


* '''Erreur 403''' : Page d’un site web protégée. Il faut un accès spécial pour accéder à une telle page. Tout le monde ne pouvant y accéder, ces pages sont à proscrire de Wikipédia.
* '''Erreur 403''' : Page d'un site web protégée. Il faut un accès spécial pour accéder à une telle page. Tout le monde ne pouvant y accéder, ces pages sont à proscrire de Wikipédia.
* '''Erreur 404''' : la page est introuvable. Mais il peut s'agir d'une indisponibilité temporaire.
* '''Erreur 404''' : La page est introuvable, mais il peut s'agir d'une indisponibilité temporaire.
* '''Erreur 410 Gone''' : la page a définitivement disparue à cette adresse.
* '''Erreur 410 Gone''' : La page a définitivement disparu à cette adresse.
* '''Erreur 500''' : Erreur sur le serveur distant.
* '''Erreur 500''' : Erreur sur le serveur distant.


== Outils ==
== Outils ==
{{Section vide ou incomplète}}
* [http://www.kloth.net/services/whois.php Whois] Vous permettra de vérifier l’existence du domaine et d’avoir des informations sur ce site. Par exemple, vous pouvez vérifier pour notre site web http://fr.wikipedia.org pour cela, il faudra inscrire '''wikipedia.org'''.
* LinkChecker est une extension pour Firefox qui analyse tous les liens de la page pour déceler les liens morts. [https://web.archive.org/web/20161225175217/http://frayd.us:80/extensions/linkchecker/linkchecker.xpi Téléchargeable ici].


== Liens utiles ==
== Liens utiles ==
* [[Projet:Gestion des liens externes]]
* [[Projet:Gestion des liens externes]] (archivé)
* [[Aide:Liens externes]]
* [[Aide:Liens externes]]
* [[Spécial:Linksearch|Rechercher des liens internet]].
* [[Spécial:Linksearch|Recherche de liens externes]]
* [[:Catégorie:Article contenant un lien mort]]
* [[:Catégorie:Article contenant un lien mort]]
* [[Wikipédia:Accès url]]

== Sites n'existant plus ==
* adana.bel.tr
* bitlis.bel.tr
* quid.fr

{{ancre|A faire}}<!-- ne pas supprimer, requis pour éviter les ruptures de liens internes -->
== À faire ==
'''Nouveaux liens morts, publiés le 10 juillet 2008''' : [[Projet:Correction des liens externes/Liens/0710/1|Page 1]], [[Projet:Correction des liens externes/Liens/0710/2|Page 2]], [[Projet:Correction des liens externes/Liens/0710/3|Page 3]], [[Projet:Correction des liens externes/Liens/0710/4|Page 4]], [[Projet:Correction des liens externes/Liens/0710/5|Page 5]], [[Projet:Correction des liens externes/Liens/0710/6|Page 6]]

Ces liens sont plutôt destinés à une correction manuelle, qui pourrait avoir lieu soit en complément d’une modification automatique des pages, soit en attente de la mise en place de l’automatisation, avec les débats qu’elle pourrait entraîner. ▪ [[Utilisateur:Eskimo|<font color="#1E90FF">Eskimo</font>]] [[Discussion Utilisateur:Eskimo|<font color="#FFD700">☼</font>]] 10 juillet 2008 à 19:02 (CEST)

=== Sous-pages de travail ===
* [[Projet:Correction des liens externes/Faux positifs]]
# À mettre à jour
# remettre les liens dans les articles dès que le lien existe à nouveau.
# maintenir (allonger ?) la liste

* [[Projet:Correction des liens externes/À corriger]]
:Ces pages étaient auparavant protégées, il convient maintenant de rétablir ces liens lorsque c’est possible.

=== Informer la communauté de ces pratiques étranges ===
* Internet Archive est peu connu, et donc l’usage que l’on peut en faire également.

== Voir aussi ==
* [[Projet:Gestion des liens externes|Projet « gestion des liens externes »]]


[[Catégorie:Projet:Gestion des liens|{{PAGENAME}}]]
[[Catégorie:Projet:Gestion des liens|{{PAGENAME}}]]

Dernière version du 7 mai 2024 à 10:29

Projet Correction des liens externes

Sur Wikipédia en français, des dizaines de liens sont créés chaque jour vers des sites web externes aux projets Wikimedia, notamment pour citer des articles de blog comme références dans des articles. Or, la toile évoluant très rapidement, des liens « se brisent » ou « meurent » tous les jours, pointant respectivement vers des pages web déplacées ou supprimées. Avant de créer un lien, il est conseillé de lire attentivement la philosophie de Wikipédia à ce sujet : Aide:Liens externes. Toutefois, malgré ces conseils avisés, il y a toujours des liens à corriger.

Ce projet vise à corriger les liens externes qui dirigent soit vers une page d'erreur, soit vers une absence de réponse du serveur.

J'ai trouvé un lien mort, que faire ?[modifier | modifier le code]

Un lien mort (ou brisé) vous a été signalé (sur la page de discussion ou via le modèle {{Lien brisé}}, ou parfois par le champ « brisé le ») et vous souhaitez savoir comment le corriger :

  1. Si le lien n'est pas mort et n'est pas une redirection (vers la page d'accueil par exemple), indiquez-le :
  2. Sinon, passez au mode d'emploi.

Un des liens de l'archive Wikiwix [archive] ne fonctionne pas :

  1. Rapportez un bug sur Discussion Utilisateur:Pmartin/Cache.
  2. Sinon, passez au mode d'emploi.

Mode d'emploi[modifier | modifier le code]

Vous avez trouvé un lien qui n'est pas corrigé par Wikiwix [archive].

  1. Si le lien est une redirection vers la bonne page, remplacez l'adresse du lien par l'adresse de la page vers laquelle il redirige.
  2. Cherchez si le site a été déplacé, si vous retrouvez la page, remplacez le lien.
  3. Si ce n'est pas déjà fait, utilisez le modèle {{Lien brisé}} avec la syntaxe suivante : {{Lien brisé|url=http://www.example.com|titre=exemple}}
  4. Si une des archives trouvées est valide,
    • si une archive sur Internet Archive (archive.org) est trouvée, vous pouvez remplacer le modèle « Lien brisé» par un {{Lien archive}} et ajouter un paramètre horodatage archive contenant l'identifiant correspondant à une archive valide, tout en conservant les autres paramètres du modèle. Exemple de syntaxe : « {{Lien archive | url = http://www.example.com/ | titre = titre obligatoire | date = date du document |site= site initial |horodatage archive=AAAAMMJJHHMMSS }} »
    • Pour les autres archives, vous pouvez utiliser le modèle {{Lien web}} avec les paramètres |brisé le=(oui ou date à laquelle est constaté que le lien est brisé) |archive-url= (url de l'archive) et|archive-date= (date de l'archive).
  5. Si ce n’est pas le cas, il faudra trouver une autre référence :
    • Voir avec les auteurs de l’article ou du projet correspondant. Il pourront vous aider à trouver une autre référence pertinente.
    • Vous pouvez ajouter le lien et l’article dans lequel il a été trouvé dans la section « Liens à corriger à la main ». Le projet vous aidera à corriger le lien.
    • Si le lien est utilisé comme source, ne pas le supprimer, même si vous trouvez une source de remplacement. Un lien mort conserve son importance : possibilité de le retrouver dans divers caches ou archives, le site peut être restauré après un long laps de temps, etc. Si le lien comporte une date de consultation, il vaut toujours comme source.
  6. Merci de l’aide ! Vous trouverez d'autres informations intéressantes sur cette page. Les remarques, suggestions, questions ainsi que la participation au projet sont bienvenues : c'est par là !

Liens à corriger manuellement[modifier | modifier le code]

Quand un paragraphe est terminé, merci de l'archiver.

Chercher dans les caches et archives[modifier | modifier le code]

  1. Internet Archive possède peut-être la page dans ses archives. Cela peut vous aider à voir le contenu de la page originale, ce qui est très utile pour retrouver une page déplacée (c'est-à-dire qui a changé d'adresse web).
  2. Tout comme les pages en cache sur Wikiwix, dont l'adresse est de la forme : http://archive.wikiwix.com/cache/?url= url de la page. Par exemple, la page http://www.ethnologue.com/show_language.asp?code=fia est en cache à http://archive.wikiwix.com/cache/?url=http://www.ethnologue.com/show_language.asp?code=fia.
  3. Il est possible de chercher dans le cache Google. L'adresse est : http://webcache.googleusercontent.com/search?q=cache: url de la page. Exemple : http://webcache.googleusercontent.com/search?q=cache:http://www.ethnologue.com/show_language.asp?code=fia. (Des extensions de Mozilla ou la fonction PageRank de IE semblent pouvoir faire ce genre de recherches ; à suivre.)
  4. WebCite (mode d'emploi à rédiger)
  5. Archive-It (mode d'emploi à rédiger)
  6. en:Category:Web archives
  7. en:Category:Online archives

Cache Google[modifier | modifier le code]

Le cache Google est mis à jour plus ou moins fréquemment suivant le Pagerank de la page à mettre en cache. Ceci est fait par les Googlebots. En théorie, il s'agit d'un cache ; toutefois, certains sites web fermés peuvent rester en « cache » pendant plusieurs années.

Erreurs possibles[modifier | modifier le code]

  • Le site a refusé la mise en cache du site (syntaxe ?) ;
  • Lorsqu'un Googlebot est passé sur le site, le site était indisponible. Le robot n'a pas archivé la page et il est possible qu'aucun autre Googlebot ne vienne archiver le site ;
  • Les sous-pages sont inaccessibles : probablement interdites par /nofollow ;
  • Retiré de l'archive pour des problèmes légaux divers ;
  • L'erreur 404 est arrivée à expiration ;

Navigation[modifier | modifier le code]

La navigation est difficile, car un lien (interne ou externe) dans cette page ne donne pas la version mise en cache (contrairement à Internet Archive).

Internet archive[modifier | modifier le code]

Cette archive dispose d’une mise à jour peu fréquente (donc si un site apparaît et disparait entre deux mises à jour il n’y figure pas), et pas disponible immédiatement (il faut attendre quelques mois).

Erreurs possibles[modifier | modifier le code]

Navigation[modifier | modifier le code]

La navigation est aisée : les liens internes et externes sont automatiquement transformés vers le correspondant de l'archive.

Participants au projet[modifier | modifier le code]

Vous souhaitez participer au projet : la démarche à suivre est la suivante.

Les articles sont séparés en petits blocs, d'une dizaine de pages.

Pour corriger des liens :

  1. Vérifiez que les liens sont bien morts (si la page est un message indiquant que l'accès au site sera bientôt rétabli, ne supprimez pas le lien).
  2. Vérifiez que le lien n'a pas déjà été corrigé (après le 3e passage du bot pour vérifier si le message en page de discussion avait été suivi d'une correction) :
    1. Si le lien est une redirection, remplacez le lien par un lien direct vers le contenu, barrez ;
    2. Si le lien n'est pas mort, supprimez le message sur la page de discussion de l'article et rapportez le lien ici.
  3. Si le lien est mort, cf. ci-dessus. Pensez à rayer le lien de la liste des liens à corriger (en utilisant <s></s>). S'il n'y a pas eu de discussion sur le lien (Est-il vraiment utile ? Ce site correspond-il vraiment au même contenu ?), merci aussi de supprimer le message de la page de discussion.
  4. Comme commentaire, vous pouvez laisser :
[[Projet:Correction des liens externes|Projet de correction des liens externes]]

Les erreurs sur le web[modifier | modifier le code]

  • Erreur 403 : Page d'un site web protégée. Il faut un accès spécial pour accéder à une telle page. Tout le monde ne pouvant y accéder, ces pages sont à proscrire de Wikipédia.
  • Erreur 404 : La page est introuvable, mais il peut s'agir d'une indisponibilité temporaire.
  • Erreur 410 Gone : La page a définitivement disparu à cette adresse.
  • Erreur 500 : Erreur sur le serveur distant.

Liens utiles[modifier | modifier le code]