Bonjour, je trouve anormal que les moteurs de recherche ignorent certains de mes pdf sous prétexte je supposes que je leur donnent la possibilité d’être téléchargés par simple clic ! pourtant ils sont intactes et non zipés ??? avez vous ce problème ? merci.
ce serait ragent de devoir en avoir deux copie Smiley confused
Modérateur
Bonjour, qu'est ce que cela signifie « je leur donnent la possibilité d’être téléchargés par simple clic »
Comment les pdfs sont servis, comment les liens sont faits et comment les PDFs sont faits?
kustolovic a écrit :
Bonjour, qu'est ce que cela signifie « je leur donnent la possibilité d’être téléchargés par simple clic »
Comment les pdfs sont servis, comment les liens sont faits et comment les PDFs sont faits?

Pdf est un document comme tout autre (Word etc...)
Apache à alors un paramètre qui lui dit ce qu'il doit faire, ou l'ouvrir dans la fenêtre du navigateur ou le télécharger ! par exemple sur un de mes sites ce PDF se télécharges de suite...
http://les-astuces-du-web.com/wadmin/meteo-Exercices-et-corrige.pdf
tout simplement parceque j'ai indiqué au serveur que pour ce répertoire les pdf étaient "application/octet-stream"
JENCAL a écrit :
Salut
PDF ou pas, tout ce qui est téléchargeable est potentiellement dangereux.

Oh l'Ami il faut que je te fasses des petits cours particuliers sur la sécurité, tout ce que tu vois images code javascript est téléchargé sur ton micro Smiley eek alors tout est potentiellement dangereux, c'est pour cela que nous avons nos antivirus .... malgrés Defendeur qui est bien peut efficace....
Modérateur
Jean-Pierre-Bruneau a écrit :

Apache à alors un paramètre qui lui dit ce qu'il doit faire, ou l'ouvrir dans la fenêtre du navigateur ou le télécharger ! par exemple sur un de mes sites ce PDF se télécharges de suite...
http://les-astuces-du-web.com/wadmin/meteo-Exercices-et-corrige.pdf
tout simplement parceque j'ai indiqué au serveur que pour ce répertoire les pdf étaient "application/octet-stream"

Ce n'est pas un paramètre qui dit «que ce fichier doit être téléchargé», il existe une en-tête pour cela, là tu utilises une vieille astuce assez moche, qui consiste à dire que le fichier est un binaire inconnu lambda (et non un pdf). Face à un fichier de type inconnu le navigateur propose effectivement de le télécharger (mais juste parce qu'il ne sait pas quoi en faire). Faut pas espérer que les moteurs de recherche fassent des miracles si tu leur mens.

Ce que tu peux faire:

Du côté apache, ou php, c'est d'ajouter une en-tête qui dit bien de télécharger le fichier:
a écrit :
Content-Disposition: attachment; filename="truc.pdf"


Le plus simple étant de ne pas mentir sur les en-têtes ni les forcer, mais de l'indiquer dans le lien:

<a href="file.pdf" download>Télécharger le pdf</a>
<a href="file.pdf" download="un_pdf_02002.pdf">Télécharger le pdf</a>
En vrai pour qu'un PDF soit pris en compte correctement, il faut être minutieux sur les classics :

- Nom soigneusement choisi (unique et opti) pour le seo
- inclure le pdf dans la structure interne du site (ne pas l'avoir en "page orphelin")
- adaptez pour le mobile
- compressez les images
- texte brut
- ne pas protéger par mot de passe le fichier
- gaffe au PageRank si il y des liens interne

kdo sur les bonnes pratiques
https://www.youtube.com/watch?v=oDzq-94lcWQ&feature=emb_title
Vous étes gentils mais c'est apache qui dit dans le répertoire de PDF par exemple de mettre un .htaccess avec;

AddType application/octet-stream .pdf

Vous avez oublié une partie de ce que j’obtiens, ce même téléchargement par un lien envoyé par mail,Alors s'il te plait kustolovic
ne parles pas d'astuces assez moche si tu ne sait de quoi tu parles ! merci d'un ancien du code propre ,si tu permets !!
<a href="" download> n'est pas une "astuce assez moche" mais un paramètre viable en HTML5.
Je ne savais pas que proposer des pdf en téléchargement pouvait être une source de problèmes, à la fois de sécurité et de référencement. Je ne m'étais jamais penché sur ce problème.
Sur l'un de mes sites, un peu ancien, j'ai des pdf en téléchargement, avec le code ci-dessous :
<a href="Documents/Recueil-2.pdf" download="Recueil-2.pdf">télécharger le manuel</a>

Sur la première page de google, en 7ème position, voici ce qui apparaît, quand je tape "Documents/Recueil-2.pdf" dans la recherche :
upload/1578655330-67790-screenshot-2020-1-10documents.png
Le pdf est donc bien référencé comme tel.
Modérateur
Mauvaise foi quand tu nous tiens.

N'hésites pas à te renseigner pour mieux comprendre le fonctionnement d'Apache.

Et un bon week-end!
Un point à prendre en compte, c’est que la seule partie d’un pdf qui peut être indexée c’est le texte. Il y a des pdf qui à la lecture semblent contenir du texté mais en fait ce texte est enregistré sous forme d’image. C’est utilisé en particulier par les personnes qui ne veulent pas qu’on puisse faire un copier/coller de leur texte.