Ein Forum vor Spidern schützen mittels robots.txt?

Fragen zu allen Themen rund ums Programmieren außerhalb von phpBB können hier gestellt werden - auch zu anderen Programmiersprachen oder Software wie Webservern und Editoren.
Antworten
Elo
Mitglied
Beiträge: 318
Registriert: 04.11.2002 17:44

Ein Forum vor Spidern schützen mittels robots.txt?

Beitrag von Elo »

Betrifft das Thema "Ein Forum vor Spidern schützen" unter:
http://www.phpbb.de/topic63121.html

Bevor das hier wirklich jemand glaubt:
Mittels der Datei robots.txt kann man Dateien und Verzeichnisse vor Spidern schützen.
Die Beachtung der robots.txt ist für spider/robots/harvestern ein kann und keinesfalls ein muss.

...zum anderen verhindert man, das bestimmte Inhalte suchbar gemacht werden.
Gewissen Robots/Harvestern gibt man durch die Angabe von Verzeichnissen und/oder Dateien in der robots.txt evtl. sogar noch Tipps, welche Verzeichnisse/Dateien es auf dem Server noch gibt, welche vielleicht gar in keiner *.html o.ä Datei verlinkt sind. Also Vorsicht mit dieser robots.txt

Also mein Tipp:
Einen wirklich wirksamen Schutz gibt es nur über die .htaccess.

Gruß,
elo
Benutzeravatar
larsneo
Mitglied
Beiträge: 2622
Registriert: 07.03.2002 15:23
Wohnort: schwäbisch gmünd
Kontaktdaten:

Beitrag von larsneo »

Einen wirklich wirksamen Schutz gibt es nur über die .htaccess.
deshalb gibt es ja auch http://www.phpbb.de/viewtopic.php?t=54059 ;-)
gruesse aus dem wilden sueden
larsneo
..::[krapohl.net]::..
Elo
Mitglied
Beiträge: 318
Registriert: 04.11.2002 17:44

Beitrag von Elo »

@larsneo,
larsneo hat geschrieben:
Einen wirklich wirksamen Schutz gibt es nur über die .htaccess.
deshalb gibt es ja auch http://www.phpbb.de/viewtopic.php?t=54059 ;-)
Genau so verärge ich auch mir nicht willkommende spider/harvester/downloadmanager. Allerdings gebe ich mich nicht mit der Rückgabe einer Fehlermeldung zufrieden, sondern lasse eine Seite mit generierten weiterführenen Links ausgeben.
Test
Die Wartezeit von 20 Sekunden auf diese Seite ist beabsichtigt. Ach bin ich böse 8)

Als besonderes Schmankerl gibt es ab und an in diesen generierten Seiten einen Link zu einer Seite mit massenweiser Zufällig generierten und ungültigen eMailadressen. Dies für die von mir so geliebten Emailsammler unter den nicht willkommenden Besuchern :evil:
Test

Emailadressen sind im Forum nur registrierten Usern zugänglich und für in Beiträge angegebene eMailadressen habe ich eine passende kleine Modifikation:
http://www.phpbb.de/viewtopic.php?t=48329

Gruß,
elo
Antworten

Zurück zu „Coding & Technik“