unerwünschte Bots bzw. E-Mail-Spider aushebeln

In diesem Forum können Mod-Autoren ihre Mods vorstellen, die sich noch im Entwicklungsstatus befinden. Der Einbau in Foren im produktiven Betrieb wird nicht empfohlen.
Forumsregeln
phpBB 2.0 hat das Ende seiner Lebenszeit überschritten
phpBB 2.0 wird nicht mehr aktiv unterstützt. Insbesondere werden - auch bei Sicherheitslücken - keine Patches mehr bereitgestellt. Der Einsatz von phpBB 2.0 erfolgt daher auf eigene Gefahr. Wir empfehlen einen Umstieg auf phpBB 3.0, welches aktiv weiterentwickelt wird und für welches regelmäßig Updates zur Verfügung gestellt werden.
Jürgen H.
Mitglied
Beiträge: 192
Registriert: 01.06.2003 23:13

Beitrag von Jürgen H. »

Guten Morgen,

no, ganz weg war der msn-bot nun leider doch nicht. Nach Durchsicht des letzten Logfiles hat sich rausgestellt, dass nicht der msn-bot msnbot/0.11 unterwegs war, sondern msnbot/0.3.

Die Zeile in der .htaccess würde so passen?
RewriteCond %{HTTP_USER_AGENT} ^msnbot/0.3.* [OR]

Ah - wer kein mod_rewrite verwenden kann: mit der feinen Bannfunktion im Forums-ACP kann man mittels der IP-Adressen den - wie schrieb mal jemand hier pointiert im Forum - Microsoft Traffic Schlampen den Saft abdrehen.

Lg
Jürgen
Benutzeravatar
Markus Wandel
Mitglied
Beiträge: 658
Registriert: 01.12.2003 18:13
Wohnort: Wuppertal
Kontaktdaten:

Beitrag von Markus Wandel »

Hallo zusammen,

ich würde auch gerne meine Site vor BOTs schützen, aber, ich bin ehrlich, ich komme mit dem ganzen "rewrite-dings" nicht klar.

Laut phpinfo kann mein Server "mod_rewrite".

Wie muß ich denn jetzt die .htaccess einrichten damit die BOTs "ausgehebelt" werden ?

Wäre für eine Hilfe dankbar.

Danke :grin:,
Markus
WebMaster von: www.RoCoFa.de - Wir sind die RollerCoasterFans
Die Seite für Achterbahn- und Freizeitparkfans, kostenlose Mitgliedschaft, keine Verpflichtungen.
EdgarHofer
Mitglied
Beiträge: 45
Registriert: 16.06.2003 14:15
Wohnort: Österreich & Gomera
Kontaktdaten:

Error 505

Beitrag von EdgarHofer »

Der Fehler kommt auch, wenn in den http-headern der .htaccess blanks drinnen sind. die blanks kann man z.b. mit ".?" ersetzen ...

lg
Edgar
Dogi
Mitglied
Beiträge: 40
Registriert: 12.12.2004 11:49

Beitrag von Dogi »

Hallo,

habe eine Frage!
Kann ich das
# block bad bots, robots and spiders [larsneo]
RewriteCond %{HTTP_USER_AGENT} ^BlackWidow [OR]
RewriteCond %{HTTP_USER_AGENT} ^Bot\ mailto:craftbot@yahoo.com [OR]
RewriteCond %{HTTP_USER_AGENT} ^CherryPicker [OR]
RewriteCond %{HTTP_USER_AGENT} ^ChinaClaw [OR]
RewriteCond %{HTTP_USER_AGENT} ^Crescent [OR]
RewriteCond %{HTTP_USER_AGENT} ^Custo [OR]
RewriteCond %{HTTP_USER_AGENT} ^DISCo [OR]
RewriteCond %{HTTP_USER_AGENT} ^Download\ Demon [OR]
RewriteCond %{HTTP_USER_AGENT} ^eCatch [OR]
RewriteCond %{HTTP_USER_AGENT} ^EirGrabber [OR]
RewriteCond %{HTTP_USER_AGENT} ^EmailCollector [OR]
RewriteCond %{HTTP_USER_AGENT} ^EmailSiphon [OR]
RewriteCond %{HTTP_USER_AGENT} ^EmailWolf [OR]
RewriteCond %{HTTP_USER_AGENT} ^Express\ WebPictures [OR]
RewriteCond %{HTTP_USER_AGENT} ^ExtractorPro [OR]
RewriteCond %{HTTP_USER_AGENT} ^EyeNetIE [OR]
RewriteCond %{HTTP_USER_AGENT} ^FlashGet [OR]
RewriteCond %{HTTP_USER_AGENT} ^GetRight [OR]
RewriteCond %{HTTP_USER_AGENT} ^GetWeb! [OR]
RewriteCond %{HTTP_USER_AGENT} ^Go!Zilla [OR]
RewriteCond %{HTTP_USER_AGENT} ^Go-Ahead-Got-It [OR]
RewriteCond %{HTTP_USER_AGENT} ^GornKer [OR]
RewriteCond %{HTTP_USER_AGENT} ^GrabNet [OR]
RewriteCond %{HTTP_USER_AGENT} ^Grafula [OR]
RewriteCond %{HTTP_USER_AGENT} ^HMView [OR]
RewriteCond %{HTTP_USER_AGENT} HTTrack [NC,OR]
RewriteCond %{HTTP_USER_AGENT} ^Image\ Stripper [OR]
RewriteCond %{HTTP_USER_AGENT} ^Image\ Sucker [OR]
RewriteCond %{HTTP_USER_AGENT} Indy\ Library [NC,OR]
RewriteCond %{HTTP_USER_AGENT} ^InterGET [OR]
RewriteCond %{HTTP_USER_AGENT} ^Internet\ Ninja [OR]
RewriteCond %{HTTP_USER_AGENT} ^Irvine [OR]
RewriteCond %{HTTP_USER_AGENT} ^JetCar [OR]
RewriteCond %{HTTP_USER_AGENT} ^JOC\ Web\ Spider [OR]
RewriteCond %{HTTP_USER_AGENT} ^larbin [OR]
RewriteCond %{HTTP_USER_AGENT} ^LeechFTP [OR]
RewriteCond %{HTTP_USER_AGENT} ^Mass\ Downloader [OR]
RewriteCond %{HTTP_USER_AGENT} ^Microsoft.URL [OR]
RewriteCond %{HTTP_USER_AGENT} ^MIDown\ tool [OR]
RewriteCond %{HTTP_USER_AGENT} ^Mister\ PiX [OR]
RewriteCond %{HTTP_USER_AGENT} ^Mozilla.*NEWT [OR]
RewriteCond %{HTTP_USER_AGENT} ^Navroad [OR]
RewriteCond %{HTTP_USER_AGENT} ^NearSite [OR]
RewriteCond %{HTTP_USER_AGENT} ^NetAnts [OR]
RewriteCond %{HTTP_USER_AGENT} ^NetSpider [OR]
RewriteCond %{HTTP_USER_AGENT} ^Net\ Vampire [OR]
RewriteCond %{HTTP_USER_AGENT} ^NetZIP [OR]
RewriteCond %{HTTP_USER_AGENT} ^NICErsPRO [OR]
RewriteCond %{HTTP_USER_AGENT} ^Octopus [OR]
RewriteCond %{HTTP_USER_AGENT} ^oegp [OR]
RewriteCond %{HTTP_USER_AGENT} ^Offline\ Explorer [OR]
RewriteCond %{HTTP_USER_AGENT} ^Offline\ Navigator [OR]
RewriteCond %{HTTP_USER_AGENT} ^PageGrabber [OR]
RewriteCond %{HTTP_USER_AGENT} ^Papa\ Foto [OR]
RewriteCond %{HTTP_USER_AGENT} ^pavuk [OR]
RewriteCond %{HTTP_USER_AGENT} ^pcBrowser [OR]
RewriteCond %{HTTP_USER_AGENT} dloader(NaverRobot) [OR]
RewriteCond %{HTTP_USER_AGENT} ^RealDownload [OR]
RewriteCond %{HTTP_USER_AGENT} ^ReGet [OR]
RewriteCond %{HTTP_USER_AGENT} ^SearchExpress [OR]
RewriteCond %{HTTP_USER_AGENT} ^SiteSnagger [OR]
RewriteCond %{HTTP_USER_AGENT} ^SmartDownload [OR]
RewriteCond %{HTTP_USER_AGENT} ^SuperBot [OR]
RewriteCond %{HTTP_USER_AGENT} ^SuperHTTP [OR]
RewriteCond %{HTTP_USER_AGENT} ^Surfbot [OR]
RewriteCond %{HTTP_USER_AGENT} ^Siphon [OR]
RewriteCond %{HTTP_USER_AGENT} ^tAkeOut [OR]
RewriteCond %{HTTP_USER_AGENT} ^Teleport\ Pro [OR]
RewriteCond %{HTTP_USER_AGENT} ^VoidEYE [OR]
RewriteCond %{HTTP_USER_AGENT} ^Web\ Image\ Collector [OR]
RewriteCond %{HTTP_USER_AGENT} ^Web\ Sucker [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebAuto [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebBandit [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebCopier [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebFetch [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebGo\ IS [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebLeacher [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebReaper [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebSauger [OR]
RewriteCond %{HTTP_USER_AGENT} ^Website\ eXtractor [OR]
RewriteCond %{HTTP_USER_AGENT} ^Website\ Quester [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebStripper [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebWhacker [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebZIP [OR]
RewriteCond %{HTTP_USER_AGENT} ^Wget [OR]
RewriteCond %{HTTP_USER_AGENT} ^Widow [OR]
RewriteCond %{HTTP_USER_AGENT} ^WWWOFFLE [OR]
RewriteCond %{HTTP_USER_AGENT} ^Xaldon\ WebSpider [OR]
RewriteCond %{HTTP_USER_AGENT} ^Zeus [OR]
RewriteCond %{HTTP_USER_AGENT} ^ZyBorg
RewriteRule ^.* - [F,L]
auch in die .htaccess schreiben wenn dort schon die Variante Short URL von "larsneo" drin steht ?
Wenn ja ist egal ob dacor oder dahinter?

DANKE!
Benutzeravatar
plACEbo
Mitglied
Beiträge: 538
Registriert: 16.12.2003 12:22

Beitrag von plACEbo »

Hi,

slurp ist mittlerweile Dauergast bei mir und
.htaccess

Code: Alles auswählen

# prevent bots from spidering
RewriteCond %{HTTP_USER_AGENT} ^slurp 
RewriteRule ^.* - [F,L]
wirkt nicht.
Welche Möglichkeiten bieten sich mir ausserdem um diesen nervigen Bot von meinem Board zu verbannen?

Matthias
Vorwärts immer, Rückwärts nimmer!
Benutzeravatar
larsneo
Mitglied
Beiträge: 2622
Registriert: 07.03.2002 15:23
Wohnort: schwäbisch gmünd
Kontaktdaten:

Beitrag von larsneo »

probier einmal

Code: Alles auswählen

SetEnvIfNoCase User-Agent slurp spambot=1
<Limit GET POST PUT>
Order allow,deny
deny from env=spambot
allow from all
</Limit>
kannst du bitte auch einmal eine entsprechende zeile aus dem access-log posten, damit man sich den referer genauer anschauen kann?
gruesse aus dem wilden sueden
larsneo
..::[krapohl.net]::..
Benutzeravatar
plACEbo
Mitglied
Beiträge: 538
Registriert: 16.12.2003 12:22

Beitrag von plACEbo »

zB.

Code: Alles auswählen

68.142.249.207 - - [22/Jun/2005:09:04:17 +0200] "GET /forum4.html HTTP/1.0" 200 5512 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)"
Matthias
Vorwärts immer, Rückwärts nimmer!
Benutzeravatar
larsneo
Mitglied
Beiträge: 2622
Registriert: 07.03.2002 15:23
Wohnort: schwäbisch gmünd
Kontaktdaten:

Beitrag von larsneo »

und jetzt noch ein link zu deiner htaccess als .txt ;-)
gruesse aus dem wilden sueden
larsneo
..::[krapohl.net]::..
Benutzeravatar
plACEbo
Mitglied
Beiträge: 538
Registriert: 16.12.2003 12:22

Beitrag von plACEbo »

ist hier verlinkt.

Matthias
Vorwärts immer, Rückwärts nimmer!
khaledelmansoury
Mitglied
Beiträge: 11
Registriert: 24.04.2005 19:35

Beitrag von khaledelmansoury »

Wie kann man das machen das die Bots in der "Wer ist online" liste erscheinen wie hier:

http://www.user-portal.com/viewonline.php
Antworten

Zurück zu „phpBB 2.0: Mods in Entwicklung“