Seite 1 von 2

Seltsame Statistik

Verfasst: 18.06.2006 22:19
von ema2412
Hy Leute,

beim genaueren durchstöbern meiner akutellen Aufrufstatistik für mein Forum ist mir etwas ganz eigenartiges aufgefallen.

Bei den Anfragen nach Ländern ist bei mir Japan an dritter stelle. da es sich um ein österreichisches Board handelt und es auch keine User gibt die sich in Japan aufhalten ist das doch ein wenig eigenartig.
Was mich noch stutziger gemacht hat ist das fast 50 % des traffics von Japan verursacht wurde.

Kann man da auf irgendwas rückschließen? Suchmaschine, Bots was auch immer, hatte in letzter zeit wieder ziemlich viele solche Bots-Werbeanmeldungen.

Verfasst: 18.06.2006 22:22
von Xwitz
Da wirst Du in die logfiles schauen müssen. Ein "Bilderdieb" vielleicht.

Verfasst: 18.06.2006 22:29
von ema2412
hmm das könnt sein, die zahl der Anfragen (6%) steht nämlich in keinem Verhältnis zu den kb (41%)

hab jetzt auch die ip adresse (rechner) der dies scheinbar verursacht lokalisieren können. Was kann ich mit der p8187-ipbffx02marunouchi.tokyo.ocn.ne.jp anfangen?

Verfasst: 18.06.2006 22:31
von Xwitz
Schaue lieber in die logfiles nach dem Referer, dann findest Du gleich den konkreten Pfad. Kommst Du an die logfiles?

PS: Die IP vom user bringt Dir nichts.

Verfasst: 18.06.2006 22:58
von ema2412
hab jetzt die logs und nach was muss ich jetzt genau suchen?

Verfasst: 18.06.2006 23:09
von Xwitz
1. Ein geeigneter Editor, der Windowseigene taugt da nicht viel. Excel geht gut "laden" "alle" und dann bei Leerzeichen trennen.
2. Suchen: Sehr groß? Wenn nicht nach dem Aufruf eines einzelnen Bildes suchen sonnst nach einer Domain mit japanischer tld. Ich suche mal wie die heißt.

PS: Suche nach .jp/ und ob mit einer IP nur ein Aufruf (z.B. auf ein Bild) erfolgt. Da kannst Du auch den Windowseditor nehmen. Kompletten Referer-Pfad in den Zwischenspeicher kopieren und dann in die Adreßzeile des Browsers einfügen. Fertig (außer bei Paßwortschutz).

Verfasst: 18.06.2006 23:23
von Luckyze
hi

ich habe in einen andern board mal dass hier zum thema trafficklau gelesen.
Matthias hat geschrieben:das Problem habe ich mit einer .htaccess Datei gelöst. Anregungen dazu hab ich unter anderem hier gefunden: http://www.trafficklau.de/trafficklau.html
Ganz grob: Diese Datei kontrolliert ob ein Bild auf einem bestimmten Server gezeigt werden darf oder nicht.

Es war eigentlich ganz einfach, wenn man diese Datei erstellt hat braucht man sie nur in den Ordner kopieren in dem sich die zu schützenden Bilder befinden.

Folgendes sollte in der Datei stehen:

RewriteEngine on
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http://(www\.)?deine eigene Homepage.de(/.*)?$ [NC]
RewriteCond %{HTTP_REFERER} !^http://(www\.)?andere HP-Adresse oder Forum wo zeigen erlaubt ist.com(/.*)?$ [NC]
RewriteRule \.(gif|jpg|GIF|JPG)$
http : //w w w.eigeneHomepage/ersatz.gif [R,L]

Wenn man kein Ersatzbild zeigen will, läßt man die letzte Zeile einfach weg und es wird dann nur ein rotes Kreuz gezeigt, welches keinen Traffic erzeugt.

Wichtig ist die Datei als .htaccess abzuspeichern, dass aber wird auf dem PC nicht funktionieren, sofern man kein UNIX drauf hat. Ich habe die Datei als 1.htaccess auf dem PC gespeichert und dann auf dem Webserver hochgeladen, danach habe ich sie über mein ftp-Programm auf dem Server in .htaccess umbenannt. Das war es.

Ach ja, will man einige Bilder überall zeigen, legt man sie am besten in einem extra-Ordner ohne .htaccess Datei ab.
quelle => Hobbyeck

greetz Luckyze

Verfasst: 19.06.2006 08:49
von ema2412
hmm schaut so aus als wär das ein Web Crawler von ner Japanischen Uni.

das ist der Link der in den Logs andauernd auftaucht: http://www.yama.info.waseda.ac.jp/~yama ... ex_eng.htm


der Crwaler dürft mein ganzes Forum durchsuchen, schaut sich fast alle Themen an, aber Bilder sind nicht betroffen.

Also was soll ich jetzt machen?

Verfasst: 20.06.2006 12:57
von ema2412
was soll ich tun?

Verfasst: 20.06.2006 14:08
von miccom
den crawler über die robots.txt aussperren:

Code: Alles auswählen

User-agent: ichiro
Disallow: /
deren crawler ist zwar die reinste dos-maschine, aber an die robots.txt hält er sich.