Hallo,
ich möchte den Crawler "LCC" in die Bot-Liste aufnehmen. Er wird in der Liste der Gäste als "LCC (+http://corpora.informatik.uni-leipzig.d ... r_faq.html)" aufgeführt. Wenn ich "LCC" oder andere Elemente der Zeichenfolge, die mit der Browser-Signatur des Bots übereinstimmt, verwende, wird der Crawler trotzdem noch als Gast aufgeführt. Bei Bing, MSN, Google usw. hat es problemlos funktioniert. Hat jemand eine Idee woran das bei LCC scheitert?
Gruß.
[3.2] Spiders & Robots verwalten
Forumsregeln
Bitte im Thementitel den Präfix deiner phpBB-Version angeben
Bitte im Thementitel den Präfix deiner phpBB-Version angeben
[3.2] Spiders & Robots verwalten
Deutsches Asterix Archiv
http://www.comedix.de/
http://www.comedix.de/
Re: [3.2] Spiders & Robots verwalten
Hallo,
ist natürlich die Frage, wie dein "Code zum finden der Bots" aussieht (RegEx?).
Können wir leider nichts dazu sagen, wenn wir das nicht wissen.
Ansonsten kannst Du den LCC natürlich auch über seine beiden Stamm-IPs erkennen:
http://webrobots.de/lcc-httpcorpora-informatik/
ist natürlich die Frage, wie dein "Code zum finden der Bots" aussieht (RegEx?).
Können wir leider nichts dazu sagen, wenn wir das nicht wissen.
Ansonsten kannst Du den LCC natürlich auch über seine beiden Stamm-IPs erkennen:
http://webrobots.de/lcc-httpcorpora-informatik/
Area51@4seven | Area51@4seven / Reloaded | Kein Support via PN
Club goin up, on a Tuesday...
Club goin up, on a Tuesday...