Wofür ist die robots.txt?
-
- Mitglied
- Beiträge: 996
- Registriert: 28.08.2008 20:20
- Wohnort: Kassel
Wofür ist die robots.txt?
Hi, in meinem Error_log von der Domain sehe ich, dass ab und an versucht wird auf die Datei phpBB3/robots.txt versucht wird zuzugreifen, diese existiert aber nicht. Wofür ist die und woher bekomme ich die?
- powersilie
- Mitglied
- Beiträge: 822
- Registriert: 09.10.2004 13:35
- Wohnort: Österreich
- Kontaktdaten:
Hallo Lisa!
Schau mal:
http://de.wikipedia.org/wiki/Robots_Exclusion_Standard
http://de.selfhtml.org/diverses/robots.htm
Da ist es recht gut erklärt!
lg
Powersilie
Schau mal:
http://de.wikipedia.org/wiki/Robots_Exclusion_Standard
http://de.selfhtml.org/diverses/robots.htm
Da ist es recht gut erklärt!
lg
Powersilie
Ich bin nicht auf der Welt, um so zu sein, wie ANDERE mich gerne hätten ...
-
- Mitglied
- Beiträge: 996
- Registriert: 28.08.2008 20:20
- Wohnort: Kassel
- powersilie
- Mitglied
- Beiträge: 822
- Registriert: 09.10.2004 13:35
- Wohnort: Österreich
- Kontaktdaten:
hallo, es kommt halt drauf an was du mit der rotots.txt erreichen willst, eigendlich braucht man keine, die bots schauen halt nur ob eine da ist. die ist aber unter umständen nutzlich um unnötigen traffic zu verhindern. ich habe im phpbb2 extrem viele zugriffe auf den kalender gehabt und den zugriff mit der robots.txt gesperrt. meine sieht da so aus:
User-agent: Googlebot
Disallow: /calendar.php
Disallow: /calendar_scheduler.php
Disallow: /tellafriend.php
User-agent: Slurp
Disallow: /calendar_scheduler.php
Disallow: /calendar.php
User-agent: *
Disallow: /calendar_scheduler.php
Disallow: /calendar.php
User-agent: Googlebot
Disallow: /calendar.php
Disallow: /calendar_scheduler.php
Disallow: /tellafriend.php
User-agent: Slurp
Disallow: /calendar_scheduler.php
Disallow: /calendar.php
User-agent: *
Disallow: /calendar_scheduler.php
Disallow: /calendar.php
Besucht mich mal http://www.das-gameboard.de phpbb3 testboard http://www.das-gameboard.com
-
- Valued Contributor
- Beiträge: 3568
- Registriert: 21.04.2004 12:22
- Wohnort: Berlin
- Kontaktdaten:
User-agent: *Andi1111 hat geschrieben:hallo, es kommt halt drauf an was du mit der rotots.txt erreichen willst, eigendlich braucht man keine, die bots schauen halt nur ob eine da ist. die ist aber unter umständen nutzlich um unnötigen traffic zu verhindern. ich habe im phpbb2 extrem viele zugriffe auf den kalender gehabt und den zugriff mit der robots.txt gesperrt. meine sieht da so aus:
User-agent: Googlebot
Disallow: /calendar.php
Disallow: /calendar_scheduler.php
Disallow: /tellafriend.php
User-agent: Slurp
Disallow: /calendar_scheduler.php
Disallow: /calendar.php
User-agent: *
Disallow: /calendar_scheduler.php
Disallow: /calendar.php
Bezieht sich soweit ich noch weiß auf alle Suchmaschinen/Bots.
Auf jeden Fall auch auf Google, das weiß ich da ich im Google-Webmastertool (Web-Crawl -> URLs durch robots.txt eingeschränkt) angezeigt bekomme, das ich dem Bot den Zugriff unteranderem auch auf die tellafriend.php verbiete (je die Mod habe ich auch) oder auch die privmsg.php
Kurz um - du hast die beiden *.php Dateien für den Kalender doppelt gesperrt.

bei google weiss ich es nicht, aber yahoo / slurp muss drin stehen sonst ignoriert der das.
Besucht mich mal http://www.das-gameboard.de phpbb3 testboard http://www.das-gameboard.com
Re: Wofür ist die robots.txt?
Die ist für bots auf Speed, denn normale bots suchen eine robots.txt nicht woanders als unter domain.tld/robots.txt.LisaserstesForum hat geschrieben:Hi, in meinem Error_log von der Domain sehe ich, dass ab und an versucht wird auf die Datei phpBB3/robots.txt versucht wird zuzugreifen, diese existiert aber nicht. Wofür ist die und woher bekomme ich die?
Die robots.txt (unter der url domain.tld/robots.txt) ist eine Datei, in der Empfehlungen/Bitten deklariert werden können, welche Inhalte von bots nicht gelesen werden sollen.