Wofür ist die robots.txt?

Fragen zu allen Themen rund ums Programmieren außerhalb von phpBB können hier gestellt werden - auch zu anderen Programmiersprachen oder Software wie Webservern und Editoren.
Antworten
LisaserstesForum
Mitglied
Beiträge: 996
Registriert: 28.08.2008 20:20
Wohnort: Kassel

Wofür ist die robots.txt?

Beitrag von LisaserstesForum »

Hi, in meinem Error_log von der Domain sehe ich, dass ab und an versucht wird auf die Datei phpBB3/robots.txt versucht wird zuzugreifen, diese existiert aber nicht. Wofür ist die und woher bekomme ich die?
Benutzeravatar
powersilie
Mitglied
Beiträge: 822
Registriert: 09.10.2004 13:35
Wohnort: Österreich
Kontaktdaten:

Beitrag von powersilie »

Hallo Lisa!

Schau mal:

http://de.wikipedia.org/wiki/Robots_Exclusion_Standard

http://de.selfhtml.org/diverses/robots.htm

Da ist es recht gut erklärt!

lg
Powersilie
Ich bin nicht auf der Welt, um so zu sein, wie ANDERE mich gerne hätten ...
LisaserstesForum
Mitglied
Beiträge: 996
Registriert: 28.08.2008 20:20
Wohnort: Kassel

Beitrag von LisaserstesForum »

Hi Powersilie, heißt das, es reicht wenn ich eine robot.txt erstelle mit diesem Inhalt:
User-agent: *
?
Benutzeravatar
powersilie
Mitglied
Beiträge: 822
Registriert: 09.10.2004 13:35
Wohnort: Österreich
Kontaktdaten:

Beitrag von powersilie »

Hallo Lisa!

Da bin ich überfragt, ich hab noch keine erstellt :oops:

Ich habs nur auch schon mal gelesen und wollte wissen, was das ist...

Leider, da kann ich Dir nicht weiterhelfen!

lg
Powersilie
Ich bin nicht auf der Welt, um so zu sein, wie ANDERE mich gerne hätten ...
Andi1111
Mitglied
Beiträge: 1301
Registriert: 26.05.2006 13:21
Wohnort: Berlin
Kontaktdaten:

Beitrag von Andi1111 »

hallo, es kommt halt drauf an was du mit der rotots.txt erreichen willst, eigendlich braucht man keine, die bots schauen halt nur ob eine da ist. die ist aber unter umständen nutzlich um unnötigen traffic zu verhindern. ich habe im phpbb2 extrem viele zugriffe auf den kalender gehabt und den zugriff mit der robots.txt gesperrt. meine sieht da so aus:

User-agent: Googlebot
Disallow: /calendar.php
Disallow: /calendar_scheduler.php
Disallow: /tellafriend.php

User-agent: Slurp
Disallow: /calendar_scheduler.php
Disallow: /calendar.php


User-agent: *
Disallow: /calendar_scheduler.php
Disallow: /calendar.php
Benutzeravatar
bantu
Server-Team
Beiträge: 7311
Registriert: 25.04.2006 16:12
Wohnort: Karlsruhe

Beitrag von bantu »

Ich verschiebe das mal nach Coding und Technik. Mit phpBB hat es ja direkt nichts zu tun.
Powered by Coffee
hackepeter13
Valued Contributor
Beiträge: 3568
Registriert: 21.04.2004 12:22
Wohnort: Berlin
Kontaktdaten:

Beitrag von hackepeter13 »

Andi1111 hat geschrieben:hallo, es kommt halt drauf an was du mit der rotots.txt erreichen willst, eigendlich braucht man keine, die bots schauen halt nur ob eine da ist. die ist aber unter umständen nutzlich um unnötigen traffic zu verhindern. ich habe im phpbb2 extrem viele zugriffe auf den kalender gehabt und den zugriff mit der robots.txt gesperrt. meine sieht da so aus:

User-agent: Googlebot
Disallow: /calendar.php
Disallow: /calendar_scheduler.php
Disallow: /tellafriend.php

User-agent: Slurp
Disallow: /calendar_scheduler.php
Disallow: /calendar.php


User-agent: *
Disallow: /calendar_scheduler.php
Disallow: /calendar.php
User-agent: *
Bezieht sich soweit ich noch weiß auf alle Suchmaschinen/Bots.
Auf jeden Fall auch auf Google, das weiß ich da ich im Google-Webmastertool (Web-Crawl -> URLs durch robots.txt eingeschränkt) angezeigt bekomme, das ich dem Bot den Zugriff unteranderem auch auf die tellafriend.php verbiete (je die Mod habe ich auch) oder auch die privmsg.php

Kurz um - du hast die beiden *.php Dateien für den Kalender doppelt gesperrt. ;-)
Andi1111
Mitglied
Beiträge: 1301
Registriert: 26.05.2006 13:21
Wohnort: Berlin
Kontaktdaten:

Beitrag von Andi1111 »

bei google weiss ich es nicht, aber yahoo / slurp muss drin stehen sonst ignoriert der das.
Xwitz
Mitglied
Beiträge: 1104
Registriert: 21.06.2005 21:41

Re: Wofür ist die robots.txt?

Beitrag von Xwitz »

LisaserstesForum hat geschrieben:Hi, in meinem Error_log von der Domain sehe ich, dass ab und an versucht wird auf die Datei phpBB3/robots.txt versucht wird zuzugreifen, diese existiert aber nicht. Wofür ist die und woher bekomme ich die?
Die ist für bots auf Speed, denn normale bots suchen eine robots.txt nicht woanders als unter domain.tld/robots.txt.
Die robots.txt (unter der url domain.tld/robots.txt) ist eine Datei, in der Empfehlungen/Bitten deklariert werden können, welche Inhalte von bots nicht gelesen werden sollen.
Antworten

Zurück zu „Coding & Technik“