suchmaschinenfreundlich?

Probleme bei der regulären Arbeiten mit phpBB, Fragen zu Vorgehensweisen oder Funktionsweise sowie sonstige Fragen zu phpBB im Allgemeinen.
Forumsregeln
phpBB 2.0 hat das Ende seiner Lebenszeit überschritten
phpBB 2.0 wird nicht mehr aktiv unterstützt. Insbesondere werden - auch bei Sicherheitslücken - keine Patches mehr bereitgestellt. Der Einsatz von phpBB 2.0 erfolgt daher auf eigene Gefahr. Wir empfehlen einen Umstieg auf phpBB 3.1, welches aktiv weiterentwickelt wird und für welches regelmäßig Updates zur Verfügung gestellt werden.
Benutzeravatar
skdluxe
Mitglied
Beiträge: 253
Registriert: 16.12.2004 11:17
Wohnort: Otterndorf

Beitrag von skdluxe »

Puh, viel Stoff!

Wie sieht denn eine "norm" robot.txt , für eine "normales" Forum aus? Ohne short url???
Was sollte da drin sein?
Benutzeravatar
larsneo
Mitglied
Beiträge: 2622
Registriert: 07.03.2002 15:23
Wohnort: schwäbisch gmünd
Kontaktdaten:

Beitrag von larsneo »

Wie sieht denn eine "norm" robot.txt , für eine "normales" Forum aus? Ohne short url???
Was sollte da drin sein?
gar nichts - da du in aller regel nichts ausschliessen willst...
gruesse aus dem wilden sueden
larsneo
..::[krapohl.net]::..
Benutzeravatar
BraveEagle
Mitglied
Beiträge: 1884
Registriert: 16.01.2003 18:05
Wohnort: born 2 be a Paelzer
Kontaktdaten:

Beitrag von BraveEagle »

@ larenso wie siehts nun mit der robots.txt aus? so i.O.?
Christian Benz
Mitglied
Beiträge: 854
Registriert: 25.02.2004 00:41
Wohnort: Regen
Kontaktdaten:

Beitrag von Christian Benz »

Hi BraveEagle,

Code: Alles auswählen

Disallow: /*?
Sagt dann, dass alle URLs die mit einem "?" aufhören nicht mit indiziert werden dürfen?
Jein. Es darf mit ? aufhören aber auch noch irgendwas danach folgen.
User-agent: *
Disallow: /
*?
[...]
Disallow: /ptopic*.html$
Disallow: /ntopic*.html$
[...]
Das rote (* Platzhalter und $ Ende-Anker) wird - wenn man der Info auf dieser Seite trauen darf - derzeit nur vom Googlebot unterstützt. Wenn du aber "User-agent: *" schreibst gelten diese Anweisungen für alle Bots. D.h. jeder Bot, mit Ausnahme von Googlebot, kapiert das mit den Platzhaltern nicht.

Lass deine robots.txt mal hier durchlaufen:
http://www.searchengineworld.com/cgi-bin/robotcheck.cgi

Weiterer Lesestoff:
http://www.google.de/webmasters/3.html#B3

Gruß,
Chris
Benutzeravatar
BraveEagle
Mitglied
Beiträge: 1884
Registriert: 16.01.2003 18:05
Wohnort: born 2 be a Paelzer
Kontaktdaten:

Beitrag von BraveEagle »

Christian Benz hat geschrieben: Lass deine robots.txt mal hier durchlaufen:
http://www.searchengineworld.com/cgi-bin/robotcheck.cgi
Dann sagt er mir das:

Code: Alles auswählen

17	warning	Possible Missplaced Wildcard. Although Google supports wildcards in the Disallow field, it is nonstandard.

Disallow: /ptopic*.html$
18	warning	Possible Missplaced Wildcard. Although Google supports wildcards in the Disallow field, it is nonstandard.

Disallow: /ntopic*.html$
19	warning	Possible Missplaced Wildcard. Although Google supports wildcards in the Disallow field, it is nonstandard.

Disallow: /ftopic*asc*.html$
Hmm dann wäre die robots.txt eigentlich nur für den googlebot gut und für den Rest nicht. Mich wundert nur ein wenig, dass es bisher anscheinend keine robots.txt gibt, die für den shorturl mod geschrieben wurde und suchmaschinenfreundlich ist
Christian Benz
Mitglied
Beiträge: 854
Registriert: 25.02.2004 00:41
Wohnort: Regen
Kontaktdaten:

Beitrag von Christian Benz »

Hi,
Hmm dann wäre die robots.txt eigentlich nur für den googlebot gut und für den Rest nicht.
Ist doch nicht weiter schlimm. Du kannst ja zuerst mal nur die Anweisungen explizit für den Googlebot angeben ...

Code: Alles auswählen

User-agent: Googlebot
Disallow: /*?
Disallow: /admin/
Disallow: /db/
Disallow: /images/
[...]
Disallow: /ptopic*.html$
[... bla bla usw.]
... und danach noch mal die Anweisungen für den ganzen "Spiderbot-Rest" (nur dieses Mal eben ohne Platzhalter bei den Disallow-Angaben):

Code: Alles auswählen

User-agent: *
Disallow: /admin/
Disallow: /db/
Disallow: /images/
[... bla bla usw.]
Gruß,
Chris
Benutzeravatar
BraveEagle
Mitglied
Beiträge: 1884
Registriert: 16.01.2003 18:05
Wohnort: born 2 be a Paelzer
Kontaktdaten:

Beitrag von BraveEagle »

k habe nun diese robots.txt:


Code: Alles auswählen

User-agent: Googlebot
Disallow: /*?
Disallow: /admin/
Disallow: /db/
Disallow: /images/
Disallow: /includes/
Disallow: /language/
Disallow: /templates/
Disallow: /config.php
Disallow: /profile.php
Disallow: /groupcp.php
Disallow: /memberlist.php 
Disallow: /modcp.php
Disallow: /posting.php
Disallow: /privmsg.php
Disallow: /viewonline.php
Disallow: /faq.php
Disallow: /ptopic*.html$
Disallow: /ntopic*.html$
Disallow: /ftopic*asc*.html$

User-agent: *
Disallow: /admin/
Disallow: /db/
Disallow: /images/
Disallow: /includes/
Disallow: /language/
Disallow: /templates/
Disallow: /config.php
Disallow: /profile.php
Disallow: /groupcp.php
Disallow: /memberlist.php 
Disallow: /modcp.php
Disallow: /posting.php
Disallow: /privmsg.php
Disallow: /viewonline.php
Disallow: /faq.php
Das müsste ja nun so stimmen oder?
Benutzeravatar
skdluxe
Mitglied
Beiträge: 253
Registriert: 16.12.2004 11:17
Wohnort: Otterndorf

Beitrag von skdluxe »

larsneo hat geschrieben:gar nichts - da du in aller regel nichts ausschliessen willst...
Aber macht es Sinn, dass "er" jede *.php durchsucht!
Benutzeravatar
BraveEagle
Mitglied
Beiträge: 1884
Registriert: 16.01.2003 18:05
Wohnort: born 2 be a Paelzer
Kontaktdaten:

Beitrag von BraveEagle »

ach ja wenn ich nun die robots.txt checken lasse kommt:

Code: Alles auswählen

2	warning	Possible Missplaced Wildcard. Although Google supports wildcards in the Disallow field, it is nonstandard.

Disallow: /*?
18	warning	Possible Missplaced Wildcard. Although Google supports wildcards in the Disallow field, it is nonstandard.

Disallow: /ptopic*.html$
19	warning	Possible Missplaced Wildcard. Although Google supports wildcards in the Disallow field, it is nonstandard.

Disallow: /ntopic*.html$
20	warning	Possible Missplaced Wildcard. Although Google supports wildcards in the Disallow field, it is nonstandard.

Disallow: /ftopic*asc*.html$
kann ich die nun so lassen?
Christian Benz
Mitglied
Beiträge: 854
Registriert: 25.02.2004 00:41
Wohnort: Regen
Kontaktdaten:

Beitrag von Christian Benz »

Hi,

müßte imho so passen, da jetzt die Zeilen mit den Wildcards nur noch für'n Googlebot gelten und die anderen Bots den unteren robots.txt-Teil nutzen.

Gruß,
Chris
Antworten

Zurück zu „phpBB 2.0: Administration, Benutzung und Betrieb“