Seite 1 von 2

Forensuche optimieren (search_ignore_words, search_synonyms)

Verfasst: 14.07.2010 08:18
von sepp71
Hallo zusammen,

die Suchfunktion wird bei mir auch für die Similar Topics Mod benutzt. V.a. deshalb ist mir an guten Ergebnissen gelegen.
Meine bisherigen Änderungen am Backend, an den Synonymen und den Stop Words waren aber nicht wirklich erfolgreich.
  • Welche Vor- und Nachteile haben den beiden Suchindizes "fulltext native" bzw. MYSQL?
  • Muss man nach Änderungen an search_ignore_words.php und search_synonyms.php immer Cache leeren und Index neu aufbauen?
  • Werde die ignore_words eigentlich komplett ignoriert oder nur geringer gewichtet?
  • Was passiert bei versehentlichen Doppelzuweisungen (also z.B. synonym.php: Bude = Haus und in der ...ignore.php Haus) oder Doppelumleitungen, also z. B. Hütte => Bude und Bude => Haus)
  • Hat der Umfang beider Dateien irgendeine Relevanz? (Es stehen viele Begriffe darin, die in meinem Forum thematisch nicht vorkommen und deshalb nicht geregelt werden müßten)
Mein Forum läuft nicht auf eigenem Server, sondern auf gemietetem Webspace.

Über Tipps würde ich mich freuen!

Sepp

Re: Forensuche optimieren (search_ignore_words, search_synon

Verfasst: 28.07.2010 21:30
von sepp71
...das Thema ist bei mir noch aktuell. Hat jemand Ideen?
Irgendwo habe ich mal aufgeschnappt, dass Webspace- und Datenbank-Provider u.U. eine eigene Stopword-Liste durchsetzen würden, so dass die phpbb-eigene (die ich ändere) gar nicht berücksichtigt wird?

Gruß
Sepp

Re: Forensuche optimieren (search_ignore_words, search_synon

Verfasst: 20.08.2010 20:14
von sepp71
Weiß keiner mehr dazu?
Würde mich wirklich freuen...

Sepp

Re: Forensuche optimieren (search_ignore_words, search_synon

Verfasst: 21.08.2010 10:24
von schnagga
Moin,
das Thema würde mich auch interessieren.

Allgemein ist die Board-Suche von phpBB ja etwas bescheiden. Ich verwende meistens Frau Google zum Suchen. Einfach

Code: Alles auswählen

site:www.domain.tld Suchwort
im Suchfeld eingeben und gut.
Für nicht öffentliche Beiträge oder Foren, die von Google nicht so stark gespidert werden, ist das natürlich unbrauchbar :roll: .

LG

Re: Forensuche optimieren (search_ignore_words, search_synon

Verfasst: 13.09.2010 13:32
von sepp71
... jetzt bumpen wir dieses Thema schon zu zweit :wink:
Hat jemand eine Idee, wie man die Forensuche unterstützen kann?

Gruß
Sepp

Re: Forensuche optimieren (search_ignore_words, search_synon

Verfasst: 19.04.2011 16:12
von sepp71
sepp71 hat geschrieben:(...)ist mir an guten Ergebnissen [der Forensuche] gelegen.
Meine bisherigen Änderungen am Backend, an den Synonymen und den Stop Words waren aber nicht wirklich erfolgreich.
  • Welche Vor- und Nachteile haben die beiden Suchindizes "fulltext native" bzw. MYSQL?
  • Muss man nach Änderungen an search_ignore_words.php und search_synonyms.php immer (...) den Index neu aufbauen?
  • Werde die ignore_words eigentlich komplett ignoriert oder nur geringer gewichtet?
  • Was passiert bei versehentlichen Doppelzuweisungen (also z.B. synonym.php: Bude = Haus und in der ...ignore.php Haus) oder Doppelumleitungen, also z. B. Hütte => Bude und Bude => Haus)
  • Hat der Umfang beider Dateien irgendeine Relevanz? (Es stehen viele Begriffe darin, die in meinem Forum thematisch nicht vorkommen und deshalb nicht geregelt werden müßten)
Mein Forum läuft nicht auf eigenem Server, sondern auf gemietetem Webspace.

Über Tipps würde ich mich freuen!

Sepp
Es ist schon eine Weile her, aber ich bin ernsthaft weiter an dem Thema interessiert.
Kann man der Suchfunktion irgendwie "helfen"? Oder sind andere auch schon auf Google & Co. ausgewichen?

Gruß
Sepp

Re: Forensuche optimieren (search_ignore_words, search_synon

Verfasst: 09.05.2011 21:40
von sepp71
Also ich hab's aufgegeben und die Links zur boardinternen Suche weitgehend abgeklemmt :(
Nun muss ich also damit leben, dass Beiträge erst gefunden werden, wenn sie von den Suchmaschinen verzeichnet sind, aber die kommen zum Glück sehr regelmäßig bei mir vorbei.

Für Similar Topics u.a. wird aber noch auf die boardeigene Funktion zurückgegriffen - also wenn doch noch jemand antworten möchte...

Viele Grüße

Sepp

Re: Forensuche optimieren (search_ignore_words, search_synon

Verfasst: 10.05.2011 11:23
von Talk19zehn
Hallo Sepp,

mich würde die angesprochene Thematik sehr interessieren. Zunächst habe ich im "weltweiten Netz" gesucht und bin doch tatsächlich an gewissen Stellen wieder hier gelandet. Die Optimierung der Forensuche ist offenbar gelungen, wenn ich jenen Beitrag verinnerliche. Ggf. hattest du nur den weiteren Threadverlauf nicht weiter beobachtet, was ich mir eigentlich soooo gar nicht vorstellen kann.
Offenbar gab es bereits in früherer Zeit Nöte hinsichtlich search_ignore_words.php? --> http://www.phpbb.com/community/viewtopi ... &t=1300495
Interessant fand ich hierbei einen "weiteren Linkverlauf" im dritten Posting.


Schnelleinstieg schreibt auf Seite 6/10
Alternativ steht noch „Fulltext mysql“ zur Verfügung. Dieser Index steht nur zur Verfügung, wenn als Datenbanksystem MySQL verwendet wird und der Tabellentyp der phpBB-Tabellen „MyISAM“ ist. Der MySQL-Index baut komplett auf MySQL-Funktionen auf und sollte in der Regel schneller und sparsamer als „Fulltext native“ sein.
https://www.phpbb.de/downloads/3.0/quickstart.pdf



Die Hinweise zur CPU-Zeit von bantu fand ich persönlich nützlich: viewtopic.php?p=1230892#p1230892
Vorteil / Nachteil: viewtopic.php?p=1081818#p1081818


Würden verwandte Suchbegriffe nicht dazu führen, dass sich ein Suchergebnis "aufbauscht"? Ich meine, eine Teilstringsuche nach "Hausboot" würde zur Ausgabe von Haustür, Hausschlüssel, Hauswart, Logenhaus, Bootshaus, Hausbrand und so weiter führen?


Ich suche meist nur explizit nach Wörtern. So auch hier im Forum: Ich gebe bspw. hier oben im Suchfeld gar kein Suchwort mehr ein, da mir dies ziemlich sinnlos erscheint. Ich klicke hier direkt auf den grauen Button "Suche",
wähle ---> unter dem Punkt ---> Wo soll gesucht werden:
sogleich den Link ---> Forum (Erweiterte Suche nur im Forum) aus. Gebe mein Suchwort ein und es werden in Windeseile *erfolgreiche Ergebnisse ausgegeben. Lediglich in zwei Fällen scheiterte die gestrige Suche, warum auch immer.

Ist dieser Verlauf in *deinem Falle und in deinem Forum nicht gewährleistet?
Welches Backend nutzt du bzw. welche DB-Nutzungsmöglichkeit wird vom Webspace "mitgeliefert"? Ich würde mich über eine Diskussion freuen, da ich stets gern dazulerne. :wink:

Re: Forensuche optimieren (search_ignore_words, search_synon

Verfasst: 10.05.2011 16:12
von BNa
Ich kann jetzt keine der Fragen erschöpfend beantworten, da mir die Zeit fehlt
aber bei mir läuft auf meinen Boards neuerdings das hier

[Beta] Sphinx search for phpBB 1.0.beta2
http://www.phpbb.com/community/viewtopi ... 5#p4507185
von unserem frisch promovierten Lehrlingsgesellen nadermann.

Das ist die Suchmaschine, die auch auf phpbb.com läuft. Für mich gibt es nichts bessseres zur Zeit.
Dagegen stinkt die klassische phpbb3 Suche mächtig ab.

Re: Forensuche optimieren (search_ignore_words, search_synon

Verfasst: 10.05.2011 16:18
von BNa
Bleibt ja doch noch eine Minute..
Welche Vor- und Nachteile haben den beiden Suchindizes "fulltext native" bzw. MYSQL?
fulltext native ist default und wird von mir bevorzugt. MYSQL verbraucht mehr Speicherplatz.
Muss man nach Änderungen an search_ignore_words.php und search_synonyms.php immer Cache leeren und Index neu aufbauen?
Ich mache das grundsätzlich. Auch bei starken Veränderungen im Forum (Verschieben/löschen etc.)
Werde die ignore_words eigentlich komplett ignoriert oder nur geringer gewichtet?
Wenn ignore_words richtig umgesetzt/implementiert werden (nach Anleitung) spricht der Name für sich selbst
Was passiert bei versehentlichen Doppelzuweisungen (also z.B. synonym.php: Bude = Haus und in der ...ignore.php Haus) oder Doppelumleitungen, also z. B. Hütte => Bude und Bude => Haus)
Gibt warscheinlich Murks, also sollte man sich genau überlegen, was man ausschliesst und was dennoch Relevanz haben soll :-?
Hat der Umfang beider Dateien irgendeine Relevanz? (Es stehen viele Begriffe darin, die in meinem Forum thematisch nicht vorkommen und deshalb nicht geregelt werden müßten)
Jeder Umfang hat Relevanz. So viel wie nötig, so wenig wie möglich, Also wie immer.