Doku zum Syntax der Suchabfrage gesucht

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

Doku zum Syntax der Suchabfrage gesucht

Beitragvon Thor » Fr Okt 24, 2008 1:42 pm

Kann mich bitte einer auf die Doku mit dem Syntax der Suchabfrage stoßen?
Wie wird eine Abfrage mit UND, ODER, NICHT usw. eingegeben?
Was funktioniert?
Was funktioniert nicht? "Georg W. Bush" soll nicht funktionieren, hab ich gelesen.
Thor
 

Re: Doku zum Syntax der Suchabfrage gesucht

Beitragvon Orbiter » Do Nov 06, 2008 12:00 pm

alles so wie man es sich denkt:
ODER gibts nicht, macht aus meiner Sicht keinen Sinn und ich kenne niemand der sowas verwendet
UND ist entsprechend dann Standard
NICHT wie bei anderen auch mit voranstehendem '-'
"" wird akzeptiert und verändert das Ranking dahingehend, das weiter zusammenstehende Wörter höher bewertet werden. Einen exakten Match haben wir noch nicht.
Orbiter
 
Beiträge: 5797
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Doku zum Syntax der Suchabfrage gesucht

Beitragvon Thor » So Nov 09, 2008 8:59 am

Hi Orbiter

Wieso macht ODER keinen Sinn? Ich verwende diese Operation sehr häufig!
Wenn ich ein Thema suche, will ich nicht zig Abfragen starten, nur um alle Synonyme zum Stichwort abzuklappern.
Also suche ich nach z.B.
Kohle OR Geld OR Kies
und habe nur eine Trefferliste, mit der ich weiterarbeite.

Bei "" findet dann also "Georg Bush" den Term "Georg W. Bush", weil Georg und Bush nahe bei einander stehen?

Aber Danke für die Hilfe
Thor
 

Re: Doku zum Syntax der Suchabfrage gesucht

Beitragvon Orbiter » So Nov 09, 2008 1:44 pm

"Kohle OR Geld OR Kies"
mag sein das man Synonyme so sinnvoll verwenden kann, ich glaube aber immer noch nicht das es wirklich so jemand benutzt. Man hat ja bei einer Google-Such meistens das 'Problem', das man ja nur eine Auswahl von 10 Treffern von hunderttausenden bekommt. Normalerweise sagt man, wenn man gute Ergebnisse haben will muss man besser suchen, und eine Nutzung von ODER macht m.E. genau das Gegenteil, weil es ja die Ergebnismenge aufpumpt anstatt sie zu schrumpfen. Ich weiss das es nur eine Beispiel ist, aber wenn man was ernsthaftes zu 'Geld' sucht sollte man nicht nach Kies oder Kohle suchen, weil das möglicherweise nicht gerade zielführend ist, bei der Autorität dieser Synonyme. Ich behaupte mal das es bei allen anderen Beispielen auch möglich ist, ein Wort zu identifizieren das stellvertretend für das Thema ist und man daher auch in den gesuchten Dokumenten stehen sollte.

Ich weiss das es nicht 'symmetrisch' ist, nur UND und nicht ODER zu implementieren. Ich argumentiere hier auch als ein Implementierer, der entscheiden muss welches Thema gerade weiter oben auf der todo-Liste stehen sollte. D.h. im Prinzip wäre eine Query-Sprache erst vollständig, wenn es auch ODER kann, aber für mich steht das eben trotzdem hinten an, auch weil ich glaube das es null Nutzer gäbe.
Orbiter
 
Beiträge: 5797
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Doku zum Syntax der Suchabfrage gesucht

Beitragvon Lotus » So Nov 09, 2008 5:59 pm

Orbiter hat geschrieben:wenn es auch ODER kann, aber für mich steht das eben trotzdem hinten an, auch weil ich glaube das es null Nutzer gäbe.

Ein ODER könnten wir intern gut für verschiedene Wortformen nutzen. Das verbessert wiederrum die Suchergebnisse.
Dieser Thread geht in diese Richtung: viewtopic.php?f=5&t=1515&p=10530&hilit=#p10530
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Doku zum Syntax der Suchabfrage gesucht

Beitragvon Thor » So Nov 09, 2008 10:36 pm

@Lotus: Danke für die Unterstützung

Ich gebe zu, daß Beispiel mit der Kohle ist in der Praxis unsinnig. Meistens versuche ich mit dem ODER verschiedene - evtl. falsche - Schreibweisen des Suchwortes auf einmal zu erschlagen. Wie in dem von Lotus angegebenen Beispiel.

Naja, vielleicht rutscht das Thema doch noch etwas nach oben auf Orbiters ToDo-Liste.
Thor
 

Re: Doku zum Syntax der Suchabfrage gesucht

Beitragvon Orbiter » So Nov 09, 2008 11:00 pm

http://www.openthesaurus.de/word_detail.php?wmid=32721
ist im Prinzip ein gutes Beispiel, aber mich graust es bei der Vorstellung simultan nach hunderten von Wortvarianten zu suchen (??) das funktioniert nicht. Erst recht nicht wenn man nach mehreren Wörtern gleichzeitig sucht, und man dann die Permutationen dieser verschiedenen Varianten betrachten müsste. Das ist schlicht out-of-scope.

WSB hat dazu sogar ein Qualitätsmerkmal aufgestellt, das die Suche nach Wortvarianten als Makel ansieht:
http://metager.de/sand.html
Die Aussage ist: nur dann ist das Ergebnis korrekt, wenn genau die gesuchten Wörter vorkommen. Bei Wortvarianten kommen die gesuchten Wörter ja gar nicht auf der gefundenen Seite vor!

Ein anderer Ansatz wäre es, alle Wörter in den geparsten Dokumenten auf Wortstämme abzubilden, und das gleiche mit den Suchwörtern zu tun. Dann hätte man alle Wörter der Varianten gleich in den Suchergebnissen. Aber ich bin mir nicht so sicher ob das immer korrekt arbeitet, und ob das immer gewünscht ist. Ich meinerseits will in den Ergebnissen auf jeden Fall nur solche Wörter drin haben, nach denen ich gesucht habe.
Orbiter
 
Beiträge: 5797
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Doku zum Syntax der Suchabfrage gesucht

Beitragvon Lotus » Mo Nov 10, 2008 2:15 pm

Orbiter hat geschrieben:WSB hat dazu sogar ein Qualitätsmerkmal aufgestellt, das die Suche nach Wortvarianten als Makel ansieht:
[...]
Ich meinerseits will in den Ergebnissen auf jeden Fall nur solche Wörter drin haben, nach denen ich gesucht habe.

Ich bin sowohl über den Fund der genauen Worte als auch über deren deklinierten und konjugierten Formen froh. Je nach Art meiner Suche. Wenn ich Ergebnisse haben möchte, in denen die Wörter in einem präzisen Zusammehang stehen , suche ich nach den Wortformen wie es jemand geschrieben haben könnte. Bei anderen Suchanfragen freue ich mich darüber, dass alle Wortformen gefunden werden, da ich allgemeine Ergebnisse zur Suchanfrage haben möchte und der Zusammenhang der Wörter erst einmal unerheblich ist.
Der Sand-Test der auch Versandkosten findet muss es nicht sein. Darin sehe ich auch keinen Mehrwert. Aber eine Anfrage nach "Sand" kann gerne die deklinierten Formen finden. Sand, Sande, Sandes, Sände, Sänder, Sänden

Zur Überlegung der Realisierung bin ich auch darauf gekommen die Arbeit auf die Indexierzeit zu verschieben. Meine momentane Überlegung ist die Wörter per Wörterbuch auf einen Wortstamm zu prüfen und bei vorhandenem Stamm, diesen zusätzlich als Wort-Hash abzuspeichern. Das verringert dann die möglichen Oder-Abfragen die wiederrum über das Wörterbuch aus dem Suchterm hervorgehen. Denkbar wäre auch den Wortstamm mit einem Salt zu versehen, der es als solchen kennzeichnet. Dann gäbe es zwei Suchoptionen: exakter Match, oder Suche auch nach Wortstämmen.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron