String-Suche kaputt

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

String-Suche kaputt

Beitragvon wsb » Mi Jun 15, 2011 1:44 pm

Seit einiger Zeit kann YaCy ja auch die Stringsuche - das ist gut. Aber es scheinen Bugs darin zu sein. Folgende Lage: ich crawle vom Startpunkt http://suma-ev.de diese Domain. Wie mir der Crawler-Monitor korrekt anzeigt, wird auch die Seite http://www.suma-ev.de/ziele/index.html gecrawlt. Auf dieser Seite gibt es einen String "Was ist Wissen". Wenn ich dann danach suche, wird dieser String nur gefunden, wenn ich die Anführungsstriche weglasse, also keine Stringsuche mache. Bei anderen Stringsuchen werden die Anführungsstriche schlicht ignoriert; wann jeweils was passiert, scheint zufällig (SVN 0.99/7780).
wsb
 
Beiträge: 201
Registriert: Mi Jun 27, 2007 2:53 pm

Re: String-Suche kaputt

Beitragvon Orbiter » Mi Jun 15, 2011 2:37 pm

nee kaputt ist das nicht, es funktioniert nur nicht so wie gedacht! Wenn du nach "was ist wissen site:www.suma-ev.de" suchst (ohne quotes) bekommst du ein Treffer mit dem Snippet
"Abschließend sollten wir uns darüber im Klaren sein, dass alles, was wir über Wissen wissen, nur rekursiv sein kann, denn es ist Teil des Wissens"
und da ist "was ist wissen" nicht drin. Darauf wird gemappt. Das klappt nicht. Man muss das anders machen.
Dieser Fall trifft jetzt auch auf weil 'was' und 'ist' eigentlich stopwords sind, die überall vorkommen und das für den Snippetgenerator sehr anspruchsvoll ist das richtige Snippet zu generieren.

Ich gucke mal ob ein quick-hack möglich ist.
Orbiter
 
Beiträge: 5796
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: String-Suche kaputt

Beitragvon wsb » Di Jun 21, 2011 5:53 am

Orbiter hat geschrieben:nee kaputt ist das nicht, es funktioniert nur nicht so wie gedacht! [...]
Dieser Fall trifft jetzt auch auf weil 'was' und 'ist' eigentlich stopwords sind, die überall vorkommen und das für den Snippetgenerator sehr anspruchsvoll ist das richtige Snippet zu generieren.
Ich gucke mal ob ein quick-hack möglich ist.

D.h. doch konkret?: dass z.Zt. die Stringsuche nur dann Strings findet, wenn diese keine Stoppworte enthalten? Das wäre nicht gut (it's not a feature, it's a bug ;-): gerade Strings/Zitate enthalten meist Stoppworte.
wsb
 
Beiträge: 201
Registriert: Mi Jun 27, 2007 2:53 pm


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste