Suche nach Begriffen mit Bindestrich

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

Suche nach Begriffen mit Bindestrich

Beitragvon Huppi » Mo Apr 20, 2009 12:09 am

In meinem beruflichen Umfeld gibt es ein Protein namens "KIT", synonym "c-kit" oder "CD117".
Wenn ich z.B. über Sciencenet nach CD117 suche, bekomme ich gute Suchergebnisse, bei der Suche nach "c-kit" finde ich nur Webseiten, in denen "kit" vorkommt, halt viele Seiten aus Karlsruhe ;-)
Ich vermute, durch den Bindestrich werden Wörter einfach getrennt.

Gibt es hier einen Workaround?

Zur Erläuterung:
http://de.wikipedia.org/wiki/C-Kit
Huppi
 
Beiträge: 898
Registriert: Fr Jun 29, 2007 9:49 am
Wohnort: Kürten

Re: Suche nach Begriffen mit Bindestrich

Beitragvon Orbiter » Mo Apr 20, 2009 12:23 am

das minus '-', oder Bindestrich (je nach Kontext) wird als whitespace interpretiert, und dann zu kurze Wörter (das 'c') verworfen. Es gibt immer wieder Fälle, wo man auf den Bindestrich wie in diesem Fall nicht verzichten sollte. Kann man das formalisieren? Kennt hier jemand dazu Regeln? Hier würde ich spontan sagen: wenn der Bindestrich nur 1-2 stellige Wörter verbindet, ist er kein Whitespace. Wie würdet ihr die Regel sehen?
Orbiter
 
Beiträge: 5796
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Suche nach Begriffen mit Bindestrich

Beitragvon Quix0r » Mi Apr 22, 2009 11:29 am

In Anführungszeichen (doppelt oder einfach?): Alles darin als *ein* Wort ansehen, fehlen diese, Default-Regeln verwenden.
Quix0r
 
Beiträge: 1345
Registriert: Di Jul 31, 2007 9:22 am
Wohnort: Krefeld

Re: Suche nach Begriffen mit Bindestrich

Beitragvon thq » Mi Apr 22, 2009 12:39 pm

Ich war gerade dabei mein YaCy das beizubringen, ich konnte schon nach 22.04.2009 ... suchen, oder nach isbn 978-3-411-06712-1, oder nach firefox 3.0.9. Desweiteren hatte ich die Satzfindung etwas verbessert gehabt, leider hat sich ein Rechner verabschiedet und ich habe deswegen zur Zeit andere Probleme ;)

Das mit dem Bindestrich hatte ich so gelöst das ich ein fach jede Kombination gespeichert habe, also aus AA-BB-CC wurde AA-BB-CC, AA-BB, BB-CC, AA, BB, CC. Wenn allerdings Links und Rechts von Bindestrich nur Zahlen waren wurde nicht getrennt wie z.B. bei einer ISBN.

Bei Zahlen wie die Version 3.0.9 von Firefox habe ich 3.0 und 3.0.9 gespeichert und da meine minimale Wortlänge auf 2 eingestellt war wurden 13:15 oder 14:30:10 verworfen.
thq
 
Beiträge: 651
Registriert: So Jul 08, 2007 12:23 pm

Re: Suche nach Begriffen mit Bindestrich

Beitragvon Orbiter » Mi Apr 22, 2009 1:39 pm

thq hat geschrieben:Das mit dem Bindestrich hatte ich so gelöst das ich ein fach jede Kombination gespeichert habe, also aus AA-BB-CC wurde AA-BB-CC, AA-BB, BB-CC, AA, BB, CC. Wenn allerdings Links und Rechts von Bindestrich nur Zahlen waren wurde nicht getrennt wie z.B. bei einer ISBN.

Bei Zahlen wie die Version 3.0.9 von Firefox habe ich 3.0 und 3.0.9 gespeichert und da meine minimale Wortlänge auf 2 eingestellt war wurden 13:15 oder 14:30:10 verworfen.

Das ist gut! man muss aber dann bei der Suche auch was machen. Ich glaube das muss man aber nur das Trennen nach den whitespaces '.' und '-' entfernen, oder?
Orbiter
 
Beiträge: 5796
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Suche nach Begriffen mit Bindestrich

Beitragvon thq » Mi Apr 22, 2009 1:56 pm

Ich muss erstmal gucken welche Daten ich wieder herstellen kann und wann, so kann ich gar nicht genau sagen wo ich was gemacht habe. Das kann schon sein das ich das gemacht habe, was sich auf jedenfall geändert hat, war das ein ausschließen, also ein -DasNicht zwingend ein Leerzeichen vor dem - brauchte. Was nicht richtig funktioniert hat war das hervorheben in den Snippets, dazu bin ich nicht mehr gekommen.
thq
 
Beiträge: 651
Registriert: So Jul 08, 2007 12:23 pm

Re: Suche nach Begriffen mit Bindestrich

Beitragvon Huppi » Mi Apr 22, 2009 9:06 pm

Das mit dem Bindestrich hatte ich so gelöst das ich ein fach jede Kombination gespeichert habe, also aus AA-BB-CC wurde AA-BB-CC, AA-BB, BB-CC, AA, BB, CC. Wenn allerdings Links und Rechts von Bindestrich nur Zahlen waren wurde nicht getrennt wie z.B. bei einer ISBN.


Cool. Das gefällt mir!
Huppi
 
Beiträge: 898
Registriert: Fr Jun 29, 2007 9:49 am
Wohnort: Kürten


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste

cron