Facetten aufbauen und Infos mittels Regex extrahieren

Keine Scheu, hier darf alles gefragt und diskutiert werden. Das ist das Forum für YaCy-Anfänger. Hier kann man 'wo muss man klicken' fragen und sich über Grundlagen zur Suchmaschinentechnik unterhalten.
Forumsregeln
Hier werden Fragen beantwortet und wir versuchen die Probleme von YaCy-Newbies zu klären. Bitte beantwortete Fragen im YaCy-Wiki http://wiki.yacy.de dokumentieren!

Facetten aufbauen und Infos mittels Regex extrahieren

Beitragvon mercutio » Sa Jan 25, 2014 2:25 pm

Hallo zusammen,

ich bin YacY Einsteiger (aber schon recht fit im Umgang mit anderen Suchtechnologien wie Elasticsearch).
Derzeit teste ich YaCy im Bereich Facettierung, Vocabularies etc.

Und hierzu habe ich gleich ein paar Fragen. Das Wiki und Forum sind klasse, aber leider konnte ich keine Antworten finden.
Daher hoffe ich auf Hinweise oder Infos über diesen Thread, was mit Bordmitteln geht und was ich ggf. mit Java zusätzlich implementieren kann.

Wenn man ein Vocabulary anlegt: über welche Felder wird dann im Index nach Treffern gesucht?
Ich habe in einem ersten Test festgestellt, dass die Werte aus dem Vocabulary anscheinend über den gesamten Text einer Seite geprüft werden.
Kann man konfigurieren, auf welchen Index Feldern die Begriffe aus dem Vocabulary geprüft werden sollen?

Außerdem würde ich gerne Indexfelder mittels regulärer Ausdrücke füllen. Wenn z.B. im Text einer Seite eine ISBN Nummer genannt wird und ein zuvor definierter regulärer Ausdruck dafür matcht, wäre es super, wenn die ISBN dann in einem separaten Feld des Solr Dokuments gespeichert werden würde.

Danke im Voraus für Eure Tipps!
Mercutio
mercutio
 
Beiträge: 1
Registriert: Sa Jan 25, 2014 2:11 pm

Zurück zu Hilfe für Einsteiger und Anwender

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast