Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs ( eintragen.
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.


Beitragvon tinkerphone » So Okt 12, 2014 4:19 pm

somehow the option to activate stop-words is missing from CrawlStartExpert.html (actually I can find it anywhere). Version 1.81/9030 or higher.

Additional questions:
1. Is it right that the option to use stop-words is activated by default?

2. What is the correct layout for the yacy.stopwords file?

is it:
Code: Alles auswählen
# Comment
yacy.stopwords.en #special for EN #Special for DE
html, htm, www, src #Default, these are always used, independent of Country Code....

3. Is there a good Stop-Word list somewhere ready?

4. Is it possible to clean the index with a new stop-word list? Or do I in need to re-crawl?

Beiträge: 26
Registriert: Fr Okt 10, 2014 10:38 am

Re: Stop-Words

Beitragvon Orbiter » Di Nov 11, 2014 10:42 am

a stopword-list is always used but the default list is empty. Please see the YaCy home directory: yacy.stopwords
This file can be filled with words, one per line.

We experimented with default stopword lists a long time ago and found out that this does not make sense in many cases. There is no use at all of them. If you don't want results for stopwords, just do not search for them. If you do not want results with special words in the text, just don't index them, use the content filter in the crawl start.

Because we did not find that stopwords are not usefull, we also have no hint where to find one. However, you may do experiments with that feature and tell us your use case.
Beiträge: 5798
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste