Tag- und Kategorie-Seiten in den Suchergebnissen abwerten?

Keine Scheu, hier darf alles gefragt und diskutiert werden. Das ist das Forum für YaCy-Anfänger. Hier kann man 'wo muss man klicken' fragen und sich über Grundlagen zur Suchmaschinentechnik unterhalten.
Forumsregeln
Hier werden Fragen beantwortet und wir versuchen die Probleme von YaCy-Newbies zu klären. Bitte beantwortete Fragen im YaCy-Wiki http://wiki.yacy.de dokumentieren!

Tag- und Kategorie-Seiten in den Suchergebnissen abwerten?

Beitragvon Chrissss » Do Jun 05, 2014 5:43 pm

Hallo Yacy-Community,

ich betreibe unter http://tuxsucht.de eine Google-CSE, die nur deutschsprachige Inhalte rund um Linux und freie Software abbildet. Schon länge schiele ich darauf auf Yacy umzusteigen -- rein vom Gefühl her ist auf der Seite Google fehlt am Platz ;) Nun habe ich auf einem kleinen Server testweise Yacy eingerichtet. Unter http://linuxandi.net:8090 lässt sich das schon aufrufen. Nun bin ich dabei ein paar Seiten zu indexieren, was schon einmal gut klappt.

Woran ich mir aber aktuell die Zähne ausbeiße ist ein brauchbares Ranking, bei sehr generischen Suchbegriffen wie Ubuntu (Siehe http://linuxandi.net:8090/yacysearch.html?query=ubuntu) Die obersten Treffer sind allesamt Kategorie und Tag-Seiten wie blog.example.com/cat/... oder blog.example.com/tag/... "Richtige" Beiträge finden sich erst sehr weit hinten. Ich habe schon verschiedene Solr-Boosts-Einstellungen probiert, aber diese Seiten landen immer ganz vorne. Könnte mich hier jemand an die Hand nehmen, und mir ein paar Tipps geben, wie das richtig zu konfigurieren ist?

Danke
Christoph
Chrissss
 
Beiträge: 2
Registriert: Do Jun 05, 2014 5:26 pm

Re: Tag- und Kategorie-Seiten in den Suchergebnissen abwerte

Beitragvon Chrissss » Do Jun 05, 2014 6:03 pm

Ich antworte mir mal schnell selber... Ich habe entsprechend viewtopic.php?f=18&t=5192#p29956 auf "Gemeinschafts-basierte Web Suche" als Anwendungsfall umgestellt und dann den Robinson-Modus aktiviert. So sehen die Ergebnisse jetzt besser aus. Zufall? Musste ich warten bis der Index ordentlich gefüllt war? //Edit: Aber dadurch listet mein Yacy nun Domains auf, die ich bisher eigentlich nicht habe Crawlen lassen. Ist diese Konfiguration für meinen Einsatzzweck falsch?
Chrissss
 
Beiträge: 2
Registriert: Do Jun 05, 2014 5:26 pm

Re: Tag- und Kategorie-Seiten in den Suchergebnissen abwerte

Beitragvon Orbiter » Fr Jun 06, 2014 12:51 am

der wesentliche Unterschied zwischen dem Portalmodus und dem P2P-Modus mit Robinsoneinstellung ist das Ranking, welches durch die RWI-Postranking nach den Solr-Rankingregeln aufgebracht wird. Das ganze wird noch ein wenig gewürzt dadurch, dass im aktuellen 1.72 Release die RWIs im Portalmodus versehentlich eingeschaltet waren... :oops:

Also meine Empfehlung: Wie in den Portalmodus schalten, dann in /IndexFederated_p.html kontrollieren dass das Flag "support peer-to-peer index transmission (DHT RWI index)" AUS ist, dann Ranking-Tests machen und Boosts in /RankingSolr_p.html 'nachschrauben'.
Im Boost Query experimentiere ich ja mit der Option "crawldepth_i:0^0.8 crawldepth_i:1^0.4", was kürzeren Pfaden, bzw. solchen die "näher" am Crawl Start dran sind einen kleinen Kick nach oben gibt. Eventuell die Werte vergrößern...

Du hast noch mehr Optionen: ggf. kommen die tag-Seiten so hoch, weil der Suchbegriff in der URL ist. Das kannst du abschalten, indem du "url_paths_sxt" ausschaltest.
Oder du rankst URLs, die kein 'tag' drin haben höher, also eine Boost Query mit -url_paths_sxt:tag^10 (hab das nicht getestet, probier mal).
Orbiter
 
Beiträge: 5784
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main


Zurück zu Hilfe für Einsteiger und Anwender

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste