3 Fragen: max.Anzahl gecrawlter Seiten, Snippets und Ranking

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

3 Fragen: max.Anzahl gecrawlter Seiten, Snippets und Ranking

Beitragvon wsb » Mo Jan 31, 2011 10:27 am

1) (Bug or Feature?): am Freitag hatte ich bei der Suchmaschinentagung in Göttingen (http://metager.de/suma-tagung-goe/ "Praxisbeispiel") live und online via yacy demonstriert, wie man ganz einfach http://www.uni-goettingen.de indexiert. So weit so gut, es hat auch alles funktioniert :-) Aber nun: ich hatte die max. Anzahl Dokumente auf 1000 eingestellt und einmaliges crawlen. Als ich heute morgen wieder hinschaute, sah ich, dass bereits mehrt als 40.000 URLs gecrawlt sind - wie kommt's??

2) Irgendwie kann man yacy doch dazu bewegen, auch Snippets anzuzeigen (bisher/default ist das nur manchmal der Fall): steht irgendwo, wie das geht? If not: kann es mir jmd. beschreiben?

Update zu 2): ich hab mir die alte Doku dazu nochmal genau durchgelesen - es hilft nix: mit verify=false erhalte ich NIE Snippets, auch nicht, wenn ich die Seiten mit meinem eigenen Peer gecrawlt habe. Das hat im vorigen Jahr / September 2010 mal funktioniert: wer hat da was kaputt programmiert??

3) Ranking: wie kann ich erreichen, dass die (Start-)Homepages von Domains bei Eingabe eines bestimmten Suchwortes IMMER zuerst erscheinen? Beispiel: ich crawler http://www.hannover.de - dann will ich, dass bei Eingabe von >hannover< auch die Startseite als erste erscheint. Ich habe in der Ranking-Config "Appearance in Title" und "URL Length" bereits auf höchsten Faktor gesetzt, das hat auch ein wenig bewirkt, aber nicht genug. Kann man diese Faktoren noch höher setzen oder irgendwas anderes dafür tun?

Schöne Grüße aus Hannover,
WSB
wsb
 
Beiträge: 201
Registriert: Mi Jun 27, 2007 2:53 pm

Re: 3 Fragen: max.Anzahl gecrawlter Seiten, Snippets und Ran

Beitragvon Orbiter » Sa Feb 12, 2011 1:08 am

zu 1): fix in SVN 7478
zu 2): die Parameter zu verify sind nun in http://www.yacy-websuche.de/wiki/index.php/Dev:API beschrieben (danke Lotus für Update!)
zu 3): du musst den Ranking-Parameter 'Appearance In URL' hoch setzen. Damit ein Parameter alle anderen aussticht muss dieser um 8 Punkte höher sein als alle anderen. Dazu einfach alle anderen Parameter um 8 Punkte niedriger setzen.
Orbiter
 
Beiträge: 5798
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste