"Doppelte" Domains in Ergebnis-Liste

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

"Doppelte" Domains in Ergebnis-Liste

Beitragvon Huppi » Do Aug 28, 2008 10:33 am

Ich baue ja gerade auf dem MotoYaCy-Peer den Motorrad-Index neu auf, inklusive Bookmarks aller gecrawlten Seiten.
Beim Testen der Suchfunktion fiel mir folgendes auf:
Discover Aprilia Dorsoduro
bookmark recommend delete

http://www.aprilia.com/\

Sa, 23 Aug 2008 | YBR-15 | Info | Pictures
Discover Aprilia Dorsoduro
bookmark recommend delete

http://www.aprilia.com/../../

Fr, 22 Aug 2008 | YBR-15 | Info | Pictures
Discover Aprilia Dorsoduro
bookmark recommend delete

http://www.aprilia.com/../../../

Sa, 23 Aug 2008 | YBR-15 | Info | Pictures


Die Seite hat eine interessante Verlinkungsstruktur mit relativen Links.

http://www.aprilia.com/../../../ wird im Browser dann geändert zu http://www.aprilia.com

Ist dieses Verhalten (dreifaches Indexing der gleichen Seite) so erwünscht?
Huppi
 
Beiträge: 898
Registriert: Fr Jun 29, 2007 9:49 am
Wohnort: Kürten

Re: "Doppelte" Domains in Ergebnis-Liste

Beitragvon thq » Do Aug 28, 2008 11:29 am

Nein, eigentlich sollte resolveBackpath() in yacyURL.java das auflösen. Ich weiß aber nicht ob diese Funktion ein BUG hat oder einfach nur nicht aufgerufen wird.
thq
 
Beiträge: 651
Registriert: So Jul 08, 2007 12:23 pm


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron