Ausländische Webseiten sinnvoll?

Ereignisse, Vorschläge und Aktionen

Ausländische Webseiten sinnvoll?

Beitragvon Seitenreiter » Do Jul 30, 2009 10:39 pm

Hi, mich würde mal interessieren wie ihr das einschätzt, ob es schon Sinn macht YaCy ausländische Booksmarks (arabisch, chinesisch,...) zu fressen zu geben. Klar UTF-8 verdaut er aber kommen da auch sinnvolle Ergebnisse raus? Denke mal die Sprachstruktur/Stopwords ist da ja noch nicht so fortgeschritten oder?
Seitenreiter
 
Beiträge: 120
Registriert: Di Jul 28, 2009 2:45 pm

Re: Ausländische Webseiten sinnvoll?

Beitragvon Orbiter » Do Jul 30, 2009 11:08 pm

Chinesisch, Japanisch und alles mit Sprachen die keine Worttrennung haben gehen nicht gut. Wir brauchen hier whitespaces für den Parser.
Ansonsten: wo ist der bug?
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Ausländische Webseiten sinnvoll?

Beitragvon Seitenreiter » Fr Jul 31, 2009 6:17 am

Naja bloß da lass ich erstmal meine eigenen Crawls zu Ende laufen oder? Weil sonst sehe ich ja an den Logs nüx.
Seitenreiter
 
Beiträge: 120
Registriert: Di Jul 28, 2009 2:45 pm


Zurück zu Mitmachen

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 1 Gast