Spracherkennung!

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

Spracherkennung!

Beitragvon gaston » Di Sep 18, 2012 1:15 pm

Die Spracherkennung in YaCy ist defekt oder funktioniert "überhaupt" nicht. Ich habe mich gefragt warum bei einer Suche mit "/language/de" immer wieder Seiten aus aller Welt auftauchen. Habe mir dann im Log die zugeteilte Sprache der Seiten ausgeben lassen. Selbst "de.wikipedia.org" Seiten haben da oft Sprachen zugeteilt bekommen von z.B. la, ia, gd, fo... So wie es aussieht werden Zeilen wie "<html lang="de-DE" ..." in den Seiten überhaupt nicht ausgewertet. Die Auswertung der URL (naja) ... lieber gar keine Information als eine falsche.
gaston
 
Beiträge: 143
Registriert: Fr Jan 06, 2012 2:22 pm

Re: Spracherkennung!

Beitragvon Orbiter » Di Sep 18, 2012 2:21 pm

das ist richtig, das ganze ist experimentell und funktioniert nicht oft genug richtig. Weil es kein 'Herzeigefeature' von YaCy ist, ist es nicht schlimm sondern wartet darauf dass jemand mit einer zündenden Idee kommt wie man die Erkennung besser machen kann.
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Spracherkennung!

Beitragvon gaston » Do Sep 20, 2012 4:05 pm

Jemand der sich da auskennt sollte zumindest schon mal dafür sorgen das alles klein gespeichert wird, mir sind teilweise auch EU ... aufgefallen. Leider ist YaCy zu komplex um mal eben ... Das analysieren von html klappt ja leider auch nicht immer, sei es javascript oder css was manchmal nicht richtig "entfernt" wird. Von daher bestimmt ein größerer Eingriff.
gaston
 
Beiträge: 143
Registriert: Fr Jan 06, 2012 2:22 pm

Re: Spracherkennung!

Beitragvon Lotus » Do Sep 20, 2012 5:00 pm

gaston hat geschrieben:Das analysieren von html klappt ja leider auch nicht immer, sei es javascript oder css was manchmal nicht richtig "entfernt" wird.

Bitte mit Beispiel in den Bug-Tracker posten. http://bugs.yacy.net
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Spracherkennung!

Beitragvon gaston » Do Sep 20, 2012 5:30 pm

Extra anmelden möchte ich mich jetzt nicht.

Auf der schnelle ViewFile.html mit www.stern.de

Da findet man in den ersten Zeilen das
Code: Alles auswählen
*/ '); var trackingManager = new TrackingManager(1010100, 30, '', 'urhp'); trackingManager.init(); gujTrackingPixelReloader = new gujTrackingPixelReloader(); /* ]] */

delicious.com/
www.cyanogenmod.com/
www.wolframalpha.com/
gaston
 
Beiträge: 143
Registriert: Fr Jan 06, 2012 2:22 pm

Re: Spracherkennung!

Beitragvon Orbiter » Di Sep 25, 2012 11:14 am

Das ist etwas für ein Moderationsframework an dem Dominic fürs KIT arbeitet, der hat in seinem git repository nämlich solche 'ich kommentiere Links' Dinge drin, die nicht in unserem main drin sind.
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Spracherkennung!

Beitragvon bbtuxi » Sa Okt 06, 2012 10:01 pm

Bin gerade durch Zufall auf folgendes gestoßen:
http://wiki.apache.org/solr/LanguageDetection

es scheint so als könnte SolR Sprachen erkennen?
Das sieht doch aus als würde das gut Funktionieren? Da braucht man ja nichts eigenes Entwicklen ;)

grüße
bbtuxi
 
Beiträge: 50
Registriert: Fr Jan 16, 2009 10:28 pm


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 2 Gäste

cron