YaCy und URLs

Forum for developers

YaCy und URLs

Beitragvon gaston » Fr Aug 17, 2012 4:28 pm

So wie YaCy mit URLs umgeht gefällt _mir_ das nicht. In MultiProtocolURI gibt es toNormalform(...) das man gezielt aufrufen muss. Ich würde es besser finden wenn YaCy vor dem speichern einer URL (auch in MultiProtocolURI selbst) alle &amp;, %3c (<), %3d (=) ... ersetzt. Das spart Platz und macht das "Blacklisten" einfacher (weniger Ausnahmen). Diese &amp; ... braucht man doch nur wenn die URL in HTML ... eingebettet ist (oder nicht?). Von daher würde ich es gut finden wenn man eine Funktion aufrufen muss um die URL wieder "unleserlich" zu machen, also & durch &amp; zu ersetzen ... also genau anders herum wie es jetzt ist.
gaston
 
Beiträge: 143
Registriert: Fr Jan 06, 2012 2:22 pm

Re: YaCy und URLs

Beitragvon Orbiter » Fr Aug 17, 2012 4:53 pm

das ist doch so, deswegen gibts ja toNormalform damit man die URL in einer Normalform speichert.
Man abgesehen davon gibt es, wie du selber schreibst, verschiedene Normalformen, was das toNormalform wiederum rechtfertigt.
Orbiter
 
Beiträge: 5786
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: YaCy und URLs

Beitragvon gaston » Fr Aug 17, 2012 5:06 pm

Ok, der Thread kann von mir aus gelöscht werden, war wohl zu warm ;)

Was fehlt ist das ASCII %nn wie &amps; ersetzt werden, vielleicht nicht alle aber zumindest !"#$%&'()*+,-./:;<=>?@[\]^_{|}~¦
gaston
 
Beiträge: 143
Registriert: Fr Jan 06, 2012 2:22 pm


Zurück zu YaCy Coding & Architecture

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron