TeX-Parser?

Forum for developers

TeX-Parser?

Beitragvon Orbiter » Di Mär 09, 2010 2:43 pm

kennt jemand eine tex Parserlib in java? Mir sind beim indexieren für die fsfe.org einige tex-Dateien aufgefallen die unser Parser nicht wollte.
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: TeX-Parser?

Beitragvon Vega » Mo Mär 22, 2010 9:53 pm

Nur altes Zeug, ich weis nicht ob man was aus ExTex verwenden könnte - kannst Dich ja mal durchwühlen... http://de.narkive.com/2008/4/9/585432-latex-parser.html + http://www-plan.cs.colorado.edu/henkel/stuff/javabib/

Thomas
Vega
 
Beiträge: 824
Registriert: Mi Jun 27, 2007 3:34 pm
Wohnort: Dresden

Re: TeX-Parser?

Beitragvon Low012 » So Jun 13, 2010 8:47 pm

Beim Linuxtag hat übrigens auch jemand danach gefragt.
Low012
 
Beiträge: 2214
Registriert: Mi Jun 27, 2007 12:11 pm

Re: TeX-Parser?

Beitragvon Orbiter » Mo Jun 14, 2010 9:54 pm

Das schwierige ist ja nicht 'nur' das entfernen der Satzinformation sondern auch das Erkennen der Metadaten.

Ich war ja am TeX-Stand und hab versucht da mein Anliegen verständlich zu machen. Da stand der Typ der da zahllose Bücher über TeX geschrieben hat und hat Zeug von sich gegeben von 'geht gar nicht' bis 'geht ja ganz leicht'. Plain TeX hat keine Metadaten strukturiert, aber es gibt da so allgemeine Regeln wie man Autoren und Überschriften macht. Bei LaTeX gibts dafür Schlüsselwörter aber ganz viele unterschiedliche Versionen wo das wieder alles ganz anders ist.

Eine Library zum Parsen gibts schon gar nicht und Mithelfen wollte auch keiner.

DVI parsen wäre auch kacke und wir sollten doch einen dvi2ps Konverter einbauen und dann einfach das ps parsen wenn wir das können.

Ich glaube TeX können wir abhaken, es sei denn es findet sich jemand der einen Parser bastelt und die vielen Ausnahmeregeln implementiert. Ich werde das aber glaube ich nicht machen...
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main


Zurück zu YaCy Coding & Architecture

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron