RDFa Parser - AbstractDocument Object

Ideen und Vorschläge sind willkommen.

RDFa Parser - AbstractDocument Object

Beitragvon Karsten » Do Okt 28, 2010 8:15 am

Hallo.

Ich bin gerade dabei einen RDFa Parser für Yacy zu schreiben. Leider passen die daraus entwickelten Ergebnisse nicht sonderlich gut in das bestehende Document-Object.
Spricht etwas dagegen ein abstraktes Document-Object zu erstellen und für jeden Parser ein eigenes Kindelement davon zuzulassen?
Karsten
 
Beiträge: 10
Registriert: Fr Okt 01, 2010 11:05 am
Wohnort: Karlsruhe

Re: RDFa Parser - AbstractDocument Object

Beitragvon Orbiter » Do Okt 28, 2010 9:53 am

RDFa macht nur bei einer richtigten Handhabung von Vokabularien Sinn, und diese kann man nur in einer Suche integrieren wenn man zum Vokabular Interpretationsmechanismen für den Anwendungszweck (hier Suchmaschine, d.h. ein Snippet Extractor und eine Wort Extractor für den Indexer) zur Verfügung stellt.

'nur' ein Parser reicht also nicht, es braucht ein Gesamtkonzept und ein Framework. Aber: gibt es! Hier:
http://github.com/yacy/cider/tree/maste ... diom/rdfa/
findest du auch schon den fertigen rdfa Parser, der im 'cider' Framework für YaCy steckt. Das ganze ist noch nicht in YaCy drin weil hier die Vorarbeiten für ein 'YaCy 2.0' statt finden.
Orbiter
 
Beiträge: 5798
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: RDFa Parser - AbstractDocument Object

Beitragvon Karsten » Do Okt 28, 2010 10:44 am

Genau diesen habe ich aktuell implementiert.

Habe ein den RDFaParser von htmlParser erben lassen. Beides ausgeführt und die Document-Objecte zusammengeführt.
Das ganze habe ich in ein neues Package gelegt. Wir haben erste Tests laufen lassen und der Parser funktioniert.

Als ein Ausblick dachten wir an eine SPARQL Implementierung um mit geeigneter Abfragesprache eine Suche zu gestalten.
Was hälst du davon?

Ich spreche mich wegen dem git mit flori ab.
Karsten
 
Beiträge: 10
Registriert: Fr Okt 01, 2010 11:05 am
Wohnort: Karlsruhe

Re: RDFa Parser - AbstractDocument Object

Beitragvon Orbiter » Do Okt 28, 2010 2:15 pm

SPARQL ist gut, dafür habe ich das Jena Framework im Visier. Das ist auch schon in dem verlinkten git Repository von cider drin. Nur wird es noch nicht benutzt; das cider git repository ist eher sowas wie eine Baustelle mit einem Fundament als Package Struktur und dem 'Baustoff' in Form der bereits eingebundenen libraries.
Orbiter
 
Beiträge: 5798
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main


Zurück zu Wunschliste

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron