Meta Description und Meta Keywords

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

Meta Description und Meta Keywords

Beitragvon dennis » Fr Apr 17, 2009 11:09 am

Hi ALL,

ich bin noch Newbie und frage mich, ob YaCy auch die Meta Keywords und die Description speichern/anzeigen kann statt dem Autor.

Danke
dennis
 
Beiträge: 3
Registriert: So Apr 12, 2009 12:21 pm

Re: Meta Description und Meta Keywords

Beitragvon Orbiter » Fr Apr 17, 2009 11:46 am

ich weiss nicht genau worauf du hinaus willst, aber es gibt eine API zu den in YaCy gespeicherten Metadaten.
Beispiel
Code: Alles auswählen
http://localhost:8080/api/yacydoc.xml?urlstring=http://yacy.net

liefert dir ein XML zu der seite yacy.net, das sieht dann so aus:
Code: Alles auswählen
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE metadata [ <!ELEMENT metadata (#PCDATA)> ]>

<!--
this is a xml file with embedded dublin core properties
you can validate it with http://www.stg.brown.edu/service/xmlvalid/
-->

<metadata xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:yacy="http://yacy.net/">
  <dc:Title LANG="uk">YaCy Distributed Web Search</dc:Title>
  <dc:Creator>Michael Peter Christen</dc:Creator>
  <dc:Contributor></dc:Contributor>
  <dc:Subject SCHEME="item-list">development download engine free harvester indexer java network open p2p peer search software spider yacy</dc:Subject>

  <dc:Description LANG="uk"></dc:Description>
  <dc:Publisher.URL>http://yacy.net/</dc:Publisher.URL>
  <dc:Date>Sun Sep 23 02:00:00 CEST 3506</dc:Date>
  <dc:Type>yacy:doctype:h</dc:Type>
  <dc:Identifier SCHEME="yacy:urlhash">yacy:urlhash:upiFJ7Fh1hyQ</dc:Identifier>
  <dc:Identifier SCHEME="URL">http://yacy.net/</dc:Identifier>

  <dc:Format.Extent>4921</dc:Format.Extent>
  <dc:Language SCHEME="ISO639-2">uk</dc:Language>
  <yacy:loaddate>Thu Apr 30 02:00:00 CEST 3531</yacy:loaddate>
  <yacy:referrer.hash>yacy:urlhash:</yacy:referrer.hash>
  <yacy:referrer.url></yacy:referrer.url>
  <yacy:words>397</yacy:words>

</metadata>


Das ganze gibts auch als xhtml mit RDFa Annotationen:
Code: Alles auswählen
http://localhost:8080/api/yacydoc.html?urlstring=http://yacy.net

liefert

Code: Alles auswählen
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

<!--
this is a XHTML+RDFa file. It contains RDF annotations with dublin core properties
you can validate it with http://validator.w3.org/
-->

<html xmlns="http://www.w3.org/1999/xhtml"
      xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
      xmlns:dc="http://purl.org/dc/elements/1.1/"
      xmlns:foaf="http://xmlns.com/foaf/0.1/">
       
  <head profile="http://www.w3.org/2003/g/data-view">
    <link rel="transformation" href="http://www-sop.inria.fr/acacia/soft/RDFa2RDFXML.xsl"/>
    <title>YaCy Distributed Web Search</title>
      <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
  <link rel="shortcut icon" href="favicon.ico" />
  <meta name="Content-Language" content="English, Englisch" />

  <meta name="keywords" content="Anomic YaCy HTTP Proxy search engine spider indexer java network open free download Mac Windows Linux Software development" />
  <meta name="description" content="Anomic Software HTTP Proxy Freeware Home Page" />
  <meta name="copyright" content="Michael Christen et al." />
  <link rel="stylesheet" type="text/css" media="all" href="/env/base.css" />
  <link rel="stylesheet" type="text/css" media="screen" href="/env/style.css" />
  <!--[if lt IE 6]>
   <link rel="stylesheet" type="text/css" media="screen" href="/env/oldie.css" />
  <![endif]-->
  <!--[if lte IE 6.0]>
   <link rel="stylesheet" type="text/css" media="screen" href="/env/ie6.css" />
  <![endif]-->
  <!--[if lte IE 7.0]>
   <link rel="stylesheet" type="text/css" media="screen" href="/env/ie7.css" />
  <![endif]-->
<!-- (C), Architecture and Realisation: Michael Peter Christen; Contact: mc <at> anomic.de -->

  </head>
   
  <body>
  <form name="yacydoc" method="post" action="yacydoc.html" enctype="multipart/form-data" accept-charset="UTF-8">
  <fieldset>
  <h1 property="dc:Title">YaCy Distributed Web Search</h1>

  <dl>
  <dt>Author</dt><dd property="dc:Creator">Michael Peter Christen</dd>

  <dt>Description</dt><dd property="dc:Description"></dd>
  <dt>Subject</dt><dd property="dc:Subject">development download engine free harvester indexer java network open p2p peer search software spider yacy</dd>
  <dt>Publisher</dt><dd property="dc:Publisher">http://yacy.net/</dd>
  <dt>Contributor</dt><dd property="dc:Contributor"></dd>
  <dt>Date</dt><dd property="dc:Date">Sun Sep 23 02:00:00 CEST 3506</dd>

  <dt>Type</dt><dd property="dc:Type">yacy:doctype:h</dd>
  <dt>Identifier</dt><dd property="dc:Identifier">yacy:urlhash:upiFJ7Fh1hyQ</dd>
  <dt>Sprache</dt><dd property="dc:Language">uk</dd>
 
  <dt>Load Date</dt><dd property="yacy:loaddate">Thu Apr 30 02:00:00 CEST 3531</dd>
  <dt>Referrer Identifier</dt><dd property="yacy:referrer.hash">yacy:urlhash:</dd>

  <dt>Referrer URL</dt><dd property="yacy:referrer.url"></dd>
  <dt>Document size</dt><dd property="yacy:size">4921</dd>
  <dt>Number of Words</dt><dd property="yacy:words">397</dd>
 
  </dl>
  </fieldset>
  </form>

  </body>
</html>
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Meta Description und Meta Keywords

Beitragvon The_Exporter » Mi Aug 29, 2012 11:44 am

Da dieser Thread recht alt ist, wollte ich mich erkundigen, ob die Angaben, um an den Meta Beschreibungen und den Text einer Seite heranzukommen, noch korrekt sind. Bei meiner soeben erfolgten Installation konnte ich mit den Angaben auf keine Daten zugreifen. Den Port hatte ich auch schon selbstständig von 8080 auf 8090 geändert.

Mein Ziel ist es den reinen Text von Webseiten für die weitere, eigene Verarbeitung zu verwenden.

Viele Grüße
Euer Exporter
The_Exporter
 
Beiträge: 2
Registriert: Mi Aug 29, 2012 11:35 am

Re: Meta Description und Meta Keywords

Beitragvon Orbiter » Sa Nov 03, 2012 2:15 pm

nachdem ja nun Solr fester Bestandteil von YaCy ist, ist das in YaCy eingebaute Solr Suchinterface wohl die beste Quelle for Metadaten.
probier mal http://localhost:8090/solr/select?q=*:*&start=0&rows=3

In das q-Feld dann den Query eintragen, für eine normale Textsuche wäre
q=text_t:<Suchwort>
und für eine URL wäre das
q=sku:<url>
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste

cron