API search conditions

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

API search conditions

Beitragvon krzyszp » Mi Jan 15, 2014 1:57 am

Is any way, how to get through api only html documents?
Currently I use cURL to get a list of sites with given word, but YaCy reply sometimes links to e.g. 'webm' or swf video files...
krzyszp
 
Beiträge: 21
Registriert: So Jan 12, 2014 2:40 pm

Re: API search conditions

Beitragvon Low012 » Do Jan 16, 2014 11:12 am

You could add a filetype to your Query:

http://yacy.allesehersonerdshier.net/yacysearch.rss?query=test+filetype:htm&Enter=Search&contentdom=text

This should remove all URLs which don't end with an extension which starts with "htm". Unfortunately this also removes all URLs like http://examlpe.org/ even if they contain HTML content.
Low012
 
Beiträge: 2214
Registriert: Mi Jun 27, 2007 12:11 pm

Re: API search conditions

Beitragvon krzyszp » Do Jan 16, 2014 1:08 pm

Thank you, but this not resolve my problem...
I need to get all links to documents which can be parsed (txt, html, etc), excluding media files.
I will try to remove media on next step - parsing process...
krzyszp
 
Beiträge: 21
Registriert: So Jan 12, 2014 2:40 pm

Re: API search conditions

Beitragvon Low012 » Fr Jan 24, 2014 9:35 am

Another thing you could do is querying the integrated Solr instance directly. Unfortunately I know close to nothing about that.

I tried the Google Search appliance API which contains a filetype parameter, but without success. The parameter seems to be ignored or I used it wrong.

This is the documentation of the parameters of the API: https://developers.google.com/search-appliance/documentation/68/xml_reference#request_parameters

An example link (for Solr too) is provided in the menu on the left side in the YaCy HTML interface.
Low012
 
Beiträge: 2214
Registriert: Mi Jun 27, 2007 12:11 pm


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste