Allgemeines Blockieren von 1x1-Trackerpixel?

Ideen und Vorschläge sind willkommen.

Allgemeines Blockieren von 1x1-Trackerpixel?

Beitragvon Quix0r » Fr Apr 17, 2009 10:33 am

Derzeit bemühe ich mich, jeden einzelnen 1x1-GIF-Trackerpixel zu sperren. Das macht wirklich nicht Sinn, das YaCy diesen indexiert.

Kann nicht eine allgemeine (generic!) Sperre implementiert werden? Die Pixel heissen meistens pixel.gif, blank.gif, stats.gif usw. und öfters mit der CSS-Anweisung display:none eingebunden. Auch per Img-Tag mit den Attributen width="1/0" height="1/0" sind sie öfters eingebunden.

Da ließe sich doch etwas machen? Weitere Namen sollten dann hier gesammelt und nachgepflegt werden.

Edit: Denkbar wäre hier ein Konfigurationseintrag mit Komma-seperarierter Liste.
Quix0r
 
Beiträge: 1345
Registriert: Di Jul 31, 2007 9:22 am
Wohnort: Krefeld

Re: Allgemeines Blockieren von 1x1-Trackerpixel?

Beitragvon Orbiter » Fr Apr 17, 2009 11:51 am

image-urls werden derzeit sowieso nicht in den Index aufgenommen. Die Suche nach Bildern funktioniert so, dass zunächst einfach nach einem Wort im Text gesucht wird, und dann auf der Seite Bilder angezeigt werden, die einen Namen entsprechend dem Suchwort haben oder das Suchwort in der Annotation haben. Man kann also gar keine Bilderindexierung entsprechend Keywords sperren, da es keine gibt. Ein Verhindern von Finden von Bildern die 'pixel' heissen läßt sich damit ganz einfach damit machen, indem man nicht danach sucht. Wenn du aber danach suchst, findest du welche, auch wenn diese nicht explizit als Bilder indexiert wurden.
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Allgemeines Blockieren von 1x1-Trackerpixel?

Beitragvon Quix0r » Fr Apr 17, 2009 3:39 pm

Okay, danke fuer den Hinweis. :)
Quix0r
 
Beiträge: 1345
Registriert: Di Jul 31, 2007 9:22 am
Wohnort: Krefeld

Re: Allgemeines Blockieren von 1x1-Trackerpixel?

Beitragvon Orbiter » Fr Apr 17, 2009 4:06 pm

Aber eine 'reine' Bilder/Medien-Link Indexierung wollte ich schon lange mal bauen. Mag sein das es auch noch lange dauert, aber so wie ich das hier sehe sind dann beim Crawler besondere Attribute für die Filterung sinnvoll.
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Image-Parser-Ideen

Beitragvon Quix0r » Mo Jan 25, 2010 9:43 am

Das koennte bei der spaeteren Image-Parser-Umbauaktion mit beruecksichtigt werden:
- EXIF-Daten durchsuchbar
- Bilder anhand der Abmasse sperrbar (sollte kein Problem sein, diese zu analysieren, ich denke da an unsinniges Speichern von Banner, Buttons, Skybanner; 468x60,88x31,250x250,120x600 usw.)
- Alternativen Text aus dem HTML mit dazu speichern (???)
- Dynamische Bilder: viewtopic.php?f=6&t=2658&hilit=+PARSER

Die EXIF-Daten koennten fuer ein lokaes Bilderarchiv ganz praktisch sein.
Quix0r
 
Beiträge: 1345
Registriert: Di Jul 31, 2007 9:22 am
Wohnort: Krefeld


Zurück zu Wunschliste

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron