greatestview

Themen und Projekte aus der Medienwelt

Nie wieder abgeschnittene RSS Feeds mit fivefilters Full-Text RSS

Kategorien:

Obwohl das Internet mit Facebook, Twitter, Google Plus oder sogar Whatsapp Buttons überflutet wird, konsumiere ich Nachrichten und Blogs seit Jahren immer noch per RSS (was sind Feeds, was ist RSS?). Und das hat mehrere Gründe:

  1. Übersichtlichkeit: News werden nicht in einer Timeline durcheinander gewürfelt, sondern lassen sich sortieren nach Themengruppen, Quelle und Datum.
  2. weniger Hürden: Bei Twitter z. B. muss ich erst einen gekürzten Teaser erfassen, dann auf einen Link klicken, warten bis sich die Seite in einem neuen Browsertab/-fenster öffnet, den Artikel auf der Seite zwischen Werbebannern und ablenkenden Inhalten lokalisieren und mich an die Gestaltung des Artikeltextes gewöhnen. In einem RSS-Reader lasse ich mir die Titel der News anzeigen, klicke oder tappe darauf, und der Inhalt erscheint sofort in einer einheitlichen Form.
  3. Die Inhalte können offline verfügbar gemacht werden.

Gerade Punkt 3 ist für mich einer der herausragendsten Vorteile von RSS, denn schließlich lese ich Artikel meistens unterwegs und in einer Geschwindigkeit, bei der das ständige Nachladen einzelner Artikel sehr störend wäre.

Das Problem heutzutage ist allerdings, dass viele Nachrichtenportale und Blogs dazu übergehen einen gekürzten Feed anzubieten., das heißt die Artikel sind nur angeteasert oder nach ein paar Zeilen abgeschnitten. Die Motivation ist klar: Die potentiellen Kunden sollen die Seite besuchen, um Klicks und Werbeeinnahmen zu generieren. Klar sollte aber auch sein: Als Anwender lässt man sich nicht einfach eine Vorgehensweise aufzwingen, um damit Vorteile zu verlieren. Es gibt ja auch Alternativen: Smashing Magazine z. B. experimentiert mit Werbemitteln innerhalb des RSS Feeds, was ich noch ok finde.

Gekürzte Feeds wieder zu vollständigen Feeds machen

Zum Glück gibt es Programme und Dienste, mit denen es möglich ist, einen gekürzten Feed wieder so umzubauen, dass die kompletten Inhalte gelesen werden können. Bisher habe ich den RSS Extender von Lars Formella benutzt: Dabei handelt es sich um ein PHP Script, welches man auf einem eigenen Server installieren muss. Damit das Script weiß, welcher Teil einer Seite nun der Artikel ist, gibt es dafür jeweils Konfigurationsdateien. Für die wichtigsten deutschen Nachrichtenseiten werden gleich welche mitgeliefert. Ich habe aber die Erfahrung gemacht, dass es besser ist diese selbst neu zu bauen, da sie oft nicht mehr aktuell sind. Das gestaltet sich dann als Pain in the Ass, da man dafür Reguläre Ausdrücke verwenden muss; selbst für erfahrene Programmierer ein Fluch. Und gerade bei HTML sehr unbequem.

Drei meiner Quellen bieten nun gekürzte Feeds an (falls es interessiert: die Tagesschau, Heise und der Postillon). Die Konfiguration hatte ich aber irgendwann erledigt und auch regelmäßig aktualisiert. Leider gab es in der Zwischenzeit Probleme mit den Feeds: der vom Postillon ist wohl nicht valide, so dass dieser nicht umgeformt werden kann, und der von Heise lässt sich in der Feedly Webansicht nicht öffnen. Aber man wäre ja nicht halber Informatiker, wenn man das nicht lösen könnte.

Die Lösung

Ein bisschen googlen brachte eine Alternative hervor: fivefilters Full-Text RSS. Die Firma bietet die Software als kostenpflichtigen Dienst an, sowie das Script zum selbst Hosten gegen eine kleine Gebühr. Allerdings stellen sie freundlicherweise auch ältere Versionen des Scriptes kostenlos zur Verfügung. Also hab ich das mal flux installiert, und ich muss sagen: Zum RSS Extender ein riesengroßer Fortschritt! Es gibt einen Algorithmus, der den Artikel automatisch auf der Webseite findet. Falls das nicht reicht, können wie beim RSS Extender auch Konfigurationsdateien angelegt werden. Diese bestehen allerdings nicht aus Regulären Ausdrücken sondern aus XPath Anweisungen. Gerade bei HTML die eindeutig einfacherer Technik. Außerdem gibt es noch eine Admin Oberfläche und eine gute Dokumentation. Jetzt sind meine Lieblingsfeeds wieder ohne Einschränkung genießbar :)

Tipps

Falls das Thema RSS für jemanden neu sein sollte, hier noch ein paar Tipps:

Für Windows und Windows Phone kann ich nur den Nextgen Reader empfehlen, ein wirklich toller schlichter Reader mit der Möglichkeit zur offline Synchronisation. Unter iOS und Mac kommt man an Reeder nicht vorbei: ein Reader mit einem sehr liebevoll ausgearbeiteten Design, welcher auch noch eine tolle Touchbedienung mitbringt, und natürlich Offline-Unterstützung.

Damit die Feeds auf allen Geräten synchronisiert werden, kommt man um einen RSS Aggregator nicht herum. Früher habe ich dafür den Google Reader benutzt, bin aber wie wahrscheinlich viele andere nach dessen Ende auf feedly umgestiegen, hauptsächlich weil dieser Dienst von den oben genannten Apps unterstützt wird.

Und den Feed von greatestview.de findet ihr hier im RSS Format oder hier im Atom Format :)

Acht Kommentare

  1. Moin! Benutzt du fivefilters noch? Wie hast du das Thema Authentifizierung bzw. allgemein Absicherung gegen dritte gelöst? Fivefilters soll ja schon öffentlich erreichbar sein, ich will meine Feeds ja auch von unterwegs (und ohne VPN) aktualisieren können, Fremden möchte ich das allerdings auf meiner Instanz nicht ermöglichen.

  2. Bin tatsächlich gestern dazu gekommen das Ganze einzurichten. HTTP Auth hatte ich eingerichtet und dann festgestellt das Feedly das nicht unterstützt, daher habe ich auf die integrierte API Key Funktion umgeschwenkt. Wenn man dann im Feedreader die URLs mit gehashtem API Key eingibt kann jemand anderes theoretisch nur noch die Eingabemaske aufrufen oder Feeds abrufen für die man URLs erstellt hat.
    Ich benutze jetzt den weg fivefilters -> Feedly -> Reeder. Heute ist mir aufgefallen das die zur gleichen Zeit von Feedly abgerufenen Einträge alle die gleiche Veröffentlichungszeit bekommen haben, das muss ich mir jetzt als nächstes ncohmal anschauen.

  3. Hi, kanns sein, dass es die alte Version vom Script nicht mehr gratis gibt? Wenn ja, kannst du mir deine vielleicht zukommen lassen?

  4. Funktioniert bei dir der golem-feed?
    Ich bekomme hier immer folgende Fehlermeldungen:

    Deprecated: Return type of RollingCurl::count() should either be compatible with Countable::count(): int, or the #[\ReturnTypeWillChange] attribute should be used to temporarily suppress the notice in /var/www/html/rss/libraries/humble-http-agent/RollingCurl.php on line 168
    
    Deprecated: strtolower(): Passing null to parameter #1 ($string) of type string is deprecated in /var/www/html/rss/libraries/simplepie/library/SimplePie/Enclosure.php on line 1225
    
    Fatal error: Uncaught Error: Object of class CurlHandle could not be converted to string in /var/www/html/rss/libraries/humble-http-agent/RollingCurl.php:297 Stack trace: #0 /var/www/html/rss/libraries/humble-http-agent/RollingCurl.php(235): RollingCurl->rolling_curl() #1 /var/www/html/rss/libraries/humble-http-agent/HumbleHttpAgent.php(614): RollingCurl->execute() #2 /var/www/html/rss/libraries/humble-http-agent/HumbleHttpAgent.php(327): HumbleHttpAgent->fetchAllOnce() #3 /var/www/html/rss/makefulltextfeed.php(694): HumbleHttpAgent->fetchAll() #4 {main} thrown in /var/www/html/rss/libraries/humble-http-agent/RollingCurl.php on line 297
    

Schreibe einen Kommentar

Kommentare werden moderiert, bitte bleib also nett und freundlich. Deine E-Mail-Adresse wird nicht veröffentlicht. Einfache HTML-Tags sind erlaubt.