Stark latsida

Vi har visst ofrivilligt hamnat lite på latsidan på sistone. RSSWatch har sprungit runt och crawlat bloggar ensam de senaste veckorna. Men det blir förhoppningsvis ändring på det inom kort. Planer finns på att skriva om RSSWatch något för att orka med större mängder bloggar och kommentarer samtidigt. Servern har bitvis börjat flämta lite under högsäsonger och viss finslipning behöver nu göras (och den bör även blåsas rent från vinterdamm). Samtidigt skall vi försöka få igång ett användargränssnitt som gör prenumeration på nya inlägg tillgängliga. Det finns även en viss tanke att kunna göra detta via SMS, men på grund av vissa kostnader tvekar vi, dock med tanken att möjligtvis låta några enstaka personer få lov att prova på detta. Tanken finns, men tiden är det lite si och så med alltså. Å andra sidan är det snart semester och det medför ju vissa fördelar för utvecklingen av den här sidan, som fortfarande onekligen tjänar ett gott syfte för många bloggläsare runtom i landet.

Väl mött!

Eder RSSWatch

RSSWatch 2.0 Systemdokumentation v1.0: Förord

Detta är ett litet utdrag ur RSSWatch systemdokumentation som i skrivande stund tillverkas. Om nu någon tycker att det kan vara intressant med detaljer, så kan det vara en god idé att skriva om det.

RSSWatch är det korrekta namnet på ett från grunden privatbyggt projekt. Tanken med projektet var att bygga en lätt tillgänglig RSS-läsare med ungefär samma funktionaliteter såsom Sharpreader, RSSReader och andra dylika opensource-läsare, där Sharpreader är bland de bättre på marknaden just nu. Idén kommer alltså delvis från Sharpreader-läsaren, där rubrikerna på postade inlägg och artiklar markeras i kursiv text, när innehåll förändrats. Men när förändringen väl var gjord kunde man inte längre se vad som hade ändrats. I synnerhet blev det svårt att finna småförändringar i större texter. Detta kunde RSSWatch göra!

RSSWatch uppdrag var att samla data från RSS-länkar och publicera dem så att de var nåbara även utan hjälp av verktyg såsom Remote Desktop – men samtidigt med möjlighet att återspegla förändringarna. Webben var ett perfekt medium för detta. Behoven, i takt med att koden skrevs, ökade naturligtvis. Förändringar var inte allt, om man inte kunde se innehållet i sin ursprungliga form. Det var en sak att studera förändringar, en helt annan sak att jämföra innehållet mot varandra. Därför speglades websidorna som cachesidor – precis såsom många sökmotorer – google, yahoo, altavista, med flera, idag fungerar.

… to be continued!

Trendstatistik

En ny idé har börjat bildas efter en observation att ”riktigblogg.se” nämner Tyra Sjöstedt i snart samtliga nya inlägg han skriver (vilket onekligen tyder på att han har hängt upp sig på något hos henne). Idén är att lägga upp trendstatistik som dels bygger på vad bloggarna själv skriver om och hur ofta de gör det, samt hur bloggarna ligger till sinsemellan.

Jag vet inte riktigt hur det skall byggas för att bli effektivt än dock.

Ett annat sidoprojekt är att låta besökare på RSSWatch bevaka kommentarer (och inlägg). Även detta är ett projekt som kommer fungera om det finns en möjlighet att, utöver RSS-feeds, kunna snappa upp referenslänkar från en specifik bloggares kommentar. Om något förändras mailas detta till den person som önskat övervakningen. Vad gäller inläggsövervakning blir det lättare, då hela RSSWatch bygger på just RSS-Feeds.

Sidoegenskap: Sajter som länkar!

Alla websidor som länkar till oss och som nämns i chatten blir automatiskt listade en stund i listan över vilka som länkar till oss. Vi kontrollerar alltså de senast skrivna adresserna i chatten och läser av de webbsidor som publicerats där efter länken ”http://fnarg.org/rsswatch”. Finns våran länk med på sidan ni publicerar, så kommer den websidan också att visas upp hos oss. Kontrollen av länkar sker i nuläget en gång i timmen och bara en kort tid tillbaka i chatten. Spamma inte – är du sugen på en fast länk i listan så är det bättre du hör av dig så löser det sig. Antalet poster är dock lite begränsade – vi kan alltså inte ha hur många länkar som helst utan att dränka webbsidan i alldeles för mycket text.

För övrigt så finns även alla som domäner som länkat till oss någon gång tidigare listade under statistiken här. Den kommer i mån av tid byggas ut och förbättras. Bland annat så syns inte alla bloggar ordentligt, speciellt de som ligger under speciella webhotell såsom nattstad.se och finest.se

Kommentarsbugg rättad

Dagens underhåll:

Ett litet fel har varit synbart i några dagar på RSSWatch, där redigerade kommentarer har visats i fel ordning (dvs, den redigerade kommentaren har tolkats som originalkommentaren). Våran scanner har också lyckats snappa upp samma kommentarer flera gånger och visat upp dem som dubletter på sidan. Åtgärder har nu vidtagits för att minimera den risken. Upptäcker ni fel, rapportera dem gärna till rsswatch@fnarg.org

Värt att veta:

Ett annat känt problem just nu är det faktum att kommentarer markerats som raderade fastän de inte är raderade. Vi har haft en funktion inlagd på websidan sedan en tid tillbaka som låter våra besökare själva att återscanna sådana kommentarer då de upptäcks. När begäran görs på hemsidan, startas en ny schemalagd kommentar-kontroll inom en minut.

Granskarna granskas!

Den sedvanliga spegel-cachen som fanns i RSSWatch 1.0x är nu upplagd igen, dock något förbättrad. Numera skickas man direkt till rätt indexfil om det finns en sådan, istället för cachens mappstruktur. Det vill säga om man klickar på ”spegel” under de inlägg som avses (observera exemplet).

Detta skedde i samband med att falsksanning raderat ett inlägg idag, som de flesta som använder sig av RSSWatch – eller läser Intresseklubbens skvallerblogg redan fått ta del av för länge sen. I princip handlade det om ett inlägg som RSSWatch snappade upp som raderat av Kissie under gårdagen där hon kritiserar skatteverket för att granska kända bloggares hantering av gåvor – där skatteverket menar att de borde betala skatt, då det räknas som en inkomst (edit). Av naturliga skäl går det inte att länka till originalet, men RSSWatch har naturligtvis kopian av det här. Sidan är även speglad i sitt original här.

Till saken hör att RSSWatch redan då inlägget var aktuellt tipsade både Falsksanning och Intresseklubben om detta, med skillnaden att Intresseklubben gavs betydligt mer information om saken. Det har sedan en kort tid tillbaka konstaterats att Intresseklubben faktiskt lyssnar till sina läsare, så det anses mera värdigt att skicka informationen dit. Hon besvarar det man skriver och behandlar folk med respekt, termer som uppenbarligen Falsksanning inte känner till, eftersom vi varken fick svar på mailet eller någon annan reaktion då det begav sig. I stället dyker ett inlägg upp dagen efter, som raderas efter att en kommentar från RSSWatch postats. Kort efter att Intresseklubben noterat detta, dyker plötsligt det tidigare raderade inlägget upp igen hos Falsksanning, med helt annan information. Det enda tänkbara alternativet är att FS skulle ha nedsatt syn. Mycket dåligt skött! För att inte säga oproffsigt!

Informationsflödet sköts onekligen väldigt dåligt bland skvallerbloggarna och prioriteten kring vad som är intressant varierar kraftigt, beroende på tycke, ålder och smak. Det är därför intressant att få uppleva en skvallerbloggare – Intresseklubben – som skiljer sig från mängden, både mognads och åldersmässigt. Och till råga på allt så är hon inte anonym!

RSSWatch skall dock även fortsättningsvis granska saker så objektivt som möjligt, så det är dags att sätta punkt här, för denna gången.

Inlägg som raderats och statistik

En ny kontroll av inlägg som raderats införs idag. Normalt sett skall en blogg (kan man tycka) lämna en ”404 File not found”, när ett inlägg inte längre finns på websidan. En del bloggar fungerar så, till RSSWatch stora glädje; när ett inlägg raderas rapporterar websidan tillbaka att inlägget inte längre finns och det flaggas som raderat. För besökaren syns detta sedan i rubriken för varje inlägg, med en rödfärgad överstruken titel. Det är dock inte alla bloggar som fungerar på det viset, utan rapporterar tillbaka statuskoden ”200 OK” trots att inläggen inte längre existerar. Det är naturligtvis irriterande eftersom RSSWatch inte kan skilja inläggen åt – bloggarens rssfeed säger ju att inlägget finns.

Detta är dock löst, genom att RSSWatch i realtid räknar antalet inkomna kommentarer. När en kommentar raderas flaggas det automatiskt som raderat och RSSWatch håller då reda på både vilka kommentarer som finns synliga på en blogg och vilka som är raderade. Om samtliga kommentarer flaggats som raderade så kan det alltså bara betyda två saker: Bloggaren har fått ett frispel och raderat alla kommentarer manuellt – eller raderat inlägget. RSSWatch utgår från att det är inlägget som är raderat.

Utöver detta så har RSSWatch nu berikats med statistik över de bloggar som lagts till i registret. Detta kan beskådas här: http://fnarg.org/rsswatch/stats