Skip to content

In the cloud

Dark Clouds Im Gegensatz zum Begriff Grid Computing ist das Thema Cloud computing etwas eindeutiger definiert. Es geht darum IT-Resourcen (Rechner oder Laufzeitumgebungen) aus der Wolke des Internets einzukaufen, also die Anwendungen remote zu betreiben. Die bekanntesten Vertreter dieses Genres sind Amazon's EC2 (Elastic Cloud Computing - eine Serverfarm auf der man Xen Images auf Stundenbasis laufen lassen kann) und Google App Engine (eine Python Web Server umgebung für Web Anwendungen). Beide haben grade aktuell Neuigkeiten zu vermelden: Google App Engine ist nun offen für alle Entwickler (die kostenfreie Einsteigerversion erfordert eine SMS Registrierung, und kann auch mit Google Apps for Domains zusammenarbeiten). In der Public Beta des Amazon Cloud Services werden bald persistente Volumes möglich sein: damit sind dann auch klassische Enterprise Anwendungen einfach zu betreiben und nicht nur Compute Jobs (Video Rendering) oder replizierte Datenbanken. In zwei kommenden Artikel will ich beide Dienste etwas näher vorstellen, und meine Bewertung dazu abgeben wo und wie das Utility Computing funktionieren kann.

Ich habe ein De ja vù

Früher gab es kostenlose PDF Viewer die leichtgewichtig waren, und auf den meisten Plattformen verfügbar. PDF war ein einfaches Austauschformat. Zwar immer umstritten (Patente, Verschlüsselung, Freie Implementierungen, Versionen, Formulare, Scripte, etc) aber doch sehr erfolgreich (und benutzbar!). Inzwischen ist der Adobe Reader zum Marketing-Vehikel von Adobe geworden. Bilder Galerien oder Web Konferencing Funktionen sind mit drin. Ständige nervige Auto-Updates und Taskleistenpest. Der Plugin ist generell langsam und instabil. PDF Inline Aufrufe klappen entweder Firefox oder im IE nicht (oder bei beiden nicht). Nun ja, ein Mitbewerber ist XPS, aber das ist Microsoft, da kann man auch gleich .doc Files nehmen (was ich sogar bevorzuge!). Das ist ganz schön deprimierend. Aber es geht noch schlimmer! Am Horizont ist ein neues Format angetreten, das ursprünglich aus der Imaging/Scan Ecke kommt und hocheffiziente Komprimierung von Bilddaten anbietet. Neben dem Speichern (und schnellen Abrufen) von Scans kann man es auch für Bilderreiche Publikationen verwenden. Aber irgendwie habe ich den Eindruck Djvu hat den Sprung von "kleinem nützlichen Format" zum "unbenutzbaren Tool" schon vor dessen Verbreitung gemacht. Jedenfalls habe ich grade versucht auf meinem XP ein DJVue Demo Dokument zu öffnen. Zuerst wollte Firefox ein Plugin herunterladen, hat mich dann auf eine manuelle Plugin Installation umgeleitet und diese mit einem 404 beendet. Dann habe ich die Java Version probiert, aber diese stürzt mit einer Security Exception ab (wenn man ein Applet von einem Host läd, dann sollte es auch nur von dort Daten anfordern, liebe Entwickler). Gut, dann halt der Installer von Lizardtech. Ergebnis: der Auto Installer ist nur für IE verfügbar und die Stand-Alone Installation (6MB) bricht mit einem "RPC Server läuft nicht" Fehler im Installer ab. Gut also WinDjview 0.5 heruntergeladen und auf die Foto Demo Seite gegangen. Ja toll, aber wo bekomme ich dort das Dejavu File das ich für den Viewer benötige? Nun gut dann halt einen der Artikel probiert. Dort den .djvu Link angeclicked, und was passiert? Firefox kennt den Viewer nicht - er hat sich nicht mit der File Extension assoziiert. Also Open with.. Other... ah endlich. Aber... ihh.. das ist ja hässlich - da muss man ja mehr als 100% auswählen (in meinem Alter). Also als PDF Ersatz für Texte kann man das vergessen. Kein Anti Aliasing, kein Cleartype, keine Vectorfonts und überhaupt (ist ja auch nicht die Domäne des Formats). Eigentlich wollte ich es ja für Bilder probieren. Ok, also die URL eines Demo Files aus der Seite extrahiert und angeclicked im Browser. Jetzt öffnet sich DeJaView als Anwendung und zeigt rassend schnell 220 leere Seiten an. Äh? Erst beim Click auf "Page Information" kommt dann ein Popup: "Error decoding page". Ok... dann lassen wir es halt.

Gefahren des DRM

Digital Rights Management (DRM) ist eine Methode Abspiel- und Kopier Möglichkeiten von Medien einzuschränken. Inhaltsanbieter sagen sie können damit günstigere Preise machen indem die Rechte auf ein vom Kunden benötigtes Maximum eingeschränkt werden. Kunden hingegen fühlen sich dadurch insbesondere mehrfach abgezockt. So oder so hat DRM große Probleme, weil dem Kunden (dem Käufer) einiges an Rechte weggenommen wird. Das kann dann so weit gehen, dass man gekaufte Songs nicht mehr abspielen kann, weil die DRM Server nicht erreichbar sind, oder keine Geräte mehr das Verfahren unterstützen. Microsoft hat den DRM Skeptikern einst versucht mit Ihrer "Plays for Shure" Campagne zu entgegnen. Ironischer weise schaltet Microsoft diesen Dienst jetzt ab, was dazu führt dass man die gekauften Medien nicht mehr von einem Gerät zum anderen übertragen kann (sondern nur noch auf den 5 registrierten Geräten). Wieder einmal zeigt sich, dass offene Formate eine sichere Zukunftsinvestition sind. Via Kris. Update: auch im Spiegel.

Intranet Identity Management (Part 1)

Das Thema Identity Management wurde besonders von den Herstellern entsprechender Lösungen immer wieder in die Fachpresse gebracht. Sicherheit ist auch ein sehr wichtiges Thema, und gerade die Innerbetrieblichen Abläufe lassen sich durch entsprechende Automatisierung nicht nur beschleunigen oder kostengünstiger machen, nein insbesondere auch die Sicherheit profitiert von einem durchdachten Ansatz. Ein typisches Beispiel ist der HR Prozess bei dem ein Mitarbeiter das Unternehmen verlässt, oder dessen Zugriffsrechte kurzfristig zurückgezogen werden sollen. Je mehr Systeme an einer Synchronisation beteiligt sind, oder direkt auf die zentrale Benutzerverwaltung zugreifen, desto schneller und vollständiger ist dieser Prozess. Aber wieder zurück zum Thema IM - ich habe den Eindruck das Risiko wird zwar verstanden, aber noch immer sind Tools in dem Umfeld "Nice-to-have", oder noch schlimmer: es werden strategische Entscheidungen "angedacht" und investiert, ein Großteil der Intranet Anwendungen bleibt aber außen vor. Hier genau setzt jetzt ein Compliance und Risk Management an. Und wie allen bekannt ist, kann sich Niemand dem Thema entziehen. Spätestens mit der neuen EU Direktive zum EuroSOX (was für ein schreckliches Schlagwort) wird es hier einen Boom geben. Entsprechend gibt es auch schon eine Analysten Meinung zu dem Thema, wie gerade bei CIO.de gefunden. Zugriffsrechte sollen hier vereinheitlicht werden (und dazu muß man natürlich Produkte kaufen). "Intranet Identity Management (Part 1)" vollständig lesen

Filehippo Update Checker

Nach all der IT Management Theorie in den letzten paar Artikeln mal wieder etwas praktisches für den Windows Desktop. Der Update Checker von Filehippo.com erlaubt es automatisiert einen Großteil aller frei verfügbaren Windows Programme auf Aktualisierungen zu testen. Danke an Oliver Gassner für den Hinweis (in seinem Twitter feed).

twitter.com/eckes

Ich habe mir einen Twitter Account zugelegt, weil ich denke das ist ein gutes Tool seinen Tagesablauf zu dokumentieren. Ich werde mir neben dem öffentlichen Account den Sie gerne tracken dürft auch noch einen privaten anlegen in dem ich z.b. Projektspezifische Zeiten accounten werde. Jetzt muss ich nur noch den RSS Feed auf meiner privaten Homepage einbauen..

Internet Explorer 7 (IE7) macht Ärger mit Outlook 2003

Vor kurzem war der IE7 in der Post. Also nicht in der Briefpost, sondern verfügbar per Windows Updates. Bisher hatte ich mich damit noch nicht befasst, weil ich mit Firefox als System Browser sehr weit komme. Ich habe deswegen den IE7 Update im Hintergrund laufen lassen, wohlwissend dass ich dieses Produkt sowieso selten benutzen werde (es gibt immer noch Websites die mit dem Firefox nicht zurrechtkommen). Nun ja, was soll ich sagen, nicht nur ist der IE auch schon bei den ersten Starts mehrfach abgestürtzt, nein noch viel Schlimmer gibt es nun Instabilitäten in Outlook 2003: beim Antworten auf manche Rich Text mails stürtzt die Office Komponente ab. Eine Deinstallation des IE7 ist aber möglich, und hat mir bei dem Problem geholfen. Es gibt noch eine menge weiterer Problemschilderungen, z.B. Font Probleme beim drucken aus Outlook heraus. Ich würde aus diesem Grund zumindest als Outlook User von dem Update Abstand nehmen. Microsoft-Watch berichtet auch über Probleme und stellt die berechtigte Frage: warum ist IE7 ein kritischer Update? Auf den Update Blocker sei hiermit ausdrücklich hingewiesen. Allen die den IE7 ausprobieren wollen oder müssen, sich aber nicht das komplette System zerschiessen wollen sei der Artikel aus dem IE-Blog ans herz gelegt. Ein XP als kostenloses Image für VirtualPC ist von Microsoft verfügbar. Darin ist IE6 und ein IE7 readyness toolkit installiert. Damit läßt sich der IE7 gefahrlos parallel zum IE6 auf einem Rechner betreiben. Web Designer werden dieses Angebot von Microsoft lieben. Die VM ist nur bis zum 1. April lauffähig, aber eine neue Version wird dann sicher folgen.

Google Code Search

Google Code Search Logo Google bietet schon einige Zeit die Suche in frei zugänglichen Quelltexten an. Eines der Kriterien ist die Lizenz - damit ist die Zielgruppe kar: Entwickler die Hife suchen, und das Rad nicht immer neu erfinden wollen. Zu den Hintergründen interviewed auch David Berlind (ZDNet) den Google Product Manager Tom Stocky. Google CodeSearch geht allerdings über die üblichen Volltext und Metadaten suchen hinaus. CodeSearch erlaubt mit Reguar Expression die Formuierung von Such-Ausdrücken die komplexe Beziehungen abprüfen. Dieses ermöglicht Data Mining in Unmengen von Quellcode, sehr praktisch für Untersuchungen zu Patterns oder Bug-Patterns. Bugle Logo Mein Kollege Ulli (der hier eigentlich mal Gast-Bloggen könnte!) hat mich auf ein Projekt hingewiesen, das genau dieses versucht: häufige Fehler-Konstrukte in CodeSearch Regeln formulieren, und dann auf alle frei verfügbaren Quellen loslassen: Bugle - Google Source Code Bug Finder Da bekommt man Lust dieses mit dem eigenen Code zu tun. Aber wer diesen nicht offenlegen will muss wohl vorerst mit Alternativen Vorlieb nehmen (die gängigen Code Inspection und Style Checker Tools haben auch Regeln in denen man den Quellcode durchsuchen kann). Hier auch ein Beispiel: einige meiner Open Source Beiträge. Wie man sehen kann sind einige Duplikate dabei...

Combots und The Long Tail

Pareto Verteilung mit langem SchwanzVilfredo Pareto ein italienischer Mathematiker und Wirtschaftswissenschaftler hat 1906 das nach Ihm benannte 80-20 Prinzip entdeckt (20% der Weltbevölkerung besitzen 80% des Reichtums). In vielen Bereichen wirkt sich die Pareto Verteilung aus. Es ist sehr bestechend mit 20% des Aufwandes 80% des Ertrags zu erhalten. In der alten Ökonomie war dies auch mehr als notwendig: mit einem kleinen Artikelbestand kann man 80% der Anfrager beglücken. In der digitalen Welt, in der die Massenbedürfnisse abgedeckt sind, und auch die Distributionskosten für digitale Güter keine Rolle spielen (oder auch die Methoden und Kosten für die Pflege einer Community geringer sind) gibt es jedoch noch einen anderen Markt: The Long Tail. Die Idee dahinter ist, dass viele kleine Kategorien und Nischen existieren die für sich genommen wenige Anhänger haben, das Gesamtvolumen dieser Märkte aber nicht unerheblich ist. Es ist kein Zufall dass "The Long Tail" (ein Begriff geprägt 2004 von Chris Anderson in einem Artikel im Wired magazine) oft im Zusammenhang mit Web 2.0 genannt wird: Web 2.0 Anwendungen zeichnen sich dadurch aus, dass es Plattformen sind in denen Gazillionen von Micro-Communities sich selbst organisieren. Die Communities sorgen sogar für den Digitalen Content der konsumiert wird, und dank Mund-zu-Mund Propaganda sind die Erschließungskosten für den Markt gering. Wichtig dafür sind nur: Eine Community Agnostische Plattform, Selbstorganisation, Verknüpfung von Services (Mashups und APIs), Benutzerfreundlichkeit und Offenheit. Was übrigens ganz Un-2.0 ist sind: zentralistische Strukturen, proprietäre Protokolle, Zwangsregistrierung und vorgekauter Content. Ich denke dabei zum Beispiel an einen Sachverhalt der auch im Computerwoche Notizblog schon beschrieben wurde: ComBOTS vermarktet Herr der Ringe Avatare. ComBOTs wird das große Problem haben den Long Tail nicht besetzen zu können da es keine Plattform gibt die als Katalysator für Communities wirken wird: kein Chat, kein Verzeichnis, keine Social Networking Gemeinde, keine Foren. Und einfache Voice Kommunikation über IP waren zu Zeiten von Skype noch genug, dass sich alle Communities danach gerissen haben, eine Online Gemeinschaft irgendwo wird sich nur selten ohne Not für ComBOTs entscheiden. Zumindest nicht wegen den bisher existierenden Features. Von daher hoffe ich (ganz im Sinne der klassischen lokalen Wirtschaft 1.0) dass sich hier noch etwas tun wird. z.B. URLs zum Direktanruf und Flash Status Applets die man auch in Foren nutzen darf. Und dazu eine hosted Foren-Lösung - für Micro Communities. Ich denke auch Google Apps for Domains wird sich dahingehend entwickeln.

Hey Pssst!! Möchtest du ein 'G' kaufen?

Pssst! Bei Google kannst Du Wörter kaufen! Jedenfalls denkt Google darüber nach der Forschergemeinde Wortkombinationen (sogenannte N-Gramme) zur Verfügung zu stellen. Diese werden bei Forschungen wie z.B. Text-Erkennung oder automatisierte Übersetzungen benötigt. Als Ergebniss einer umfangreichen Auswertung in den Google Rechenzentren wurden 1.011.582.453.213 Wörter verarbeitet und dabei eine Liste mit 1.146.580.664 5-Wort-Kombinationen erstellt. Hintergrund der Aktion kann im offiziellen Google Research Blog nachgelesen werden. Das Ergebnis steht auf 6 DVDs zur Verfügung.