Dienstag 22 November 2005

BBC to Google Base: You’re boring

BBC Database Vor einigen Jahren habe ich mal für RTL eine Comedy-Datenbank aufgebaut. Das war der geilste Job meines Lebens: Wir guckten den ganzen Tag die besten Comedy-Serien aus England und den USA (The Fast Show! The Day Today!) und hackten nebenher ein paar Daten in den Computer. Schon damals hab ich mir gedacht: Einmal in die Archive der BBC steigen dürfen und da die ganzen Schätze heben. Und tatsächlich: Daran frickeln zur Zeit ein paar Programmierer, und wenn das, woran sie da frickeln, auch nur halb so spannend ist, wie es in der Gerüchteküche und im Flurgeflüster klingt, dann ist Googles niedliche Base dagegen Informatik aus der Volkshochschule.

Die BBC hat vor zwei Jahren angekündigt, ihre Archive der Öffentlichkeit zugänglich zu machen.Das steht im Zusammenhang mit vielen ähnlichen (und fast durchweg spannenden) BBC-Initiativen, die eine ganz interessante Neuorientierung des öffentlich-rechtlichen Rundfunks einleiten könnten. Die Anforderungen sind freilich nicht ohne: “Fast eine Million Programme sind katalogisiert, mit Beschreibungen, Details über Mitwirkende und Anmerkungen, die aus einem herrlich detaillierten und kontrollierten Vokabular bezogen werden”, schreibt Mark Biddulph, der für das Projekt verantwortlich ist.

Diese Eintragungen gehen bis in kleinste Programmdetails - Biddulph erzählt, dass er einen Auftritt seines Vaters in einer regionalen Nachrichtensendung wiederfinden konnte -, und die natürlich soll die finale Version der Datenbank multimedial sein.

Man kann sich vorstellen, dass es eine Herkulesarbeit ist, einen strukturierten Zugriff auf diese Datenflut einzurichten. Biddulph hat von der BBC scheinbar freie Hand bekommen, um das Projekt randvoll mit allem zu packen, was im Moment an Features so angesagt ist:

Es ist alles in Ruby on Rails entwickelt, und es hat Unmengen Ajax und Tags und RDF und FOAF und Sparklines und Microformats, und überhaupt alles, was wir noch mit unterbringen können.

heißt es im Blog von Designer Ben Hammersley. Und wenn er sagt, hier entstehe “the Database to end all Databases”, dann klingt das vielleicht hoch gestochen, aber im Grunde ist das der Anspruch, dem ein solches Projekt genügen muss. Herauskommen soll, nämlich nichts Geringeres als

eine Art BBC-Wikipedia voller Live-Feeds über Suchbegriffe, Programme, BBC-Mitarbeiter usw., mit Daten, die bis ins Jahr 1936 zurückreichen, und einem kontrollierten Vokabular an Stichworten, dass in der gesamten Zeitspanne von BBC-Bibliothekaren genauestens beachtet wurde. Das wird ein einmaliges Datenarchiv sein, und die BBC rechnet mit bei diesem Ding mit bis zu 3.000 Anfragen pro Sekunde (ja, Sie haben das richtig gelesen).

Das schreibt einer, der bei der ersten öffentlichen Präsentation, letzte Woche auf einer Konferenz in London, mit dabei war. Ich war’s nicht, aber angesichts der positiven Stimmen, die man von Teilnehmern hören und lesen kann, bin ich schon etwas neidisch. (Hier gibt es Biddulphs Slides im S5-Format, die sind allerdings nicht so vielsagend. Screenshots gibt’s hier und hier - noch dazu als nette Verbeugung an einen großen Mann.)

Aber was hat die multimediale Datenbank eines Rundfunkhauses mit Google Base zu tun? Sehr viel, denn die Erfassung der Programmarchive ist ja nur der Anfang. Der nächste Schritt wird sein, auch den Zugriff auf die Inhalte zu ermöglichen: Auch hier geht es um schnellen und eleganten Zugriff auf disparate Informationen: Eine Datenbank für alles. Und da kann ein Dinosaurier wie die BBC auf ganz andere Ressourcen zurückgreifen als Google: Kochrezepte, regionale Infos, Tipps für Hobbygärtner - was Google von seinen Nutzern erst hochgeladen bekommen möchte, ist ja dort schon alles vorhanden. Das Wettrennen geht nun darum, wer es am schnellsten schafft, diese Inhalte so ins Netz zu befördern, das man alle möglichen Verwertungsmöglichkeiten da andocken kann. Google ist zwar ganz schön flink unterwegs, aber an der BBC sieht man, dass die alten Dickschiffe noch lange nicht reif fürs Trockendock sind.

Die BBC jedenfalls will demnächst mal eine öffentliche Beta launchen. Die wird noch nicht multimedial sein, sondern erst einmal Zugriff auf sämtliche Programmdaten seit 1936 bieten: “So eine Art IMDB für die BBC, nur größer”, heißt es bei Hammersley. Ich bin gespannt.

Noch keine Kommentare.

Artikel kommentieren:

Wer möchte, kann gerne auch HTML benutzen, und zwar folgende Tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>

Hinweis: Die Kommentare werden moderiert und erscheinen darum nicht sofort. Ein Kommentar muss aber nicht noch ein zweites Mal abgeschickt werden. (Keine Angst: Das ist nur eine Vorsichtsmaßnahme, um Spam-Kommentare zu verhindern. Ansonsten geht hier (fast) alles durch ...)