Beiträge getagged mit informatik2008
GI Jahrestagung 2008 – eScience
Verfasst von kochm unter Science 2.0, Universität am 10.9.2008
Im Rahmen der Jahrestagung der Gesellschaft für Informatik 2008 fand heute der “Tag der Informatik” statt. Der Tag war angefüllt von vielen hochkarätigen Vorträgen zu verschiedenen Bereichen der Informatik – sehr interessant und inspirieren – und eine eigene Folge von Blog-Beiträgen wert. In diesem Beitrag will ich nur auf den letzten Beitrag eingehen – vor allem weil er mit enger mit meinen aktuellen Forschungsthemen zusammenhängt.
Der letzte Vortrag des Tages war betitelt mit “eScience, Semantic Computing and the Cloud: Towards a Smart Cyberinfrastructure for eScience” und wurde gehalten von Tony Hey, Corporate Vice President for Technical Computing, Microsoft. Tony Hey ist aus England – und vieles in seinen Ausführungen erinnerte mich stark an die Präsentation von Rob Procter auf der COOP 2008.
Was hat Tony Hey nun berichtet …
Hauptaussage war, dass die Wissenschaft heute immer mehr Daten hat – er sprach in diesem Zusammenhang auch von e-Science als “data-centric science”. Die WIssenschaftler sind überlastet und die Technologie soll in Zukunft hauptsächlich dabei helfen mit den vielen Daten umzugehen.
- data today can be easily produced
- data and serices can be easily composed
- data is easily accessible
- data is easily shareable
in the future more help with (automatic) aggregation, analysis, correlation, interpretation, inference is needed
Zur dafür notwendigen Automatisierung ist vor allem “semantic computing” gefragt. An dieser Stelle ging Hey auch darauf ein, wie Communities helfen können die Daten zu erschließen – also Crowdsourcing (Beispiel Galaxy Zoo). Interessant hierbei, dass das Konzept nicht als “Crowdsourcing” bezeichnet wurde, sondern als “Cloud Service”.
Kurz ist der Vortragende dann auch noch darauf eingegangen, dass das nun auch die Art und Weise ändern wird, wie Wissenschaft betrieben wird (“publish data first, then do research on it – distributed”).
Ganz kurz angesprochen hat Hey schließlich noch die “research pipeline” präsentiert um mögliche Einsatzmöglichkeiten von Technologie einzuordnen:
- data acqisition and modeling
- collaboration
- analysis
- disseminate and search
- archiving
Interessant war dabei, dass zum letzten Punkt (archiving) natürlich auch die Langzeitarchivierung gehört.