DNA bindende Moleküle

An DNA bindet alles mögliche. DNA, RNA, Proteine verschiedener Klassen und Funktionalitäten, eine Menge an Molekülen, die täglich mehr wird und schier unübersehbare Möglichkeiten biologischer Funktionalität nach sich zieht. Wie soll man da als Wissenschaftler den Überblich behalten oder gar eine vernünftige Analyse starten?

Cistrome ist in erster Linie eine Datenbank in die die Rohdaten einer Unmenge an quantitativ gewonnenen experimentellen Daten beinhaltet. Und diese Daten beziehen sich ausschließlich auf DNA bindende Moleküle, also in der Methode ChIPseq, ChIP-chip oder ähnliches. Die graphische Aufarbeitung ist phänomenal einfach und intuitiv, so dass man sehr schnell zu den Daten kommt, die man bearbeiten möchte. Man kann sich einzelne Datensätze vergleichend zueinander bereits auf der Seite selbst darstellen lassen, allerdings geben einem die gesetzten links auch die Möglichkeit, die Rohdaten aus den öffentlichen Repositories bequem auf den heimischen Rechner herunterzuladen.

Ich habe selten eine so schöne Datenbank im Netz gesehen, man kann nur hoffen, dass die Förderung für dieses Datenbankprojekt noch sehr lange besteht, um die Seite am laufen zu halten. An dieser Stelle wäre es wirklich angebracht, einen Unterstützungsbutton einzubauen, damit man als interessierter Wissenschaftler dieses Projekt auch finanziell unterstützen kann, schließlich profitiert man ja selbst sehr von solch durchdachten Konzepten.

DAVID Reduktion

DAVID ist ein ziemlich mächtiges Tool, wenn es darum geht, biologischen Sinn aus daten zu gewinnen. Das Problem ist nur, dass Bioinformatiker und Biologen an dieser Stelle zwei unterschiedliche Ansätze fahren. Der Bioinformatiker möchte natürlich so viel wie möglich aus den Daten herausziehen und fährt, wenn es beim Auswählen der Datenbanken geht meist nach dem Prinzip Default oder gleich alles. Das macht für den Biologen wiederum wenig Sinn, denn für ihn ist die Argumentation so:

1. Ich möchte das wiederfinden, was ich seit 10 Jahren mit anderen Methoden bereits im Labor sehe
2. Ich möchte die These bestätigt finden, die der Doktorand X vor vier Jahren in seiner Doktorarbeit aufgestellt hat, die wir aber bisher nie wieder so nachweisen konnten
3. Und es darf auch noch ein bisschen mehr sein.

Insofern macht es Sinn, einerseits den Partner aus dem Labor zu einem Gespräch einzuladen, damit man wirklich versteht, was er denn eigentlich sucht und danach den Teil der Analyse auf das zu beschränken, was für das Nachprüfen im Labor und die weitere Arbeit wirklich Sinn macht. Alles andere ist zwar schöne Spielerei, aber von keinem praktischen Nutzen und führt vor allem zu immenser Miskommunikation und folglich Zeitverlust für beide Seiten.

Analogie: Datenanalyse

Was man alles mit Daten machen kann. Was passiert, wenn ein Bioinformatiker auf einen Datensatz gesetzt wird, der nichts mit seinem Fachgebiet zu tun hat? In Analogie: funktioniert reverse engeneering auch bei Vortragsdaten? Ein amüsantes, Video findet sich hierzu auf den TED-Seiten.

TED ist eine kleine Organisation, die unter dem Motto „Technology, Entertainment, Design“ seit einigen Jahren Vortragsreihen veranstalt. Die relativ kurzen Vorträge (ca. 20 min) werden von Wissenschaftlern, Politikern, Musikern ect. gehalten und decken so ziemlich alles ab, was einen interessieren könnte. Meist mit aha-Effekt.

Zum Selberbasteln von Vorträgen aus den Stichworten gehts hier lang.