ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Ι

ΜΠΑΓΚΟΣ ΠΑΝΤΕΛΕΗΜΩΝ

Περιγραφή

Σκοπός του μαθήματος είναι να παρουσιάσει τις βασικές έννοιες της Βιοπληροφορικής και της Υπολογιστική Βιολογίας. Η ύλη περιλαμβάνει τις κλασικές ενότητες τέτοιων μαθημάτων και αναφέρεται κυρίως στις βάσεις βιολογικών δεδομένων και τα εργαλεία αναζήτησης και ομοιότητας, αλλά και τις μεθόδους πρόγνωσης. Με την επιτυχή ολοκλήρωση του μαθήματος οι φοιτητές θα πρέπει να είναι ικανοί:

 

  • Να αναγνωρίζουν και να διακρίνουν τα βασικά βιολογικά φαινόμενα, στα οποία εμπλέκεται η βιοπληροφορική αλλά και της σημασία της ανάμεσα στις σύγχρονες βιολογικές επιστήμες
  • Να επιλύουν προβλήματα που έχουν να κάνουν με αναζητήσεις σε βάσεις βιολογικών δεδομένων διαφόρων τύπων
  • Να χρησιμοποιούν τα βασικά εργαλεία στοίχισης, πολλαπλής στοίχισης και πρόγνωσης δομής και λειτουργίας πρωτεϊνών

 

CC - Αναφορά Δημιουργού
Περιεχόμενο μαθήματος

Εισαγωγή: ορισμός και Ιστορία της Βιοπληροφορικής. Υποδιαιρέσεις. Είδη των δεδομένων στη Βιοπληροφορική. Βάσεις δεδομένων: βάσεις δεδομένων βιβλιογραφίας, αλληλουχιών πρωτεϊνών και DNA, δομών, διπλωμάτων και οικογενειών, εξειδικευμένες βάσεις δεδομένων, εργαλεία ανάλυσης της πληροφορίας που είναι αποθηκευμένη στις βάσεις δεδομένων – Entrez, SRS. Στοίχιση ακολουθιών: Μέθοδοι εύρεσης ομοιοτήτων σε αλληλουχίες, ομολογία και ομοιότητα αλληλουχιών και η σημασία τους, αλγόριθμοι δυναμικού προγραμματισμού, ολική στοίχιση – Global Alignment – αλγόριθμος των Needleman και Wunch, τοπική στοίχιση – Local Alignment – αλγόριθμος των Smith και Waterman, υπολογισμός της στατιστικής σημαντικότητας της στοίχισης, πίνακες ομοιότητας και η σημασία τους, ποινές για τα κενά, ευριστικές μέθοδοι για αναζήτηση ομοιοτήτων σε βάσεις δεδομένων BLAST, FASTA. Πολλαπλή στοίχιση αλληλουχιών: Πολυδιάστατοι αλγόριθμοι δυναμικού προγραμματισμού, ευριστικές μέθοδοι πολλαπλής στοίχισης ακολουθιών – CLUSTAL, DIALIGN, T-Coffee, κλπ – φυλογενετικά δένδρα και πολλαπλές στοιχίσεις. Αλγόριθμοι πρόγνωσης στηριζόμενοι στην ακολουθία πρωτεϊνών και DNA: Πρόγνωση δευτεροταγούς δομής πρωτεϊνών και RNA, πρόγνωση διαμεμβρανικών τμημάτων πρωτεϊνών και προσανατολισμού τους, εύρεση πιθανών γονιδίων σε ακολουθίες DNA, Hidden Markov Models και Νευρωνικά Δίκτυα στη Βιοπληροφορική. Oι αλγόριθμοι forward και backward, αποκωδικοποίηση (αλγόριθμοι Viterbi, Nbest, Posterior, Posterior - Viterbi, OAPD), εκτίμηση παραμέτρων με τους αλγόριθμους Baum - Welch και Gradient Descent, ειδικές τροποποιήσεις του Hidden Markov Model για βιολογικά δεδομένα (Class HMM, αλγόριθμοι για σημασμένες ακολουθίες, αλγόριθμοι ενσωμάτωσης πειραματικής πληροφορίας, profile Hidden Markov Models)

Βιβλιογραφία

Βιοπληροφορική και Λειτουργική Γονιδιωματική, Jonathan Pevsner, ΑΚΑΔΗΜΑΪΚΕΣ ΕΚΔΟΣΕΙΣ, ISBN: 978-618-5135-17-1

Βιοπληροφορική, OVELLETE F. - BAXEVANIS A., ΠΑΡΙΣΙΑΝΟΥ ΑΝΩΝΥΜΗ ΕΚΔΟΤΙΚΗ ΕΙΣΑΓΩΓΙΚΗ ΕΜΠΟΡΙΚΗ ΕΤΑΙΡΙΑ ΕΠΙΣΤΗΜΟΝΙΚΩΝ ΒΙΒΛΙΩΝ, 2012, ΑΘΗΝΑ

Μπάγκος, Π., 2015. Βιοπληροφορική. [ηλεκτρ. βιβλ.] Αθήνα:Σύνδεσμος Ελληνικών Ακαδημαϊκών Βιβλιοθηκών. Διαθέσιμο στο: http://hdl.handle.net/11419/5016

 

Πρόσθετο Υλικό

 

  1. Shawn T. O’Neil. A Primer for Computational Biology https://open.oregonstate.education/computationalbiology/
  2. Jens Stoye et al. Algorithms for Phylogenetic Reconstructions http://profs.scienze.univr.it/~liptak/ALBioinfo/files/PhylogenetikSkript2009.pdf
  3. Jens Stoye et al. Sequence Analysis http://profs.scienze.univr.it/~liptak/ALBioinfo/files/sequence_analysis.pdf
  4. Sabu M. Thampi. Introduction to Bioinformatics https://arxiv.org/abs/0911.4230
  5. David A. Hendrix. Applied Bioinformatics https://open.oregonstate.education/appliedbioinformatics/
  6. Computational Biology - Genomes, Networks, and Evolution (Kellis et al.) https://bio.libretexts.org/Bookshelves/Computational_Biology/Book%3A_Computational_Biology_-_Genomes_Networks_and_Evolution_(Kellis_et_al.)
  7. Keith Bradnam & Ian Korf. Unix and Perl Primer for Biologists http://korflab.ucdavis.edu/Unix_and_Perl/current.pdf
  8. Martin Jones. Python for Biologists http://userpages.fu-berlin.de/digga/p4b.pdf
  9. Learning To Program With Perl https://www.bioinformatics.babraham.ac.uk/training/Perl%20Introduction.pdf
  10. Avril Coghlan . A Little Book of R For Bioinformatics https://buildmedia.readthedocs.org/media/pdf/a-little-book-of-r-for-bioinformatics/latest/a-little-book-of-r-for-bioinformatics.pdf
Μαθησιακοί στόχοι

Με την επιτυχή ολοκλήρωση του μαθήματος οι φοιτητές θα πρέπει να είναι ικανοί:

  • Να αναγνωρίζουν και να διακρίνουν τα βασικά βιολογικά φαινόμενα, στα οποία εμπλέκεται η βιοπληροφορική
  • Να επιλύουν προβλήματα που έχουν να κάνουν με αναζητήσεις σε βάσεις βιολογικών δεδομένων
  • Να χρησιμοποιούν τα βασικά εργαλεία στοίχισης, πολλαπλής στοίχισης και πρόγνωσης
Ημερολόγιο Διαλέξεων
Α/Α Διδάσκων Ημ/νία Τίτλος Διάλεξης Περιγραφή
1 Μπάγκος Π. 2-Οκτ Εισαγωγή -Ιστορία της Βιοπληροφορικής Διάλεξη
2 Μπάγκος Π. 9-Οκτ Βάσεις Βιολογικών Δεδομένων Διάλεξη
3 Μπάγκος Π. 16-Οκτ Στοίχιση Αλληλουχιών Διάλεξη
4 Μπάγκος Π. 23-Οκτ Αναζητήσεις ομοιότητας σε βάσεις δεδομένων (BLAST) Διάλεξη
5 Μπάγκος Π. 30-Οκτ Πολλαπλή στοίχιση αλληλουχιών Διάλεξη
6 Μπάγκος Π. 6-Νοε Αναζήτηση προτύπων Διάλεξη
7 Μπάγκος Π. 13-Νοε Φυλογενετική ανάλυση Διάλεξη
8 Μπάγκος Π. 20-Νοε ΗΜΜ 1 Διάλεξη
9 Μπάγκος Π. 27-Νοε ΗΜΜ 2 Διάλεξη
10 Μπάγκος Π. 4-Δεκ Μέθοδοι πρόγνωσης Ι Διάλεξη
11 Μπάγκος Π. 11-Δεκ Μέθοδοι πρόγνωσης ΙΙ Διάλεξη
12 Μπάγκος Π. 18-Δεκ Μέθοδοι πρόγνωσης ΙΙI Διάλεξη
         
         
13 Μπάγκος Π. 8-Ιαν Επανάληψη Διάλεξη
Ημερολόγιο Εργαστηριακών Ασκήσεων
Α/Α Διδάσκων Ημ/νία Τίτλος Άσκησης Περιγραφή
1 Κάνδυλας Δ, Κυλώνης Α 10-Οκτ Βάσεις Βιολογικών Δεδομένων Εργαστηριακή Άσκηση (Ομάδες Α+Β)
2 Κάνδυλας Δ, Κυλώνης Α 17-Οκτ Βάσεις Βιολογικών Δεδομένων Εργαστηριακή Άσκηση (Ομάδες Γ+Δ)
3 Κάνδυλας Δ, Κυλώνης Α 24-Οκτ Στοίχιση και Αναζητήσεις σε Βάσεις Δεδομένων Εργαστηριακή Άσκηση (Ομάδες Α+Β)
4 Κάνδυλας Δ, Κυλώνης Α 31-Οκτ Στοίχιση και Αναζητήσεις σε Βάσεις Δεδομένων Εργαστηριακή Άσκηση (Ομάδες Γ+Δ)
5 Κάνδυλας Δ, Κυλώνης Α 7-Νοε Πολλαπλή Στοίχιση, Profiles και Φυλογενετική Εργαστηριακή Άσκηση (Ομάδες Α+Β)
6 Κάνδυλας Δ, Κυλώνης Α 14-Νοε Πολλαπλή Στοίχιση, Profiles και Φυλογενετική Εργαστηριακή Άσκηση (Ομάδες Γ+Δ)
7 Κάνδυλας Δ, Κυλώνης Α 21-Νοε Μέθοδοι Πρόγνωσης Εργαστηριακή Άσκηση (Ομάδες Α+Β)
8 Κάνδυλας Δ, Κυλώνης Α 28-Νοε Μέθοδοι Πρόγνωσης Εργαστηριακή Άσκηση (Ομάδες Γ+Δ)
9 Κάνδυλας Δ, Κυλώνης Α 5-Δεκ Επανάληψη-Αναπληρώσεις Εργαστηριακή Άσκηση (όλες οι ομάδες)
Εργαστηριακές Ομάδες
ΟΝΟΜΑ ΕΠΩΝΥΜΟ ΤΜΗΜΑ ΠΡΩΤΕΪΝΗ
ΑΘΑΝΑΣΙΟΣ ΑΓΓΕΛΗΣ Α A8IE32
ΣΤΑΥΡΟΣ  ΑΓΓΟΥΡΙΔΑΚΗΣ Α E6MVD9
ΒΑΣΙΛΕΙΟΣ-ΒΥΖΑΝΤΙΟΣ ΑΔΑΜΟΣ Α P0A1N8
ΖΙΟΥΛΗ  ΑΙΚΑΤΕΡΙΝΗ Α P75733
ΓΕΩΡΓΙΟΣ ΑΚΡΙΒΟΥ Α P0DSN2
ΠΑΝΑΓΙΩΤΗΣ ΑΠΟΣΤΟΛΟΣ  ΑΝΔΡΕΟΠΟΥΛΟΣ Α A0A923E755
ΚΩΝΣΤΑΝΤΙΝΑ ΑΝΔΡΙΑΝΟΠΟΥΛΟΥ Α Q9RGZ0
ΕΛΕΝΗ  ΑΝΔΡΙΩΤΗ Α A0A0H3LM39
ΣΟΦΙΑ  ΒΑΡΔΟΥΛΗ Α A0A2S6NEK5
ΣΤΕΛΙΟΣ ΒΑΡΘΑΛΙΤΗΣ Α A0A0L8FVQ9
ΕΛΕΝΗ  ΒΛΑΧΑΚΗ Α P0ABJ1
ΘΕΟΔΩΡΑ ΑΛΙΚΗ  ΒΛΑΧΟΥ Α A0A263CW99
ΛΟΥΚΙΑ  ΒΟΥΔΟΥΡΗ Α P9WK55
ΓΕΩΡΓΙΟΣ ΒΡΕΝΤΖΟΣ Α Q50EA3
ΘΟΔΩΡΗΣ ΓΕΡΑΜΑΝΗΣ Α O50499
ΗΛΙΑΣ ΓΕΩΡΓΙΑΔΗΣ Α D4GPW5
ΠΑΝΑΓΙΩΤΗΣ ΓΚΑΤΖΙΝΗΣ Α D4GUI7
ΕΥΘΥΜΙΟΣ  ΓΚΙΚΑΣ Α A8IE32
ΙΩΑΝΝΗΣ ΓΚΙΛΛΗΣ Α E6MVD9
ΕΛΕΥΘΕΡΙΟΣ ΓΚΟΥΛΙΑΒΙΔΗΣ Α P0A1N8
ΜΑΡΙΝΑ ΓΚΟΥΛΙΟΥΔΗ Α P75733
ΒΑΣΙΛΕΙΟΣ ΓΕΩΡΓΙΟΣ ΓΩΓΟΥΛΑΣ Α P0DSN2
ΓΙΩΡΓΟΣ  ΔΑΜΙΡΗΣ Α A0A923E755
ΓΙΩΡΓΟΣ ΔΑΡΔΑΝΗΣ Α Q9RGZ0
ΑΛΕΞΑΝΔΡΟΣ ΔΕΔΕΣ Α A0A0H3LM39
ΗΡΑΚΛΗΣ ΕΥΘΥΜΙΑΔΗΣ Α A0A2S6NEK5
ΧΡΙΣΤΟΦΟΡΟΣ  ΕΥΚΟΛΙΔΗΣ Β A0A0L8FVQ9
ΣΤΑΥΡΟΥΛΑ  ΖΙΑΡΡΑ Β A0A263CW99
ΕΥΑΓΓΕΛΟΣ ΖΟΥΜΑΣ Β P9WK55
ΚΩΝΣΤΑΝΤΙΝΟΣ  ΘΕΟΧΑΡΗΣ Β O50499
ΝΤΑΡΙ ΙΝΦΑΝΤΕ ΧΑΚΕΖ Β D4GPW5
ΕΙΡΗΝΗ  ΚΑΝΔΥΛΑ Β D4GUI7
ΙΩΑΝΝΗΣ  ΚΑΡΑΝΑΤΣΙΟΣ Β A8IE32
ΚΥΡΙΑΚΗ  ΚΑΡΤΣΙΟΥ Β E6MVD9
ΠΑΝΑΓΙΩΤΗΣ ΚΑΤΣΑΡΕΛΗΣ Β P0A1N8
ΝΙΚΟΣ ΚΑΤΣΙΚΑΒΑΛΗΣ Β P75733
ΙΩΑΝΝΑ ΚΙΣΙΡΗ Β A0A923E755
ΜΑΡΙΑ  ΚΙΤΣΑ Β Q9RGZ0
ΒΑΣΙΛΗΣ ΚΟΝΙΟΣ Β A0A0H3LM39
ΜΑΡΙΑ ΚΟΤΣΑΛΑ Β A0A2S6NEK5
ΣΩΤΗΡΙΟΣ ΚΟΥΤΡΑΣ Β A0A0L8FVQ9
ΧΑΡΙΚΛΕΙΑ  ΚΥΡΙΩΤΗ Β P0ABJ1
ΖΗΣΗΣ ΚΩΝΣΤΑΝΤΙΝΙΔΗΣ Β A0A263CW99
ΜΙΧΑΗΛ  ΛΑΖΑΡΙΔΗΣ Β P9WK55
ΓΕΩΡΓΙΟΣ - ΠΑΝΑΓΙΩΤΗΣ  ΛΙΤΟΣΕΛΙΤΗΣ Β Q50EA3
ΜΑΡΙΑ ΜΑΚΡΗ Β O50499
ΑΦΡΟΔΙΤΗ ΜΑΛΛΙΤΟΥ Β D4GPW5
ΡΑΝΙΑ ΜΕΧΝΤΙ Β D4GUI7
ΜΑΡΙΝΑ ΜΗΤΣΗ Β A8IE32
ΗΛΙΑΣ ΜΙΧΑΛΑΣ Β E6MVD9
ΛΕΩΝΙΔΑΣ ΚΡΥΟΝΑΣ Β P0A1N8
ΚΩΝΣΤΑΝΤΙΝΟΣ ΜΠΑΚΟΓΙΑΝΝΗΣ Γ P75733
ΧΡΙΣΤΙΝΑ - ΚΑΘΟΛΙΚΗ  ΜΠΑΝΤΙΟΥ Γ P0DSN2
ΔΗΜΗΤΡΗΣ  ΜΠΕΣΙΝΑΣ Γ A0A923E755
ΝΑΝΣΙ ΜΠΥΛΥΚΟΥ Γ Q9RGZ0
ΜΑΡΙΝΑ-ΕΥΤΥΧΙΑ ΜΥΡΤΑΚΗ Γ A0A0H3LM39
ΠΑΡΘΕΝΑ ΜΩΫΣΙΑΔΟΥ Γ A0A2S6NEK5
ΔΗΜΟΣΘΕΝΗΣ  ΝΑΣΙΟΥΛΑΣ Γ A0A0L8FVQ9
ΜΑΡΙΑ  ΝΕΔΟΥ Γ P0ABJ1
ΕΥΑΓΓΕΛΙΑ ΑΙΚΑΤΕΡΙΝΑ  ΝΙΚΑ Γ A0A263CW99
ΠΑΝΤΕΛΕΗΜΩΝ ΝΙΚΟΛΑΟΥ Γ P9WK55
ΗΛΙΑΣ ΝΤΑΡΤΖΟΥΛΙΔΗΣ Γ Q50EA3
ΑΝΑΣΤΑΣΙΟΣ  ΝΤΑΣΗΣ Γ O50499
ΠΟΣΟΥΛΑ ΝΤΟΥΜΠΑΚΗ Γ D4GPW5
ΔΗΜΗΤΡΗΣ  ΞΑΝΘΟΠΟΥΛΟΣ Γ D4GUI7
ΧΑΤΖΗΑΥΓΟΥΣΤΙΔΗΣ ΠΑΝΑΓΙΩΤΗΣ Γ A8IE32
ΣΤΕΛΙΟΣ ΠΑΝΟΣ Γ E6MVD9
ΓΕΩΡΓΙΟΣ  ΠΑΠΑΘΑΝΑΣΙΟΥ Γ P0A1N8
ΓΙΩΡΓΟΣ  ΠΑΠΑΜΙΚΡΟΥΛΗΣ Γ P75733
ΣΤΥΛΙΑΝΗ ΕΛΕΝΗ  ΠΑΡΑΣΚΕΥΑ Γ P0DSN2
ΘΕΟΔΩΡΟΣ ΠΑΡΟΥΣΟΓΛΟΥ Γ A0A923E755
ΗΛΙΑΣ  ΠΑΥΛΙΔΗΣ Γ Q9RGZ0
ΕΥΑΓΓΕΛΟΣ ΠΙΝΑΤΣΗΣ Γ A0A0H3LM39
ΜΑΡΙΑ ΠΟΛΥΧΡΟΝΟΥΔΗ Γ A0A2S6NEK5
ΔΗΜΗΤΡΗΣ ΠΡΙΤΣΑΣ Γ A0A0L8FVQ9
ΓΕΩΡΓΙΟΣ ΠΡΙΦΤΗΣ Γ P0ABJ1
ΑΙΚΑΤΕΡΙΝΗ ΙΩΑΝΝΑ  ΡΕΓΓΙΝΑ Γ A0A263CW99
ΣΤΥΛΙΑΝΗ ΚΙΤΣΙΟΥ Γ P9WK55
ΒΑΣΙΛΕΙΑ ΡΟΓΚΑ Δ Q50EA3
ΑΡΤΕΜΙΣ ΣΑΒΒΙΔΟΥ Δ D4GPW5
ΠΑΝΑΓΙΩΤΗΣ ΣΑΚΑΤΖΗΣ Δ D4GUI7
ΆΝΝΑ ΧΡΙΣΤΙΝΑ ΣΑΡΡΗ Δ A8IE32
ΜΑΡΙΑ ΕΛΕΝΗ ΣΕΡΒΕΤΑ Δ E6MVD9
ΦΑΤΜΑ  ΣΕΧ Δ P0A1N8
ΦΩΤΕΙΝΗ  ΣΙΑΠΕΡΑ Δ P75733
ΜΑΡΙΑ  ΣΟΛΩΜΟΥ Δ P0DSN2
ΠΑΝΑΓΙΩΤΑ  ΣΤΕΡΓΙΟΠΟΥΛΟΥ Δ Q9RGZ0
ΓΕΩΡΓΊΑ ΤΑΝΤΑΝΌΖΗ Δ A0A0H3LM39
ΘΩΜΑΣ  ΤΖΙΜΑΣ Δ A0A2S6NEK5
ΑΛΕΞΑΝΔΡΟΣ  ΤΡΥΨΑΝΗΣ Δ A0A0L8FVQ9
ΚΑΡΙΝΑ ΤΣΑΝΑ Δ P0ABJ1
ΜΑΡΙΑ ΤΣΙΛΙΓΚΑΡΙΔΟΥ Δ P9WK55
ΔΕΣΠΟΙΝΑ  ΤΣΙΟΥΜΑΡΗ Δ Q50EA3
ΒΑΣΙΛΗΣ  ΦΙΝΙΔΗΣ Δ O50499
ΣΤΥΛΙΑΝΗ ΦΡΑΓΚΟΥ Δ D4GPW5
ΠΕΤΡΟΣ ΧΑΛΑΡΗΣ Δ D4GUI7
ΜΑΡΙΑ ΧΕΛΙΔΟΝΗ Δ A8IE32
ΔΗΜΗΤΡΗΣ- ΑΝΔΡΕΑΣ ΧΟΥΠΕΡ Δ E6MVD9
ΔΗΜΗΤΡΙΟΣ ΧΡΥΣΑΦΗΣ Δ P0A1N8
ΒΑΣΙΛ ΧΥΣΟΛΛΙ Δ P75733
ΣΤΑΥΡΟΣ ΒΑΣΙΛΑΚΗΣ Δ A0A923E755
ΧΡΗΣΤΟΣ ΓΙΑΛΟΥΡΗΣ Δ Q9RGZ0
Κανονισμός εργαστηριακών ασκήσεων

1) Η παρακολούθηση και η ολοκλήρωση των εργαστηριακών ασκήσεων είναι υποχρεωτική. Λόγω των ειδικών συνθηκών και της διεξαγωγής 2 ασκήσεων σε κάθε εργαστήριο, η δυνατότητα απουσίας σε ένα από τα τέσσερα εργαστήρια θα επιτραπεί και θα θεωρείται δικαιολογημένη μόνο για σοβαρούς κυρίως ιατρικούς λόγους και σε αυτές τις περιπτώσεις απαιτείται η προσκόμιση της αντίστοιχης βεβαίωσης. Σε τέτοιες περιπτώσεις προβλέπεται και επαναληπτική εργαστηριακή άσκηση (υπάρχει στο πρόγραμμα)

2) Η βαθμολογία των εργασιών αυτών θα προσμετράται στον τελικό βαθμό κατά 30% μόνο κατά το έτος άσκησης (για σας, το έτος 2025-26). Αν κάποιος δεν παραδώσει εργασία μέσα στις προθεσμίες, τότε ο βαθμός του κατά το έτος της άσκησης θα βγαίνει με άριστα το 7. Αν κάποιος φοιτητής δεν καταφέρει να πάρει προβιβάσιμο βαθμό στις 2 εξεταστικές (Ιανουάριο, Σεπτέμβριο), αλλά έχει ολοκληρώσει επιτυχώς τις ασκήσεις, τότε τις επόμενες χρονιές θα πρέπει να εξεταστεί μόνο στο μάθημα και ο τελικός βαθμός θα προκύψει από την βαθμολογία της γραπτής εξέτασης που θα λάβει.

3) Οι φοιτητές παλαιότερων ετών που έχουν ολοκληρώσει τις εργαστηριακές ασκήσεις χωρίς απουσίες δεν χρειάζεται να δηλώσουν συμμετοχή εκ νέου στις ασκήσεις (και ούτε να ασκηθούν εκ νέου). Ο βαθμός τους θα προκύψει όπως στο (2) ανωτέρω, από την γραπτή εξέταση.

4) Όσοι φοιτητές παλαιότερων ετών έχουν απορίες και δεν θυμούνται αν έχουν ολοκληρώσει όντως τις εργαστηριακές ασκήσεις, μπορούν να επικοινωνήσουν με την κα Μαργαρίτα Θεοδωροπούλου (margarita.th@gmail.com) για τα έτη μέχρι το 2021-2022 και με την κα Θεοδοσία Χαρίτου (sissycha87@gmail.com) για τα έτη (2022-20223 και μετά) για να κάνουν τον έλεγχο.

Ενότητες

Η βιοπληροφορική είναι ένας ταχέα αναπτυσσόμενος διεπιστημονικός κλάδος. Παρόλο που ένας ακριβής ορισμός δεν μπορεί να δοθεί, και υπάρχουν μάλιστα και πολλές διαφωνίες ανάλογα με την οπτική και το υπόβαθρο του καθενός, είναι σαφές ότι πρόκειται για τον επιστημονικό κλάδο που βρίσκεται στην περιοχή επαφής της βιολογίας με τα μαθηματικά και την επιστήμη υπολογιστών. Στο κεφάλαιο αυτό, θα προσπαθήσουμε να εξετάσουμε τέτοια θέματα από όλες τις πλευρές. Θα δούμε το ιστορικό πλαίσιο ανάπτυξης της βιοπληροφορικής (ή καλύτερα, της υπολογιστικής βιολογίας), το διεπιστημονικό χαρακτήρα της, τους μύθους που τη συνοδεύουν, αλλά θα δούμε και τις τελευταίες εξελίξεις στη βιβλιογραφία της βιοπληροφορικής, τόσο διεθνώς όσο και στην Ελλάδα. Με τα περιεχόμενα αυτού το κεφαλαίου, ευελπιστούμε ότι οι αναγνώστες θα μπορέσουν να αποκτήσουν μια εποπτική εικόνα αυτού του σύνθετου ερευνητικού πεδίου η οποία θα τους βοηθήσει στην κατανόηση των επόμενων κεφαλαίων

Στο κεφάλαιο αυτό, θα γίνει η απαραίτητη εισαγωγή στις βιολογικές βάσεις δεδομένων έτσι ώστε ο αναγνώστης να μπορεί, στα επόμενα κεφάλαια, να ανατρέχει στις πηγές που χρησιμοποιούνται για την ανάλυση των αντίστοιχων κάθε φορά δεδομένων (αλληλουχίες, δομές, οικογένειες πρωτεϊνών, δεδομένα έκφρασης, πολυμορφισμοί κ.ο.κ.). Ανάλογα με το είδος της πληροφορίας που περιέχουν, θα παρουσιαστούν οι κύριες βάσεις κάθε κατηγορίας και θα τονιστούν τα βασικά χαρακτηριστικά τους. Ειδικό κομμάτι στο τέλος του κεφαλαίου, θα αφιερωθεί στις εξειδικευμένες βάσεις (κυριώς πρωτεϊνικών) δεδομένων, οι οποίες καταλαμβάνουν σημαντικό μερίδιο στην έρευνα των μικρών και μεσαίου μεγέθους ερευνητικών εργαστηρίων και αποτελούν σημαντικό εργαλείο στη βιοπληροφορική μελέτη των πρωτεϊνών.

 

Στο κεφάλαιο αυτό θα παρουσιαστούν αρχικά, τα απαραίτητα μαθηματικά μοντέλα που περιγράφουν τις αλληλουχίες μακρομορίων και κάποια βασικά ασυμπτωτικά αποτελέσματα που αναφέρονται σε αυτές. Στη συνέχεια θα παρουσιαστούν τα βασικά θεωρητικά αποτελέσματα που αφορούν στη στοίχιση βιολογικών αλληλουχιών. Θα παρουσιαστούν οι τρόποι βαθμονόμησης της στοίχισης, οι τρόποι εύρεσης της στοίχισης, καθώς και τα διαφορετικά είδη αλγορίθμων στοίχισης, ενώ ιδιαίτερη έμφαση θα δοθεί στην αξιολόγηση της στατιστικής σημαντικότητας μιας στοίχισης. Τέλος, θα παρουσιαστούν οι βασικοί ευριστικοί αλγόριθμοι τοπικής στοίχισης (FASTA, BLAST), οι οποίοι χρησιμοποιούνται καθημερινά στη βιοπληροφορική

Η πολλαπλή στοίχιση είναι μια διαδικασία με κεντρική σημασία στη σύγχρονη βιοπληροφορική. Πολλαπλές στοιχίσεις χρησιμοποιούνται για να εντοπιστούν τα συντηρημένα τμήματα σε μια ομάδα πρωτεϊνικών ακολουθιών και για να χαρακτηριστεί η αντίστοιχη οικογένεια, αλλά και για άλλες αναλύσεις, όπως η εκτίμηση φυλογενετικών σχέσεων και η υποβοήθηση της απόδοσης προγνωστικών αλγορίθμων. Το βασικό πρόβλημα της πολλαπλής στοίχισης είναι ότι δεν υπάρχει εύκολος τρόπος να βρεθεί μαθηματικά, η βέλτιστη λύση στο πρόβλημα, όπως έγινε στην περίπτωση της κατά ζεύγη στοίχισης. Στο κεφάλαιο αυτό θα μελετήσουμε τους κύριους αλγόριθμους πολλαπλής στοίχισης και τις αντίστοιχες υλοποιήσεις. Θα δούμε επίσης πώς αξιολογείται μια μέθοδος πολλαπλής στοίχισης, ποια εργαλεία υπάρχουν για την οπτικοποίηση και την επεξεργασία της, και τέλος, θα δούμε πρακτικές συμβουλές για μια καλή πολλαπλή στοίχιση

Στο κεφάλαιο αυτό θα μελετήσουμε τα πρότυπα αλληλουχιών και θα εξετάσουμε τη χρησιμότητά τους. Θα δούμε τον τρόπο ορισμού των προτύπων της PROSITE και τη σχέση τους με τα πρότυπα κανονικών εκφράσεων και θα συζητήσουμε τα πλεονεκτήματα και τα μειονεκτήματά τους. Κατόπιν, θα αξιολογήσουμε πώς κάποια από αυτά τα μειονεκτήματα αντιμετωπίζονται με τους πίνακες του σκορ ειδικούς ανά θέση (PSSMs) και τα προφίλ αλληλουχιών (profiles), τα οποία είναι πιο ευέλικτες στατιστικές περιγραφές των συντηρημένων περιοχών σε μια πολλαπλή στοίχιση. Τέλος, θα μιλήσουμε και για τα πιο γνωστά εργαλεία λογισμικού που χρησιμοποιούνται για την κατασκευή αλλά και για την αναγνώριση τέτοιων προτύπων και προφίλ σε αλληλουχίες.

Στο κεφάλαιο αυτό εξετάζονται οι υπολογιστικές όψεις της φυλογενετικής ανάλυσης, δηλαδή, της διαδικασίας εκτίμησης των εξελικτικών σχέσεων των οργανισμών, μέσα από τη μελέτη των αντίστοιχων βιολογικών αλληλουχιών τους. Θα δούμε στην αρχή τους βασικούς ορισμούς για τα φυλογενετικά δέντρα και τα βασικά πιθανοθεωρητικά μοντέλα της εξέλιξης αλληλουχιών. Κατόπιν, θα παρουσιάσουμε τις βασικές κατηγορίες μεθόδων κατασκευής φυλογενετικών δέντρων, και θα σχολιάσουμε τις ομοιότητες και τις διαφορές τους. Τέλος, θα παρουσιάσουμε τα αντίστοιχα πακέτα λογισμικού που υπάρχουν διαθέσιμα για το σκοπό αυτό, θα σχολιάσουμε τα σχετικά πλεονεκτήματα και μειονεκτήματα τους, και θα δώσουμε πρακτικές συμβουλές.

Στο κεφάλαιο αυτό, θα γίνει η απαραίτητη εισαγωγή στα μαρκοβιανά μοντέλα εξάρτησης και κατόπιν, παρουσίαση των κρυπτομαρκοβιανών μοντέλων (Hidden Markov Models) τα οποία αποτελούν ένα σημαντικό εργαλείο στη σύγχρονη βιοπληροφορική. Θα αναφερθούμε στα βασικά χαρακτηριστικά των μοντέλων αυτών και στη μαθηματική τους θεμελίωση, ενώ θα παρουσιαστούν σε βάθος οι διάφοροι αλγόριθμοι που χρησιμοποιούνται για τον υπολογισμό της πιθανοφάνειας, για την αποκωδικοποίηση και για την εκτίμηση παραμέτρων στα μοντέλα αυτά. Θα παρουσιαστούν επίσης, τα μοντέλα για σημασμένες αλληλουχίες, τα οποία αποτελούν μια επέκταση του βασικού ΗΜΜ, η οποία βρίσκει πολλές εφαρμογές στην ανάλυση βιολογικών αλληλουχιών (πρόγνωση διαμεμβρανικών πρωτεϊνών, εύρεση γονιδίων κ.ο.κ.). Τέλος, θα γίνει ειδική αναφορά στο profile HMM το οποίο είναι άλλη μια παραλλαγή του βασικού μοντέλου, η οποία βρίσκει εφαρμογές στη μοντελοποίηση πρωτεϊνικών οικογενειών, στην εύρεση μακρινών ομολόγων και στην πολλαπλή στοίχιση.



Στο κεφάλαιο αυτό θα ασχοληθούμε με τις μεθόδους πρόγνωσης δομής και λειτουργίας μακρομορίων, τόσο των πρωτεϊνών όσο και του DNA και RNA. Οι μέθοδοι αυτές είναι ιδιαίτερα σημαντικές καθώς έρχονται να καλύψουν το κενό που προκύπτει σε περιπτώσεις που μια νεοανακαλυφθείσα αλληλουχία δεν εμφανίζει σημαντική ομοιότητα με κάποια άλλη γνωστής δομής ή λειτουργίας. Θα παρουσιάσουμε τις βασικές αρχές με τις οποίες μπορεί να κατασκευαστεί μια προγνωστική μέθοδος, καθώς και τα πιο σημαντικά παραδείγματα τέτοιων μεθόδων τα οποία παρουσιάζουν μεγάλο θεωρητικό και πρακτικό ενδιαφέρον. Έτσι, θα δούμε την πρόγνωση της δευτεροταγούς δομής πρωτεϊνών, την πρόγνωση των διαμεμβρανικών τμημάτων, την πρόγνωση των σηματοδοτικών αλληλουχιών αλλά και παραδείγματα πρόγνωσης μετα-μεταφραστικών τροποποιήσεων. Στην περίπτωση του DNA θα δούμε τις μεθόδους εύρεσης γονιδίων, αλλά και άλλα σχετιζόμενα προβλήματα (εύρεση σημείων αποκοπής εξωνίων/εσωνίων, πρόγνωση πολυαδενυλίωσης κ.ο.κ.), ενώ για RNA θα εστιάσουμε στις μεθόδους πρόγνωσης των micro RNA και των στόχων τους.

Ημερολόγιο