Το αν έχουμε προδιάθεση για ορισμένες ασθένειες εξαρτάται σε μεγάλο βαθμό από τις αμέτρητες παραλλαγές στο γονιδίωμά μας.

Ωστόσο, ιδίως στην περίπτωση γενετικών παραλλαγών που εμφανίζονται σπάνια στον πληθυσμό, η επιρροή τους στην έκφραση ορισμένων παθολογικών χαρακτηριστικών είναι μέχρι σήμερα δύσκολο να προσδιοριστεί.

Ερευνητές από το Γερμανικό Κέντρο Ερευνών για τον Καρκίνο (DKFZ), το Ευρωπαϊκό Εργαστήριο Μοριακής Βιολογίας (EMBL) και το Τεχνικό Πανεπιστήμιο του Μονάχου παρουσιάζουν τώρα έναν αλγόριθμο βασισμένο στη βαθιά μάθηση που μπορεί να προβλέψει και τις επιδράσεις σπάνιων γενετικών παραλλαγών.

Η μέθοδος επιτρέπει το ακριβέστερο φιλτράρισμα των ατόμων με υψηλό κίνδυνο εμφάνισης ασθενειών και διευκολύνει τον εντοπισμό γονιδίων που εμπλέκονται στην ανάπτυξη ασθενειών.

Η γενετική σύσταση κάθε ανθρώπου διαφέρει από εκείνη των συνανθρώπων του σε πολλά εκατομμύρια μεμονωμένα δομικά στοιχεία. Αυτές οι διαφορές στο γονιδίωμα είναι γνωστές ως παραλλαγές. Πολλές από αυτές τις παραλλαγές συνδέονται με συγκεκριμένα βιολογικά χαρακτηριστικά και ασθένειες. Τέτοιες συσχετίσεις προσδιορίζονται συνήθως με τις λεγόμενες μελέτες συσχέτισης σε όλο το γονιδίωμα.

Ωστόσο, η επιρροή των σπάνιων παραλλαγών, οι οποίες εμφανίζονται με συχνότητα μόνο 0,1% ή λιγότερο στον πληθυσμό, συχνά αγνοείται στατιστικά στις μελέτες συσχέτισης. "Ωστόσο, ειδικά οι σπάνιες παραλλαγές έχουν συχνά πολύ μεγαλύτερη επιρροή στην έκφραση ενός βιολογικού χαρακτηριστικού ή μιας ασθένειας", λέει ο Brian Clarke, ένας από τους πρώτους συγγραφείς της μελέτης.

"Μπορούν επομένως να βοηθήσουν στον εντοπισμό εκείνων των γονιδίων που παίζουν ρόλο στην ανάπτυξη μιας νόσου και που μπορούν στη συνέχεια να μας δείξουν την κατεύθυνση νέων θεραπευτικών προσεγγίσεων", προσθέτει η Eva Holtkamp, έτερη πρώτη συγγραφέας της μελέτης.

Προκειμένου να προβλέψουν καλύτερα τις επιπτώσεις των σπάνιων παραλλαγών, οι ομάδες με επικεφαλής τους Oliver Stegle και Brian Clarke στο DKFZ και το EMBL και τον Julien Gagneur στο Τεχνικό Πανεπιστήμιο του Μονάχου ανέπτυξανένα εργαλείο εκτίμησης κινδύνου που βασίζεται στη μηχανική μάθηση. Το "DeepRVAT" (rare variant association testing), όπως αποκαλούν οι ερευνητές τη μέθοδο, είναι το πρώτο που χρησιμοποιεί τεχνητή νοημοσύνη (AI) σε μελέτες γονιδιωματικής συσχέτισης για την αποκρυπτογράφηση σπάνιων γενετικών παραλλαγών.

Το μοντέλο εκπαιδεύτηκε αρχικά σε δεδομένα αλληλουχιών (αλληλουχίες εξώματος) 161.000 ατόμων από τη βρετανική βιοτράπεζα. Επιπλέον, οι ερευνητές εισήγαγαν πληροφορίες σχετικά με γενετικά επηρεασμένα βιολογικά χαρακτηριστικά των μεμονωμένων ατόμων, π.χ. τιμές αίματος, καθώς και σχετικά με τα γονίδια που εμπλέκονται στα χαρακτηριστικά. Οι αλληλουχίες που χρησιμοποιήθηκαν για την εκπαίδευση περιλάμβαναν περίπου 13 εκατομμύρια παραλλαγές. Για καθεμία από αυτές διατίθενται λεπτομερείς "επισημάνσεις", ποσοτικές πληροφορίες σχετικά με τις πιθανές επιπτώσεις που μπορεί να έχει η εκάστοτε παραλλαγή στις κυτταρικές διεργασίες ή στη δομή της πρωτεΐνης. Αυτές οι επισημειώσεις αποτέλεσαν επίσης κεντρικό στοιχείο της εκπαίδευσης.

Μετά την εκπαίδευση, το DeepRVAT είναι σε θέση να προβλέψει για μεμονωμένα άτομα ποια γονίδια επηρεάζονται στη λειτουργία τους από σπάνιες γενετικές παραλλαγές. Για να το κάνει αυτό, χρησιμοποιεί τις μεμονωμένες παραλλαγές και τις επισημάνσεις τους για να υπολογίσει μια αριθμητική τιμή που περιγράφει τον βαθμό στον οποίο ένα γονίδιο είναι εξασθενημένο και τον πιθανό αντίκτυπό του στην υγεία.

Οι ερευνητές επικύρωσαν επίσης το DeepRVAT χρησιμοποιώντας δεδομένα γονιδιώματος από την βρετανική βιοτράπεζα. Το σύστημα δοκιμής βρήκε 352 συσχετίσεις με τα εμπλεκόμενα γονίδια για 34 εξεταζόμενα χαρακτηριστικά, όπως οι σχετικές με την ασθένεια τιμές αίματος, ξεπερνώντας κατά πολύ όλα τα υπάρχοντα μοντέλα. Τα αποτελέσματα που προέκυψαν με το DeepRVAT αποδείχθηκαν επίσης πολύ ισχυρά και καλύτερα αναπαραγώγιμα σε ανεξάρτητα δεδομένα από τα αποτελέσματα εναλλακτικών προσεγγίσεων.

Μια άλλη σημαντική εφαρμογή του DeepRVAT είναι η αξιολόγηση της γενετικής προδιάθεσης για ορισμένες ασθένειες. Οι ερευνητές συνδύασαν το DeepRVAT με την πολυγενετική βαθμολόγηση κινδύνου με βάση τις πιο κοινές γενετικές παραλλαγές. Αυτό βελτίωσε σημαντικά την ακρίβεια των προβλέψεων, ιδίως για τις παραλλαγές υψηλού κινδύνου.

Επιπλέον, αποδείχθηκε ότι το DeepRVAT αναγνώρισε γενετικές συσχετίσεις για πολυάριθμες ασθένειες - συμπεριλαμβανομένων διαφόρων καρδιαγγειακών παθήσεων, καρκίνων, μεταβολικών και νευρολογικών ασθενειών - που δεν είχαν βρεθεί με τη χρήση υφιστάμενων δοκιμών.

Πηγές:
Γερμανικό Κέντρο Ερευνών για τον Καρκίνο

Ειδήσεις υγείας σήμερα
Ο αντίκτυπος της πανδημίας στους ογκολογικούς ασθενείς [μελέτη]
Γλωσσικό μοντέλο απαντά σε ιατρικές ερωτήσεις
Η σεμαγλουτίδη ωφελεί και στην στετατοηπατίτιδα που συνδέεται με μεταβολική δυσλειτουργία [μελέτη]