מחקרים

למידת מכונה מאפשרת לשפר את הדיוק האבחנתי של איחויי גנים

מסווג שהוכשר על איחויי גנים הוביל לשיפור הדיוק בזיהוי של fusion transcript בדגימות ללא נתוני ריצוף כלל גנומי, וכך אפשר לזהות איחויים העשויים להיות רלוונטיים קלינית לטיפול ממוקד

04.02.2024, 17:59
עריכה גנטית. אילוסטרציה

במחקר שממצאיו פורסמו בכתב העת 'BMC Genomics' החוקרים בנו מסווג למידת מכונה לצורך ניבוי חיובי אמיתי של איחויי גנים אשר שיפר את יכולת הניבוי, מה שעשוי לקדם את איתורם של איחויי גנים רלוונטיים קלינית לטיפול ממוקד.

כרקע לכך, מציינים החוקרים כי Genomic rearrangements בתאים סרטניים יכולים ליצור גנים מאוחים (fusion genes) המקודדים חלבונים כימריים, או לשנות את הביטוי של RNA מקודדים ולא מקודדים. בסוגי סרטן מסוימים איחויים הכוללים קינאזות (kinases) ספציפיות משמשים כמטרות טיפוליות. ניתן לזהות גנים מאוחים על ידי ריצוף כלל גנומי (WGS: whole genome sequencing) ופאנלים ממוקדים לאיחוי, אך לריצוף RNAי(RNA-Seq) קיים יתרון מבחינת היכולת לזיהוי רחב של fusion transcripts מבוטאים.

במסגרת מחקרם הנוכחי, פיתחו החוקרים צינור עיבוד נתונים (pipeline) לתיקוף (ולידציה) של fusion transcripts אשר זוהו ב-RNA-Seq באמצעות נתוני WGS תואמים מ-The Cancer Genome Atlas י(TCGA), והחלו זאת על 910 גידולים מתוך 11 סוגי סרטן שונים.

מכאן, החוקרים הגיעו ל-4,237 איחויי גנים מתוקפים, כאשר ב-3,049 ניתן לזהות לכל הפחות genomic breakpoint אחת. תוך שימוש באיחויים מתוקפים כאירועים חיוביים אמיתיים, החוקרים אימנו מסווג למידת מכונה לצורך ניבוי fusion transcripts חיוביים וחיוביים כוזבים מתוך ה- RNA-Seq.

מנתוני החוקרים עולה כי ה-precision ו-recall metrics הסופיים של המסווג היו 0.74 ו-0.71, בהתאמה, במסד נתונים בלתי תלוי של 249 גידולי שד. יישום המסווג לכלל הדגימות עם נתוני RNA-Seq מסוגי הסרטן הללו הרחיב במידה ניכרת את מספר ה-fusion transcripts שקרוב לוודאי היו חיוביים אמיתיים, והוביל לזיהוי איחויי קינאז רבים בעלי פוטנציאל למיקוד. כמו כן, אנליזה נוספת של איחויי הגנים המתוקפים הדגימה כי רבים נוצרים באירועי intrachromosomal amplification עם microhomology-mediated non-homologous end-joining.

לסיכום, ממצאי החוקרים הדגימו כי מסווג שהוכשר על אירועי איחוי מתוקפים הגביר את הדיוק של זיהוי fusion transcript בדגימות ללא נתוני WGS. מכאן, לחוקרים הייתה אפשרות להרחיב את האנליזה לכלל הדגימות עם נתוני RNA-Seq, מה שקידם מחקרי ביולוגיה של הגידול והגדיל את מספר איחויי הקינאז שזוהו. החוקרים מציינים כי למידת מכונה יכולה לשמש לצורך איתורם של אירועי איחוי רלוונטיים קלינית לטיפול ממוקד. עוד מוסיפים החוקרים כי מערך הנתונים הגדול של איחויי גנים מתוקפים שנוצר במחקרם עשוי להיות משאב שימושי לפיתוח והערכה של אלגוריתמים לזיהוי fusion transcript.

מקור:

Hafstað, V., Häkkinen, J., Larsson, M. et al. Improved detection of clinically relevant fusion transcripts in cancer by machine learning classification. BMC Genomics 24, 783 (2023). https://doi.org/10.1186/s12864-023-09889-y

נושאים קשורים:  מחקרים,  למידת מכונה,  ריצוף גנומי מלא,  איחוי גנים
תגובות