מאגר DNAהוביל את המשטרה לחשוד ברוצח גולדן סטייטבאמצעות נתונים שהעלו בני דודיו הרחוקים. כעת, חוקרי גנטיקה של אוכלוסיות חישבו את ההסתברות לכךשֶׁלְךָקרובי משפחה מסרו את המידע הגנטי שלהם למסד נתונים דומה.
לפי החישובים שלהם, רוב הסיכויים שלרובנו יהיו קומץ של בני דודים שלישיים במסד נתונים של מיליון איש, כמאה אם המאגר מכיל 5 מיליון אנשים, ויותר מ-200 במסד נתונים של 10 מיליון איש. בכל אחד מהגדלים האלה, הסיכוי הוא קרוב ל-100 אחוז שמאגר הנתונים יכיל לפחות אדם אחד שהוא בן דודך הרביעי או מעבר לכך.
GEDmatch, מסד הנתונים שרשויות אכיפת החוק השתמשו בו בתיק גולדן סטייט קילר, מחזיק כיום בסביבות 650,000 רשומות. ל-AncestryDNA יש כ-5 מיליון, ול-23andMe יש כ-2 מיליון. (המספרים האלהנאספו על ידי הגנאלוגית לאה לרקין בשנה שעברה.)
מאגרי המידע הגדולים יותר אינם משמשים כיום את רשויות אכיפת החוק לחיפושי DNA, מכיוון שהם לא מקבלים קבצי נתונים, אלא רק דגימות יורקות. אבל העניין בגנאלוגיה רק הולך וגדל עם הזמן, אז כדאי לשים עין על המספרים האלה.
אם מחברים את החישובים האלה, זה די הגיוני לצפות שלרובנו יש בני דודים רחוקים ב-GEDmatch, וכנראה כמה בני דודים קרובים יותר ב-AncestryDNA ו-23andMe.
יש מגבלות חשובות למספרים האלה. הם מניחים שהאוכלוסיה במאגרי המידע הללו היא מדגם אקראי של האוכלוסייה בכללותה, וזה כנראה לא. (הייתי מתערב בכסף שהוא מטה לבן, עשיר, ומורמונים.) הם גם מניחים שאין הכלאה ושאנשים בוחרים את בני הזוג שלהם באופן אקראי לחלוטין. ולבסוף, הם ממוצעים; יכול להיות שבמקרה אין לך קרובי משפחה שמתעניינים בגנאלוגיה, או מהצד השני שאמא ואחותך עובדות על אילן יוחסין ושכנעו את כל קרוביך להשתתף.
אבל השורה התחתונה, אומרים מדענים אלה, היא שאותם אכיפת החוק שמצא את ה-DNA של משפחתו של חשוד במאגר מידע ציבורי כנראה לא היה ממצא בר מזל כלל, אלא ממצא צפוי לחלוטין.
איזה מזל הייתה החקירה הגנטית בתיק גולדן סטייט קילר?| מעבדת הלול