Phả hệ di truyền pháp y: Mở rộng truy tìm dòng tộc và điều tra di truyền
Trong những năm gần đây, lĩnh vực khoa học pháp y đã chứng kiến một cuộc cách mạng thầm lặng nhưng đầy sức mạnh: sự ra đời và phát triển của phả hệ di truyền pháp y. Đây là phương pháp kết hợp công nghệ phân tích ADN với nghiên cứu phả hệ truyền thống, mở ra những hướng đi mới trong việc xác định danh tính những người chưa rõ lai lịch – từ nạn nhân trong các vụ án hình sự cho đến những bộ hài cốt cổ xưa.
Phả hệ di truyền pháp y là gì và tại sao nó quan trọng?
Phả hệ di truyền pháp y, còn được gọi là phả hệ di truyền điều tra, là sự kết hợp giữa công nghệ ADN dựa trên đa hình đơn nucleotide với các phương pháp nghiên cứu phả hệ truyền thống. Mục tiêu của nó là cung cấp manh mối quan trọng để xác định danh tính những cá nhân chưa rõ, có thể là nghi phạm trong các vụ án chưa giải quyết được hoặc nạn nhân trong các thảm họa.
Phương pháp này ra đời và phát triển nhờ sự tiến bộ của công nghệ giải trình tự ADN và các thuật toán tính toán. Đặc biệt, sự bùng nổ của các dịch vụ xét nghiệm gen trực tiếp đến người tiêu dùng như 23andMe, AncestryDNA hay MyHeritage đã tạo ra những cơ sở dữ liệu gen khổng lồ với khoảng 400 triệu hồ sơ ADN, chủ yếu phục vụ mục đích nghiên cứu phả hệ giải trí.
Trong khi các cơ sở dữ liệu ADN hình sự quốc gia sử dụng các marker STR để truy tìm tội phạm vẫn còn nhiều hạn chế, phả hệ di truyền pháp y mở ra cánh cửa mới bằng cách khai thác các cơ sở dữ liệu dân sự này. Khi phương pháp STR không mang lại kết quả khớp, các nhà điều tra có thể chuyển sang sử dụng công nghệ phả hệ di truyền pháp y để tiến hành vụ án.
Dấu mốc lịch sử: Vụ án “Kẻ sát nhân Golden State”
Năm 2018 đánh dấu một bước ngoặt quan trọng trong lịch sử phả hệ di truyền pháp y. Vụ án “Kẻ sát nhân Golden State” – một tội phạm khét tiếng gây ra hàng loạt vụ giết người và hiếp dâm ở California trong những năm 1970-1980 cuối cùng đã được giải quyết nhờ sự hợp tác giữa các nhà phả hệ di truyền và cơ quan thực thi pháp luật, sử dụng cơ sở dữ liệu GEDmatch.
Cũng trong năm đó, Tổ chức Xác định Danh tính ADN, một tổ chức phi lợi nhuận thành lập năm 2018, đã sử dụng phả hệ di truyền pháp y để xác định nạn nhân trong vụ án giết người “Buckskin Girl”. Kể từ đó, phương pháp này đã đạt được thành công đáng kể với hơn 500 vụ án được giải quyết, nâng cao nhận thức của công chúng về tiềm năng của công nghệ này.
Tuy nhiên, việc sử dụng cơ sở dữ liệu giải trí cho điều tra hình sự cũng đặt ra nhiều vấn đề về đạo đức và pháp lý. Nhiều quốc gia như Mỹ, Anh, Thụy Điển, Úc, Trung Quốc, Tây Ban Nha, Hà Lan và New Zealand đang nghiên cứu hoặc đã triển khai phương pháp này, mỗi nước đều đối mặt với những thách thức riêng trong việc tích hợp vào khuôn khổ pháp lý hiện hành.
Sự ra đời của cơ sở dữ liệu phả hệ di truyền pháp y
Lịch sử phả hệ di truyền bắt đầu từ năm 1903 với sự thành lập của Hiệp hội Phả hệ Quốc gia tại Washington. Tuy nhiên, phải đến cuối thế kỷ 20, khi công nghệ ADN phát triển, lĩnh vực này mới thực sự bùng nổ. Năm 1979, các nhà khoa học lần đầu tiên sử dụng ADN ty thể và nhiễm sắc thể Y để nghiên cứu mối quan hệ gia đình và dòng dõi. Đến năm 1998, nghiên cứu về dòng dõi của Tổng thống Thomas Jefferson đã thu hút sự chú ý rộng rãi của công chúng, đưa phả hệ di truyền vào tầm ngắm.
Bước ngoặt đến từ các dự án gen quy mô lớn như Dự án Bộ gen Người, hoàn thành năm 2003, và sự xuất hiện của các công ty xét nghiệm gen trực tiếp đến người tiêu dùng. Các công ty này đã tạo ra các cơ sở dữ liệu gen khổng lồ phục vụ nghiên cứu khoa học và nhu cầu của người dùng. 23andMe, thành lập năm 2006, đi tiên phong trong lĩnh vực này, cung cấp dịch vụ xét nghiệm ADN với giá cả phải chăng, giúp người tiêu dùng vừa khám phá nguồn gốc tổ tiên vừa đóng góp dữ liệu cho nghiên cứu y sinh.
Marker di truyền và công nghệ xác định kiểu gen trong phả hệ di truyền pháp y
Có sự khác biệt cơ bản giữa cơ sở dữ liệu tiêu dùng cho phả hệ di truyền và cơ sở dữ liệu thực thi pháp luật cho mục đích pháp y. Cả hai đều phân tích ADN từ nhiễm sắc thể thường và vật liệu di truyền liên kết giới tính, nhưng cơ sở dữ liệu tiêu dùng sử dụng hàng trăm nghìn marker SNP, trong khi cơ sở dữ liệu thực thi pháp luật hiện nay chỉ sử dụng vài chục marker STR có tính đa hình cao.
STR trên nhiễm sắc thể thường được sử dụng chủ yếu để xác định cá nhân do tính đa hình cao. Tuy nhiên, phân tích SNP có thể xác định quan hệ họ hàng xa, đặc biệt khi việc định type STR bị hạn chế. Tốc độ đột biến cao của STR chỉ cho phép các phương pháp dựa trên STR trên nhiễm sắc thể thường suy luận quan hệ họ hàng ở mức độ thứ nhất, trong khi tìm kiếm gia đình trong cơ sở dữ liệu STR trên nhiễm sắc thể Y quốc gia chỉ có thể mở rộng lên đến bốn thế hệ.
Các phương pháp xác định kiểu gen khác nhau phân biệt cơ sở dữ liệu sử dụng cho phả hệ di truyền tiêu dùng và mục đích pháp y. Phân tích ADN truyền thống dựa trên STR sử dụng điện di mao quản chỉ xem xét tính đa hình chiều dài của các đoạn được khuếch đại, bỏ qua các biến thể trình tự tiềm ẩn. Ngược lại, dữ liệu SNP mật độ cao cần thiết cho phả hệ di truyền pháp y được tạo ra thông qua công nghệ xác định kiểu gen thông lượng cao như microarray hoặc giải trình tự toàn bộ bộ gen.
Bốn công ty xét nghiệm trực tiếp đến người tiêu dùng lớn nhất tại Mỹ hiện nay là AncestryDNA, 23andMe, MyHeritage và FTDNA, dẫn đầu thị trường xét nghiệm ADN nhiễm sắc thể thường. Hầu hết đã chuyển từ Illumina OmniExpress sang Illumina Infinium Global Screening Array được thiết kế tùy chỉnh, và một số đã áp dụng giải trình tự toàn bộ bộ gen với độ phủ thấp hoặc cao.
Đối với mẫu đơn nguồn, xét nghiệm microarray rất hiệu quả cho xét nghiệm di truyền thương mại nhưng yêu cầu lượng ADN lớn hơn đáng kể – gấp khoảng 20-100 lần so với lượng một nanogram điển hình được sử dụng trong xét nghiệm ADN pháp y truyền thống. Yêu cầu ADN tăng cao này thường khiến microarray không phù hợp với mẫu pháp y, vốn có thể bị lỗi lai ghép do ADN bị phân hủy.
Giải trình tự thế hệ mới có giá trị trong việc phân tích vật liệu bị phân hủy và đã biến đổi lĩnh vực gen sinh học y sinh và sinh học kể từ khi công cụ thương mại đầu tiên ra đời năm 2005. Công nghệ này cung cấp khả năng phát hiện SNP mật độ cao hơn, với hơn 10 triệu SNP tiềm năng và cho phép định type marker đồng thời trên nhiều mẫu. Không giống công nghệ microarray, giải trình tự thế hệ mới cũng tối đa hóa việc khai thác thông tin trong khi giảm thiểu lượng ADN đầu vào.
Các kỹ thuật bắt giữ ADN đã làm giàu thành công các khuôn ADN ngắn hơn từ các mẫu bị hư hỏng nhiễm lượng lớn ADN ngoại lai. Công nghệ giải trình tự thế hệ mới, như bắt giữ lai ghép hoặc giải trình tự amplicon đích, đã tăng cường khả năng phát hiện vượt xa PCR truyền thống, tạo ra hàng nghìn SNP. Các phương pháp tiên tiến này, ban đầu được phát triển để giải trình tự ADN cổ và bị phân mảnh nặng, đã được các công ty như Astrae Forensics áp dụng để xây dựng hồ sơ ADN chi tiết cho phả hệ di truyền pháp y.
Các cơ sở dữ liệu phả hệ di truyền pháp y có thể truy cập
Bốn cơ sở dữ liệu chính được các cơ quan thực thi pháp luật sử dụng để so sánh hồ sơ ADN từ mẫu pháp y với hồ sơ do người dùng tải lên: GEDmatch, FTDNA, DNASolve và DNA Justice.
GEDmatch đóng vai trò then chốt trong việc triển khai phả hệ di truyền pháp y. Được thành lập năm 2010 như một dự án sở thích về phả hệ, GEDmatch ban đầu hoạt động như một cơ sở dữ liệu giải trí miễn phí. Các nhà sáng lập đã rất ngỡ ngàng và tự hào khi phát hiện GEDmatch được các cơ quan thực thi pháp luật sử dụng để truy tìm nghi phạm trong vụ án Golden State năm 2018.
Năm 2019, GEDmatch công bố hợp tác với Verogen, một công ty gen pháp y độc lập chuyên về giải pháp giải trình tự thế hệ mới cho phòng thí nghiệm pháp y. Sự hợp tác này tăng cường khả năng tìm kiếm và độ ổn định của trang web GEDmatch, cải thiện bảo vệ quyền riêng tư. Tháng 12 năm 2020, Verogen ra mắt GEDmatch PRO, một cổng chuyên dụng cho phả hệ di truyền pháp y, cung cấp công cụ điều tra cụ thể chỉ có thể truy cập bởi người được ủy quyền.
Nguyên tắc của phương pháp ước tính quan hệ họ hàng
Đồng dạng do chung tổ tiên là nền tảng của sự tương đồng di truyền giữa những người họ hàng. Các đoạn IBD được chia sẻ giữa các cá nhân thể hiện đặc tính alen hoàn toàn giống nhau và có độ dài cũng như số lượng khác nhau. Chiều dài đoạn được đo bằng đơn vị “cM”, với 1 cM đại diện cho 1% cơ hội tái tổ hợp di truyền tách hai marker.
Các phương pháp quan hệ họ hàng truyền thống dựa trên đoạn trong GEDmatch hoạt động trên nguyên tắc: tổng chiều dài đoạn IBD càng lớn thì mối quan hệ càng gần và mức độ quan hệ họ hàng càng lớn. Dự án Shared cM, một sáng kiến thu thập dữ liệu hợp tác, cung cấp các nhóm quan hệ có thể xảy ra và khả năng của chúng dựa trên tổng chiều dài cM khớp.
Erlich và cộng sự ước tính rằng chỉ cần 2% phủ sóng dân số mục tiêu trong cơ sở dữ liệu di truyền có thể cung cấp các khớp quan hệ họ hàng bậc ba gần như hoàn chỉnh cho hầu hết mọi cá nhân.
Xây dựng phả hệ và ứng dụng trong thực tiễn
Khi xác định được khớp, nghiên cứu phả hệ phải được tiến hành, bắt đầu bằng việc xác định các cụm khớp được chia sẻ và truy tìm tổ tiên chung gần nhất. Nghiên cứu ngược dòng hay nghiên cứu hậu duệ được thực hiện để thu hẹp vị trí của cá nhân mục tiêu trong cây phả hệ bằng cách sử dụng các phương pháp như nguồn gốc địa sinh học, thông tin nhân khẩu học và phân tích kiểu hình.
Trong thực hành phả hệ di truyền pháp y hiện nay, ADN nhiễm sắc thể Y và ty thể được sử dụng để thu hẹp phạm vi điều tra hoặc hỗ trợ phả hệ di truyền pháp y. Ví dụ, một cuộc điều tra vụ án chưa giải quyết thành công ở Trung Quốc đã sử dụng phả hệ di truyền pháp y: STR trên nhiễm sắc thể Y được sử dụng đầu tiên để xác định gia đình mở rộng, sau đó phân tích nhóm đơn bội SNP trên nhiễm sắc thể Y để suy luận nhóm dân tộc và khu vực địa lý; phả hệ di truyền pháp y sau đó được sử dụng để xây dựng phả hệ di truyền, và hồ sơ STR trên nhiễm sắc thể thường được sử dụng để xác nhận.
Xây dựng phả hệ là một nhiệm vụ tốn thời gian. Khả năng sử dụng phả hệ di truyền pháp y có thể được đánh giá dựa trên một số tham số, bao gồm độ gần của khớp hàng đầu, chất lượng khớp và thông tin thu được từ mỗi khớp. Một chiến lược có giá trị đã được phát triển để định lượng toán học nỗ lực cần thiết để xây dựng cây phả hệ.
Từ tìm kiếm gia đình đến phả hệ di truyền pháp y
Về phương pháp luận, phả hệ di truyền pháp y mở rộng phả hệ di truyền theo chiều dọc, trong khi ứng dụng của nó trong điều tra phản ánh sự mở rộng theo chiều ngang từ các phương pháp tìm kiếm trước đó, đặc biệt là tìm kiếm gia đình.
Các trường hợp xác định nghi phạm thành công sử dụng hồ sơ ADN từ người thân cận đã được báo cáo từ năm 2003. Người thân cận chia sẻ hồ sơ ADN rất giống nhau do chung tổ tiên. Các thuật toán chuyên biệt đã được phát triển để tìm kiếm các khớp tương tự nhưng không chính xác trên các marker STR độc đáo trong cơ sở dữ liệu ADN quốc gia. Chủ sở hữu mẫu ADN với khả năng cao trong cơ sở dữ liệu hình sự được ưu tiên trong điều tra.
Một phương pháp khác, “khớp một phần”, bổ sung cho tìm kiếm gia đình. Cả hai phương pháp đều dựa vào hồ sơ ADN của người thân cận của tội phạm trong cơ sở dữ liệu hình sự. Tuy nhiên, khớp một phần sử dụng các chức năng vốn có của cơ sở dữ liệu mà không cần phần mềm chuyên biệt.
Ứng dụng trong nghiên cứu ADN cổ và nhân chủng học
Phả hệ di truyền pháp y và phương pháp luận của nó không chỉ có giá trị trong điều tra tội phạm mà còn mở rộng sang nhân chủng học pháp y và nghiên cứu ADN cổ. Khả năng tái tạo mạng lưới quan hệ di truyền quy mô lớn và mối quan hệ sinh học từ hài cốt cổ xưa cho thấy ứng dụng rộng rãi của nó trong khảo cổ học và nhân chủng học hiện đại.
Nhiều nghiên cứu gần đây đã tái tạo phả hệ mở rộng từ các cá nhân thời kỳ đồ đá mới. Một phả hệ năm thế hệ gợi ý rằng dòng dõi nội, chôn cất theo chồng, nhận con nuôi và ngoại hôn nữ là những hiện tượng xã hội quan trọng. Hai phả hệ bảy thế hệ được tái tạo từ các cá nhân thời kỳ đồ đá mới ở Pháp cho thấy sự tồn tại của các dòng dõi nhiễm sắc thể Y cụ thể, chỉ ra rằng gia đình lớn và mối quan hệ xã hội phức tạp là trung tâm ở châu Âu thời kỳ đồ đá mới giữa.
Nghiên cứu đa ngành gần đây đã làm sáng tỏ mối quan hệ họ hàng phức tạp và thực hành xã hội của người Avar di cư đường dài lịch sử, tái tạo một phả hệ chín thế hệ mở rộng. Hệ thống quan hệ họ hàng nội nghiêm ngặt, bao gồm ngoại hôn nữ và cư trú theo chồng được suy luận từ các kết nối ADN IBD, xác nhận mối liên hệ lịch sử của các xã hội thảo nguyên Á-Âu.
Nghiên cứu quan hệ họ hàng và mối quan hệ sinh học cũng đã hỗ trợ tái tạo phân tầng xã hội trong các xã hội thời kỳ đồ đá mới. Nhìn chung, tái tạo phả hệ trong các quần thể cổ đã làm sâu sắc thêm đáng kể hiểu biết của chúng ta về tổ chức xã hội quá khứ và di cư đường dài của con người.
Các vấn đề đạo đức, pháp lý và xã hội
Việc triển khai phả hệ di truyền pháp y không còn mới mẻ ở Mỹ. Tuy nhiên, với nhu cầu ngày càng tăng về tiêu chuẩn hóa và sự cân nhắc từ nhiều quốc gia hơn, các vấn đề liên quan đến phả hệ di truyền pháp y phải được nhấn mạnh để tạo điều kiện thiết lập quy định và tiêu chuẩn.
Sự đồng ý có thông tin dựa trên ba yếu tố: thông tin, hiểu biết và tham gia tự nguyện. Trong vụ án Golden State, cơ quan thực thi pháp luật đã vượt qua yêu cầu đồng ý có thông tin bằng cách tải lên hồ sơ ADN dưới danh tính giả. Công chúng ủng hộ mạnh mẽ việc bắt giữ tội phạm bạo lực, tương tự như quan điểm về việc cơ quan thực thi pháp luật truy cập hồ sơ điện thoại và tài khoản mạng xã hội.
Mối quan tâm về sự đồng ý có thông tin cho người dùng cơ sở dữ liệu thương mại cũng ảnh hưởng đến doanh nghiệp. Hầu hết các công ty thương mại và cơ sở dữ liệu liên quan đến phả hệ di truyền pháp y đều cho phép cơ quan thực thi pháp luật truy cập hoặc tiết lộ thông tin người dùng theo yêu cầu pháp lý.
Một số cuộc khảo sát đã xem xét ý nghĩa xã hội của phả hệ di truyền pháp y. Đảm bảo niềm tin công chúng là điều cần thiết. Các bên liên quan trong hệ thống tư pháp hình sự và di truyền pháp y nhấn mạnh tầm quan trọng của ứng dụng ADN pháp y trong chống tội phạm và cải thiện công lý. Hầu hết các cuộc khảo sát đều báo cáo sự ủng hộ của công chúng đối với phả hệ di truyền pháp y.
Việc xây dựng luật và quy định nên cân bằng chức năng công cộng, xem xét cả lợi ích xã hội của việc giải quyết vụ án và lợi ích cá nhân trong việc tránh sự giám sát không cần thiết. Thông tin cá nhân và mối quan hệ gia đình của những người vô tội được truy cập trong quá trình phả hệ di truyền pháp y nên được bảo vệ.
Bộ Tư pháp Mỹ đã ban hành chính sách tìm kiếm phả hệ pháp y tạm thời vào năm 2019, quy định tiêu chuẩn vụ án, quy trình và thu thập hồ sơ phả hệ di truyền pháp y. Năm 2021, Maryland ban hành luật mới để điều chỉnh phả hệ di truyền pháp y. Gần đây, một Ủy ban Công nhận Phả hệ phi lợi nhuận và khung tiêu chuẩn và quy trình chứng nhận phả hệ di truyền pháp y đã được công bố.
Triển vọng và kết luận
Các sáng kiến giải trình tự gen tham vọng và gen tiêu dùng đã cung cấp nguồn lực gen chất lượng cao cho thực hành phả hệ di truyền pháp y. Sự sẵn có ngày càng tăng của dữ liệu SNP trên toàn bộ gen và dữ liệu gen từ ngân hàng sinh học quy mô lớn đã mở rộng đáng kể cơ sở dữ liệu tham chiếu quần thể. Tuy nhiên, cải tiến thống kê và tính toán cho ước tính IBD tập trung vào mẫu pháp y bị phân hủy cao vẫn tương đối trì trệ. Các quy trình phân tích thống nhất, diễn giải suy luận phả hệ di truyền pháp y chính xác và sử dụng cơ sở dữ liệu chất lượng cao là các bước quan trọng để thúc đẩy tìm kiếm gia đình xa.
Các dự án gen quần thể toàn cầu gần đây đã nâng cao đáng kể hiểu biết của chúng ta về tổ tiên và đa dạng gen người. Tuy nhiên, nguồn lực gen từ các quần thể không phải châu Âu vẫn còn ít được đại diện. Chi phí giải trình tự cao ở một số quốc gia nhấn mạnh sự cần thiết phải phát triển và xác nhận một bảng gen dựa trên microarray dành riêng cho từng quần thể, phù hợp với nền tảng di truyền, phổ tần số biến thể và mô hình mất cân bằng liên kết đặc thù của quần thể.
Do sự thiên lệch và bất bình đẳng trong nguồn lực gen người trên toàn cầu, nghiên cứu khoa học và nguồn lực gen tiêu dùng chủ yếu tập trung vào cá nhân gốc Âu. Việc triển khai phả hệ di truyền pháp y ở các khu vực thiếu dữ liệu gen quy mô lớn như Trung Quốc và các nước châu Phi là rất quan trọng để giải quyết các vụ án hình sự phức tạp. Các công ty xét nghiệm trực tiếp đến người tiêu dùng Trung Quốc gần đây đã tích lũy một lượng đáng kể nguồn lực gen. Tuy nhiên, chưa có cơ quan thực thi pháp luật chính thức nào ở Trung Quốc thiết lập cơ sở dữ liệu phả hệ di truyền pháp y hoặc ban hành quy định cụ thể.
Công việc tương lai sẽ tập trung vào phát triển bảng giải trình tự thế hệ mới dành riêng cho từng quần thể, cải tiến tính toán dựa trên CPU/GPU, ước tính đơn bội do AI điều khiển và tái tạo cơ sở dữ liệu tham chiếu dành riêng cho từng quần thể. Việc triển khai rộng rãi phả hệ di truyền pháp y trong khoa học pháp y sẽ đòi hỏi cam kết về học thuật và các nguyên tắc quản trị dữ liệu.
Phả hệ di truyền pháp y đang phát triển từ một thực hành non trẻ thành một lĩnh vực chuyên biệt và tinh vi hơn, định hình tương lai của điều tra pháp y. Với sự tiếp tục nghiên cứu và tiến bộ công nghệ, phương pháp này hứa hẹn sẽ nâng cao độ chính xác, hiệu quả và cân nhắc đạo đức, củng cố vai trò của nó trong khoa học pháp y.
Bài viết được tham khảo từ bài báo Forensic investigative genetic genealogy: expanding pedigree tracing and genetic inquiry in the genomic era
Để tìm hiểu chi tiết thêm về ứng dụng và tính năng của các sản phẩm phục vụ cho lĩnh vực pháp y, xác định danh tính, huyết thống, vui lòng liên hệ chúng tôi để được hỗ trợ tư vấn trực tiếp.