Giải trình tự thế hệ mới: 1 cuộc cách mạng công nghệ và những thách thức chính sách trong giám định pháp y
Công nghệ giải trình tự ADN đã trải qua một hành trình dài kể từ những ngày đầu của phương pháp Sanger. Ngày nay, giải trình tự thế hệ mới (NGS), còn được gọi là giải trình tự song song hóa khối lượng lớn (MPS), đang dần khẳng định vị thế là tương lai của phân tích ADN pháp y. Với khả năng phân tích đồng thời hàng triệu phân tử ADN và ARN với độ nhạy, tốc độ và khả năng mở rộng vượt trội, NGS mở ra những cánh cửa chưa từng có trong điều tra tội phạm và nhận dạng nạn nhân.
Một bài tổng quan toàn diện được công bố trên tạp chí WIREs Forensic Science đã cung cấp bức tranh chi tiết về công nghệ NGS, các ứng dụng pháp y và những cân nhắc chính sách quan trọng. Các tác giả, Tebah N. Browne và Mikaelah Freeman từ Innocence Project, đã phân tích sâu sắc cả tiềm năng lẫn những thách thức đạo đức, xã hội và pháp lý mà công nghệ này đặt ra.
Từ phương pháp Sanger đến cuộc cách mạng giải trình tự thế hệ mới
Phân tích ADN pháp y đã thay đổi đáng kể kể từ khi phương pháp “in dấu vân tay ADN” ra đời vào năm 1986. Ban đầu, các nhà khoa học sử dụng phương pháp Sanger (kỹ thuật giải trình tự thế hệ thứ nhất) để đọc trình tự ADN. Phương pháp này dựa trên việc kết thúc chuỗi đặc hiệu theo từng base và phân tách các đoạn ADN bằng điện di trên gel.
Bước ngoặt đến vào năm 2003, khi Dự án Bộ gen Người hoàn thành sứ mệnh giải mã toàn bộ hệ gen người. Dự án này không chỉ tạo ra bản đồ gen tham chiếu mà còn thúc đẩy sự phát triển của các công nghệ giải trình tự mới. Cuộc chạy đua giữa các nhóm nghiên cứu công và tư, đặc biệt là giữa Viện nghiên cứu gen người quốc gia Mỹ và công ty Celera Genomics của J. Craig Venter, đã tạo ra những đột phá về phương pháp luận và tốc độ giải trình tự.
Sau khi dự án kết thúc, giải trình tự toàn bộ hệ gen trở nên nhanh hơn, rẻ hơn và chính xác hơn. Các bộ gen người tham chiếu đã đóng góp vào tiến bộ này và là điều kiện tiên quyết cho mọi phân tích NGS thành công.
Các nền tảng giải trình tự thế hệ mới
NGS được chia thành hai thế hệ chính: thế hệ thứ hai và thế hệ thứ ba. Mỗi nền tảng có công nghệ và hóa chất giải trình tự riêng.
Thế hệ thứ hai – Giải trình tự đọc ngắn
Các nền tảng thế hệ thứ hai thực hiện giải trình tự đọc ngắn với các đoạn ADN khoảng 75-400 bp thông qua giải trình tự bằng lai ghép, giải trình tự bằng tổng hợp hoặc pyrosequencing. Tất cả các công nghệ thế hệ thứ hai đều yêu cầu khuếch đại trước khi giải trình tự để tăng cường tín hiệu.
Roche 454 Genome Sequencer FLX là hệ thống thế hệ thứ hai thành công về mặt thương mại đầu tiên, ra mắt năm 2005. Hệ thống này sử dụng phương pháp pyrosequencing thông lượng cao và có ưu điểm về tốc độ, cho ra các đoạn đọc dài tới 800 bp. Tuy nhiên, chi phí thuốc thử cao và khả năng đo chính xác các đoạn đồng trùng lặp kém là những hạn chế đáng kể.
Hệ thống SOLiD của Applied Biosystems, ra mắt năm 2007, được coi là một trong những nền tảng giải trình tự thế hệ thứ hai chính xác nhất với độ chính xác 99,94%. Tuy nhiên, tốc độ chậm và độ dài đọc ngắn là những điểm yếu của hệ thống này.
Illumina, nhà sản xuất hàng đầu các thiết bị giải trình tự, hiện là nền tảng NGS phổ biến nhất. Công nghệ của Illumina sử dụng khuếch đại cầu và giải trình tự bằng tổng hợp, cho phép giải trình tự cặp từ cả hai đầu của khuôn ADN. Với tỷ lệ lỗi trung bình chỉ 0,1% mỗi nucleotide, Illumina được đánh giá cao về độ chính xác. Tuy nhiên, thời gian chạy tương đối dài là một nhược điểm.
Ion Torrent ra mắt máy giải trình tự Personal Genome Machine năm 2010, dựa trên công nghệ giải trình tự bán dẫn. Ưu điểm của hệ thống này là thời gian chạy nhanh và độ dài đọc tốt, nhưng gặp khó khăn khi giải trình tự các vùng đồng trùng lặp.
GenapSys ra mắt năm 2019, là hệ thống giải trình tự nhỏ gọn và giá cả phải chăng. Công nghệ của GenapSys sử dụng PCR nhũ tương tự động và giải trình tự bằng tổng hợp với phát hiện dựa trên điện. Tuy nhiên, chưa có nhiều nghiên cứu đánh giá độc lập về khả năng thực sự của hệ thống này.
Công nghệ Complete Genomics, được BGI mua lại năm 2013, phát triển công nghệ giải trình tự DNA nanoball sử dụng hóa học lai ghép-nối. Hiện có bốn nền tảng dành cho mục đích nghiên cứu.
Thế hệ thứ ba – Giải trình tự đọc dài
Các nền tảng thế hệ thứ ba có khả năng giải trình tự nucleotide trực tiếp từ mẫu sinh học mà không cần khuếch đại PCR, cho phép đọc các đoạn dài hơn 10 kb. Công nghệ này thường được sử dụng cho các ứng dụng chẩn đoán lâm sàng.
Pacific Bioscience thiết lập công nghệ giải trình tự thời gian thực đơn phân tử đầu tiên. Phương pháp này theo dõi phản ứng giải trình tự trong thời gian thực trên chip tế bào SMRT. Thời gian chạy dưới một ngày và độ dài đọc trung bình khoảng 1300 bp, nhưng thông lượng thấp là điểm yếu.
Oxford Nanopore Technologies có thể tạo ra các đoạn đọc lớn hơn 1 Mb. Công nghệ này có ưu điểm về chuẩn bị mẫu tối thiểu và tạo ra các đoạn đọc dài và siêu dài. Độ chính xác đã được cải thiện đáng kể, hiện đạt trên 95%. Tuy nhiên, tỷ lệ lỗi cao và yêu cầu lượng vật liệu sinh học lớn là những thách thức.
Phân tích dữ liệu giải trình tự thế hệ mới
Dữ liệu NGS có khối lượng rất lớn, đòi hỏi các phương pháp tin sinh học và quản lý dữ liệu hợp lý. Quá trình phân tích dữ liệu được hoàn thành qua ba giai đoạn.
Phân tích sơ cấp được thực hiện sau khi giải trình tự, bao gồm xác định base và đánh giá chất lượng. Đầu vào là tệp nhị phân .bcl được tạo từ nền tảng giải trình tự. Đầu ra là tệp FASTQ chứa thông tin giải trình tự và điểm chất lượng Phred.
Phân tích thứ cấp bao gồm làm sạch dữ liệu đọc, căn chỉnh trình tự, xác định đột biến và phân tích biểu hiện gen. Căn chỉnh trình tự xảy ra khi các đoạn đọc thô được so sánh với bộ gen tham chiếu. Kết quả được lưu trữ trong tệp BAM hoặc SAM. Sau đó, dữ liệu được đánh giá để xác định đột biến thông qua các công cụ gọi biến thể.
Phân tích cấp ba là giai đoạn chủ quan nhất, phụ thuộc vào mục tiêu và giả thuyết của nhà nghiên cứu. Phân tích này thường bao gồm chú thích và diễn giải biến thể cũng như dự đoán tác động của đột biến.
Ứng dụng pháp y của giải trình tự thế hệ mới
NGS đang ngày càng phổ biến trong di truyền học pháp y nhờ chi phí thấp hơn trên mỗi nucleotide được giải trình tự, khả năng đọc đồng thời lượng lớn ADN và độ nhạy cao, đặc biệt phù hợp với các mẫu pháp y có lượng ADN thấp và bị phân hủy.
Phân tích STR
Phân tích STR là phương pháp phân tử được sử dụng thường xuyên nhất trong sinh học pháp y. Khác với điện di mao quản truyền thống chỉ xác định chiều dài, NGS tiết lộ trình tự thực tế của các biến thể STR, cho phép phân biệt cao hơn giữa các hồ sơ ADN tương tự. Tuy nhiên, việc áp dụng NGS-STR gặp nhiều thách thức thực tế về tài chính, đào tạo và phần mềm. Một khảo sát gần đây cho thấy 61% nhà khoa học pháp y không có nền tảng NGS trong phòng thí nghiệm và 53% trong số những người có NGS không tự tin về khả năng đào tạo nhân viên.
Giải trình tự ADN ty thể
ADN ty thể được sử dụng để xác định mối quan hệ gia đình theo dòng mẹ. NGS có khả năng giải trình tự toàn bộ bộ gen ty thể với độ nhạy cao hơn, phát hiện tốt hơn hiện tượng dị hợp tử ty thể. Phân tích chi tiết toàn bộ gen ty thể có thể tăng đáng kể khả năng phân biệt của dữ liệu thu được.
Phân tích microRNA
MicroRNA là lớp ARN không mã hóa tham gia điều hòa nhiều cơ chế sinh hóa. Sự hiện diện của miRNA trong các dịch cơ thể khiến chúng trở nên quan trọng trong phân tích pháp y để xác định loại dịch cơ thể tại hiện trường. NGS cho phép phân tích nhanh hàng triệu trình tự miRNA để xác định biểu hiện đặc hiệu cơ quan và giai đoạn phát triển.
Vi sinh vật pháp y
Vi sinh vật pháp y sử dụng dấu vết vi sinh vật để xác định môi trường mà một cá nhân đã ở trong quá trình xảy ra tội phạm. Ứng dụng bao gồm xác định nguyên nhân và cách thức tử vong, ước tính thời gian sau khi chết và phát hiện địa điểm xảy ra tội phạm. NGS đang mở ra những hướng mới trong phân tích vi sinh vật pháp y.
Di truyền ngoại gen pháp y
Di truyền ngoại gen nghiên cứu những thay đổi trong biểu hiện gen do các yếu tố bên ngoài. Ứng dụng pháp y bao gồm phân tích mẫu dịch cơ thể, phân biệt sinh đôi cùng trứng và ước tính tuổi. Hầu hết các phân tích trong biểu sinh học pháp y sử dụng NGS, đặc biệt là pyrosequencing.
Xác định kiểu hình ADN pháp y
Xác định kiểu hình ADN pháp y là phân tích các vùng gen cụ thể để dự đoán đặc điểm hình thái bên ngoài của một cá nhân như màu tóc, màu mắt và sắc tố da. Phương pháp này cũng có thể suy luận nguồn gốc địa sinh học, tuổi tác và các đặc điểm khác.
Các công cụ phổ biến nhất bao gồm HIRisPlex-S và ForenSeq DNA Signature Prep Kit. HIRisPlex-S có độ chính xác cao trong dự đoán màu mắt xanh (0,94 AUC) và nâu (0,95 AUC), màu tóc đỏ (0,92 AUC) và màu da tối (0,958 AUC).
Tuy nhiên, bản chất xác suất và tiềm năng tạo ra dữ liệu nhạy cảm của FDP dẫn đến nhiều lo ngại về đạo đức, xã hội và pháp lý. Các đặc điểm như màu mắt và tóc có thể dễ dàng thay đổi, và FDP không thể tạo ra dữ liệu duy nhất cho một cá nhân mà chỉ tạo ra một nhóm nghi phạm tiềm năng. Thiên lệch cơ sở dữ liệu và thuật toán có thể khiến một số quần thể bị đại diện quá mức trong khi các quần thể khác bị đại diện thiếu, vì hầu hết dữ liệu thống kê đều đến từ các quần thể gốc Âu.
Phả hệ di truyền pháp y
Phả hệ di truyền pháp y sử dụng cơ sở dữ liệu ADN phả hệ để xác định người thân gần hoặc xa của nguồn mẫu ADN bằng cách tái tạo dòng dõi tổ tiên và cây gia đình. Phương pháp này dựa vào dữ liệu SNP mật độ cao từ cơ sở dữ liệu của các công ty thương mại như 23andMe hay Ancestry.
Có hai cách tiếp cận để suy luận quan hệ họ hàng. Cách tiếp cận khám phá dựa trên việc đếm số lượng alen được chia sẻ, với hai phương pháp: phương pháp KING và phương pháp phân đoạn. Cách tiếp cận khả năng tính toán xác suất có điều kiện của việc quan sát dữ liệu marker di truyền dựa trên giả thuyết về mối quan hệ.
Có nhiều lo ngại về quyền riêng tư, đạo đức và pháp lý xung quanh việc sử dụng FGG. Việc điều hướng sự đồng ý có thông tin và bảo vệ quyền riêng tư cho những người không trực tiếp liên quan đến vụ án là một thách thức lớn. Người thân của người tiêu dùng không đồng ý và thậm chí không biết về việc họ đã được đưa vào cơ sở dữ liệu một cách gián tiếp.
Cân nhắc chính sách nhằm cân bằng giữa tiến bộ công nghệ và bảo vệ quyền công dân
Các phương pháp pháp y sử dụng dữ liệu NGS nhận được nhiều ý kiến trái chiều từ công chúng. Một cuộc khảo sát của Trung tâm Nghiên cứu Pew cho thấy chỉ 48% người được hỏi cho rằng các công ty ADN nên chia sẻ dữ liệu di truyền với cơ quan thực thi pháp luật.
Bảo vệ, quản lý và báo cáo dữ liệu
NGS tạo ra lượng dữ liệu khổng lồ không chỉ có giá trị lâm sàng và pháp y mà còn có ý nghĩa đạo đức, pháp lý và xã hội. Cần có quy trình đáng tin cậy để đảm bảo dữ liệu không thể bị truy cập bởi người không được ủy quyền, dữ liệu được sử dụng hợp pháp và công bằng, thiết lập mức độ minh bạch và các cá nhân hoặc tổ chức phải chịu trách nhiệm khi niềm tin bị phá vỡ.
Giảm thiểu thiên lệch thuật toán
Phân tích và diễn giải dữ liệu NGS phụ thuộc vào thuật toán và học máy. Thiên lệch có thể bắt nguồn từ dữ liệu huấn luyện không đại diện hoặc không đầy đủ. Nghiên cứu gen nói chung tập trung phần lớn vào các quần thể gốc Âu, khiến các quần thể khác không được đại diện hoặc đại diện không đầy đủ. Nếu không được tính đến đúng cách, các kỹ thuật NGS không thể được sử dụng đáng tin cậy cho một số quần thể nhất định.
Giới hạn ứng dụng
Khả năng của NGS không nên được đánh đồng với tính thực tiễn. Các ứng dụng pháp y nên được giới hạn ở các hành vi bạo lực nghiêm trọng. Một cuộc khảo sát quốc tế cho thấy sự ủng hộ của công chúng đối với việc cảnh sát truy cập cơ sở dữ liệu ADN tư nhân là 83,5% cho tội phạm tình dục, 83,2% cho giết người, nhưng chỉ 58,9% cho tội phạm liên quan đến ma túy.
Đồng ý có thông tin và lưu giữ dữ liệu
Khi yêu cầu mẫu ADN từ bên thứ ba, cần có sự đồng ý có thông tin hợp lệ. Cơ quan thực thi pháp luật phải đảm bảo rằng các cá nhân hiểu rõ mục tiêu của yêu cầu và các rủi ro tiềm ẩn. Tất cả các mẫu của bên thứ ba không nên được lưu giữ quá thời gian điều tra và tố tụng hình sự. Các mẫu không cung cấp thông tin hoặc cá nhân đã bị loại trừ cần được hủy ngay lập tức.
Tiêu chuẩn hóa
Hiện nay, thiếu tiêu chuẩn hóa cho các công nghệ NGS. Cần phát triển các tiêu chuẩn và hướng dẫn cho việc xác nhận xét nghiệm NGS; phân tích, diễn giải và báo cáo dữ liệu; và đào tạo nhân viên phòng thí nghiệm.
Minh bạch và trách nhiệm giải trình
Minh bạch thúc đẩy trách nhiệm giải trình. Các phòng thí nghiệm và cơ quan sử dụng công nghệ NGS nên công khai danh sách các kỹ thuật, tiết lộ hạn chế của phương pháp, công bố quy trình vận hành chuẩn, tóm tắt xác nhận phương pháp và thống kê, tài liệu đào tạo và chính sách phòng thí nghiệm. Minh bạch và trách nhiệm giải trình tăng cường niềm tin và sự tin cậy của công chúng.
Nhóm nghiên cứu đạo đức, pháp lý và xã hội
Năm 1990, Viện nghiên cứu gen người quốc gia Mỹ thành lập Chương trình Nghiên cứu Đạo đức, Pháp lý và Xã hội như một thành phần của Dự án Bộ gen Người. Ở Anh và xứ Wales, Nhóm Đạo đức Sinh trắc học và Pháp y chịu trách nhiệm xem xét các vấn đề đạo đức liên quan đến công nghệ NGS trước khi đưa vào xét nghiệm. Cần thiết lập một nhóm tương tự để tài trợ nghiên cứu ELSI hoặc xem xét chúng khi phê duyệt sử dụng các phương pháp dựa trên NGS mới.
Kết luận và triển vọng
Giá giải trình tự bộ gen người đã giảm đáng kể nhờ tiến bộ trong NGS. Trong khoa học pháp y, NGS đã cho phép sử dụng các marker di truyền mới có thể được phân tích đồng thời và khả năng tạo ra thông tin mà trước đây không thể xác định được. Tuy nhiên, tính hữu dụng của NGS vẫn chưa được chứng minh cho xét nghiệm thường quy trong sinh học pháp y. Cần nhiều nghiên cứu để đánh giá đầy đủ lợi ích và rủi ro, thiết lập các chính sách điều chỉnh việc sử dụng.
Trước khi NGS có thể được sử dụng cho điều tra hình sự, các tác động đạo đức, xã hội và pháp lý phải được nghiên cứu và giải quyết. Các biện pháp bảo vệ phải được thiết lập để bảo vệ dữ liệu, giảm thiểu thiên lệch liên quan, ngăn chặn lạm dụng dữ liệu và bảo vệ quyền tự chủ của bên thứ ba.
Các nước châu Âu đang đi đầu trong việc sử dụng công nghệ NGS trong phòng thí nghiệm pháp y. Một khảo sát gần đây từ 32 quốc gia châu Âu cho thấy 46% phòng thí nghiệm đã sở hữu nền tảng NGS và 32,4% đã sử dụng NGS cho phân tích STR. Tuy nhiên, 36% trong số các phòng thí nghiệm đã triển khai NGS không được đào tạo trước về sử dụng nền tảng và phân tích dữ liệu NGS.
Việc sử dụng ngày càng rộng rãi phân tích pháp y dựa trên NGS cùng với đào tạo và giáo dục hạn chế đặt ra nhiều vấn đề đạo đức và pháp lý. Những vấn đề này cho thấy rằng mặc dù có tiềm năng khoa học, các tác động đạo đức và pháp lý liên quan đến việc triển khai NGS trong xét nghiệm pháp y phải được giảm thiểu đáng kể trước khi các công nghệ này có thể được sử dụng rộng rãi.
Giải trình tự thế hệ mới là một công cụ mạnh mẽ, nhưng sức mạnh đó đi kèm với trách nhiệm lớn. Khi công nghệ tiếp tục phát triển với tốc độ chóng mặt, việc xây dựng một khuôn khổ pháp lý và đạo đức vững chắc không chỉ là mong muốn mà là điều kiện tiên quyết để đảm bảo rằng cuộc cách mạng này phục vụ công lý mà không xâm phạm các quyền cơ bản của con người.
Để tìm hiểu chi tiết thêm về ứng dụng và tính năng của các sản phẩm phục vụ cho lĩnh vực pháp y, xác định danh tính, huyết thống, vui lòng liên hệ chúng tôi để được hỗ trợ tư vấn trực tiếp.