Next Generation Sequencing (NGS) - Phương pháp giải trình tự thế hệ mới và ứng dụng trong phát hiện đột biến.

ĐỀ TÀI:
Next Generation Sequencing – NGS và ứng dụng trong phát hiện đột biến

BÁO CÁO TIỂU LUẬN
MÔN: SINH HỌC PHÂN TỬ TRONG LĨNH VỰC SỨC KHỎE

Từ lịch sử của phương pháp giải trình tự Sanger và dự án giải mã bộ gen người đến sự kế thừa và phát triển của NGS đã trải qua nhiều giai đoạn. Từ đó cũng có nhìu kỹ thuật và ứng dụng ra đời
RNA-seq và ChIP-Seq ứng dụng vào nghiên cứu bệnh truyền nhiễm
kỹ thuật phân tích nhiễm sắc thể mới toàn diện hơn, đó là CGH (phép lai tạo gen có so sánh – comparative genomic hybridization) – chọn phôi trước khi chuyển
NSG đã mở ra 1 hướng để con người hiểu rõ hơn về bản thân cũng như chuẩn đoán phát hiện các biến đổi về gen mà gây bệnh từ đó có phương pháp điều trị sớm nhất. Nó là công cụ đắc lực và tiềm năng phục vụ cho các nghiên cứu về sinh học phân tử hiện nay và trong tương lai.






Slide 2 -21
A/ Lịch sử quá trình giải trình tự DNA:
1/ Lịch sử quá trình giải trình tự DNA:
1953: Watson & Crick lần đầu tiên công bố cấu trúc xoắn kép của ADN. Phát hiện đột phá này đã mở ra những bí mật của sự sống.
1977: Giải Nobel được trao cho Paul Berg về công trình nghiên cứu ADN tái tổ hợp và Walter Gilbert & Fred Sanger về giải trình tự ADN.

1990: Bắt đầu triển khai Dự án Giải trình tự gen người.
1995: Các nhà khoa học Stanford báo cáo về lần đầu tiên sử dụng kỹ thuật ADN microarray.
2003: Hoàn thiện Dự án Giải trình tự gen người sau 13 năm thực hiện. Hệ gen người gồm 13 tập, mỗi tập dày tương đương 1000 trang sách.
2/ Phương pháp Gilbert:
Năm 1977, Maxam và Gilbert lần đầu tiên phát minh phương pháp giải trình tự DNA theo phương pháp hóa học. Nguyên lý của phương pháp dựa trên sự biến tính DNA thành các mạch đơn và xử lý bằng các hóa chất hóa học nhằm phân hủy đặc trưng một loại nucleotide của mạch DNA đã đánh dấu bằng đồng vị phóng xạ, tạo các đoạn oligonucleotide có chiều dài hơn kém nhau một nucleotide. Sau đó, các đoạn này được phát hiện bằng cách điện di trên gel polyacrylamide, đọc kết quả điện di bằng máy đọc phóng xạ.
Các bước thực hiện:
Bước 1:
- Đánh dấu phóng xạ P32 ở đầu 5’ của mạch khuôn.
- Biến tính bằng nhiệt độ.
- Điện di tách lấy một mạch DNA làm mạch khuôn, dùng mạch khuôn này cho các xử lý tiếp theo.

Bước 2: Thực hiện các phản ứng hóa học đặc hiệu:
Có thể sử dụng 4 ống nghiệm để thực hiện các phản ứng hóa học đặc hiệu khác nhau, tạo các đoạn DNA cắt dài ngắn khác nhau.
Ống 1 Hóa chất xử lý Vị trí cắt
1 Dimethyl sunrfat pH 8 G
2 Piperidine formate pH2 A và G
3 Hydrazine C và T
4 Hydrazine + Nacl 1,5M C

Bước 3: Lấy sản phẩm xử lý trong mỗi ống nghiệm đem chạy điện di, hiện hình phóng xạ và xác định kết quả.
Ví dụ: Xử lý Dimethylsunfat ở ống phản ứng 1, phản ứng cắt tại G:


Bước 4:  Tập hợp kết quả thu được ở tất cả các ống nghiệm, thu được các đoạn polynucleotid dài ngắn hơn kém nhau 1 nucleotid, từ đó xác định được trình tự của DNA mạch khuôn:


3/ Phương pháp dideoxy (khử hai gốc oxy) hoặc giải trình tự Sanger:
Phương pháp Dideoxy hay còn gọi là phương pháp gián đoạn chuỗi (chain-determination method) là một phương pháp xác định trình tự DNA được Frederick Sanger phát triển vào năm 1975.
Nguyên tắc cơ bản của phương pháp Dideoxy dựa vào hoạt động của enzyme DNA polymerase trong quá trình tổng hợp DNA. Enzyme DNA polymerase xúc tác gắn các nucleotide vào mạch đơn DNA đang tổng hợp ở vị trí 3'có chứa nhóm -OH tự do, khi gặp nucleotide không có nhóm 3'-OH thì phản ứng tổng hợp bị dừng lại. Đặc trưng của phương pháp là sử dụng dideoxynucleotide để làm ngừng phản ứng tổng hợp DNA một cách ngẫu nhiên. Trong phản ứng sử dụng đoạn DNA mồi là đoạn DNA mạch đơn có kích thước 20 nucleotide.

Phương pháp được chia làm 4 phản ứng thực hiện riêng rẽ có DNA khuôn, DNA mồi, đầy đủ các loại dNTP (deoxynucleotide), enzyme Taq polymerase, dung dịch đệm và các điều kiện phản ứng thích hợp đồng thời có bổ sung thêm khoảng 1% một loại ddNTP (dideoxynucleotide) cho mỗi phản ứng khác nhau. Các dideoxynucleotide bị mất 2 nguyên tử oxy ở carbon thứ 3 và carbon thứ 4. Do đó khi mạch DNA đang tổng hợp bị gắn 1 ddNTP thì không có nhóm 3'-OH ở nucleotide cuối cùng nên mạch đang tổng hợp không được kéo dài tiếp tục phản ứng tổng hợp sẽ dừng lại.

Chính do lượng ddNTP được đưa vào với một lượng nhỏ so với lượng dNTP nên thỉnh thoảng mới có một ddNTP được sử dụng ngẫu nhiên làm phản ứng tổng hợp DNA dừng lại. Kết quả sẽ tổng hợp được các đoạn nucleotide có kích thước dài ngắn khác nhau. Để xác định trình tự, người ta điện di kết quả thu được trên gel polyacrylamid. Các đoạn oligonucleotide có kích thước khác nhau sẽ di chuyển với tốc độ khác nhau trên bản gel. Lúc này thực hiện phản ứng hiện hình phóng xạ có thể quan sát được các đoạn mạch đơn DNA bằng các vạch trên bản gel. Tổng hợp kết quả sẽ thu được trình tự sắp xếp các nucleotide của đoạn gen.


Phương pháp dideoxy (khử hai gốc oxy) hoặc giải trình tự Sanger, được công bố vào năm 1977 và là một trong những kỹ thuật đầu tiên được áp dụng phổ biến trong giải trình tự DNA. Trong suốt một thập kỷ, kỹ thuật này được thực hiện thủ công trong các phòng thí nghiệm trên toàn thế giới và là phương pháp chính để lập trình tự từng gen và bộ gen nhỏ của virus. Tuy nhiên, mọi thứ đã thay đổi. Giải trình tự DNA đã trở thành đỉnh cao trong công cuộc cách mạng về công nghệ, thúc đẩy tạo ra phương pháp nhanh, rẻ, chính xác hơn, biến genomic thành công cụ hữu ích trong thời đại dữ liệu khoa học như ngày nay.
Leroy Hood, người đồng sáng lập Applied Biosystems Inc. (ABI) vào năm 1981 – đã phát triển một số thiết bị góp phần thúc đẩy cuộc cách mạng trên, cho biết: “Rõ ràng là giải trình tự DNA tự động đã sẵn sàng trở thành chìa khóa cho nền sinh học tương lai. Sinh học phân tử đang dần tiên phong, và rõ ràng là để nắm bắt thông tin sinh học trong cơ thể sống… Giải trình tự đang ngày càng quan trọng”.
B/ Kỹ thuật giải trình tự thế hệ mới (NGS)
1/ Các hạn chế của kỹ thuật giải trình tự bằng phương pháp Sanger:
- Cần có gel để phân tách các đoạn trình tự đã nhuộm huỳnh quang.
- Số lượng mẫu giải trình tự đồng thời thấp.
- Phương pháp chuẩn bị mẫu khó tự động hóa.
- Để có lượng DNA lớn, các đoạn DNA cần được nhân dòng trong vi khuẩn.
- Giá thành cao.
- Sai sót cao, không đủ khả năng phát hiện đột biến với tần số thấp.
- Khó giải trình tự bộ gene mới (de novo sequencing)
2/ Ưu điểm của các kỹ thuật giải trình tự thế hệ mới:
- Tăng khả năng xác định trình tự lên công suất cao (high throughtput)
- Thời gian ngắn
- Chi phí thấp
- Quy trình đơn giản, tự động cao.
3/ 3 phương pháp NGS dẫn đầu hiện nay:
- Roche/454 FLX Pyrosequencer
- Illumina/Solexa Genome Analyzer
- Applied Biosystems SOLiD
4/ Một số tên gọi các phương pháp giải trình tự thế hệ mới:
- Next generation sequencing (NGS)
- High-throughput sequencing (HTS or HT-Seq)
- Massively parallel sequencing (MPS)
- Deep sequencing



Slide 22.
Giải trình tự thế hệ mới là một bước tiến nhảy vọt về công nghệ vì nếu ở phương pháp giải trình tự Sanger chỉ cho phép giải trình tự không quá 1500bps, thì giải trình tự thế hệ mới cho phép giải được từ 8Gbases đến 600Gbases, có nghĩa cho phép giải trình tự cả một bộ gen. Về nguyên tắc giải trình tự thế hệ mới gồm 3 bước chính:
Bước 1: Chuẩn bị thư viện DNA
Bước 2: Khuếch đại.
Bước 3: Giải trình tự
Slide 23.
Ở bước 1: Chuẩn bị thư viện DNA

- DNA mục tiêu/bộ gen được cắt thành những đoạn fragment ngắn.
- Sau đó các đoạn fragment sẽ được gắn 2 đầu bởi adapter 1 và adapter 2 (adapter 1có trình tự nhận biết bởi các đoạn dò được gắn trên giá bám, còn adapter 2 được nhận biết bởi trình tự mồi khuếch đại)
- Sau khi gắn 2 đầu bằng adapter, các đoạn fragment này được gắn vào giá bám nhờ việc bắt cặp đặc hiệu giữa adapter 1 và đoạn dò.
Giá bám có thể là vi bản (phương pháp giải trình tự illumina) hoặc là vi hạt (phương pháp giải trình tự ion torrent, pyrosequencing, solid system).
Ghi chú: Phải pha loãng các mảnh  DNA đã gắn adapter ở nồng độ thích hợp để nếu giá bám là các vi hạt thì chỉ có 1 mảnh DNA được gắn lên giá bám; hoặc nếu giá bám là vi bản thì khoảng cách các mảnh DNA được gắn lên phải cách xa nhau.
Slide 24.
Sau khi các đoạn DNA được gắn trên giá bám, đến bước khuếch đại:

- Dùng mồi đặc hiệu với adapter 2 để khuếch đại các mảnh DNA thành từng clone. Sao cho ở mỗi vi hạt chỉ có 1 clone DNA được khuếch đại, hay trên vi bản tạo thành từng cụm clone (hay còn gọi cluster) cách xa nhau.
Ở vi hạt người ta dùng dung dịch PCR ở dạng nhũ hóa (giọt nhũ), mỗi giọt nhũ chỉ chứa 1 vi hạt, nhờ vậy mà khi thực hiện PCR mỗi vi hạt sẽ chỉ có 1 clone sản phẩm khuếch đại trên nó.
Slide 25.
Sau khi được khuếch đại, tiến hành giải trình tự:

Các phương pháp có thể tiến hành: Pyrosequencing 454, Ion Torrent, Illumina, SOLID system…
Tùy theo từng phương pháp mà nguyên tắc/cơ chế giải trình tự khác nhau.
Bài báo cáo sẽ chỉ đề cập một số phương pháp: Pyrosequencing 454, Ion Torent và Illumina.
Slide 26.
Một số dòng máy giải trình tự phổ biến trên thị trường:

- Pyrosequencing 454/ Roche
- Ion Torrent/Life Technologies: Máy Ion PGM System và máy Ion Proton System.
- Solid system/Applied Biosystems
- Illumina cho ra đời một số máy giải trình tự NGS sử dụng công nghệ giải trình tự Illumina bao gồm máy HiSeq, Genome Analyzer IIx, MiSeq và HiScanSQ…
Slide 27 +28.
Giải trình tự Pyrosequencing 454
Phương pháp Pyrosequencing 454 được sáng tạo đầu tiên bởi Pål Nyrén và Mostafa Ronaghi của Viện Kỹ thuật Stockholm, Thụy Điển năm 1996. Phương pháp này được phát triển bởi công ty 454 Life Science, là một hệ thống giải trình tự DNA hai bước có độ tương đồng cao với dung lượng lớn hơn rất nhiều so với hệ thống giải trình tự Sanger. Phương pháp này dựa trên nguyên lý “giải trình tự bằng tổng hợp” bao gồm khởi động một sợi DNA được giải trình tự, và giải trình sợi DNA bổ sung bằng phản ứng của enzyme. Đây là một hệ thống được kết hợp với việc khuếch đại số lượng lớn các đoạn DNA kèm cùng pyrosequencing dung khối lớn trong các giếng picotiter. Nguyên lý “giải trình tự bằng việc tổng hợp” cũng dựa trên việc nhận biết các pyrophosphate (PPi) được giải phóng trong quá trình gắn nucleotide, tạo ra một tín hiệu ánh sáng, hiệu quả hơn phương pháp kết thúc chuỗi bằng dideoxynucleotide (phương pháp Sanger).
Phương pháp giải trình tự Pyrosequencing cũng gồm 3 bước:
Bước 1: Chuẩn bị thư viện DNA
DNA mục tiêu được cắt thành các đoạn fragment ngắn. Sau đó các đoạn fragment này được gắn adapter ở 2 đầu.
Sau khi gắn 2 đầu bằng adapter, các đoạn fragment bám vào vi hạt nhờ việc bắt cặp đặc hiệu giữa adapter và đoạn dò trên vi hạt. Nồng độ fragment được pha loãng để chỉ 1 fragment bám trên 1 vi hạt.
Bước 2: Bước khuếch đại
Sau khi 1 fragment bám trên 1 vi hạt (nanoball), các đoạn fragment này sẽ được khuếch đại thành 1 clone/1 vi hạt.

Bước 3: Giải trình tự Pyrosequencing 454.
Mỗi hạt nanoball sẽ được cho vào từng giếng picotiter.
Quá trình giải trình tự diễn ra qua 5 giai đoạn. Đầu tiên, sợi khuôn được lai với một primer giải trình tự và sau đó được ủ với các enzyme DNA polymerase, ATP sulfurylase, luciferase và apyrase cũng như các cơ chất adenosine 5’ phosphosulfate (APS) và luciferin. Khi dNTP đầu tiên được bắt cặp bổ sung, nó được gắn với sợi DNA khuôn nhờ DNA polymerase và kèm theo sẽ giải phóng một PPi. PPi được biến đổi thành ATP nhờ enzyme ATP sulfyrelase cùng với sự tham gia của APS, sau đó một phản ứng được xúc tác bởi licuferase sẽ biến đổi luciferin thành oxyluciferin - tạo ra ánh sánh nhìn thấy, có độ sáng tương ứng với lượng ATP tạo thành. Ánh sáng này được nhận viết bởi một camera và phân tích bởi một chương trình phần mềm.
Apyrase làm suy biến các nucleotide không bắt cặp và ATP. Sau quá trình làm suy biến, phản ứng bắt đầu lại với nucleotide khác được gắn vào. Sau một quá trình liên tục, sợi DNA bổ sung được tổng hợp xong và việc giải trình tự nucleotide được xác định từ các đỉnh tín hiệu dựa trên "dấu vết của pyrogram (pyrogram trace)"
 
Ví dụ:Trên hình 2: một sợi khuôn có trình tự: TATGAC-------
1. Đầu tiên, người ta cho dNTP là A, do A bắt cặp đặc hiệu với T trên sợi khuôn nên giải phóng 1 PPi (pyrophosphate).
PPi sẽ tương tác với APS trong môi trường dưới sự xúc tác của Sulfurylase hình thành 1 ATP.
ATP tiếp tục tương tác Luciferin dưới sự xúc tác của Luciferase bị oxide hóa hình thành Oxiluciferin. Đây chính là tín hiệu phát sáng giúp hệ thống camera thiết bị ghi nhận và truy xuất qua máy bằng 1 peak.
2. Tiếp theo, người ta cho dNTP là T, T lại bắt cặp đặc hiệu với trình tự nucleotide trên mạch khuôn là A, nên chuỗi phản ứng tương tự xảy ra, và tín hiệu được ghi nhận, truy xuất thong qua 1 peak.
3. Kế đến, người ta cho dNTP là G, do G không bắt cặp đặc hiệu với trình tự nucleotide T tiếp theo trên mạch khuôn, nên không có tín hiệu phát ra, và trên đồ thị không hình thành peak.
4. Người ta cho dNTP là C, do C không bắt cặp đặc hiệu với trình tự nucleotide T tiếp theo trên mạch khuôn, nên không có tín hiệu phát ra, và trên đồ thị không hình thành peak.
5. Cứ thế người ta lại bổ sung các dNTP lần lượt theo thứ tự A-T-G-C và ghi nhận các peak. Mỗi peak tương ứng với loại dNTP bắt cặp đặc hiệu với nucleotide trên mạch khuôn. Từ đó xác định được trình tự DNA sợi khuôn.
Slide 29.
Phương pháp Ion Torrent
Hệ thống sử dụng các hóa chất giải trình tự đơn giản nhất, không sử dụng dye huỳnh quang nên không cần đến các hệ thống quang học đắt tiền (không đèn laser, không phin lọc, không camera), tiết kiệm chi phí, rút ngắn thời gian giải trình tự. Thời gian giải trình tự trên máy ít hơn 3 giờ.
Hệ thống sử dụng công nghệ giải trình tự Ion Torrent hoạt động dựa trên chip bán dẫn với các hóa chất thông thường cho phép chuyển đổi trực tiếp từ dữ liệu hóa học thành dữ liệu số.
Con chip được cấu tạo 2 lớp.
- Lớp trên chứa hệ thống các giếng microwell, mỗi giếng chỉ chứa được 1 nanoball.
- Lớp thứ 2 hệ thống hàng triệu đến hàng tỷ sensor để đo sự thay đổi pH của từng giếng.

Khác với pyrosequencing 454, tín hiệu anh sáng thu nhận thông qua việc tạo thành PPi thì hệ thống Ion torrent tín hiệu ghi nhận dựa trên sự thay đổi pH của mỗi giếng microwell thông qua hệ thống sensor đo pH ở mỗi giếng này. Tóm lại, các ion H+ được sinh ra mỗi khi enzyme polymerase gắn 1 nucleotid vào trình tự khuôn và được các sensor ghi nhận và truy xuất bằng đồ thị peak.
Slide 30+31
Tương tự như phương pháp Pyrosequencing 454. Ion Torent cũng được thực hiện qua 3 bước.
Bước 1: Chuẩn bị thư viện DNA
DNA mục tiêu được cắt thành các đoạn fragment ngắn. Sau đó các đoạn fragment này được gắn adapter ở 2 đầu.
Sau khi gắn 2 đầu bằng adapter, các đoạn fragment bám vào vi hạt nhờ việc bắt cặp đặc hiệu giữa adapter và đoạn dò trên vi hạt. Nồng độ fragment được pha loãng để chỉ 1 fragment bám trên 1 vi hạt.
Bước 2: Bước khuếch đại
Sau khi 1 fragment bám trên 1 vi hạt (nanoball), các đoạn fragment này sẽ được khuếch đại thành 1 clone/1 vi hạt. Sau đó mỗi vi hạt đã được khuếch đại thành dòng được cho vào mỗi giếng microwell trên con chip. Quá trình giải trình tự được thực hiện.
Bước 3: Giải trình tự Ion Torrent.

Người ta sẽ bổ sung các dNTP lần lượt theo thứ tự T-A-C-G và ghi nhận các peak. Khi dNTP loại nào bắt cặp đặc hiệu với nucleotide trên sợi khuôn, thì ion H+ được giải phóng và lúc này hệ thống sensor sẽ ghi nhận sự thay đổi pH và truy xuất ra máy 1 peak. Mỗi peak tương ứng với loại dNTP bắt cặp đặc hiệu với nucleotide trên mạch khuôn. Từ đó xác định được trình tự DNA sợi khuôn.
Slide 32.
 Data analysis

Khi hệ thống thiết bị ghi nhận tín hiệu và truy xuất thông tin thông qua các peak, hệ thống máy tính sẽ sử dụng các phần mềm NGS aligment software. Phần mềm này sẽ sử dụng các thuật toán để sắp xếp trình tự của các đoạn fragment và cuối cùng truy xuất trình tự của DNA mục tiêu.









Slide 33
Công nghệ sắp xếp Illumina, sắp xếp theo tổng hợp (SBS), là công nghệ sắp xếp theo trình tự thế hệ kế tiếp được sử dụng rộng rãi trên toàn thế giới, chịu trách nhiệm tạo ra hơn 90% dữ liệu trình tự của thế giới.
Ilumina sequencing technology được tiến hành qua 4 bước cơ bản:
1/ Chuẩn bị mẫu
2/ Tạo cluster
3/ sequencing
4/ Phân tích dữ liệu
Ilumina được tiến hành trên 1 flow cell
Slide 34
Chuẩn bị mẫu: DNA template được cắt thành các đoạn fragment và được nối adapter ở 2 đầu end.




Slide 35
Cấu tạo của 1 đoạn DNA insert được gắn adapter. Adapter có cấu tạo gồm 3 trình tự:
- Trình tự gắn của  mồi ( mồi 1 – màu hồng; mồi 2 – màu xanh lá)
- Index ( index 1 – màu đỏ; index2 – màu tím)
- Vùng trình tự bổ sung với đoạn oligo trên flow cell

Slide 36
Flow cell trên bề mặt sẽ được gắn cố định các đoạn oligo có trình tự bổ sung với trình tự trên adapter (đã giới thiệu ở slide trước). Cụ thể là sẽ có 2 loại oligo (màu tím và màu xanh dương) tương ứng với trình tự bổ sung trên sợi sense và antisense của sợi DNA mạch đơn. Các DNA fragment sau khi gắn adapter sẽ được chuyển vào trong flow cell và đi vào bước tạo cluster.
Slide 37
Cluster generation:
A. Khi DNA fragment gắn adapter được chuyển vào flow cell nó sẽ bị biến tính để tách thành 2 mạch đơn, sợi đơn DNA sẽ gắn với các đoạn oligo trên flow cell. DNA polymerase sau đó sẽ gắn vào vị trí mồi và tiến hành tổng hợp mạch DNA bổ sung.
B. DNA mạch đôi sau khi tổng hợp
C. DNA mạch đôi bị biến tính lần nữa, tách thành 2 mạch đơn bằng cách sử dụng nhiệt. Sợi Reverse (antisense) có đoạn oligo sẽ được giữ lại và các sợi không có đoạn oligo sẽ được rửa khỏi flow cell. (ở ví dụ này sợi reverse (antisense ) được giữ lại)
D. Hình thành cầu khuếch đại: Trình tự bổ sung với oligo màu xanh dương trên sợi antisense sẽ bắt cặp bổ sung với nó, (Tương tự cho sợi sense có đoạn oligo)
Slide 38;
E. DNA polymerase gắn vào trình tự mồi trên mạch DNA và tiến hành tổng hợp mạch bổ sung.
F. Sau khi tổng hợp, sợi DNA mạch đôi bị biến tính, tách thành 2 mạch đơn
- Quá trình tạo cầu khuếch đại cứ như vậy tiến tục lặp lại từ bước D đến bước F
- Sau nhìu lần lặp ta sẽ thu được các cluster (mỗi cụm là 1 trình tự DNA hoàn toàn giống nhau)
Slide 39
Khi hoàn thành, vài triệu clustal dày đặc của các sợi đôi DNA được tạo ra trong mỗi kênh của flow cell


Slide 40
Sau khi các cụm cluster được tạo thành, Sợi antisense sẽ được rửa khỏi flow cell. Chỉ duy nhất sợi sense được giữ lại.

Slide 41:
Sequencing: Ở đây sợi sense sẽ được đọc trước (lần đọc thứ nhất)
Người ta sẽ bổ sung các ddNTP vào. Khi dNTP loại nào bắt cặp đặc hiệu với nucleotide trên sợi khuôn, thì ánh sang huỳnh quang của nó sẽ được giải phóng và lúc này hệ thống sensor sẽ ghi nhận màu và truy xuất ra máy 1 nucleotide tương ứng. Mỗi màu tương ứng với loại dNTP bắt cặp đặc hiệu với nucleotide trên mạch khuôn. Từ đó xác định được trình tự DNA sợi khuôn.
Bước sóng phát xạ cùng với cường độ tín hiệu xác định Base call. Base call cho 1 clustal tất cả giống hệt nhau được đọc đồng thời hàng trăm lần.

Slide 42:
Sau khi đọc xong trình tự của sợi sense, mạch DNA sẽ bị biến tính bởi nhiệt độ thành mạch đơn, mạch không gắn với đoạn oligo sẽ bị rửa khỏi dung dịch.
Sợi sense sẽ tạo cầu khuếch đại với đoạn oligo còn lại trên flow cell. DNA polymerase được them vào và tiến hành tổng hợp mạch bổ sung
Slide 43:
Sequencing: Sợi antise được đọc
Mạch đôi DNA bị biến tính bởi nhiệt độ và tách thành sợi đơn, sợi sense được rửa khỏi flow cell và giữ lại sợi antisense.
Quá trình đọc sợi antisense diễn ra tương tự như sợi sense
Slide 44:
Quá trình giải trình tự song song các mạch liên tục sẽ tạo ra các tập con trình tự trên mỗi cluster. Các tập con này sẽ được sắp xếp và so sánh với nhau để cho ra trình tự ban đầu của mạch DNA mẫu.
Slide 45:
Trình tự đọc được sau đó sẽ được aligned với trình tự reference, điều này sẽ giúp tìm thấy sự đồng nhất cũng như là các thay đổi trong trình tự DNA

Slide 46:
Tổng hợp tóm tắt lại Ilumina technology được thể hiện qua hình sau:
Mẫu DNA (0.1 – 1.0 ug) sẽ được chuẩn bị để thêm vào flow cell
Quá trình hình thành cầu khuếch đại và tổng hợp mạch bổ sung sẽ tạo ra các cụm cluster.
Các cluster sẽ được giải trình tự dựa trên ánh sáng huỳnh quang phát ra từ các ddNTP (mỗi ddNTP tương ứng với một màu)
Ánh sang phát ra sẽ được ghi nhận lại qua hình ảnh bằng detecter
Từ màu sắc sẽ suy ra được nucleotide tương ứng, quá trình này gọi là base calling.

Slide 47:
Dữ liệu NGS sẽ được tạo ra cho hàng trăm khối u từ tất cả các loại ung thư chính trong tương lai gần. Việc phân tích tích hợp dữ liệu trình tự DNA, RNA và methylation sẽ giúp làm sáng tỏ tất cả các thay đổi di truyền liên quan đến ung thư.
Ngoài ra NGS còn được ứng dụng trong việc chuẩn đoán tiền sinh, giúp phát hiện sớm các đột biến trên NST mà liên quan đến dị tật thai nhi.
Slide 48;
Kỹ thuật chuẩn đoán tiền sinh không xâm lấn NIPT (Non-invasive prenatal tests ) là 1 kỹ thuật ứng dụng NGS để chuẩn đoán kiểu gen của thai nhi, kỹ thuật này hiện rất phổ biến ở các bệnh viện.
Con người có tổng cộng 23 cặp hay 46 nhiễm sắc thể. Khi có sự hiện diện ba bản sao của cùng một nhiễm sắc thể thay vì hai như bình thường trong mỗi tế bào, đó chính là một dạng bất thường về số lượng nhiễm sắc thể còn được gọi là trisomy.
Trisomy xảy ra tại cặp nhiễm sắc thể số 13, 18, 21 hoặc 23 (NST giới tính) có thể gây ra các hội chứng nghiêm trọng ảnh hưởng tới sức khỏe và sự phát triển của thai nhi như Down, Edwards, Patau, Klinefelter và Turner.
xét nghiệm trước sinh không xâm lấn NIPT có thể phát hiện sớm các hội chứng Down, Edwards, Patau, Klinefelter và Turner, đặc biệt dùng để sàng lọc các trường hợp có kết quả xét nghiệm Double test nguy cơ cao hoặc Triple test nguy cơ cao mà không cần chọc ối.
Slide 49:
Tại sao phải xét nghiệm NIPT – Ilumina?
Cứ 100 trẻ em sinh ra thì có 4 trẻ mang vấn đề nghiêm trọng về sức khỏe, phần lớn liên quan đến trường hợp bất thường nhiễm sắc thể (NST). Khoảng 1:700 trẻ có khả năng mắc các hội chứng Down. 1:8000 đối với hội chứng Edwards và 1: 10.000 đối với hội chứng Patau.
Xét nghiệm NIPT – Illumina giúp sàng lọc các hội chứng bệnh di truyền phổ biến mà thai nhi mắc phải như:
Bất thường số lượng nhiễm sắc thể
Bất thường nhiễm sắc thể giới tính
Đột biến vi mất đoạn
Bất thường số lượng NST các NST còn lại
Phương pháp sàng lọc trước sinh không xâm lấn (NIPT) cho kết quả chính xác hơn (Đặc biệt với hội chứng Down), so với phương pháp truyền thống. Phương pháp này không xâm lấn thai, giảm tỉ lệ thai phụ có chỉ định chọc ối hoặc sinh thiết gai nhau không cần thiết. Thai phụ có thể tiến hành sớm bắt đầu từ tuần thai thứ 10…
Quy trình NIPT – Ilumina bao gồm 5 bước:
- Thu mẫu máu và tách chiết: cffDNA được thu từ máu mẹ
- Chuẩn bị thư viện trình tự
- Sequecing
- Phân tích dữ liệu
- Trả kết quả

Slide 50:
Xét nghiệm tiền sản không xâm lấn Harmony là xét nghiệm tiền sản được phát triển bởi Trung tâm chẩn đoán Ariosa Diagnostic, California, Hoa Kỳ. Đây là phòng xét nghiệm số 1 thế giới về xét nghiệm tiền sản không xâm lấn. Từ năm 2012, xét nghiệm Harmony đã được thử nghiệm trên 150.000 phụ nữ ở 50 quốc gia với độ chính xác đến 99,9% và là xét nghiệm tiên tiến nhất hiện nay.
Slide 51:
20 ml máu trong tĩnh mạch người mẹ từ tuần thái thứ 9 trở đi sẽ được thu nhận để xét nghiệm NIPT. Trong máu của mẹ sẽ có chứa maternal DNA và cff DNA. Mẫu máu này sẽ được tách chiết và thu nhận DNA, xét nghiệm NIPT – illumina và xác định thể tam bội ở NST
Slide 52:
Cho tới nay, có 2 phương pháp NIPT chính đang được sử dụng: phương pháp đếm định lượng là phương pháp được đa số các nơi sử dụng và thuộc NIPT thế hệ thứ nhất, phương pháp kết hợp các thông tin kiểu gen dựa trên sự đa hình đơn nucleotide (Single nucleotide polymophisms: SNP) đang được Netera sử dụng thuộc NIPT thế hệ thứ hai.
Quy trình chung của NIPT như sau:
- Thu mẫu máu của mẹ
- Tách DNA ( DNA maternal và cffDNA)
- Giải trình tự gen thế hệ mới
- So sánh trình tự thu được với trình tự Chromosome quan tâm ( phương pháp đếm và sử dụng SNP)
- Phát hiện các đột biện
- Báo các kết quả
Phương pháp đếm định lượng là phương pháp so sánh số lượng đoạn trình tự ADN từ nhiễm sắc thể quan tâm (ví dụ như nhiễm sắc thể 21 trong hội chứng Down) với nhiễm sắc thể tham chiếu hoặc bộ nhiễm sắc thể giả định nguyên bội (euploidy). Mặc dù phương pháp này rất hiệu quả để xác định Trisomy 21 và Trisomy 18, nó không hiệu quả lắm trong việc xác định Trisomy 13 và dị bội nhiễm sắc thể giới tính 20-24. Phương pháp này cũng không xác định được thể tam bội, hội chứng chiếm tỉ lệ 1:2000 ở tuần thứ 12 của thai kỳ
Slide 53:
Panorama là một xét nghiệm NIPT thương mại duy nhất hiện nay dựa trên sự đa hình đơn nucleotide (SNP), sử dụng các SNP đích đặc trưng để xác định mức bội thể (ploidy). Phương pháp này tách chiết ADN mẹ từ tế bào bạch cầu trong máu mẹ, giải trình tự, và dùng thông tin đó trong quá trình phân tích tin sinh học để phân tách kiểu gen của mẹ từ mẫu huyết tương vốn bao gồm thông tin ADN của cả mẹ và thai nhi.

Slide 54:
Hệ thống giải trình tự gien thế hệ mới (NGS- Next-Generation Sequencing) giúp phân tích/phát hiện đột biến gien qua những “mảnh ADN” trong máu ngoại vi bệnh nhân ung thư phổi được sử dụng để phát hiện những đột biến kháng thuốc điều trị đích, do đó nó “dẫn lối” cho bác sĩ lựa chọn điều trị chính xác hơn và không chỉ lựa chọn bước 1 mà có thể “thiết kế” các phương án B,C… ngay từ đầu.
Đặc biệt, hệ thống NGS còn giúp bác sĩ chẩn đoán được đột biến gien mà không cần lấy mẫu mô u lớn, làm đi làm lại nhiều lần dễ dàng do chỉ cần lấy máu ngoại vi như một xét nghiệm thường qui.
Trong khi trình tự thế hệ tiếp theo (NGS) cho phép phân tích toàn diện về bộ gen, công nghệ có thể phải vật lộn để phát hiện các biến thể tần số thấp. Để cải thiện độ nhạy của NGS để phát hiện đột biến, chúng tôi đã tạo ra một peptide axit nucleic (PNA) kẹp, xác nhận bởi qPCR, được thiết kế để ràng buộc hoang dại KRAS (WT KRAS) trên codon 12 trong khuếch đại giai đoạn PCR của một sự chuẩn bị thư viện NGS ( Trình tự CACCAG)

Slide 55;
Quy trình:
1. Thiết kế đoạn PNA (peptide nucleic acid) kẹp
2. Chuẩn bị mồi và mẫu dò. Có 2 loại mẫu dò được sử dụng (mẫu dò cho WT và G12D mutation)
3. Sử dụng droplet digital PCR để khuếch đại trình tự mong muốn
4. Định lượng
5. Chạy NGS (ở đây sử dụng phương pháp Ion torrent): 207 đoạn khuếch đại, tương đương với 2800 đột biến trên Oncogene và TSG được sử dụng để chạy NGS. Trình tự thu được sau đó sẽ được aligned với genome 19 để so sánh
Slide 56:
Phân tích tình trạng KRAS của bệnh nhân ung thư phổi không tế bào nhỏ (NCSLC) sử dụng cfDNA plasmatic làm nguồn circulating tumour DNA. Nghiên cứu đã sử dụng Droplet Digital PCR  (ddPCR) và NGS với sự hỗ trợ của PNA để phát hiện ra đột biến KRASG12D ở tần số allelic là 3,2% (một tần số rất thấp)
Slide 57:
Một ứng dụng sử dụng NGS ( ion torrent) để xác định các gen đột biến kháng thuốc ở vi khuẩn lao. Phương pháp này nhắm vào target gen
Mycobacterium tuberculosis: 5 gen đích kháng thuốc được phân tích
- rpoB (kháng rifampin)
- katG (kháng isoniazid)
- pncA (kháng pyrazinamide)
- gyrA (kháng ofloxacin/ fluroquinolone)
- rrs (kháng aminoglycosides)
MDR M. tuberculosis (vi khuẩn lao kháng đa thuốc) : kháng rifampin (RIF) và isoniazid (INH)
XDR M. tuberculosis(vi khuẩn lao kháng thuốc phổ rộng): kháng cả RIF and INH cũng như là fluoroquinolones (FQs)
Slide 58:
Quy trình được tiến hành theo các bước như trên hình
Slide 59:
Tổng cộng 10 thay thế axit amin rpoB đã được xác định trong 26 chủng lâm sàng so với chủng hoang dại H37Rv. Sự đột biến S531L thông thường là phổ biến nhất, nhưng các đột biến tại các vị trí 516 và 526, cũng được biết đến để đề kháng rifampin, được quan sát thấy
Slide 60:
katG gene mutations:4 amino acid biến đổi được quan sát thấy trong sản phẩm gen katG - S315T, được biến đến là kháng isoniazid.
Slide 61:
đột biến gen pncA.
Bảy đột biến nucleotide được ghi nhận ở ít nhất một dòng trong số 561 bp bao gồm vùng mã hóa đầy đủ cho gen pncA (Bảng 4). Chín trong số 26 chủng (34,6%) có chứa một đột biến axit amin cung cấp khả năng chống lại pyrazinamide (PZA) (Bảng 4). Trong một dòng, đột biến nucleotide im lặng (đồng nghĩa) được đặc trưng ở vị trí tương ứng với axit amin 195 (C195T). Năm chủng có chứa các chất thay thế amino acid đã được biết trước đây (C14R, A102V, V139G, R154G, và L172P) được biết đến để đề kháng với pyrazinamid. Một đột biến mới, không được báo cáo trước đây ở những nơi khác, bao gồm một codon kết cuối đã được tìm thấy trong một phân lập ở nhóm 122 (Q122Stop) trong protein PncA
Slide 62:
Sự kháng thuốc đối với fluoroquinolones (FQs) chỉ được ghi nhận ở các dòng có các đột biến ở vùng xác định độ bền quinolone (QRDR) được xác định bởi sự thay thế ở gyrA ở các vị trí tương ứng với axit amin 88, 90 và 94. Một số đột biến bổ sung cũng được quan sát thấy ở vùng ngoài QRDR, bao gồm hai đột biến "biến dạng" ở vị trí 549 và 613 trong protein GyrA
Slide 63:
4 đột biến nucleotide được ghi nhận trong đoạn 1.540 bp bao gồm gen 16s rrs có chiều dài đầy đủ. 7 trong số 26 (27%) chủng lâm sàng cho thấy có khả năng đề kháng với aminoglycosid, và tất cả các chủng có đột biến A1401G được cho là có khả năng đề kháng.
phương pháp sử dụng NGS với target gene có thể dễ dàng được mở rộng để bao gồm tất cả 16 gen hiện đang gây ra sự kháng thuốc của M. tuberculosis. Phân tích gen kéo dài bằng cách sử dụng Ion Torrent PGM có thể xác định những đột biến mới, khi có liên quan đến thử nghiệm MIC kiểu hình, có thể xác định được các vi khuẩn kháng lao mới của M. Tuberculosis.
Slide 64:
Từ lịch sử của phương pháp giải trình tự Sanger và dự án giải mã bộ gen người đến sự kế thừa và phát triển của NGS đã trải qua nhiều giai đoạn. Từ đó cũng có nhìu kỹ thuật và ứng dụng ra đời
RNA-seq và ChIP-Seq ứng dụng vào nghiên cứu bệnh truyền nhiễm
kỹ thuật phân tích nhiễm sắc thể mới toàn diện hơn, đó là CGH (phép lai tạo gen có so sánh – comparative genomic hybridization) – chọn phôi trước khi chuyển
NSG đã mở ra 1 hướng để con người hiểu rõ hơn về bản thân cũng như chuẩn đoán phát hiện các biến đổi về gen mà gây bệnh từ đó có phương pháp điều trị sớm nhất. Nó là công cụ đắc lực và tiềm năng phục vụ cho các nghiên cứu về sinh học phân tử hiện nay và trong tương lai.