Luận văn thS: Các phương pháp dự đoán khả năng ức chế bệnh dựa trên các biểu diễn khác nhau của RNA và ứng dụng

Luận văn Các phương pháp dự đoán khả năng ức chế bệnh dựa trên các biểu diễn khác nhau của RNA và ứng dụng giới thiệu tổng quan về RNA, RNAi và đi sâu vào siRNA; trình bày một số nghiên cứu tiếp cận theo hướng sinh học và tin sinh học; trình bày các cách thức biểu diễn chuỗi RNA; trình bày các  áp dụng cụ thể một số phương pháp dự đoán như Hồi quy tuyến tính và Luật kết hợp trên các biểu diễn khác nhau của chuỗi siRNA và đánh giá kết quả. 

Luận văn thS: Các phương pháp dự đoán khả năng ức chế bệnh dựa trên các biểu diễn khác nhau của RNA và ứng dụng

1. Mở đầu

RNAi được sử dụng trong khoa học cơ bản nghiên cứu chức năng của gen. Ngoài ra, cơ chế này có ý nghĩa rất quan trọng đối với việc điều khiển các biểu hiện gen, tham gia bảo vệ cơ thể chống nhiễm virus và kiểm soát gen thay đổi đột ngột. Với nghiên cứu mới này, giới khoa học cũng đang tìm ra các ứng dụng của RNAi trong những nghiên cứu y học chữa bệnh bằng liệu pháp gen, các ứng dụng trên cây trồng, vật nuôi trong nông nghiệp nhằm tạo ra các sản phẩm với chất lượng tốt hơn; trong điều trị các bệnh nhiễm khuẩn, các bệnh do virut, bệnh tim, ung thư, rối loạn nội tiết và nhiều chứng bệnh khác. Bộ máy can thiệp RNAi bao gồm 2 thành phần siRNA và miRNA, trong đó cơ chế tắt gen bởi siRNA có hiệu quả rất cao, chỉ cần một lượng nhỏ siRNA được đưa vào tế bào cố thể đủ để làm tắt hoàn toàn sự biểu hiện của một gen nào đó (vốn có rất nhiều bản sao trong cơ thể đa bào). Trong ngữ cảnh đó, đã có rất nhiều nghiên cứu ứng dụng học máy vào việc dự đoán khả năng ức chế bệnh của siRNA. Các nghiên cứu tập trung vào việc tìm kiếm cách thiết kế siRNA có khả năng ức chế bệnh cao, đồng thời xây dựng các mô hình dự đoán khả năng ức chế bệnh của siRNA. Các mô hình đã xây dựng bằng nhiều phương pháp tiếp cận những hầu hết còn bị hạn chế do hệ số tương quan của mô hình còn thấp. Một trong những ảnh hưởng lớn tới kết quả này là sự biểu diễn dữ liệu siRNA, do vậy một hướng tiếp cận trong việc xây dựng mô hình dự đoán này là tìm biểu diễn siRNA nhằm đại diện được những đặc tính quan trọng nhất của siRNA mà vẫn đạt hiệu năng tính toán tốt. 

2. Nội dung

2.1 Giới thiệu khả năng ức chế bệnh của RNA

Tổng quan RNA can thiệp (RNAi)

  • Tổng quan RNAi 
  • Lịch sử nghiên cứu RNAi
  • Ý nghĩa của việc phát hiện ra RNAi

Cơ chế can thiệp RNAi

  • Các loại RNAi
  • Cơ chế can thiệp RNA  
  • Ứng dụng RNAi và thách thức

Phát biểu bài toán

2.2 Các hướng nghiên cứu

Hướng nghiên cứu sinh học

Hướng nghiên cứu tin sinh học

2.3 Các cách thức biểu diễn RNA

Biểu diễn theo tần số xuất hiện của các bộ 1-merge, 2-merge, 3-merge

Biểu diễn theo tần số của một bộ các nucleotide có tính thứ tự

Biểu diễn thành số tương ứng với loại nucleotide và vị trí

Phương pháp biểu diễn chuỗi DNA không suy thoái

VOSS

TETRAHEDRON

INTEGER

REAL

COMPLEX

QUATERNION

EIIP

ATOMIC NUMBER

PAIRED NUMERIC

DNA WALK

Z-CURVE

2.4 Đánh giá thực nghiệm

Thực nghiệm thuật toán kết hợp APRIORI

Thực nghiệm thuật toán phân lớp NAÏVE BAYES

  • Biểu diễn VOSS
  • Biểu diễn DNA không suy thoái

Thực nghiệm thuật toán phân lớp hồi quy tuyến tính

  • Biểu diễn theo tần số xuất hiện của các bộ 1-merge, 2-merge, 3-merge
  • Biểu diễn theo tần số của một bộ các nucleotide có tính thứ tự
  • Phương pháp biểu diễn DNA không suy thoái
  • VOSS
  • TETRAHEDRON
  • INTEGER
  • REAL
  • EIIP
  • ATOMIC
  • DNA WALKER
  • Kết hợp các phương pháp biểu diễn khác nhau

Đánh giá kết quả thực nghiệm

  • Tóm tắt kết quả thực nghiệm
  • Đánh giá

3. Kết luận

Trong công việc này, giảng viên hướng dẫn của tôi đã đề xuất phương pháp biểu diễn dựa vào thống kê tần số căn cứ vào các đặc tính về trình tự và số lần xuất hiện của các bộ thứ tự nucleotide trong chuỗi siRNA. Kết quả từ quá trình thực nghiệm của phương pháp biểu diễn này cũng như các phương pháp biểu diễn khác khi kết hợp với các phương pháp xây dựng mô hình dự đoán chưa đem lại kết quả mong đợi. Có nhiều nguyên nhân để dẫn tới kết quả đó như dữ liệu để thực nghiệm chưa đủ lớn để đem lại kết quả chính xác. Dữ liệu để thực nghiệm được lấy từ kết quả của công trình nghiên cứu của một số nhà khoa học hiện có một số ý kiến trái chiều với nhau nên kết quả test với mô hình đã xây dựng từ dữ liệu training không thực sự cao. Ngoài ra kết quả thực nghiệm chỉ ngang bằng với các thử nghiệm trước đó và thấp hơn so với công bố năm 2017 của nhóm nghiên cứu Fei He và Ye Han một phần do chưa có sự tối ưu mô hình dự đoán trong quá trình thực nghiệm. Và nguyên nhân chính là do các phương pháp biểu diễn đã được trình bày và thực nghiệm còn bộc lộ nhiều thiếu xót như số chiều chưa đủ lớn, thiếu các cấu trúc dữ liệu bậc 1, 2, 3 và chưa đủ tính đai diện cho số lượng siRNA vô cùng lớn 419. 

4. Tài liệu tham khảo

Montgomery, Mary K: "RNA Interference - RNA Interference, Editing, and Modification: Methods and Protocols",  Methods in Molecular Biology,3-21, 2010.

Nobelprize.org, "The Nobel Prize in Physiology or Medicine 2006" 

Neema Agrawal, P. V. N. Dasaradhi, Asif Mohmmed, Pawan Malhotra, Raj K.Bhatnagar, and Sunil K. Mukherjee*: "RNA Interference: Biology, Mechanism, and Applications", Microbiol Mol  Biol Rev, 67(4):657-85, 2003. 

Sayda M. Elbashir, Winfried Lendeckel and Thomas Tuschl: "RNA interference is mediated by 21- and 22-nucleotide RNAs", Genes Dev,  15:188–200, 2001.

Angela Reynolds, Devin Leake, Queta Boese, Stephen Scaringe, William S Marshall, Anastasia Khvorova: "Rational siRNA design for RNA interference", Nat Biotechnol, 22:326–30, 2004....

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn Thạc sĩ trên ---

Ngày:19/08/2020 Chia sẻ bởi:Xuân Quỳnh

CÓ THỂ BẠN QUAN TÂM