Nhóm nghiên cứu MIT phát triển thành công kỹ thuật lưu trữ và truy xuất dữ liệu DNA tiên tiến, cách làm tương tự Google Search

Trên Trái Đất hiện nay có khoảng 10 nghìn tỷ gigabytes dữ liệu số và mỗi ngày, con người tạo ra khoảng hoảng 2,5 triệu gigabyte dung lượng dưới dạng email, ảnh, cập nhật trạng thái facebook và nhiều dữ liệu số khác. Phần lớn dữ liệu này được lưu trữ trong các trung tâm dữ liệu exabyte (tương đương 1 tỉ gigabytes), có kích thước tương đương nhiều sân bóng đã và có chi phí lên tới 1 tỉ USD để xây dựng và duy trì.

Nhóm nghiên cứu MIT phát triển thành công kỹ thuật lưu trữ và truy xuất dữ liệu DNA tiên tiến, cách làm tương tự Google Search - Ảnh 1.

Một cốc coffee chứa đầy DNA trên lý thuyết có khả năng lưu trữ toàn bộ dữ liệu số trên thế giới

Nhiều khoa học gia tin rằng một giải pháp lưu trữ thay thế nằm ở chính phân tử chứa dữ liệu di truyền của chúng ta: DNA, một sản phẩm tiến hóa có khả năng lưu trữ lượng lớn dữ liệu với mật độ cực lớn. Một cốc coffee chứa đầy DNA trên lý thuyết có khả năng lưu trữ toàn bộ dữ liệu số trên thế giới, theo Mark Bathe, giáo sư kỹ thuật sinh học tại MIT.

Chúng ta cần những giải pháp mới cho phép lưu trữ lượng dữ liệu khổng lồ ngày càng tích tụ. DNA cũng có mật độ dầy đặc hơn bộ nhớ flash gấp hàng ngàn lần, và một thuộc tính đặc biệt đó là một khi bạn polymer hóa DNA, nó hoàn toàn không tiêu thụ năng lượng. Bạn có thể tạo ra một trình tự DNA và lưu trữ nó mãi mãi”, theo Bathe.

Các nhà khoa học hiện đã chứng minh khả năng mã hóa hình ảnh và tài liệu chữ dưới dạng DNA. Tuy nhiên, chúng ta cần một cách dễ hơn để trích xuất dữ liệu cần truy cập từ một tổ hợp DNA nhiều mảnh. Bathe và các đồng nghiệp đã tìm ra một phương pháp thực hiện điều này bằng cách đóng gói mỗi file dữ liệu thành một khối silica có kích thước 6-micromet và gán nó cho các chuỗi DNA ngắn để dễ dàng truy xuất.

Bằng phương pháp này, các nhà nghiên cứu đã thể hiện khả năng trích xuất chính xác từng file hình ảnh được lưu giữ trong các chuỗi DNA chứa 20 hình. Tính toán cho thấy phương pháp này có thể được áp dụng cho các tổ hợp tới 1020 tệp tin, tức 100.000.000.000.000.000.000 tệp, một trăm tỷ tỷ file.

Bathe là tác giả của nghiên cứu này, được đăng trên tạp chí Nature Materials. Các đồng tác giả khác là thạc sĩ MIT James Banal, cựu nghiên cứu sinh MIT Tyson Shephard và cử nhân Joseph Berleant.

Khả năng lưu trữ ổn định

Nhóm nghiên cứu MIT phát triển thành công kỹ thuật lưu trữ và truy xuất dữ liệu DNA tiên tiến, cách làm tương tự Google Search - Ảnh 2.

Các hệ thống lưu trữ dữ liệu số mã hóa dữ liệu thành các chuỗi nhị phân 0 và 1. Dữ liệu có thể được mã hóa tương tự trong DNA, nhưng với 4 neucleotide là A,T,G, C thay cho 0 và 1. Ví dụ, C và G có thể tượng trưng cho 0, còn A và T có thể đại diện cho giá trị 1.

DNA có một số thuộc tính tối ưu khác: cực bền bỉ, dễ dàng tổng hợp và lập trình (tuy rằng tốn kém). Ngoài ra, nhờ mật độ lớn - mỗi nucleotide, tương đương 2 bit, chỉ có kích thước 1 nanomet khối, khiến cho 1 exabyte dữ liệu DNA có thể hoàn toàn nằm gọn trong lòng bàn tay.

Một chướng ngại đối với lưu trữ dữ liệu DNA đó là chi phí tổng hợp DNA. Hiện tại, để ghi 1 petabyte (1 triệu gigabyte) vào DNA, quá trình sẽ tốn tới 1 nghìn tỷ USD. Để có thể cạnh tranh với giải pháp lưu trữ dữ liệu từ tính, Bathe ước tính chi phí tổng hợp DNA cần giảm đi tối thiểu 6 con số. Bathe cho biết anh hy vọng có thể đạt được cột mốc này sau một hoặc hai thập kỷ nữa, tương tự như việc chi phí ổ flash đã giảm mạnh sau vài thập kỷ.

Nhóm nghiên cứu MIT phát triển thành công kỹ thuật lưu trữ và truy xuất dữ liệu DNA tiên tiến, cách làm tương tự Google Search - Ảnh 3.

20 hình được lưu trong thử nghiệm.

Khó khăn trong trích xuất dữ liệu

Bên cạnh chi phí, một vấn đề khác với việc sử dụng DNA để lưu dữ liệu là khó khăn trong việc trích xuất chính xác file bạn muốn. Bathe so sánh việc này với mò kim đáy bể. Hiện tại, dữ liệu DNA được trích xuất sử dụng phản ứng chuỗi polymerase (PCR). 

Mỗi file dữ liệu bao gồm một trình tự DNA sẽ phản ứng với chất mồi PCR nhất định. Để trích xuất một file nhất định, chất mồi được kết hợp với mẫu DNA để nhận diện chuỗi đích. Tuy nhiên, phương pháp này có phương sai nhất định và sử dụng enzym, khiến phần lớn DNA trong tổ hợp bị phân rã. Bathe nhận xét: “Gần như là bạn đang rút cạn bể để tìm một cái kim dưới đáy.

Nhóm nghiên cứu MIT phát triển thành công kỹ thuật lưu trữ và truy xuất dữ liệu DNA tiên tiến, cách làm tương tự Google Search - Ảnh 4.

Để khắc phục khó khăn, nhóm đã phát triển một phương pháp khác bao gồm việc đóng gói mỗi file vào một phân tử silica nhỏ. Mỗi gói sẽ được gán nhãn bằng một chuỗi DNA đơn đại diện cho nội dung của file. Để trình diễn kỹ thuật này với chi phí thấp, các nhà nghiên cứu mã hóa 20 hình ảnh khác nhau vào chuỗi DNA dài 3.000 nucleotides, tương đương 100 bytes. 

Mỗi tệp tin được dán một mã vạch cụ thể đại diện cho một khái niệm nhất định. Khi cần trích xuất một hình ảnh bất kỳ, họ lấy các mẫu DNA và cho phản ứng với chất mồi tương ứng với khái niệm cần tìm kiếm. Nhờ đó, các gói dữ liệu không phản ứng có thể dễ dàng được đưa trở lại kho lưu trữ. Phương pháp này áp dụng logic Boolean cơ bản, cho phép khả năng tìm kiếm tương tự như khi bạn tìm ảnh trên Google.

Ở thử nghiệm chứng minh tính hiệu quả công nghệ, chúng ta đã đạt tốc độ tìm kiếm 1 kilobyte/giây. Tốc độ tìm kiếm của hệ thống được quyết định bởi kích thước mỗi gói dữ liệu, bị hạn chế bởi chi phí tổng hợp DNA. Nếu chi phí tổng hợp DNA trở nên phải chăng hơn, chúng ta có thể tối đa hóa kích thước dữ liệu lưu trữ trong mỗi gói”, Banal, tác giả chính của nghiên cứu nhận định.

Nhóm nghiên cứu MIT phát triển thành công kỹ thuật lưu trữ và truy xuất dữ liệu DNA tiên tiến, cách làm tương tự Google Search - Ảnh 5.

Trong tương lai, các file sẽ có hình dạng như thế này?

Bathe cho rằng phương pháp lưu trữ dữ liệu này có thể hữu ích đối với lưu trữ “lạnh”, khi mà dữ liệu không được truy cập nhiều. Nhóm nghiên cứu đang bắt đầu một công ty khởi nghiệp có tên Cache DNA, tập trung phát triển các công nghệ lưu trữ DNA dài hạn nhằm áp dụng cho cả lưu trữ dữ liệu DNA lẫn lưu trữ các mẫu DNA trong nghiên cứu.

Theo lời giáo sư di truyền George Church hiện đang công tác tại Harvard và không tham gia nghiên cứu mới, đây là "một bước nhảy vọt lớn trong quản lý tri thức và kỹ thuật tìm kiếm dữ liệu". Ông nhận định nghiên cứu mới tận dụng được công nghệ và công cụ sẵn có để đưa khả năng lưu trữ dữ liệu DNA lên một tầm cao mới, một cách tiếp cận khác với phương pháp truyền thống mà vẫn hiệu quả.

Nghiên cứu này được tài trợ bởi Phòng nghiên cứu Hải quân, Quỹ Khoa học Quốc qua Mỹ và Phòng nghiên cứu Quân sự Mỹ.

Theo MIT

Adblock test (Why?)


Xem Chi Tiết Ở Đây >>>
Bạn có thể quan tâm:
>> Máy nhồi bột Bear có tốt không? Địa chỉ mua máy nhồi bột Bear chính hãng
>> Nồi phủ sứ an toàn Honey's HO-AP2C182 size 18 màu vàng
>> Trên tay Galaxy A52 5G: Phiên bản nâng cấp với màn hình 120 Hz, chip Snapdragon 750G và thiết kế không đổi

0 nhận xét:

Đăng nhận xét