Tin KHCN nước ngoài
Hệ điều hành máy tính và bộ phim ngắn được lưu trữ trên ADN (09/03/2017)
-   +   A-   A+   In  

Nhân loại có thể sớm tạo ra nhiều dữ liệu hơn so với ổ cứng hoặc băng từ, một vấn đề đưa các nhà khoa học đến việc chuyển đổi sang giải pháp lâu đời của tự nhiên cho việc lưu trữ thông tin - ADN.

Trong một nghiên cứu mới đăng trên tạp chí Science, hai nhà nghiên cứu tại Trường Đại học Columbia và Trung tâm bộ gen New York đã chứng minh một thuật toán được thiết kế để phát video trên điện thoại di động có thể mở ra tiềm năng lưu trữ gần như đầy đủ của ADN bằng cách nén nhiều thông tin thành 4 nucleotide cơ sở của nó. Công nghệ này được chứng minh rất đáng tin cậy.

 

ADN là một phương tiện lưu trữ lý tưởng vì nó siêu nhỏ gọn và có thể tồn tại hàng trăm nghìn năm nếu được cất giữ ở nơi khô ráo và mát mẻ, như được minh chứng bởi sự phục hồi gần đây của ADN từ xương của tổ tiên người cổ đại 430.000 năm tuổi trong một hang động ở Tây Ban Nha.

 

Yaniv Erlich, giáo sư khoa học máy tính và là đồng tác giả nghiên cứu cho rằng: "ADN sẽ không bị hỏng theo thời gian như băng cassette và đĩa CD và hơn nữa, sẽ không trở nên lỗi thời. Nếu có là những vấn đề lớn hơn".

 

Nhóm nghiên cứu đã chọn 6 tập tin để mã hóa hoặc viết trên ADN: một hệ điều hành máy tính đầy đủ, một bộ phim Pháp năm 1895 có tên "Chuyến tàu đến La Ciotat", một thẻ quà tặng của Amazon trị giá 50 USD, một virus máy tính, một tấm bảng Pioneer và một nghiên cứu năm 1948 của nhà lý thuyết thông tin Claude Shannon.

 

Các nhà khoa học đã nén các tập tin thành một tập tin chủ và sau đó chia dữ liệu thành các chuỗi ngắn của mã nhị phân được tạo thành từ các số 1 và 0. Sử dụng thuật toán tẩy xoá gọi là mã nguồn, họ đã bao gói một cách ngẫu nhiên các chuỗi thành những giọt nhỏ và lập bản đồ các số 1 và 0 trong mỗi giọt cho 4 nucleotide trong ADN: A, G, C và T. Thuật toán đã xóa các chữ kết hợp được biết là tạo ra lỗi và thêm một mã vạch cho từng giọt để giúp lắp ghép các tập tin về sau này.

 

Nhìn chung, nhóm nghiên cứu đã lập một danh sách số gồm 72.000 sợi ADN, mỗi sợi dài 200 base và gửi nó dưới dạng một tập tin bằng văn bản đến công ty khởi nghiệp tổng hợp ADN San Francisco có tên là Twist Bioscience, chuyên chuyển đổi dữ liệu số thành dữ liệu sinh học. Hai tuần sau đó, các nhà khoa học nhận được một lọ nhỏ chứa các cụm phân tử ADN. Để lấy các tập tin đó, nhóm nghiên cứu đã sử dụng công nghệ lập trình tự hiện đại để đọc các sợi ADN, tiếp theo là phần mềm dịch mã di truyền trở lại dạng nhị phân. Kết quả là các tập tin đã được khôi phục với sai số bằng không.

 

Các nhà khoa học cũng đã chứng minh các bản sao của tập tin với số lượng không hạn chế có thể được tạo ra nhờ kỹ thuật mã hóa bằng cách nhân bản các mẫu ADN thông qua phản ứng chuỗi polymerase (PCR) và các bản sao đó và thậm chí các bản sao của những bản sao đó… có thể được khôi phục mà không bị lỗi.

 

Cuối cùng, chiến lược mã hóa của nhóm nghiên cứu đã bao gói được 215 petabyte dữ liệu trên 1g ADN - gấp hơn 100 lần so với những phương pháp của các nhà nghiên cứu tiên phong, đó là George Church tại Đại học Harvard và Nick Goldman và Ewan Birney tại Viện Tin sinh học châu Âu. "Chúng tôi tin rằng đây là thiết bị lưu trữ dữ liệu có mật độ cao nhất từ trước đến nay", Erlich nói.

 

Dung tích lưu trữ dữ liệu bằng ADN về lý thuyết giới hạn trong hai chữ số nhị phân cho mỗi nucleotide, nhưng những hạn chế sinh học của bản thân ADN và sự cần thiết phải tính đến thông tin không quan trọng để lắp ghép lại và đọc các phân đoạn sau đó làm giảm dung tích của nó đến 1,8 chữ số nhị phân cho mỗi nucleotide cơ sở. Với kỹ thuật ADN Fountain, Erlich và Zielinski đã bao gói trung bình là 1,6 bit vào mỗi nucleotide cơ sở, dung lượng dữ liệu lớn hơn ít nhất 60% so với các phương pháp được công bố trước đây và gần giới hạn 1,8 bit.

 

Chi phí vẫn là một rào cản. Các nhà nghiên cứu đã dành 7.000 USD để tổng hợp ADN được sử dụng để lưu trữ 2 MB dữ liệu và thêm 2.000 USD để đọc nó. Mặc dù giá thành của việc lập trình tự ADN đã giảm theo cấp số nhân, nhưng sẽ không giống như tổng hợp ADN. Nhưng giá thành tổng hợp ADN có thể giảm mạnh nếu các phân tử chất lượng thấp được tạo ra và việc mã hóa các chiến lược như ADN Fountain được sử dụng để sửa lỗi phân tử.

Nguồn: vista.gov.vn

Số lượt đọc: 1914

Về trang trước Về đầu trang