Trong khi các tập đoàn công nghệ đang thường xuyên xây dựng các trung tâm dữ liệu khổng lồ để lưu trữ thông tin, một nhóm nghiên cứu đã phát triển thành công một hệ thống dữ liệu sử dụng các phân tử ADN.
Giờ đây, với kỹ thuật mới được phát triển bởi trường Đại học Washington và các nhà nghiên cứu từ tập đoàn Microsoft, chúng ta đã có thể giảm thiểu không gian cần thiết để lưu trữ các dữ liệu kỹ thuật số. Thậm chí, một khối lượng dữ liệu cần đến một không gian lưu trữ ngang bằng một đại siêu thị Walmart cũng có thể được thu nhỏ chỉ còn kích thước một viên đường.
Tại một hội nghị quốc tế, một nhóm các nhà khoa học máy tính và kỹ sư điện tử đã trình bày chi tiết một trong những hệ thống hoàn chỉnh đầu tiên cho việc mã hóa, lưu trữ và truy xuất dữ liệu kỹ thuật số sử dụng các phân tử ADN, với khả năng lưu trữ thông tin gọn nhẹ hơn hàng triệu lần so với các công nghệ hiện hành, theo một thông cáo báo chí của trường Đại học Washington.
Trong một thí nghiệm, nhóm nghiên cứu đã mã hóa thành công dữ liệu kỹ thuật số từ 4 tệp tin hình ảnh vào các trình tự nucleotide của các đoạn phân tử ADN tổng hợp. Đáng ngạc nhiên hơn là, họ đã có thể “đảo ngược quá trình này ー khôi phục chính xác các trình tự từ một biển dữ liệu ADN và tái khôi phục các hình ảnh mà không bỏ sót dù chỉ 1 bít (byte) thông tin nào.
Ông Luis Ceze, phó giáo sư ngành kỹ thuật và khoa học máy tính tại trường Đại học Washington và đồng tác giả nghiên cứu, đã nói trong một tuyên bố:
Sự sống đã tạo ra cái phân tử tuyệt diệu được gọi là ADN này, với khả năng lưu trữ hiệu quả tất cả các dạng thức thông tin về các gen di truyền của bạn và cơ chế hoạt động của một hệ thống sống — nó rất, rất là gọn nhẹ và cực kỳ lâu bền.
Về cơ bản chúng tôi đang thay đổi công năng của các phân tử ADN hướng tới việc lưu trữ các dữ liệu kỹ thuật số — hình ảnh, video, văn bản — theo một cách thức có thể được quản lý trong hàng trăm hoặc hàng nghìn năm.
Các nhà nghiên cứu tin rằng các phân tử ADN sẽ có thể lưu trữ dữ liệu cô đặc hơn hàng triệu lần so với bất kỳ công nghệ nào hiện nay. Một ưu điểm khác cần kể đến là, trong khi công nghệ lưu trữ dữ liệu hiện hành sẽ bị thoái hóa sau vài năm hoặc vài thập kỷ, ADN trái lại sẽ chắc chắn có thể được bảo quản trong hàng thế kỷ với dữ liệu còn nguyên.
Tuy nhiên, ADN là thích hợp nhất cho việc lưu trữ dữ liệu, nhưng lại không phù hợp nếu người dùng muốn truy cập tức thì các file khi cần đến. Nhóm nghiên cứu đang phát triển một hệ thống lưu trữ dựa trên ADN, và kỳ vọng rằng nó sẽ có thể giải quyết nhu cầu lưu trữ dữ liệu của thế giới.
Để phát triển hệ thống này, đầu tiên nhóm nghiên cứu đã chuyển đổi các dãy số nhị phân gồm hai số 0 và 1 dưới dạng dữ liệu kỹ thuật số (cơ chế lưu trữ dữ liệu trong máy tính) thành 4 khối xây dựng cơ bản (building block) tạo nên các trình tự ADN: adenine (A), guanine (G), cytosine (C), và thymine (T).
Georg Seelig, phó giáo sư ngành kỹ thuật và khoa học máy tính và kỹ thuật điện tử tại trường Đại học Washington và đồng tác giả nghiên cứu, nói:
Bạn làm cách nào để đi từ những dãy số nhị phân hợp thành từ hai số 0 và 1 cho đến các gốc A, G, C, T, đây là một điều rất quan trọng vì nếu bạn sử dụng một phương pháp khéo léo, bạn sẽ có thể khiến mật độ [lưu trữ dữ liệu] trở nên cực kỳ dày đặc và không xuất hiện nhiều sai sót, nhưng nếu bạn làm không đúng cách, bạn sẽ gặp phải rất nhiều lỗi dữ liệu.
Dữ liệu kỹ thuật số được chia ra thành từng mảnh nhỏ và sau đó được lưu trữ bằng cách tổng hợp một lượng lớn các phân tử nhỏ ADN, vốn sau đó sẽ có thể được khử nước hoặc bảo quản để lưu trữ trong dài hạn.
Các nhà nghiên cứu này cũng là một trong số hai nhóm nghiên cứu duy nhất tại Mỹ có khả năng tiến hành “truy cập ngẫu nhiên” — xác định và truy xuất các trình tự ADN chính xác từ biển phân tử ADN ngẫu nhiên (tương tự việc ráp lại một chương của một cuốn sách từ một thư viện tràn ngập những cuốn sách bị xé rách), theo như thông cáo báo chí của Đại học Washington.
Để truy cập dữ liệu, các nhà nghiên cứu đã mã hóa một dạng thông tin giống với mã bưu chính và địa chỉ các con phố vào trong các trình tự ADN. Bằng cách sử dụng kỹ thuật ‘Phản ứng chuỗi trùng hợp’ [1] (thường được sử dụng trong sinh học phân tử) họ sẽ có thể dễ dàng xác định được ‘mã bưu chính’ mà họ cần tìm.
Sau đó bằng kỹ thuật sắp xếp trình tự ADN, họ sẽ có thể “đọc” được dữ liệu và chuyển đổi nó trở lại thành hình ảnh, băng video hay file văn bản bằng cách sử dụng các địa chỉ con phố để sắp xếp lại các dữ liệu.
Tuy nhiên, một nhược điểm cần được khắc phục là chi phí và hiệu quả để tổng hợp (hoặc sản xuất) ADN và sắp xếp (hoặc đọc) trên quy mô lớn.
Tác giả: Troy Oakes, Vision times
Đăng tải với sự cho phép. Đọc bản gốc tại đây.
Thạch Khánh biên dịch
Chú thích của người dịch:
[1] Phản ứng chuỗi trùng hợp (cũng được gọi là Phản ứng khuếch đại gen – Polymerase Chain Reaction/ PCR): một kỹ thuật nhằm tạo ra nhiều bản sao của 1 đoạn ADN mà không cần sử dụng thực thể sống như E.coli hay nấm men. PCR được sử dụng trong các nghiên cứu sinh học và y học phục vụ nhiều mục đích khác nhau, như phát hiện các bệnh di truyền, nhận dạng, chẩn đoán những bệnh nhiễm trùng, tách dòng gene, và xác định huyết thống.
Xem thêm: