Syntetické polymery jsou pro dlouhodobá úložiště alternativou ke konvenčním paměťovým médiím, protože uchovávají informace při menší spotřebě místa a energie. Vyhledávání dat pomocí hmotnostní spektrometrie však omezuje délku, a tím i kapacitu ukládání jednotlivých polymerních řetězců. Vědci nyní představili metodu, která toto omezení překonává a umožňuje přímý přístup ke konkrétním bitům bez nutnosti číst celý řetězec.
Pro dlouhodobou archivaci velkého množství dat, která nevyžadují častý přístup, jsou alternativou pro disky i páskové systémy makromolekuly s definovanou sekvencí, jako je DNA a syntetické polymery.
Syntetické polymery mají oproti DNA některé výhody: jednoduchou syntézu, vyšší hustotu záznamu a stabilitu v náročných podmínkách. Jejich nevýhodou je, že informace zakódovaná v polymerech bylo dosud třeba číst pomocí hmotnostní spektrometrie (MS) nebo tandemového hmotnostního sekvenování (MS2). U těchto metod musí být omezena velikost molekul, což značně limituje i maximální kapacitu každého použitého polymerního řetězce. Kromě toho musí být celý řetězec dekódován sekvenčně, blok po bloku – k bitům, které nás zajímají, nelze přistupovat přímo. Naproti tomu dlouhé řetězce DNA lze rozřezat na fragmenty náhodné délky, sekvenovat je jednotlivě a poté výpočetně rekonstruovat do původní sekvence.
Kyoung Taek Kim ze Soulské národní univerzity a jeho kolegové nyní vyvinuli novou metodu, pomocí níž lze efektivně dekódovat i velmi dlouhé syntetické polymerní řetězce, jejichž molekulová hmotnost výrazně přesahuje limity MS a MS2.
Jako demonstraci vědci zakódovali adresu své univerzity do ASCII a převedl ji spolu s kódem detekce chyb (CRC, cyclic redundancy check, cyklický kontrolní součet) na binární kód. Tuto 512bitovou sekvenci uložili do polymerního řetězce složeného ze dvou různých monomerů: kyseliny mléčné, která reprezentovala jedničku, a kyseliny fenylmléčné pro nulu. V nepravidelných intervalech zahrnuli také fragmentační kódy obsahující kyselinu mandlovou. Při chemické aktivaci se řetězce v těchto místech přetrhnou.
Při své demonstraci získali 18 fragmentů různých velikostí, které bylo možné jednotlivě dekódovat pomocí sekvenování MS2.
Speciálně vyvinutý software zpočátku identifikoval fragmenty podle jejich hmotnosti a koncových skupin. Fragmenty bylo možné sekvenovat na základě rozdílu hmotností jednotlivých částí. Pomocí kódu detekce chyb CRC pak software rekonstruoval sekvenci celého řetězce, čímž překonal limit délky polymerních řetězců. Tým byl také schopen dekódovat zajímavé bity bez sekvenování celého polymerního řetězce (tedy náhodný přístup), například slovo „chemie“ v kódu jejich adresy. Protože všechny části adresy byly ve specifickém pořadí (oddělení, instituce, město, poštovní směrovací číslo, země) a odděleny čárkami, dokázali autoři studie izolovat místo, kde je v řetězci uložena požadovaná informace, a sekvenovat pouze příslušné fragmenty.
Heejeong Jang et al, Shotgun Sequencing of 512‐mer Copolyester Allows Random Access to Stored Information, Angewandte Chemie International Edition (2024). DOI: 10.1002/anie.202415124
Zdroj: Wiley / Phys.org, přeloženo / zkráceno