Forskare Använder Mindre än 1% Av De Uppgifter Som Samlats In Av Large Hadron Collider - Alternativ Vy

Forskare Använder Mindre än 1% Av De Uppgifter Som Samlats In Av Large Hadron Collider - Alternativ Vy
Forskare Använder Mindre än 1% Av De Uppgifter Som Samlats In Av Large Hadron Collider - Alternativ Vy

Video: Forskare Använder Mindre än 1% Av De Uppgifter Som Samlats In Av Large Hadron Collider - Alternativ Vy

Video: Forskare Använder Mindre än 1% Av De Uppgifter Som Samlats In Av Large Hadron Collider - Alternativ Vy
Video: Скучающие ученые теперь просто вставляют случайные вещи в большой адронный коллайдер 2024, April
Anonim

Det är tydligt när det finns ett problem att få vetenskaplig information. Men det visar sig att det finns ett problem att spara och bearbeta dem.

Hela serien av högprofilerade upptäckter gjorda med collideren baserades på analys av data, vars volym är mindre än en procent av den totala volymen genererade data.

Resten av uppgifterna går förlorade oåterkalleligt.

Den 26,7 kilometer långa kollisionstunneln används för att påskynda partiklar nära ljusets hastighet. Två strömmar av partiklar som rör sig i motsatta riktningar kolliderar vid punkter i rymden som övervakas av känsliga sensorer. Även vid den lägsta densitetsnivån för protonstrålar som innehåller 120 miljarder protoner vardera är antalet kollisioner 30 miljoner kollisioner per sekund.

Enligt information som publiceras på webbplatsen för European Organisation for Nuclear Research CERN skapar en miljard kollisioner per sekund en dataström på 1 petabyte per sekund. Och detta är det största problemet för närvarande, eftersom en dataström med en sådan hastighet helt enkelt är omöjlig att lagra, än mindre behandla den ordentligt.”Vid minst 30 miljoner kollisioner behöver vi 2 000 petabyte för att lagra resultaten från en typisk 12-timmars kollideringsfas. Vid 150 colliderlanseringar per år skulle det ta 400 000 petabyte, 400 exabyte data för att lagra alla data, en enorm mängd som vi inte ens kan lagra just nu, säger Andreas Hoecker, forskare vid CERN.

Lösningen på problemet med en stor mängd data är naturligtvis en drastisk minskning av deras volym. Och detta görs inte på bekostnad av någon informationskomprimeringsalgoritm, för detta finns det inte tillräckligt med kraft för alla processorer för befintliga superdatorer. Funktionerna med datortekniken som finns tillgängliga på CERN gör det möjligt att spara resultaten av endast 1200 kollisioner för var 30 miljon sådana fall. Detta är 0,004 procent av den totala volymen, och de återstående 99,996 procent, som nämnts ovan, går förlorade för alltid.

Image
Image

Detta tillstånd verkar vara ett fruktansvärt slöseri, men inte allt är så ledsen. Fenomen som är av verkligt intresse för forskare uppstår inte i denna takt. Till exempel visas Higgs-bosonen med en hastighet av en gång per sekund, medan andra händelser inträffar med en frekvens av tiotals eller hundratals gånger per sekund. För att lyfta fram det mest intressanta av hela dataströmmen är speciella "triggers" involverade, enheter som utför preliminär datafiltrering huvudsakligen på hårdvarunivå. Dessa triggers utvecklas för varje specifikt fall och är avstämda i enlighet med egenskaperna hos de sökta partiklarna, såsom Higgs boson, true quark, W och Z bosons, etc.

Kampanjvideo:

Naturligtvis med en sådan implementering av preliminär databehandling förloras en del av de intressanta uppgifterna tillsammans med ett berg av onödigt och ointressant "skräp". Men den återstående informationen innehåller huvudsakligen betydande data, och dess relativt blygsamma volym möjliggör redan tillräckligt djup behandling även i realtid.

Sammanfattningsvis bör det noteras att lösningen på problemet som beskrivs ovan inte på något sätt garanterar möjligheten att lagra mestadels värdelös data. Lösningen på problemet är att skapa nya sensorer för collideren, som kommer att använda de senaste prestationerna för modern teknik och som kommer att kunna tränga in i djupet i de fysiska områden som för närvarande inte är utforskade. Förresten, några av dessa sensorer kommer att dyka upp vid collideren under dess nästa modernisering som genomförs just nu. Och lanseringen av den moderniserade collideren är planerad till 2025.