Forskere Bruger Mindre End 1% Af De Data, Der Er Indsamlet Af Large Hadron Collider - Alternativ Visning

Forskere Bruger Mindre End 1% Af De Data, Der Er Indsamlet Af Large Hadron Collider - Alternativ Visning
Forskere Bruger Mindre End 1% Af De Data, Der Er Indsamlet Af Large Hadron Collider - Alternativ Visning

Video: Forskere Bruger Mindre End 1% Af De Data, Der Er Indsamlet Af Large Hadron Collider - Alternativ Visning

Video: Forskere Bruger Mindre End 1% Af De Data, Der Er Indsamlet Af Large Hadron Collider - Alternativ Visning
Video: Bored Scientists Now Just Sticking Random Things Into Large Hadron Collider 2024, April
Anonim

Det er klart, når der er et problem med at indhente videnskabelige data. Men det viser sig, at der er et problem at gemme og behandle dem.

Hele serien af høje profilopdagelser, der blev foretaget med collideren, var baseret på analysen af data, hvis volumen er mindre end en procent af den samlede mængde genererede data.

Resten af dataene mistes uopretteligt.

Den 26,7 kilometer lange kollideretunnel bruges til at accelerere partikler tæt på lysets hastighed. To strømme af partikler, der bevæger sig i modsatte retninger, kolliderer på steder i rummet, der overvåges af følsomme sensorer. Selv ved det laveste densitetsniveau af protonstråler, der indeholder 120 milliarder protoner hver, er antallet af kollisioner 30 millioner kollisioner pr. Sekund.

Ifølge oplysninger offentliggjort på webstedet for Den Europæiske Organisation for Nuklear Forskning CERN skaber en milliard kollisioner i sekundet en datastrøm på 1 petabyte per sekund. Og dette er det største problem på nuværende tidspunkt, da en datastrøm med en sådan hastighed simpelthen er umulig at opbevare, så meget mindre at behandle den ordentligt.”Ved mindst 30 millioner kollisioner har vi brug for 2.000 petabytes for at gemme resultaterne af en typisk 12-timers colliderfase. Ved 150 collider-lanceringer pr. År ville det kræve 400.000 petabyte, 400 exabyte med data at gemme alle data, en enorm mængde, som vi ikke engang kan gemme på nuværende tidspunkt,”siger Andreas Hoecker, videnskabsmand ved CERN.

Løsningen på problemet med en stor mængde data er naturligvis en drastisk reduktion i deres volumen. Og dette gøres ikke på bekostning af nogen informationskomprimeringsalgoritmer, for dette er der ikke nok strøm til alle processorer i eksisterende supercomputere. Funktionerne ved den computerteknologi, der er tilgængelig på CERN, gør det muligt at gemme resultaterne af kun 1200 sammenstød for hver 30 million sådanne tilfælde. Dette er 0,004 procent af det samlede volumen, og de resterende 99.996 procent, som nævnt ovenfor, går tabt for evigt.

Image
Image

Denne situation ser ud som et forfærdeligt spild, men ikke alt er så trist. Fænomener, der er af reel interesse for forskere, opstår ikke i denne sats. For eksempel vises Higgs-bosen med en hastighed på en gang i sekundet, mens andre begivenheder forekommer med en frekvens på titusinder eller hundreder af gange pr. Sekund. For at fremhæve det mest interessante af hele datastrømmen involveres specielle "triggere", enheder, der udfører foreløbig datafiltrering hovedsageligt på hardwareniveau. Disse triggere er udviklet til hvert specifikt tilfælde og er afstemt i overensstemmelse med egenskaberne for de søgte partikler, såsom Higgs boson, sand kvark, W og Z bosoner osv.

Salgsfremmende video:

Selvfølgelig med en sådan implementering af den foreløbige databehandling går nogle af de interessante data tabt sammen med et bjerg af unødvendig og uinteressant "affald". Men de resterende oplysninger indeholder hovedsageligt betydelige data, og dets relativt beskedne volumen muliggør allerede tilstrækkelig dyb behandling selv i realtid.

Og afslutningsvis skal det bemærkes, at løsningen på det ovenfor beskrevne problem på ingen måde sikrer muligheden for at gemme overvejende ubrukelige data. Løsningen på problemet er at skabe nye sensorer til collideren, der vil bruge de nyeste resultater af moderne teknologier, og som vil være i stand til at trænge ind i dybderne i de i øjeblikket uudforskede fysiske områder. Forresten, nogle af disse sensorer vises på collideren i løbet af dens næste modernisering, der udføres lige nu. Og lanceringen af den moderniserede collider er planlagt til 2025.