www.eprace.edu.pl » minos-neutrina » ANALIZA » Czystość, efektywność i moc separacji

Czystość, efektywność i moc separacji

Do oceny jakości algorytmu selekcji służą m.in. dwie wielkości: czystość (Pur) oraz efektywność (Eff) [1] [10]. Wielkości te definiuje się jako:
$\displaystyle Pur = \frac{N_{true}}{N_{true} + N_{false}} $ $\displaystyle Eff = \frac{N_{true}}{N_{all}}\\ $
gdzie Ntrue oznacza ilość poprawnie wyselekcjonowanych przypadków, Nfalse ilość niepoprawnie wyselekcjonowanych przypadków, Nall oznacza ilość wszystkich przypadków Monte Carlo.

W celu uproszczenia zapisu, wielkości Pur i Eff można zapisać w postaci:
$\displaystyle Pur = \frac{n}{n+m} $ $\displaystyle Eff = \frac{n}{N} $

W szczególności na tej podstawie można wyznaczyć błędy czystości i efektywności z rozkładu dwumianowego:
$\displaystyle {\Delta}Pur = \sqrt{\frac{Pur (1 - Pur)}{n + m}} $ $\displaystyle {\Delta}Eff = \sqrt{\frac{Eff (1 - Eff)}{N}} $

Na podstawie powyższych wzorów wyznaczono słupki błędów na wykresach czystości i efektywności (rys. 5.18 i 5.19).

Innym wyznacznikiem stopnia poprawności działania algorytmu selekcji jest tzw. moc separacji S (ang. separation power) zdefiniowana jako:
$\displaystyle S = \frac{{\epsilon}_s}{{\epsilon}_t} = \frac{\frac{N_{s,wyselekcjonowane}}{N_{s,calkowite}}}{\frac{N_{t,wyselekcjonowane}}{N_{t,calkowite}}} $
gdzie Ns,wyselekcjonowane to liczba wyselekcjonowanych przypadków sygnału, Ns,calkowite to całkowita liczba przypadków sygnału, Nt,wyselekcjonowane liczba wyselekcjonowanych przypadków tła, oraz Nt,calkowite to całkowita liczba przypadków tła. Innymi słowy licznik stanowi efektywność liczenia sygnału, a mianownik to stosunek liczby przypadków tła zaklasyfikowanych jako sygnał w danym cięciu do ilości wszystkich przypadków tła. Pojęcie sygnału i tła jest subiektywne. W przypadku, gdy rozpatrywana jest selekcja CC, wówczas sygnałem są przypadki CC, a tłem NC. W przypadku selekcji NC jest na odwrót.

W rozpatrywanej metodzie selekcji przypadków CC i NC za pomocą cięć, moce separacji wynoszą kolejno:

Histogramy czystości i efektywności w zależności od energi zmierzonej w detektorze dla selekcji zoptymalizowanej na CC zamieszczono na rysunku 5.18.

Rysunek 5.18: Czystość (lewy) i efektywność (prawy) dla przypadków CC w zależności od energii [GeV]

Image PurCC Image EffCC

Średnie wartości czystości i efektywności dla selekcji CC:

Dla selekcji zoptymalizowanej na NC wykresy Pur i Eff przedstawiono na rys. 5.19.

Rysunek 5.19: Czystość (lewy) i efektywność (prawy) dla przypadków NC w zależności od energii [GeV]

Image PurNC Image EffNC

Średnie wartości czystości i efektywności dla selekcji NC:

Z rysunku 5.4 wynika, iż większość (59%) przypadków posiada energię mniejszą niż 5 GeV. W związku z tym wykresy 5.18 i 5.19 należy analizować głównie w tym obszarze.

Otrzymane wartości czystości i efektywności są dobre zważywszy fakt, iż do selekcji użyto trzech relatywnie prostych zmiennych. Dla niskich energii ( < 2GeV ) wyraźnie dobra (Pur i Eff powyżej 60%) jest selekcja NC, natomiast dla większych energii ( > 3GeV ) czystość i efektywność selekcji zoptymalizowanej na CC wynosi ponad 85%. Odpowiednio modyfikując algorytm i zmieniając miejsca cięć, można otrzymać lepsze wartości czystości kosztem efektywności i na odwrót.

Selekcja NC jest wyraźnie gorsza niż CC. Powodem jest bardzo trudna separacja przypadków typu NC. W obszarze niskich energii (a NC głównie tam się znajdują) przypadki typu NC niewiele się różnią od CC, kiedy to mion praktycznie nie opuszcza towarzyszącej mu kaskady (patrz rozdz. 5.1).

komentarze

Copyright © 2008-2010 EPrace oraz autorzy prac.