Jak metoda jedna-vs-One działa na zestaw testowy w klasyfikacji multiclass? Rozumiem, jak wygenerowały podzbiory każdej pary do zestawu treningowego, ale jak jest używany na zestawie testowym? Przeczytałem coś o większości głosów, ale nie mogę znaleźć niczego, co te głosy są lub jak pracują moje przezroczyste, jest to, że głosy są obserwacjami oznaczonymi jako pozytywne / negatywne w parę zajęć.

Jak to rozumiem:

Jeśli mam trzy pary A VS B, A VS C, B VS C, i chcę przewidzieć C, wówczas muszę użyć A VS C, jeśli ta para ma więcej wartości negatywnych niż b VS C?

0
Paweł P 20 październik 2020, 18:56

1 odpowiedź

Najlepsza odpowiedź

Twoja intuicja jest prawie właściwa, Głosy dla każdej klasy reprezentuje liczbę czasu, w której klasa wygrała pojedynku w porównaniu z inną klasą , ujemne, nie są po prostu podejmowane w koncie.

Aby zilustrować, jak działa jeden w porównaniu z jednym klasyfikatorem, weźmy prosty przykład, z 4 klasami "czerwonym", "niebieskim", "zielonym", "żółtym". Będziemy musieli trenować K * (K -1) / 2 klasyfikatory (K jest liczbą zajęć).

Aby trenować model, każdy podzbiór 2 klas zostanie wykorzystany do trenowania klasyfikatora binarnego, więc będziemy trenować łącznie 4 * (4 - 1) / 2 w naszym przypadku 6 klasyfikatorów:

  • Klasyfikator 1: Czerwony vs niebieski
  • Klasyfikator 2: Czerwony Vs Green
  • Klasyfikator 3: Czerwony vs Yellow
  • Klasyfikator 4: Niebieski vs Green
  • Klasyfikator 5: niebieski vs yellow
  • Klasyfikator 6: Zielony vs Yellow

Teraz weźmy pojedynczy element testowy, prowadzimy wszystkie nasze klasyfikacje binarne na nim, oto wynik:

  • Klasyfikator 1: Czerwony
  • Klasyfikator 2: Czerwony
  • Klasyfikator 3: Czerwony
  • Klasyfikator 4: Niebieski
  • Klasyfikator 5: żółty
  • Klasyfikator 6: Zielony

Jak widać powyżej, niebieski, żółty i zielony zdobył tylko 1 pojedynek, podczas gdy Red wygrał 3 pojedynki. Nasz klasyfikator multiclass przewiduje, że ta instancja jest czerwona

1
Émilien F 22 październik 2020, 12:24