Próbuję zmienić nową zmienną w zależności od średniej funkcji każdej grupy. Próbowałem uruchomić ten kod za pomocą wstępnie załadowanej ramy danych "zęba" dostępne w R.

Wyniki Wyniki są nieprawidłowe, wydaje się, że zapętla środki każdej grupy jako listy zamiast przypisywać do każdej grupy.

Diagram pokazujący, co próbuję osiągnąć:

image of what I am trying to achive, How to mutate by groups?

data("ToothGrowth")
head(ToothGrowth)

tg.tb01<-ToothGrowth %>% 
group_by(supp, dose) %>% # mydata has 3 more variables. 
  summarise(mean = mean(len)) %>% 
  print()
ToothGrowth %>% 
  group_by(supp) %>%
  mutate(submean2 = len - tg.tb01$mean/tg.tb01$dose)
4
Marcello 18 marzec 2020, 16:26

2 odpowiedzi

Najlepsza odpowiedź

Nie potrzebujesz innego zestawu danych do przechowywania średniej. Zobacz poniżej:

library(dplyr)
library(datasets)

ToothGrowth %>% 
  group_by(supp, dose) %>%
  mutate(lenmean = mean(len),
         submean2 = len - lenmean/dose)

#> # A tibble: 60 x 5
#> # Groups:   supp, dose [6]
#>      len supp   dose lenmean submean2
#>    <dbl> <fct> <dbl>   <dbl>    <dbl>
#>  1   4.2 VC      0.5    7.98   -11.8 
#>  2  11.5 VC      0.5    7.98    -4.46
#>  3   7.3 VC      0.5    7.98    -8.66
#>  4   5.8 VC      0.5    7.98   -10.2 
#>  5   6.4 VC      0.5    7.98    -9.56
#>  6  10   VC      0.5    7.98    -5.96
#>  7  11.2 VC      0.5    7.98    -4.76
#>  8  11.2 VC      0.5    7.98    -4.76
#>  9   5.2 VC      0.5    7.98   -10.8 
#> 10   7   VC      0.5    7.98    -8.96
#> # ... with 50 more rows
2
M-- 20 marzec 2020, 16:39

Jeśli poprawnie rozumiem, powinieneś użyć zamiast tego. Określ żądane wyjście z numerami.

tg.tb01<-ToothGrowth %>% 
    group_by(supp, dose) %>%
    mutate(mean = mean(len)) %>%
    ungroup() %>%
    group_by(supp) %>%
    mutate(submean2 = len - mean/dose)
2
M-- 18 marzec 2020, 14:12