Spisu treści:

Jak radzisz sobie z wartościami NA w R?
Jak radzisz sobie z wartościami NA w R?

Wideo: Jak radzisz sobie z wartościami NA w R?

Wideo: Jak radzisz sobie z wartościami NA w R?
Wideo: Jak Radzić Sobie z Silnymi Negatywnymi Emocjami 2024, Grudzień
Anonim

Podczas importowania zestawu danych z innych aplikacji statystycznych, brakujące wartości może być zakodowany liczbą, na przykład 99. Aby pozwolić r wiem, że to jest brakująca wartość musisz to przekodować. Kolejna przydatna funkcja w r do radzić sobie z brakującymi wartościami jest nie . pomija(), które usuwają niekompletne obserwacje.

Tak więc, jak radzisz sobie z NA w R?

Opcje NA w R

  1. pomiń i na. exclude: zwraca obiekt z usuniętymi obserwacjami, jeśli zawierają jakiekolwiek brakujące wartości; różnice między pomijaniem a wykluczaniem NA można zaobserwować w niektórych funkcjach predykcyjnych i rezydualnych.
  2. pass: zwraca obiekt bez zmian.
  3. fail: zwraca obiekt tylko wtedy, gdy nie zawiera braków danych.

Podobnie, jak radzisz sobie z brakującymi danymi kategorialnymi w R? Istnieją różne sposoby obsługi brakujących wartości sposobów kategorycznych.

  1. Zignoruj obserwacje braków danych, jeśli mamy do czynienia z dużymi zestawami danych, a mniejsza liczba rekordów zawiera braki danych.
  2. Zignoruj zmienną, jeśli nie jest znacząca.
  3. Opracuj model do przewidywania brakujących wartości.
  4. Traktuj brakujące dane jako kolejną kategorię.

Podobnie można zapytać, jak ustawić brakujące wartości w R?

w r , brakujące wartości są reprezentowane przez symbol Nie dotyczy (niedostępne). Niemożliwy wartości (np. dzielenie przez zero) są reprezentowane przez symbol NaN (nie liczba). W przeciwieństwie do SAS, r używa tego samego symbolu dla znaku i cyfry dane . Więcej praktyki w pracy z brakujące dane , wypróbuj ten kurs na sprzątanie dane w R.

Co oznacza Na Rm w R?

Podczas korzystania z funkcji dataframe nie . rm w r odnosi się do parametru logicznego, który mówi funkcji, czy usunąć, czy nie Nie dotyczy wartości z obliczeń. To dosłownie oznacza NA usunąć. Nie jest ani funkcją, ani operacją. Jest to po prostu parametr używany przez kilka funkcji dataframe.

Zalecana: