Spisu treści:

Jakie są wartości odstające w analizie danych?
Jakie są wartości odstające w analizie danych?

Wideo: Jakie są wartości odstające w analizie danych?

Wideo: Jakie są wartości odstające w analizie danych?
Wideo: Finding an outlier in a dataset using Python 2024, Może
Anonim

W statystykach an odstający jest dane punktktóry znacznie różni się od innych obserwacji. jakiś odstający może wynikać ze zmienności pomiaru lub może wskazywać na błąd eksperymentalny; te ostatnie są czasami wykluczone z dane ustawić. jakiś odstający może powodować poważne problemy w Analizy statystyczne.

Biorąc to pod uwagę, jak znaleźć wartości odstające w danych?

Punkt, który wypada poza dane wewnętrzne ogrodzenia zestawu są klasyfikowane jako małoletnie odstający , natomiast ten, który wychodzi poza zewnętrzne ogrodzenia, jest klasyfikowany jako major odstający . Aby znaleźć wewnętrzne ogrodzenia dla swojego dane ustaw najpierw pomnóż zakres międzykwartylowy przez 1,5. Następnie dodaj wynik do Q3 i odejmij go od Q1.

Poza powyższym, czy powinienem usunąć z moich danych odstających? Do ten w większości, jeśli Twoje dane są dotknięte tymi ekstremalnymi przypadkami, ty Móc uwiązany ten wkład do historycznego przedstawiciela Twoje dane to wyklucza odstające . Określ indywidualnie dla każdego przypadku, co ten Efekt odstające było. A stamtąd zdecyduj, czy chcesz usunąć , zmień lub zachowaj odstający wartości.

W związku z tym, jak analiza danych radzi sobie z wartościami odstającymi?

Oto cztery podejścia:

  1. Odrzuć rekordy odstające. W przypadku Billa Gatesa lub innego prawdziwego odstania czasami najlepiej jest całkowicie usunąć ten rekord ze zbioru danych, aby ta osoba lub wydarzenie nie wypaczyły Twojej analizy.
  2. Ogranicz dane o wartościach odstających.
  3. Przypisz nową wartość.
  4. Spróbuj transformacji.

Jaki jest przykład wartości odstającej?

Odstający . more Wartość, która "leży na zewnątrz" (znacznie mniejsza lub większa niż) większość innych wartości w zbiorze danych. Do przykład w wynikach 25, 29, 3, 32, 85, 33, 27, 28 zarówno3, jak i 85 to „ odstające ".

Zalecana: