I dataanalys kan du sortera dina data enligt en viss variabel i datasetet. I R kan vi använda hjälp av funktionsordningen (). I R kan vi enkelt sortera en vektor av kontinuerlig variabel eller faktorvariabel. Ordna data kan vara i stigande eller fallande ordning.
Syntax:
sort(x, decreasing = FALSE, na.last = TRUE):
Argument:
- x : En vektor som innehåller kontinuerlig eller faktorvariabel
- minskande : Kontroll för sorteringsmetodens ordning. Som standard är minskningen inställd på "FALSE".
- sista : Indikerar om '' NA '' - värdet ska sättas sist eller inte
Exempel 1
Vi kan till exempel skapa en tibble-dataram och sortera en eller flera variabler. En tibble-dataram är ett nytt tillvägagångssätt för dataramen. Det förbättrar syntaxen för dataramen och undviker frustrerande datatypsformatering, särskilt för tecken till faktor. Det är också ett bekvämt sätt att skapa en dataram för hand, vilket är vårt syfte här. För att lära dig mer om tibble, se vignetten: https://cran.r-project.org/web/packages/tibble/vignettes/tibble.html
library(dplyr)set.seed(1234)data_frame <- tibble(c1 = rnorm(50, 5, 1.5),c2 = rnorm(50, 5, 1.5),c3 = rnorm(50, 5, 1.5),c4 = rnorm(50, 5, 1.5),c5 = rnorm(50, 5, 1.5))# Sort by c1df <-data_frame[order(data_frame$c1),]head(df)
Produktion:
# A tibble: 6 x 5## c1 c2 c3 c4 c5#### 1 1.481453 3.477557 4.246283 3.686611 6.0511003## 2 1.729941 5.824996 4.525823 6.753663 0.1502718## 3 2.556360 6.275348 2.524849 6.368483 5.4787404## 4 2.827693 4.769902 5.120089 3.743626 4.0103449## 5 2.988510 4.395902 2.077631 4.236894 4.6176880## 6 3.122021 6.317305 5.413840 3.551145 5.6067027
Exempel 2
# Sort by c3 and c4df <-data_frame[order(data_frame$c3, data_frame$c4),]head(df)
Produktion:
# A tibble: 6 x 5## c1 c2 c3 c4 c5#### 1 2.988510 4.395902 2.077631 4.236894 4.617688## 2 2.556360 6.275348 2.524849 6.368483 5.478740## 3 3.464516 3.914627 2.730068 9.565649 6.016123## 4 4.233486 3.292088 3.133568 7.517309 4.772395## 5 3.935840 2.941547 3.242078 6.464048 3.599745## 6 3.835619 4.947859 3.335349 4.378370 7.240240
Exempel 3
# Sort by c3(descending) and c4(acending)df <-data_frame[order(-data_frame$c3, data_frame$c4),]head(df)
Produktion:
# A tibble: 6 x 5## c1 c2 c3 c4 c5#### 1 4.339178 4.450214 8.087243 4.5010140 8.410225## 2 3.959420 8.105406 7.736312 7.1168936 5.431565## 3 3.339023 3.298088 7.494285 5.9303153 7.035912## 4 3.397036 5.382794 7.092722 0.7163620 5.620098## 5 6.653446 4.733315 6.520536 0.9016707 4.513410## 6 4.558559 4.712609 6.380086 6.0562703 5.044277