>

각종 제품 (csv 파일)을 판매하여 회사의 매출에 대한 데이터를 보유하고 있는데 그 중 하나는 다음과 같습니다.

> abc
   Order.Week..BV. Product.Number Quantity Net.ASP Net.Price
1         2013-W44        ABCDEF       92  823.66       749
2         2013-W44        ABCDEF       24  898.89       749
3         2013-W44        ABCDEF      243  892.00       749
4         2013-W45        ABCDEF       88  796.84       699
5         2013-W45        ABCDEF       18  744.80       699

이제 Net.Price는 Y, 수량, Net.ASP는 x1과 x2 인 다중 회귀 모델을 사용하고 있습니다. 100 개가 넘는 파일이 있으며 다음 코드를 사용하여 시도하고 있습니다.

fileNames <- Sys.glob("*.csv")
for (fileName in fileNames) {      
abc <- read.csv(fileName, header = TRUE, sep = ",")
fit <- lm(Net.Price ~ Quantity + Net.ASP, data = abc)
x <- data.frame (abc, summary(fit))
write.csv (x, file = fileName)
}

이제 x <- data.frame (abc, summary(fit)) 라인을 이해합니다   Error in as.data.frame.default(x[[i]], optional = TRUE, stringsAsFactors = stringsAsFactors) : cannot coerce class ""summary.lm"" to a data.frame 가 말하는 것처럼 잘못되었습니다.  그러나 각 CSV 파일에 대한 회귀 모델 요약을 파일 자체에 작성하고 싶습니다. 도와주세요.

  • 답변 # 1

    데이터 세트와 의견을 제공하면 다음과 같은 작업을 수행합니다

    abc <- read.table(text = "
    Order.Week..BV.    Product.Number    Quantity    Net.ASP    Net.Price
    1         2013-W44        ABCDEF       92  823.66       749
    2         2013-W44        ABCDEF       24  898.89       749
    3         2013-W44        ABCDEF      243  892.00       749
    4         2013-W45        ABCDEF       88  796.84       699
    5         2013-W45        ABCDEF       18  744.80       699", header = T) # Yor data
    fit <- lm(Net.Price ~ Quantity + Net.ASP, data = abc)
    x <- cbind(abc, t(as.numeric(coefficients(fit))), t(as.numeric(summary(fit)$coefficients[, 4])), summary(fit)$r.squared)
    names(x)[(length(x) - 6):length(x)] <- c(paste("coeff", names(coefficients(fit))), paste("P-value", names(summary(fit)$coefficients[, 4])), "R-squared")
    
    

    누가 돌아올 것인가

     Order.Week..BV. Product.Number Quantity Net.ASP Net.Price coeff (Intercept) coeff Quantity coeff Net.ASP P-value (Intercept) P-value Quantity
    1        2013-W44         ABCDEF       92  823.66       749          434.0829    0.001853692     0.3545852          0.09474093        0.9898202
    2        2013-W44         ABCDEF       24  898.89       749          434.0829    0.001853692     0.3545852          0.09474093        0.9898202
    3        2013-W44         ABCDEF      243  892.00       749          434.0829    0.001853692     0.3545852          0.09474093        0.9898202
    4        2013-W45         ABCDEF       88  796.84       699          434.0829    0.001853692     0.3545852          0.09474093        0.9898202
    5        2013-W45         ABCDEF       18  744.80       699          434.0829    0.001853692     0.3545852          0.09474093        0.9898202
      P-value Net.ASP R-squared
    1       0.1865054 0.7165826
    2       0.1865054 0.7165826
    3       0.1865054 0.7165826
    4       0.1865054 0.7165826
    5       0.1865054 0.7165826
    
    

  • 답변 # 2

    다음을 사용하여 텍스트 파일에 매우 쉽게 쓸 수 있습니다

    sink("summary.txt")
    summary(lm)
    sink()
    
    

  • 이전 hsqldb - hsqlexception"무결성 제약 위반 - 외래 키 부모 없음"은 무엇을 의미합니까?
  • 다음 로컬 볼륨 이름에 대한 도커 유효하지 않은 문자