如何使用回顾窗口获取data.table中的快速摘要？

作者: 一腔诗意喂了狗
发布时间: 2024-12-18 02:18:36 (2月前)
转自：

3 条回复

0#
回复此人
只怕再见是故人 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 你可以试试 </p> <pre> <code> dt <- fread("ID Time Time-2D Col Count A 2017-06-05 2017-06-03 M 1 A 2017-06-02 2017-05-31 M 1 A 2017-06-03 2017-06-01 M 1 B 2017-06-02 2017-05-31 K 1 B 2017-06-01 2017-05-30 M 4") dt1 <- dcast(dt, ID+Time+`Time-2D`~Col, value.var = c("Count")) dt1[, K := ifelse(is.na(K), 0, K)] dt1[, M := ifelse(is.na(M), 0, M)] ID Time Time-2D K M 1: A 2017-06-02 2017-05-31 0 1 2: A 2017-06-03 2017-06-01 0 1 3: A 2017-06-05 2017-06-03 0 1 4: B 2017-06-01 2017-05-30 0 4 5: B 2017-06-02 2017-05-31 1 0 dt1[, Col_K := K/(K+M)] dt1[, Col_M := M/(K+M)] ID Time Time-2D K M Col_K Col_M 1: A 2017-06-02 2017-05-31 0 1 0 1 2: A 2017-06-03 2017-06-01 0 1 0 1 3: A 2017-06-05 2017-06-03 0 1 0 1 4: B 2017-06-01 2017-05-30 0 4 0 1 5: B 2017-06-02 2017-05-31 1 0 1 0 </code> </pre> <P> 也许你可以结合最后两行。就像是 </p> <pre> <code> dt1[, `:=`()] </code> </pre> </DIV>

编辑
1#
回复此人
࿏自ོ༾由ོ༽人͙⃡⌇ | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 我想我理解你的要求。你似乎关心观察的顺序，例如，无论是第二次观察 <code> Time </code> 是在第一次观察之前 <code> Time </code> 。这没有多大意义，但这是一个退出高效的data.table解决方案，以实现这一目标。这基本上是一个 <EM> 非等距 </EM> 加入 <code> ID </code> ， <code> Col </code> ，两者 <code> Time </code> 列 <EM> 和 </EM> 行索引（基本上是外观顺序）。事后，它只是 <code> dcast </code> 从长到高转换（如在上一个问题中）。请注意，结果按日期排序，但我保留了 <code> rowindx </code> 变量，因此您可以使用重新排序 <code> setorder </code> 。此外，我将保持比率calc给你，因为这是非常基本的（提示 - <EM> 别 </EM> 使用循环，它是一个完全矢量化的一个班轮） </p> <pre> <code> library(data.table) #v1.10.4+ ## Read the data DT <- fread("ID Time Col Count A 2017-06-05 M 1 A 2017-06-02 M 1 A 2017-06-03 M 1 B 2017-06-02 K 1 B 2017-06-01 M 4") ## Prepare the variables we need for the join DT[, Time := as.IDate(Time)] DT[, Time_2D := Time - 2L] DT[, rowindx := .I] ## Non-equi join, sum `Count` by each join DT2 <- DT[DT, sum(Count), on = .(ID, Col, rowindx <= rowindx, Time <= Time, Time >= Time_2D), by = .EACHI] ## Fix column names (a known issue) setnames(DT2, make.unique(names(DT2))) ## Long to wide (You can reorder back using `rowindx` and `setorder` function) dcast(DT2, ID + Time + Time.1 + rowindx ~ Col, value.var = "V1", fill = 0) # ID Time Time.1 rowindx K M # 1: A 2017-06-02 2017-05-31 2 0 1 # 2: A 2017-06-03 2017-06-01 3 0 2 # 3: A 2017-06-05 2017-06-03 1 0 1 # 4: B 2017-06-01 2017-05-30 5 0 4 # 5: B 2017-06-02 2017-05-31 4 1 0 </code> </pre> </DIV>

编辑

登录后才能参与评论