如何匹配2个文件并使用R中的if循环获取所需数据？

作者: 哈哈
发布时间: 2025-02-02 03:37:23 (1月前)
转自：

3 条回复

0#
回复此人
早岁那知世事艰 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 我希望这个能帮上忙， </p> <pre> <code> dplyr::filter(merge(df1, df2, by='Chr'), Location >= Start, Location <= End) </code> </pre> <P> 使用数据表： </p> <pre> <code> dt <- data.table(merge(df1, df2, by='Chr')) dt[Location >= Start & Location <= End] </code> </pre> </DIV>

编辑
1#
回复此人
薄情 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 在当前devel版本的data.table中， <code> non-equi </code> 联接已实施。您可以按照说明进行安装 <a href="https://github.com/Rdatatable/data.table/wiki/Installation" rel="nofollow"> 这里 </A> 。有了这个，这可以非常有效地完成如下： </p> <pre> <code> setDT(DF2)[DF1, .(Chr, Start, End, Region, Site, Gene), on = .(Chr, Location>=Start, Location<=End)] # Chr Start End Region Site Gene # 1: chr6 3324 3360 Region1 Site3 GeneM # 2: chr6 3324 3360 Region1 Site6 GeneF # 3: chr4 2445 2455 Region2 Site1 GeneB # 4: chr4 2445 2455 Region2 Site8 GeneO # 5: chr1 1034 1090 Region4 Site4 GeneC </code> </pre> <P> 加入 <code> Chr </code> 单独创建不必要的组合只是为了在下一步中过滤它们。但 <EM> 非等距 </EM> 连接直接查找匹配的条目（因此在速度和内存方面的效率）。 </p> </DIV>

编辑

登录后才能参与评论